Περίληψη
Η πρόοδος των τεχνολογιών αλληλούχισης νέας γενιάς και της βιοπληροφορικής έχουν επιτρέψει τη συσσώρευση τεράστιου όγκου γονιδιωματικών δεδομένων, τα οποία με τη σειρά τους έχουν φέρει επανάσταση στον τομέα της γονιδιωματικής έρευνας. Στη συγκεκριμένη διατριβή, αναπτύχθηκε ένα υπολογιστικό εργαλείο, με την ονομασία pyPGCF, το οποίο είναι ικανό να διαχειρίζεται και να αναλύει, με μεγάλη απόδοση, εκατοντάδες έως και χιλιάδες γονιδιώματα. Το pyPGCF μπορεί να εφαρμοστεί τόσο σε προκαρυώτες όσο και σε ευκαρυώτες και να εκτελέσει διάφορες αναλύσεις, συμπεριλαμβανομένων της φυλογενωμικής, της αναγνώρισης του γονιδιώματος πυρήνα και της αναγνώρισης των γονιδίων αποτυπωμάτων, τα οποία μπορεί να εμπλέκονται στις προσαρμογές της κάθε εξελικτικής γραμμής. Το pyPGCF μπορεί να αναλύσει γονιδιώματα στη κλίμακα των χιλιάδων με ελάχιστο υπολογιστικό κόστος σε σύγκριση με άλλα υπάρχοντα εργαλεία. Συγκεκριμένα, κατά τη διάρκεια της συγκεκριμένης διατριβής, το pyPGCF χρησιμοποιήθηκε για την ανάλυση 742 κα ...
Η πρόοδος των τεχνολογιών αλληλούχισης νέας γενιάς και της βιοπληροφορικής έχουν επιτρέψει τη συσσώρευση τεράστιου όγκου γονιδιωματικών δεδομένων, τα οποία με τη σειρά τους έχουν φέρει επανάσταση στον τομέα της γονιδιωματικής έρευνας. Στη συγκεκριμένη διατριβή, αναπτύχθηκε ένα υπολογιστικό εργαλείο, με την ονομασία pyPGCF, το οποίο είναι ικανό να διαχειρίζεται και να αναλύει, με μεγάλη απόδοση, εκατοντάδες έως και χιλιάδες γονιδιώματα. Το pyPGCF μπορεί να εφαρμοστεί τόσο σε προκαρυώτες όσο και σε ευκαρυώτες και να εκτελέσει διάφορες αναλύσεις, συμπεριλαμβανομένων της φυλογενωμικής, της αναγνώρισης του γονιδιώματος πυρήνα και της αναγνώρισης των γονιδίων αποτυπωμάτων, τα οποία μπορεί να εμπλέκονται στις προσαρμογές της κάθε εξελικτικής γραμμής. Το pyPGCF μπορεί να αναλύσει γονιδιώματα στη κλίμακα των χιλιάδων με ελάχιστο υπολογιστικό κόστος σε σύγκριση με άλλα υπάρχοντα εργαλεία. Συγκεκριμένα, κατά τη διάρκεια της συγκεκριμένης διατριβής, το pyPGCF χρησιμοποιήθηκε για την ανάλυση 742 και 1,104 γονιδιωμάτων από τα βακτηριακά γένη Streptomyces και Bacillus που χρήζουν ιδιαίτερου ενδιαφέροντος στη βιοτεχνολογία και την ιατρική. Οι αναλύσεις του γένους Streptomyces ανέδειξαν την αξιοσημείωτη ποικιλομορφία τόσο μεταξύ όσο και εντός των διαφορετικών ειδών, την πλαστικότητα του γονιδιώματος του γένους και τα διάφορα γονίδια-αποτυπώματα ορισμένων εξελικτικών γραμμών. Επιπλέον, οι αναλύσεις του γένους Bacillus αναγνώρισαν πολλαπλά γονίδια-αποτυπώματα του κλάδου Cereus, ο οποίος συγκαταλέγει πολλά σημαντικά παθογόνα. Τα συγκεκριμένα γονίδια-αποτυπώματα ενδέχεται να είναι χρήσιμα ως θεραπευτικοί στόχοι και μοριακά διαγνωστικά εργαλεία. Το δεύτερο μέρος της διατριβής επικεντρώθηκε στις συγκριτικές γονιδιωματικές αναλύσεις, μεγάλης κλίμακας, κλινικά σημαντικών RNA και DNA ιών και πιο συγκεκριμένα των Κορονοϊών και των HPV-16, όσον αφορά το δυναμικό μεταλλάξεων και ανασυνδυασμού. Οι αναλύσεις των Κορονοϊών ανέδειξαν την εξελικτική αστάθεια του γονιδίου της ακίδας (Spike) και της γενωμικής γειτονιάς του, καθώς μεταλλάσσεται συχνά και εμπλέκεται σε γεγονότα ανασυνδυασμού. Τα αποτελέσματα αυτά έχουν επιπτώσεις για την πανδημία του SARS-CoV-2, τη μελλοντική της πορεία και για την ανάπτυξη εμβολίων μέσω της αναγνώρισης εξελικτικά συντηρημένων γενωμικών περιοχών. Οι αναλύσεις των HPV-16 έδειξαν ότι η ανάλυση ολόκληρου του γονιδιώματος είναι απαραίτητη προκειμένου να πραγματοποιηθεί σωστή γονοτύπηση και εκτίμηση κινδύνου. Για το συγκεκριμένο σκοπό αναπτύχθηκε ένα λογισμικό που αυτοματοποιεί τις συγκεκριμένες αναλύσεις. Το εργαλείο αυτό, μπορεί να αναλύσει με μεγάλη ταχύτητα πλήρη ή σχεδόν πλήρη γονιδιώματα των HPV-16 και να πραγματοποιήσει γονοτύπηση, ανάλυση ανασυνδυασμού και αναγνώριση SNPs που αυξάνουν τον κίνδυνο ανάπτυξης καρκίνου.
περισσότερα
Περίληψη σε άλλη γλώσσα
The advances in high-throughput sequencing technologies and bioinformatics have enabled the accumulation of vast amounts of genomic data, which in turn has revolutionized the field of genomics research. In this thesis, a computational tool, named pyPGCF, capable of efficiently handling and analyzing data from hundreds to even thousands of genomes was developed. pyPGCF can be applied to both prokaryotes and eukaryotes and perform several analyses, including phylogenomics and the identification of the core-genome and lineage-specific fingerprints, with the latter being important for adaptations. pyPGCF can scale up to thousands of genomes with minimal computational cost compared to other existing tools. In particular, during this thesis, pyPGCF was used to analyze 742 and 1,104 genomes from the biotechnology and clinically important bacterial genera Streptomyces and Bacillus. The analyses of the Streptomyces genus highlighted the remarkable diversity between and within the different spec ...
The advances in high-throughput sequencing technologies and bioinformatics have enabled the accumulation of vast amounts of genomic data, which in turn has revolutionized the field of genomics research. In this thesis, a computational tool, named pyPGCF, capable of efficiently handling and analyzing data from hundreds to even thousands of genomes was developed. pyPGCF can be applied to both prokaryotes and eukaryotes and perform several analyses, including phylogenomics and the identification of the core-genome and lineage-specific fingerprints, with the latter being important for adaptations. pyPGCF can scale up to thousands of genomes with minimal computational cost compared to other existing tools. In particular, during this thesis, pyPGCF was used to analyze 742 and 1,104 genomes from the biotechnology and clinically important bacterial genera Streptomyces and Bacillus. The analyses of the Streptomyces genus highlighted the remarkable diversity between and within the different species, the genomic plasticity of the genus and the various lineage-specific fingerprints. In addition, the analyses of the Bacillus genus identified multiple lineage-specific genes of the highly pathogenic Cereus clade that may be suitable candidates as therapeutic targets and molecular diagnostic tools. The second part of the thesis focused on the large-scale comparative analyses of clinically important RNA and DNA viral genomes and in particular Coronaviruses and HPV-16, in terms of their mutation and recombination potential. Analyses of Coronaviruses highlighted the evolutionary instability of the Spike gene and its genomic neighborhood as it is frequently mutated and implicated in recombination events. These results have implications for the SARS-CoV-2 pandemic, its future trajectory and for vaccine development by identifying conserved genomic regions. Analyses of HPV-16 showed that complete-genome analyses are necessary for correct classification and risk-assessment and thus a software that automates such analyses was developed. More specifically, this tool can quickly analyze either complete or almost complete HPV-16 genomes and perform genotyping, recombination analysis and the identification of SNPs that increase the risk of developing cancer.
περισσότερα