Περίληψη
Η Ιατρική Ακριβείας αποτελεί μία νέα προσέγγιση της ιατρικής που λαμβάνει υπόψη το γενετικό προφίλ του κάθε ασθενούς, με στόχο τη χορήγηση εξατομικευμένης θεραπείας, αλλά και την πρόληψη ασθενειών. Ο καρκίνος είναι μια ασθένεια του γονιδιώματος, κι έτσι η Ιατρική Ακριβείας έχει ιδιαίτερη εφαρμογή στην ογκολογία. Πιο συγκεκριμένα, ένας από τους βασικούς στόχους της Ιατρικής Ακριβείας στην ογκολογία είναι η διάγνωση των γενετικών ιδιαιτεροτήτων του όγκου κάθε ασθενούς και, κατά συνέπεια, η χορήγηση συγκεκριμένης θεραπείας που θα στοχεύει αυτές τις ιδιαιτερότητες. Παράλληλα, μια άλλη πτυχή της Ιατρικής Ακριβείας στην ογκολογία είναι η πρόληψη της νόσου, μέσω της μελέτης του κληρονομικού καρκίνου, η οποία επιτρέπει την έγκαιρη αναγνώριση των ατόμων που έχουν αυξημένο κίνδυνο να διαγνωστούν με καρκίνο και, τελικά, τη σωστή κλινική διαχείρισή τους.Τα τελευταία χρόνια, η τεχνολογία αλληλούχησης του DNA έχει εξελιχθεί ραγδαία χάρη στις τεχνολογικές βελτιώσεις και τις νέες μεθόδους αυτοματοποίη ...
Η Ιατρική Ακριβείας αποτελεί μία νέα προσέγγιση της ιατρικής που λαμβάνει υπόψη το γενετικό προφίλ του κάθε ασθενούς, με στόχο τη χορήγηση εξατομικευμένης θεραπείας, αλλά και την πρόληψη ασθενειών. Ο καρκίνος είναι μια ασθένεια του γονιδιώματος, κι έτσι η Ιατρική Ακριβείας έχει ιδιαίτερη εφαρμογή στην ογκολογία. Πιο συγκεκριμένα, ένας από τους βασικούς στόχους της Ιατρικής Ακριβείας στην ογκολογία είναι η διάγνωση των γενετικών ιδιαιτεροτήτων του όγκου κάθε ασθενούς και, κατά συνέπεια, η χορήγηση συγκεκριμένης θεραπείας που θα στοχεύει αυτές τις ιδιαιτερότητες. Παράλληλα, μια άλλη πτυχή της Ιατρικής Ακριβείας στην ογκολογία είναι η πρόληψη της νόσου, μέσω της μελέτης του κληρονομικού καρκίνου, η οποία επιτρέπει την έγκαιρη αναγνώριση των ατόμων που έχουν αυξημένο κίνδυνο να διαγνωστούν με καρκίνο και, τελικά, τη σωστή κλινική διαχείρισή τους.Τα τελευταία χρόνια, η τεχνολογία αλληλούχησης του DNA έχει εξελιχθεί ραγδαία χάρη στις τεχνολογικές βελτιώσεις και τις νέες μεθόδους αυτοματοποίησης. Η εισαγωγή της μεθόδου Αλληλούχησης Επόμενης Γενιάς έχει ως αποτέλεσμα την παραγωγή μεγάλου όγκου γενετικών δεδομένων, τα οποία επιτρέπουν την κατανόηση των βιολογικών μηχανισμών που διέπουν την ανθρώπινη νόσο. Όλες αυτές οι εξελίξεις, έχουν συνηγορήσει στην ενίσχυση και την εφαρμογή της Ιατρικής Ακριβείας, ωστόσο, εισάγουν νέες προκλήσεις σχετικά με την ανάλυση, την καταγραφή και τη διανομή αυτού του τεράστιου όγκου δεδομένων. Η επιστήμη της βιοπληροφορικής έχει συμβάλει δυναμικά στην αντιμετώπιση αυτών των προκλήσεων. Επιτρέποντας την ανάλυση ακατέργαστων δεδομένων μεγάλης κλίμακας, τα οποία είναι αδύνατο να αναλυθούν χειροκίνητα, την ενσωμάτωση ετερογενών βιολογικών δεδομένων και τη χρήση προηγμένων υπολογιστικών και στατιστικών μεθόδων για την κατανόησή τους, η βιοπληροφορική παρέχει τα εργαλεία για την ανίχνευση βιοδεικτών και υποψηφίων φαρμάκων. Επιπλέον, συμβάλει και στην αποθήκευση αυτού του τεράστιου όγκου δεδομένων, μέσω των βάσεων βιολογικών δεδομένων που έχουν δημιουργηθεί, οι οποίες όχι μόνο διευκολύνουν τη διαχείριση των δεδομένων, αλλά και το διαμοιρασμό τους σε ολόκληρη την επιστημονική κοινότητα.Σκοπός της παρούσας διδακτορικής διατριβής αποτελεί η μελέτη εφαρμογών βιοπληροφορικής με κλινική χρησιμότητα στη γενετική καρκίνου και την ιατρική ακριβείας. Σε αυτό το πλαίσιο, αναπτύχθηκαν η βάση δεδομένων CanVaS που αποτελεί την πρώτη βάση δεδομένων για τον κληρονομικό καρκίνο που αφορά τον ελληνικό πληθυσμό, η οποία καταγράφει το φάσμα της γενετικής ποικιλομορφίας των Ελλήνων ασθενών με καρκίνο, καθώς και τα φαινοτυπικά και κλινικά χαρακτηριστικά αυτών των ατόμων, και η ροή διοχέτευσης εντολών διεργασιών VarTrace, με σκοπό την ανάλυση της γενετικής πληροφορίας που έχει παραχθεί από Αλληλούχηση Επόμενης Γενιάς DNA όγκου. Τέλος, αξιολογήθηκε ένα εμπορικό λογισμικό για τον εμπλουτισμό παραλλαγών που ανιχνεύονται σε ένα πείραμα Αλληλούχησης Επόμενης Γενιάς, με κλινική εφαρμογή.Η έλευση της μεθόδου Αλληλούχηση Επόμενης Γενιάς, έχει καταστήσει αναγκαία την καταγραφή των γενετικών και γονιδιωματικών δεδομένων σε πληθυσμιακό επίπεδο, με απώτερο σκοπό την μεγαλύτερη ακρίβεια στην αποτύπωση της γενετικής ετερογένειας μεταξύ, αλλά και εντός των πληθυσμών, καθώς και την έγκυρη κατηγοριοποίηση των σπάνιων αλληλομόρφων. Η ανάπτυξη εθνικών βάσεων γενετικών δεδομένων συνεισφέρει ουσιαστικά στην κατανόηση των γενετικών ιδιαιτεροτήτων ενός πληθυσμού και κατά συνέπεια στην καλύτερη διαχείριση των ασθενών με καρκίνο. Η βάση CanVaS αποτελείται από τη συλλογή δεδομένων που προέρχονται από τις γενετικές αναλύσεις 7.363 Ελλήνων που έχουν διαγνωσθεί με διαφόρους τύπους καρκίνου ή/και σύνδρομα που συμπεριλαμβάνουν κακοήθειες και υγιών συγγενών τους, οι οποίοι έχουν αναλυθεί για την ύπαρξη γενετικών αλλαγών σε 1 έως 97 γονίδια, παθογόνοι παραλλαγές των οποίων έχουν σχετισθεί με προδιάθεση στον καρκίνο. Οι συγκεκριμένες αναλύσεις έχουν πραγματοποιηθεί στο Εργαστήριο Μοριακής Διαγνωστικής του ΕΚΕΦΕ «Δημόκριτος». Η συλλογή δεδομένων του CanVaS αποτελείται από περίπου 24.000 λειτουργικά χαρακτηρισμένες παραλλαγές. Για κάθε παραλλαγή, περιλαμβάνεται η συχνότητα αλληλομόρφου για τον ελληνικό πληθυσμό, η αξιολόγηση, ερμηνεία και κλινική επίπτωσή της βάσει των κανόνων του American College of Clinical Geneticists (ACMG), καθώς και τα φαινοτυπικά χαρακτηριστικά των ατόμων που τη φέρουν. Επιπλέον, παρέχονται πληροφορίες σχετικά με τη γεωγραφική κατανομή των παραλλαγών σε ολόκληρη τη χώρα, επιτρέποντας τη μελέτη των απομονωμένων ελληνικών πληθυσμών. Αξίζει να σημειωθεί ότι έχει δοθεί προτεραιότητα στην ενσωμάτωση και τη διασύνδεση των δεδομένων με τις εδραιωμένες ανοιχτά προσβάσιμες βάσεις δεδομένων. Η βάση CanVaS υποστηρίζεται από το λογισμικό ανοιχτού κώδικα Leiden Open Variation Database (LOVD), επιτρέποντας έτσι την εύκολη διασύνδεση με κεντρικές πηγές δεδομένων. Κατ’ αυτόν τον τρόπο, χρησιμεύει ως μέρος της λύσης στη διαιρεμένη διαθεσιμότητα των γενετικών δεδομένων σε διάφορες βάσεις δεδομένων. Η βάση δεδομένων CanVaS είναι διαθέσιμη στην ηλεκτρονική διεύθυνση: http://ithaka.rrp.demokritos.gr/CanVaS. Η ροή διοχέτευσης εντολών διεργασιών VarTrace αναπτύχθηκε με σκοπό την ακριβή ανίχνευση σωματικών παραλλαγών στο DNA καρκινικών κυττάρων. Η Αλληλούχηση Επόμενης Γενιάς του DNA όγκων χρησιμοποιείται ευρέως για την ανίχνευση βιοδεικτών που μπορούν να αποτελέσουν στόχο για εξατομικευμένη θεραπεία. Χαρακτηριστικό παράδειγμα αποτελεί η εκτίμηση της ανεπάρκειας του ομόλογου ανασυνδυασμού σε όγκους μέσω της ανίχνευσης παθογόνων παραλλαγών στα γονίδια BRCA1 και BRCA2. Οι ασθενείς με ανεπαρκείς όγκους μπορούν να επωφεληθούν από τη χορήγηση αναστολέων των πολυμερασών της πολυαδενοφωσφορικής ριβόζης (polyADP-ribose polymerase, PARP). Ωστόσο, η αλληλούχηση του DNA όγκων κρύβει πολλές προκλήσεις, καθώς το γονιδίωμα του όγκου χαρακτηρίζεται από ετερογένεια, ενώ οι μέθοδοι διατήρησης του ιστού αλλοιώνουν το γενετικό του υλικό. Ως αποτέλεσμα, η αλληλούχηση του DNA των όγκων συχνά οδηγεί στην ανίχνευση αυξημένου αριθμού ψευδώς θετικών παραλλαγών. Το εργαλείο VarTrace αντιμετωπίζει αυτούς τους περιορισμούς μέσω της χρήσης πολλαπλών αλγορίθμων κλήσης παραλλαγών και της εξειδικευμένης προσαρμογής των παραμέτρων του. Προκειμένου να αποδειχθεί η απόδοση και η χρησιμότητά του, το VarTrace εφαρμόστηκε σε δεδομένα που προέρχονται από την αλληλούχηση των γονιδίων BRCA1 και BRCA2 σε όγκους 75 ασθενών με επιθηλιακό καρκίνωμα των ωοθηκών, ενώ τα αποτελέσματα συγκρίθηκαν με δύο εμπορικά διαθέσιμες ροές διοχέτευσης εντολών διεργασιών. Το VarTrace αποτελεί μια αυτοματοποιημένη, πλήρως διαμορφώσιμη και παράλληλη ροή διοχέτευσης εντολών διεργασιών, γραμμένη σε R και Perl και είναι διαθέσιμο στην ηλεκτρονική διεύθυνση: https://gitlab.com/dkalfakakou/TumorPipeline. Τέλος, αξιολογήθηκε ο χαρακτηρισμός παραλλαγών ως προς την επίπτωσή τους, όπως πραγματοποιείται από ένα φιλικό προς το χρήστη κι εμπορικά διαθέσιμο λογισμικό, το Illumina® VariantStudio v3.0 (VS), το οποίο χρησιμοποιεί ένα συγκεκριμένο σύνολο μεταγράφων. Για λόγους σύγκρισης, χρησιμοποιήθηκε το Ensembl VEP, ένα εργαλείο γραμμής εντολών ανοιχτού κώδικα, καθώς παρέχει ευελιξία όσον αφορά την επιλογή των μεταγράφων. Για την αξιολόγηση, χρησιμοποιήθηκαν δεδομένα που προέκυψαν από τον προσδιορισμό της αλληλουχίας 857 δειγμάτων DNA γαμετικής σειράς ασθενών με καρκίνο με τη μέθοδο Αλληλούχησης Επόμενης Γενιάς. Η σύγκριση μεταξύ των δύο συνόλων μεταγράφων έδειξε αναντιστοιχία σε ποσοστό 82,82%. Επιπλέον, χρησιμοποιώντας το προεπιλεγμένο σύνολο μεταγράφων του VS, δεν χαρακτηρίστηκαν σωστά το 11,45% των ταυτοποιημένων παραλλαγών απώλειας λειτουργίας, γεγονός που στην περίπτωση που ο γονιδιακός έλεγχος έχει κλινική εφαρμογή, μπορεί να έχει άμεσο αντίκτυπο στην κλινική διαχείριση των ασθενών. Τα αποτελέσματά μας επισημαίνουν τη σημασία της προσεκτικής επιλογής λογισμικού και μεταγράφων και την ανάγκη για αξιόπιστη ανάλυση δεδομένων, με σκοπό τη μείωση του ποσοστού σφάλματος των γονιδιακών ελέγχων και κατ’ επέκταση, τη βελτίωση της φροντίδας των ασθενών.
περισσότερα
Περίληψη σε άλλη γλώσσα
Precision Medicine is an emerging approach to medicine that studies the genetic profile of each patient, aiming in providing personalized treatment and preventing disease. Cancer is a disease of the genome, so precision medicine has a special application in oncology. More specifically, one of the main goals of precision medicine in oncology is to identify the distinct genetic features of each patient's tumor and, consequently, to provide specific treatment that targets them. Additionally, another aspect of precision medicine in oncology is disease prevention, through the study of hereditary cancer, which allows the timely identification of individuals who are at increased risk of developing cancer and, ultimately, their proper clinical management.In recent years, DNA sequencing technology has rapidly evolved thanks to technological improvements and new automation methods. The introduction of Next Generation Sequencing resulted in the production of a large volume of genetic data, which ...
Precision Medicine is an emerging approach to medicine that studies the genetic profile of each patient, aiming in providing personalized treatment and preventing disease. Cancer is a disease of the genome, so precision medicine has a special application in oncology. More specifically, one of the main goals of precision medicine in oncology is to identify the distinct genetic features of each patient's tumor and, consequently, to provide specific treatment that targets them. Additionally, another aspect of precision medicine in oncology is disease prevention, through the study of hereditary cancer, which allows the timely identification of individuals who are at increased risk of developing cancer and, ultimately, their proper clinical management.In recent years, DNA sequencing technology has rapidly evolved thanks to technological improvements and new automation methods. The introduction of Next Generation Sequencing resulted in the production of a large volume of genetic data, which allows the understanding of the biological machineries that govern human disease. These developments have paved the way to precision medicine; they have also introduced new challenges regarding the analysis, the recording, and the distribution of this huge amount of data.Bioinformatics is a science that has decidedly contributed to addressing these challenges. By allowing the analysis of large-scale raw data that is impossible to analyze manually, the integration of heterogeneous biological data, and the use of advanced computational and statistical methods to understand them, bioinformatics provides the tools for detecting biomarkers and candidate drugs. Moreover, many biological databases have been created for storing this huge amount of data, enabling easy data management, and sharing with the scientific community.The aim of the present thesis is the study of bioinformatics applications with clinical utility in cancer genetics and precision medicine. In this context, CanVaS (Cancer Variation reSource), the first database on hereditary cancer for the Greek population, was developed, recording the genetic heterogeneity of Greek cancer patients along with their phenotypic and clinical characteristics. Moreover, VarTrace, a pipeline for the analysis of genetic data generated from Next Generation Sequencing of tumor DNA is presented. Finally, a commercial software for the annotation of germline variants identified through Next Generation Sequencing was evaluated.The advent of Next Generation Sequencing technology has introduced the need to record population-specific genetic data. National genetic variation registries vastly increase the level of detail for the relevant population, while directly affecting patient management. CanVaS comprises a collection of data from the genetic analyses of 7,363 Greek patients that have been diagnosed with various types of cancer and/or cancer syndromes and their healthy relatives. All these individuals have been tested in the Molecular Diagnostics Laboratory of NCSR "Demokritos" for germline variants in 1 to 97 genes that have been associated with predisposition to cancer. The CanVaS data collection consists of approximately 24,000 functionally annotated variants. For each variant, the allele frequency for the Greek population, its evaluation, interpretation, and clinical impact according to the American College of Clinical Geneticists (ACMG) guidelines are recorded. Most importantly, the genetic dataset is accompanied by the phenotypic and clinical traits of the carriers. Moreover, information on the geographical distribution of the variants throughout the country is provided, allowing the study of Greek isolates. CanVaS is developed using the Leiden Open Variation Database (LOVD) open-source software, allowing easy connection to central data sources. This way, it serves as a part of the solution to the divided availability of genetic data in many different databases. CanVaS is available at: http://ithaka.rrp.demokritos.gr/CanVaS. The VarTrace pipeline was developed to accurately detect somatic variants in tumor DNA. Next Generation Sequencing of somatic DNA is widely used for biomarker detection that can be targeted for personalized treatment. A prominent example is the assessment of homologous recombination deficiency in tumors, through the detection of pathogenic variants in BRCA1 and BRCA2. Patients with homologous recombination deficient tumors can benefit from the administration of poly ADP ribose polymerase (PARP)-inhibitors. However, tumor DNA sequencing bears many challenges, as the tumor genome is vastly heterogeneous and existing tissue preservation methods alter its genetic material. As a result, tumor DNA sequencing often leads to the detection of an increased number of false-positive variants. VarTrace addresses these limitations using multiple variant calling algorithms and fine-tuned customization of its parameters. To demonstrate its efficacy and utility, we applied VarTrace to data from the sequencing of BRCA1 and BRCA2 genes in 75 patients with ovarian epithelial carcinoma and compared the results with two commercially available pipelines. VarTrace is an automated, fully configurable, and parallel pipeline, written in R and Perl and is available at: https://gitlab.com/dkalfakakou/TumorPipeline.Finally, we evaluated the variant annotation performed by a user-friendly and commercially available software, Illumina® VariantStudio v3.0 (VS), on a clinical setting. VS uses a specific set of transcripts for the annotation process. For the sake of comparison, we employed Ensembl VEP, an open source command line tool, which provides flexibility in transcript selection. Data from the germline DNA sequencing of 857 cancer patients that were analyzed using Next Generation Sequencing were used for the evaluation. The comparison between the two transcript sets showed a discordance rate of 82.82%. Moreover, using the default VS transcript set, 11.45% of the identified loss-of-function variants were characterized incorrectly. In the case of a clinical application of genetic testing, these results could directly and negatively impact patient management. Our results highlight the importance of careful software and transcript selection and the need for reliable data analysis, in order to reduce the error rate of genetic testing and, consequently, improve patient care.
περισσότερα