Περίληψη
Ο σκοπός της συγκεκριμένης μελέτης, αποτέλεσε την δημιουργία ενός υπολογιστικού πλαισίου ανάλυσης για την μελέτη των δυναμικών αλλαγών της ενεργής μεταγραφής, καθώς και της αλληλεπίδρασής τους με την αναδιαμόρφωση της χρωματίνης, κατά την απόκριση στο γενοτοξικό στρες. Για τον σκοπό αυτό, η υπεριώδης ακτινοβολία C (UVC) χρησιμοποιήθηκε σαν στρεσογόνος παράγοντας για την δημιουργία βλαβών σε δερματικά κύτταρα, και συγκεκριμένα κυτταρικές σειρές ινοβλαστών δέρματος (VH10, CSB and 1BR.3), ενώ ο μηχανισμός εκτομής νουκλεοτιδίων (NER), και συγκεκριμένα τα επιδιορθωτικά παράγωγα των υπό-μονοπατιών Global Genome NER (GG-NER) και Transcription Coupled NER (TC-NER) χρησιμοποιήθηκαν για την αξιολόγηση των υπό μελέτη μηχανισμών.Για την μελέτη των σταδίων του μεταγραφικού κύκλου σε κανονικές συνθήκες, καθώς και σε συνθήκες έκθεσης στην UVC ακτινοβολία, χρησιμοποιήθηκαν τεχνικές αλληλούχισης νέας γενιάς (Next Generation Sequencing - NGS). Συγκεκριμένα, για την μελέτη της κινητικής των μορίων της RN ...
Ο σκοπός της συγκεκριμένης μελέτης, αποτέλεσε την δημιουργία ενός υπολογιστικού πλαισίου ανάλυσης για την μελέτη των δυναμικών αλλαγών της ενεργής μεταγραφής, καθώς και της αλληλεπίδρασής τους με την αναδιαμόρφωση της χρωματίνης, κατά την απόκριση στο γενοτοξικό στρες. Για τον σκοπό αυτό, η υπεριώδης ακτινοβολία C (UVC) χρησιμοποιήθηκε σαν στρεσογόνος παράγοντας για την δημιουργία βλαβών σε δερματικά κύτταρα, και συγκεκριμένα κυτταρικές σειρές ινοβλαστών δέρματος (VH10, CSB and 1BR.3), ενώ ο μηχανισμός εκτομής νουκλεοτιδίων (NER), και συγκεκριμένα τα επιδιορθωτικά παράγωγα των υπό-μονοπατιών Global Genome NER (GG-NER) και Transcription Coupled NER (TC-NER) χρησιμοποιήθηκαν για την αξιολόγηση των υπό μελέτη μηχανισμών.Για την μελέτη των σταδίων του μεταγραφικού κύκλου σε κανονικές συνθήκες, καθώς και σε συνθήκες έκθεσης στην UVC ακτινοβολία, χρησιμοποιήθηκαν τεχνικές αλληλούχισης νέας γενιάς (Next Generation Sequencing - NGS). Συγκεκριμένα, για την μελέτη της κινητικής των μορίων της RNA πολυμεράσης 2 (RNAPII), από το στάδιο έναρξης της μεταγραφής, στο στάδιο παύσης (promoter proximal pausing - PPP), μέχρι και την μετάβαση στο στην παραγωγική επιμήκυνση, παράχθηκαν και αναλύθηκαν δεδομένα NGS ανοσοκατακρίμνησης της χρωματίνης (Chromatin immunoprecipitation sequencing - ChIP-seq) της υποφωσφορυλιωμένης RNAPII (RNAPII-hypo), της φωσφορυλιωμένης στην σερίνη 2 RNAPII (RNAPII-ser2P), και της φωσφορυλιωμένης στην σερίνη 5 RNAPII (RNAPII-ser5P).Για την μελέτη της παραγωγικότητας των μορίων της RNAPII στα παραπάνω στάδια της μεταγραφής, χρησιμοποιήθηκαν δεδομένα CAGE-seq (Capped Analysis of Gene expression sequencing), καθώς και δεδομένα NGS αρτιγενούς έκφρασης RNA (nascent RNA synthesis sequencing - nRNA-seq).Για την μελέτη της αλληλεπίδρασης της χρωματίνης και των αναδιαμορφώσεων της κατά το φαινόμενο της ενεργής μεταγραφής, ενεργοποιήθηκαν και αναλύθηκαν NGS δεδομένα καταγραφής της προσβασιμότητας της χρωματίνης ATAC-seq (Assay for Transposase-Accessible Chromatin), καθώς και δεδομένα ChIP-seq των επιγενετικών τροποποιήσεων της χρωματίνης H3K27ac και H3K27me3.Για την αποσαφήνιση της αποτελεσματικότητας του μηχανισμού NER και των υπο-μονοπατιών GG-NER και TC-NER, αναπτύχθηκε μια νέα NGS τεχνολογία, το aniFOUND-seq, η οποία συνδυάστηκε με δεδομένα XR-seq (μεθοδολογία εντοπισμού εκτομής DNA κατά την δράση του μηχανισμού NER), καθώς και με NGS δεδομένα εντοπισμού βλαβών του DNA που προκαλούνται από την UVC ακτινοβολία (damage-seq). Η λειτουργική αποτίμηση του μηχανισμού TC-NER σε ενεργά μεταγραφικές μονάδες πραγματοποιήθηκε με την ανάλυση δεδομένων μεταλλαγών γονιδιώματων με καρκίνο του δέρματος (melanoma) καθώς και καρκίνο του πνεύμονα (lung adenocarcinoma), σε συνδυασμό με μετα-ανάλυση δεδομένων XR-seq.Τα αποτελέσματα των παραπάνω συνοψίζονται σε 4 τμήματα:(1) Ανάπτυξη και εφαρμογή αλγορίθμων για την ανάλυση δεδομένων NGS που σχετίζονται με την ανθρώπινη παθογένεια: (α) Ανάπτυξη ενός αυτόνομου πλαισίου ανάλυσης δεδομένων ChIP-seq, nRNA-seq, και ATAC-seq που περιέχει την ποιοτική αποτίμηση των δεδομένων (Quality Control - QC), την προ-επεξεργασία των μικρών διαβασμάτων (reads), την αντιστοίχιση των διαβασμάτων στο γονιδίωμα/ μεταγράφωμα αναφοράς, την επεξεργασία των αντιστοιχίσεων, την σύνοψη των αντιστοιχίσεων σε γονιδιακές περιοχές αναφοράς και την οπτικοποίηση τους, την δημιουργία εγγραφών για πλοήγηση σε γονιδιακούς φυλλομετρητές (IGV, UCSC), την ομαδοποίηση του NGS σήματος σε λειτουργικά μετάγραφα, τις συσχετίσεις μεταξύ βιολογικών και τεχνικών επαναλήψεων των δεδομένων, την εφαρμογή μεθόδων μείωσης διαστάσεων για την αναγνώριση τεχνικών/βιολογικών ομοιοτήτων/διαφορών των δεδομένων, την ανάλυση διαφορικής έκφρασης, την ανάλυση εύρεσης περιοχών με ενισχυμένο ChIP-seq σήμα (peak calling), την ανάλυση διαφορικής πρόσδεσης, την ανάλυση διαφορικής προσβασιμότητας της χρωματίνης, και άλλες στατιστικές συγκρίσεις μεταξύ των υπο-μελέτη βιολογικών συνθηκών. (β) Ανάπτυξη ενός αλγορίθμου για τον εντοπισμό του “de novo” μεταγραφικού κύματος της RNAPII, χρησιμοποιώντας Κρυφά Μαρκοβιανά Μοντέλα (Hidden Markov Models - HMMs) και δεδομένα DRB-nRNA-seq.(2) Κυτταρική απόκριση σε συνθήκες γενοτοξικού στρες: (α) Ανάπτυξη ενός πλαισίου ανάλυσης για την μελέτη της αναδιοργάνωσης της μεταγραφής και της χρωματίνης έπειτα από έκθεση σε UV-C. Στο συγκεκριμένο πλαίσιο ανάλυσης περιέχονται: Κατάλληλη προσαρμογή των μεταγράφων αναφοράς (υποκινητές, γονίδια, ενισχυτές, PROMoter uPstream Transcripts - asPROMPs) και χαρακτηρισμός της ενεργότητάς τους, ποσοτικοποίηση της εξόδου της RNAPII από το σημεία PPP και αποτίμηση της κινητικής της κατά την παραγωγική επιμήκυνση.(b) Ένα προτεινόμενο μοντέλο που περιγράφει τον μηχανισμό “safe mode” της παραγωγικής επιμήκυνσης. Συγκεκριμένα, κατά την απόκριση στο γενοτοξικό στρες που προκαλείται από την UVC ακτινοβολία, παρατηρείται η γρήγορη και ομοιόμορφη απελευθέρωση της RNAPII από τα PPP σημεία των ενεργών μεταγράφων, προκαλώντας το ξέσπασμα ενός μεταγραφικού κύματος το οποίο με την σειρά του ανιχνεύει το μεταγραφώμενο γονιδίωμα για βλάβες.Ο συγκεκριμένος μηχανισμός μεγιστοποιεί την ταχύτητα εντοπισμού DNA βλαβών, την πιθανότητα αναγνώρισης από τα επιμηκούμενα μόρια RNAPII, και αφαίρεσης τους από το TC-NER στις μεταγραφικές μονάδες των ενεργών γονιδίων. Σαν αποτέλεσμα, γονιδιώματα εκτεθημένα σε περιβαλλοντικούς παράγοντες χαρακτηρίζονται από περιορισμένο και ομοιόμορφο βαθμό μεταλλαγών, σε περιοχές ενεργών μεταγράφων, και στις 2 DNA αλυσίδες, σε αντίθεση με τις περιοχές που δεν μεταγράφονται από την RNAPII όπου παρατηρείται αυξημένος βαθμός μεταλλαγών. Σε περίπτωση που το NER είναι ανεπιτυχές, η δεν στρατολογηθεί επιτυχώς κατά την διαδικασία της ανάκαμψης από την έκθεση στις στρεσογόνες συνθήκες, μη διορθωμένες DNA βλάβες μπορούν να προκαλέσουν εσφαλμένη DNA σύνθεση η οποία θα έχει σαν αποτέλεσμα την μεταλλαξιγένεση.(3) Επεκτείνοντας την περιγραφή του μηχανισμού “safe mode” της παραγωγικής επιμήκυνσης, τα αποτελέσματα της συγκεκριμένης διατριβής υποστηρίζουν ένα μοντέλο διαρκούς έναρξης της μεταγραφής, το οποίο τροφοδοτεί την εκτενή έξοδο των RNAPII μορίων από το PPP έπειτα από έκθεση στην UVC, διαφυλάσσοντας έτσι την ακεραιότητα του ενεργά μεταγραφώμενου γονιδιώματος. Ο μηχανισμός αυτός πλαισιώνεται από την καθολική αύξηση της προσβασιμότητας της χρωματίνης, σε όλες τις ενεργές μεταγραφικές μονάδες, παίζοντας τον ρόλο μιας πλατφόρμας η οποία ευνοεί την αδιάκοπη έναρξη της μεταγραφής, ενώ παράλληλα διατηρούνται οι επιγενετικές τροποποιήσεις των ιστονών H3K27ac και H3K27me3 κατά την διάρκεια των πρώτων σταδίων κυτταρικής ανάκαμψης έπειτα από την έκθεση στην UVC ακτινοβολια. (4) Ανάπτυξη ενός πλαισίου ανάλυσης του ολόκληρου του γονιδιώματος για την αποτίμηση της aniFOUND-seq μεθόδου. Το aniFOUND, αποτελεί την πρώτη μέθοδο (κατά την διάρκεια τηςσυγγραφής της συγκεκριμένης μελέτης) που επιτρέπει τον αποκλειστικό χαρακτηρισμό και την ανάκτηση των νεοσυντιθέμενων τμημάτων της επιδιορθωμένη χρωματίνης, έπειτα από την απομάκρυνση των DNA βλαβών από τον μηχανισμό NER. O συνδυασμός της μεθόδου aniFOUND με την τεχνολογία NGS, επιτρέπει τον εντοπισμό και τον χαρακτηρισμό της αποτελεσματικότητας του μηχανισμού NER στο σε ολόκληρο το ανθρώπινο γονιδίωμα.To aniFOUND-seq εφαρμόστηκε επιτυχώς για την ανίχνευση επιδιορθωμένων περιοχών σε ινοβλάστες δέρματος (1BR.3 κυτταρική σειρά), με έμφαση στις περιοχές των υποκινητών και ενισχυτών. Επιπλέον, το aniFOUND-seq αξιοποιήθηκε για την αποτίμηση της δραστηριότητας του NER-UDS, σε διάφορες περιοχές του ανθρώπινου γονιδιώματος, όπως οι περιοχές επαναλήψεων DNA (DNA repeats). Συγκεκριμένα, αποσαφηνίστηκε η αποτελεσματικότητα της επιδιόρθωσης του DNA κατά τις 4 πρώτες ώρες έπειτα από την δημιουργία βλαβών, για τις περιοχές ριβοσωμικού DNA και των τελομερών, για τις οποίες μέχρι τώρα υπήρχαν αντικρουόμενα μοντέλα περιγραφής. Κατά συνέπεια, ο σωρευτικός χαρακτήρας του aniFOUND-seq (σε όρους τύπων βλαβών, καθώς και περιόδου επιδιόρθωσης) το καθιστά κατάλληλο για μελέτες που απαιτούν την ολική αξιολόγηση της διαδικασίας επιδιόρθωσης του DNA κατά την διάρκεια σχετικά μεγάλων χρονικών διαστημάτων.
περισσότερα
Περίληψη σε άλλη γλώσσα
The purpose of this study is the development of a computational framework for studying the dynamic changes of active transcription, and its interaction with chromatin remodeling and chromatin alterations during cellular responses to genotoxic stress. For this purpose, ultraviolet light C (UVC) was used as a genotoxic stress factor, damaging skin cells, specifically skin fibroblasts (VH10, CSB and 1BR.3), while the activity of Nucleotide Excision Repair (NER) pathway and the repair products of Global Genome NER (GG-NER) and Transcription Coupled NER (TC-NER) sub-pathways were used to evaluate the examined mechanisms. Various types of Next Generation Sequencing (NGS) experiments have been used to study the stages of the transcription cycle in normal conditions, and in response to Ultraviolet C irradiation (UVC) induced stress. Specifically, for studying the kinetics of RNA Polymerase 2 (RNAPII) molecules from the transcription initiation state, to promoter proximal pausing (PPP), and the ...
The purpose of this study is the development of a computational framework for studying the dynamic changes of active transcription, and its interaction with chromatin remodeling and chromatin alterations during cellular responses to genotoxic stress. For this purpose, ultraviolet light C (UVC) was used as a genotoxic stress factor, damaging skin cells, specifically skin fibroblasts (VH10, CSB and 1BR.3), while the activity of Nucleotide Excision Repair (NER) pathway and the repair products of Global Genome NER (GG-NER) and Transcription Coupled NER (TC-NER) sub-pathways were used to evaluate the examined mechanisms. Various types of Next Generation Sequencing (NGS) experiments have been used to study the stages of the transcription cycle in normal conditions, and in response to Ultraviolet C irradiation (UVC) induced stress. Specifically, for studying the kinetics of RNA Polymerase 2 (RNAPII) molecules from the transcription initiation state, to promoter proximal pausing (PPP), and the transition to productive elongation, Chromatin immunoprecipitation sequencing (ChIP-seq) data of the hypophosphorylated RNAPII (RNAPII-hypo), the elongating isoform of RNAPII (RNAPII-ser2P), and the RNAPII-ser5P isoform (transcription initiation) was generated and analyzed. To study the productivity of RNAPII molecules during the above stages, Capped Analysis of Gene expression sequencing (CAGE-seq) data and nascent RNA synthesis sequencing (nRNA-seq) data was used. To study the interactions of chromatin with active transcription and its alteration during the states of active transcription, Assay for Transposase-Accessible Chromatin (ATAC-seq) data was generated and analyzed, and ChIP-seq data of H3K27ac and H3K27me3 histone modifications. To study the effectiveness and genomic landscape of NER repair-synthesis events, for both GG-NER and TC-NER sub-pathways, a novel assay called aniFOUND-seq was developed and analyzed, coupled with data of excised DNA during NER activity (XR-seq) and NER damage sequencing data (damage-seq). The functional assessment of TC-NER at active genes was carried out through the study of mutations in melanoma and lung adenocarcinoma cancer genomes, and XR-seq data meta-analysis respectively.The results of these essays are divided into four sections:(1) Development and application of algorithms for the analysis of NGS data related to human disease. (a) Implementation of stand-alone analysis pipelines for the analysis of ChIP-seq, nRNA-seq, and ATAC-seq datasets that include: Quality control (QC) assessment of sequenced short-reads, short-read preprocessing, short-read mapping against the understudy reference genome/transcriptome, alignment processing, alignment summarization in genomic features and visualization via heatmaps and average profiles, generation of genomic tracks viewable in genome browsers (IGV, UCSC), NGS signal clustering upon functional genomic regions, correlation of biological and technical replicates, dimensionality reduction methods to identify technical/biological similarities/differences between samples, differential expression analysis, peak calling analysis, differential binding analysis, differential accessibility analysis and other statistical comparisons between biological conditions.(b) Implementation of a “de novo” elongation wave identification algorithm using Hidden Markov Models (HMMs), and DRB-nRNA-seq datasets.(2) Cellular responses under genotoxic stress conditions. (a) Development of a computational pipeline for the study of the reorganization of transcription and the chromatin rearrangements upon UV-induced stress that include: genome annotation reconstruction, and characterization of transcribed units’ activity (promoters, genes, enhancers, PROMoter uPstream Transcripts - asPROMPs) along the human genome, the quantification of the RNAPII release from PPP sites, and the evaluation of the RNAPII elongation wave kinetics.(b) A proposed model describing the ‘safe’ mode mechanism of transcription elongation; upon UVC-induced stress, steady-state transcription levels of virtually all actively transcribed genes are re-adjusted to the fast and uniform release of RNAPII elongation waves from PPP sites that scan the transcribed genome for DNA lesions.This mechanism maximizes the speed of lesion sensing, the probability that a lesion will be identified by an elongating RNAPII molecule and removed by TC-NER along the actively transcribed elements. As a result, environmentally exposed genomes are characterized by a modest and homogeneous mutation prevalence across the actively transcribed genome in both strands, as opposed to the non-transcribed elements where higher mutation rates are observed. In case NER is unsuccessful or is not recruited efficiently during the stress recovery process, unrepaired DNA lesions can provoke error-prone DNA synthesis and result in mutagenesis during replication.(3) Extending the previously described ‘safe’ mode mechanism of transcription elongation, the results of the particular dissertation also support a model of continuous transcription initiation that can fuel the widespread UV-triggered escape of RNAPII into transcription elongation, that safeguards the integrity of the actively transcribed genome. The particular mechanism is supported by a global increase of chromatin accessibility at all actively transcribed promoters serving as a platform that favors unrestrained transcription initiation, coupled by the preservation of the active mark H3K27ac and repressive mark H3K27me3 mark during the early response to genotoxic stress.(4) A genome-wide analysis pipeline for the evaluation of aniFOUND-seq methodology.aniFOUND, is the first methodology (at the time of writing this thesis) that can exclusively label, capture and map the post-damage newly synthesized repaired chromatin in its native form (see materials and methods). Coupling of aniFOUND to NGS, allows the mapping and characterization of the NER efficacy of different chromosomal regions of the human genome. aniFOUND-seq was successfully applied to map the repair-synthesis activity along damaged skin fibroblasts (1BR.3 cells) with particular attention to promoter and enhancer sequences. Furthermore, aniFOUND-seq was applied for the assessment of NER-UDS activity in several chromosomal regions, including the fraction of repetitive DNA. Specifically, the repair efficacy during the first 4 hours after damage induction was clarified for rDNA and telomeres, for which contradictory explanatory models have been suggested. This is the first time that NGS-based approaches are adopted for shedding light in the above-mentioned inquiries regarding repair of telomeric DNA. Evidently, the cumulative nature of aniFOUND-seq (in terms of both damage types and repair assessment period) renders it applicable for the cases that require capturing ofthe whole repair process, or the repair activity during moderately-to-considerably long-time windows.
περισσότερα