Περίληψη
Η ολοκλήρωση της αλληλούχισης του ανθρώπινου γονιδιώματος και η εμφάνιση βιολογικών τεχνολογιών υψηλής απόδοσης/τροφοδοσίας στην αυγή της νέας χιλιετίας μεταβάλλουν ταχύτατα το τοπίο προσέγγισης των βιολογικών προβλημάτων προς έναν ολιστικό, συστημικό τρόπο. Οι μικροσυστοιχίες DNA και οι αλληλουχιτές επόμενης γενιάς αποτελούν πολλά υποσχόμενες τεχνολογικές εξελίξεις που χρησιμοποιούνται για την έρευνα και ταυτοποίηση γονιδίων ή ομάδων γονιδίων συσχετισμένων με σημαντικές βιολογικές διαδικασίες αλλά και επιγονιδιωματικών γεγονότων τα οποία είναι ουσιώδη για τη συστημική κατανόηση των ανώτερων βιολογικών διαδικασιών.
Αν και το πεδίο της ανάλυσης δεδομένων μικροσυστοιχιών αναπτύσσεται συνεχώς μέσω διαφόρων υπολογιστικών εργαλείων, ανοιχτού κώδικα ή εμπορικών, παρατηρείται μια έλλειψη προκαθορισμένων λογικών αλγοριθμικών ροών εργασίας ανάλυσης ή προτυποποιημένης επεξεργασίας, η οποία περιλαμβάνει όλα τα βήματα ανάλυσης, από την εισαγωγή ακατέργαστων δεδομένων έως την παραγωγή λιστών γονιδ ...
Η ολοκλήρωση της αλληλούχισης του ανθρώπινου γονιδιώματος και η εμφάνιση βιολογικών τεχνολογιών υψηλής απόδοσης/τροφοδοσίας στην αυγή της νέας χιλιετίας μεταβάλλουν ταχύτατα το τοπίο προσέγγισης των βιολογικών προβλημάτων προς έναν ολιστικό, συστημικό τρόπο. Οι μικροσυστοιχίες DNA και οι αλληλουχιτές επόμενης γενιάς αποτελούν πολλά υποσχόμενες τεχνολογικές εξελίξεις που χρησιμοποιούνται για την έρευνα και ταυτοποίηση γονιδίων ή ομάδων γονιδίων συσχετισμένων με σημαντικές βιολογικές διαδικασίες αλλά και επιγονιδιωματικών γεγονότων τα οποία είναι ουσιώδη για τη συστημική κατανόηση των ανώτερων βιολογικών διαδικασιών.
Αν και το πεδίο της ανάλυσης δεδομένων μικροσυστοιχιών αναπτύσσεται συνεχώς μέσω διαφόρων υπολογιστικών εργαλείων, ανοιχτού κώδικα ή εμπορικών, παρατηρείται μια έλλειψη προκαθορισμένων λογικών αλγοριθμικών ροών εργασίας ανάλυσης ή προτυποποιημένης επεξεργασίας, η οποία περιλαμβάνει όλα τα βήματα ανάλυσης, από την εισαγωγή ακατέργαστων δεδομένων έως την παραγωγή λιστών γονιδίων διαφορικής έκφρασης. Αυτή η έλλειψη προκαλεί σύγχυση στην αναλυτική διαδικασία και παρακωλύει τη μαζική συγκριτική επεξεργασία συνόλων δεδομένων πειραμάτων μικροσυστοιχιών. Εξάλλου, πολλές από τις λύσεις που παρέχονται εξαρτώνται πολύ από τις προγραμματιστικές ικανότητες του εκάστοτε χρήστη, ενώ στην περίπτωση εφαρμογών που έχουν γραφικό περιβάλλον, δεν παρέχεται απευθείας υποστήριξη διαφόρων τυποποιημένων μορφών αρχείων, προερχομένων από προγράμματα ανάλυσης εικόνας, ούτε κάποια συλλογή ευπροσάρμοστων μεθόδων ανάλυσης σήματος. Για την αντιμετώπιση των παραπάνω προβλημάτων, και στα πλαίσια της παρούσας διατριβής αναπτύχθηκε το λογισμικό Gene ARMADA, μια πλατφόρμα ανάλυσης δεδομένων μικροσυστοιχιών με γραφικό περιβάλλον, υλοποιημένη σε MATLAB. Αυτή η «σουίτα» ενοποιεί όλα τα βήματα της ανάλυσης δεδομένων μικροσυστοιχιών, περιλαμβανομένων της αυτόματης εισαγωγής δεδομένων, διόρθωση και φιλτράρισμα θορύβου, κανονικοποίηση, στατιστική επιλογή γονιδίων διαφορικής έκφρασης, ομαδοποίησης, κατηγοριοποίησης και επισημείωσης. Το Gene ARMADA υποστηρίζει διχρωματικές μικροσυστοιχίες cDNA και ολιγονουκλεοτιδιακές Affymetrix και Illumima αλλά και μη τυποποιημένες μικροσυστοιχίες όπου οι πειραματικές λεπτομέρειες δίνονται σε απλό κείμενο. Υποστηρίζει επίσης την ανάλυση ήδη επεξεργασμένων αποτελεσμάτων μέσω ενός ευέλικτου περιβάλλοντος εισαγωγής δεδομένων. Εκτός από την αυτοματοποίηση, το Gene ARMADA παρέχει πολυάριθμα εργαλεία οπτικοποίησης και εξερεύνησης δεδομένων, καθώς και ευέλικτη προτυποποίηση εξόδου με την οποία τα δεδομένα που αναλύονται μπορούν να εισαχθούν σε πολλαπλές εφαρμογές για περεταίρω επεξεργασία.
Παράλληλα με το λογισμικό Gene ARMADA και στα πλαίσια της ανάπτυξης εργαλείων για τη βιοπληροφορική ανάλυση δεδομένων γονιδιωματικής προερχομένων από τεχνολογίες υψηλής απόδοσης/τροφοδοσίας, αναπτύχθηκε βασική υπολογιστική ροή εργασίας για ανάλυση δεδομένων πρόσδεσης μεταγραφικών παραγόντων και γονιδιακής ρύθμισης μέσω αλληλούχισης «επόμενης γενιάς». Η ροή εργασίας αποτελείται τόσο από την αποτελεσματική χρήση εργαλείων ανίχνευσης δυνητικών σημείων πρόσδεσης όσο και με εμπειρική μεθοδολογία μείωσης θορύβου και στατιστική ανίχνευση γονιδίων διαφορικής έκφρασης. Τα αναπτυχθέντα και υπάρχοντα εργαλεία εφαρμόστηκαν για τη μελέτη δύο βιολογικών συστημάτων: i) τη μελέτη επίδρασης χορήγησης μαστιχελαίου σε πνευμονικά καρκινικά κύτταρα ποντικού, τύπου LLC και ii) τη μελέτη του προφίλ πρόσδεσης και αλληλεπίδρασης των παραγόντων GR και NF-κB σε ανθρώπινα ηπατικά κύτταρα HeLa B2, σε συνθήκες διέγερσης του καθενός ξεχωριστά ή και των δύο μαζί. Πραγματοποιήθηκε επίσης παράλληλη μελέτη της γονιδιακής έκφρασης μέσω της χαρτογράφησης της πρόσδεσης της RNAPII.
Το μαστιχέλαιο από το φυτό Pistacia lentiscus ποικιλίας chia, είναι ένα μείγμα από βιοενεργά τερπένια με αναγνωρισμένες φαρμακευτικές ιδιότητες. Έχει δειχθεί προσφάτως ότι παρουσιάζει κατασταλτικές δράσεις στην ανάπτυξη όγκων μέσω της καταστολής του πολλαπλασιασμού των καρκινικών κυττάρων, της επιβίωσης, της αγγειογένεσης και της αντίδρασης στη φλεγμονή. Παρ’όλ’αυτά, δεν υπάρχουν μελέτες που να έχουν ασχοληθεί με τους μηχανισμούς δράσης σε επίπεδο έκφρασης του συνολικού γονιδιώματος. Προκειμένου να ερευνηθούν οι μηχανισμοί που ενεργοποιούνται από το μαστιχέλαιο, χορηγήθηκε μαστιχέλαιο ή DMSO σε πνευμονικά καρκινικά κύτταρα ποντικιού, τύπου LLC σε 5 διαφορετικά χρονικά σημεία (3-48h). Για την παρακολούθηση του προφίλ έκφρασης του γονιδιώματος χρησιμοποιήθηκαν μικροσυστοιχίες Illumina σε συνδυασμό με την ουσιώδη υπολογιστική ανάλυση. Για έναν αριθμό επιλεγμένων γονιδίων, έγινε επιβεβαίωση της έκφρασης τους με RT-PCR, τόσο στα LLC κύτταρα όσο και σε τρεις ανθρώπινες κυτταρικές σειρές διαφορετικής προέλευσης (A549, HCT116, K562). Η μελέτη στο σύνολό της έδειξε ότι η έκθεση καρκινικών κυττάρων LLC σε μαστιχέλαιο προκαλεί μια χρονικά εξαρτώμενη αλλαγή στην έκφραση 925 γονιδίων. Οντολογική ανάλυση βασισμένη στη GO συνέδεσε τα προφίλ έκφρασης με διάφορες βιολογικές λειτουργίες και διεργασίες. Ανάμεσά τους, μεταβολές στον κυτταρικό κύκλο/πολλαπλασιασμό, την επιβίωση και το σειριακό μονοπάτι του NF-κB σε σύνδεση με την επακόλουθη ρύθμιση των γονιδίων που κωδικοποιούν για τις πρωτεΐνες PTEN, E2F7, HMOX1 (επαγωγή) και NOD1 (καταστολή) δήλωσαν μερικούς σημαντικούς μηχανιστικούς συνδέσμους καταδεικνύοντας τις αντιπολλαπλασιαστικές, προαποπτοτικές και αντιφλεγμονώδεις δράσεις επιρροές του μαστιχελαίου. Η έκφραση των γονιδίων Hmox1, Pten and E2f7 ήταν παρόμοια στην πλειοψηφία των κυτταρικών σειρών που δοκιμάστηκαν. Η αναστολή της λειτουργίας της πρωτεΐνης PTEN ανέστρεψε εν μέρει τα αποτελέσματα της δράσης του μαστιχελαίου στην ανάπτυξη του όγκου των καρκινικών κυττάρων, δηλώνοντας ένα πιθανό μηχανισμό δράσης με πολλαπλούς στόχους. Τελικά, η ομαδοποίηση k-μέσων οδήγησε στην οργάνωση της τελική λίστας διαφοροποιημένων γονιδίων σε οκτώ ομάδες παρόμοιας γονιδιακής έκφρασης. Ανάλυση υποκινητών σε μια αντιπροσωπευτική ομάδα αποκάλυψε κοινά θεωρούμενα cis-ρυθμιστικά στοιχεία, προτείνοντας έναν κοινό μηχανισμό ρυθμιστικής μεταγραφής.
Ο υποδοχέας των γλυκοκορτικοειδών (GR) επιδεικνύει αντιφλεγμονώδη δράση εν μέρει μέσω του ανταγωνισμού με προ-φλεγμονώδεις μεταγραφικούς παράγοντες όπως ο πυρηνικός παράγοντας κάπα-Β (NF-κB). Η μελέτη που έγινε στα πλαίσια της παρούσας διατριβής εκτιμά τη λειτουργική συνομιλία/ αλληλεξάρτηση μεταξύ του ενεργοποιημένου GR και της p65 (μείζονα υπομονάδα του NF-κB) μέσω συνολικής ταυτοποίησης των σημείων πρόσδεσής τους και τον γονιδίων στόχων τους. Επίσης, καταδεικνύεται ότι η διέγερση των GR και p65 έχει ως αποτέλεσμα την εκτεταμένη αναδιάταξη των συνόλων των ρυθμιζόμενων γονιδίων και του συσχετισμού τους με καινούργια σημεία πρόσδεσης κατά αλληλοεξαρτώμενο τρόπο. Αυτά τα νέα σημεία πρόσδεσης, ομαδοποιούνται κυρίως με τα γονίδια στόχους της p65 τα οποία ανταγωνίζονται τον ενεργοποιημένο GR και αντιστρόφως. Τα δεδομένα παρουσιάζουν επαναπρογραμματισμό των γλυκοκορτικοειδών και φλεγμονωδών μονοπατιών μετά τη συνδιέγερση των GR και NF-κB παρέχοντας επίγνωση επί των μοριακών δικτύων που βρίσκονται πίσω από τη συνομιλία των GR και NF-κB.
περισσότερα
Περίληψη σε άλλη γλώσσα
The completion of the Human Genome Project and the emergence of high-throughput technologies at the dawn of the new millennium, are rapidly changing the way we approach biological problems towards a more systemic, holistic manner. DNA microarrays and next generation sequencers represent promising new technological developments, used for the investigation and identification of genes or groups of genes associated with important biological processes but also for epigenomic events which are crucial for the understanding of higher biological systems.
The microarray data analysis realm is ever growing through the development of various tools, open source and commercial. However there is absence of predefined rational algorithmic analysis workflows or batch standardized processing to incorporate all steps, from raw data import up to the derivation of significantly differentially expressed gene lists. This absence obfuscates the analytical procedure and obstructs the massive comparative proce ...
The completion of the Human Genome Project and the emergence of high-throughput technologies at the dawn of the new millennium, are rapidly changing the way we approach biological problems towards a more systemic, holistic manner. DNA microarrays and next generation sequencers represent promising new technological developments, used for the investigation and identification of genes or groups of genes associated with important biological processes but also for epigenomic events which are crucial for the understanding of higher biological systems.
The microarray data analysis realm is ever growing through the development of various tools, open source and commercial. However there is absence of predefined rational algorithmic analysis workflows or batch standardized processing to incorporate all steps, from raw data import up to the derivation of significantly differentially expressed gene lists. This absence obfuscates the analytical procedure and obstructs the massive comparative processing of genomic microarray datasets. Moreover, the solutions provided, heavily depend on the programming skills of the user, whereas in the case of GUI embedded solutions, they do not provide direct support of various raw image analysis formats or a versatile and simultaneously flexible combination of signal processing methods. To overcome some of the aforementioned problems and in the framework of this thesis, a computational tool named Gene ARMADA (Automated Robust MicroArray Data Analysis) was developed, which is a MATLAB implemented platform with a GUI. This suite integrates all steps of microarray data analysis including automated data import, noise correction and filtering, normalization, statistical selection of differentially expressed genes, clustering, classification and annotation. Gene ARMADA fully supports 2 colored cDNA, Affymetrix and Illumina oligonucleotide arrays, plus custom arrays for which experimental details are given in tabular form. It also supports the analysis of already processed results through its versatile import editor. In addition, it provides numerous visualization and exploration tools plus customizable export data formats for seamless integration by other analysis tools for further processing.
In parallel with Gene ARMADA and in the framework of developing bioinformatics tools for high-throughput genomic data analysis, a fundamental workflow for analyzing transcription factor and gene expression data derived from next generation sequencing was developed. This workflow consists both of effective use of putative binding site detection tools as well as empirical methodology for data driven noise reduction and statistical detection of differentially expressed genes. The existing and developed tools were applied to study two biological systems i) the study of mastic oil treatment to mouse LLC cells and ii) the study of binding and interaction profile of the factors GR and NF-κB in human HeLa B2 cells, under stimulation or co-stimulation conditions. A parallel study of gene expression was also performed through the profiling of RNAPII binding.
Mastic oil from Pistacia lentiscus variation chia, a blend of bioactive terpenes with recognized medicinal properties, has been recently shown to exert anti-tumor growth activity through inhibition of cancer cell proliferation, survival, angiogenesis and inflammatory response. However, no studies have addressed its mechanisms of action at genome-wide gene expression level. To investigate molecular mechanisms triggered by mastic oil, LLC cells were treated with mastic oil or DMSO at five distinct time points (3-48h). Microarray expression profiling was performed using Illumina beadchips, followed by computational analysis. For a number of selected genes, RT-PCR validation was performed in LLC cells as well as in three human cancer cell lines of different origin (A549, HCT116, K562). In total, this work demonstrated that exposure of Lewis lung carcinomas to mastic oil caused a time-dependent alteration in the expression of 925 genes. GO analysis associated expression profiles with several biological processes and functions. Among them, modifications on cell cycle/proliferation, survival and NF-κB cascade in conjunction with concomitant regulation of genes encoding for PTEN, E2F7, HMOX1 (up-regulation) and NOD1 (down-regulation) indicated some important mechanistic links underlying the anti-proliferative, pro-apoptotic and anti-inflammatory effects of mastic oil. The expression profiles of Hmox1, Pten and E2f7 genes were similarly altered by mastic oil in the majority of test cancer cell lines. Inhibition of PTEN partially reversed mastic oil effects on tumor cell growth, indicating a multi-target mechanism of action. Finally, k-means clustering, organized the significant gene list in eight clusters demonstrating a similar expression profile. Promoter analysis in a representative cluster revealed shared putative cis-elements suggesting a common regulatory transcription mechanism.
Glucocorticoid receptor (GR) exerts anti-inflammatory action in part by antagonizing pro-inflammatory transcription factors such as the nuclear factor kappa-b (NF-B). In this work, the cross-talk of activated GR and p65 (major NF-B component). Here we assess by global identification of their binding sites and target genes. We show that cο-activation of GR and p65 results in extensive rearrangement of the regulated genes repertoire and in their association with novel sites in a mutually dependent manner. These novel sites predominantly cluster with p65 target genes that are antagonized by activated GR and vice versa. Our data show reprogramming of glucocorticoid and inflammatory pathways upon co-activation of GR and NF-B and provide insight into the networks underlying the GR and NF-B crosstalk.
περισσότερα