Περίληψη
Στους ευκαρυωτικούς οργανισμούς, τα πρόδρομα μετάγραφα των γονιδίων που κωδικοποιούν πρωτεΐνες (pre-mRNAs), περιλαμβάνουν τόσο αλληλουχίες εσωνίων όσο και εξωνίων. Όλα τα pre-mRNAs υποβάλλονται σε επεξεργασία από το σωμάτιο συρραφής (spliceosome), κατά την οποία αποβάλλονται τα εσώνια και συρράπτονται τα εξώνια, ώστε για να δημιουργηθούν τα αντίστοιχα ώριμα mRNAs. Ωστόσο, το φαινόμενο της εναλλακτικής συρραφής επιτρέπει διαφορετικούς τρόπους συρραφής των εξωνίων, οδηγώντας στην παραγωγή αρκετών mRNA μεταγράφων από ένα γονίδιο. Η εναλλακτική συρραφή αποτελεί μια πολυβάθμια βιολογική διαδικασία, η οποία ρυθμίζεται σε μεγάλο βαθμό ανάλογα με τον τύπο του κυττάρου και το αναπτυξιακό στάδιο. Παρόλα αυτά, αρκετές ρυθμιστικές δυσλειτουργίες μπορεί να οδηγήσουν σε αλλοιώσεις των θέσεων ματίσματος, προκαλώντας έτσι δυσμενείς επιδράσεις στην κυτταρική ομοιόσταση. Πιο συγκεκριμένα, το εναλλακτικό μάτισμα των γονιδίων που σχετίζονται με τον καρκίνο είναι ένας κοινός κυτταρικός μηχανισμός, ο οποίος ...
Στους ευκαρυωτικούς οργανισμούς, τα πρόδρομα μετάγραφα των γονιδίων που κωδικοποιούν πρωτεΐνες (pre-mRNAs), περιλαμβάνουν τόσο αλληλουχίες εσωνίων όσο και εξωνίων. Όλα τα pre-mRNAs υποβάλλονται σε επεξεργασία από το σωμάτιο συρραφής (spliceosome), κατά την οποία αποβάλλονται τα εσώνια και συρράπτονται τα εξώνια, ώστε για να δημιουργηθούν τα αντίστοιχα ώριμα mRNAs. Ωστόσο, το φαινόμενο της εναλλακτικής συρραφής επιτρέπει διαφορετικούς τρόπους συρραφής των εξωνίων, οδηγώντας στην παραγωγή αρκετών mRNA μεταγράφων από ένα γονίδιο. Η εναλλακτική συρραφή αποτελεί μια πολυβάθμια βιολογική διαδικασία, η οποία ρυθμίζεται σε μεγάλο βαθμό ανάλογα με τον τύπο του κυττάρου και το αναπτυξιακό στάδιο. Παρόλα αυτά, αρκετές ρυθμιστικές δυσλειτουργίες μπορεί να οδηγήσουν σε αλλοιώσεις των θέσεων ματίσματος, προκαλώντας έτσι δυσμενείς επιδράσεις στην κυτταρική ομοιόσταση. Πιο συγκεκριμένα, το εναλλακτικό μάτισμα των γονιδίων που σχετίζονται με τον καρκίνο είναι ένας κοινός κυτταρικός μηχανισμός, ο οποίος σχετίζεται άμεσα με την πολυπλοκότητα του μεταγραφώματος του καρκινικού κυττάρου και επηρεάζει τον έλεγχο του κυτταρικού κύκλου, τον πολλαπλασιασμό, την απόπτωση, την αγγειογένεση, τη διήθηση και την μετάσταση. Για το λόγο αυτό, αρκετά εναλλακτικά μετάγραφα που παράγονται με παρεκκλίνοντα γεγονότα συρραφής μπορεί να αντιπροσωπεύουν ελπιδοφόρους βιοδείκτες καρκίνου ή θεραπευτικούς στόχους.Η γονιδιακή οικογένεια των καλλικρεϊνών (KLKs), η οποία αποτελείται από 15 μέλη (KLK1-KLK15), κωδικοποιεί τη μεγαλύτερη ομάδα πρωτεασών σερίνης στον άνθρωπο. Η πρώτη KLK πρωτεΐνη ανακαλύφθηκε το έτος 1930. Tο ανθρώπινο γονίδιο που την κωδικοποιούσε παρέμενε ακόμα άγνωστο και ανακαλύφθηκε αρκετά χρόνια μετά, συγκεκριμένα το 1985, παίρνοντας την ονομασία KLK1. Τα γονίδια KLK2 και KLK3 (το γνωστό PSA) ανακαλύφθηκαν τη δεκαετία του 1980. Τα υπόλοιπα 12 νέα μέλη των καλλικρεϊνών ανακαλύφθηκαν τα έτη 1998-2000 από τους Yousef, Scorilas και Diamandis. Τα ανθρώπινα γονίδια KLKs μοιράζονται πολλά κοινά χαρακτηριστικά και παρουσιάζουν μεγάλη ομοιότητα, καθώς αποτελούνται από πέντε κωδικά εξώνια παρόμοιου μεγέθους με συντηρημένες περιοχές εσωνίων. Μερικά από τα γεγονότα εναλλακτικής συρραφής, που έχουν παρατηρηθεί να οδηγούν στην παραγωγή KLK μεταγράφων, περιλαμβάνουν την παράλειψη εξωνίων, την εναλλακτική 5' και 3' θέση συρραφής, τη διατήρηση εσωνίων, τις επεκτάσεις ή περικοπές εξωνίων και τη χρήση εναλλακτικών θέσεων πολυαδενυλίωσης. Ωστόσο, πολλά από τα μετάγραφα των γονιδίων KLKs χαρακτηρίζονται από μη φυσιολογικά επίπεδα έκφρασης σε διάφορες κακοήθειες και κατά συνέπεια διαθέτουν σημαντική προγνωστική και / ή διαγνωστική αξία. Επιπρόσθετα, το ανθρώπινο γονίδιο RNASEK κωδικοποιεί την πρωτεΐνη RNase κ, η οποία εκφράζεται ευρέως σε όλους τους ιστούς και στα στάδια εξέλιξης, παρουσιάζοντας ενδοριβονουκλεολυτική δραστικότητα και συνεπώς έχει πολύ σημαντική βιολογική λειτουργία. Tο ανθρώπινο γονίδιο RNASEK κλωνοποιήθηκε το έτος 2007 από τους Economopoulou, Fragoulis και Sideris. Στο γονίδιο αυτό έχουν παρατηρηθεί εναλλακτικά γεγονότα ματίσματος μικρής έκτασης, τα οποία οδηγούν στο σχηματισμό εναλλακτικών μεταγράφων που δεν περιέχουν ή περιλαμβάνουν μικρό αριθμό νουκλεοτιδίων, οδηγώντας στην έκφραση πρωτεϊνικών ισομορφών. Ένα άλλο ταχέως αναπτυσσόμενο επιστημονικό πεδίο στην έρευνα για τον καρκίνο είναι η μελέτη των microRNAs (miRNAs). Τα miRNAs αποτελούν μια μεγάλη οικογένεια μικρών μορίων που ρυθμίζουν αρνητικά, στο μετα-μεταγραφικό επίπεδο, τη γονιδιακή έκφραση. Πρόσφατα επιστημονικά δεδομένα έχουν αναδείξει την αξιοσημείωτη απορρύθμιση των επιπέδων miRNA σε ανθρώπινες κακοήθειες και υποδηλώνουν ότι μπορεί να αντιπροσωπεύουν νέους υποσχόμενους βιοδείκτες καρκίνου.Τα τελευταία χρόνια, η εναλλακτική συρραφή μπορεί να μελετηθεί σε βάθος με τη χρήση της τεχνολογίας της αλληλούχησης νέας γενιάς (NGS). Η αλληλούχηση RNA υψηλής απόδοσης (RNA-seq), μία από τις πιο βασικές εφαρμογές της τεχνολογίας NGS, καθιστά δυνατό τον προσδιορισμό, τον χαρακτηρισμό και την ποσοτικοποίηση των εκφρασμένων μορίων RNA στα υπό μελέτη δείγματα και συνεπώς μπορεί να οδηγήσει σε σημαντικές βιολογικές ανακαλύψεις σχετικά με το ανθρώπινο μεταγράφωμα. Η εφαρμογή RNA-seq διαθέτει αρκετά σημαντικά πλεονεκτήματα σε σχέση με την ανάλυση της έκφρασης γονιδίων, συμπεριλαμβανομένης της υψηλής ευαισθησίας και ακρίβειας, της ευρείας δυναμικής εμβέλειας, της ανάλυσης σε επίπεδο νουκλεοτιδίου και της ανάλυσης του mRNA εναλλακτικού ματίσματος και για την ανίχνευση νέων μεταγράφων. Η τεχνολογία NGS συνδυασμένη με τεχνικές μοριακής κλωνοποίησης, όπως η ταχεία ενίσχυση των άκρων cDNA (RACE), μπορεί να παρέχει χρήσιμες πληροφορίες σχετικά με τις εναλλακτικές θέσεις έναρξης μεταγραφής και τις θέσεις πολυαδενυλίωσης που συνήθως χρησιμοποιούνται και οι οποίες αυξάνουν την πολυπλοκότητα του μεταγραφώματος.Ο πρωταρχικός στόχος της παρούσας διδακτορικής διατριβής ήταν η ανακάλυψη νέων εναλλακτικών μεταγράφων των ανθρώπινων γονιδίων KLKs και RNASEK, με τη χρήση nested 3' RACE και NGS. Επιπλέον, ο δεύτερος στόχος ήταν η ανάλυση δεδομένων miRNA-seq για την ανίχνευση νέων miRNAs που προβλέπεται να στοχεύουν τα ανθρώπινα γονίδια KLKs και / ή RNASEK. Προκειμένου να επιτευχθούν αυτοί οι στόχοι, πραγματοποιήθηκε nested 3' RACE με τη χρήση ειδικών ζευγών εκκινητών, επιτρέποντας την ενίσχυση των ανθρώπινων μεταγράφων των γονιδίων KLKs και RNASEK. Στη συνέχεια, μετά την ολοκλήρωση της κατασκευής και ποσοτικοποίησης της βιβλιοθήκης, καθώς και των διαδικασιών προετοιμασίας και εμπλουτισμού του εκμαγείου αλληλούχησης, πραγματοποιήθηκαν αντιδράσεις NGS για κάθε γονίδιο-στόχο, εφαρμόζοντας νέα πειραματικά πρωτόκολλα που αναπτύχθηκαν για το σκοπό αυτό. Η ανάλυση των δεδομένων NGS που προέκυψαν αποκάλυψε την ύπαρξη νέων εναλλακτικών σημείων συρραφής που περιλαμβάνουν νέα εξώνια, νέες 3' αμετάφραστες περιοχές (3' UTRs), επεκτάσεις και περικοπές εξωνίων, καθώς και εναλλακτικά γεγονότα ματίσματος μεταξύ αυτών των εξωνίων. Στη συνέχεια, πραγματοποιήθηκε nested RT-PCR σε ένα σύνολο 55 ανθρώπινων κυτταρικών σειρών που προέρχονταν από δεκαεπτά καρκινικούς και δύο φυσιολογικούς ιστούς με τη χρήση ειδικών ζευγών εκκινητών, με σκοπό την ανάλυση έκφρασης του κάθε νέου εναλλακτικού μεταγράφου, ενώ μέσω αλληλούχησης κατά Sanger των αντίστοιχων αμπλικονίων επιβεβαιώθηκε η δομή των εναλλακτικών μεταγράφων που ανακαλύφθηκαν.Συνολικά, ανακαλύφθηκαν και χαρακτηρίστηκαν συνολικά 61 νέα εναλλακτικά μετάγραφα της γονιδιακής οικογένειας των KLKs, από τα οποία τα 36 νέα μετάγραφα διαθέτουν ανοιχτό πλαίσιο ανάγνωσης (ORF) και προβλέπεται να κωδικοποιούν νέες πρωτεϊνικές ισομορφές, ενώ τα υπόλοιπα 25 περιέχουν πρόωρο κωδικόνιο τερματισμού και πιθανώς αντιπροσωπεύουν μη κωδικά μόρια mRNA. Πιο συγκεκριμένα, όσον αφορά τα γονίδια των κλασσικών καλλικρεϊνών (KLK1-KLK3), ταυτοποιήθηκε η ύπαρξη 2 νέων μεταγράφων του γονιδίου KLK1, 9 νέων μεταγράφων του γονιδίου KLK2, καθώς και 2 νέων μεταγράφων του γονιδίου KLK3, τα οποία βρέθηκαν να εκφράζονται αποκλειστικά σε ανθρώπινες καρκινικές κυτταρικές σειρές προστάτη. Παράλληλα, ανιχνεύτηκαν 3 νέα μετάγραφα του γονιδίου KLK5, 6 νέα μετάγραφα του γονιδίου KLK6, 2 νέα μετάγραφα του γονιδίου KLK7, 9 νέα μετάγραφα του γονιδίου KLK8 και 10 νέα μετάγραφα του γονιδίου KLK9, τα οποία βρέθηκαν να εκφράζονται σε σημαντικά επίπεδα σε αρκετές ανθρώπινες καρκινικές κυτταρικές σειρές από διάφορες ανθρώπινες νεοπλασίες. Συμπληρωματικά, στο γονίδιο KLK10 επιβεβαιώθηκε η ύπαρξη 8 νέων εναλλακτικών μεταγράφων, αλλά και μιας νέας 3' UTR που τα χαρακτηρίζει. Τέλος, ανακαλύφθηκαν 3 νέα μετάγραφα του γονιδίου KLK11, 1 νέο μετάγραφο του γονιδίου KLK12, καθώς και 6 νέα εναλλακτικά μετάγραφα του γονιδίου KLK15.Επιπλέον, ανακαλύφθηκαν συνολικά 8 νέα εναλλακτικά μετάγραφα του γονιδίου RNASEK, 6 από τα οποία διαθέτουν ORF και προβλέπεται να είναι κωδικά μετάγραφα, ενώ τα υπόλοιπα 2 περιέχουν πρόωρο κωδικόνιο τερματισμού και πιθανώς αντιπροσωπεύουν μη κωδικά μόρια mRNA. Τέλος, η εκτεταμένη ανάλυση που πραγματοποιήθηκε σε ένα μεγάλο σύνολο δεδομένων από πειράματα miRNA-seq οδήγησε στην ταυτοποίηση ενός νέου μικρού μη κωδικού μορίου RNA (sncRNA), πιθανού miRNA, το οποίο προβλέπεται να στοχεύει την 3' UTR του ανθρώπινου γονιδίου KLK4.Τα νέα μετάγραφα, λόγω του υψηλού δυναμικού τους ως βιοδείκτες, το οποίο προέκυψε από τα πειραματικά δεδομένα, θα μπορούσαν να χρησιμοποιηθούν για διαγνωστικούς και προγνωστικούς σκοπούς σε πολλές ανθρώπινες κακοήθειες. Είναι γνωστό ότι οι KLKs έχουν προσελκύσει μεγάλο μέρος της προσοχής της επιστημονικής κοινότητας κατά τις τελευταίες δεκαετίες. Η αποκρυπτογράφηση της πολυπλοκότητας των μεταγράφων που προέρχονται από τη συγκεκριμένη γονιδιακή οικογένεια είναι πολύ σημαντική και η τεχνολογία NGS θα αποτελέσει σίγουρα ένα βασικό παράγοντα για αυτό το επίτευγμα στο εγγύς μέλλον. Τα νέα εναλλακτικά μετάγραφα, τα οποία ταυτοποιήθηκαν από την παρούσα διδακτορική διατριβή, μπορεί να αποτελούν πολύτιμους διαγνωστικούς ή/και προγνωστικούς βιοδείκτες σε διάφορες ανθρώπινες νεοπλασίες και για το λόγο αυτό απαιτείται περαιτέρω μελέτη της έκφρασής τους σε στατιστικά σημαντικό μέγεθος δειγμάτων ασθενών με διάφορους τύπους καρκίνου.
περισσότερα
Περίληψη σε άλλη γλώσσα
In eukaryotic organisms, the primary transcripts of the protein-coding genes, namely pre-mRNAs, comprise both intronic and exonic sequences. All pre-mRNAs are processed by the spliceosome and their intronic sequences are spliced out in a highly orchestrated fashion to generate the respective mRNAs. However, the process of alternative splicing enables the differential splicing of exons, leading to the production of multiple mRNA transcripts from a single gene. Consequently, it can be easily assumed that RNA splicing is a multistep biological procedure that is highly regulated according to the cell type, developmental stage, and disease conditions. Although alternative splicing is a process that is characterized by tight regulation, specific regulatory malfunctions may lead to alterations in splicing patterns, thus causing unfavorable effects in cellular homeostasis. Several splicing alterations are associated with cancer development and/or progression, as particular alternatively splice ...
In eukaryotic organisms, the primary transcripts of the protein-coding genes, namely pre-mRNAs, comprise both intronic and exonic sequences. All pre-mRNAs are processed by the spliceosome and their intronic sequences are spliced out in a highly orchestrated fashion to generate the respective mRNAs. However, the process of alternative splicing enables the differential splicing of exons, leading to the production of multiple mRNA transcripts from a single gene. Consequently, it can be easily assumed that RNA splicing is a multistep biological procedure that is highly regulated according to the cell type, developmental stage, and disease conditions. Although alternative splicing is a process that is characterized by tight regulation, specific regulatory malfunctions may lead to alterations in splicing patterns, thus causing unfavorable effects in cellular homeostasis. Several splicing alterations are associated with cancer development and/or progression, as particular alternatively spliced transcripts can affect cell transformation, motility, and metastasis of tumor cells. Alternative splicing of cancer-related genes is a common cellular mechanism accounting for cancer cell transcriptome complexity and affecting cell cycle control, proliferation, apoptosis, angiogenesis, invasion, and metastasis. For this reason, alternative transcripts produced by aberrant splicing events may represent promising cancer biomarkers or therapeutic targets.The gene family of tissue kallikrein and kallikrein-related peptidases (KLKs), consisting of 15 members (KLK1 – KLK15), encompasses the largest contiguous cluster of serine proteases in humans. The human KLK genes share many common features and exhibit high similarity as they consist of five coding exons of similar size, with conserved intron phases Alternative splicing events that generate multiple KLK transcripts include exon skipping, mutually exclusive exons (special case of exon skipping), alternative 5′ and 3′ splice site usage, intron retention, exon extensions or truncations, and use of alternative polyadenylation sites. While multiple alternative transcripts have been reported with regard to the vast majority of human KLK genes, many of them have been found aberrantly expressed in various malignancies, thus possessing significant prognostic and/or diagnostic value. In addition, the human RNASEK gene encodes the RNase κ protein, which is widely expressed in all tissues and developmental stages, showing endoribonucleolytic activity and therefore having a very significant biological function. Subtle alternative splicing events in the human RNASEK gene lead to the formation of RNA variants lacking or including a small number of nucleotides, leading to the expression of protein isoforms. Another rapidly developing scientific field in cancer research is the study of microRNAs (miRNAs). miRNAs constitute a large family of small molecules that negatively regulate, at the post-transcriptional level, the expression of genes involved in key-cellular processes. Recent data describe the marked deregulation of miRNA levels in human malignancies and suggest that they might represent novel promising cancer biomarkers.Alternative splicing can now be studied in-depth using Next-Generation Sequencing (NGS) technology. High-throughput RNA sequencing (RNA-seq), one of the newest applications of NGS, enables the determination, characterization, and quantification of the expressed RNA molecules in the sample(s) of interest, and can hence lead to important biological discoveries regarding the human transcriptome. Despite the need for bioinformatic tools for NGS data analysis, RNA-seq possesses several major advantages over classical gene expression analysis, including its high sensitivity and accuracy, broad dynamic range, nucleotide-level resolution, and – most importantly – its ability to analyze pre-mRNA alternative splicing and to detect novel transcripts. NGS combined with molecular cloning techniques such as rapid amplification of cDNA ends (RACE) can provide useful information about alternative transcription start sites and polyadenylation sites that are usually exploited and which increase transcriptome complexity.The primary objective of the present thesis was the discovery of novel alternative splice variants of the human KLK genes and RNASEK, using nested 3′ RACE and high-throughput sequencing. Furthermore, the secondary objective was the bioinformatic identification of novel putative miRNAs that are predicted to target the human KLKs and/or RNASEK.In order to reach these goals, nested 3′ RACE was carried out with the use of gene-specific primer pairs, enabling the amplification of the human KLK and RNASEK transcripts. Then, after the completion of library construction and quantitation as well as the template preparation and enrichment procedures, NGS was performed for each target-gene. Extensive bioinformatic analysis of the acquired NGS data revealed the existence of novel splice variants comprising entirely new exons, new 3′ UTRs, previously unknown boundaries of the already annotated exons (extensions and truncations) as well as alternative splicing events between these exons. Then, nested RT-PCR in a panel of 55 human cell lines originating from seventeen cancerous and two normal tissues, with the use of variant-specific pairs of primers, was carried out for the expression analysis of these novel splice variants, while Sanger sequencing of the respective amplicons confirmed the structure of the newly discovered transcripts.In summary, a total of 61 novel alternative transcripts were discovered for the KLK gene family, from which 36 novel transcripts are likely to possess an open reading frame (ORF) and are predicted to encode new KLK isoforms, while the other 25 transcripts contain a premature stop codon and probably represent nonsense-mediated mRNA decay (NMD) candidates. Since KLKs are implicated in human malignancies and qualify as potential biomarkers, the quantification of the novel KLK transcripts in human samples may have clinical applications in different types of cancer. In addition, a total of 8 novel alternative transcripts were discovered for the RNASEK gene, 6 out of which can be considered as protein-coding, whereas the rest 2 are non-coding splice variants. Finally, the extensive bioinformatic analysis that was carried out in a large dataset of miRNA-seq experiments led to the identification of a novel putative miRNA that is predicted to target the 3′ UTR of the human KLK4 gene.Τhe newly discovered transcripts presented in this study may constitute per se valuable disease biomarkers, especially regarding particular human malignancies. Undoubtedly, their expression patterns in both cancerous and normal tissue samples merit further investigation. Due to their multiple roles in cellular homeostasis and physiology, their involvement in key signaling pathways, the wide range of tissues in which they are expressed or secreted, but mostly due to their high potential as biomarkers that could be used for diagnostic and prognostic purposes in several human malignancies, KLKs have attracted much of the attention of the scientific community during the last decades. For all these reasons, deciphering the complexity of the transcripts originating from the kallikrein locus is very important, and NGS technology will certainly be a key player for this accomplishment in the near future.
περισσότερα