Περίληψη
Κατά τη διάρκεια των τελευταίων δεκαετιών, οι σημαντικές εξελίξεις των επιστημών της πληροφορικής και της βιολογίας έχουν προσελκύσει το ενδιαφέρον όλης της ανθρωπότητας. Η ανάπτυξη του Παγκόσμιου Ιστού και η αποκρυπτογράφηση του ανθρώπινου γονιδιώματος αντανακλούν την έκταση της προόδου αυτών των επιστημών. Μάλιστα, η ραγδαία ανάπτυξη της τεχνολογίας έχει οδηγήσει στην αύξηση του ρυθμού παραγωγής βιολογικών δεδομένων, γεγονός που κατέστησε επιτακτική την ανάγκη στενής συνεργασίας μεταξύ των επιστημόνων της βιολογίας και της πληροφορικής. Αυτή η συνεργασία οδήγησε στην εμφάνιση της βιοπληροφορικής, μιας νέας διεπιστημονικής ερευνητικής περιοχής, που αποτελεί την τομή των επιστημών της βιολογίας και της πληροφορικής. Σκοπός της βιοπληροφορικής είναι η ανάπτυξη και η χρήση εργαλείων για τη διαχείριση και ανάλυση του τεράστιου όγκου των βιολογικών δεδομένων. Παράλληλα με τη βιοπληροφορική εξελίχθηκε και ένα άλλο ερευνητικό πεδίο ως απότοκος της ανάγκης αποδοτικής και αποτελεσματικής διαχε ...
Κατά τη διάρκεια των τελευταίων δεκαετιών, οι σημαντικές εξελίξεις των επιστημών της πληροφορικής και της βιολογίας έχουν προσελκύσει το ενδιαφέρον όλης της ανθρωπότητας. Η ανάπτυξη του Παγκόσμιου Ιστού και η αποκρυπτογράφηση του ανθρώπινου γονιδιώματος αντανακλούν την έκταση της προόδου αυτών των επιστημών. Μάλιστα, η ραγδαία ανάπτυξη της τεχνολογίας έχει οδηγήσει στην αύξηση του ρυθμού παραγωγής βιολογικών δεδομένων, γεγονός που κατέστησε επιτακτική την ανάγκη στενής συνεργασίας μεταξύ των επιστημόνων της βιολογίας και της πληροφορικής. Αυτή η συνεργασία οδήγησε στην εμφάνιση της βιοπληροφορικής, μιας νέας διεπιστημονικής ερευνητικής περιοχής, που αποτελεί την τομή των επιστημών της βιολογίας και της πληροφορικής. Σκοπός της βιοπληροφορικής είναι η ανάπτυξη και η χρήση εργαλείων για τη διαχείριση και ανάλυση του τεράστιου όγκου των βιολογικών δεδομένων. Παράλληλα με τη βιοπληροφορική εξελίχθηκε και ένα άλλο ερευνητικό πεδίο ως απότοκος της ανάγκης αποδοτικής και αποτελεσματικής διαχείρισης μεγάλων όγκων δεδομένων. Η ανακάλυψη γνώσης από βάσεις δεδομένων παρέχει ένα σύνολο ισχυρών εργαλείων για την ανάλυση νέων τύπων δεδομένων με σκοπό την αποδοτική και αποτελεσματική εξαγωγή γνώσης. Αυτά τα εργαλεία συνδυάζουν τεχνικές από διάφορες περιοχές, όπως είναι η στατιστική, η τεχνητή νοημοσύνη, η αναγνώριση προτύπων και η τεχνολογία βάσεων δεδομένων, με σκοπό την αντιμετώπιση των εμποδίων και των περιορισμών που τίθενται από τις παραδοσιακές μεθόδους ανάλυσης δεδομένων. Η παρούσα διατριβή έχει ως αντικείμενο μελέτης την ανακάλυψη γνώσης από βιολογικά δεδομένα και εντάσσεται στα πλαίσια των ερευνητικών περιοχών της ανακάλυψης γνώσης από βάσεις δεδομένων και της βιοπληροφορικής. Στους στόχους της διατριβής περιλαμβάνεται η επινόηση νέων και η τροποποίηση ή επέκταση υπαρχουσών μεθόδων ανακάλυψης γνώσης, καθώς και η εφαρμογή τους για την ανάλυση βιολογικών δεδομένων. Στα πλαίσια της διατριβής ορίζεται ένα νέο είδος προβλήματος της ανακάλυψης γνώσης από βάσεις δεδομένων, που περιλαμβάνει την ανακάλυψη αμοιβαίως αποκλειόμενων αντικειμένων. Προτείνεται ένας αλγόριθμος ανακάλυψής τους από μια βάση δεδομένων συναλλαγών, ο οποίος εφαρμόζεται σε βιολογικά δεδομένα που αφορούν την έκφραση γονιδίων. Επιπλέον, προτείνεται μια μέθοδος για την αποτελεσματική ταξινόμηση δεδομένων γονιδιακής έκφρασης με απώτερο σκοπό την πρόβλεψη φαινοτύπου. Επίσης, προτείνονται προσεγγίσεις που εντάσσονται στα πλαίσια της ανάλυσης βιολογικών αλληλουχιών. Συγκεκριμένα, αντιμετωπίζονται δύο ξεχωριστά προβλήματα που προσελκύουν το ενδιαφέρον των ερευνητών, η πρόβλεψη του σημείου έναρξης της μετάφρασης και η πρόβλεψη του σημείου αποκοπής και πολυαδενυλίωσης.
περισσότερα
Περίληψη σε άλλη γλώσσα
During the last decades the major advances in informatics and biology have attracted the interest of all humanity. The growth of World Wide Web and the Human Genome Project reflect the extent of the development of these two scientific areas. Moreover, the rapid technological development has resulted in an increased rate of biological data accumulation, necessitating the collaboration between scientists of biology and informatics. This collaboration has lead to the emergence of bioinformatics, a new interdisciplinary research area, which is the intersection of biology and informatics. The aim of bioinformatics is the development and use of tools for managing and analyzing the vast amounts of biological data. Another research area has been grown along with bioinformatics, in order to deal with large-volume data management efficiently and effectively. Knowledge discovery in databases provides a set of tools to analyze new data types in order to extract various types of knowledge efficient ...
During the last decades the major advances in informatics and biology have attracted the interest of all humanity. The growth of World Wide Web and the Human Genome Project reflect the extent of the development of these two scientific areas. Moreover, the rapid technological development has resulted in an increased rate of biological data accumulation, necessitating the collaboration between scientists of biology and informatics. This collaboration has lead to the emergence of bioinformatics, a new interdisciplinary research area, which is the intersection of biology and informatics. The aim of bioinformatics is the development and use of tools for managing and analyzing the vast amounts of biological data. Another research area has been grown along with bioinformatics, in order to deal with large-volume data management efficiently and effectively. Knowledge discovery in databases provides a set of tools to analyze new data types in order to extract various types of knowledge efficiently and effectively. These tools combine powerful techniques from different areas, such as statistics, artificial intelligence, pattern recognition and database technology. This fusion of technologies aims to overcome the obstacles and constraints posed by the traditional data analysis methods. The scope of this thesis includes knowledge discovery from biological data and is strongly related to the research areas of knowledge discovery in data bases and bioinformatics. This thesis targets to the invention of new knowledge discovery methods and the modification or extension of existing ones, as well as the application of these methods for biological data analysis. In the framework of this thesis a new knowledge discovery problem, which deals with the discovery of mutually exclusive items, is defined. An algorithm for mining mutually exclusive items from transactional data is provided and is applied on gene expression data. Moreover, an approach for the effective classification of gene expression data and phenotype prediction is proposed. Furthermore, a number of biological sequence analysis approaches are proposed. In particular, two interesting and distinct sequence analysis problems are studied, namely translation initiation site prediction and cleavage-polyadenylation site prediction.
περισσότερα