Περίληψη
Ο στόχος της παρούσας διδακτορικής διατριβής είναι η δημιουργία συστημάτων υποστήριξης απόφασης με γνώση που παράγεται από τεχνικές εξόρυξης δεδομένων. Πιο συγκεκριμένα, στο χώρο της βιοιατρικής, σχεδιάσαμε και υλοποιήσαμε ένα σύστημα υποστήριξης απόφασης για την πάθηση της ισχαιμίας, με επεξεργασία του ΗΚΓκού σήματος. Από το χώρο της βιολογίας, σχεδιάσαμε και υλοποιήσαμε μια μέθοδο ταξινόμησης πρωτεϊνών σε πτυχές. Τέλος, αναπτύξαμε και μια καινοτόμα μεθοδολογία που μπορεί να εφαρμοστεί σε διάφορα πεδία, με την προϋπόθεση ότι είναι ακολουθιακά και περιγράφονται από διακριτές χρονοσειρές. Πιο συγκεκριμένα, στο πρώτο κεφάλαιο παρουσιάζουμε και περιγράφουμε τις γενικές έννοιες των ιατρικών συστημάτων υποστήριξης απόφασης, της εξόρυξης δεδομένων καθώς και τη σχέση μεταξύ των δυο εννοιών. Παρουσιάζεται η γενικότερη μεθοδολογία εξόρυξης δεδομένων που χρησιμοποιείται για τη δημιουργία συστημάτων υποστήριξης απόφασης. Στο τέλος του πρώτου κεφαλαίου γίνεται λεπτομερής ανασκόπηση στους τομείς κα ...
Ο στόχος της παρούσας διδακτορικής διατριβής είναι η δημιουργία συστημάτων υποστήριξης απόφασης με γνώση που παράγεται από τεχνικές εξόρυξης δεδομένων. Πιο συγκεκριμένα, στο χώρο της βιοιατρικής, σχεδιάσαμε και υλοποιήσαμε ένα σύστημα υποστήριξης απόφασης για την πάθηση της ισχαιμίας, με επεξεργασία του ΗΚΓκού σήματος. Από το χώρο της βιολογίας, σχεδιάσαμε και υλοποιήσαμε μια μέθοδο ταξινόμησης πρωτεϊνών σε πτυχές. Τέλος, αναπτύξαμε και μια καινοτόμα μεθοδολογία που μπορεί να εφαρμοστεί σε διάφορα πεδία, με την προϋπόθεση ότι είναι ακολουθιακά και περιγράφονται από διακριτές χρονοσειρές. Πιο συγκεκριμένα, στο πρώτο κεφάλαιο παρουσιάζουμε και περιγράφουμε τις γενικές έννοιες των ιατρικών συστημάτων υποστήριξης απόφασης, της εξόρυξης δεδομένων καθώς και τη σχέση μεταξύ των δυο εννοιών. Παρουσιάζεται η γενικότερη μεθοδολογία εξόρυξης δεδομένων που χρησιμοποιείται για τη δημιουργία συστημάτων υποστήριξης απόφασης. Στο τέλος του πρώτου κεφαλαίου γίνεται λεπτομερής ανασκόπηση στους τομείς και τις εφαρμογές που αναπτύχθηκαν στην παρούσα διδακτορική διατριβή, δηλαδή μεθοδολογίες εντοπισμού ισχαιμικών παλμών στο ηλεκτροκαρδιογράφημα, και συστήματα ταξινόμησης πρωτεϊνών σε πτυχές και κλάσεις. Στο κεφάλαιο 2 γίνεται βιβλιογραφική ανασκόπηση τόσο σε επιτυχημένα ιατρικά συστήματα υποστήριξης απόφασης που εφαρμόστηκαν στην κλινική πράξη όσο και σε αλγορίθμους εξόρυξης δεδομένων. Επίσης, γίνεται βιβλιογραφική ανασκόπηση στα επιμέρους πεδία της διδακτορικής διατριβής: ταξινόμηση ισχαιμικών παλμών και ταξινόμηση πρωτεϊνών. Στα κεφάλαια 3 και 4, γίνεται αναλυτική περιγραφή των μεθόδων που υλοποιήσαμε για την επίλυση των 2 εφαρμογών. Οι μέθοδοι ακολουθούν ένα γενικότερο σχήμα που αντιστοιχεί σε α)συλλογή δεδομένων β) προεπεξεργασία δεδομένων γ) ανάλυση δεδομένων με τεχνικές εξόρυξης δεδομένων και δ) δημιουργία του μοντέλου ταξινόμησης – συστήματος υποστήριξης απόφασης. Ιδιαίτερα στο βήμα γ, ιδιαίτερη έμφαση δόθηκε στην παρούσα διδακτορική διατριβή στις τεχνικές εξαγωγής κανόνων συσχέτισης και τεχνικές εξαγωγής ακολουθιακών προτύπων. Τα αποτελέσματα που σημειώθηκαν και στις 2 εφαρμογές δείχνουν την αποδοτικότητα αυτών των μεθόδων στην δημιουργία συστημάτων υποστήριξης απόφασης. Στο κεφάλαιο 5, παρουσιάζουμε μια μεθοδολογία που χρησιμοποιείται για την δημιουργία μοντέλων ταξινόμησης ακολουθιών. Η μεθοδολογία ενσωματώνει τεχνικές εξαγωγής ακολουθιακών προτύπων και βελτιστοποίησης και συγκρίνεται με ήδη υπάρχοντες αλγόριθμους που εκτελούν την ίδια δουλεία. Τέλος, στο κεφάλαιο 6 δίνουμε γενικά συμπεράσματα της διατριβής και μελλοντικές προεκτάσεις της. Μια προέκταση που έχει ήδη εντοπιστεί είναι η δημιουργία συστημάτων υποστήριξης απόφασης με τεχνικές εξόρυξης δεδομένων που εφαρμόζονται σε δεδομένα και κλινικά αλλά και γενετικά. Η σύνδεση αυτών των 2 τύπων δεδομένων μπορεί να βοηθήσει στην καλύτερη περιγραφή του ασθενή και άρα στην πιο ακριβής και αποτελεσματική διάγνωσή του. Η χρήση κλινικών και γενετικών δεδομένων έχει να προσφέρει πολλά σε παθήσεις όπως ο καρκίνος όπου τα γενετικά δεδομένα παίζουν τον κυριότερο ρόλο. Στο τέλος του κεφαλαίου προτείνουμε την αρχιτεκτονική ενός συστήματος που κάνει εφικτή αυτήν την ενσωμάτωση και τη δημιουργία των αντίστοιχων συστημάτων υποστήριξης απόφασης.
περισσότερα
Περίληψη σε άλλη γλώσσα
The objective of the PhD thesis is the design and development of decision support systems, with knowledge derived using data mining techniques. Specifically, in the field of biomedicine we designed and developed a decision support system for ischeamia, by processing and analyzing the ECG signal. From the biology domain, we designed and developed a method for the classification of proteins into folds. Finally we created a novel methodology than can be applied in several sequential domains, for the creation of sequential classification models, if the data are described as discrete time series. In the first chapter we describe the fundamental issues of the healthcare decision support systems, data mining as well as their interconnection and relationship. A general data mining framework for creating decision support systems is also presented. At the end of the first chapter we provide a detailed literature review concerning the two applications we have developed: ischaemic beat detection a ...
The objective of the PhD thesis is the design and development of decision support systems, with knowledge derived using data mining techniques. Specifically, in the field of biomedicine we designed and developed a decision support system for ischeamia, by processing and analyzing the ECG signal. From the biology domain, we designed and developed a method for the classification of proteins into folds. Finally we created a novel methodology than can be applied in several sequential domains, for the creation of sequential classification models, if the data are described as discrete time series. In the first chapter we describe the fundamental issues of the healthcare decision support systems, data mining as well as their interconnection and relationship. A general data mining framework for creating decision support systems is also presented. At the end of the first chapter we provide a detailed literature review concerning the two applications we have developed: ischaemic beat detection and protein fold and class recognition. In the second chapter we present a literature review of decision support systems that have been developed and are widely used in the healthcare domain and provide algorithms that are used for data mining. Moreover, detailed state of the art in the domains of ischaemic beat detection and protein fold and class prediction are included. In chapters 3 and 4 we describe in detail the methods we followed for solving the real world applications – ischaemic beat detection and protein fold recognition and class prediction. The methods follow a general scheme that corresponds to four steps: a) data collection b) data preprocessing c) data analysis using data mining techniques and d) creation of the classification model – decision support system. Special attention is given in the third step, where we mainly used association rule and sequential pattern mining techniques. The results we have achieved show the effectiveness of these methods. In chapter 5 we present a methodology that can be used for the creation of sequence classification models. The methodology integrates sequential pattern mining techniques and optimization algorithms and is compared with two other similar methodologies. Finally in chapter 6 we provide conclusions, remarks and future development of out thesis. A future development that we have already identified is the creation of decision support systems using data mining techniques applied in data clinical and genetic. The integration of these two types of data can help in better describing the situation of the patient and thus in a more accurate diagnosis. The use and integration of clinical and genetic data can help in diseases like cancer. At the end of this chapter we present a system’s architecture that can achieve this integration and create the corresponding healthcare decision support systems
περισσότερα