Περίληψη
Αντικείμενο της παρούσας διδακτορικής διατριβής είναι η ανάπτυξη αυτόματης μεθόδου για την ανάλυση της λειτουργίας του εγκεφάλου σε άτομα με τη νόσο Alzheimer και πιο συγκεκριμένα για τη διάγνωση της νόσου του Alzheimer και τον διαχωρισμό των σταδίων εξέλιξης αυτής. Η μέθοδος βασίζεται στην επεξεργασία και ανάλυση εικόνων λειτουργικής απεικόνισης μαγνητικού συντονισμού (fMRI) καθώς επίσης και σε τεχνικές μηχανικής μάθησης (αλγόριθμοι ταξινόμησης).
Η προτεινόμενη μέθοδος αποτελείται από έξι βήματα. Αρχικά οι εικόνες λειτουργικής απεικόνισης μαγνητικού συντονισμού επεξεργάζονται τόσο ως προς το χρόνο όσο και ως προς το χώρο προκείμενου να απομακρυνθούν τα τεχνικά σφάλματα και η μετέπειτα ανάλυση να επιτρέψει τη λήψη αποτελεσμάτων υψηλής ακρίβειας (βήμα 1ο). Στη συνέχεια από τις προεπεξεργασμένες εικόνες λειτουργικής απεικόνισης μαγνητικού συντονισμού εξάγονται οι χρονοσειρές οι οποίες μοντελοποιούνται με τη χρήση γενικευμένων γραμμικών μοντέλων με σκοπό τη δημιουργία των χαρτών ενε ...
Αντικείμενο της παρούσας διδακτορικής διατριβής είναι η ανάπτυξη αυτόματης μεθόδου για την ανάλυση της λειτουργίας του εγκεφάλου σε άτομα με τη νόσο Alzheimer και πιο συγκεκριμένα για τη διάγνωση της νόσου του Alzheimer και τον διαχωρισμό των σταδίων εξέλιξης αυτής. Η μέθοδος βασίζεται στην επεξεργασία και ανάλυση εικόνων λειτουργικής απεικόνισης μαγνητικού συντονισμού (fMRI) καθώς επίσης και σε τεχνικές μηχανικής μάθησης (αλγόριθμοι ταξινόμησης).
Η προτεινόμενη μέθοδος αποτελείται από έξι βήματα. Αρχικά οι εικόνες λειτουργικής απεικόνισης μαγνητικού συντονισμού επεξεργάζονται τόσο ως προς το χρόνο όσο και ως προς το χώρο προκείμενου να απομακρυνθούν τα τεχνικά σφάλματα και η μετέπειτα ανάλυση να επιτρέψει τη λήψη αποτελεσμάτων υψηλής ακρίβειας (βήμα 1ο). Στη συνέχεια από τις προεπεξεργασμένες εικόνες λειτουργικής απεικόνισης μαγνητικού συντονισμού εξάγονται οι χρονοσειρές οι οποίες μοντελοποιούνται με τη χρήση γενικευμένων γραμμικών μοντέλων με σκοπό τη δημιουργία των χαρτών ενεργοποίησης (βήμα 2ο). Οι χάρτες ενεργοποίησης χρησιμοποιούνται ώστε να εξαχθούν χαρακτηριστικά τα οποία εκφράζουν την ενεργοποίηση και την αιμοδυναμική απόκριση του εγκεφάλου του ατόμου που δέχεται το ερέθισμα κατά τη λήψη των λειτουργικών απεικονίσεων. Επιπλέον από τις λειτουργικές απεικονίσεις εξάγεται ένας δείκτης για την κίνηση του κρανίου κατά τη διάρκεια εκτέλεσης του πειράματος. Οι ανατομικές εικόνες μαγνητικού συντονισμού αξιοποιούνται για την εξαγωγή χαρακτηριστικών που να εκφράζουν την ατροφία του εγκεφάλου που πιθανά να έχει προκαλέσει η νόσος (βήμα 3ο). Τα χαρακτηριστικά αυτά σε συνδυασμό με δημογραφικά στοιχεία (ηλικία και φύλο) και με στοιχεία συμπεριφοράς (χρόνος αντίδρασης στο ερέθισμα) αξιολογούνται ως προς την συνεισφορά τους στη διάγνωση της νόσου και στο προσδιορισμό του σταδίου εξέλιξης αυτής. Σε μια διαδικασία επιλογής χαρακτηριστικών (βήμα 4ο), βασισμένη σε μέτρα της θεωρίας της πληροφορίας, μόνο τα χαρακτηριστικά με την μεγαλύτερη συνεισφορά στη διάγνωση της νόσου χρησιμοποιούνται στο επόμενο βήμα της ταξινόμησης (βήμα 5ο). Αξιολογούνται δύο διαφορετικοί ταξινομητές ως προς την ακρίβεια της ταξινόμησης, την ευαισθησία και την εξειδίκευση. Οι ταξινομητές αυτοί είναι τα τυχαία δάση (Random Forests - RF) και οι μηχανές διανυσμάτων υποστήριξης (Support Vector Machines - SVM). Στην συνέχεια (βήμα 6ο), τα δέντρα απόφασης τα οποία συνθέτουν το τυχαίο δάσος μετατρέπονται σε κανόνες, οι οποίοι συνδυάζουν τις πληροφορίες που εμπερικλείονται στα χαρακτηριστικά, και παρέχουν την απόφαση αν ο ασθενής πάσχει από τη νόσο ή όχι και αν πάσχει σε ποιο στάδιο βρίσκεται (πρώιμο ή προχωρημένο).
Η μέθοδος αξιολογήθηκε χρησιμοποιώντας δεδομένα τα οποία προήλθαν από 41 άτομα (14 νεαρά φυσιολογικά άτομα, 14 ηλικιωμένα φυσιολογικά άτομα, 13 ηλικιωμένα παθολογικά άτομα). Παρατηρήσαμε ότι από τους αλγορίθμους ταξινόμησης τα καλύτερα αποτελέσματα για το πρόβλημα της διάγνωσης της νόσου και των προσδιορισμό των σταδίων εξέλιξης προέκυψαν με τη χρήση του αλγορίθμου τυχαίων δασών, γεγονός το οποίο μπορεί να αποδοθεί στο ότι οι μηχανές διανυσμάτων υποστήριξης αποτελούν ένα μεμονωμένο μοντέλο ταξινόμησης ενώ τα τυχαία δάση είναι ένας συλλογικός ταξινομητής. Προς αυτή την κατεύθυνση, προτείνονται τροποποιήσεις του αλγορίθμου τυχαίων δασών οι οποίες βελτιώνουν τη δυνατότητα ταξινόμησης του αλγορίθμου. Οι προτεινόμενες τροποποιήσεις στοχεύουν στην αύξηση της ισχύος του κάθε ταξινομητή μέλους της συλλογής και στη μείωση της μεταξύ τους συσχέτισης, δεδομένου ότι το σφάλμα γενίκευσης του αλγορίθμου επηρεάζεται από τους δύο αυτούς παράγοντες. Για να το επιτύχουν επεμβαίνουν είτε στη διαδικασία κατασκευής των δέντρων του δάσους, είτε στον τρόπο με τον οποίο συνδυάζονται οι αποφάσεις των δέντρων προκειμένου να προκύψει η τελική απόφαση ταξινόμησης είτε και στο μηχανιμό κατασκευής και στο μηχανισμό ψηφοφορίας, μία προσέγγιση η οποία προτείνεται για πρώτη φορά.
Για την αξιολόγηση των μεθόδων χρησιμοποιήθηκαν διαφορετικά σύνολα δεδομένων τόσο ως προς το πεδίο εφαρμογής όσο και ως προς τον αριθμό χαρακτηριστικών και τον αριθμό των κλάσεων. Η αξιολόγηση των τροποποιήσεων έγινε ως προς την ακρίβεια της ταξινόμησης την οποία παρέχουν. Επιπλέον έγινε στατιστική ανάλυση ώστε να κριθεί αν υπάρχει στατιστικά σημαντική διαφορά μεταξύ των αποτελεσμάτων που έδωσαν οι παραπάνω τροποποιήσεις. Από τη μελέτη του αλγορίθμου τυχαίων δασών έγινε αντιληπτό ότι μία σημαντική παράμετρος για τα τυχαία δάση και γενικότερα για τους συλλογικούς ταξινομητές είναι ο αριθμός των ταξινομητών που συμμετέχουν στη συλλογή. Για το σκοπό αυτό στα πλαίσια της παρούσας διδακτορικής διατριβής αναπτύχθηκε μέθοδος καθορισμού του αριθμού των δέντρων του δάσους δυναμικά, δηλαδή κατά τη διάρκεια κατασκευής των τυχαίων δασών. Η μέθοδος βασίζεται σε διαδικασία on-line fitting.
Δεν είναι η πρώτη φορά που το fMRI χρησιμοποιείται για τη μελέτη ασθενών με νευροεκφυλιστικές ασθένειες, όπως η νόσο Alzheimer. Πολλές από τις μελέτες είναι ενδεικτικές για το πώς η συγκεκριμένη τεχνική μπορεί να αποτελέσει εργαλείο για τη διάγνωση νευρολογικών ανωμαλιών. Ωστόσο, όλες οι εργασίες που αναφέρονται στη βιβλιογραφία εστιάζονται στο να εντοπίσουν τις διαφορές μεταξύ φυσιολογικών και παθολογικών ατόμων με χρήση εικόνων fMR. Μόνο κάποιες από αυτές παρουσιάζουν ένα δείκτη για τη διάγνωση της νόσου του Alzheimer. Οι εργασίες επικεντρώνονται σε συγκεκριμένες περιοχές του εγκεφάλου και κατ’ επέκταση εξαρτώνται και από τον τύπο του ερεθίσματος ή της διαδικασίας που εκτελούν προκειμένου να ενεργοποιηθούν οι συγκεκριμένες περιοχές του εγκεφάλου. Επιπλέον, προϋποθέτουν ένα συγκεκριμένο σχεδιασμό του fMRI πειράματος (block design, event related) και βασίζονται σε ένα μόνο χαρακτηριστικό, κατά κύριο λόγο της ενεργοποίησης.
Σε αντίθεση με τις μελέτες αυτές στην παρούσα διδακτορική διατριβή προτείνουμε μία μέθοδο η οποία α) διαγιγνώσκει αν ο ασθενής πάσχει από τη νόσο Alzheimer ή όχι, β) προσδιορίζει το στάδιο εξέλιξης της νόσου σε περίπτωση που αυτή υφίσταται, παρέχει ερμηνεία του αποτελέσματος μέσω των κανόνων που εξάγονται για τη διάγνωση της νόσου και τον προσδιορισμό του σταδίου της, γ) δεν περιορίζεται στο να εντοπίσει τι διαφοροποιείται στη λειτουργία του εγκεφάλου αλλά ποσοτικοποιεί τις διαφορές μέσω χαρακτηριστικών, δ) είναι ανεξάρτητη από τον τύπο του fMRI πειράματος και το είδος της διέγερσης, ε) αξιοποιεί όλες τις πληροφορίες του πειράματος, ζ) μπορεί εύκολα να προσαρμοστεί στη διάγνωση μίας νέας μορφή άνοιας ή στη διαφοροποίηση μεταξύ των διαφόρων μορφών άνοιας.
περισσότερα
Περίληψη σε άλλη γλώσσα
The aim of this thesis is the development of an automated method for the analysis of the brain function in patients with Alzheimer’s disease (AD). Based on the processing and analysis of functional Magnetic Resonance Imaging (fMRI) and on the utilization and improvement of machine learning techniques, we propose a method for the diagnosis of AD and the separation of stages of the disease progression.
The proposed method consists of six steps. First, the functional Magnetic Resonance Images were preprocessed, in spatial and time domain, to remove artefacts and the subsequent analysis to lead to reliable results (Step 1). The voxel time courses were extracted from the preprocessed images and they were modeled using a generalized linear model (Step 2). The result of the second step is the formation of a statistical parametric map for each subject. The activation maps were analyzed permitting thus the extraction of features describing the activation patterns and the hemodynamic res ...
The aim of this thesis is the development of an automated method for the analysis of the brain function in patients with Alzheimer’s disease (AD). Based on the processing and analysis of functional Magnetic Resonance Imaging (fMRI) and on the utilization and improvement of machine learning techniques, we propose a method for the diagnosis of AD and the separation of stages of the disease progression.
The proposed method consists of six steps. First, the functional Magnetic Resonance Images were preprocessed, in spatial and time domain, to remove artefacts and the subsequent analysis to lead to reliable results (Step 1). The voxel time courses were extracted from the preprocessed images and they were modeled using a generalized linear model (Step 2). The result of the second step is the formation of a statistical parametric map for each subject. The activation maps were analyzed permitting thus the extraction of features describing the activation patterns and the hemodynamic response of the brain. The functional images were also used for the calculation of an index expressing the head movement during the conduction of the fMRI experiment. Additionally, the anatomic MRI images were exploited to extract features describing the atrophy of gray matter (Step 3). Those features, as well as, demographic details (age and sex) and behavioral data (median and average reaction time) were evaluated for their contribution to the diagnosis of AD and the monitoring of its progression. For this purpose a feature selection approach, based on information theory measures, was applied (Step 4). The selected features were supplied as input to the classification step (Step 5). The Random Forests algorithm and Support Vector Machines (SVMs) were evaluated for their classification accuracy, sensitivity and specificity. Finally, the trees that consist of the forest were converted to rules (Step 6). The rules combine the information, which is encompassed to the features, and they provide the decision if the subject is suffering from AD. In case of positive diagnosis the rules determine the stage of progression (very mild or mild).
The method was evaluated using data from 41 subjects (14 healthy young, 14 healthy old, 13 demented old subjects). The data were made available at the fMRI Data Center (fMRIDC) by Buckner and his colleagues. The classification results, for the diagnosis of the disease and the progression of its stages, indicated that the Random Forests algorithm outperforms the Support Vector Machines. This can be attributed to the fact that Support Vector Machines are a single classification model while Random Forests is an ensemble classifier. Several authors, in the literature, have demonstrated the advantage of the ensemble methods over the individual classifier models and have noted that they significantly improve the performance of the learning. Taking into consideration the above issues we propose modifications of the Random Forests algorithm which improve its prediction performance. The suggested modifications intend to increase the strength and decrease the correlation of individual trees (two factors that affect the generalization error of the algorithm) and to improve the function which determines how the output of the base classifiers is combined. This is achieved by modifying the node splitting and the voting mechanisms. The novel feature of this thesis is that proposes modifications, not only for the improvement of the construction or the voting procedure but, for the first time, it examines the overall improvement of the Random Forests algorithm (a combination of construction and voting).
For the evaluation of the proposed modifications 14 datasets were used. Thirteen of them are publicly available at the UCI Machine Learning Repository. The datasets cover different areas of science and they consist of a different number of features and classes. We compare the proposed modifications in terms of accuracy and other heuristics reported in the literature. Also, a statistical comparison was conducted to examine if there is a statistical significant difference between the results of the above modifications. The study of the Random Forests algorithm revealed that a significant parameter of the algorithm and for the ensemble classifier in general, is the number of base classifiers which consist of the ensemble. In this thesis we develop a method for the dynamic determination (during the construction of the forest) of the number of base classifiers. The method is based on an on-line fitting procedure.
The fMRI technique has been employed in many studies in the literature concerning patients with neurodegenerative diseases such as AD. Most of the studies are indicative of how the specific technique can be used as a diagnostic tool for different neurological abnormalities. However, the studies reported in the literature focus on detecting differences between different healthy and demented subjects using fMRI. Only few of them present an index for the diagnosis of AD. They are concentrated on a specific anatomical region depending thus on the presentation of a specific task for the activation of this region. In addition, they presuppose a specific type of fMRI experiment (block design, event related, resting-state) and they are using only one feature, activation, in order to extract conclusions.
On the contrary, the method proposed in this thesis not only diagnoses the AD but it specifies the stage of progression. It provides an explanation of the results through the rules that are extracted and it does not limited to detect differences between group of subjects but quantifies these differences through a number of features expressing a big part of the medical knowledge about AD. This is achieved by exploiting all the information provided by the fMRI experiment. Finally, it is independent form all the factors mentioned above and it can be easily adapted to the diagnosis of a new type or the differentiation between different types of dementia.
περισσότερα