Περίληψη
Η έκρηξη πληροφορίας που πυροδοτείται από τη δημιουργία μιας τεράστιας ποσότητας δεδομένων ανά πάσα στιγμή, οπουδήποτε στον κόσμο, υποδηλώνει ότι ζούμε σε μια εποχή κατακλυσμού δεδομένων. Αν και οι παραδοσιακές μέθοδοι μοντελοποίησης μέσω μητρών είναι συνήθως κατάλληλες για την επεξεργασία τους, όταν οι διαστάσεις των δεδομένων αυξάνονται ως άμεση απόρροια των πολυ-παραγοντικών μηχανισμών δημιουργίας τους, οι περιορισμοί τους γίνονται εμφανείς και μπορεί να ϑέσουν σε κίνδυνο την αποτελεσματική επεξεργασία τους. Ως εκ τούτου, απαιτείται ο σχεδιασμός σύγχρονων μεθόδων βασισμένων σε τανυστές ανώτερων διαστάσεων, ειδικά προσαρμοσμένων για την εκμετάλλευση των συσχετίσεων στις εγγενείς διαστάσεις των δεδομένων. Η κύρια συνεισφορά της παρούσας διατριβής είναι η ανάπτυξη ενός καινοτόμου πλαισίου για την επεξεργασία δεδομένων ανώτερων διαστάσεων, καθώς και η επίδειξη της πρακτικής χρησιμότητάς του σε εφαρμογές που άπτονται των τομέων της επεξεργασίας σήματος και της μηχανικής μάθησης. Στο πρώτ ...
Η έκρηξη πληροφορίας που πυροδοτείται από τη δημιουργία μιας τεράστιας ποσότητας δεδομένων ανά πάσα στιγμή, οπουδήποτε στον κόσμο, υποδηλώνει ότι ζούμε σε μια εποχή κατακλυσμού δεδομένων. Αν και οι παραδοσιακές μέθοδοι μοντελοποίησης μέσω μητρών είναι συνήθως κατάλληλες για την επεξεργασία τους, όταν οι διαστάσεις των δεδομένων αυξάνονται ως άμεση απόρροια των πολυ-παραγοντικών μηχανισμών δημιουργίας τους, οι περιορισμοί τους γίνονται εμφανείς και μπορεί να ϑέσουν σε κίνδυνο την αποτελεσματική επεξεργασία τους. Ως εκ τούτου, απαιτείται ο σχεδιασμός σύγχρονων μεθόδων βασισμένων σε τανυστές ανώτερων διαστάσεων, ειδικά προσαρμοσμένων για την εκμετάλλευση των συσχετίσεων στις εγγενείς διαστάσεις των δεδομένων. Η κύρια συνεισφορά της παρούσας διατριβής είναι η ανάπτυξη ενός καινοτόμου πλαισίου για την επεξεργασία δεδομένων ανώτερων διαστάσεων, καθώς και η επίδειξη της πρακτικής χρησιμότητάς του σε εφαρμογές που άπτονται των τομέων της επεξεργασίας σήματος και της μηχανικής μάθησης. Στο πρώτο μέρος αυτής της διατριβής αρχικά παραθέτουμε τις ϑεμελιώδεις έννοιες της μοντελοποίησης και επεξεργασίας δεδομένων ανώτερων διαστάσεων, δηλαδή των τανυστών και των παραγοντοποιήσεών τους. Αυτές οι δομές επεξεργασίας ανώτερης τάξης κατέστησαν εφικτή τη μοντελοποίηση και τον αποτελεσματικό χειρισμό δεδομένων ανώτερων διαστάσεων σε πραγματικά προβλήματα. Συγκεκριμένα, υιοθετούμε προσεγγίσεις βασισμένες σε τανυστές για την αποτελεσματική απόδοση τιμών σε ελλιπείς μετρήσεις και τις συγκρίνουμε με προηγμένες τεχνικές που βασίζονται σε μήτρες, τόσο από την σκοπιά της επεξεργασίας σήματος όσο και από εκείνη της μηχανικής μάθησης, στο πλαίσιο του προβλήματος της εποπτευόμενης ταξινόμησης. Δείχνουμε ότι η χρήση δομών επεξεργασίας τανυστών ανώτερης τάξης παρουσιάζει εμφανή πλεονεκτήματα και επομένως η επεξεργασία δεδομένων ανώτερων διαστάσεων στις ονομαστικές τους διαστάσεις μπορεί να οδηγήσει σε σαφώς βελτιωμένα συστήματα.Δεδομένου ότι οι προσεγγίσεις βαθιάς μάθησης έχουν κυριαρχήσει στον τομέα της μηχανικής μάθησης, στο δεύτερο μέρος αυτής της διατριβής αρχικά αποσαφηνίζουμε τις ϑεωρητικές τους βάσεις προκειμένου να εξοικειωθούμε με τους κύριους μηχανισμούς επεξεργασίας τους. Επικεντρώνουμε την προσοχή μας στα συνελικτικά νευρωνικά δίκτυα, τα οποία είναι ειδικά προσαρμοσμένα για προβλήματα απεικόνισης, εξετάζοντας κάθε δομικό τους στοιχείο. Στη συνέχεια, ϑεωρούμε αρκετές εφαρμογές επιβλεπόμενης μάθησης κατώτερης τάξης στην περιοχή της επεξεργασίας σήματος, μοντελοποιώντας τα αντίστοιχα προβλήματα ως περιπτώσεις ταξινόμησης συνελικτικών νευρωνικών δικτύων χαμηλής τάξης. Δείχνουμε ότι τα χαμηλής τάξης συνελικτικά νευρωνικά δίκτυα παρουσιάζουν εξαιρετικές επιδόσεις καθώς η διάσταση των δεδομένων εισόδου τους αυξάνεται και, κατά συνέπεια, η επέκτασή τους για την αντιμετώπιση προβλημάτων επιβλεπόμενης μάθησης ανώτερης τάξης αξίζει να επιχειρηθεί. Συνδυάζοντας τη ϑεωρητική καθώς και την πρακτική γνώση που προέκυψε από τα προαναφερθέντα, το τελευταίο μέρος της παρούσας διατριβής εστιάζει στην επέκταση των συνελικτικών νευρωνικών δικτύων χαμηλής τάξης στα ανάλογα ανώτερης τάξης, προκειμένου να αντιμετωπιστούν αποτελεσματικά πρακτικά προβλήματα επιβλεπόμενης μάθησης ανώτερων διαστάσεων. Πιο συγκεκριμένα, εισάγουμε την έννοια των συνελικτικών νευρωνικών δικτύων N-διαστάσεων, επεκτείνοντας τη βασική έννοια της συνέλιξης στη γενική περίπτωση. Η αντίστοιχη επέκταση πραγματοποιείται μέσω παραγοντοποιήσεων τανυστών καθώς και σωρευμένων συνελίξεων, με τα πλεονεκτήματα και τα μειονεκτήματα κάθε μεθόδου να επισημαίνονται ως προς την ενσωμάτωσή της σε σύγχρονα συστήματα βαθιάς μάθησης. Αξιοποιώντας την σχεδιασμένη επέκταση της εν λόγω βασικής λειτουργίας, ακολούθως επαληθεύουμε την απόδοσή της σε διάφορες εφαρμογές επιβλεπόμενης μηχανικής μάθησης εγγενώς υψηλών διαστάσεων στον τομέα της τηλεπισκόπησης, που κυμαίνονται από ταξινόμηση έως παλινδρόμηση. Τα εξαχθέντα πειραματικά αποτελέσματα καταδεικνύουν ξεκάθαρα ότι η μοντελοποίηση σημάτων μέσω τανυστών σε συνδυασμό με αρχιτεκτονικές συνελικτικών νευρωνικών δικτύων προσφέρουν απτά πλεονεκτήματα προς την αποτελεσματική επεξεργασία και μάθηση δεδομένων ανώτερων διαστάσεων, στο πλαίσιο ανάπτυξης καινοτόμων συστημάτων βαθιάς μάθησης.
περισσότερα
Περίληψη σε άλλη γλώσσα
The information explosion triggered by the creation of vast amounts of data anytime, anywhere, around the globe implies that we are certainly living in an era of data deluge. Although traditional flat-view matrix modeling methods are usually suitable for their processing, when data dimensionality scales up as a direct consequence of their multi-factor creation mechanisms, their limitations become apparent and may jeopardize subsequent efficient processing. This calls for the design of modern high-dimensional tensor-based methods and frameworks, tailored especially to exploit existing correlations in the inherent dimensions of the data. The prevailing contribution of this thesis is therefore to develop a novel framework for processing high dimensional data, as well as to show its practical utility in several applications of signal processing and machine learning. Towards that end, in the first part of this dissertation we initially consider the fundamental concepts of modeling and proce ...
The information explosion triggered by the creation of vast amounts of data anytime, anywhere, around the globe implies that we are certainly living in an era of data deluge. Although traditional flat-view matrix modeling methods are usually suitable for their processing, when data dimensionality scales up as a direct consequence of their multi-factor creation mechanisms, their limitations become apparent and may jeopardize subsequent efficient processing. This calls for the design of modern high-dimensional tensor-based methods and frameworks, tailored especially to exploit existing correlations in the inherent dimensions of the data. The prevailing contribution of this thesis is therefore to develop a novel framework for processing high dimensional data, as well as to show its practical utility in several applications of signal processing and machine learning. Towards that end, in the first part of this dissertation we initially consider the fundamental concepts of modeling and processing high-dimensional data, namely tensors and their decompositions. These higher-order processing workhorses, made it feasible to model, treat and process efficiently high dimensional data in real-world problems, in the quest of deriving new results in various application domains of interest. In particular, we adopted tensor-based approaches for efficiently imputing missing measurements and compared them with state-of-the-art matrix-based ones in the context of supervised classification. In that way, we were able to prove that concrete merits are made available when higher-order tensor processing structures are employed, and hence high-dimensional data processing in their nominal dimensions paves the way for clearly enhanced performance results. Since deep learning approaches have dominated the machine learning field in several interesting low and high-dimensional tasks, in the second part of this thesis we initially elucidate their theoretical foundations in order to familiarize with their key processing mechanisms to be used in upcoming applications. We focus on convolutional neural networks, specially tailored for imaging tasks, by reviewing every building block of them to be used and extended in this thesis. Subsequently, we cope with several lower-order supervised learning applications of signal processing flavor, by formulating the respective problems at hand as instances of low-order convolutional neural networks classification tasks. Throughout this process we were able to show that low-order convolutional neural networks are excellent feature learners as the dimensionality of their input data scales up, and, hence, their extension for addressing higher-order supervised learning tasks is worthwhile. Combining the theoretical and the application-based intuition obtained from the aforementioned parts, the last part of the dissertation focuses on extending existing low-order convolutional neural networks to their higher-order analogues, in order to efficiently cope with high-dimensional supervised learning regimes arising in practice. More precisely, we introduce the notion of N dimensional convolutional neural networks, by extending the key concept of convolution to the general case. The respective extension is performed via tensor decompositions as well as stacked convolutions, with the pros and cons of each method being highlighted towards their integration in modern deep learning systems. Capitalizing on the designed core-functionality extension, we subsequently verify its performance in several inherently high-dimensional supervised machine learning tasks in remote sensing, ranging from classification to regression. The obtained experimental results clearly demonstrate that tensor signal modeling in conjunction with convolutional neural networks architectures offer concrete merits towards efficient high dimensional data processing and learning in the context of novel deep learning systems.
περισσότερα