Μηχανές διανυσμάτων υποστήριξης για θορυβώδεις και ασαφείς ετικέτες

Η διατριβή ασχολείται με το πρόβλημα της αναγνώρισης προτύπων για δεδομένα εκπαίδευσης με θόρυβο ετικετών ή ασάφεια παραδειγμάτων. Ο θόρυβος ετικετών αναφέρεται σε λανθασμένες αναθέσεις στις τιμές των ετικετών ενώ η ασάφεια αναφέρεται στο διαφορετικό βαθμό συμμετοχής των παραδειγμάτων στην κλάση τους. Η επίλυση αυτών των προβλημάτων μπορεί να γίνει με μοντελοποίηση του θορύβου ή της ασάφειας κάθε παραδείγματος και τη χρήση κατάλληλων βαρών παραδειγμάτων σε σταθμισμένους αλγορίθμους μάθησης. Η εργασία εντοπίζει δύο βασικές προκλήσεις: (α) πώς μπορεί να μοντελοποιηθεί ο θόρυβος και η ασάφεια των παραδειγμάτων· και (β) πώς μπορούν να αξιοποιηθούν οι μοντελοποιήσεις για την παραγωγή βέλτιστων βαρών παραδειγμάτων. Για την αντιμετώπιση των παραπάνω προκλήσεων, η διατριβή προτείνει στρατηγικές βασισμένες σε σταθμισμένες εκδοχές του αλγορίθμου Μηχανών Διανυσμάτων Υποστήριξης (Support Vector Machines, SVM). Σε θεωρητικό επίπεδο, η κύρια συνεισφορά της εργασίας εντοπίζεται σε μεθόδους επιλογής υπερ-παραμέτρων για θορυβώδη και ασαφή δεδομένα. Αρχικά, επεκτείνεται η θεωρία εκτίμησης της πιθανότητας σφάλματος με βάση το span των Vapnik και Chapelle στον αλγόριθμο fuzzy SVM και αποδεικνύονται η αμεροληψία της εκτιμήτριας της πιθανότητας σφάλματος και το άνω φράγμα της πιθανότητας σφάλματος με βάση το span. Επίσης, ορίζονται εκτιμήτριες της πιθανότητας σφάλματος για προβλήματα όπου υπάρχουν μοντελοποιήσεις της πιθανότητας σωστής ανάθεσης των ετικετών και αποδεικνύεται η αμεροληψία τους. Σε εφαρμοσμένο επίπεδο, η εργασία προτείνει και αξιολογεί στρατηγικές εκπαίδευσης ταξινομητών εικόνων από θορυβώδη δεδομένα clickthrough που περιλαμβάνουν την αυτόματη δημιουργία συνόλων εκπαίδευσης, τη μοντελοποίηση του θορύβου και την παραγωγή βαρών για σταθμισμένους αλγορίθμους SVM. Επίσης, αξιοποιούνται οι νέες μέθοδοι επιλογής υπερ-παραμέτρων για τη βέλτιστη επιλογή των βαρών σε ταξινομητές fuzzy SVM. Επιπλέον, η εργασία προτείνει και αξιολογεί στρατηγικές συνεχούς εκπαίδευσης αποδοτικών ταξινομητών εικόνων SVM από ροές δεδομένων clickthrough. Οι στρατηγικές αυτές κατασκευάζονται ώστε να είναι θεωρητικά ισοδύναμες με αυτές των σταθμισμένων ταξινομητών συνόλου. Τέλος, η εργασία προτείνει μία στρατηγική εκπαίδευσης μοντέλων ερμηνείας της ανθρώπινης συμπεριφοράς από μετρήσεις. Αυτή εξειδικεύεται σε μεθόδους πρόβλεψης διατροφικών κινδύνων από μετρήσεις της συμπεριφοράς κατά το γεύμα. Τα παραδείγματα λαμβάνουν βαθμούς συμμετοχής στις κλάσεις από ειδικούς εμπειρογνώμονες και η επιλογή των βαρών γίνεται με χρήση των νέων μεθόδων. Η πειραματική ανάλυση στις παραπάνω εφαρμογές δείχνει ότι η μοντελοποίηση του θορύβου και της ασάφειας σε συνδυασμό με την παραγωγή βαρών παραδειγμάτων με τις νέες μεθόδους επιλογής υπερ-παραμέτρων μπορεί να βελτιώσει σημαντικά την απόδοση και την ευρωστία σε σχέση με τις μη-σταθμισμένες λύσεις.

περισσότερα

Περίληψη σε άλλη γλώσσα

This dissertation studies the problem of pattern recognition with noisy labels or fuzzy training instances. Label noise refers to wrong label assignments whereas fuzziness refers to instances with different membership values for their class. Such problems can be solved effectively by modelling the noise or the fuzziness of each training instance and using instance-weighted learning algorithms. We identify two major challenges: (a) how to model instance label noise or fuzziness; and (b) how to produce optimal instance weights using these models. To overcome these challenges, this work proposes strategies based on variants of the Support Vector Machine (SVM) algorithm that feature instance weights. The main theoretical contribution of this work is a set of new hyper-parameter selection methods for noisy and fuzzy training data. First, we extend the span error bound theory of Vapnik and Chapelle to the fuzzy SVM algorithm and we prove an unbiased estimator and an upper bound of the test error. Also, we define estimators of the test error in problems where the probability of correct label assignments can be estimated and we prove their unbiasedness. The work proposes and evaluates strategies for training image classifiers using label-noisy clickthrough data. The strategies include automatic training set construction, label noise modelling and instance weights generation for weighted SVM variants. Also, the new hyper-parameter selection methods are used to perform instance weights selection for fuzzy SVM classifiers. Furthermore, the work proposes and evaluates strategies for robust online classifier training using streaming clickthrough data. The online classifiers are designed to be theoretical equivalent to the batch-trained ones that use explicit instance weights. Finally, the work proposes a strategy for training data-driven models for human behaviour interpretation in domains with little or none medical guidelines. Based on this, the work describes methods for identifying individuals at risk from measurements of eating behaviour during meals. Domain experts assign membership values and the optimal weights are selected using the new methods. The experimental evaluation in the above applications demonstrates that modelling noise and fuzziness in combination with instance weights produced using the new hyper-parameter selection methods leads to better generalisation performance and robustness than non-weighted solutions.

περισσότερα

Διαβάστε τη διατριβή (Online)

Κατεβάστε τη διατριβή σε μορφή PDF (12.38 MB) (Η υπηρεσία είναι διαθέσιμη μετά από δωρεάν εγγραφή)

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI	10.12681/eadd/44863
Διεύθυνση Handle	http://hdl.handle.net/10442/hedi/44863
ND	44863
Εναλλακτικός τίτλος	Support vector machines for noisy and fuzzy labels
Συγγραφέας	Σαράφης, Ιωάννης (Πατρώνυμο: Αργύριος)
Ημερομηνία	2018
Ίδρυμα	Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ). Σχολή Πολυτεχνική. Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Ηλεκτρονικής και Υπολογιστών. Εργαστήριο Επεξεργασίας Πληροφοριών
Εξεταστική επιτροπή	Ντελόπουλος Αναστάσιος Μήτκας Περικλής Συμεωνίδης Ανδρέας Ρέκανος Ιωάννης Θεοχάρης Ιωάννης Μυλωνάς Φοίβος Τσαπατσούλης Νικόλαος
Επιστημονικό πεδίο	Επιστήμες Μηχανικού και Τεχνολογία ➨ Επιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ Επιστήμες Μηχανικού και Τεχνολογία ➨ Άλλες Επιστήμες Μηχανικού και Τεχνολογίες
Λέξεις-κλειδιά	Μηχανική μάθηση; Μηχανές διανυσμάτων υποστήριξης; Μάθηση με θόρυβο ετικετών; Μάθηση με ασαφείς ετικέτες
Χώρα	Ελλάδα
Γλώσσα	Ελληνικά
Άλλα στοιχεία	227 σ., εικ., πιν., σχημ., γραφ.
Ειδικοί όροι χρήσης/διάθεσης	Το έργο παρέχεται υπό τους όρους της δημόσιας άδειας του νομικού προσώπου Creative Commons Corporation: Αναφορά Δημιουργού - Παρόμοια Διανομή 3.0 (CC-BY-SA)

Στατιστικά χρήσης

ΠΡΟΒΟΛΕΣ

Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΞΕΦΥΛΛΙΣΜΑΤΑ

Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΜΕΤΑΦΟΡΤΩΣΕΙΣ

Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

ΧΡΗΣΤΕΣ

Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)

ΣΧΕΔΙΑΣΗ ΚΑΙ ΚΑΤΑΣΚΕΥΗ ΕΝΕΡΓΕΙΑΚΟΥ ΜΟΝΤΕΛΟΥ ΠΡΟΣΟΜΟΙΩΣΗΣ ΤΗΣ ΙΣΟΡΡΟΠΙΑΣ ΤΩΝ ΕΝΕΡΓΕΙΑΚΩΝ ΑΓΟΡΩΝ

ΒΡΑΧΥΧΡΟΝΙΕΣ ΠΡΟΒΛΕΨΕΙΣ ΤΗΣ ΜΗΝΙΑΙΑΣ ΖΗΤΗΣΗΣ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΣΤΗΝ ΕΛΛΑΔΑ

Ανάπτυξη συστήματος υποστήριξης αποφάσεων σε περιβάλλον γεωγραφικών συστημάτων πληροφοριών με χρήση ασαφών πολυκριτήριων μεθόδων

Μηχανική μάθηση για το συγκερασμό πολλαπλών, κατανεμημένων ευφυών συστημάτων

Μηχανική μάθηση για την ανάλυση μεγάλων βιολογικών δεδομένων

Τεχνικές μηχανικής μάθησης για πρόβλεψη πολλαπλών μεταβλητών

Καινοτομικές δραστηριότητες και οικονομική ανάπτυξη: μια διαπεριφερειακή προσέγγιση της Ελλάδας στην Ευρωπαϊκή Ένωση

Η ανάλυση των περιφερειακών συστημάτων καινοτομίας

Μέθοδοι πρόβλεψης εκλογικών αποτελεσμάτων: συγκριτική μελέτη εργαλείων του διαδικτύου

Χρήση τεχνικών εξόρυξης γνώσης στον σχεδιασμό παιχνιδοποιημένων εφαρμογών

"Μηχανές διανυσμάτων υποστήριξης για θορυβώδεις και ασαφείς ετικέτες"
	Πληκτρολογήστε το κείμενο της εικόνας!
Δηλώνω ότι έλαβα γνώση και ανεπιφύλακτα συμφωνώ και αποδέχομαι τους Όρους Χρήσης του Εθνικού Αρχείου Διδακτορικών Διατριβών, καθώς και της . Έλαβα γνώση οτι το έργο παρέχεται υπό τους όρους της δημόσιας άδειαςCreative Commons Αναφορά Δημιουργού Παρόμοια Διανομή 3.0 Ελλάδα