Αντιμετωπίζοντας την ανισορροπία κλάσης στα δεδομένα πολλαπλών ετικετών

Περίληψη

Στα δεδομένα πολλαπλών ετικετών, κάθε παράδειγμα είναι συσχετισμένο με πολλαπλές δυαδικές μεταβλητές εξόδους (ετικέτες), το οποίο επιτρέπει αναπαραστάσεις με πλουσιότερη σημασιολογία σε σύγκριση με τα δυαδικά ή πολλαπλών κλάσεων δεδομένα. Κατά τη διάρκεια των τελευταίων δύο δεκαετιών, η μάθηση πολλαπλών ετικετών έχει σταδιακά προσελκύσει την προσοχή της ερευνητικής κοινότητας, και έχει ευρέως εφαρμοστεί σε ποικίλα προβλήματα, συμπεριλαμβανομένης της κατηγοριοποίησης κειμένων, της επισημείωσης πολυμέσων και της βιοπληροφορικής. Η ανισορροπία κλάσεων είναι ένα εγγενές χαρακτηριστικό των δεδομένων πολλαπλών ετικε\-τών, το οποίο εισάγει μια κρίσιμη πρόκληση για τις μεθόδους μάθησης πολλαπλών ετικετών. Στα δεδομένα πολλαπλών ετικετών, κάθε παράδειγμα συνήθως συσχετίζεται με μερικές ετικέτες που επιλέγονται από ένα σύνολο ετικετών μεγάλης κλίμακας, καθιστώντας των χώρο των ετικετών εξόδου αραιό και πολλές φορές μεροληπτικό. Αν και έχουν προταθεί πολλές μέθοδοι για την αντιμετώπιση της ανισορ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

In multi-label data, each instance is associated with multiple binary output variables (labels), which allows the expression of much richer semantics compared to binary and multi-class data. During the past two decades, multi-label learning has gradually attracted a plethora of research attention, and has been widely applied to diverse problems, including text categorization, multimedia annotation and bioinformatics. Class imbalance is an intrinsic characteristic of multi-label data, which imposes a crucial challenge for the multi-label learning approach. In multi-label data, each instance is typically associated with a few labels picked from a large-scale label set, leading to the sparse and skewed output label space. Although plenty of methods have been proposed to deal with imbalanced multi-label data, there is still a room for further improvement in predicting accuracy, especially for highly imbalanced labels and difficult instances. Furthermore, predicting drug-target interaction ...
περισσότερα
Η διατριβή είναι δεσμευμένη από τον συγγραφέα  (μέχρι και: 12/2023)
DOI
10.12681/eadd/50783
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/50783
ND
50783
Εναλλακτικός τίτλος
Addressing class imbalance in multi-label data
Συγγραφέας
Λίου, Μπίν του Γιανμίν
Ημερομηνία
2021
Ίδρυμα
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ). Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής
Εξεταστική επιτροπή
Τσουμάκας Γρηγόριος
Κούρνια Ζωή
Αγγελής Ελευθέριος
Βλαχάβας Ιωάννης
Βράκας Δημήτριος
Μπλέκας Κωνσταντίνος
Παπαδόπουλος Απόστολος
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική ➨ Τεχνητή νοημοσύνη
Λέξεις-κλειδιά
Δεδομένα Πολλαπλών Ετικετών; Πρόβλεψη Αλληλεπίδρασης Φαρμάκου-Στόχου; Ανισορροπία Κλάσεων
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.