Κατανεμημένη τανυστική αποδόμηση στη μηχανική μάθηση για πλήρως ή μερικώς παρατηρούμενα πολυδιάστατα δεδομένα μεγάλου όγκου

Περίληψη

Στην παρούσα διδακτορική διατριβή προτείνουμε έναν βασικό αλγόριθμο, τον GenProxSGD, για τον υπολογισμό μιας CANDECOM/PARAFAC (CP) αποδόμησης από μερικώς παρατηρούμενα δεδομένα, ο οποίος βασίζεται στον τελεστή εγγύτητας και αντιμετωπίζει το πρόβλημα βελτιστοποίησης λύνοντας τοπικά προβλήματα βελτιστοποίησης, με την έννοια ότι σε κάθε επανάληψη υπολογίζεται ένα σημείο το οποίο να είναι σε εγγύτητα με το προηγούμενο σημείο, αλλά να οδηγεί προς το ελάχιστο της αντικειμενικής συνάρτησης. Επιπλέον, προτείνουμε δύο κατανεμημένους αλγορίθμους, τους ParallelProxSGD και StrProxSGD, που βασίζονται στον τελεστή εγγύτητας και στην παραπάνω ιδέα, για τον υπολογισμό μιας CP αποδόμησης από μερικώς παρατηρούμενα δεδομένα. Οι αλγόριθμοι αυτοί είναι κατάλληλοι και αξιολογήθηκαν σε δεδομένα μεγάλου όγκου. Δείξαμε πειραματικά ότι οι αλγόριθμοι αυτοί έχουν πολύ καλές ιδιότητες κλιμάκωσης ως προς διάφορες παραμέτρους (διαστατικότητα, βαθμός αποδόμησης, επιτάχυνση (speed-up) κ.τ.λ.). Στη συνέχεια, προτείνουμ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

In this dissertation, we propose a basic algorithm (GenProxSGD) for calculating a CANDECOMP/PARAFAC (CP) decomposition from partially observed data, which is based on the proximal operator. This algorithm deals with the decomposition’s optimization problem by solving local optimization problems, in the sense that in each iteration a proximal to the previous point is calculated that leads to the minimum of the objective function. Furthermore, we propose two distributed algorithms (ParallelProxSGD and StrProxSGD) that are based on the proximal operator and GenProxSGD for calculating a CP decomposition from data with missing entries. These algorithms are suitable for big data. These algorithms are assessed on big data and by experiments we show that possess great scaling properties in respect to different parameters like dimensionality, decomposition rank, speed-up etc. Subsequently, we propose a classification algorithm for Multiple Instance Learning (MIL) called TensMIL. In TensMIL we p ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/49961
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/49961
ND
49961
Εναλλακτικός τίτλος
Distributed tensor decomposition in Machine Learning for fully or partially observed multidimensional Big Data
Συγγραφέας
Παπαστεργίου, Θωμάς (Πατρώνυμο: Αστέριος)
Ημερομηνία
2020
Ίδρυμα
Πανεπιστήμιο Πατρών. Σχολή Πολυτεχνική. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής
Εξεταστική επιτροπή
Μεγαλοοικονόμου Βασίλειος
Γαλλόπουλος Ευστράτιος
Βούλγαρης Σπυρίδων
Μπερμπερίδης Κωνσταντίνος
Ψαράκης Εμμανουήλ
Κοφίδης Ελευθέριος
Κωτσιαντής Σωτήριος
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική ➨ Τεχνητή νοημοσύνη
Λέξεις-κλειδιά
Μηχανική μάθηση; Μάθηση Πολλαπλών Στιγμιότυπων; Επιλογή στιγμιότυπων; Αλγόριθμοι βελτιστοποίησης; Εγγύς Αλγόριθμος; Κατανεμημένοι αλγόριθμοι; Πολυδιάστατα δεδομένα; Τανυστική Αποδόμηση; Συμπλήρωση Τανυστών; Κατανεμημένη Τανυστική Αποδόμηση; Κατηγοριοποίηση Βιοιατρικών Εικόνων; Δεδομένα μεγάλου όγκου
Χώρα
Ελλάδα
Γλώσσα
Ελληνικά
Άλλα στοιχεία
εικ., πιν., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)