Εξόρυξη γνώσης από μεγάλης διάστασης ταχείς ροές δεδομένων
Περίληψη
Ενώ η ομαδοποίηση δεδομένων έχει μια μακρά ιστορία και ένα μεγάλο κομμάτι της έρευνας έχει αφιερωθεί στην ανάπτυξη πολυάριθμων μεθόδων ομαδοποίησης, σημαντικές προκλήσεις παραμένουν ακόμα. Μία από τις πιο σημαντικές σχετίζεται με τη μεγάλη διάσταση των δεδομένων. Μία συγκεκριμένη κατηγορία αλγορίθμων ομαδοποίησης αντιμετωπίζει τέτοιου τύπου δεδομένα με μεγάλη επιτυχία χρησιμοποιώντας τεχνικές μείωσης της διάστασης. Οι μέθοδοι προβολών για την μείωση διάστασης μας έδωσαν τη δυνατότητα να ανακαλύψουμε τη δομή των δεδομένων εξαιρετικά μεγάλης διάστασης. Σε αυτή τη διατριβή, γίνεται μία προσπάθεια να εμβαθύνουμε την κατανόηση μας σχετικά με το τι μπορεί να επιτευχθεί από αυτού του είδους τις τεχνικές σε μία προσπάθεια να ανακαλύψουμε θεωρητικά τη σχέση των ομάδων στα δεδομένα και την κατανομή των προβολών τους. Βασισμένοι στα ευρήματα μας προτείνουμε μία σειρά από διαχωριστικούς ιεραρχικούς αλγορίθμους ομαδοποίησης. Οι προτεινόμενοι αλγόριθμοι απαιτούν ελάχιστες παραμέτρους εισόδου και επί ...
περισσότερα
Περίληψη σε άλλη γλώσσα
While data clustering has a long history and a large amount of research has been devoted to the development of numerous clustering techniques, significant challenges still remain. One of the most important of them is associated with high data dimensionality. A particular class of clustering algorithms has been very successful in dealing with such datasets, utilizing information driven by dimensionality reduction techniques. Projection methods for dimension reduction have enabled the discovery of otherwise unattainable structure in ultra high dimensional data. In this thesis, we try to deepen our understanding on what can be achieved by this kind of approaches in an attempt to theoretically discover the relationship between true clusters in the data and the distribution of their projection. Based on such findings, we propose a series of new hierarchical divisive clustering algorithms. The proposed algorithms require minimal user-defined parameters and have the desirable feature of being ...
περισσότερα
Κατεβάστε τη διατριβή σε μορφή PDF (6.36 MB)
(Η υπηρεσία είναι διαθέσιμη μετά από δωρεάν εγγραφή)
|
Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.
|
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.