Μαζικά παράλληλος μη επιβλεπόμενος εντοπισμός ανωμαλιών σε ροές δεδομένων

Περίληψη

Τις τελευταίες δεκαετίες, η εύρεση ακραίων τιμών αποτελεί ένα ενεργό ερευνητικό πεδίο με μία σωρεία εργασιών και πολλούς διαφορετικούς ορισμούς να υπάρχουν στην βιβλιογραφία. Η σημασία της ανίχνευσης ενός σημείου δεδομένων ως μία ακραία τιμή είναι διπλή. Πρώτον, τα ακραία σημεία μπορούν να αντιμετωπιστούν ως θόρυβος σε ένα σύνολο δεδομένων. Όταν ένα σύνολο δεδομένων περιλαμβάνει θόρυβο οι αλγόριθμοι επεξεργασίας μπορεί να βγάλουν λανθασμένα αποτελέσματα ή αποτελέσματα που θα οδηγήσουν σε λάθος ανάλυση από τον τελικό χρήστη. Δεύτερον, μία ακραία τιμή μπορεί να περιλαμβάνει μία σημαντική πληροφορία που θα εκμαιευθεί μέσω περαιτέρω ανάλυσης. Για παράδειγμα, ένα πρόσφατο σημείο δεδομένων σε μία συνεχή ροή δεδομένων, το οποίο ανιχνεύεται σαν ακραία τιμή, μπορεί να υποδεικνύει μία απότομη αλλαγή στην κατανομή των τιμών της ροής.Η εύρεση ακραίων τιμών έχει εδραιωθεί ως ένα σταθερό και βασικό εργαλείο στην ανάλυση δεδομένων σε πολλούς τομείς. Κάποιοι από αυτούς είναι η ανίχνευση απάτης σε τραπ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

Outlier detection on data streams has seen a rise in popularity over the past years due to the advances of Internet of Things devices. Nevertheless, a distributed solution for distance-based outlier detection, which is one of the most widely used categories, has not been proposed for continuous data streams. This thesis proposes a solution to this problem, along with providing an efficient explanation for each outputted outlier, in contrast to the output of normal distance-based detectors. Additionally, it studies the self-adaptive problem for workload balancing on distributed streams and proposes a mechanism that works on the fly without any system interruptions.More specifically, the rationale behind the parallelization of the state-of-the-art centralized distance-based outlier detection algorithms for streams is presented along with the decisions for the partitioning phase of the ingested streams. The proposed techniques show significant improvements over their centralized counter-p ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/52686
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/52686
ND
52686
Εναλλακτικός τίτλος
Massively parallel unsupervised anomaly detection in data streams
Συγγραφέας
Τολιόπουλος, Θεόδωρος (Πατρώνυμο: Αθανάσιος)
Ημερομηνία
2022
Ίδρυμα
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ). Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής. Εργαστήριο Τεχνολογίας και Επεξεργασίας Δεδομένων
Εξεταστική επιτροπή
Γούναρης Αναστάσιος
Παπαδόπουλος Απόστολος
Τσίχλας Κωνσταντίνος
Βακάλη Αθηνά
Τσουμάκας Γρηγόριος
Δεληγιαννάκης Αντώνιος
Ευαγγελίδης Γεώργιος
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική ➨ Πληροφοριακά συστήματα
Λέξεις-κλειδιά
Εύρεση ακρότατων σημείων με βάση την απόσταση; Επεξεργασία έντονων ροών δεδομένων; Επεξήγηση αποτελεσμάτων; Προσαρμογή φόρτου εργασίας
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
εικ., πιν.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.