Τεχνικές μηχανικής μάθησης για την ανίχνευση ομοιότητας/ανομοιότητας: εφαρμογές εντοπισμού κοινοτήτων σε κοινωνικά δίκτυα και ελέγχου λογοκλοπής σε κείμενα

Περίληψη

Τα τελευταία χρόνια, η πληροφορία που διακινείται ηλεκτρονικά έχει αυξηθεί σε μεγάλο βαθμό, γεγονός που επιβάλλει τη δημιουργία και χρήση νέων συστημάτων, ικανών να διαχειρίζονται μεγάλο όγκο πληροφορίας. Η Μηχανική Μάθηση και η Εξόρυξη Δεδομένων είναι δύο πεδία μελέτης, τα οποία επιτρέπουν την ανάλυση και ταξινόμηση πληροφορίας. Οι αλγόριθμοι μηχανικής μάθησης "μαθαίνουν" από τα ίδια τα δεδομένα, ανακαλύπτοντας μοτίβα, χωρίς τη χρήση ρητών οδηγιών. Στο πλαίσιο της διατριβής, μελετήθηκαν και υλοποιήθηκαν τρεις ξεχωριστές, αλλά συναφείς προσεγγίσεις, για την Ανίχνευση Κοινοτήτων και την Εγγενή Ανίχνευση Λογοκλοπής, οι οποίες κάνουν χρήση τεχνικών μηχανικής μάθησης. H Ανίχνευση Κοινοτήτων, ή αλλιώς ομαδοποίηση γράφου, είναι ένα από τα πιο δημοφιλή θέματα της σύγχρονης επιστήμης δικτύων, που επιχειρεί να λύσει το πρόβλημα του εντοπισμού της κοινοτικής δομής σε δίκτυα. Τα περισσότερα δίκτυα εμφανίζουν κοινοτική δομή, δηλαδή οι κορυφές τους είναι οργανωμένες σε ομάδες, που ονομάζονται κοινό ...
περισσότερα

Περίληψη σε άλλη γλώσσα

In recent years, the amount of information transmitted online has greatly increased, which dictates the creation and usage of new systems, capable of handling large volumes of information. Machine Learning and Data Mining are two fields of study, which facilitate the analysis and classification of information. Machine learning algorithms "learn" directly from data, by discovering meaningful patterns, without the use of explicit instructions. In this thesis, three separate, but related, approaches for Community Detection and Intrinsic Plagiarism Detection, which utilize machine learning techniques, were studied and implemented. Community Detection, or graph clustering, is one of the most popular topics in modern science of networks, which aims to solve the problem of identifying the community structure in networks. Most networks display community structure, i.e. the vertices are organized in groups, called communities, groups or clusters. Community detection is not a well defined proble ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/47095
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/47095
ND
47095
Εναλλακτικός τίτλος
Machine learning techniques for similarity/dissimilarity identification: applications to community detection in social networks and plagiarism detection in documents
Συγγραφέας
Βάθη, Ελένη (Πατρώνυμο: Κωνσταντίνος)
Ημερομηνία
2019
Ίδρυμα
Εθνικό Μετσόβιο Πολυτεχνείο (ΕΜΠ). Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Συστημάτων Τεχνητής Νοημοσύνης και Μάθησης
Εξεταστική επιτροπή
Σταφυλοπάτης Ανδρέας - Γεώργιος
Στάμου Γεώργιος
Τσανάκας Παναγιώτης
Μέντζας Γρηγόριος
Παπαβασιλείου Συμεών
Τσουκάλας Δημήτριος
Βαζιργιάννης Μιχαήλ
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Λέξεις-κλειδιά
Μηχανική μάθηση; Ανίχνευση κοινοτήτων; Ανάλυση κοινωνικών δικτύων; Μοντελοποίηση θεμάτων; Διανυσματικές παραστάσεις κόμβων; Μάθηση χαρακτηριστικών; Εγγενής ανίχνευση λογοκλοπής; Μη ισορροπημένα δεδομένα
Χώρα
Ελλάδα
Γλώσσα
Ελληνικά
Άλλα στοιχεία
4, xxx, 135 σ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)