Κατηγοριοποίηση και τμηματοποίηση κειμένων με χρήση μεθόδων υπολογιστικής νοημοσύνης
Περίληψη
Η παρούσα διδακτορική διατριβή πραγματεύεται την ανάπτυξη υπολογιστικών μεθόδων για την εμβάθυνση στο περιεχόμενο των κειμένων και την ανάδειξη του τρόπου δόμησής τους (με την εύρεση των υποθεμάτων από τα οποία αποτελούνται) άρα και κατ’ επέκταση τη βελτίωση πρόσβασης σε πληροφορία με τη βοήθεια γλωσσικής τεχνολογίας. Η εν λόγω διατριβή αφορά την χρήση του θησαυρού όρων Wordnet για την ακριβέστερη απόδοση της έννοιας των λέξεων μέσα στο περιεχόμενο στο οποίο απαντώνται, αλλά και την αποτελεσματικότερη πρόσβαση στην πληροφορία με την τμηματοποίηση μεγάλης έκτασης κειμένων σε μικρότερα τμήματα καθένα από τα οποία αναφέρεται σε ένα συγκεκριμένο θέμα. Μια τέτοιου είδους βελτιωμένη πρόσβαση είναι χρήσιμη στην ολοένα αυξανόμενη πληροφορία που απαντάται στις μέρες μας κυρίως στο Διαδίκτυο. Μετά από επισκόπηση των μοντέλων και μεθόδων για την εύρεση της εννοιολογικής δομής των κειμένων και τη βελτίωση πρόσβασης σε πληροφορία προτείνονται τρία μοντέλα. Το πρώτο από αυτά ακολουθεί την προσέγγιση ...
περισσότερα
Περίληψη σε άλλη γλώσσα
This dissertation deals with the development of computational methods which penetrate into the content of texts and reveal their structure, as the result of finding their topics and subtopics. The benefit of such methods is the improvement in accessing in information using a language technology. The dissertation uses Wordnet’s thesaurus in order to attribute -in a more accurate way- the sense of a word taking under consideration the content in which this word appears in the text. The dissertation achieves a more effective access in information using the result of the segmentation of large texts into smaller segments each of which refers to a specific topic. Such an improved access is extremely useful while searching the Web. After an overview of the models and methods that have been proposed in the literature for the problem of finding the semantic structure of a text, we propose and implement three models. The first of those follows the Machine Learning approach and classifies texts ...
περισσότερα
Κατεβάστε τη διατριβή σε μορφή PDF (7.43 MB)
(Η υπηρεσία είναι διαθέσιμη μετά από δωρεάν εγγραφή)
|
Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.
|
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.