Αυτόματη εξαγωγή περιλήψεων από πολλαπλά κείμενα

Περίληψη

Σε αυτήν την αναφορά περιγράφεται η έρευνα που διεξήχθη στα πλαίσια του διδακτορικού μου στον τομέα της εξαγωγής περιλήψεων από πολλαπλά έγγραφα και τη χρήση υποστηρικτικής γνώσης. Η έρευνα εστιάζει στην αξιολόγηση περιλήψεων και την υλοποίηση ενός συνόλου γενικευμένων εργαλείων με εφαρμογές σε διαδικασίες επεξεργασίας φυσικής γλώσσας, μέσα από ένα σύνολο τελεστών και σχετικών μεθοδολογιών. Παρουσιάζουμε αυτές τις μεθοδολογίες στα πλαίσια της αξιολόγησης περιλήψεων, της επιλογής περιεχομένου, της αναγνώρισης νεωτερισμού και αφαίρεσης πλεονασμού. Περαιτέρω, παρουσιάζουμε ένα σύνολο από αλγορίθμους και μεθοδολογίες, με βάση τους γράφους ν-γραμμάτων, με σκοπό την υποστήριξη της εξαγωγής νοήματος και της ποσοτικοποίησης της κειμενικής ποιότητας.

Περίληψη σε άλλη γλώσσα

This work reports on research conducted on the domain of multi-document summarization using background knowledge. The research focuses on summary evaluation and the implementation of a set of generic use tools for NLP tasks and especially for automatic summarization. Within this work we formalize the n-gram graph representation and its use in NLP tasks. We present the use of n-gram graphs for the tasks of summary evaluation, content selection, novelty detection and redundancy removal. Furthermore, we present a set of algorithmic constructs and methodologies, based on the notion of n-gram graphs, that aim to support meaning extraction and textual quality quantization.

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/18012
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/18012
ND
18012
Εναλλακτικός τίτλος
Automatic Summarization from Multiple Documents
Συγγραφέας
Γιαννακόπουλος, Γεώργιος
Ημερομηνία
2009
Ίδρυμα
Πανεπιστήμιο Αιγαίου. Σχολή Θετικών Επιστημών. Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων
Εξεταστική επιτροπή
Βούρος Γεώργιος
Καρκαλέτσης Βαγγέλης
Σταματόπουλος Παναγιώτης
Σταματάτος Ευστάθιος
Φακωτάκης Νικόλαος
Παλιούρας Γεώργιος
Ανδρουτσόπουλος Ιωάννης
Επιστημονικό πεδίο
Φυσικές Επιστήμες
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Λέξεις-κλειδιά
Αυτόματη εξαγωγή περιλήψεων; Γράφοι ν-γραμμάτων; Αυτόματη αξιολόγηση περιλήψεων; Μηχανική μάθηση; Ν-γράμματα; Ανίχνευση εξέχουσας σημασίας; Ανίχνευση πλεονασμού
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
173 σ., εικ., ευρ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)