Γλωσσική τεχνολογία στατιστικά μοντέλα για γλώσσα, ομιλία και εικόνα

Περίληψη

Αντικείμενο της παρούσας διατριβής αποτελεί η στατιστική μοντελοποίηση της πληροφορίας που εμπεριέχεται σε κείμενα, ομιλία και εικόνες σε συνδυασμό με την ομαδοποίηση της με βάση διάφορα κριτήρια ομοιότητας με σκοπό την αποτελεσματικότερη οργάνωση και διαχείριση της ακόμα και σε ένα μεταβαλλόμενο χρονικά περιβάλλον. Αναλυτικότερα, η έρευνα κινήθηκε σε δύο βασικούς άξονες: τη γλωσσική μοντελοποίηση και την ομαδοποίηση. Στα πλαίσια της γλωσσικής μοντελοποίησης μελετήθηκαν το κλασικό μοντέλο δυάδων, τα μοντέλα δυάδων σε μεγάλη απόσταση, με και χωρίς παρεμβολή, και τα ζεύγη εναύσεως σε συνδυασμό με εξομάλυνση στα πλαίσια την ομαδοποίησης λέξεων σε εννοιολογικές ομάδες συνωνύμων. Για το σκοπό αυτό τα μοντέλα αυτά ενσωματώθηκαν σε τρεις διαφορετικούς αλγορίθμους ομδοποίησης, των οποίων τα αποτελέσματα αποτιμήθηκαν με σχετικούς και αντικειμενικούς δείκτες εγκυρότητας των ομαδοποιήσεων. Ειδικότερα, για την εκτίμηση των αντικειμενικών δεικτών όπου απαιτείται μια βάσιμη αλήθεια αυτή κατασκευάστη ...
περισσότερα

Περίληψη σε άλλη γλώσσα

The present thesis studies the statistical modeling of information inherent in text, speech, and images in combination with clustering based on various similarity criteria, so that multimedia documents are efficiently organized and handled even in a constantly changing environment. In more detail, the research lies in two main fields: language modeling and clustering. In the field of language modeling, the classic bigram model, the long distance bigram models, with and without interpolation, and the trigger-pairs together with smoothing were studied for word clustering in groups of conceptual synonyms. For this purpose, the language models were incorporated in three different clustering algorithms. The clustering results were evaluated with relative and external validity indices. In the special case of estimating the external indices where a ground truth is needed this was extracted systematically for the first time by means of Wordnet. The language models were also studied in image pr ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/30145
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/30145
ND
30145
Εναλλακτικός τίτλος
Language technology - statistical models for language, speech and images
Συγγραφέας
Μπάσιου, Νικολέττα (Πατρώνυμο: Κωνσταντίνος)
Ημερομηνία
2012
Ίδρυμα
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ). Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής
Εξεταστική επιτροπή
Κοτρόπουλος Κωνσταντίνος
Πήτας Ιωάννης
Νικολαΐδης Νικόλαος
Τζοβάρας Δημήτριος
Λύκας Αριστείδης
Ποταμιάνος Αλέξανδρος
Λάσκαρης Νικόλαος
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμες Ηλεκτρονικών Υπολογιστών & Πληροφορικής
Λέξεις-κλειδιά
Γλωσσική μοντελοποίηση; Ομαδοποίηση; Ισοστάθμιση ισογράμματος; Δεικτοδότηση ομιλητών
Χώρα
Ελλάδα
Γλώσσα
Ελληνικά
Άλλα στοιχεία
213 σ., πιν., σχημ., ευρ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)