Περίληψη
Αντικείμενο της διδακτορικής διατριβής αποτελεί η μελέτη των ρηματικών κατηγορημάτων της Ελληνικής που δηλώνουν συναίσθημα και η ταξινόμησή τους σε πίνακες του Λεξικού-Γραμματική. Απώτερος στόχος είναι η δημιουργία ενός εύρωστου γλωσσικού πόρου ο οποίος θα μπορεί να αξιοποιηθεί σε διάφορες εφαρμογές επεξεργασίας φυσικής γλώσσας. Η γλωσσολογική έρευνα ακολουθεί τη θεωρία της Μετασχηματιστικής και Κατανεμητικής Γραμματικής που θεμελιώθηκε από τον Zelling S. Harris (1951, 1954, 1968, 1981), ενώ για την περιγραφή των γλωσσικών δεδομένων υιοθετήσαμε τις αρχές του μεθοδολογικού μοντέλου του Λεξικού-Γραμματική (Maurice Gross 1975). Στο πλαίσιο του μοντέλου, η συντακτική ανάλυση ξεκινά από τη μελέτη της απλής πρότασης. Στην κατεύθυνση αυτή, αξιοποιήθηκαν στο έπακρο τα μεθοδολογικά και υπολογιστικά εργαλεία που μας προσφέρουν τα ηλεκτρονικά σώματα κειμένων τόσο για την ανάπτυξη όσο και για την αξιολόγηση του λεξικού πόρου. Αρχικά, πραγματοποιήθηκε ο καθορισμός του σημασιολογικού πεδίου ΣΥΝΑΙΣΘ ...
Αντικείμενο της διδακτορικής διατριβής αποτελεί η μελέτη των ρηματικών κατηγορημάτων της Ελληνικής που δηλώνουν συναίσθημα και η ταξινόμησή τους σε πίνακες του Λεξικού-Γραμματική. Απώτερος στόχος είναι η δημιουργία ενός εύρωστου γλωσσικού πόρου ο οποίος θα μπορεί να αξιοποιηθεί σε διάφορες εφαρμογές επεξεργασίας φυσικής γλώσσας. Η γλωσσολογική έρευνα ακολουθεί τη θεωρία της Μετασχηματιστικής και Κατανεμητικής Γραμματικής που θεμελιώθηκε από τον Zelling S. Harris (1951, 1954, 1968, 1981), ενώ για την περιγραφή των γλωσσικών δεδομένων υιοθετήσαμε τις αρχές του μεθοδολογικού μοντέλου του Λεξικού-Γραμματική (Maurice Gross 1975). Στο πλαίσιο του μοντέλου, η συντακτική ανάλυση ξεκινά από τη μελέτη της απλής πρότασης. Στην κατεύθυνση αυτή, αξιοποιήθηκαν στο έπακρο τα μεθοδολογικά και υπολογιστικά εργαλεία που μας προσφέρουν τα ηλεκτρονικά σώματα κειμένων τόσο για την ανάπτυξη όσο και για την αξιολόγηση του λεξικού πόρου. Αρχικά, πραγματοποιήθηκε ο καθορισμός του σημασιολογικού πεδίου ΣΥΝΑΙΣΘΗΜΑ, με στόχο την επιλογή του γλωσσικού υλικού, δηλαδή των δηλωτικών συναισθήματος ρηματικών κατηγορημάτων. Εν συνεχεία, συγκροτήθηκε Ηλεκτρονικό Σώμα Κειμένων το οποίο χρησιμοποιήθηκε για τη μελέτη των συντακτικών και σημασιολογικών ιδιοτήτων των κατηγορημάτων της ανά χείρας έρευνας. Τελικώς, τα υπό ανάλυση ρήματα, ταξινομήθηκαν σε πέντε (5) πίνακες Λεξικού-Γραμματικής, καθένας εκ των οποίων ορίστηκε στη βάση μίας κοινής (για όλα τα κατηγορήματα που υπάγονται σε αυτόν) καθοριστικής δομής και κοινών συντακτικών και σημασιολογικών ιδιοτήτων. Ακολούθως, και με βάση τη σημασία, ορίστηκαν επιπλέον σημασιολογικές ιδιότητες, οι οποίες αντιστοιχούν σε προ-επιλεγμένα ζεύγη χαρακτηριστικών/τιμών. Τα ζεύγη αυτά ορίζουν ένα ταξινομικό σχήμα που σκιαγραφεί την έννοια ΣΥΝΑΙΣΘΗΜΑ. Οι τιμές του ταξινομικού σχήματος κωδικοποιήθηκαν ως ιδιότητες σε συμπληρωματικούς πίνακες Λεξικού-Γραμματικής. Στο τελευταίο στάδιο, η κωδικοποίηση στους πίνακες των ιδιοτήτων (συντακτικών και σημασιολογικών) με τρόπο τυπικό επέτρεψε την υλοποίηση υπολογιστικής γραμματικής με τη βοήθεια γράφων που κατασκευάστηκαν μέσω εξειδικευμένου λογισμικού (UNITEX). Η στόχευση είναι διττή: η εργασία αποσκοπεί αφενός στον έλεγχο της τελικής κωδικοποίησης που πραγματοποιήθηκε, και αφετέρου στη διερεύνηση της δυνατότητας αξιοποίησης του πόρου (των πινάκων του Λεξικού-Γραμματικής και της υπολογιστικής γραμματικής), για την αυτόματη επεξεργασία φυσικής γλώσσας και της αναγνώρισης συναισθήματος σε κείμενα.
περισσότερα
Περίληψη σε άλλη γλώσσα
This doctoral dissertation presents research aimed at the study of Greek verbal predicates denoting emotion, and their classification into Lexicon-Grammar tables. The ultimate purpose is the creation of a robust lexical resource that is suitable for translation – performed by humans and machines alike. The linguistic analysis follows the theoretical assumptions of transformational and distributional grammar introduced by Zelling S. Harris (1951, 1954, 1968, 1981), whereas the representation of the verbs abides by the principles set by the Lexicon-Grammar framework proposed by Maurice Gross (1975). Being a model of syntax limited to the elementary sentences of the form Subject – Verb – Object, the theory argues that the unit of meaning is located at the sentence rather than the word level. In this respect, our study is based on empirical data drawn from material collected from electronic corpora (corpus-based).In order to better delineate the linguistic data, the definition of the sema ...
This doctoral dissertation presents research aimed at the study of Greek verbal predicates denoting emotion, and their classification into Lexicon-Grammar tables. The ultimate purpose is the creation of a robust lexical resource that is suitable for translation – performed by humans and machines alike. The linguistic analysis follows the theoretical assumptions of transformational and distributional grammar introduced by Zelling S. Harris (1951, 1954, 1968, 1981), whereas the representation of the verbs abides by the principles set by the Lexicon-Grammar framework proposed by Maurice Gross (1975). Being a model of syntax limited to the elementary sentences of the form Subject – Verb – Object, the theory argues that the unit of meaning is located at the sentence rather than the word level. In this respect, our study is based on empirical data drawn from material collected from electronic corpora (corpus-based).In order to better delineate the linguistic data, the definition of the semantic field of EMOTION was in order and the verbs denoting emotion were collected. Subsequently, a corpus of text documents was compiled in view of eliciting real-world data on the syntactic and semantic properties of the verbal predicates at hand. Ultimately, the verbs studied were classified into five (5) Lexicon-Grammar tables, based on a shared definitional structure and shared syntactic and semantic-distributional properties. At the next stage, in view of better representing the emotion concept each verb denotes, additional semantic properties were defined, which correspond to a set of pre-defined attribute/value pairs. We argue that these pairs define a taxonomy (annotation scheme) that better depicts the semantic class of EMOTION. The values assigned to the verbs at hand were encoded as properties in supplementary Lexicon-Grammar tables. At the final stage, a cascade of graphs that comprise a computational grammar was manually crafted using a lexicon- and grammar-based corpus processing suite. The grammar makes use of the information encoded in the Lexicon-Grammar tables, rendering itself appropriate for validation purposes. The final grammar can be integrated into a future syntactic parser or a system for emotion detection.
περισσότερα