Περίληψη
Η παρούσα διδακτορική διατριβή εντάσσεται στην επιστήμη της Υπολογιστικής Γλωσσολογίας, το διεπιστημονικό πεδίο που συνδυάζει τις αρχές της Γλωσσολογίας με τις εφαρμογές της Πληροφορικής. Για την εκπόνηση της έρευνάς μας υιοθετήσαμε τη θεωρία της μετασχηματιστικής γραμματικής του Z.S. Harris (1951, 1968) και το μεθοδολογικό πλαίσιο του λεξικού-γραμματικής, όπως ορίστηκε από τον M. Gross (1975). Στόχος της μελέτης μας ήταν η κατασκευή ενός ηλεκτρονικού μορφολογικού λεξικού πολυλεκτικών σύνθετων μονάδων της νέας ελληνικής με τη μορφή Επίθετο + (Επίθετο) + Ουσιαστικό (π.χ. απονενοημένο διάβημα, λαϊκή απογευματινή παράσταση) και η μελέτη τους σε μορφολογικό, σημασιολογικό και συντακτικό επίπεδο. Ειδικότερα, αφού πραγματοποιήσαμε μια ανασκόπηση της ελληνόγλωσσης και της ξενόγλωσσης βιβλιογραφίας, μελετήσαμε το φαινόμενο της παγίωσης καθώς και τα ειδικά χαρακτηριστικά που διέπουν τις πολυλεκτικές σύνθετες μονάδες που αποτελούνται από επίθετο και ουσιαστικό (ψευδοεπίθετο, παραλλαγές κ.ά.). Το ...
Η παρούσα διδακτορική διατριβή εντάσσεται στην επιστήμη της Υπολογιστικής Γλωσσολογίας, το διεπιστημονικό πεδίο που συνδυάζει τις αρχές της Γλωσσολογίας με τις εφαρμογές της Πληροφορικής. Για την εκπόνηση της έρευνάς μας υιοθετήσαμε τη θεωρία της μετασχηματιστικής γραμματικής του Z.S. Harris (1951, 1968) και το μεθοδολογικό πλαίσιο του λεξικού-γραμματικής, όπως ορίστηκε από τον M. Gross (1975). Στόχος της μελέτης μας ήταν η κατασκευή ενός ηλεκτρονικού μορφολογικού λεξικού πολυλεκτικών σύνθετων μονάδων της νέας ελληνικής με τη μορφή Επίθετο + (Επίθετο) + Ουσιαστικό (π.χ. απονενοημένο διάβημα, λαϊκή απογευματινή παράσταση) και η μελέτη τους σε μορφολογικό, σημασιολογικό και συντακτικό επίπεδο. Ειδικότερα, αφού πραγματοποιήσαμε μια ανασκόπηση της ελληνόγλωσσης και της ξενόγλωσσης βιβλιογραφίας, μελετήσαμε το φαινόμενο της παγίωσης καθώς και τα ειδικά χαρακτηριστικά που διέπουν τις πολυλεκτικές σύνθετες μονάδες που αποτελούνται από επίθετο και ουσιαστικό (ψευδοεπίθετο, παραλλαγές κ.ά.). Το επόμενο στάδιο ήταν η αυτόματη παραγωγή κλιτών τύπων των πολυλεκτικών συνθέτων και των παραλλαγών τους μέσω του προγράμματος επεξεργασίας πολυλεκτικών μονάδων Multiflex (Savary 2005, 2007, 2008, 2009). Έπειτα, προβήκαμε σε προσθήκη σημασιολογικών χαρακτηριστικών στα λήμματα του λεξικού εφαρμόζοντας συντακτικοσημασιολογικά κριτήρια. Στο συντακτικό επίπεδο, μελετήσαμε αφενός τους συντακτικούς μετασχηματισμούς που οδηγούν στο σχηματισμό πολυλεκτικών σύνθετων μονάδων (Monceaux 1993) και αφετέρου τα πολυλεκτικά σύνθετα κατηγορηματικά ουσιαστικά που συντάσσονται με το υποστηρικτικό ρήμα κάνω (M. Gross 1981, Giry-Schneider 1987, Σφέτσιου 2007) τα οποία κατατάξαμε σε πίνακες του λεξικού-γραμματικής βάσει των κατανεμητικών ιδιοτήτων τους. Στη συνέχεια, μελετήσαμε την παρουσία των πολυλεκτικών σύνθετων μονάδων στα γραπτά κείμενα της νέας ελληνικής καθώς και τις αμφισημίες που δημιουργούνται στο λόγο. Τέλος, προτείναμε δραστηριότητες για τη διδασκαλία της γλωσσικής αυτής κατηγορίας μέσω του συστήματος αυτόματης ανάλυσης φυσικών γλωσσών Unitex (Paumier 2004). Τα τυποποιημένα γλωσσικά δεδομένα (λεξικά και γραμματικές) που κατασκευάστηκαν στο πλαίσιο της διατριβής θα ενσωματωθούν στο σύστημα αυτόματης επεξεργασίας της νέας ελληνικής που αναπτύσσεται στο Εργαστήριο Μετάφρασης και Επεξεργασίας του Λόγου (ΕΜΕΛ), το οποίο εδρεύει στο Τμήμα Γαλλικής Γλώσσας και Φιλολογίας του Α.Π.Θ. Η έρευνα για τις πολυλεκτικές σύνθετες μονάδες της νέας ελληνικής που πραγματοποιήσαμε μπορεί να αποβεί χρήσιμη στη διδασκαλία της νέας ελληνικής, καθώς σε εφαρμογές που βασίζονται στην επεξεργασία φυσικών γλωσσών όπως η αυτόματη ανάλυση κειμένων, ο εντοπισμός και η εξαγωγή πληροφοριών, η περίληψη κειμένων, ο ορθογραφικός έλεγχος σωμάτων κειμένων, η εξάλειψη αμφισημιών σε σημασιολογικό επίπεδο (word sense disambiguation) και άλλες εφαρμογές που βασίζονται σε μονόγλωσσα ή πολύγλωσσα τυποποιημένα γλωσσικά δεδομένα. Επιπλέον, το ερευνητικό έργο που παρουσιάστηκε μπορεί να αποτελέσει σημαντικό εργαλείο για τη μετάφραση και κυρίως για την αυτόματη μετάφραση.
περισσότερα
Περίληψη σε άλλη γλώσσα
The present thesis lies in the area of Computational Linguistics, the interdisciplinary field which draws on linguistic theory and computer science. The aim of our research, which is is based on Z.S. Harris’ transformational theory (1951, 1968) and the Lexicon-Grammar methodological framework developed by M. Gross (1975), is the construction of an electronic morphological dictionary of multiword compound nouns in the form of Adjective + (Adjective) + Noun (eg. urban legend, national air space) followed by a study of their morphological, semantic and syntactic properties. In particular, after having presented the principle sources about compounding and various computational methods on multiword expressions, we studied the special characteristics of Adjective + Noun compound nouns such as non-compositionality, fixedness, variation etc. Afterwards, we proceeded to the automatic inflection of compound nouns and their variants using Multiflex, a morpho-syntactic generator of multi-word unit ...
The present thesis lies in the area of Computational Linguistics, the interdisciplinary field which draws on linguistic theory and computer science. The aim of our research, which is is based on Z.S. Harris’ transformational theory (1951, 1968) and the Lexicon-Grammar methodological framework developed by M. Gross (1975), is the construction of an electronic morphological dictionary of multiword compound nouns in the form of Adjective + (Adjective) + Noun (eg. urban legend, national air space) followed by a study of their morphological, semantic and syntactic properties. In particular, after having presented the principle sources about compounding and various computational methods on multiword expressions, we studied the special characteristics of Adjective + Noun compound nouns such as non-compositionality, fixedness, variation etc. Afterwards, we proceeded to the automatic inflection of compound nouns and their variants using Multiflex, a morpho-syntactic generator of multi-word units (A. Savary 2005, 2007, 2008, 2009). Moreover, we added semantic marks in the lexicon based on syntactic and semantic criteria. On the syntactic level, we studied, on one hand the transformations which lead to the formation of compound nouns and on the other hand the support verb constructions consisting of the verb ‘to do’ and complex predicative nouns which we classified in lexicon-grammar tables according to their distributional properties. Furthermore, we studied the presence of multiword compound nouns in Modern Greek written texts along with the ambiguities which rise in discourse. Finally, we proposed activities for teaching compound nouns by using the natural language processing system Unitex (Paumier 2004). Our formalized linguistic tools (dictionaries and grammars) will be incorporated in the automatic analysis system for the Modern Greek language developed by the members of the Translation and Natural Language Processing Laboratory (French School, AUTH). Our research tools could be used for teaching/learning Modern Greek and for applications based on natural language processing such as automatic analysis of texts, information retrieval, text summarization, spelling correctors, word sense disambiguation, and other systems based on monolingual or multilingual formalized linguistic data. Finally, our research could contribute to the improvement of automatic translation systems.
περισσότερα