Σύγχρονες τεχνικές ανάλυσης και σύνθεσης φωνής και ομιλίας με τη χρήση οπτικών και ακουστικών πληροφοριών

Περίληψη

Στόχος της παρούσας διατριβής αποτελεί η μελέτη τεχνικών μεθόδων που αφορούν την επεξεργασία πληροφορίας που σχετίζεται με την δια του προσώπου οπτικοακουστική επικοινωνία.Κατόπιν μελέτης των διαφορετικών προσεγγίσεων, οι οποίες αναφέρονται σε ανατομικούς, νευρολογικούς, σημειολογικούς, συναισθηματικούς και συστημικούς παράγοντες επιρροής, το ακριβές αντικείμενο προσδιορίστηκε στο επίπεδο του αμιγώς γλωσσικού περιεχομένου. Σε σχέση με το τελευταίο, προδιαγράφηκαν λεπτομερώς τα χαρακτηριστικά ενός δείγματος ελέγχου φυσικών ομιλητών κατάλληλου για ανάλυση της γραπτής απεικόνισης καθώς και των ακουστικού και οπτικού ερεθίσματος. Αρχικά, για τη γραπτή απεικόνιση προτείνεται μια καινοτομική αναπαράσταση φωνητικής μεταγραφής από έναν ακρυλικό κατευθυντικό γράφο αντί της κλασσικής σειριακής ακολουθίας φωνητικών συμβολών. Η προτεινόμενη μεθοδολογία εφαρμόστηκε για την περίπτωση της νέας ελληνικής γλώσσας για την οποία δημιουργήθηκε ένα σύστημα βασισμένο σε κανόνες μεταγραφής.Στη συνέχεια, για ...
περισσότερα

Περίληψη σε άλλη γλώσσα

The aim of the current thesis is to study technical methods of information processing associated with the face-based audiovisual communication.Following a study of different approaches, referring to anatomical, neurological, semantic, emotional and systemic influence factors, the exact object is defined in terms of purely linguistic content. In relation to the latter, a detailed characteristics specification of a native speakers control sample was determined, suitable for analysis of written form, auditory and visual stimuli.Regarding the written form a novel phonetic transcription representation is proposed, with the use of an acrylic directional graph instead of the classic serial sequence of phonetic symbols. The methodology was applied to the case of the Greek language, by means of a rule-based transcription system development.Furthermore, regarding the acoustic stimulus two novel fuzzy segmentation methods of the corresponding signal are proposed. Their design is based on both the ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/29051
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/29051
ND
29051
Εναλλακτικός τίτλος
Synchronous voice and speech analysis and synthesis techniques using visual and auditory information
Συγγραφέας
Αβδελίδης, Κωνσταντίνος του Αθανάσιος
Ημερομηνία
2012
Ίδρυμα
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ). Σχολή Πολυτεχνική. Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Ηλεκτρονικών Υπολογιστών. Τομέας Τηλεπικοινωνιών
Εξεταστική επιτροπή
Παπανικολάου Γεώργιος
Πανάς Σταύρος
Σεργιάδης Γεώργιος
Μουρτζόπουλος Ιωάννης
Χατζηλεοντιάδης Λεόντιος
Καλλίρης Γεώργιος
Ντελόπουλος Αναστάσιος
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμες Ηλεκτρονικών Υπολογιστών & Πληροφορικής
Επιστήμες Μηχανικού και ΤεχνολογίαΕπιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ
Λέξεις-κλειδιά
Ανάλυση γλωσσικού περιεχομένου; Οριακή φωνητική μεταγραφή κειμένου; Ασαφής κατάτμηση σήματος φωνής; Ανάλυση βραχέως χρόνου χαρακτηριστικών σήματος ήχου; Διακριτικά χαρακτηριστικά; Παρακολούθηση/απομόνωση ορατών αρθρωτών; Επεξεργασία και τεκμηρίωση οπτικοακουστικού σήματος ομιλίας
Χώρα
Ελλάδα
Γλώσσα
Ελληνικά
Άλλα στοιχεία
265 σ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)