Σύγχρονες τεχνικές σχεδίασης και υλοποίησης συστήματος παραγωγής συνθετικής ομιλίας με επεξεργασία στο πεδίο του χρόνου

Η παρούσα διατριβή παρουσιάζει την ερευνητική προσπάθεια και τα αποτελέσματα αυτής αναφορικά με την σχεδίαση και υλοποίηση ενός συστήματος συνθετικής ομιλίας με τεχνικές επεξεργασίας ψηφιακού σήματος στο πεδίο του χρόνου. Πιο συγκεκριμένα, η διατριβή, εκτός από την εκτενή αναφορά σε ερευνητικά αποτελέσματα παρόμοιων προσπαθειών στον ίδιο γνωστικό τομέα, εστιάζει στα εξής επιμέρους σημεία: - Στη μελέτη της προσωδίας και στην έμμεση μοντελοποίηση αυτής μέσω του υποσυστήματος βέλτιστης επιλογής ακουστικών μονάδων. Προτείνεται ένας καινοτόμος μηχανισμός για την μοντελοποίηση, παραγωγή και εφαρμογή πρότυπων καμπυλών προσωδίας στο συνθετικό σήμα φωνής, με τρόπο που επιτρέπει την διατήρηση της μικροπροσωδίας και την ποικιλότητα στην προσωδία. - Στον σχεδιασμό, υλοποίηση και επεξεργασία του πρωτογενούς υλικού για την βάση δεδομένων του συνθέτη φωνής, το οποίο βασίζεται σε ηχογραφήσεις ενός φυσικού ομιλητή. Η μέθοδος που προτείνεται αποτελεί μία καινοτόμο τεχνική για τον σχεδιασμό του σώματος κειμένου, λαμβάνοντας υπόψη τα ιδιαίτερα χαρακτηριστικά του συνθέτη φωνής και εξασφαλίζοντας μέγιστη κάλυψη διαφορετικών φαινομένων. - Σε διαφορετικά υποσυστήματα του συνθέτη ομιλίας τα οποία είναι υπεύθυνα για την επεξεργασία φυσικής γλώσσας, την κανονικοποίηση κειμένου από Greeklish και την φωνητική μεταγραφή του κειμένου, προτείνοντας νέες μεθόδους για την φωνητική μεταγραφή για την Ελληνική γλώσσα, όπως επίσης και την μετατροπή από Greeklish σε ορθά Ελληνικά. - Σε ειδικές προσαρμογές και τεχνικές που προτείνονται για την δημιουργία ενός συνθέτη ομιλίας ειδικά σχεδιασμένου για την σύμπραξη με υποστηρικτικά εργαλεία προσβασιμότητας για εμποδιζόμενα άτομα, λαμβάνοντας μέριμνα για τις ανάγκες χρήστη και τα σενάρια χρήσης. Τα αποτελέσματα της συγκεκριμένης ερευνητικής προσπάθειας έχουν οδηγήσει στην υλοποίηση του ποιοτικότερου συστήματος συνθετικής ομιλίας για την Ελληνική γλώσσα, ενώ παράλληλα έβαλε τις βάσεις δημιουργίας συνθέτη ομιλίας για την Βουλγαρική γλώσσα με εξαιρετικά υψηλή φυσικότητα και καταληπτότητα.

περισσότερα

Περίληψη σε άλλη γλώσσα

This thesis presents the research effort and its results regarding the design and implementation of a speech synthesis system based on time-domain techniques. More specifically, this thesis, apart from a detailed literature review, focuses on the following specific points: - The study of prosody and its modeling for the Text-to-Speech system. The proposed mechanism provides a novel algorithm for modeling, producing and applying of prosodic curves onto the synthetic speech signal, in a manner that allows the preservation of microprosody and diversity in prosodic patterns. - The design and development of primary material for the database of a voice synthesizer, which is based on recordings of a native speaker. The method proposed is an innovative one for the design of the textual corpus, taking into account the specific characteristics of the voice synthesizer and ensuring maximum coverage of different acoustic and linguistic phenomena. - The different subsystems of the speech synthesize ...

περισσότερα

Διαβάστε τη διατριβή (Online)

Κατεβάστε τη διατριβή σε μορφή PDF (4.02 MB) (Η υπηρεσία είναι διαθέσιμη μετά από δωρεάν εγγραφή)

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI	10.12681/eadd/25568
Διεύθυνση Handle	http://hdl.handle.net/10442/hedi/25568
ND	25568
Εναλλακτικός τίτλος	Advanced design and development techniques for the creation of a time domain text to speech system
Συγγραφέας	Χαλαμανδάρης, Αιμίλιος (Πατρώνυμο: Ηλίας)
Ημερομηνία	2011
Ίδρυμα	Εθνικό Μετσόβιο Πολυτεχνείο (ΕΜΠ). Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Σημάτων, Ελέγχου και Ρομποτικής
Εξεταστική επιτροπή	Καραγιάννης Γεώργιος Σταφυλοπάτης Ανδρέας Κόλλιας Στέφανος Σέλλης Τιμολέων Τσανάκας Παναγιώτης Ρετάλης Συμεών Ράπτης Σπυρίδων
Επιστημονικό πεδίο	Επιστήμες Μηχανικού και Τεχνολογία ➨ Επιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ
Λέξεις-κλειδιά	Σύνθεση φωνής; Αλγόριθμος επιλογής ακουστικών μονάδων; Συναρτήσεις κόστους; Μοντελοποίηση προσωδίας; Συνθετική φωνή για ΑμΕΑ; Σχεδίαση σώματος κειμένου για σύνθεση φωνής; Υπολογισμός σημείων ανάλυσης
Χώρα	Ελλάδα
Γλώσσα	Ελληνικά
Άλλα στοιχεία	180 σ., εικ.

Στατιστικά χρήσης

ΠΡΟΒΟΛΕΣ

Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΞΕΦΥΛΛΙΣΜΑΤΑ

Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΜΕΤΑΦΟΡΤΩΣΕΙΣ

Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

ΧΡΗΣΤΕΣ

Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)

Κουβουκλιώτικα: ένα μικρασιατικό γλωσσικό ιδίωμα

Η παιδική σχολική χορωδία στο σύστημα μουσικής εκπαίδευσης μέσα στο πλαίσιο της ελληνικής πραγματικότητας: σύγχρονες τάσεις και αποτελεσματικές εφαρμογές

Η διδασκαλία της μουσικής των παιδιών ηλικίας 8 έως 10 χρόνων με τη χρήση των νέων τεχνολογιών και η επίδρασή της στις στάσεις τους σχετικά με την ελληνική μουσική παράδοση

Πρώιμη ανίχνευση τάσεων προς εμφάνιση συμπτωμάτων δυσλεξικής συμπεριφοράς κατά την προσχολική ηλικία

Η ΜΟΥΣΙΚΗ ΑΓΩΓΗ ΩΣ ΠΑΡΑΓΟΝΤΑΣ ΓΙΑ ΤΗ ΔΙΑΜΟΡΦΩΣΗ ΤΗΣ ΠΡΟΣΩΠΙΚΟΤΗΤΑΣ ΤΟΥ ΠΑΙΔΙΟΥ: ΔΙΑΘΕΜΑΤΙΚΗ ΔΙΔΑΣΚΑΛΙΑ ΜΕ ΚΕΝΤΡΙΚΟ ΑΞΟΝΑ ΤΗ ΜΟΥΣΙΚΗ ΣΕ ΠΑ...

Η ανάπτυξη της αντίληψης του ρυθμού μέσα από την πολυπολιτισμική μουσική αγωγή σε παιδιά ηλικίας 8-10 ετών της πρωτοβάθμιας εκπαίδευσης

ΟΙ ΕΠΙΤΑΚΤΙΚΕΣ ΑΝΑΓΚΕΣ ΩΣ ΕΠΙΦΥΛΑΞΗ ΣΤΗΝ ΕΛΕΥΘΕΡΙΑ ΚΥΚΛΟΦΟΡΙΑΣ ΤΩΝ ΕΜΠΟΡΕΥΜΑΤΩΝΣΤΗΝ ΕΝΙΑΙΑ ΕΥΡΩΠΑΙΚΗ ΑΓΟΡΑ

Η ΡΥΘΜΙΚΗ ΩΣ ΜΕΣΟ ΕΚΠΑΙΔΕΥΣΗΣ ΣΤΗΝ ΠΡΟΣΧΟΛΙΚΗ ΗΛΙΚΙΑ "ΕΝΑ ΣΥΝΔΥΑΣΤΙΚΟ ΠΡΟΓΡΑΜΜΑΡΥΘΜΙΚΗΣ ΚΑΙ ΚΙΝΗΤΙΚΗΣ ΑΓΩΓΗΣ"

Ο Πατριάρχης Αλεξανδρείας Θεόφιλος Β' Παγκώστας ο Πάτμιος (1805-1825)

Η ανάπτυξη του λόγου σε παιδιά με αυτισμό και βαριές διαταραχές στην επικοινωνία

"Σύγχρονες τεχνικές σχεδίασης και υλοποίησης συστήματος παραγωγής συνθετικής ομιλίας με επεξεργασία στο πεδίο του χρόνου"
	Πληκτρολογήστε το κείμενο της εικόνας!
Δηλώνω ότι έλαβα γνώση και ανεπιφύλακτα συμφωνώ και αποδέχομαι τους Όρους Χρήσης του Εθνικού Αρχείου Διδακτορικών Διατριβών, καθώς και της .