Βελτίωση της ποιότητας συνθετικής φωνής και εφαρμογή σε σύγχρονα τηλεπικοινωνιακά περιβάλλοντα και υπηρεσίες

Περίληψη

Αντικείμενο της διδακτορικής διατριβής αποτελεί η τεχνολογία σύνθεσης φωνής από κείμενο. Έμφαση δίνεται στην μεθοδολογία σύνθεσης με επιλογή και ένωση ακουστικών μονάδων στο πεδίο του χρόνου (unit selection concatenative speech synthesis), εστιάζοντας κυρίως στον αλγόριθμο επιλογής ακουστικών μονάδων (unit selection module) και στην σχεδίαση της συνάρτησης του κόστους ένωσης. Εξετάζονται προσεγγίσεις που αφορούν τόσο την γενική περίπτωση συστήματος σύνθεσης φωνής από κείμενο (general domain speech synthesis), όσο και την περίπτωση προσαρμογής αυτής της τεχνολογίας σε περιβάλλον ενσωματωμένων συστημάτων με περιορισμένους υπολογιστικούς πόρους (embedded speech synthesis). Απώτερος στόχος είναι η βελτίωση της ποιότητας της συνθετικής ομιλίας με σκοπό την ευρεία υιοθέτηση συστημάτων σύνθεσης φωνής σε σύγχρονα τηλεπικοινωνιακά περιβάλλοντα και τηλεπικοινωνιακές υπηρεσίες. Επιπρόσθετα, στην διατριβή εξετάζονται και νέες σύγχρονες εναλλακτικές παραμετρικές τεχνικές σύνθεσης φωνής (statistical ...
περισσότερα

Περίληψη σε άλλη γλώσσα

The subject of this thesis is speech synthesis technology and, in particular, the improvement of the quality of Text‐to‐Speech (TTS) systems for application in contemporary telecommunication environments and services. Emphasis is given in Corpus‐based Speech Synthesis and in Unit Selection Concatenative TTS systems by focusing on the Unit Selection algorithm and the design of the cost functions which comprising it. Methods and approaches concerning the implementation of not only General Domain TTS systems, but also adapted scaled‐down TTS systems for computational environments with limited resources and embedded systems in general, are explored and evaluated. In addition, contemporary Statistical Parametric Speech Synthesis based on Hidden Markov Models is explored for the case of the Greek language. More particularly, this thesis deals with research efforts and contributes to the following: - The design and implementation of the unit selection algorithm for a general purpose Textto‐Sp ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/24814
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/24814
ND
24814
Εναλλακτικός τίτλος
Improvement of the quality of text to speech systems for application in contemporary telecommunication environments and services
Συγγραφέας
Καραμπέτσος, Σωτήριος (Πατρώνυμο: Χαρίλαος)
Ημερομηνία
2010
Ίδρυμα
Εθνικό Μετσόβιο Πολυτεχνείο (ΕΜΠ). Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Σημάτων, Ελέγχου και Ρομποτικής
Εξεταστική επιτροπή
Καραγιάννης Γεώργιος
Μαραγκός Πέτρος
Μήτρου Νικόλαος
Κόλλιας Στέφανος
Τσανάκας Παναγιώτης
Μέρτζιος Βασίλειος
Ράπτης Σπυρίδων
Επιστημονικό πεδίο
Επιστήμες Μηχανικού και ΤεχνολογίαΕπιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ
Λέξεις-κλειδιά
Σύνθεση φωνής; Ταξινόμηση μιας τάξης; Επιλογή ακουστικών μονάδων; Φασματικές αποστάσεις; Κρυφά μαρκοβιανά μοντέλα; Κόστος ένωσης; Τηλεπικοινωνιακές υπηρεσίες; Κινητά τηλέφωνα
Χώρα
Ελλάδα
Γλώσσα
Ελληνικά
Άλλα στοιχεία
x, 143 σ., εικ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)