Περίληψη
Τα τελευταία χρόνια παρατηρείται η ταχεία εξάπλωση και χρήση Διαλογικών Βοηθών (Conversational Assistants - CAs) και συστημάτων, ιδιαίτερα μετά την εμφάνιση των Μεγάλων Γλωσσικών Μοντέλων (Large Language Models - LLMs). Οι βοηθοί αυτοί χρησιμοποιούνται τόσο σε τα εταιρικά περιβάλλοντα για αυτοματοποίηση διαδικασιών και αναζήτηση εταιρικών πληροφοριών, όσο και από καθημερινούς χρήστες σε έξυπνα σπίτια και συσκευές. Παρά τις εντυπωσιακές δυνατότητές τους, η ενσωμάτωση τους συνοδεύεται από σημαντικές προκλήσεις. Η συχνή εμφάνιση παραισθήσεων (hallucinations), η ασφάλεια και η κυριότητα των δεδομένων, η μειωμένη επεξηγησιμότητα και διαφάνεια των αποτελεσμάτων και οι αυξημένες απαιτήσεις υλικού (hardware) είναι μόνο κάποιες από τις πλέον σημαντικές προκλήσεις αυτών των λύσεων. Ταυτόχρονα, η ανάπτυξη Διαλογικών Βοηθών παραμένει μια πολύπλοκη και χρονοβόρα διαδικασία, με υψηλές απαιτήσεις σε τεχνικές γνώσεις, περιορίζοντας την ανάπτυξη τους αποκλειστικά σε ειδικούς. Η παρούσα διδακτορική διατ ...
Τα τελευταία χρόνια παρατηρείται η ταχεία εξάπλωση και χρήση Διαλογικών Βοηθών (Conversational Assistants - CAs) και συστημάτων, ιδιαίτερα μετά την εμφάνιση των Μεγάλων Γλωσσικών Μοντέλων (Large Language Models - LLMs). Οι βοηθοί αυτοί χρησιμοποιούνται τόσο σε τα εταιρικά περιβάλλοντα για αυτοματοποίηση διαδικασιών και αναζήτηση εταιρικών πληροφοριών, όσο και από καθημερινούς χρήστες σε έξυπνα σπίτια και συσκευές. Παρά τις εντυπωσιακές δυνατότητές τους, η ενσωμάτωση τους συνοδεύεται από σημαντικές προκλήσεις. Η συχνή εμφάνιση παραισθήσεων (hallucinations), η ασφάλεια και η κυριότητα των δεδομένων, η μειωμένη επεξηγησιμότητα και διαφάνεια των αποτελεσμάτων και οι αυξημένες απαιτήσεις υλικού (hardware) είναι μόνο κάποιες από τις πλέον σημαντικές προκλήσεις αυτών των λύσεων. Ταυτόχρονα, η ανάπτυξη Διαλογικών Βοηθών παραμένει μια πολύπλοκη και χρονοβόρα διαδικασία, με υψηλές απαιτήσεις σε τεχνικές γνώσεις, περιορίζοντας την ανάπτυξη τους αποκλειστικά σε ειδικούς. Η παρούσα διδακτορική διατριβή στοχεύει στην ανάπτυξη μιας ολοκληρωμένης μεθοδολογίας για τη σχεδίαση και την ανάπτυξη ασφαλών Διαλογικών Βοηθών, ικανών να εκτελεστούν σε περιβάλλοντα περιορισμένων πόρων. Η προτεινόμενη προσέγγιση συνδυάζει τεχνικές Μηχανικής Λογισμικού Οδηγούμενης από Μοντέλα (Model-driven Engineering – MDE), Γλώσσες Ειδικού Πεδίου (Domain-specific Languages – DSLs) και LLM-based διαλογικές διεπαφές, προκειμένου να αυτοματοποιηθεί η δημιουργία CAs, οι οποίοι μπορούν να προσαρμόζονται εύκολα σε διαφορετικά σενάρια χρήσης, να λειτουργούν με διαφάνεια και να εγκαθίστανται σε περιβάλλοντα περιορισμένων πόρων, όπως edge συσκευές. Εστιάζει στην ανάπτυξη και αξιοποίηση εργαλείων ανοικτού υλικού και λογισμικού που διασφαλίζουν ιδιωτικότητα, ασφάλεια και προσαρμοστικότητα. Η διατριβή οργανώνεται γύρω από τέσσερις βασικούς στόχους. Πρώτον, τον σαφή προσδιορισμό των διαδικασιών και της μεθοδολογίας σχεδίασης και ανάπτυξης CAs, ώστε να δημιουργηθεί ένα επαναχρησιμοποιήσιμο και επεκτάσιμο πλαίσιο. Δεύτερον, την αυτοματοποίηση της ανάπτυξης CAs μέσω εργαλείων μειωμένου κώδικα, επιτρέποντας ακόμη και μη ειδικούς (citizen developers) να δημιουργούν διαλογικά συστήματα. Τρίτον, την ανάπτυξη μεθοδολογίας για τη στοχευμένη βελτιστοποίηση της απόδοσης των CAs, με έμφαση στο τμήμα κατανόησης φυσικής γλώσσας (Natural Language Understanding - NLU) και στην επιλογή κατάλληλων γλωσσικών μοντέλων και αλγορίθμων. Τέταρτον, τη διερεύνηση τρόπων αξιοποίησης των LLMs κατά τη σχεδίαση και ανάπτυξη CAs. Με αυτόν τον τρόπο, η διατριβή συμβάλλει στη δημιουργία μιας ολοκληρωμένης μεθοδολογίας για ασφαλείς, επεξηγήσιμους και προσαρμόσιμους Διαλογικούς Βοηθούς, προσφέροντας παράλληλα εργαλεία που καθιστούν εφικτή την ανάπτυξη τους από ένα ευρύτερο κοινό πέρα από τους εξειδικευμένους μηχανικούς.
περισσότερα
Περίληψη σε άλλη γλώσσα
In recent years, there has been a rapid increase in the adoption and use of Conversational Assistants (CAs) and systems, especially after the emergence of Large Language Models (LLMs). These assistants are used in corporate environments to automate processes and search for corporate information, as well as by everyday users in smart homes and devices. Despite their impressive capabilities, their use is accompanied by significant challenges. The frequent occurrence of hallucinations, data security and ownership concerns, reduced results explainability and transparency, and increased hardware requirements are just some of the most significant challenges of these solutions. At the same time, the development of CAs remains a complex and time-consuming process, with high demands on technical knowledge, limiting their development to domain experts.This PhD thesis aims to develop a comprehensive methodology for the design and development of privacy-aware Conversational Assistants that can ope ...
In recent years, there has been a rapid increase in the adoption and use of Conversational Assistants (CAs) and systems, especially after the emergence of Large Language Models (LLMs). These assistants are used in corporate environments to automate processes and search for corporate information, as well as by everyday users in smart homes and devices. Despite their impressive capabilities, their use is accompanied by significant challenges. The frequent occurrence of hallucinations, data security and ownership concerns, reduced results explainability and transparency, and increased hardware requirements are just some of the most significant challenges of these solutions. At the same time, the development of CAs remains a complex and time-consuming process, with high demands on technical knowledge, limiting their development to domain experts.This PhD thesis aims to develop a comprehensive methodology for the design and development of privacy-aware Conversational Assistants that can operate in low-resource environments. The proposed approach combines Model-driven Engineering (MDE) techniques, Domain-specific Languages (DSLs), and LLM-based conversational interfaces to automate the creation of CAs, which can be easily adapted to different use case scenarios, operate transparently, and be fully deployed in low-resource environments, such as edge devices. It focuses on the development and utilization of open hardware and software tools that ensure privacy, security, and adaptability. The PhD thesis is organized around four main objectives. Firstly, aims to define the processes and methodology for designing and developing CAs, thus creating a reusable and extensible CA development framework. Secondly, attempts to automate the CA development process by proposing several low-code tools, allowing even non-experts, such as citizen developers, to create conversational systems. Thirdly, focuses on optimizing the CA performance and particularly the Natural Language Understanding (NLU) component by proposing a methodology for selecting appropriate Language Models and algorithms. Finally, it explores the integration of LLM-based systems into the CA design and development process. This way, this PhD thesis contributes to the creation of a complete and practically applicable methodology for privacy-aware, explainable, and customizable Conversational Assistants, while offering tools that enable their development by a wider audience beyond domain experts.
περισσότερα