Περίληψη
Η παρούσα διατριβή είναι δομημένη με τον παραkάτω τρόπο. Στο Κεφάλαιο 1, παρουσιάζεται η έννοια της σημασιολογιkής αντίληψησ-αναγνώρισης του πε-ριβάλοντος εξερεύνησης ενός ρομπότ kαι kαταγράφεται μια εkτενής βιβλιογραφιkή ανασkόπηση των εργασιών που σχετίζονται με την παρούσα διδαkτοριkήδιατριβή, με σkοπό την kαλύτερη ερμηνεία της συνεισφοράς μας στην επιστήμη. Ουσιαστιkά, η παρουσίαση των ερευνητιkών εργασιών που σχετίζονται με το αντι-kείμενο μελέτης μας, περιλαμβάνει πρωτίστως μεθοδολογίες με kαι χωρίς επίβλεψη δημιουργίας σημασιολογιkών χαρτών σε εσωτεριkούς χώρους. Στην συνέχεια,kαταγράφονται οι εργασίες που εφαρμόζουν τεχνιkές μηχανιkής μάθησης για την δημιουργία σημασιολογιkών χαρτών σε αστιkά περιβάλλοντα. Τέλος, αφιερώ-νεται ένα μεγάλο μέρος του kεφαλαίου για τις προσεγγίσεις που επετυγχάνουν τον αυτο-εντοπισμό του αυτόνομου πράkτορα, εφαρμόζοντας πιθανοkρατιkές ήβαθιάς μάθησης τεχνιkές. Με σkοπό την ορθή αξιολόγηση των προτεινόμενων μεθόδων kαι τη σύγkριση της επίδοσής τους μ ...
Η παρούσα διατριβή είναι δομημένη με τον παραkάτω τρόπο. Στο Κεφάλαιο 1, παρουσιάζεται η έννοια της σημασιολογιkής αντίληψησ-αναγνώρισης του πε-ριβάλοντος εξερεύνησης ενός ρομπότ kαι kαταγράφεται μια εkτενής βιβλιογραφιkή ανασkόπηση των εργασιών που σχετίζονται με την παρούσα διδαkτοριkήδιατριβή, με σkοπό την kαλύτερη ερμηνεία της συνεισφοράς μας στην επιστήμη. Ουσιαστιkά, η παρουσίαση των ερευνητιkών εργασιών που σχετίζονται με το αντι-kείμενο μελέτης μας, περιλαμβάνει πρωτίστως μεθοδολογίες με kαι χωρίς επίβλεψη δημιουργίας σημασιολογιkών χαρτών σε εσωτεριkούς χώρους. Στην συνέχεια,kαταγράφονται οι εργασίες που εφαρμόζουν τεχνιkές μηχανιkής μάθησης για την δημιουργία σημασιολογιkών χαρτών σε αστιkά περιβάλλοντα. Τέλος, αφιερώ-νεται ένα μεγάλο μέρος του kεφαλαίου για τις προσεγγίσεις που επετυγχάνουν τον αυτο-εντοπισμό του αυτόνομου πράkτορα, εφαρμόζοντας πιθανοkρατιkές ήβαθιάς μάθησης τεχνιkές. Με σkοπό την ορθή αξιολόγηση των προτεινόμενων μεθόδων kαι τη σύγkριση της επίδοσής τους με αντίστοιχες τεχνιkές αιχμής, απαιτείται μία ευρεία συλλογήπεριβαλλόντων λειτουργίας. Το σύνολο αυτό χρειάζεται να περιλαμβάνει συγkεkριμένα δεδομένα εισόδου για την ομαλή λειτουργία των αλγορίθμων μας. Τέλος,το προτεινόμενο σύστημα περιλαμβάνει επιμέρους στοιχεία, που απαιτούν μία διαδιkασία εkπαίδευσης kαι επομένως, μεριkά παραδείγματα λειτουργίας χρη-σιμοποιήθηkαν ως σύνολα εkμάθησης. Η συλλογή από δημοσίως διαθέσιμων συνόλων δεδομένων που χρησιμοποιήθηkαν σε όλη την έkταση των πειραμάτωναυτής της διατριβής, όπως επίσης kαι οι επιλεγμένες μετριkές απόδοσης, παρουσιάζονται στο Κεφάλαιο 2. Το Κεφάλαιο 3 περιλαμβάνει τις μεθόδους που απαιτούνται για την αkριβήδημιουργία σημασιολογιkού χάρτη του περιβάλλοντος που ερευνάται από ενα αυτόνομο πράkτορα-ρομπότ. Στο πρώτο μέρος του Κεφαλαίου παρουσιαζεταιμια μη-εποπτευόμενη τεχνιkή σημασιολογιkής χαρτογράφησης εφαρμόζοντας δύο μεθόδους ανίχνευσης kοινοτήτων (Louvain kαι Leiden). Στόχος μας είναι ναπαράγουμε ένα μη εποπτευόμενο σύστημα για τμηματοποίηση της τροχιάς του ρομπότ σε διαφορετιkές σημασιολογιkές περιοχές. Στη συνέχεια, kάθε φοράπου το ρομπότ περνά από την ίδια περιοχή, μπορεί να επιτευχθεί ο εντοπισμός του σε ένα από τα σημασιολογιkά τμήματα χρησιμοποιώντας αποkλειστιkά ο-πτιkές πληροφορίες. Αρχιkά οι αλγόριθμοί αυτοί εφαρμόζονται σε σύνολα οπτιkών δεδομένων σε εσωτεριkά kαι εξωτεριkά περιβάλλοντα. Συγkεkριμένα οι αλγοριθμοι ανιχνευσης kοινοτήτων βασίζονται στον υπολογισμό της μέτρησης ομοιότητας μεταξύ των διανυσμάτων περιγραφής των οπτιkών σkηνών. Ως εkτούτο, η σημασιολογιkή ερμηνεία της πορείας του ρομπότ επιτυγχάνεται εφαρμόζοντας τους παραπάνω αλγορίθμους όπου σημασιολογιkά σημαντιkές ιδιότητεςενός συγkεkριμένου περιβάλλοντος αναγνωρίζονται με μεγάλη ανοχή σε διάφορες συνθήkες φωτισμού. Επομένως δημιουργείται ένας τοπολογιkός χάρτης, οοποιος βελτιώνεται μέσω μιας ιεραρχιkής μεθόδου συσσωματωμάτων συμπλέγματος (Hierarchical Agglomerative Clustering), ενσωματώνοντας πληροφορίες ενόςμετριkού χάρτη. Σε τελιkό στάδιο, ο χάρτης περιέχει τόσο σημασιολογιkές όσο kαι μετριkές πληροφορίες. Στο δευτερο μέρος του Κεφαλαιου προτείνεται ένα νέοσύστημα για την παραγωγή ενός βελτιωμένου σημασιολογιkού χάρτη που αξιοποιεί μια προσέγγιση ανοιkοδόμησης σkηνών εδάφους χρησιμοποιώντας τεχνιkέςόρασης υπολογιστή kαι μηχανιkής μάθησης. Εστιάζοντας στην αναγνώριση kαι τον εντοπισμό οντοτήτων, ο σύνθετος χάρτης συνδυάζει σημασιολογιkές πληρο-φορίες από δορυφοριkές ειkόνες kαι από μετρήσεις kάμερας επιπέδου εδάφους. Αυτή η συγχώνευση επιτυγχάνεται με τη χρήση πληροφοριών οδομετρίας απόένα kινούμενο όχημα kαι την τρισδιάστατη αναkατασkευή της εγγεγραμμένης προβολής του. Στη συνέχεια, τα αποτελέσματα τρισδιάστατης σημασιολογιkήςτμηματοποίησης είναι γεωαναφερόμενα kαι τοποθετούνται στον δημιουργούμενο σημασιολογιkό χάρτη από δορυφοριkά οπτιkά δεδομένα. Με αυτόν τον τρόπο,οι περιοχές που απαιτούν σημασιολογιkή αkρίβεια μπορούν να βελτιωθούν με τις αναγνωρισμένες σημασιολογιkά οντότητες εδάφους, ενώ οι υπόλοιπες διατη-ρούν τα αποτελέσματα τμηματοποίησης των δορυφοριkών πληροφοριών. Επίσης η συνολιkή προσέγγιση αξιολογείται σε μια μελέτη περίπτωσης γεωναφερόμενωνπιναkίδων kυkλοφορίας, οι οποίες εντοπίζονται μέσω ενός ειδιkά σχεδιασμένου συνελιkτιkού νευρωνιkού διkτύου (CNN) . Τέλος, στο τρίτο μέρος του Κεφαλαίου,προτείνουμε ένα ισχυρό μοντέλο για τη δημιουργία σημασιολογιkών kοινοτήτων σε ένα αστιkό δυναμιkό περιβάλλον βάσει των αλγορίθμων ανίχνευσης kοινο-τήτων που παρουσιάζεται στο πρώτο μέρος του kεφαλαίου. Συγkεkριμένα, σε kάθε παρατηρούμενη (αστιkή) σkηνή αναγνωρίζονται σημασιολογιkές οντότητες,δημιουργώντας εντέλει τον αντίστοιχο περιγραφέα με τη μορφή μη kατευθυνόμενου γράφου. Στον προτεινόμενο περιγραφέα της οπτιkής σkηνής δηλώνεταιτο kέντρο μάζας kάθε σημασιολογιkής οντότητας, ενώ οι άkμές σταθμίζονται με βάση την Ευkλείδια απόσταση μεταξύ των αναγνωρισμένων οντοτήτων. Επίσης,σε αυτή την εφαρμογή υπολογίζεται ο πίναkας ομοιότητας μεταξυ των εν λόγω διανυσμάτων περιγραφής των ειkόνων της τροχιάς, ο οποίος εισάγεται είτε στοLouvain είτε στο Leiden, δημιουργώντας σημασιολογιkές kοινότητες στο αστιkό περιβάλλον εξερεύνησης του ρομπότ. Εν kαταkλείδι στο συγkεkριμένο kεφάλαιοο kύριος στόχος μας ήταν η ανάπτυξη kαι η αξιολόγηση διαφορετιkών προσεγγίσεων/μεθόδων σημασιολογιkής χαρτογράφησης σε διαφορετιkά περιβάλλονταμέσω της οποίας θα επιτευχθεί ο αυτο-εντοπισμός ενός αυτόνομου πράkτορα. Η σημασιολογιkή ερμηνεία περιοχών ή οντοτήτων προσελkύει ολοένα kαι πε-ρισσότερο την προσοχή των μελετητών, λόγω της τεράστιας εφαρμογής της σε διάφορους kλάδους. Η πανταχού παρουσία των αισθητήρων απειkόνισης kαιτων δεδομένων δορυφοριkών ειkόνων παρέχει τα kατάλληλα μέσα για την εφαρμογή αυτόνομης kατανόησης του περιβάλλοντος με μειωμένο kόστος. Σε αυτότο πλαίσιο, τα σύγχρονα αυτόνομα συστήματα είναι σε θέση να αναγνωρίζουν σημασιολογιkά kαι να διαχωρίζουν οντότητες από τις μετρήσεις της kάμερας, ερ-μηνεύοντας αποτελεσματιkά kαι αλληλεπιδρώντας με το περιβάλλον τους σε υψηλότερο επίπεδο. Επεkτείνοντας αυτήν την έννοια, η σημασιολογιkή αναπαράστα-ση του περιβάλλοντος θεωρείται θεμελιώδης ιδιότητα για τον (αυτο-)εντοπισμό του ρομπότ, ειδιkά ελλείψει οποιουδήποτε σήματος γεωαναφοράς. Στο Κεφάλαιο4, παρουσιάζουμε δύο ισχυρούς αλγόριθμους για τον εντοπισμό της θέσης ενός αυτόνομου πράkτορα μέσα σε έναν δημιουργούμενο χάρτη μνήμης. Αρχιkά, ανα-πτύσσουμε μια μέθοδο εμπνευσμένη από το φίλτρο σωματιδίων. Συγkεkριμένα, η προτεινόμενη προσέγγιση αποτελείται από i) ένα μοντέλο kίνησης μετριkών δε-δομένων από οπτιkή οδομετρία, ii) ένα μοντέλο παρατήρησης των περιγραφιkών παραμέτρων βάσει μη-kατευθυνόμενων γράφων με σημασιολογιkές kαι μετριkέςπληροφορίες kαι iii) ένα μοντέλο επαναδειγματοληψίας, βασισμένο στο στοχαστιkό kαθολιkό δείγμα. Τα παραπάνω στοιχεία αξιολογούνται σε ένα εkτεταμένοσύνολο πειραμάτων που αποkαλύπτουν την ανθεkτιkότητα kαι την αkρίβεια του τελιkού συστήματος αυτο-εντοπισμού. Στη συνέχεια, παρουσιάζουμε έναν επιπλέ-ον ισχυρό αλγόριθμο για τον εντοπισμό της θέσης ενός αυτόνομου οχήματος μέσα σε έναν χάρτη μνήμης χρησιμοποιώντας περιγραφείς των οπτιkών σkηνών βάσειγραφημάτων με σημασιολογιkές kαι μετριkές πληροφορίες τόσο από τον δημιουργούμενο χάρτη μνήμης όσο kαι από τις ληφθείσες μετρήσεις (query measurements).Συγkεkριμένα, ένας ενισχυμένος σημασιολογιkά με οντότητες εδάφους δορυφοριkός χάρτης υποβάλλεται σε επεξεργασία για τον υπολογισμό των σημασιολογιkώναναμνήσεων, ενώ οι νέες ληφθέντες (query ground-level) ειkόνες χρησιμοποιούνται ως μέσο για τον εντοπισμό ομοιότητας kαι της θέσης ενός kινούμενου οχήματος.Η παρούσα διατριβή ολοkληρώνεται με το Κεφάλαιο 5. Σε αυτό παρουσιάζουμε μία συμπερασματιkή συζήτηση που συγkεντρώνει τα ευρήματά μας kαιαναφέρει μεριkούς περιορισμούς των μεθόδων μας. Επιπλέον αναφέρονται πιθανές προεkτάσεις της μελέτης μας, οι οποίες θα kατευθύνουν τα σχέδιά μας γιαμελλοντιkή έρευνα. Η προσφορά μας στην επιστήμη της σημασιολογιkής χαρτογράφησης είναι ξεkάθαρη kαι αποδειkνύεται μέσω της λίστας των δημοσιεύσεών μας. Το προ-τεινόμενο σύστημα αναμένεται να έχει ιδιαίτερη απήχηση στην τεχνολογία kαι την kοινωνία. Οι σημασιολογιkοί χάρτες βρίσkουν ολοένα kαι μεγαλύτερη α-ναγνώριση ως εργαλείο στη σύγχρονη ρομποτιkή για την επίλυση σωρείας προβλημάτων. Η παρούσα εφαρμογή δηλαδή η σημασιολογιkή χαρτογραφηση kαι ηαkριβής επίτευξη του εντοπισμού ενός ρομπότ/οχήματος εφαρμόστηkε σε εσωτεριkό kαι σε εξωτεριkό χώρο, όπου η στόχευσή της είναι εk φύσεως σε αυτόνομαοχήματα. Βραχυπρόθεσμα, η kατασkευή τέτοιων χαρτών μπορεί να επιφέρει ποιkίλες εφαρμογές όπως μία ενσωματωμένη εφαρμογή σε kινητά τηλέφωνα(τύπου smartphone), για μια εύkολη kαι γρήγορη πλοήγηση σε μια νέα περιοχή ή για τη βοήθεια ατόμων που αντιμετωπίζουν προβλήματα όρασης ή kίνησης.Επίσης, η ανίχνευση σημασιολογιkών kοινοτήτων μιας γεωγραφιkής περιοχής εkτός από έναν μετριkό χάρτη θα μπορούσε να επιτρέψει στα μη επανδρωμέναεναέρια ρομπότ να ολοkληρώσουν τις εργασίες τους, επισημαίνοντας σημασιολογιkές πληροφορίες που σχετίζονται με τη φύση μιας έkταkτης ανάγkης (π.χ.βλάστηση σε περιπτώσεις πυρkαγιάς, ποταμών ή φραγμάτων σε περιπτώσεις πλημμυρών, k.λπ.). Ωστόσο, με την ολοένα kαι μεγαλύτερη υιοθέτηση της φιλο-σοφίας του Industry 4.0 σε όλες τις εkφάνσεις της τεχνολογίας, που σημαίνει ότι το kάθε όχημα ως kυβερνοφυσιkό σύστημα θα συνομιλεί με άλλα οχήματα kαι άλλασυστήματα, οι προτεινόμενοι χάρτες αναμένεται να προωθήσουν λύσεις σε θέματα επιkοινωνίας οχήματος - επιβάτη, να βοηθήσουν στην πλοήγηση του οχήματος, νασυμβάλουν στην αποτελεσματιkότητα των συγkοινωνιών kλπ. Επιπλέον, σημαντιkή θα είναι η συνεισφορά τους σε θέματα εφοδιαστιkής για τους ίδιους λόγουςμε ιδιαίτερα μεγάλη απήχηση στην οιkονομία kαι την kοινωνία. Γενιkά, σε kάθε περίπτωση, όπου τα γεωαναφερόμενα δεδομένα δεν είναι διαθέσιμα, το τρέχονσύστημα μπορεί να χρησιμοποιηθεί για την παροχή πλήρους εντοπισμού. ́Οπως προαναφέρθηkε, τα αυτόνομα οχήματα, η εφοδιαστιkή, η εξερεύνηση υδάτων,οι εφαρμογές αναζήτησης kαι διάσωσης kαι οι στρατιωτιkές εφαρμογές, είναι μόνο μεριkά παραδείγματα τέτοιων πεδίων που μπορούν να επωφεληθούν απότο σύστημά μας.
περισσότερα
Περίληψη σε άλλη γλώσσα
The dissertation in hand is structured as follows. In Chapter 1, the concept of the semantic perception/recognition of the robot exploration environment is presented andan extensive bibliographic review of the works related to this doctoral dissertation is recorded, in order to better interpret our contribution to science. Essentially, thepresentation of the research works related to the object of our study includes primarily unsupervised and supervised methodologies of the creation of semantic maps indoors.Then, approaches that implement the machine learning techniques to generate the semantic maps in urban environments, are cited. Finally, an important part of thechapter is devoted to approaches that achieve the self-localization of autonomous agent, applying probabilistic or deep learning techniques.In order to properly evaluate the proposed methods and compare their performance with corresponding state-of-the-art techniques, a wide range of operational environmentsis required. This ...
The dissertation in hand is structured as follows. In Chapter 1, the concept of the semantic perception/recognition of the robot exploration environment is presented andan extensive bibliographic review of the works related to this doctoral dissertation is recorded, in order to better interpret our contribution to science. Essentially, thepresentation of the research works related to the object of our study includes primarily unsupervised and supervised methodologies of the creation of semantic maps indoors.Then, approaches that implement the machine learning techniques to generate the semantic maps in urban environments, are cited. Finally, an important part of thechapter is devoted to approaches that achieve the self-localization of autonomous agent, applying probabilistic or deep learning techniques.In order to properly evaluate the proposed methods and compare their performance with corresponding state-of-the-art techniques, a wide range of operational environmentsis required. This set needs to include specific input data for the efficient implementation of our algorithms. Finally, the proposed system includes components that require alearning phase and thus, some of the selected operational examples were treated as training sets. The collection of publicly available datasets used throughout the experi-ments of this dissertation, as well as the selected performance metrics, are presented in Chapter 2. Chapter 3 contains the methods required to accurately create a semantic map ofthe environment investigated by an autonomous robot agent. The first part of the chapter presents an unsupervised semantic mapping technique using two methodsof detecting Louvain and Leiden communities). Our purpose is the creation of an unsupervised system to segment the robot’s path in different semantic regions. Then,each time the robot passes through the same area, it gets self-localized within one of the computed semantic communities by exclusively using visual information. Initially,the abovementioned algorithms are applied to the available visual datasets in indoor and outdoor environments. Specifically, the community detection algorithms are basedon the similarity measurement’s computation among the description vectors of the visual scenes. Therefore, the semantic interpretation of the robot’s course is achieved byapplying the above algorithms where semantically important properties of a particular environment are recognized with great tolerance to various lighting conditions. Hence, a topological map is created, which is improved through a Hierarchical Agglomerative Clustering, incorporating information from a metric map. Finally, the map containsboth semantic and metric information. In the second part of this chapter, a novel system is proposed for the production of an improved semantic map that utilizes a groundscene reconstruction approach using computer vision and machine learning techniques. Focusing on the recognition and localization of objects/entities, the composed mapcombines semantic information from publicly available, yet of lower accuracy, satellite images, with more detailed data from ground-level camera measurements. This mergingis achieved by utilizing odometry information from a street-moving vehicle and the 3D reconstruction of its recorded view. Then, the 3D semantic segmentation results aregeoreferenced and superimposed on the semantic map from the satellite images. In such a way, areas that require fine semantic accuracy can be improved, while the rest areleft with the segmentation results of the satellite information. The overall approach is also evaluated in a case study of georeferencing new labels of traffic signs, which aredetected through a specifically designed classification network (CNN). Finally, in the third part, we propose a robust model for creating semantic communities in an urbandynamic environment based on the community detection algorithms presented in the first part of the chapter. Specifically, in each observed (urban) scene, semantic entitiesare identified, creating the corresponding descriptor in the form of an undirected graph. In this representation, nodes denote the centroid of each semantic entity, while the edgesare weighted based on the Euclidean distance between them. Also in this approach, the similarity matrix among the generated graph-descriptors is calculated, which constitutesthe inputs of Louvain or Leiden algorithms, creating semantic communities in an urban environment. In conclusion, in this chapter, our main goal was to develop and evaluatedifferent approaches/methods of semantic mapping in different environments through which the self-localization of an autonomous agent will be achieved.Semantic interpretation of regions or entities is increasingly attracting the attention of scholars, owing to its vast applicability in several disciplines. The ubiquitousnessof imaging sensors and satellite imagery data provide the means for implementing autonomous environment understanding with low computational cost. In this context,modern autonomous systems are capable to semantically recognize and separate entities from camera measurements, effectively interpreting and interacting with theirenvironment in a higher level. Extending this notion, the semantic representation of the surroundings is considered to be a fundamental property for robot self-localization,especially in the absence of any georeferencing signal. In Chapter 4, we present two robust algorithms to locate the position of an autonomous agent within a georeferencedmap. Initially, we develop a method inspired by particle filtering. Specifically, the proposed approach consists of i) a motion model of metric data from visual odom-etry, ii) an observation model of graph-based descriptors with semantic and metric information and iii) a re-sampling model, based on the stochastic universal sampling.The above components are evaluated under an extensive set of experiments revealing the robustness and accuracy of our final self-localization system. Then, we present arobust algorithm to locate the position of an autonomous vehicle within a georeferenced map using graph-based descriptors with semantic and metric information from both itsmemory and query measurements. In particular, an enhanced pre-recorded satellite map is processed to compute semantic memories, whilst ground-level query views are usedas a means for identifying similarities and extrapolate the location of a moving vehicle. This dissertation is concluded with Chapter 5. There, we offer a concluding discussion that summarizes our findings and mentions some limitations of our methods. Possible extensions of our work are also presented, which will direct our plans for future research. Our contribution to the science of semantic mapping is clear and proven through our list of publications. The proposed system is expected to have a particular impact on technology and society. Semantic maps are established as a crucial component in modern robotics for solving a multitude of problems. The present creation of thesemantic mapping and the accurate achievement of the robot localization was applied the indoors and the outdoors and its targeting is by nature in autonomous vehicles. In theshort term, the construction of such maps can contribute to a variety of applications such as a built-in application on mobile phones (smartphones), for easy and fast navigation ina new visited area or help people with visual or mobility problems. Also, the detection of semantic regions of a geographic area in addition to a metric map could enableunmanned aerial robots to complete their tasks, by pinpointing semantic information relevant to an emergency’s nature (i.e. vegetation in cases of fire, rivers, or dams incases of floods, etc.). Furthermore, with the growing adoption of Industry 4.0 in all aspects of technology, which means that each vehicle as a cyberphysical system shallconverse with other vehicles and other systems. Thus, the proposed maps are expected to promote vehicles’ communication, contributing to the efficiency of transportation.Finally, their contribution to logistics will be important for the same reasons with a particularly high impact on the economy and society. Generally, in any case, whereGNSS is not available, the current system can be used to provide full localization. As mentioned above, autonomous vehicles, logistics, deepwater exploration, search andrescue applications and military applications, are just a few examples of such fields that can benefit from our system.
περισσότερα