Εξόρυξη και διαχείριση σημασιολογικής πληροφορίας στον παγκόσμιο ιστό

Ο Σημασιολογικός Ιστός (Semantic Web) υπόσχεται έναν διαφορετικό τρόπο διαχείρισης και πρόσβασης στις πληροφορίες του Διαδικτύου. Η κεντρική ιδέα στην οποία βασίζεται το όραμα του Σημασιολογικού Ιστού είναι η κατανόηση των πληροφοριών από τους ίδιους τους υπολογιστές μέσω της περιγραφής των ίδιων των δεδομένων και των σχέσεων μεταξύ τους. Αντικείμενο αυτής της διατριβής είναι οι κύριες τεχνολογίες που μπορούν κάνουν πραγματικότητα αυτόν το νέο τρόπο πληροφόρισης. Η διατριβή επικεντρώνεται στις τεχνολογίες ανακάλυψης σημασιολογικών δεδομένων στον Παγκόσμιο Ιστό, στις σημασιολογικές βάσεις δεδομένων, στα σημασιολογικά ερωτήματα και στην κατάταξη σημασιολογικών αποτελεσμάτων. Για κάθε μια από αυτές τις τεχνολογίες παρουσιάζονται οι διαθέσιμες προσεγγίσεις ενώ στη συνέχεια δίνεται και υλοποιείται μια καινοτόμος λύση, τα πλεονεκτήματα της οποίας συγκρίνονται με τις υπάρχουσες τεχνολογίες. Συγκεκριμένα, για την ανακάλυψη σημασιολογικών δεδομένων στον Παγκόσμιο Ιστό σχεδιάστηκε και αναπτύχθηκε ένα οικοσύστημα πρακτόρων λογισμικού οι οποίοι έχουν την ικανότητα εντοπισμού και εκμάθησης των περιοχών του WWW που περιέχουν σημασιολογικά δεδομένα, καθώς και τη δυνατότητα να ανταλλάσουν μεταξύ τους πληροφορίες σχετικά με τις πρόσφατες ανακαλύψεις του καθενός. Σε ότι αφορά την αποθήκευση σημασιολογικών δεδομένων, σχεδιάστηκε και υλοποιήθηκε ένα σύστημα που χρησιμοποιεί αντικειμενοστρεφείς βάσεις για την αποθήκευση σημασιολογικών γράφων της OWL το οποίο ονομάστηκε db4OWL. Αξίζει να σημειωθεί, πως αυτό είναι το μόνο σύστημα ειδικά σχεδιασμένο για αποθήκευση δεδομένων OWL. Για την αναζήτηση πληροφοριών, αναπτύχθηκε ένας μηχανισμός σημασιολογικών ερωτημάτων εκφρασμένων απευθείας σε γλώσσα OWL χωρίς την ανάγκη χρήσης μιας ενδιάμεσης γλώσσας ερωτημάτων, όπως γινόταν μέχρι σήμερα σε παρόμοια συστήματα. Η έκφραση σημασιολογικών ερωτημάτων στη φυσική τους γλώσσα απλοποιεί σημαντικά τη χρήση του συστήματος ενώ παράλληλα αυξάνει την ακρίβεια των ερωτημάτων. Επίσης, το σύστημα επιτρέπει την μετατροπή και χρήση δοκιμασμένων μεθόδων κατάταξης αποτελεσμάτων (όπως ο αλγόριθμος PageRank του Google) σε σημασιολογικά δεδομένα. Αυτό επιτυγχάνεται με την χρήση μιας ανοιχτής αρχιτεκτονικής όπου διαφορετικοί αλγόριθμοι μπορούν να δουλεύουν συμπληρωματικά, λαμβάνοντας υπόψη διαφορετικούς παράγοντες κατάταξης. Στο τέλος της διατριβής παρουσιάζεται η συμβατότητα και διαλειτουργικότητα των σημασιολογικών τεχνολογιών με την ενσωμάτωσή τους σε ένα ενιαίο σύστημα Σημασιολογικής Μηχανής Αναζήτησης

περισσότερα

Περίληψη σε άλλη γλώσσα

The Semantic Web introduces a novel way of accessing and managing information on the Internet. The main concept behind this approach is the notion of machine understandable information, accomplished by explicitly describing data elements as well as their interrelationships. The focus of this dissertation is the main technologies capable of transforming the Semantic Web vision into a reality. It concentrates on technologies enabling the discovery of semantic data on the Web (crawling), semantic databases, semantic querying and techniques to rank semantic query results. The current state of the art is reviewed for each one of the above technologies and a novel approach is presented and implemented, the advantages of which are compared with the existing solutions. More specifically, for the discovery of semantic data on the WWW, an agent?ecosystem was designed and developed, which involves agents able to locate and remember areas of the Web that contain semantic data. These agents are also capable of exchanging information between them, regarding their recent discoveries, in order to optimize the system’s performance. In the area of semantic data storage, a novel approach is proposed that relies on objectoriented databases instead of relational ones. db4OWL, a prototype system, specifically designed to store OWL (Web Ontology Language) data using an object database was created. It should be noted that at the time of this writing, db4OWL is the only persistent storage system that natively supports OWL. To retrieve information, a querying mechanism was developed that allows users or software agents to express semantic queries directly in OWL, without the need for an intermediate query language like the ones used in similar systems. Querying semantic data in their native language is far more intuitive for users, while also allowing for more detailed and precise queries. Furthermore, successfull and time?tested ranking principles from commercial search engines can be adapted and used in the system on semantic data. This is achieved through an open architecture that allows different algorithms to complement each other while focusing on different ranking factors. OWLRank, an adaptation of Google’s PageRank algorithm for semantic data, demonstrates this feature. Finally, the compatibility and interoperability of the proposed approaches is demonstrated by integrating them in order to form a Semantic Search Engine prototype

περισσότερα

Διαβάστε τη διατριβή (Online)

Κατεβάστε τη διατριβή σε μορφή PDF (7.35 MB) (Η υπηρεσία είναι διαθέσιμη μετά από δωρεάν εγγραφή)

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI	10.12681/eadd/19280
Διεύθυνση Handle	http://hdl.handle.net/10442/hedi/19280
ND	19280
Εναλλακτικός τίτλος	Discovery and management of semantic data on the world wide web
Συγγραφέας	Μπάτζιος, Αλέξανδρος (Πατρώνυμο: Δημήτριος)
Ημερομηνία	2009
Ίδρυμα	Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ). Σχολή Πολυτεχνική. Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Εξεταστική επιτροπή	Μήτκας Περικλής Στρίντζης Μιχαήλ Ντελόπουλος Αναστάσιος Θεοχάρης Ιωάννης Βλαχάβας Ιωάννης Βακάλη Αθηνά Κομπατσιάρης Ιωάννης
Επιστημονικό πεδίο	Επιστήμες Μηχανικού και Τεχνολογία ➨ Επιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ
Λέξεις-κλειδιά	Σημασιολογικός ιστός; Σημασιολογική αναζήτηση; Σημασιολογικά δεδομένα; Σημασιολογικά ερωτήματα; Βάσεις δεδομένων OWL; Σημασιολογική μηχανή αναζήτησης
Χώρα	Ελλάδα
Γλώσσα	Ελληνικά
Άλλα στοιχεία	176 σ., ευρ.

Στατιστικά χρήσης

ΠΡΟΒΟΛΕΣ

Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΞΕΦΥΛΛΙΣΜΑΤΑ

Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΜΕΤΑΦΟΡΤΩΣΕΙΣ

Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

ΧΡΗΣΤΕΣ

Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)

Μέθοδοι μηχανικής μάθησης για αυτόματη ταξινόμηση κειμένων

Μέθοδοι και τεχνικές ανακάλυψης γνώσης στο σημαντικό ιστό: παραγωγική απόκτηση γνώσης από οντολογικά έγγραφα και η τεχνική της σημασιακής προσαρμογής

Κατηγοριοποίηση κειμένων

Πρώιμη ανίχνευση και αναγνώριση της αναπτυξιακής διαταραχής του ψυχοκινητικού συντονισμού σε παιδιά ηλικίας 4 - 8 ετών

Μέτρα ομοιότητας με εναλλακτικές μεθόδους για συστήματα συλλογιστικής των περιπτώσεων (Case Based Reasoning)

Automatic generation of natural language summaries

Σημασιολογική ανακάλυψη υπηρεσιών ιστού και συλλογιστική οντολογιών με συμπερασματικούς κανόνες

Ανακάλυψη γνώσης από ακολουθίες και δεδομένα συναλλαγών

Κατηγοριοποίηση και τμηματοποίηση κειμένων με χρήση μεθόδων υπολογιστικής νοημοσύνης

Επενδύσεις σε μηχανολογικό και λοιπό εξοπλισμό και η επίδρασή τους στην απόδοση των επιχειρήσεων

"Εξόρυξη και διαχείριση σημασιολογικής πληροφορίας στον παγκόσμιο ιστό"
	Πληκτρολογήστε το κείμενο της εικόνας!
Δηλώνω ότι έλαβα γνώση και ανεπιφύλακτα συμφωνώ και αποδέχομαι τους Όρους Χρήσης του Εθνικού Αρχείου Διδακτορικών Διατριβών, καθώς και της .