Optimizing query answering over expressive ontological knowledge

Στη διατριβή αυτή έχουν αναπτυχθεί τεχνικές βελτιστοποίησης για την απάντηση συζευκτικών ερωτημάτων που τίθενται σεβάσεις γνώσης περιγραφικής λογικής. Με βάση το σύστημα συνεπαγωγής άμεσης σημασιολογίας OWL της SPARQLδημιουργήθηκε μια γλώσσα συζευκτικών ερωτημάτων, η οποία επιτρέπει τη χρήση μεταβλητών στη θέση εννοιών και ρόλωνεκτός από τη θέση στιγμιοτύπων, και αναπτύχθηκε ένας αλγόριθμος απάντησης ερωτημάτων στη γλώσσα αυτή.Στη συνέχεια αναπτύχθηκε μια τεχνική για την εύρεση μιας όσο το δυνατόν πιο αποδοτικής σειράς εκτέλεσης των ατόμωνενός (συζευκτικού) ερωτήματος. Σύμφωνα με την τεχνική αυτή τα άτομα ενός ερωτήματος ταξινομούνται με βάση το κόστοςεκτέλεσής τους. Ο υπολογισμός του κόστους ενός ατόμου στηρίζεται σε πληροφορία σχετική με τα στιγμιότυπα των εννοιώνκαι ρόλων της υπό εξέταση οντολογίας η οποία εξάγεται από ένα αρχικό μοντέλο που κατασκευάζεται από μια OWL μηχανήσυλλογιστικής. Παρουσιάζεται ένας στατικός και ένας δυναμικός αλγόριθμος ταξινόμησης που χρησιμοποιούν αυτά τα κόστηγια να βρουν βέλτιστες ή σχεδόν βέλτιστες σειρές εκτέλεσης των ατόμων των ερωτημάτων. Στην περίπτωση του δυναμικούαλγορίθμου, χρησιμοποιείται μια τεχνική συσταδοποίησης στιγμιοτύπων και υπολογίζονται οι συναρτήσεις κόστους με βάσητο πολύ ένα στιγμιότυπο από καθεμιά από τις συστάδες. Στη συνέχεια προτείνονται τεχνικές επανεγγραφής ερωτημάτων καιαναλύεται πως μπορούν να χρησιμοποιηθούν ειδικές λειτουργίες των OWL μηχανών συλλογιστικής και η ιεραρχία εννοιώνκαι ρόλων της υπό εξέταση οντολογίας για τη μείωση του χρόνου απάντησης ερωτημάτων. Οι τεχνικές αυτές είναι ιδιαίτεραχρήσιμες για την αξιολόγηση ατόμων ερωτημάτων που περιέχουν μεταβλητές στη θέση εννοιών και ρόλων.Η αποτελεσματικότητα των προτεινόμενων τεχνικών αξιολογείται χρησιμοποιώντας πρότυπα σύνολα ελέγχου. Από τηνπειραματική αυτή μελέτη προκύπτει ότι ο στατικός αλγόριθμος ταξινόμησης συνήθως υπερτερεί του δυναμικού ότανχρησιμοποιείται για ερωτήματα για τα οποία έχουμε ακριβείς πληροφορίες/στατιστικές από την αρχή. Για ερωτήματα πουτίθενται σε μη ντετερμινιστικές οντολογίες (οντολογίες με διαζευκτική πληροφορία) και περιέχουν πολλά άτομα για τα οποίαδεν είναι δυνατή η εξαγωγή ακριβών στατιστικών εκ των προτέρων, ο δυναμικός αλγόριθμος είναι πιο αποδοτικός. Η χρήσητεχνικών συσταδοποίησης οδηγεί σε βελτίωση της απόδοσης για ερωτήματα με μεγάλο πλήθος αποτελεσμάτων. Για τέτοιασύνθετα ερωτήματα οι τεχνικές αυτές μπορούν να οδηγήσουν σε βελτίωση μέχρι και τρεις τάξεις μεγέθους. Στο τέλοςακολουθεί μια περιγραφή του τρόπου που μπορούν να χρησιμοποιηθούν οι προτεινόμενες τεχνικές και το αναπτυγμένοσύστημα σε μια πραγματική εφαρμογή σημασιολογικής αναζήτησης πολιτιστικών αντικειμένων.

περισσότερα

Περίληψη σε άλλη γλώσσα

Query answering over ontologies, i.e., the computation of answers to user queriesbased not only on explicitly stated information but also on implicit knowledge is animportant task in the context of the Semantic Web. In this direction, the SPARQLquery language has recently been extended by the World Wide Web Consortium(W3C) with so-called entailment regimes. An entailment regime defines how queriesare evaluated under more expressive semantics than SPARQL’s standard simpleentailment, which is based on subgraph matching.In this thesis we describe a sound and complete algorithm for the OWL DirectSemantics entailment regime of SPARQL (SPARQL-OWL). The proposed SPARQLOWLqueries are very expressive since variables can occur within complex conceptsand can also bind to concept or role names apart from individuals. Initially, wepresent a cost-based query planning strategy for SPARQL queries issued over anOWL ontology. The costs of the model are based on information about the instancesof concepts and roles that are extracted from a model abstraction built byan OWL reasoner. A static and a dynamic algorithm are presented which use thesecosts to find optimal or near optimal execution orders for the templates of a query.For the dynamic case, we improve the performance by exploiting an individual clusteringapproach that allows for computing the cost functions based on one individualsample per cluster. Afterwards, we propose optimizations that target particularlythe complex queries that are allowed in SPARQL-OWL. These optimizations exploitquery rewriting techniques and the concept and role hierarchies to efficiently answersuch queries.The proposed algorithm and optimizations have been implemented in a systemcalled OWL-BGP. Our experimental study, using this system, shows that thestatic ordering usually outperforms the dynamic one when accurate statistics areavailable. This changes, however, when the statistics are less accurate, e.g., dueto non-deterministic reasoning decisions. For complex SPARQL-OWL queries weobserve an improvement of up to three orders of magnitude due to the proposedoptimizations. Finally, we show that the implemented system works well in a realworld application about cultural heritage data.

περισσότερα

Διαβάστε τη διατριβή (Online)

Κατεβάστε τη διατριβή σε μορφή PDF (2.41 MB) (Η υπηρεσία είναι διαθέσιμη μετά από δωρεάν εγγραφή)

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI	10.12681/eadd/39509
Διεύθυνση Handle	http://hdl.handle.net/10442/hedi/39509
ND	39509
Εναλλακτικός τίτλος	Optimizing query answering over expressive ontological knowledge
Συγγραφέας	Κόλλια, Ηλιάννα (Πατρώνυμο: Στέφανος)
Ημερομηνία	2014
Ίδρυμα	Εθνικό Μετσόβιο Πολυτεχνείο (ΕΜΠ). Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών
Εξεταστική επιτροπή	Σταφυλοπάτης Ανδρέας-Γεώργιος Glimm Birte Στάμου Γεώργιος Τσανάκας Παναγιώτης Κουμπαράκης Μανώλης Κοντογιάννης Κωνσταντίνος Horrocks Ian
Επιστημονικό πεδίο	Φυσικές Επιστήμες ➨ Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική Επιστήμες Μηχανικού και Τεχνολογία ➨ Επιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ
Λέξεις-κλειδιά	SPARQL απάντηση ερωτημάτων; Σύστημα συνεπαγωγής OWL 2 άμεσης σημασιολογίας; Βελτιστοποίηση ερωτημάτων
Χώρα	Ελλάδα
Γλώσσα	Αγγλικά
Άλλα στοιχεία	xi, 134 σ., εικ., πιν., σχημ.

Στατιστικά χρήσης

ΠΡΟΒΟΛΕΣ

Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΞΕΦΥΛΛΙΣΜΑΤΑ

Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΜΕΤΑΦΟΡΤΩΣΕΙΣ

Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

ΧΡΗΣΤΕΣ

Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)

Το στοιχείο της βίας στο σύγχρονο αμερικάνικο κινηματογράφο (1992-2007)

Η βία στο σύγχρονο γαλλικό θέατρο: το παράδειγμα του Κολτές

Η ΚΟΙΝΩΝΙΚΗ ΘΕΣΗ ΤΩΝ ΓΥΝΑΙΚΩΝ ΣΤΟ ΕΡΓΟ ΤΟΥ Α. ΠΑΠΑΔΙΑΜΑΝΤΗ

Ο ηθικός λόγος στη ρητορική του Αριστοτέλη: διδακτική προσέγγιση στην εκπαιδευτική αγωγή και διαμεσολάβηση

Kant και Wittgenstein: από την κριτική της γνώσης στην κριτική του νοήματος

Η ψηφιακή αφήγηση (digital storytelling) ως διδακτικό εργαλείο στο μάθημα της λογοτεχνίας

Το εθνογραφικό στοιχείο στην σύγχρονη δημιουργική φωτογραφία

Η Επτανησιακή Σχολή ζωγραφικής: αναθεώρηση

Πορτρέτα κοσμικών δωρητών στην εντοίχια ζωγραφική του Αγίου Όρους (14ος-αρχές 16ου αιώνα): η ιστορική και η ιδεολογική διάσταση της εικονογραφίας του ορθόδοξου ηγεμόνα στο αθωνικό περιβάλλον

Ουσία και μορφή στον κινηματογράφο

"Βελτιστοποίηση απάντησης ερωτημάτων σε εκφραστική οντολογική γνώση"
	Πληκτρολογήστε το κείμενο της εικόνας!
Δηλώνω ότι έλαβα γνώση και ανεπιφύλακτα συμφωνώ και αποδέχομαι τους Όρους Χρήσης του Εθνικού Αρχείου Διδακτορικών Διατριβών, καθώς και της .