Περίληψη
Η παρούσα διδακτορική διατριβή ασχολείται με τη μελέτη και ανάπτυξη τεχνικών διαλειτουργικότητας σχημάτων μεταδεδομένων, η οποία αποτελεί ένα ενεργό ερευνητικό πρόβλημα στο χώρο της διαχείρισης της πληροφορίας. Στο πλαίσιο της διατριβής δίνεται έμφαση στην ανάπτυξη τεχνικών διαλειτουργικότητας ανάμεσα σε πληροφοριακές πηγές που προέρχονται από συγκεκριμένους θεματικούς τομείς, στην εν λόγω περίπτωση, από τον τομέα των Ιδρυμάτων Πολιτιστικής Κληρονομιάς (αρχείων, βιβλιοθηκών, μουσείων, κέντρων τεκμηρίωσης, μορφωτικών ιδρυμάτων κτλ.).Στο συγκεκριμένο θεματικό τομέα παρατηρείται χρήση ποικίλων σχημάτων μεταδεδομένων σε εθνικό και διεθνές επίπεδο, ακόμα και σεπεριπτώσεις τεκμηρίωσης πληροφοριακών πηγών με κοινά χαρακτηριστικά. Τα Ιδρύματα Πολιτιστικής Κληρονομιάς διαθέτουν υλικό ποικίλου τύπου και υποστρώματος, όπως χειρόγραφα, έντυπη και ηλεκτρονική μουσική, χαρτογραφικό υλικό, περιοδικά δημοσιεύματα, βιβλία, αρχεία, συλλογές, ηλεκτρονικά τεκμήρια κτλ. Προκειμένου να καλυφθούν οι ανάγκες ...
Η παρούσα διδακτορική διατριβή ασχολείται με τη μελέτη και ανάπτυξη τεχνικών διαλειτουργικότητας σχημάτων μεταδεδομένων, η οποία αποτελεί ένα ενεργό ερευνητικό πρόβλημα στο χώρο της διαχείρισης της πληροφορίας. Στο πλαίσιο της διατριβής δίνεται έμφαση στην ανάπτυξη τεχνικών διαλειτουργικότητας ανάμεσα σε πληροφοριακές πηγές που προέρχονται από συγκεκριμένους θεματικούς τομείς, στην εν λόγω περίπτωση, από τον τομέα των Ιδρυμάτων Πολιτιστικής Κληρονομιάς (αρχείων, βιβλιοθηκών, μουσείων, κέντρων τεκμηρίωσης, μορφωτικών ιδρυμάτων κτλ.).Στο συγκεκριμένο θεματικό τομέα παρατηρείται χρήση ποικίλων σχημάτων μεταδεδομένων σε εθνικό και διεθνές επίπεδο, ακόμα και σεπεριπτώσεις τεκμηρίωσης πληροφοριακών πηγών με κοινά χαρακτηριστικά. Τα Ιδρύματα Πολιτιστικής Κληρονομιάς διαθέτουν υλικό ποικίλου τύπου και υποστρώματος, όπως χειρόγραφα, έντυπη και ηλεκτρονική μουσική, χαρτογραφικό υλικό, περιοδικά δημοσιεύματα, βιβλία, αρχεία, συλλογές, ηλεκτρονικά τεκμήρια κτλ. Προκειμένου να καλυφθούν οι ανάγκες τεκμηρίωσης αυτών των τύπων υλικού εφαρμόζονται διάφορα XML σχήματα μεταδεδομένων, όπως είναι το Encoded Archival Description (EAD), το Metadata Object Description Schema (MODS), το Dublin Core (DC) και τα διάφορα Προφίλ Εφαρμογής του, τα MARC κτλ. Η ανάγκη ενιαίας διαχείρισης αυτών των σχημάτων μεταδεδομένων στα πλαίσια των Ψηφιακών Βιβλιοθηκών, των Ψηφιακών Αποθετηρίων και των Συλλογικών Καταλόγων ανάγει την επίτευξη της διαλειτουργικότητας σε βασικό ζήτημα.Βασική ερευνητική συνεισφορά της διατριβής αποτελεί ο ορισμός αρχιτεκτονικής ολοκλήρωσης των σχημάτων μεταδεδομένων με τη χρήση της οντολογίας CIDOC Conceptual Reference Model (CIDOC CRM). Στο πλαίσιο της αρχιτεκτονικής αυτής η οντολογία CIDOC CRM, η οποία είναι μία οντολογία πυρήνα για την εννοιολογική αναπαράσταση της πολιτισμικής πληροφορίας, αποτελεί βασικό συστατικό μέρος και καλείται να παίξει διάφορους ρόλους ανάλογα με το σενάριο ολοκλήρωσης στο οποίο μετέχει. Εκτός της CIDOC CRM, επιπλέον συστατικά μέρη της εν λόγω αρχιτεκτονικής αποτελούν οι προς ολοκλήρωση τοπικές πηγές XML δεδομένων που προέρχονται από τα Ιδρύματα Πολιτιστικής Κληρονομιάς (και είναι συχνά κωδικοποιημένες με διαφορετικά XML σχήματα μεταδεδομένων), καθώς και οι σημασιολογικές απεικονίσεις ανάμεσα στην οντολογία και τις τοπικές XML πηγές και ανάμεσα στις ίδιες τις τοπικές XML πηγές.Για την έκφραση των σημασιολογικών απεικονίσεων ανάμεσα στα XML σχήματα μεταδεδομένων και την οντολογία CIDOC CRM προτείνεται η Γλώσσα Περιγραφής Απεικονίσεων (ΓΠΑ), η οποία ορίζει τυποποιημένους κανόνες. Οι συγκεκριμένοι κανόνες έχουν τη μορφή μονοπατιών, εφόσον τόσο τα σχήματα μεταδεδομένων όσο και η οντολογία εκφράζονται μέσα από μονοπάτια. Συγκεκριμένα, τα σχήματα μεταδεδομένων εκφράζονται μέσα από αλληλουχίες XML κόμβων και τα μέρη της οντολογίας μέσα από δυαδικές σχέσεις ανάμεσα σε κλάσεις, οι οποίες εμφανίζονται με τη μορφή “κλάση – ιδιότητα – κλάση” ή αλληλουχίες αυτών. Αξιοποιώντας τη ΓΠΑ, ορίζονται οι σημασιολογικές απεικονίσεις ανάμεσα στο EAD και τη CIDOC CRM. Οι συγκεκριμένες απεικονίσεις περιλαμβάνουν εκτός των απεικονίσεων των πεδίων του σχήματος μεταδεδομένων σε μονοπάτια της οντολογίας, την πλήρη σημασιολογική απεικόνιση των εννοιών του αρχείου και της αρχειακής περιγραφής στη CIDOC CRM και την έκφραση των πολύπλοκων μεταξύ τους σχέσεων μέσα από τυποποιημένους κανόνες. Παράλληλα, ορίζεται η απεικόνιση προς τη CIDOC CRM της πολύπλοκης ιεραρχικής δομής της αρχειακή περιγραφής και της κληρονομικότητας της περιγραφής που τη διέπει, καθώς αποτελούν βασικά χαρακτηριστικά της αρχειακής περιγραφής, αξιοποιώντας κανόνες εκφρασμένους μέσα από τη γλώσσα Semantic Web Rule Language (SWRL).Επιπλέον, οι κανόνες που ορίζονται μέσα από τη ΓΠΑ (και ονομάζονται Κανόνες Περιγραφής Απεικονίσεων, ΚΠΑ) μπορούν να αξιοποιηθούν σε διαδικασίες μεταφοράς μεταδεδομένων από τις διάφορες τοπικές πηγές προς την οντολογία, καθώς και σε διαδικασίες μετασχηματισμού ερωτημάτων που απευθύνονται σε κάποιο XML σχήμα μεταδεδομένων σε ισοδύναμα ερωτήματα που απευθύνονται στη CIDOC CRM. Ως εκ τούτου, προτείνεται συγκεκριμένη μέθοδος ερμηνείας τους για τη μετατροπή των δεδομένων, τα οποία βρίσκονται αποθηκευμένα σε πηγές που ακολουθούν ένα συγκεκριμένο XML σχήμα μεταδεδομένων προς τη CIDOC CRM. Στο πλαίσιο της παρουσίασης της συγκεκριμένης μεθόδου, γίνεται χρήση μέρους των ΚΠΑ που έχουν οριστεί ανάμεσα στο EAD και τη CIDOC CRM. Αναφορικά με τις διαδικασίες μετασχηματισμού ερωτημάτων, στο πλαίσιο της προτεινόμενης αρχιτεκτονικής υιοθετείται η γλώσσα XPath για τα ερωτήματα στις XML πηγές, ενώ για τη διατύπωση ερωτημάτων στην οντολογία CIDOC CRM υιοθετείται μία σύνταξη βασισμένη στη γλώσσα ερωτημάτων RQL, η οποία ονομάζεται RQL-like σύνταξη. Συνεπώς, ο αλγόριθμος μετασχηματισμού ερωτημάτων που προτείνεται ορίζει το μετασχηματισμό των XPath ερωτημάτων σε RQL-like ερωτήματα, λαμβάνοντας υπόψη τους ΚΠΑ που έχουν οριστεί ανάμεσα στο εκάστοτε XML σχήμα μεταδεδομένων και τη CIDOC CRM. Και σε αυτήν τη μέθοδο, γίνεται χρήση μέρους των ΚΠΑ που έχουν οριστεί ανάμεσα στο EAD και τη CIDOC CRM.
περισσότερα
Περίληψη σε άλλη γλώσσα
The doctoral thesis studies and develops metadata schemas' interoperability methods, since this is an open research problem in the field of information management. In the thesis, emphasis is given to the development of techniques needed to promote interoperability between cultural heritage information sources (coming from archival institutions, libraries, museums, documentation centers, educational institutions etc.). In the cultural heritage domain, the use of multiple metadata schemas is observed in a national and international level, even for the description of resources that have common characteristics. The Cultural Heritage Institutions have in their possession material of different types and formats, such as manuscripts, printed and electronic music, cartographic material, serial publications, books, archives, collections, electronic resources etc. In order to cope with the documentation needs of this material, the institutions apply various XML metadata schemas, such as the Enc ...
The doctoral thesis studies and develops metadata schemas' interoperability methods, since this is an open research problem in the field of information management. In the thesis, emphasis is given to the development of techniques needed to promote interoperability between cultural heritage information sources (coming from archival institutions, libraries, museums, documentation centers, educational institutions etc.). In the cultural heritage domain, the use of multiple metadata schemas is observed in a national and international level, even for the description of resources that have common characteristics. The Cultural Heritage Institutions have in their possession material of different types and formats, such as manuscripts, printed and electronic music, cartographic material, serial publications, books, archives, collections, electronic resources etc. In order to cope with the documentation needs of this material, the institutions apply various XML metadata schemas, such as the Encoded Archival Description (EAD), the Metadata Object Description Schema (MODS), the Dublin Core (DC) and its Application Profiles, the MARC etc. In order to manage this material in an integrated way in Digital Libraries, Digital Repositories and Unified Catalogues, a solution to the interoperability problem must be found. The main contribution of this dissertation is the definition of a metadata schemas' integration architecture based on the CIDOC Conceptual Reference Model (CRM). As part of this architecture, the CIDOC CRM, which is a core ontology that conceptualizes the cultural heritage information, is the basic component and has different roles, depending on the integration scenario it participates. The other components of the architecture are the XML local sources that have to be integrated and that come from various Cultural Heritage Institutions (encoded in different XML schemas), and the semantic mappings defined between the local sources and/or between the ontology and the local sources. Aiming to express the semantic mappings via formal rules between the XML metadata schemas and the CIDOC CRM ontology, the Mapping Description Language (MDL) is proposed. These rules are formed through paths, given that both the ontology and the metadata schemas are expressed in the form of paths. In detail, the metadata schemas are expressed through XML nodes' concatenations and the ontology's parts are expressed through paths of the form “class - property – class” or concatenations of them. Through the use of MDL, the semantic mappings of the EAD to the CIDOC CRM are expressed. These mappings include, apart from the semantic mappings of the metadata schema's fields to the ontology's paths, the complete semantic representation of the archive's and the archival description's concepts to the ontology. Moreover, it also includes the expression of their in between complex relations through formally defined rules. In parallel, the complex hierarchical and multi-level archival description and the inheritance of information are also expressed to the CIDOC CRM via the Semantic Web Rule Language (SWRL), since both of them are the main characteristics of the archival description. Additionally, the rules defined in MDL (called Mapping Description Rules, MDR) can also be used for data transferring between the local sources and the ontology, and, also, for query rewriting of the queries expressed over the local sources to queries expressed over the ontology. Hence, an algorithm is proposed for transferring the data that are stored in the local sources and are encoded in a specific XML metadata schema, to the CIDOC CRM ontology. As part of this algorithm, the EAD to CIDOC CRM mappings defined in MDL are used as an example. Furthermore, an algorithm for query rewriting is presented, based on the assumption that the queries over the XML local sources are expressed in XPath and the queries over the CIDOC CRM ontology are expressed in an RQL-like syntax. Hence, the algorithm rewrites XPath queries to RQL-like queries, taking into consideration the EAD to CIDOC CRM mappings defined in MDL.
περισσότερα