Περίληψη
Τα τελευταία χρόνια, ο Παγκόσμιος Ιστός (World Wide Web) έχει αναδειχθεί ως ένα από τα κυριότερα μέσα πληροφόρησης. Παρόλα αυτά, οι χρήστες πολλές φορές δυσκολεύονται να βρουν τις πληροφορίες που αναζητούν, λόγω του μεγάλου όγκου πληροφοριών σε συνδυασμό με τη δυναμική και ετερογενή φύση του ιστού. Γι’ αυτόν τον λόγο, πολλοί δικτυακοί τόποι παρέχουν εξατομικευμένες προτάσεις προς τους χρήστες τους. Οι περισσότερες ερευνητικές προσπάθειες στην περιοχή της εξατομίκευσης δικτυακών τόπων (web personalization) συνδέονται με την εξέλιξη της έρευνας στην περιοχή της εξόρυξης γνώσης από τα δεδομένα χρήσης του ιστού (web usage mining), με άλλα λόγια την ανακάλυψη και επεξεργασία των προτύπων πλοήγησης (navigational patterns) των επισκεπτών ενός δικτυακού τόπου. Εντούτοις, πολύτιμα δεδομένα και εννοιολογικά συναφή με αυτά που τελικά προτείνονται στον χρήστη μπορεί να μη συμπεριληφθούν κατά τη διαδικασία παραγωγής προτάσεων όταν ένα σύστημα εξατομίκευσης δικτυακών τόπων βασίζεται μόνο στα δεδομέν ...
Τα τελευταία χρόνια, ο Παγκόσμιος Ιστός (World Wide Web) έχει αναδειχθεί ως ένα από τα κυριότερα μέσα πληροφόρησης. Παρόλα αυτά, οι χρήστες πολλές φορές δυσκολεύονται να βρουν τις πληροφορίες που αναζητούν, λόγω του μεγάλου όγκου πληροφοριών σε συνδυασμό με τη δυναμική και ετερογενή φύση του ιστού. Γι’ αυτόν τον λόγο, πολλοί δικτυακοί τόποι παρέχουν εξατομικευμένες προτάσεις προς τους χρήστες τους. Οι περισσότερες ερευνητικές προσπάθειες στην περιοχή της εξατομίκευσης δικτυακών τόπων (web personalization) συνδέονται με την εξέλιξη της έρευνας στην περιοχή της εξόρυξης γνώσης από τα δεδομένα χρήσης του ιστού (web usage mining), με άλλα λόγια την ανακάλυψη και επεξεργασία των προτύπων πλοήγησης (navigational patterns) των επισκεπτών ενός δικτυακού τόπου. Εντούτοις, πολύτιμα δεδομένα και εννοιολογικά συναφή με αυτά που τελικά προτείνονται στον χρήστη μπορεί να μη συμπεριληφθούν κατά τη διαδικασία παραγωγής προτάσεων όταν ένα σύστημα εξατομίκευσης δικτυακών τόπων βασίζεται μόνο στα δεδομένα χρήσης του ιστού. Επιπλέον, με αυτή τη προσέγγιση παραμελούνται συχνά και τα δομικά χαρακτηριστικά του δικτυακού τόπου. Σε αυτή τη διατριβή, προτείνουμε νέες τεχνικές οι οποίες χρησιμοποιούν τη σημασιολογία του περιεχομένου (content semantics) και τα δομικά χαρακτηριστικά ενός δικτυακού τόπου για να βελτιώσουν την αποτελεσματικότητα της εξατομίκευσης του. Στο πρώτο μέρος αυτής της δουλειάς παρουσιάζουμε το SEWeP (SEmantic Web Personalization), ένα σύστημα εξατομίκευσης το οποίο ενσωματώνει τα σημασιολογικά χαρακτηριστικά του περιεχομένου, εκφρασμένα με όρους που ανήκουν σε μια οντολογία, με τα δεδομένα χρήσης, ώστε να δημιουργήσει σημασιολογικά εμπλουτισμένα πρότυπα πλοήγησης και ως εκ τούτου πιο χρήσιμες προτάσεις (recommendations) για τους χρήστες. Απ’ όσο γνωρίζουμε, το SEWeP είναι το μόνο σημασιολογικό σύστημα εξατομίκευσης το οποίο μπορεί να χρησιμοποιηθεί από οποιονδήποτε δικτυακό τόπο. Στο δεύτερο μέρος της διατριβής, προτείνουμε μια πρωτότυπη προσέγγιση που στοχεύει στη βελτίωση της ποιότητας των προτάσεων, βασισμένη στην υποκείμενη δομή του δικτυακού τόπου. Παρουσιάζουμε τον UPR (Usage-based PageRank), έναν αλγόριθμο που ανήκει στην οικογένεια του PageRank, ο οποίος χρησιμοποιεί τα δεδομένα χρήσης σε συνδυασμό με τεχνικές ανάλυσης υπερσυνδέσμων (link analysis techniques). Ο αλγόριθμος αυτός εφαρμόζεται σε μια αναπαράσταση των συνεδριών των χρηστών (user sessions) την οποία ονομάζουμε Γράφο Πλοήγησης (Navigational Graph) προκειμένου να προσδιορίσει την σημαντικότητα μιας δικτυακής σελίδας. Χρησιμοποιώντας το προτεινόμενο πλαίσιο, αναπτύσσουμε τον l-UPR, έναν αλγόριθμο παραγωγής προτάσεων ο οποίος βασίζεται σε μια «τοπική» παραλλαγή του UPR, η οποία εφαρμόζεται στον εξατομικευμένο υπο-γράφο πλοήγησης κάθε χρήστη. Επιπρόσθετα, ενσωματώνουμε τον UPR και τις παραλλαγές του σε ένα υβριδικό πιθανοτικό μοντέλο πρόβλεψης, για τον υπολογισμό των αρχικών (prior) πιθανοτήτων επίσκεψης των σελίδων. Μέσα από μια σειρά πειραμάτων, αποδεικνύουμε ότι η προτεινόμενη προσέγγιση έχει ως αποτέλεσμα πιο αντικειμενικές και αντιπροσωπευτικές προβλέψεις σε σχέση με ήδη υπάρχουσες τεχνικές που βασίζονται μόνο σε δεδομένα χρήσης.
περισσότερα
Περίληψη σε άλλη γλώσσα
The impact of the World Wide Web as a main source of information acquisition is increasing dramatically. The existence of such abundance of information, in combination with the dynamic and heterogeneous nature of the web, makes web site exploration a difficult process for the average user. To address the requirement of effective web navigation, web sites provide personalized recommendations to the end users. Most of the research efforts in web personalization correspond to the evolution of extensive research in web usage mining, i.e. the exploitation of the navigational patterns of the web site’s visitors. When a personalization system relies solely on usage-based results, however, valuable information conceptually related to what is finally recommended may be missed. Moreover, the structural properties of the web site are often disregarded. In this thesis, we propose novel techniques that use the content semantics and the structural properties of a web site in order to improve the eff ...
The impact of the World Wide Web as a main source of information acquisition is increasing dramatically. The existence of such abundance of information, in combination with the dynamic and heterogeneous nature of the web, makes web site exploration a difficult process for the average user. To address the requirement of effective web navigation, web sites provide personalized recommendations to the end users. Most of the research efforts in web personalization correspond to the evolution of extensive research in web usage mining, i.e. the exploitation of the navigational patterns of the web site’s visitors. When a personalization system relies solely on usage-based results, however, valuable information conceptually related to what is finally recommended may be missed. Moreover, the structural properties of the web site are often disregarded. In this thesis, we propose novel techniques that use the content semantics and the structural properties of a web site in order to improve the effectiveness of web personalization. In the first part of our work we present SEWeP (standing for SEmantic Web Personalization), a personalization system that integrates usage data with content semantics, expressed in ontology terms, in order to compute semantically enhanced navigational patterns and effectively generate useful recommendations. To the best of our knowledge, SEWeP is the only semantic web personalization system that may be used by non-semantic web sites. In the second part of our work, we present a novel approach for enhancing the quality of recommendations based on the underlying structure of a web site. We introduce UPR (Usage-based PageRank), a PageRank-style algorithm that relies on the recorded usage data and link analysis techniques. UPR is applied on an abstraction of the user sessions termed Navigational Graph in order to determine the importance of a web page. We develop l-UPR, a recommendation algorithm based on a localized variant of UPR that is applied to the personalized navigational sub-graph of each user. Moreover, we integrate UPR and its variations in a hybrid probabilistic predictive model as a robust mechanism for determining prior probabilities of page visits. Overall, we demonstrate that our proposed hybrid personalization framework results in more objective and representative predictions than existing techniques that rely solely on usage data.
περισσότερα