Περίληψη
Τα τελευταία χρόνια η εξελισσόμενη φύση των κοινωνικών δικτύων έχει οδηγήσει στην ταχεία ανάπτυξη του Διαδικτύου και παράλληλα στη ραγδαία αύξηση του όγκου των δεδομένων σε παγκόσμια κλίμακα. Η ανάγκη για πρόσβαση και ανάκτηση πληροφοριών σχετικά με τις προτιμήσεις των χρηστών είναι ένα ανοικτό πρόβλημα που εγείρει συνεχώς νέες προκλήσεις για την έρευνα. Η ερευνητική αυτή περιοχή ονομάζεται συστήματα συστάσεων και εστιάζει στη μοντελοποίηση και ανάλυση των δεδομένων ώστε να ανακτηθεί σχετική πληροφορία με βάση τις προτιμήσεις των χρηστών ώστε να προταθούν κάποιες νέες εναλλακτικές επιλογές. Η εξερεύνηση των μεγάλων όγκων δεδομένων από τα υπάρχοντα μοντέλα που αναφέρονται στη βιβλιογραφία δεν είναι επαρκής εξαιτίας της ακολουθούμενης κατανομής που κάνει την εξατομίκευση μια δύσκολη διαδικασία. Το πρόβλημα αυτό είναι γνωστό και ως “Cold start” κατά το οποίο γίνεται προσπάθεια να ανακτηθεί σχετική πληροφορία με βάση τις προτιμήσεις των χρηστών για τους οποίους η πληροφορία δεν είναι επαρκ ...
Τα τελευταία χρόνια η εξελισσόμενη φύση των κοινωνικών δικτύων έχει οδηγήσει στην ταχεία ανάπτυξη του Διαδικτύου και παράλληλα στη ραγδαία αύξηση του όγκου των δεδομένων σε παγκόσμια κλίμακα. Η ανάγκη για πρόσβαση και ανάκτηση πληροφοριών σχετικά με τις προτιμήσεις των χρηστών είναι ένα ανοικτό πρόβλημα που εγείρει συνεχώς νέες προκλήσεις για την έρευνα. Η ερευνητική αυτή περιοχή ονομάζεται συστήματα συστάσεων και εστιάζει στη μοντελοποίηση και ανάλυση των δεδομένων ώστε να ανακτηθεί σχετική πληροφορία με βάση τις προτιμήσεις των χρηστών ώστε να προταθούν κάποιες νέες εναλλακτικές επιλογές. Η εξερεύνηση των μεγάλων όγκων δεδομένων από τα υπάρχοντα μοντέλα που αναφέρονται στη βιβλιογραφία δεν είναι επαρκής εξαιτίας της ακολουθούμενης κατανομής που κάνει την εξατομίκευση μια δύσκολη διαδικασία. Το πρόβλημα αυτό είναι γνωστό και ως “Cold start” κατά το οποίο γίνεται προσπάθεια να ανακτηθεί σχετική πληροφορία με βάση τις προτιμήσεις των χρηστών για τους οποίους η πληροφορία δεν είναι επαρκής ώστε να μπορέσουν τα μοντέλα να τους συσχετίσουν με άλλους χρήστες, τοποθεσίες ή προϊόντα. Στο πρόβλημα αυτό θα πρέπει να εξετάσουμε τη δυναμική εξέλιξη των προτιμήσεων των χρηστών μεταξύ των χρονικών περιόδων, η οποία εναλλάσσει συνεχώς την ακρίβεια των μοντέλων πρόβλεψης. Από την άλλη πλευρά, υπάρχουν μοντέλα που ενσωματώνουν τη χρονική διάσταση της εναλλαγής των προτιμήσεων των χρηστών, αλλά πάσχουν από την εξατομίκευση των αποτελεσμάτων τους, καθώς είναι λιγοστές οι πληροφορίες για το ιστορικό των περισσότερων χρηστών. Αυτές οι προσεγγίσεις εστιάζουν μόνο στη χρονική επιρροή και αγνοούν την άμεση ή έμμεση πληροφορία που σχετίζεται με τους χρήστες. Κατά συνέπεια δεν μπορούν να επιλύσουν επαρκώς το πρόβλημα της πρόβλεψης για χρήστες με μικρό ιστορικό. Τέλος, υπάρχουν προσεγγίσεις που κλιμακώνουν την ευρωστία των προβλέψεων τους με την ενσωμάτωση γεωγραφική πληροφορίας αλλά πάσχουν από την αγνόηση τόσο της διάστασης του χρόνου όσο και της διάστασης της παράπλευρης πληροφορίας που σχετίζονται με τη συμπεριφορά των χρηστών. Τα περισσότερα από τα αναγραφόμενα στη βιβλιογραφία μοντέλα αγνοούν αυτή τη δυναμική με αποτέλεσμα να μειώνεται η ικανότητά τους να προσωποποιήσουν τις συστάσεις τους αλλά και ταυτόχρονα αδυνατούν να ξεπεράσουν το πρόβλημα του cold start. Με αυτή τη διατριβή, διερευνούμε την επίδραση όλων των προαναφερθέντων θεμάτων σχετικά με την προβλεψιμότητα των μοντέλων κατά την ανάκτηση των σχετικών πληροφοριών με το ιστορικό των χρηστών εξειδικεύoντας τις συστάσεις μας για κάθε μεμονωμένο χρήση ανεξαρτήτως του μεγέθους του ιστορικού του. Σε αυτό το πλαίσιο παρουσιάζονται 5 καινοτόμα μοντέλα συστάσεων που βελτιώνουν τις υπάρχουσες προσεγγίσεις, καθώς και ένας καινοτόμος τρόπος ταξινόμησης των μοντέλων βασιζόμενος στα δίκτυα πληροφορίας που χρησιμοποιούν.
περισσότερα
Περίληψη σε άλλη γλώσσα
Recent years, the evolving nature of social networks has led to the expeditious growth of the internet and the rapid increment of the data on a global scale. The need of accessing and retrieving relevant information close to users’ preferences is an open problem which continuously raises new challenges for recommender systems. To over come this problem many researchers focused on creating models that provide personalized recommendation in order to assist users making choices. In this context, a new research area in information systems has emerged over the last decades to respond to these challenges. This research area is called recommendation systems and focuses on modelling and analyzing data in order to retrieve relevant information based on users’ preferences and to suggest some new alternatives. The exploitation of information in large amounts with the existing models is not sufficient since power law distribution of the data causes sparsity problem and makes personalization a diff ...
Recent years, the evolving nature of social networks has led to the expeditious growth of the internet and the rapid increment of the data on a global scale. The need of accessing and retrieving relevant information close to users’ preferences is an open problem which continuously raises new challenges for recommender systems. To over come this problem many researchers focused on creating models that provide personalized recommendation in order to assist users making choices. In this context, a new research area in information systems has emerged over the last decades to respond to these challenges. This research area is called recommendation systems and focuses on modelling and analyzing data in order to retrieve relevant information based on users’ preferences and to suggest some new alternatives. The exploitation of information in large amounts with the existing models is not sufficient since power law distribution of the data causes sparsity problem and makes personalization a difficult task. More specifically, models predictions accuracy is higher for users with large past history than for users with a few interactions. This problem is also known as “Cold Start” according to which it is attempted to retrieve relevant information based on small past history and to associate these users with other users, locations or products. In this problem, we should also examine the dynamics of users’ preferences among time periods, which continuously alternate the precision of prediction models. On the other hand, there are models which consider users' preference dynamics but miss to personalize their recommendations since the past history information of most users is small. These approaches focus only on preference dynamics but lack the users' implicit and/or the explicit information. Thus, they can not adequately provide recommendations for users with short past history. Finally, there are approaches which increase their prediction robustness using geographical information but they miss the temporal dynamics and the side information related to the users. Most of the models in literature miss dynamics resulting to decrease their ability to personalize their recommendations and to solve the cold start problem. With this dissertation, I investigate the impact of all aforementioned issues on predictability of the models while retrieving relevant information to users’ past history independent of the amount of the past history record. To this context, we present 5 novel recommendation models which improve the state-of-the-art approaches, and a novel model taxonomy based on the participant information networks.
περισσότερα