Περίληψη
Προσωπικά δεδομένα είναι οποιαδήποτε πληροφορία μπορεί να χρησιμοποιηθεί για την αναγνώριση ενός ατόμου. Αυτά τα δεδομένα μπορούν να λάβουν διάφορες μορφές, όπως ένα πεδίο σε μια βάση δεδομένων, έναν μοναδικό αριθμό, μια φωτογραφία ή ένα πακέτο δικτύου. Τα προσωπικά δεδομένα σχετικά με τα άτομα συλλέγονται και διαχειρίζονται από οργανισμούς στον ιδιωτικό και δημόσιο τομέα. Οι επιχειρήσεις και η επιστημονική κοινότητα έχουν μια ακόρεστη δίψα για δεδομένα. Με τους προηγμένους αλγόριθμους εξόρυξης δεδομένων νέα γνώση μπορεί να αποκαλυφθεί από αυτά τα δεδομένα. Πρέπει να σημειωθεί ότι αυτά τα δεδομένα δεν μπορούν να δημοσιευθούν χωρίς την δέουσα προσοχή αφού υπάρχει πάντα ο κίνδυνος παραβίασης της ιδιωτικής ζωής των ατόμων. Ένας επιστημονικός τομέας αναδείχθηκε, αυτός της ανωνυμοποίησης δεδομένων, για να καλύψει την ανάγκη της προστασίας της ιδιωτικότητας σε δεδομένα που δημοσιεύονται. Η διαδικασία της ανωνυμοποίησης θα πρέπει να εξισορροπήσει την προστασία της ιδιωτικότητας των ατόμων με ...
Προσωπικά δεδομένα είναι οποιαδήποτε πληροφορία μπορεί να χρησιμοποιηθεί για την αναγνώριση ενός ατόμου. Αυτά τα δεδομένα μπορούν να λάβουν διάφορες μορφές, όπως ένα πεδίο σε μια βάση δεδομένων, έναν μοναδικό αριθμό, μια φωτογραφία ή ένα πακέτο δικτύου. Τα προσωπικά δεδομένα σχετικά με τα άτομα συλλέγονται και διαχειρίζονται από οργανισμούς στον ιδιωτικό και δημόσιο τομέα. Οι επιχειρήσεις και η επιστημονική κοινότητα έχουν μια ακόρεστη δίψα για δεδομένα. Με τους προηγμένους αλγόριθμους εξόρυξης δεδομένων νέα γνώση μπορεί να αποκαλυφθεί από αυτά τα δεδομένα. Πρέπει να σημειωθεί ότι αυτά τα δεδομένα δεν μπορούν να δημοσιευθούν χωρίς την δέουσα προσοχή αφού υπάρχει πάντα ο κίνδυνος παραβίασης της ιδιωτικής ζωής των ατόμων. Ένας επιστημονικός τομέας αναδείχθηκε, αυτός της ανωνυμοποίησης δεδομένων, για να καλύψει την ανάγκη της προστασίας της ιδιωτικότητας σε δεδομένα που δημοσιεύονται. Η διαδικασία της ανωνυμοποίησης θα πρέπει να εξισορροπήσει την προστασία της ιδιωτικότητας των ατόμων με τη χρησιμότητα του δημοσιευμένου συνόλου δεδομένων. Αυτές οι τεχνικές ανωνυμοποίησης αναλύονται και παρουσιάζονται τα πλεονεκτήματα και μειονεκτήματα τους. Η συμβολή αυτής της διατριβής στο επιστημονικό πεδίο της δημοσίευσης δεδομένων είναι διττή. Πρώτον, την εισαγωγή μιας νέας επίθεσης σε ανωνυμοποιημένα δεδομένα, που ονομάζεται επίθεση συμπερασμού των οιονεί αναγνωριστικών, inference of QI attack, που δείχνει ότι μια αυτοματοποιημένη λύση ανωνυμοποίησης, ειδικά για ιατρικά δεδομένα, είναι δύσκολο να επιτευχθεί χωρίς να ληφθεί υπόψη η σημασιολογία των δεδομένων και χωρίς την συμβολή των εμπειρογνωμόνων του τομέα. Δεύτερον, η ανάπτυξη ενός νέου αλγορίθμου που υλοποιεί km-anonymisation λαμβάνοντας υπόψη τις ιδιότητες των συνεχών χαρακτηριστικών και χωρίς να προαπαιτεί μια ιεραρχία γενίκευσης. Μετά από διεξαγωγή πειραμάτων φαίνεται ότι ο νέος αλγόριθμός διατηρεί περισσότερες πληροφορίες στο δημοσιευμένο σύνολο δεδομένων σε σύγκριση με άλλους αλγόριθμους ανωνυμοποίησης που χρησιμοποιούν ιεραρχίες γενίκευσης. Τα πολυμέσα είναι ένας άλλος τύπος προσωπικών δεδομένων που επίσης εξετάστηκε σε αυτή την έρευνα. Συγκεκριμένα από τα πολυμέσα που διαμοιράζονται στα Online Κοινωνικά Δίκτυα προκύπτουν πολλοί κίνδυνοι ιδιωτικότητας. Παρουσιάζεται μια αναλυτική έρευνα για τους κινδύνους αυτούς και προτείνεται μια λύση με βάση την ψηφιακή υδατογράφηση για την εξάλειψη πολλών από αυτούς τους κινδύνους. Τα έξυπνα τηλέφωνα με την συνεχώς αυξανόμενη υπολογιστική δύναμη συνδυάζονται με αισθητήρες, όπως το GPS, προσφέροντας νέες ευκαιρίες για ανάπτυξη κινητών εφαρμογών με νέες δυνατότητες. Για να δείξουμε πώς μπορεί να παραβιαστεί το απόρρητο ενός χρήστη, επικεντρώσαμε την προσοχή μας σε έναν τομέα ευαίσθητο στην ιδιωτικότητα των εφαρμογών, των εφαρμογών που χρονολογούνται. Η έρευνα βασίζεται στα μεταδιδόμενα πακέτα δικτύου και τα αποτελέσματα είναι ανησυχητικά.
περισσότερα
Περίληψη σε άλλη γλώσσα
Personal data is any information that can be used to identify a person. These data can take different forms such as a field in a database, a unique number, a photograph or a network packet. Personal data about individuals is collected and manage from organizations in private and public sector. Businesses and the scientific community are both hungry for data. With the advanced algorithms of data mining original knowledge can be revealed from this data. Therefore, these data cannot be disseminated carelessly because the danger of breaching individuals’ privacy is always present. A scientific area of data anonymisation was emerged to protect the privacy and several methods have been proposed to guarantee data privacy in published datasets. There is a trade-off to apply anonymisation algorithms. The anonymisation process should balance between the protection of the privacy of the individuals and the usefulness of the released dataset. These anonymisation technics are analyzed and their str ...
Personal data is any information that can be used to identify a person. These data can take different forms such as a field in a database, a unique number, a photograph or a network packet. Personal data about individuals is collected and manage from organizations in private and public sector. Businesses and the scientific community are both hungry for data. With the advanced algorithms of data mining original knowledge can be revealed from this data. Therefore, these data cannot be disseminated carelessly because the danger of breaching individuals’ privacy is always present. A scientific area of data anonymisation was emerged to protect the privacy and several methods have been proposed to guarantee data privacy in published datasets. There is a trade-off to apply anonymisation algorithms. The anonymisation process should balance between the protection of the privacy of the individuals and the usefulness of the released dataset. These anonymisation technics are analyzed and their strong and weak points are highlighted. The contribution of this thesis on data publishing scentific field is twofold. First, the introduction of a new attack on anonymised data, called inference of QIs attack}, which shows that an automated anonymisation solution, especially for medical records, is difficult without taking into account the semantics of the data and without consulting experts in this field. Second, the development of an algorithm which implements the km-anonymisation by taking into account the properties of continuous attributes and without giving a generalisation hierarchy. We conduct experiments which show that our algorithm preserves more information in the published dataset in comparison to other anonymisation algorithms that use generalisation hierarchy trees. Multimedia is another type of personal data that also examined in this research. From multimedia that is shared on Online Social Networks derives multiple privacy risks. An analytic survey of these risks is presented and a solution based on digital watermarking has been proposed towards to elimination of many of these risks. Smartphones increasing compute capabilities are paired with sensors, such as GPS, offering new opportunities to develop mobile applications with new potentials. To demonstrate how the privacy of a user can be breached we focused on a privacy-sensitive domain of apps, the dating apps. The research is based on the transmitted network packets and the results are worrying.
περισσότερα