Επεξεργασία παράλληλου ερωτήματος για περιβάλλοντα cloud computing

Περίληψη

Μαζικά σύνολα δεδομένων με πρωτοφανείς διαστάσεις εμφανίζονται πρόσφατα σε πολλούς τομείς. Αυτά τα σύνολα δεδομένων απαιτούν ειδικά εργαλεία ώστε να αναλύονται αποτελεσματικά και να εξάγονται χρήσιμες πληροφορίες από αυτά. Για την αντιμετώπιση αυτών των προκλήσεων έχουν δημιουργηθεί παράλληλα εργαλεία κατάλληλα για μαζικά δεδομένα. Το σημαντικότερο είναι να δοθεί ιδιαίτερη έμφαση ώστε να μπορούμε να παραλληλίσουμε διεργασίες στον βέλτιστο δυνατό βαθμό. Εν αντιστοιχία,ο σκοπός αυτής της διατριβής είναι να παράσχει μια μέθοδο απάντησης επερωτήσεων χρησιμοποιώντας ένα μόνο γύρο της τεχνικής του MapReduce. Αυτό επιτυγχάνεται δίδοντας ιδιαίτερη έμφαση στα δεδομένα εισόδου,δηλαδή σε δυαδικές ή «παχιές» σχέσεις δεδομένων . Yλοποιούμε έναν αλγόριθμο πολλαπλών συζεύξεων (“multiway join”) στους δύο αυτούς τύπους εισόδων και πραγματοποιούμε συγκρίσεις, όπου διαπιστώνουμε ότι οι «παχιές» σχέσεις δεδομένων επιτυγχάνουν καλύτερο χρόνο επεξεργασίας λόγω της φύσης αυτών των συνόλων δεδομένων. Η περ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

Massive datasets of unprecedented sizes are emerging in diverse fields. These datasets require tools to be effectively analyzed in order to extract value. Massively parallel tools have emerged to address these challenges. Most importantly, core emphasis must be focused on enabling tasks to be parallelized to the optimal. Thus the aim of this thesis is to provide a method of answering queries in a single round of Map Reduce. With special focus on input, that is, binary relations and ”fat” relations. A multiway join algorithm is implemented on the two types of inputs and comparisons are made, where we find that "fat" relations achieve better process time due to the nature of these datasets. In the case of "fat" relations it is studied in the context of data integration, that is, an application is proposed to crosschecking multiple data sources with conflicting information. The case of binary relation is also studied with regard to RDF datasets, which is a significantly important applicat ...
περισσότερα
Η διατριβή είναι δεσμευμένη από τον συγγραφέα  (μέχρι και: 7/2021)
Το πλήρες κείμενο της διατριβής είναι διαθέσιμο σε έντυπη μορφή από τη Βιβλιοθήκη Επιστήμης και Τεχνολογίας του ΕΚΤ
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/43730
ND
43730
Εναλλακτικός τίτλος
Parallel query processing for cloud computing environments
Συγγραφέας
Μομανι, Ζαιντ Γαζι
Ημερομηνία
2018
Ίδρυμα
Εθνικό Μετσόβιο Πολυτεχνείο (ΕΜΠ). Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Εξεταστική επιτροπή
Aφράτη Φώτο
Γεργατσούλης Μανόλης
Φωτάκης Δημήτρης
Κοζύρης Νεκτάριος
Καντερέ Βερένα
Γκούμας Γιώργος
Στάμου Γιώργος
Κιαμάλ Πεκμεστζή
Επιστημονικό πεδίο
Μηχανική & Τεχνολογία
Επιστήμες Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού & Μηχανικού Η/Υ
Λέξεις-κλειδιά
Υπολογιστική «Συννέφου» (cloud); Μεγάλα δεδομένα (BigData); Έλεγχος γεγονότων; Εύρεση αληθείας; Σημασιολογικός ιστός
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
77 σ., πιν., σχημ., γραφ.