Επεξεργασία παράλληλου ερωτήματος για περιβάλλοντα cloud computing

Περίληψη

Μαζικά σύνολα δεδομένων με πρωτοφανείς διαστάσεις εμφανίζονται πρόσφατα σε πολλούς τομείς. Αυτά τα σύνολα δεδομένων απαιτούν ειδικά εργαλεία ώστε να αναλύονται αποτελεσματικά και να εξάγονται χρήσιμες πληροφορίες από αυτά. Για την αντιμετώπιση αυτών των προκλήσεων έχουν δημιουργηθεί παράλληλα εργαλεία κατάλληλα για μαζικά δεδομένα. Το σημαντικότερο είναι να δοθεί ιδιαίτερη έμφαση ώστε να μπορούμε να παραλληλίσουμε διεργασίες στον βέλτιστο δυνατό βαθμό. Εν αντιστοιχία,ο σκοπός αυτής της διατριβής είναι να παράσχει μια μέθοδο απάντησης επερωτήσεων χρησιμοποιώντας ένα μόνο γύρο της τεχνικής του MapReduce. Αυτό επιτυγχάνεται δίδοντας ιδιαίτερη έμφαση στα δεδομένα εισόδου,δηλαδή σε δυαδικές ή «παχιές» σχέσεις δεδομένων . Yλοποιούμε έναν αλγόριθμο πολλαπλών συζεύξεων (“multiway join”) στους δύο αυτούς τύπους εισόδων και πραγματοποιούμε συγκρίσεις, όπου διαπιστώνουμε ότι οι «παχιές» σχέσεις δεδομένων επιτυγχάνουν καλύτερο χρόνο επεξεργασίας λόγω της φύσης αυτών των συνόλων δεδομένων. Η περ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

Massive datasets of unprecedented sizes are emerging in diverse fields. These datasets require tools to be effectively analyzed in order to extract value. Massively parallel tools have emerged to address these challenges. Most importantly, core emphasis must be focused on enabling tasks to be parallelized to the optimal. Thus the aim of this thesis is to provide a method of answering queries in a single round of Map Reduce. With special focus on input, that is, binary relations and ”fat” relations. A multiway join algorithm is implemented on the two types of inputs and comparisons are made, where we find that "fat" relations achieve better process time due to the nature of these datasets. In the case of "fat" relations it is studied in the context of data integration, that is, an application is proposed to crosschecking multiple data sources with conflicting information. The case of binary relation is also studied with regard to RDF datasets, which is a significantly important applicat ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/43730
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/43730
ND
43730
Εναλλακτικός τίτλος
Parallel query processing for cloud computing environments
Συγγραφέας
Μομανι, Ζαιντ (Πατρώνυμο: Γαζι)
Ημερομηνία
2018
Ίδρυμα
Εθνικό Μετσόβιο Πολυτεχνείο (ΕΜΠ). Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Εξεταστική επιτροπή
Aφράτη Φώτο
Γεργατσούλης Μανόλης
Φωτάκης Δημήτρης
Κοζύρης Νεκτάριος
Καντερέ Βερένα
Γκούμας Γιώργος
Στάμου Γιώργος
Κιαμάλ Πεκμεστζή
Επιστημονικό πεδίο
Επιστήμες Μηχανικού και ΤεχνολογίαΕπιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ
Λέξεις-κλειδιά
Υπολογιστική «Συννέφου» (cloud); Μεγάλα δεδομένα (BigData); Έλεγχος γεγονότων; Εύρεση αληθείας; Σημασιολογικός ιστός
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
77 σ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)