Βελτιστοποίηση ροών εργασιών για ανάλυση δεδομένων

Περίληψη

Η αύξηση των δεδομένων με ραγδαίο ρυθμό συντέλεσε στην ανάγκη για την ανάπτυξη αυτοματοποιημένων μηχανισμών επεξεργασίας και ανάλυσης δεδομένων. Γι' αυτό το λόγο, υιοθετήθηκαν οι ροές εργασιών για ανάλυση δεδομένων (ή πιο απλά οι ροές δεδομένων). Όμως, οι ροές δεδομένων είναι αρκετά πολύπλοκες και γίνονται ολοένα πολυπλοκότερες, καθώς η εκτέλεσή τους πραγματοποιείται σε παράλληλα, κατανεμημένα και ετερογενή περιβάλλοντα. Η παρούσα διατριβή πραγματεύεται τη βελτιστοποίηση των ροών δεδομένων μέσα από την πρόταση τεχνικών αναδιάταξης των εργασιών των ροών με σκοπό τη μείωση του συνολικού κόστους εκτέλεσής τους και της επιλογής των μηχανών εκτέλεσης των εργασιών. Πιο αναλυτικά, οι συνεισφορές της διατριβής κωδικοποιούνται ως εξής: (i) παρουσιάζεται μία συστηματική ανασκόπηση του χώρου της βελτιστοποίησης των ροών δεδομένων, (ii) προτείνονται αποδοτικοί ακριβείς αλγόριθμοι για την εύρεση της βέλτιστης διάταξης των εργασιών για τη μείωση του κόστους της ροής, (iii) προτείνονται, για το ίδιο ...
περισσότερα

Περίληψη σε άλλη γλώσσα

The big data analysis with the help of automated mechanisms attracts a lot of attention because of the growing need for end-to-end processing of this data. Modern workflows for data analysis, or simply data flows, are adopted in order to process and analyze large volumes of data. However, the data flows become more and more complex and operate in highly dynamic parallel, distributed and heterogeneous environments. This thesis deals with the data flow cost-based optimization and propose task ordering techniques that aim to minimize the total execution cost of the data flow tasks. Additionally, a set of engine selection techniques are proposed for task allocation to specific heterogeneous engines that aim to minimize the flow execution cost. More specifically, the contributions of the thesis are summarized as follows: (i) a thorough survey of data flow optimization research area is presented, (ii) they are presented effective accurate algorithms for finding the optimal order of tasks tha ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/41309
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/41309
ND
41309
Εναλλακτικός τίτλος
Optimization of workflows for data analytics
Συγγραφέας
Κούγκα, Γεωργία (Πατρώνυμο: Κωνσταντίνος)
Ημερομηνία
2017
Ίδρυμα
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ). Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής. Εργαστήριο Τεχνολογίας και Επεξεργασίας Δεδομένων
Εξεταστική επιτροπή
Γούναρης Αναστάσιος
Βασιλειάδης Νικόλαος
Βακάλη Αθηνά
Μανωλόπουλος Ιωάννης
Παπαδόπουλος Απόστολος
Σταμέλος Ιωάννης
Τσίχλας Κωνσταντίνος
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Λέξεις-κλειδιά
Ροές δεδομένων / Δυναμικά περιβάλλοντα; Ροές δεδομένων; Ροές εργασιών; Ροές εργασιών, Διαχείριση; Βελτιστοποίηση Ροών Δεδομένων; Επεξεργασία δεδομένων; Ανάλυση δεδομένων
Χώρα
Ελλάδα
Γλώσσα
Ελληνικά
Άλλα στοιχεία
xviii, 170 σ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)