Περίληψη
Το Shortest Superstring Problem (SSP) είναι ένα πρόβλημα συνδυαστικής βελτιστοποίησης που έχει προσελκύσει το ενδιαφέρων πολλών ερευνητών, λόγω των εφαρμογών του. Μπορεί να χρησιμοποιηθεί σε προβλήματα Υπολογιστικής Μοριακής Βιολογίας όπως η αλληλούχιση του DNA και σε προβλήματα της επιστήμης υπολογιστών όπως η συμπίεση δεδομένων. Το SSP είναι ένα NP-hard πρόβλημα. Ένα άρθρο ανασκόπησης για το SSP παρουσιάζεται στο πρώτο κεφάλαιο της παρούσας διατριβής με έναν περιεκτικό και σαφή τρόπο, καλύπτοντας ολόκληρη τη σχετική βιβλιογραφία, αναδεικνύοντας την κατακτημένη γνώση και βοηθώντας στην μελλοντική έρευνα.Η μέθοδος GRASP (Greedy Randomized Adaptive Search Procedure) είναι μια επαναληπτική ευρετική μέθοδος για συνδυαστική βελτιστοποίηση. Η μέθοδος Path Relinking (PR) αποτελεί έναν τρόπο ενοποίησης των στρατηγικών εντατικοποίησης και διαφοροποίησης στην αναζήτηση για βέλτιστες λύσεις. Η PR στα πλαίσια του GRASP εισήχθη ως μηχανισμός μνήμης για την αξιοποίηση των δεδομένων από καλές λύσεις ...
Το Shortest Superstring Problem (SSP) είναι ένα πρόβλημα συνδυαστικής βελτιστοποίησης που έχει προσελκύσει το ενδιαφέρων πολλών ερευνητών, λόγω των εφαρμογών του. Μπορεί να χρησιμοποιηθεί σε προβλήματα Υπολογιστικής Μοριακής Βιολογίας όπως η αλληλούχιση του DNA και σε προβλήματα της επιστήμης υπολογιστών όπως η συμπίεση δεδομένων. Το SSP είναι ένα NP-hard πρόβλημα. Ένα άρθρο ανασκόπησης για το SSP παρουσιάζεται στο πρώτο κεφάλαιο της παρούσας διατριβής με έναν περιεκτικό και σαφή τρόπο, καλύπτοντας ολόκληρη τη σχετική βιβλιογραφία, αναδεικνύοντας την κατακτημένη γνώση και βοηθώντας στην μελλοντική έρευνα.Η μέθοδος GRASP (Greedy Randomized Adaptive Search Procedure) είναι μια επαναληπτική ευρετική μέθοδος για συνδυαστική βελτιστοποίηση. Η μέθοδος Path Relinking (PR) αποτελεί έναν τρόπο ενοποίησης των στρατηγικών εντατικοποίησης και διαφοροποίησης στην αναζήτηση για βέλτιστες λύσεις. Η PR στα πλαίσια του GRASP εισήχθη ως μηχανισμός μνήμης για την αξιοποίηση των δεδομένων από καλές λύσεις που έχουν ήδη βρεθεί. Στο δεύτερο κεφάλαιο, παρουσιάζεται η υλοποίηση της μεθόδου GRASP με PR για το SSP. Η νέα μέθοδος λύνει στιγμιότυπα μεγάλης κλίμακας και υπερτερεί του φυσικού άπληστου αλγόριθμου στη συντριπτική πλειοψηφία των στιγμιοτύπων που δοκιμάστηκαν. Η προτεινόμενη μέθοδος είναι ικανή να παράγει πολλαπλές λύσεις κοντά στο βέλτιστο, γεγονός το οποίο είναι σημαντικό για την πρακτική της αλληλούχισης του DNA και επιτρέπει μια φυσική και εύκολη παράλληλη υλοποίηση. Ένα σύνολο αναφοράς στιγμιοτύπων με γνωστή βέλτιστη λύση κατασκευάστηκε χρησιμοποιώντας μια νέα Διατύπωση Ακέραιου Προγραμματισμού (Integer Programming Formulation) για το SSP.Η οικογένεια των γράφων επικάλυψης αποτελεί ένα κατάλληλο είδος δομής δεδομένων για την περίπτωση του SSP. Έχουν εφαρμογές στην αλληλούχιση γονιδιώματος, στην συμπίεση ακολουθιών και στον χρονοπρογραμματισμό μηχανών. Ένας κατευθυνόμενος γράφος με βάρη είναι γράφος επικάλυψης αν υπάρχει ένα σύνολο από ακολουθίες, οι οποίες βρίσκονται σε ένα προς ένα αντιστοιχία με τις κορυφές του γράφου, έτσι ώστε κάθε βάρος του γράφου να ισούται με την επικάλυψη μεταξύ των αντίστοιχων ακολουθιών. Στο τρίτο κεφάλαιο της παρούσας διατριβής, παρουσιάζεται ένα θεώρημα χαρακτηρισμού των γράφων επικάλυψης και ο αντίστοιχος αλγόριθμος αναγνώρισής τους.Το Quadratic Assignment Problem (QAP) είναι ένα από τα δυσκολότερα προβλήματα συνδυαστικής βελτιστοποίησης. Το QAP είναι ένα NP-hard πρόβλημα, ενώ η εύρεση ενός ε-προσεγγιστικού αλγόριθμου για αυτό είναι επίσης δύσκολη. Ο κλασικός άπληστος αλγόριθμος για διακριτά προβλήματα βελτιστοποίησης όπου η βέλτιστη λύση είναι ένα μεγιστοτικό ανεξάρτητο υποσύνολο ενός πεπερασμένου συνόλου βάσης με στοιχεία με βάρη, μπορεί να οριστεί με δύο διαφορετικούς τρόπους που είναι δυϊκοί ο ένας προς το άλλο. Τον άπληστο-εισαγωγής (greedy-in) αλγόριθμο, όπου μια λύση κατασκευάζεται από ένα κενό σύνολο με την εισαγωγή του επόμενου καλύτερου στοιχείου, ενός κάθε φορά, μέχρι να προκύψει μια μη εφικτή λύση και τον άπληστο-εξαγωγής (greedy-out) αλγόριθμο, όπου ξεκινώντας από το σύνολο βάσης, διαγράφεται το επόμενο χειρότερο στοιχείο, ένα κάθε φορά, μέχρι να προκύψει κάποια εφικτή λύση. Έχει αποδειχτεί ότι ενώ ο πρώτος αλγόριθμος παρέχει έναν παράγοντα προσέγγισης για τα προβλήματα μεγιστοποίησης, η απόδοσή του στην χειρότερη περίπτωση δεν είναι φραγμένη για τα προβλήματα ελαχιστοποίησης και το αντίστροφο για τον δεύτερο αλγόριθμο. Στο τέταρτο κεφάλαιο αυτής της διατριβής, παρουσιάζεται ο άπληστος-εξαγωγής αλγόριθμος για το QAP, αφότου αναπτύσσεται ένας συνδυαστικός χαρακτηρισμός των λύσεων του προβλήματος.
περισσότερα
Περίληψη σε άλλη γλώσσα
The Shortest Superstring Problem (SSP) is a combinatorial optimization problem which has attracted the interest of many researchers due to its applications. It can be applied in computational molecular biology problems such as DNA sequencing, and in computer science problems such as string compression. A concise survey for the SSP is presented in the first chapter of this dissertation covering the whole relevant literature, revealing the knowledge that is already conquered, and paving the path for further development in the study of shortest superstrings.A Greedy Randomized Adaptive Search Procedure (GRASP) is an iterative meta-heuristic for combinatorial optimization. Path Relinking (PR) is an approach to integrate intensification and diversification strategies in search for optimal solutions. In this dissertation, an implementation of GRASP with PR for solving the SSP is presented. It solves large scale SSP instances and outperforms the natural greedy algorithm in the majority of the ...
The Shortest Superstring Problem (SSP) is a combinatorial optimization problem which has attracted the interest of many researchers due to its applications. It can be applied in computational molecular biology problems such as DNA sequencing, and in computer science problems such as string compression. A concise survey for the SSP is presented in the first chapter of this dissertation covering the whole relevant literature, revealing the knowledge that is already conquered, and paving the path for further development in the study of shortest superstrings.A Greedy Randomized Adaptive Search Procedure (GRASP) is an iterative meta-heuristic for combinatorial optimization. Path Relinking (PR) is an approach to integrate intensification and diversification strategies in search for optimal solutions. In this dissertation, an implementation of GRASP with PR for solving the SSP is presented. It solves large scale SSP instances and outperforms the natural greedy algorithm in the majority of the tested instances. The proposed method is able to provide multiple near-optimum solutions that is of practical importance for the DNA sequencing, and admits a natural parallel implementation. A benchmark set of the instances with known optimal solutions was constructed using a new Integer Programming (IP) formulation of the SSP, and used to indicate that the new method finds the optimum in most of the cases, and its average error relative to the optimum is close to zero.The class of the Overlap Graphs is an appropriate data structure for the SSP and other problems that comprise overlapping segments. A weighted directed graph is an overlap graph if there exists a set of strings that is with one-to-one correspondence to the vertices of the graph, such that each weight in the edges of the graph equals the overlap between the corresponding strings. In this dissertation, a characterization theorem for overlap graphs is established, and a polynomial time recognition algorithm is presented.The Quadratic Assignment Problem (QAP) is one of the hardest combinatorial optimization problems. The QAP is NP-hard and even finding an ε-approximation solution for the QAP is a hard problem. The classical greedy algorithm for discrete optimization problems where the optimal solution is a maximal independent subset of a finite ground set of weighted elements, can be defined in two ways which are dual to each other. The greedy-in where a solution is constructed from the empty set by adding the next best element, one at a time, until infeasibility is reached, and the greedy-out where starting from the ground set the next worst element is deleted, one at a time, until feasibility is reached. It is known that while the former provides an approximation ratio for maximization problems, its worst-case performance is not bounded for minimization problems, and vice-versa for the latter. However the greedy-out algorithm requires an oracle for checking the existence of a maximal independent subset which for most discrete optimization problems is a difficult task by itself. In this dissertation, a greedy-out algorithm for the QAP is presented by providing a combinatorial characterization of its solutions.
περισσότερα