Περίληψη
Η παρούσα διδακτορική διατριβή μπορεί να αναλυθεί σε δύο κυρίως σκέλη. Το ένα σκέλος περιλαμβάνει την πρόταση νέων βελτιωμένων χαρακτηριστικών αναγνώρισης εικόνων ενώ το δεύτερο σκέλος περιλαμβάνει την πρόταση μιας νέας οικογένειας μη γραμμικών φίλτρων επεξεργασίας εικόνας, τα οποία είναι κατάλληλα για επεξεργασία αλλά και εξαγωγή κάποιων χαρακτηριστικών αναγνώρισης. Και τα δύο σκέλη έχουν τύχει αναγνώρισης από τη διεθνή επιστημονική κοινότητα καθώς υπάρχει σημαντικό πλήθος αναφορών στις προτεινόμενες τεχνικές. Πιο συγκεκριμένα η διατριβή αποτελείται από: α) Τη βελτίωση της αποτελεσματικότητας των κλασσικών γεωμετρικών ροπών ως εργαλείο για την εξαγωγή χαρακτηριστικών αναγνώρισης, καθώς επίσης και εισαγωγή καινούργιας μεθόδου μέτρησης ομοιότητας (similarity measure).Αυτό που θεωρήθηκε και εφαρμόσθηκε, ήταν η εισαγωγή του παράγοντα της διασποράς (σ), στον υπολογισμό των στατιστικών ροπών (p,q) τάξης. Η παραπάνω θεώρηση εφαρμόσθηκε στον υπολογισμό μονοδιάστατων και δισδιάστατων ροπών. Α ...
Η παρούσα διδακτορική διατριβή μπορεί να αναλυθεί σε δύο κυρίως σκέλη. Το ένα σκέλος περιλαμβάνει την πρόταση νέων βελτιωμένων χαρακτηριστικών αναγνώρισης εικόνων ενώ το δεύτερο σκέλος περιλαμβάνει την πρόταση μιας νέας οικογένειας μη γραμμικών φίλτρων επεξεργασίας εικόνας, τα οποία είναι κατάλληλα για επεξεργασία αλλά και εξαγωγή κάποιων χαρακτηριστικών αναγνώρισης. Και τα δύο σκέλη έχουν τύχει αναγνώρισης από τη διεθνή επιστημονική κοινότητα καθώς υπάρχει σημαντικό πλήθος αναφορών στις προτεινόμενες τεχνικές. Πιο συγκεκριμένα η διατριβή αποτελείται από: α) Τη βελτίωση της αποτελεσματικότητας των κλασσικών γεωμετρικών ροπών ως εργαλείο για την εξαγωγή χαρακτηριστικών αναγνώρισης, καθώς επίσης και εισαγωγή καινούργιας μεθόδου μέτρησης ομοιότητας (similarity measure).Αυτό που θεωρήθηκε και εφαρμόσθηκε, ήταν η εισαγωγή του παράγοντα της διασποράς (σ), στον υπολογισμό των στατιστικών ροπών (p,q) τάξης. Η παραπάνω θεώρηση εφαρμόσθηκε στον υπολογισμό μονοδιάστατων και δισδιάστατων ροπών. Αποτέλεσμα αυτού ήταν η βελτίωση του ποσοστού αναγνώρισης έναντι των κλασσικών ροπών κατά 5.4 % σε καθαρά σήματα και 9.5% σε θορυβώδη. Δηλαδή, οι προτεινόμενες ροπές είναι πολύ αποτελεσματικές σε εφαρμογές όπου το σήμα έχει υποστεί παραμόρφωση από κάποιο είδος θορύβου. Η εφαρμογή και η εξαγωγή των αποτελεσμάτων, πραγματοποιήθηκε σε πειράματα οπτικής αναγνώρισης χαρακτήρων (Ο. C. R.) παρουσιάζοντας πολύ ικανοποιητικά αποτελέσματα. Επίσης σε συγκριτικές μελέτες δοκιμής διαφόρων μεθοδολογιών μέτρησης ομοιότητας, μελέτες που υποστηρίζονται και από άλλους ερευνητές, δείχνεται ότι οι προτεινόμενες ροπές υπερτερούν σημαντικά έναντι άλλων ροπών της βιβλιογραφίας. β) Παρουσίαση νέου είδους μη γραμμικών φίλτρων.Εδώ παρουσιάζεται η θεωρία της συντεταγμένης λογικής καθώς και την εφαρμογή της σε διάφορα πεδία της επεξεργασίας εικόνων και ειδικά στην εξαγωγή χαρακτηριστικών αναγνώρισης Παρουσιάζονται για πρώτη φορά τα Φίλτρα Συντεταγμένης Λογικής (ΦΣΛ). Τα προτεινόμενα φίλτρα, βασίζονται στην εκτέλεση πράξεων συντεταγμένης λογικής, μεταξύ των διαδυκών αριθμητικών τιμών των δειγμάτων του σήματος. Κύριο χαρακτηριστικό της συντεταγμένης λογικής είναι η εκτέλεση απλών λογικών πράξεων (AND, OR, NOT και XOR) μεταξύ διαδυκών παραστάσεων αριθμών σε επίπεδο bit (bitwise logical operators). Τα ΦΣΛ έχουν ένα ευρύ φάσμα εφαρμογών στην ψηφιακή επεξεργασία σημάτων και ειδικότερα στη ψηφιακή επεξεργασία εικόνων. Αυτό που διακρίνει τα ΦΣΛ από άλλα μη γραμμικά φίλτρα είναι η απλότητα, η ταχύτητα, καθώς και η απόλυτη καταλληλότητα για κυκλωματική υλοποίηση (H/W). Στο υλικό της διατριβής παρουσιάζονται υλοποιήσεις αυτών των φίλτρων σε FPGA’s, όπου και αναδεικνύεται η απλότητά τους σε σχέση με υλοποιήσεις άλλων γνωστών φίλτρων της βιβλιογραφίας.Οι ιδιότητες των τελεστών συντεταγμένης λογικής, οι οποίες αναλύονται στη διατριβή, επιτρέπουν το σχεδιασμό φίλτρων που έχουν παρόμοια λειτουργικότητα (functionality), με αυτή των φίλτρων σωρού (stack filters) και κατ' επέκταση με αυτή των μορφολογικών φίλτρων. Με αυτόν τον τρόπο, όλος ο πλούτος των εργαλείων και των μεθόδων που έχουν αναπτυχθεί με τη χρησιμοποίηση της μαθηματικής μορφολογίας, μπορεί να χρησιμοποιηθεί και από φίλτρα συντεταγμένης λογικής. Με βάση αυτή την ομοιότητα παρουσιάζονται ΦΣΛ για την ανίχνευση ακμών, για τον υπολογισμό του φάσματος ισχύος (pattern spectrum) και γενικότερα για την εξαγωγή μορφολογικών χαρακτηριστικών αναγνώρισης. Επίσης παρουσιάζονται ΦΣΛ για εφαρμογές όπως η εξαγωγή θορύβου, η μεγέθυνση εικόνας, η κρυπτογράφηση καθώς και για την ακολουθία περιγράμματος (contour fowling). Όλα τα προηγούμενα μπορούν να εφαρμοσθούν σε μία γενική εφαρμογή επεξεργασίας και αναγνώρισης 24 – bit εικόνων.Αυτό που ουσιαστικά διφοροποιεί τα ΦΣΛ από τα μορφολογικά φίλτρα είναι ότι :•οι συναρτήσεις συντεταγμένης λογικής δεν είναι αύξουσες (non increasing functions). •οι αντίστοιχες μορφολογικές είναι αύξουσες ( increasing functions).γ) Μορφοκλάσματα (Fractals), Κυψελιδωτά αυτόματα και κρυπτογράφηση.Άλλη μια σημαντική ιδιότητα των ΦΣΛ είναι η σχέση τους με την μορφοκλασματική γεωμετρία (fractal geometry), και τη διαμόρφωση κανόνων σε κυψελιδωτά αυτόματα. Η εφαρμογή των ΦΣΛ εισάγει μια νέα μέθοδο στη περιγραφή και δημιουργία φυσικών και τεχνητών δομών. Επίσης το συντεταγμένο xor παρουσιάζει σημαντικές ιδιότητες στην αυτοαναπαραγωγή και κρυπτογράφηση ψηφιακών σημάτων.
περισσότερα
Περίληψη σε άλλη γλώσσα
This PhD dissertation is constituted from two major parts. The first part is related with a modification of the geometrical moments so that they can be used as image features contributing to higher recognition rates, while the second part with the introduction of a new kind of non linear filters. Both parts have been recognized by the international scientific community with a significant number of publications and citations. More specifically. Improvement of the performance of the geometrical moments, as recognition features, and introduction of a new similarity measure.At this part a modification of the geometrical moments is proposed in order to improve their performance as recognition features. This is achieved by adding the variance σ of the pixel values into the function that calculates the geometrical moments. The performance of the proposed features and that of a newly introduced weighted Euclidian measure are tested on an OCR application.It is turning out that the proposed fea ...
This PhD dissertation is constituted from two major parts. The first part is related with a modification of the geometrical moments so that they can be used as image features contributing to higher recognition rates, while the second part with the introduction of a new kind of non linear filters. Both parts have been recognized by the international scientific community with a significant number of publications and citations. More specifically. Improvement of the performance of the geometrical moments, as recognition features, and introduction of a new similarity measure.At this part a modification of the geometrical moments is proposed in order to improve their performance as recognition features. This is achieved by adding the variance σ of the pixel values into the function that calculates the geometrical moments. The performance of the proposed features and that of a newly introduced weighted Euclidian measure are tested on an OCR application.It is turning out that the proposed features and distance measure contribute to a 5,4% improvement in comparison to the conventional geometrical moments when the data are non noisy. The improvement further increased reaching 9,5% when the patterns to be recognized are noisy. . Introduction of a new kind of non linear filters.In this part the theory of Coordinate Logic Filters (CLF) and their applications in image processing are introduced. The proposed filters are based on the execution of logic operations among the binary representations of the pixel values (bitwise). The main idea of CLF is based on three major steps1.binary decomposition of the image2.processing of each binary level using simple Boolean functions 3.composition of the processed levels to a new word value CLF have a wide range of applications in image processing. The main features of CLF are 1.simplicity 2.speed 3.inherent parallelism4.grate performanceThe above features make CLF very appropriate for H/W implementation. According to their definition CLF present similar functionality with stack filters and consequently with the morphological filters (MF), presenting however distinct results due to their definition and the resulting properties. CLF are non increasing functions but satisfy the properties of duality, idempotence and extensivity. It is also proved that CLF can act exactly as their corresponding morphological ones when the image grey levels are quantized and mapped to a specific set of decimal numbers having unary binary representation. This way, special forms of morphological filters can be implemented using CLF, exploiting thus the inherent circuitry simplicity and parallelism of CLF. CLF are effective to many image processing tasks such as edge detection, feature extraction, noise cleaning, coding, zooming, contour following, image cryptography, cellular automata and fractal modeling. In this dissertation, the methodology for designing of CLF for the execution of the above image processing tasks is presented. Moreover the advantage in speed and simplicity, of the CLF against other classical non linear filters, is shown using FPGA implementations. Finally, the features and filters introduced in this dissertation are joined with well known image processing and pattern recognition methodologies to form a paradigm of an image retrieval platform.
περισσότερα