Πολυτροπική ολοκλήρωση υψηλού επιπέδου και εξαγωγή σημασιολογίας

Η παρούσα διδακτορική διατριβή αφορά στην πολυτροπική επεξεργασία και εξαγωγή σημασιολογίας από δεδομένα βίντεο και επικεντρώνεται στο πρόβλημα της αναγνώρισης επιβλαβούς για ευαίσθητες κοινωνικές ομάδες περιεχομένου. Αρχικά, εξετάζεται η υπάρχουσα βιβλιογραφία μονοτροπικών και πολυτροπικών μεθοδολογιών εντοπισμού βίας και πορνογραφίας. Το κύριο μέρος της διατριβής αρχίζει εντοπίζοντας την έλλειψη μεθοδολογιών εξαγωγής και φιλτραρίσματος περιεχομένου, που βασίζονται σε τεχνικές αναπαράστασης γνώσης και συλλογιστικής. Έτσι, προτείνεται ένα πλαίσιο ύστερης σημασιολογικής συγχώνευσης, που συνδυάζει ηχητικές και οπτικές έννοιες χαμηλού και ενδιάμεσου επιπέδου με οντολογική συλλογιστική και εφαρμογή κανόνων για εξαγωγή υψηλότερου επιπέδου σημασιολογίας. Το πρώτο συστατικό του σημασιολογικού πλαισίου αναλαμβάνει την κατάτμηση δεδομένων βίντεο σε κατάλληλες προς επεξεργασία δομικές μονάδες. Εξετάζεται, η χρήση κλασικών τεχνικών κατάτμησης πλάνων σε ψηφιακές ταινίες δράσης και επιλέγεται τελικά ένα συνδυαστικό πλειοψηφικό σχήμα \en (majority voting) \el των αποφάσεων των επιμέρους τεχνικών. Στη συνέχεια, ενσωματώνονται σύγχρονες μέθοδοι ταξινόμησης για την εξαγωγή επιβλαβών ενδείξεων τόσο από το ηχητικό όσο και από το οπτικό κανάλι. Σύμφωνα με τις προδιαγραφές του σημασιολογικού πλαισίου υλοποιούνται οντολογίες χαμηλού και μεσαίου επιπέδου γνώσης για την αναπαράσταση της δομής του βίντεο και των εξαγόμενων ηχητικών και οπτικών γεγονότων αντίστοιχα. Επίσης, παρουσιάζεται η πρώτη προσπάθεια καταγραφής του γνωστικού πεδίου του επιβλαβούς περιεχομένου σε κινηματογραφικές ταινίες με συμβολικό τρόπο σε μία οντολογία υψηλού επιπέδου. Για τη διασύνδεση των οντολογιών και την τροφοδότηση της διαδικασίας συμπερασματολογίας, ενσωματώνονται σύνολα κανόνων, που υλοποιήθηκαν σε συμβολική μορφή \en SWRL. \el Η πειραματική αποτίμηση εξετάζει το σημασιολογικό πλαίσιο συγκριτικά με ένα μεταταξινομητή ύστερης συγχώνευσης και τις μονοτροπικές μεθόδους. Τέλος, παρουσιάζονται επεκτάσεις και αντίστοιχα αποτελέσματα της αρχικά προτεινόμενης μεθοδολογίας. Οι επεκτάσεις αφορούν στην αναγνώριση σκηνών ως αλληλουχίες πλάνων με χρήση γραφοθεωρητικών τεχνικών ομαδοποίησης και στην επιπρόσθετη χρήση πληροφορίας μεταδεδομένων για την εξεταζόμενη ταινία.

περισσότερα

Περίληψη σε άλλη γλώσσα

This thesis on multimodal fusion and semantics extraction, focuses on automated detection and annotation of harmful content in video data. The aim is not only to reason out the existence of violence or not (i.e., the binary problem), but also to determine the type of violence (e.g., fight, explosion, murder). An introductory comparative study of several harmful content detection approaches is first presented and the lack of knowledge representation and reasoning approaches for the problem at hand is acknowledged. Towards filling this gap, we propose a semantic fusion approach that combines low to mid level modality specific semantics through ontological and rule reasoning. A major part of the proposed framework is the movie segmentation into meaningful and easy to handle units. Towards this direction, we investigate and evaluate a set of shot boundary detection approaches and their combination through a majority voting scheme. In the sequel, state of the art classification methods are employed to extract mid level semantics. The segmentation module and the modality specific analysis algorithms instantiate the corresponding video structure and modality specific ontologies developed in the context of the knowledge engineering framework. A set of consecutive and interleaved ontological and SWRL rule reasoning steps map sets and sequences of extracted semantics into higher level concepts represented in the harmful content ontology. We present the involved ontologies, the corresponding SWRL rule sets and the reasoning mechanism in detail. A comparative study of the most common ontological reasoners for the realization procedure of the semantic framework and the classification of the harmful content ontology is presented in detail. In the final part of the thesis we evaluate the proposed approach in a preanotated movie dataset and compare its results with the single modality approaches and a kNN late fusion classifier. We comment on the higher level semantics extraction ability and evaluate a set of extensions employed in the basic structure of the framework. The extensions concern the development of a scene detection module that combines Markov clustering with SQWRL queries and the incorporation of existing rating and movie genre metadata in the reasoning process.

περισσότερα

Διαβάστε τη διατριβή (Online)

Κατεβάστε τη διατριβή σε μορφή PDF (4.79 MB) (Η υπηρεσία είναι διαθέσιμη μετά από δωρεάν εγγραφή)

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI	10.12681/eadd/26721
Διεύθυνση Handle	http://hdl.handle.net/10442/hedi/26721
ND	26721
Εναλλακτικός τίτλος	Higher level multimodal fusion and semantics extraction
Συγγραφέας	Περπερής, Αθανάσιος (Πατρώνυμο: Αργύριος)
Ημερομηνία	2011
Ίδρυμα	Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών (ΕΚΠΑ). Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής και Τηλεπικοινωνιών
Εξεταστική επιτροπή	Θεοδωρίδης Σέργιος Περαντώνης Σταύρος Κουμπαράκης Εμμανουήλ Καλαμπούκης Θεόδωρος Μαρούλης Δημήτριος Κουρουπέτρογλου Γεώργιος Ελευθεριάδης Αλέξανδρος
Επιστημονικό πεδίο	Φυσικές Επιστήμες Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Λέξεις-κλειδιά	Σημασιολογική ανάλυση βίντεο; Ανάκτηση με βάση το περιεχόμενο; Αναγνώριση επιβλαβούς περιεχομένου; Αναπαράσταση γνώσης; Συλλογιστική
Χώρα	Ελλάδα
Γλώσσα	Ελληνικά
Άλλα στοιχεία	400 σ., πιν., σχημ., ευρ.

Στατιστικά χρήσης

ΠΡΟΒΟΛΕΣ

Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΞΕΦΥΛΛΙΣΜΑΤΑ

Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΜΕΤΑΦΟΡΤΩΣΕΙΣ

Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

ΧΡΗΣΤΕΣ

Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)

Μέθοδοι μηχανικής μάθησης για αυτόματη ταξινόμηση κειμένων

Έμφυλες ιεραρχήσεις και στερεότυπα στη μουσική εκπαίδευση: αφηγήσεις αγοριών σχετικά με τη συμμετοχή τους σε χορωδίες μουσικών σχολείων

Η ιδιότητα του πολίτη στο ελληνικό γενικό λύκειο: δυνατότητες και όρια ανάπτυξής της σε πλαίσιο εκπαιδευτικών παρεμβάσεων

Διαμορφώνοντας μια εναλλακτική οργανωσιακή κουλτούρα στο δημόσιο σύστημα υγείας: εθνογραφική μελέτη ενός προγράμματος απεξάρτησης

Κατηγοριοποίηση κειμένων

Η εκπαίδευση των δασκάλων στα ανθρώπινα δικαιώματα: η περίπτωση των Ρομά της Δυτικής Αττικής

Εκπαιδευτική ηγεσία και δημοκρατικές αξίες στο ελληνικό σχολείο: μια έρευνα σε σχολικές μονάδες της δευτεροβάθμιας εκπαίδευσης της περιφερειακής ενότητας Αιτωλοακαρνανίας

Ανίχνευση προσεγγίσεων του μαθήματος της μουσικής αγωγής στην πρωτοβάθμια εκπαίδευση: η περίπτωση των εκπαιδευτικών μουσικής αγωγής των νομών της Περιφέρειας Δυτικής Ελλάδας

"Έχουμε τρεις τηλεοράσεις, DVD και video (...)": μέσα επικοινωνίας και διαμόρφωση ταυτότητας Αλβανών μαθητών

Η πολιτική διάσταση της τέχνης κατά Πλάτωνα και Αριστοτέλη: συγκριτική προσέγγιση

"Πολυτροπική ολοκλήρωση υψηλού επιπέδου και εξαγωγή σημασιολογίας"
	Πληκτρολογήστε το κείμενο της εικόνας!
Δηλώνω ότι έλαβα γνώση και ανεπιφύλακτα συμφωνώ και αποδέχομαι τους Όρους Χρήσης του Εθνικού Αρχείου Διδακτορικών Διατριβών, καθώς και της .