Πολυτροπική ολοκλήρωση υψηλού επιπέδου και εξαγωγή σημασιολογίας

Περίληψη

Η παρούσα διδακτορική διατριβή αφορά στην πολυτροπική επεξεργασία και εξαγωγή σημασιολογίας από δεδομένα βίντεο και επικεντρώνεται στο πρόβλημα της αναγνώρισης επιβλαβούς για ευαίσθητες κοινωνικές ομάδες περιεχομένου. Αρχικά, εξετάζεται η υπάρχουσα βιβλιογραφία μονοτροπικών και πολυτροπικών μεθοδολογιών εντοπισμού βίας και πορνογραφίας. Το κύριο μέρος της διατριβής αρχίζει εντοπίζοντας την έλλειψη μεθοδολογιών εξαγωγής και φιλτραρίσματος περιεχομένου, που βασίζονται σε τεχνικές αναπαράστασης γνώσης και συλλογιστικής. Έτσι, προτείνεται ένα πλαίσιο ύστερης σημασιολογικής συγχώνευσης, που συνδυάζει ηχητικές και οπτικές έννοιες χαμηλού και ενδιάμεσου επιπέδου με οντολογική συλλογιστική και εφαρμογή κανόνων για εξαγωγή υψηλότερου επιπέδου σημασιολογίας. Το πρώτο συστατικό του σημασιολογικού πλαισίου αναλαμβάνει την κατάτμηση δεδομένων βίντεο σε κατάλληλες προς επεξεργασία δομικές μονάδες. Εξετάζεται, η χρήση κλασικών τεχνικών κατάτμησης πλάνων σε ψηφιακές ταινίες δράσης και επιλέγεται τελικ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

This thesis on multimodal fusion and semantics extraction, focuses on automated detection and annotation of harmful content in video data. The aim is not only to reason out the existence of violence or not (i.e., the binary problem), but also to determine the type of violence (e.g., fight, explosion, murder). An introductory comparative study of several harmful content detection approaches is first presented and the lack of knowledge representation and reasoning approaches for the problem at hand is acknowledged. Towards filling this gap, we propose a semantic fusion approach that combines low to mid level modality specific semantics through ontological and rule reasoning. A major part of the proposed framework is the movie segmentation into meaningful and easy to handle units. Towards this direction, we investigate and evaluate a set of shot boundary detection approaches and their combination through a majority voting scheme. In the sequel, state of the art classification methods ar ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/26721
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/26721
ND
26721
Εναλλακτικός τίτλος
Higher level multimodal fusion and semantics extraction
Συγγραφέας
Περπερής, Αθανάσιος (Πατρώνυμο: Αργύριος)
Ημερομηνία
2011
Ίδρυμα
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών (ΕΚΠΑ). Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής και Τηλεπικοινωνιών
Εξεταστική επιτροπή
Θεοδωρίδης Σέργιος
Περαντώνης Σταύρος
Κουμπαράκης Εμμανουήλ
Καλαμπούκης Θεόδωρος
Μαρούλης Δημήτριος
Κουρουπέτρογλου Γεώργιος
Ελευθεριάδης Αλέξανδρος
Επιστημονικό πεδίο
Φυσικές Επιστήμες
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Λέξεις-κλειδιά
Σημασιολογική ανάλυση βίντεο; Ανάκτηση με βάση το περιεχόμενο; Αναγνώριση επιβλαβούς περιεχομένου; Αναπαράσταση γνώσης; Συλλογιστική
Χώρα
Ελλάδα
Γλώσσα
Ελληνικά
Άλλα στοιχεία
400 σ., πιν., σχημ., ευρ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)