Περίληψη
Οι τεχνικές κωδικοποίησης video είναι όλο και περισσότερο σημαντικές, εξαιτίας της ραγδαίας εμφάνισης εφαρμογών που απαιτούν ροές video χαμηλού bit - rate, όπως η video - τηλεφωνία και η video - συνεδρία. Το γεγονός αυτό κάνει απαραίτητη την ύπαρξη ενός βιομηχανικού πρότυπο για αναπαράσταση κωδικοποιημένου video με υψηλή απόδοση συμπίεσης και ενισχυμένη αντοχή σεδικτυακά περιβάλλοντα. Το πιο πρόσφατο πρότυπο στην περιοχή της κωδικοποίησης video είναι το Η.264, το οποίο δημιουργήθηκε από την Joint Video Team (JVT), μια συνεργασία μεταξύ των ITU-T Video Coding Expert Group (VCEG) και ISO/IEC Moving Picture Expert Group (MPEG). Το H.264 παρέχει παρόμοια λειτουργικότητα με τα προηγούμενα πρότυπα, επιτυγχάνοντας όμως σημαντικήβελτίωση στην συμπίεση και βελτιωμένη υποστήριξη για αξιόπιστη μετάδοση. Στα πλαίσια αυτής της εργασίας ασχοληθήκαμε με αλγορίθμους που αφορούν την διαδικασία πρόβλεψης Macroblock, όπως αυτή ορίζεται από το πιο πρόσφατο πρότυπο κωδικοποίησης video, το Η.264. Στο Η.264 ...
Οι τεχνικές κωδικοποίησης video είναι όλο και περισσότερο σημαντικές, εξαιτίας της ραγδαίας εμφάνισης εφαρμογών που απαιτούν ροές video χαμηλού bit - rate, όπως η video - τηλεφωνία και η video - συνεδρία. Το γεγονός αυτό κάνει απαραίτητη την ύπαρξη ενός βιομηχανικού πρότυπο για αναπαράσταση κωδικοποιημένου video με υψηλή απόδοση συμπίεσης και ενισχυμένη αντοχή σεδικτυακά περιβάλλοντα. Το πιο πρόσφατο πρότυπο στην περιοχή της κωδικοποίησης video είναι το Η.264, το οποίο δημιουργήθηκε από την Joint Video Team (JVT), μια συνεργασία μεταξύ των ITU-T Video Coding Expert Group (VCEG) και ISO/IEC Moving Picture Expert Group (MPEG). Το H.264 παρέχει παρόμοια λειτουργικότητα με τα προηγούμενα πρότυπα, επιτυγχάνοντας όμως σημαντικήβελτίωση στην συμπίεση και βελτιωμένη υποστήριξη για αξιόπιστη μετάδοση. Στα πλαίσια αυτής της εργασίας ασχοληθήκαμε με αλγορίθμους που αφορούν την διαδικασία πρόβλεψης Macroblock, όπως αυτή ορίζεται από το πιο πρόσφατο πρότυπο κωδικοποίησης video, το Η.264. Στο Η.264 υπάρχουν δυο διακριτές διαδικασίες πρόβλεψης. Η μια αφορά το χωρικό μοντέλο και ονομάζεται IntraPrediction και η δεύτερη αφορά το χρονικό και ονομάζεται Inter Prediction. Εάν ένα block ή Macroblock κωδικοποιείται με μέθοδο Intra, τότε σχηματίζεται ένα block (ή Macroblock) πρόβλεψης, το οποίο σχηματίζεται από προηγουμένως κωδικοποιημένα και αναδομημένα blocks (ή Macroblocks) του ίδιου καρέ. Η κωδικοποίηση Inter χρησιμοποιεί το χρονικό μοντέλο. Το προβλεπόμενο καρέδημιουργείται από ένα ή περισσότερο, προηγούμενα ή μελλοντικά καρέ ('καρέ αναφοράς'), τα οποία έχουν ήδη κωδικοποιηθεί και μεταδοθεί. Μια πρακτική και ευρέως χρησιμοποιούμενη μέθοδος του συμψηφισμού κίνησης (motion compensation) είναι ο συμψηφισμός κίνησης ορθογώνιων τμημάτων ή 'blocks' του τωρινού καρέ (Variable Block- Size Motion Estimation (Compensation) - VBSME ). To H.264 είναι ένας block-based motion compensated hybrid transform codec. Και στις δυο μεθόδους πρόβλεψης, Intra & Inter, δημιουργούνται προβλεπόμενα blocks, από τα οποία πρέπει να επιλεγεί το «καλύτερο». Το «καλύτερο» block θα χρησιμοποιηθεί για τη δημιουργία του block διαφορών. Ποιο είναι όμως το κριτήριο επιλογής? Δυστυχώς, δεν υπάρχει κοινώς αποδεκτό μέτρο για την ποιότητα ενός σήματος. Στην κωδικοποίηση video, εκτός από την ποιότητα, εξίσου σημαντικός παράγοντας είναι η συμπίεση. Το κριτήριο επιλογής θα πρέπει να περιλαμβάνει εκτός από την ποιότητα και το bit-rate κόστος. Στην παρούσα διδακτορική διατριβή παρουσιάζεται ένα κριτήριο επιλογής το οποίο βασίζεται σε έναν καινούργιο τρόπο μέτρησης της ποιότητας που θα αντικαθιστά το SAD. Το νέο αυτό μέτρο είναι το πλήθος των μεγαλύτερων απολύτων διαφορών, Sum of Greater Values - SGV. Στην παρούσα δουλειά παρουσιάζεται ο αλγόριθμος που υλοποιεί το SGV, καθώς και η αξιολόγηση του. Επίσης παρουσιάζεται η αρχιτεκτονική και η υλοποίησή της σε επίπεδο hardware. Η χρήση του προτεινόμενου κριτηρίου σε έναν κωδικοποιητή Η.264 μπορεί να προσδώσει μια περισσότερο αποδοτική από πλευράς ισχύος υλοποίηση ενώ ταυτόχρονα θα διατηρείται η ποιότητα του video και η απόδοση της κωδικοποίησης.
περισσότερα
Περίληψη σε άλλη γλώσσα
Video has always been the backbone of multimedia technology. In the last two decades the field of video coding has been revolutionized by the advent of various standards like Η.261 to Η.263 and MPEG-1 to MPEG-4 each addressing different aspects of multimedia Η.264 is a new standard which adds one more step in the endeavour towards video coding excellence and provides one-stop solution for wide range of applications. The standard has been developed by the Joint Video Team (JVT) comprised of both ISO/IEC and ITU-T. The primary goal of Η.264 is to achieve higher compression while preserving video quality. The motivation for compression is to compensate for the ever-present constraints of limited channel capacity. The keys to high coding efficiency of Η.264 are the two prediction modes (Intra & Inter) provided by the standard which adopt many new features such as variable block size searching motion vector prediction etc. However these result in a considerably higher encoder complexity tha ...
Video has always been the backbone of multimedia technology. In the last two decades the field of video coding has been revolutionized by the advent of various standards like Η.261 to Η.263 and MPEG-1 to MPEG-4 each addressing different aspects of multimedia Η.264 is a new standard which adds one more step in the endeavour towards video coding excellence and provides one-stop solution for wide range of applications. The standard has been developed by the Joint Video Team (JVT) comprised of both ISO/IEC and ITU-T. The primary goal of Η.264 is to achieve higher compression while preserving video quality. The motivation for compression is to compensate for the ever-present constraints of limited channel capacity. The keys to high coding efficiency of Η.264 are the two prediction modes (Intra & Inter) provided by the standard which adopt many new features such as variable block size searching motion vector prediction etc. However these result in a considerably higher encoder complexity that adversely affects speed and power which are both significant for many of the applications targeted by the standard. Therefore it is of high importance to design architectures that minimize the speed and power overhead of the prediction modes. In this work we present a novel matching criterion for prediction as well as the algorithm and the architecture that implements it. The use of this criterion in a H.264 encoder can provide a power efficient hardware implementation without perceivable degradation in coding efficiency or video quality.
περισσότερα