|
Im nächsten Schritt werden wir etwas über Dateiformate und die Komprimierung lesen und evtl. auch lernen. 90 Minuten Spielfilm mit 25 Einzelbildern pro Sekunde, bei einer hohen Auflösung und vielen Farben ergeben eine Datenmenge von so rund 110 GByte. Das ist eine Informationsflut, die auf fast keinem PC zu bewältigen ist. Die Daten müssen also komprimiert werden. Komprimieren ist das Weglassen oder Umstrukturieren von Daten, um die Größe einer Datei zu verringern. Für das Komprimieren von Videos, die unter Windows laufen bzw. verarbeitet werden sollen, sind zahlreiche Komprimierungs- und Dekomprimierungs-Algorithmen (Codecs) verfügbar. Die Abkürzung „Codec“ steht übrigens für COmpressor / DECompressor. Ein solcher Codec kann auf Hardware oder einer reinen Softwarelösung basieren. Hardwarelösungen haben in der Regel den Vorteil der Geschwindigkeit, da die elektronischen Bausteine eigens für eine spezielle Aufgabe, nämlich das Komprimieren oder Dekomprimieren, entwickelt wurden. Das Geheimnis einer guten Bilddarstellung liegt im ausgewählten Algorithmus. Er beeinflusst die visuelle Qualität und die Geschwindigkeit, mit der das Video am Bildschirm wiedergegeben werden kann. Im AV Master Handbuch der Firma Fast habe ich eine sehr schöne Tabelle gefunden, die einmal das Verhältnis von Kompression und Bildqualität darstellt:
Alle heute gebräuchlichen Codecs sind übrigens stark asymmetrisch. Das bedeutet, dass der eigentliche Kompressionsvorgang recht lange dauert. Die Dekompression zur Darstellung erfolgt dagegen sehr schnell.
Codecs für fernsehähnliche Qualität verwenden derzeit eines von drei Verfahren: Motion-JPEG (M-JPEG) M-JPEG ist kein eigentlicher Standard, vielmehr gibt es verschiedene Verfahren, wie der JPEG-Standard auf Bewegtsequenzen angewandt wird. Jedes einzelne Bild eines Film wird also per JPEG komprimiert. Zu diesem Thema haben wir ja schon mal was bei den
M-JPEG wird vor allem im Bereich des nichtlinearer Videoschnitt verwendet und erlaubt prinzipiell Datenraten von wenigen MBit/s bis hin zu der des unkomprimierten Videosignals. Entsprechend ist auch die Bildqualität unterschiedlich. Typisch reduziert M-JPEG den Datenstrom eines Videos auf ca. 4 MByte/s. Zwar kommt dazu noch der Stereoton mit 172 KByte/s – aber das ist in diesem Zusammenhang erst einmal zu vernachlässigen. M-JPEG-Videos werden unter Windows fast ausschließlich im AVI-Dateiformat abgelegt, unter dem Mac OS in der Regel als Quick-Time-Video.
MPEG Die Abkürzung steht für „Motion Pictures Expert Group“. Sehen Sie auch
Der MPEG-Standard unterteilt sich in MPEG-1, MPEG-2, MPEG-3 (zwischenzeitlich in MPEG-2 integriert) und MPEG-4. Da sich zwei aufeinanderfolgende Bilder einer Filmszene in der Regel kaum unterscheiden, wird bei dem MPEG-Verfahren nicht jedes Bild komplett komprimiert. Anstelle mit hohem Speicheraufwand alle Bilder zu komprimieren, werden lediglich die veränderten Bilddetails erfasst und weiterverarbeitet. Dazu werden die Bilder eines MPEG-Videos in kleine quadratische Bildbereiche (8 x 8 bzw. 16 x 16 Pixel) eingeteilt. Das MPEG-Format speichert in regelmäßigen Abständen von typisch 12 oder 15 Bildern sogenannte Intra-Frames (I-Frames) ab. Das sind im Prinzip JPEG-komprimierte Einzelbilder. Die Bilder zwischen diesen I-Frames werden nach Möglichkeit nicht komplett abgelegt. MPEG speichert dabei aber das Verfahren bzw. die Berechnungsmethode ab, wie man diese Bilder durch Verschieben von Blöcken aus den vorangegangenen oder nachfolgenden Bildern zurückgewinnen kann. Dazu werden vorausschauende „Predicted Frames“ (P-Frames) und „Bi-directionale Frames (B-Frames) eingesetzt. Mit dieser Methode lässt sich der Datenaufwand für eine Video extrem verringern. Die mögliche Kompression geht bis zu 200:1. Eine häufig auftretende Nebenwirkung dieser Komprimierungsmethode ist aber eine Art von Blockbildung innerhalb der Videobilder. Sie zeigen sich als mosaikartige Pixelklötze und als unruhige Muster an den Konturen – sogenannten „Moskitoschwärme“. Man spricht hierbei von Kompressions-Artefakten (Kunstprodukte). Achten Sie mal bei den Nachrichtensendungen der "Privaten" auf Zuspielungen aus dem Ausland. MPEG-1 / Standard ISO/IEC11172 (1992) Die ursprüngliche Aufgabe war es, ein Format zu entwickeln, das es ermöglicht, fließende Bilder und den dazugehörigen Ton von einer (Single-Speed-) CD in Echtzeit zu lesen. Das bedeutet, Bilder und Ton müssen in einen Datenstrom verpackt werden, der ca. 1,5 MBit pro Sekunde nicht überschreitet. Daraus ergibt sich, dass auf einer 650-MByte-CD etwa 74 Minuten Bild und Ton untergebracht werden können. 25 PAL-Fernseh-Bilder pro Sekunde im Format 768 × 576 bei 24 Bit Farbtiefe ergeben aber einen Datenstrom von 32 MBytes/sec. Auf eine CD mit 650 MByte Speicherkapazität würde demnach nur ein 20-Sekunden-Film passen. Um hier dennoch eine Lösung zu haben, hat man sich zwei Komponenten zur Datenreduktion ausgedacht: Zuerst hat man das Videosignal vereinfacht und im nächsten Schritt die Redundanzen entfernt - man hat also das Bild komprimiert. Schauen wir uns zuerst die Vereinfachung des Videosignals an: Da bei sich bewegenden Motiven zwei Halbbilder mit einer zeitlichen Verzögerung von 1/50 sec = 20 msec entstanden sind, können sie nicht exakt zu einem konsistenten Vollbild vereinigt werden. Daher stützt sich die Kompression eines Einzelbilds nur auf ein Halbbild. Zusätzlich hat man noch die Auflösung halbiert. Von 575 sichtbaren PAL-Zeilen auf der vertikalen Achse bleiben also nur 288 übrig (siehe auch
Das entspricht nach Meinung von einigen „Experten“ bzw. Fachzeitschriften der Auflösung eines VHS-Videorecorders. Schaut man aber genauer hin (z.B. mit einem stehenden Testbild – wie wir das bei den EDV-TIPPs machen werden, oder auch bei Bewegtbildern), so kann man feststellen, das eine VHS-Aufnahme (meiner Meinung nach) doch immer noch deutlich besser als ein MPEG-1-Stream ist. Der Datenstrom liegt heute übrigens bei 1,2 bis 3 MBits/s. Audio- und Videodatenstrom ergeben gemischt einen „MPEG-1 system stream“, der in einer Datei mit der Kennung .mpg abgelegt wird. Wo finden wir nun MPEG-1-Videos?
MPEG-2 / Standard ISO/IEC13818 (November 1994) Die Kodierung ist im wesentlichen dieselbe wie unter MPEG-1. MPEG-2 hat seine Hauptanwendung bei Fernsehübertragungen. Es unterstützt aber auch CD-ROM Anwendungen. MPEG-2 stellt deshalb Datenübertragungsraten von 1,5 MBit/s bis 80 MBit/s zur Verfügung und unterstützt neben dem Vollbild (progressive scan) auch das Zeilensprungverfahren (Interlace). Fernsehbilder bestehen aus einer Folge von 25 Einzelbildern pro Sekunde, wobei ein Bild in zwei Schritten übertragen wird: Zuerst alle ungeraden Zeilen, dann alle geraden Zeilen. Durch dieses Zeilensprungverfahren (Interlace-Modus) entsteht beim Zuschauer der Eindruck, als würde das Bild zweimal aufgebaut (mit 50 Hz). Experten glauben übrigens, dass MPEG-2, besonders bei Übertragungen via Satellit, die heutigen analogen Systeme bis zum Jahre 2010 ersetzen wird. Anstatt nur eine Auflösung wie MPEG-1 unterstützt MPEG-2 im Wesentlichen vier:
Die Auflösung "Low" garantiert die Rückwärtskompatibilität mit MPEG-1. Main ist die normale Auflösung für Fernsehübertragungen und die letzten beiden Auflösungen sind für HDTV (High Definition Television) konzipiert. Die Daten liegen - wenn man so will - in Studioqualität vor. MPEG-2 ist damit quasi zum Broadcaststandard geworden. Für gute Bilder reicht in der Regel bereits ein Datenstrom zwischen 2 und 6 MBit/s. Bei reiner I-Framecodierung lässt sich MPEG-2 auch problemlos im Schnittbetrieb einsetzen. Einsatz:
Der "Film-Aufbau" Zum Abschluss noch ein paar Hinweise zur Bildreihenfolge. Das ist zwar zur Zeit nicht besonders wichtig, macht aber deutlich, wie später ein entsprechender Codec eingestellt werden kann. Wir haben also gelernt, dass die reinen Schlüsselbilder, I-Frames, unabhängig von den anderen Bildern codiert werden. Weitere Referenzbilder, die P-Frames, stellen die Abhängigkeiten zwischen Bildern in zeitlich positiver Achse dar. Im Prinzip sind P-Frames mehr eine Rechenvorschrift als ein Bild. Zwischen diesen I- und P-Bildern gibt es nun die B-Bilder, die Abhängigkeiten in zeitlich positiver und negativer Richtung darstellen können. Schauen wir uns mal einen typischen Bildablauf - eine GOP (Group of Pictures) - an. Als Parameter sei der Abstand 12 für die I-Frames und 4 für die P-Frames gesetzt.: I BBB P BBB P BBB Da kommt also zuerst ein I-Frame. Dann drei B-Frames und als viertes Bild ein P-Frame. Dann wieder drei B-Frames, ein P-Frame und zum Schluss wieder drei B-Frames. Danach geht das Spiel von vorne los – und zwar mit einem I-Frame. Dieser Zyklus wiederholt sich nun laufend. Die Kompression der B-Frames ist am größten. Deshalb gilt die Regel, dass man für eine hohe Kompression möglichst viele B-Frames verwenden muss. Umgekehrt sollte man bei einer niedrigen Kompression möglichst wenige B-Frames verwenden. Der Parameter für die I-Frames muss zwingend ein Vielfaches des „P“-Parameters sein. Typische Zyklen für hohe Kompression ist z.B. I = 12 und P = 4 oder I = 15 und P = 5. Für eine niedrige Kompression (das bedeutet im Umkehrschluss auch für einen höheren Speicherbedarf) nutzt man I = 10 und P = 2 oder I = beliebig und P = 1 das führt dazu, dass gar keine B-Frames codiert werden. Das Abspielen eines so codierten Videos ist übrigens nur von einem I-Frame, als Startpunkt aus möglich. Von einem P- oder B-Frame kann nicht begonnen werden. Das macht den wirklich bildgenauen Videoschnitt von MPEG-2 Dateien recht schwer. Will man „bildgenau“
und VERLUSTFREI schneiden, so muss ein MPEG-2-Film aus reinen I-Frames bestehen. Damit ist aber der Vorteil der hohen Kompression verspielt. Also besser erst den Film schneiden (z.B. als M-JPEG) und dann kodieren. Zumindest sollte man aber bei der Komprimierung beachten, dass jede Video-Szene, die der Anwender am DVD-Player direkt anwählen kann, auch mit einem I-Frame beginnt. Denn nur dieses Frame trägt die vollständige Bildinformation. Wird das Video zuerst encodiert und später im Authoring eine Szene definiert, so ist es sehr wahrscheinlich, dass an diesem Szenenanfang kein I-Frame vorhanden ist. Ein DVD-Player z.B. wird dann das nächste I-Bild anspringen. Liegt dieses vor der betreffenden Szene, so wird für ca. eine halbe Sekunde das Ende der vorherigen Szene noch abgespielt, was sich meist als sehr störend erweist. Die Decodierung des Films erfolgt übrigens nicht linear - also Bild für Bild. Während der Anzeige des ersten I-Bildes wird bereits das nachfolgende P-Bild decodiert. Die nächsten B-Bilder werden unmittelbar nach ihrer Decodierung angezeigt. Nun kann das bereits decodierte P-Bild angezeigt werden, während das nächste I-Bild bereits decodiert wird.
MPEG-3 MPEG-3 (bitte nicht verwechseln mit MP3) war ursprünglich für hochauflösende Videoanwendungen wie HDTV mit Auflösungen bis zu 1920 x 1080 Punkten vorgesehen. Statt dessen ist dies mit in den MPEG-2 Standard übernommen worden. MPEG-4 / Standard ISO/IEC14496 (1999) Zur Vollständigkeit will ich noch MPEG-4 erwähnen. Ein recht junges Format, das besonders im Bereich Videokonferenzen benutzt werden soll. Hier kann man davon ausgehen, dass im Verlauf der eigentlichen Anwendung nur leichte Bildänderungen passieren. Auflösung 176 x 144 Bildpunkte bei einer Datenrate von 4,8 bis 64 kBit/s. Findige Köpfe nun bringen in diesem Format ganze Spielfilme auf eine CD. Für den echten Videofilmer mit einem etwas gehobenen Qualitätsanspruch ist das allerdings kein geeignetes Format.
| ||||||||||||||||||||||||||||||||||||||||||||||||