Lassen Sie mich zum Abschluss dieser Staffel noch einmal die wesentlichen Ergebnisse zusammenfassen: Wir haben mit einzelnen Tönen und mit Rosa Rauschen gearbeitet und hatten zwei sehr gute Ergebnisse. Sowohl der mit TooLAME erstellte Stream (MPEG-1 Audio Layer II), als auch der AC3-Stream, encodet mit dem Encoder von Gerard Lantau in BeSweet, haben die von mir gesetzte Hürde von 20 kHz überwunden. Doch wie klingt das in Wirklichkeit? Ich habe mir dazu die ersten Takte aus dem Ausschnitt von Giuseppe Verdis "Nabucco" mit Chor und Orchester der Deutschen Oper Berlin ausgewählt und nochmals visualisiert. Hier die Frequenz-Analyse zum Zeitpunkt 14:50.055 meines Test-Streams:
Während AC-3 fast dem Original entspricht, ist MPEG-1 Audio Layer II hier sehr abgesackt und bringt nur knapp 15 kHz. Nun werden Sie fragen, wie es zu so unterschiedlichen Ergebnissen kommen kann, wo doch alle Encoder beim Rosa Rauschen die 20 kHz - Grenze überwunden haben. Ja, wenn das alles im Leben so einfach wäre.... Nun weiß ich selbst, dass alle bis jetzt gemachten Tests im Prinzip recht ungeeignet sind um eine verlustbehaftete Komprimierung zu testen. Die hübschen Bilder auf den letzten Seiten hatten im Wesentlichen nur das Ziel, Ihnen die Grundlagen näher zu bringen. Alle Ton-Komprimierungen orientieren sich nämlich letztendlich an der akustischen Wahrnehmung. Bei solchen Komprimierungen werden z.B. die Frequenzen in einem Musikstück entfernt, die durch andere, gleichzeitig gespielte, überlagert werden und deshalb für das menschliche Ohr nicht wahrzunehmen sind. Akustische Wahrnehmung des Menschen hat also nicht nur was mit dem Gehör, sondern auch mit dem Gehirn zu tun. Dieses "Vorenthalten" von bestimmten Frequenzen erfolgt übrigens über die so genannte "Maskierung". Es wird also einfach eine Maske über den Frequenzverlauf gelegt. Ein sehr schöner Fall für eine solche Maskierung ist das Auftreten eines lauten Geräusches (Gauß-Impuls), z.B. ein Paukenschlag. Nach einem solchen Ton benötigt das Gehör einige Millisekunden um wieder auf leise Töne reagieren zu können. Also kann ich doch die leisen Töne gleich ganz weglassen. Und so ist es im Prinzip egal, ob ein einfacher isolierter Sinus-Ton von 20 kHz encodet wird oder nicht. Auf den Zusammenhang kommt es an. Wer sich für Details
interessiert, dem sei die Dissertation
Und mit einer guten Komprimierung einher geht auch die Anwendung eines guten psychoakustischen Modells. Stark vereinfacht gesagt werden bestimmte Frequenzen bevorzugt oder einfach nur in der Amplitude angehoben oder abgesenkt, also lauter oder leiser als im Original wiedergegeben. Das Wissen über Psychoakustik stammt übrigens vorwiegend aus empirischen Versuchen. Nun hat man bei dem ein oder anderen Encoder direkten Einfluss auf diese psychoakustischen Modelle. Und zwar z.B. in TooLAME über den Parameter "psy". Der sicher vielen von Ihnen bekannte Web-User mit dem Namen "Anwender G." gab mir den Hinweis, dass "psy 1" bei Datenraten von > 224 kbps recht gute Ergebnisse bringt und "psy 2" deutlich besseren Klang (etwas mehr Berücksichtigung der höheren Frequenzen) bei Datenraten unter 160 kbps produziere. "Anwender G." wies in diesem Zusammenhang auch darauf hin, dass man bei MP2 bevorzugt mit "Stereo" und nicht mit "Joint-Stereo" arbeiten solle, um eine evtl. vorhandene Surround-Information nicht zu zerstören. AC-3 scheint in dieser Hinsicht aber offensichtlich nicht so empfindlich zu sein, denn da kann man auch recht gefahrlos "Joint-Stereo" nutzen. Kommen wir jedoch auf unsere drei Kurvenverläufe zurück. Hier ist ganz offensichtlich, dass TooLAME mit MPEG-1, Layer II, beschlossen hatte, bestimmte Frequenzen nicht wiederzugeben, da die wohl nicht wahrnehmbar seien. Ob das nun wirklich zu hören ist, können Sie nur in einem echten Hörtest ermitteln. Nun wollte ich mit meinen Mitteln keinen
Im nächsten Analyse-Schritt stand also eine echte Hörprobe auf dem Programm. Ich habe dazu einen Testfilm auf MPEG-Basis gebaut, der folgende Streams in sich vereinigten:
Fragen Sie mich bitte nicht, wie ich das in einen VOB-Stream
hineinbekommen habe. Vielleicht erkläre ich es Ihnen mal bei Gelegenheit,
denn bei der DVD sind bis zu acht Tonspuren
möglich. Dabei kann jede der Tonspuren ein anderes Format benutzen.
Im Prinzip geht es so, wie im EDV-TIPP
Ein großes Problem bei der Herstellung einer solchen DVD ist aber nicht das Muxing - das kann z.B. TMPGEnc ganz hervorragend. Ein großes Problem sind meistens die "Authoringprogramme". Ich schreibe das bewusst in Anführungszeichen, da die Programme alles mögliche machen, nur kein Authoring. Oder zumindest ein Authoring nach ihren ganz eigenwilligen Regeln. So multiplext die eine Gruppe von Programmen den Stream vollkommen neu und "vergisst" dabei - so ganz durch Zufall - von den sechs Tonspuren im Stream fünf! Ja, Sie haben richtig gelesen - Sie haben sich viel Arbeit mit dem Multiplexing gemacht und zum Schluss ist im Stream nur noch eine Tonspur wirklich drin! Andere Authoringprogramme hingegen reißen den Rechner (oder zumindest den ausführenden Task) beim Auftauchen von solchen Mehrfachtonspuren in die Tiefen des Betriebssystems und belohnen den Anwender mit einem Absturz. Wieder andere Authoringprogramme selektieren sich den qualitativ besten Audio-Stream (AC-3) heraus und brennen nur diesen auf die DVD. In meinem konkreten Beispiel habe ich eine wunderschöne DVD mit 6
Audio-Streams produziert - wie man hier mit
Und auch VOBrator erkannte sehr schön alle Tonspuren:
Doch mein YAMMI erkannte davon nur zwei Spuren! Und zwar eine MPEG- und eine AC-3-Spur. Also, das Thema ist offensichtlich einen eigenen EDV-TIPP wert. Mal sehen, ob
ich das in der zweiten Jahreshälfte 2003 hinbekomme. Zur Zeit habe ich
dazu mehr Fragen als Antworten! ;-) Kommen wir jedoch zurück zu unserer Test-DVD: Neben dem Stream mit den sechs Tonspuren habe ich noch für einen direkteren Vergleich einen Film gebaut, der folgende Einzelstreams enthielt :
Sowie eine weitere DVD mit
Wenn ich darf, würde ich gerne noch einen Augenblick bei der WinOnCD-Lösung verbleiben, die im ersten Film als Spur 6 mitlaufen sollte. Während Roxio mit WinOnCD in früheren
Versionen noch auf die
Einer der vielen anderen
Während mir die Bildqualität von WinOnCD wirklich gut gefiel, hatte ich etwas Probleme mit dem Ton. Um hier bessere Informationen zu gewinnen, habe ich WinOnCD mit in meinen Test aufgenommen. Über die Funktion "Formatumwandlung" in WinOnCD wurde mein Ausgangs-AVI einfach zu einer VOB-Datei gewandelt und da dann der Sound durch demuxen wieder zurückgewonnen. Ein Blick auf das Rosa Rauschen zeigt uns eine kleine Betonung des linken Kanals (blaue Hüllkurve):
Die lila Kurve offenbart uns, dass bei etwa 16 kHz Schluss ist mit der Bandbreite. Während der linke Kanal noch knapp 17 kHz rüberbringt. Ich vermute mal, die Roxio-Leute arbeiten bei der MPEG-1 Codierung mit einer Datenrate von 192 kbps, obwohl der Stream mit 224 kbps ausgewiesen wird. Die Strategie, die dahinter liegt, ist mir allerdings nicht klar geworden, zumal an einer anderen Stelle im Rauschen urplötzlich wieder ein kleines Frequenzband bei etwa 18 kHz auf der linken Seite auftaucht.
Trotz oder gerade wegen dieser Strategie hat es WinOnCD aber dennoch geschafft, den 20 kHz-Ton zu encoden:
Zwar mit ein paar mülligen Frequenzen dabei, aber immerhin. An den 22 kHz-Ton war jedoch auch hier nicht zu denken. Bedingt durch diese Besonderheit hatte ich diesen Stream mit in meinen Hörtest aufgenommen. Ich war einfach gespannt, wie das in der Praxis klingt. Doch leider konnte ich meinen YAMMI nicht davon überzeugen, meinen 6-fach Audio-Stream abzuspielen und so habe ich mir den WinOnCD-Stream mal für einen späteren Zeitpunkt aufgespart, da er für meinen EDV-TIPP hier nicht als so typisch einzustufen ist. Für eine Hörprobe habe ich mir mehrmals ein paar fachkundige Leute eingeladen. Also, Leute, die was von Musik und Elektroakustik verstehen. Und die haben alle eine Hörprobe gemacht. Dabei wurde der Ton von meinem YAMMI über die nachgeschaltete Stereoanlage abgespielt. Ich will Sie nun nicht mit Einzelergebnissen langweilen, aber keiner meiner Testteilnehmer hat einen wirklichen gravierenden Unterschied zwischen den hier dargebotenen Stücken herausgehört. Erst AC-3 mit Datenraten kleiner 192 kbps (noch als Test-DVD nachgeschoben) fiel sofort auf. Leider war auch der Unterschied zwischen MPEG-1 mit 256 kbps und AC-3 mit 192 kbps bzw. 256 kbps nicht eindeutig genug. Es gab, trotz der bis jetzt nachgewiesenen messtechnischen Vorteile für AC-3, keinen klaren Sieger. Erst das Abhören der Musikstücke mit einem Kopfhörer brachte einen kleinen Vorteil für den AC-3 - Stream. Hier wurde von den Zuhörern der AC-3-Klang als "voller" eingestuft. Einer meiner Testteilnehmer wusste nun zu berichten, dass die ganze Sache
mit den hohen Tönen und den Oberwellen bzw. dem "warmen" Ton doch gar nicht
gewollt sei. Selbst der Dolby-Referenz-Decoder,
Und so wollte ich es mal wieder genau wissen: Bei meinem DVD-Player handelt es sich um den schon etwas betagten AVPhile 715 von Yamakawa und der macht nur eine 2-Kanal Downmix der Audio-Ausgänge für alle Dolby Signale. Also so richtig repräsentativ ist er nicht, dennoch kann man lange darüber philosophieren was besser ist - im Zweifel muss man es einfach messen. Aus diesem Grunde habe ich mir meinen YAMMI an meinen PC angeschlossen und den Ausgang des YAMMIs auf den Eingang der Soundkarte gegeben. Mit Hilfe der Software Oscilloscope
und der Wiedergabe meiner Test-Audio-CD (
Neben den Signalen für die Hochtonmessung (1, 18, 20 und 22 kHz) kam auch der Sweep problemlos bis zu seinen 21 kHz rüber. Im nächsten Schritt habe ich dann den Messaufbau um die anderen Bausteine meiner Stereo-Anlage erweitert und auch da war nachzuweisen, dass alle den 22 kHz noch sehr sauber darstellen konnten. In einem weiteren Schritt habe ich dann meine Test-DVD mit dem AC-3 - Ton abgespielt:
Und wie Sie sehen können, kommen die 21 kHz im Sweep noch sehr sauber aus der Anlage heraus. Der Sweep hat nun den Vorteil, dass die Decodersoftware sich (sofern sie einigermaßen "vorausschauend" ist) auf die steigende Frequenz einrichten kann. Der Sweep ist darum für eine Beurteilung von De- und Encodern nicht so gut geeignet. Aus diesem Grund habe ich wieder das Rosa Rauschen als Quelle genommen und hier konnte man erst sehen, dass der YAMMI mit den Frequenzen über 19 kHz so seine Problem hat.
Der hier oben dargestellte Frequenzverlauf ist die Analyse des TMPGEnc-MPEG-1-Stream (256 kbps). Zur Sicherheit habe ich auch noch den TooLAME-Stream "vermessen". Aber das brachte auch keine höhere Bandbreite. Bei 19,5 kHz war bei meinem YAMMI mehr oder weniger Schluss. Nun wollte ich sehen, wie das Ergebnis bei AC-3 aussieht. Und siehe da, es wurde nicht gerade besser:
Zwar waren Frequenzen größer 20 bzw. 21 kHz vertreten (im Gegensatz zu der MPEG-Decodierung), aber das sah doch alles sehr stochastisch, also zufällig, aus. Der Decoder in meinem YAMMI ist doch sehr für die Mütze, wenn ich das mal so platt sagen darf. Und da werde ich sicher beim Kauf eines neuen DVD-Players etwas genauer hinsehen. Genau in dem o.a. Problem war vermutlich auch der Grund zu suchen, warum AC-3 nicht als so klarer Sieger aus meinem Hörtest hervorgegangen ist, denn mein YAMMI und seine AC-3-Wiedergabe war das schwächste Glied in der Wiedergabekette.
Was ist denn jetzt das Fazit aus der ganzen Sache? Sie, als Hobby-Filmer sehen das Thema aus einem etwas anderen Blickwinkel als die Leute, die sich Sicherheitskopien von ihren DVDs machen wollen. Während eine DVD meist einen Ton beinhaltet, der mit viel Aufwand in einem Studio entstanden ist, ist die Basis für Ihren Ton zuerst einmal der Ton vom Camcorder. Selbst wenn Sie einen "Drei-Chip-Camcorder" wie z.B. den "Canon XM 2" besitzen, liegt der aufgezeichnete Frequenzbereich nur zwischen 130 und 15.300 Hz. Eine bessere Quelle ist meist ein sep. Aufzeichnungsgerät. Um einen Film nun ansprechend aufzubereiten wird er (eine DV-Quelle unterstellt) mit einer Audio-Sampling-Frequenz von 48 kHz geschnitten. 48 kHz ist auch die Basis für eine DVD. Wollen Sie Ihren DVD-Film mit Musik von einer CD etwas aufpeppen, so müssen Sie die Songs der Musik-CD von 44,1 kHz auf 48 kHz Sampling-Frequenz wandeln - am besten bevor Sie den Sound in Ihr Schnittprogramm einfügen. Wird daraus eine SVCD, so ist für MPEG-1 Audio Layer II eine Datenrate von 128, 160, 192 oder 224 kbps angemessen. Da Sie hier einen Kompromiss zur Datenmenge eingehen müssen, empfehle ich meist 192 kbps. Stellen Sie Ihre eigene DVD her, so können Sie MPEG-1 Audio Layer II mit 256 kbps oder Dolby Digital 2.0 mit > 192 kbps nutzen. Ich selbst setze für meine DVDs überwiegend AC-3 mit 256 kbps ein und das nicht nur wegen des besseren Klangs, sondern auch wegen der höheren Kompatibilität einer so hergestellten DVD. Beachten Sie bitte, dass der AC3-Stream als "big-endian" gewandelt wird. Das steigert die Kompatibilität weiter.
Denn nur diese Einstellung ist wirklich DVD-konform, wie
z.B. der obige Screen aus dem Sonic Scenartist - Encoder zeigt. Details zum
Thema "endian" hatten wir ja schon in der letzten
Leider beschäftigen sich die "Fachzeitungen" viel zu wenig mit dem Thema Tonqualität. Fast alle "Testberichte", die ich gelesen habe, schauen nur auf die Bildqualität von Encodern und Schnittprogrammen. Vermutlich sind die meisten der Tester taub oder so alt, dass sie nur noch Frequenzen bis 5.000 Hz hören. Sie, als Anwender sind also darauf angewiesen, sich selbst Ihr Urteil zu bilden. Leider meist erst nach dem Kauf einer Schnittsoftware oder eines Encoders. Für eine Analyse benötigen Sie ein Weißes oder Rosa Rauschen, einen Sweep mit steigender Frequenz (möglichst bis 21 kHz) und für Messungen im Hochtonbereich entsprechende Signaltöne. Und nicht zu vergessen einen "echten" Hörtest. Als Tools sind hilfreich Programme wie Cool Edit Pro und Spectrogram zu
nennen und 'Last but not least' Sehen Sie bitte von Anfragen an mich ab, ob ich Ihnen die Test-Töne zur Verfügung stellen kann. Leider ist das nicht möglich, da die von mir eingesetzten Töne einem fremden Copyright unterliegen. Es gibt gerade für den Audiobereich unendlich viele Anbieter von guten Test-CDs und die wollen ja auch leben. ;-)
Zum Schluss dieser Staffel über den Ton noch ein paar weiterführende
bzw. ergänzende Links
|
|
| ||
| 031101 | ||