Macht Alex den Toni arbeitslos? | Retro-Artikel

Rückblick: Wie funktioniert Audio-KI in der Praxis? "Alex Audio Butler" besteht aus VSTPlug-ins, welche die Tonabmischung eigenständig erledigen sollen. Die großen Player im VST-Game: DaVinci Resolve, Premiere Pro und Adobe Audition.

Dieser Artikel erschien ursprünglich in der DP 04 : 2021.

Alex Audio Butler (kurz: AAB) ist eine kleine Reihe von VSTPlug-ins, die sich in gängige Videoprogramme einklinken und versprechen, eigenständig die Tonabmischung zu erledigen. Derzeit sind das DaVinci Resolve, Premiere Pro und Adobe Audition. Weitere sind in Arbeit. AAB läuft unter Windows 10 und Mac OS ab 10.13, beim Mac sogar schon nativ mit M1, aber es geht nicht mit der AppStore-Version von Resolve. (Doch wer will die schon?)

Den allgemeinen Überblick zu KI im Audiobereich gibt euch mein dafür fachlich berufener Kollege Björn Eichelbaum in diesem Heft ab Seite 72. Ich dagegen oute mich hier als Testperson ohne jegliches Audio-Fachwissen; allenfalls war ich mal in jüngeren Jahren in der Lage, mit dem Equalizer der Stereoanlage meine Musik auf Disco-Wumms zu verkurbeln. Bei anspruchsvollen Filmprojekten habe ich die wichtige Rolle des Tons immer respektiert und diese Arbeit den Fachleuten überlassen.

Endabmischung vom Roboter

Aber wie ist es mit einem kleinen, unterfinanzierten Projekt, bei dem dafür gar kein Etat vorhanden ist? Wir haben den Praxistest bei einem Videoporträt gemacht, mit dem sich eine Hochschule aus einem Schwellenland vorstellen möchte. Alex Audio Butler von der Firma Unimule aus den Niederlanden sollte dabei die Lautstärke regeln, falls nötig einen Kompressor einsetzen und das Audio Ducking übernehmen (das ist die Reduktion der Hintergrundmusik oder Effekte bei einsetzender Sprache).

Wir haben mit Resolve gearbeitet, wo AAB sich nach der Installation unter den Filtern für Fairlight bei Uncategorized > VST findet. Selbstverständlich haben wir beim Schnitt darauf geachtet, die Töne nach Funktion auf einzelne Spuren zu legen. AAB unterscheidet zwischen Voice, Music und Sound FX (wobei Letztere in unserem Projekt nicht vorkamen). Man sollte die kleinen Helfer aber nicht nur auf die einzelnen Spuren legen, sondern auch auf den Master.

Nach der Auswahl der Funktion für die jeweilige Spur muss man sich bei den Einstellungen nicht mit Hertz, Dezibel oder Attack- und Decay-Zeiten auseinandersetzen. Stattdessen wählt man die jeweilige Aufgabe unter wenigen allgemein verständlichen Begriffen, die zudem mit erklärenden Texten versehen sind. Die dürfte auch ein Videomensch ohne Probleme verstehen – notfalls hilft ausprobieren. Das PDF-Handbuch beschränkt sich auf Installation und Lizenzierung. An sich reicht das auch völlig, aber ihr findet zusätzlich Videos unter „Alex Audio Butler“ bei Youtube.

Anschieben

Wenn man versucht, gleich das komplette Werk auszugeben, kommt oft die Fehlermeldung, dass Alex mit der Analyse noch nicht fertig gewesen sei. Warten nützt da nichts, stattdessen muss man dem kleinen Kerl ein bisschen auf die Sprünge helfen. Man sollte entweder den ganzen Film einmal komplett abhören oder einfach zwei- oder dreimal allein den Ton ausgeben, was meist schneller geht als das Berechnen aller Bilder.

Dann kommt letztlich die Meldung, dass die Analyse erfolgreich war, und jetzt kann man auch den gesamten Film mit Video rendern lassen. Allerdings dürften die Bildschirmmeldungen gern ein bisschen größer ausfallen – wir konnten sie auf einem 27-ZollMonitor mit 2.560 x 1.440 Pixel kaum noch erkennen, obwohl Schriften in Resolve dabei noch gut lesbar blieben.

Ergebnis

Das Ergebnis kann sich durchaus hören lassen – ein blutiger Audio-Laie bekäme es wohl kaum besser hin. In unserem Fall gab es im Wesentlichen das gängige Problem mit unerfahrenen Sprechern, die oft laut loslegen und dann immer leiser werden oder sich langsam in der Lautstärke steigern. Das bekommt AAB durch interne Keyframes ganz gut in den Griff, ohne in Pausen die Hintergrundgeräusche hochzuziehen, denn er erkennt die menschliche Stimme. Zusätzlich kann man einen Kompressor in mehreren Stufen einsetzen. Hintergrundmusik aus zwei völlig unterschiedlichen Quellen auf einer Spur wurde gut auf gleiche subjektive Lautstärke geregelt. Ihr könnt aber auch mehrere Spuren mit unterschiedlichen Einstellungen für die Musik benutzen. Dabei gibt man nur die Lautstärke bei Musik im Vordergrund und die Relation des Auto-Ducking an. Bei der Beurteilung von Kompression und Audio-Ducking kommt es auch auf die Abhöranlage an. Wir waren mit dem Ergebnis per Lautsprecher am Computer und auch über einen hochwertigen Kopfhörer recht zufrieden. Doch es kam Kritik nach der Vorführung über eine Saalanlage. Kein Problem: schnell die Kompression und das Ducking geändert, neu angeschubst, und schon war auch die Hochschule zufrieden.

Kommentar

Was AAB keineswegs leisten kann, ist die Reparatur von Fehlern und Störungen bei der Aufnahme. Die muss durch präzise Justage entsprechender Filter (die heutzutage auch schon auf KI basieren können) von Fachleuten mit geschulten Ohren erledigt werden. Der Alex wird auch keine perfekte Spielfilmabmischung liefern, bei der die emotionale Wirkung von sehr subtilen Faktoren abhängt. Aber einfache Projekte mit Interviews, OffKommentar und Hintergrundmusik bekommt der Butler bei technisch sauberen Aufnahmen durchaus in den Griff – zurzeit noch für den Einführungspreis von 79 Euro.

Kommentar schreiben

Please enter your comment!
Please enter your name here

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.