Blackmagic eGPU: Zusatzgrafik mit Apples Segen

Thunderbolt nährte ja schon früh die Hoffnung, damit die Grafikleistung seines Rechners aufmöbeln zu können. Doch lange Zeit wurde nur die Nutzung von schnellen Speicherlösungen unterstützt, nicht aber die von externen Grafikkarten – heute unter dem Stichwort eGPU oder eGFX bekannt. Mehr dazu....
Anzeige

Die Blackmagic eGPU ist eine integrierte Lösung, anders als die bisher angebotenen eGPU-Gehäuse, in die man eine normale Grafikkarte wie in den Slot eines Rechners einsetzt. Sie steckt in einem Gehäuse aus Leichtmetall, das einigermaßen als „Space Grey“ durchgeht und neben einem Mac gut aussieht, auch wenn es mit seinem oktogonalen Design noch besser zu der Formensprache eines PC von Alienware passt. Es ist überraschend groß, sogar etwas höher als ein ‚aktueller‘ MacPro. Selbst der Lüftungsgrill oben und der massive Sockel, an dem man das Gerät auch gut tragen kann, sind aus Metall. Es ist so robust, dass man sich einen Einsatz vor Ort gut vorstellen kann, selbst wenn dann das eleganteFinish irgendwann leiden könnte. Das kräftige Netzteil befindet sich im Gehäuse.

Es gibt gute Gründe für dessen Größe: Immerhin werden bis zu 315 Watt verbraten und das Ganze steckt neben der Elektronik voller Kühlrippen und einem großen, langsam drehenden Lüfter. Offensichtlich könnten Apples Ingenieure bei Blackmagic noch was über gute Kühlung lernen: Selbst bei stundenlangem Rendern blieb das Gerät völlig geräuschlos, was für den iMac oder das MacBook Pro nicht gilt. Es traten auch keine Renderfehler durch überhitzte Grafikkarten auf, wie etliche Nutzer des MacPro sie mit der D700 erleiden mussten. Das beiliegende TB-3 Kabel ist nur 50 cm lang, viel Freiheit bei der Aufstellung gibt es nicht. Das hat nicht unbedingt mit Geiz zu tun: Die hohen Datenraten von 40 Gigabit / Sekunde könnten durch erheblich längere Kabel eingeschränkt werden. Über den TB-3 Port kann ein Laptop mit bis zu 85 Watt geladen werden, das reicht selbst für das 15er MacBook Pro.

Das Gerät ist „Plug-and-Play“, man muss keinerlei Treiber installieren oder Konfigurationen einstellen. Als System ist nur High Sierra vorgesehen und erst ab 10.13.6 wird der Typ des Grafikchips korrekt erkannt. Die Anmeldung dauert etwa 20 Sekunden und erfolgt automatisch. Ein unauffälliges Icon in der Menüleiste erlaubt es, die eGPU wieder abzumelden – einfach rausziehen ist keine gute Idee. Das Abmelden dauert ca. 10
Sekunden.

Vor dem Trennen des TB-Kabels sollte man darauf achten, alle mit der eGPU verkabelten Speicher abzumelden, denn die werden nicht zusammen mit der Grafikkarte deaktiviert. Das können immerhin bis zu 5 Geräte sein, denn die eGPU stellt vier USB-3.1 Ports inklusive Ladestrom zur Verfügung und einen zweiten TB-3 Port.

Das ist ein Novum bei Apple und Intel, denn bisher erhielt keine eGPU mit einem zweiten Port die eGFX Zertifizierung. Außerdem gibt es einen Anschluss für HMDI 2.0, so dass auch Monitore mit hoher Auflösung und Bildfrequenz direkt angeschlossen werden können.

Das Gerät hat einen doppelten UBS-C Controller mit dem Mac-kompatiblen Chip TI83. Geräte mit nur einem Controller können die Last zwischen I/O-Verkehr und Grafik schlechter verteilen und neigen bei hoher Last zu Instabilitäten. Außerdem nutzt die eGPU als erste den neuen „Titan Ridge“ TB-3 Controller (Intel JHL7540), der das interne Routing von Display-Port Signalen aus der GPU auf einen TB-3 Ausgang unterstützt (bei den Vorgängern war immer der Hostrechner mit im Spiel). Entsprechend bewirbt Apple als ideale Kombination den anspruchsvollen LG UltraFine 5K, der direkt an den zweiten Port angeschlossen werden kann. Er hat die gleichen technischen Werte wie der 5K Retina Bildschirm und beruht vermutlich auch auf dem gleichen Panel – Apple selbst hat ja keine reinen Monitore mehr im Programm. Übrigens haben wir das Gerät nicht selber zerlegt und die entsprechenden 61 Schrauben herausgedreht, sondern stützten uns bei diesen Angaben auf die Fotos der Innereien bei egpu.io.


Rechts drückte ein aktives SSD-RAID den Durchsatz zum Host, aber der GPU reichte das noch.

Allgemeine Performance

Bei so zahlreichen Anschlüssen stellt sich die Frage, ob der Grafikdurchsatz zum Host durch die Peripherie nicht ausgebremst wird. Immerhin stehen Grafikkarten im Rechner mit 16x PCIe Slots wesentlich höhere Durchsatzraten zur Verfügung als bei TB-3 mit etwa 4x. Deshalb haben wir getestet, ob der Datendurchsatz eines schnellen SSD-Arrays im zweiten Port die Leistung der Grafik reduziert. Wir ließen als konstante Last den Speedtest von Blackmagic laufen und haben dann mit CL!ing von Bart Vanhaeren den Durchsatz gemessen (beachten Sie beim googeln die Schreibweise). Dabei reduziert sich der Anteil für die Grafik tatsächlich etwa um 25%, aber die Leistung der GPU ließ kaum nach. Nun handelt es sich hier um einen AMD-Chip der gehobenen Mittelklasse, Spitzenmodelle wie eine Vega64 könnten eventuell doch leicht ausgehungert werden. Es ist auch sicherlich nicht sinnvoll, sämtliche USB-Anschlüsse mit schnellen Laufwerken zu belegen. Bei unseren Rendertests mit Resolve (s. u.) hatten wir ein SSD-RAID am USB-C Port und zusätzlich eine USB-3.1 Festplatte an der eGPU, um die Schreib-/Lesevorgänge nicht zu bremsen.

Ein LG UltraFine 5K, der sogar mit 10 Bit betrieben werden kann, stand uns nicht zur Verfügung. Wir haben aber einen LG mit UHD sowohl per USB-C Adapter als auch über HDMI getestet. Es war kein Problem, die volle Auflösung bei 60 Hz zu nutzen und gemäß der Messung mit CL!ling schluckt der Monitor dank der Unterstützung durch Titan Ridge nur 3-5 Prozent der Gesamtleistung. An einem iMac Retina 5K könnte man also zwei der 5K-Boliden betreiben und hätte dann in der Horizontalen insgesamt 15.360 Pixel – und einen ziemlichen vollen Arbeitstisch.

Leistung unter DaVinci Resolve

Es gibt einen guten Grund, warum die eGPU gerade von Blackmagic kommt: DaVinci Resolve (kurz: DR) nutzt mehrere GPUs im Rechner höchst effizient. Da kein aktueller Rechner von Apple verfügbar ist, in den man zusätzliche oder bessere Grafikkarten einsetzen kann, ist eine eGPU die einzige Lösung. Zwei besonders geeignete Kandidaten: Ein MacBook Pro ohne schnelle Grafik oder ein iMac, dessen Leistung man erweitern möchte. Der teure iMac Pro ist von Hause aus mit Hochleistungsgrafik zu haben, andererseits gibt es derzeit kein MacBook Pro mit mehr als 4 GB VRAM. Bei DR richtet sich das nutzbare VRAM immer nach der kleineren Karte, so dass man hier Potenzial bei der Arbeitsauflösung verschenken würde. Der geeignete iMac ist das Modell mit der gleichen GPU, denn zwei identische GPUs laufen unter DR optimal.
Zum Erkennen der zweiten GPU braucht Resolve einen Neustart, beim ersten Mal muss man auch kontrollieren, ob beide aktiviert wurden. Beim Abmelden der eGPU mit laufendem Programm lässt Resolve noch speichern, beendet sich und startet mit nur einer GPU selbständig. So geht Hard- und Software aus einer Hand! Nett wäre es, wenn man mit einem Menübefehl die eGPU erneut anmelden könnte. Statt dessen muss man sie abziehen (vorher alle angeschlossenen Speicher abmelden!) und erneut starten.

eGPU mit dem iMac

Wir haben zum Test eine Timeline in UHD mit ProRes-Clips zusammengestellt und neben einem Grading mit mehreren Nodes ein paar rechenintensive Filter wie temporale Rauschflterung, Film Grain und Aperture Diffraction (Beugungssimulation) auf einige Clips verteilt, u. E. ein relativ praxisnahes Szenario. Damit gab es beim finalen Rendering auf dem iMac einen Geschwindigkeitsvorteil von über 80% Prozent mit aktiver eGPU. Aufgrund des ‚leichten‘ Codecs waren die CPUs nur zwischen 50 und 75% ausgelastet (und der Rechner noch recht leise). Quell- und Ziellaufwerk waren getrennt, sodass hier in erster Linie die GPU-Leistung zu Buche schlägt. Das sind optimale Bedingungen, weil die Leistung aller Komponenten gut ausbalanciert ist.

Recht gut lief es auch noch mit UHD-Clips in H.264 oder H.265. Aber nur, solange diese von der Hardware dekodiert wurden: Dann lag der Vorteil mit eGPU noch bei über 50%. Bei 8 Bit und 4:2:0 laufen diese Formate selbst mit 60 fps in UHD noch flüssig. Sobald die reine Software-Dekodierung übernehmen muss, wie bei 10 Bit 4:2:2 (z.B. aus der GH5) haben alle CPU-Kerne zu kämpfen und die beiden GPUs ‚verhungern‘. Dann schafft der iMac nur noch mit Mühe 24 oder 25 fps, selbst ohne irgendwelche Filter, und die eGPU wird nutzlos. Auch bei komprimiertem DNG-Material aus einer Ursa Mini Pro waren die CPUs schon fast voll gefordert, dazu eine einzelne GPU beim reinen Abspielen schon mit 50%. So liefen ebenfalls weniger ls 30 fps flüssig, 50 oder gar 60 waren mit dem iMac nicht drin. Die eGPU brachte mit Grades und Filtern gerade noch einen Vorteil von 30%.

(Bild1: So kann die Konfiguration für den iMac mit eGPU in Resolve aussehen. Bild2: Wenn die CPUs zur Dekompression am Anschlag laufen, ist auch eine GPU unterbeschäftigt. Bild3: Zwei GPUs können zwei große Bildschirme deutlich leichter versorgen als eine allein.)

Ein Test mit 5K-Material aus einer Red in der gleichen Timeline fiel noch wesentlich unvorteilhafter aus, da hier die CPUs bei der Dekodierung am Anschlag laufen und die beiden GPUs nicht gefordert werden, selbst eine GPU lief nur mit etwa 30%. Ein Vorteil durch die zweite GPU ist kaum noch messbar; bei 8K war die Auslastung noch ungünstiger. Hier ist also eindeutig ein Rechner mit mehr CPU-Kernen gefragt, wie man ihn von Apple nur als iMac Pro bekommt – der liegt aber preislich weit über einem ähnlich ausgestatteten PC. Die Kombination aus 27er iMac und eGPU ist dagegen in allen Fällen attraktiv, bei denen die CPU-Leistung ausreicht. Wenn man den exzellenten Bildschirm dazu rechnet, ist diese Kombi auch von einem PC nicht so leicht zu schlagen.

Metal war bei den meisten Filtern in DR etwas schneller als OpenCL, aber beide können die eGPU nutzen. Unter den Fremdfiltern nutzt Boris Continuum weder mit Metal noch mit OpenCL die zweite GPU. Neuere Filter aus Red Giant Universe dagegen sind mit Metal und eGPU bis zu 45% schneller, aber z. B. das ältere ToonIt nutzt nur eine GPU. Auch FilmConvert fordert eine GPU sehr, profitiert aber nicht von der eGPU. Neatvideo erkennt beide GPUs, ist aber nur etwa 10% schneller. Effekte aus Resolve,
die von der eGPU beschleunigt werden, profitieren auch in Fusion. Die hauseigenen Funktionen von Fusion dagegen nutzen zwar beide GPUs, aber jeweils nur zur Hälfte, ein Geschwindigkeitsvorteil ist nicht erkennbar. Ein paar anspruchsvolle Funktionen aus DR haben wir auch noch separat gemessen. Am interessantesten ist sicher die Rauschreduzierung, denn als Kombi aus temporaler NR mit 1 Bild Radius und „better“ sowie der spatialen NR (better) erreicht man fast die Qualität von Neatvideo. Hier brachte die eGPU einen massiven Vorteil von 85%.

Auch der Filter „Automatic Dirt Removal“ (better) ist rechenintensiv und profitiert mit 70%. Effekte wie „Aperture Diffrac­tion“ (94%), „Film Grain“ (82%), „Lens Blur“ (40%) oder „Deflicker“ (14%) zeigen jedoch, wie unterschiedlich die Vorteile ausfallen können. Optical Flow, Stabilisierung und Tracking profitieren kaum, einzig beim Stabilizer zeigte sich ein geringfügiger Vorteil. Außerdem interessierte uns, ob die GPUs nennenswert am Encoding beteiligt sind. Allenfalls beim Encoding zu Cineform mit 6% und zu DNxHR mit 12% gab es leichte Vorteile, bei den gängigen GOP-Formaten oder DCI-Encoding war die eGPU nicht hilfreich.

Der zweite Bildschirm bremst kaum, solange man dort nicht gleichzeitig einen Player mit einem UHD-Video oder Ähnliches laufen lässt. In Resolve kann er voll genutzt werden, ohne die Gewinne durch die eGPU merklich zu schmälern, beim finalen Rendering passiert darauf sowieso nichts. Es war auch weitgehend egal, ob er am Hauptrechner oder an der eGPU hängt. Bedauerlich ist, dass die eGPU keine I/O-Karte enthält, um zuverlässiges Monitoring auf einem kalibrierten Bildschirm zu ermöglichen. Andererseits kann man die Funktion „Use Mac Display Color Profiles for Viewers“ nutzen, wenn man nur fürs Internet arbeitet und der Schirm kalibriert wurde.

eGPU und MacBook Pro 13

Das einfachste MacBook Pro aus 2017 hat nur eine Intel Grafik mit 1,5 GB VRAM, eine bescheidene i5-CPU mit zwei Kernen bei 2,3 GHz und in unserem Testrechner 8 GB RAM. Hier geht es weniger um Beschleunigung, sondern um die Frage, ob man überhaupt mit Resolve ernsthaft arbeiten kann. Wir haben unsere UHD-Testsequenz zuerst ohne eGPU auf den armen Laptop angesetzt und gestaunt, dass das Programm nicht sofort abstürzte. Blackmagic selbst traut dem Laptop allenfalls die Arbeit mit ProRes in HD zu. Selbstverständlich war die Sequenz zäh wie Kaugummi, an ernsthaftes Arbeiten war bei 1-2 fps nicht zu denken. Durch die Hardwaredekodierung sind UHD-Clips in H.264 oder H.265 bei 8 Bit sogar noch in UHD abspielbar, nur darf man keine Filter oder Grading-Nodes drauflegen, sonst bremst die schwachbrüstige GPU alles.

Mit der eGPU dagegen lässt es sich in einer HD-Timeline recht komfortabel arbeiten, solange der Codec und die Auflösung des Originals nicht zu anspruchsvoll sind. ProRes und DNxHR in HD sind unproblematisch und vertragen dann auch aufwändiges Grading, NR oder andere Filter dank der eGPU. Begrenzt geht sogar UHD/4K in einer HD-Timeline: Temporale Rauschminderung (faster) läuft bei 25 fps flüssig, ohne eGPU nur mit 8 fps, auch Film Grain ist mit eGPU echtzeitfähig, ohne sind es nur 3 fps. Der sehr anspruchsvolle Dust Remover (auch temporal) schafft zwar nur die Hälfte, doch ohne eGPU sind es nur 3,5 fps. H.264 läuft bis zu 60 fps flüssig, ohne eGPU schafft der Laptop kaum 30. Die Stabilisierung von UHD-Quellen ist mit eGPU 3,5 mal schneller als ohne, der Tracker immerhin noch 70%. Es dürfte klar sein, dass Clips in 4,6K DNG oder gar 8K R3D das System überfordern, schon das Abspielen von komprimiertem DNG in 4,6K in einer HD-Sequenz bricht ohne jegliches Grading auf ca. 17 fps ein.

Mit der eGPU kann man das MacBook durchaus auch mal einsetzen, um Material zu optimieren oder mit einer Grobkorrektur (aka First Light) in einen Offline-Codec umzurechnen, um dann unterwegs damit zu arbeiten. Nur sollte man der CPU einen Laptop-Kühler gönnen oder die Rendergeschwindigkeit unter „Deliver“ etwas herabsetzen, sonst wird der arme kleine Rechner sehr heiß – die eGPU bleibt weiterhin ganz cool.

Kommentar

Die ideale Kombi für mobile Filmemacher besteht im Grunde aus allen drei Geräten: Der iMac und die eGPU am Arbeitsplatz rechnen flott Offline-Material für den Laptop aus, und die kreative Arbeit geht fast überall. Man kommt zurück, macht ein paar Feinkorrekturen und lässt das Projekt in voller Qualität ausgeben. Die kompakten und robusten 4,5 Kilo der eGPU kann man auch mal zum Dreh mitnehmen, um dem Team Korrekturmöglichkeiten am Material ohne leidige Wartezeiten vorzuführen. Nur High-End Formate wie Red sind kaum zu bewältigen und leider kann die GPU nicht getauscht werden. Aber bei Erfolg kommt ja vielleicht ein Modell mit Vega64 am iMac Pro für die Kinoproduktion.

Kommentar schreiben

Please enter your comment!
Please enter your name here

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.