Formate, Aufnahmetechnik & Abspielsysteme

Einstieg in das Thema 3D-Audio!

Anzeige

In Zeiten ohne Live-Musik würde man sich wünschen, wir hätten schon viel früher und umfassender damit begonnen, Konzerterlebnisse gefühlsecht zu dokumentieren. Immersiv ist das Zauberwort: Ganz in den Sound eintauchen, vom Klang umhüllt werden. Gerade auf der Wiedergabeseite hat sich einiges getan. Physische Datenträger sind passé; per Streaming können auch vielkanalige Formate wie Dolby Atmos und Auro 3D verbreitet werden. Immer mehr Konsumenten leisten sich 3D-fähige Soundbars für ihr TV, und das primäre Wiedergabesystem für Musik ist heute der Kopfhörer – mit der Möglichkeit, binauralen 3D-Sound zu genießen. Fehlt nur noch der Content – und da sind wir Musiker und Produzenten gefragt!

Anzeige

Der Wunsch nach einem intensiveren Hörerlebnis besteht seit Beginn der Tonaufzeichnung. Und gerade in den ersten Jahrzehnten wurden enorme Fortschritte gemacht. Die generelle Klangqualität verbesserte sich kontinuierlich, und bereits seit den 1950ern begann Stereofonie, sich beim Konsumenten durchzusetzen. Seit der Einführung der CD in den 1980ern hat sich jedoch kaum noch was getan. Vielfach lag das an Formatkriegen und der Schwierigkeit, physische Datenträger und Abspielgeräte für hochauflösendes Audio mit vielen Kanälen zu etablieren. Dazu kommt die Kostenfrage. Schon eine 5.1-Surround-Anlage müsste eigentlich etwa das Dreifache einer Stereoanlage kosten. Faktisch verkauft wurden während des Surround-Booms Anfang der 2000er aber vor allem Billigst-Systeme für 99 Euro. Klanggewinn? Fehlanzeige! Statt vor einer edlen Stereoanlage fand man sich nun von Audioschrott umzingelt. Doch selbst wer bereit ist, Geld in die Hand zu nehmen, wird nicht selten von der Realität eingeholt bzw. vom Wunsch nach einem aufgeräumten Wohnzimmer ohne Boxenstative und Kabelwust rings um die Couch.

Familienfreundlicher sind 3D-taugliche Soundbars, die inzwischen von einigen Firmen angeboten werden. Zum Launch von Sennheisers AMBEO-Soundbar hatte ich Gelegenheit, mir diese in einem Hotelzimmer anzuhören. Der Eindruck entsprach zwar nicht einer ausgewachsenen 7.1.4-Installation, aber das Klangbild war deutlich »größer« und umhüllender als nur Stereo. Bisweilen schienen Klänge von weit außerhalb der üblichen Stereobreite zu kommen. Weniger gut abgebildet wurde der Rückraum, denn die zusammen mit dem Fraunhofer Institut entwickelten Algorithmen setzen auf Schallreflexionen – was natürlich nur funktioniert, wenn der Raum genügend schallharte Flächen bietet. Das war in besagtem Hotelzimmer nicht der Fall. Trotzdem war das Klangerlebnis »mehr als stereo«.

Noch einfacher ist der Zugang zu 3D-Sound via Kopfhörer. Binauraler Sound benötigt nur zwei Spuren, und ist somit kompatibel zu bestehenden Tonträgern, File-Formaten und Vertriebswegen. Der Konsument benötigt nichts, was er nicht bereits besitzt. Es liegt alleine an uns Musikern und Produzenten, die Möglichkeiten zu nutzen, die der anhaltende Trend zum Kopfhörer eröffnet, unsere Kampfzone zu erweitern.

Binaurale Aufnahmen gibt es schon lange; einen ersten kleinen Boom gab es ab Mitte der 1970er, als die Firma Neumann ihr erstes Kunstkopf-Stereomikrofon, den KU 80, auf den Markt brachte. Damals entstanden vor allem Hörspiele in binauraler Technik, aber auch einige Musiker und Pop-Produzenten wie Alan Parsons oder Godley & Creme nutzten die Kunstkopftechnik. Dass das Interesse rasch wieder nachließ, lag schlicht an der Tatsache, dass man damals Musik vornehmlich über Boxen konsumierte. Der Kopfhörer galt als Notlösung. Das ist heute anders. Gefühlt 90% der Musik wird heute per Kopfhörer konsumiert. So viele Menschen konnte man noch nie mit 3D-Sound erreichen!

Doch bevor wir uns den praktischen Aspekten widmen, sollten wir ein paar wichtige Begriffe klären.

 

Die Möglichkeiten und Einsatzgebiete von Immersive Audio – Tom Ammermann

Dir gefällt das Video? Dann folge uns auf Facebook und YouTube!

Der Audio-Podcast:

Hier kannst du unseren Podcast abonnieren:

RSSSpotify| Apple Podcasts | Deezer Overcast.fm | YouTube 

Hier findest du alle Episoden in der Übersicht!

 

Surround Sound …

heißt wörtlich, dass der Hörer von Lautsprechern umgeben ist. Üblicherweise nur auf Ohrhöhe; d. h. es entsteht noch kein dreidimensionaler Eindruck, sondern der Klang bewegt sich in einer Ebene. Gegenüber Stereo ist das eine große Bereicherung, denn Räume lassen sich nun viel realistischer abbilden; rückwärtige Reflexionen kommen tatsächlich von hinten. Natürlich kann man die erweiterte Spielwiese auch im Sinne einer Pop-Ästhetik nutzen und Delay-Rückwürfe auf die hinteren Lautsprecher legen oder diese gar für Stimmen und Instrumente nutzen.

Eine frühe Form des Surround Sounds war die Quadrophonie, die Mitte der 1970er einen Boom erlebte, der leider nicht lange anhielt. Die heute gängigste Form von Surround ist 5.1, was quasi eine erweiterte Quadrophonie ist: Zusätzlich zu den beiden Lautsprecherpaaren vorne und hinten gibt es vorne in der Mitte einen Center-Speaker. Dazu kommt der LFE-Kanal (das ist die ».1«) für »Low Frequency Effects«. Beides geht auf die Bedürfnisse der Filmindustrie zurück. Der Center-Speaker wird primär für Dialoge genutzt; ihn gab es im Kino schon immer, denn bereits zu Mono-Zeiten stand ein Lautsprecher hinter der Leinwand. Der LFE-Kanal ist dagegen ein frequenzbeschränkter Kanal, der eigentlich nur für Effekte genutzt werden soll, etwa um die Zuschauer durchzurütteln, wenn Godzilla auf einer Bananenschale ausrutscht. Den LFE sollte man also nicht mit der Frequenzweiche zum Subwoofer verwechseln, auch wenn Signale auf dem LFE-Kanal üblicherweise auf dem Subwoofer landen.

Natürlich gibt es noch größere Surround-Anordnungen mit mehr Lautsprechern. Verbreitet ist vor allem 7.1 mit zusätzlichen Seitenlautsprechern links und rechts der Hörposition. Diese ermöglichen ein breiteres Klangbild und eine schärfere Lokalisation.

Immersive/3D oder 3D-Audio …

ist gemeint, wenn eine Höhenebene dazukommt. Man spricht dann auch von »Immersive Sound«. Auch diese Formate werden teilweise als »Surround Sound« bezeichnet, was schnell zu Verwirrung führen kann. Im Folgenden steht »Surround« nur für zweidimensionalen Sound auf Ohrebene.

Die zusätzliche Höhendimension von Immersive Sound ist eine klangliche Bereicherung – die aber nicht so krass ist wie der Unterschied zwischen Stereo und Surround. Das liegt daran, dass evolutionsbedingt unsere akustische Richtungswahrnehmung in der Vertikalen schwach ausgeprägt ist. Das wäre wahrscheinlich anders, wenn es riesige Raubvögel gäbe, die unsere Vorfahren bedroht hätten. Gefahr lauerte aber primär in der Fläche um uns herum.

Nichtsdestotrotz komplettiert die Höhenebene das Gefühl des Vom-Klang-Umschlossen-Seins. Das gilt vor allem für Aufnahmen in großen Räumen, wo auch die Reflexionen von der Decke eine wichtige Rolle für das Klangerlebnis spielen. Darüber hinaus erweitert die Höhenebene natürlich auch unsere popmusikalische Spielwiese, sowohl bei der Aufnahme als auch im Mix.

Übliche Lautsprecherkonfigurationen sind 5.1.4 oder 7.1.4 Dabei steht die ».4« für vier weitere Lautsprecher auf einer Ebene oberhalb der Ohrhöhe. 5.1.4 ist also ein um vier Höhenlautsprecher erweitertes 5.1. Diese Nomenklatur ist nicht allgemeingültig; bei manchen Formaten wie Auro 3D werden die Höhenlautsprecher zu den anderen Hauptlautsprechern addiert, d. h. 5.1.4 heißt dort 9.1. Insbesondere in Kinos findet man noch sehr viel größere Lautsprecheranordnungen bis hin zu AuroMax 26.1.

Noch aufwendiger ist die sagenumwobene Wellenfeldsynthese, die allerdings einen anderen Ansatz verfolgt: Hier wird eine große Zahl von Lautsprechern so angesteuert, dass die Überlagerung der Einzelsignale das Schallfeld reproduziert. Der Vorteil liegt darin, dass die Illusion nicht nur am optimalen Hörplatz perfekt ist, sondern mehr oder weniger im gesamten Raum und damit für eine große Zuschauergruppe. Leider sind die Kosten einer solchen Installation so immens, dass die Wellenfeldsynthese außerhalb der Forschung kaum zum Einsatz kommt. Für kommerzielle Anwendungen geeigneter ist SpatialSound Wave vom Fraunhofer IDMT. Dieses System basiert auf der Wellenfeldsynthese, nutzt aber zusätzlich Psychoakustik, um die Anzahl der benötigten Lautsprecher zu reduzieren. SpatialSound Wave wird für anspruchsvolle Installationen u. a. in Opernhäusern und Planetarien eingesetzt.

Der Vorführraum im Fraunhofer IDMT. Mit »nur« 30 Lautsprechern plus Subwoofer erreicht SpatialSound Wave eine ähnliche Lokalisationsschärfe wie die Wellenfeldsynthese, für die man in diesem Raum etwa 90 Lautsprecher bräuchte.

 

Kanalbasiert vs. Objektbasiert

Die meisten der bekannten Mehrkanalformate arbeiten kanalbasiert mit direkter Lautsprecherzuordnung. Das fängt schon bei Stereo an: Es gibt einen linken und einen rechten Kanal, zwischen denen man mit dem Pan-Poti überblendet, um Phantomschallquellen zwischen den beiden Boxen anzuordnen. Auch Quadrofonie und übliche Surround-Formate wie 5.1 sowie dreidimensionale Anordnungen mit Höhenebene wie 5.1.4 oder auch Auro 3D arbeiten kanalbasiert: Man kann Phantomschallquellen per 2D- bzw. 3D-Panner anordnen oder Spuren direkt einem Kanal zuordnen, um beispielsweise Dialoge auf den Center-Lautsprecher zu legen. Das funktioniert solange wunderbar, wie die Lautsprecheranordnung beim Hörer der beim im Mix-Studio entspricht. Das ist in der Praxis aber nicht unbedingt der Fall.

Das Problem fängt schon damit an, dass es verschiedene Empfehlungen für eine optimale Lautsprecheranordnung gibt. Beispielsweise sollen die Lautsprecher für 5.1-Kino-Sound ein Quadrat bilden, während für optimalen 5.1-Musikgenuss eine andere Anordnung empfohlen wird, bei der die Lautsprecher in einem Kreis angeordnet werden, wobei die Winkel für die Lautsprecherpositionen so vorgegeben sind, dass das die hinteren beiden Boxen weiter auseinanderstehen als die vorderen. Der Konsument müsste sich somit für eine der beiden Anordnungen entscheiden. In der Praxis dürfte ein Großteil der Aufstellungen weder der einen noch der anderen Empfehlung entsprechen, denn bei der Aufstellung der Boxen machen ästhetische oder praktische Erwägungen nicht selten einen Strich durch die Rechnung. Auch befindet sich die Abhörzone, aka Couch, eher selten an der optimalen Position in der Mitte der Lautsprecheranordnung. Fazit: Kanalbasierte Mehrkanalsysteme funktionieren in der Theorie super, scheitern aber oft an der Realität.

Objektbasierte Mehrkanalsysteme sind diesbezüglich cleverer. Hier werden die einzelnen Audioobjekte – das sind beispielsweise die Einzelspuren eines Multitrack-Projekts – mit Metadaten versehen, über die ihnen eine Position (oder Bewegung) im Raum zugeordnet wird. Auf der Wiedergabeseite gibt es nun ein System in Form eines Rechners oder Prozessors, das die dort vorhandene Lautsprecheranordnung kennt und besagte Audioobjekte so genau, wie es die Installation zulässt, anhand der Metadaten im 3D-Raum positioniert. Ein Nachteil liegt jedoch im höheren Aufwand. Das Wiedergabesystem muss erst eingerichtet bzw. eingemessen werden – was mit heutigen Technologien auch auf Konsumentenebene durchaus kostengünstig machbar wäre. Ein größeres Problem ist (derzeit noch) das hohe Datenaufkommen. Wenn jedes Audioobjekt einzeln übertragen wird, kommt man bei heutigen Musikproduktionen schnell auf über 100 Spuren plus Metadaten.

In der Praxis nutzt man daher oft Hybridsysteme, d. h. eine Kombination von präzise positionierbaren Audioobjekten und einem kanalbasierten »Bed« aus Klängen, die keine besonders präzise Positionierung erfordern. Letzteres könnten beim Filmton beispielsweise die Streicher sein, die bedrohlich anschwellen, während ein Hubschrauber – als sich bewegendes Audioobjekt – auf die Insel zusteuert, wo wir gleich auf King Kong treffen werden. Das wohl bekannteste Hybridsystem für 3D-Sound ist Dolby Atmos.

Szenenbasiert: Ambisonics & Co

Ein anderer sehr cleverer Ansatz ist, das Schallfeld zu beschreiben. Das nennt man »szenenbasiert«. Die Idee ist eigentlich schon ziemlich alt, denn Ambisonics, entwickelt in den 1970ern, ist ein solches szenenbasiertes System. Es ist bis heute auch das bekannteste – und keineswegs veraltet! Im Gegenteil, Ambisonics hat in den letzten Jahren enorm an Momentum gewonnen.

Die Beschreibung des Schallfelds kann bei Ambisonics in verschiedenen Genauigkeitsstufen, sogenannten »Ordnungen« erfolgen. Aufnahmeseitig muss man sich meist mit Ambisonics erster Ordnung begnügen. Eine Ausnahme ist das in dieser Ausgabe getestete Spatial Mic von Voyage Audio, das Ambisonics zweiter Ordnung verspricht. Ambisonics erster Ordnung ist die einzige, die sich prinzipiell mit realen Mikrofonen 1:1 aufbauen ließe. Man kann sich das vorstellen wie ein erweitertes Mitte/Seite-Verfahren. Ein üblicher M/S-Aufbau besteht ja aus einem nach vorne gerichteten Nierenmikrofon und einem im 90-Grad-Winkel dazu angeordneten Achtermikrofon, das quasi den Links/Rechts-Vektor erfasst. Bei Ambisonics erster Ordnung hätten wir statt der Niere eine Kugel, da ja das gesamte Schallfeld in allen drei Dimensionen erfasst werden soll. Drei Achtermikrofone sind nach links/rechts, hinten/vorne und oben/unten ausgerichtet, d.h. ihre Membranauslenkungen liefern die Richtungsinformation.

In der Praxis wird diese Anordnung so gut wie nie verwendet, alleine schon aufgrund ihrer physikalischen Größe und der damit verbundenen Schwierigkeit der Aufstellung. Denn die Kapseln sollten sich idealerweise am selben Punkt befinden, oder zumindest so nahe beisammen wie möglich. In der Praxis verwendet man für Ambisonics erster Ordnung üblicherweise vier Nierenkapseln in einer Tetraeder-Anordnung. Das ist die kleinste und damit kostengünstigste Mikrofonanordnung, die das Schallfeld dreidimensional erfassen kann. Die »rohen« Signale dieser vier Nierenkapseln nennt man A-Format. Dieses lässt sich mit einem Prozessor oder einem Plug-in in das B-Format überführen, das dem der oben beschriebenen Anordnung aus Kugel und drei Achten entspricht. Für Ambisonics höherer Ordnung ist eine solche Transformation immer nötig, denn die dafür erforderlichen virtuellen Richtcharakteristiken gibt es real gar nicht. Sie lassen sich nur durch Processing erzeugen. Die Rechenlast entsprechender Plug-ins stellt heute keine Herausforderung mehr dar. Problematischer ist die mit höheren Ordnungen rapide anwachsende Zahl von Mikrofonkapseln, die nötig sind, um das Schallfeld ausreichend präzise zu erfassen. Denn mit jeder weiteren Kapsel steigt das Grundrauschen.

Während Ambisonics-Mikrofone inzwischen zum Standard-Werkzeugkasten gehören, um 3D-Sound einzufangen, sind dedizierte Ambisonics-Wiedergabesysteme exotisch und eher im Forschungsbereich zu finden. Meist wird Ambisonics heute als geräteunabhängiges Zwischenformat genutzt, das sich ausgangsseitig auf verschiedenste Wiedergabesysteme mappen lässt. Auch zur Klangverarbeitung ist Ambisonics ein interessantes Format, um innerhalb der DAW Klänge dreidimensional anzuordnen – eben weil es geräteunabhängig ist. So lässt sich das im Mix generierte 3D-Klangbild für verschiedene Ausgabeformate ausspielen.

Hochinteressant ist Ambisonics auch für Virtual Reality (VR) und andere Anwendungen mit Headtracking, d.h. die Verknüpfung der Wiedergabe mit Bewegungsdaten, die der Kopfhörer übermittelt. So kann der Konsument sich in einer Hörwelt bewegen, sich also z. B. nach einem Geräusch umdrehen, das dann von vorne kommt. Das steigert den Realismus enorm. Die dafür notwendigen Rechenprozesse sind in Ambisonics von geringem Aufwand, denn das so erfasste Schallfeld lässt sich in alle Richtungen rotieren. Auch für Mikrofonaufnahmen ist das praktisch: Man kann Ambisonics-Mikros stehend, hängend oder horizontal ausrichten; im dazugehörigen Plug-in lässt sich die Orientierung entsprechend anpassen bzw. oft auch frei rotieren.

Der Neumann KU 100 ist der wohl bekannteste und meistgenutzte Kunstkopf für Musikaufnahmen.

 

Binaural: 3D mit Köpfchen

Wie angesprochen, lässt sich ein 3D-Klangerlebnis auch über Kopfhörer erreichen. Wir haben ja ohnehin nur zwei Ohren, mit denen wir es irgendwie schaffen, die Welt um uns in allen drei Dimensionen wahrzunehmen. Das funktioniert, weil wir gelernt haben, die Schallbeugung durch Außenohren, Kopf und Torso in Richtungsinformation zu übersetzen. Unser Gehirn ist schon ein ziemlich cooler Bio-DSP!

Die traditionelle und eigentlich auch beste Methode zur Aufnahme von binauralem Sound ist ein Kunstkopfmikrofon. Das ist im Prinzip nichts anderes als ein Paar Kleinmembran-Kugelmikrofone, die in die Ohren eines künstlichen Kopfes eingebaut wurden. Bevor ihr nun einer Schaufensterpuppe die Rübe abreißt und Mikros einbaut: Im Detail ist das Ganze dann doch ein bisschen diffiziler: Wie werden die Ohrkanäle nachgebildet, wie sollten die Ohrmuscheln geformt sein, wie müssen die Mikrofone entzerrt werden? Das mag ein Grund sein, warum es derzeit nur wenige Modelle mit professionellem Anspruch gibt. Und die sind ziemlich teuer: Der wohl bekannteste Kunstkopf ist der Neumann KU 100 für rund 8.000 Euro. Die Klangergebnisse sind allerdings durchaus beeindruckend, wie ich vor ein paar Jahren selbst ausprobieren durfte, als mir der Hersteller einen KU 100 leihweise überließ.

Billiger wird’s, wenn man statt eines Kunstkopfs die eigene Rübe hinhält. Binaurale Stereomikrofone, die den menschlichen Kopf zur Schallbeugung nutzen, gibt es von mehreren Herstellern in unterschiedlicher Qualität. Dazu mehr im Kapitel »3D-Sound aufnehmen«.

Kopfbezogener 3D-Sound lässt sich auch künstlich erzeugen: mit einem Binauralisierer. Hier gibt es zwei Ansätze: Zum einen sind da 3D-Panner mit binauralem Ausgang, die es ermöglichen Audioobjekte, d. h. Mono-Spuren, dreidimensional zu positionieren. Und dann gibt es Binauralisierer, die ein mehrkanaliges Eingangssignal – das kann ein Bus mit kanalbasiertem Surround- oder Immersive-Sound sein oder auch eine Ambisonics-Aufnahme – in zweikanaligen, binauralen Sound überführen.

Die Basis dafür bildet die Head-Related Transfer Function (HRTF), zu Deutsch: kopfbezogene Übertragungsfunktion. Das ist eine Nachbildung jener komplexen, winkelabhängigen Filterwirkung von Kopf, Ohrmuscheln und Rumpf, die es uns ermöglicht, mit nur zwei Ohren dreidimensional zu hören. Ein Problem dabei ist, dass Ohren verschiedener Menschen nicht identisch aufgebaut sind. Die Ohrmuscheln sind sogar ähnlich individuell wie ein Fingerabdruck. Eigentlich müsste daher jeder Hörer seine individuelle HRTF haben, um binauralen Sound optimal zu genießen. Tatsächlich gibt es Services, um sich eine individuelle HRTF erstellen zu lassen, beispielsweise »Immerse« für den in Cubase und Nuendo integrierten AmbiDecoder; dabei werden Fotos der eigenen Ohren ausgewertet.

In der Praxis verlässt man sich jedoch meist auf Universal-HRTFs, die für einen Großteil der Menschheit recht gut funktionieren. Oft basieren diese HRTFs auf einem Kunstkopfmikrofon – vermutlich, weil sich dies viel leichter vermessen lässt als ein echter menschlicher Schädel. Außerdem haben die Entwickler des Kunstkopfs natürlich auf eine hohe Kompatibilität mit einer Gruppe von Testhörern geachtet.

Ein sehr hochwertiges und (noch) bezahlbares Binaural-Headset ist das DPA 4560.
Noch deutlich preisgünstiger ist das Sennheiser AMBEO Smart Headset, das leider nicht mehr hergestellt wird, aber noch vereinzelt im Handel erhältlich ist.

 

3D-Sound aufnehmen

Der einfachste und direkteste Weg zu dreidimensionalem Klang ist und bleibt ein binaurales Mikrofon, d. h. ein Kunstkopf oder ein Binaural-Headset. Der Neumann Kunstkopf KU 100 ist nach wie vor State of the Art und erzeugt ein sehr plastisches Klangbild mit exzellenter Lokalisation in allen drei Dimensionen. Die Handhabung ist kinderleicht: Man stellt ihn dort auf, wo’s für die eigenen Ohren gut klingt. Aufnahmen mit dem KU 100 funktionieren für die allermeisten Zuhörer sehr gut. Da der Kunstkopf mit Druckempfänger-Kapseln arbeitet, reicht die Bassübertragung sehr tief und ist entfernungsunabhängig. Auch das Eigenrauschen ist gering, zumal ja – anders als bei anderen 3D-Aufnahmetechniken – nur zwei Mikrofonkapseln zum Einsatz kommen. Der Nachteil liegt allein im happigen Preis.

Deutlich günstiger sind binaurale Headsets, die man am eigenen Kopf trägt. Einfache Modelle bekommt man schon für 100–200 Euro, etwa die OKM Mikros von Soundman, die vor allem im Zeitalter des DAT-Rekorders schwer angesagt waren, heute aber ein bisschen in Vergessenheit geraten sind. Teurer, aber sehr hochwertig ist das kürzlich getestete Kopfbügelmikrofon 4560 des dänischen Nobelherstellers DPA (Test in Sonderausgabe Studioszene 2020). Inklusive XLR-Adaptern muss man rund 1.200 Euro anlegen; alternativ lässt es sich über DPAs Mini-USB-Interface betreiben, das mit rund 500 Euro zu Buche schlägt. Eine preiswertere Alternative ist (bzw. war) Sennheisers AMBEO Smart Headset, das leider wieder eingestellt wurde. Vereinzelt ist es aber noch im Handel zu bekommen, teils deutlich unter dem ursprünglichen Preis von 299 Euro. Das AMBEO Smart Headset ist speziell für iOS-Devices konzipiert und kommt mit einem Lightning-Anschluss. Es trägt sich recht bequem, und anders als die meisten Binaural-Headsets kann man es auch als Kopfhörer verwenden. Damit ist es ein ideales Immer-Dabei-Headset, was ein großer Praxisvorteil sein kann – auf viele interessante Soundscapes stößt man ja eher zufällig.

Die Vor- und Nachteile von Headsets gegenüber einem Kunstkopf liegen auf der Hand: Bei Headsets muss man auf Handling-Geräusche achten; man muss auch eine gewisse Disziplin entwickeln, den Kopf gerade zu halten und sich nicht nach jedem Geräusch bzw. nach schönen Dingen oder Menschen umdrehen. Für die Studioarbeit oder Orchesteraufnahmen sind binaurale Headsets weniger geeignet; bisweilen müsste man sehr lange regungslos sitzen bleiben, bis die Aufnahmen beendet sind. Extrem vorteilhaft sind Headsets für mobile Aufnahmen. Nicht nur, weil sie sehr viel kompakter und transportabler sind, sondern vor allem, weil man sehr unauffällig aufnehmen kann. Einen Kunstkopf in die Flughafenlobby rollen? Das gibt Stress mit der Security. Dieselbe Klangkulisse mit einem Binaural-Headset aufnehmen? Völlig unproblematisch!

Ein systembedingter Nachteil der binauralen Technik soll nicht verschwiegen werden: Es gibt derzeit keine Möglichkeit, binaurale Aufnahmen in andere immersive Formate wie 5.1.4 zu übersetzen. Die Kompatibilität mit Lautsprecherwiedergabe in Stereo ist indes nicht so schlecht wie vielfach behauptet. Jedenfalls bei Kunstköpfen und Binaural-Headsets neuerer Bauart, denn im Gegensatz zu frühen Modellen sind diese Diffusfeld-entzerrt. Das Klangbild wirkt auch über Boxen spektral ausgewogen; lediglich die räumliche Darstellung wirkt etwas unscharf, ähnlich wie bei Klein-AB mit Kugelmikrofonen.

Das Sennheiser AMBEO VR Mic ist ein sehr hochwertiges,optisch unauffälligesAmbisonics-Mikrofon.
Die Kapselanordnung des AMBEO VR Mics entspricht der üblichen Tetraeder-Anordnung für Ambisonics erster Ordnung.
Ein sehr preisgünstiges, dennoch hochwertiges Ambisonics-Mikrofon ist das RødeNT-SF1.
Der Zoom H3 VR kombiniert ein Ambisonics- Mikrofon mit einem vierkanaligen SD-Karten- Rekorder. Ein sehr preisgünstiger Einstieg ins 3D-Recording.

 

Ambisonics-Mikrofone …

sind ebenfalls relativ bezahlbar. Die meisten bieten »nur« Ambisonics erster Ordnung und arbeiten mit vier Nierenkapseln in Tetraeder-Anordnung. Mit so wenigen Kapseln wird das Schallfeld nicht besonders hochauflösend erfasst, was sich z.T. aber durch ausgeklügelte Algorithmen in der Nachbearbeitung ausgleichen lässt. Das geschieht über Filter, die quasi dreidimensional arbeiten, um die Off-Axis-Verfärbung der Kapseln auszugleichen. Ambisonics-Mikrofone neueren Datums kommen daher meist mit einer speziell auf sie zugeschnittenen Software, üblicherweise als Plug-in, die diese Optimierungen vornimmt und gleichzeitig als Formatkonverter dient, um die Rohsignale der vier Nierenkapseln (A-Format) in ein Ambisonics-Signal erster Ordnung zu wandeln. Manchmal sind noch weitere Funktionen integriert. In jedem Fall lohnt es sich, vor dem Kauf zu schauen, was an Software mitgeliefert wird.

Ein sehr gutes und besonders handliches Ambisonics-Mikrofon ist Sennheisers AMBEO VR Mic (s. S&R 2.2017), das aktuell für 1.550 Euro angeboten wird. Das ins Formatkonverter-Plug-in integrierte Ambisonics-Filter ist von exzellenter Qualität, was dem AMBEO VR Mic ein sehr gleichmäßiges, ausgewogenes und brillantes Klangbild beschert. Es arbeitet mit vier hochwertigen, präzise abgeglichenen Elektret-Kondensatormikofon-Kapseln, die Sennheiser selbst herstellt. Der (abnehmbare) Mikrofonkorb ist sehr kompakt und lässt das VR Mic aussehen wie ein gewöhnliches Reportermikrofon – was an öffentlichen Orten sehr von Vorteil sein kann, weil es wenig Aufmerksamkeit auf sich zieht.

Deutlich größer ist das NT-SF1 von Røde (Test in S&R 3.2019). Wenn man die mitgelieferte Windschutz-Kugel montiert, sieht es für Außenstehende eher wie eine Wetterstation oder Messsonde aus. In Bahnhöfen, Flughägen, eventuell auch im Einkaufszentrum wird man Blicke auf sich ziehen, eventuell auch die der Security. Technisch eignet es sich für den Außeneinsatz sehr gut, zumal sogar ein Fellwindschutz mit zum Lieferumfang gehört. Auch im Studio kann man viel Spaß mit dem NT-SF1 haben. Sein Eigenrauschen von 17 dB-A ist ausreichend niedrig, um auch bei leisen Quellen bzw. größerem Abstand studiotaugliche Ergebnisse erzielen zu können. Das zugehörige Plug-in »Soundfield by Røde« bietet umfassende Möglichkeiten zur Nachbearbeitung. Mit einer unverbindlichen Preisempfehlung von 1.099 Euro bietet das NT-SF1 sehr viel fürs Geld. Im gleichen Preisbereich liegt auch das SpatialMic von Voyage Audio, das in dieser Ausgabe getestet wird.

Inzwischen gibt es sogar Digitalrekorder mit integriertem Ambisonics-Mikrofon. Der Zoom H3-VR (s. S&R 3.2019) ist die wohl kompakteste Lösung für Ambisonics-Aufnahmen und kostet inzwischen nur noch 249 Euro. Natürlich sind seine Mikrofonkapseln nicht so hochwertig wie die von Sennheiser oder Røde, und das Kunststoffgehäuse neigt leider zu deutlich hörbaren Handgeräuschen. Dennoch ist der H3-VR ein Tipp für alle, die in das Thema 3D-Sound preisgünstig einsteigen möchten. Zumal die Handhabung kinderleicht ist: Aufstellen, auf Aufnahme drücken, Spaß haben.

Größere Arrays

Der Vollständigkeit sei angemerkt, dass gerade im Bereich Klassik, aber auch für TV-Übertragungen komplexere und meist auch physisch größere Mikrofonanordnungen als die hier beschriebenen eingesetzt werden. Von der Firma Schoeps werden ORTF-3D-Sets angeboten, die mit acht Supernierenkapseln ausgestattet sind. Die dreidimensionale ORTF-Anordnung ist so kompakt, dass sie in einen Zeppelin-Windschutz passt, was sie auch für Sportübertragungen und andere Outdoor-Events tauglich macht. Microtech Gefell propagiert den »M Cube«, eine Kubus-Anordnung von neun Kleinmembranmikrofonen mit Kugelcharakteristik – eigentlich handelt es sich um kalibrierte Messkapseln. Das System arbeitet rein laufzeitbasiert, was größere Kapselabstände bedingt. Damit empfiehlt sich der M Cube vor allem für Klassikaufnahmen.

Dies sind nur zwei Beispiele aus einer Vielzahl von Arrays, die heute für Immersive Sound eingesetzt werden. In diesem Bereich wird weiterhin viel experimentiert und geforscht.

In Cubase Pro sind seit Version 10 bereits ein 3D-Panner ...
... und ein Binauralisierer integriert.
Bei Sennheiser kostenlos erhältlich sind der 3D-Panner Dear VR Micro und ...
... der Binauralisierer DearVR Ambi.

 

Budget-Tipps

Wer bereits einen Zoom H2 bzw. H2n besitzt, kann damit bereits erste Schritte in Richtung Immersive Sound machen. Okay, eigentlich nur Surround ohne Höhenebene. Diese Rekorder können nämlich vierkanalig aufnehmen, wobei für vorne und hinten jeweils ein Stereo-File generiert wird. Daraus lässt sich ein beeindruckendes Rundum-Klangerlebnis zaubern, wenn man einen binauralen Panner verwendet. Übrigens bietet Cubase Pro ab Version 10 bereits alles, was man für 3D-Sound benötigt: Multi-Panner, Binauralisierer und die Möglichkeit, Ambisonics-Busse bis zur dritten Ordnung anzulegen. Wahlweise lassen sich auch externe 3D-Panner und Binauralisierer integrieren, etwa Dear VR Micro und Dear VR Ambi, die bei Sennheiser kostenlos erhältlich sind.

Selber mit 3D-Sound arbeiten

Im Home- und Projektstudio wird man sich aus finanziellen und auch aus Platzgründen meist auf Binaural- und Ambisonics-Mikrofone beschränken müssen. Diese sind auch leichter in der Handhabung. Vielfach wird man sich jedoch nach geeigneten Räumlichkeiten umschauen müssen, denn für das, was Immersive ausmacht, nämlich Lokalisation (auch außerhalb der Stereobreite) und Umhüllung (d. h. das Gefühl des Vom-Klang-Umschlossen-Seins), ist der Aufnahmeraum von zentraler Bedeutung. Akustisch »tote« Räume sind daher ungeeignet. Es muss ein gewisses Maß an Reflexionsschall vorhanden sein. Auch sollte der Raum eine gewisse Größe haben, damit sich die Erstreflexionen vom Direktschall absetzen. Und natürlich sollte es keine störenden Nebengeräusche geben, sei es von draußen oder von der Klimaanlage.

Es gibt Beispiele, wo alleine mit einem Kunstkopf oder mit einem Ambisonics-Mikrofon großartiger Sound gemacht wurde. Das wohl bekannteste ist The Trinity Session der Cowboy Junkies, die dieses Album um ein Soundfield-Mikrofon gruppiert aufnahmen (d. h. in Ambisonics erster Ordnung). Das Ergebnis klingt auch heute noch großartig. Allerdings sind Musik und Arrangement auf die starke Raum-Ambience abgestimmt.

Wer einen zeitgemäßen druckvollen, direkten Sound bevorzugt bzw. Möglichkeiten zur Nachbearbeitung und Gestaltung im Mix offenhalten möchte, der wird aufwendiger mikrofonieren müssen. D.h., der Direktklang wird wie bisher über Nahmikrofonierung abgenommen. Das Ambisonics- oder Binaural-Mikrofon sollte man eher als ein Raummikrofon betrachten, das zusätzlich Richtungsinformation liefert. Daher sollte es etwas weiter von der Klangquelle entfernt sein. Mit dem Abstand muss man experimentieren und dabei die Kombination mit dem Nahmikrofon im Auge behalten. Ihre Klanganteile sollten sich nicht beißen, sondern ergänzen. Wer den Aufwand nicht scheut, kann den Aspekt Umhüllung separat aufnehmen, nämlich mit noch weiter entfernten Mikrofonen, die möglichst wenig Direktschall abbekommen sollten, etwa indem man diese Mikros hinter Trennwänden aufbaut und/oder von der Klangquelle abwendet.

Diese Herangehensweise und viele andere Praxislösungen beleuchtet Hans-Martin Buffs Buch Überall – Musikproduktion in 3D-Audio für Kopfhörer, dem ich zahlreiche Infos und Ideen dieses Artikels zu verdanken habe. Die Lektüre lohnt unbedingt, denn es ist das einzige wirkliche Praxisbuch zu 3D-Audio mit Fokus auf Popmusik. Nahezu alle anderen Publikationen zu Immersive Sound befassen sich nämlich mit Orchesteraufnahmen – wo ganz andere Klangideale gelten. Hans-Martins Grundsatz ist: 3D ersetzt nicht Stereo, sondern ist eine Ergänzung – so wie ja auch in Stereomixes weiterhin Monospuren enthalten sind. Hans-Martin erklärt en detail, wie man die Räumlichkeit von 3D-Audio mit einer zeitgemäßen Pop-Ästhetik vermählt. Was Überall außerdem auszeichnet, ist ein klarer Fokus auf die Kopfhörerwiedergabe. Während viele andere Publikationen zu Immersive Audio sich an aufwendigen und teuren Lautsprecheranordnungen abarbeiten, die für Privatanwender völlig utopisch sind, hat Hans-Martin Buff die große Chance erkannt, die der Trend zum Kopfhörer bietet, 3D-Sound unters Volk zu bringen und (endlich!) zum Erfolg zu machen. Und zwar für alle Beteiligten: Konsumenten, Künstler und Produzenten. Ich sage: Buch kaufen, loslegen, Spaß haben!

Lektüretipp: "Überall – Musikproduktion in 3D-Audio für Kopfhörer" von Hans-Martin Buff. Jetzt versandkostenfrei unter www.soundandrecording.de/shop bestellen!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.