Andreas Sandborg, Class ’16
For mig har en af de mest fascinerende egenskaber ved lyd og musik altid været, hvordan man af og til som lytter kan blive opslugt af og forsvinde ind i det man lytter til. Det er sandsynligvis en oplevelse de fleste kender til, men det er alligevel ikke nødvendigvis ligetil at forstå, hvordan det sker. Min observation er, at man kan se på hvordan lydoplevelsen fungerer fra en indholdsmæssig og en formmæssig side. Selvfølgelig er selve indholdet af det man lytter til, altså komposition og produktion, af stor betydning for hvordan det opleves. Men formen eller måden man hører det på, må nødvendigvis også have en betydning, alt efter om det er på hovedtelefoner, en eller flere højtalere mv. I denne sammenhæng må det fysiske rum som lyden opleves i også have stor betydning både ifht. dets arkitektoniske og akustiske egenskaber, men også rummets sociale sammenhænge, f.eks. om det er i det offentlige rum, på gaden, på et museum, i et lydstudie, i hjemmet osv.

Begrebet immersion

Dette fænomen med at forsvinde ind i lydoplevelsen betegnes for tiden inden for oplevelsesindustrien typisk med begrebet immersion. Især i gaming- og filmindustrien opfattes dette begreb i høj grad som det, der fremover skal gøre oplevelserne endnu større og dermed adskille sig fra konkurrenternes. Immersion som fænomen er selvfølgelig ikke brugt ekslusivt om lydsiden, men er også noget der arbejdes med på andre oplevelses planer. Især inden for computerspil er det et begreb, der bliver brugt rigtig meget i forbindelse med f.eks. gameplay og hvordan spillet fungerer i sin helhed. Inden for filmindustrien er det dog især et begreb, der bliver brugt om lydsiden og mere præcist i forbundelse med, hvordan lydsiden bliver afviklet især med de nye multikanalsformater som Dolby Atmos og Auro 3D. Men det gælder faktisk for begge industrier, at det der i øjeblikket fokuseres rigtig meget på, når der snakkes om immersion, netop er formen; altså hvordan lyden bliver gengivet til lytteren. Betragtningen er den, at man ved skabe et lydfelt der omslutter lytteren, kommer tættere på den måde lyd omgiver os i den naturlige verden og derved også kan skabe en mere troværdig og realistisk oplevelse, som får lytteren til at føle sig som en del af den ønskede verden eller oplevelse. I min bacheloropgave har jeg set på, hvad der fysisk skal til for at skabe dette omsluttende lydfelt omkring lytteren, og derved at få en bedre forståelse for, hvad den formmæssige side af immersiv lyd kan og ikke kan.

Den Binaurale Hørelse

Hvis målet er at gengive et så realistisk lydfelt som muligt, er man selvfølgelig nødt til at forstå hvad der er realistisk. I den forbindelse er det væsentligt at undersøge hvordan mennesket opfatter lyd omkring sig rent fysiologisk.
Når man tænker nærmere over det, kan det virke utroligt at vi kan lokalisere lyd i et tredimensionelt rum bare med vores to ører, men det er netop det, at der er to, som gør det muligt. Vi bruger i meget høj grad forskelle i lydes amplitude og fase mellem ørene til at lokalisere hvor de kommer fra. Dette fungerer meget præcist på det horisontale plan, altså om lyden kommer fra højre eller venstre. Men så snart vi skal vurdere om lyden kommer for- eller bagfra bliver det sværere, og det samme gælder for om lyden kommer oppe- eller nedefra, fordi vi her ikke kan bruge forskellen ml. ørene, men er nødt til at forlade os på, hvordan lyden filtreres og reflekteres af kroppens, hovedets og ørets udformning, og der således kommer mange flere funktioner i spil. Sådan er vilkårene for den binaurale hørelse, som det hedder når vi bruger begge ører til at lokalisere lyd. Det som imidlertid er yderst relevant at forstå ifht. den binaurale hørelse og de såkaldte immersive lydformater er, at vi faktisk ikke er så gode som vi måske tror til at lokalisere lyde som kommer bag- og oppefra, fordi vi her ikke kan forlade os på at bruge forskellen mellem ørene. For at kompensere for dette til daglig, gør vi konstant brug af at bevæge hovedet en smule, for på den måde at flytte lyden til et sted, hvor vi så kan bruge forskellen mellem ørene igen. Dette kan imidlertid være mere problematisk når man f.eks. ser film, hvor fokus jo helst skal være på billedet foran sig. Hvis man f.eks. ser en film i et surround format, kan det nogen gange være svært at vurdere, hvor meget lyd der ligger i surround højtalerne, men dette bliver pludselig meget tydeligt at høre hvis man drejer hovedet 90°, og det som før lå bagved nu ligger på den ene side.
Fordi vi bruger refleksioner og filtrering af frekvenser til at lokalisere om en lyd kommer for-, bag- oppe- eller nedefra er denne evne også i høj grad bestemt af det frekvensmæssige indhold i lyden, idet der selvfølgelig skal være frekvenser som kan filtreres væk for at der er noget at arbejde med. Et eksempel, man kan prøve for at mærke effekten af dette, kan laves ved at afspille en sinustone på 3200 Hz fra en enkelt højtaler mens man drejer kroppen 360° rundt. De fleste vil føle at det punkt lyden kommer fra ikke er det samme hele tiden, fordi hjernen ikke har tilstrækkelig frekvensmæssige oplysninger til at lokalisere lyden præcist hele vejen rundt. Hvis man derimod ændrer tonen til en sawtooth bølge bliver det straks mere præcist, og med pink støj vil der typisk ikke være nogen tvivl om at lyden hele tiden kommer fra samme position.

Afviklingsformatet

Når man har styr på hvordan vores hørelse fungerer, er det næste skridt at forstå hvordan gengivelsen af lyden fungerer. Vi er så vante til stereo formatet med 2 højtalere at vi nærmest ikke tænker over det. Men det er faktisk en udviklet konstruktion som udnytter viden om, hvordan vi hører lyd binauralt til at skabe et større lydfelt der ikke er begrænset til højtalernes to positioner. Målet med 2 kanals stereo er altså at kunne fordele lyde fra venstre højtaler hele vejen mellem højtalerne og til højre højtaler, ved at simulere ørets evne til at lokalisere en lyd vha. amplitude forskelle mellem ørene. Dette fungerer dog kun rigtig præcist hvis højtalerne danner en trekantet form med lyttepositionen i en vinkel på 60°. Hvis vinklen bliver større opleves et ‘hul’ mellem højtalerne hvor lyden bliver lavere, og hvis lyttepositionen ændres ret meget vil lyden hurtigt høres som kommende kun fra den nærmeste højtaler. Det er altså et forholdsvist skrøbeligt format i den forstand, at der ikke skal ret meget til for at præcisionen i panoreringer og placering af lydkilder forskydes og bliver unaturlig ifht. at skabe et egalt lydfelt.

Når 2 kanals stereo udvides til surround som f.eks. med 5.1 får man problemer med at holde en vinkel på 60°, da der nødvendigvis vil være nogle vinkler der bliver større end dette. Resultatet bliver typisk at man overholder denne vinkel i fronten, mens baghøjtalerne får en større vinkel og dermed mindre præcise muligheder for placering af lyde. Denne prioritering giver både mening ifht. hvordan filmmediet har sit fokus på billedet foran lytteren, men også ifht. hvordan lyde bagfra i forvejen er mere diffuse at lokalisere for os, men den er ikke desto mindre et kompromis.

Dolby Atmos og Auro 3D giver selvfølgelig mulighed for mere præcis placering af lyde, idet der er flere kanaler og højtalere at gøre godt med. Men de er stadig baseret på det enkle princip fra 2 kanals stereo hvor lyden placeres vha. ændring i lydens amplitude mellem to højtalere
Hvis vi vender tilbage til ønsket om at skabe et virkelighedstro lydfelt som omslutter lytteren, er en udbredt teoretisk betragtning at for at kunne gøre dette i det hørbare frekvensområde, vil det kræve noget i retning af 400.000 kanaler. Dette er selvfølgelig praktisk talt umuligt, men det sætter alligevel de større gængse multikanalsformater vi kender lidt i perspektiv. Andre mindre velkendte teknikker til at skabe et lydfelt med multikanalsopsætninger såsom ambisonics og wavetable synthesis kommer en del af de ovennævnte problematikker til livs, men de er indtil videre hverken særlig udbredte eller ligetil at arbejde med, selvom ambisonics lader til at kunne have et stort potentiale.

Immersivt Lyddesign

Ideen om at skabe en immersiv lydoplevelse blot med måden lyden afvikles på, er altså ikke så ligetil som blot at hænge en masse højtalere op. Der er i hvert fald en række begrænsninger som er væsentlige at være bevidst om. Til gengæld kan viden om den binaurale hørelse og afviklingsformaternes muligheder og begrænsninger bruges i produktionen af lyd til disse formater. F.eks. er det nogle gange ønsket at skabe et diffust lydfelt og her kan man med fordel bruge lyde uden væsentligt spektralt indhold, ligesom man, hvis det er vigtigt at en lyd kan lokaliseres helt præcist, er nødt til at sørge for at den har en frekvenssammensætning der faktisk gør det muligt at lokalisere den præcist. Det faktum at vi er mindre præcise til at lokalisere lyde bagfra, kan også bruges til f.eks. at snige en lyd ind herfra, uden at vi er lige så opmærksomme på hvor den kommer fra.
Ingen tvivl om at de større multikanalsformater skaber muligheder for at arbejde med et mere komplekst lydfelt og designe en mere præcis oplevelse af en lydlig verden omkring publikum. Men der er altså også en række begrænsninger og fysiske realiteter, som er væsentlige at undersøge og forstå for at få mest muligt ud af disse formater og derved lykkes med at skabe den immersive oplevelse der er tiltænkt.