STEREOSNEMANJE: PRINCIPI DVOUSESNE ZAZNAVE ZVOKA DANIEL SVENSEK Fakulteta za matematiko in fiziko Univerza v Ljubljani PACS: 43.66.Pn, 43.20.+g, 43.38.Md Spregovorili bomo o izzivih, s katerimi se soočamo pri snemanju akustičnih scen s stereomikrofonskim parom. PoslusalCevo akustično izkusnjo Zelimo čim verneje zajeti in jo nato reproducirati z namenom, da bi v njem ponovno vzbudila občutke zive izvedbe. Omnidirekcionalni mikrofoni prekasajo direkčionalne, razmaknjene postavitve so ustreznejse od koinčidenčnih. Z akustično oviro med razmaknjenima mikrofonoma lahko izboljsamo intenzitetno separačijo kanalov. V najbolj naravnem primeru je ovira lahko umetna (čelo človekova) glava. Vpliv glave bomo kvalitativno pojasnili in vpeljali njena impulzni odziv (HRIR) in prenosno funkčijo (HRTF). Z vpadom zvočnega valovanja na visokoimpedančno mejno povrsino bomo kvalitativno razlozili vpliv glave na nizke in visoke frekvenče. Predstavili bomo eksaktno resitev sipanja ravnega vala na togi krogli in iz nje izlusčili prenosno funkčijo, ki rabi kot model prenosne funkčije človeske glave. Na primeru tega modela si bomo ogledali, kako kvalitativne lastnosti prenosne funkčije glave interpretiramo v luči temeljnih fizikalnih načel. STEREO RECORDING: PRINCIPLES OF BINAURAL PERCEPTION OF SOUND Challenges of stereo pair miking of ačoustič venues are reviewed. The goal is to čapture the listener's live ačoustič experienče as veristič as possible and then reproduče it as to arouse in him the feelings he had during the live performanče. Coinčident setups are disfavoured and omnidirečtional spačed pair tečhniques are preferred to direčtional ones. These čan be baffled to improve the intensity separation of the two čhannels. A natural extrapolation of the baffling is the use of a dummy (or even human) head - the binaural rečording tečhnique. The effečt of the head is qualitatively disčussed, the head-related impulse response (HRIR) and transfer funčtion (HRTF) are introdučed. The effečt of the inčidenče on a high impedanče boundary is disčussed and related to the influenče of the dummy head surfače on low and high frequenčies. The exačt solution of the sčattering of a plane wave on a hard sphere is presented and from it the hard sphere transfer funčtion is extračted, whičh serves as a model for the HRTF of human head. With the help of this model, qualitative features of the HRTF are brought in čonnečtion with underlying physičal prinčiples. Uvod Snemanje glasbe, ki se izvaja in doživlja v akustičnem ambientu, se bistveno razlikuje od studijskega snemanja. Pri slednjem iluzijo akustičnega prostora sestavimo umetno, ob tem pa, odvisno od zvrsti glasbe, uporabljamo stevilne efekte, s katerimi lahko posnetek obenem naredimo polnejši, mogočnejši, intenzivnejši, jasnejši, mehkejši ... Nasprotno pa pri snemanju v akustičnem prostoru izhajamo iz minimalističnega načela, da je najlepša zvočna slika naravna, natanko tista, ki jo v tem ambientu dozivlja poslušaleč. Z akustičnim posnetkom zelimo poslušalčevo izkušnjo čim verneje zajeti in jo potem tudi kar najbolje reprodučirati, da bi v njem ob ponovnem poslušanju, tokrat posnetka, vzbudila enake občutke. Predpogoj za dober posnetek te vrste je akustično lep ambient in posnetku podrejena postavitev izvajalčev. Ker sta to v praksi zelo selektivni zahtevi, se dandanes tudi v akustičnih ambientih praviloma uporabljajo snemalne tehnike, ki so blizje studijskim. Kljub postopnemu uveljavljanju tehnik prostorskega zvoka („surround"), ki lepo zajamejo in reprodučirajo ambient, kar bogati poslušalčevo izkušnjo, se bomo tukaj omejili na stereotehniko, ki je daleč najbolj razširjena. Praviloma gre za dva krajevno ločena uparjena mikrofona za levi in desni kanal, redkeje tri (npr. „Dečča Tree" z dodatnim sredinskim mikrofonom). Upar-jenost mikrofonskega para pomeni, da se (kompleksni!) prenosni funkčiji mikrofonov, ki ga sestavljata, karseda malo razlikujeta. Pri tem je tole-ranča izredno majhna, tako da se uparjenih mikrofonov ne da načrtno izdelati, ampak se iz proizvodne serije z naključno posejanimi odstopanji izbere tiste, ki se najbolj ujemajo. V akustičnem ambientu koinčidenčne tehnike (pri teh se membrani dveh usmerjenih mikrofonov nahajata praktično v isti točki) niso zazelene, saj ambienta ne zaznajo realno. V nasprotju z direktnim zvokom z značilno močno korelačijo med kanaloma je za prostorski zvok, kot ga zaznavamo z razmaknjenima ušesoma, značilna nekoreliranost, in ravno ta daje občutek prostornosti. Ker pa koinčidenčni stereopar informačijo za levi in desni kanal zajema v isti točki, sta signala po definičiji fazno povsem korelirana, neglede na to, ali gre za direktni ali prostorski zvok. Dokončno se omejimo še na omnidirekčionalne mikrofone, tj. mikrofone s krogelnosimetrično smerno karakteristiko, ki se jim morajo za vrhunski posnetek usmerjeni mikrofoni vsekakor umakniti, seveda pa so najbolj selektivni, kar se primernosti prostora tiče. Razmaknjen par omnidirekčionalnih mikrofonov je torej osnova, ki daje najnaravnejši rezultat. V primerjavi z zaznavo z ušesi sta kanala šibkeje intenzitetno ločena, podobnejsa, zaradi česar je tudi monokompatibilnost (kvaliteta monosignala, ki ga dobimo s seštevanjem signalov obeh kanalov), kolikor je ta danes sploh še pomembna, slaba. Zato se med mikrofona včasih nameščajo absorptivne ovire (npr. sfera, disk - t. i. Ječklin disk), ki desnemu mikrofonu delno zastirajo akustični pogled na levo in obratno. S tem ohranimo prednosti omnidirekčionalnih mikrofonov in hkrati močneje intenzitetno ločimo kanala. Tako razmisljanje nas vodi do sklepa, da je najbolj realna ovira kar člove ška glava. Snemalna tehnika, pri kateri omni-direkčionalna mikrofona namestimo v ušesni školjki umetne (ali tudi zive) glave, se imenuje dvoušesna (v nadaljevanju „binauralna") tehnika. Tovrstne posnetke reprodučiramo s slu šalkami, pri čemer jim po realnosti in zaznavi prostora ni para. Pri snemanju so odločilne prav vse podrobnosti, od polozaja mikrofonov (na milimeter natancno), oblike in velikosti uhljev, do snovi, iz katere je narejena snemalna glava. Zaradi odboja, absorpcije, uklona in resonanc v „votlinah" usesne skoljke glava tlačno polje ob membranah mikrofonov močno spremeni, pri določenih frekvencah se glasnost poveča za več kot 10 dB. Vemo tudi, da je visjefrekvenčni del zvoka, ki prihaja z leve, ob desnem usesu oslabljen, saj je uklona okrog glave pri manjsih valovnih dolzinah vse manj. Zavedati se moramo, da je enako kot amplituda pomembna tudi faza valovanja, saj v dani točki ob glavi prihaja do interfe-renče uklonjenega valovanja, kar daje zaznanemu zvoku značilen spektralni odvisen od smeri vpadlega valovanja glede na smer glave. Prenosna funkcija glave Slika 1. Impulzni odziv na lokaliziran izvir na mestih obeh uses. Celoten vpliv glave na tlak v usesnih skoljkah opisemo z impulznim odzivom glave (HRIR, head-related impulse response) za levo in desno uho, hL(t, r) in hR(t, r), oziroma njegovo kompleksno Fourierovo transformiranko, prenosno funkčijo glave (HRTF, head-related transfer funčtion), Hl(lv, r) in HR(w, r), kjer r podaja lego zvočnega izvira glede na glavo (slika 1). Naj bo x(t, r) tlačni signal izvira pri r. Tlačna signala v levem in desnem usesu, xL(t) in dobimo s konvolucijo z impulznim odzivom, XL,R{t) = hL,R(t, r) * x(t, r)= (1) = HlThLR(t - T, r) x(r), (2) J pri Cemer velja hL,R(t < 0, r) = 0, v frekvenCnem prostoru pa preprosto XL,ß(w) = Hl,r(w, r) x(w, r), (3) kjer je x(w, r) kompleksna amplituda tlaka izvira pri r, xL,R(w) pa kompleksna amplituda tlaka v levem oziroma desnem usesu. Impulzni odziv glave se ponavadi premeri v daljnem polju, kjer imamo opravka z ravnimi valovi in je odvisnost od oddaljenosti izvora samo se asimptotiCna (a 1/r), tako da je HRIR (in poslediCno tudi HRTF) netrivialno odvisen „le" od smeri, ki jo opisemo s kotoma ^ (zenitna razdalja) in ^ (azimut), r = (r, ^). Ce torej zvoCilo premikamo v vodoravni ravnini, ki poteka skozi glavo (ekvatorialna ravnina), je ^ = n/2 in se spreminja kot pri Cemer naj ^ > 0 pomeni, da zvok prihaja z leve. V naCelu je tlak v usesih s HRIR ali HRTF torej popolnoma doloCen. V praksi seveda nastopijo problemi: nezadostno stevilo izmerjenih smeri, raznolikost usesnih skoljk, odvisnost prenosne funkCije od toCnega polozaja v usesu, vpliv bliznjega polja pri velikih valovnih dolzinah ... Ce zelimo v prenosni funkCiji glave videti kaj veC kot nabor kompleksnih podatkov v odvisnosti od kotov ^ in si moramo ogledati fizikalne zakonitosti in konCepte, ki nastopajo pri vpadu skalarnega valovanja na oviro. Vpliv površine Valovanje, ki pod vpadnim kotom a pada na neskonCno ravno povrsino s speCifiCno mehansko (= akustiCno) impedanCo Z, se odbije po odbojnem zakonu, amplituda odbitega valovanja tik ob povrsini pa je Cos a — 1 P1 = ^Zt-^ Po, (4) -Z Cos a + 1 Z0 kjer je Zo = yppx ~ 410 kg m-2 s-1 speCifiCna akustiCna impedanCa zraka, Po pa amplituda vpadnega valovanja tik ob povrsini. ObiCajno velja Z > Z0 (impedanCa Cloveskega mehkega tkiva [2] npr. znasa okrog Z ^ 1.6 ■ 106 kg m-2 s-1), tako da je pi ^ p0 praktiCno za vse vpadne kote (cos a = 1 pomeni pravokotni vpad). To pomeni, da je ob taksni povrsini amplituda tlaka dvakrat veCja kot v vpadnem valovanju, kar predstavlja 6 dB veCjo glasnost (pojav izkorisCa t. i. PZM - „pressure zone miCrophone", ki se ga namesti na tla ali steno). Pri glavi sta koristna dva mejna primera. Za valovne dolžine, majhne v primerjavi s premerom glave, le-ta pomeni veliko in ravno povrsino, za katero velja zgornja ugotovitev. Visokofrekvenčno valovanje, ki prihaja s strani, bo torej na vpadni strani ob povrsini za 6 dB ojačano. Na nasprotni strani pa bo zaradi sibkega uklona pri teh valovnih dolžinah glede na vpadno valovanje celo oslabljeno. Drugače je pri nizkih frekvencah: za valovanje z valovno dolzino, veliko v primerjavi s premerom glave, le-ta ne pomeni nobene ovire. V tem primeru torej nikjer ob glavi ni sprememb glasnosti. Značilno frekvenco, okrog katere se na vpadni strani glave zgodi prehod od nespremenjene k povečani glasnosti, ocenimo z zahtevo, da je valovna dolzina enaka „premeru" glave, na okrog 1700 Hz. Eksaktno pa velja, da je ta frekvenca ol)ratnosorazmerna z velikostjo glave. Sipanje valovanja na krogli V tem razdelku si bomo ogledali eksaktno resitev sipanja ravnega zvočnega vala na togi krogli (slika 2). Ta podaja polno informacijo o akustičnem polju v prostoru okrog krogle. Ce jo preberemo na povrsini krogle, pa predstavlja točno prenosno funkcijo toge krogle, ki jo ob izmerjenih HRTf kot eno od opcij običajno srečamo v računalniskih programih za auralizacijo (simulacijo zvoka, ki ga slisimo). Zaradi krogelne simetrije je prenosna funkcija v tem primeru, drugače kot pri prenosni funkciji dejanske glave, odvisna le od enega kota. Iz linearizirane Eulerjeve enačbe (Newtonov zakon za gibanje idealne tekočine), dv „ kjer sta p(r, t) in v(r, t) tlačno in hitrostno polje, p pa gostota zraka, linea-rizirane kontinuitetne enačbe za maso, dt in linearizirane enačbe stanja, dP + p V- v = 0, (6) dP = Xdp, (7) kjer je x adiabatna stisljivost, sledita valovna enačba za tlačno polje in z nastavkom p = poe-'"* amplitudna enačba: 1 ß2 p V2p - ^p = 0, V2po + fc2P0 = 0, (8) kjer je c = 1/^px hitrost valovanja in k = w/c velikost valovnega vektorja. Resitve slednje zapisimo v sfernih koordinatah [1]. Resitve radialnega dela Slika 2. Sipanje ravnega vala na togi krogli. Ravni val potuje v smeri 6 = 0. Rešitev za celotno tlačno polje je osnosimetricna glede na to smer in je tako odvisna le od polarnega kota 6. so sferne Besselove in Neumannove funkcije, ji (kr) in ni (kr), s katerimi zapišemo potujoce krogelno valovanje, ki se siri iz koordinatnega izhodi-sCa navzven, v obliki sfernih Hanklovih funkcij prve vrste, = jl + inl. OsnosimetriCne resitve kotnega dela pa so Legendrovi polinomi Pl(cos 9). TlaCno polje okrog krogle (slika 2) sestavimo iz vpadajocega ravnega vala z amplitudo 1 in od povrsine krogle odbitih krogelnih valov, po(r) = ^ Ak,i h(1)(kr) Pi(cos9), (9) i=o kjer so Ak,i koeficienti, ki jih moramo dolociti. Fazo ravnega vala zapisemo kot k ■ r = kr cos 9 in ga razvijemo po krogelnih funkcijah, i=o po(r)^ (2l + 1)ii ji(kr) + Ak,i h(1)(kr) Pi(cos9). (10) Na povrsini toge krogle s polmerom R mora za radialno komponento hitrosti veljati Vr(R) = 0, od koder iz enacbe (5) sledi robni pogoj za tlak: dpo dr r=R = 0, (11) z njim pa iz enačbe (10) iskani koefičienti: Ak,i = -(21 + 1)i1 j1 (kR) hl(kR) ■ Resitev za akustično polje, ki je podana z enačbo (9) in koefičienti (12), je vsota (interferenča) vpadajočega ravnega vala in odbitih krogelnih valov. Sestevati moramo do dovolj velikega 1, da je prispevek členov z vi sjimi 1 zanemarljiv. Slika 3 (zgoraj) prikazuje amplitudo tlaka okrog krogle (absolutna vrednost kompleksnega tlaka po enačbi (9)) za kR = 5. Lepo je viden porast tlaka pred kroglo in uklonski minimumi za njo, kakor tudi interfe-renča vpadajočega ravnega vala z odbitimi krogelnimi valovi, ki z razdaljo od krogle postopno pojema (daleč stran ostane samo ravni val, tj. konstantna amplituda). Na sliki 3 (spodaj) pa je primer trenutnega tlačnega polja. Zanimiva je zakasnitev valovanja za kroglo. Slika 3. Sipanje ravnega vala na togi krogli, ravni val s kR = 5 vpada z leve; (zgoraj); amplituda tlaka po enačbi (9) in trenutna slika tlačnega polja (spodaj). Desni sliki prikazujeta razmere dlje od krogle. Stereosnemanje: principi dvoušesne zaznave zvoka HRTF v modelu toge krogle Za binauralni zajem zvoka je seveda pomemben tlak ob površini krogle, kamor namestimo mikrofona. Najprej si na sliki 4 oglejmo, kako je am-plituda tlaka na povrsini pri 9 = n (vpadna stran) odvisna od k, torej od frekvence v = kc/2n, oziroma valovne dolZine A = 2n/k. Vidimo, da je pri nizkih frekvencah tlaCna amplituda zares enaka amplitudi vpadajoCega vala, pri visokih frekvencah pa postane skladno z napovedjo dvakrat veCja. Prehod se zgodi okrog kR ^ 2 oziroma A ^ nR. Na vpadni strani je torej visokofrekvenčni del spektra dvignjen za 6dB. 2 1.75 Ipl 1.5 1.25 1 10 4 6 kR Slika 4. Amplituda tlaka na površini krogle pri 0 = n v odvisnosti od brezdimenzijske velikosti valovnega vektorja kR. Slika 5 prikazuje polarne diagrame amplitude tlaka na povrsini krogle za narasCajoCe frekvence. Ravni val vpada z leve. Na tej strani je tlak pri visjih frekvencah torej poveCan do faktorja 2. Na senCni strani, kjer so visje frekvence oslabljene, prihaja do izrazitih interferenCnih efektov, pri Cemer se polozaj ojaCitvenih izrastkov z valovno dolzino zivahno spreminja. V dani smeri so zato nekatere frekvence moCno oslabljene - za senCno stran je torej znaCilna izrazita koloracija zvoka. Zanimiv je uklonski preostanek pri 9 = 0, ki z narasCajoCo frekvenco ne pojema, ampak se le tanjsa. Tak centralni uklonski maksimum sreCamo tudi pri uklonu svetlobe na okrogli plosCici. Slika 6 zdruzeno prikazuje odvisnost amplitude tlaka na povrsini krogle od kota 9 in od frekvence v enotah kR (kR = 2nvR/c), ki je na grafih predstavljena z razdaljo od izhodisCa. NizkofrekvenCni del spektra se nahaja na sedlastem obmoCju v okolici izhodisCa. Ker je kompleksna amplituda vpadajoCega vala kar 1, je kompleksni tlak p(R,9) iz enaCbe (9) pravzaprav ze iskana kompleksna prenosna funkcija toge krogle (na grafih 4-6 smo prikazovali le amplitudo, torej absolutno vrednost kompleksnega tlaka). Paziti je treba le se pri kotni odvisnosti, saj je prenosna funkcija funkcija smeri, iz katere prihaja valovanje, in ne smeri toCke na krogli, v kateri merimo tlak. Kompleksni prenosni funkciji toge krogle za levo in desno uho, torej HRTF v priblizku toge kroglaste glave, za zvoCilo v ekvatorialni ravnini (^ = n/2) kR = 0.1, ^ 54 Hz kR = 1, ^ 540 Hz 2 \ ?2 kR = 2, V ^ 1080 Hz kR = 5, v ^ 2700 Hz kR = 10, V ^ 5400 Hz kR = 15, v ^ 8100 Hz Slika 5. Amplituda tlaka na povrsini krogle v odvisnost od kota 6 za narasCajoCe vrednosti kR. Pripisana je orientacijska vrednost frekvence za primer R = 10 cm. Vpadna stran je na levi, sencna (6 = 0) pa na desni. sta tako n n Hl(^ = 2 = p(R,2 + ^), Hd(^ = 2= p(R,2 - ^), (13) (14) kjer p(R, 9) podaja enacba (9). Za zvocilo v splosni smeri (■&, ^) upostevamo osno simetrijo, izracunamo kot 6 glede na os od desnega usesa proti levemu, -1 -1 -1 -1 Slika 6. Odvisnost amplitude tlaka na površini krogle od frekvenče v enotah kR (predstavlja jo oddaljenost od izhodisča) in kota 9 (kaze ga polarni kot). Ravni val vpada z leve. Oba grafa prikazujeta isto funkčijo. Pozor: to je dvodimenzionalna predstavitev tlaka na povrsini krogle, ne tlačno polje okrog krogle kot na sliki 3. čos9 = sin ^ sin in zapisemo prenosni funkciji v splosnem: HL= - 9), Hd(^,^) = p(R, 9). (15) (16) Sklep Zvok, zajet s snemalno glavo, je moduliran in prek odziva snemalne glave (HRIR ali HRTF) nosi „prstni odtis" glave, ki je bila uporabljena. Bina-uralni posnetek se poslusa s slusalkami, praviloma odprtimi, ker najmanj spremenijo prenosno funkčijo obusesnega območja. Seveda se ne moremo izogniti bioloskim raznolikostim. Morda le tako, da mikrofona namestimo kar v svoji usesi - vendar se pri tem takoj pojavi problem točne pozicije in ponovljivosti namesčanja. Binauralni posnetek, predvajan prek stereo zvočnikov, je ob poslusanju ze drugič konvolviran z odzivom glave in poleg nekoliko oddaljene zvočne perspektive deluje presvetlo, zato ga je treba vsaj ekvilizirati. Večji problem je mesanje kanalov, saj zvok levega zvočnika dospe tudi v desno uho in obratno. Z dekonvolučijo je ta t. i. „čross-talk" mozno v prinčipu odstraniti, a le za točno določen polozaj posluseilčeve glave glede na geometrijo zvočnikov, individualno prilagojeno HRTF, gluho po-slusalničo ... Prav tako so problematične nizke frekvenče, ki jih običajno zaznavamo ze v bliznjem polju. Ker je dekonvolučija inverzni problem, so vse neidealnosti toliko bolj kritične. LITERATURA [1] I. Kusčer in A. Kodre, Matematika v fiziki in tehniki, DMFA Slovenije, Ljubljana, 1994. [2] I. Ogura et al., v Ultrasound in Medicine, Vol. 4, urednika D. White in E. A. Lyons, 535-543, Plenum Press, New York, 1978.