Lokalizacja źródeł dźwięków Janusz Renowski
Określanie miejsca , z którego dochodzi dźwięk, czyli wykrywanie i identyfikacja źródła dźwięku, ma duże znaczenie praktyczne. Dlatego zwykle mówi się o lokalizacji źródła dźwięku. W tym sformułowaniu zawarte jest założenie, że każdy dźwięk ma swoje miejsce pochodzenia – źródło, którego położenie można określić.
Od kiedy jednak została wynaleziona stereofoniczna transmisja dźwięku, konieczne było szersze spojrzenie na sprawę lokalizacji. W stereofonii występują bowiem tzw. pozorne źródła dźwięku, umiejscawiane tam, gdzie w rzeczywistości nie ma żadnego źródła (np. pomiędzy dwoma głośnikami). Słuchając przy użyciu słuchawek mamy do czynienia z lokalizacją dźwięku wewnątrz głowy, gdzie także nie ma żadnego źródła dźwięku.
pojęcie obrazu dźwiękowego (zdarzenia dźwiękowego) i Aby więc wyeliminować takie sprzeczności, należy wykorzystać znane pojęcia; pojęcie obrazu dźwiękowego (zdarzenia dźwiękowego) i pojęcie obrazu słuchowego (zdarzenia słuchowego)
Prowadzi nas to do mówienia o lokalizacji zdarzenia słuchowego i do szukania związków pomiędzy lokalizacją zdarzenia słuchowego i cechami obrazu dźwiękowego, z którymi jest związane dane zdarzenie słuchowe.
Do określenia położenia źródła dźwięku najwygodniej jest przyjąć przestrzeń trójwymiarową, na której określenie położenia źródła dźwięku dokonuje się za pomocą współrzędnych biegunowych: azymutu, kąta biegunowego i odległości.
Lokalizację źródła dźwięku w przestrzeni określa się względem głowy obserwatora w trzech płaszczyznach: środkowej (wertykalnej), poziomej (horyzontalnej) oraz pionowej (przedniej ).
Wszystkie te płaszczyzny mają wspólny punkt przecięcia leżący w przybliżeniu w środku głowy - na wysokości linii łączącej środki uszu. Punkt ten określa początek naszego układu współrzędnych, względem którego określa się kierunki propagacji dźwięku w stosunku do obserwatora.
Wektor r , łączący początek układu współrzędnych z punktem w którym znajduje się źródło dźwięku, nazywa się promieniem wodzącym (jest to jednocześnie nasza odległość).
Kąt zawarty między kierunkiem określającym przód i rzutem promienia wodzącego na płaszczyznę horyzontalną nazywa się kątem azymutalnym lub azymutem „ Q”
A kąt pomiędzy płaszczyzną horyzontalną a promieniem wodzącym (czyli odległości źródła dźwięku) nazywa się kątem biegunowym d (czasem nazywany jest kątem podniesienia).
Wartości kątów Q i d oraz odległość r, pozwalają na określenie położenia źródła dźwięku względem obserwatora. Dla źródła dźwięku leżącego dokładnie na wprost obserwatora, azymut i kąt biegunowy są równe zero (Q =d = O0 ).
zaś dla Q = 0o i d = 90o źródło dźwięku leży nad głową słuchacza. Dla kąta biegunowego równego zero, źródło leży w płaszczyźnie horyzontalnej, jeśli zaś azymut równa się zero to źródło leży w płaszczyźnie środkowej. Dla kątów, azymutalnego Q = 180o i biegunowego d = 0o, źródło leży z tyłu głowy, zaś dla Q = 0o i d = 90o źródło dźwięku leży nad głową słuchacza.
Przy takim określaniu położenia źródła dźwięku wyznaczonego w przestrzeni podanymi współrzędnymi, można wyróżnić dwa rodzaje błędów z którymi są związane dwie psychofizyczne metody pomiaru.
Metoda pierwsza mierzy tzw Metoda pierwsza mierzy tzw. absolutny błąd lokalizacji (dokładność lokalizacji). W tej metodzie słuchacz jest proszony o wskazanie kierunku, z którego wydaje mu się przychodzić dźwięk. Na podstawie wielu pomiarów dla danego kierunku określa się następnie absolutny błąd lokalizacji jako wartość średnią poszczególnych odchyleń w ocenie słuchacza od rzeczywistego kierunku, przy czym poszczególne odchylenia wyrażane są przez wartości bezwzględne.
Metoda druga mierzy próg różnicy (MAA – Minimum Audible Angle). W metodzie tej słuchacz jest proszony jedynie o określenie, czy dwa następujące po sobie dźwięki przychodzą z tego samego, czy też z dwóch kierunków. Próg różnicy lokalizacji definiowany jest jako najmniejsza wyczuwalna różnica pomiędzy azymutami 2. identycznych źródeł emitujących sukcesywnie następujące po sobie dźwięki.
Ostatnią sytuację ilustruje rysunek pokazujący próg różnicy DQ Pozycja źródła dźwięku w pozycji odniesienia (azymut 0) wskazana jest przez S, a dla każdej ledwo zauważalnej różnicy przez SL i SP
Po tych wyjaśnieniach dotyczących możliwych do wystąpienia błędów zastanowimy się , jak przebiegać będzie lokalizacja w sytuacji, gdy uwzględnimy wskaźniki czasowe i „natężeniowe” (czyli różnice czasów dojścia sygnałów i różnice poziomów ciśnienia akustycznego dla obojga uszu). A więc jaka jest lokalizacja źródeł dźwięku w płaszczyźnie poziomej i jaka jest lokalizacja w przestrzeni?
Morfologicznie, ludzki organ słuchu składa się z dwóch małżowin, otaczających wejście do kanałów usznych, położonych symetrycznie po przeciwnych stronach głowy. Każde ucho znajduje się w innym punkcie pola akustycznego. W przypadku ogólnym zatem , każde ucho odbiera inny sygnał akustyczny.
Zastępując głowę kulą możemy rozpatrzyć dwa skrajne przypadki padania fali dźwiękowej na głowę słuchacza przedstawione na rysunku poniżej.
W obu sytuacjach drogi fali dźwiękowej do każdego z uszu różnią się między sobą.
Dla sytuacji „a”, różnica ta wynosi Dl = r ( Q + sin Q), a dla „b” Dl = r 2 przy czym r – jest to promień głowy (w m), Q - kąt kierunkowy źródła, czyli kąt zawarty między płaszczyzną środkową, a prostą przechodzącą przez źródło i środek głowy (w radianach).
Wzór Dl = r ( Q + sin Q) można zastąpić wzorem: Dt = r/c ( Q + sin Q). Wówczas przyjmując promień głowy r = 0.1 m, oraz prędkość dźwięku c = 344 m/s, można dla różnych kątów kierunkowych wyliczyć różnicę czasów dojścia fali dźwiękowej do każdego z uszu. Podobne działania można wykonać dla źródła położonego blisko głowy.
Różnica czasów i jej wpływ na percypowany kierunek w płaszczyźnie horyzontalnej pokazana jest na rysunku.
Na podobnym rysunku pokazana jest różnica poziomów dźwięku przy lewym i prawym uchu i jej wpływ na percypowany kierunek (w płaszczyźnie horyzontalnej).
Zależność poziomu ciśnienia akustycznego mierzonego u wlotu da kanału ucha zewnętrznego od kąta padania fali dźwiękowej (dla dźwięków prostych o różnych f. w płaszczyźnie horyzontalnej wg Schirmera) pokazana jest na podanym wykresie.
To samo w płaszczyźnie symetrii.
W przypadku tonów okresowych różnicę czasów dojścia zastępuje różnica faz, ale jeśli różnica faz przekroczy 180 stopni nie można stwierdzić, czy dźwięk przychodzący do ucha dalszego opóźnia się w stosunku do dźwięku przychodzącego do ucha bliższego, czy też go wyprzedza. Dzieje się to przy częstotliwościach przy których długość fali pokrywa się lub jest mniejsza od średnicy głowy.
Stąd dla f. większych niż 1500 Hz mogą wystąpić niejednoznaczności w określaniu różnicy fazy. Przyjmuje się więc, że różnica faz może służyć do oceny położenia źródła dla f. mniejszych od 800 Hz. Można też spodziewać się, że powyżej częstotliwości 1500 Hz błąd lokalizacji źródła dla dźwięków prostych będzie się zwiększać (do chwili gdy wystąpi wyraźna różnica poziomów pomiędzy uszami, która teraz będzie decydowała o lokalizacji).
Dźwięki sinusoidalne docierające do słuchacza różnią się bowiem nie tylko fazą, ale również poziomem ciśnienia akustycznego, a głowa słuchacza znajdująca się w polu akustycznym powoduje powstawanie cieni akustycznych, a także spiętrzeń dźwięku. Na rysunku pokazana jest zależność pomiędzy częstotliwością tonu, a różnicą poziomów ciśnień akustycznych przy obojgu uszach, w sytuacji gdy fala dźwiękowa dochodzi z boku głowy (źródło dźwięku umieszczone jest pod kątem 90 stopni w stosunku do płaszczyzny środkowej).
Konkludując - można wysnuć następujące wnioski dotyczące lokalizacji rzeczywistych źródeł dźwięków wytwarzających dźwięki proste. W zakresie częstotliwości dużych główną rolę odgrywa różnica poziomów ciśnienia akustycznego pomiędzy uszami. W zakresie częstotliwości małych decydującym wskaźnikiem jest różnica faz. Dla częstotliwości pośrednich błąd lokalizacji powinien być największy.
Widać to na poniższym rysunku, a potwierdzenie wystąpienia największego błędu (około 21 stopni ) uzyskali Stevens i Newman wykonując następujące doświadczenie: Słuchacz umieszczony w polu swobodnym miał za zadanie określić położenie źródła tonu. Źródłem tym był głośnik umieszczony na ramieniu, które mogło się obracać dookoła głowy słuchacza w płaszczyźnie poziomej. Głośnik ten ustawiano w przypadkowej kolejności pod różnymi kątami.
Rysunek przedstawia otrzymaną w wyniku tego eksperymentu zależność błędu lokalizacji od częstotliwości. Największy błąd (około 21 stopni) pojawił się w tym zakresie częstotliwości w którym różnice poziomów i faz mogą dostarczyć tylko niewielką liczbę informacji o położeniu źródła.
Jeśli się będzie rozpatrywać łącznie między uszną różnicę czasów oraz między uszną różnicę poziomów ciśnienia akustycznego dla różnych położeń źródła dźwięku w przestrzeni otaczającej słuchacza, to dojdzie się do wniosku, że istnieje wiele punktów, dla których między uszna różnica poziomu i między uszna różnica czasu dotarcia fali jest taka sama.
Punkty te znajdują się na powierzchni stożka stożka niepewności (albo tzw. stożka pomieszania) co pokazano na rysunku. Takie same różnice dróg i czasów dojścia dźwięku dojścia dźwięku do lewego i prawego ucha wystąpią dla źródeł położonych na podstawie tego stożka.
Jeśli się rozpatrzy całą przestrzeń otaczającą słuchacza, to okazuje się, że promień podstawy stożka pomieszania, mierzony w coraz to większej odległości od głowy, zwiększa swoją długość. W skrajnym przypadku stożek ten dąży do płaszczyzny, która pokrywa się z płaszczyzną środkową
Można zatem stwierdzić, ż e w przypadku lokalizacji źródeł umieszczonych na płaszczyźnie środkowej słuchacz nie może się kierować ani między uszną różnicą czasów dotarcia, ani między uszną różnicą poziomu dźwięku.
W płaszczyźnie środkowej uzyskuje się zatem eliminację wskaźników czasowych i natężeniowych. Należy więc sądzić, że lokalizacja w płaszczyźnie pionowej bazuje na dodatkowych - innych – wskaźnikach lokalizacyjnych.
Są to właściwości małżowiny i kanału ucha zewnętrznego Są to właściwości małżowiny i kanału ucha zewnętrznego. Pewną rolę pomocną w lokalizacji źródła dźwięku mogą też stanowić właściwości skóry, bądź kształt twarzy czy czaszki. Właściwości te mogą być przedstawione w postaci funkcji HRTF (Head Related Transfer Function), o czym można się dowiedzieć z najnowszych badań [5].
Rolę, jaką odgrywa natomiast kształt małżowin usznych, wykazały już badania M.Gardnera (z 1973 r.) w których autor posługiwał się zestawem głośników jak na rysunku.
Korzystając z tego zestawu badał wpływ wypełnienia poszczególnych obszarów małżowiny usznej i wpływ widma na pogarszanie zdolności lokalizacyjnych w płaszczyźnie środkowej. (Obszary wypełnienia małżowiny pokazane są na rysunku poniżej).
Badania wykonano dla 14. słuchaczy i kilku rodzajów sygnałów (szumowych) o poziomie dźwięku „A” = 60 dB, mierzonym przy uchu słuchacza. Wyniki pomiarów zestawione są na rysunku.
Widać na nim , że: Zdolność lokalizacji maleje ze wzrostem wypełnienia małżowiny usznej. Zdolność lokalizacji wzrasta wraz ze wzrostem częstotliwości środkowej pasma szumu. Lokalizacja jest lepsza dla szumu szeroko pasmowego w porównaniu do szumów wąskopasmowych przy wszystkich stopniach wypełnienia małżowiny usznej. W nieobecności wypełnienia rezultaty dla szumów wąskopasmowych przy 8 i 10 kHz są ściśle porównywalne z rezultatami dla szumu białego.
Konkluzja Przy określaniu położenia źródła dźwięku w przestrzeni, u ludzi słyszących tylko na jedno ucho, istotną rolę odgrywa małżowina i kanał ucha zewnętrznego.
Powstało kilka teorii próbujących wyjaśnić zdolność określania położenia źródła dźwięku u ludzi słyszących jedno usznie. Przytoczmy dwie z nich: Pierwsza, to teoria oparta na badaniach uczonego o nazwisku Show-Teranishy. Teoria ta mówi, że małżowina uszna wraz z kanałem ucha zewnętrznego przedstawia układ rezonansowy, a wzbudzenie określonych rezonansów zależy od kierunku i odległości źródła dźwięku od obserwatora.
Badania na modelach , a także pomiary wykonane w małżowinach i kanałach usznych u osobników żywych pozwoliły wyciągnięcie następujących stwierdzeń:
Przy częstotliwości około 3 kHz występuje pierwszy rezonans kanału ucha zewnętrznego, a przy f = 5-6 kHz drugi sposób drgań, a więc druga częstotliwość rezonansowa. (przy błonie bębenkowej mamy więc nadciśnienie - zwiększony poziom ciśnienia), mamy też powstałe w tym układzie fale stojące. Kolejny rezonans będzie przy 9 kHz a w kanale ucha zewnętrznego ułożą się wówczas trzy punkty faz „ +” , „-” i „+”.
Okazało się, że zmiana położenia punktowego źródła dźwięku stosowanego w badaniach zmieniała częstotliwości rezonansowe i rozkład ciśnienia akustycznego w kanale ucha zewnętrznego obserwatora.
Druga, to hipoteza Batteau Hipoteza Batteau w zasadniczy sposób wiąże określanie położenia źródła dźwięku z budową małżowiny usznej. W jego teorii bowiem istotna rolę grają zewnętrzne elementy małżowiny usznej i to, zarówno przy detekcji kąta wzniesienia , jak i odległości, czy azymutu.
Hipoteza Batteau Fala dźwiękowa pada na małżowinę a zaistniałe efekty można opisać następującym schematem funkcjonalnym. + a1 t1 a2 t2 I tak; - fala dźwiękowa z tłumieniem a1 jest odbita od detektora odległości (obrąbek) i wpada do kanału ucha zewnętrznego z opóźnieniem t1 , - podobnie z tłumieniem a2 jest odbita od innego fragment i wpada do kanału z opóźnieniem t2 . Tam fale są sumowane.
W związku z tym odpowiedź impulsowa opisana jest poniższym równaniem: W związku z tym odpowiedź impulsowa opisana jest poniższym równaniem:. h (t) = d(t) + a1d(t –t1 ) + a1d(t –t2 ) Można też określić transmitancję tego toru równaniem podanym niżej: H(f) = 1 + a1 e -2ft1 + a2e -2pft2
Zarówno a1 i a2 jak i t1 i t2 zależą od kąta oraz oraz od odległości Zarówno a1 i a2 jak i t1 i t2 zależą od kąta oraz oraz od odległości. Opóźnienie pomiędzy dźwiękiem bezpośrednim a odbitym zależy od kierunku padania czoła fali. Zmienia się ono od 10 do 100 ms dla azymutów oraz od 100 do 300 ms dla kątów podniesienia.
Na zakończenie przypominamy, że wspomniana już poprzednio funkcja HRTF stara się uwzględnić wszystkie te czynniki, które dodatkowo (oprócz ruchów głowy i wcześniej omówionych różnic poziomów i czasów dojścia fali dźwiękowej do uszu) współdziałają w lokalizacji źródeł dźwięków w przestrzeni [5].
Bibliografia [1] Houtsma A.J.M.,Rossing T,D.,Wagenaars W.M., Auditory Demonstrations, IPO, Eindhoven 1987 [2] Jorasz U., Wykłady z psychoakustyki, Wydawnictwo Naukowe UAM, Poznań 1998 [3] Moore B.C.J., Wprowadzenie do psychologii słyszenia, Wydawnictwo Naukowe PWN, Warszawa-Poznań 1999 [4] Ozimek E., Dźwięk i jego percepcja, Wydawnictwo Naukowe PWN, Warszawa-Poznań 2002 [5] Plaskota P., Symulacja HRTF uwzględniająca akustyczne parametry głowy (praca doktorska), Instytut Telekomunikacji Teleinformatyki i Akustyki PWr, Raport seria PRE I 28/P-018/06, Wrocław 2006, ss.146