Wstęp do Multimediów Wykład 3 Słuch. Podstawowe pojęcia z dziedziny akustyki. Charakterystyki słuchu. Pasma krytyczne. Właściwości słyszenia muzyki i mowy
Narząd słuchu Ucho – narząd odbierający informację akustyczną i kodujący ją w odpowiednie impulsy neuralne Droga słuchowa – przenosząca zakodowane informacje Pola słuchowe kory mózgowej – miejsce powstawania wrażenia słuchowego
Budowa ucha - model
Budowa ucha
Budowa ucha
Budowa ucha
Budowa ucha external ear canal
Budowa ucha
Budowa ucha
Budowa ucha
Budowa ucha Inner ear semicircular canals
Budowa ucha Źródło: http://www.sightandhearing.org/
Budowa ucha Ucho zewnętrzne: małżowina i kanał słuchowy Kanał słuchowy można rozpatrywać w przybliżeniu jako kanał otwarto-zamknięty Małżowina i kanał słuchowy wpływają na (filtrują) dźwięk z powodu swojego charakterystycznego kształtu human eardrum dampens the resonance peaks and antiresonance notches caused by the ear canal J. Audio Eng. Soc., Vol. 58, No. 4, 2010 p.271 Ucho środkowe: błona bębenkowa i kosteczki słuchowe Kosteczki słuchowe: młoteczek, kowadełko, strzemiączko Działają jak przetwornik mechaniczny, konwertujący ciśnienie działające na błonę bębenkową na ciśnienie działające na okienko owalne, ze współczynnikiem wzmocnienia do 30 razy Większa część wzmocnienia jest spowodowana różnicą powierzchni (błony b. i okienka) – ok. 20 razy Dźwignia kosteczek – ok. 1.5 raza 13
Budowa ucha Ucho wewnętrzne: Kanały półkoliste kontrolują równowagę człowieka Ślimak przekształca zmiany ciśnienia w impulsy nerwowe Ok. 30000 komórek rzęsatych na błonie podstawnej o dł. ok. 37 mm Każda komórka ma wiele rzęsek, falujących pod wpływem wibracji błony podstawnej Detekcja wysokich częstotliwości następuje wzdłuż sztywnej części błony (najbliższej okienka owalnego) Detekcja niskich częstotliwości następuje następuje w pobliżu drugiego końca błony Istotne jest również przewodnictwo kostne do ucha wewnętrznego Włókna nerwu słuchowego są “nastrojone” na różne częstotliwości środkowe 14
Słuch i inne zmysły http://www.aes-media.org/706641079/tutorials/126_T7_Schulein/; AuditoryTransduction – animacja (słuch) Sensor processing: Sense Capacity b/s Sight 10.000,000 Hearing 100.000 Skin(feel) 1.000.000 Taste 1.000 Smell 100.000 Total 11.201.000
Ucho
Ucho 17
Budowa ucha - przekrój 18
Budowa ucha – przekrój ślimaka Błona podstawna blisko podstawy ślimaka (przy przy okienku owalnym) jest wąska i sztywna. W kierunku szczytu ślimaka (helicotremy) jest coraz szersza i coraz bardziej elastyczna i w najszerszym miejscu osiąga 3mm szerokości 1. Zwój nerwu ślimakowego, 2. Włókna nerwu śl., 3. Blaszka spiralna kostna, 4. Przewód ślimakowy, 5. Schody przedsionka, 6. Schody bębenka, 7. Błona podstawna, 8. Narząd Cortiego, 9. Więzadło spiralne, 10. Prążek naczyniowy, 11. Błona przedsionkowa Reissnera 19
Budowa ucha – przekrój ślimaka
Budowa ucha – przekrój ślimaka W obudowie kostnej ślimaka znajduje się okienko owalne, okryte błoną, połączone ze strzemiączkiem W dolnej części ślimaka znajduje się okienko okrągłe, okryte błoną Schody przedsionka i bębenka łączy szpara osklepka (helikotrema) na szczycie ślimaka Dźwięk biegnie od o.owalnego przez s.przedsionka do szczytu ślimaka, dalej s.bębenka, do o.okrągłego Przestrzeń wypełniona perylimfą Narząd Cortiego (w błonie podstawnej) zbudowany jest z komórek receptorowych i podporowych
Budowa ucha – narząd Cortiego W narządzie Cortiego znajduje się 1 rząd komórek rzęskowych wewnętrznych (około 3500) i 3 (do 5) rzędów komórek zewnętrznych (po około 5000 lub mniej komórek w każdym rzędzie) Każda z komórek wewnętrznych ma ok. 40 tzw. rzęsek formujących proste rzędy Do każdej z tych komórek dochodzi ok. 20 neuronów aferentnych, przekazujących impulsy elektryczne ze ślimaka na wyższe piętra drogi słuchowej i dalej do mózgu Zewnętrzne komórki rzęskowe uporządkowane są w pięciu rzędach. Jest nich około 25000 a każda ma ok. 140 rzęsek uformowanych w kształcie litery V Do komórek tych dochodzi ok. 1800 neuronów eferentnych tj. przekazujących sygnały z mózgu
23
Słyszenie – reakcja ucha na dźwięk Drgania błony podstawnej są nieliniowe – sygnał odpowiedzi nie wzrasta proporcjonalnie do sygnału wejściowego Przy pobudzeniu impulsem na błonie podstawnej powstaje i przemieszcza się wzdłuż niej „zaburzenie” – krótki ciąg fal gasnących Częstotliwość oscylacji tych fal koresponduje z częstotliwością charakterystyczną danego punktu błony podstawnej
Słyszenie – reakcja ucha na dźwięk Reakcja błony podstawnej na pobudzenie impulsowe
Percepcja głośności sygnału Próg słyszalności (próg absolutny, próg detekcji sygnału) jest najmniejszym poziomem ciśnienia akustycznego dźwięku, który wywołuje zaledwie spostrzegane wrażenie słuchowe wobec braku innych dźwięków Próg słyszalności zależy od częstotliwości sygnału
Skala dB Próg słyszalności (minimalna zmiana ciśnienia wykrywana przez ucho) < 10-9 ciśnienia atmosferycznego lub 2*10-5 N/m2 dla 1000 Hz Dolna granica percepcji Zależna od częstotliwości sygnału Próg bólu odpowiada ciśnieniu 106 większemu, lecz nadal < 1/1000 od ciśnienia atmosferycznego Z powodu szerokiego zakresu, pomiary ciśnienia dźwięku wykonywane są w skali logarytmicznej (dB)
SPL SPL - Sound Pressure Level Sound Pressure Level (SPL)=20 log (p/p0)=10 log (p/p0)2 gdzie p0 =2*10-5 N/m2 SPL jest proporcjonalny do średniego pierwiastka z amplitudy
Próg słyszalności Eksperymenty: >20kHz (nawet 24kHz) Ashihara et al, 2010: Psychoacoustic Measurement and Auditory Brainstem Response in the Frequency Range Between 10 kHz and 30 kHz some subjects could perceive sounds above 20 kHz and the auditory brainstem response could be measured for one subject at 22 kHz. However, SPLs of the thresholds were beyond 80 dB in the both measurements. The aud.nerve seems not to be stimulated by weak high-frequency sounds
PWL, intensywność dźwięku Poziom mocy dźwięku Całkowita moc dźwięku emitowanego przez źródło we wszystkich kierunkach Mierzona w watach (joule/s) Sound Power Level (PWL)=10 log(W/W0), W0=10-12 watów Intensywność (natężenie) dźwięku Stosunek przepływu energii przez jednostkę powierzchni/s Sound Intensity Level (IL) = 10 log (I/I0), gdzie I0=10-12 wat/m2 (I/I0=(p/p0)2) 2 i więcej źródeł 2 jednakowe źródła dają zwiększenie PWL o 3dB 2 jednakowe źródła dają 3 dB zwiększenie SPL, przy założeniu braku interferencji (10 log 2*I1/I2=10 log 2 + 10 log I1/I2) Dwa 80-decybelowe źródła dodając się dają 83 dB SPL 30
Percepcja głośności Głośność opisuje wielkość wrażenia słuchowego. Zasadniczo zależy od wielkości fizycznej ciśnienia dźwięku wytwarzającego to wrażenie; inne czynniki: częstotliwość i amplituda, szerokość pasma, czas trwania, złożoność dźwięku
Głośność
Poziom głośności Skala poziomu głośności dźwięku dla prawidłowej oceny głośności Poziom głośności dźwięku [fon] = poziom ciśnienia akustycznego jaki w danym punkcie wytwarza fala akustyczna o częstotliwości 1000 Hz, która daje głośność identyczną z głośnością porównywanego dźwięku Liczbowo p.g. wyraża się wartością poziomu natężenia tonu porównawczego, tzn. liczba fonów równa się liczbie decybeli tonu porównawczego 0 fonów - próg czułości ucha, 130 fonów - granica bólu; 1 fon to poziom głośności dźwięku o poziomie natężenia 1 dB i częst. 1kHz (E.Kubera, praca doktorska, PJWSTK); http://www.rmfclassic.pl/muzyka/encyklopedia,1.html głośności poziom, poziom głośności, natężenia dźwięku poziom
Skalowanie głośności 2-krotna zmiana natężenia odpowiada zmianie poziomu o 3 dB 2-krotna zmiana głośności jest wywołana zmianą poziomu o 10dB Głośność L [son]: L = k I0,3, k – stała (powyżej 40dB) Głośność 1 son = głośność tonu o częstotliwości 1kHz i poziomie 40 dB SPL 1 son=głośność tonu 1000 Hz na poziomie dźwięku 40 dB (lub głośności 40 fonów); dźwięk o głośności 2 jest 2-krotnie głośniejszy, dźwięk o poziomie 0.5 son jest o połowę cichszy Podwojenie głośności z 1 sona do 2 sonów: 50 dB SPL 100 dB: 64 sony Dla niskich poziomów głośność zmienia się szybciej Skala fonów SPL tonu odniesienia identyfikuje izofony (krzywe jednakowej głośności) w jednostkach zwanych fonami, wyznaczanymi w dB SPL dla 1 kHz
Skalowanie głośności skala dla tonu o częstotliwości 1kHz
Percepcja głośności sygnału Izofony Krzywe jednakowej głośności dla różnych poziomów głośności. Sygnały testowe prezentowano binauralnie i docierały do obserwatora z przodu. Dodatkowo przedstawiono krzywą progu słyszalności MAF w polu swobodnym 36
Izofony: Standard ISO 226:2003 Normal equal-loudness-level contours
Percepcja głośności Głośność czystych tonów Dźwięki o równym SPL ale różnych częstotliwościach nie muszą brzmieć tak samo głośno Nasz układ słuchowy jest szczególnie niewrażliwy na dźwięki o niskiej częstotliwości o intensywności od średniej do niskiej Maksimum czułości ok. 4000 Hz i lokalne maksimum ok. 13 kHz są związane z 2 pierwszymi częstotliwościami rezonansowymi kanału słuchowego
Percepcja głośności Głośność i czas trwania dźwięku Głośność wzrasta z czasem trwania dźwięku, do ok. 0,2 s Ochrona do ok. 20 dB zapewniana jest przez mięśnie przyczepione do błony bębenkowej i kosteczki słuchowe, przy ekspozycji na dźwięk przekraczający ok. 85 dB ruch obrotowy wokół poziomej osi strzemiączka przy zbyt silnym pobudzeniu błony bębenkowej – tzw. refleks akustyczny, lub inaczej odruch strzemiączkowy Ten odruch zaczyna działać ok. 30 - 40 ms po rozpoczęciu dźwięku, pełna ochrona następuje po ok. 150 ms. Tak więc głośne impulsy dźwiękowe (eksplozje, strzały) są zbyt szybkie, by zadziałała ochrona ucha
Mierzenie poziomu dźwięku Mierniki poziomu dźwięku wyposażone są w krzywe korekcyjne, oparte na izofonach. Krzywe te uwzględniają aspekty głośności zależne od częstotliwości Natężenia dla wszystkich częstotliwości, nim zostaną zsumowane, podlegają ważeniu za pomocą funkcji będących odwróconymi izofonami Funkcje te są jedynie zbliżone kształtem do izofon
Percepcja głośności sygnału A,B,C – wyznaczają krzywe korekcyjne stosowane w miernikach poziomu dźwięku Dla miernika krótkoczasowego – sugerowana stała czas.~4s; powinien działać nieliniowo – reagować szybciej przy szybszych zmianach sygnału Najpopularniejsza jest krzywa A 41
Prawo Webera -Fechnera Przyrost intensywności bodźca zdolny wywołać dostrzegalny przyrost intensywności wrażenia jest proporcjonalny do już działającego bodźca Przyrost wrażenia jest proporcjonalny do logarytmu przyrostu bodźca Przyrost wrażenia jest logarytmicznie proporcjonalny do przyrostu bodźca
Odstępstwa od prawa Webera Od strony dużych częstotliwości pobudzenie wzrasta nieliniowo ze wzrostem natężenia Przebiegi pobudzeń wywołanych przez ton o częstotliwości 1kHz i o poziomie 20, 30, 40, 50, 60, 70, 80 i 90dB (najwyższa krzywa). Przebiegi wyznaczone na podstawie danych psychoakustycznych 43
Spostrzeganie zmian natężenia Dynamika układu słuchowego – reakcja na pobudzenie
Filtry słuchowe Układ słuchowy można modelować jako zestaw filtrów słuchowych 45
Pasma krytyczne Pasmo krytyczne jest to elementarne pasmo częstotliwości o szerokości wydzielone z ciągłego pasma szumów i zawierające w sobie moc akustyczną równą mocy akustycznej tonu prostego o częstotliwości f położonej w środku tego pasma, przy czym rozpatrywany ton prosty ma taką intensywność, że zagłuszany przez nieograniczone widmo szumów ciągłych znajduje się dokładnie na granicy słyszalności
Pasma krytyczne Jeśli ton prosty o częstotliwości f jest słyszany na tle równomiernego i nieograniczonego szumu, to efekt zagłuszania tonu przez szum wywołany jest jedynie działaniem szumów mieszczących się w paśmie krytycznym
Pasma krytyczne Są regionami „wyróżnionymi” na błonie podstawnej Wyznaczone przez eksperymenty psychoakustyczne Ok. 24 pasm na błonie podstawnej Każde pasmo ma ok. 1,3 mm dł. i obejmuje ok.1300 neuronów
Pasma krytyczne Wg Zwickera Wg Fletchera 24 pasma http://ccrma-www.stanford.edu/~jos/bbt/Bark_Frequency_Scale.html Wg Fletchera 12 pasm 49
Głośność dźwięków złożonych Gdy szerokość pasma dźwięku złożonego jest mniejsza od szerokości pasma krytycznego, wtedy głośność jest ~ niezależna od szerokości pasma Dźwięk taki oceniany jest jako jednakowo głośny z tonem o takim samym natężeniu i o częstotliwości = częstotliwości środkowej pasma tego dźwięku Jeśli szerokość pasma dźwięku będzie zwiększana ponad szerokość pasma krytycznego, głośność tego dźwięku zacznie wzrastać 50
Głośność dźwięków złożonych Dla dźwięków o szerszym paśmie rośnie wraz z pasmem – tzw. sumowanie głośności Np. szerokopasmowy dźwięk orkiestry grającej akord wydaje się być głośniejszy niż pojedynczy dźwięk fletu, nawet jeśli dźwięki mają ten sam poziom SPL
Głośność dźwięków złożonych Poziom głośności w fonach pasma szumu o częstotliwości środkowej 1kHz jako funkcja szerokości tego pasma. Dla każdej z krzywych całkowity poziom dźwięku [dB SPL] był stały. Początek wzrostu głośności przypada dla tej samej szerokości pasma bodźca dla wszystkich poziomów (oprócz najniższego – bez wzrostu głośności) 52
Głośność dźwięków złożonych Zmienność głośności z szerokością pasma Stała wartość dla pasm węższych niż pasmo krytyczne ERB – ekwiwalentna szerokość prostokątna – miara szerokości pasma filtrów Równa szerokości filtru doskonale prostokątnego o wysokości i polu powierzchni jak dany filtr Górny rys: Krzywe pobudzenia dla sygnału sin 1kHz o poziomie 60dB SPL i pasm szumu o częst. środkowej 1kHz, 60dB SPL i różnych szerokościach. Częstotliwość wyrażono w jednostkach ERB. Szerokości pasm szumu wynoszą 20, 60, 140, 620 i 1260 Hz. Gdy szerokość pasma szumu wzrasta, krzywe pobudzenia obniżają się i obejmują szerszy zakres wskaźnika ERB. Dolny rys: krzywe głośności właściwej odpowiadające krzywym pobudzenia z rys. górnego. Dla szerokości pasma <=140Hz powierzchnia pod krzywą głośności właściwej jest stała. Dla szerszych pasm szumu całkowita powierzchnia zwiększa się. 53
Perceptualne aspekty słyszenia Maskowanie: w czasie (w przód, wstecz), w dziedzinie częstotliwości Głośniejszy dźwięk może sprawić, że inny, cichszy dźwięk nie będzie słyszalny (głośniejszy zamaskuje cichszy), zależnie od wzajemnych relacji częstotliwości i głośności obu dźwięków Czyste tony o bliskich częstotliwościach maskują się bardziej niż oddalone Czysty ton o wyższej częstotliwości jest maskowany efektywniej niż o niższej Im większa intensywność tonu maskującego (maskera), tym szersze pasmo maskowania
Krzywe maskowania Krzywe (audiogramy) maskowania dla wąskiego pasma szumu o różnym poziomie i o częstotliwości środkowej 410Hz. Każda krzywa przedstawia podwyższenie progu detekcji tonu jako funkcję jego częstotliwości 55
Perceptualne aspekty słyszenia: wysokość dźwięku Rozróżnianie wysokości dźwięku Najmniejsza postrzegalna różnica pomiędzy 2 pobudzeniami zwana jest just noticeable difference (jnd) jnd dla wysokości dźwięku zależy od jego częstotliwości podstawowej, poziomu dźwięku, czasu trwania i szybkości zmian częstotliwości Ten sam mechanizm wydaje się odpowiadać za pasma krytyczne i rozróżnianie częstotliwości Około 30 jnd w każdym paśmie krytycznym dla wszystkich środkowych częstotliwości Częstotliwość podstawowa F a okres T i długość fali dźwiękowej λ; λ=cT, F=1/T, c – prędkość dźwięku w powietrzu, 345m/s w temp. 22°C (340m/s); Prędkość dźwięku w ciałach stałych jest większa niż w powietrzu F=32,7Hz długość fali 10,5m okres 30,6ms F=261,6Hz długość fali 1,3m okres 3,8ms F=12,558Hz długość fali 27,5mm okres 0,08ms 56
Skala melowa i skala barków Skala melowa - uwzględniająca cechy psychofizjologiczne słuchu ludzkiego http://www.answers.com/topic/mel-scale http://sound.eti.pg.gda.pl/student/amowy/mat-am-4.pdf Skala barków – pasma krytyczne wg Zwickera 57
Wysokość dźwięku Słyszana wysokość dźwięku W dźwięku harmonicznym, największy wspólny dzielnik częstotliwości składowych identyfikowany jest jako wysokość dźwięku, nawet, jeśli jest bardzo słaby lub brakujący (częstotliwość pozorna) W nieharmonicznych tonach złożonych, ucho wychwytuje serie składowych zbliżonych do harmonicznych w okolicy środka zakresu słyszalności i wyznacza wysokość dźwięku jako NWD w seriach Np. 650, 950,1250 Hz ->334Hz (1,95, 2,84, i 3,74) Składowe zbyt odległe od t.podst. by były traktowane przez ucho jako cześć dźw.harm. o podstawie 50Hz http://www.cise.ufl.edu/~acamacho/publications/Object1-7.Inharmonic_signal.wav 58
Wysokość dźwięku Model percepcji dźwięków złożonych 59
Wysokość dźwięku Wysokość czystych tonów a czas trwania Wrażenie wysokości może powstać po 3-4 okresach dla impulsów tonów o niskiej częstotliwości (50-100 Hz), jednak ten czas trwania wydłuża się do ok. 12 okresów dla 1000 Hz (i rośnie wraz z częstotliwością) Jeśli ton ma miękki atak, rozpoznanie jest możliwe już po 3 ms
Wysokość dźwięku Wysokość czystych tonów a interferencja z innymi dźwiękami Wysokość tonu testowego wydaje się wzrastać w obecności tonu interferującego o niższej częstotliwości Wysokość tonu testowego wydaje się maleć w obecności tonu interferującego o wyższej częstotliwości Wysokość tonu testowego wydaje się wzrastać w obecności interferującego szumu o składnikach niskiej częstotliwości. Jeśli szum zawiera wyższe częstotliwości, możliwe jest przesunięcie w obu kierunkach Postrzegane przesunięcie wysokości dźwięku wzrasta wraz ze wzrostem amplitudy interferującego dźwięku przekraczającej amplitudę tonu testowego 61
Słyszenie barwy dźwięku Barwa dźwięku Cecha dźwięku pozwalająca rozróżnić 2 dźwięki o tej samej wysokości, prezentowane w tych samych warunkach (wg American Standards Association) Subiektywny atrybut dźwięku, oparty głównie na składzie częstotliwościowym dźwięku Zależy od kształtu fali dźwiękowej Charakter zmian czasowych składowych widma ma duże znaczenie dla określania barwy dźwięku Stałe proporcje składników widma – monotonne brzmienie Skale subiektywne (nudny - błyskotliwy, zimny - ciepły, ubogi - bogaty, tępy - ostry, zwarty - rozproszony, pełny - pusty, barwny - bezbarwny)
Słyszenie wielotonów Składową wielotonu można usłyszeć jako oddzielną, gdy jej odległość od sąsiednich składowych szerokości pasma krytycznego Dla dwutonów jest to możliwe dla mniejszych odległości Rys. górny: pobudzenia dla poszczególnych składowych i pobudzenie łączne. Rys. dolny: pobudzenia związane z 7 i 8 składową oraz ich pobudzenie łączne. Dla dwutonu neurony o częstotliwościach charakterystycznych <1400Hz będą zsynchronizowane fazowo przede wszystkich z niższą z harmonicznych, a neurony o częstotliwościach charakterystycznych >1600Hz będą zsynchronizowane głównie z wyższą z harmonicznych 63
Słyszenie barwy dźwięku Spadek amplitudy alikwotów o 6dB/okt. odpowiada barwie naturalnej Przy spadku amplitudy alikwotów <6dB na oktawę dźwięk ma barwę wytężoną Przy spadku amplitudy alikwotów >6dB na oktawę dźwięk ma barwę lekką
Słyszenie barwy i wysokości dźwięku Glissando –wrażenie stale rosnącej wysokości dźwięku: http://eamusic.dartmouth.edu/~book/MATCpages/chap.4/chap4.snd/forann.aiff.mp3 Słyszenie ciągłego dźwięku the illusion of continuity: the auditory system fills in the gaps in the meaningful signal component based on other nontonal energy in the same frequency region
Słyszenie mowy Głoski dźwięczne i bezdźwięczne Głoski dźwięczne zawierają formanty Formant – maksimum charakterystyki (obwiedni widma), wyraźnie przekraczające założony poziom średni tej charakterystyki, przy zapewnieniu warunku odpowiedniej rozległości tego maksimum I prążek odpowiada tonowi krtaniowemu
Słyszenie mowy Górna część: krótkoterminowe widma różnych fragmentów czasowych wypowiedzi, środkowa – spektrogram, dolna – zmiany amplitudy sygnału w czasie. Widma w górnej części zostały wyznaczone na podstawie sygnału, którego składowe o dużych częstotliwościach zostały wzmocnione względem składowych o małych częstotliwościach 67
Zrozumiałość mowy Pasmo telefoniczne: 300 - 3400 Hz Standardy (JAES vol. 53 no.7/8 2005, p. 760): Speech Interference Level (SIL) Articulation Index (AI) Speech Intelligibility Index (SII) Speech Transmission Index (STI) Pasmo telefoniczne: 300 - 3400 Hz
Zrozumiałość mowy Speech Transmission Index (STI) STI measurements make use of a modulation transfer function in which the human voice is characterized by 7 bands of frequencies from 125 Hz to 8 kHz that are modulated in a range 0.63 - 12.5 Hz STI value reveals the depth of modulation If no noise or reverberation alters the sound, then the speech intelligibility is considered excellent at 1.0 As distortion reduces the depth of modulation, falling STI scores reflect lower speech intelligibility STI=0 indicates that the communication is totally unintelligible
Lokalizacja źródła dźwięku a human being cannot easily distinguish the variation of the spatial angle within 3 degree distortion JAES vol.53 no.12 2005 p.1216; JAES v.55 no.6 2007 p.540 IID: Interaural intensity difference – dominuje dla częstotliwości powyżej ok. 4000 Hz Interaural Level Difference; wewnątrzsłuchowa różnica natężenia dźwięku In real rooms low-frequency ILDs are often strongly affected by the acoustics of the space, giving rise to misleading localization cues In such cases it appears that we ignore the ILD cues and concentrate on the ITDs ITD: Interaural time difference - dominuje dla f<1kHz Interaural Time Delay; wewnątrzsłuchowe opóźnienie czasowe Efekt pierwszeństwa Fale dźwiękowe podróżują z jednej strony głowy na drugą w ok. 0.0006s (tak szybko, że nie słyszymy echa dopóki dźwięk nie zwolni 100 razy). Umysł szybko oblicza różnicę dźwięków dochodzących do obu uszu w minimalnie różnym czasie, a następnie pierwszy usłyszany dźwięk określa kierunek Działa dla zmiennych dźwięków (np. przejeżdżające auto), ale nie tak efektywnie dla ciągłych dźwięków wysokiej częstotliwości (flet) HRTFs: Head-related Transfer Functions – powszechnie używane w systemach reprodukcji 3D Presenting sounds in virtual environments requires filtering free-field signals with HRTFs, describing the filtering effects of pinna, head, and torso measured in the ear canal of a subject Konieczne jest wyznaczenie odrębnej HRTF dla każdego ucha i dla każdej pozycji 70
Lokalizacja źródła dźwięku http://ebooki.bisi.pl/helion/100taj-4-pp_branded.pdf
HRTF represents the modifying effect of the head and ear on the signal originating from a particular point in space, in terms of time delay and frequency spectrum characterizes the scattering of sound waves on the human body, esp. on pinnae, head, and torso high variability between individuals updating is done to reflect the changes in the sound transmission to the listener’s ears that occur as a result of moving sound individually measured, generic, and customizable HRTFs Symmetrical nature of HRTFs may exacerbate the in-the-head locatedness of headphone playback
Lokalizacja źródła dźwięku Lokalizacja źródła tonów stacjonarnych w polu swobodnym w płaszczyźnie horyzontalnej (zał: źródło znajduje się z jednej strony głowy słuchacza). Dźwięk dochodząc do ucha dalszego jest opóźniony w stosunku do dźwięku docierającego do ucha bliższego. Powstaje międzyuszna (binauralna) różnica czasu. Dla tonów stacjonarnych różnica ta odpowiada binauralnej różnicy fazy W lokalizacji źródła dźwięku odgrywają rolę m.in. ruchy głowy Od kąta padania dźwięku zależy głośność JAES v.56 no.6 2008 p.452 73
Lokalizacja źródła dźwięku Układ współrzędnych stosowany do określenia kątów dochodzenia dźwięków względem głowy słuchacza. Azymut teta ma dodatnie wartości z lewej strony głowy, kąt biegunowy delta ma dodatnie wartości powyżej płaszczyzny horyzontalnej; r – odległość źródła dźwięku od głowy 74
Lokalizacja źródła dźwięku Rzeczywistość wirtualna - interactive virtual audio displays: headtracker latency values lower than 60 ms are likely to be adequate for most virtual audio applications, and delays of less than 30 ms are difficult to detect even in very demanding virtual auditory environments J. Audio Eng. Soc., Vol. 54, No. 1/2, 2006 p.32
Złudzenia słuchowe Can arise when there are conflicting segregation or fusion cues, with a resulting condition in which the psychological perception is very different from the physical stimuli The Franssen Illusion produces large localization errors due to the ineffectiveness of ITD and ILD cues in determining the location of a sinusoidal source in a reflective room The Clifton Effect is a result of the breakdown of the precedence effect The McGurk Effect results when a visual cue contradicts an accompanying auditory cue J. Audio Eng. Soc., Vol. 55, No. 4, 2007 p.308
Literatura Alicja Wieczorkowska. Multimedia. Podstawy teoretyczne i zastosowania praktyczne. PJWSTK, 2008 Urszula Jorasz, Wykłady z psychoakustyki, Wydawnictwo Naukowe UAM. Poznań 1998 Brian C. J. Moore, Wprowadzenie do psychologii słyszenia, Wydawnictwo Naukowe PWN, Warszawa-Poznań 1999 James O. Pickles, An Introduction to the Physiology of Hearing, Academic Press, London 1994 http://zakus.ita.pwr.wroc.pl/dydaktyka/prezentacje/UKLAD_S.ppt słuch/dźwięk: http://hyperphysics.phy-astr.gsu.edu/hbase/sound/soucon.html http://www-ccrma.stanford.edu/CCRMA/Courses/152/index.html http://physics.mtsu.edu/~wmr/log_3.htm http://www.prointer.pl/~aston/sluch/sluch.htm http://www.republika.pl/audioton/ucho.html 77