Ryszard Gubrynowicz Ryszard.Gubrynowicz@pjwstk.edu.pl DwiĘk w multimediach Ryszard Gubrynowicz Ryszard.Gubrynowicz@pjwstk.edu.pl Wykład 2
Dźwięki mowy Badanie dźwięków mowy określonego języka: Jak powstają ? Czym się charakteryzują ? Jakie są między nimi współzależności ? Jakie spełniają funkcje ?
Dziedziny wiedzy obejmujące dwustronną komunikację werbalną Fonetyka artykulacyjna Fonetyka percepcyjna Fonetyka akustyczna
Podstawy opisu i klasyfikacji dźwięków mowy Opis artykulacyjny Opis akustyczny Opis percepcyjny
Fonetyka artykulacyjna Przedmiotem fonetyki artykulacyjnej jest opisanie mechanizmu powstawania dźwięków mowy w narządzie artykulacyjnym człowieka.
Fonetyka akustyczna Koncentruje się na analizie fizycznych własności dźwięków mowy promieniowanych wokół osoby mówiącej. Badanie dźwięków mowy odbywa się przy zastosowaniu fizycznych metod analizy sygnałów akustycznych. Jednocześnie poszukuje powiązań istniejących między czynnością artykulacyjną i wytworzonym sygnałem mowy
Fonetyka percepcyjna Bada percepcję dźwięków mowy, na poziomie układu centralnego. W badaniach stosowane są metody analizy subiektywnej oceny własności sygnałów akustycznych, zrozumiałości mowy itp.
Układ akustyczny źródło –ośrodek-odbiornik
Anatomia i akustyka narządu artykulacyjnego
Narząd artykulacyjny człowieka
Narząd artykulacyjny w akcji „Le boulanger dit onze bieres”
Elementy narządu artykulacyjnego uczestniczące w formowaniu sygnału mowy Fałdy głosowe Podniebienie miękkie Podniebienie twarde Język Zęby Wargi
Źródłem energii promieniowanej podczas mówienia są płuca. Podobnie jak ma to miejsce w instrumentach muzycznych dętych – źródłem energii niesionej przez dźwięk są płuca osoby grającej
Funkcjonalny schemat organu mowy
Układ oddechowy- płuca
Układ oddechowy - tchawica
Cykle oddechowe: proporcje czasowe Max pojemność płuc – ok. 7 litrów Pojemność minimalna – 2 litry stale w płucach. Objętość powietrza wymieniana podczas każdego cyklu oddechowego – 0.5 l Częst. oddychania w stanie spoczynku – 12-20 cykli na minutę
Przebieg zmian objętości powietrza w płucach VC – pojemność spoczynkowa
Źródłem pobudzającym tor głosowy mogą być: fałdy głosowe – modulują w sposób regularny przepływ powietrza wychodzącego z płuc, szczelina utworzona w torze głosowym - powoduje powstanie zawirowań, przeszkoda (zęby) – j.w. krótkotrwały impuls powietrza – powstaje w wyniku nagłego otwarcia toru głosowego, po chwilowym zwarciu w określonym miejscu toru głosowego.
Głośnia+fałdy głosowe+tchawica Przekrój pionowy
Fałdy głosowe – widok z góry
Fałdy głosowe w akcji Faza oddechu Faza fonacji
Rozkład ciśnień powietrza w torze głosowym
Aerodynamika fałdów głosowych
Instrumenty muzyczne stroikowe Działają na podobnej zasadzie jak fałdy głosowe Harmonijka ustna
Przebieg zmian prędkości objętościowej strugi powietrza u wylotu głośni T0=1/F0
Mechaniczny model źródła pobudzenia krtaniowego Model 1-masowy Model 3-masowy m – masa fałdów głosowych k – sprężystość fałdów b – stratność w ruchu fałdów
Funkcjonalny model źródła krtaniowego
Wzór na częstotliwość drgań fałdów głosowych m – masa fałdów K – sztywność (napięcie) fałdów K* - sztywność aerodynamiczna
Widmo przebiegu piłokształtnego Aproksymacja przebiegu zmian prędkości objętościowej strugi powietrza płynącego przez głośnię
Widmo pobudzenia krtaniowego Obwiednia widma opada z częstotliwością –12 dB/okt
Zmiana średniej częstotliwości tonu krtaniowego w funkcji wieku Skąd się biorą różnice? Średnia długość fałdów: noworodki – 5 mm dzieci – 10-13 mm kobiety –11-15 mm mężczyźni – ok. 20 mm Masa drgających fałdów jest proporcjonalna do ich długości
Przebieg zmian częstotliwości F0 w zdaniu „Czy mógłby pan...”
Przebieg F0 z opisem fonetycznym
Narząd artykulacyjny jako układ akustyczny Jest on swoistego rodzaju układem akustycznym, w którym można wyróżnić dwa podstawowe elementy: a) źródło pobudzające b) tor głosowy stanowiący w swej istocie rurę o zmiennym przekroju wypełnioną powietrzem – w torze tym rozchodzi się fala płaska
Formowanie sygnału mowy
Akustyczny model toru głosowego
Rezonanse stratnej rury cylindrycznej o długości 17.5 cm formanty
Tor głosowy jako rura akustyczna o zmiennej konfiguracji
Dlaczego rezonanse w modelu 2 - rurowym są inne niż w 1 - segmentowym (sumaryczna długość w obu przypadkach jest taka sama)?
Co się dzieje na granicy 2 segmentów cylindrycznych? (AkAk+1)
Jak wygląda przybliżony kształt toru głosowego dla /a/ ? Funkcja powierzchni przekroju toru głosowego An
Stosunek powierzchni Ak/Ak+1 a charakterystyka częstotliwościowa Nakładanie się fal padających i odbitych o różnym przesunięciu czasowym powoduje ich wielokrotne sumowanie (lub/i odejmowanie). Wielkość (amplituda) fal przenikających i odbitych zależy od stosunku powierzchni Ak/Ak+1. Stosunek tych powierzchni decyduje o charakterystyce częstotliwościowej układu cylindrów
Przekroje samogłoskowe Samogłoska i Samogłoska I Samogłoska e Samogłoska a Samogłoska o Samogłoska u
Miejsce i wysokość artykulacji długość toru głosowego - 17 cm długość odcinka cylindrycznego - 1 cm Wysokość artykulacji Miejsce artykulacji
Wpływ położenia zwężenia na F1, F2, F3 dla konfiguracji /u/
Charakterystyka rezonansów modelu samogłoski /a/
Porównanie widm modelu i naturalnej samogłoski /a/ F1 F2 F3 F4 Częstotliwość [kHz] Liczba rezonansów w torze głosowym istotnych dla percepcji dźwięku samogłoskowego jest ograniczona i nie przekracza zazwyczaj 5-7
Modelowanie toru głosowego za pomocą filtrów formantowych źródło Pojedyncze rezonatory Funkcja promieniowania F1 F2 F3
Definicja formantu Maksima w charakterystyce częstotliwościowej toru głosowego wpływające na różnicowanie dźwięków mowy danego języka nazywamy formantami. Oznacza to, że nie każde maksimum w widmie danego dźwięku mowy musi być formantem.
Trudności w określaniu formantów w sygnałach naturalnych Dwie kolejne samogłoski /a/ w wyrazie „waga” (głos męski, F0=148 Hz) Częstotliwość [Hz] Częstotliwość [Hz]
Wpływ częstotliwości F0 na widmo dźwięku mowy widmo głosu niskiego widmo głosu wysokiego
Zasadnicze tematy Jakie elementy narządu artykulacyjnego uczestniczą w formowaniu sygnału mowy ? Jaki jest mechanizm działania fałdów głosowych ? Jakie czynniki wpływają na częstotliwość drgań fałdów głosowych ? Jaki jest model formowania dźwięków mowy ? Miejsce i wysokość artykulacji
Terminy angielskie Tchawica - trachea Krtań – larynx Fałdy głosowe – vocal folds Głośnia - glottis Podniebienie miękkie – soft palate Podniebienie twarde – hard palate Wargi – lips Źródło pobudzenia – excitation source Częstotliwość podstawowa (F0) – fundamental frequency Tor głosowy – vocal tract
Terminy angielskie Widmo – spectrum Obwiednia widma – spectrum envelope Miejsce i wysokość artykulacji – place of articulation, height of articulation Formant - formant