Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Informatyka Stosowana Semestr letni2010/2011 W6.

Podobne prezentacje


Prezentacja na temat: "Informatyka Stosowana Semestr letni2010/2011 W6."— Zapis prezentacji:

1 Informatyka Stosowana Semestr letni2010/2011 W6

2

3 Liniowe kodowanie predykcyjne (ang. Linear Predictive Coding – LPC) – technika analizy sygnału mowy polegająca na przedstawieniu sygnału mowy jako odpowiedzi filtru typu biegunowego (all-pole filter) na sygnał tonu krtaniowego. Filtr biegunowy (AR) odzwierciedla rezonansową charakterystykę traktu głosowego

4 u(n) s(n)

5 Odpowiedź filtru biegunowego na pobudzenie jest kombinacją liniową kolejnych próbek z wyjścia filtru. Oznacza to, że sygnał mowy można przewidzieć na podstawie jego poprzednich próbek. Stąd nazwa liniowe kodowanie predykcyjne. Liczba próbek branych pod uwagę przy tej analizie jest zdeterminowana przez rząd filtru (rząd analizy LPC) –p.

6

7 Wyznaczanie współczynników filtra LPC polega na zminimalizowaniu błędu między sygnałem a jego predykcją.

8

9 W zapisie macierzowym: Najczęściej rozwiązuje się problem wyznaczenia współczynników metodą autokorelacyjną z zastosowaniem iteracyjnego odwracania macierzy (algorytmy Levinsona, Robinsona i Durbina)

10

11 Wyliczane: Współczynniki predykcji liniowej a i, i = 1, …, p Znane: Współczynniki autokorelacji r(i), i = 0, 1, …, p Zakładane: n, p

12

13

14 Przykład: Wyliczyć współczynniki LPC dla modelu drugiego rzędu, p=2

15 Metoda dwuetapowa i jednoetapowa

16 Predykcja liniowa - zastosowania

17

18

19

20

21

22

23

24 Mel-Frequency Cepstral Coefficients MFCC

25

26

27 Prawo Webbera-Fechnera głosi, że Reakcja układu biologicznego jest proporcjonalna do logarytmu pobudzającego go bodźca. Oznacza to, że ludzkie ucho nie odpowiada liniowo na zwiększającą się częstotliwość.

28 Skalę melową uzyskuje się poprzez filtrację sygnału bankiem filtrów o charakterystyce trójkątnej. Zazwyczaj liczba pasm wynosi od 12 do 20

29

30

31

32

33

34

35

36

37

38

39 Nieliniowa normalizacja czasowa (DTW – Dynamic Time Warping) Podejście stochastyczne (HMM – Hidden Markov Model) Sztuczne sieci neuronowe (TDNN – Time Delay Neural Networks)

40

41 A – zbiór obrazów, alfabet Ustalenie elementów zbioru obrazów, wzorców, które z pewnego punktu widzenia uznajemy za jednorodne. Na tym etapie decydujemy co będzie przedmiotem rozpoznawania (A – zbiór obrazów, alfabet). Zbiór tych cech oznaczamy przez X Dokonanie wyboru cech opisujących pojedynczą realizację obrazu. Zbiór tych cech oznaczamy przez X. Każde zadanie określane ogólną nazwą rozpoznawania obiektów da się sformułować za pomocą czterech podstawowych pojęć:

42 Przyjęcie reguły decyzyjnej R, tzn. zasady, zgodnie z którą podejmowane będą decyzje, do jakiego obrazu należy zaliczyć wybraną z przestrzeni prób realizację. Ustalenie wielkości strat S spowodowanych błędami klasyfikacji

43 [R/(A, X, S)] Klasyczny problem PR – konstrukcja reguły decyzyjnej [X/(A, R, S)] Problem minimalizacji opisu, redukcja liczby cech [A/(X, R, S)] Taksonomia, grupowania, analiza skupień – należy podzielić przestrzeń obiektów na grupy [S/(A, X, R)] Należy wyznaczyć spodziewane straty klasyfikacji

44 Celem metod grupowania jest łączenie obiektów w większe grupy na podstawie ich wzajemnego podobieństwa Kryterium podobieństwa obiektów oparte jest na ich wzajemnej odległości. ZADANIE: Znaleźć taki podział, żeby odległości między obiektami w jednej klasie były jak najmniejsze, a między klasami – jak największe.

45 Topologia przestrzeni cech?

46 Jak odwzorować obiekty w przestrzeni? Wybór zmiennych Normalizacja zmiennych Jak mierzyć odległości między obiektami? Wprowadzenie metryki Odległości: obiekt-grupa oraz grupa-grupa Jaką metodę grupowania zastosować?

47 Podziałowe: 1) Leader 2) K-means Hierarchiczne: a) Aglomeracyjne b) Dzielące

48 Przydziel pierwszy obiekt jako jądro pierwszego skupienia, Przejdź do następnego obiektu, Jeżeli obiekt ten jest bliższy niż to przydziel go do skupienia, w przeciwnym przypadku przejdź do następnego punktu, Utwórz nowe skupienie Powtarzaj procedurę aż do rozpatrzenia wszystkich obiektów

49 Znajdź dwa najmniej odległe od siebie obiekty Znajdź obiekt najmniej odległy od któregokolwiek z obiektów skupienia d

50 Po znalezieniu skupień dla najmniejszej wartości d 0 zwiększamy d 0 i w podobny sposób prowadzimy łączenie już znalezionych skupień w większe. Algorytm kompletnych połączeń: dwa skupienia łączą się w jedno, jeżeli największa odległość między ich elementami jest mniejsza od zadanego kryterium. Algorytm średnich połączeń: dwa skupienia łączą się w jedno, jeżeli średnia odległość pomiędzy ich elementami jest mniejsza od zadanego kryterium. Algorytmy centroidów: liczy się odległość obiektu od środka dotychczasowego skupienia.

51 Dokonaj wstępnego podziału zbioru danych na k skupień. Wylicz ich centroidy. Dla każdego obiektu znajdź najbliższy centroid i jeżeli nie jest to centroid skupienia, do którego jest on aktualnie przydzielony, przenieś obiekt do tego skupienia oraz popraw parametry obu skupień (centroidy i liczebności) Powtarzaj drugi krok dopóki w przeglądzie zajdzie zmiana w przydziale obiektów

52

53

54

55

56

57 Wartości k są wybierane tak, aby minimalizowały wyrażenie:


Pobierz ppt "Informatyka Stosowana Semestr letni2010/2011 W6."

Podobne prezentacje


Reklamy Google