ZASTOSOWANIE PROCESORÓW SYGNAŁOWYCH PG – Katedra Systemów Mikroelektronicznych ZASTOSOWANIE PROCESORÓW SYGNAŁOWYCH Marek Wroński Wykład 8: Kwantyzacja i kompresja PCM, ADPCM, filtry adaptacyjne, kodowanie sygnałów mowy
Błędy kwantyzacji w przetwornikach A/D e(n)=x(n)-xQ(n) Sym: ak=- a-k oraz bk=- b-k Dla kwabtyzatora liniowego |e|<D/2 (2M+1) poziomów gdzie M=2(B-1)-1 Punkt krytyczny: aM+1=V oraz D=V/ 2(B-1) Dla liniowej gęstości prawdopodobieństwa pe(e)=1/ D dla |e|<D/2 (są też mid-rised) Dla +3dBm0 (max mocy) więc dla X<3:
SNR rozkładu Gausowskiego Maska dla szumowego sygnału testowego (dla sin maska –45dB-0 max 33dB)
Kwantyzacja z minimalnymi zniekształceniami Szum kwantyzacji: Wartości optymalne:
Nierównomierny rozkład gęstości prawdopodobieństwa, np. eksponencjalny Dla nierównomiernego rozkładu gęstości prawdop:(ucho czulsze na szum kwantyzacji, gdy szum dużyw stosunku do sygnału) transformacja h=g(x)
Kodeki (koder+dekoder) z kompresją sygnałów wg.zasady m i A Maksymalizacja nie SNR lecz zakresu mocy sygnału w którym SNR jest większe od zadanego Companding=compression+expanding m-Law (amerykański PCM): A-Law (europejski PCM):
Koder typu m (m-Law PCM) Kompresuje 13-bitowy zakres dynamiczny do 8-bitowej wartości cyfrowej
Algorytm m-Law PCM Wartości końca przedziałów {xi}: Na koniec inwersja bitów
Koder typu A (A-Law PCM) Kompresuje 14-bitowy zakres dynamiczny do 8-bitowej wartości cyfrowej
Algorytm A-Law PCM Wartości końca przedziałów {xi}: Na koniec inwersja bitów
Sprawność koderów PCM (m- i A-typu) SNR rozkładu Gausowskiego:
Kodowanie predykcyjne 1-rzędu (do przodu) Gdy oczekiwana max moc s2 wtedy nasycenie ch-ki kwantyzacji dla K1s (zwykle K1=4) K1 jest mierzone jako stosunek: pik-pik do rms. Estymacja szumu kwantyzacji (dla N bitów): gdzie K2 zależy od kształtu gęstości prawdop. Dlatego wystarczy N-1 bitów dla takiej samej mocy szumu kwantyz. gdy moc sygn.zredukować 1/4.Niech {Rxx(k)} autokorelacja {x(n)} Min wariancji dla a=rxx(1) Wtedy N1bits
Kodowanie różnicowe DPCM (Differential Pulse code Modulation)
Kodowanie adaptacyjne Ponieważ mowa jest krótkoterminowo (100ms) prawie stacjonarna rxx(1) jest dobrze Zdefiniowany dlatego współczynnik a dobrze śledzi za zmianami statystyki sygnału i może być okeślony z min. błędu {e(n)}co daje dla kodera z otwartą pętlą: dla kodera z zamkniętą pętlą: Dla stabilności i uproszczenia algorytmu ADPCM: Ponieważ {e(n)} nie jest z natury stacjonarne dlatego kwantyzator Q powinien być adaptacyjny. Posiada on kilka poziomów i gdy sygnał konsekwentnie (kilka razy) jest zbyt mały jest traktowany jako mały i inaczej skalowany. To samo dotyczy Powtarzających się „dużych” sygnałów (następuje zmiana kroków wg. optymalnej decyzji)
Adaptive Differential Pulse Code Modulation (ADPCM) - Encoder Wykorzystuje on adaptacyjny predyktor dla redukcji liczby bitów z 8- (PCM) do 4. Filtr rekonstrukcyjny jest typu IIR z 2 biegunami i 6 zerami. ADPCM nie używa do transmisji próbek sygnału a różnicę z wartością przewidy- waną. Sam kwantyzator rozdzielono na 2 sekcje: adaptacyjne bitowe kodowanie i adaptacyjne bitowe dekodowanie (w dekoderze tylko jedna sekcja) · {s1(n)} sygn. liniowy
Adaptacyjny kwantyzator i predyktor 7-,15-,lub 31-poz. nieliniowy (log2(d(n)) kwantyzator dla sygn. różnicowego {d(n)}, co odpowiada 3,4lub 5 bitom na próbkę. Adaptacje poprzez skalowanie log2(d(n)) przez mnożnik y(n) przeliczany z każdą próbką. Predyktor estymuje sygnał jako: Syg.rekonstrukcyjny: wsp. met. gradientów: Dla stabilności IIR:
Opis Kodeka ADPCM (ITU-T G.726)
ADPCM - Decoder
Szumy kwantyzacji ADPCM
2-pasmowa (Sub-Band) ADPCM Używane dla szerokiego pasma np. dla wideokonferncji(50-7000Hz) dzielonego na 2 podpasma (0-4000 i 4000-8000Hz) do których stosowana jest oddzielnie ADPCM FIR 24-parametrowy z odpow.impuls.=fun.opóżnienia
Higher and Lower Sub-Band Encoder
Higher and Lower Sub-Band Decoder
Metody kompresji stratnej sygnałów mowy
Kodowanie predykcyjne – wokoder LPC-10 1. Częstotliwość próbkowania fs = 8 kHz 2. Podział na bloki 30 ms, w których zakłada się quasi-stacjonarność 3. Okno o długości 240 próbki przesuwane co 180 próbek 4. Estymacja i przesyłanie współczynników modelu generacyjnego sygnału mowy Model generacji sygnału mowy
Filtry adaptacyjne Wygładzanienie (smoothing) wg. danych zebranych także po chwili t (dokładniejsze) Predykcja tj. określenie informacji o procesie, który będzie miał miejsce w przyszłości filtracja, która oznacza estymację informacji w chwili t na podstawie zebranych danych
Podstawowe układy aplikacyjne filtrów adaptacyjnych