Kodery audio operujące w dziedzinie częstotliwości G.722.1 ATRAC (MiniDisc) MPEG1 (warstwa 1, 2, 3=MP3) MPEG2 (AAC, DVD Audio) MPEG4 (AAC) Dolby Digital (AC-3) PTMT
Koder transformaty G.722.1 Y = W X Częstotliwość próbkowania 16 kHz Pasmo sygnału akustycznego 7 kHz Transformata MLT (MDCT) Y = W X 320 640 14 podpasm po 20 próbek transformaty (szerokość podpasma = 0.5 kHz) - podpasm 7-7.5 kHz i 7.5-8 kHz nie koduje się Przepływności 24 i 32 kbit/s PTMT
W każdym podpasmie oblicza się obwiednię widma amplitudy PTMT
« Kategorie» rozdziału bitów Każdemu podpasmu przydzielana jest jedna z 8 „kategorii” rozdziału bitów Istnieje tylko 16 dopuszczonych normą sposobów „kategoryzacji”, czyli rozdzielania kategorii między 14 podpasm. PTMT
Kwantowanie wektorowe w obrębie podpasma Każde podpasmo dzieli się na vpr wektorów o wymiarze vd (vpr · vd = 20). Słownik kwantyzatora wektorowego liczy u wektorów. PTMT
Kwantowanie wektorowe w obrębie podpasma Parametry vd, vpr, u – dla każdej kategorii rozdziało bitów Transmituje się: obwiednię amplitudy w 14 podpasmach Schemat kodowania (kategoryzacja) Numery wektorów słownika (kod Huffmana) PTMT
ATRAC Adaptive Transform Acoustic Coding MiniDisc - 1/5 pojemności standardowego CD - 74 min dźwięku ATRAC pasmo 22 kHz (częstotliwość próbkowania 44.1 kHz) stopień kompresji: 5 wykorzystanie maskowania szumu kwantyzacji w dziedzinie częstotliwości i w dziedzinie czasu PTMT
Ogólny schemat kodera ATRAC Spectral Quantization PTMT
Przejście na ska lę częstotliwości QMF – quadratic mirror filters: podział pasma na 2 części i 2 – krotne obniżenie częstotliwości próbkowania PTMT
Przejście na ska lę częstotliwości MDCT – zmodyfikowana dyskretna transformata cosinusoidalna Wielkość transformowanego bloku próbek wynosi: 11.6 ms (long mode) 1.45 ms (dla pasma 11-22 kHz) i 2.9 ms w pozostałych 2 podpasmach (short mode) PTMT
Long mode (sygnały quasi-stacjonarne, np skrzypce) pre-echo PTMT
Short mode (sygnały niestacjonarne, np perkusja) pre-echo PTMT
Rozdzielczość czasowo – częstotliwościowa kodera ATRAC PTMT
MPEG1 – warstwa 1 i 2 PTMT
MPEG1- ramka 32 kanały od f=0 do f=fs/2 32 kwantyzatory z adaptacją „w przód” dynamiczny rozdział bitów pomiędzy kwantyzatory wykorzystanie maskowania w dziedzinie częstotliwości przy rozdzielaniu bitów PTMT
MPEG1 warstwa 3 (MP3) PTMT
MPEG2 1. Kompatybilny z MPEG1 warianty: mono, stereo, 3-, 4- ,5- kanałowy 5-kanałowy efekt surround stereo przy 640 kbit/s 2. Niekompatybilny (MPEG2 Advanced Audio Coder - AAC) 5- kanałowy surround stereo przy 320 kbit/s B. dobra jakość stereo przy 128 kbit/s AAC 96 kbit/s oferuje jakość sygnału stereo porównywalną z MPEG1 warstwa 2 o przeplywności 192 kbit/s i MP3 128 kbit/s Obsługuje niskie przepływności, np. 16 kbit/s PTMT
Cechy kodera MPEG2 AAC W porównaniu z MP3 koder AAC posiada Lepszą rozdzielczość w dziedzinie częstotliwości (okno MDCT zwiększono z 1152 do 2048 próbek) Lepszy algorytm kształtowania szumu kwantyzacji (TNS – temporal noise shaping) Algorytmy predykcji sygnału audio PTMT
Kodery MPEG4 - Audio Kodery MPEG4 operujące w dziedzinie częstotliwości: AAC AAC Low delay AAC – BSAC (bit-sliced arithmetic coding) Inne kodery MPEG4: koder parametryczny HILN (Harmonic plus Individual Lines plus Noise) SA – Structured Audio PTMT
Dolby Digital (AC-3) 5 kanałów (20-20000Hz) i kanał dolnopasmowy (LFE – low frequency effects) częstotliwości próbkowania 32, 44.1, 48 kHz przepływności binarne 32 – 640 kbit/s PTMT
Dla porównania: Super Audio CD (SACD) To nie jest koder operujący w dziedzinie częstotliwości! Format: Direct Stream Digital (DSD) – 1 bit/próbkę Koder delta – sigma (predyktor xnp=xn-1) Częstotliwość próbkowania do 2822400 Hz (64x44100) zastosowanie: 2-warstwowy CD PTMT