Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

DCT w kodowaniu obrazów Zaawansowana Analiza Sygnałów Marek Barcz, STI sem. 09.

Podobne prezentacje


Prezentacja na temat: "DCT w kodowaniu obrazów Zaawansowana Analiza Sygnałów Marek Barcz, STI sem. 09."— Zapis prezentacji:

1 DCT w kodowaniu obrazów Zaawansowana Analiza Sygnałów Marek Barcz, STI sem. 09

2 2 Plan prezentacji Kodowanie transformujące Kodowanie transformujące Jedno- i dwuwymiarowa DCT Jedno- i dwuwymiarowa DCT Właściwości DCT Właściwości DCT Szybka DCT Szybka DCT DCT vs. KLT / DFT DCT vs. KLT / DFT DCT a Teoria Informacji DCT a Teoria Informacji Podsumowanie Podsumowanie

3 3 Plan prezentacji Kodowanie transformujące Kodowanie transformujące Jedno- i dwuwymiarowa DCT Właściwości DCT Szybka DCT DCT vs. KLT / DFT DCT a Teoria Informacji Podsumowanie

4 4 Kodowanie transformujące Jest to nieodzowna część współczesnych aplikacji przetwarzania obrazów i video. Jest to nieodzowna część współczesnych aplikacji przetwarzania obrazów i video. Opiera się na założeniu, że piksele w obrazie wykazują pewien poziom korelacji z sąsiadującymi pikselami. Podobnie w transmisji video, sąsiednie piksele w kolejnych ramkach również wykazują wysoki stopień korelacji. Opiera się na założeniu, że piksele w obrazie wykazują pewien poziom korelacji z sąsiadującymi pikselami. Podobnie w transmisji video, sąsiednie piksele w kolejnych ramkach również wykazują wysoki stopień korelacji. Korelacje można wykorzystać w celu estymowania wartości pikseli na podstawie wartości ich sąsiadów. Korelacje można wykorzystać w celu estymowania wartości pikseli na podstawie wartości ich sąsiadów. Transformacja zatem polega na odwzorowaniu przestrzennych, skorelowanych danych na nieskorelowane współczynniki. Transformacja zatem polega na odwzorowaniu przestrzennych, skorelowanych danych na nieskorelowane współczynniki.

5 5 Transmisja obrazów/video Komponenty klasycznego systemu transmisji obrazu/video Komponenty klasycznego systemu transmisji obrazu/video:

6 6 Blok transformujący Dekoreluje informacje zawarte w obrazie, tym samym redukując (a w niektórych przypadkach eliminując) tzw. nadmiarowość międzypikselową. Dekoreluje informacje zawarte w obrazie, tym samym redukując (a w niektórych przypadkach eliminując) tzw. nadmiarowość międzypikselową. Obraz oryginalny Histogramy obrazów Znormalizowana autokorelacja

7 7 Blok kwantyzacji Wykorzystuje fakt, że ludzkie oko nie jest w stanie dostrzec wszystkich informacji zawartych w obrazie. Uznawane są one za nadmiarowe i mogą być usunięte bez zauważalnych strat jakości wizualnej. Wykorzystuje fakt, że ludzkie oko nie jest w stanie dostrzec wszystkich informacji zawartych w obrazie. Uznawane są one za nadmiarowe i mogą być usunięte bez zauważalnych strat jakości wizualnej. Nadmiarowość taka nazywana jest psychowizualną nadmiarowością. Nadmiarowość taka nazywana jest psychowizualną nadmiarowością. Można to wykorzystać w większym stopniu dla odbiorców o niskim poziomie transmisji bitów, którzy mogą poświęcić jakość obrazów dla osiągnięcia lepszego wykorzystania pasma. Można to wykorzystać w większym stopniu dla odbiorców o niskim poziomie transmisji bitów, którzy mogą poświęcić jakość obrazów dla osiągnięcia lepszego wykorzystania pasma.

8 8 Blok kodera entropii Wykorzystuje informacje o procesach transformacji i kwantyzacji w celu zredukowania liczby bitów niezbędnej do reprezentacji każdego symbolu na wyjściu kwantyzera. Wykorzystuje informacje o procesach transformacji i kwantyzacji w celu zredukowania liczby bitów niezbędnej do reprezentacji każdego symbolu na wyjściu kwantyzera.

9 9 Plan prezentacji Kodowanie transformujące Jedno- i dwuwymiarowa DCT Jedno- i dwuwymiarowa DCT Właściwości DCT Szybka DCT DCT vs. KLT / DFT DCT a Teoria Informacji Podsumowanie

10 10 Dyskretna Transformata Kosinusowa Dyskretna Transformata Kosinusowa DCT (Discrete Cosine Transform) w ciągu ostatniej dekady okazała się być najlepszym rozwiązaniem w kodowaniu transformującym większości systemów wizualnych. DCT (Discrete Cosine Transform) w ciągu ostatniej dekady okazała się być najlepszym rozwiązaniem w kodowaniu transformującym większości systemów wizualnych. DCT jest stosowana w wielu współczesnych standardach kodowania video (MPEG, JVT, itp.) DCT jest stosowana w wielu współczesnych standardach kodowania video (MPEG, JVT, itp.) Podobnie do innych transformat, DCT dąży do dekorelacji danych zawartych w obrazie. Podobnie do innych transformat, DCT dąży do dekorelacji danych zawartych w obrazie. Po dekorelacji, każdy współczynnik transformaty DCT może być zakodowany niezależnie, bez straty efektywności kompresji. Po dekorelacji, każdy współczynnik transformaty DCT może być zakodowany niezależnie, bez straty efektywności kompresji.

11 11 Jednowymiarowa DCT DCT dla sekwencji o dł. N ( u = 0, 1, 2, …, N – 1) : DCT dla sekwencji o dł. N ( u = 0, 1, 2, …, N – 1) : Odwrotna DCT: Odwrotna DCT: W obu równaniach, α(u) jest definiowane jako: W obu równaniach, α(u) jest definiowane jako:

12 12 Jednowymiarowa DCT Z definicji DCT jasno wynika, że dla u = 0: Z definicji DCT jasno wynika, że dla u = 0: Oznacza to, że pierwszy współczynnik transformaty jest wartością średnią całej sekwencji próbek. Oznacza to, że pierwszy współczynnik transformaty jest wartością średnią całej sekwencji próbek. W literaturze, wartość tą określa się jako współczynnik DC, podczas gdy pozostałe nazywane są współczynnikami AC. W literaturze, wartość tą określa się jako współczynnik DC, podczas gdy pozostałe nazywane są współczynnikami AC. Nazwy pochodzą z czasów, gdy DCT wykorzystano do analizy obwodów prądu stałego i zmiennego. Nazwy pochodzą z czasów, gdy DCT wykorzystano do analizy obwodów prądu stałego i zmiennego.

13 13 Jednowymiarowa DCT Jeżeli zignorujemy składniki f(x) i α(u) i wykreślimy wartości funkcji: Jeżeli zignorujemy składniki f(x) i α(u) i wykreślimy wartości funkcji: przy N = 8 dla różnych wartości u, to funkcje te nazywamy bazowymi funkcjami kosinusowymi. Wykres w lewym górnym rogu ( u = 0) pokazuje stałą wartość (współczynnik DC). Wykres w lewym górnym rogu ( u = 0) pokazuje stałą wartość (współczynnik DC). Pozostałe obrazy ( u = 1, 2, …, 7) pokazują wykresy dla stopniowo rosnącej częstotliwości (współczynniki AC). Pozostałe obrazy ( u = 1, 2, …, 7) pokazują wykresy dla stopniowo rosnącej częstotliwości (współczynniki AC).

14 14 Funkcje bazowe 1-D DCT Jednowymiarowe bazowe funkcje kosinusowe (dla N = 8): Jednowymiarowe bazowe funkcje kosinusowe (dla N = 8):

15 15 Jednowymiarowa DCT Jeżeli wejściowa sekwencja zawiera więcej niż N punktów, wówczas może być podzielona na pod- sekwencje o dł. N, a DCT może być zastosowana do każdego z kawałków niezależnie. Jeżeli wejściowa sekwencja zawiera więcej niż N punktów, wówczas może być podzielona na pod- sekwencje o dł. N, a DCT może być zastosowana do każdego z kawałków niezależnie. W każdym z obliczeń wartości punktów funkcji bazowych pozostają niezmienne. Jedynie wartości f(x) będą inne w każdej pod-sekwencji. W każdym z obliczeń wartości punktów funkcji bazowych pozostają niezmienne. Jedynie wartości f(x) będą inne w każdej pod-sekwencji. Funkcje bazowe mogą zatem być obliczane wcześniej (off-line), a następnie mnożone z pod-sekwencjami. Funkcje bazowe mogą zatem być obliczane wcześniej (off-line), a następnie mnożone z pod-sekwencjami. Pozwala to obniżyć liczbę wymaganych operacji matematycznych, tym samym zapewniając lepszą wydajność obliczeniową. Pozwala to obniżyć liczbę wymaganych operacji matematycznych, tym samym zapewniając lepszą wydajność obliczeniową.

16 16 Dwuwymiarowa DCT Dwuwymiarowa DCT, jako rozwinięcie przypadku jednowymiarowego, opisana jest wzorem: Dwuwymiarowa DCT, jako rozwinięcie przypadku jednowymiarowego, opisana jest wzorem: Transformata odwrotna opisana jest jak poniżej: Transformata odwrotna opisana jest jak poniżej: dla u, v = 0, 1, 2, …, N – 1 oraz α(u) i α(v) zdefiniowanych jak dla jednowymiarowej DCT.

17 17 Funkcje bazowe 2-D DCT Dwuwymiarowe funkcje bazowe generowane są poprzez mnożenie poziomo zorientowanych jednowymiarowych funkcji bazowych z tymi samymi funkcjami, zorientowanymi pionowo. Dwuwymiarowe funkcje bazowe generowane są poprzez mnożenie poziomo zorientowanych jednowymiarowych funkcji bazowych z tymi samymi funkcjami, zorientowanymi pionowo. Funkcje bazowe dwuwymiarowej DCT dla N = 8 pokazane są na następnym slajdzie. Funkcje bazowe dwuwymiarowej DCT dla N = 8 pokazane są na następnym slajdzie. Analogicznie do przypadku jednowymiarowego, można zauważyć, że funkcje bazowe wykazują progresywny wzrost częstotliwości, zarówno w kierunku poziomym, jak i pionowym. Analogicznie do przypadku jednowymiarowego, można zauważyć, że funkcje bazowe wykazują progresywny wzrost częstotliwości, zarówno w kierunku poziomym, jak i pionowym. Funkcja bazowa w górnym lewym rogu jest wynikiem iloczynu współczynnika DC z jego transformatą. Funkcja bazowa w górnym lewym rogu jest wynikiem iloczynu współczynnika DC z jego transformatą.

18 18 Funkcje bazowe 2-D DCT Dwuwymiarowe bazowe funkcje kosinusowe (dla N = 8): Dwuwymiarowe bazowe funkcje kosinusowe (dla N = 8):

19 19 Plan prezentacji Kodowanie transformujące Jedno- i dwuwymiarowa DCT Właściwości DCT Właściwości DCT Szybka DCT DCT vs. KLT / DFT DCT a Teoria Informacji Podsumowanie

20 20 Dekorelacja Polega na usuwaniu nadmiarowości pomiędzy sąsiadującymi pikselami (wówczas nieskorelowane współczynniki mogą być kodowane niezależnie): Polega na usuwaniu nadmiarowości pomiędzy sąsiadującymi pikselami (wówczas nieskorelowane współczynniki mogą być kodowane niezależnie): Znormalizowana autokorelacja przed DCT Znormalizowana autokorelacja po DCT

21 21 Zagęszczenie energii Skuteczność transformacji można też mierzyć na podstawie możliwości umieszczenia wejściowych danych w jak najmniejszej liczbie współczynników. Skuteczność transformacji można też mierzyć na podstawie możliwości umieszczenia wejściowych danych w jak najmniejszej liczbie współczynników. Współczynniki odpowiadające amplitudom wolnych zamian jasności umieszczane są lewej-górnej części macierzy, a pozostałe w lewej-dolnej części. Współczynniki odpowiadające amplitudom wolnych zamian jasności umieszczane są lewej-górnej części macierzy, a pozostałe w lewej-dolnej części. Wówczas kwantyzator może odrzucać współczynniki o względnie małych amplitudach bez wprowadzania zakłóceń wizualnych w zrekonstruowanym obrazie. Wówczas kwantyzator może odrzucać współczynniki o względnie małych amplitudach bez wprowadzania zakłóceń wizualnych w zrekonstruowanym obrazie.

22 22 Zagęszczenie energii Przykłady skupiania energii przez DCT: Przykłady skupiania energii przez DCT: Obraz Jego DCT

23 23 Rozłączność Równanie opisujące 2-D DCT można też zapisać: Równanie opisujące 2-D DCT można też zapisać: dla u, v = 0, 1, 2, …, N – 1. Zaletą tej właściwości jest możliwość obliczenia transformaty w dwóch krokach, przez kolejne zastosowanie operacji jednowymiarowej DCT na wierszach i kolumnach obrazu. Zaletą tej właściwości jest możliwość obliczenia transformaty w dwóch krokach, przez kolejne zastosowanie operacji jednowymiarowej DCT na wierszach i kolumnach obrazu.

24 24 Rozłączność Ideę tego pomysłu przedstawia poniższy rysunek: Ideę tego pomysłu przedstawia poniższy rysunek: Własność ta może być zastosowana w ten sam sposób na równaniu odwrotnej dwuwymiarowej transformaty DCT. Własność ta może być zastosowana w ten sam sposób na równaniu odwrotnej dwuwymiarowej transformaty DCT.

25 25 Symetria Przedstawione operacje na wierszach i kolumnach są funkcjonalnie identyczne. Taką transformację nazywa się transformacją symetryczną. Przedstawione operacje na wierszach i kolumnach są funkcjonalnie identyczne. Taką transformację nazywa się transformacją symetryczną. Inaczej mówiąc, operacje te posiadają identyczne jądro transformacji, które w wypadku DCT wyraża funkcje bazowe. Inaczej mówiąc, operacje te posiadają identyczne jądro transformacji, które w wypadku DCT wyraża funkcje bazowe. Transformację, która jest rozłączna i symetryczna, można zapisać w postaci macierzowej, w celu znacznego uproszczenia wymaganych obliczeń. Transformację, która jest rozłączna i symetryczna, można zapisać w postaci macierzowej, w celu znacznego uproszczenia wymaganych obliczeń.

26 26 Symetria Postać macierzowa DCT: Postać macierzowa DCT: T = AfA, gdzie: A jest macierzą symetrycznej transformacji o wymiarach N × N, gdzie element a(i, j) jest opisany jako: A jest macierzą symetrycznej transformacji o iiiii wymiarach N × N, gdzie element a(i, j) jest opisany iiiii jako: f jest macierzą obrazu o wymiarach N × N.

27 27 Ortogonalność Rozszerzając przedstawione zagadnienia, zdefiniujmy transformatę odwrotną jako: Rozszerzając przedstawione zagadnienia, zdefiniujmy transformatę odwrotną jako: f = A –1 T A –1 Funkcje bazowe DCT są ortogonalne, zatem macierz transformaty odwrotnej jest równa swojej transpozycji: Funkcje bazowe DCT są ortogonalne, zatem macierz transformaty odwrotnej jest równa swojej transpozycji: A –1 = A T W połączeniu z własnościami dekorelującymi, zapewnia to znaczącą redukcję w obliczeniach ogólnych przeprowadzanych przed transformacją. W połączeniu z własnościami dekorelującymi, zapewnia to znaczącą redukcję w obliczeniach ogólnych przeprowadzanych przed transformacją.

28 28 Plan prezentacji Kodowanie transformujące Jedno- i dwuwymiarowa DCT Właściwości DCT Szybka DCT Szybka DCT DCT vs. KLT / DFT DCT a Teoria Informacji Podsumowanie

29 29 Szybka DCT Omówione wcześniej właściwości stanowią podstawę do opracowania szybszego algorytmu transformaty kosinusowej. Omówione wcześniej właściwości stanowią podstawę do opracowania szybszego algorytmu transformaty kosinusowej. Najpopularniejszy algorytm wykorzystuje Szybką Transformatę Fouriera (FFT) do obliczenia DCT i transformaty do niej odwrotnej (IDCT). Najpopularniejszy algorytm wykorzystuje Szybką Transformatę Fouriera (FFT) do obliczenia DCT i transformaty do niej odwrotnej (IDCT). W tym miejscu należy wspomnieć, że DCT nie jest rzeczywistą częścią Dyskretnej Transformaty Fouriera (DFT), co można łatwo sprawdzić porównując macierze transformacji DCT i DFT. W tym miejscu należy wspomnieć, że DCT nie jest rzeczywistą częścią Dyskretnej Transformaty Fouriera (DFT), co można łatwo sprawdzić porównując macierze transformacji DCT i DFT.

30 30 Szybka DCT W jednowymiarowej przestrzeni, wykorzystywana dotąd sekwencja f(x) może być wyrażona jako suma składników parzystych i nieparzystych: W jednowymiarowej przestrzeni, wykorzystywana dotąd sekwencja f(x) może być wyrażona jako suma składników parzystych i nieparzystych:gdzie:oraz:

31 31 Szybka DCT Wówczas operacja sumowania może być rozdzielona, otrzymując: Wówczas operacja sumowania może być rozdzielona, otrzymując:

32 32 Szybka DCT Można łatwo pokazać, że otrzymany rezultat jest równy części rzeczywistej FFT przeprowadzonej na Można łatwo pokazać, że otrzymany rezultat jest równy części rzeczywistej FFT przeprowadzonej na Wówczas, dla transformaty odwrotnej, wystarczy obliczyć, natomiast punkty nieparzyste obliczamy wykorzystując zależność: Wówczas, dla transformaty odwrotnej, wystarczy obliczyć, natomiast punkty nieparzyste obliczamy wykorzystując zależność:dla:

33 33 Plan prezentacji Kodowanie transformujące Jedno- i dwuwymiarowa DCT Właściwości DCT Szybka DCT DCT vs. KLT / DFT DCT vs. KLT / DFT DCT a Teoria Informacji Podsumowanie

34 34 DCT vs. KLT KLT (Karhunen-Loève Transform) jest liniową transformatą, w której funkcje bazowe oparte są o statystyczne właściwości danych w obrazie. KLT (Karhunen-Loève Transform) jest liniową transformatą, w której funkcje bazowe oparte są o statystyczne właściwości danych w obrazie. Algorytm jest optymalny w kontekście zagęszczenia energii (umieszcza możliwie jak najwięcej energii w jak najmniejszej liczbie współczynników). Algorytm jest optymalny w kontekście zagęszczenia energii (umieszcza możliwie jak najwięcej energii w jak najmniejszej liczbie współczynników). Jednak jądro transformacji KLT jest nierozłączne, a więc konieczne jest przeprowadzenia pełnego mnożenia macierzy. Jednak jądro transformacji KLT jest nierozłączne, a więc konieczne jest przeprowadzenia pełnego mnożenia macierzy. KLT jest zatem zależna od ilości danych w obrazie, a tym samym pozbawiona możliwości uprzedniego przeprowadzenia szybkich obliczeń (off-line). KLT jest zatem zależna od ilości danych w obrazie, a tym samym pozbawiona możliwości uprzedniego przeprowadzenia szybkich obliczeń (off-line).

35 35 DCT vs. DFT DFT (Discrete Fourier Transform) jest liniowa, rozłączna i symetryczna oraz posiada wbudowane obrazy bazowe i umożliwia szybkie implementacje. DFT (Discrete Fourier Transform) jest liniowa, rozłączna i symetryczna oraz posiada wbudowane obrazy bazowe i umożliwia szybkie implementacje. Wykazuje również dobre właściwości dekorelujące oraz zagęszczenie energii. Wykazuje również dobre właściwości dekorelujące oraz zagęszczenie energii. Jednakże DFT jest zespoloną transformatą i wymaga zakodowanych informacji zarówno o amplitudzie, jak i o fazie składników obrazu. Jednakże DFT jest zespoloną transformatą i wymaga zakodowanych informacji zarówno o amplitudzie, jak i o fazie składników obrazu. Dodatkowo, badania wykazały, iż DCT zapewnia lepsze zagęszczenie energii od DFT dla większości obrazów naturalnych. Dodatkowo, badania wykazały, iż DCT zapewnia lepsze zagęszczenie energii od DFT dla większości obrazów naturalnych.

36 36 Plan prezentacji Kodowanie transformujące Jedno- i dwuwymiarowa DCT Właściwości DCT Szybka DCT DCT vs. KLT / DFT DCT a Teoria Informacji DCT a Teoria Informacji Podsumowanie

37 37 DCT a Teoria Informacji W celu zbadania skuteczności transformaty DCT w zastosowaniu w stratnych standardach kodowania obrazów (np. JPEG) i video (np. MPEG), rozpatrzmy ją w odniesieniu do dwóch zagadnień Teorii Informacji: W celu zbadania skuteczności transformaty DCT w zastosowaniu w stratnych standardach kodowania obrazów (np. JPEG) i video (np. MPEG), rozpatrzmy ją w odniesieniu do dwóch zagadnień Teorii Informacji:  Redukcji entropii,  Współczynnika wzajemnej informacji.

38 38 Redukcja entropii Właściwości dekorelacyjne DCT powinny zapewniać znaczną redukcję entropii i informacji o obrazie. Właściwości dekorelacyjne DCT powinny zapewniać znaczną redukcję entropii i informacji o obrazie. Dzięki temu możliwe jest zmniejszenie średniej liczby bitów wymaganych do reprezentacji obrazu. Dzięki temu możliwe jest zmniejszenie średniej liczby bitów wymaganych do reprezentacji obrazu. Entropię definiujemy następująco: Entropię definiujemy następująco: gdzie p(x i ) jest wartością funkcji rozkładu prawd. dla H = x i (w tym wypadku funkcja ta odnosi się do znormalizowanego histogramu obrazu).

39 39 Redukcja entropii Poniższa tabela pokazuje wartości entropii obrazów przykładowych oraz ich DCT (zapis DCT(M%) oznacza, że po operacji DCT tylko pierwsze M procent ze wszystkich współczynników zostało zachowanych): Poniższa tabela pokazuje wartości entropii obrazów przykładowych oraz ich DCT (zapis DCT(M%) oznacza, że po operacji DCT tylko pierwsze M procent ze wszystkich współczynników zostało zachowanych): ObrazEntropiaoryginałuEntropiaDCT(75%)EntropiaDCT(50%)EntropiaDCT(25%) Saturn Dziecko Obwód Drzewa Pawian Fala

40 40 Redukcja entropii Należy jednak zadać sobie fundamentalne pytanie: ile zakłóceń wizualnych wprowadza do obrazu opisana wyżej procedura kwantyzacji? Należy jednak zadać sobie fundamentalne pytanie: ile zakłóceń wizualnych wprowadza do obrazu opisana wyżej procedura kwantyzacji? Na rysunkach przedstawionych na następnym slajdzie zaprezentowano omawiane obrazy zrekonstruowane przy pomocy odwrotnej DCT zastosowanej na skwantowanych współczynnikach. Na rysunkach przedstawionych na następnym slajdzie zaprezentowano omawiane obrazy zrekonstruowane przy pomocy odwrotnej DCT zastosowanej na skwantowanych współczynnikach. Wyniki pokazano odpowiednio dla 100%, 75%, 50% i 25% zachowanych współczynników. Wyniki pokazano odpowiednio dla 100%, 75%, 50% i 25% zachowanych współczynników.

41 41 Redukcja entropii Zrekonstruowane obrazy po stratnej kwantyzacji (IDCT): Zrekonstruowane obrazy po stratnej kwantyzacji (IDCT): Saturn DCT(50%) Saturn DCT(100%) Saturn DCT(25%) Saturn DCT(75%) Dziecko DCT(50%) Dziecko DCT(100%) Dziecko DCT(25%) Dziecko DCT(75%) Obwód DCT(50%) Obwód DCT(100%) Obwód DCT(25%) Obwód DCT(75%) Drzewa DCT(50%) Drzewa DCT(100%) Drzewa DCT(25%) Drzewa DCT(75%) Pawian DCT(50%) Pawian DCT(100%) Pawian DCT(25%) Pawian DCT(75%) Fala DCT(50%) Fala DCT(100%) Fala DCT(25%) Fala DCT(75%)

42 42 Współczynnik wzajemnej informacji Jak wiadomo, transmisja video składa się z sekwencji obrazów (ramek), transmitowanych w określonej kolejności. Jak wiadomo, transmisja video składa się z sekwencji obrazów (ramek), transmitowanych w określonej kolejności. W ogólnym przypadku, zmiana informacji pomiędzy następującymi po sobie ramkami jest niewielka. W ogólnym przypadku, zmiana informacji pomiędzy następującymi po sobie ramkami jest niewielka. Zatem wartości pikseli w jednej ramce mogą być użyte do przewidzenia wartości sąsiednich pikseli w następnej ramce (korelacja chwilowa). Zatem wartości pikseli w jednej ramce mogą być użyte do przewidzenia wartości sąsiednich pikseli w następnej ramce (korelacja chwilowa). Taką nadmiarowość można zatem usunąć, by uzyskać lepszą kompresję. Taką nadmiarowość można zatem usunąć, by uzyskać lepszą kompresję.

43 43 Współczynnik wzajemnej informacji Jednak gdy dwie kolejne ramki prezentują zmianę sceny, wówczas wzajemna informacja jest mała. Jednak gdy dwie kolejne ramki prezentują zmianę sceny, wówczas wzajemna informacja jest mała. Chwilową korelację między ramkami filmu video obliczamy ze Współczynnika Wzajemnej Informacji: Chwilową korelację między ramkami filmu video obliczamy ze Współczynnika Wzajemnej Informacji: gdzie p(x, y) jest łącznym rozkładem prawd. zmiennych losowych X i Y (tutaj: ramki X i ramki Y ), zaś p(x) i p(y) reprezentują brzegowe rozkłady prawd. odpowiednio zmiennych X i Y.

44 44 Współczynnik wzajemnej informacji Poniżej pokazana jest przykładowa sekwencja trzech kolejnych ramek filmu: Poniżej pokazana jest przykładowa sekwencja trzech kolejnych ramek filmu: Ramki 1 i 2 prezentują wysoką korelację chwilową, natomiast ramki 2 i 3 reprezentują zmianę sceny i pokrycie informacyjne między nimi jest mniejsze. Ramki 1 i 2 prezentują wysoką korelację chwilową, natomiast ramki 2 i 3 reprezentują zmianę sceny i pokrycie informacyjne między nimi jest mniejsze. Ramka 1 Ramka 2 Ramka 3

45 45 Współczynnik wzajemnej informacji Niech teraz p(x, y) będzie zdefiniowane jako połączenie wartości sąsiednich pikseli w dwóch następujących po sobie ramkach. Niech teraz p(x, y) będzie zdefiniowane jako połączenie wartości sąsiednich pikseli w dwóch następujących po sobie ramkach. Wówczas dopuszczalne wartości p(x, y) to: Wówczas dopuszczalne wartości p(x, y) to: (0, 0), (0, 1), (0, 2), …, (255, 255). Zatem całkowita liczba tych wartości to (255) 2. Niech natomiast p(x) i p(y) będą znormalizowanymi histogramami odpowiednio ramek X i Y. Niech natomiast p(x) i p(y) będą znormalizowanymi histogramami odpowiednio ramek X i Y. Wówczas wzajemna informacja przyjmuje wartości: Wówczas wzajemna informacja przyjmuje wartości:  między ramkami 1 i 2:  między ramkami 2 i 3:

46 46 Plan prezentacji Kodowanie transformujące Jedno- i dwuwymiarowa DCT Właściwości DCT Szybka DCT DCT vs. KLT / DFT DCT a Teoria Informacji Podsumowanie Podsumowanie

47 47 Podsumowanie Przedstawione właściwości pokazują, jak DCT wykorzystuje nadmiarowość międzypikselową w celu zapewnienia doskonałej dekorelacji obrazów. Przedstawione właściwości pokazują, jak DCT wykorzystuje nadmiarowość międzypikselową w celu zapewnienia doskonałej dekorelacji obrazów. Dodatkowo, DCT skupia energię w niskich częstotliwościach, w związku z czym niektóre dane o wysokich częstotliwości mogą być odrzucone. Dodatkowo, DCT skupia energię w niskich częstotliwościach, w związku z czym niektóre dane o wysokich częstotliwości mogą być odrzucone. Taka kwantyzacja dodatkowo redukuje entropię, czyli średnią liczbę bitów na piksel. Taka kwantyzacja dodatkowo redukuje entropię, czyli średnią liczbę bitów na piksel. Ponieważ natomiast większość kolejnych ramek w transmisji video wykazuje wysoką korelację chwilową, można to wykorzystać by znacznie poprawić wydajność kodowania. Ponieważ natomiast większość kolejnych ramek w transmisji video wykazuje wysoką korelację chwilową, można to wykorzystać by znacznie poprawić wydajność kodowania.

48 48 Bibliografia R. J. Clark, “Transform Coding of Images,” New York: Academic Press, R. J. Clark, “Transform Coding of Images,” New York: Academic Press, N. Ahmed, T. Natarajan, and K. R. Rao, “Discrete cosine transform,” IEEE Transactions on Computers, N. Ahmed, T. Natarajan, and K. R. Rao, “Discrete cosine transform,” IEEE Transactions on Computers, G. Strang, “The Discrete Cosine Transform,” SIAM Review, G. Strang, “The Discrete Cosine Transform,” SIAM Review, S. A. Khayam, “DCT - Theory and Application,” Department of Electrical & Computer Engineering, 2003 S. A. Khayam, “DCT - Theory and Application,” Department of Electrical & Computer Engineering, 2003 J. F. Blinn, “What's the Deal with the DCT?,” IEEE Computer Graphics and Applications, J. F. Blinn, “What's the Deal with the DCT?,” IEEE Computer Graphics and Applications, Haque, “A Two-Dimensional Fast Cosine Transform,” IEEE Transactions on Acoustics, Speech and Signal Processing, Haque, “A Two-Dimensional Fast Cosine Transform,” IEEE Transactions on Acoustics, Speech and Signal Processing, W. B. Pennebaker and J. L. Mitchell, “JPEG – Still Image Data Compression Standard,” Newyork: International Thomsan Publishing, W. B. Pennebaker and J. L. Mitchell, “JPEG – Still Image Data Compression Standard,” Newyork: International Thomsan Publishing, 1993.

49 49 Dziękuję za uwagę!


Pobierz ppt "DCT w kodowaniu obrazów Zaawansowana Analiza Sygnałów Marek Barcz, STI sem. 09."

Podobne prezentacje


Reklamy Google