K ODY ZMIENNEJ DŁUGOŚCI Alfabet Morsa Kody Huffmana.

Slides:



Advertisements
Podobne prezentacje
PRZEDSTAWIANIE INFORMACJI W KOMPUTERZE
Advertisements

Dokument HTML jest zwykłym
Kodowanie informacji Instytut Informatyki UWr Studia wieczorowe
Kodowanie informacji Instytut Informatyki UWr Studia wieczorowe
Reprezentacja danych w komputerze
dr A Kwiatkowska Instytut Informatyki
SZYFRY BEZ TAJEMNIC.
Materiały pochodzą z Platformy Edukacyjnej Portalu
Architektura Systemów Komputerowych
1 Kompresja indeksu slajdy studenta Karola Tomaszewskiego (z drobnymi modyfikacjami)
Zapis informacji Dr Anna Kwiatkowska.
Ochrona danych wykład 3.
KOMPRESJA DANYCH Marek Dyoniziak.
Temat 3: Co to znaczy, że komputer ma pamięć? Czy można ją zmierzyć?
Nauka to potęgi klucz Tomasz Pawlak.
opracowanie: Agata Idczak
MATEMATYCZNE METODY SZYFROWANIA
Protokół Komunikacyjny
Tajemnice klawiatury.
Przypomnienie wiadomości o PowerPoincie
Warsztaty programowania w języku Python
Wirujący tekst Lekcja fizyki projektu Comenius ul.Skłodowskiej 6
SZYFROWANIE INFORMACJI
Jednostki w informatyce i system binarny (dwójkowy)
ZASTOSOWANIE KRYPTOGRAFII W SZYFROWANIU DANYCH
Radosław Kaczyński Wrocław 2006
Liczby całkowite dodatnie BCN
Matematyka i system dwójkowy
Projektowanie stron WWW
Podstawy języka Instrukcje - wprowadzenie
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
 Karta sieciowa to urządzenie odpowiedzialne za wysyłanie i odbieranie danych w sieciach LAN. Każdy komputer, który ma korzystać z dobrodziejstw sieci,
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Programowanie Niskopoziomowe
WYKŁAD 3 Temat: Arytmetyka binarna 1. Arytmetyka binarna 1.1. Nadmiar
Znaki specjalne Co i jak + brak przykładów.  Aby wstawić symbol lub znak specjalny należy na karcie Wstawianie w grupie Symbole kliknąć na przycisk Symbol.
1 Prowadzący: Dr inż. Sławomir Samolej D102 C, tel: , WWW: ssamolej.prz-rzeszow.pl INFORMATYKA.
Klawiatura i mysz.
Danuta Stanek KODOWANIE LICZB Systemy liczenia III.
SZYFROWANIE Kacper Nowak.
Kolumny, tabulatory, tabele, sortowanie
Systemy liczenia IV Kodowanie i kody Danuta Stanek.
Kompresja i Szyfrowanie
Algorytmy kodowania Shannona-Fano i Huffmana
Kompresja danych Instytut Informatyki UWr Studia dzienne Wykład nr 3: kody Golomba, kody Tunstalla.
Kompresja danych Instytut Informatyki UWr Studia dzienne Wykład nr 2: rozszerzone i dynamiczne Huffmana.
Operacje na plikach i folderach
METODY REPREZENTOWANIA IFORMACJI
Metody komunikacji dawniej i dziś
Metody komunikacji dawniej i dziś
Metody komunikacji Dawniej i dziś.
Metody komunikacji Dawniej i dziś.
Sposoby Komunikacji. Definicja Komunikacja to proces mający na celu spowodowanie u odbiorcy informacji zmiany świadomości zamierzonej przez nadawcę. Na.
Metody komunikacji. Ludzie od dawnych czasów próbowali się ze sobą porozumiewać. Nauczyli oni się komunikować ze sobą za pomocą przeróżnych środków: od.
Sposoby Komunikacji.
„Filtry i funkcje bazodanowe w EXCELU”
 Formuła to wyrażenie algebraiczne (wzór) określające jakie operacje ma wykonać program na danych. Może ona zawierać liczby, łańcuchy znaków, funkcje,
Media Cyfrowe  Media cyfrowe to dowolna forma (lub format) prezentacji i użytkowania treści (np. tekstowych, graficznych, audiowizualnych), które są.
Historia radia od telegrafu do radioodbiornika Gulielmo Marconi – twórca radiaXXI wiek 1887 r.
Programowanie strukturalne i obiektowe Klasa I. Podstawowe pojęcia dotyczące programowania 1. Problem 2. Algorytm 3. Komputer 4. Program komputerowy 5.
URZĄDZENIA TECHNIKI KOMPUTEROWEJ Zapis liczb binarnych ze znakiem.
Zmienne typy danych w VBA. MS Excel – typy danych w języku programowania VBA.
Jak zaczynam przygodę z programowaniem z gimnazjalistami?
Samuel Finley Breese Morse
Podstawy Informatyki.
Technika Mikroprocesorowa 1
Systemy liczbowe.
Wstęp do Informatyki - Wykład 6
ALGORYTMY I STRUKTURY DANYCH
Zapis prezentacji:

K ODY ZMIENNEJ DŁUGOŚCI Alfabet Morsa Kody Huffmana

A LFABET M ORSA I KOD HUFFMANA Historia kompresji sięga wielu lat przed erą komputerów. Ideę oszczędnego reprezentowania informacji odnajdujemy w połowie XIX wieku, gdy Samuel Morse ( ) wynalazł telegraf, mechaniczne urządzenie do przesyłania wiadomości i posłużył się przy tym specjalnym alfabetem, znanym jako alfabet Morse’a, który umożliwia kodowanie znaków w tekście za pomocą dwóch symboli – kropki i kreski. Najważniejszą cechą tego alfabetu jest kodowanie najczęściej występujących znaków w tekście za pomocą możliwie najkrótszych kodów, np. kodem litery E jest kropka, a kodem litery T jest kreska, gdyż są to dwie najczęściej występujące litery w tekstach w języku angielskim.

Ponieważ w telegrafie wysyłanie tekstu polega na przekazaniu kluczem kodów kolejnych znaków z tekstu, alfabet Morse’a znacznie zmniejszał liczbę znaków (kropek i kresek) potrzebnych do wysłania wiadomości. Wadą alfabetu Morse’a jest to, że kody niektórych liter są częścią kodów innych liter, np. każdy kod zaczynający się od kropki zawiera na początku kod litery E. To powoduje, że w tekstach w kodzie Morse’a potrzebny jest dodatkowy znak oddzielający kody kolejnych liter. Tej wady nie ma kod Huffmana, zaproponowany w 1952 roku przez Davida Huffmana w jego pracy magisterskiej. W tym kodzie również często występujące znaki mają krótkie kody, ale żadan kod nie jest początkiem innego kodu.

Kodowanie w tym kodzie nie wymaga więc dodatkowego znaku oddzielającego litery. Na przykład słowo abrakadabra ma w kodzie Huffmana postać: , czyli zamiast 88 bitów w kodzie ASCII wystarczy 29 bitów w kodzie Huffmana. Algorytm Huffmana jest wykorzystywany w wielu profesjonalnych metodach kompresji tekstu, obrazów i dźwięków, również w połączeniu z innymi metodami. Redukcja wielkości danych przy stosowaniu tego algorytmu wynosi około 50% (w przypadku obrazów i dźwięków kodowane są nie same znaki, ale różnice między kolejnymi znakami).

K OD H UFFANA – ZASTOWOWANIE DRZEWA BINARNEGO Np. alfabet składajacy się z 5 liter. A B C D E W pliku, który chcemy zaszyfrować, litery występujż z czestościami: A – 45 B – 5 C – 15 D – 10 E – 25

Z liter i ich częstości (wag) tworzymy odrębne drzewa uporzdkowane od najmniejszych do największych częstości. B5B5 B5B5 D 10 D 10 C 15 C 15 E 25 E 25 A 45 A 45

Z liter i ich częstości (wag) tworzymy odrębne drzewa uporzdkowane od najmniejszych do największych częstości. B5B5 B5B5 D 10 D 10 C 15 C 15 E 25 E 25 A 45 A 45

Bierzemy dwa drzewa o najmniejszych wagach i łączymy je w jedno drzewo. Sumujemy ich wagi. Co więcej, w zależności od tej sumy wstawiamy je w odpowiednie miejsce B5B5 B5B5 D 10 D 10 C 15 C 15 E 25 E 25 A 45 A 45 15

Znowu bierzmy dwa drzewa, łaczymy je i wstawiamy w odpowiednie miejsce. B5B5 B5B5 D 10 D 10 C 15 C 15 E 25 E 25 A 45 A

Drzewo wstawione w odpowiednie miejsce. B5B5 B5B5 D 10 D 10 C 15 C 15 E 25 E 25 A 45 A

I znowu zabieramy dwa drzewa o najmniejszych wagach. B5B5 B5B5 D 10 D 10 C 15 C 15 E 25 E 25 A 45 A

Łączymy je i wstawiamy w odpowiednie miejsce. B5B5 B5B5 D 10 D 10 C 15 C 15 E 25 E 25 A 45 A

I ponownie zabieramy dwa drzewa o najmniejszych wagach. B5B5 B5B5 D 10 D 10 C 15 C 15 E 25 E 25 A 45 A

Drzewo Huffmana. B5B5 B5B5 D 10 D 10 C 15 C 15 E 25 E 25 A 45 A – lewe gałęzie 1 – prawe gałęzie

Drzewo Huffmana. B5B5 B5B5 D 10 D 10 C 15 C 15 E 25 E 25 A 45 A – lewe gałęzie 1 – prawe gałęzie A A B B C C D D E Ma kod 0 Ma kod 1100 Ma kod 111 Ma kod 1101 Ma kod 10

WNIOSKI Ogólnie: Każdy znak zajmuje 1 bajt, czyli 8 bitów. Jeżeli mamy plik składający się z 100 znaków, to zajmuje on 100 bajtów, czyli 800 bitów. Kod Huffmana: A wystąpiło 45 razy i jest kodowane za pomocą jednego bitu; E wystąpiło 25 razy i jest kodowane za pomoca 2 bitów; C wystąpiło 15 razy i jest kodowane za pomocą 3 bitów; D wystąpiło 10 razy i jest kodowane za pomoca 4 bitów; B wystąpiło 5 razy i jest kodowane za pomocą 4 bitów

Mając takie dane otrzymujemy: 45*1+25*2+15*3+10*4+5*4=200 bitów. Nasz plik został skompresowany. Do deszyfrowania tekstu potrzebna jest wiedza na temat drzewa kodowego.

Tekst zaczerpnięty: siazka_ZBIOR_tom1.pdf