Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Kompresja i archiwizacja danych. Formaty kompresji plik ó w Damian Dźwigaj Informatyka i Ekonometria.

Podobne prezentacje


Prezentacja na temat: "Kompresja i archiwizacja danych. Formaty kompresji plik ó w Damian Dźwigaj Informatyka i Ekonometria."— Zapis prezentacji:

1 Kompresja i archiwizacja danych. Formaty kompresji plik ó w Damian Dźwigaj Informatyka i Ekonometria

2 Historia Idea zapisywania danych w taki spos ó b, aby zajmowały jak najmniej miejsca, jest starsza niż sam komputer. Już stworzony w 1832 roku alfabet Morse'a dla używanych często liter używa kr ó tszych znak ó w, a do liter występujących rzadziej - dłuższych. Dzięki temu wiadomości zapisane alfabetem Morse'a są kr ó tsze. W 1948 roku Amerykanin Claude Shannon opracował matematyczną metodę skracania zapisanych danych. Wraz z modemową transmisją danych w latach siedemdziesiątych pojawiły się pierwsze programy archiwizujące, korzystające z metody Shannona.

3 Kompresja Danych W znaczeniu informatycznym kompresja to zmniejszenie objętości danych przy zachowaniu ładunku informacyjnego, czyli sensu tych danych. : Celem kompresji jest: Możliwie dokładna reprezentacja informacji przy użyciu możliwie małej ilości bit ó w. Kompresja ma zazwyczaj na celu oszczędność nośnika i/lub łącza sieciowego, kt ó rym są przesyłane dane, czyli redukcje koszt ó w.. Proces odwrotny do kompresji nazywamy dekompresja.

4 Kompresja Danych Zastosowanie kompresji danych jest bardzo różnorodne. Bez kompresji danych nie istniał by standardDVD i niemożliwe byłoby słuchanie muzyki z plików MP3. Kompresja pozwala na efektywniejsze wykorzystywanie łączy telekomunikacyjnych (jest np. stosowana w modemach) oraz umożliwia upchnięcie większej ilości danych na zbyt ciasnych dyskach. Tekst daje się zazwyczaj skompresować do 40% pierwotnej objętości, pliki graficzne w granicach 20 – 90%, niektóre pliki kompresują się w niewielkim stopniu. Pliki audio i video można skompresować nawet do 5% ich pierwotnej objętości

5 Czynniki pozwalające na kompresje danych duża cześć danych cechuje sie znaczną redundancja (nadmiarowością), tzn. pewne informacje powtarzają sie z różną częstością dane są prezentowane w rozmaity sposób (np. grafika może być rastrowa lub wektorowa) człowiek ma ograniczone zdolności percepcyjne mózg można do pewnego stopnia oszukać

6 Wady i zalety kompresji danych + + przesyłanie większej ilości danych w jednostce czasu + + przesyłanie tej samej ilości danych w krótszym czasie + + zmniejszenie rozmiarów danych przechowywanych na nośnikach – – przed użyciem danych należy je rozpakować – – w pewnych sytuacjach dekompresja w czasie rzeczywistym lub quasi-rzeczywistym może pochłaniać sporo zasobów systemu komputerowego

7 Co Kompresujemy Kompresji można poddawać dane (zbiory informacji) różnego rodzaju, m.in.: tekst dźwięk (mowa, muzyka) obraz ruchomy i nieruchomy pliki wykonywalne

8 Programy do kompresji danych potocznie nazywane są pakerami, archiwizatorami lub kompresorami. należą do programów narzędziowych, przeznaczonych do umieszczania plików w archiwach i odtwarzania zapisanych w nich informacji. posiadają swoje własne formaty i algorytmy kompresji, przeznaczone dla różnego typu danych. Pliki możemy skompresować, używając popularnych programów, np. Winzip, Winrar, czy darmowym 7-Zip. W efekcie otrzymujemy plik o mniejszym rozmiarze, którego jednak w takiej postaci nie jesteśmy w stanie użyć go bezpośrednio. Kompresja z użyciem tego typu programów nie powoduje utraty danych –stąd nazwa KOMPRESJA BEZSTRATNA.

9 Wybrane programy do kompresji danych

10 WinRAR Bardzo popularny program do kompresji danych, który tworzy archiwa z rozszerzeniem.rar. Dodatkowo WinRAR może rozpakować inne rodzaje archiwów, między innymi popularne pliki.zip. Bez problemu także radzi sobie z tworzeniem archiwów.zip. Program oferuje graficzne środowisko pracy, obsługuje technologię drag and drop (przeciągnij i upuść), może tworzyć archiwa zabezpieczone hasłem. WinRAR jest potężnym narzędziem do kompresji posiadającym wiele dodatkowych funkcji, umożliwiającym organizację skompresowanych archiwów. WinRAR jest wiodącym na rynku narzędziem do kompresji. Dzięki konsekwentnemu tworzeniu mniejszych archiwów jest często szybszy niż programy konkurencji, co oszczędza miejsce na dysku, koszty transmisji ORAZ cenny czas pracy. WinRAR obsługuje wszystkie popularne format kompresji (RAR, ZIP, CAB, ARJ, LZH, ACE, TAR, GZip, UUE, ISO, BZIP2, Z oraz 7-Zip). WinRAR jest idealnym rozwiązaniem dla plików multimedialnych automatycznemu rozpoznawaniu i wybieraniu najlepszej metody kompresji. Specjalny algorytm kompresuje pliki multimedialne, wykonywane oraz biblioteki. WinRAR umożliwia łatwe dzielenie archiwów na odrębne woluminy, dzięki czemu mogą być one zapisywane dla przykładu na oddzielnych dyskach. WinRAR jest doskonałym rozwiązaniem, gdy zachodzi potrzeba przesłania danych przez sieć. 128-bitowe szyfrowanie programu oraz technologia autoidentyfikacji podpisu zapewnia bezpieczeństwo i pewność. WinRAR jest programem typu shareware, co oznacza że użytkownik ma możliwość gruntownego przetestowania. Okres bezpłatnego użytkowania wynosi 40 dni.

11 WinRAR

12 WinZIP WinZip. WinZip jest komercyjnym archiwizatorem przeznaczonym dla użytkowników systemu Windows, stworzonym przez WinZip Computing (dawniej znane jako Nico Mak Computing). Natywny format archiwów WinZip'a to PKWARE's PKZIP. WinZip WinZip został stworzony na początku lat 90. jako GUI do popularnego wówczas archiwizatora PKZIP. Około 1996 roku twórcy programu postanowili uniezależnić go od wymaganych dotąd plików.exe PKZIP'a. Obecnie WinZip jest jednym z najpopularniejszych kompresorów plików. Od 2006 roku program rozwijany przez firmę Corel.Zalety Prosty w obsłudze Dużo funkcji StabilnyWady Potrafi tworzyć archiwa jedynie w formacie ZIP

13 WinZIP

14 7-zip 7-Zip to archiwizer będący wolnym oprogramowaniem. Rozpowszechniany na zasadach licencji GNU LGPL. 7-Zip obok znanych formatów archiwizacji (ZIP, CAB, RAR, ARJ, gzip, Bzip2, tar, cpio, RPM i Deb) obsługuje również swój własny format 7z, który charakteryzuje się wyjątkowo dużym stopniem kompresji. Program potrafi tworzyć samo rozpakowujące się archiwum (SFX) dla formatu 7z. W wersji GUI integruje swoje menu z powłoką systemu Microsoft Windows. Program ma wbudowany prosty manager plików. Kompresja w trybie 7z jest wyższa od popularnego w Polsce RARa, praca w trybie ZIP okazuje się skuteczniejsza od komercyjnych pakietów takich jak WinZIP. Główną wadą programu jest wolna praca w trybach Ultra czy Maksimum, ale za to można osiągnąć lepszy stopień kompresji niż WinZIP lub WinRAR. Zaletami są szybka dekompresja, bezproblemowa praca z archiwami powyżej 2GB czy obsługa bardzo dużych plików do GB.

15 7-zip

16 PowerArchiwer PowerArchiver - PowerArchiver - program do kompresji plików działający w środowisku Windows. Program został stworzony przez firmę ConeXware Inc. i jest rozpowszechniany na licencji Shareware, obecnie kosztuje ok. 80 złotych. Obsługuje on najważniejsze formaty kompresji takie jak: zip, 7-zip, tar, bh, lha, cab. Program może otwierać także inne typy archiwów takie jak rar. PowerArchiver może tworzyć także szyfrowane archiwa. Wygląd programu wzorowany jest na pakieci microsoft office 2007

17 PowerArchiwer

18 PKZIP PKZIP program do kompresji danych napisany przez amerykańskiego programistę Phila Katza, wykorzystujący do kompresji danych PKZIP używa algorytmu ZIP. PKZIP jest akronimem od Phil Katz ZIP. PKZIP program do kompresji danych napisany przez amerykańskiego programistę Phila Katza, wykorzystujący do kompresji danych PKZIP używa algorytmu ZIP. PKZIP jest akronimem od Phil Katz ZIP. Pierwsza wersja programu PKZIP została wydana w 1989 roku. Była dostępna w wersji DOS jako program wykonywany z wiersza poleceń oraz dystrybuowana na zasadzie shareware. Pierwsza wersja programu PKZIP została wydana w 1989 roku. Była dostępna w wersji DOS jako program wykonywany z wiersza poleceń oraz dystrybuowana na zasadzie shareware. Druga wersja programu PKZIP o nazwie PKZIP 2 została wydana przez firmę PKWARE (której właścicielem jest Phil Katz) i korzysta przy kompresji z algorytmu deflate. Druga wersja programu PKZIP o nazwie PKZIP 2 została wydana przez firmę PKWARE (której właścicielem jest Phil Katz) i korzysta przy kompresji z algorytmu deflate. Format ZIP jest obecnie bardzo popularny w systemach Microsoft Windows oraz w Internecie. Większość plików z rozszerzeniem.zip jest w formacie PKZIP2, a narzędzia do tworzenia oraz czytania takich plików są dostępne na większości platform. Format ZIP jest obecnie bardzo popularny w systemach Microsoft Windows oraz w Internecie. Większość plików z rozszerzeniem.zip jest w formacie PKZIP2, a narzędzia do tworzenia oraz czytania takich plików są dostępne na większości platform.

19 PKZIP

20 Algorytmy Kompresji Algorytmem kompresji nazywamy schemat postępowania przy zmniejszaniu objętości pliku; najczęściej zależy on od charakteru kompresowanych danych. Algorytmy kompresji można podzielić ze względu na różne kryteria, np. stopień zmiany ładunku informacyjnego: kompresja bezstratna kompresja bezstratna kompresja stratna kompresja stratna

21 Kompresja bezstratna Algorytmy kompresji bezstratnej umożliwiają takie przechowanie danych, by w procesie dekompresji uzyskać dane w postaci identycznej z ta, jaka miały przed poddaniem ich kompresji. Dzieje sie to jednak zazwyczaj kosztem gorszego współczynnika kompresji. Nadają sie do danych charakteryzujących sie duża redundancja (nadmiarowością) informacji. Algorytmy kompresji bezstratnej umożliwiają takie przechowanie danych, by w procesie dekompresji uzyskać dane w postaci identycznej z ta, jaka miały przed poddaniem ich kompresji. Dzieje sie to jednak zazwyczaj kosztem gorszego współczynnika kompresji. Nadają sie do danych charakteryzujących sie duża redundancja (nadmiarowością) informacji. Niektóre obszary zastosowań: tekst, bazy danych, pewne rodzaje obrazów statycznych (np. do zastosowań medycznych). Niektóre obszary zastosowań: tekst, bazy danych, pewne rodzaje obrazów statycznych (np. do zastosowań medycznych). Przykłady algorytmów bezstratnych: Deflate, Huffman, LZW, RLE, BZIP2. Przykłady algorytmów bezstratnych: Deflate, Huffman, LZW, RLE, BZIP2.

22 Komppresja bezstratna Formaty plików z zastosowaniem kompresji bezstratnej: ZIP ZIP RAR RAR 7-zip 7-zip ARJ ARJ

23 Kompresja Stratna Przy użyciu algorytmu kompresji stratnej część oryginalnych danych zostaje utracona, chociaż ładunek informacyjny zazwyczaj jest zachowany. Algorytmy kompresji stratnej oferują lepsze współczynniki kompresji niż algorytmy kompresji bezstratnej. Przy użyciu algorytmu kompresji stratnej część oryginalnych danych zostaje utracona, chociaż ładunek informacyjny zazwyczaj jest zachowany. Algorytmy kompresji stratnej oferują lepsze współczynniki kompresji niż algorytmy kompresji bezstratnej. Niektóre obszary zastosowań: obraz ruchomy i nieruchomy, muzyka, mowa. Niektóre obszary zastosowań: obraz ruchomy i nieruchomy, muzyka, mowa. Przykłady algorytmów stratnych: DCT, metoda falkowa, JPEG, MPEG, Vorbis,MP3. Przykłady algorytmów stratnych: DCT, metoda falkowa, JPEG, MPEG, Vorbis,MP3.

24 Kompresja Stratna Różne stopnie kompresji JPG oryginału o objętości 47 KB Różne stopnie kompresji JPG oryginału o objętości 47 KB 50%85% 95%99% 3,96 KB2,17 KB1,23 KB0,96 KB

25 Algorytmy kompresji w zastosowaniach Algorytmy można podzielić również w inny sposób, np. ze względu na obszar zastosowań. Pewne algorytmy są uniwersalne i mogą zostać użyte do kompresji danych o różnej zawartości, inne z kolei są specjalizowane do konkretnych, czasami bardzo wąskich obszarów.

26 Współczynnik i stopień kompresji Współczynnik kompresji (ang. compression ratio) jest definiowany jako stosunek objętości danych skompresowanych (wyjściowych) do objętości danych oryginalnych (wejściowych), czyli jego wartość zawiera sie w przedziale od 0 do 1. Stopien kompresji (ang. compression factor ) jest odwrotnością współczynnika kompresji i przyjmuje wartości większe od 1.

27 Archiwizacja Danych Archiwizacja (ang. backup) to proces wykonywania kopii danych w celu zabezpieczenia ich przed utratą wskutek wystąpienia takich zdarzeń losowych jak powódź, pożar, włamanie, awaria sprzętu lub oprogramowania, czy nawet przypadkowe skasowanie przez użytkownika. Pod pojęciem archiwizacji rozumie się również proces przenoszenia danych z systemów komputerowych na inne nośniki (zwykle tylko do odczytu) w celu zredukowania ilości danych (np. już niepotrzebnych) w głównym systemie komputerowym (lub bazie danych). Przyczyny utraty danych - uszkodzenia mechaniczne 48% - błędy oprogramowania 30% - błędy człowieka 12% - niewłaściwe użycie 5% - przypadek 2% - pożar 1% - kradzież <1%

28 Archiwizacja Danych Niektóre sposoby archiwizacji: - kopie analogowe (wydruki dokumentów), - kopiowanie na nośniki wymienne: dyskietki, CD-R, DVD-R, - kopiowanie na taśmy magnetyczne, - kopiowanie na inny dysk tego samego komputera, - kopiowanie na inny komputer (np. kopia zwierciadlana strony WWW). Autoloader - automatyczny zmieniacz, ładujący bez udziału operatora pożądany nośnik (np. taśmę) z własnego magazynka do napędu (np. streamera). Zapewnia znaczną automatyzację procesu archiwizacji. Autoloader - automatyczny zmieniacz, ładujący bez udziału operatora pożądany nośnik (np. taśmę) z własnego magazynka do napędu (np. streamera). Zapewnia znaczną automatyzację procesu archiwizacji. Streamer - urządzenia do zapisu i odczytu wykorzystujące taśmę magnetyczną. Streamer - urządzenia do zapisu i odczytu wykorzystujące taśmę magnetyczną.

29 Archiwizacja Danych Korzystamy z systemów archiwizowania danych z następujących powodów: - podniesienie poziomu bezpieczeństwa przechowywanych danych i informacji, - największą wartością firmy są DANE (nie sprzęt komputerowy), dlatego należy je chronić, - odtworzenie utraconych bitów informacji jest bardzo kosztowne, czasochłonne lub nawet niemożliwe, - pomimo ciągłego wzrostu niezawodności stosowanego sprzętu, jego awarie wciąż są możliwe.

30 Rodzaje archiwizacji i ich cechy Backup pełny (Full) - archiwizacja za każdym razem wszystkich danych, - najdłuższy czas potrzebny na archiwizację, - najkrótszy czas potrzebny na odtworzenie danych, - wszystkie dane znajdują się na jednej płycie (taśmie), ewentualnie komplecie płyt (taśm).

31 Rodzaje archiwizacji i ich cechy Backup różnicowy (Differential) - archiwizacja danych zmodyfikowanych po ostatniej pełnej archiwizacji, - stosunkowo szybka metoda archiwizacji (szybsza od archiwizacji pełnej), - dłuższy czas potrzebny na odtworzenie danych, - potrzebna jest większa liczba kaset do odtworzenia systemu w stosunku do archiwizacji pełnej.

32 Rodzaje archiwizacji i ich cechy Backup przyrostowy (Incremental) - archiwizacja danych zmodyfikowanych po ostatniej archiwizacji, - najszybsza metoda archiwizacji, - najdłuższy czas potrzebny na odtworzenie danych, - ilość nośników danych (płyt) wzrasta w skali okresu składowania.

33 Programy do archiwizacji danych Programy typu freeware Programy typu freeware ABC Backup Darmowy program tworzący kopię bezpieczeństwa. Jego największą zaletą jest prostota obsługi i nieskończona ilość planowanych zadań archiwizacji. Darmowy program tworzący kopię bezpieczeństwa. Jego największą zaletą jest prostota obsługi i nieskończona ilość planowanych zadań archiwizacji.

34 Programy do archiwizacji danych Programy typu shareware 1) Image for Windows Narzędzie do archiwizacji i odzyskiwania danych. Tworzy dokładną kopię partycji. 2) Ferro Backup System System archiwizacji danych przeznaczony zarówno dla małych biur jak i dużych przedsiębiorstw i instytucji. Dzięki modułowi centralnego zarządzania umożliwia łatwe i wygodne wykonywanie kopii bezpieczeństwa z wielu komputerów równocześnie. 3) WinPSF Aplikacja polskiej produkcji służąca do archiwizacji i regularnego wykonywania kopii zapasowych plików według ustalonych wcześniej profili. Może automatycznie wykonać kopię zapasową o zadanej porze wybranych dni tygodnia i miesiąca.

35 Programy do archiwizacji danych Profesjonalne programy komercyjne 1) Norton Ghost Produkt firmy Symantec jest wysokiej klasy rozwiązaniem do tworzenia kopii zapasowych. Program służący do wykonywania obrazów całych dysków lub wybranych partycji. 2) Acronis Narzędzie do tworzenia obrazu dysku. Po uruchomieniu aplikacji wskazuje się, czy ma być zarchiwizowany cały dysk czy tylko jego partycja, oraz miejsce, gdzie ma być zachowany obraz, a ponadto określa się rodzaj archiwizacji, hasło oraz sposób kompresji danych.

36 Kompresja dźwięku oraz wybrane formaty

37 Kompresja dźwięku Utwory muzyczne kompresuje się, aby zajmowały mniej miejsca. W ten sposób można na dyskach twardych i płytach CD/DVD przechowywać całe dyskografie wykonawców, a do przenośnego odtwarzacza wgrać kilkadziesiąt godzin muzyki. Utwory muzyczne kompresuje się, aby zajmowały mniej miejsca. W ten sposób można na dyskach twardych i płytach CD/DVD przechowywać całe dyskografie wykonawców, a do przenośnego odtwarzacza wgrać kilkadziesiąt godzin muzyki. Najpopularniejszymi formatami kompresji dźwięku są: Najpopularniejszymi formatami kompresji dźwięku są:

38 MP3 Grupa Motion Picture Expert Group przy współpracy z Instytutem Frauenhofera z niemieckiego Erlangen, stworzyła algorytm kompresji i zapisu plików multimedialnych, ze szczególnym naciskiem na obraz (format MPEG). Jednak format ten można było wykorzystać również do zapisu audio i tak powstał format MP3. Największą zaletą tego zapisu jest możliwość skompresowania pliku typu WAV do MP3 nawet 12,13-krotnie, czyli dużo bardziej niż przy pomocy popularnych programów kompresujących (ZIP, RAR, ARJ). -Na popularność MP3 wpływa przede wszystkim wysoki stopień kompresji danych dźwiękowych, dzięki czemu pliki w tym formacie mają stosunkowo niewielkie rozmiary przy jednoczesnej wysokiej jakości brzmienia. -format wykorzystujący standard kompresji MPEG-1 Audio Layer 3. -Pliki MP3 można odtwarzać przy pomocy różnych programów komputerowych (na przykład Winampa dla systemów Microsoft Windows, Macamp dla Macintosha, XMMS dla systemów uniksowych), natomiast do ich tworzenia służy na przykład program MP3 Compressor. Niektóre discmany potrafią odtwarzać płyty CD-R i CD-RW zawierające pliki MP3.

39 WMA Windows Media Audio został stworzony przez firmę Microsoft. Windows Media Audio został stworzony przez firmę Microsoft. Użytkownicy zauważyli, że o ile WMA znakomicie radzi sobie z kompresją muzyki, to kompresja nagranej mowy pozostawia wiele do życzenia. Wprawdzie wiele z tych wad wyeliminowano lub chociaż poprawiono w najnowszej wersji kodeka Windows Media Audio 8 ale jakościowo nadal ustępuje on MP3. Użytkownicy zauważyli, że o ile WMA znakomicie radzi sobie z kompresją muzyki, to kompresja nagranej mowy pozostawia wiele do życzenia. Wprawdzie wiele z tych wad wyeliminowano lub chociaż poprawiono w najnowszej wersji kodeka Windows Media Audio 8 ale jakościowo nadal ustępuje on MP3. Zgodnie z zapewnieniem producenta funkcja kodowania Window Media Audio 8 dostarcza dźwięk o jakości jak z płyty CD i rozmiarze dwukrotnie mniejszym niż pliki w formacie MP3, dzięki czemu podwaja ilość miejsca przeznaczonego na przechowywanie muzyki i skraca czas pobierania muzyki cyfrowej o jakości płyt CD. Zgodnie z zapewnieniem producenta funkcja kodowania Window Media Audio 8 dostarcza dźwięk o jakości jak z płyty CD i rozmiarze dwukrotnie mniejszym niż pliki w formacie MP3, dzięki czemu podwaja ilość miejsca przeznaczonego na przechowywanie muzyki i skraca czas pobierania muzyki cyfrowej o jakości płyt CD. Atutem tego standardu jest strumieniowa obsługa plików i łatwa integracja ze środowiskiem XML. Najczęściej dane zakodowane za pomocą WMA umieszcza się w kontenerze ASF. Atutem tego standardu jest strumieniowa obsługa plików i łatwa integracja ze środowiskiem XML. Najczęściej dane zakodowane za pomocą WMA umieszcza się w kontenerze ASF.

40 WAV WAV (ang. wave form audio format) format plików dźwiękowych stworzony przez Microsoft oraz IBM. WAVE bazuje na formacie RIFF, poszerzając go o informacje o strumieniu audio, takie jak użyty kodek, częstotliwość próbkowania czy ilość kanałów. WAV podobnie jak RIFF został przewidziany dla komputerów IBM PC, toteż wszystkie zmienne zapisywane są w formacie little endian. Odpowiednikiem WAV dla komputerów Macintosh jest AIFF. WAV (ang. wave form audio format) format plików dźwiękowych stworzony przez Microsoft oraz IBM. WAVE bazuje na formacie RIFF, poszerzając go o informacje o strumieniu audio, takie jak użyty kodek, częstotliwość próbkowania czy ilość kanałów. WAV podobnie jak RIFF został przewidziany dla komputerów IBM PC, toteż wszystkie zmienne zapisywane są w formacie little endian. Odpowiednikiem WAV dla komputerów Macintosh jest AIFF. Mimo że pliki WAVE mogą być zapisane przy użyciu dowolnych kodeków audio, zazwyczaj stosuje się nieskompresowany format PCM, który powoduje, że pliki zajmują dużo miejsca (około 172 kB na sekundę dla jakości CD). Inną wadą formatu jest ograniczenie wielkości pliku do 4 GB, ze względu na 32- bitowe zmienne. Format WAV został częściowo wyparty przez formaty kompresji stratnej. Mimo to, dzięki swojej prostocie, nadal znajduje szerokie zastosowania. Wykorzystywany jest w edycji dźwięku oraz w przenośnych urządzeniach audio takich jak odtwarzacze i cyfrowe dyktafony. Mimo że pliki WAVE mogą być zapisane przy użyciu dowolnych kodeków audio, zazwyczaj stosuje się nieskompresowany format PCM, który powoduje, że pliki zajmują dużo miejsca (około 172 kB na sekundę dla jakości CD). Inną wadą formatu jest ograniczenie wielkości pliku do 4 GB, ze względu na 32- bitowe zmienne. Format WAV został częściowo wyparty przez formaty kompresji stratnej. Mimo to, dzięki swojej prostocie, nadal znajduje szerokie zastosowania. Wykorzystywany jest w edycji dźwięku oraz w przenośnych urządzeniach audio takich jak odtwarzacze i cyfrowe dyktafony.

41 Kompresja graficzna oraz wybrane formaty

42 Kompresja graficzna Coraz większą ilość informacji jest przekazywana w postaci obrazów (statycznych i ruchomych). Według magazynu NetWorld w 2006 r. na świecie wygenerowano 161 miliardów gigabajtów danych. Zasadnicza część pochodzi od plików graficznych produkowanych przez rozmaite urządzenia do cyfrowej rejestracji obrazu (cyfrowe aparaty fotograficzne, cyfrowe kamery filmowe, skanery, zdjęcia satelitarne, systemy obrazowania medycznego i inne). Szacuje sie, ze w 2010 r. zostanie wygenerowanych około 1000 miliardów gigabajtów danych Coraz większą ilość informacji jest przekazywana w postaci obrazów (statycznych i ruchomych). Według magazynu NetWorld w 2006 r. na świecie wygenerowano 161 miliardów gigabajtów danych. Zasadnicza część pochodzi od plików graficznych produkowanych przez rozmaite urządzenia do cyfrowej rejestracji obrazu (cyfrowe aparaty fotograficzne, cyfrowe kamery filmowe, skanery, zdjęcia satelitarne, systemy obrazowania medycznego i inne). Szacuje sie, ze w 2010 r. zostanie wygenerowanych około 1000 miliardów gigabajtów danych Taka ilość danych wymaga projektowania i użycia efektywnych metod gromadzenia, indeksowania, przeglądania i wymiany informacji w postaci graficznej. Taka ilość danych wymaga projektowania i użycia efektywnych metod gromadzenia, indeksowania, przeglądania i wymiany informacji w postaci graficznej.

43 JPEG Joint Photographic Experts Group + szeroko rozpowszechniony + szeroka paleta barw: do (28)3 = , 8 mln (tzw. True Color ) + dobrze sprawdza sie w przypadku obrazów o łagodnych przejściach tonalnych,zarówno wielobarwnych, jak i w odcieniach szarości (np. fotografie) + obsługuje tryb progresywny + istnieją rozszerzenia standardu i modyfikacje algorytmu kompresującego (JPEG-LS, JPEG 2000) + istnieją wolne (niekomercyjne i nieopatentowane) implementacje – kompresja stratna – w procesie kompresji z obrazu usuwane sa drobne szczegóły – istnieje wiele formatów plików, w których wykorzystuje sie algorytm JPEG, który sam w sobie nie został dokładnie sprecyzowany niektóre są niezgodne ze sobą lub używane przez nieliczne programy

44 GIF Graphics Interchange Format + szeroko rozpowszechniony + kompresja bezstratna (algorytm LZW) + małe rozmiary plików + dobrze sprawdza sie w przypadku obrazów składających sie z dużych obszarów o jednolitej barwie (np. wykresy tortowe) i/lub szczegółowych oraz z ostrymi krawędziami (np. wykresy, rysunki, siatki, szkice) + można zapisać informacje o przeźroczystości wybranego koloru + istnieją rozszerzenia standardu pozwalające na zapis animacji – niewielka paleta barw: maksymalnie 28 = 256 (tzw. tryb indeksowany) – obrazy o dużej rozpiętości tonalnej są redukowane do 256 kolorów przed wykonaniem kompresji, przez co trąca na jakości – format był do niedawna objęty patentami

45 PNG Portable Network Graphics + kompresja bezstratna + łączy zalety JPEG i GIF: dobrze sprawdza sie zarówno w przypadku obrazów o płynnych przejściach tonalnych wielobarwnych i w odcieniach szarości (paleta barw do 16, 8 mln kolorów), jak i GIF (pełna 8-bitowa przezroczystość [tzw. kanał alfa] oraz paleta barw od 2 do 256 kolorów) + obsługuje korekcje gamma, tryb progresywny i kontrole poprawności pliku + obsługuje różne głębokości bitowe (do 48 bitów na piksel) + algorytm i format są wolne od patentów + zalecany przez W3C (World Wide Web Consortium) jako do reprezentacji grafiki rastrowej w sieci Web – nie obsługuje animacji (istnieje osobny format do tego celu [MNG] oparty na algorytmie PNG) – nieprawidłowo obsługiwany przez przeglądarkę Internet Explorer < 7.0 – niektóre programy nie obsługują wszystkich właściwości PNG – występują problemy z obsługa korekcji gamma w przeglądarkach

46 Kompresja filmów oraz wybrane formaty

47 Kompresja filmów Każdy film zapisany w postaci cyfrowej składa się z klatek, są to pojedyncze obrazy – podobne do zbioru naszych fotografii. Jedna klatka nieskompresowanego obrazu zajmuje 810 kilobajtów pamięci (sekunda to 25 klatek, czyli minuta filmu to ponad 1 GB). Na szczęście istnieje kompresja danych – także stosowana w przypadku filmów. W tym celu opracowano standard MPEG. W plikach MPEG zapisujemy obraz do skompresowanych klatek JPG, dźwięk do formatu MPEG (mp3, ac3) i sekwencje wideo do plików tekstowych – dzięki tej technice możliwe jest zwiększenie współczynnika kompresji do 1:7- 1:30. Najbardziej znane formaty skompresowanych filmów to MP4,DivX,MPEG oraz Windows WMV. Do kompresji stosuje się odpowiednie programy komputerowe. Jednym z nich jest popularny Nero Suite (m.in. do wypalania płyt) i darmowy Any Video Converter (...) Każdy film zapisany w postaci cyfrowej składa się z klatek, są to pojedyncze obrazy – podobne do zbioru naszych fotografii. Jedna klatka nieskompresowanego obrazu zajmuje 810 kilobajtów pamięci (sekunda to 25 klatek, czyli minuta filmu to ponad 1 GB). Na szczęście istnieje kompresja danych – także stosowana w przypadku filmów. W tym celu opracowano standard MPEG. W plikach MPEG zapisujemy obraz do skompresowanych klatek JPG, dźwięk do formatu MPEG (mp3, ac3) i sekwencje wideo do plików tekstowych – dzięki tej technice możliwe jest zwiększenie współczynnika kompresji do 1:7- 1:30. Najbardziej znane formaty skompresowanych filmów to MP4,DivX,MPEG oraz Windows WMV. Do kompresji stosuje się odpowiednie programy komputerowe. Jednym z nich jest popularny Nero Suite (m.in. do wypalania płyt) i darmowy Any Video Converter (...)

48 MPEG oraz DivX 1. Formaty MPEG-1 (Video CD, MP3), MPEG-2 (telewizja cyfrowa), MPEG-4 (najnowszy standard filmów DVD) – standardy kompresji obrazów i dźwięków, stosowane m. in. w Internecie, telewizji cyfrowej, telefonii komórkowej. 2. Format DivX, format kompresji pozwalający na zapis filmów z jakością porównywalna do DVD, oparty na standardzie MPEG-4. Do zapisu i odtwarzania formatu potrzebny jest specjalny kodek (algorytm kodowania – dekodowania plików multimedialnych). Format najczęściej używany do kopiowania filmów DVD (rozszerzenie plików.avi).

49 Kompresja plików oraz wybrane formaty

50 ZIP ZIP – jeden z najczęściej używanych formatów kompresji i archiwizacji danych na platformie PC, zwłaszcza w środowisku Microsoft Windows. ZIP – jeden z najczęściej używanych formatów kompresji i archiwizacji danych na platformie PC, zwłaszcza w środowisku Microsoft Windows. Format ten został zaprojektowany w 1989 roku przez Phila Katza Format ten został zaprojektowany w 1989 roku przez Phila Katza Mimo że pierwotnie jedynym programem obsługującym ten format kompresji i archiwizacji był PKZIP, obecnie istnieją setki programów obsługujących go. Ponadto, począwszy od Windows ME, obsługa archiwów ZIP jest częścią systemu (archiwa ZIP są rozpoznawane jako "skompresowane foldery"). Mimo że pierwotnie jedynym programem obsługującym ten format kompresji i archiwizacji był PKZIP, obecnie istnieją setki programów obsługujących go. Ponadto, począwszy od Windows ME, obsługa archiwów ZIP jest częścią systemu (archiwa ZIP są rozpoznawane jako "skompresowane foldery"). Pliki w formacie ZIP mają rozszerzenie ".zip" i typ MIME application/zip. Pojedynczy plik ZIP może zawierać jeden lub więcej plików oraz folderów w postaci skompresowanej (każdy kompresowany osobno) lub nieskompresowanej. Pliki w formacie ZIP mają rozszerzenie ".zip" i typ MIME application/zip. Pojedynczy plik ZIP może zawierać jeden lub więcej plików oraz folderów w postaci skompresowanej (każdy kompresowany osobno) lub nieskompresowanej. Format ZIP jest też używany przez wiele programów jako nośnik danych (zbiornik) rozbitej na dużą liczbę elementów większej logicznej struktury. Przykładami mogą być np. dokumenty OpenOffice, archiwa JAR, dodatki programu Mozilla Firefox, itp. Format ZIP jest też używany przez wiele programów jako nośnik danych (zbiornik) rozbitej na dużą liczbę elementów większej logicznej struktury. Przykładami mogą być np. dokumenty OpenOffice, archiwa JAR, dodatki programu Mozilla Firefox, itp. Istnieje wiele narzędzi umożliwiających odczyt, tworzenie oraz edycję plików ZIP. Należą do nich między innymi PKZIP, WinZIP, PicoZip, Info-ZIP, WinRAR oraz FAR manager. Chociaż 7-zip ma własny macierzysty format (7z), to potrafi kompresować pliki do postaci ZIP nawet o kilka procent wydajniej niż inne implementacje. Istnieje wiele narzędzi umożliwiających odczyt, tworzenie oraz edycję plików ZIP. Należą do nich między innymi PKZIP, WinZIP, PicoZip, Info-ZIP, WinRAR oraz FAR manager. Chociaż 7-zip ma własny macierzysty format (7z), to potrafi kompresować pliki do postaci ZIP nawet o kilka procent wydajniej niż inne implementacje.

51 RAR Format RAR w większości przypadków umożliwia wydajniejszą kompresję niż format ZIP, szczególnie w trybie ciągłym. Inną ważną właściwością formatu RAR jest możliwość tworzenia woluminów(archiwów wieloczęściowych). Woluminy są wygodniejsze i łatwiejsze w użyciu niż wieloczęściowe archiwa ZIP (tworzone przy użyciu polecenia span disks). WinRAR nie obsługuje wieloczęściowych archiwów ZIP.Format Format RAR w większości przypadków umożliwia wydajniejszą kompresję niż format ZIP, szczególnie w trybie ciągłym. Inną ważną właściwością formatu RAR jest możliwość tworzenia woluminów(archiwów wieloczęściowych). Woluminy są wygodniejsze i łatwiejsze w użyciu niż wieloczęściowe archiwa ZIP (tworzone przy użyciu polecenia span disks). WinRAR nie obsługuje wieloczęściowych archiwów ZIP.Format RAR posiada ponadto kilka właściwości nieobecnych w archiwach ZIP, np. dane naprawcze(które umożliwiają odzyskanie danych z uszkodzonych archiwów), czy też możliwość blokowania ważnych archiwów, aby uniknąć ich przypadkowej modyfikacji. RAR posiada ponadto kilka właściwości nieobecnych w archiwach ZIP, np. dane naprawcze(które umożliwiają odzyskanie danych z uszkodzonych archiwów), czy też możliwość blokowania ważnych archiwów, aby uniknąć ich przypadkowej modyfikacji. Format RAR może obsługiwać pliki praktycznie dowolnych rozmiarów (do wielkości gigabajtów), podczas gdy rozmiar pojedynczego pliku w archiwum ZIP jest ograniczony rozmiarem 2GB. Aby jednak obsługiwać pliki przekraczające swym rozmiarem 4 GB należy pracować w systemie obsługującym NTFS, ponieważ starsze systemy plików (FAT, FAT32) nie obsługują plików o takich rozmiarach. Format RAR może obsługiwać pliki praktycznie dowolnych rozmiarów (do wielkości gigabajtów), podczas gdy rozmiar pojedynczego pliku w archiwum ZIP jest ograniczony rozmiarem 2GB. Aby jednak obsługiwać pliki przekraczające swym rozmiarem 4 GB należy pracować w systemie obsługującym NTFS, ponieważ starsze systemy plików (FAT, FAT32) nie obsługują plików o takich rozmiarach.

52 7-zip To nowy format archiwizowania danych zapewniający wysoki stopień kompresji. Format 7-zip charakteryzuje się: Otwartą architekturą Otwartą architekturą Wysokim stopniem kompresji Wysokim stopniem kompresji Silnym szyfrowaniem AES-256 Silnym szyfrowaniem AES-256 Zdolnością kompresji, konwersji i szyfrowania Zdolnością kompresji, konwersji i szyfrowania Wsparciem plików, których rozmiary sięgają GB Wsparciem plików, których rozmiary sięgają GB Nazwami plików zgodnymi ze standardami Unicode Nazwami plików zgodnymi ze standardami Unicode Solidną kompresją Solidną kompresją

53 Podsumowując… Trudno sobie wyobrazić rozwój nowoczesnej telekomunikacji,e-biznesu,obiegu różnego typu dokumentów w Internecie, skuteczne wyszukiwarki czy globalne bazy danych bez optymalizowanych algorytmów kompresji i archiwizacji. Kompresja i archiwizacja danych jest efektywna i uniwersalna. Pozwala przyspieszyć i wzbogacić przekaz wiadomości, zwiększyć niezawodność wymiany informacji pomiędzy nadawcą i odbiorcą, lepiej archiwizować posiadane zasoby.

54 Dziękuje za uwagę


Pobierz ppt "Kompresja i archiwizacja danych. Formaty kompresji plik ó w Damian Dźwigaj Informatyka i Ekonometria."

Podobne prezentacje


Reklamy Google