Technologie taśmowe – wprowadzenie i zastosowania Jacek Herold, WCSS
Zagadnienia Czym są urządzenia taśmowe Czym różnią się od dysków twardych Podstawowe parametry urządzeń Parametry streamerów Parametry taśm Najczęściej używane technologie i kompatybilność Kiedy i dlaczego używamy technologii taśmowych Trochę głębiej w technologię Systemy kodowania Sposób zapisu Line Serpentine vs. Helical Track Urządzenia blokowe vs znakowe sposób dostępu do danych - szeregowe układanie danych. Zagadnienie kompresji - kompresja automatyczna vs. Konfigurowana Systemy automatyczne: autloadery, biblioteki RAIT
Zagadnienia c.d. Oprogramowanie do archiwizacji tar, dump/restore IBM TSM Amanda, Bacula Veritas
Czym są urządzenia taśmowe - historia Urządzenia taśmowe to napędy pozwalające na zapisywanie informacji na taśmach magnetycznych (nośnikach taśmowych). Służą przede wszystkim do archiwizacji i tworzenia kopii zapasowych. Ich historia sięga roku 1951 kiedy to firma Remington Rand wyprodukowała pierwszy na świecie napęd taśmowy. Napęd obsługiwał taśmy o „zawrotnej” ilości ośmiu ścieżek (6 użytecznych) i gęstości 128bpi. Taśma przesuwała się z prędkością ok. 2,5m/s a szybkość odczytu wynosiła 7200 znaków na sekundę. W 1984 roku firma DEC wprowadziła na rynek pierwszy napęd korzystający z technologii zapisu Line Serpentine. Co znacznie przyspieszyło szybkość wymiany danych pomiędzy taśmą a urządzeniem. Kolejnym krokiem było wprowadzenie w roku 1987 przez konsorcjum SONY i Exabyte technologii zapisu Helical Track, co przy ówczesnych prędkościach przesuwu taśm stanowiło kolejną rewolucję w prędkości zapis / odczyt.
Czym są urządzenia taśmowe – c.d. Kasety do napędów dzielą się na dwa rodzaje – z dwoma szpulami i z jedną szpulą: Obecnie w zastosowaniach profesjonalnych stosuje się najczęściej taśmy z jedną szpulą: LTO, SDLT, natomiast w pozostałych taśmy z dwoma szpulami: DAT72, QIC.
Czym są urządzenia taśmowe – c.d. Różne rodzaje napędów taśmowych:
Czym są urządzenia taśmowe – c.d. Przykładowe system prowadzenia taśmy:
Czym różnią się od dysków twardych Urządzenia taśmowe: Twarde dyski Szeregowy dostęp do danych Wymienne nośniki Długi czas przechowywania danych (30 lat) Wydajne algorytmy korekcji błędów WH Error: SW Error: Duża odporność na uszkodzenia nośnika Bardzo szybki transfer liniowy – ok. 280MB/s (LTO-5 Comp.) Potencjalnie bardzo długi czas oczekiwania na określowny fragment danych Kodowanie: RLL, MPRL, NPML Brak systemu plików (wyjątek LTFS) Blokowy dostęp do danych Niewymienne nośniki – wyjątek MO Nieznany maksymalny czas przechowywania Słabsze algorytmy korekcji Mała odporność na uszkodzenia mechaniczne Transfer liniowy na poziomie 120MB/s Stosunkowo krótki czas oczekiwania na określony fragment danych Kodowanie RLL Ściśle zdefinowane systemy plików
Technologia: LTO, SDLT, AIT, DDS (DAT) Pojemność nośnika: nominalna, z kompresją Interface: SCSI, FC, SAS Szybkość transferu: nominalna, z kompresją Całkowity czas potrzebny na utworzenie odczytanie pełnego archiwum Szyfrowanie sprzętowe WORM Gwarantowany czas przechowania danych Maksymalna liczba przebiegów głowicy Maksymalna liczba montowań nośnika Cartidge Memory (CM) Korekcja błędów HW Error, SW Error Pamięć cache Wsteczna kompatybilność Podstawowe parametry urządzeń i nośników
LTO-5: (przykładowo Quantum LTO-5 FH) Pojemność nominalna: 1500GB, 3000GB (2:1) 4500GB (3:1 IBM) Interface FC-8 Szybkość transferu: 140MB/s, 280MB/s (2:1) Czas potrzebny na utworzenie pełnego archiwum: 90 minut (2:1) – dla pewności należy przyjąć 120minut Dostepność WORM-a: TAK Szyfrowanie sprzętowe: NIE Pamięć cache: 256MB
Podstawowe parametry urządzeń i nośników Taśma LTO-5: Gwarantowany czas przechowywania archiwum lat Pojemność 1500GB / 3000GB (2:1) Maksymalna liczba montowań taśmy: 5000 Maksymalna liczba przebiegów głowicy co daje ok. 260 pełnych zapisów / odczytów nośnika. CM: jeśli występuje pozwala odczytać ważne informacje o taśmie: Liczbę montowań Liczbę przebiegów głowicy Ewentualne problemy Bar Code
Najczęściej używane technologie i kompatybilność Technologie profesjonalne: LTO (obecnie LTO-5) 1500GB 120MB/s SDLT 300GB (1:1) 36MB/s (1:1) AIT (oczekiwane AIT-6) 800GB 248MB/s SAIT (oczekiwane SAIT-4) 4000GB (1:1) 240MB/s (1:1) T10000 (T10000B) 1000GB (1:1) 120MB/s (1:1) DLT-S4 800GB (1:1) 60MB/s
Technologie użytku domowego i małych firm Digital Data Storage (DDS) (obecnie DAT-160) 80GB 6,9MB/s VXA (obecnie VXA-320) 160GB 24MB/s SLR (Scalable Linear Recording) 70GB 6MB/s Ponadto wiele innych formatów. Najczęściej używane technologie i kompatybilność
Na co zwracać uwagę przy wyborze technologii: Powszechność danej technologii Lista kompatybilności Dostępność serwisu Współpraca z innymi urządzeniami Możliwości rozwojowe technologii
Najczęściej używane technologie i kompatybilność Kompatybilność technologii LTO-5
Najczęściej używane technologie i kompatybilność Kompatybilność technologii DDS
Najczęściej używane technologie i kompatybilność Przyszłość technologii LTO:
Najczęściej używane technologie i kompatybilność Przyszłość technologii DDS:
Przyrost pojemności taśm Rok 1974 – pierwsza „biblioteka” taśmowa (IBM) Rok 1996 – zastosowanie algorytmu PRML (DDS-3)
Kiedy i dlaczego używamy technologii taśmowych Stosujemy: Archiwa długoterminowe Bezpieczeństwo danych nie modyfikowanych (WORM) Trwałość mechaniczna: dysk pracuje przez cały czas taśma tylko przez chwilę Przechowywanie dużych pojemności Archiwa multi-volume Kopie bezpieczeństwa Szybkość dostępu do danych jest drugorzędna Wymagane mocne kody korekcyjne Nie stosujemy: Szybki lub losowy dostęp do danych Dane często ulegają zmianie Krótki czas, życia danych Dane małoistotne
Kilka słów więcej o technologii Systemy kodowania Sposoby zapisu Urządzenia blokowe i znakowe Sposób dostępu do danych (partycje)
Systemy kodowania danych na taśmach Czym jest kodowanie i dlaczego je stosujemy Rodzina LTO: LTO-1: RLL1,7 LTO 2,3,4: PRML LTO-5: NPML Rodzina DDS: Helical scan (R-DAT, PRML od DDS3)
Sposób zapisu danych – metody prowadzenia taśmy
Sposób zapisu danych – ułożenie ścieżek Helical scan Line serpentine
Sposób zapisu danych – ułożenie domen magnetycznych
Urządzenia blokowe i znakowe Sposób dostępu do danych Szybkość liniowa vs czas dostępu Odczyt danych z taśmy a ułożenie plików Dane na „końcu” taśmy Czas dostępu do danych na „końcu” taśmy Partycje na taśmie vs partycje na dysku
Kompresja danych i pojemność taśmy Pojemność nominalna Problem kompresji danych Porównanie przykładowych wyników kompresji Szybkość transferu a kompresja Kompresja automatyczna (LTO) a kompresja konfigurowana
Systemy automatyczne Autoloadery Biblioteki Rodzaje elementów biblioteki: Data Transfer, Storage, Mail etc. Zarządzanie biblioteką Partycje biblioteki VTL
Systemy automatyczne – rodzaje bibliotek Z pojedynczym robotem Z wieloma robotami Współdzielony obszar roboczy Autonomiczne obszary robocze Pojedyncza technologia zapisu lub wiele technologii zapisu Wiele bibliotek w systemie
Systemy automatyczne – zarządzanie biblioteką Elementy biblioteki: napędy, roboty Biblioteka podłączona bezpośrednio Biblioteka w strukturze SAN Partycje biblioteki
RAIT Co to jest RAIT Poziomy – konfiguracje: 0,1,5 Dlaczego stosujemy RAIT Gdzie zastosowanie RAIT jest uzasadnione HW RAIT vs Software RAIT dopasowanie nośników
Oprogramowanie do archiwizacji Istotne cechy oprogramowania Wspierany sprzęt Wspierane systemy operacyjne Praca w sieci Sposób zarządzania Procedury awaryjne Wsparcie od strony producenta Wspierane technologie, Multi-Volume, VTL, RAIT, Disk Pool Oprogramowanie IBM TSM Bacula Amanda CASTOR (CERN) Veritas backup tar, dump/restore, mt, mtx
Oprogramowanie do archiwizacji HSM – ang. Hierarchical Storage Management Parametry użytkowe i cechy systemu HSMPrzykładowa realizacja HSM w PCSSPoziomy hierarchii HSM
Przyrost pojemności technologii taśmowych Współczynnik 2x Przyrost na przestrzeni lat
... Podsumowanie
Dziękujemy za uwagę Kontakt: kmd.pcss.pl Technologie taśmowe