Macierze RAID ang. Redundant Array of Independent Disks, Nadmiarowa macierz niezależnych dysków
Cele RAID zwiększenie niezawodności (odporność na awarie), zwiększenie wydajności transmisji danych, powiększenie przestrzeni dostępnej jako jedna całość.
Kontroler RAID
RAID 0 striping Wydajność w porównaniu do pojedynczego dysku twardego wzrasta n-krotnie, gdzie n to liczba dysków w macierzy RAID 0. Oznacza to, że macierz RAID 0 składająca się z dwóch dysków twardych, jest dwukrotnie bardziej wydajna od pojedynczego dysku – macierz złożona z czterech dysków, jest już czterokrotnie wydajniejsza od pojedynczego dysku. Rozmiar całej macierzy równy jest n-krotności najmniejszego z dysków w tej macierzy, gdzie n to liczba dysków. – Operacje odczytu i zapisu przeprowadzane są równolegle na wielu dyskach (jeżeli wielkość danych odczytywanych i zapisywanych jest większa niż blok danych macierzy) – Zapisując dane o wielkości mniejszej niż ustalony blok danych zapisane zostaną tylko na jednym dysku
RAID 0 striping Zasada działania RAID 0 jest następująca – Macierz stworzona z kilku dysków widoczna jest dla systemu jako jeden wolumin. Dane zapisywane na owym woluminie logicznym dzielone są na bloki danych (wielkość bloku określana jest podczas tworzenia macierzy), a następnie bloki te przeplatane są pomiędzy kolejnymi dyskami w macierzy.
RAID 0 striping Korzyści: przestrzeń wszystkich dysków jest widziana jako całość, przyspieszenie zapisu i odczytu w porównaniu do pojedynczego dysku. Wady: brak odporności na awarię dysków, N*rozmiar najmniejszego z dysków (zwykle łączy się jednakowe dyski), zwiększenie awaryjności. Awaria pojedynczego dysku powoduje utratę wolumenu, a szansa na awarię jednego z N dysków rośnie wraz z N.
RAID 0 striping Przykład 1 Trzy dyski po 500 GB zostały połączone w RAID 0. Powstała przestrzeń ma rozmiar 1,5TB. Szybkość zapisu i odczytu jest prawie trzykrotnie większa niż na pojedynczym dysku. Sumaryczna szybkość jest 3-krotnością szybkości najwolniejszego z dysków, gdyż kontroler raid podczas zapisu/odczytu musi poczekać na najwolniejszy dysk. Stąd też sugeruje się stosowanie dysków o identycznej szybkości i pojemności. Przykład 2 Trzy dyski: 160 GB, 500 GB i 80 GB zostały połączone w RAID 0. Powstała w ten sposób przestrzeń ma rozmiar taki jak N*rozmiar najmniejszego z dysków, czyli 3·80 GB = 240 GB. Szybkość jest ograniczona szybkością najwolniejszego dysku, analogicznie do poprzedniego przykładu.
RAID 0 striping Zastosowanie RAID 0: - amatorzy edycji video, edycji dźwięku, twórcy grafiki trójwymiarowej lub posiadacze domowych serwerów.
RAID 1 mirroring Macierz RAID 1 składa się z przynajmniej dwóch dysków twardych, przy czym pojemność całej macierzy wynosi tyle ile pojemność najmniejszego z dysków w tejże macierzy. RAID 1 ma za zadanie dokonywać na n dyskach (gdzie n to liczba dysków w macierzy) zmian identycznych, jakie zachodzą na dysku woluminie logicznym. Oznacza to, że dane zapisywane na woluminie logicznym kopiowane są w locie na wszystkie dyski w macierzy.
RAID 1 mirroring
RAID 1 mirroring Korzyści: odporność na awarię N – 1 dysków przy N-dyskowej macierzy możliwe zwiększenie szybkości odczytu możliwe zmniejszenie czasu dostępu Wady: możliwa zmniejszona szybkość zapisu utrata pojemności (całkowita pojemność jest taka jak pojemność najmniejszego dysku)
RAID 10 (1+0) Konfiguracja RAID 10 to połączenie dwóch poprzednich trybów. Rozwiązanie to wymaga minimum czterech dysków twardych, ale przy tym zapewnia podwyższoną wydajność zaczerpniętą z RAID 0 przy zachowaniu bezpieczeństwa znanego z RAID 1. Macierz RAID 10 działa w następujący sposób: – Dane zapisywane na wolumenie logicznym dzielone są na bloki danych o określonym podczas tworzenia macierzy rozmiarze (jeśli dane mają rozmiar większy niż pojedynczy blok). – Bloki danych zapisywane są równolegle, z przeplotem kolejności na dyskach w macierzy – Dyski w macierzy RAID 0 posiadają swój mirror dzięki zastosowaniu „podmacierzy” RAID 1. RAID 10 to wydajne i bezpieczne rozwiązanie, jednak pojemność macierzy RAID 10 równa jest połowie pojemności wszystkich dysków w macierzy. Z uwagi na zastosowanie w konstrukcji macierzy rozwiązań RAID 1, macierz ta ograniczona jest także wydajnością, która teoretycznie będzie wynosiła połowę n-krotności najwolniejszego dysku w macierzy (gdzie n to liczba dysków w macierzy).
RAID 10 (1+0)
RAID 2 Dane na dyskach są paskowane. Zapis następuje po 1 bicie na pasek. Potrzebujemy minimum 8 powierzchni do obsługi danych oraz dodatkowe dyski do przechowywania informacji generowanych za pomocą kodu Hamminga potrzebnych do korekcji błędów. Liczba dysków używanych do przechowywania tych informacji jest proporcjonalna do logarytmu liczby dysków, które są przez nie chronione. Połączone dyski zachowują się jak jeden duży dysk. Dostępna pojemność to suma pojemności dysków przechowujących dane. Korzyści: każdy dowolny dysk (zarówno z danymi jak i z kodem Hamminga) może w razie uszkodzenia zostać odbudowany przez pozostałe dyski Wady: konieczność dokładnej synchronizacji wszystkich dysków zawierających kod Hamminga (w przeciwnym wypadku dezorganizacja i całkowita nieprzydatność tych dysków) długotrwałe generowanie kodu Hamminga przekładające się na wolną pracę całego systemu
RAID 2 Dane na dyskach są paskowane. Zapis następuje po 1 bicie na pasek. Potrzebujemy minimum 8 powierzchni do obsługi danych oraz dodatkowe dyski do przechowywania informacji generowanych za pomocą kodu Hamminga potrzebnych do korekcji błędów. Liczba dysków używanych do przechowywania tych informacji jest proporcjonalna do logarytmu liczby dysków, które są przez nie chronione. Połączone dyski zachowują się jak jeden duży dysk. Dostępna pojemność to suma pojemności dysków przechowujących dane. Żadko stosowane ze względu na duży stopień skomplikowania.
RAID 3 Dane składowane są na N-1 dyskach. Ostatni dysk służy do przechowywania sum kontrolnych. Działa jak striping (RAID 0), ale w macierzy jest dodatkowy dysk, na którym zapisywane są kody parzystości obliczane przez specjalny procesor. Korzyści: odporność na awarię 1 dysku, zwiększona szybkość odczytu Wady: zmniejszona szybkość zapisu z powodu konieczności kalkulowania sum kontrolnych (eliminowana poprzez zastosowanie sprzętowych kontrolerów RAID) w przypadku awarii dysku dostęp do danych jest spowolniony z powodu obliczeń sum kontrolnych odbudowa macierzy po wymianie dysku jest operacją kosztowną obliczeniowo i powoduje spowolnienie operacji odczytu i zapisu pojedynczy, wydzielony dysk na sumy kontrolne zazwyczaj jest "wąskim gardłem" w wydajności całej macierzy
RAID 3
RAID 4 RAID 4 jest bardzo zbliżony do RAID 3, z tą różnicą, że dane są dzielone na większe bloki (16, 32, 64 lub 128 kB). Takie pakiety zapisywane są na dyskach podobnie do rozwiązania RAID 0. Dla każdego rzędu zapisywanych danych blok parzystości zapisywany jest na dysku parzystości. Przy uszkodzeniu dysku dane mogą być odtworzone przez odpowiednie operacje matematyczne. Parametry RAID 4 są bardzo dobre dla sekwencyjnego zapisu i odczytu danych (operacje na bardzo dużych plikach). Jednorazowy zapis małej porcji danych potrzebuje modyfikacji odpowiednich bloków parzystości dla każdej operacji I/O. W efekcie, za każdym razem przy zapisie danych system czekałby na modyfikacje bloków parzystości, co przy częstych operacjach zapisu bardzo spowolniłoby pracę systemu.
RAID 4
RAID 5 Poziom piąty pracuje bardzo podobnie do poziomu czwartego z tą różnicą, iż bity parzystości nie są zapisywane na specjalnie do tego przeznaczonym dysku, lecz są rozpraszane po całej strukturze macierzy. RAID 5 umożliwia odzyskanie danych w razie awarii jednego z dysków przy wykorzystaniu danych i kodów korekcyjnych zapisanych na pozostałych dyskach (zamiast tak jak w 3. na jednym specjalnie do tego przeznaczonym, co nieznacznie zmniejsza koszty i daje lepsze gwarancje bezpieczeństwa). RAID 5 oferuje większą prędkość odczytu niż lustrzany (ang. mirroring) ale przy jego zastosowaniu nieznacznie spada prędkość zapisu. Poziom piąty jest bezpieczny dla danych – w razie awarii system automatycznie odbuduje utracone dane, tak by mogły być odczytywane, zmniejszając jednak bieżącą wydajność macierzy. Spowolnienie ma charakter przejściowy, zaś jego czas zależy od obciążenia macierzy i pojemności dysku. Po zamontowaniu nowego dysku i odbudowaniu zawartości dysku wydajność macierzy wraca do normy. Macierz składa się z 3 lub więcej dysków. Przy macierzy liczącej N dysków jej objętość wynosi N – 1 dysków. Przy łączeniu dysków o różnej pojemności otrzymujemy objętość najmniejszego dysku razy N – 1. Sumy kontrolne CRC danych dzielone są na N części, przy czym każda część składowana jest na innym dysku, a wyliczana jest z odpowiedniego fragmentu danych składowanych na pozostałych N-1 dyskach.
RAID 5
RAID 6 Macierz z podwójną parzystością, realizowana np. jako 5+2, albo 13+2. Kosztowniejsza w implementacji niż RAID 5, ale dająca większą niezawodność. Awaria dwóch dowolnych dysków w tym samym czasie nie powoduje utraty danych. Korzyści: odporność na awarię maksimum 2 dysków szybkość pracy większa niż szybkość pojedynczego dysku.
RAID 6
NAS Network Attached Storage technologia umożliwiająca podłączenie zasobów pamięci dyskowych bezpośrednio do sieci komputerowej. Dzięki takiemu rozwiązaniu można łatwo skonfigurować dostęp do danych znajdujących się w jednym miejscu z różnych punktów sieci. Zaletą NAS jest możliwość jego stosowania w heterogenicznych sieciach opartych na różnych rozwiązaniach klienckich przez co dane są osiągalne bez względu na rodzaj zainstalowanego systemu operacyjnego.
NAS