Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Systemy wysokiej niezawodności ( High Availability Systems )

Podobne prezentacje


Prezentacja na temat: "Systemy wysokiej niezawodności ( High Availability Systems )"— Zapis prezentacji:

1 Systemy wysokiej niezawodności ( High Availability Systems )
Jacek Kitowski Katedra Informatyki AGH Grupa Systemów Komputerowych (CSG) C2 IV p. tel

2 Bezpieczeństwo Systemów Komputerowych Systemy wysokiej niezawodności ( High Availability Systems )
Jacek Kitowski

3 Plan wykładu Wprowadzenie do problematyki HAS
Podstawowe pojęcia Rekapitulacja Metody oceny wydajności systemów Tendencje rozwojowe procesorów Komputery systemów otwartych i modele programowania Systemy komputerowe wysokiej dostępności Składowanie i udostępnianie dużych zbiorów danych Wprowadzenie do problematyki jakości oprogramowania Ochrona danych przed zniszczeniem i utratą Podczas przetwarzania Elementy architektury komputera Systemy wielokomputerowe Podczas udostępniania Podsystemy pamięci masowej Podczas archiwizacji Tertiary storage

4 Technology Infrastructure
Składowe dyspozycyjności - dostępności Availability is Built, Managed and Measured "Technology is one component in the evolution to high availability systems" Technology Infrastructure Availability IT Processes Support Partnerships

5 Cel wykładu Problemy projektowania i eksploatacji przemysłowych i komercyjnych systemów komputerowych Metody podniesienia niezawodności systemów i zapewnienia ciągłości pracy M.in.: parametry techniczne sprzętu i oprogramowania rozwiązania sprzętowo-programowe elementy strategii dotyczącej wyboru sprzętu

6 Literatura Evan Marcus, Hal Stern „Blueprint for High Availability: Desiging Resilent Distributed Systems”, John Wiley & Sons, 2000 Jacek Kitowski „Współczesne Systemy Komputerowe”, Wyd. CCNS, 2000 Marc Farley, Thorton A. May „Building Storage Networks”, Mac Graw-Hill, 2000 Pomocnicza: Jon W. Toigo: „Disaster Recovery Planning: Strategies for Protecting Critical Information Assets”, 1999 Dhiraj K. Pradhan: „Fault-Tolerant Computer System Design”, Prentice Hall, 1996

7 Wprowadzenie Zastosowania naukowo-techniczne, przemysłowe, komercyjne
Zagadnienia: parametry techniczne i funkcjonalność oprogramowania rozwiązania podnoszące niezawodność oferowanych usług i ich bezpieczeństwo ciągłość pracy wybór sprzętu - elementy strategii koszt rozwiązań

8 Jakość przetwarzania Zróżnicowane pojęcie, zależne od celu, implementacji .... Tradycyjnie: łatwiej wiarygodniej taniej szybciej więcej High Performance Computing (HPC) versus High Throughput Computing (HTC) HPC - execution time, speedup, efficiency (dot. pojedynczego zadania) HTC - przepustowość instalacji - wydajność w długim horyzoncie, miesiącu ....

9 Czynniki przy podejmowaniu decyzji w zakresie systemów informatycznych
Podstawowe cele informatyzacji Zakres zastosowań, np.: naukowo-techniczne wspomaganie zarządzania usługi sieciowe udział przetwarzania rozproszonego Własności aplikacji, np.: algorytm i dane, model programowania metoda implementacji algorytmu architektura komputera i system operacyjny rozmiar zagadnienia i liczba użytkowników metody i środki programistyczne do oceny wydajności i optymalizacji aplikacji Przykłady: Obliczenia n-t: -> opis fenomenologiczny -> model matematyczny -> algorytm numeryczny (struktury danych) -> model komputerowy > odwzorowanie: problem-architektura-algorytm Instytucje międzynarodowe: struktura zdecentralizowana -> system rozproszony zapewniający integralność

10 Czynniki przy podejmowaniu decyzji w zakresie systemów informatycznych - cd.
Strategie w zakresie niezawodności i ochrony informacji, w tym: poziom dostępności i architektura systemu - redundancja model składowania i udostępniania danych i jego realizacja środki ochrony informacji przed niepowołanym dostępem Inżynieria i problematyka jakości oprogramowania Przykłady: systemy wielokomputerowe backup, archiwizacja, HSM firewalls

11 Pojęcia system failover (model: 2 systemy pracują jako jeden)
wydajność basic systems Redundancja RAS niezawodność (resiliency) dostępność, A (availability) serwisowalność (servisability) MTBF (Mean Time Between Failures) MTTR (Mean Time to Repair) MSBF (Mean Time Between Swaps) stopa błędu system failover (model: 2 systemy pracują jako jeden) disaster recovery zastosowania: naukowo-technicze przemysłowe komercyjne wspomaganie zarządzania przykładowa definicja

12 Metody oceny wydajności systemów ( Computer benchmarks )
Motywacja (testowe wykonanie własnej aplikacji) LICZBA PROCESORÓW vs. WYDAJNOŚĆ  hardware performance counters

13 Klasyczne miary wydajności
MIPS Million Instructructions per Second 1 MIPS <-> DEC VAX11/780 IBM MIPS (S390/OS390) MFLOPS (Mflop/s) Million Floating Point Operations per Second Rpeak Rmax (Linpack) R własnej aplikacji

14 Cechy miar wydajności ---> HAV
napisane w językach programowania wysokiego poziomu (przenośność) reprezentacja dla wybranej klasy rzeczywistych zastosowań, łatwość modyfikacji (postęp w algorytmach, metodach optymalizacji, technologii) szeroki zakres testowanych elementów składowych systemu i współpracy z oprogramowaniem pomiary łatwe do realizacji akceptowane

15 Kategorie miar wydajności --> HAV
syntetyczne miary wydajności (podstawowe operacje) - Dhrystone i Whetstone jądra programowe (kernels) wybrane fragmenty rzeczywistych programów, m.in. Livermore Fortran Kernels i NAS Kernel Benchmark Program algorytmy - programy testowe, np. LINPACK aplikacje (kompletne) (fizyka, chemia lub wspomaganie zarządzania), np. Perfect Benchmarks, ParkBench, z rodziny SPEC, SAP, NotesBench i Baan specyfikacje - stanowią zbiór wymagań funkcjonalnych realizowanych przy dowolnej implementacji sprzętowej i programowej, np. miary z rodziny TPC

16 Miary syntetyczne i jądra programowe
Whetstone (1976) obliczenia numeryczne; wywołania funkcji z biblioteki matematycznej (np. sin(.), exp(.)); Algol i Pascal Dhrystone (1984) - zastosowania nienumeryczne stałoprzecinkowe (instr. warunkowe i wywołania procedur), systemy operacyjne, kompilatory, czy edytory; ADA i C Livermore Fortran Kernels Różnica między LFK Mflop/s i Rpeak Mflop/s !!

17 Jądra programowe, cd. NAS Kernels (Fortran) jądra programy
EP - generacja liczb pseudolosowych - mała komunikacja MG - obliczenia wielosiatkowe - duża komunikacja CG - met. gradientów sprzężonych - wartośći własne macierzy rzadkiej FT - cząstkowe równania różniczkowe met. FFT IS - sortowanie programy LU - równania liniowe met. trangulacji SP - równania liniowe macierzy gęstej BT - jak SP - met. blokową

18 Algorytmy: -- LINPACK macierz gęsta R Rpeak Mflop/s
DP Mflop/s (100x100) TPP Mflop/s (1000x1000) Rpeak Mflop/s Liczba operacji (n - liczba równań) Linpack Parallel Rmax Nmax N1/2 Rpeak

19 Przykładowe wyniki dla zestawu LINPACK

20 Linpack - cd.

21 Aplikacje: -- SPEC Organizacja niekomercyjna (1988) - miary dla komputerów systemów otwartych Trzy grupy robocze: Open Systems Group - miary dla UNIX, NT, VMS; najważniejsze z nich to CINT95 i CFP95; High Performance Computing Group -- ocena wydajności systemów przeznaczonych dla intensywnych obliczeń numerycznych dużej skali; Graphics Performance Characterization Group -- dla podsystemów graficznych oraz środowisk OpenGL i Xwindows. Podstawowe zestawy SPEC: CPU95 i CPU2000 GPC, SFS, web96/web99, jvm98

22 SPEC CPU95 Maszyna referencyjna SUN SPARCstation10/40

23 CPU95 - szczegóły ( średnia geometryczna miar )
„C” - component; „S” - system

24 CPU2000 ( średnia geom. miar )
CFP2000 chromodynamika kwantowa (F77) model dynamiki wody (F77) solwer wielosiatkowy 3D - pole potencjalne (F77) solwer dla równań parabolicznych i eliptycznych (F77) biblioteka graficzna w 3D (C) CFD (F90) rozpoznawanie obrazów - sieci neuronowe (C) propagacja fal sejsmicznych (C) przetwarzanie obrazów - identyfikacja twarzy (F90) chemia obliczeniowa (C) testowanie liczb pierwszych (F90) FEM - zderzenia (F90) projektowanie akceleratora (F77) rozchodzenie się zanieczyszczeń (F77) CINT2000 Kompresja danych (C) Projektowanie układów FPGA (C) Kompilator języka C (C) optymalizacja - minimalizacja (C) gra w szachy (C) Przetwarzanie języka naturalnego (C) raytracing (C++) przetwarzanie w języku Perl (C) teoria grup (C) Maszyna referencyjna SUN Ultra5/300MHz/256MB - wartości 100

25 Przykładowe wartości CPU95

26 Przykładowe wartości CPU2000

27 SPECint95

28 SPECfp95

29 SPEC2000

30 *Other brands and names are the property of their respective owners
SPECfp2000 Source: September 2001 *Other brands and names are the property of their respective owners

31 Aplikacje: SAP System do wspomagania zarządzania
Używany przez duże międzynarodowe koncerny ~15000 instalacji architektura klient-serwer model dwuwarstwowy model trzywarstwowy R/3 warstwy: danych aplikacji prezentacji Metryki: liczba użytkowników średni czas odpowiedzi < 2 s przepustowość konfiguracji (w SAPS) - liczba kroków dialogu/godz.

32 Opis modułów benchmarku SAP R/3

33 Przykładowa konfiguracja sprzętu dla SAP R/3
V2250 Database Server Dialog/Update Servers K380 Message Server 1 Database Server - V way, 16 GB - Oracle bit - HP-UX bit 9 Dialog/Update Servers - V way, 8GB - HP-UX 11.0 1 Message/Enqueue Server - K380, 6-way, 2GB - HP-UX 10.20 HP AutoRaids 18 HP AutoRaid Disk Systems HyperFabric Interconnect SAP 3.1H 6750 SD users 1.95 second response time 2,034,000 dialog steps/hr

34 Przykładowe wyniki SAP R/3 dla modułu SD

35 Przykładowe wyniki SAP R/3 - cd.
SD Users * Benchmark with R/3 v. 3 ** Benchmark with R/3 v. 4

36 Aplikacje: inne BaanIV BRU NotesBench Perfect Benchmark i Parkbench

37 Specyfikacje: - TPC Transaction Processing Council (San Jose 1988)
definiowanie zbioru wymagań funkcjonalnych (tj. specyfikacji) metodologia testów i koszt utrzymania systemu przez 5 lat dowolna implementacja na dowolnym sprzęcie TPC tworzą przedstawiciele sprzętu i oprogramowania - ISV, analitycy rynku (~50)

38 TPC-C On-line Transaction Processing, 1992
mieszanka transakcji zapisu, odczytu, usuwania i aktualizacji elementy: jednoczesne wykonywanie transakcji transakcje on-line i odroczone wiele sesji umiarkowane czasy systemowe i aplikacji znaczne wykorzystanie pamięci dyskowej i i/o transakcje ACID (atomicity, consistency, isolation durability) nierównomierny dostęp do danych - klucze pierwotne i wtórne wiele zróżnicowanych tablic współzawodnictwo w dostępie do danych i ich aktualizacji

39 TPC-C cd. Testy przekazane do TPC dla zatwierdzenia
dla produktów aktualnych lub dostępnych w ciągu 12 miesięcy rodzaje transakcji nowe zamówienie obciążenie kosztami zakupu wysyłka towaru status zamówienia monitorowanie zasobów

40 Metryki TPC-C tpmC (trans/min) dla nowych zamówień przy jednoczesnej obsłudze pozostałych $/tpmC ($ - koszt zakupu i utrzymania przez 5 lat) wymagana ostrożność przy interpretacji wyników

41 Przykłady miar

42 Przykładowe wyniki tpmC i $/tpmC
OLTP Performance (tpmC) Price/Perf. ($/tpmC) HP 9000 V2500(32) Oracle 6/30/99 HP 9000 V2250(16) Sybase 8/13/98 HP 9000 V2200(16) Oracle 2/28/99 SUN E6500(24) Sybase 1/31/99 IBM AS 400e S40(12) DB2 9/11/98 IBM RS/6000 S70(12) Oracle 1/21/99 Compaq GS140(8) Sybase 1/10/99 Database Avail. Date TPC-C results as of 3/2/99

43 TPC-D zakres DSS (Decision Support Side of Business)
wspieranie wspomagania decyzji, eksploracja danych (data mining) cel: pozyskanie danych z dużych baz (OLTP) agregacja - analiza - informacji zastosowanie: duża objętość danych niewielka liczba zapytań duża złożoność zapytań

44 Metryki TPC-D QppD (Query Processing Performance) wydajność obsługi zapytań, gdy cała moc skierowana do obsługi pojedynczego strumienia zapytań QthD (Query Throughput) liczba zapytań (w 1 godz) przetworzonych współbieżnie - wiele strumieni danych $/QphD ($/Queries per hour) QphD = (QppD x QthD)1/2 różne wielkości baz danych: 1GB, 10GB, 30GB, 100GB, 1TB, 3TB Baza tworzona przez DBGEN (w C jako element zestawu)

45 TPC-H i TPC-R TPC-H - ad hoc (TPC-D) bez znajomości istoty zapytań
TPC-R - predefiniowany zestaw zapytań Metryki: QphH lub QphR QthH lub QthR $/QphH lub $/QphR

46 Przykłady wartości

47 Wykonanie własnego programu równoległego Metrics for parallel computing
Czas wykonania Tp - parallel wall-clock time Ts - serial run time Przyspieszenie (Speedup): Ts - execution time for the fastest serial algorithm Efektywność (Efficiency) Pamięć operacyjna Monitoring Problems: fixed, variable size Ts ??

48 Równoległość w MD multiple jobs replicated data atom decomposition
force decomposition domain decomposition

49 Prawo Amdahl’a a1 - fraction of operations done with one processor a2 - fraction of operations done with average degree of parallelism k < p a3 - fraction of operations done with p degree of parallelism td - time required for data delay Ideal case

50 Zestawienie miar dla typowych zastosowań

51 Nowa tendencja poprzedni paradygmat: współczesny paradygmat:
informacja dla biznesu współczesny paradygmat: informacja jest biznesem

52 Proces transformacji biznesu
strategia biznesu infrastruktura biznesowa procesy budowy produktów procesy obsługi klienta wzajemne powiązania zawsze dostępna infrastruktura infrastruktura informatyczna doskonałość działania

53 systemy informatyczne
Potrzeby klientów systemy informatyczne biznes wzrost zysku obniżenie kosztów zarządzalność przewidywalność szybkość i czas reakcji skuteczność czas realizacji zgodność biznesu z IT lojalność klientów informacja jest kluczem wymaganie stałej dostępności bezpieczeństwo jest najważniejsze sieć partnerów elastyczna infrastruktura IT globalna wymiana informacji wzajemna integracja systemów IT

54 Tendencje rozwoju: architektury systemów informatycznych ukierunkowanych na usługi (service-centric computing) technologia informatyczna jest: zapewniana jako usługa … dostarczana jako usługa … zarządzana jako usługa … kupowana jako usługa … Serwisy, serwisy, serwisy .....

55 Zawsze dostępna infrastruktura IT always-on IT infrastructure
usługi środowisko internetowe Zawsze dostępna infrastruktura IT always-on IT infrastructure Szkielet połączeń zarządzanie usługami Świat systemów informatycznych ukierunkowanych na usługi (service-centric computing) będzie zbudowany na kręgosłupie, który tworzy zawsze dostępna infrastruktura internetowa (always-on internet infrastructure). Infrastruktura ta jest jedna z trzech części strategii naszej firmy, która ma zapewniać aby miliardy transakcji elektronicznych (e-services), realizowane z wykorzystaniem milionów urządzeń dostępowych (appliances) były realizowane na zawsze dostępnej infrastrukturze internetowej (always-on internet infrastructure). Usługą elektroniczną (e-service) jest aplikacja dostępna poprzez sieć, która odpowiada za realizację zadania, rozwiązanie problemu lub przeprowadzenie transakcji. Usługi te będą rozwijane dla rynku konsumenckiego i biznesowego wspólnie z naszymi Partnerami podczas gdy podstawowym strumieniem biznesu naszej firmy będzie dostarczanie technologii oraz rozwiązań systemowych potrzebnych do tworzenia i wdrażania tych usług. serwery pamięć

56 Tendencje rozwojowe procesorów ( elementy niezawodności )
Rekapitulacja

57 Elementy RAS RAS w odniesieniu do procesorów (RAS: Reliability, Availability, Serviceability) Wydajność: mała liczba (mniej elementów) versus duża liczba procesorów (większe możliwości redundancji) ECC w odniesieniu do pamięci podręcznej

58 Nomenklatura Technologia (typ) procesora - typ instrukcji i sposób realizacji CISC RISC EPIC Architektura - wykorzystuje daną technologię POWER IA-64 PA-RISC Procesor - realizacja sprzętowa architektury POWER2 Itanium PA-8500 Technologia półprzewodnikowa ECL CMOS GaAs

59 Producenci IBM (POWER x i POWER PC) SUN Microsystems (UltraSPARC x)
Compaq/DEC (Alpha 21x64) SGI (MIPS) Hewlett-Packard (PA RISC 8xxx) Intel (Pentium, IA-64)

60 Zbieżność wydajności

61 CISC W wyniku tego niemożliwe jest uzyskanie wysokiej wydajności.
Niełatwe jest również zwiększenie częstotliwości pracy, gdyż realizacja architektury wymaga dużej ilości materiału, co wiąże się z koniecznością odprowadzenia ciepła i podnosi koszty produkcji. Najczęściej technologia CISC realizowana jest w formie procesorów wieloukładowych. Ten typ technologii procesorowej charakterystyczny jest dla wcześniejszych rozwiązań, np. dla komputerów typu mainframe; jego elementy implementowane były w procesorach Intel Pentium oraz przez innych producentów (np. AMD, Cyrix). Obecnie technologia CISC wyraźnie traci na znaczeniu. Najwcześniej rozwinięta technologia CISC oznacza procesor o złożonej, obszernej, liście rozkazów różnej długości Różnice w długościach poszczególnych instrukcji mogą być znaczne, np. dla komputera VAX wahały się od 4 do kilkuset. Komplikują w wysokim stopniu analizę i optymalizację kodu i utrudniają uzyskanie równoległości na poziomie realizacji poszczególnych instrukcji.

62 Technologia RISC Zwielokrotnione jednostki funcjonalne - superskalarność, np. 200MHz, 4-drożny --> 800 Mflop/s Procesory jednoukładowe Rozbudowane bufory i rejestry; optymalizacja kolejności wykonywania obliczeń (out-of-order) organizacja przetwarzania skalarnego organizacja przetwarzania potokowego Duża pamięćpodręczna cache dla danych dla instrukcji L1 L2 Modyfikacja technologii półprzewodnikowej ścieżki miedziane

63 Rozwój procesorów RISC
Heurystyczne prawo Moore’a: 2 x w 18 mies.

64 Rozwój procesorów i układów pamięci

65 Rozwój procesorów IBM

66 Wykorzystanie PowerPC604e

67 Rozwój procesorów HP

68

69 Przykład PA RISC

70 Architektura IA-32 Pentium II/III

71 Techologia EPIC, architektura IA-64
Very Long Instruction Word; Cechy: przeglądanie instrukcji przed wykonaniem - technika predykcji wykorzystanie długich rozkazów stałej długości (nowy format 128 bitów zawierający 3 instrukcje) możliwość eliminacji rozgałęzień kodu - technika predykcji procesor ITANIUM system operacyjny: Win64 IA-64 Linux (projekt Trillian) Monterey 64 (IBM i SCO) HP-UX Modesto (Novell)

72 zunifukowana platforma powiekszony dostęp do aplikacji
Itanium Processor Family: zunifikowana architektura najwyższa elastyczność Efekt współpracy hp / intel Linux/ Win2000XP/ HP-UX Interoperability high volume Win 2000/XP hi-value hp-ux emerging Linux Itanium Architecture Linux Linux zunifukowana platforma powiekszony dostęp do aplikacji Windows HP-UX IA-32 PA-RISC zgodność binarna

73 Techologia EPIC, cd.

74 Procesory

75

76 Technologia firmy Intel
Wprowadzenie Wydajność jest najważniejsza Proces technologiczny Architektura Architektura 64 bitowa – procesor Itanium® 2 Architektura Intel® NetBurst™ Technologia hiperwątkowa Technologia mobilna Intel® Centrino™ Oprogramowanie i wsparcie rynku Doświadczenie w HPTC Intel Technology Poland Podsumowanie

77 Intel – Firma Technologiczna
Technologia i produkcja układów scalonych Architektury cyfrowych urządzeń komputerowych i komunikacyjnych

78 Prawo Moore’a Co dwa lata liczba tranzystorów podwaja się, dążąc ku mikroprocesorowi z miliardem tranzystorów

79 Prawo Moore’a obowiązuje
Ku miliardowi tranzystorów w 2007 roku Procesor Pentium® 4 55 milionów Procesor Pentium® III Procesor Pentium® II Procesor Pentium® Procesor 486™ DX Procesor 386™ 286 8086 8080 8008 4004

80 1000 razy cieńszy niż ludzki włos! 1200 razy cieńszy niż ludzki włos!
Najmniejsze, najszybsze tranzystory 90 nanometra (nm) Tranzystor 0,13 µm NMOS 50 nm Tranzystor 90 nm 70 nm 1000 razy cieńszy niż ludzki włos! 1200 razy cieńszy niż ludzki włos!

81 Rozwój tranzystorów jest coraz szybszy
Ogłoszono w czerwcu 2001 r. Produkcja: 2007 r. 20 nm 50 nm Tranzystor 50 nm w procesie 0,09 µm – produkcja w 2002 r. 30 nm Prototyp tranzystora 30 nm do procesu 65 nm – produkcja w 2005 r. 1,2 THz przy 0,85 V Prototyp tranzystora 20 nm do procesu 45 nm – produkcja w 2007 r. 1,45 THz przy 0,75 V Ogłoszono w grudniu 2000 r. Produkcja: 2005 r.

82 Ogłoszono w listopadzie 2001 r.
Kolejny rekord: Tranzystor 15 nm NMOS Ogłoszono w listopadzie 2001 r. Produkcja: 2009 r. 25 nm 15 nm 2,63 THz 82

83 Przejście na wafle 300 mm Marzec 2001 r.: 300 mm
Pierwsza w pełni funkcjonalna płyta 300 mm w technologii 0,13 µm Dwie fabryki produkują 300 mm wafle od 2002 r. Trzy kolejne będą gotowe do 2005 r.

84 Co daje transformacja produkcji
początek produkcji masowej – maj 2001 r. 6 fabryk w 2002 r. 200 mm prawie 2 razy więcej struktur na płytce niż w technologii 0,18 μm 300 mm prawie 2,5 raza więcej struktur na płytce niż w technologii 0,13 μm 200 mm 300mm 200mm WSPW (odpowiedniki 200 mm) F17 F22 D2 F11X 300 mm F20 D1C 300 mm I kw. II kw. III kw. IV kw. I kw. II kw. III kw. IV kw. 2001 2002 Wielkość produkcji

85 Architektura Itanium®

86 Zupełnie nowa architektura
Zaawansowane funkcje niezawodności Nowa architektura EPIC Przewidywanie Aparat spekulacji Wydajna jednostka zmiennoprzecinkowa Mnogość zasobów 64-bit instrukcje, rejestry & przestrzeń adresowa IA-32 Technologia RISC Nowe systemy operacyjne Technologia CISC

87 Format instrukcji procesora IA64

88 Technika predykcji

89 Instrukcje warunkowe

90 IA-64, cd. 733/800 MHz, 4MB cache L3 Errors corrected by processor (- process continues) Errors corrected by PAL, OS (- process continues) ECC and parity corrections Instruction level parallelism 6-way (6-drożny) 4 double precision operations/s 8 single precision operations/s 3.2 Gflop/s DP lub 6.4 Gflop/s SP 20 operacji/cykl DIV i SQRT realizowane programowo

91 Architektura Itanium®

92 Zupełnie nowa architektura
Zaawansowane funkcje niezawodności Nowa architektura EPIC Przewidywanie Aparat spekulacji Wydajna jednostka zmiennoprzecinkowa Mnogość zasobów 64-bit instrukcje, rejestry & przestrzeń adresowa IA-32 Technologia RISC Nowe systemy operacyjne Technologia CISC

93 64-Bity Czy to coś nowego? Czy to jest dobre czy złe?
IA-32 posiada 64-bit a nawet więcej 64-bitowa magistrala 64- bitowa jednostka zmiennoprzecinkowa 80-bitowe rejestry 64-bitowa jednostka stałoprzecinkowa 64/128-bity MMX™/XMM rejestry ale tylko 32-bity przestrzeni adresowej Procesor Itanium® ma 64-bitową przestrzeń adresowa ale to nie wszystko Jak wiele i jak szybko można przesłać dane jako: 32-bitowe paczki 64-bitowe paczki

94 64-bity przestrzeni adresowej
32-bity adresowania 1 cm wysokość CD 64-bity adresowania km odległość między ziemią a księżycem 64-bit 32-bit .

95 Wyzwania dla architektów
Garb sekwencyjnego podejścia Masowe zasoby niezbędne dla ILP Skoki sprawiają, że ILP jest skomplikowane Zależności pamięciowe limituje użycie ILP Wzrost opóźnienia to kolejny koszt ILP Ograniczone zasoby to kolejny problem Współdzielenie zasobów powoduje problemy Pętle sprawiają, że ILP zwiększa wielkość kodu i wiele innych ... Architektura Itanium® spełnia wszystkie te wyzwania!

96 EPIC (Explicit Parallel Instruction Computing)
kod Michael S.Schlansker, B.Ramakrishna Rau: EPIC: Explicit Parallel Instruction Computing; IEEE Computer, February 2000, pp.37-45 Kompilator Grupowanie instrukcji w paczki Instrukcyjna paczka (3 instr. w paczce) Do 6 instrukcji wykonywanych w jednym cyklu

97 Predykcja usuwa rozgałęzienia, umożliwia równoległe przetwarzanie
instr 1 instr 2 : instr 3 instr 4 jump instr 5 instr 6 instr 7 instr 8 cmpEQ a,b jump_zero if True if False instr 1 instr 2 : p1, p2 <- cmp(a==b) instr 5 instr 6 if (p2) instr 3 instr 4 if (p1) instr 7 instr 8 64 rejestrów predykcji Predykcja usuwa rozgałęzienia, umożliwia równoległe przetwarzanie

98 Architektura procesora Itanium®
64-bitowy model adresowania pamięci ILP - Instruction Level Parallelism (6-drożny) Large Register Files Automatyczny system rotacji stoku Predykcja Mechanizm kontroli pętli Zaawansowany mechanizm obsługi rozgałęzień Spekulacyjny mechanizm analizy i kontroli danych 64-bitowa jednostka stałoprzecinkowa 82-bitowa zaawansowana jednostka zmiennoprzecinkowa Wsparcie technologii MMX™

99 Diagram procesora Itanium® 2, czyli EPIC w rzeczywistości

100 Porównanie IA-32 i IA-64

101 Porównanie technologii

102 Inne projekty procesorów
Cruzoe (Transmeta) E2K (Elbrus) CMP (Chip Multiprocessor) SMT (Simultaneous Multithreaded Processor)

103 O czym mówiliśmy do tej pory ?
RAS ( technologia, procesy IT, wsparcie) Reliability Availability Serviceability Metryki wydajności dla systemów przemysłowych i komercyjnych Aplikacje – SPEC i SAP R/3 Specyfikacje – TPC-C, TPC-D/H/R Technologie procesorów – CISC, RISC, EPIC Technologia Intela


Pobierz ppt "Systemy wysokiej niezawodności ( High Availability Systems )"

Podobne prezentacje


Reklamy Google