Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
OpublikowałIdzi Pasik Został zmieniony 10 lat temu
1
Akademia Górniczo-Hutnicza Skalowalny, komponentowy system zbierania i przechowywania danych pochodzących z monitorowania systemów rozproszonych Dominik Radziszowski Katedra Informatyki AGH Kraków 2007
2
Akademia Górniczo-Hutnicza Plan wystąpienia Wstęp Cele i teza pracy Bazowy model systemu Rozszerzenia modelu bazowego Badania eksperymentalne Podsumowanie i wnioski
3
Akademia Górniczo-Hutnicza Wstęp Powszechność systemów rozproszonych Potrzeba zbierania i przechowywania danych odnośnie ich działania Bardzo duża objętość danych pochodzących z różnych zasobów Wyzwanie dla twórców systemów zbierających i przechowujących dane pochodzące z monitorowania: –Uniwersalność – zdolności do przechowywania dowolnych, podlegających monitorowaniu danych oraz adaptowalności do ich zmienności –Skalowalność – możliwość zapewnienia odpowiedniej wydajności, pomimo wzrostu wielkości strumienia danych przyjmowanych przez system
4
Akademia Górniczo-Hutnicza Pożądane własności systemu Funkcjonalne Heterogeniczność monitorowanych zasobów Dynamiczne definiowanie zasobów i atrybutów Obsługa atrybutów złożonych i wielowartościowych oraz różnych typów danych Różne modele monitorowania (push, pull, tracing) oraz tryby (off-line i on-line) Uniwersalne interfejsy zapisu i odczytu danych Niezależność od domeny wykorzystania Własności środowisk komponentowych Własności uwarunkowane architektonicznie i implementacyjnie Niefunkcjonalne Wysoka dostępność Równoważenie obciążenia Reakcja na błędy Heterogeniczność węzłów Dynamiczna rekonfiguracja Skalowalność Efektywność
5
Akademia Górniczo-Hutnicza Teza pracy Możliwa jest konstrukcja komponentowego systemu zbierania i przechowywania danych pochodzących z monitorowania systemów rozproszonych, którego działanie jest samoadaptowalne do zmian zarówno rodzaju danych pochodzących z konkretnego zasobu jak i trybu ich zbierania, zapewniającego odpowiednią efektywność i skalowalność.
6
Akademia Górniczo-Hutnicza Bazowy model systemu
7
Akademia Górniczo-Hutnicza Koncepcja systemu SZiPD SZiPD Aplikacja prezentacyjna Zapis danych poprzez uniwer- salny interfejs. Wspólny protokół i format danych. Dostęp do danych poprzez uniwersalny interfejs dostępu. Wspólny model danych. Sensory monitorowanego zasobu Periodyczne odpytywanie, raportowanie oraz notyfikacja. Specyficzny protokół i format danych. SZiPD – System Zbierania i Przechowywania Danych Baza Danych Agent monitorujący Sensory monitorowanego zasobu Agent monitorujący Sensory monitorowanego zasobu Agent monitorujący ?:?: ogólny model danych dla systemów monitorujących uniwersalne interfejsy zapisu i dostępu do danych Interfejs zapisu Interfejs dostępu
8
Akademia Górniczo-Hutnicza Model danych SZiPD META-DANE WARTOŚCI Typ (Kind), Zasób (Resource), Atrybut (Attribute) –Prosty/Strukturalny –Wielowartościowy Meta-dane Podstawowe typy: – napis – liczba całkowita – liczba zmiennoprzecinkowa Wartości Pozwala na zapis praktycznie dowolych danych pochodzącej z monitorowania systemów rozproszonych – w szczególności z modeli CIM, SNMP, WBEM
9
Akademia Górniczo-Hutnicza Przykładowe dane Meta-dane Wartości
10
Akademia Górniczo-Hutnicza Koncepcje zapisu danych - atrybuty- wartości atrybutów - porcja danych Przekazywanie wartości wraz z całą strukturą atrybutów Przekazywanie dwuetapowe: - w pierwszym kroku konfigurowane są meta-dane - do przesyłania war- tości wykorzystywane są identyfikatory atrybutów Agent SZiPD Agent SZiPD Agent SZiPD Ustalenie struktury meta-danych Przekazywanie wartości zmniejszenie obciążenia kanałów transmisji danych zależy od proporcji wielkości danych i meta-danych faza ustalania struktury atrybutów pozwala wykryć niespójność struktury
11
Akademia Górniczo-Hutnicza Koncepcja pobierania danych -elementy drzewa zawierające meta-dane (zasoby, atrybuty) -elementy drzewa mające zostać rozszerzone - zbiór wartości atrybutów zapisanych w systemie SZiPD Operacja pobrania korzenia drzewa Operacja rozszerzenia wybranych liści drzewa o jeden poziom w dół Operacja pobrania zapisanych w systemie wartości dla wybranych liści drzewa Prezentacja danych Aplikacja prezentacyjna Przekazywanie tworzącej drzewo struktury meta- danych między aplikacją prezentacyjną, a systemem.
12
Akademia Górniczo-Hutnicza Bazowy model systemu SZiPD – M0 Technologie wykorzystane do implementacji: –Technologia komponentowa: Java, J2EE (Java 2 Enterprise Edition) –Serwer aplikacji: JBoss, BEA WebLogic –Baza danych: Oracle, PostgreSQL Pozytywnie zweryfikowano uzyskane własności funkcjonalne.
13
Akademia Górniczo-Hutnicza Optymalizacja modelu bazowego
14
Akademia Górniczo-Hutnicza Rozszerzenia modelu bazowego Cel: Zapewnienie odpowiedniej wydajności i skalowalności SZiPD Metoda: - wykorzystanie różnych technik optymalizacji i zwiększania wydajności systemów komponentowych - komponentowa budowa umożliwia niezależne strojone poszczególnych komponentów systemu oraz ich zastępowanie bardziej wydajnymi odpowiednikami
15
Akademia Górniczo-Hutnicza detekcja operacji najbardziej degradujących wydajność wprowadzenie grupowej operacji zapisu danych sposób obsługi meta-danych oraz odczyt danych nie zmienia się Optymalizacja modelu bazowego – M1 optymalizacja, klastrowanie, broker, partycjonowanie, adaptowalność
16
Akademia Górniczo-Hutnicza Klasteryzacja serwera aplikacji – M2 odpowiednia konfiguracje serwerów oraz rozmieszczenie komponentów nie wymagała zmian w implementacji komponentów Klaster - jest zbiorem komputerów - węzłów (ang. node), które realizują wspólny cel, widzianych z zewnątrz jako jeden spójny system. optymalizacja, klastrowanie, broker, partycjonowanie, adaptowalność
17
Akademia Górniczo-Hutnicza Wykorzystanie brokera komunikatów – M3 rozluźnienie zależności pomiędzy komponentami zwiększenie zrównoleglenia przetwarzania uniezależnienie zakończenia wykonywania operacji przez klienta od stopnia obciążenia bazy danych optymalizacja, klastrowanie, broker, partycjonowanie, adaptowalność
18
Akademia Górniczo-Hutnicza Partycjonowanie danych – M4 aplikacja świadoma partycjonowania współpraca z bazami danych nie wspierającymi partycjonowania Partycjonowa- nie danych polega na automatycznym rozpraszaniu danych (pochodzących z jednej lub wielu relacji) na wielu dyskach, znajdujących się w tym samym lub wielu węzłach (komputerach) sieci. optymalizacja, klastrowanie, broker, partycjonowanie, adaptowalność
19
Akademia Górniczo-Hutnicza Model hybrydowy – MH autorska koncepcja wykorzystania brokera komunikatów oraz partycjonowania danych mechanizm adaptowania trybu zapisu danych do wielkości strumienia danych (o konfigurowalnej charakterystyce) optymalizacja, klastrowanie, broker, partycjonowanie, adaptowalność
20
Akademia Górniczo-Hutnicza Badania eksperymentalne
21
Akademia Górniczo-Hutnicza Badania eksperymentalne - metodologia Metryki jakości (QoS): Czas odpowiedzi systemu (SRT), Stopa błędnie wykonanych operacji (ERR ): Metryki wydajności: Ilość transakcji na sekundę (TPS), Przepustowość systemu na sekundę (DTPS), Metoda: porównanie wartości parametrów wydajnościowych uzyskiwanych w punktach pracy Cel: porównanie własności zaproponowanych modeli Punkt pracy systemu jest taką konfiguracją symulowanego obciążenia konkretnej konfiguracji testowej (a więc modelu i elementów infrastruktury), przy której osiągane są najlepsze wartości parametrów wydajnościowych oraz zachowane zadane parametry jakościowe.
22
Akademia Górniczo-Hutnicza Badania eksperymentalne - środowisko Wydzielona instalacja 15 komputerów SUN Fire B100s Blade Server 5 jednostek zapisujących dane do SZiPD 4 instancje serwerów aplikacji 4 instancje serwerów bazy danych Solaris 9 BEA WebLogic 9.0 SUN JDK 1.5.04 Oracle 10g BEA WebLogic 9.0 JMS System operacyjny: Serwer Aplikacji J2EE: Wirtualna maszyna Java: Baza danych: Broker komunikatów:
23
Akademia Górniczo-Hutnicza Uzyskane wyniki – porównanie M0 i M1 Wykazano istotny wzrost wydajności wynikający z zastosowania komponentu do grupowego zapisu danych. M0 – model bazowy, M1 – model z komponentem do operacji grupowych Konfiguracja: 1 serwer aplikacji, 1 instancja bazy danych, stałe obciążenie
24
Akademia Górniczo-Hutnicza Uzyskane wyniki – porównanie M3, M4 i MH Zapis synchroniczny bez brokera (M4) jest wydajniejszy. Odpowiednio skonfigurowany MH gwarantuje podobną wydajność. Konfiguracja: 2 serwery aplikacji, 2 instancje bazy danych, stałe obciążenie
25
Akademia Górniczo-Hutnicza Uzyskane wyniki – porównanie M4 i MH Wykazano odporność modelu wykorzystującego broker (MH) na chwilowy wzrost wielkości strumienia danych. Konfiguracja: 4 serwery aplikacji, 2 instancje bazy danych
26
Akademia Górniczo-Hutnicza Uzyskane wyniki – porównanie M4 i MH Wykazano, że modele M4 i MH są skalowalne.
27
Akademia Górniczo-Hutnicza Podsumowanie
28
Akademia Górniczo-Hutnicza Osiągnięcia rozprawy Określono szczegółową listę wymagań dla systemów zbierających dane pochodzące z monitorowania. Zaproponowano model informacyjny dla takich systemów oraz stworzono ogólny obiektowy model danych oparty na koncepcji meta-danych. Zdefiniowano uniwersalne interfejsy dostępu do danych. Przedstawiono i zaimplementowano pięć różnych modeli SZiPD wykorzystujących: –klasteryzację serwerów aplikacji, –zwielokrotnienie instancji baz danych, –partycjonowanie danych, –komunikację asynchroniczną i kolejkowanie z wykorzystaniem brokera komunikatów, –autorską koncepcję modelu hybrydowego, który posiada zdolność adaptacji mechanizmów zapisu danych do wielkości strumienia danych.
29
Akademia Górniczo-Hutnicza Osiągnięcia rozprawy Zaproponowano, bazującą na koncepcji punktu pracy systemu, metodologię testów oraz kryteria ewaluacji. Opracowano środowisko uruchomieniowe oraz narzędziowe usprawniające wykonanie kilkuset testów. Wykazano przydatność architektury komponentowej do tworzenia skalowalnych systemów zbierania i przechowywania dużej ilość danych pochodzących z monitorowania systemów rozproszonych. Uzyskane rezultaty są ważne nie tylko w kontekście przedmiotowego systemu, mogą być interpretowane szerzej i zastosowane do optymalizacji innych systemów komponentowych intensywnie zapisujących dane.
30
Akademia Górniczo-Hutnicza Kierunki dalszych prac Zastosowanie SZiPD do zapisu danych pochodzących z monitorowania rzeczywistych źródeł danych. Rozbudowa mechanizmów adaptacji trybu zapisu danych oraz mechanizmów partycjonowania do aktualnego obciążenia bazy danych. Rozwinięcie opracowanej metodyki wyznaczania punktu pracy systemu oraz programów narzędziowych w celu stworzenia niezależnej aplikacji testującej wydajność systemów komponentowych.
31
Akademia Górniczo-Hutnicza Dziękuję za uwagę!
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.