Akademia Górniczo-Hutnicza Skalowalny, komponentowy system zbierania i przechowywania danych pochodzących z monitorowania systemów rozproszonych Dominik.

Slides:



Advertisements
Podobne prezentacje
Praca dyplomowa inżynierska
Advertisements

Migrating Desktop Podsumowanie projektu
Zastosowanie LDAP w obsłudze katalogów bibliotecznych
Architektura SAP R/3 Wybrane zagadnienia.
Sieci VLAN.
CORBA Łukasz Wnęk.
Microsoft Professional Developer Days 2004
ADAM Active Directory w trybie aplikacyjnym
Skalowalny algorytm estymacji ruchu dla systemów rozproszonych
Platformy na żądanie (ASP) element wdrożenia rozwiązania e-learning
SYSTEM ZARZĄDZANIA DANYMI PCSS 2003/2004 START.
Uwierzytelnianie i autoryzacja dostępu do portali
Artur Jonak empolis Polska Sp. z o.o.
Projektowanie Aplikacji Komputerowych
Architektura systemu Gra strategiczna „Strusia Jama”
Tomasz Smieszkoł - 15 stycznia
Proxy (WWW cache) Sieci Komputerowe
Platforma J2EE korporacyjny standard wytwarzania złożonych systemów informatycznych Autor: Jarosław Lis Warszawa, 2006r.
ETL – wymiana danych Michał Jabłonka
Enteprise Java Beans Emil Wcisło.
Wzorce projektowe w J2EE
Rozproszone bazy danych
Projekt urządzenia z interfejsem GPIB
Praca Inżynierska „Analiza i projekt aplikacji informatycznej do wspomagania wybranych zadań ośrodków sportowych” Dyplomant: Marcin Iwanicki Promotor:
Projekt i implementacja aplikacji do zasilania bazy danych testowymi danymi Jacek Lis Promotor: prof. dr hab. inż. Włodzimierz KASPRZAK.
SYSTEMY INFORMATYCZNE - Altamira, CRM i Remedy
Efektywna transmisja plików za pomocą TCP Piotr Kasprzyk Instytut Informatyki Politechniki Śląskiej.
Heterogeniczne procesory wielordzeniowe w urządzeniach audio
Wykład 4 Analiza i projektowanie obiektowe
Wykonawcy:Magdalena Bęczkowska Łukasz Maliszewski Piotr Kwiatek Piotr Litwiniuk Paweł Głębocki.
Budowa sieci mgr inż. Łukasz Dylewski
ZIS Tematyka prac magisterskich w Zakładzie Informatyki Stosowanej.
SYSTEM DYNAMICZNEJ ANALIZY JAKOŚCI SCENARIUSZY BIZNESOWYCH Łukasz Budnik.
PI w systemie monitoringu produkcji opon w Michelin Olsztyn
Topologie sieci lokalnych.
Dynamiczna rekonfiguracja układów FPGA
Zaprojektowanie i wykonanie prototypowego systemu obiegu dokumentów (workflow) dla Dziekanatu Wydziału z wykorzystaniem narzędzi open-source i cloud computing.
Artur Ulatowski Implementacja algorytmu k – najbliższych sąsiadów jako serwis internetowy Promotor: Dr hab. prof. WWSI Michał Grabowski.
Autor: Marcin Polak Promotor: dr inż. Paweł Kasprowski
1 Każdy obiekt jest scharakteryzowany poprzez: tożsamość – daje się jednoznacznie wyróżnić; stan; zachowanie. W analizie obiektowej podstawową strukturą
Opracowanie ćwiczeń dotyczących zapewniania niezawodności baz danych na przykładzie Oracle Opiekun : dr inż. Agnieszka Landowska Dyplomant : Tomasz Krzyżanowski.
Bazy danych, sieci i systemy komputerowe
GEO-INFO 6 System Informacji Przestrzennej
Skalowanie aplikacji JPA na przykładzie Oracle TopLink Grid
Robert Jędrychowski Politechnika Lubelska
„Żadna firma nie posiada ani czasu, ani środków niezbędnych do uczenia się wyłącznie na własnych błędach” James Harrington.
Systemy informatyczne
Clustering Technologia klastrowa - architektura łącząca serwery i urządzenia pamięci masowych w celu zwiększenia niezawodności, bezpieczeństwa i wydajności.
Zbiór danych zapisanych zgodnie z określonymi regułami. W węższym znaczeniu obejmuje dane cyfrowe gromadzone zgodnie z zasadami przyjętymi dla danego.
Zakres wykładu Kierunki rozwoju oprogramowania systemów rozproszonych Własności wybranych architektur - problemy badawcze Przykładowe obszary zastosowań.
niezawodności Z problemem jakości systemów informacyjnych wiąże się problem zapewnienia odpowiedniej niezawodności ich działania.
XML w serwisach webowych. Zapotrzebowanie na serwisy XML.
.NET i Bazy Danych Projekt: Wadim Grasza.
WSPM - Wirtualny System Plików Multimedialnych Igor BOKUN, Stanisław STRELNIK, Krzysztof ZIELIŃSKI Katedra Informatyki Akademia Górniczo-Hutnicza.
Wdrożenie Foglight w Urzędzie Dozoru Technicznego
Struktura systemu operacyjnego
Zintegrowany monitoring infrastruktury IT w Budimex
Bartosz Pawlak Wiktor Paliwoda Bezpieczeństwo Systemów Operacyjnych IMAP vs POP.
Temat: Porównanie technologii php,c# oraz javascript na przykładzie webaplikacji typu społecznościowy agregator treści Autor: Wojciech Ślawski.
Sławomir Staśkiewicz JBossAS i EJB 3.1 Sławomir Staśkiewicz
Architektura Rafał Hryniów. Architektura Wizja projektu systemu, którą dzielą twórcy Struktura komponentów systemu, ich powiązań oraz zasad i reguł określających.
Zarządzanie stanem w aplikacjach ASP.NET Elżbieta Mrówka-Matejewska
Komisja Torowa IGKM „Techniczne i środowiskowe aspekty rozwoju tramwaju i metra w Warszawie” System monitorowania zwrotnic tramwajowych sterowanych automatycznie.
Analiza, projekt i częściowa implementacja systemu wspomagania pracy Referatu Reprografii Promotor: mgr inż. Dariusz OlczykWykonała: Katarzyna Ściwiarska.
Testowanie wydajnościowe Metody testowania Apache Jmeter Serwer Jboss Baza danych PostgreSQL Testowanie wydajności odczytu z bazy danych Testowanie wydajności.
COBIT 5 Streszczenie dla Kierownictwa
Grzegorz Chodak Wykład
JavaBeans by Paweł Wąsala
Zapis prezentacji:

Akademia Górniczo-Hutnicza Skalowalny, komponentowy system zbierania i przechowywania danych pochodzących z monitorowania systemów rozproszonych Dominik Radziszowski Katedra Informatyki AGH Kraków 2007

Akademia Górniczo-Hutnicza Plan wystąpienia Wstęp Cele i teza pracy Bazowy model systemu Rozszerzenia modelu bazowego Badania eksperymentalne Podsumowanie i wnioski

Akademia Górniczo-Hutnicza Wstęp Powszechność systemów rozproszonych Potrzeba zbierania i przechowywania danych odnośnie ich działania Bardzo duża objętość danych pochodzących z różnych zasobów Wyzwanie dla twórców systemów zbierających i przechowujących dane pochodzące z monitorowania: –Uniwersalność – zdolności do przechowywania dowolnych, podlegających monitorowaniu danych oraz adaptowalności do ich zmienności –Skalowalność – możliwość zapewnienia odpowiedniej wydajności, pomimo wzrostu wielkości strumienia danych przyjmowanych przez system

Akademia Górniczo-Hutnicza Pożądane własności systemu Funkcjonalne Heterogeniczność monitorowanych zasobów Dynamiczne definiowanie zasobów i atrybutów Obsługa atrybutów złożonych i wielowartościowych oraz różnych typów danych Różne modele monitorowania (push, pull, tracing) oraz tryby (off-line i on-line) Uniwersalne interfejsy zapisu i odczytu danych Niezależność od domeny wykorzystania Własności środowisk komponentowych Własności uwarunkowane architektonicznie i implementacyjnie Niefunkcjonalne Wysoka dostępność Równoważenie obciążenia Reakcja na błędy Heterogeniczność węzłów Dynamiczna rekonfiguracja Skalowalność Efektywność

Akademia Górniczo-Hutnicza Teza pracy Możliwa jest konstrukcja komponentowego systemu zbierania i przechowywania danych pochodzących z monitorowania systemów rozproszonych, którego działanie jest samoadaptowalne do zmian zarówno rodzaju danych pochodzących z konkretnego zasobu jak i trybu ich zbierania, zapewniającego odpowiednią efektywność i skalowalność.

Akademia Górniczo-Hutnicza Bazowy model systemu

Akademia Górniczo-Hutnicza Koncepcja systemu SZiPD SZiPD Aplikacja prezentacyjna Zapis danych poprzez uniwer- salny interfejs. Wspólny protokół i format danych. Dostęp do danych poprzez uniwersalny interfejs dostępu. Wspólny model danych. Sensory monitorowanego zasobu Periodyczne odpytywanie, raportowanie oraz notyfikacja. Specyficzny protokół i format danych. SZiPD – System Zbierania i Przechowywania Danych Baza Danych Agent monitorujący Sensory monitorowanego zasobu Agent monitorujący Sensory monitorowanego zasobu Agent monitorujący ?:?: ogólny model danych dla systemów monitorujących uniwersalne interfejsy zapisu i dostępu do danych Interfejs zapisu Interfejs dostępu

Akademia Górniczo-Hutnicza Model danych SZiPD META-DANE WARTOŚCI Typ (Kind), Zasób (Resource), Atrybut (Attribute) –Prosty/Strukturalny –Wielowartościowy Meta-dane Podstawowe typy: – napis – liczba całkowita – liczba zmiennoprzecinkowa Wartości Pozwala na zapis praktycznie dowolych danych pochodzącej z monitorowania systemów rozproszonych – w szczególności z modeli CIM, SNMP, WBEM

Akademia Górniczo-Hutnicza Przykładowe dane Meta-dane Wartości

Akademia Górniczo-Hutnicza Koncepcje zapisu danych - atrybuty- wartości atrybutów - porcja danych Przekazywanie wartości wraz z całą strukturą atrybutów Przekazywanie dwuetapowe: - w pierwszym kroku konfigurowane są meta-dane - do przesyłania war- tości wykorzystywane są identyfikatory atrybutów Agent SZiPD Agent SZiPD Agent SZiPD Ustalenie struktury meta-danych Przekazywanie wartości zmniejszenie obciążenia kanałów transmisji danych zależy od proporcji wielkości danych i meta-danych faza ustalania struktury atrybutów pozwala wykryć niespójność struktury

Akademia Górniczo-Hutnicza Koncepcja pobierania danych -elementy drzewa zawierające meta-dane (zasoby, atrybuty) -elementy drzewa mające zostać rozszerzone - zbiór wartości atrybutów zapisanych w systemie SZiPD Operacja pobrania korzenia drzewa Operacja rozszerzenia wybranych liści drzewa o jeden poziom w dół Operacja pobrania zapisanych w systemie wartości dla wybranych liści drzewa Prezentacja danych Aplikacja prezentacyjna Przekazywanie tworzącej drzewo struktury meta- danych między aplikacją prezentacyjną, a systemem.

Akademia Górniczo-Hutnicza Bazowy model systemu SZiPD – M0 Technologie wykorzystane do implementacji: –Technologia komponentowa: Java, J2EE (Java 2 Enterprise Edition) –Serwer aplikacji: JBoss, BEA WebLogic –Baza danych: Oracle, PostgreSQL Pozytywnie zweryfikowano uzyskane własności funkcjonalne.

Akademia Górniczo-Hutnicza Optymalizacja modelu bazowego

Akademia Górniczo-Hutnicza Rozszerzenia modelu bazowego Cel: Zapewnienie odpowiedniej wydajności i skalowalności SZiPD Metoda: - wykorzystanie różnych technik optymalizacji i zwiększania wydajności systemów komponentowych - komponentowa budowa umożliwia niezależne strojone poszczególnych komponentów systemu oraz ich zastępowanie bardziej wydajnymi odpowiednikami

Akademia Górniczo-Hutnicza detekcja operacji najbardziej degradujących wydajność wprowadzenie grupowej operacji zapisu danych sposób obsługi meta-danych oraz odczyt danych nie zmienia się Optymalizacja modelu bazowego – M1 optymalizacja, klastrowanie, broker, partycjonowanie, adaptowalność

Akademia Górniczo-Hutnicza Klasteryzacja serwera aplikacji – M2 odpowiednia konfiguracje serwerów oraz rozmieszczenie komponentów nie wymagała zmian w implementacji komponentów Klaster - jest zbiorem komputerów - węzłów (ang. node), które realizują wspólny cel, widzianych z zewnątrz jako jeden spójny system. optymalizacja, klastrowanie, broker, partycjonowanie, adaptowalność

Akademia Górniczo-Hutnicza Wykorzystanie brokera komunikatów – M3 rozluźnienie zależności pomiędzy komponentami zwiększenie zrównoleglenia przetwarzania uniezależnienie zakończenia wykonywania operacji przez klienta od stopnia obciążenia bazy danych optymalizacja, klastrowanie, broker, partycjonowanie, adaptowalność

Akademia Górniczo-Hutnicza Partycjonowanie danych – M4 aplikacja świadoma partycjonowania współpraca z bazami danych nie wspierającymi partycjonowania Partycjonowa- nie danych polega na automatycznym rozpraszaniu danych (pochodzących z jednej lub wielu relacji) na wielu dyskach, znajdujących się w tym samym lub wielu węzłach (komputerach) sieci. optymalizacja, klastrowanie, broker, partycjonowanie, adaptowalność

Akademia Górniczo-Hutnicza Model hybrydowy – MH autorska koncepcja wykorzystania brokera komunikatów oraz partycjonowania danych mechanizm adaptowania trybu zapisu danych do wielkości strumienia danych (o konfigurowalnej charakterystyce) optymalizacja, klastrowanie, broker, partycjonowanie, adaptowalność

Akademia Górniczo-Hutnicza Badania eksperymentalne

Akademia Górniczo-Hutnicza Badania eksperymentalne - metodologia Metryki jakości (QoS): Czas odpowiedzi systemu (SRT), Stopa błędnie wykonanych operacji (ERR ): Metryki wydajności: Ilość transakcji na sekundę (TPS), Przepustowość systemu na sekundę (DTPS), Metoda: porównanie wartości parametrów wydajnościowych uzyskiwanych w punktach pracy Cel: porównanie własności zaproponowanych modeli Punkt pracy systemu jest taką konfiguracją symulowanego obciążenia konkretnej konfiguracji testowej (a więc modelu i elementów infrastruktury), przy której osiągane są najlepsze wartości parametrów wydajnościowych oraz zachowane zadane parametry jakościowe.

Akademia Górniczo-Hutnicza Badania eksperymentalne - środowisko Wydzielona instalacja 15 komputerów SUN Fire B100s Blade Server 5 jednostek zapisujących dane do SZiPD 4 instancje serwerów aplikacji 4 instancje serwerów bazy danych Solaris 9 BEA WebLogic 9.0 SUN JDK Oracle 10g BEA WebLogic 9.0 JMS System operacyjny: Serwer Aplikacji J2EE: Wirtualna maszyna Java: Baza danych: Broker komunikatów:

Akademia Górniczo-Hutnicza Uzyskane wyniki – porównanie M0 i M1 Wykazano istotny wzrost wydajności wynikający z zastosowania komponentu do grupowego zapisu danych. M0 – model bazowy, M1 – model z komponentem do operacji grupowych Konfiguracja: 1 serwer aplikacji, 1 instancja bazy danych, stałe obciążenie

Akademia Górniczo-Hutnicza Uzyskane wyniki – porównanie M3, M4 i MH Zapis synchroniczny bez brokera (M4) jest wydajniejszy. Odpowiednio skonfigurowany MH gwarantuje podobną wydajność. Konfiguracja: 2 serwery aplikacji, 2 instancje bazy danych, stałe obciążenie

Akademia Górniczo-Hutnicza Uzyskane wyniki – porównanie M4 i MH Wykazano odporność modelu wykorzystującego broker (MH) na chwilowy wzrost wielkości strumienia danych. Konfiguracja: 4 serwery aplikacji, 2 instancje bazy danych

Akademia Górniczo-Hutnicza Uzyskane wyniki – porównanie M4 i MH Wykazano, że modele M4 i MH są skalowalne.

Akademia Górniczo-Hutnicza Podsumowanie

Akademia Górniczo-Hutnicza Osiągnięcia rozprawy Określono szczegółową listę wymagań dla systemów zbierających dane pochodzące z monitorowania. Zaproponowano model informacyjny dla takich systemów oraz stworzono ogólny obiektowy model danych oparty na koncepcji meta-danych. Zdefiniowano uniwersalne interfejsy dostępu do danych. Przedstawiono i zaimplementowano pięć różnych modeli SZiPD wykorzystujących: –klasteryzację serwerów aplikacji, –zwielokrotnienie instancji baz danych, –partycjonowanie danych, –komunikację asynchroniczną i kolejkowanie z wykorzystaniem brokera komunikatów, –autorską koncepcję modelu hybrydowego, który posiada zdolność adaptacji mechanizmów zapisu danych do wielkości strumienia danych.

Akademia Górniczo-Hutnicza Osiągnięcia rozprawy Zaproponowano, bazującą na koncepcji punktu pracy systemu, metodologię testów oraz kryteria ewaluacji. Opracowano środowisko uruchomieniowe oraz narzędziowe usprawniające wykonanie kilkuset testów. Wykazano przydatność architektury komponentowej do tworzenia skalowalnych systemów zbierania i przechowywania dużej ilość danych pochodzących z monitorowania systemów rozproszonych. Uzyskane rezultaty są ważne nie tylko w kontekście przedmiotowego systemu, mogą być interpretowane szerzej i zastosowane do optymalizacji innych systemów komponentowych intensywnie zapisujących dane.

Akademia Górniczo-Hutnicza Kierunki dalszych prac Zastosowanie SZiPD do zapisu danych pochodzących z monitorowania rzeczywistych źródeł danych. Rozbudowa mechanizmów adaptacji trybu zapisu danych oraz mechanizmów partycjonowania do aktualnego obciążenia bazy danych. Rozwinięcie opracowanej metodyki wyznaczania punktu pracy systemu oraz programów narzędziowych w celu stworzenia niezależnej aplikacji testującej wydajność systemów komponentowych.

Akademia Górniczo-Hutnicza Dziękuję za uwagę!