Sieć CAN (Content Aware Network) Andrzej Bęben, Politechnika Warszawska
Plan prezentacji Wprowadzenie Sieć CAN Prototyp sieci CAN Architektura Mechanizmy i algorytmy Prototyp sieci CAN Sieć eksperymentalna PI CAN Podsumowanie
Wprowadzenie (1) Sieć CAN (Content Aware Network) zaprojektowana do efektywnego dostarczania treści multimedialnych (sieć post-IP) zaimplementowana w Systemie IIP jako jedna z trzech Równoległych Sieci Internet opracowana przez 6 zespołów Politechnika Warszawska Instytut Informatyki Teoretycznej i Stosowanej Politechnika Wrocławska Poznańskie Centrum Superkomputerowo-Sieciowe Instytut Łączności Politechnika Śląska
Wprowadzenie (2) Motywacja dla sieci CAN: Przekaz treści multimedialnych, tj. filmy wideo, programy telewizyjne i radiowe, stanowi obecnie około 70% ruchu w sieci Internet Sieć Internet nie była projektowana do przekazu treści z czego wnikają główne ograniczenia: brak jednolitego systemu identyfikatorów treści prowadzący do ograniczenia dostępności treści dostęp do treści wymaga znajomości jej fizycznej lokalizacji, tzn. adresu serwera przechowującego treść (komunikacja w sieci Intertnet wymaga znajomości adresów IP) sieć jest „nieświadoma” przesyłanej treści – co prowadzi do wielokrotnego przekazu tej samej treści i braku możliwości wykorzystania mechanizmów wspomagających połączenia multicast przechowywanie replik popularnej treści w pamięci podręcznej węzłów wybór serwera oraz ścieżek pomiędzy serwerem treści a użytkownikiem. 4
Sieć CAN (1) Cel: Zaprojektowanie sieci PI CAN, która jest zorientowana na dostarczanie treści od wydawcy do użytkownika Metoda: Efektywne dostarczenie treści jest możliwe dzięki wiedzy o: lokalizacji serwerów na których są dostępne repliki treści żądanej przez użytkownika wymaganiach dotyczących przekazu treści, tj. usługa sieciowa, wymagany poziom jakości obsługi, przepływność, dopuszczalny poziom strat pakietów aktualnym obciążeniu serwerów warunkach ruchowych panujących w sieci Co jest potrzebne? Nowa architektura sieci, w której informacja o treści, jej lokalizacji jest częścią sieci -> Content Aware Network vel. Information Centric Network Nowe mechanizmy wspomagające przekaz treści 5
Rejestruje treść w sieci PI CAN Sieć PI CAN (2) Podstawowe procesy w sieci PI CAN: Publikowanie treści Wyszukanie treści i przygotowanie sieci Pobranie treści Wyszukiwanie dostępnych replik Wybór najlepszego serwera i ścieżki sieci Żądanie treści Adres serwera Rejestruje treść w sieci PI CAN Wydawca Udostępnia treść na serwerach Pobranie treści Użytkownik Przekaz pakietów Przygotowanie sieci 6
Sieć PI CAN (3) Architektura sieci PI CAN
Mechanizmy i algorytmy sieci PI CAN Identyfikator treści Wyszukiwanie i lokalizacja treści Zbierania wiedzy o stanie sieci i serwerach: Routing wielościeżkowy Stan obciążenia serwerów Proces decyzyjny Przekaz treści – węzły CAFE
Identyfikator treści (CID) CID (Content ID) pełni rolę adresu, za pomocą którego użytkownik oraz system identyfikuje dostępne obiekty Wymagania: unikalny w całej sieci niezależny do lokalizacji treści wspierający łatwe wyszukiwanie treści brak znaczenia semantycznego Rozwiązanie przyjęte w PI CAN 128-bitowy identyfikator bez wewnętrznej struktury, generowany za pomocą funkcji MD5 (na podstawie zawartości) lub funkcji GUID
Wyszukiwanie i lokalizacja treści Wyszukiwanie treści jest realizowane za pomocą algorytmu COLOCAN (COntent LOcalisation for CAN), który tworzy rozproszoną bazę danych przechowywaną w węzłach sieci CAN Algorytm COLOCAN bazuje na idei algorytmów DHT, w którym proces wyszukiwania węzła przechowującego szukany rekord wykorzystuje strukturę drzewa binarnego Złożoność algorytmu: Maksymalnie O(log N) przekazanych zapytań w sieci N węzłów sterujących sieci PI CAN
Proces decyzyjny Proces decyzyjny jest odpowiedzialny za wybór serwera oraz ścieżki dostarczania treści od serwera do użytkownika biorąc pod uwagę wiedzę o treści, stanie serwerów i warunkach panujących w sieci: Algorytm decyzyjny w sieci PI CAN wykorzystuje ranking dostępnych rozwiązań, tj. par <serwer, ścieżka> oparty na analizie wielokryterialnej używającej poziomów odniesienia Proces decyzyjny jest inicjowany dla każdego żądania i zwraca „najlepszą” parę <serwer, ścieżka> z dostępnych rozwiązań Rozwiązanie to umożliwia równoważenie obciążenia serwerów i sieci
Zbierania wiedzy o stanie sieci i serwerach: Wiedza o stanie sieci i serwerów jest uzyskiwana z: Protokołu rutingu wielościeżkowego Międzydomenowy, wielokryterialny, wielościeżkowy Systemu zarządzania domeną Systemu monitorowania stanu serwerów
Przekaz treści – węzły CAF Węzły CAF przesyłają pakiety na podstawie listy kluczy przekazu zawartej w nagłówku pakietu. Opracowana metoda przekazu: wykorzystuje ideę rutingu źródłowego na poziomie domen umożliwia wykorzystanie wielu ścieżek pozwala wybrać drogę przekazu dla każdego żądania treści pozwala zminimalizować tablice routingu (klucze są lokalne) pozwala zastosować zaawansowane przetwarzanie pakietów w węzłach
Prototyp sieci CAN (1) Węzły sieci CAN zostały zaimplementowane jako węzły wirtualne systemu IIP na trzech platformach: XEN rozwiązanie programowe EzAppliance Przekaz danych realizowany sprzętowo Sterowanie realizowane programowo NetFPGA
Prototyp sieci CAN (2) Sieć CAN została zintegrowana z 3 aplikacjami: HomeNet Media - domowe centrum multimediów integracja lokalnych i zewnętrznych źródeł treści personalizowane profile użytkowników Rozproszone Muzeum Wirtualne interaktywne obiekty 3D pobieranie progresywne Cyfrowa Biblioteka Pacjenta jednolity dostęp i wyszukiwanie rozproszonych danych medycznych udostępnianie danych medycznych zamkniętym grupom użytkowników, np. lekarzom, rodzinie
Sieć eksperymentalna CAN Sieć CAN: jest zbudowana z 9 węzłów CAN zlokalizowanych w 6 ośrodkach PW, IŁ, PCSS, IITiS, PWr oraz AGH połączonych przez PL-LAB każdy węzeł pełni rolę węzła dostępowego, szkieletowego lub serwera treści Umożliwia przeprowadzenie testów funkcjonalnych oraz wydajnościowych związanych z publikowaniem i pobieraniem treści
Podsumowanie Sieć CAN zakłada nową architekturę (rozwiązanie post-IP) specjalizowaną dla przekazu treści: Ujednolicony dostęp do treści identyfikatory niezależne od lokalizacji efektywne algorytmy wyszukiwania informacji o lokalizacji treści Mechanizmy i algorytmy sterowania siecią uwzględniające warunki panujące w sieci oraz obciążenie serwerów Nowa metoda przekazu treści umożliwiająca wybór ścieżek dostarczania treści dla każdego żądania Zaimplementowany prototyp, integracja z aplikacjami oraz badania symulacyjne oraz eksperymenty przeprowadzone w sieci testowej potwierdziły efektywność sieci PI CAN w porównaniu do obecnie stosowanych modeli dystrybucji treści, np. CDN Rozwiązanie było prezentowane na wielu wystawach (CeBIT2013, ITC 2012, KST 2012, FIA 2011) oraz publikacjach konferencyjnych