Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Dane semistrukturalne Remigiusz Siudziński na podstawie: S.Abiteboul, P.Buneman, D,Suciu Dane w sieci www.

Podobne prezentacje


Prezentacja na temat: "Dane semistrukturalne Remigiusz Siudziński na podstawie: S.Abiteboul, P.Buneman, D,Suciu Dane w sieci www."— Zapis prezentacji:

1 Dane semistrukturalne Remigiusz Siudziński na podstawie: S.Abiteboul, P.Buneman, D,Suciu Dane w sieci www

2 Agenda l Kultura i architektura baz danych i Sieci l Podstawy składni l Typy podstawowe l Reprezentacja baz relacyjnych i obiektowych l Specyfikacja składni l OEM, ODMG, ACeDB l Terminologia dla grafów l Bibliografia

3 Wstęp, czyli motywator l Rozwój Sieci l Sieć jako źródło skomplikowanej informacji l Czytelność a strukturyzacja l Problemy: pobieranie weryfikowanie zarządzanie zmianami efektywne wykonywanie zapytań l Rozwiązania: hurtownie danych i systemy mediacyjne l Punkty widzenia dokumentu i bazy danych

4 Kultura baz danych l Relacje l Zależności l Języki zapytań l Mechanizmy kontroli spójności l Abstrakcyjny model na służbie użytkownika l Fizyczna reprezentacja ku lepszej wydajności

5 Kultura Sieci l Prosty uniwersalny standard wymiany informacji l plik identyfikowany i udostępniany przez URL Uniform Resource Locator możliwość powtórnego użycia linku l HTML (Hypertext Markup Language) formatowanie hiperłącza

6 Architektura baz danych a architektura aplikacji sieciowej l Architektura klient - serwer zapytanie -> przesłanie -> obliczenie -> odpowiedź l Podejście wielopowłokowe źródła danych, czyli serwery warstwa kliencka wiele warstw pośrednich middleware transformacje integracje wzbogacanie przykłady data warehouse mediator system, czyli tłumaczenie zapytań

7 Trzy poziomy abstrakcji w reprezentacji danych l Poziom fizyczny jak dane są przechowywane urządzenia fizyczne sposoby indeksowania l Poziom logiczny model poprawność kwerend dostęp do danych l Poziom zewnętrzny widoki interfejsy l Sieć - brak rozróżnienia w podejściu hipertekstowym

8 Cechy i zbliżenie obu podejść Sieć l ogólnoświatowy zasięg l standardy wymiany dokumntów l format prezentacji - HTML l dobre interfejsy użytkownika l nowy format XML do wymiany danych semistrukturalnych Bazy danych l reprezentacja i język zapytań wspierające dostęp do dużych ilości strukturalnych informacji l modele danych l integralność i spójność l nowy model danych semistrukturalnych (rozluźnienie struktur)

9 Niejednorodność danych l Ujednolicanie heterogenicznych struktur różnice na poz iomie myślowym róznice na poziomie logicznym l Przykłady kompromisów na poziomie logicznym XML NetCDF - wielowymiarowe tablice i relacyjne bazy ASN.1 - mediacja między warstwami sieci, dane bibliograficzne i genetyczne ACeBD - dane genetyczne prostego zwierzaka, bliskość modelu semistrukturalnego l Systemy bazodanowe a zapis w pliku tekstowym

10 Podstawy składni - przedstawienie graficzne nazwa telefon Remigiusz osoba nazwa telefon imięnazwisko KlaudiuszNowak osoba nazwa telefonwzrost Ausustyn

11 Podstawy składni l W Lispie wygląda to tak... { osoba: { nazwa: Remigiusz, telefon: , osoba: {nazwa: {imię: Klaudiusz, nazwisko: Nowak}, telefon: , } osoba: {nazwa: Ausustyn, telefon: , wzrost: 177} } l pary nazwa - wartość l powtarzanie nazw l rózne typy dla tych samych nazw l brakujące dane samoopisywanie serializacja

12 Typy podstawowe l Liczby l Ciągi znaków l Nazwy l Rozpoznawanie na podstawie składni l Inne typy wyznaczone przez ustaloną notację data: 11 maja 1999 czas: 11:11:11 gif: :MITE&.#.....

13 Reprezentacja baz relacyjnych l Schemat relacji R1 (k1,k2,k3), R2 (k3,k4) l Typy kolumn l Instancje relacji jako wiersze tabel relacja nazwa kolumny R1:k1k2k3 abc def R2:k3k4 xy

14 Reprezentacja baz relacyjnych {R1: {row: {k1: a, k2: b, k3: c}, row: {k1: d, k2: e, k3: f} }, R2: {row: {k3: x, k4: y} } R1 R2 row k1k2k3 k1k2k3 k4 abcdefxy

15 Reprezentacja bazy obiektowej &o1 &o2&o3 osoba dziecko matka dziecko imię wiek imiępokrewieństwo wiek imię kraj Maria44 Janek 13 JolaPolska siostramatka

16 Reprezentacja bazy obiektowej {osoba:&o1{imię:Maria, wiek:44, dziecko:&o2, dziecko:&o3 }, osoba:&o2{imię:Janek, wiek:13, pokrewieństwo:{matka:&o1, siostra:&o3} }, osoba:&o3{imię:Jola, kraj:Polska, matka:&o1 }

17 Reprezentacja bazy obiektowej &o1 a &o2 33 Oidy = identyfikatory obiektu nazwa wartość

18 Dane semistrukturalne - specyfikacja składni l Ssd-wyrażenia: ::= | oid | oid ::= typ prosty | ::= {nazwa:,...,nazwa: } l definicja oida: oid {l1: e1,..., lk: oid,..., en: ln}... l użycie oida wystąpienie w innej formie, np. ojciec: {imię: Jan, syn: oid} l poprawność każdy oid zdefiniowany dokładnie raz użycie poprzedzone definicją

19 OEM - model wymiany obiektów l Wymiana danych między aplikacjami l Cztery elementy nazwa oid typ (prosty lub złożony) wartość (... lub zbiór identyfikatorów obiektów) l Interpretacja graficzna - graf nazwy przypisane wierzchołkom

20 ODMG - obiektowy model danych class Stan {extent stany} { attribute string kod-stanu; attribute string nazwa-stanu; attribute Miasto stolica; relationship set miasta-w-stanie inverse Miasto::stan-dla-miasta; } class Miasto {extent miasta} { attribute string kod-miasta; attribute string nazwa-miasta; relationship Stan stan-dla-miasta inverse Stan::miasta-w-stanie; }

21 ODMG - obiektowy model danych l Schemat ODL - Object Definition language atrybuty pokrewieństwo l Wbudowane typy rekordy, zbiory, listy, tablice l Powiązanie deklaracji obiektów z bazą danych zasięg klas nazwy globalne l Języki związane z bazą danych konstrukcja/destrukcja ODMG/C++, ODMG/Jva

22 ODMG - reprezentacja danych {stany:{stan:&s1{kod-stanu:ID, nazwa-stanu:Idaho stolica:&m1, miasta-w-stanie:{Miasto: &m1, Miasto &m3,...} }, stan:&s2{kod-stanu:NE, nazwa-stanu:Nevada, stolica:&m2, miasta-w-stanie:{Miasto: &m2,...} } }, miasta: {miasto: &m1 {kod-miasta: BOI, nazwa-miasta: Boise,stan-dla-miasta: &s1}, miasto: &m2 {kod-miasta: CCN, nazwa-miasta: Carson,stan-dla-miasta: &s2}, miasto: &m3 {kod-miasta: MOC, nazwa-miasta: Moscow,stan-dla-miasta: &s1} }

23 ACeDB - schemat i dane l Schemat ?Ksiazkatytul UNIQUE Text autorzy Text rozdzialy Int UNIQUE Text jezyk UNIQUEangielski francuski inny data UNIQUE miesiac Int rok Int l Dane &ksiazka1tytulDane w sieci www autorzyAbiteboul Buneman Suciu rozdzialy1 Wprowadzenie 2 Skladnia dla danych jezykangielski l UWAGA: nazwy traktowane są równorzędnie z typami podstawowymi

24 ACeDB - drzewo l Schemat to drzewo z nieskończoną liczbą krawędzi l Dane to skończone poddrzewo drzewa schematu tytuł autorrozdziałjęzykdata... Dane w sieci www Abiteboul Buneman Suciu Wprowadzenie

25 ACeDB - reprezentacja pokrewieństwa ?Stankod-stanuUNIQUEText nazwa-stanuUNIQUEText stolicaUNIQUE?Miasto miasta-w-stanie?mastoXREFstan-dla-miasta ?Miastokod-miastaUNIQUEText nazwa-miastaUNIQUEText stan-dla-miasta?StanXREFmiasta-w-stanie &idkod-stanuID nazwa-stanuIdaho stolica&boi miasta-w-stanie&boi &moc... &boikod-miastaBOI nazwa-miastaBoise stan-dla-miasta&id

26 Terminologia dla ssd (grafów) l Graf (N,E), wierzchołki i krawędzie l graf skierowany każdej krawędzi odpowiada jej początek i koniec l ścieżka l korzeń wierzchołek, od którego istnieje ścieżka do każdego innego l cykl ścieżka zaczynająca się i kończąca w tym samym wierzchołku graf acykliczny l drzewo jak zdefiniować? Liście l DAG l etykiety w jakim modelu są przypisane wierzchołkom?

27 Bibliografia l OEM J.Hammer,... Information translation, mediation and Mosaic-based browsing in the Tsimmis system (95) S.Chawathe,... The Timmis project: Integration of heterogenous information sources (94) l modele semistrukturalne S.Abiteboul Querying semistructured data (97) P.Buneman Semistructured data (97) l NetCDF R.Rew,... The unidata netCDF: Software for scientific data access (90) l ASN.1 ISO 8824 Specification of abstraction syntax notation one (ASN.1) (87) l ACeDB J.Thierry-Mieg,... Syntactic definitions for the ACeDB data base manager (92)


Pobierz ppt "Dane semistrukturalne Remigiusz Siudziński na podstawie: S.Abiteboul, P.Buneman, D,Suciu Dane w sieci www."

Podobne prezentacje


Reklamy Google