Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Slajd 1© J.Rumiński Jacek Rumiński  Hurtownie i eksploracja danych Kontakt: Katedra Inżynierii Biomedycznej, pk. 106, tel.: 3472678, fax: 3461757, e-mail:

Podobne prezentacje


Prezentacja na temat: "Slajd 1© J.Rumiński Jacek Rumiński  Hurtownie i eksploracja danych Kontakt: Katedra Inżynierii Biomedycznej, pk. 106, tel.: 3472678, fax: 3461757, e-mail:"— Zapis prezentacji:

1 slajd 1© J.Rumiński Jacek Rumiński  Hurtownie i eksploracja danych Kontakt: Katedra Inżynierii Biomedycznej, pk. 106, tel.: , fax: ,

2 slajd 2© J.Rumiński  Omówienie planu wykładów i ćwiczeń laboratoryjnych (harmonogram wykładów – Ruminski_J_Hurt.doc )  Omówienie ogólnych zagadnień organizacyjnych

3 slajd 3© J.Rumiński  ZALICZENIE  100 punktów do zdobycia:  60 proj. + 2*20 kolokwia.  Zalicza 51 punktów.  3+(61-70); 4 (71-80); 4+(81-90); 5 (91-95); 5+ (96-100).

4 slajd 4© J.Rumiński Jacek Rumiński Wprowadzenie do hurtowni danych Kontakt: Katedra Inżynierii Biomedycznej, pk. 106, tel.: , fax: ,

5 slajd 5© J.Rumiński Książki: 1.Podstawa: William Inmon, Building the Data Warehouse, 1993 – początek Hurtowni !!! 2.Building the Data Warehouse, Third Edition by W.H. Inmon ISBN: John Wiley & Sons © 2002John Wiley & Sons

6 slajd 6© J.Rumiński Jarke Matthias Hurtownie danych. Podstawy organizacji i funkcjonowania Książka ta jest tłumaczeniem publikacji „Fundamentals of Data Warehouses”, wydanej przez wydawnictwo Springer-Verlag. Porusza bardzo dynamicznie rozwijającą się tematykę, związaną z hurtowniami danych. Zagadnienia w niej zawarte dotyczą: integracji danych; wielowymiarowych agregacji; aktualizacji hurtowni danych; optymalizacji i przetwarzania zapytań; zarządzania metadanymi; jakości hurtowni danych; projektowania hurtowni danych. Książka jest znakomitym wprowadzeniem do problematyki związanej z jakością i wykorzystaniem metadanych w kontekście hurtowni danych. Mogą z niej korzystać zarówno teoretycy, jak i praktycy zajmujący się tym tematem. O tym, jak cenna jest to publikacja może świadczyć fakt, że jej pierwsze oryginalne wydanie rozeszło się w ciągu niespełna roku. wydawnictwo: Wydawnictwa Szkolne i Pedagogiczne Spółka Akcyjna seria: Idee, metody i narzędzia informatyki wymiary: 23,3 x 16,3 x 1,2 cm ISBN:

7 slajd 7© J.Rumiński Wspomaganie podejmowania decyzji – DSS -Hurtownie danych (ang. Data Warehouse) – organizacja danych dla potrzeb ich przetwarzania (pobieranie danych), a nie operacji transakcyjnych (dodawanie i aktualizacja danych). -Eksploracja danych (ang. Data mining) – metody przetwarzania danych dla potrzeb uzyskiwania nowej wiedzy (ang. Knowledge Discovery), -Eksploracja sieci (ang. Web mining) – eksploracja danych w otoczeniu sieci WWW – xml i inne.

8 slajd 8© J.Rumiński Hurtownia to: - według twórcy pojęcia Williama Inmona w jego książce z 1993 roku Building the Data Warehouse : „ A data warehouse is a subject-oriented, integrated, nonvolatile, and time-variant collection of data in support of management’s decisions.” Hurtownia danych jest tematyczną, zintegrowaną, niezmienną i określoną w czasie kolekcją danych wspomagającą podejmowanie decyzji w procesie zarządzania.

9 slajd 9© J.Rumiński Hurtownia danych jest: - tematyczną, - zintegrowaną, - niezmienną -i określoną w czasie -kolekcją danych -wspomagającą podejmowanie decyzji w procesie zarządzania. Tematyczną W odróżnieniu od operacyjnych baz danych dane gromadzone są nie w kontekście aplikacji (np. ubezpieczenia na życie, ubezpieczenia samochodowe, ubezpieczenia mieszkaniowe, itp.) ale w kontekście tematycznym (np. klienci, dostawcy, sprzedawcy, itd.). Zintegrowaną Hurtownia danych zawiera bardzo dużo danych, często z wielu baz danych. Takie duże ilości danych wymagają odpowiednich narzędzi ich transformacji, czyszczenia, itp. Im większa ilość danych tym hipotetycznie większa pewność uzyskanych wniosków z analiz.

10 slajd 10© J.Rumiński Niezmienną Dane operacyjne są najczęściej wielokrotnie wykorzystywane w postaci dostępu do kolejnych rekordów. Rekordy te podlegają zmianom. W hurtowni natomiast dla realizacji określonej operacji dane wczytywane są jako blok (np. wszystkie dane dla danej perspektywy czasowej) a następnie przetwarzane bez możliwości zmian danych. Zatem standardowo (istnieją bowiem odstępstwa) dane hurtowni nie podlegają zmianą, są więc danymi historycznymi. Określone w czasie Przetwarzane dane hurtowni są zawsze zdefiniowane z jakieś perspektywy czasowej (określone historycznie). Horyzont czasu określa własność danych zgromadzonych/przetwarzanych z hurtowni danych. Kolekcją danych Podstawą hurtowni jest oczywiście baza danych – budowanie schematu takiej bazy musi spełniać powyższe wymagania. Przykładowe schematy to schemat gwiazdy czy płatka śniegu.

11 slajd 11© J.Rumiński OLTP vs. OLAP Denormalizacja? Modelowanie wielowymiarowe? Typ przetwarzania OLTPOLAP Przeglądanie wielu tabel NieTak Duże zasoby danych NieTak Wysoki koszt przetwarzania NieTak Czas przetwarzania w funkcji rozmiaru bazy danych NieTak

12 slajd 12© J.Rumiński Demo – Hurtownie w zastosowaniach biomedycznych – dane DNA Demo.wmv


Pobierz ppt "Slajd 1© J.Rumiński Jacek Rumiński  Hurtownie i eksploracja danych Kontakt: Katedra Inżynierii Biomedycznej, pk. 106, tel.: 3472678, fax: 3461757, e-mail:"

Podobne prezentacje


Reklamy Google