Hurtownie i eksploracja danych

Slides:



Advertisements
Podobne prezentacje
Modelowanie przypadków użycia
Advertisements

Modelowanie klas i obiektów
mgr inż. Katarzyna Kaszuba Katedra Systemów Multimedialnych WETI PG
HURTOWNIE DANYCH DSDSDSDFGFDG.
OLAP budowa aplikacji analitycznych w MS SQL 2000 i Yukon
Wykład (12 godz): Jan Aleksander Wierzbicki Ćwiczenia ( godz):
Opracowanie zasad tworzenia programów ochrony przed hałasem mieszkańców terenów przygranicznych związanych z funkcjonowaniem dużych przejść granicznych.
Hurtownie Danych Mariusz Dołęga.
Propozycja metodyki nauczania inżynierii oprogramowania
Definicje operacji.
Koncepcja Geoprzestrzennego Systemu Informacji o Terenie Górniczym
Kierunki rozwoju technologii informatycznych: Hurtownie Danych
Specjalność: Metody i systemy wspomagania decyzji II
Specjalność Analiza danych 2009 Katedra Statystyki Instytut Zastosowań Matematyki.
Specjalność Analiza danych 2010 na kierunku IiE Katedra Statystyki Instytut Zastosowań Matematyki.
Specjalność: Metody i systemy wspomagania decyzji
Inżynieria Oprogramowania dla Fizyków
mgr inż. Marek Kamiński Katedra Inżynierii Oprogramowania WETI PG
Wykład 7 Wojciech Pieprzyca
Wykład 6 Wojciech Pieprzyca
Mgr inż. Marcin Kulawiak Katedra Systemów Geoinformatycznych, WETI PG Urodzony: r. Wykształcenie: 2006-studium doktoranckie ETI PG
Życiorys mgr inż. Rafał Mikołajczak Katedra Architektury Systemów Komputerowych WETI PG Urodzony: r. Wykształcenie: studia na kierunku.
mgr inż. Piotr Piotrowski Katedra Inżynierii Oprogramowania WETI PG
Jakość systemów informacyjnych (aspekt eksploatacyjny)
System eksploracji danych z wykorzystaniem dokumentów XML
Wzorce projektowe w J2EE
Projekt i implementacja aplikacji do zasilania bazy danych testowymi danymi Jacek Lis Promotor: prof. dr hab. inż. Włodzimierz KASPRZAK.
Typy systemów informacyjnych
WYŻSZA SZKOŁA INFORMATYKI STOSOWANEJ i ZARZĄDZANIA
Plan prezentacji informatyka + 1. Wprowadzenie 2. Systemy OLTP i OLAP
SYSTEM DYNAMICZNEJ ANALIZY JAKOŚCI SCENARIUSZY BIZNESOWYCH Łukasz Budnik.
Metadane w opisie hurtowni danych oraz procesie ETL
Punkt Informacyjny EUROPE DIRECT - Warszawa Działalność Punktu Informacyjnego EUROPE DIRECT – Warszawa Karolina Iwińska Konsultantka Punktu.
Moduł: Informatyka w Zarządzaniu
Zarządzanie informacją
Wybrane zagadnienia relacyjnych baz danych
1 Każdy obiekt jest scharakteryzowany poprzez: tożsamość – daje się jednoznacznie wyróżnić; stan; zachowanie. W analizie obiektowej podstawową strukturą
Bazy danych Microsoft access 2007.
dr Łukasz Murowaniecki T-109
Bazy danych, sieci i systemy komputerowe
Informatyczne Systemy Zarządzania dr inż. Andrzej Macioł
Komputerowe wspomaganie projektowania
Slajd 1© J.Rumiński Jacek Rumiński  Bazy danych Kontakt: Katedra Inżynierii Biomedycznej, pk. 106, tel.: , fax: ,
Systemy informatyczne
Zbiór danych zapisanych zgodnie z określonymi regułami. W węższym znaczeniu obejmuje dane cyfrowe gromadzone zgodnie z zasadami przyjętymi dla danego.
Slajd 1© J.Rumiński Jacek Rumiński  Bazy danych Kontakt: Katedra Inżynierii Biomedycznej, pk. 106, tel.: , fax: ,
Wykład nr 1 Wartość pieniądza w czasie Pomiar ryzyka
Ergonomia procesów informacyjnych
Transfer Wiedzy w Leśnym Centrum Informacji dr inż. Dorota Farfał Sękocin Stary 5 grudnia 2011 r.
Przetwarzanie informacji w procesie decyzyjnym
Systemy zarządzania przepływem pracy i systemy zarządzania procesami biznesowymi Karolina Muszyńska.
Informatyka – szkoła gimnazjalna – Scholaris - © DC Edukacja Tworzenie stron WWW w programie Microsoft FrontPage Informatyka.
BAZY DANYCH Microsoft Access Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i.
Badania operacyjne i teoria optymalizacji semestr zimowy 2015/2016
Hurtownia danych dla PSZ – realizacja CeSAR
BAZY DANYCH Microsoft Access Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i.
1 Hurtownie Danych – SAP BW Ćwiczenia prowadzone w ramach przedmiotu Hurtownie Danych Semestr letni 2005/2006 Marcin Gajewski Michał Wilbrandt.
1 Hurtownie Danych – SAP BW Ćwiczenia prowadzone w ramach przedmiotu Hurtownie Danych Semestr letni 2005/2006 Marcin Gajewski Michał Wilbrandt.
Zintegrowane systemy informatyczne
Zagadnienia transportowe Katedra Ekonomiki i Funkcjonowania Przedsiębiorstw Transportowych.
Konkursy i seminaria metodyczne dla nauczycieli informatyki.
Prof. dr hab. inż. Dorota Kuchta
Optymalizacja SAS OLAP Studio
Krzysztof Szymański, Krzysztof Leja Wydział Zarządzania i Ekonomii
{ Wsparcie informacyjne dla zarządzania strategicznego Tereshkun Volodymyr.
Specjalność: Finanse zatrudnienia
Systemy Informacji Prawnej
FACULTY OF ENGINEERING MANAGEMENT
Specjalność: Finanse zatrudnienia
Zapis prezentacji:

Hurtownie i eksploracja danych Jacek Rumiński Kontakt: Katedra Inżynierii Biomedycznej, pk. 106, tel.: 3472678, fax: 3461757, e-mail: jwr@eti.pg.gda.pl

Omówienie planu wykładów i ćwiczeń laboratoryjnych (harmonogram wykładów – Ruminski_J_Hurt.doc) Omówienie ogólnych zagadnień organizacyjnych

ZALICZENIE 100 punktów do zdobycia: 60 proj. + 2*20 kolokwia. Zalicza 51 punktów. 3+(61-70); 4 (71-80); 4+(81-90); 5 (91-95); 5+ (96-100).

Wprowadzenie do hurtowni danych Jacek Rumiński Kontakt: Katedra Inżynierii Biomedycznej, pk. 106, tel.: 3472678, fax: 3461757, e-mail: jwr@eti.pg.gda.pl

Książki: Podstawa: William Inmon, Building the Data Warehouse, 1993 – początek Hurtowni !!! Building the Data Warehouse, Third Edition by W.H. Inmon  ISBN:0471081302 John Wiley & Sons © 2002

Jarke Matthias Hurtownie danych. Podstawy organizacji i funkcjonowania        Książka ta jest tłumaczeniem publikacji „Fundamentals of Data Warehouses”, wydanej przez wydawnictwo Springer-Verlag. Porusza bardzo dynamicznie rozwijającą się tematykę, związaną z hurtowniami danych. Zagadnienia w niej zawarte dotyczą: • integracji danych; • wielowymiarowych agregacji; • aktualizacji hurtowni danych; • optymalizacji i przetwarzania zapytań; • zarządzania metadanymi; • jakości hurtowni danych; • projektowania hurtowni danych. Książka jest znakomitym wprowadzeniem do problematyki związanej z jakością i wykorzystaniem metadanych w kontekście hurtowni danych. Mogą z niej korzystać zarówno teoretycy, jak i praktycy zajmujący się tym tematem. O tym, jak cenna jest to publikacja może świadczyć fakt, że jej pierwsze oryginalne wydanie rozeszło się w ciągu niespełna roku. wydawnictwo: Wydawnictwa Szkolne i Pedagogiczne Spółka Akcyjna seria: Idee, metody i narzędzia informatyki wymiary: 23,3 x 16,3 x 1,2 cm ISBN: 83-02-08850-1

Wspomaganie podejmowania decyzji – DSS Hurtownie danych (ang. Data Warehouse) – organizacja danych dla potrzeb ich przetwarzania (pobieranie danych), a nie operacji transakcyjnych (dodawanie i aktualizacja danych). Eksploracja danych (ang. Data mining) – metody przetwarzania danych dla potrzeb uzyskiwania nowej wiedzy (ang. Knowledge Discovery), Eksploracja sieci (ang. Web mining) – eksploracja danych w otoczeniu sieci WWW – xml i inne.

Hurtownia to: - według twórcy pojęcia Williama Inmona w jego książce z 1993 roku Building the Data Warehouse: „A data warehouse is a subject-oriented, integrated, nonvolatile, and time-variant collection of data in support of management’s decisions.” Hurtownia danych jest tematyczną, zintegrowaną, niezmienną i określoną w czasie kolekcją danych wspomagającą podejmowanie decyzji w procesie zarządzania.

Hurtownia danych jest: tematyczną, zintegrowaną, niezmienną i określoną w czasie kolekcją danych wspomagającą podejmowanie decyzji w procesie zarządzania. Tematyczną W odróżnieniu od operacyjnych baz danych dane gromadzone są nie w kontekście aplikacji (np. ubezpieczenia na życie, ubezpieczenia samochodowe, ubezpieczenia mieszkaniowe, itp.) ale w kontekście tematycznym (np. klienci, dostawcy, sprzedawcy, itd.). Zintegrowaną Hurtownia danych zawiera bardzo dużo danych, często z wielu baz danych. Takie duże ilości danych wymagają odpowiednich narzędzi ich transformacji, czyszczenia, itp. Im większa ilość danych tym hipotetycznie większa pewność uzyskanych wniosków z analiz.

Niezmienną Dane operacyjne są najczęściej wielokrotnie wykorzystywane w postaci dostępu do kolejnych rekordów. Rekordy te podlegają zmianom. W hurtowni natomiast dla realizacji określonej operacji dane wczytywane są jako blok (np. wszystkie dane dla danej perspektywy czasowej) a następnie przetwarzane bez możliwości zmian danych. Zatem standardowo (istnieją bowiem odstępstwa) dane hurtowni nie podlegają zmianą, są więc danymi historycznymi. Określone w czasie Przetwarzane dane hurtowni są zawsze zdefiniowane z jakieś perspektywy czasowej (określone historycznie). Horyzont czasu określa własność danych zgromadzonych/przetwarzanych z hurtowni danych. Kolekcją danych Podstawą hurtowni jest oczywiście baza danych – budowanie schematu takiej bazy musi spełniać powyższe wymagania. Przykładowe schematy to schemat gwiazdy czy płatka śniegu.

Przeglądanie wielu tabel Nie Tak Duże zasoby danych OLTP vs. OLAP Typ przetwarzania OLTP OLAP Przeglądanie wielu tabel Nie Tak Duże zasoby danych Wysoki koszt przetwarzania Czas przetwarzania w funkcji rozmiaru bazy danych Denormalizacja? Modelowanie wielowymiarowe?

Demo – Hurtownie w zastosowaniach biomedycznych – dane DNA Demo.wmv