Wykład 6 Wojciech Pieprzyca

Slides:



Advertisements
Podobne prezentacje
HURTOWNIE DANYCH DSDSDSDFGFDG.
Advertisements

przetwarzaniu informacji
Badania operacyjne. Wykład 1
Bazy danych zastosowania i skutki Prentice Hall8.2 O czym będzie Elektroniczna przechowalnia informacji: podstawy baz danych Nieco dalej: Systemy.
Nowa Jakość kontroli w biznesie Projekt: Stworzenie e- usługi w postaci systemu księgowo-kadrowego on-line przez MGA Sp. z o.o. w Toruniu jest współfinansowany.
Komponenty bazy danych Baza danych Jest to uporządkowany zbiór powiązanych ze sobą danych charakterystycznych dla pewnej klasy obiektów lub zdarzeń,
METODOLOGIA W INFORMATYCE
Hurtownie Danych Mariusz Dołęga.
Opracowanie studium przypadku w SAS ETL Studio
Kierunki rozwoju technologii informatycznych: Hurtownie Danych
Specjalność Analiza danych 2009 Katedra Statystyki Instytut Zastosowań Matematyki.
Specjalność Analiza danych 2010 na kierunku IiE Katedra Statystyki Instytut Zastosowań Matematyki.
Systemy informatyczne zarządzania
ETL – wymiana danych Michał Jabłonka
Wykład 7 Wojciech Pieprzyca
Wykład 5 Wojciech Pieprzyca
System eksploracji danych z wykorzystaniem dokumentów XML
Rozproszone bazy danych
Typy systemów informacyjnych
IPscore - narzędzie do wyceny wartości patentów
Lider rynku Źródło: The OLAP Report Źródło: Gartner Group
Wykład 2 Cykl życia systemu informacyjnego
Business Intelligence jako narzędzie do walki z praniem brudnych pieniędzy Tomasz Matysik Kołobrzeg,
WYŻSZA SZKOŁA INFORMATYKI STOSOWANEJ i ZARZĄDZANIA
Produkujesz, sprzedajesz, zarządzasz? Zyskaj przewagę! Uniwersytet Ekonomiczny Wrocław, 10 czerwca 2008 Kontrola i analiza procesów biznesowych Mateusz.
Prezentacja funkcjonalności dziennika e-klasa
1 PREZENTACJA FUNKCJONALNOŚCI DZIENNIKA UCZNIA Moduł Dyrektora ZAPRASZAMY ZAPRASZAMY O&S Computer-Soft ul. Żwirki i Wigury 8-12, Wałbrzych, woj.
Plan prezentacji informatyka + 1. Wprowadzenie 2. Systemy OLTP i OLAP
Metadane w opisie hurtowni danych oraz procesie ETL
Bazy danych rezydujące w pamięci operacyjnej komputera (in-memory)
Sieciowe Systemy Operacyjne
Bazy danych.
InTouch.
Moduł: Informatyka w Zarządzaniu
Wybrane zagadnienia relacyjnych baz danych
dr Łukasz Murowaniecki T-109
1 Każdy obiekt jest scharakteryzowany poprzez: tożsamość – daje się jednoznacznie wyróżnić; stan; zachowanie. W analizie obiektowej podstawową strukturą
Planowanie przepływów materiałów
dr Łukasz Murowaniecki T-109
Bazy danych, sieci i systemy komputerowe
1. Współczesne generacje technologii
Medical Intelligence – jak można wykorzystać potencjał danych zawartych w bazie HIS? Piotr Stępniak Konsultant Naukowy, Transition Technologies S.A.
NASZE B2B B liżej wspólnego B iznesu. Tematy :  Konsorcjum Elmega – o nas  Projekt B2B  Założenia platformy SII  Praktyczne zastosowania SII  Korzyści.
Informatyczne Systemy Zarządzania dr inż. Andrzej Macioł
Moduł I Definiowanie dziedzin, celów, wskaźników strategicznych i usług publicznych oraz prognoz finansowych i raportów.
Podsystem Business Intelligence
Temat 4: Funkcje Systemu Zarządzania Bazą Danych (SZBD)
System Zarządzania Bazą Danych
Szkolenia E-Learning SIMP Consulting Stanisław Płaskowicki Dorota Płaskowicka.
Systemy Business Intelligence – warunki użytkowania Halina Tańska Wydział Matematyki i Informatyki Uniwersytet Warmińsko-Mazurski „e-commerce” Olsztyn.
Systemy informatyczne
Systemy kontroli wersji
ENOVA dla WODOCIĄGÓW I KANALIZACJI System Zarządzania klasy ERP NOWOCZESNE, SPECJALSTYCZNE OPROGRAMOWANIE, WSPOMAGAJĄCE ZARZĄDZANIE I OBSŁUGĘ.
System Informowania Kierownictwa – nowoczesne narzędzie wspomagające uzyskanie przewagi konkurencyjnej Piotr Bączek – Project.
Hurtownie i eksploracja danych
XML w bazach danych.
Transfer Wiedzy w Leśnym Centrum Informacji dr inż. Dorota Farfał Sękocin Stary 5 grudnia 2011 r.
Dane – informacje - wiadomości Kodowanie danych i problem nadmiarowości.
Przetwarzanie informacji w procesie decyzyjnym
Waldemar Bartyna 1 Programowanie zaawansowane LINQ to XML.
Systemy Baz Danych Wykład 1
BAZY DANYCH MS Access.
Architektura Rafał Hryniów. Architektura Wizja projektu systemu, którą dzielą twórcy Struktura komponentów systemu, ich powiązań oraz zasad i reguł określających.
STEROWANIE MONITORING ARCHIWIZACJA ROZWIĄZANIA INFORMATYCZNE W GALWANIZERNI – APLIKACJA KOMPUTEROWA DO ZARZĄDZANIA PROCESEM PRODUKCYJNYM.
Zintegrowane systemy informatyczne
Opracowanie studium przypadku w SAS ETL Studio Systemy baz danych i hurtowni danych Ludmiła Binek Katarzyna Rafalska
{ Wsparcie informacyjne dla zarządzania strategicznego Tereshkun Volodymyr.
Strukturalny język zapytań SQL - historia
dr Robert Kowalczyk, PWSZ Płock
Zapis prezentacji:

Wykład 6 Wojciech Pieprzyca Systemy Baz Danych Wykład 6 Wojciech Pieprzyca

Bazy operacyjne i analityczne Rozpatrując bazy danych możemy podzielić je na dwie kategorie: 1) bazy operacyjne, 2) bazy analityczne. 1) bazy operacyjne (ang. On-Line Transaction Processing - OLTP) służą do bieżącego przechowywania i przetwarzania danych. Ich celem jest uporządkowanie danych (zapewnienie spójności danych), a także umożliwienie szybkiego dostępu do informacji. Podstawowe problemy związane z takimi bazami danych to utrzymanie odpowiednich mechanizmów transakcji i zapewnienie wysokiej szybkości i niezawodności ich działania.

Bazy operacyjne i analityczne 2) bazy analityczne (ang. On-Line Analytical Processing – OLAP). Bazy analityczne określane są często jako hurtownie danych (ang. data warhouse). Mają one na celu wydobywanie z baz danych informacji biznesowych wspomagających podejmowanie decyzji w danej firmie. Mogą to być np. informacje o bieżącej sprzedaży, kosztach, dostawach,itp. Hurtownie danych operują na danych historycznych tzn. ważne jest zawarcie w bazie analitycznej jak największej liczby danych z przeszłości ponieważ na ich podstawie określa się trendy i statystyki dotyczące działalności firmy.

Cechy hurtowni danych Podstawowe cechy hurtowni danych: a) mogą przechowywać dane z różnych baz danych, często pochodzących także spoza systemu bazodanowego danej firmy, b) dane dotyczą długiego okresu historii działania firmy, c) bazy na których opierają się hurtownie danych mają zwykle rozmiary liczone w gigabajtach, a czasami nawet terabajtach, w związku z powyższym ważna jest możliwość w miarę szybkiego przetwarzania dużej ilości danych.

Cechy hurtowni danych Podstawowe cechy hurtowni danych: d) w odróżnieniu od baz operacyjnych, dane w hurtowniach danych nie podlegają modyfikacjom, jedynie okresowo spływają do bazy nowe dane historyczne. e) dane w rekordach mogą być zagregowane lub zawierać informacje szczątkowe. Przykładowo, gdy mamy do czynienia z hurtownią danych sprzedaży, wtedy nie będą występowały w niej poszczególne pozycje na fakturach a jedynie kwoty faktur, gdy jest to podstawą analizy.

Cechy hurtowni danych Do analizy danych z hurtowni danych wykorzystywany jest mechanizm eksploracji danych (ang. data mining), który poszukuje ogólnych form wiedzy z olbrzymiej ilości danych. Istnieje wiele technik eksploracji danych, które wywodzą się z ugruntowanych dziedzin nauki takich jak statystyka (statystyczna analiza wielowymiarowa) i uczenie maszynowe. Idea eksploracji danych polega na wykorzystaniu szybkości komputera do znajdowania ukrytych dla człowieka (właśnie z uwagi na ograniczone możliwości czasowe) prawidłowości w danych zgromadzonych w hurtowniach danych.

Architektura hurtowni danych Dane z różnych źródeł danych transformowane są do postaci znajdującej się w hurtowni danych za pomocą warstwy pośredniej oprogramowania ETL. Aplikacje analityczne na podstawie hurtowni danych tworzą raporty wspomagające podejmowanie decyzji, przeprowadzanie analiz, odkrywanie wiedzy, itp.

Oprogramowanie ETL 1) odczyt danych ze źródeł (Extraction), Oprogramowanie ETL (Extraction Translation Loading): 1) odczyt danych ze źródeł (Extraction), 2) transformacja do wspólnego modelu hurtowni danych, usunięcie niespójności (Translation), 3) wczytanie danych do hurtowni danych (Loading).

Oprogramowanie ETL Z każdym źródłem danych związane jest oprogramowanie w postaci modułów konwertera i monitora. 1) konwerter – przekształca dane z formatu źródłowego na format wykorzystywany w hurtowni danych. Dla różnych źródeł danych potrzebne są odmienne moduły konwertera, tak aby przekształcić np. dane źródłowe (plik tekstowy, XML, Excel) do postaci relacyjnego modelu danych (jeżeli taki wykorzystywany jest w hurtowni danych). 2) monitor – wykrywa zmiany w danych źródłowych i przekazuje je do hurtowni danych.

Źródła danych Ze względu na sposób działania monitora możemy wyróżnić następujące rodzaje źródeł danych: 1) źródła aktywne – związane z nimi są wyzwalacze, które informują monitor o zmianach zachodzących w danych, 2) źródła utrzymujące dzienniki operacji wykonywanych na danych źródłowych – zmiany wykrywane są na podstawie wpisów w dzienniku monitora, 3) źródła przepytywalne – umożliwiają zadawanie zapytań, monitor wydaje takie zapytania w celu stwierdzenia zmian lub ich braku, 4) źródła wspierające tworzenie migawek – umożliwiają tworzenie migawek, za pomocą porównania migawek z różnych okresów monitor może stwierdzić czy zaszły jakieś zmiany,

Zastosowanie Menadżerowie Do zarządzania taktycznego Analitycy Bieżąca analiza sytuacji podmiotu Prognozy Stratedzy firmy Tworzenie planów strategicznych krotko i długookresowych. zestawienia (zbiorcze, porównawcze, okresowe), analizy statystyczne, analizy trendów, zależności między danymi, planowanie i kontrola celów.

Zastosowanie Co najmniej 50% danych w bazach operacyjnych służy potrzebom analitycznym i podejmowaniu decyzji 40% raportów produkcyjnych jest niewykorzystywana (raport IBM, 1995) 30% raportów jest używana niezgodnie z ich przeznaczeniem (raport IBM, 1995) Kierownictwo Strategiczne ocenia dokładność i użyteczność danych na 2 w skali (od 1 do 10) (raport IBM, 1995)