Wprowadzenie do systemów baz danych

Slides:



Advertisements
Podobne prezentacje
Teoretyczne podstawy tworzenia systemów relacyjnych baz danych
Advertisements

Data Mining w e-commerce
HURTOWNIE DANYCH DSDSDSDFGFDG.
przetwarzaniu informacji
Rola komputera w przetwarzaniu informacji.
OLAP budowa aplikacji analitycznych w MS SQL 2000 i Yukon
Komponenty bazy danych Baza danych Jest to uporządkowany zbiór powiązanych ze sobą danych charakterystycznych dla pewnej klasy obiektów lub zdarzeń,
Procesy informacyjne w zarządzaniu
Kwerendy –wszystkie typy (usuwające, aktualizujące i inne)
Hurtownie Danych Mariusz Dołęga.
Microsoft Office Access
Kwerendy, formularze, relacje, raporty i makra
Klasyfikacja dokumentów tekstowych w oparciu o blogi
Co to jest studium przypadku?
Kierunki rozwoju technologii informatycznych: Hurtownie Danych
Proste bazy danych w Excelu
Specjalność Analiza danych 2009 Katedra Statystyki Instytut Zastosowań Matematyki.
Specjalność Analiza danych 2010 na kierunku IiE Katedra Statystyki Instytut Zastosowań Matematyki.
Systemy informatyczne zarządzania
Wykład 7 Wojciech Pieprzyca
BD-LAB6 Wojciech Pieprzyca
Wykład 6 Wojciech Pieprzyca
Rozproszone bazy danych
WYKONYWANIE ZAPYTAŃ Przygotował Lech Banachowski na podstawie: 1.Raghu Ramakrishnan, Johannes Gehrke, Database Management Systems, McGrawHill, 2000 (książka.
Modele baz danych - spojrzenie na poziom fizyczny
Typy systemów informacyjnych
KWERENDY 1. Kwerenda wybierająca – zadania 1-5. Zadanie 1 Wyświetl następujące dane z tabeli Pracownicy: nazwisko, imię oraz data urodzenia. Skorzystaj.
dr inż. Piotr Muryjas Wyższa Szkoła Przedsiębiorczości i Administracji
PROJEKTOWANIE TABEL W PROGRAMIE: ACCESS
SQL – zapytania posumowanie
Arkusze kalkulacyjne, część 3
Administracja serwerem bazy danych Oracle 11g Zarządzanie strukturą bazy danych Wykład nr 2 Michał Szkopiński.
WYŻSZA SZKOŁA INFORMATYKI STOSOWANEJ i ZARZĄDZANIA
Plan prezentacji informatyka + 1. Wprowadzenie 2. Systemy OLTP i OLAP
Metadane w opisie hurtowni danych oraz procesie ETL
Sieciowe Systemy Operacyjne
Prezentacja danych w postaci wykresu
Bazy danych Access 200x Ćwiczenie 1.
Moduł: Informatyka w Zarządzaniu
KWERENDY ćw. 3.
Wybrane zagadnienia relacyjnych baz danych
Wyprowadzanie informacji z bazy danych - kwerendy wybierające Marzena Nowakowska Katedra Informatyki Stosowanej, WZiMK, PŚk.
Bazy danych Microsoft access 2007.
dr Łukasz Murowaniecki T-109
T ABELE PRZESTAWNE Przygotował: Przemysław Kacperski.
Tabela przestawna Tabela przestawna - narzędzie analityczne arkusza kalkulacyjnego pozwalające wybierać i przestawiać kolumny i wiersze z danymi w arkuszu.
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Hurtownie i eksploracja danych
Bazy danych.
Ergonomia procesów informacyjnych
Transfer Wiedzy w Leśnym Centrum Informacji dr inż. Dorota Farfał Sękocin Stary 5 grudnia 2011 r.
Projektowanie postaci formularza:
BAZY DANYCH MS Access.
BAZY DANYCH Microsoft Access Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i.
Zintegrowany monitoring infrastruktury IT w Budimex
Czym s ą i do czego słu żą ? Narzędzie analityczne arkusza kalkulacyjnego pozwalające filtrować, wybierać, przestawiać kolumny i wiersze z danymi w arkuszu.
Tabele Przestawne Adam Wójcik Tomasz Kowalski.  Czym Tabele Przestawne są?  Jak je używać?  Zadania.
1 Hurtownie Danych – SAP BW Ćwiczenia prowadzone w ramach przedmiotu Hurtownie Danych Semestr letni 2005/2006 Marcin Gajewski Michał Wilbrandt.
Zintegrowane systemy informatyczne
Prezentacja programu PowerPoint
1 Zarządzania ryzykiem.  Audyty, audity i kontrole Pod koniec każdego roku trzeba przygotować:  plany audytu wewnętrznego,  plany kontroli, wykonywanych.
Temat: Tworzenie bazy danych
SQL Server Analysis Services Action!
Hurtownie danych i systemy wspomagania decyzji
{ Wsparcie informacyjne dla zarządzania strategicznego Tereshkun Volodymyr.
Hurtownia danych: (ang. data warehouse) to: uporządkowany tematycznie
Czym są i jak służą społeczeństwu?
Modele baz danych - spojrzenie na poziom fizyczny
Zapis prezentacji:

Wprowadzenie do systemów baz danych Analiza danych Wprowadzenie do systemów baz danych

Przetwarzanie analityczne on-line (On Line Analytical Processing – OLAP) Hurtownie Danych (Data Warehouses) Magazyny Danych (Data Marts) Systemy Wspomagania Decyzji (Decision Support Systems – DSS) Systemy Informowania Kierownictwa (Executive Information Systems – EIS) Systemy Zarządzania Informacją (Management Information System – MIS) Zarządzanie kontaktami z klientami (Customer Relationship Management – CRM) Eksploracja danych (Data Mining) – zgłębianie danych

Charakterystyka OLTP Dane ciągle aktualizowane Wykorzystywane do aktywnego przetwarzania informacji Ograniczone do dziesiątek gigabajtów Posiadają małą ilość danych historycznych Zoptymalizowane do efektywnej aktualizacji danych (przetwarzania transakcji) Zorientowane na działanie OLAP Dane historyczne, aktualizowane w ustalonym czasie np. co noc Wykorzystywane do analizy w dłuższym przedziale czasowym Zbiory rzędu terabajtów Przechowuje dane przez wiele lat Zoptymalizowane do wyszukiwania danych Zorientowane na cel

Operacje analityczne Konsolidacja – łączenie danych pochodzących z różnych źródeł Np. połączenie danych ze wszystkich wydziałów AM Drążenie – operacja przeciwna do konsolidacji polegająca na wydobywaniu danych szczegółowych Np. wydobycie danych studentów urodzonych w konkretnym roku Obracanie – przedstawianie tych samych danych z różnych punktów widzenia („cięcie i rzutowanie” danych)

Wielowymiarowe struktury danych Wielowymiarowa struktura danych jest przedstawiana jako kostka (sześcian) danych Każdy bok reprezentuje jeden wymiar Przecięcie wymiarów tworzy komórkę, w której jest przechowywana wartość danej, jest to zwykle wartość funkcji agregującej Nie ma ograniczeń na liczbę wymiarów struktury danych ani na liczbę poziomów agregacji

Tabela faktów Ocena IDStudenta IDEgzaminatora IDPrzedmiotu Data

Tabela wymiarowa Student IDStudenta Nazwisko i imię Rok urodzenia Typ ukończonej szkoły średniej Pochodzenie Stan cywilny

Struktura gwiazdy Ocena IDStudenta IDEgzaminatora IDPrzedmiotu Data Nazwisko i imię studenta Rok urodzenia Typ ukończonej szkoły średniej Pochodzenie Stan cywilny Egzaminator IDEgzaminatora Nazwisko i imię egzaminatora Rok urodzenia Staż pracy Stanowisko Stopień naukowy Tabela faktów Przedmiot IDPrzedmiotu Nazwa przedmiotu Specjalność Semestr Tabela wymiarowa Tabela wymiarowa Tabela wymiarowa

Przykład wielowymiarowej struktury danych Informacja o ocenach W komórkach znajduje się ocena maksymalna lub średnia Wymiary Osoba otrzymująca ocenę (nazwisko i imię) Osoba wystawiająca ocenę (nazwisko i imię) Staż pracy wystawiającego ocenę Stanowisko wystawiającego ocenę Nazwa przedmiotu Specjalność Rok akademicki Semestr studiów

Zobrazowanie wyników Człowiek może analizować wielowymiarowe struktury danych i wyciągać, na ich podstawie, właściwe wnioski, jednak analiza taka musi składać się z serii analiz cząstkowych Najłatwiej jest analizować i wizualizować struktury 2 wymiarowe – dodanie 3 wymiaru stwarza już trudności W celu uzyskania 2, 3 wymiarowych struktur danych dokonuje się cięcia (rzutu) struktur wielowymiarowych, co umożliwia oddzielną analizę różnych aspektów złożonego zagadnienia

Przykłady różnych analiz Średnia i odchylenie standardowe ocen wystawianych przez pracowników w funkcji stażu pracy Średnia i odchylenie standardowe ocen wystawianych przez pracowników w zależności od semestru Średnia i odchylenie standardowe ocen wystawianych przez pracowników w kolejnych latach – normy Unii Europejskiej wymagają, aby nie było zbyt dużego rozrzutu Średnia ocen studentów w zależności od semestru Średnia ocen studentów w kolejnych latach akademickich

Kwerenda podsumowująca (grupująca) Umożliwia agregację danych np. Obliczenie sumy zamówień klientów Obliczenie sumy zamówień klientów w poszczególnych kwartałach Obliczenie średnich ocen studentów Obliczenie średnich ocen studentów w poszczególnych semestrach Grupowanie może następować po kilku kategoriach, których nazwy pojawią się jako wartości w kolumnach Wyniki podsumowania są wypisywane w kolumnie Liczba podsumowań nie jest ograniczona

Przykład kwerendy podsumowującej SELECT Nazwisko, Semestr, Avg(Ocena), Count(Ocena) FROM Student NATURAL JOIN Ocena GROUP BY Nazwisko, Semestr ORDER BY Nazwisko, Semestr

Wynik kwerendy podsumowującej Nazwisko Semestr AVG(Ocena) Count(Ocena) Student1 1 3.333 9 2 4.000 12 3 3.800 13 4 4.200 Student2 3.500 8 3.900

Kwerenda krzyżowa Podobna do kwerendy podsumowującej Wybrane kategorie grupowania pojawiają się jako nagłówki kolumn Wybrane kategorie grupowania pojawiają się jako wartości w pierwszych kolumnach tabeli wynikowej – nagłówki wierszy Wyniki podsumowań pojawiają się jako wartości w wierszach MS Access posiada narzędzia ułatwiające tworzenie kwerend krzyżowych

Wynik kwerendy krzyżowej Nazwisko Sem. 1 Sem. 2 Sem. 3 Sem. 4 Student1 3.333 4.000 3.800 4.200 Student2 3.500 3.900 4.300 Student3 4.500 4.800 Student4 3.350 4.100 Student5 3.700 Student6 Student7 3.200

Silny klient Komputery PC stały się tanie i mają duże moce obliczeniowe Część obliczeń związanych z analizą danych może być wykonana na komputerze klienckim odciążając serwer Dane są przechowywane na serwerze i przesyłane klientowi, który dokonuje ich analizy przy pomocy programu działającego na komputerze klienckim Najpopularniejszymi programami dokonującymi analizy danych są arkusze kalkulacyjne

Raport tabeli przestawnej Realizowany przez arkusz kalkulacyjny np. MS Excel Dane pochodzą z samego arkusza lub są pobierane z bazy danych Jeśli dane są pobierane z bazy danych możliwa jest ich aktualizacja przykład tabeli przestawnej – sieć przykład tabeli przestawnej - lokalnie

MSSQLServerOLAPService Tworzy wielowymiarowe struktury danych na podstawie źródeł danych OLTP MOLAP (Multidimensional OLAP) – dane są pobierane z innych baz danych po czym wielowymiarowa struktura danych zapisywana jest na trwałym nośniku, przez serwer OLAP ROLAP (Relational OLAP) – na serwerach OLTP tworzone są tabele zbiorcze zawierające pogrupowane dane, na ich podstawie serwer OLAP tworzy wielowymiarową strukturę danych ale jej nie przechowuje (nie zapisuje na dysku) HOLAP (Hybrid OLAP) – połączenie technik MOLAP i ROLAP – centralna baza pozostaje na serwerze OLTP a zagregowane dane są przechowywane na serwerze OLAP

Analysis Manager Program administracji Serwera Analiz Program umożliwia Określenie źródłowych baz danych OLTP Tworzenie wielowymiarowych struktur danych Przeglądanie i analizę wielowymiarowych struktur danych Zarządzanie bezpieczeństwem danych

Zastosowania Analiza przyczyn obserwowanych zjawisk ekonomicznych, społecznych itp. Analiza upodobań konsumentów Walka z przestępczością Przewidywanie potencjalnych zagrożeń – ekonomicznych czy związanych z bezpieczeństwem Planowanie strategii rozwoju organizacji Badania socjologiczne – pisanie rozpraw naukowych Przewidywanie przyszłości ;), opracowywanie prognoz Oddziaływanie na opinię publiczną, analiza skuteczności PR

Eksploracja danych Eksploracja danych jest procesem wydobywania nieznanych wcześniej informacji z dużych baz danych i wykorzystania ich przy podejmowaniu decyzji Techniki eksploracji danych Modelowanie predykcyjne (modelownie sposobu uczenia) Klasyfikacja i predykcja wartości Segmentacja bazy danych Analiza powiązań Wykrywanie odchyleń Każda technika może być realizowana przy pomocy różnych algorytmów Istnieje wiele produktów realizujących różne algorytmy eksploracji danych