Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
OpublikowałSzczeosny Nowaczyk Został zmieniony 11 lat temu
1
POWTÓRZENIE Podstawowe polecenia definicji danych SQL oraz odniesienie do MySQL; Wyświetlanie zapisu tworzenia bazy, tabeli; Rozszerzona prezentacja struktury tabeli; Informacje o statusie tabeli i jej powiązaniach; Zawartość INFORMATION_SCHEMA: informacje o bazach danych, o tabelach dla baz danych, rozszerzone informacje o kolumnach; informacje o dostępnych rodzajach czcionek i kodowaniu informacje o używanych kluczach; informacje o ograniczeniach tabel; informacje o indeksach.
2
Hurtownia danych: (ang. data warehouse) to: uporządkowany tematycznie zintegrowany zawierający wymiar czasowy nieulotny zbiór danych wspomagających podejmowanie decyzji. Często dodaje się jeszcze jeden punkt: Hurtownia danych ma wspomagać przetwarzanie informacji dla celów strategicznych i analitycznych (w przeciwieństwie do systemów transakcyjnych realizujących przetwarzanie dla celów operacyjnych)
3
Hurtownia danych – rodzaj bazy danych, która jest zorganizowana i zoptymalizowana pod kątem pewnego wycinka rzeczywistości. Hurtownia danych jest wyższym szczeblem abstrakcji niż zwykła relacyjna baza danych (choć do jej tworzenia używane są także podobne technologie). W skład hurtowni wchodzą zbiory danych zorientowanych tematycznie (np. hurtownia danych klientów). Dane te często pochodzą z wielu źródeł, są one zintegrowane i przeznaczone wyłącznie do odczytu.
4
W praktyce hurtownie są bazami danych integrującymi wszystkie pozostałe systemy bazodanowe w firmie.
Polega ona na cyklicznym zasilaniu hurtowni danymi systemów produkcyjnych. Może być tych baz lub systemów dużo i mogą być rozproszone - dla każdego z nich niezbędne jest więc odpowiednie przeformatowanie danych i ich oczyszczenie, tylko wówczas dane zgromadzone w hurtowni będą stanowiły solidną podstawę do wykonywania miarodajnych analiz.
5
Architektura hurtowni danych:
W hurtowniach danych możemy wyróżnić nastepujące architektury: - schemat gwiazdy:
6
Schemat gwiazdy jest najprostszym modelem hurtowni danych
Schemat gwiazdy jest najprostszym modelem hurtowni danych. Jego nazwa wzięła się z wyglądu schematu danych, w którym w centralnym miejscu znajduje się tabela faktów otoczona przez tabele wymiarów. Dane w tabeli faktów powinny być znormalizowane do trzeciej postaci normalnej, natomiast tabele wymiarów są zwykle zdenormalizowane przy czym dla każdego z wymiarów może występować tylko jedna zdenormalizowana tabela. Tabela faktów składa się z dwóch typów kolumn: - kolumy zawierające wartości numeryczne o danym fakcie tzw. miary - kolumny z kluczami obcymi do tablic wymiarów
7
Klucz główny tabeli faktów składa się z jej wszystkich kolumn z wyłączeniem kolumn opisujących miary. Tabela faktów może zawierać informacje o faktach na poziome detalicznym lub zagregowanym. Tabele wymiarów są strukturami złożonymi często z jednej lub więcej hierarchii, które służą do kategoryzowania danych. Oprócz kluczy głównych tabele faktów zawierają pola z atrybutami opisującymi dany wymiar. Wielkość tabeli faktów jest znacznie większa od tabel wymiarów. Architektura gwiazdy umożliwia przeglądanie poszczególnych danych z podziałem na kategorie, agregację, sumowanie, drążenie oraz filtrowanie.
8
Schemat gwiazdy dla sprzedaży nieruchomości w firmie WymarzonyDom:
9
- schemat płatka śniegu
Schemat płatka śniegu jest bardziej złożoną wersja schematu gwiazdy ponieważ tabele które opisują wymiary są znormalizowane. Oznacza to, że każdy wymiar może mieć kilka własnych wymiarów. Schemat ten używa się przede wszystkim w sytuacjach gdy mamy do czynienia z bardzo złożonymi wymiarami oraz aby lepiej odzwierciedlić sposób myślenia użytkowników o danych. W praktyce często stosuje się kombinacje schematu płatka śniegu i gwiazdy poprzez normalizacje jednych wymiarów i denormalizację innych (jak w schemacie konstelacji faktów).
11
- schemat konstelacji faktów
Schemat konstelacji faktów stanowi rozwiązanie pośrednie między gwiazdą a płatkiem śniegu. W schemacie tym część tabel wymiarów jest znormalizowanych a część zdenormalizowanych oraz zwykle występuje więcej niż jedna tabela faktów. Ponadto tabele faktów są ze sobą powiązane w relacji 1:1 lub 1:n oraz mogą współdzielić te same tabele wymiarów.
12
Miara a wymiar: różnica między nimi polega na tym, że miara zawiera wartości liczbowe, natomiast wymiar wartości opisowe (tekstowe) danej charakterystyki. Np. jeśli chcemy opisać sprzedaż samochodów to ilość sprzedanych samochodów to miara, natomiast marka to wymiar. Wymiary są informacjami referencyjnymi i określają kontekst analiz miar. W modelu wielowymiarowym każda miara jest powiązana z kilkoma wymiarami. Wymiar najczęściej posiada strukturę hierarchiczną, określającą sposób agregacji wartości skojarzonych z nim miar.
13
Najbardziej typową hierarchią wymiaru jest hierarchia bazująca na poziomach, posiada powiązania referencyjne typu parent-child pomiędzy wystąpieniami wymiaru, które umożliwiają grupowanie członków wymiaru w poziomy, np. dni tygodnia przypisujemy do jednego poziomu, tygodnie do drugiego a miesiące do trzeciego. W sytuacji gdy hierarchia posiada powiązania typu parent-child ale nie posiada poziomów mamy do czynienia z wymiarem bazującym na wartościach, np. dla każdego pracownika możemy wyznaczyć jego kierownika, jednak grupowanie tak wyznaczonych kierowników nie będzie miało większego sensu bo kierownika załóżmy zespołu zajmującego się sprzedażą nie można porównać z kierownikiem dyrektora regionu sprzedaży. Jeśli wymiar nie posiada hierarchii i poziomów, nosi nazwę wymiaru płaskiego lub listy.
14
Architektura bazy hurtowni jest zorientowana na optymalizację szybkości wyszukiwania i jak najefektywniejszą analizę zawartości. Stąd bywa, że hurtownie danych nie są realizowane za pomocą relacyjnych baz danych, gdyż takie bazy ustępują szybkością innym rozwiązaniom. W zależności od rodzaju hurtowni dane w jej rekordach mogą być zagregowane lub zawierać nawet informacje szczątkowe. W praktyce oznacza to, że pewne dane w hurtowni nie są przechowywane w postaci rozdrobnionej a tylko jako ich suma.
15
Architektura hurtowni danych wg. motorów baz danych
Motory baz danych hurtowni danych opartych na koncepcji wielowymiarowej kostki OLAP możemy podzielić na: - ROLAP-Relational OLAP. W rozwiązaniu tym dane odczytywane są z zewnętrznych tablic relacyjnych przez co polecenia użytkownika w postaci zapytań SQL do danych elementarnych i zagregowanych muszą zawsze trafić do RDBMS. Serwer analityczny (kostka) wykorzystywany jest wyłącznie jako warstwa pośrednia między klientem a RDBMS. Struktura ROLAP zapewnia wolniejszy dostęp do danych w porównaniu do MOLAP i HOLAP. Jest najbardziej odpowiednia dla dużych zbiorów danych o stosunkowo rzadkim użyciu.
16
- MOLAP-Multidimensional OLAP
- MOLAP-Multidimensional OLAP. Charakteryzuje się tym, że dane są przechowywane w wielowymiarowej bazie danych w postaci wielowymiarowych tablic – kostek (ang. multidimensional array, datacube) zawierających dane o różnym stopniu agregacji. Wielowymiarowa struktura jest w stanie zapewnić najszybszy dostęp do danych. Jest najbardziej odpowiednia dla danych o częstym użyciu i wysokich wymaganiach odnośnie czasu odpowiedzi. - HOLAP-Hybrid OLAP. Kobinacja rozwiązań ROLAP i MOLAP. Wykorzystuje się tu jednocześnie wielowymiarowe(dane zagregowane) oraz relacyjne(dane elementarne, bez dublowania) bazy danych. Zapytania drążące są wykonywane wolniej ponieważ działają na strukturze relacyjnej. Dane w HOLAP mają zwykle mniejszy rozmiar. Struktury HOLAP są przeznaczone dla potrzeb szybkiego dostępu do agragacji bazujących na dużych zbiorach danych.
17
Kostka wielowymiarowa (Multidimensional OLAP Cube)
Wielowymiarowa kostka OLAP (cube) jest podstawową strukturą danych w każdym systemie OLAP działającym w środowisku Hurtowni Danych. Cube składa się z Miar (Measures), Wymiarów (Dimensions) i Poziomów (Levels) i jest zoptymalizowany pod kątem szybkiego i bezpiecznego dostępu do danych wielowymiarowych. Miary to wskaźniki numeryczne (ile?), natomiast wymiary reprezentują dane opisowe (kto? co? kiedy? gdzie?). Wymiary są pogrupowane za pomocą poziomów, które odzwierciedlają hierarchię funkcjonującą w organizacji i pozwalają użytkownikom końcowym zwiększać lub zmniejszać poziom szczegółowości analizowanego wymiaru.
18
Z reguły w hurtowni danych jest zdefiniowanych co najmniej kilkanaście wymiarów, a najczęściej spotykanym i wymiarami są: Czas Klient Produkt Lokalizacja Biuro Sprzedaży Hierarchia każdego z wymiarów ustawiona jest za pomocą Poziomów. Przykładowo, hierarchia poziomów może być ułożona w następujący sposób: wymiar Czas: Rok -> Kwartał -> Miesiąc -> Tydzień -> Dzień Klient: Grupa klientów -> Nazwa klienta Produkt: Linia Produktu -> Grupa Produktu -> Produkt Lokalizacja: Obszar -> Region -> Kraj
19
Kategorie to elementy danych które opisują poziomy w wymiarach.
Przykładowo, dla wymiaru Lokalizacji, w hurtowni danych zostały ustawione poziomy obszaru, regionu i kraju. W tym przykładzie dla Polski kategoriami będą: Obszar - Europa Region - Europa Środkowa Kraj - Polska Typowe, najczęściej występujące Miary w hurtowniach danych to: Przychód netto Przychód brutto Waga Ilość Koszt Upust
20
Hurtownie danych - spotykane najczęściej w średnich i dużych firmach, gdzie ilości składowanych informacji liczone są w dziesiątkach, setkach gigabajtów. Głównym celem ich tworzenia jest wspomaganie przetwarzania informacji dla celów strategicznych i analitycznych (systemy wspomagające podejmowanie decyzji). Dobrze zaprojektowana hurtownia danych to solidna podstawa dla systemów analitycznych i źródło informacji do podejmowania decyzji w przedsiębiorstwie. Błędy w projekcie hurtowni spowodują natomiast załamanie całego systemu informowania, a ich późniejsze usunięcie może być bardzo kosztowne.
21
Przedsiębiorstwo: Współczesne, sprawnie funkcjonujące przedsiębiorstwo powinno umieć odpowiedzieć na kilka zasadniczych pytań dotyczących swej działalności. Powinno wiedzieć jak postrzegane jest na rynku, w jaki sposób zmienia się w czasie sprzedaż produktów i usług, jaki jest poziom zysku przynoszonego przez poszczególnych klientów. Jednak udzielenie odpowiedzi na te pytania bez uprzednio przygotowanych zbiorczych raportów dotyczących działalności firmy jest w zasadzie niemożliwe. W związku z tym przygotowanie odpowiednich raportów prezentujących całościowy obraz działalności firmy jest jednym z najważniejszych aspektów sprawnego funkcjonowania przedsiębiorstwa. Na podstawie takich zbiorczych danych można właściwie planować działalność firmy i podejmować decyzje na przyszłość.
22
Ciekawe dane pokazują też statystyki, według których nawet najmniejsza strata najlepszych klientów powoduje ogromne straty finansowe, rzędu kilkudziesięciu procent. Zatem opieka nad nimi jest jednym z kluczowych zadań firmy. Dysponując danymi o każdym ze swych klientów można interweniować w odpowiednim momencie, zaoferować lepsze usługi i produkty nie dopuszczając tym samym do jego utraty. Dzięki zaawansowanym analizom danych klientów przedsiębiorca może dokonać podziału klientów na grupy o np. różnej zyskowności, zróżnicować sposób traktowania potrzeb różnych klientów – przedstawić dodatkowe oferty dla najlepszych klientów, czy też ograniczyć kontakty z klientami najmniej zyskownymi redukując dzięki temu koszty ich obsługi.
23
Hurtownie danych stały się również istotnym narzędziem wspomagającym sprzedaż, marketing, promocje a nawet sposób wystawiania towarów w sektorze handlu. Dzięki analizie danych dziesiątek tysięcy nawet setek tysięcy transakcji dla tysięcy oferowanych produktów, można ściśle określić preferencje klientów i zależności pomiędzy produktami. Umożliwia to handlowcom wyjście na przeciw oczekiwaniom klientów i zwiększenie sprzedaży. Wszystkie te działania przekładają się na wymierne wyniki finansowe, znacznie przewyższające koszty wdrożenia hurtowni danych.
24
Hurtownia danych gromadzi dane ze wszystkich systemów działających w obrębie organizacji, stanowi więc źródło analiz w kontekście całej działalności. Dane zorganizowane są pod kątem dostarczania w jak najkrótszym czasie rzetelnych informacji o aktualnym stanie firmy, a dzięki temu, że są uspójnione w ramach całej organizacji Hurtownia danych stanowi "jedno źródło prawdy".
25
Hurtownia danych nie jest więc systemem, który można kupić "z półki"
Hurtownia danych nie jest więc systemem, który można kupić "z półki". Skoro ma wspomagać realizację strategicznych celów organizacji - musi być zaprojektowana ze szczególnym położeniem nacisku na strategię firmy. Głównym beneficjentem takiego systemu jest kadra zarządzająca oraz kierownictwo średniego szczebla, analitycy. To przede wszystkim ich potrzeby powinna zaspokajać hurtownia danych. Zasadniczym motywatorem projektu hurtowni danych jest zatem możliwość śledzenia najistotniejszych z punktu widzenia organizacji wskaźników (rentowność produktów czy klientów, ryzyko kredytowe, poziom zadowolenia klienta, rotacja klientów, jakość procesu produkcyjnego itd.), nie zaś objęcie zakresem systemu zadań wynikających z realizacji w przedsiębiorstwie pewnych konkretnych procesów gospodarczych.
26
Z drugiej strony, najistotniejszym atrybutem jakości hurtowni danych jest wiarygodność pozyskiwanych dzięki niej informacji. Zatem jakość danych oraz sposób ich umieszczenia w hurtowni danych jest jednym z najpoważniejszych wyzwań, a zarazem obszarem najczęściej i najmocniej niedoszacowanym. Hurtownia danych to również zmiana sposobu myślenia o dostępie do danych w obrębie firmy, to odstąpienie od „specjalisty od danych", "zamówień na raporty" na rzecz samodzielnego dokonywania analiz, zgodnie z potrzebą chwili.
27
Zbierane dane są uzgadniane, konsolidowane i przechowywane w jednolitej formie w hurtowni danych, gdzie otrzymują zrozumiałe i intuicyjne nazwy oraz opisy tworząc proste i czytelne informacje. Informacje w hurtowni mogą być uzupełnione o plany lub prognozy, a także złożone wskaźniki automatycznie wyliczane z informacji bazowych. Odpowiednie narzędzia przekształcają te informacje w wiedzę prezentowana w postaci raportów, wykresów, tabel, kostek danych. Wiedza ta trafia za pośrednictwem sieci lokalnych lub Internetu do odpowiednich użytkowników.
28
Przepływ informacji w hurtowni danych:
29
Przykłady pytań na jakie można odpowiedzieć dzięki zastosowaniu hurtowni danych:
Jak kształtuje się sprzedaż w poszczególnych okresach czasu; na tej podstawie można sprawdzić czy sprzedaż rośnie czy maleje, kiedy była największa, a kiedy najmniejsza i wyciągnąć odpowiednie wnioski. Który z klientów kupuje najwięcej, a który najmniej w wybranych okresach czasu. Pozwoli to na zastosowanie odpowiednich promocji, skierowanie ofert do określonych klientów. Który z oddziałów firmy prosperuje najlepiej, a który najgorzej.
30
Jak pracują akwizytorzy, który może pochwalić się największą sprzedażą.
Jak kształtuje się sprzedaż w rozbiciu na grupy towarowe w poszczególnych okresach czasu z uwzględnieniem konkretnych klientów. Którzy klienci płacą regularnie, a którzy zalegają z płatnościami, ile zalegają, ile zalegają z uwzględnieniem naliczonych odsetek. W którym mieście sprzedaż jest największa. Które produkty sprzedają się najlepiej.
31
Czy też inne: Jaki był ogólny dochód w województwie małopolskim w trzecim kwartale 2005 roku? Jaki był ogólny dochód ze sprzedaży nieruchomości dla każdego typu nieruchomości w całym kraju w 2005 roku? Jakie trzy dzielnice były najbardziej popularne wśród wynajmujących nieruchomości w każdym mieście w 2005 roku i jakie zaszły zmiany w stosunku do wyników z poprzednich dwóch lat? Jakie rodzaje nieruchomości sprzedawane są powyżej średnich cen sprzedaży nieruchomości w głównych miastach i jakie są tu korelacje z danymi demograficznymi?
32
Korzyści z korzystania z hurtowni danych:
Korzystanie z odpowiednio skonstruowanej hurtowni danych i stworzonych na jej podstawie raportów pozwala na: zwiększenie obrotów dla produktów; ograniczenie promocji towarów, które dobrze się sprzedają; zmniejszenie stanów lub usunięcie towarów wolno rotujących na półkach; zmniejszenie odpływu klientów mało aktywnych (poprzez zastosowanie w odpowiednim momencie promocji lub określonej atrakcyjnej oferty); zmniejszenie wszelkich zadłużeń; tworzenie 'inteligentnych' kampanii, dzięki którym można zmniejszyć koszty marketingowe.
33
Ryzyko projektu budowy Hurtowni Danych:
Hurtownia danych obejmuje całą działalność firmy - jest więc systemem bardzo złożonym. Praktyka wskazuje, że wraz ze złożonością systemu rośnie ryzyko niepowodzenia przedsięwzięcia. Jak można zatem sobie pomóc, aby minimalizować ryzyko niepowodzenia projektu, czyli jakie podjąć działania aby osiągnąć zakładane korzyści w zakładanym czasie? Są to przede wszystkim: ścisła współpraca z użytkownikami, sensowne planowanie przedsięwzięcia zarówno od strony merytorycznej, jak i technicznej, oraz iteracyjny cykl wdrażania systemu.
34
Najważniejszym czynnikiem minimalizującym ryzyko każdego projektu informatycznego jest ścisła współpraca z użytkownikami. W przypadku hurtowni danych stanowi osobne wyzwanie i to przede wszystkim dla użytkownika. Główni beneficjanci hurtowni danych to kadra zarządzająca, czyli ludzie, których czas jest wyjątkowo cenny i stanowiący "towar" równie wyjątkowo deficytowy. Niemniej jednak właściwe zaplanowanie współpracy na poziomie kierownictwa strategicznego organizacji jest jednym z najistotniejszych czynników stanowiących o powodzeniu całego przedsięwzięcia. Jest to bowiem grupa ludzi, która jako jedyna jest w stanie zapewnić strategiczny kontekst analiz wymaganych dla hurtowni danych.
35
Dzięki współpracy z kadrą menedżerską możliwa jest identyfikacja zasadniczych strategii działania organizacji oraz potrzeb informacyjnych z nich wynikających. Podjęciu decyzji o budowie hurtowni danych musi więc towarzyszyć przekonanie o konieczności poświęcenia własnego czasu na rozmowy z twórcami systemu.
36
Drugim sposobem ograniczenia ryzyka jest precyzyjne zdefiniowanie architektury hurtowni danych na samym początku prac. Podobnie jak projekt architektoniczny dla budowli, architektura hurtowni danych jest ogólnym planem wielkiej i złożonej struktury systemu. Chodzi tu o właściwe odniesienie całego zakresu funkcjonalnego do strategii działania, oraz o zaplanowanie architektury technicznej dla całego systemu. Projektowanie architektury to duży nakład żmudnej pracy, w wyniku której powstaje jedynie dokumentacja, ale etap ten jest bardzo ważny z tego względu, że jakość planu realizacji przedsięwzięcia jest wprost proporcjonalna do wiedzy na jego temat.
37
Właściwe zaplanowanie architektury pozwala też osiągnąć znaczną poprawę wydajności w realizacji kolejnych etapów hurtowni danych, ponieważ stanowi fundament, na którym budowane są kolejne fragmenty systemu, uwalniając projektantów i programistów od konieczności zastanawiania się nad poszczególnymi komponentami technologicznymi, które powinny zostać zastosowane. Z punktu widzenia procesu inwestycyjnego architektura pozwala utrzymać w ryzach koszty przedsięwzięcia.
38
Hurtownia danych jest systemem złożonym, obejmuje szeroki zakres potrzeb informacyjnych.
Podejście przyrostowe pozwala skutecznie zarządzać tym elementem ryzyka. Polega ono na podzieleniu systemu na kilka mniejszych "kawałków" i budowie ich po kolei. Dzięki temu już po kilku miesiącach użytkownicy mogą mieć korzyści z budowanego systemu. Nie bez znaczenia jest również fakt, że ludziom łatwiej jest precyzować swoje wymagania w odniesieniu do czegoś, co już widzieli i używali.
39
Po wdrożeniu pierwszego przyrostu funkcjonalności hurtowni danych użytkownicy chętniej będą definiować swoje potrzeby, widząc korzyści, jakie daje wprowadzany system. Przyrosty funkcjonalności systemu powinny być tak zdefiniowane, aby dało się każdy z nich zaprojektować, zaimplementować i wdrożyć w czasie nie przekraczającym 3 miesięcy.
40
Czynniki sukcesu: Kiedy warto myśleć o budowie hurtowni danych?
Warunkiem koniecznym jest istnienie systemu (lub systemów) stanowiących źródło danych dla hurtowni danych, czyli wspomnianych Systemów Zarządzania Przedsiębiorstwem. Określa się jeszcze kilka czynników pozwalających ocenić poziom przygotowania organizacji do uruchomienia projektu budowy hurtowni danych. Wśród najważniejszych należy wymienić cztery:
41
1. Dostępność źródeł danych.
Ideałem byłoby, gdyby w organizacji istniało jedno, udokumentowane, wewnętrzne, zautomatyzowane źródło danych odpowiadających potrzebom informacyjnym organizacji. Niestety zazwyczaj mamy do czynienia z wieloma nieudokumentowanymi, zewnętrznymi, niezautomatyzowanymi źródłami. Nie uniemożliwia to jeszcze budowy hurtowni danych - jedynie podnosi ryzyko takiego przedsięwzięcia i zapewne jeśli tylko mamy wybór warto w pierwszej kolejności zająć się budową rozwiązań automatyzujących codzienną pracę, a dopiero później myśleć o hurtowni danych.
42
2. Świadomość odbiorców systemu co do informacji, które chcą z niego otrzymywać i jasne powiązanie tych informacji z potencjalnymi korzyściami gospodarczymi dla organizacji. Bez takiego powiązania możemy zbudować "fantastyczny" system, ale nie wnoszący żadnej wartości dodanej. 3. Zakres – którym można zarządzać i tak go dzielić na kolejne fragmenty systemu aby były one wykonalne w czasie 3-4 miesięcy oraz były ściśle powiązane z korzyściami dla organizacji.
43
4. Umocowanie projektu – Budowa hurtowni danych jest w gruncie rzeczy przedsięwzięciem biznesowym i do tego sterowanym potrzebami informacyjnymi o strategicznym znaczeniu. W związku z tym bez zaangażowania ze strony kierownictwa organizacji trudno będzie mówić o powodzeniu projektu. Oczywiście zazwyczaj sytuacja odbiega nieco od ideału. Analiza organizacji pod kątem powyższych czynników jest sposobem zwrócenia uwagi na istotne problemy, mogące wystąpić podczas budowy hurtowni danych.
44
Dodatkowym problemem, jakże często występującym w wielu organizacjach jest niska jakość danych.
Jakość informacji uzyskiwanych z hurtowni danych zawsze będzie adekwatna do jakości danych źródłowych. Nie oznacza to oczywiście, że "wyczyszczenie" danych źródłowych nie jest możliwe - oczywiście, w większości przypadków daje się to zrobić, często jednak wymaga to dodatkowej pracy użytkowników jak również zespołu realizującego hurtownię danych. Przedsięwzięcie budowy hurtowni danych wydaje się być bardzo złożone. Ale, czy uzyskanie dużych, wymiernych korzyści nie wymaga dużego nakładu pracy?
45
Projektowanie hurtowni danych:
Metoda dziewięciu kroków: Wybór procesu; Wybór poziomu szczegółowości; Identyfikacja i uzgodnienie wymiarów; Wybór faktów; Umieszczenie wstępnych obliczeń w tabeli faktów Zaokrąglanie tabeli wymiarów Wybór zakresu czasowego bazy danych; Śledzenie wolno zmieniających się wymiarów; Określenie priorytetów zapytań i trybów zapytań.
46
Schemat gwiazdy dla sprzedaży nieruchomości w firmie WymarzonyDom:
47
Model związków encji dla rozszerzonej wersji projektu WymarzonyDom:
48
Model wielowymiarowy dla hurtowni danych WymarzonyDom:
49
Rozproszone bazy danych
Rozproszona baza danych to zbiór powiązanych baz danych, które rozproszone są w sieci komputerowej. Rozproszony system baz danych to zbiór oprogramowania, które umożliwia administrowanie rozproszoną bazą danych. Rozproszeniem jest również połączenie kilku komputerów klienckich do jednej bazy danych.
50
Schemat połączenia oddziałów firmy
51
Architektura klient – serwer
52
Zastosowanie replikacji w medycynie
53
Bezpieczeństwo baz danych:
Mechanizm zabezpieczający bazę danych przed przypadkowym lub celowym zagrożeniem, jak np.: kradzież i defraudacja; utrata poufności (tajności) danych (dane o kluczowym znaczeniu dla instytucji); utrata prywatności (dane osób prywatnych); brak integralności (powstanie niespójnych lub błędnych danych); uniemożliwienie dostępu.
54
Zabezpieczenia systemowe:
Uprawnienia; Perspektywy (użytkownik nie jest świadom istnienia atrybutów i wierszy, które nie znajdują się w perspektywie – bardziej ograniczony dostęp niż do relacji z odpowiednimi prawami); Składowanie (wykonywany okresowo proces tworzenia kopii bazy danych i pliku dziennika na dodatkowych nośnikach pamięci) i odtwarzanie (w razie awarii kopia archiwalna i szczegóły zapisane w dzienniku służą do odtworzenia spójnego, jak najbardziej aktualnego stanu bazy danych ); Integralność (więzy integralności zapobiegają wystąpieniu niepoprawnych danych, które mogłyby spowodować wygenerowanie); Szyfrowanie (symetryczne i niesymetryczne);
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.