Slowly changing dimension w SSIS

Slides:



Advertisements
Podobne prezentacje
SQL – Strukturalny język zapytań
Advertisements

Interfejs użytkownika do zarządzania konfiguracją oprogramowania
TEMAT: Tworzenie prostych tabel
Elementarne struktury danych Piotr Prokopowicz
Komponenty bazy danych Baza danych Jest to uporządkowany zbiór powiązanych ze sobą danych charakterystycznych dla pewnej klasy obiektów lub zdarzeń,
25/08/ Bazy danych II Piotr Górczyński Instrukcja UPDATE.
MS Access 2000 Piotr Górczyński Dane w tabelach.
Kwerendy –wszystkie typy (usuwające, aktualizujące i inne)
Opracowanie studium przypadku w SAS ETL Studio
Co to jest studium przypadku?
Język definicji danych (Data Definition Language)
Dynamiczne struktury danych 1
Wykład 7 Wojciech Pieprzyca
Programowanie wizualne PW – LAB5 Wojciech Pieprzyca.
To idealne narzędzie do zarządzania komunikacją z klientami i prowadzenia kampanii sprzedażowych na najwyższym poziomie.
WYKONYWANIE ZAPYTAŃ Przygotował Lech Banachowski na podstawie: 1.Raghu Ramakrishnan, Johannes Gehrke, Database Management Systems, McGrawHill, 2000 (książka.
Ochrona danych wykład 3.
dr inż. Piotr Muryjas Wyższa Szkoła Przedsiębiorczości i Administracji
PROJEKTOWANIE TABEL W PROGRAMIE: ACCESS
DIAGRAMY ER 2 (ENTITY-RELATIONSHIP DIAGRAMS 2) Ćwiczenia 2.
import danych; sumy pośrednie; tabela przestawna; konsolidacja danych
WSPARCIE DLA BIZNESU / STR. 2 Mikołaj Gomółka UpGreat Systemy Komputerowe Sp. z o.o Poznań, ul Ostrobramska 22 Tel Faks: 0-61.
Władcy Danych Wykorzystanie Master Data Services do zapanowania nad wszechobecnym chaosem Paweł Potasiński.
Bazy danych.
Administracja serwerem bazy danych Oracle 11g Zarządzanie strukturą bazy danych Wykład nr 2 Michał Szkopiński.
Instrukcje: CREATE, INSERT, UPDATE, DELETE, DROP
Zarządzanie danymi biznesowymi za pomocą usług EIM serwera SQL 2012, czyli jak SSIS, MDM i DQS rozwiązują problem błędnych danych Marcin Szeliga
Bazy danych podstawowe pojęcia
Rozpoczęcie pracy z programem DAPP Optic.
Systemy baz danych Wykład 1
CabMan System dyspozytorski.
Prezentacja i szkolenie
Typy diagramów Diagram hierarchii funkcji (HFD)
Tabele historyczne w PostgreSQL
SQL - Structured Query Language
Zarządzanie informacją
Specjalizacja "Dziennikarstwo On-line„ HTML – XHTML Część 4 Prowadzący: Dariusz Jaruga

Specjalizacja "Dziennikarstwo On-line„ HTML – XHTML część 1 Prowadzący: Dariusz Jaruga
Projektowanie bazy danych
Wstęp - Prosta aplikacja internetowa w technologii Java EE 5 Programowanie komponentowe 1.
Domain Specific Language Mac Michał Programujący architekt, konsultant.
Definiowanie kluczy w tabelach RBD
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Dokumenty wysyłkowe A.Ś..
Opracowanie mgr Karol Adamczyk
Komendy SQL do pracy z danymi
Bazy danych.
Ms Access Raporty Marzena Nowakowska WZiMK, PŚk
Projektowanie postaci formularza:
Modelowanie model związków encji
TEMAT: ACCESS - KWERENDY.
BAZY DANYCH Microsoft Access Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i.
Temporalne magazyny danych. Magazyny danych (1) Magazyn danych (hurtownia danych) – zintegrowana materializowana perspektywa (zbiór perspektyw) zdefiniowana.
Filtrowanie, Funkcje bazodanowe
Czym s ą i do czego słu żą ? Narzędzie analityczne arkusza kalkulacyjnego pozwalające filtrować, wybierać, przestawiać kolumny i wiersze z danymi w arkuszu.
T ABELE PRZESTAWNE Daniel Galion. C O TO SĄ TABELE PRZESTAWNE I W JAKIM CELU SIĘ ICH UŻYWA ? Normalna tabela często zbyt mało czytelna ciężej znaleźć.
Tabele Przestawne Adam Wójcik Tomasz Kowalski.  Czym Tabele Przestawne są?  Jak je używać?  Zadania.
„Filtry i funkcje bazodanowe w EXCELU”
ASP.NET Kontrolki źródła danych i prezentacji danych w ASP.Net
Opracowanie studium przypadku w SAS ETL Studio Systemy baz danych i hurtowni danych Ludmiła Binek Katarzyna Rafalska
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego Moduł ECDL-AM5 Bazy danych, poziom zaawansowany Tabele, relacje.
Temat: Tworzenie bazy danych
SQL Server Analysis Services Action!
Menu Opcje.
Indeksy.
Wstęp - Prosta aplikacja internetowa w technologii Java EE 5
Czym są i jak służą społeczeństwu?
Zapis prezentacji:

Slowly changing dimension w SSIS Karol Kuryło karol@kurylo.net

Agenda Co to jest wymiar ? Co to jest wymiar SCD ? Typy wymiarów SCD Metody implementacji w SSIS Demo

Co to jest wymiar Wymiar pozwala grupować, filtrować i nazywać fakty, np.: Wymiar Pracownik Wymiar Produkt Wymiar Region Wymiar Czas Każdy wymiar posiada atrybuty np. w przypadku wymiaru pracownika mogą to być: Imię Nazwisko Oddział Płeć

Co to jest wymiar SCD To wymiary zawierające atrybuty zmieniające się w czasie Wymiary gdzie atrybuty zmieniają się bardzo często, dynamiczne, w regularnych interwałach czasowych to nie jest SCD.

Typy wymiarów SCD Typ 0 – bez zmian Typ 1 – zmiany są nadpisywanie Typ 2 – dodanie nowego wiersza, oznaczenie starego Typ 3 – wykorzystanie dodatkowej kolumny w tabeli Typ 4 – dodatkowa tabela z danymi historycznymi Hybrydy

SCD Type 1 Nadpisuje stare dane nowymi Brak historii ID Numer_pracownika Imie Nazwisko Miasto Plec 1 U101 Adam Kowalski Warszawa M 2 U102 Barbara Nowak Krakow K ID Numer_pracownika Imie Nazwisko Miasto Plec 1 U101 Adam Kowalski Warszawa M 2 U102 Barbara Kowalska K

SCD Type 2 Tworzy nowy rekord Stary oznacza jako nieaktualny Nieograniczona historia ID Numer_pracownika Imie Nazwisko Miasto Plec IsCurrent 1 U101 Adam Kowalski Warszawa M 2 U102 Barbara Nowak Krakow K ID Numer_pracownika Imie Nazwisko Miasto Plec IsCurrent 1 U101 Adam Kowalski Warszawa M 2 U102 Barbara Nowak Krakow K 3 Kowalska

SCD Type 2 ID Numer_pracownika Imie Nazwisko Miasto Plec DateFrom DateTo 1 U101 Adam Kowalski Warszawa M 2001-01-01 9999-12-31 2 U102 Barbara Nowak Krakow K ID Numer_pracownika Imie Nazwisko Miasto Plec DateFrom DateTo 1 U101 Adam Kowalski Warszawa M 2001-01-01 9999-12-31 2 U102 Barbara Nowak Krakow K 2011-02-01 3 Kowalska 2011-02-02

SCD Type 2 & Type 1 ID Numer_pracownika Imie Nazwisko Miasto Plec IsCurrent DateFrom DateTo 1 U101 Adam Kowalski Warszawa M 2001-01-01 9999-12-31 2 U102 Barbara Nowak Krakow 2011-02-01 ID Numer_pracownika Imie Nazwisko Miasto Plec IsCurrent DateFrom DateTo 1 U101 Adam Kowalski Warszawa M 2001-01-01 9999-12-31 2 U102 Barbara Nowak Krakow 2011-02-01 3 Kowalska 2011-02-02 ID Numer_pracownika Imie Nazwisko Miasto Plec IsCurrent DateFrom DateTo 1 U101 Adam Kowalski Warszawa M 2001-01-01 9999-12-31 2 U102 Barbara Nowak Krakow 2011-02-01 3 Kowalska K 2011-02-02

SCD Type 3 Wykorzystanie dodatkowych kolumn na dane historyczne Historia ograniczona do liczby dodatkowych kolumn ID Numer_pracownika Imie Nazwisko Miasto Plec Miasto_archiw 1 U101 Adam Kowalski Warszawa M 2 U102 Barbara Nowak Krakow K ID Numer_pracownika Imie Nazwisko Miasto Plec Miasto_archiw 1 U101 Adam Kowalski Warszawa M 2 U102 Barbara Nowak K Krakow

Metody implementacji DEMO

SCD Wizard Standardowy komponent SSIS Wolny Niewielka możliwość konfiguracji Case sensitive, trailing spaces sensitive Próba ponownego uruchomienia wizarda – zupełnie niszczy dotychczasowy data flow Nie wspiera generowania kluczy podstawowych Domyślnie wstawia NULL w pole daty wygaśnięcia rekordu (zmiana tego i ponowne uruchomienie wizarda, niszczy data flow) Nie można oznaczyć usuniętych wierszy

Merge Dużo szybszy niż SCD Wizard Elastyczny Mało przejrzysty w konfiguracji

Cheksum Transformation Dużo szybszy niż SCD Wizard Wspierane algorytmy: Original checksum – depreciated od SQL 2005 RTM .Net Framework Cheksum – różne wartości na systemach 32/64 bitowych CRC32 – domyślny (problemy z unikalnością) Do ściągnięcia: http://www.sqlis.com/sqlis/

Multiple Hash Dużo szybszy niż SCD WIzard Wspierane algorytmy: MD5, SHA1, SHA256, SHA384, SHA512 Możliwość generowania kilku skrótów w jednej transformacji Do ściągnięcia: http://ssismhash.codeplex.com/

Dimension Merge SCD Dużo szybszy niż SCD Wizard Stanowczo najbardziej rozbudowane narzędzie Szybki, bardzo dużo opcji Na początku może być trudny w konfiguracji Do ściagnięcia: http://dimensionmergescd.codeplex.com/

Dziękuję za uwagę! karol@kurylo.net