Jak 5 narzędzi złożyło się na sukces projektu Hurtowni Danych

Slides:



Advertisements
Podobne prezentacje
Piotr Czekalski, ZMiTAC, Politechnika Śląska 2003
Advertisements

Agile w praktyce, czyli jak to robimy naprawdę
Copyright © 2006 Quest Software Wybrane Narzędzia z Oferty Quest Software Dedykowane dla Baz Danych MACIEJ POGORZELSKI.
Horyzontalne scenariusze pracy
ADAM Active Directory w trybie aplikacyjnym
OLAP budowa aplikacji analitycznych w MS SQL 2000 i Yukon
Microsoft Office System w praktyce wdrożenie w COMARCH-CDN
Optymalizacja infrastruktury biznesowej
(Content Management System)
Content Management System
Tomasz Smieszkoł - 15 stycznia
Dokumentowanie wymagań w języku XML
Opracowanie studium przypadku w SAS ETL Studio
ETL – wymiana danych Michał Jabłonka
Wykład 6 Wojciech Pieprzyca
Information Bridge Framework platforma integracji Microsoft Office 2003 z aplikacjami Line of Business Krzysztof Michalski10/01/2005.
7. Platformy informatyczne przyszłości (wizja SAP)
Projekt i implementacja aplikacji do zasilania bazy danych testowymi danymi Jacek Lis Promotor: prof. dr hab. inż. Włodzimierz KASPRZAK.
Analiza, projekt i częściowa implementacja systemu obsługi kina
Zarządzanie transakcjami w SQL Server
Architektura systemów wykorzystujących bazy danych (systemów bazodanowych) Wykład S. Kozielski.
Lider rynku Źródło: The OLAP Report Źródło: Gartner Group
Wykład 2 Cykl życia systemu informacyjnego
Projekt i implementacja aplikacji wspomagającej testowanie oprogramowania, zgodne z metodologią Unified Software Development Process (RUP). Włodzimierz.
SZPIF – Harmonogram, Opis narzędzi, Schemat bazy danych
© Victo Testowanie dla menedżerów Wersja TDM Slajd 1 (27) Testowanie oprogramowania dla menedżerów Co menedżerowie i kierownicy naprawdę potrzebują
Microsoft Sharepoint 2010 – Peter Dabrowski
PowerPivot dla DBA mgr inż. Paweł Potasiński.
Nowoczesny system zarządzania firmą
Stanisław Jerzy Niepostyn, Ilona Bluemke Instytut Informatyki,
Continuous Integration
Kompleksowe zarządzanie jakością informacji (TIQM)
Arkusze kalkulacyjne, część 3
Tryb tabelaryczny w Analysis Services 2012
Król Excel 2013 Dynastii ciąg dalszy Grzegorz Stolecki
Zarządzanie danymi biznesowymi za pomocą usług EIM serwera SQL 2012, czyli jak SSIS, MDM i DQS rozwiązują problem błędnych danych Marcin Szeliga
Promotor: dr.inż. Aleksandra Werner
Microsoft Solution Framework
Wsparcie pracy grupowej systemem Workflow
Metadane w opisie hurtowni danych oraz procesie ETL
Self Service Business Intelligence Witajcie po ciemnej stronie mocy!
Moduł: Informatyka w Zarządzaniu
1 Każdy obiekt jest scharakteryzowany poprzez: tożsamość – daje się jednoznacznie wyróżnić; stan; zachowanie. W analizie obiektowej podstawową strukturą
Duży efekt małym kosztem, czyli SQL Server nie tylko jako baza danych
Metodyka zarządzania projektami w nurcie Agile
Zaawansowane techniki obiektowe
Bazy i Systemy Bankowe Sp. z o.o. ul. Kasprzaka 3, 85 – 321 Bydgoszcz
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Agenda O Nas Ogólne informacje o Produkcie Job Manager – idealne rozwiązanie Aplikacja Webowa Aplikacja Kliencka Najnowsze zmiany.
Światłowód Wiedzy źródłem motywacji do dzielenia się wiedzą Eksperta
PROINFO System zarządzania informacją o przedsięwzięciu informatycznym Seminarium dyplomowe 2004 WIiZ Politechnika Poznańska.
Projekt współfinansowany ze środków Unii Europejskiej i budżetu państwa Partnerzy projektu: Program do analizowania i weryfikowania danych dla JST i kuratoriów.
Copyright © Jerzy R. Nawrocki Team Software Process Inżynieria oprogramowania II Wykład.
FIX FULLY INTEGRATED CONTROL SYSTEM W PEŁNI ZINTEGROWANY SUSTEM WIZUALIZACJI.
Wdrożenie Foglight w Urzędzie Dozoru Technicznego
Moduł e-Kontroli Grzegorz Dziurla.
Zintegrowany monitoring infrastruktury IT w Budimex
1 WebCenter 14 – Co nowego? Rozwiązanie ESKO w zakresie zarządzania produkcją opakowań.
T ESTY JEDNOSTKOWE W C# Alicja Majka, A GENDA Wprowadzenie do środowiska Czym są testy jednostkowe i po co je stosować? XUnit, NUnit Pokrycie.
Zintegrowane systemy informatyczne
Opracowanie studium przypadku w SAS ETL Studio Systemy baz danych i hurtowni danych Ludmiła Binek Katarzyna Rafalska
Testy jednostkowe. „Test jednostkowy (unit test) to fragment kodu, który sprawdza inny fragment kodu”
InMoST Wielkopolska sieć współpracy w zakresie innowacyjnych metod wytwarzania oprogramowania Termin realizacji: – Innowacyjne metody.
Weed Wizualna eksploracja danych Andrzej Bartoszek Adam Dudczak Przemysław Gwóźdz Jakub Jankowski.
Optymalizacja zapytań w SQL Server
SQL Server Analysis Services Action!
Gotowy intranet dla platformy
Kurs Access.
Zapis prezentacji:

Jak 5 narzędzi złożyło się na sukces projektu Hurtowni Danych Przemysław Dzierżak, Maciej Skrzos High Wheel Software przemyslaw.dzierzak@highwheelsoftware.com maciej.skrzos@highwheelsoftware.com

O nas – Maciej Skrzos 8 lat doświadczenia, jako Programista BI, Od 2 lat Team Leader, Lider PLSSUG Trójmiasto, organizator konferencji AnalyticsConf, Software Development Manager w BEST SA, Współtwórca High Wheel Software

O nas – Przemysław Dzierżak (prawie) 12 lat pracy z danymi (C++, C#, MSSQL BI) 5 lat jako lider zespołów hurtowni danych MCSE: Business Intelligence Współtwórca High Wheel Software

Agenda Wprowadzenie, Architektura rozwiązania, Wyzwania, Nasze rozwiązania.

Wprowadzenie Nowy projekt Efekt – lepszy od oczekiwań Continuous Integration Feature Driven Development

Architektura rozwiązania SQL BI Methodology – Alberto Ferrari, Marco Russo https://www.sqlbi.com/articles/sqlbi-methodology/

Architektura rozwiązania (2) Aplikacje zewnętrzne ODS Analysis Services System 1 ETL Reporting Services System 2 Extract Area Staging Area Data Warehouse ETL ETL ETL widoki Excel … Configuration System N Inne…

Wyzwania

Wskaźniki decydujące o sukcesie projektu Time to market: czas potrzebny na wdrożenie zmiany na serwer produkcyjny, liczony od akceptacji wymagania biznesowego. Optymalizacja czasu wytwarzania oraz wdrożeń nowych wersji. Niezawodność: dostępność środowisk: produkcyjnego, preprodukcyjnego oraz UAT. Mniejsza liczba awarii, poprawa czasu dostępności środowiska po awarii. SQLDay 2017

Narzędzia

Narzędzie 1 Standardy

Co standaryzować? Wszystko co można nazwać :) Pakiety Składowe pakietów Tabele pośrednie (Extract, Staging) i kolumny Powtarzalne czynności (np. opis/lista kontrolna na wiki) Definition Of Done Fragmenty obsługujące błędy, logujące itp. Architektura rozwiązania Proces wytwarzania

Standaryzacja - efekty Łatwiejsze: Wydobywanie informacji o projekcie Wykorzystywane tabele i kolumny w systemach źródłowych Zależności między pakietami ETL, tabelami i kolumnami Nawigacja po projekcie, utrzymanie jakości kodu (porządek) Pisanie skryptów, automatyzacja Inteligentne szablony pakietów [DEMO]

Utrzymanie standardów Sprawa całego zespołu Dyskusja ( np. retrospektywy ) Code review Statyczna analiza kodu

Standardów się nie omija Je się ZMIENIA

Narzędzie 1 ½ Metadane SQLDay 2017

Metadane U nas: Atrybuty wymiarów - typ SCD (Nieoczywiste) zależności pomiędzy pakietami Przechowywanie w formie tabel (lub innej przyjaznej komputerom)

Standaryzacja i metadane - przykłady Wznawianie przeliczania hurtowni po błędzie nazwa klocka -> nazwa pakietu który uruchomić Metadane -> zależności między pakietami Katalog SSIS -> czy pakiet udało się uruchomić [DEMO]

Chcesz żeby komputer pracował za ciebie? Dokumentuj tak, aby komputer mógł to przeczytać

Wpływ na wskaźniki? Dodatkowo: Time to market – szybsze wytwarzanie kodu, podstawa automatyzacji. Niezawodność – skrócenie czasu przywrócenia Hurtowni po awarii. Dodatkowo: Spójność to: [+5 do profesjonalizmu ;) ] lepsze postrzeganie projektu zaufanie do prezentowanych danych Łatwiejsze: wprowadzanie nowego członka zespołu szkolenie użytkowników

Zarządzalny projekt bazy danych Narzędzie 2 Zarządzalny projekt bazy danych

„Jedna” instalacja hurtowni danych DEV TEST PrePROD PROD

Projekt hurtowni danych Hurtownia danych to: Logika – ETL: SSIS Kostki: SSAS Raporty: SSRS Struktury bazodanowe: MSSQL

Projekt hurtowni danych Hurtownia danych to: Logika – ETL: SSIS -> .ISPAC -> ISDeploymentWizard Kostki: SSAS Raporty: SSRS Struktury bazodanowe: MSSQL

Projekt hurtowni danych Hurtownia danych to: Logika – ETL: SSIS -> .ISPAC -> ISDeploymentWizard Kostki: SSAS -> .ASDATABASE (i in.) -> Microsoft.AnalysisServices.Deployment.exe Raporty: SSRS Struktury bazodanowe: MSSQL

Projekt hurtowni danych Hurtownia danych to: Logika – ETL: SSIS -> .ISPAC -> ISDeploymentWizard Kostki: SSAS -> .ASDATABASE (i in.) -> Microsoft.AnalysisServices.Deployment.exe Raporty: SSRS -> „Publish” Struktury bazodanowe: MSSQL

Projekt hurtowni danych Hurtownia danych to: Logika – ETL: SSIS -> .ISPAC -> ISDeploymentWizard Kostki: SSAS -> .ASDATABASE (i in.) -> Microsoft.AnalysisServices.Deployment.exe Raporty: SSRS -> „Publish” devenv.com /deploy Release reports.sln Struktury bazodanowe: MSSQL

Projekt hurtowni danych Hurtownia danych to: Logika – ETL: SSIS -> .ISPAC -> ISDeploymentWizard Kostki: SSAS -> .ASDATABASE (i in.) -> Microsoft.AnalysisServices.Deployment.exe Raporty: SSRS -> „Publish” devenv.com /deploy Release reports.sln Struktury bazodanowe: MSSQL -> ?

SQL Server Data Tools

SQL Server Data Tools – SQLPackage.exe Baza danych Projekt SSDT .DACPAC

SQL Server Data Tools – Schema Compare

SSDT – konfiguracja wdrożenia

SSDT – konfiguracja wdrożenia (2)

SSDT i DAC Framework – workflow .DACPAC Aktualna struktura bazy danych SQL Server Data Tools SQLPackage.exe .publish.xml

Automatyczne budowanie wersji Narzędzie 3 Automatyczne budowanie wersji

Budowanie wersji - MSBuild [DEMO] MSBuild.exe /t:Clean;Build build_package.proj

Instalator – cmd  SQLPackage.exe /Action:Publish -> bazy danych ISDeployWizard.exe -> ETL Microsoft.AnalysisServices.Deployment.exe -> kostki Devenv.com /Deploy -> raporty sqlcmd.exe -> zmiany jobagent-a, „gdy się inaczej nie da”

Wpływ na wskaźniki? Dodatkowo: Time to market – szybsze wdrożenia. Niezawodność – mniejsza liczba błędów przy wdrożeniach. Dodatkowo: Wersjonowanie bazy danych – możliwość zarządzania funkcjonalnościami

System kontroli wersji Narzędzie 4 System kontroli wersji

System kontroli wersji Tu: SVN SSIS się słabo merge’uje, Był używany w organizacji (Jest darmowy) Alternatywy: GIT TFS Branchowanie Wersja „bieżąca” – developerska Wersja „do testów” – wszystkie zadania w pełni zaimplementowane Wersja „na produkcję” – zadania przetestowane i decyzja biz. wdrażać

Continuous Integration

Continuous Integration Dostępność źródeł (SVN) + możliwość zbudowania paczki instalacyjnej (SSDT, MSBuild) + możliwość wdrożenia wsadowo paczki (CMD) + uruchomienie przeliczania hurtowni po wdrożeniu + Testy poprawności hurtowni (skrypty SQL, raporty SSRS) = Continuous Integration

Testy

Testy jednostkowe SQLDay 2017

Raport zdrowia

Narzędzie 5 BIML

Czym jest BIML? Alternatywa w XML + C# dla języka obrazkowego SSIS Generowanie wielu pakietów na podstawie metadanych Za darmo: BIDS Helper BIML Express Wersja płatna MIST

Wykorzystanie BIML Szablony vs. BIML Pakiety sterujące hurtowni – bolączka SVN Wady: Nowe kompetencje w zespole Koszt MIST-a

Wpływ na wskaźniki? Dodatkowo: Time to market – automatyzacja wytwarzania (SSIS). Niezawodność – mniejsza liczba błędów przy tworzeniu pakietów. Dodatkowo: Elastyczność – możliwość szybszej reakcji na zmiany, łatwiejsze dostosowanie do nowych wymagań

Podsumowanie Standardy i metadane podstawą automatyzacji „Efekt kuli śnieżnej” Zaczynajcie od prostych rozwiązań Time to market i niezawodność

Pytania? maciej.skrzos@highwheelsoftware.com przemyslaw.dzierzak@highwheelsoftware.com