Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Slides:



Advertisements
Podobne prezentacje
Wprowadzenie do Data Miningu
Advertisements

Inteligencja Obliczeniowa Metody oparte na podobieństwie do wzorców.
Projekt Do kariery na skrzydłach – studiuj Aviation Management Projekt współfinansowany ze ś rodków Europejskiego Funduszu Społecznego. Biuro projektu:
OLAP budowa aplikacji analitycznych w MS SQL 2000 i Yukon
WekaSQL Język i aplikacja przetwarzania oraz eksploracji danych.
Klasyfikacja dokumentów tekstowych w oparciu o blogi
WekaSQL Język i aplikacja przetwarzania oraz eksploracji danych.
Additive Models, Trees, and Related Methods
Przykład włamania do aplikacji internetowej poprzez modyfikację zapytań SQL Skrypty ASP Serwer bazy danych MS SQL Server Piotr Kuźniacki BDi.
Lider rynku Źródło: The OLAP Report Źródło: Gartner Group
Techniki eksploracji danych
Licencjonowanie narzędzi dla programistów
Duży efekt małym kosztem, czyli SQL Server nie tylko jako baza danych
Ekonometryczne modele nieliniowe
Ekonometryczne modele nieliniowe
Adaptacyjne Systemy Inteligentne Maciej Bielski, s4049.
Gini index measures the extent to which the distribution of income (or, in some cases, consumption expenditure) among individuals or.
Joanna Tyrowicz Skąd się bierze firma? Ekonomia instytucjonalna.
Informatyka w biznesie Prezentacja promująca specjalność na kierunku ZARZĄDZANIE.
InMoST, Analiza architektury metodą ATAM Jerzy Nawrocki
Wizja rozwoju Uczelni Prof. Wiesław Józef Piekarski SPÓJRZ W PRZYSZŁOŚĆ z Uniwersytetem Przyrodniczym w Lublinie.
TurboCAD Zintegrowany system komputerowego wspomagania projektowania
IEN 2010 © wszelkie prawa zastrzeżone SEMINARIUM Pakiet MATLAB w Zakładzie OGM Możliwości posiadanych produktów.
Ile masz lat? This project has been funded with support from the European Commission. This document reflects the views only of the authors, and the Commission.
© Kazimierz Duzinkiewicz, dr hab. inż. Katedra Inżynierii Systemów Sterowania Modelowanie i podstawy identyfikacji 2015/2016 Modelowanie rozmyte – podstawy,
Pakiety numeryczne Optymalizacja Łukasz Sztangret Katedra Informatyki Stosowanej i Modelowania.
© 2014 IBM Corporation COMMON POLSKA 2014 JDBC z IBM System i Tomasz Piela & Marcin Wilk Global Technlonogy Services, IBM.
Metody Analizy Danych Doświadczalnych Wykład 9 ”Estymacja parametryczna”
Komponentowe i rozproszone Kompozycja gui Cap theorem Wydajne Systemy Rozproszone CQRS.
Co Pan robi? Kim Pani jest? This project has been funded with support from the European Commission. This document reflects the views only of the authors,
Analiza, projekt i implementacja zintegrowanego systemu zarządzania i promocji dla branży gastronomicznej Krzysztof Grabalski 5921.
Dzień dobry! Cześć! This project has been funded with support from the European Commission. This document reflects the views only of the authors, and.
Optymalna wielkość produkcji przedsiębiorstwa działającego w doskonałej konkurencji (analiza krótkookresowa) Przypomnijmy założenia modelu doskonałej.
Metoda zmiennych instrumentalnych i uogólniona metoda momentów
Metody sztucznej inteligencji - Technologie rozmyte i neuronowe 2015/2016 Perceptrony proste nieliniowe i wielowarstwowe © Kazimierz Duzinkiewicz, dr hab.
Warszawska Wyższa Szkoła Informatyki Andrzej Kuska Promotor : dr inż. Paweł Figat Konsultant : mgr inż. Andrzej Ptasznik.
Program realizowany w ramach projektu z przedmiotu: „Aplikacje internetowe i rozproszone”
Mój czas wolny This project has been funded with support from the European Commission. This document reflects the views only of the authors, and the Commission.
Analiza danych genomicznych metodami statystycznymi i inteligencji obliczeniowej Wiktor Młynarski
Studia II stopnia Kierunek: ZARZĄDZANIE
Hoopl Higher-order optimization library
Czy DENY jest zawsze ważniejszy niż GRANT?
Opracowanie: Katarzyna Gagan, Anna Krawczuk
Programowanie Obiektowe – Wykład 1
Informatyczne systemy zarządzania
Systemy eksperckie i sztuczna inteligencja
mutacyjnego algorytmu ewolucyjnego
Bartosz Kowkrak i Aleksander Szydłowski.
Bezpieczeństwo dostępu do danych w systemie Windows
Języki programowania.
Running Dictation Activity to Engage Students in Reading, Writing, Listening, and Speaking.
Katedra Informatyki Stosowanej UMK
Lesson 11 – Problem Solving & Applications of Functions
Dynamics 365 CE i język TypeScript
Zygmunt Kubiak Instytut Informatyki Politechnika Poznańska
Własności statystyczne regresji liniowej
Przepływy międzygałęziowe
Podstawy Informatyki.
Wprowadzenie do teorii ekonometrii
NEMERLE Michał Maliszewski.
Sterowanie procesami ciągłymi
Implementacja rekurencji w języku Haskell
Power Query vs Tableau Prep
Mirosław Kordos Lipiec 2015 Lipiec 2015
dr Danuta Kajrunajtys BUSINESS PROCESS MANAGEMENT ROBOTIC PROCESS
SatMapping Your map from space Cover page
Programowanie sieciowe Laboratorium 3
Łatwa obsługa Prosta instalacja Wieczysta licencja Praca w sieci
Analityka predyktywna dla prawników Maciej Troć
Sztuczna inteligencja w rozpoznawaniu obrazów
Zapis prezentacji:

Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining Mirosław Kordos styczeń 2015

Cel i Idea Prezentacji Końcowy cel Poprawa efektywności procesów technologicznych, biznesowych i innych Sposób Budowa inteligentnego systemu Dlaczego w oparciu o SQL Server data Mining? Niski koszt wejścia Integracja z .NET i SQL Server Forma prezentacji poszczególnych etapów Treść naukowa: co, jak, dlaczego i jakie korzyści Treść programistyczna: jak to zrealizować w SQL Server Data Mining Adresaci Programiści i studenci informatyki styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Plan Prezentacji Proces Predykcji w SQL Data Mining Algorytmy w SQL Server Data Mining Język DMX Eksploracja danych OLAP Excel Data Mining Plug-in Budowa kompleksowego systemu inteligentnego styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Plan Prezentacji Proces Predykcji w SQL Data Mining Algorytmy w SQL Server Data Mining Język DMX Eksploracja danych OLAP i Excel Power Pivot Excel Data Mining Plug-in Budowa kompleksowego systemu inteligentnego styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Co trzeba zainstalować styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Proces Predykcji w SQL Server Data Mining

Plan Prezentacji Algorytmy w SQL Server Data Mining Proces Predykcji w SQL Data Mining Algorytmy w SQL Server Data Mining Język DMX Eksploracja danych OLAP Excel Data Mining Plug-in Budowa kompleksowego systemu inteligentnego styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Algorytmy Predykcji w SQL Server Data Mining Decision Trees Neural Networks Linear Regression Clustering Association Rules Time Series Logistic Regression Naive Bayes Sequence Clustering Możliwość dodania własnych algorytmów styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Algorytmy Predykcji: k-NN Optymalizacja predykcji na poziomie pojedynczego węzła Reguły przez SELECT + Prediction Join styczeń 2015 Mirosław Kordos Do We Need Whatever More than k-NN? Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Czy potrzebujemy jeszcze coś oprócz k-NN? Jaki jest problem z k-NN? K-NN nie generuje reguł logicznych K-NN jest lazy i dlatego nie możemy w łatwy sposób zbudować efektywnego modelu w SQL Server DM Optymalizacja predykcji na poziomie pojedynczego węzła Reguły przez SELECT + Prediction Join styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

– Decision Trees (Drzewa Decyzyjne) Algorytmy Predykcji – Decision Trees (Drzewa Decyzyjne) styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Drzewa Decyzyjne - Regresja V = wariancja, p = liczba wektorów w węźle A Hybrid System with Regression Trees styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Czy potrzebujemy jeszcze coś oprócz Drzew Decyzyjnych? Jaki jest problem z drzewami decyzyjnymi? styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Czy potrzebujemy jeszcze coś oprócz Drzew Decyzyjnych? Jaki jest problem z drzewami decyzyjnymi? styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Czy potrzebujemy jeszcze coś oprócz Drzew Decyzyjnych? Jaki jest problem z drzewami decyzyjnymi? styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Czy potrzebujemy jeszcze coś oprócz Drzew Decyzyjnych? Jaki jest problem z drzewami decyzyjnymi? styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Czy potrzebujemy jeszcze coś oprócz Drzew Decyzyjnych? Jaki jest problem z drzewami decyzyjnymi? styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Czy potrzebujemy jeszcze coś oprócz Drzew Decyzyjnych? Jaki jest problem z drzewami decyzyjnymi? styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Czy potrzebujemy jeszcze coś oprócz Drzew Decyzyjnych? Jaki jest problem z drzewami decyzyjnymi? Optymalizacja podziału w danym węźle jest optymalna tylko dla danego danego węzła i danego artybutu – brak bieżącej optymalizacji globalnej styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining V = wariancja, p = liczba wektorów w węźle

Algorytmy Predykcji – Neural Networks (Sieci Neuronowe) Y=(1-exp(-βu))/(1+exp(-βu)) MLP – Multilayer Perceptron styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Sieć MLP - Multilayed Perceptron styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Uczenie sieci neuronowej MLP iteracyjna modyfikacja wartości wszystkich wag (opracowano wiele metod) A Survey of Factors Influencing MLP Error Surface styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Algorytmy Predykcji – Neural Networks styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Algorytmy Predykcji – Neural Networks styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Algorytmy Predykcji – Neural Networks styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Algorytmy Predykcji – Neural Networks styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Algorytmy Predykcji – Neural Networks Jaki jest problem z sieciami neuronowymi? Reguły logiczne - z analizy wag w sieci poprzez aproksymacje funkcji transferu funkcją odcinkowo-liniową (lub ewentualnie w inne sposoby) są przeważnie znacznie bardziej złożone niż reguły z drzew decyzyjnych Joining Advantages of Decision Trees and Neural Networks styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Algorytmy Predykcji – Linear Regression 𝑦= 𝑎 0 + 𝑎 1 𝑥 1 + 𝑎 2 𝑥 2 + ... + 𝑎 𝑛 𝑥 𝑛 styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Algorytmy Predykcji – Linear Regression Jaki jest problem z regresją liniową? Regresja liniowa jest liniowa styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Algorytmy Predykcji: Clustering styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Algorytmy Predykcji: Clustering styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Algorytmy Predykcji: Clustering styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Algorytmy Predykcji: Clustering styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Algorytmy Predykcji: Clustering styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Inne Algorytmy Predykcji w SQL Server DM Association Rules Time Series Logistic Regression Naïve Bayes Sequential Clustering styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Inne Algorytmy Predykcji w SQL Server DM Jaki algorytm zastosować? Decision Trees Neural Networks Linear Regression Clustering Association Rules Time Series Logistic Regression Naive Bayes Sequence Clustering Możliwość dodania własnych algorytmów styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Inne Algorytmy Predykcji w SQL Server DM Jaki algorytm zastosować? Trzeba samodzielnie napisać? ważony 9-NN Jakie mają właściwości? Jak działają na naszych danych? A może specjalna kombinacja? styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Tworzenie własnych algorytmów predykcji COM Wydajność Integracja z SQL Server Najtrudniej stworzyć .NET CLR Łatwiej stworzyć Kompatybilność z kodem aplikacji .NET CLR Stored Procedures Najłatwiej stworzyć Niedostępne w projekcie Analysis Services styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Plan Prezentacji Język DMX Proces Predykcji w SQL Data Mining Algorytmy w SQL Server Data Mining Język DMX Eksploracja danych OLAP Excel Data Mining Plug-in Budowa kompleksowego systemu inteligentnego styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

DMX - Data Mining Extensions DMX w projekcie Analysis Services DMX w SQL Management Studio DMX w aplikacji użytkownika styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Plan Prezentacji Eksploracja danych OLAP Proces Predykcji w SQL Data Mining Algorytmy w SQL Server Data Mining Język DMX Eksploracja danych OLAP Excel Data Mining Plug-in Budowa kompleksowego systemu inteligentnego styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Data Mining na danych OLAP styczeń 2015 Mirosław Kordos źródło: technet.microsoft.com Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Plan Prezentacji Excel Data Mining Plug-in Proces Predykcji w SQL Data Mining Algorytmy w SQL Server Data Mining Język DMX Eksploracja danych OLAP Excel Data Mining Plug-in Budowa kompleksowego systemu inteligentnego styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Plan Prezentacji Budowa kompleksowego systemu inteligentnego Proces Predykcji w SQL Data Mining Algorytmy w SQL Server Data Mining Język DMX Eksploracja danych OLAP Excel Data Mining Plug-in Budowa kompleksowego systemu inteligentnego styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Ensembles - Komitety średnia lub głosowanie z PREDICTION JOIN styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Ensembles - Komitety Metody różnicowania modeli: Różne wektory (Bagging) Selekcja cech Różne algorytmy Local Experts: przydział do klastra i predykcja przez jego model styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Przygotowanie danych Selekcja cech Klasteryzacja Normalizacja / standardyzacja Transformacje styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Przygotowanie danych Selekcja cech Klasteryzacja Normalizacja / standardyzacja Transformacje styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Przygotowanie danych Selekcja cech Klasteryzacja Normalizacja / standardyzacja Transformacje styczeń 2015 Mirosław Kordos Selekcja wektorów Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Selekcja wektorów Podobnie jak k-NN, selekcja wektorów nie ma charakteru typowego algorytmu SQL Server Data Mining. Instance Selection in Logical Rule Extraction for Regression Problems The purpose of CNN (Condensed Nearest Neighbor) is to reject these instances, which do not bring any additional information into the classification process. The algorithm starts with only one randomly chosen instance from the original dataset T. And this instance is added to the new dataset P. Then each remaining instance from T is classified with the k-NN algorithm, using the k nearest neighbors from the dataset P. Only if the classification is wrong - the instance is added to P. Ensembles of Instance Selection Methods in Regression Problems

Przykładowy System Inteligentny styczeń 2015 Mirosław Kordos Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining

Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining bazy danych, literatura i inne materiały wykorzystane w prezentacji: www.kordos.com/pw Oprogramowanie użyte w prezentacji: SQL Server 2014 Developer Edition, Visual Studio 2013 Professional Upddate 3, SQL Server Data Tools Business Intelligence for VS 2013, Excel 2010, Data Mining Add-ins for Excel, Power Pivot Add-ins for Excel Mirosław Kordos styczeń 2015