III EKSPLORACJA DANYCH

Slides:



Advertisements
Podobne prezentacje
Data Mining w e-commerce
Advertisements

Teoria układów logicznych
Metody losowania próby
Statystyka Wojciech Jawień
Zmienne losowe i ich rozkłady
Minimalne drzewa rozpinające
REGUŁOWO-MODELOWE SKORUPOWE SYSTEMY EKSPERTOWE Część 1
VI Rachunek predykatów
Skale pomiarowe – BARDZO WAŻNE
BUDOWA MODELU EKONOMETRYCZNEGO
Badania operacyjne. Wykład 2
KNW- Wykład 8 Wnioskowanie rozmyte.
Programowanie liniowe całkowitoliczbowe
MATEMATYCZNO FIZYCZNA
Statystyka w doświadczalnictwie
Algorytmy generowania reguł decyzyjnych
Analiza korelacji.
Czy potrafimy obliczyć wartość wyjścia sieci znając wartości jej wejść? Tak, przy założeniu, że znamy aktualne wartości wag i progów dla poszczególnych.
Model lingwistyczny – wnioskowanie Mamdani’ego
Niepewności przypadkowe
Klasyfikacja Obcinanie drzewa Naiwny klasyfikator Bayes’a kNN
Odkrywanie wzorców sekwencji
Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych
Odkrywanie wzorców sekwencji
Pobieranie próby Populacja generalna: zbiór wyników wszystkich możliwych doświadczeń określonego typu. Próba n-wymiarowa: zbiór n wyników doświadczeń.
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
FP-Growth Adam Pieśkiewicz Kamil Niezręcki Krzysztof Grześkowiak
FP-Growth Adam Pieśkiewicz Kamil Niezręcki Krzysztof Grześkowiak Michał Kucal
FP-Growth Adam Pieśkiewicz Kamil Niezręcki Krzysztof Grześkowiak Michał Kucal
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Podstawy układów logicznych
Seminarium 2 Krzywe kalibracyjne – rodzaje, wyznaczanie, obliczanie wyników Równanie regresji liniowej Współczynnik korelacji.
Elementy Rachunku Prawdopodobieństwa i Statystyki
dr hab. Ryszard Walkowiak prof. nadzw.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Gramatyki Lindenmayera
Rozkłady wywodzące się z rozkładu normalnego standardowego
Zadanie programowania liniowego PL dla ograniczeń mniejszościowych
Zadanie programowania liniowego PL dla ograniczeń mniejszościowych
Technika optymalizacji
Algorytm DIC Dynamic Itemset Countin
VI EKSPLORACJA DANYCH Zadania eksploracji danych: klasyfikacja
IV EKSPLORACJA DANYCH Zadania eksploracji danych: klasyfikacja
SYSTEMY EKSPERTOWE I SZTUCZNA INTELIGENCJA
PRZYGOTOWALI Bartosz Pawlik Daniel Sawa Marcin Turbiński.
Testowanie hipotez statystycznych
Gramatyki Lindenmayera
Wyszukiwanie maksimum funkcji za pomocą mrówki Pachycondyla Apicalis.
Co to jest dystrybuanta?
URZĄDZENIA TECHNIKI KOMPUTEROWEJ
Wnioskowanie statystyczne
Zagadnienia AI wykład 5.
Statystyka medyczna Piotr Kozłowski
Projektowanie relacyjnych baz danych – diagramy związków encji
Rozkład wariancji z próby (rozkład  2 ) Pobieramy próbę x 1,x 2,...,x n z rozkładu normalnego o a=0 i  =1. Dystrybuanta rozkładu zmiennej x 2 =x 1 2.
Systemy wspomagające dowodzenie twierdzeń
Analiza (odkrywanie) Asocjacji 2 Association rule learning
Regresja liniowa. Dlaczego regresja? Regresja zastosowanie Dopasowanie modelu do danych Na podstawie modelu, przewidujemy wartość zmiennej zależnej na.
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Gramatyki Lindenmayera
BAZY DANYCH Microsoft Access Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i.
Statystyczne parametry akcji Średnie Miary rozproszenia Miary współzależności.
IFS, IFSP I GRA W CHAOS ZBIORY FRAKTALNE I WYBRANE SPOSOBY ICH GENEROWANIA.
Zarządzanie projektami
Statystyczna analiza danych
Metody sztucznej inteligencji - Technologie rozmyte i neuronowe 2015/2016 Systemy rozmyte – wnioskowanie Mamdani’ego I © Kazimierz Duzinkiewicz, dr hab.
Statystyka matematyczna
METROLOGIA Statystyczne metody poprawienia dokładności
Jednorównaniowy model regresji liniowej
PODSTAWY STATYSTYKI Wykład udostępniony przez dr hab. Jana Gajewskiego
Zapis prezentacji:

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Model jest globalnym, ogólnym opisem zbioru danych. Może być opisowy, podsumowujący dane w dogodny i zwięzły sposób, lub też indukcyjny, pozwalający formułować wnioski o populacji, z której pobrane zostały dane lub o prawdopodobnych wartościach przyszłych danych. Model (struktura modelu) mówi coś o każdym punkcie w całej przestrzeni pomiarowej. .

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Wzorzec jest lokalną cechą danych, obowiązującą być może jedynie dla kilku rekordów lub kilku zmiennych (lub obudwu tych rzeczy). Wzorce są interesujące, ponieważ odzwierciedlają odchylenia od ogólnej partii danych: para zmiennych mająca szczególnie wysoką korelację, zbiór elementów mających wyjątkowo duże wartości niektórych zmiennych, grupa rekordów, która zawsze daje ten sam wynik na jakichś zmiennych. Przykładem wzorca jest lokalna cecha w p-wymiarowej przestrzeni zmiennych, taka jak moda funkcji gęstości, lub punkt przegięcia krzywej regresji. .

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Reguły asocjacyjne przybierają postać „Jeżeli poprzednik, to następnik razem z miarą wsparcia i ufności reguły.

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Przy założeniu (upraszczającym), że wszystkie zmienne są binarne, reguła asocjacyjna przyjmuje następującą postać: IF A = 1 AND B = 1 THEN C = 1 z prawdopodobieństwem p, gdzie: p = p (C = 1│A = 1, B = 1) jest prawdopodobieństwem warunkowym, że C = 1 pod warunkiem, że A = 1 i B = 1

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Prawdopodobieństwo warunkowe p jest nazywane dokładnością, albo ufnością reguły. Zaś p = p (A = 1, B = 1, C = 1) jest nazywane wsparciem.

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Zbiór zdarzeń Częstość zbioru zdarzeń Zbiór częsty

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Odkrywanie reguł asocjacyjnych jest procesem dwu etapowym: 1. Znajdź wszystkie częste zbiory zdarzeń; to znaczy znajdź zbiory zdarzeń o częstości ≥φ 2. Na podstawie częstych zdarzeń utwórz reguły asocjacyjne R, które spełniają warunek minimalnego wsparcia i poziomu ufności

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Algorytm A priori korzysta z właściwości A priori Właściwość A priori Jeżeli zbiór zdarzeń Z nie jest częsty, to dla dowolnego elementu A, Z  A nie będzie częste

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Przykład za: Daniel T. Larose „Odkrywanie wiedzy z danych” Wydawnictwo Naukowe PWN

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Przykład za: Daniel T. Larose „Odkrywanie wiedzy z danych” Wydawnictwo Naukowe PWN

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Przykład za: Daniel T. Larose „Odkrywanie wiedzy z danych” Wydawnictwo Naukowe PWN

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Zbiory zdarzeń są łączone, jeżeli mają wspólnych k-1 elementów Przykład za: Daniel T. Larose „Odkrywanie wiedzy z danych” Wydawnictwo Naukowe PWN

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Przykład za: Daniel T. Larose „Odkrywanie wiedzy z danych” Wydawnictwo Naukowe PWN

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Przykład za: Daniel T. Larose „Odkrywanie wiedzy z danych” Wydawnictwo Naukowe PWN

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Tworzenie reguł asocjacyjnych R 1. Utwórz wszystkie podzbiory ze zbiorów częstych 2. Utwórz zbiór/zbiory ss będące zbiorem niepustym. Rozważ regułę asocjacyjną R: ss⇒(s-ss) Stwórz i zwróć R, jeżeli R spełnia minimalne wymagania ufności.

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Z utworzonych zbiorów częstych dwuelementowych F2 i trzyelementowych F3 tworzymy zbiory ss

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie Niech s {szparagi, fasola, kabaczki} Wówczas ss {szparagi, fasola}, ss-s {kabaczki} Wsparcie i ufność

III EKSPLORACJA DANYCH Zadania eksploracji danych: odkrywanie