Algorytmy generowania reguł decyzyjnych KRZYSZTOF KAŁUŻNY PIOTR PIKUSA
Plan prezentacji Reguły asocjacyjne w teorii i praktyce Cele i zadania Wymagania Wybór algorytmów Plan działania
Reguły asocjacyjne (association rules) znaleźć korelacje wiążące współwystępowanie podzbiorów elementów w dużej kolekcji zbiorów, reguły postaci: X → Y (sup, conf), gdzie : - X, Y są rozłącznymi zbiorami elementów, - sup = wsparcie, oznacza częstotliwość występowania X U Y, - conf = ufność, oznacza prawdopodobieństwo warunkowe P(Y│X)
Reguły asocjacyjne - przykład Itemset Temperature Wind Humidity Play 1 Warm Calm Dry Yes 2 Cold 3 Windy Raining No 4 Gale 5 (Warm, Dry) → Yes sup = 20%, conf = 100% (Dry) → Yes sup = 40%, conf = 67% (Cold, Raining) → No sup = 40%, conf = 100%
Cele i zadania zapoznanie się z kilkoma popularnymi metodami generowania reguł asocjacyjnych porównanie ich pod względem szybkości działania i kosztowności (np. pamięciowej) wybranie najbardziej obiecujących metod i zaimplementowanie ich przygotowanie (w formie raportu) zbiorczego porównania badanych algorytmów i opis problemów i zastosowanych w implementacji rozwiązań
Wymagania wczytywanie pliku z danymi wejściowymi parametryzacja aplikacji ze względu na minimalne progi wsparcia i ufności zapis reguł do pliku tekstowego reguły postaci N : 1
Frequent Itemset Mining Implementations Repository Wybór algorytmów Frequent Itemset Mining Implementations Repository (http://fimi.cs.helsinki.fi/) PatriciaMine (DFS, iterations) FP-Growth
Plan działania zapoznanie się z algorytmami generowania reguł asocjacyjnych prezentacja wstępna [17.03.2008] analiza wybranych algorytmów pod kątem implementacji prezentacja (seminarium) [21.05.2008] opracowanie raportu z przeprowadzonych doświadczeń i prezentacja wyników