Data Mining w e-commerce Cz. 2
szablony wyszukiwania reguł asocjacyjnych generowanie drzewa decyzyjnego reguły decyzyjne
1. Szablony Szablony: najprotsza forma wzorców Problem wyszukiwania szablonów Algorytmy odkrywania szablonów Zastosowania szablonów
Zbiór danych:szablony Obiekty Atrybuty rzeczywiste symboliczne System informacyjny System decyzyjny
Problemy Znaleźć regularne zjawiska w danej tablicy który szablon jest bardziej interesujący? Dekompozycja dużych tablic Odkrywanie charakterystyk Jak wykrywać szablony dla tablic zachowanych w bazach danych (SQL, OQL)
Reguły asocjacyjne Problem wyszukiwania reguł asocjacyjnych Algorytm odkrywania reguł asocjacyjnych Zastosowania (katalogi, rozmieszczenie towarów w sklepie, segmentacja klientów, diagnoza awarii, itp..)
Drzewa decyzyjne Problem generowania optymalnego drzewa decyzyjnego Konstrukcja drzew decyzyjnych Zagadnienia praktyczne Zastosowanie w problemie klasyfikacji
Dlaczego ? Proces klasyfikacji jest efektywny obliczeniowo O ile drzewa nie są zbyt skomplikowane, reprezentacja ta jest czytelna dla człowieka Istnieje łatwa możliwość przejścia od drzew decyzyjnych do reguł decyzyjnych.ż
Przycinanie drzewa zasada krótkiego opisu: skracamy opis kosztem dokładności klasyfikacji w zbiorze treningowym zastąpienie podrzewa nowym liściem (przycinanie) lub mniejszym podrzewem.
reguły decyzyjne Reguły decyzyjne: prosty opis klas decyzyjnych Problem wyszukiwania reguł decyzyjnych Algorytmy generowania reguł decyzyjnych (Sekwencyjne pokrywanie,Algorytm AQ)