WekaSQL Język i aplikacja przetwarzania oraz eksploracji danych
2 WEKA Waikato Environment for Knowledge Analysis (WEKA) Waikato Environment for Knowledge Analysis (WEKA) Zbiór bibliotek implementujących algorytmy maszynowego uczenia i data miningu. Zbiór bibliotek implementujących algorytmy maszynowego uczenia i data miningu. Na licencji GNU General Public Licence Na licencji GNU General Public Licence
3 WekaSQL - Cel projektu rozszerzenia języka SQL do wykonywania obliczeń związanych z ekploracją danych rozszerzenia języka SQL do wykonywania obliczeń związanych z ekploracją danych Stworzenie parsera i aplikacji pozwalającej na wykonywanie zapytań w zaprojektowanym języku i prezentującej ich wyniki Stworzenie parsera i aplikacji pozwalającej na wykonywanie zapytań w zaprojektowanym języku i prezentującej ich wyniki
4 Rozszerzenie języka o możliwość składowania wyników zapytań do bazy danych. Rozszerzenie języka o możliwość składowania wyników zapytań do bazy danych. Umożliwienie oceny i porównania stworzonych klasyfikatorów Umożliwienie oceny i porównania stworzonych klasyfikatorów Poprawa interfejsu graficznego Poprawa interfejsu graficznego WekaSQL - nowości
5 Technologie JAVA J2SE/swing JAVA J2SE/swing WEKA 3.5 WEKA 3.5 MySQL 5.0 MySQL 5.0 JavaCC JavaCC WekaSQL
6 WekaSQL - interfejs
7 WekaSQL - składnia 1. Zdobywanie wiedzy 2. Zarządzanie wiedzą 3. Wykorzystanie wiedzy
8 Nowe możliwości – SPLIT, EVALUATE Użytkownik wprowadza zapytanie w języku Weka-SQL mające na celu nauczenie systemu sposobu klasyfikacji oraz ocenę powstałego klasyfikatora na podstawie zbioru uczącego i testowego. Użytkownik wprowadza zapytanie w języku Weka-SQL mające na celu nauczenie systemu sposobu klasyfikacji oraz ocenę powstałego klasyfikatora na podstawie zbioru uczącego i testowego. SPLIT TABLE "weather_problem" FACTOR 66 INTO "LEARN_WEATHER" AND "TEST_WEATHER"; SPLIT TABLE "weather_problem" FACTOR 66 INTO "LEARN_WEATHER" AND "TEST_WEATHER"; learn classification using J48(-U) as "tree" classindex 4 from learn classification using J48(-U) as "tree" classindex 4 from select outlook, temperature, humidity, windy, play from LEARN_WEATHER; EVALUATE CLASSIFIER "tree" LEARN SET "LEARN_WEATHER" TEST SET "TEST_WEATHER" CLASSINDEX 4; EVALUATE CLASSIFIER "tree" LEARN SET "LEARN_WEATHER" TEST SET "TEST_WEATHER" CLASSINDEX 4;
9 Nowe możliwości – SPLIT, EVALUATE
10 Użytkownik tworzy dwa klasyfikatory oparte na różnych algorytmach. Następnie wykorzystuje stworzone klasyfikatory zapisując wyniki klasyfikacji w tworzonej dynamicznie tabeli. Na końcu porównuje wyniki klasyfikacji. Użytkownik tworzy dwa klasyfikatory oparte na różnych algorytmach. Następnie wykorzystuje stworzone klasyfikatory zapisując wyniki klasyfikacji w tworzonej dynamicznie tabeli. Na końcu porównuje wyniki klasyfikacji. learn classification using J48(-U) as "mytree" classindex 4 learn classification using J48(-U) as "mytree" classindex 4 from select outlook, temperature, humidity, windy, play from LEARN_WEATHER; learn classification using NaiveBayes() as "mynet" classindex 4 learn classification using NaiveBayes() as "mynet" classindex 4 from select outlook, temperature, humidity, windy, play from LEARN_WEATHER; classify with "mytree" classindex 4 into "classify_result" as "tree" classify with "mytree" classindex 4 into "classify_result" as "tree" from select outlook, temperature, humidity, windy, play from LEARN_WEATHER; classify with "mynet" classindex 4 into "classify_result" as "bayes" classify with "mynet" classindex 4 into "classify_result" as "bayes" from select outlook, temperature, humidity, windy, play from LEARN_WEATHER; select * from classify_result; select * from classify_result; Nowe możliwości – utrwalanie wyników
11 Użytkownik twoży dwa klasyfikatory oparte na różnych algorytmach. Następnie wykorzystuje stworzone klasyfikatory zapisując wyniki klasyfikacji w tworzonej dynamicznie tabeli. Na końcu porównuje wyniki klasyfikacji. Użytkownik twoży dwa klasyfikatory oparte na różnych algorytmach. Następnie wykorzystuje stworzone klasyfikatory zapisując wyniki klasyfikacji w tworzonej dynamicznie tabeli. Na końcu porównuje wyniki klasyfikacji. learn classification using J48(-U) as "mytree" classindex 4 learn classification using J48(-U) as "mytree" classindex 4 from select outlook, temperature, humidity, windy, play from LEARN_WEATHER; learn classification using NaiveBayes() as "mynet" classindex 4 learn classification using NaiveBayes() as "mynet" classindex 4 from select outlook, temperature, humidity, windy, play from LEARN_WEATHER; classify with "mytree" classindex 4 into "classify_result" as "tree" classify with "mytree" classindex 4 into "classify_result" as "tree" from select outlook, temperature, humidity, windy, play from LEARN_WEATHER; classify with "mynet" classindex 4 into "classify_result" as "bayes" classify with "mynet" classindex 4 into "classify_result" as "bayes" from select outlook, temperature, humidity, windy, play from LEARN_WEATHER; select * from classify_result; select * from classify_result; Nowe możliwości – utrwalanie wyników
12 Pytania ?