A-priori Partition Mateusz Mor, Kasper Rzepecki, Daniel Mendalka, Michał Samsonowski.

Slides:



Advertisements
Podobne prezentacje
Przykład liczbowy Rozpatrzmy dwuwymiarową zmienną losową (X,Y), gdzie X jest liczbą osób w rodzinie, a Y liczbą izb w mieszkaniu. Niech f.r.p. tej zmiennej.
Advertisements

Klasyfikacja roczna w roku szkolnym 2012/2013
Wolność oddechu 1 Badanie skuteczności programu edukacyjnego p.t. Wolność Oddechu.
Informacja o stanie bezpieczeństwa i porządku publicznego za rok 2008 w powiecie nidzickim Nidzica, r.
POWIAT MYŚLENICKI Tytuł Projektu: Poprawa płynności ruchu w centrum Myślenic poprzez przebudowę skrzyżowań dróg powiatowych K 1935 i K 1967na rondo.
Domy Na Wodzie - metoda na wlasne M
ZNACZENIE ZDROWIA PSYCHICZNEGO DLA EFEKTYWNOŚCI PRACOWNIKA
MINISTERSTWO ROZWOJU REGIONALNEGO Przebieg realizacji działań dotyczących MSP w ramach Sektorowego Programu Operacyjnego Wzrost konkurencyjności przedsiębiorstw,
Podatki i opłaty lokalne w 2010 roku
NOWE TECHNOLOGIE NA USŁUGACH EDUKACJI Publiczna Szkoła Podstawowa nr 3 w Grodkowie Zajęcia w ramach projektu NTUE.
UŁAMKI DZIESIĘTNE porównywanie, dodawanie i odejmowanie.
Typy zachowań firmy w procesie internacjonalizacji (projekt badawczy)
Prezentacja poziomu rozwoju gmin, które nie korzystały z FS w 2006 roku. Eugeniusz Sobczak Politechnika Warszawska KNS i A Wykorzystanie Funduszy.
Fundusze nieruchomości jako inwestycja z celem zdobycia kapitału emerytalnego Karolina Oleszek.
Ćwiczenia ZZI Cykl 2 Realizacja projektu indywidualnego.
Studium przypadku mgr inż. Krzysztof Mossakowski
- ROZWÓJ i POPRAWA KONKURENCYJNOŚCI REGIONU - realizowane w oparciu o:
Klasyfikacja systemów
ChemCAD Termodynamika w praktyce. Praktyczne obliczanie równowag Modelowanie równowag fazowych BIP – z bazy ChemCADa BIP – z literatury Metody bez BIP:
FP-Growth Adam Pieśkiewicz Kamil Niezręcki Krzysztof Grześkowiak
Opracował: Zespół Humanistyczny. Klasa Średnia ww - wielokrotnego wyboru (na 20 p) Średnia KO - krótkie odpowiedzi (na 10 p) Średnia za zaproszenie (na.
JO16-75 Dane techniczne: Wysokość-130 Płaszczyzna dolna-90
Pytania konkursowe.
Tytuł prezentacji Warszawa, r..
Matura 2005 Wyniki Jarosław Drzeżdżon Matura 2005 V LO w Gdańsku
Ogólnopolski Konkurs Wiedzy Biblijnej Analiza wyników IV i V edycji Michał M. Stępień
Analiza wyników „Matura próbna”
Agnieszka Jankowicz-Szymańska1, Wiesław Wojtanowski1,2
Raport z badań termowizyjnych – RECTICEL Rys. 1a. Rozdzielnia RS14 Temperatura maksymalna 35,27 o C Rys. 1b. Rozdzielnia RS14 (wizyjny) 3.
Podsumowanie działalności Zarządu Banku za okres
Opracowano w Departamencie Kontrolingu Informacja o sytuacji finansowej Banku BPS S.A. Informacja o sytuacji finansowej Banku BPS S.A. według stanu na.
Harmonogram naboru do ZPORR w Województwie Małopolskim UNIA EUROPEJSKA FUNDUSZE STRUKTURALNE Marszałek Województwa Małopolskiego Janusz Sepioł
RADA PROGRAMOWA RSIP WŁ Łódź, r. Małgorzata Krawczyk
1/34 HISTORIA BUDOWY /34 3/34 6 MAJA 2011.
AKASA Bank Sebastian Marchel Anna Karpińska Anna Matusiewicz
Klasa I a Wychowawca Agnieszka łącka. Klasa I a Wychowawca Agnieszka łącka.
KOLEKTOR ZASOBNIK 2 ZASOBNIK 1 POMPA P2 POMPA P1 30°C Zasada działanie instalacji solarnej.
VI przegląd plastyczny z rysunku, malarstwa i rzeźby
EGZAMIN GIMNAZJALNY W SUWAŁKACH 2009 Liczba uczniów przystępująca do egzaminu gimnazjalnego w 2009r. Lp.GimnazjumLiczba uczniów 1Gimnazjum Nr 1 w Zespole.
Ze szczególnym uwzględnieniem stosowanych ćwiczeń specjalnych OPRACOWAŁ Z.LIPIŃSKI.
Ewa Meller Koło Naukowe Metod Ilościowych Wydział Zarządzania Uniwersytet Gdański.
Algorytm DIC Dynamic Itemset Countin
MATURA 2007 raport ZESPÓŁ SZKÓŁ I PLACÓWEK KSZTAŁCENIA ZAWODOWEGO.
PROPOZYCJE MEXX JESIEŃ NOWA KOLEKCJA Ceny od 40zł.
1. Pomyśl sobie liczbę dwucyfrową (Na przykład: 62)
Analiza matury 2013 Opracowała Bernardeta Wójtowicz.
Badanie kwartalne BO 2.3 SPO RZL Wybrane wyniki porównawcze edycji I- VII Badanie kwartalne Beneficjentów Ostatecznych Działania 2.3 SPO RZL – schemat.
Analiza wskaźnikowa.
-17 Oczekiwania gospodarcze – Europa Wrzesień 2013 Wskaźnik > +20 Wskaźnik 0 a +20 Wskaźnik 0 a -20 Wskaźnik < -20 Unia Europejska ogółem: +6 Wskaźnik.
Spływ należności w Branży Elektrycznej
Energia Środowisko i Zrównoważony Rozwój PT4 B: Energia Piąty Program Ramowy UE Andrzej Sławiński Wyniki.
Wstępna analiza egzaminu gimnazjalnego.
EGZAMINU GIMNAZJALNEGO 2013
EcoCondens Kompakt BBK 7-22 E.
EcoCondens BBS 2,9-28 E.
Wyniki badań dzieci 10 letnich z realizacji podstawy programowej z wychowania fizycznego po I etapie edukacyjnym- wrzesień 2013, luty- czerwiec 2014 Kuratorium.
User experience studio Użyteczna biblioteka Teraźniejszość i przyszłość informacji naukowej.
WYNIKI EGZAMINU MATURALNEGO W ZESPOLE SZKÓŁ TECHNICZNYCH
Komenda Powiatowa Policji
Testogranie TESTOGRANIE Bogdana Berezy.
Jak Jaś parował skarpetki Andrzej Majkowski 1 informatyka +
© GfK 2014 | GfK Health | Leki homeopatzcyne widziane okiem lekarzy 1 LEKI HOMEOPATYCZNE WIDZIANE OKIEM LEKARZY Czerwiec 2014.
Nowy Jork Londyn Mleko, (1l) 0,81£ 0,94 £ Bochenek świeżego chleba (500g) 1,78 £ 0,96 £ Ryż (biały), (1kg) 2,01 £ 1,51 £ Jajka(12) 1,86 £ 2,27 £ Lokalny.
Dr hab. Renata Babińska- Górecka
1 Używanie alkoholu i narkotyków przez młodzież szkolną w województwie opolskim w 2007 r. Na podstawie badań przeprowadzonych przez PBS DGA (w pełni porównywalnych.
Współrzędnościowe maszyny pomiarowe
ANKIETA ZOSTAŁA PRZEPROWADZONA WŚRÓD UCZNIÓW GIMNAZJUM ZPO W BORONOWIE.
Elementy geometryczne i relacje
Strategia pomiaru.
LO ŁobżenicaWojewództwoPowiat pilski 2011r.75,81%75,29%65,1% 2012r.92,98%80,19%72,26% 2013r.89,29%80,49%74,37% 2014r.76,47%69,89%63,58% ZDAWALNOŚĆ.
Zapis prezentacji:

A-priori Partition Mateusz Mor, Kasper Rzepecki, Daniel Mendalka, Michał Samsonowski

Apriori Pomysły inspirowane artykułami naukowymi, w szczególności: [Implementacja w C rozwijana przez tysiąclecia]

Apriori Optymalizacje: Usunięcie elementów niebędących 1-frequent Usunięcie transakcji pustych Pogrupowanie takich samych transakcji i traktowanie ich jako jednej z większą wagą [ ] [0][0] [ ] [0][0]([0], 3) [0] [0][0] [9] [ ]

Apriori Dla kosarak (supp=0,1): 8 mln => 1,6 mln, => 11 Mushroom (supp=0,5):186 tyś => 76 tyś, 8100 => 57 Accidents (supp=0,5): 11,5 mln=>6mln, =>65000

Apriori Optymalizacje c.d.: Żadnych zbędnych HashSetów itp., wszystko co się da na int[] Dopasowane struktury danych: listy, tablice, itp Elementy przemapowane na 0-based i używane jako indeksy tablic [23, 29, ] => [0, 1, 2]

Apriori Struktura danych: drzewo prefiksowe Propagacja odcięć w górę drzewa Usuwanie transakcji którym nie udało się zmienić drzewa na danym poziomie Pomysły nie zrealizowane: Zrównoleglenie Grupowanie podobnych transakcji

Algorytm Partition: Modyfikacja algorytmu a-priori Przeszukuje Partycje danych które mieszczą się w pamięci Przyspiesza sprawdzanie wsparcia w partycji Wrażliwy na duże ilości zbiorów częstych Powtórne poszukiwanie wsparcia dla znalezionych zbiorów częstych

Zyski z założenia Znaczne przyspieszenie 2 krotne przejrzenie zbioru danych

Koszty z założenia Możliwość przekroczenia dostępnej pamięci i konieczność rozpoczęcia eksperymentu od początku Zwiększone wymaganie pamięciowe

Optymalizacje Wykorzystanie charakteru danych Zastosowanie listy sortowanej z indeksami przy łączeniu zbiorów Ponowne wykorzystanie partycji przy weryfikacji zbiorów częstych Łączenie zbiorów i czyszczenie pamięci w każdej iteracji

Apriori wyniki – czas całkowity[s] Support0,20,30,40,50,60,70,80,9 Accident s ,87,26,66,1 Kosarak6,66,35,75,65,25,1 Mushroom7,60,90,380,3

Apriori wyniki – czas generowania zbiorów częstych[s] / pamięć [MB] Support0,20,30,40,50,60,70,80,9 Accidents , , , , ,8 171 Kosarak , , , , , , ,7 145 Mushroom , , , , , , ,06 180

Partition wyniki – czas całkowity[s] Support0,20,30,40,50,60,70,80,9 Accidents2:4256,1732,0724,29 Kosarak4:23 4:25 Mushroom3,200,900,610,430,410,490,37

Partition wyniki – czas generowania zbiorów częstych[s] / pamięć [MB] Support0,20,30,40,50,60,70,80,9 Accidents2:42, , , ,29 34 Kosarak4: : : : : : : :25 26 Mushroom2, , , , , , ,37 24