WARSAW DATA SCIENCE MEETUP

Slides:



Advertisements
Podobne prezentacje
Zakład Mechaniki Teoretycznej
Advertisements

Niezawodności sieci telekomunikacyjnych
Izokwanty.
Funkcje tworzące są wygodnym narzędziem przy badaniu zmiennych losowych o wartościach całkowitych nieujemnych. Funkcje tworzące pierwszy raz badał de.
Teoria układów logicznych
Statystyka Wojciech Jawień
System lingwistyczny - wnioskowanie
IV Tutorial z Metod Obliczeniowych
Sztuczna Inteligencja Reprezentacja wiedzy I Logika przybliżona
Wprowadzenie do optymalizacji wielokryterialnej.
Inteligencja Obliczeniowa Zbiory rozmyte, modelowanie wiedzy.
Zakład Mechaniki Teoretycznej
ALGORYTMY I STRUKTURY DANYCH
KNW- Wykład 8 Wnioskowanie rozmyte.
Sztuczna Inteligencja Reprezentacja wiedzy I Logika przybliżona
Materiały pochodzą z Platformy Edukacyjnej Portalu
CLUSTERING Metody grupowania danych Plan wykładu Wprowadzenie Dziedziny zastosowania Co to jest problem klastrowania? Problem wyszukiwania optymalnych.
Materiały do zajęć z przedmiotu: Narzędzia i języki programowania Programowanie w języku PASCAL Część 7: Procedury i funkcje © Jan Kaczmarek.
Rozpoznawanie Twarzy i Systemy Biometryczne, 2005/2006
Sztuczna Inteligencja Reprezentacja wiedzy I Logika rozmyta
Analiza korelacji.
Systemy rozmyte Systemami rozmytymi nazywamy systemy (statyczne lub dynamiczne) w których wykorzystujemy zbiory rozmyte i właściwy im aparat matematyczny.
Niepewności przypadkowe
Grupowanie Wprowadzanie Definicja problemu
SZTUCZNA INTELIGENCJA ARTIFICIAL INTELLIGENCE
Temat: Symulacje komputerowe lotu helikoptera w języku Java
Temat: Symulacje komputerowe lotu helikoptera w języku Java
Temat: Symulacje komputerowe lotu helikoptera w języku Java
Temat: Symulacje komputerowe lotu helikoptera w języku Java
Układy równań 23x - 31 y = 1 x – y = - 8 x = -1 y - x = 1 x + y = 11
POJĘCIE ALGORYTMU Pojęcie algorytmu Etapy rozwiązywania zadań
Podstawy układów logicznych
odwracania macierzy. Macierz odwrotna Sposoby Postaraj się przewidzieć
Elementy Rachunku Prawdopodobieństwa i Statystyki
Elementy Rachunku Prawdopodobieństwa i Statystyki
Wykład 25 Regulatory dyskretne
Sieci bayesowskie Wykonali: Mateusz Kaflowski Michał Grabarczyk.
Modelowanie populacji i przepływu opinii pomiędzy aktorami sztucznej inteligencji za pomocą sieci społecznej Wojciech Toman.
formalnie: Rozmyte systemy wnioskujące
Działania na zbiorach ©M.
Materiały pochodzą z Platformy Edukacyjnej Portalu Wszelkie treści i zasoby edukacyjne publikowane na łamach Portalu
Materiały pochodzą z Platformy Edukacyjnej Portalu
FUNKCJE Opracował: Karol Kara.
Politechniki Poznańskiej
SYSTEMY EKSPERTOWE I SZTUCZNA INTELIGENCJA
UML W V ISUAL S TUDIO Mateusz Lamparski. UML D EFINICJA Unified Modeling Language (UML) to graficzny język do obrazowania, specyfikowania, tworzenia i.
Co to jest dystrybuanta?
Metody numeryczne szukanie pierwiastka metodą bisekcji
Zagadnienia AI wykład 2.
Zagadnienia AI wykład 5.
Kwadrat -Wszystkie boki są jednakowej długości,
Ćwiczenia 8 Aproksymacja funkcji
Zasady arytmetyki dwójkowej
Modelowanie model związków encji
Wybrane zagadnienia inteligencji obliczeniowej Zakład Układów i Systemów Nieliniowych I-12 oraz Katedra Mikroelektroniki i Technik Informatycznych proponują.
© Kazimierz Duzinkiewicz, dr hab. inż. Katedra Inżynierii Systemów Sterowania Modelowanie i podstawy identyfikacji 2015/2016 Modelowanie rozmyte – podstawy,
Etapy procesu sterowania rozmytego
Metody sztucznej inteligencji - Technologie rozmyte i neuronowe 2015/2016 Systemy rozmyte – wnioskowanie Mamdani’ego I © Kazimierz Duzinkiewicz, dr hab.
STATYSTYKA – kurs podstawowy wykład 8 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Modele nieliniowe sprowadzane do liniowych
Metody sztucznej inteligencji - Technologie rozmyte i neuronowe 2015/2016 Systemy rozmyte – wnioskowanie formalne © Kazimierz Duzinkiewicz, dr hab. inż.
 Zdefiniowanie zmiennych  Programowanie liniowe jest działem programowania matematycznego obejmującym te zagadnienia, w których wszystkie związki mają.
Filmoteka szkolna akcja – się działo
Podstawowe rodzaje modeli rozmytych
Pojęcia podstawowe Algebra Boole’a … Tadeusz Łuba ZCB 1.
Systemy neuronowo – rozmyte
Sztuczna Inteligencja Reprezentacja wiedzy I Logika rozmyta
KORELACJA WIELOKROTNA I CZĄSTKOWA
POJĘCIE ALGORYTMU Wstęp do informatyki Pojęcie algorytmu
Sztuczna Inteligencja Reprezentacja wiedzy I Logika przybliżona
Zapis prezentacji:

WARSAW DATA SCIENCE MEETUP 09.05.2017

Wykorzystanie zbiorów rozmytych w silnikach rekomendacji Mateusz Grzyb konsultant technologiczny Microsoft Polska mateuszgrzyb.pl

O czym będzie ta prezentacja?

Plan prezentacji Zbiory rozmyte. Logika rozmyta. Systemy rekomendacyjne. Przykład silnika rekomendacji wykorzystującego zbiory rozmyte. Pytania do was. Pytania do mnie.

"Miękkie" modelowanie - historia 1913 1965 1970 1973 1982 Logika trójwartościowa - Jan Łukasiewicz Zbiory rozmyte - Lofti Zadeh Niepełna informacja liniowa - Edward Kofler Logika rozmyta - Lorfi Zadeh (A. Tarski, J. Łukasiewicz) Zbiory przybliżone - Zdzisław Pawlak

Zbiory rozmyte

Zbiory rozmyte Lofti Zadeh - 1965. Rozszerzenie klasycznego zbioru z teorii zbiorów. Obiekt matematyczny o zdefiniowanej funkcji przynależności. Każdy element zbioru przyjmuje wartości z przedziału [0,1]. Każdy element zbioru, to dwójka uporządkowana. Zastępuje logikę dwuwartościową logiką wielowartościową. Umożliwia wykonywanie klasycznych operacji na zbiorach (suma, iloczyn, dopełnienie, etc.).

Zbiory rozmyte - zapis matematyczny

Czy mężczyzna o wzroście 185 cm jest wysoki, czy niski?

185 cm - wysoki czy niski?

Losowy zbiór mężczyzn

Losowy zbiór mężczyzn

Losowy zbiór koszykarzy ligi NBA

Losowy zbiór koszykarzy ligi NBA

Co warto zapamiętać z teorii zbiorów rozmytych?

Co warto zapamiętać z teorii zbiorów rozmytych? Istnieje wiele pośrednich stopni prawdy. Nie istnieją tu pojęcia prawdopodobieństwa i szansy. Każdy element zbioru to tzw. dwójka uporządkowana. Każdy element może przynależeć do zbioru z dowolną wartością stopnia przynależności z przedziału [0,1].

Logika rozmyta

Logika rozmyta Lofti Zadeh - 1973. Ściśle powiązana z teorią zbiorów rozmytych. Ogromny wpływ na jej powstanie mieli polscy matematycy/logicy: Jan Łukasiewicz i Alred Tarski.

Logika rozmyta - przykład

Systemy rekomendacyjne

Silniki rekomendacji

Systemy rekomendacyjne - metody filtrowania Content based filtering Collaborative filtering Rozwiązania hybrydowe Filtrowanie w oparciu o indywidualne preferencje użytkownika Filtrowanie w oparciu o preferencje użytkowników o podobnym guście. Filtrowanie łączące obie metody.

Content based filtering - wady i zalety Brak problemu "zimnego startu" Szybkość Daje gorsze rezultaty niż CF *

Przykład silnika rekomendacji

Silnik rekomendacji filmów z filtrowaniem opartym o logikę rozmytą 15986 aktorów. 6563 słów kluczowych. 1633 reżyserów. 108 języków. 92 państw. 24 gatunków.

Struktura bazy danych

Etapy budowania silnika rekomendacji 1 2 3 4 Filtrowanie filmów lubianych przez daną osobę. Filtrowanie atrybutów filmów. Wyznaczenie stopnia podobieństwa pomiędzy filmami. Wyznaczenie współczynnika wsparcia rekomendacji

Etapy budowania silnika rekomendacji 1 2 3 4 Filtrowanie fimów lubianych przez daną osobę. Filtrowanie atrybutów filmów. Wyznaczenie stopnia podobieństwa pomiędzy filmami. Wyznaczenie współczynnika wsparcia rekomendacji

Kiedy możemy uznać, że użytkownik polubił dany film?

Kiedy możemy uznać, że użytkownik polubił dany film? - Przykład nr. 1. W skali 1-5 użytkownik ocenił "film A" na 4. Stopień przynależności jest większy niż 0.5, a więc film można zaliczyć do zbioru filmów lubianych przez danego użytkownika.

Kiedy możemy uznać, że użytkownik polubił dany film? - Przykład nr. 2. W skali 1-5 użytkownik ocenił "film B" na 3. Stopień przynależności jest równyniż 0.5, a więc filmu nie można zaliczyć do zbioru filmów lubianych przez danego użytkownika.

Filmy ocenione przez Dominika

Etapy budowania silnika rekomendacji 1 2 1 2 3 4 Filtrowanie fimów lubianych przez daną osobę. Filtrowanie atrybutów filmów. Wyznaczenie stopnia podobieństwa pomiędzy filmami. Wyznaczenie współczynnika wsparcia rekomendacji

Filtrowanie atrybutów filmów Obliczenie stopnia przynależności filmu do danego gatunku/aktora/języka/kraju produkcji.

Filtrowanie atrybutów filmów - "The Goodfather" Tytuł Gatunek The Godfather Crime Drama

Filtrowanie atrybutów filmów - "Goodfellas" Tytuł Język Goodfellas English Italian

Filtrowanie atrybutów filmów - "Casino" Tytuł Gatunek Casino Biography Crime Drama

Etapy budowania silnika rekomendacji 1 2 1 3 4 Filtrowanie fimów lubianych przez daną osobę. Filtrowanie atrybutów filmów. Wyznaczenie stopnia podobieństwa pomiędzy filmami. Wyznaczenie współczynnika wsparcia rekomendacji

Wyznaczanie stopnia podobieństwa pomiędzy filmami Dwie podstawowe metody: Fuzzy Set Theoretic Fuzzy Theoretic Cosine

Wyznaczanie stopnia podobieństwa pomiędzy filmami Ostatecza forma wzoru na stopień podobieństwa pomiędzy filmami miała postać:

Wyznaczanie stopnia podobieństwa pomiędzy filmami - Przykład: "The Godfather" vs "Casino" Tytuł Gatunek DoM The Godfather Crime 0.667 Drama 0.333 Casino Biography 0.5 0.167

Wyznaczanie stopnia podobieństwa pomiędzy filmami - Przykład: "The Godfather" vs "Casino" Fuzzy Set Theoretic Fuzzy Theoretic Cosine

Wyznaczanie stopnia podobieństwa pomiędzy filmami Tytuł Stopień podobieństwa Goodfellas Casino 0.838 The Godfather 0.587 0.512

Jakie filmy są do siebie najbardziej podobne?

Największe podobieństwo

Najmniejsze podobieństwo

Etapy budowania silnika rekomendacji 1 2 3 1 4 Filtrowanie fimów lubianych przez daną osobę. Filtrowanie atrybutów filmów. Wyznaczenie stopnia podobieństwa pomiędzy filmami. Wyznaczenie współczynnika wsparcia rekomendacji

Wyznaczanie współczynnika wsparcia rekomendacji

Jakie filmy zarekomendujemy Dominikowi?

Podsumowanie

Pytania do Was

Która para filmów ocenionych przez Dominika była ze sobą najmocniej skoreowana?

Odp: "Chłopcy z ferajny" i "Kasyno"

Które para filmów z TOP 20 miała najmniejszy stopień podobieństwa?

Odp: Casablanba i Władca Pierścieni

Który film został zarekomendowany Dominikowi na pierwszym miejscu?

Odp: Donnie Brasco

Jakiego pojęcie używamy w teorii zbiorów rozmytych i logice rozmytej w alternatywie do prawdopodobieństwa.

Odp: Stopnia przynależności

Jaka jest główna zaleta Content Based Filtering?

Odp: Brak problemu "zimnego startu".

Pytania do mnie Materiały: mateuszgrzyb.pl/WDS Kontakt: m.grzyb@outlook.com