Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Metody oceny siły rąk w rozdaniach brydżowych mgr inż. Krzysztof Mossakowski Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Warszawa,

Podobne prezentacje


Prezentacja na temat: "Metody oceny siły rąk w rozdaniach brydżowych mgr inż. Krzysztof Mossakowski Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Warszawa,"— Zapis prezentacji:

1 Metody oceny siły rąk w rozdaniach brydżowych mgr inż. Krzysztof Mossakowski Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Warszawa, 8 listopada 2006

2 Zagadnienie Znając dokładny rozkład kart w rozdaniu brydżowym, odpowiedzieć na pytanie ile lew weźmie para NS przy założeniu optymalnej gry wszystkich graczy Miara skuteczności - dla ilu procent rozdań: bezbłędny wynik tolerancja jednej lewy tolerancja dwóch lew

3 Sieci neuronowe Java Neural Network Simulator Sieci feed-forward: funkcja aktywacji: unipolarna lub bipolarna sigmoidalna, resilient backpropagation (RProp), 52 lub 104 neurony wejściowe, eksperymenty z liczbą warstw i neuronów ukrytych, 1 lub 14 neuronów wyjściowych.

4 Dotychczasowe wyniki

5 Wyniki Gra BA, wist W SiećUczącyTestowy (26x4)-(13x4) | | | | (26x4)-(13x4)-(3x4) | | | | (26x4)-(13x4)-(7x4) | | | | (26x4)-(13x4)-(13x4) | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | W procentach: błąd nie większy niż dwie lewy W procentach: błąd nie większy niż jedna lewa W procentach: bezbłędnie

6 Wyniki Gry kolorowe, wist W (26x4;1) – dodatkowy neuron 52 i 104 – wzmacniane wartości wejściowe neuronów kart atutowych (26,1x4;1)-(13x4)-(7x4) | | | | atu*2 NS 0.5 WE | | | | atu*2 NS 1.0 WE | | | | atu*2 NS 0.5 WE | | | | test dla BA (nie było w uczeniu)91.64 | | j.w. + BA97.83 | | | | test tylko dla gier kolorowych98.57 | | test tylko dla BA94.30 | | 30.09

7 Wyniki Gra w zadany kolor, wist W Piki N 1.0 S 0.8 W -1.0 E | | | | Piki NS 1.0 WE | | | | test dla Kierów (nie było w uczeniu)59.18 | | test dla Kar (nie było w uczeniu)58.89 | | test dla Trefli (nie było w uczeniu)58.86 | | Kiery NS 1.0 WE | | | | Kara NS 1.0 WE | | | | Trefle NS 1.0 WE | | | | Piki NS 1.0 WE | | | | x Piki NS 1.0 WE | | | | test dla BA (nie było w uczeniu)72.87 | | Piki NS 1 WE -1 NW 1 SE | | | | 39.11

8 Wyniki Gra w Piki, zmiana wistu W 7,1% rozdań liczba lew zależy od tego, kto wistuje wszystkie wisty62.53 | | | | wisty NS N 1.0 S 0.5 W -1.0 E | | | | wisty NS N 1.0 S 0.8 W -1.0 E | | | | Piki NS 1.0 WE | | | | test dla rozdań z liczbą lew zależną od wistu97.78 | | test dla rozdań z liczbą lew zależną od wistu98.85 | | NS 1.0 WE -1.0 NW 1.0 SE | | | | 41.92

9 Wyniki Podsumowanie Bez Atu96.96 | | | | Bez Atu i wszystkie kolory97.83 | | | | Wszystkie kolory98.78 | | | | Piki98.89 | | | | Piki ze zmianą wistu99.29 | | | | Najlepsze dotychczasowe wyniki uczenie wyłącznie na przykładach bez ludzkiej wiedzy bez znajomości zasad gry

10 Ludzkie metody oceny siły rąk

11 Punkty za honory Punkty Miltona Worka Punkty Bambergera Punkty Colleta Punkty czterech asów Polskie punkty Punkty AKD Punkty Reitha Punkty Robertsona Punkty Vernesa AKQJT

12 Punkty Vernesa Relatywna wartość honorów w stosunku do asa, obliczona na podstawie 2400 rozdań z Mistrzostw Świata w 1965 roku A K Q J 4,003,081,880,94 Sieci neuronowe 52-1 BA: 4,002,671,681,05 Atu: 4,003,112,271, : 0,59 Nie-Atu: 1,820,64-0,26-0,73

13 Punkty za układ Modyfikacje Miltonów Plus za każdego asa +0.5 za każdą dziesiątkę z innym honorem lub dziewiątką +0.5 za zgrupowanie honorów +0.5 za każdą figurę za ręką Minus -1 za brak asa na ręce -0.5 za brak dziesiątek -1 za brak odpowiedniej liczby kart towarzyszących honorowi -0.5 za brak zgrupowania honorow -1 za każdą figurę przed ręką Trzech i czterech reguła +1 za każdą kartę powyżej 4 w atu +1 za każdą kartę powyżej 3 w bocznym kolorze

14 Punkty za układ Modyfikacje Miltonów c.d. Punkty przeliczeniowe Truscotta +1 za kolor za singel +2 za renons Punkty przeliczeniowe Staymana +1 za 4 asy +1 za K, D lub KD w kolorze partnera -1 za brak asów -1 za honory w bocznych kolorach bez obstawy +2 za piątą, szóstą itd. kartę w kolorach 5+ z AKDW lub AKD +1 za piątą, szóstą itd. kartę w kolory 5+ z co najmniej dwoma honorami +3 za renons, +2 za singel, +1 za dubleton

15 Punkty za układ Ujemna lewa Ile lew jest do oddania w kolorze 1 LU za K, D, x, AD, Ax, Kx, AKW, AKx, ADW, ADx, KDW, KDx 2 LU za DW, Dx, xx, AWx, Axx, KW10, Kxx, DW10, Dxx 3 LU za W10x, xxx

16 Punkty za układ Wygrywająca lewa Ile lew jest do wzięcia w kolorze wartości honorów w krótkich kolorach np. AKD 3, AKW 2.5, KW10 1,5, KDW 2, wartości honorów w sekwensach i niskich kart w długich kolorach zawierających sekwensy np. AKDW 4, AKD10 3.5, AW za 5 kart w kolorze, +2 za 6, +3 za 7 wartości niskich kart w długich kolorach np. dla 5-kartowego koloru: +2 dla atu, +1 dla bocznego koloru dodatkowo za kolor atutowy +1 za A, K lub DW, +0,5 za D lub W10 +2 za 6 kart, +1 za 5, +0,5 za 4 krótkość w bocznym kolorze przy grze w atu

17 Wyniki Bez Atu 1-1 : suma Miltonów pary93.62 | | | | : Miltony dla poszczególnych rąk93.64 | | | | : Miltony i długości kolorów93.61 | | | | : j.w | | | | : punkty Vernesa93.64 | | | | : 8 estymatorów układu dla rąk95.07 | | | | : 9 estymatorów siły dla rąk95.03 | | | | : 9 estymatorów siły dla rąk i par95.00 | | | | : 9 est. siły i 8 est. układu96.14 | | | | : tylko rozkład (bez estymatorów)96.51 | | | | (52+36)-25-1 : rozkład i 9 estymatorów siły96.77 | | | | (52+32)-25-1 : rozkład i 8 estymatorów układu97.40 | | | | (52+102) : rozkład, siła i układ dla rąk i par | | | | (dalej przeuczenie)

18 Liczba punktów a liczba lew (wg sieci 1-1) Bez Atu Liczba punktówLiczba lew 0 – 70 8 – – – – – – – – – – – – | | 31.37

19 Wyniki Piki 4-1 : Miltony dla poszczególnych rąk76.38 | | | | : Miltony i długości kolorów96.92 | | | | : j.w | | | | : 8 estymatorów układu dla rąk98.70 | | | | : 9 estymatorów siły dla rąk76.84 | | | | : 9 est. siły i 8 est. układu98.74 | | | | : tylko rozkład (bez estymatorów)98.91 | | | | x : j.w | | | | (52+16)-25-1 : rozkład i długości kolorów99.60 | | | | (52+16) : j.w | | | | ze zmianą wistu: : tylko rozkład [104]99.29 | | | | (104+68) : rozkład i 8 est. układu99.88 | | | | 45.54

20 Punkty Zara Siła ręki to suma: wartości honorów wg puktacji: A: 6, K: 4, D: 2, W: 1 różnicy długości najdłuższego i najkrótszego koloru sumy długości dwóch najdłuższych kolorów Wyniki dla Pików ze zmianą wistu: | | | | | | | | | | | | (52+4) | | | | 28.18

21 Reprezentacja danych

22 Reprezentacja danych 26x4

23 Reprezentacja danych 52

24 Reprezentacja danych 104

25 Reprezentacja danych 52x4 NOWOŚĆ

26 Wyniki reprezentacji 52x4 Piki ze zmianą wistu 52x4-4x4x4-5x | | | | x4-(3x4,4)x4-8x4-8x | | | | x4-8x | | | | x4-13x | | | | x4-26x | | | | (52x4+16)-(13x4+8)-16-1 rozkład i długości kolorów | | | | (52x4+84)-(13x4+21)-26-1 rozkład, długości kolorów, estymatory siły, estymatory układu | | | | 52.47

27 Porównanie procesu nauki (26x4) 10 tys. rozdań ~ 50 tys. iteracji 52 i tys. rozdań ~ 1 tys. iteracji 52x4 100 tys. rozdań ~ 10 tys. iteracji 52x x4

28 Porównanie wielkości sieci Sieć Liczba neuronów Liczba połączeń Wynik (Piki ze zmianą wistu) (26x4)-(13x4)-(7x4) | | | | | | | | | | x4-4x4x4-5x | | x4-(3x4,4)x4-8x4-8x | | x4-8x | | x4-13x | | x4-26x | | 53.11

29 Ekperymenty

30 Sprawdzenie powtarzalności wyników 4 sieci uczone niezależnie na tych samych rozdaniach | | | | | | | | | | | | | | | | BA Atu zgodne wyniki 61.23% 63.40% 1 lewa rozbieżności 37.93% 36.56% 2 lewy rozbieżności 0.81% 0.04% 3 lewy rozbieźności 0.03% 0.00%

31 Użycie średniej wartości wynikowej kilku sieci Cztery niezależnie uczone sieci : Biorąc ich średnią wartość wyjścia: Kontrakty atutowe | | 40, | | 41, | | | | Bez Atu | | | | | | | | | | | | 41.13

32 Sprawdzenie skuteczności dla poszczególnych liczb lew lewy # ±2 ± ,32% 66,61% 12,30% ,39% 81,21% 34,53% ,10% 86,66% 40,73% ,93% 88,96% 41,41% ,94% 89,04% 40,36% ,85% 88,67% 40,80% ,03% 88,75% 41,32% ,10% 88,99% 40,50% ,28% 89,29% 40,46% ,14% 89,19% 42,14% ,89% 88,45% 40,58% ,94% 85,87% 42,32% ,57% 81,71% 31,94% ,66% 73,85% 9,39% Piki

33 Zmiana docelowych wartości Równy podziałProporcjonalny podział Liczba rozdań Liczba kew Wielkość przedziału Wartość docelowa Wielkość przedziału Wartość docelowa , ,06150,16150,01550, ,06150,22310,03150, ,06150,28460,05280, ,06150,34620,07400, ,06150,40770,09060, ,06150,46920,10050, ,06150,53080,10250, ,06150,59230,09670, ,06150,65380,08430, ,06150,71540,06590, ,06150,77690,04440, ,06150,83850,02460, ,06150,90000,01660, : | | | | 39.98

34 Sprawdzenie skuteczności na granicach Liczba lewSkutecznośćLiczba lew | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | Piki

35 Uczenie na błędach Piki, sieci I faza | | II faza – inna sieć uczona na błędach I fazy | | wynik dla poprawnych z I fazy: | | III faza – inna sieć uczona na błędach II fazy | | wynik dla poprawnych z I fazy: | | wynik dla poprawnych z II fazy: | | 39.15

36 Uczenie na błędach kontynuacja Używając 2 sieci w II fazie (jedna uczona na błędach przeszacowania, druga niedoszacowania) przeszacowanie: uczenie: | | na całym testowym:91.85 | | niedoszacowanie: uczenie: | | na całym testowym:92.47 | | Tworząc system 3 sieci (dwie powyższa i ta z pierwszej fazy) i jako wynik biorąc ich średnią: | | dla porównania wynik pierwotnej sieci: | | 40.13

37 Przykładowe rozdania

38 Przykładowe rozdanie 1 Piki, wist W Liczba lew pary NS:10 Wyniki sieci: (52x4)-(13x4)-13-1 (52x4)-(26x4) (104+68) (52x4+84)-(13x4+21)

39 Przykładowe rozdanie 2 Piki, wist N Liczba lew pary NS:3 Wyniki sieci: (52x4)-(13x4)-13-1 (52x4)-(26x4) (104+68) (52x4+84)-(13x4+21)

40 Przykładowe rozdanie 3 Piki, wist N lub S wist NS Liczba lew pary NS:43 Wyniki sieci: (52x4)-(13x4)-13-1 (52x4)-(26x4) (104+68) (52x4+84)-(13x4+21)

41 Przykładowe rozdanie 4 Piki, wist N Liczba lew pary NS:0 Wyniki sieci: (52x4)-(13x4)-13-1 (52x4)-(26x4) (104+68) (52x4+84)-(13x4+21)

42 Podsumowanie: Wyniki najlepszej sieci 52x4-26x Bez Atu: | | Piki ze zmianą wistu: | | Uczenie wyłącznie na przykładach Bez ludzkiej wiedzy Bez znajomości zasad gry

43 Pomysły ?


Pobierz ppt "Metody oceny siły rąk w rozdaniach brydżowych mgr inż. Krzysztof Mossakowski Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Warszawa,"

Podobne prezentacje


Reklamy Google