Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
OpublikowałWalerian Balcerek Został zmieniony 11 lat temu
1
Metody oceny siły rąk w rozdaniach brydżowych
mgr inż. Krzysztof Mossakowski Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Warszawa, 8 listopada 2006
2
Zagadnienie Znając dokładny rozkład kart w rozdaniu brydżowym, odpowiedzieć na pytanie ile lew weźmie para NS przy założeniu optymalnej gry wszystkich graczy Miara skuteczności - dla ilu procent rozdań: bezbłędny wynik tolerancja jednej lewy tolerancja dwóch lew
3
Sieci neuronowe Java Neural Network Simulator Sieci feed-forward:
funkcja aktywacji: unipolarna lub bipolarna sigmoidalna, resilient backpropagation (RProp), 52 lub 104 neurony wejściowe, eksperymenty z liczbą warstw i neuronów ukrytych, 1 lub 14 neuronów wyjściowych.
4
Dotychczasowe wyniki
5
Wyniki Gra BA, wist W W procentach: błąd nie większy niż dwie lewy
W procentach: błąd nie większy niż jedna lewa Wyniki Gra BA, wist W W procentach: bezbłędnie Sieć Uczący Testowy (26x4)-(13x4)-1 94.77 | | 31.91 94.77 | | 32.05 (26x4)-(13x4)-(3x4)-5-1 93.86 | | 30.00 92.85 | | 29.60 (26x4)-(13x4)-(7x4)-13-1 96.02 | | 33.57 93.87 | | 31.04 (26x4)-(13x4)-(13x4) 97.29 | | 34.99 90.09 | | 26.87 52-1 94.22 | | 30.88 94.15 | | 31.29 52-4-1 94.52 | | 31.80 94.44 | | 32.13 52-8-1 95.42 | | 32.92 95.24 | | 32.88 96.51 | | 35.34 96.07 | | 34.66 96.79 | | 35.45 95.66 | | 33.64 104-1 94.81 | | 32.19 94.76 | | 32.19 96.96 | | 35.85 96.46 | | 34.86
6
Wyniki Gry kolorowe, wist W
(26x4;1) – dodatkowy neuron 52 i 104 – wzmacniane wartości wejściowe neuronów kart atutowych (26,1x4;1)-(13x4)-(7x4)-13-1 97.26 | | 36.21 96.74 | | 35.62 52-1 atu*2 NS 0.5 WE 0.5 96.66 | | 32.87 96.69 | | 32.79 52-1 atu*2 NS 1.0 WE -1.0 96.66 | | 32.89 96.68 | | 32.79 atu*2 NS 0.5 WE 0.5 98.78 | | 40.51 98.68 | | 40.11 test dla BA (nie było w uczeniu) 91.64 | | 26.06 j.w. + BA 97.83 | | 37.75 97.72 | | 37.56 test tylko dla gier kolorowych 98.57 | | 39.43 test tylko dla BA 94.30 | | 30.09
7
Wyniki Gra w zadany kolor, wist W
Piki N 1.0 S 0.8 W E -0.8 98.66 | | 39.76 98.47 | | 39.16 Piki NS 1.0 WE -1.0 98.91 | | 41.04 98.77 | | 40.13 test dla Kierów (nie było w uczeniu) 59.18 | | 14.12 test dla Kar (nie było w uczeniu) 58.89 | | 13.51 test dla Trefli (nie było w uczeniu) 58.86 | | 13.77 Kiery NS 1.0 WE -1.0 98.90 | | 41.18 98.65 | | 40.18 Kara NS 1.0 WE -1.0 98.96 | | 40.94 98.66 | | 39.96 Trefle NS 1.0 WE -1.0 98.87 | | 40.82 98.73 | | 40.02 Piki NS 1.0 WE 0.0 98.95 | | 41.06 98.76 | | 40.20 52-7x Piki NS 1.0 WE 0.0 98.89 | | 40.91 98.83 | | 40.77 test dla BA (nie było w uczeniu) 72.87 | | 18.42 Piki NS 1 WE -1 NW 1 SE -1 99.18 | | 42.40 98.57 | | 39.11
8
Wyniki Gra w Piki, zmiana wistu
W 7,1% rozdań liczba lew zależy od tego, kto wistuje wszystkie wisty 62.53 | | 13.66 58.28 | | 12.65 wisty NS N 1.0 S 0.5 W E -0.5 97.78 | | 36.82 97.61 | | 36.57 wisty NS N 1.0 S 0.8 W E -0.8 98.65 | | 39.70 98.49 | | 39.29 Piki NS 1.0 WE -1.0 98.91 | | 41.04 98.77 | | 40.13 test dla rozdań z liczbą lew zależną od wistu 97.78 | | 35.84 98.85 | | 40.46 NS 1.0 WE -1.0 NW 1.0 SE -1.0 99.29 | | 42.64 99.09 | | 41.92
9
Wyniki Podsumowanie Najlepsze dotychczasowe wyniki
uczenie wyłącznie na przykładach bez ludzkiej wiedzy bez znajomości zasad gry Bez Atu 96.96 | | 35.85 96.46 | | 34.86 Bez Atu i wszystkie kolory 97.83 | | 37.75 97.72 | | 37.56 Wszystkie kolory 98.78 | | 40.51 98.68 | | 40.11 Piki 98.89 | | 40.91 98.83 | | 40.77 Piki ze zmianą wistu 99.29 | | 42.64 99.09 | | 41.92
10
Ludzkie metody oceny siły rąk
11
Punkty za honory Punkty Miltona Worka Punkty Bambergera Punkty Colleta
Punkty czterech asów Polskie punkty Punkty AKD Punkty Reitha Punkty Robertsona Punkty Vernesa A K Q J T
12
Punkty Vernesa Relatywna wartość honorów w stosunku do asa, obliczona na podstawie 2400 rozdań z Mistrzostw Świata w 1965 roku A K Q J 4,00 3,08 1,88 0,94 Sieci neuronowe 52-1 BA: 4,00 2,67 1,68 1,05 Atu: 4,00 3,11 2,27 1, : 0,59 Nie-Atu: 1,82 0,64 -0,26 -0,73
13
Punkty za układ Modyfikacje Miltonów
Plus +0.25 za każdego asa +0.5 za każdą dziesiątkę z innym honorem lub dziewiątką +0.5 za zgrupowanie honorów +0.5 za każdą figurę za ręką Minus -1 za brak asa na ręce -0.5 za brak dziesiątek -1 za brak odpowiedniej liczby kart towarzyszących honorowi -0.5 za brak zgrupowania honorow -1 za każdą figurę przed ręką Trzech i czterech reguła +1 za każdą kartę powyżej 4 w atu +1 za każdą kartę powyżej 3 w bocznym kolorze OCENA WARTOSCI RAK **** pojecia ogolne **** DOBRE PUNKTY punkty za honory warte wiecej niz wynikaloby to z punktow: - w dlugich kolorach - za przeciwnikiem, ktory wskazal mocna reke - za przeciwnikiem, ktory pokazal dlugosc w kolorze tych honorow - wraz z towarzyszacymi dzeisatkami idziewiatkami - w dlugich kolorach (4+) pokazanych przez partnera, nawet bez odpowiedniej liczby blotek DUPLIKACJA WARTOSCI - d.w. honorowych: na obu rekach dubel wylacznie z honorow - d.w. ukladowych: obaj partnerzy wliczaja punkty za uklad w tym samym kolorze - d.w. honorowych i ukladowych: jeden z partnerow ma krotkosc w kolorze, w ktorym parner ma honory ++ LIMIT (Bambergera) as - 7 krol - 5 dama - 3 walet - 1 **** wartosci honorow **** # as to 4.25 waleta, damy i 1.3 krola ++ BAMBERGERA PUNKTY ++ COLLETA PUNKTY as - 4 krol - 3 dama - 2 walet - 0.5 dziesiatka - 0.5 ++ CZTERECH ASOW PUNKTY as - 3 krol - 2 dama - 1 ++ HONOROWA LEWA AKDW AKD AKW AK - 2 AD - 1.5 AW 1.25 A - 1 KDW KD - 1 KWx Kx - 0.5 DWx DW Dx KONTROLA (stosowana w szlemowej licytacji) as - 2 kontrole krol - 1 kontrola [zgrupowanie honorow: co najmniej 2 starsze - AKD lub 3 dowolne honory - AKDWT) ++ MILTONY - doliczyc 0.25 za kazdego asa, odjac 1 za brak asa w poczatkowej rece - za honory bez odpowiedniej liczby blotek -1 (K, D, W, Dx, Wx, Wxx, KD, KW, DW, A) za dziesiatki z dziewiatkami lub starszymi honorami za zgrupowanie honorow, -0.5 za K, D, W (gdy z licytacji wynika, ze reka partnera jest slaba) - honor za reka +0.5, honor przed reka -1 ++ MINUS modyfikacja Miltonow: - -1 za brak asa na rece za brak dziesiatek - -1 za brak odpowiedniej liczby kart towarzyszacych honorowi za brak zgrupowania honorow - -1 za kazda figure przed reka ++ PLUS za kazdego asa za kazda dziesiatke z innym honorem lub dziewiatka za zgrupowanie honorow za kazda figure za reka ++ POLSKIE PUNKTY krol - 4 walet - 0 - modyfikacja: honory samotne: honory z innymi honorami: ++ PUNKTY AKD ++ REITHA PUNKTY as - 6 walet - 2 dziesiatka - 1 ++ ROBERTSONA PUNKTY ++ TRUSCOTTA PUNKTY PRZELICZENIOWE modyfikacja Miltona - +1 za kolor 5+ - +1 za singel - +2 za renons ++ UJEMNA LEWA gry kolorowe 1 LU: K, D, x, AD, Ax, Kx, AKW, AKx, ADW, ADx, KDW, KDx 2 LU: DW, Dx, xx, AWx, Axx, KW10, Kxx, DW10, Dxx 3 LU: W10x, xxx oraz: - Axx ponizej 2 LU - Dxx 3LU, ale z waletem lub w kolorze partnera 2 LU ++ VERNESA PUNKTY as: 4 krol: 3.08 dama: 1.88 walet: 0.94 (as to 4.25 waleta, damy, 1.3 krola) ++ WYGRYWAJACA LEWA - (1) wartosci honorow w krotkich kolorach AKD 3, AKW 2.5, AKx 2, ADW 2.5, AD10 2, ADx 1.5 AW10 1.5, AWx 1, Axx 1, KDW 2, KD KDx 1 KW10 1.5, KWx 1, KW 0.5, Kxx 0.5, DW10 1, DWx 0.5 - wartosci honorow w sekwensach i niskich kart w dlugich kolorach zawierajacych sekwensy AKDW 4, AKD10 3.5, AKW10 3.5 ADW10 3.5, AW , KDW10 3 KW , DW109 2, W1098 1 jesli powyzsze sekwensy w kolorze 5-kartowy +1, 6- +2, 7- +3 - wartosci niskich kart w kolorach 4-kartowych: atu 1, boczny 0.5 5-: atu 2, boczny 1 6-: atu 3, boczny 2 7-: atu 4 (ta wartosc dodac do wartosci z(1)) - dodatkowo w grze kolorowej: honory atu: A 1, K 1, DW 1, D 0.5, W10 0.5 liczba atu: 4: 0.5, 5: 1, 6: 2 za jeden (tylko jeden) krotki boczny kolor kolor: karty dubleton singel renons liczba atu: liczba LW: **** wartosci ukladowe **** CULBERTSONA PUNKTY PRZELICZENIOWE (p. Encyklopedia...) zalezne od licytacji GORENA PUNKTY PRZELICZENIOWE PUNKTY ZA UKLAD PUSTA REKA ++ STAYMANA PUNKTY PRZELICZENIOWE dodatek za uklad do Miltonow - 4 asy: +1 - K, D lub KD w kolorze partnera: +1 - 0 asow: -1 - honory w bocznych bez obstawy: K, D, W, KD, KW, DW, Dx, Wx, kazdy 3-kartowy zawierajacy nie wiecej niz D lub W: -1 - kolory 5+ z AKDW lub AKD: +2 za kazda karte powyzej 4 - kolory 5+ z co najmniej dwoma honorami: +1 za kazda karte powyzej 4 - krotkie kolory: renons +3, singel +2, dubleton +1 - 5+ kart w kolorze: +1 - singel: +1 - renons: +2 ++ TRZECH I CZTERECH REGULA - za kazda karte powyzej 4 w atu: +1 - za kazda karte powyzej 3 w bocznym: +1 todo: + honorowa lewa + minus, plus + Truscotta + Staymana punkty przeliczeniowe + trzech i czterech regula + ujemna lewa + wygrywajaca lewa
14
Punkty za układ Modyfikacje Miltonów c.d.
Punkty przeliczeniowe Truscotta +1 za kolor 5+ +1 za singel +2 za renons Punkty przeliczeniowe Staymana +1 za 4 asy +1 za K, D lub KD w kolorze partnera -1 za brak asów -1 za honory w bocznych kolorach bez obstawy +2 za piątą, szóstą itd. kartę w kolorach 5+ z AKDW lub AKD +1 za piątą, szóstą itd. kartę w kolory 5+ z co najmniej dwoma honorami +3 za renons, +2 za singel, +1 za dubleton OCENA WARTOSCI RAK **** pojecia ogolne **** DOBRE PUNKTY punkty za honory warte wiecej niz wynikaloby to z punktow: - w dlugich kolorach - za przeciwnikiem, ktory wskazal mocna reke - za przeciwnikiem, ktory pokazal dlugosc w kolorze tych honorow - wraz z towarzyszacymi dzeisatkami idziewiatkami - w dlugich kolorach (4+) pokazanych przez partnera, nawet bez odpowiedniej liczby blotek DUPLIKACJA WARTOSCI - d.w. honorowych: na obu rekach dubel wylacznie z honorow - d.w. ukladowych: obaj partnerzy wliczaja punkty za uklad w tym samym kolorze - d.w. honorowych i ukladowych: jeden z partnerow ma krotkosc w kolorze, w ktorym parner ma honory ++ LIMIT (Bambergera) as - 7 krol - 5 dama - 3 walet - 1 **** wartosci honorow **** # as to 4.25 waleta, damy i 1.3 krola ++ BAMBERGERA PUNKTY ++ COLLETA PUNKTY as - 4 krol - 3 dama - 2 walet - 0.5 dziesiatka - 0.5 ++ CZTERECH ASOW PUNKTY as - 3 krol - 2 dama - 1 ++ HONOROWA LEWA AKDW AKD AKW AK - 2 AD - 1.5 AW 1.25 A - 1 KDW KD - 1 KWx Kx - 0.5 DWx DW Dx KONTROLA (stosowana w szlemowej licytacji) as - 2 kontrole krol - 1 kontrola [zgrupowanie honorow: co najmniej 2 starsze - AKD lub 3 dowolne honory - AKDWT) ++ MILTONY - doliczyc 0.25 za kazdego asa, odjac 1 za brak asa w poczatkowej rece - za honory bez odpowiedniej liczby blotek -1 (K, D, W, Dx, Wx, Wxx, KD, KW, DW, A) za dziesiatki z dziewiatkami lub starszymi honorami za zgrupowanie honorow, -0.5 za K, D, W (gdy z licytacji wynika, ze reka partnera jest slaba) - honor za reka +0.5, honor przed reka -1 ++ MINUS modyfikacja Miltonow: - -1 za brak asa na rece za brak dziesiatek - -1 za brak odpowiedniej liczby kart towarzyszacych honorowi za brak zgrupowania honorow - -1 za kazda figure przed reka ++ PLUS za kazdego asa za kazda dziesiatke z innym honorem lub dziewiatka za zgrupowanie honorow za kazda figure za reka ++ POLSKIE PUNKTY krol - 4 walet - 0 - modyfikacja: honory samotne: honory z innymi honorami: ++ PUNKTY AKD ++ REITHA PUNKTY as - 6 walet - 2 dziesiatka - 1 ++ ROBERTSONA PUNKTY ++ TRUSCOTTA PUNKTY PRZELICZENIOWE modyfikacja Miltona - +1 za kolor 5+ - +1 za singel - +2 za renons ++ UJEMNA LEWA gry kolorowe 1 LU: K, D, x, AD, Ax, Kx, AKW, AKx, ADW, ADx, KDW, KDx 2 LU: DW, Dx, xx, AWx, Axx, KW10, Kxx, DW10, Dxx 3 LU: W10x, xxx oraz: - Axx ponizej 2 LU - Dxx 3LU, ale z waletem lub w kolorze partnera 2 LU ++ VERNESA PUNKTY as: 4 krol: 3.08 dama: 1.88 walet: 0.94 (as to 4.25 waleta, damy, 1.3 krola) ++ WYGRYWAJACA LEWA - (1) wartosci honorow w krotkich kolorach AKD 3, AKW 2.5, AKx 2, ADW 2.5, AD10 2, ADx 1.5 AW10 1.5, AWx 1, Axx 1, KDW 2, KD KDx 1 KW10 1.5, KWx 1, KW 0.5, Kxx 0.5, DW10 1, DWx 0.5 - wartosci honorow w sekwensach i niskich kart w dlugich kolorach zawierajacych sekwensy AKDW 4, AKD10 3.5, AKW10 3.5 ADW10 3.5, AW , KDW10 3 KW , DW109 2, W1098 1 jesli powyzsze sekwensy w kolorze 5-kartowy +1, 6- +2, 7- +3 - wartosci niskich kart w kolorach 4-kartowych: atu 1, boczny 0.5 5-: atu 2, boczny 1 6-: atu 3, boczny 2 7-: atu 4 (ta wartosc dodac do wartosci z(1)) - dodatkowo w grze kolorowej: honory atu: A 1, K 1, DW 1, D 0.5, W10 0.5 liczba atu: 4: 0.5, 5: 1, 6: 2 za jeden (tylko jeden) krotki boczny kolor kolor: karty dubleton singel renons liczba atu: liczba LW: **** wartosci ukladowe **** CULBERTSONA PUNKTY PRZELICZENIOWE (p. Encyklopedia...) zalezne od licytacji GORENA PUNKTY PRZELICZENIOWE PUNKTY ZA UKLAD PUSTA REKA ++ STAYMANA PUNKTY PRZELICZENIOWE dodatek za uklad do Miltonow - 4 asy: +1 - K, D lub KD w kolorze partnera: +1 - 0 asow: -1 - honory w bocznych bez obstawy: K, D, W, KD, KW, DW, Dx, Wx, kazdy 3-kartowy zawierajacy nie wiecej niz D lub W: -1 - kolory 5+ z AKDW lub AKD: +2 za kazda karte powyzej 4 - kolory 5+ z co najmniej dwoma honorami: +1 za kazda karte powyzej 4 - krotkie kolory: renons +3, singel +2, dubleton +1 - 5+ kart w kolorze: +1 - singel: +1 - renons: +2 ++ TRZECH I CZTERECH REGULA - za kazda karte powyzej 4 w atu: +1 - za kazda karte powyzej 3 w bocznym: +1 todo: + honorowa lewa + minus, plus + Truscotta + Staymana punkty przeliczeniowe + trzech i czterech regula + ujemna lewa + wygrywajaca lewa
15
Punkty za układ Ujemna lewa
Ile lew jest do oddania w kolorze 1 LU za K, D, x, AD, Ax, Kx, AKW, AKx, ADW, ADx, KDW, KDx 2 LU za DW, Dx, xx, AWx, Axx, KW10, Kxx, DW10, Dxx 3 LU za W10x, xxx
16
Punkty za układ Wygrywająca lewa
Ile lew jest do wzięcia w kolorze wartości honorów w krótkich kolorach np. AKD 3, AKW 2.5, KW10 1,5, KDW 2, wartości honorów w sekwensach i niskich kart w długich kolorach zawierających sekwensy np. AKDW 4, AKD10 3.5, AW +1 za 5 kart w kolorze, +2 za 6, +3 za 7 wartości niskich kart w długich kolorach np. dla 5-kartowego koloru: +2 dla atu, +1 dla bocznego koloru dodatkowo za kolor atutowy +1 za A, K lub DW, +0,5 za D lub W10 +2 za 6 kart, +1 za 5, +0,5 za 4 krótkość w bocznym kolorze przy grze w atu
17
96.06 | 81.21 | 35.15 (dalej przeuczenie)
Wyniki Bez Atu 1-1 : suma Miltonów pary 93.62 | | 31.51 93.73 | | 31.37 4-1 : Miltony dla poszczególnych rąk 93.64 | | 31.47 93.73 | | 31.31 20-1 : Miltony i długości kolorów 93.61 | | 31.48 : j.w. 94.23 | | 33.00 94.24 | | 32.78 4-1 : punkty Vernesa : 8 estymatorów układu dla rąk 95.07 | | 32.57 94.94 | | 32.50 : 9 estymatorów siły dla rąk 95.03 | | 32.84 94.87 | | 32.39 : 9 estymatorów siły dla rąk i par 95.00 | | 32.93 94.85 | | 32.47 : 9 est. siły i 8 est. układu 96.14 | | 35.60 96.03 | | 35.41 : tylko rozkład (bez estymatorów) 96.51 | | 35.34 96.07 | | 34.66 (52+36)-25-1 : rozkład i 9 estymatorów siły 96.77 | | 35.65 96.33 | | 35.01 (52+32)-25-1 : rozkład i 8 estymatorów układu 97.40 | | 37.66 96.86 | | 36.67 (52+102) : rozkład, siła i układ dla rąk i par 98.28 | | 39.95 96.06 | | (dalej przeuczenie)
18
Liczba punktów a liczba lew (wg sieci 1-1) Bez Atu
93.73 | | 31.37 Liczba punktów Liczba lew 0 – 7 8 – 10 1 11 – 13 2 14 – 15 3 16 – 17 4 18 – 19 5 20 6 21 – 22 7 23 – 24 8 25 – 26 9 27 – 28 10 29 – 31 11 32 – 34 12 35 – 40 13
19
Wyniki Piki 4-1 : Miltony dla poszczególnych rąk 76.38 | 50.05 | 17.09
76.22 | | 16.91 20-1 : Miltony i długości kolorów 96.92 | | 35.35 97.00 | | 35.29 : j.w. 98.73 | | 40.52 98.75 | | 40.30 : 8 estymatorów układu dla rąk 98.70 | | 40.82 98.56 | | 39.94 : 9 estymatorów siły dla rąk 76.84 | | 16.94 76.83 | | 16.75 : 9 est. siły i 8 est. układu 98.74 | | 41.55 98.71 | | 40.94 : tylko rozkład (bez estymatorów) 98.91 | | 41.04 98.77 | | 40.13 52-7x : j.w. 98.89 | | 40.91 98.83 | | 40.77 (52+16)-25-1 : rozkład i długości kolorów 99.60 | | 46.19 99.54 | | 45.40 (52+16) : j.w. 99.81 | | 50.52 99.75 | | 49.03 ze zmianą wistu: : tylko rozkład [104] 99.29 | | 42.64 99.09 | | 41.92 (104+68) : rozkład i 8 est. układu 99.88 | | 52.45 99.46 | | 45.54
20
Punkty Zara Siła ręki to suma: Wyniki dla Pików ze zmianą wistu:
wartości honorów wg puktacji: A: 6, K: 4, D: 2, W: 1 różnicy długości najdłuższego i najkrótszego koloru sumy długości dwóch najdłuższych kolorów Wyniki dla Pików ze zmianą wistu: 4-1 84.11 | | 22.72 84.08 | | 22.62 83.74 | | 23.73 83.77 | | 23.65 98.91 | | 41.04 98.77 | | 40.13 (52+4)-25-1 91.86 | | 28.60 91.49 | | 28.18
21
Reprezentacja danych
22
Reprezentacja danych 26x4
23
Reprezentacja danych 52
24
Reprezentacja danych 104
25
Reprezentacja danych 52x4
NOWOŚĆ
26
Wyniki reprezentacji 52x4 Piki ze zmianą wistu
52x4-4x4x4-5x4-7-1 99.58 | | 47.11 99.56 | | 46.82 52x4-(3x4,4)x4-8x4-8x2-8-1 99.73 | | 49.54 99.60 | | 46.69 52x4-8x4-8-1 99.64 | | 47.87 99.63 | | 47.32 52x4-13x4-13-1 99.81 | | 51.54 99.79 | | 50.62 52x4-26x 99.92 | | 55.07 99.88 | | 53.11 (52x4+16)-(13x4+8)-16-1 rozkład i długości kolorów 99.80 | | 51.33 99.79 | | 50.70 (52x4+84)-(13x4+21)-26-1 rozkład, długości kolorów, estymatory siły, estymatory układu 99.86 | | 53.63 99.84 | | 52.47
27
Porównanie procesu nauki
26x4 (26x4) 10 tys. rozdań ~ 50 tys. iteracji 52 i 104 100 tys. rozdań ~ 1 tys. iteracji 52x4 ~ 10 tys. iteracji 52 104 52x4
28
Porównanie wielkości sieci
Liczba neuronów Liczba połączeń Wynik (Piki ze zmianą wistu) (26x4)-(13x4)-(7x4)-13-1 198 845 98.76 | | 39.90 78 1325 98.49 | | 39.29 139 3244 99.09 | | 41.92 196 7111 98.60 | | 39.60 236 11568 96.99 | | 35.13 52x4-4x4x4-5x4-7-1 300 1299 99.56 | | 46.82 52x4-(3x4,4)x4-8x4-8x2-8-1 329 2360 99.60 | | 46.69 52x4-8x4-8-1 249 1928 99.63 | | 47.32 52x4-13x4-13-1 274 3393 99.79 | | 50.62 52x4-26x 352 8463 99.88 | | 53.11
29
Ekperymenty
30
Sprawdzenie powtarzalności wyników
4 sieci uczone niezależnie na tych samych rozdaniach | | | | | | | | | | | | | | | | BA Atu zgodne wyniki % % 1 lewa rozbieżności % % 2 lewy rozbieżności % % 3 lewy rozbieźności % %
31
Użycie średniej wartości wynikowej kilku sieci
Cztery niezależnie uczone sieci : Biorąc ich średnią wartość wyjścia: Bez Atu 96.21 | | | | | | | | 35.15 Kontrakty atutowe 98.81 | | 40, | | 41, | | | | 40.71 96.43 | | 35.46 98.91 | | 41.13
32
Sprawdzenie skuteczności dla poszczególnych liczb lew
Piki lewy # ± ± ,32% 66,61% 12,30% ,39% 81,21% 34,53% ,10% 86,66% 40,73% ,93% 88,96% 41,41% ,94% 89,04% 40,36% ,85% 88,67% 40,80% ,03% 88,75% 41,32% ,10% 88,99% 40,50% ,28% 89,29% 40,46% ,14% 89,19% 42,14% ,89% 88,45% 40,58% ,94% 85,87% 42,32% ,57% 81,71% 31,94% ,66% 73,85% 9,39%
33
Zmiana docelowych wartości
Równy podział Proporcjonalny podział Liczba rozdań Liczba kew Wielkość przedziału Wartość docelowa Wielkość przedziału 1138 0,1000 2725 1 0,0615 0,1615 0,0155 0,1155 5156 2 0,2231 0,0315 0,1470 8043 3 0,2846 0,0528 0,1998 10447 4 0,3462 0,0740 0,2737 12201 5 0,4077 0,0906 0,3643 12927 6 0,4692 0,1005 0,4648 12709 7 0,5308 0,1025 0,5674 11467 8 0,5923 0,0967 0,6641 9618 9 0,6538 0,0843 0,7484 6866 10 0,7154 0,0659 0,8144 4225 11 0,7769 0,0444 0,8587 1935 12 0,8385 0,0246 0,8834 543 13 0,9000 0,0166 100000 : 98.77 | | 40.13 98.66 | | 39.98
34
Sprawdzenie skuteczności na granicach
Piki Liczba lew Skuteczność | | 84.21 0-1 | | 48.46 1 99.91 | | 46.86 1-2 99.34 | | 40.38 2 99.42 | | 40.71 2-3 98.37 | | 38.27 3 98.68 | | 40.93 3-4 98.55 | | 37.96 4 98.85 | | 40.34 4-5 98.60 | | 37.28 5 98.87 | | 41.23 5-6 98.47 | | 37.95 6 98.83 | | 41.73 6-7 98.41 | | 38.74 7 98.91 | | 41.64 7-8 98.48 | | 37.13 8 98.43 | | 40.42 8-9 98.43 | | 38.61 9 99.31 | | 41.68 9-10 98.66 | | 38.75 10 98.95 | | 42.05 10-11 98.93 | | 40.47 11 99.80 | | 47.27 11-12 99.68 | | 43.15 12 99.54 | | 53.05 12-13 | | 38.66 13 | |
35
Uczenie na błędach Piki, sieci 52-25-1 I faza 98.77 | 88.00 | 40.13
II faza – inna sieć uczona na błędach I fazy | | wynik dla poprawnych z I fazy: | | 74.35 III faza – inna sieć uczona na błędach II fazy | | wynik dla poprawnych z I fazy: | | wynik dla poprawnych z II fazy: | | 39.15
36
Uczenie na błędach kontynuacja
Używając 2 sieci w II fazie (jedna uczona na błędach przeszacowania, druga niedoszacowania) przeszacowanie: uczenie: | | na całym testowym: | | 21.13 niedoszacowanie: uczenie: | | na całym testowym: | | 22.08 Tworząc system 3 sieci (dwie powyższa i ta z pierwszej fazy) i jako wynik biorąc ich średnią: | | dla porównania wynik pierwotnej sieci: | | 40.13
37
Przykładowe rozdania
38
Przykładowe rozdanie 1 Piki, wist W
Liczba lew pary NS: 10 Wyniki sieci: (52x4)-(13x4)-13-1 (52x4)-(26x4) (104+68) (52x4+84)-(13x4+21)-26-1 8 7
39
Przykładowe rozdanie 2 Piki, wist N
Liczba lew pary NS: 3 Wyniki sieci: (52x4)-(13x4)-13-1 (52x4)-(26x4) (104+68) (52x4+84)-(13x4+21)-26-1 5 4
40
Przykładowe rozdanie 3 Piki, wist N lub S
Liczba lew pary NS: 4 3 Wyniki sieci: (52x4)-(13x4)-13-1 (52x4)-(26x4) (104+68) (52x4+84)-(13x4+21)-26-1
41
Przykładowe rozdanie 4 Piki, wist N
Liczba lew pary NS: Wyniki sieci: (52x4)-(13x4)-13-1 (52x4)-(26x4) (104+68) (52x4+84)-(13x4+21)-26-1 4 3
42
Podsumowanie: Wyniki najlepszej sieci 52x4-26x4-26-13-1
Bez Atu: | | 37.31 Piki ze zmianą wistu: | | 53.11 Uczenie wyłącznie na przykładach Bez ludzkiej wiedzy Bez znajomości zasad gry
43
Pomysły ?
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.