Metody oceny siły rąk w rozdaniach brydżowych mgr inż. Krzysztof Mossakowski Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Warszawa, 8 listopada 2006
Zagadnienie Znając dokładny rozkład kart w rozdaniu brydżowym, odpowiedzieć na pytanie ile lew weźmie para NS przy założeniu optymalnej gry wszystkich graczy Miara skuteczności - dla ilu procent rozdań: bezbłędny wynik tolerancja jednej lewy tolerancja dwóch lew
Sieci neuronowe Java Neural Network Simulator Sieci feed-forward: funkcja aktywacji: unipolarna lub bipolarna sigmoidalna, resilient backpropagation (RProp), 52 lub 104 neurony wejściowe, eksperymenty z liczbą warstw i neuronów ukrytych, 1 lub 14 neuronów wyjściowych.
Dotychczasowe wyniki
Wyniki Gra BA, wist W W procentach: błąd nie większy niż dwie lewy W procentach: błąd nie większy niż jedna lewa Wyniki Gra BA, wist W W procentach: bezbłędnie Sieć Uczący Testowy (26x4)-(13x4)-1 94.77 | 77.45 | 31.91 94.77 | 77.50 | 32.05 (26x4)-(13x4)-(3x4)-5-1 93.86 | 75.67 | 30.00 92.85 | 73.60 | 29.60 (26x4)-(13x4)-(7x4)-13-1 96.02 | 80.14 | 33.57 93.87 | 75.70 | 31.04 (26x4)-(13x4)-(13x4)-26-13-1 97.29 | 82.02 | 34.99 90.09 | 69.17 | 26.87 52-1 94.22 | 76.14 | 30.88 94.15 | 76.15 | 31.29 52-4-1 94.52 | 77.13 | 31.80 94.44 | 77.05 | 32.13 52-8-1 95.42 | 78.77 | 32.92 95.24 | 78.53 | 32.88 52-25-1 96.51 | 81.80 | 35.34 96.07 | 80.88 | 34.66 52-52-1 96.79 | 82.23 | 35.45 95.66 | 79.46 | 33.64 104-1 94.81 | 77.62 | 32.19 94.76 | 77.52 | 32.19 104-30-4-1 96.96 | 82.70 | 35.85 96.46 | 81.43 | 34.86
Wyniki Gry kolorowe, wist W (26x4;1) – dodatkowy neuron 52 i 104 – wzmacniane wartości wejściowe neuronów kart atutowych (26,1x4;1)-(13x4)-(7x4)-13-1 97.26 | 83.74 | 36.21 96.74 | 82.36 | 35.62 52-1 atu*2 NS 0.5 WE 0.5 96.66 | 79.81 | 32.87 96.69 | 79.81 | 32.79 52-1 atu*2 NS 1.0 WE -1.0 96.66 | 79.82 | 32.89 96.68 | 79.81 | 32.79 52-25-1 atu*2 NS 0.5 WE 0.5 98.78 | 88.22 | 40.51 98.68 | 87.88 | 40.11 test dla BA (nie było w uczeniu) 91.64 | 69.21 | 26.06 52-25-1 j.w. + BA 97.83 | 85.12 | 37.75 97.72 | 84.90 | 37.56 test tylko dla gier kolorowych 98.57 | 87.24 | 39.43 test tylko dla BA 94.30 | 75.50 | 30.09
Wyniki Gra w zadany kolor, wist W 52-25-1 Piki N 1.0 S 0.8 W -1.0 E -0.8 98.66 | 87.74 | 39.76 98.47 | 86.83 | 39.16 52-25-1 Piki NS 1.0 WE -1.0 98.91 | 88.81 | 41.04 98.77 | 88.00 | 40.13 test dla Kierów (nie było w uczeniu) 59.18 | 39.09 | 14.12 test dla Kar (nie było w uczeniu) 58.89 | 38.67 | 13.51 test dla Trefli (nie było w uczeniu) 58.86 | 38.90 | 13.77 52-25-1 Kiery NS 1.0 WE -1.0 98.90 | 88.65 | 41.18 98.65 | 87.81 | 40.18 52-25-1 Kara NS 1.0 WE -1.0 98.96 | 88.76 | 40.94 98.66 | 87.68 | 39.96 52-25-1 Trefle NS 1.0 WE -1.0 98.87 | 88.69 | 40.82 98.73 | 87.90 | 40.02 52-26-13-6-1 Piki NS 1.0 WE 0.0 98.95 | 88.86 | 41.06 98.76 | 87.96 | 40.20 52-7x4-20-1 Piki NS 1.0 WE 0.0 98.89 | 88.63 | 40.91 98.83 | 88.37 | 40.77 test dla BA (nie było w uczeniu) 72.87 | 50.34 | 18.42 104-30-4-1 Piki NS 1 WE -1 NW 1 SE -1 99.18 | 89.96 | 42.40 98.57 | 87.07 | 39.11
Wyniki Gra w Piki, zmiana wistu W 7,1% rozdań liczba lew zależy od tego, kto wistuje 52-25-1 wszystkie wisty 62.53 | 39.89 | 13.66 58.28 | 36.94 | 12.65 52-25-1 wisty NS N 1.0 S 0.5 W -1.0 E -0.5 97.78 | 84.43 | 36.82 97.61 | 84.00 | 36.57 52-25-1 wisty NS N 1.0 S 0.8 W -1.0 E -0.8 98.65 | 87.61 | 39.70 98.49 | 87.15 | 39.29 52-25-1 Piki NS 1.0 WE -1.0 98.91 | 88.81 | 41.04 98.77 | 88.00 | 40.13 test dla rozdań z liczbą lew zależną od wistu 97.78 | 83.20 | 35.84 98.85 | 88.37 | 40.46 104-30-4-1 NS 1.0 WE -1.0 NW 1.0 SE -1.0 99.29 | 90.64 | 42.64 99.09 | 89.79 | 41.92
Wyniki Podsumowanie Najlepsze dotychczasowe wyniki uczenie wyłącznie na przykładach bez ludzkiej wiedzy bez znajomości zasad gry Bez Atu 96.96 | 82.70 | 35.85 96.46 | 81.43 | 34.86 Bez Atu i wszystkie kolory 97.83 | 85.12 | 37.75 97.72 | 84.90 | 37.56 Wszystkie kolory 98.78 | 88.22 | 40.51 98.68 | 87.88 | 40.11 Piki 98.89 | 88.63 | 40.91 98.83 | 88.37 | 40.77 Piki ze zmianą wistu 99.29 | 90.64 | 42.64 99.09 | 89.79 | 41.92
Ludzkie metody oceny siły rąk
Punkty za honory Punkty Miltona Worka Punkty Bambergera Punkty Colleta Punkty czterech asów Polskie punkty Punkty AKD Punkty Reitha Punkty Robertsona Punkty Vernesa A K Q J T 4 3 2 1 0 7 5 3 1 0 4 3 2 0.5 0.5 3 2 1 0.5 0 7 4 3 0 0 4 3 2 0 0 6 4 3 2 1 7 5 3 2 1 4 3.08 1.88 0.94 0
Punkty Vernesa Relatywna wartość honorów w stosunku do asa, obliczona na podstawie 2400 rozdań z Mistrzostw Świata w 1965 roku A K Q J 4,00 3,08 1,88 0,94 Sieci neuronowe 52-1 BA: 4,00 2,67 1,68 1,05 Atu: 4,00 3,11 2,27 1,63 ... 2: 0,59 Nie-Atu: 1,82 0,64 -0,26 -0,73
Punkty za układ Modyfikacje Miltonów Plus +0.25 za każdego asa +0.5 za każdą dziesiątkę z innym honorem lub dziewiątką +0.5 za zgrupowanie honorów +0.5 za każdą figurę za ręką Minus -1 za brak asa na ręce -0.5 za brak dziesiątek -1 za brak odpowiedniej liczby kart towarzyszących honorowi -0.5 za brak zgrupowania honorow -1 za każdą figurę przed ręką Trzech i czterech reguła +1 za każdą kartę powyżej 4 w atu +1 za każdą kartę powyżej 3 w bocznym kolorze OCENA WARTOSCI RAK **** pojecia ogolne **** DOBRE PUNKTY punkty za honory warte wiecej niz wynikaloby to z punktow: - w dlugich kolorach - za przeciwnikiem, ktory wskazal mocna reke - za przeciwnikiem, ktory pokazal dlugosc w kolorze tych honorow - wraz z towarzyszacymi dzeisatkami idziewiatkami - w dlugich kolorach (4+) pokazanych przez partnera, nawet bez odpowiedniej liczby blotek DUPLIKACJA WARTOSCI - d.w. honorowych: na obu rekach dubel wylacznie z honorow - d.w. ukladowych: obaj partnerzy wliczaja punkty za uklad w tym samym kolorze - d.w. honorowych i ukladowych: jeden z partnerow ma krotkosc w kolorze, w ktorym parner ma honory ++ LIMIT (Bambergera) as - 7 krol - 5 dama - 3 walet - 1 **** wartosci honorow **** # as to 4.25 waleta, 2.125 damy i 1.3 krola ++ BAMBERGERA PUNKTY ++ COLLETA PUNKTY as - 4 krol - 3 dama - 2 walet - 0.5 dziesiatka - 0.5 ++ CZTERECH ASOW PUNKTY as - 3 krol - 2 dama - 1 ++ HONOROWA LEWA AKDW - 2.25 AKD - 2.25 AKW - 2.25 AK - 2 AD - 1.5 AW 1.25 A - 1 KDW - 1.25 KD - 1 KWx - 0.75 Kx - 0.5 DWx - 0.75 DW - 0.25 Dx - 0.25 KONTROLA (stosowana w szlemowej licytacji) as - 2 kontrole krol - 1 kontrola [zgrupowanie honorow: co najmniej 2 starsze - AKD lub 3 dowolne honory - AKDWT) ++ MILTONY - doliczyc 0.25 za kazdego asa, odjac 1 za brak asa w poczatkowej rece - za honory bez odpowiedniej liczby blotek -1 (K, D, W, Dx, Wx, Wxx, KD, KW, DW, A) - +0.5 za dziesiatki z dziewiatkami lub starszymi honorami - +0.5 za zgrupowanie honorow, -0.5 za K, D, W (gdy z licytacji wynika, ze reka partnera jest slaba) - honor za reka +0.5, honor przed reka -1 ++ MINUS modyfikacja Miltonow: - -1 za brak asa na rece - -0.5 za brak dziesiatek - -1 za brak odpowiedniej liczby kart towarzyszacych honorowi - -0.5 za brak zgrupowania honorow - -1 za kazda figure przed reka ++ PLUS - +0.25 za kazdego asa - +0.5 za kazda dziesiatke z innym honorem lub dziewiatka - +0.5 za zgrupowanie honorow - +0.5 za kazda figure za reka ++ POLSKIE PUNKTY krol - 4 walet - 0 - modyfikacja: honory samotne: honory z innymi honorami: ++ PUNKTY AKD ++ REITHA PUNKTY as - 6 walet - 2 dziesiatka - 1 ++ ROBERTSONA PUNKTY ++ TRUSCOTTA PUNKTY PRZELICZENIOWE modyfikacja Miltona - +1 za kolor 5+ - +1 za singel - +2 za renons ++ UJEMNA LEWA gry kolorowe 1 LU: K, D, x, AD, Ax, Kx, AKW, AKx, ADW, ADx, KDW, KDx 2 LU: DW, Dx, xx, AWx, Axx, KW10, Kxx, DW10, Dxx 3 LU: W10x, xxx oraz: - Axx ponizej 2 LU - Dxx 3LU, ale z waletem lub w kolorze partnera 2 LU ++ VERNESA PUNKTY as: 4 krol: 3.08 dama: 1.88 walet: 0.94 (as to 4.25 waleta, 2.125 damy, 1.3 krola) ++ WYGRYWAJACA LEWA - (1) wartosci honorow w krotkich kolorach AKD 3, AKW 2.5, AKx 2, ADW 2.5, AD10 2, ADx 1.5 AW10 1.5, AWx 1, Axx 1, KDW 2, KD10 1.5 KDx 1 KW10 1.5, KWx 1, KW 0.5, Kxx 0.5, DW10 1, DWx 0.5 - wartosci honorow w sekwensach i niskich kart w dlugich kolorach zawierajacych sekwensy AKDW 4, AKD10 3.5, AKW10 3.5 ADW10 3.5, AW109 2.5, KDW10 3 KW109 2.5, DW109 2, W1098 1 jesli powyzsze sekwensy w kolorze 5-kartowy +1, 6- +2, 7- +3 - wartosci niskich kart w kolorach 4-kartowych: atu 1, boczny 0.5 5-: atu 2, boczny 1 6-: atu 3, boczny 2 7-: atu 4 (ta wartosc dodac do wartosci z(1)) - dodatkowo w grze kolorowej: honory atu: A 1, K 1, DW 1, D 0.5, W10 0.5 liczba atu: 4: 0.5, 5: 1, 6: 2 za jeden (tylko jeden) krotki boczny kolor kolor: 3karty dubleton singel renons liczba atu: 2 3 4+ 2 3 4+ 2 3 4+ 2 3 4+ liczba LW: 0 0 0 0 0.5 1 0.5 1 2 1 2 3 **** wartosci ukladowe **** CULBERTSONA PUNKTY PRZELICZENIOWE (p. Encyklopedia...) zalezne od licytacji GORENA PUNKTY PRZELICZENIOWE PUNKTY ZA UKLAD PUSTA REKA ++ STAYMANA PUNKTY PRZELICZENIOWE dodatek za uklad do Miltonow - 4 asy: +1 - K, D lub KD w kolorze partnera: +1 - 0 asow: -1 - honory w bocznych bez obstawy: K, D, W, KD, KW, DW, Dx, Wx, kazdy 3-kartowy zawierajacy nie wiecej niz D lub W: -1 - kolory 5+ z AKDW lub AKD: +2 za kazda karte powyzej 4 - kolory 5+ z co najmniej dwoma honorami: +1 za kazda karte powyzej 4 - krotkie kolory: renons +3, singel +2, dubleton +1 - 5+ kart w kolorze: +1 - singel: +1 - renons: +2 ++ TRZECH I CZTERECH REGULA - za kazda karte powyzej 4 w atu: +1 - za kazda karte powyzej 3 w bocznym: +1 todo: + honorowa lewa + minus, plus + Truscotta + Staymana punkty przeliczeniowe + trzech i czterech regula + ujemna lewa + wygrywajaca lewa
Punkty za układ Modyfikacje Miltonów c.d. Punkty przeliczeniowe Truscotta +1 za kolor 5+ +1 za singel +2 za renons Punkty przeliczeniowe Staymana +1 za 4 asy +1 za K, D lub KD w kolorze partnera -1 za brak asów -1 za honory w bocznych kolorach bez obstawy +2 za piątą, szóstą itd. kartę w kolorach 5+ z AKDW lub AKD +1 za piątą, szóstą itd. kartę w kolory 5+ z co najmniej dwoma honorami +3 za renons, +2 za singel, +1 za dubleton OCENA WARTOSCI RAK **** pojecia ogolne **** DOBRE PUNKTY punkty za honory warte wiecej niz wynikaloby to z punktow: - w dlugich kolorach - za przeciwnikiem, ktory wskazal mocna reke - za przeciwnikiem, ktory pokazal dlugosc w kolorze tych honorow - wraz z towarzyszacymi dzeisatkami idziewiatkami - w dlugich kolorach (4+) pokazanych przez partnera, nawet bez odpowiedniej liczby blotek DUPLIKACJA WARTOSCI - d.w. honorowych: na obu rekach dubel wylacznie z honorow - d.w. ukladowych: obaj partnerzy wliczaja punkty za uklad w tym samym kolorze - d.w. honorowych i ukladowych: jeden z partnerow ma krotkosc w kolorze, w ktorym parner ma honory ++ LIMIT (Bambergera) as - 7 krol - 5 dama - 3 walet - 1 **** wartosci honorow **** # as to 4.25 waleta, 2.125 damy i 1.3 krola ++ BAMBERGERA PUNKTY ++ COLLETA PUNKTY as - 4 krol - 3 dama - 2 walet - 0.5 dziesiatka - 0.5 ++ CZTERECH ASOW PUNKTY as - 3 krol - 2 dama - 1 ++ HONOROWA LEWA AKDW - 2.25 AKD - 2.25 AKW - 2.25 AK - 2 AD - 1.5 AW 1.25 A - 1 KDW - 1.25 KD - 1 KWx - 0.75 Kx - 0.5 DWx - 0.75 DW - 0.25 Dx - 0.25 KONTROLA (stosowana w szlemowej licytacji) as - 2 kontrole krol - 1 kontrola [zgrupowanie honorow: co najmniej 2 starsze - AKD lub 3 dowolne honory - AKDWT) ++ MILTONY - doliczyc 0.25 za kazdego asa, odjac 1 za brak asa w poczatkowej rece - za honory bez odpowiedniej liczby blotek -1 (K, D, W, Dx, Wx, Wxx, KD, KW, DW, A) - +0.5 za dziesiatki z dziewiatkami lub starszymi honorami - +0.5 za zgrupowanie honorow, -0.5 za K, D, W (gdy z licytacji wynika, ze reka partnera jest slaba) - honor za reka +0.5, honor przed reka -1 ++ MINUS modyfikacja Miltonow: - -1 za brak asa na rece - -0.5 za brak dziesiatek - -1 za brak odpowiedniej liczby kart towarzyszacych honorowi - -0.5 za brak zgrupowania honorow - -1 za kazda figure przed reka ++ PLUS - +0.25 za kazdego asa - +0.5 za kazda dziesiatke z innym honorem lub dziewiatka - +0.5 za zgrupowanie honorow - +0.5 za kazda figure za reka ++ POLSKIE PUNKTY krol - 4 walet - 0 - modyfikacja: honory samotne: honory z innymi honorami: ++ PUNKTY AKD ++ REITHA PUNKTY as - 6 walet - 2 dziesiatka - 1 ++ ROBERTSONA PUNKTY ++ TRUSCOTTA PUNKTY PRZELICZENIOWE modyfikacja Miltona - +1 za kolor 5+ - +1 za singel - +2 za renons ++ UJEMNA LEWA gry kolorowe 1 LU: K, D, x, AD, Ax, Kx, AKW, AKx, ADW, ADx, KDW, KDx 2 LU: DW, Dx, xx, AWx, Axx, KW10, Kxx, DW10, Dxx 3 LU: W10x, xxx oraz: - Axx ponizej 2 LU - Dxx 3LU, ale z waletem lub w kolorze partnera 2 LU ++ VERNESA PUNKTY as: 4 krol: 3.08 dama: 1.88 walet: 0.94 (as to 4.25 waleta, 2.125 damy, 1.3 krola) ++ WYGRYWAJACA LEWA - (1) wartosci honorow w krotkich kolorach AKD 3, AKW 2.5, AKx 2, ADW 2.5, AD10 2, ADx 1.5 AW10 1.5, AWx 1, Axx 1, KDW 2, KD10 1.5 KDx 1 KW10 1.5, KWx 1, KW 0.5, Kxx 0.5, DW10 1, DWx 0.5 - wartosci honorow w sekwensach i niskich kart w dlugich kolorach zawierajacych sekwensy AKDW 4, AKD10 3.5, AKW10 3.5 ADW10 3.5, AW109 2.5, KDW10 3 KW109 2.5, DW109 2, W1098 1 jesli powyzsze sekwensy w kolorze 5-kartowy +1, 6- +2, 7- +3 - wartosci niskich kart w kolorach 4-kartowych: atu 1, boczny 0.5 5-: atu 2, boczny 1 6-: atu 3, boczny 2 7-: atu 4 (ta wartosc dodac do wartosci z(1)) - dodatkowo w grze kolorowej: honory atu: A 1, K 1, DW 1, D 0.5, W10 0.5 liczba atu: 4: 0.5, 5: 1, 6: 2 za jeden (tylko jeden) krotki boczny kolor kolor: 3karty dubleton singel renons liczba atu: 2 3 4+ 2 3 4+ 2 3 4+ 2 3 4+ liczba LW: 0 0 0 0 0.5 1 0.5 1 2 1 2 3 **** wartosci ukladowe **** CULBERTSONA PUNKTY PRZELICZENIOWE (p. Encyklopedia...) zalezne od licytacji GORENA PUNKTY PRZELICZENIOWE PUNKTY ZA UKLAD PUSTA REKA ++ STAYMANA PUNKTY PRZELICZENIOWE dodatek za uklad do Miltonow - 4 asy: +1 - K, D lub KD w kolorze partnera: +1 - 0 asow: -1 - honory w bocznych bez obstawy: K, D, W, KD, KW, DW, Dx, Wx, kazdy 3-kartowy zawierajacy nie wiecej niz D lub W: -1 - kolory 5+ z AKDW lub AKD: +2 za kazda karte powyzej 4 - kolory 5+ z co najmniej dwoma honorami: +1 za kazda karte powyzej 4 - krotkie kolory: renons +3, singel +2, dubleton +1 - 5+ kart w kolorze: +1 - singel: +1 - renons: +2 ++ TRZECH I CZTERECH REGULA - za kazda karte powyzej 4 w atu: +1 - za kazda karte powyzej 3 w bocznym: +1 todo: + honorowa lewa + minus, plus + Truscotta + Staymana punkty przeliczeniowe + trzech i czterech regula + ujemna lewa + wygrywajaca lewa
Punkty za układ Ujemna lewa Ile lew jest do oddania w kolorze 1 LU za K, D, x, AD, Ax, Kx, AKW, AKx, ADW, ADx, KDW, KDx 2 LU za DW, Dx, xx, AWx, Axx, KW10, Kxx, DW10, Dxx 3 LU za W10x, xxx
Punkty za układ Wygrywająca lewa Ile lew jest do wzięcia w kolorze wartości honorów w krótkich kolorach np. AKD 3, AKW 2.5, KW10 1,5, KDW 2, wartości honorów w sekwensach i niskich kart w długich kolorach zawierających sekwensy np. AKDW 4, AKD10 3.5, AW109 2.5 +1 za 5 kart w kolorze, +2 za 6, +3 za 7 wartości niskich kart w długich kolorach np. dla 5-kartowego koloru: +2 dla atu, +1 dla bocznego koloru dodatkowo za kolor atutowy +1 za A, K lub DW, +0,5 za D lub W10 +2 za 6 kart, +1 za 5, +0,5 za 4 krótkość w bocznym kolorze przy grze w atu
96.06 | 81.21 | 35.15 (dalej przeuczenie) Wyniki Bez Atu 1-1 : suma Miltonów pary 93.62 | 76.01 | 31.51 93.73 | 76.41 | 31.37 4-1 : Miltony dla poszczególnych rąk 93.64 | 75.95 | 31.47 93.73 | 76.34 | 31.31 20-1 : Miltony i długości kolorów 93.61 | 75.93 | 31.48 20-10-5-1 : j.w. 94.23 | 77.60 | 33.00 94.24 | 77.78 | 32.78 4-1 : punkty Vernesa 32-25-1 : 8 estymatorów układu dla rąk 95.07 | 78.29 | 32.57 94.94 | 77.71 | 32.50 36-25-1 : 9 estymatorów siły dla rąk 95.03 | 79.09 | 32.84 94.87 | 78.30 | 32.39 54-25-1 : 9 estymatorów siły dla rąk i par 95.00 | 78.95 | 32.93 94.85 | 78.27 | 32.47 68-25-1 : 9 est. siły i 8 est. układu 96.14 | 81.44 | 35.60 96.03 | 81.34 | 35.41 52-25-1 : tylko rozkład (bez estymatorów) 96.51 | 81.80 | 35.34 96.07 | 80.88 | 34.66 (52+36)-25-1 : rozkład i 9 estymatorów siły 96.77 | 82.37 | 35.65 96.33 | 81.39 | 35.01 (52+32)-25-1 : rozkład i 8 estymatorów układu 97.40 | 84.34 | 37.66 96.86 | 83.02 | 36.67 (52+102)-77-38-19-1 : rozkład, siła i układ dla rąk i par 98.28 | 86.93 | 39.95 96.06 | 81.21 | 35.15 (dalej przeuczenie)
Liczba punktów a liczba lew (wg sieci 1-1) Bez Atu 93.73 | 76.41 | 31.37 Liczba punktów Liczba lew 0 – 7 8 – 10 1 11 – 13 2 14 – 15 3 16 – 17 4 18 – 19 5 20 6 21 – 22 7 23 – 24 8 25 – 26 9 27 – 28 10 29 – 31 11 32 – 34 12 35 – 40 13
Wyniki Piki 4-1 : Miltony dla poszczególnych rąk 76.38 | 50.05 | 17.09 76.22 | 49.64 | 16.91 20-1 : Miltony i długości kolorów 96.92 | 82.40 | 35.35 97.00 | 82.21 | 35.29 20-10-5-1 : j.w. 98.73 | 88.30 | 40.52 98.75 | 88.21 | 40.30 32-25-1 : 8 estymatorów układu dla rąk 98.70 | 88.32 | 40.82 98.56 | 88.07 | 39.94 36-25-1 : 9 estymatorów siły dla rąk 76.84 | 50.09 | 16.94 76.83 | 49.77 | 16.75 68-25-1 : 9 est. siły i 8 est. układu 98.74 | 89.02 | 41.55 98.71 | 88.70 | 40.94 52-25-1 : tylko rozkład (bez estymatorów) 98.91 | 88.81 | 41.04 98.77 | 88.00 | 40.13 52-7x4-20-1 : j.w. 98.89 | 88.63 | 40.91 98.83 | 88.37 | 40.77 (52+16)-25-1 : rozkład i długości kolorów 99.60 | 92.98 | 46.19 99.54 | 92.38 | 45.40 (52+16)-34-17-8-1 : j.w. 99.81 | 95.45 | 50.52 99.75 | 94.50 | 49.03 ze zmianą wistu: 104-30-4-1 : tylko rozkład [104] 99.29 | 90.64 | 42.64 99.09 | 89.79 | 41.92 (104+68)-50-10-1 : rozkład i 8 est. układu 99.88 | 96.34 | 52.45 99.46 | 92.40 | 45.54
Punkty Zara Siła ręki to suma: Wyniki dla Pików ze zmianą wistu: wartości honorów wg puktacji: A: 6, K: 4, D: 2, W: 1 różnicy długości najdłuższego i najkrótszego koloru sumy długości dwóch najdłuższych kolorów Wyniki dla Pików ze zmianą wistu: 4-1 84.11 | 60.69 | 22.72 84.08 | 60.61 | 22.62 4-3-2-1 83.74 | 61.65 | 23.73 83.77 | 61.60 | 23.65 52-25-1 98.91 | 88.81 | 41.04 98.77 | 88.00 | 40.13 (52+4)-25-1 91.86 | 72.04 | 28.60 91.49 | 71.27 | 28.18
Reprezentacja danych
Reprezentacja danych 26x4
Reprezentacja danych 52
Reprezentacja danych 104
Reprezentacja danych 52x4 NOWOŚĆ
Wyniki reprezentacji 52x4 Piki ze zmianą wistu 52x4-4x4x4-5x4-7-1 99.58 | 93.54 | 47.11 99.56 | 93.31 | 46.82 52x4-(3x4,4)x4-8x4-8x2-8-1 99.73 | 95.13 | 49.54 99.60 | 93.14 | 46.69 52x4-8x4-8-1 99.64 | 94.02 | 47.87 99.63 | 93.75 | 47.32 52x4-13x4-13-1 99.81 | 95.88 | 51.54 99.79 | 95.49 | 50.62 52x4-26x4-26-13-1 99.92 | 97.28 | 55.07 99.88 | 96.48 | 53.11 (52x4+16)-(13x4+8)-16-1 rozkład i długości kolorów 99.80 | 95.85 | 51.33 99.79 | 95.44 | 50.70 (52x4+84)-(13x4+21)-26-1 rozkład, długości kolorów, estymatory siły, estymatory układu 99.86 | 96.68 | 53.63 99.84 | 96.12 | 52.47
Porównanie procesu nauki 26x4 (26x4) 10 tys. rozdań ~ 50 tys. iteracji 52 i 104 100 tys. rozdań ~ 1 tys. iteracji 52x4 ~ 10 tys. iteracji 52 104 52x4
Porównanie wielkości sieci Liczba neuronów Liczba połączeń Wynik (Piki ze zmianą wistu) (26x4)-(13x4)-(7x4)-13-1 198 845 98.76 | 88.00 | 39.90 52-25-1 78 1325 98.49 | 87.15 | 39.29 104-30-4-1 139 3244 99.09 | 89.79 | 41.92 104-52-26-13-1 196 7111 98.60 | 87.45 | 39.60 104-74-44-14 236 11568 96.99 | 81.98 | 35.13 52x4-4x4x4-5x4-7-1 300 1299 99.56 | 93.31 | 46.82 52x4-(3x4,4)x4-8x4-8x2-8-1 329 2360 99.60 | 93.14 | 46.69 52x4-8x4-8-1 249 1928 99.63 | 93.75 | 47.32 52x4-13x4-13-1 274 3393 99.79 | 95.49 | 50.62 52x4-26x4-26-13-1 352 8463 99.88 | 96.48 | 53.11
Ekperymenty
Sprawdzenie powtarzalności wyników 4 sieci 52-25-1 uczone niezależnie na tych samych rozdaniach 98.84 | 88.69 | 40.91 98.52 | 87.23 | 39.54 98.87 | 88.65 | 41.16 98.51 | 87.11 | 39.60 98.82 | 88.47 | 40.89 98.52 | 87.17 | 39.58 98.87 | 88.61 | 40.79 98.51 | 87.09 | 39.42 BA Atu zgodne wyniki 61.23% 63.40% 1 lewa rozbieżności 37.93% 36.56% 2 lewy rozbieżności 0.81% 0.04% 3 lewy rozbieźności 0.03% 0.00%
Użycie średniej wartości wynikowej kilku sieci Cztery niezależnie uczone sieci 52-25-1: Biorąc ich średnią wartość wyjścia: Bez Atu 96.21 | 81.29 | 34.77 96.16 | 81.30 | 34.86 96.36 | 81.72 | 35.00 96.36 | 81.94 | 35.15 Kontrakty atutowe 98.81 | 88.85 | 40,71 98.86 | 88.75 | 41,02 98.81 | 88.51 | 40.71 98.87 | 88.62 | 40.71 96.43 | 82.14 | 35.46 98.91 | 89.13 | 41.13
Sprawdzenie skuteczności dla poszczególnych liczb lew Piki 52-25-1 lewy # ±2 ±1 0 0 1138 93,32% 66,61% 12,30% 1 2725 97,39% 81,21% 34,53% 2 5156 98,10% 86,66% 40,73% 3 8043 98,93% 88,96% 41,41% 4 10447 98,94% 89,04% 40,36% 5 12201 98,85% 88,67% 40,80% 6 12927 99,03% 88,75% 41,32% 7 12709 99,10% 88,99% 40,50% 8 11467 99,28% 89,29% 40,46% 9 9618 99,14% 89,19% 42,14% 10 6866 98,89% 88,45% 40,58% 11 4225 97,94% 85,87% 42,32% 12 1935 97,57% 81,71% 31,94% 13 543 94,66% 73,85% 9,39%
Zmiana docelowych wartości Równy podział Proporcjonalny podział Liczba rozdań Liczba kew Wielkość przedziału Wartość docelowa Wielkość przedziału 1138 0,1000 2725 1 0,0615 0,1615 0,0155 0,1155 5156 2 0,2231 0,0315 0,1470 8043 3 0,2846 0,0528 0,1998 10447 4 0,3462 0,0740 0,2737 12201 5 0,4077 0,0906 0,3643 12927 6 0,4692 0,1005 0,4648 12709 7 0,5308 0,1025 0,5674 11467 8 0,5923 0,0967 0,6641 9618 9 0,6538 0,0843 0,7484 6866 10 0,7154 0,0659 0,8144 4225 11 0,7769 0,0444 0,8587 1935 12 0,8385 0,0246 0,8834 543 13 0,9000 0,0166 100000 52-25-1: 98.77 | 88.00 | 40.13 98.66 | 87.41 | 39.98
Sprawdzenie skuteczności na granicach Piki 52-25-1 Liczba lew Skuteczność 100.00 | 98.25 | 84.21 0-1 100.00 | 99.76 | 48.46 1 99.91 | 96.95 | 46.86 1-2 99.34 | 88.47 | 40.38 2 99.42 | 89.61 | 40.71 2-3 98.37 | 86.59 | 38.27 3 98.68 | 88.09 | 40.93 3-4 98.55 | 86.23 | 37.96 4 98.85 | 88.49 | 40.34 4-5 98.60 | 86.01 | 37.28 5 98.87 | 88.93 | 41.23 5-6 98.47 | 86.38 | 37.95 6 98.83 | 89.21 | 41.73 6-7 98.41 | 86.49 | 38.74 7 98.91 | 88.65 | 41.64 7-8 98.48 | 86.54 | 37.13 8 98.43 | 87.60 | 40.42 8-9 98.43 | 86.73 | 38.61 9 99.31 | 88.29 | 41.68 9-10 98.66 | 86.85 | 38.75 10 98.95 | 89.55 | 42.05 10-11 98.93 | 87.73 | 40.47 11 99.80 | 92.15 | 47.27 11-12 99.68 | 92.26 | 43.15 12 99.54 | 97.26 | 53.05 12-13 100.00 | 99.48 | 38.66 13 100.00 | 100.00 | 100.00
Uczenie na błędach Piki, sieci 52-25-1 I faza 98.77 | 88.00 | 40.13 II faza – inna sieć uczona na błędach I fazy 97.48 | 77.56 | 15.17 wynik dla poprawnych z I fazy: 100.00 | 99.96 | 74.35 III faza – inna sieć uczona na błędach II fazy 96.61 | 73.01 | 12.77 wynik dla poprawnych z I fazy: 100.00 | 99.87 | 70.69 wynik dla poprawnych z II fazy: 100.00 | 98.34 | 39.15
Uczenie na błędach kontynuacja Używając 2 sieci w II fazie (jedna uczona na błędach przeszacowania, druga niedoszacowania) przeszacowanie: uczenie: 99.85 | 98.29 | 65.72 na całym testowym: 91.85 | 65.02 | 21.13 niedoszacowanie: uczenie: 99.94 | 98.56 | 67.68 na całym testowym: 92.47 | 66.52 | 22.08 Tworząc system 3 sieci (dwie powyższa i ta z pierwszej fazy) i jako wynik biorąc ich średnią: 98.80 | 88.01 | 40.37 dla porównania wynik pierwotnej sieci: 98.77 | 88.00 | 40.13
Przykładowe rozdania
Przykładowe rozdanie 1 Piki, wist W Liczba lew pary NS: 10 Wyniki sieci: (52x4)-(13x4)-13-1 (52x4)-(26x4)-26-13-1 104-30-4-1 52-25-1 (104+68)-50-10-1 (52x4+84)-(13x4+21)-26-1 8 7
Przykładowe rozdanie 2 Piki, wist N Liczba lew pary NS: 3 Wyniki sieci: (52x4)-(13x4)-13-1 (52x4)-(26x4)-26-13-1 104-30-4-1 52-25-1 (104+68)-50-10-1 (52x4+84)-(13x4+21)-26-1 5 4
Przykładowe rozdanie 3 Piki, wist N lub S Liczba lew pary NS: 4 3 Wyniki sieci: (52x4)-(13x4)-13-1 (52x4)-(26x4)-26-13-1 104-30-4-1 52-25-1 (104+68)-50-10-1 (52x4+84)-(13x4+21)-26-1
Przykładowe rozdanie 4 Piki, wist N Liczba lew pary NS: Wyniki sieci: (52x4)-(13x4)-13-1 (52x4)-(26x4)-26-13-1 104-30-4-1 52-25-1 (104+68)-50-10-1 (52x4+84)-(13x4+21)-26-1 4 3
Podsumowanie: Wyniki najlepszej sieci 52x4-26x4-26-13-1 Bez Atu: 96.89 | 83.64 | 37.31 Piki ze zmianą wistu: 99.88 | 96.48 | 53.11 Uczenie wyłącznie na przykładach Bez ludzkiej wiedzy Bez znajomości zasad gry
Pomysły ?