Poker hraji tak jednou za uhersky rok, tak bych se rad zeptal nekoho, kdo tomu rozumi...
Jak casto se hraje poker ve dvou lidech? Jako laik jsem se s pokerem ve dvou v zivote nesetkal, leda tak ve flashovych hrickach. Hraje se texas hold'em ve dvou i v casinech nebo je to jen domena "pocitacovych her"?
Jednak hra ve dvou je klasicky headsup, tedy druh pokerove hry.
Druhak je to headsup = finale, kdy uz zustavaji posledni 2 hraci na stole (v turnaji).
Da se uspesne predpokladat, ze po tomto uspechu pujdou i po multi-player forme, coz tedy bude nasobne tezsi, kazdopadne zajimave.
Navíc, většina Texas hold 'em her, pokud neskončí už při rozdání či až flopu (tam to procento neodhadnu), tak se zakončuje ve dvou, ostatní to položí.
Takže umět hrát začátek ve více hráčích je sice nezbytné, důležité a je dost rozdílný (pozice hráče, ...) od heads up, ale ovládnout hru ve dvou je (i pro počítač) nutná podmínka. Bez této znalosti fakticky předem prohrál.
Je to zmíněné i v článku:
<cite>
Matematické modely her umožňují popsat situace z ekonomie, aukcí, síťové bezpečnosti, ochrany důležitých cílů nebo kontroly jízdného. V těchto reálných situacích se jednotlivé strany jen velmi zřídka rozhodují na základě úplných a totožných informací. Proto je pokrok v řešení her s neúplnou informací zásadní pro praktické aplikace,“ vysvětluje Michael Bowling.
</cite>
Teorie her se neaplikuje jen na hry, obecně se používá k rozhodování třeba v multiagentních systémech. Je to o odhadu reakce okolí (soupeř, spolupracovník, samořiditelné auto v druhém pruhu, akciový trh, ...) na moji činnost nebo nějaký vývoj.
Jenze poker je tomu vsemu na hony vzdaleny, pouze spada do podobne kategorie uloh. Citace slov pana Bowlinga jsou jen vzletne fraze vhodna pro grantova podani kolem teorie her. Ja nevidim prakticky prinos v reseni 1-1 pokeru, a protoze je tady spousta tech, kterym to naopak prijde zrejme, tak mi jiste snadno popisou ulohu, kde to lze nejak rozumne aplikovat.
Tak to pozor. Coby výukový materiál to je vhodné. V tom mém výčtu, k čemu že poker je, jsem ho nezmiňoval, protože to je opravdu specialitka (výuka).
Nejprve vyjasnění toho 1-1. Heads up je jedna z variant a pro určitý typ hráčů dokonce složitější než normální (orientují se lépe ve více hráčích a pak doufají v nekonfliktní koncovku /1-1/, protože vědí, že jsou v ní slabí). Heads up není nějaký "odpad" zde použitý pro zjednodušení programování.
A teď k té teorii her. Programy /programátoři/ opravdu mají problémy s "pokrok v řešení her s neúplnou informací zásadní pro praktické aplikace". Tedy, když je zadání v principu nedeterministické. To je opravdu něco, co se v praxi - byť zde jen na hru - jen tak nevidí. Aby takový program předčil člověka. Neříkám algoritmus, ale program. Imho popis článku nesedí, protože algoritmus je deterministický elementární (konečný počet dílčích jednoduchých kroků, ... ) a tím se právě liší tento případ od šachu a go a podobně. Tam bylo vše deterministické, byť (zatím) nespočítatelné a optimalizace se vesměs soustředila jen na omezení prostoru. U pokeru je to jiné. Na ten, vzhledem k možnosti blufování, nejde použít obvyklá schemata.
Výhoda pokeru je, že výstup (zda to program dělá dobře či špatně) je vidět hned po pár (desítkách, stovkách) her. To u jiných (nedeterministických) oborů (ekonomie, ...) většinou není možné.
Proc je to vhodne jako vyukovy material? Kroky, pocet zucastnenych hracu i vlivove faktory jsou silne omezene a pouzitelne jenom na ulohu hrani pokeru. Nebo to reseni ma nejaky univerzalni princip? Kdyz ano, tak jaky? Mne to zatim prijde jako DNN natrenovana na psychologii soudobeho lidskeho hrace, nikoliv jako univerzalni reseni nebo univerzalni postup pouzitelny dr. Noonienem Soongem.
Neexistuje nic jako "psychologie soudobeho lidskeho hrace" Texas hold 'em. Univerzální postup by byl příliš velký a dost možná nekonečně - viz jak se hráči vyvíjí s časem - stačí se podívat na to jak se vyvíjel styl hraní Texas hold 'em v posledních 15-30 letech a jak ani dnes nelze určit ideální kombinace staré a nové školy, kdy staré stále dokáže vítězit, spolu po boku nové.
Takže DNN (natož pouze předučené) jen sama o sobě nestačí. Ostatně počtem kombinací je poker srovnatelný s go (o hodně řádů méně, ale z našeho pohledu stále nad limit). Takže program musí být mix algoritmu a (d)nn. A navíc se síť musí (sama) rekurzivně za chodu učit na každého jiného dalšího hráče. A nepřeučit. A to vše za situace, kdy (D)NN je jen nápomocná nadstavba nad základem.
Na tu jejich ukázku se těším, samotného mne zajímá, jak to vyřešili. Právě to napojení. Pokud čistě jen DNN (a program je opravdu jen pomocný bokem) tak klobouk dolu, to je ten vývoj pěkně rychlý. Pak souhlasím, že by to asi nebylo nic extra.
Dosud jsem žil v domnění, že (D)NN slouží, u deterministických her (go, šach), až jako pomocná pro časově nedopočítané koncovky, ale že může být (dostatečně kvalitně) předučená, protože deterministické. A že pokud učení na konkrétního člověka, navíc za běhu (je?, nebo předem, byť na konkrétního člověka), je jen pomocná nadstavba navíc, ne nutný nosný prvek. Ale je fakt, že vývoj je hodně rychlý a že mi něco uteklo.
Prakticky? Zjednodušeně, k ničemu. Je to zábava, stejně jako mariáš, kulečník, golf, go a podobně.
Složitěji, ano, jsou i turnaje a dá se na tom i vydělat pokud člověk opravdu umí (jako skoro na všem). A ano, dá se určitě najít i něco dalšího - jako třeba pro golf, že se člověk protáhne, tak co já vím pro poker třeba že si mírně procvičí mozek na kombinace a pamatování a trocha psychologie A kdesi cosi. Bla bla. Ale reálně, masově, je to hlavně zábava. Jeden z druhů.