Sunteți pe pagina 1din 13

2

3








Jocul modern
de table





Bill Robertie











4






































Modern Backgammon Modern Backgammon Modern Backgammon Modern Backgammon
Bill Robertie, 2001

5




Cuprins Cuprins Cuprins Cuprins



Introducere

1: Teoria modern 9
2: Eficiena
3: Conectivitatea
4: Ne-angajarea
5: Puterea
6: Probleme suplimentare
7: Meci ilustrativ


6

7


Introducere Introducere Introducere Introducere



n anii 1990, lumea tablelor a fost schimbat pentru totdeauna de
apariia reelelor neurale: TD-Gammon, Jellyfish i, n final,
Snowie. La nceput, juctorii au fost impresionai de simpla calitate
a rezultatelor lor; pentru prima dat, existau programe
computerizate ce le puteau ine piept celor mai buni juctori reali.
Mai trziu, i mult mai ncet, a aprut un respect pentru stilul lor.

Era un stil deosebit de greu de caracterizat. La prima impresie,
prea conservativ fr prea multe ocupri, aproape niciun
backgame, mutrile nu erau prea neobinuite. Pe msur ce jucai
din ce n ce mai mult mpotriva lor, realizai c nu erau deloc
conservativi. i puteau asuma riscuri mari, dar adesea n locuri
total neateptate. i erau nite creaturi foarte viclene! Jocurile lor
mari nu ddeau gre foarte des. Pulurile lor preau s apar
ntotdeauna n locurile utile.

Dac reelele neurale ar fi fost oameni, le-ai fi putut ntreba despre
teoria jocului lor. Dar reelele neurale nu au o teorie a jocului
doar o funcie de evaluare, cu mii de termeni mbuntii pn la
o precizie uimitoare n milioane de jocuri de antrenament. Cu toate
astea, ele joac de parc ar avea o teorie, aa c, poate, dac le
urmreti ndeajuns de mult, ai putea deduce care este aceea... Aa
a aprut aceast carte.


Jocul pieselor reelelor neurale este guvernat de un set relativ mic
de principii generalizate. Aceste principii nu sunt unice jocului de
table. ntr-o form puin modificat, ele guverneaz jocul pieselor
i n alte jocuri de mas, ca ahul i go-ul. n forme chiar mai
generalizate, ele opereaz n arene mai mari, ca finanele i
rzboiul. Toate aceste activiti mprtesc o tem comun: Cum
poate un juctor s maximizeze eficiena unui set mic de resurse,

8
atunci cnd se confrunt cu un adversar ce are acelai scop? Totui,
cu toate c este plcut s tii c aceste principii au aplicaii vaste,
nu voi merge prea departe. Cartea se concentreaz pe cum poi
juca un joc de table mai bun.

Observ, de asemenea, c principiile subliniate aici guverneaz
doar jocul pulurilor. Ele nu au nimic de-a face cu aciunea cubului
i, de fapt, nu exist probleme legate de cub n aceast carte pn
ajungem la meciul ilustrativ din Capitolul 7.

Capitolele 1-5 acoper n detaliu principiile fundamentale ale
tablelor.

Capitolul 6 const dintr-un set suplimentar de probleme, care
poate fi folosit ca un test dac doreti, sau doar ca o extensie a
primelor cinci capitole. Problemele sunt ceva mai dificile i, n
unele cazuri, combin mai multe teme n acelai timp.

n Capitolul 7 trecem dincolo de teorie i ajungem la o aplicaie
practic n dificila lume a turneelor cu mize mari. Am adnotat
meciul dintre Jerry Grandell i Nack Ballard din Istanbul, 1998.
Este att un meci fascinant, ct i o platform de pe care poi vedea
cum se aplic aceste idei n competiiile lumii reale.

Bill Robertie
Noiembrie 2001

9


1: Teoria modern 1: Teoria modern 1: Teoria modern 1: Teoria modern



Timp de muli ani, jocul de table a fost imun la mbuntirile
tehnologiei computerizate. Computerele ce jucau ah au concurat
n turnee nc de la jumtatea anilor 1960. Au atins puterea unui
maestru la sfritul anilor 1970 i puterea unui mare-maestru la
nceputul anilor 1990. n acelai timp, cele mai bune programe de
table se aflau nc la un nivel mediu i nu se vedeau semne cum c
situaia se va schimba n viitorul apropiat.

Superioritatea programelor de ah fa de cele de table era de
neneles pentru unii, din moment ce ahul este, evident, un joc
mult mai complex dect tablele. Dar explicaia era destul de
simpl. Primele programe de ah erau exact ca primele programe
de table programatorul ncerca s copieze procesul de gndire al
unui om i s-l codifice ntr-un program computerizat. Pieselor li
se atribuiau valori, iar pieselor de pe poziiile puternice li se
atribuiau valori mai mari. Programele analizau cteva mutri
viitoare i ncercau s aleag jocuri ce le maximizau valoarea
numeric n acea poziie.

Rezultatele au fost ngrozitoare. Programele ncercau s in de
material cu orice pre i puteau foarte uor s fie manevrate n
poziii uor de combtut. Programatorii au ncercat s compenseze
adugnd mai multe variabile pentru a cuprinde i alte
caracteristici ale poziiei. Asta a avut ca rezultat mbuntirea
anumitor poziii, dar degradarea altora.

Soluia pe care au gsit-o programatorii ahului a fost s renune la
a mai copia procesul de gndire al oamenilor i s profite de
puterea unic a computerelor. n oricare poziie din ah exist, de
obicei, aproximativ 40 de mutri legale. A privi cu patru mutri
nainte nseamn a analiza 2-3 milioane de poziii. Aceasta este o
sarcin intimidant pentru un om, dar una destul de uoar pentru
un computer. n loc s ncerce s reduc arborele posibilitilor

10
pentru a produce un numr de opiuni uor de mnuit (pentru
oameni), programele computerizate puteau calcula ntregul arbore,
aplicnd o funcie simplificat de evaluare tuturor poziiilor
rezultate i producnd apoi un program ce putea juca aproape
perfect n limita numrului de mutri cu care privea nainte. Mai
mult, pe msur ce viteza computerelor a crescut, la fel s-a
ntmplat i cu adncimea mutrilor nainte, aa c era un lucru
garantat c programele vor juca din ce n ce mai bine de-a lungul
timpului. Rezultatul a fost o mbuntire constant a puterii
programelor computerizate de ah, culminnd n proiectul Deep
Blue de la IBM, care a folosit matrici de cipuri optimizate pentru
analize ale ahului, i care a reuit s l nving pe Gary Kasparov n
1998.

Totui, acelai proces nu se putea aplica n table, pentru c
arborele posibilitilor era prea mare i cretea prea rapid. Sunt 15
aruncri posibile ale zarurilor n poziia de deschidere i 21 pentru
fiecare poziie urmtoare. Fiecare aruncare are undeva ntre unul i
cteva sute de jocuri legale. n fiecare nivel al arborelui, pot exista
aproximativ 1000 sau mai multe jocuri legale. A privi cu patru
mutri nainte nseamn a privi nu la cele 2-3 milioane de
posibiliti din ah, ci la un miliard de posibiliti! Prea mult, chiar
i pentru cele mai rapide computere.

Programatorii tablelor erau blocai ncercnd s copieze, pe ct de
bine puteau, procesul de gndire al oamenilor. Au fost obinute
succese modeste. Cele mai bune realizri le-au avut Gammonoid
Merit I, programat de Hans Berliner, i Expert Backgammon,
programat de Tom Johnson i Tom Weaver. n 1979, robotul
Gammonoid al lui Berliner l-a nvins pe Campionul Mondial Luigi
Villa ntr-un meci de 7 puncte, cu toate c Villa a fost, n mod clar,
juctorul mai bun.


Reelele neurale Reelele neurale Reelele neurale Reelele neurale

n 1991, am mers la IBM Research Laboratories din White Plains,
New York, pentru a juca un meci de antrenament mpotriva unui
nou tip de program de table. Dr. Gerry Tesauro de la IBM a creat
un program numit TD-Gammon, care folosea o idee inovatoare ce

11
a atras atenia cercettorilor inteligenei artificiale: tehnologia
reelelor neurale. El considera c este mai bun dect oricare dintre
programele vechi i m-a invitat s mi ncerc norocul.

n tehnologia reelelor neurale, ideea de baz este s creezi un
program ce nelege regulile jocului, dar are o funcie de evaluare
goal. Cu toate c funcia de evaluare are termeni ce reprezint
sute de caracteristici potenial utile ale unei poziii (numrtoarea
spaiilor, numrul de puncte din cas i descoperirile expuse, de
exemplu), coeficientul tuturor termenilor va fi zero. Programul va
nva jucnd partide mpotriva lui nsui i modificnd termenii
evalurii dup fiecare joc, conform rezultatului partidei. Procesul,
dac este continuat mai multe sute, mii sau milioane de jocuri,
poate produce un program ce joac foarte bine. Sau poate c nu.

Prima mea sesiune mpotriva lui TD-Gammon a avut 31 de jocuri.
Am ctigat 19 puncte, dar am fost clar norocos. (O partid de 8
puncte a fcut diferena.) Cred c avantajul meu la acel moment
era de doar 4-5 puncte ntr-o sesiune de 30 de jocuri. Jocul lui
TD-Gammon era foarte puternic n unele arii, foarte slab n altele.
n plus, a fcut mai multe jocuri originale care ar fi putut fi corecte
sau greite nimeni nu putea spune cu siguran. Stilul su de joc
nu putea fi clasificat ca agresiv sau pasiv. Nu ocupa punctul 5 cu
deschiderile 21, 41 sau 51 (mutare standard n acele vremuri), dar
n alte poziii fcea ocupri sau duble-ocupri fr team. (Pentru
o analiz complet a acestui meci, vezi cartea mea din 1993, nva nva nva nva
de la robot de la robot de la robot de la robot.)

Un an mai trziu, n 1992, am jucat o alt sesiune mpotriva unei
versiuni mbuntite a TD-Gammon. Aceasta a fost mai strns i
am putut obine o victorie la limit dup 40 de jocuri. Aceast
versiune avea un creier mai mare (mai muli termeni n funcia
de evaluare) i fusese antrenat cu peste un milion de jocuri, spre
deosebire de cele 300 000 din prima versiune. Era, n mod clar, un
juctor mai bun dect versiunea precedent, i erau puine jocuri,
poate chiar niciunele, ce puteau fi marcate drept evident greite.
Stilul lui, totui, era complet diferit de al celor mai buni juctori
reali ai momentului. Prefera mai mult spargerea dect ocuparea n
deschidere. Evita backgameurile cu orice pre. Era dispus s
renune la ancore n momente pe care oamenii le-ar fi considerat

12
premature. Iar aciunea cubului era nenfricat, lucru care punea o
presiune considerabil pe oponeni.

TD-Gammon nu a devenit niciodat un produs comercial, cu toate
c, pentru o vreme, a fost ncorporat ca parte a pachetului de
jocuri pentru sistemul de operare OS/2 de la IBM, care a pierdut
pn la urm btlia sistemelor operaionale n faa Windows-ului.
Totui, au aprut rapid dou reele neurale comerciale.

Primul a fost Jellyfish, dezvoltat de Fredrik Dahl i Effect Software
n Norvegia, n 1994. Versiunea 1.0 nu era chiar att de bun ca
programul final al lui TD-Gammon, dar, pentru prima dat, le
oferea juctorilor o reea neural pe computerul lor i putea
efectua i analize. Versiunea 2.0 a fost o mare mbuntire, iar
versiunea 3.0 a reprezentat un alt pas nainte. n 1997, Jellyfish 3.0
a fost provocat ntr-un meci demonstrativ mpotriva lui Nack
Ballard i Mike Senkiewicz, n Dallas. Mizele erau mari: Jellyfish
avea un parior entuziast, dar anonim. Condiiile concursului erau
clare: Jellyfish juca 50 de jocuri pe zi mpotriva fiecrui oponent,
timp de ase zile, adic un total de 300 de jocuri. (Limita servea la
anularea oricrui factor al oboselii pentru oameni.) Au fost folosite
zaruri manuale. La finalul sptmnii, Jellyfish s-a dovedit a fi la fel
de bun ca doi dintre juctorii din Top 5 mondial. Acest fapt a
ridicat ntrebarea dac Jellyfish putea juca table la nivel mondial.
Orict de ciudat ar fi prut stilul lui pentru tradiionaliti,
eficacitatea sa nu putea fi pus la ndoial.

Cel de-al doilea program de reele neurale a fost Snowie, care a
aprut n 1998. Snowie nu era o singur reea neural, ci mai
multe reele neurale combinate. Fiecare reea neural era
optimizat pentru diferite tipuri de poziii. Snowie era cel mai bun
program la acea vreme n ceea ce privete backgameurile, dar
puterea de joc general era doar puin mai mare dect a lui
Jellyfish. Venea, totui, cu o interfa avansat, ce fcea ca
analizarea unui ntreg meci s devin uoar. Era capabil, de
asemenea, s efectueze rollout-uri lund n calcul scorul meciului,
ceea ce a permis accesul la primele analize reale ale mnuirii
corecte a cubului n situaiile delicate dintr-un meci. mpreun,
Jellyfish i Snowie le-au oferit juctorilor unelte incomparabile
pentru analiz.

13
nvnd de la reele nvnd de la reele nvnd de la reele nvnd de la reele

n ciuda capacitilor puternice de analiz, Jellyfish i Snowie au
un dezavantaj frustrant: sunt mute. Avnd destul timp, poi obine
o analiz cu orice grad de acuratee doreti, ce i va spune mutarea
optim n oricare poziie. (Cu toate c aceste rezultate pot conine
erori, ele sunt, n general, att de bune nct niciun om nu s-ar
oferi s parieze mpotriva lor.) Dar aceste rezultate vin doar ca
fapte, neavnd nicio explicaie ataat. Pentru a te mbunti ca
juctor, trebuie s ncorporezi aceste rezultate ntr-o teorie a
jocului, iar roboii nu sunt de ajutor aici.

De exemplu, uit-te la urmtoarea problem.


Diagrama 1 Diagrama 1 Diagrama 1 Diagrama 1- -- -1: 1: 1: 1:
Negrul va juca 51. Negrul va juca 51. Negrul va juca 51. Negrul va juca 51.

S-ar putea să vă placă și