Sunteți pe pagina 1din 30

Teoria Jocurilor

INFO III 2011-2012

Teoria jocurilor
Modele matematice legate de situaiile strategice (n care succesul individual al alegerilor depinde de alegerile celorlali participani, prin conflict sau cooperare). Aplicaii: Economie, Psihologie, Informatic, Politic, Societate, Sport Jocul GO are peste 2000 de ani.

Exemplu
Nim Joc pentru doi juctori, jucat cu obiecte mprite n grupuri. Fiecare juctor, pe rnd, poate elimina dintr-un singur grup orice numr de obiecte. Pierde cel care face ultima mutare.

Clasificri
Numr de juctori:
0 (automate) (Conway) 1 (individuale, studiate n Teoria Deciziei) (puzzle, Solitaire) 2 (table, ah) cel puin 3 (volei, alegerile parlamentare)

Clasificri
Modelul jocului:
forma extins forma strategic (normal) forma coaliional

1. Forma extins
Se definesc:
poziia mutarea gradul de determinism (dac exist sau nu variabile aleatoare de ex.: zarul, amestecatul crilor de joc) tipul informaiei (perfect fiecare juctor cunoate istoricul jocului i valorile tuturor mutrilor efectuate; imperfect nu este perfect).

1. Forma extins
Exemplu
poziia: X i 0 pe o tabl 3 x 3 mutarea: pe rnd juctorii adaug semnul alocat lor; iniial tabla e goal; ctig cel care completeaz 3 semne identice coliniare. Jocul se poate ncheia indecis gradul de determinism: determinist tipul informaiei: perfect

1. Forma extins
Tipuri de jocuri:
combinatoriale: de 2 juctori, informaie perfect, deterministe, care se ncheie prin ctig sau pierdere impariale: fiecare juctor are acelai set set de mutri dintro poziie oarecare (altfel jocurile sunt partizane) finite (se ncheie ntotdeauna dup un numr finit de mutri)

2. Forma strategic
Se definesc:
strategiile; fiecare juctor i alege strategia, concomitent cu ceilali ctigurile; dac jocul nu se ncheie cu ctiguri numerice, se folosete Teoria Utilitii.

O strategie (pur) descrie, pentru fiecare poziie, mutarea de efectuat. Exemplu: un program care joac un joc i nu nva este o strategie (va muta la fel n poziii identice).

Teoria Utilitii
Utilitatea msoar preferina juctorului asupra poziiilor finale ale jocului. Exemplu: Dilema prizonierului Doi prizonieri sunt bnuii c au svrit o infraciune, pedeapsit cu 5 ani. Celor doi li se face o propunere. Dac unul mrturisete i astfel i mpovreaz partenerul, atunci scap nepedepsit cellalt trebuie s ispeasc o pedeaps de 5 ani. Dac ambii decid s nu mrturiseasc, rmn doar dovezi prezumptive care le vor aduce o pedeaps de 2 ani. Dac amndoi mrturisesc, pe fiecare l ateapt o pedeaps de 4 ani. Prizonierii sunt chestionai separat unul de cellalt; niciunul dintre ei nu va cunoate nici nainte i nici dup chestionare intenia celuilalt.

Teoria Utilitii
Exemplu: Dilema prizonierului

n mod individual, pare s fie pentru fiecare avantajos s coopereze: Dac cellalt coopereaz, mi pot reduce pedeapsa la 4 ani, dac mrturisesc i eu; ns dac cellalt tinuiete faptele svrite, pot s-mi reduc pedeapsa de la 2 ani la 0 prin declaraia mea! Deci trebuie s mrturisesc faptele orice s-ar ntmpla! Decizia de a mrturisi nu depinde de comportamentul celuilalt i pare s fie ntotdeauna avantajoas.

Teoria Utilitii
Ruleta
(1/38) Winning number $36 $1 (37/38) Losing number $0 $1

Bet $1 Dont

U(Bet) = ($36)(1/38) + ($0)(37/38) = $0.947 U(Dont) = $1 Dont bet

Teoria Utilitii
Este utilitatea liniar? Ce loterie e aleas, dintre urmatoarele perechi, dac se joac doar o dat? Dar de 2 ori? Dar de 10000 de ori?
Loteria 1: (0.5: 2.000; 0.5: 0) Loteria 2: (1: 1.000) Loteria 3: (0.001: 1.000.000; 0.999: 0) Loteria 4: (0.5: 2.000) Loteria 5: (0.5: 3.000.000; 0.5: 0) Loteria 6: (1: 1.000.000) Loteria 7: (0.1: 5.000.000; 0.9: 0) Loteria 8: (0.11: 1.000.000; 0.89: 0) Loteria 9: (0.1: 5.000.000; 0.89: 1.000.00; 0.01: 0) Loteria 10: (1: 1.000.000)

Utilitatea NU ESTE LINIARA

2. Forma strategic
Tipuri de jocuri:
de sum nul (suma ctigurilor juctorilor este mereu 0) cooperative (juctorii pot forma coaliii pentru a obine ctiguri individuale mai mari).

3. Forma coaliional
Se definesc:
coaliiile i valorile lor modul n care se mparte ctigul i costurile pentru realizarea coaliiei

Rezultate specifice
Jocuri finite, de 2 persoane, de sum nul, n forma strategic Un astfel de joc este: (X, Y, C) unde:
X mulimea strategiilor lui A Y mulimea strategiilor lui B C este ctigul lui A C : X Y R

Jocuri finite, de 2 persoane, de sum nul, n forma strategic


Exemplu: Par sau Impar
Fiecare juctor alege o valoare din {1,2}. Dac suma este impar, A ctig; altfel, A pierde. Suma valorilor alese este pltit de cel care pierde. A B 1 2 1
2

-2
+3

+3
-4

Dac se joac o singur dat, ce ar trebui s joace A? A alege 1: ctigul mediu este (-2)*0.5 + 3*0.5 = 0.5 A alege 2: ctigul mediu este 3*0.5 + (-4)*0.5 = -0.5 A alege 1. Dar dac B afl c A va juca 1? B va alege 1 i A va pierde (ctig -2)!

Jocuri finite, de 2 persoane, de sum nul, n forma strategic


Exemplu: Par sau Impar (cont.)
A B 1 2

1
2

-2
+3

+3
-4

Dac se joac la infinit, ce ar trebui s joace A? Dac A alege 1 cu probabilitatea p, atunci ctigul su mediu este: dac B alege mereu 1: (-2)*p + 3*(1 - p) = 3 - 5p dac B alege mereu 2: 3*p + (-4)*(1 - p) = 7p - 4 Cum poate A alege valoarea lui p, astfel ca s nu conteze alegerile lui B? 3 5p = 7p 4 deci p = 7/12 n acest caz, ctigul mediul al lui A este 3-5*7/12 = 1/12 deci POZITIV.

Jocuri finite, de 2 persoane, de sum nul, n forma strategic


Exemplu: Par sau Impar (cont.)
A B 1 2

1
2

-2
+3

+3
-4

Strategia (mixt) a lui A i asigur ctig pe termen lung, indiferent de strategia lui B. O strategie egalizatoare are efect independent de cea a celuilalt juctor. B tie c exist o strategie mixt pentru A prin care el (B) pierde pe termen lung 1/12 la fiecare joc. Poate gsi B o strategie mixt prin care s nu piard mai mult de 1/12? Prin calcule se ajunge c B alege 1 cu probabilitatea 7/12 (la fel ca A). Strategiile mixte gsite de A i de B sunt optime.

Jocuri finite, de 2 persoane, de sum nul, n forma strategic


Teorema Minimax (von Neumann, 1928)
Pentru orice joc finit, de 2 persoane, de sum nul exist v numr real (valoarea jocului) astfel ca:
exist o strategie mixt pentru A care i aduce lui A un ctig mediu v, indiferent de aciunile lui B; exist o strategie mixt pentru B care i aduce lui B o pierdere medie v, indiferent de aciunile lui A.

Jocuri finite, de 2 persoane, de sum nul, n forma strategic


Teorema Minimax (von Neumann, 1928)
Echivalent: orice joc finit, de 2 persoane, de sum nul are strategii mixte optime. Dac v = 0, atunci jocul este corect. Dac v > 0, atunci jocul l favorizeaz pe A. A rezolva un joc nseamn a-i gsi valoarea i cte o strategie (pur sau mixt) optim pentru fiecare juctor. Teorema Minimax: orice joc finit, de 2 persoane, de sum nul poate fi rezolvat.

Rezultate specifice
Jocuri finite, de 2 persoane, de sum nul, n forma extins Un astfel de joc este reprezentat prin arborele jocului (arborele Kuhn): nodurile sunt poziii; mutarea determin fii nodului; frunzele sunt poziii terminale (joc ncheiat) i descriu ctigurile; nodurile neterminale sunt alocate fie lui A, fie lui B, fie mutrilor aleatoare (zaruri, cri de joc, rulet); Informaia incomplet se reprezint prin comasarea strilor implicate.

Jocuri finite, de 2 persoane, de sum nul, n forma extins


Exemplu: Basic endgame
Juctorii (I i II) pariaz cte $1. I primete o carte pe care o vede, dar II nu o vede; probabilitatea s fie ctigtoare este i s piard este . I decide: check (I arat cartea, jocul se termin) sau bet (I adaug $2 la pariu). n cazul bet, II decide: fold (II renun, jocul se termin, I ia banii) sau call (II adaug $2 la pariu, I arat cartea, jocul se termin conform valorii crii).

Jocuri finite, de 2 persoane, de sum nul, n forma extins


Exemplu: Basic endgame Arborele Kuhn: evenimentele aleatoare sunt mutri ale jucatorului N (Nature, al 3lea juctor).

Rezultate specifice
Jocuri finite, de n persoane, de sum nenul, n forma strategic Un astfel de joc este:
( X1 , X 2 , X n , u1 , u2 ,un ) unde:
Xi este mulimea strategiilor juctorului i ui : X1 X 2 X n R este ctigul juctorului i

Jocuri finite, de n persoane, de sum nenul, n forma strategic


Echilibru strategic pur: ( x1 , x2 , xn ) ( X1 X 2 X n ) cte o strategie pentru fiecare juctor, ce reprezint cel mai bun rspuns la strategiile celorlali: ui ( x1 , xi 1 , xi , xi 1 , xn ) ui ( x1 , xi 1 , x, xi 1 , xn ) x X i 1 i n

Strategie mixt pentru juctorul i: pi un vector de probabiliti de lungime card ( X i ) Echilibru strategic: ( p1 , p2 , pn ) strategii mixte pentru fiecare juctor, astfel c niciunul nu ctig mai mult prin schimbarea unilateral a strategiei alese.

Jocuri finite, de n persoane, de sum nenul, n forma strategic


Teorema echilibrului (Nash, 1950): Orice joc finit, de n persoane, de sum nenul are cel puin un echilibru strategic.

1994 - the Nobel Memorial Prize in Economic Sciences A beautiful mind movie 2001

Rezultate specifice
Jocuri recursive Un joc G genereaz alegerea unui joc din {G1 , G2 ,Gn } Exemplu: jocurile Parrondo Juctorul are un cont, iniial cu $0 i la fiecare rund pariaz $1. G: o rund: juctorul arunc o moned corect, care determin dac se joac A sau B. A: se arunc o moned cu probabilitatea de ctig -e B: dac suma din cont este multiplu de 3, atunci se arunc moneda M1 (probabilitatea de ctig 1/10-e); altfel se arunc moneda M2 (probabilitatea de ctig -e).

Jocuri recursive
Exemplu: jocurile Parrondo (cont.) A i B duc la o pierdere pe termen lung, dar G ctig pe termen lung. Paradoxal, alegerea aleatoare dintre dou jocuri care pierd, poate fi o strategie ctigtoare!

Bibliografie
http://en.wikipedia.org/wiki/Senet http://www.ibiblio.org/lifepatterns/ http://ro.wikipedia.org/wiki/Dilema_prizonierului http://www.cut-the-knot.org/Curriculum/Games/MixedStrategies.shtml http://academicearth.org/lectures/nash-equilibrium http://www.eleceng.adelaide.edu.au/Groups/parrondo/intro.html http://www.cut-the-knot.org/ctk/Parrondo.shtml