# Facultatea de Cibernetic, Statistic i Informatic Economic

Bucureti

TEORIA JOCURILOR
~ APLICAII REZOLVATE ~

## STUDENT: VASILE ELENA-VALENTINA

CSIE, SPECIALIZAREA CIBERNETIC
ECONOMIC
PROF. NDRUMTOR:
PROF. UNIV. DR. MIHAI DANIEL ROMAN
CUPRINS

1. Cuprins ...................................................................................................................................................... 2
2. JOCURI STATICE N INFORMAIE COMPLET ....................................................................... 3
2.1. Potrivirea monedelor ( Matching pennies Game) .......................................................... 3
2.2. Vntoarea cerbului ( Stag Hunt Game ) ............................................................................ 4
2.3. Porcii raionali ( Rational Pigs Game ) ................................................................................ 5
2.4. Parteneriatul ( Partnership Game ) ...................................................................................... 7
3. JOCURI DINAMICE N INFORMAIE COMPLET ................................................................... 9
3.1. Descurajarea ( The Detterence Game ) ............................................................................... 9
4. JOCURI STATICE N INFORMAIE INCOMPLET .................................................................. 11
4.1. Donaii pentru comunitate ( Donations for the community ) ................................... 11
4.2. Tortul ( The Cake Game ) .......................................................................................................... 14
4.3. Holmes-Moriarty ( The Holmes-Moriarty Game ) ......................................................... 17
5. Bibliografie ............................................................................................................................................. 19
A. JOCURI STATICE N INFORMAIE COMPLET

## 1. Potrivirea monedelor ( Matching pennies Game)

Potrivirea monedelor ( Matching pennies ) este numele unui joc simplu folosit n teoria jocurilor.
Se realizeaz ntre doi juctori, Even i Odd. Fiecare juctor are un bnu ( penny ) pe trebuie s l ntoarc
n secret pe cap sau pajur. Juctorii i dezvluie alegerile simultan. Dac prile banilor se potrivesc
(ambele cap sau ambele pajur), atunci Even pstreaz ambii banui, deci ctig unul de la Odd (+1
pentru Even, -1 pentru Odd). Dac prile nu se potrivesc ( unul cap i unul pajur ) Odd pstreaz ambele
monezi, deci primete unul de la Even (-1 pentru Even, +1 pentru Odd).

ODD

Cap Pajur

Cap +1 , -1 -1 , +1
EVEN
Pajur -1 , +1 +1 , -1
Fig. 1 Matricea jocului

Matching Pennies este un joc cu sum zero, deoarece ctigul unui juctor este exact egal cu
pierderea celuilalt juctor.
Jocul poate fi scris ntr-o matrice de compensare (imagine dreapta). Fiecare celul a matricei arat
plile celor doi juctori, n primul rnd fiind afiate plile lui Even.
Jocul este folosit n primul rnd pentru a ilustra conceptul de strategii mixte i un echilibru Nash al
strategiei mixte.
Acest joc nu are un echilibru strategic Nash pur, deoarece nu exist o strategie pur (cap sau
pajur) care s fie cel mai bun rspuns la cel mai bun rspuns. Cu alte cuvinte, nu exist o pereche de
strategii pure, astfel nct niciun juctor s nu vrea s schimbe, dac i-ar spune ce ar face cellalt. n
schimb, echilibrul unic Nash al acestui joc este n strategii mixte: fiecare juctor alege cap sau pajur cu
probabilitate egal. n acest fel, fiecare juctor l face pe cellalt indiferent ntre alegerea faetelor
monedei, astfel nct niciunul dintre juctori nu are un stimulent s ncerce alt strategie. Cele mai bune
funcii de rspuns pentru strategiile mixte sunt prezentate n figura de mai jos:

1y 1y 1y

0 1x 0 1x 0 1x
Fig. 2 Cea mai potrivit pereche de rspunsuri

Figura din stnga arat strategia pentru juctorul Even, iar mijlocul arat strategia pentru
juctorul Odd. Singurul echilibru Nash este prezentat n graficul din dreapta. X reprezint probabilitatea
ca juctorul Odd s aleag cap, iar y reprezint probabilitatea ca juctorul Even s aleag cap. Intersecia
unic este singurul punct n care strategia lui Even reprezint cel mai bun rspuns la strategia lui Odd i
invers.
Cnd oricare dintre juctori joac echilibrul, ctigul ateptat al fiecruia este zero.

## 2. Vntoarea cerbului ( Stag Hunt Game )

Jocul Vntoarea cerbului se bazeaz pe o discuie din partea filosofului Jean-Jacques Rousseau.
Este un joc despre cooperarea social.
Imaginai-v c dumneavoastr i un tovar suntei la vntoare. Fiecare dintre voi are
posibilitatea de a urmri un iepure sau un cerb. Cerbul este premiul mai mare i mai gustos i poate fi
prins sigur dac amndoi alegei s-l urmrii. Fiecare dintre voi poate captura un iepure, care este mai
mic, dar care este totui satisfctor. De asemenea, fiecare persoan poate captura un iepure sigur,
indiferent de ceea ce face cealalt persoan.
nainte de a ncepe vntoarea, putei discuta strategia cu partenerul dumneavoastr, dar jocul
este despre supravieuirea individual. Nu putei fi sigur c partenerul va respecta orice acord.
Ce alegere vei face?
Diagrama
S presupunem c a captura un iepure d un ctig de 3, a captura un cerb d un ctig de 5 pentru
fiecare persoan, iar n cazul n care nu se va captura nimic, ctigul va fi 0.
Prin natura jocului, dac un juctor urmrete un iepure, el este garantat cu o recompens de 3,
deoarece fiecare persoan este capabil s captureze un iepure. Pe de alt parte, dac un juctor
urmrete cerbul, ctigul depinde de alegerea celeilalte persoane. Dac cealalt persoan alege de
asemenea cerbul, atunci cerbul este capturat i fiecare obine o recompens de 5. Dac cealalt persoan
alege, n schimb, iepurele, atunci juctorul nu captureaz nimic i ctigul lui va fi 0.

Juctor 2

Cerb Iepure

Cerb 5, 5 0, 3
Juctor 1
Iepure 3, 0 3, 3
Fig. 3 Matricea jocului

Soluia
Jocul poate fi rezolvat prin cutarea celor mai bune rspunsuri. Pentru fiecare alegere a celeilalte
persoane, luai n considerare ce este mai bine pentru dumneavoastr. Un echilibru Nash apare cnd ambii
juctori aleg cele mai bune rspunsuri.

Care sunt cele mai bune rspunsuri?
Exist dou opiuni de luat n considerare. Mai nti, luai n considerare dac cealalt persoan a
ales cerbul. n acest caz, este logic s alegei cerbul (5) n loc de iepure (3). n al doilea rnd, luai n
considerare dac cealalt persoan a ales iepurele. n acest caz, este mult mai raional s alegei iepurele
(3) n loc de cerb (0).
Cele mai bune rspunsuri pentru fiecare juctor sunt:
Iepurele este cel mai bun raspuns la iepure;
Cerbul este cel mai bun rspuns la cerb.
Acest lucru ne conduce la dou echilibre Nash n strategii pure ( fr strategii mixte ): alegerea
cerbului de ctre amndoi i alegerea iepurelui de ctre amndoi.

## 3. Porcii raionali ( Rational Pigs Game )

O pereche de porci, unul dominant i unul subordonat, se afl ntr-o cutie i au ansa de a fi
recompensai cu alimente. La un capt al cutiei este o prghie care elibereaz mncarea cnd este presat.
Rsucirea se face astfel nct mncarea este eliberat la cellalt capt al cutiei. Porcul care preseaz
prghia este dezavantajat, pe msur ce cellalt porc poate ajunge primul la alimente.
Jocul poate fi modelat cu ajutorul unor numere. Dac porcul dominant preseaz prghia, porcul
subordonat poate mnca 80% din mncare nainte ca porcul dominant s ajung i s ia restul. Dac
porcul subordonat preseaz prghia, atunci porcul dominant poate lua toat mncarea nainte ca porcul
subordonat s ajung la cutie. Dac nici un porc nu apas prghia, atunci niciun porc nu primete
alimente. i dac ambele sunt adiacente atunci cnd prghia este apsat, porcul dominant poate consuma
70% din alimente.
Presupunnd c mncarea este n valoare de 10 uniti, este nevoie de 1 unitate de energie pentru
a apsa prghia i a se ndrepta spre cealalt parte a cutiei pentru a se lupta pentru mncare.

Porcul dominant
Preseaz Nu
prghia preseaz
Preseaz
Porcul prghia
2, 6 -1 , 10
subordonat Nu
preseaz
8, 1 0, 0
Fig. 4 Matricea jocului

Cum ar trebui cei doi porci s acioneze dac vor raiona ca teoreticieni de joc?
Rezolvarea pentru echilibrul Nash
Luai n considerare alegerea porcului subordonat. Dac porcul dominant preseaz prghia, atunci
pentru porcul subordonat este mai bine s nu preseze prghia i s lase mncarea s fie eliberat pentru a
obine 8 uniti. Dac porcul dominant nu apas prghia, atunci este mai bine pentru porcul subordonat s
nu apese, pentru c este mai avantajos s obin 0 dect -1 de la a nu primi hran i a cheltui energie.
Observai c porcul subordonat are o strategie dominant de a nu presa prghia. Aceste cele mai
bune rspunsuri sunt ilustrate prin supralinierea n celulele corespunztoare neapsrii prghiei.

Porcul dominant
Preseaz Nu
prghia preseaz
Preseaz
Porcul prghia
2, 6 -1 , 10
subordonat Nu
preseaz
8 , 1 0 , 0
Fig. 5 Matricea jocului

Ce ar trebui s fac porcul dominant? Pentru completare, s lum n considerare fiecare alegere a
porcului subordonat. Dac porcul subordonat apas prghia, porcul dominant ar prefera s nu o apese i
s primeasc toate cele 10 uniti de mncare. Dac porcul subordonat nu apas prghia, atunci porcul
dominant ar trebui s o preseze pentru a obine o plat de 1 fa de o plat de 0 pentru neapsare. Aceste
cele mai bune rspunsuri sunt descrise prin sublinierea n celulele corespunztoare.

Porcul dominant
Preseaz Nu
prghia preseaz
Preseaz
Porcul prghia
2, 6 -1 , 10
subordonat Nu
preseaz
8 , 1 0 , 0
Fig. 6 Matricea jocului

Echilibrul unic Nash al acestui joc este celula care are att o linie superioar, ct i o linie
inferioar, n care ambii porci joac cel mai bun rspuns. Acesta corespunde apsrii prghiei porcului
dominant i neapsrii porcul subordonat, astfel nct porcul subordonat primete 8, n timp ce porcul
dominant primete doar 1.

Experiment real
Baldwin i Messe au fcut acest experiment i au publicat detalii despre el n 1979. n timp ce
porcii nu scriu efectiv jocul matricei i l rezolv, ei pot nva un comportament optim. Cercetatorii au
descoperit ca porcii dominanti au facut aproape toata presarea. Cu alte cuvinte, porcii au acionat n
acelai mod despre care teoria jocurilor a prezis c vor aciona. n timp ce porcii nu cunosc teoria
jocurilor, rolul teoriei jocului este acela de a prezice comportamentul animalelor.

4. Parteneriatul ( Partnership Game )
Imaginai-v c dumneavoastr avei un partener de munc. Fiecare dintre voi are posibilitatea de
a munci din greu sau de a se eschiva. A munci din greu aduce cel mai mare ctig, care poate fi atins sigur
doar dac amndoi alegei aceast variant. A se eschiva nu aduce niciun ctig, dar nu aduce nici vreo
pierdere. n schimb, dac unul alege s munceasc din greu, iar cellalt se eschiveaz, cel care va munci va
avea un ctig mediu de 1, iar cel care se va eschiva, va avea o pierdere ( -1 ).

Partener 2
Muncete Se
din greu eschiveaz
Muncete
din greu
2, 2 -1 , 1
Partener 1
Se
eschiveaz
1 , -1 0, 0
Fig. 7 Matricea jocului

Aici, primul numr este ctigul juctorului ( partenerului ) 1, iar al doilea este ctigul juctorului
2. Aceste cifre ar putea fi doar pli monetare sau ar putea include "preferine sociale" ( faptul c putei fi
altruist fa de partenerul dumneavoastr sau putei fi suprat pe acesta.
Ce alegere vei face? Vei juca "muncesc din greu" sau "eschivez"?

## Rezolvarea pentru echilibrul Nash

Luai n considerare alegerea partenerului 1. Dac partenerul 2 alege s munceasc din greu,
atunci pentru partenerul 1 este mai bine s fac aceeai alegere, pentru a obine 2 uniti n loc de 1. Dac
partenerul 2 alege s se eschiveze, atunci este mai bine pentru partenerul 1 s se eschiveze i el, pentru c
este mai avantajos s obin 0 dect -1.
Aceste cele mai bune rspunsuri sunt descrise prin supralinierea n celulele corespunztoare.

Partener 2
Muncete Se
din greu eschiveaz
Muncete
din greu
2 , 2 -1 , 1
Partener 1
Se
eschiveaz
1 , -1 0 , 0
Fig. 8 Matricea jocului

Ce ar trebui s fac porcul dominant? Pentru completare, s lum n considerare fiecare alegere a
porcului subordonat. Dac partenerul 1 alege s munceasc din greu, atunci pentru partenerul 2 este mai
7
bine s fac aceeai alegere, pentru a obine 2 uniti n loc de 1. Dac partenerul 1 alege s se eschiveze,
atunci este mai bine pentru partenerul 2 s se eschiveze i el, pentru c este mai avantajos s obin 0
dect -1.
Aceste cele mai bune rspunsuri sunt descrise prin sublinierea n celulele corespunztoare.

Partener 2
Muncete Se
din greu eschiveaz
Muncete
din greu
2 , 2 -1 , 1
Partener 1
Se
eschiveaz
1 , -1 0 , 0
Fig. 9 Matricea jocului

Echilibrele Nash ale acestui joc reprezint celulele care au att o linie superioar, ct i o linie
inferioar, n care ambii parteneri joac cel mai bun rspuns.
Nu exist strategii dominante sau dominate. Muncesc din greu reprezint cel mai bun rspuns
pentru Muncesc din greu i M eschivez reprezint cel mai bun rspuns pentru M eschivez. Prin
urmare, exist dou strategii pure de echilibru Nash ( muncesc din greu, muncesc din greu ) i ( m
eschivez, m eschivez ). n funcie de ateptrile pe care le avei din partea partenerului dumneavoastr,
putei ajunge la un rezultat bun sau ru.

A. JOCURI DINAMICE N INFORMAIE COMPLET

## 1. Descurajarea ( The Detterence Game )

Juctorul 1 ( un nou venit" ) trebuie s decid dac s intre pe o pia monopolizat n prezent de
un ocupant". Juctorul 2 ( ocupantul ), dup ce observ aciunea participantului, acesta decide dac s-l
gzduiasc sau s lupte. Participantul decide dac s intre" sau dac s stea". Dac el rmne afar",
profiturile sale vor fi 0, iar profiturile ocupantului actual vor fi 3. Dac intr, ocupantul actual trebuie s
decid dac va lupta" sau dac l va gzdui ". n cazul n care ocupantul lupt, acesta va avea un profit
egal cu 1, n timp ce nou-venitul va avea un profit negativ ( -1 ). n cazul n care ocupantul decide s
gzduiasc, acesta va avea un profit egal cu 2, iar nou-venitul va avea un profit egal cu 1.
Fiecare juctor trebuie s acioneze o singur dat. Astfel, setul de strategie este egal cu setul de
aciuni. Forma normal, atunci, este dup cum urmeaz:

Ocupant

Lupt Gzduiete

Intr -1 , 1 1, 2
Nou-venit
Rmne
afar
0, 3 0, 3
Fig. 10 Matricea jocului

## Rezolvarea pentru echilibrul Nash

Luai n considerare alegerea nou-venitului. Dac ocupantul alege s lupte, atunci pentru nou-venit
este mai bine s fac rmn afar, pentru a obine 0 uniti n loc de -1. Dac ocupantul alege s
gzduiasc, atunci este mai bine pentru nou-venit s intre, pentru a obine 1 unitate n loc de 0.
Aceste cele mai bune rspunsuri sunt descrise prin supralinierea n celulele corespunztoare.

Ocupant

Lupt Gzduiete

Intr -1 , 1 1 , 2
Nou-venit
Rmne
afar
0 , 3 0, 3
Fig. 11 Matricea jocului

Luai n considerare alegerea ocupantului. Dac nou-venitul alege s intre, atunci pentru ocupant
este mai bine s gzduiasc, pentru a obine 2 uniti n loc de 1. Dac nou-venitul alege s rmn afar,
atunci profiturile sale vor fi 0, iar profiturile ocupantului actual vor fi 3.
Aceste cele mai bune rspunsuri sunt descrise prin supralinierea n celulele corespunztoare.

Ocupant

Lupt Gzduiete

Intr -1 , 1 1 , 2
Nou-venit
Rmne
afar
0 , 3 0, 3
Fig. 12 Matricea jocului

Nou-venitul

I R
Ocupantul
G L ( 0, 3 )

( 1, 2 ) ( -1, 1)
Fig. 13 Arborele jocului

## Exist dou echilibre Nash: ( Intr, Gzduiete ) i ( Rmne afar, Lupt ).

Definiia induciei inverse: Un echilibru de inducie invers al unui joc cu informaie perfect este
un profil de strategie, n care strategia fiecrui juctor este optim n fiecare punct dat n care el se
ateapt ca alii s urmeze strategii de echilibru n viitor.
( Intr, Gzduiete ) este un echilibru de inducie invers al jocului de descurajare.

B. JOCURI STATICE N INFORMAIE INCOMPLET

## 1. Donaii pentru comunitate ( Donations for the community )

n jocurile cu micri secveniale, cum ar fi jocul cu prjituri, exist o metod simpl de a gsi un
echilibru, numit inducie invers sau rsturnare. Multe jocuri de comunicare implic un vorbitor, primul
care codific un mesaj i l transmite, i un asculttor, care primete mesajul i selecteaz un coninut
pentru el. Din moment ce acest mod de a gndi despre comunicare este secvenial, rsturnarea poate fi
utilizat pentru a descoperi un profil de strategie de echilibru.
Dup cum sugereaz i numele, rollback-ul funcioneaz pornind de la rezultatul jocului i lucrnd
n ordinea invers, avnd n vedere cea mai bun micare pentru obinerea unei anumite alegeri, pn
cnd se ajunge la nodul rdcin al copacului.
S presupunem c sunt trei juctori: Emily, Nina i Talia, care locuiesc n acelai cartier. Cineva
merge de la u la u, cernd oamenilor care locuiesc n cartier s contribuie la o grdin comunitar.
Dimensiunea i splendoarea ultim a grdinii depind de ct de muli contribuie. Fiecare juctor este fericit
s aib grdina, mai fericit dac grdina este mare i magnific, dar fiecare este reticent s suporte costul
contribuiei. Dac nimeni nu contribuie, grdina va fi rar i mizerabil, un depozit viitor de gunoi, aa
cum se ntmpl adesea cu loturile vacante din ora. n mod clar, nimeni nu vrea asta.
Pentru fiecare juctor, exist patru rezultate:
Rezultatul A: Nu contribuie, dar celelalte o fac ( grdina va fi plcut i economisete i
bani ).
Rezultatul B: Contribuie, dar o va mai face doar una din vecine sau poate amndou (
grdina va fi plcut, dar scump pentru ea ).
Rezultatul C: Nu contribuie i numai una dintre vecine o va face sau poate niciuna ( grdin
va fi neremarcabil, dar cel puin ea economisete bani ).
Rezultatul D: Contribuie, dar niciuna dintre celelalte nu o face ( grdin va fi groaznic i
scump pentru ea ).
Emily, Nina i Talia au acelai rang de preferin:
Rezultatul A> Rezultatul B> Rezultatul C> Rezultatul D:
Deci posibilele lor aciuni sunt da (contribuie) sau nu (nu contribuie). Trecnd de la rezultate la
utiliti care reflect preferinele juctorilor, putem s alocm utiliti dup cum urmeaz:
Rezultat A -> 4
Rezultat B -> 3
Rezultat C -> 2
Rezultat A -> 1
S presupunem c persoana care colecteaz donaii pentru grdina comunitii merge de la cas la
cas, nainte vizitnd-o pe Emily i de a primi rspunsul ei, apoi vizitnd-o pe Nina i de a primi rspunsul
ei, vizitnd-o n final i pe Talia, pentru a primi i rspunsul ei. Acesta este un joc secvenial.
Ce ar trebui s fac fiecare juctor pentru a-i maximiza utilitatea?
Rezultatele sunt prezentate n figura 14. Plile sunt enumerate n ordine (Emily, Nina, Talia).
Cum ar trebui s se calculeze echilibrul de rsturnare?

Emily
A

da nu

Nina B C Nina

da nu da nu

## Talia E E Talia Talia G H Talia

da nu da nu da nu da nu

( 3, 3, 3 ) ( 3, 3, 4 ) ( 3, 4, 3 ) ( 1, 2, 2 ) ( 4, 3, 3 ) ( 2, 1, 2 ) ( 2, 2, 1) ( 2, 2, 2 )
Fig. 14 Arborele jocului

ncepem cu Talia, deoarece ea este ultima care va oferi un rspuns. Ea este asociat cu punctele E,
F, G i H. La punctul E, dac spune da, primete un ctig de 3, dar dac spune c nu, primete un ctig de
4. Deoarece ea prefer 4 n loc de 3, ar trebui s ia decizia (E, nu). Apoi, lum n considerare opiunile sale
la punctul F. Dac ea spune da, primete un ctig de 3, dar dac spune nu, primete un ctig de 2.
Deoarece ea prefer de 3 n loc de 2, ar trebui s ia decizia (F, da). La punctul G, dac ea spune da, primete
un ctig de 3, dar dac spune c nu, ea primete un ctig de 2. Deci, ar trebuie s ia decizia (G, da). La
punctul H, dac spune da, primete un ctig de 1, dar dac spune c nu, primete un ctig de 2. Deci ar
trebui decid (H, nu). Cele mai bune rspunsuri ale Taliei ( Fig. 15 ) sunt: { (E, nu), (F, da), (G, da), (H,
nu) }.
Acum s gsim cele mai bune micri ale Ninei. Nina este asociat cu punctele B i C. n ambele
cazuri, tie c, oricum se mic, Talia va continua s fac cea mai bun micare, aa c Nina ia n
considerare acest lucru. n punctul B, dac Nina spune da, primete un ctig de 3, dar dac spune nu,
primete un ctig de 4. n mod evident, la punctul B, ar trebui s decid (B, nu). n punctul C, dac spune
da, primete un ctig de 3, dar dac spune nu, primete un ctig de 2. n punctul C, ea ar trebui s decid
(C, da). Cele mai bune rspunsuri ale Taliei ( Fig. 16 ) sunt: { (B, nu), (C, da) }.
Acum s lum n considerare cea mai bun micare a lui Emily. Ea este asociat numai cu punctul
A. Dac spune da, primete un ctig de 3, dar dac spune nu, primete un ctig de 4. n mod evident, ar
trebui decid (A, nu). Cea mai bun micare a lui Emily ( Fig. 17 ) este { (A, nu) }.

Emily
A

da nu

Nina B C Nina

da nu da nu

## Talia E ( 3, 3, 4 ) ( 3, 4, 3 ) E Talia Talia G ( 4, 3, 3 ) ( 2, 2, 2 ) H Talia

da nu da nu da nu da nu

( 3, 3, 3 ) ( 3, 3, 4 ) ( 3, 4, 3 ) ( 1, 2, 2 ) ( 4, 3, 3 ) ( 2, 1, 2 ) ( 2, 2, 1) ( 2, 2, 2 )
Fig. 15 Cele mai bune rspunsuri ale Taliei

Emily
A

da nu

Nina B ( 3, 4, 3 ) ( 4, 3, 3 ) C Nina

da nu da nu

## Talia E ( 3, 3, 4 ) ( 3, 4, 3 ) E Talia Talia G ( 4, 3, 3 ) ( 2, 2, 2 ) H Talia

da nu da nu da nu da nu

( 3, 3, 3 ) ( 3, 3, 4 ) ( 3, 4, 3 ) ( 1, 2, 2 ) ( 4, 3, 3 ) ( 2, 1, 2 ) ( 2, 2, 1) ( 2, 2, 2 )
Fig. 16 Cele mai bune rspunsuri ale Ninei
Emily
A ( 4, 3, 3 )

da nu

Nina B ( 3, 4, 3 ) ( 4, 3, 3 ) C Nina

da nu da nu

## Talia E ( 3, 3, 4 ) ( 3, 4, 3 ) E Talia Talia G ( 4, 3, 3 ) ( 2, 2, 2 ) H Talia

da nu da nu da nu da nu

( 3, 3, 3 ) ( 3, 3, 4 ) ( 3, 4, 3 ) ( 1, 2, 2 ) ( 4, 3, 3 ) ( 2, 1, 2 ) ( 2, 2, 1) ( 2, 2, 2 )
Fig. 17 Cele mai bune rspunsuri ale lui Emily, ale Ninei i ale Taliei
Calea de echilibru a jocului poate fi gsit n figura 17, urmnd ramurile cu aciuni ncercuite.
ntregul profil de strategie optim poate fi gsit prin asocierea seturilor generate la fiecare etap:
{ (A, nu), (B, nu), (C, da), (E, nu), (F, da), (G, da), (H, nu) }.
Adic, profilul de strategie optim de strategie ofer cel mai bun rspuns juctorului la fiecare
punct. Calea real a jocului n echilibrul de redresare se gsete prin punerea n comun a micrilor
optime ale fiecrui juctor pentru a asambla o istorie real. n figura 17, aceasta este secvena gsit
urmnd ramurile cu aciuni ncercuite de la rdcin la frunz:
{ (A, nu), (C, da), (G, da) }.
Emily are n mod clar un avantaj fa de Nina i Talia. Ea are avantajul primului juctor.

## 2. Tortul ( The Cake Game )

n acest joc, doi copii au permisiunea de a mpri un tort prin faptul c un singur copil, un feliator,
mparte tortul n dou buci i cellalt copil, selectorul, selecteaz bucata pe care o dorete. Acesta este
un bun exemplu de joc, deoarece rezultatul fiecrui agent depinde de alegerile celuilalt agent. Ambii copii
trebuie s gndeasc strategic pentru a obine cele mai bune rezultate. S presupunem c feliatorul are
urmtoarele aciuni posibile:
a. Tierea tortului n dou felii egale.
b. Tierea tortului ntr-o felie mare i o felie mic.

Aciunile feliatorului au ca rezultat trei dimensiuni posibile pentru felii de tort: mici, medii i mari.
Aceasta ofer selectorului trei aciuni posibile:
a. Alegerea feliei mari.
b. Alegerea feliei medii.
c. Alegerea feliei mici.
Observm c rezultatele pentru cei doi juctori depind de aciunile lor individuale. Dac feliatorul
alege s taie tortul n mod inegal, atunci selectorul poate alege ntre felie mare i felie mic. Dac feliatorul
alege s mpart tortul n dou felii egale, atunci selectorul poate alege doar o felie medie.
Feliatorul
1

## tiere egal tiere inegal

Selectorul 2 3 Selectorul

## ( medie, medie ) ( mic, mare ) ( mare, mic )

Fig. 18 Arborele jocului
Acum ne ndreptm spre relaia de preferin. Copiii ador n general tortul, aa c pot fi afirmate
confortabil urmtoarele pentru ambii copii:
a. Felie mare Felie medie
b. Felie medie Felie mic.
Dac copiii sunt raionali, ambii prefer o felie mare fa de o felie mic.
Figura 18 prezint o versiune simpl a jocului. Nodurile arborelui sunt numerotate, cu excepia
nodurilor frunzelor. n general, m refer la nodurile numerotate ca stri de informaie. Nodul superior,
starea de informare 1, este rdcina i reprezint opiunile disponibile pentru feliator. El poate alege fie s
taie tortul n buci egale, fie n buci inegale. Aceste alegeri sunt reprezentate de ramurile care ies din
nodul rdcin. Aceste ramuri sunt etichetate de alegerile feliatorului. Urmtorul nivel al arborelui
reprezint opiunile selectorului. Dac feliatorul a ales s taie n mod egal (starea de informare 2),
selectorul nu are nicio alegere real: exist dou buci medii, iar lui i este indiferent pe care o ia,
deoarece acestea sunt egale. Altfel, dac feliatorul a fcut tieturi inegale (starea de informare 3),
selectorul poate alege fie felia mare, fie felia mic.
Nodurile frunzelor arborelui arat rezultatele celor doi juctori. Aceste rezultate sunt afiate ca
perechi ordonate, ctigul feliatorului fiind primul element, iar ctigul selectorului fiind cel de-al doilea
element. Dac feliatorul a ales s taie dou buci egale, el i selectorul vor avea felii medii. Dar s
presupunem c a tiat piesele inegal. Astfel, dac selectorul alege felia mare, feliatorul rmne cu felia
mic, iar dac selectorul alege felia mic, feliatorul rmne cu felia mare.
n acest moment, exist un rezultat intuitiv pentru joc. Dac feliatorul taie tortul n dou felii egale,
i este garantat astfel o felie medie. Dac taie tortul n dou piese inegale, selectorul va lua bucata mare i
feliatorul va fi lsat cu bucata mic. Relaia de preferin ne spune c feliatorul prefer o pies medie fa
de o bucat mic, aa c, n mod normal, acesta nu va tia tortul n buci inegale. Cea mai bun strategie
a slicerului este ntotdeauna s taie tortul n buci egale: { (1, tiere egal) }.
Aceasta este o pereche ordonat constnd dintr-o stare de informare, n acest caz, starea 1, i o
aciune. Deci, dac feliatorul este n starea de informare 1, ar trebui s aleag s taie tortul n felii egale.
Din punctul de vedere al selectorului, lucrurile sunt mai complicate. Dac acesta este n starea de
informare 2, alegerea sa este determinat: el trebuie s aleag o felie medie. S presupunem c feliatorul
face o greeal i taie tortul n buci inegale. Un juctor raional ar fi gata s exploateze aceast greeal.
Deci selectorul ar trebui s aleag bucata mare, din moment ce o prefer fa de bucata mic. Selectorul
ar trebui s urmeze strategia { (2, alege medie), (3, alege mare) }.
Intuitiv, niciun juctor nu are niciun motiv s-i schimbe strategia. Ambii fac tot ce pot, avnd n
vedere alegerile care le sunt confruntate i ateptarea ca cellalt juctor s-i urmeze preferinele. Suntem
justificai n a numi aceste sugestii de strategie o strategie de echilibru. Dac oricare dintre juctori are
defecte la realizarea strategiei, atunci va alege cea mai rea decizie. Dac feliatorul face o greeal i taie
lucrurile inegal, atunci el va primi o bucat mic, iar selectorul ar trebui s aleag felia mare, pe care o
prefer fa de felia mic. Putem asambla opiunile ntr-un profil de strategie care le arat juctorilor ce
trebuie s fac n orice caz:
{ (1, tiere egal), (2, alege medie), (3, alege mare) }.
Feliatorul
1

## tiere egal tiere inegal

Selectorul 2 3 Selectorul

## ( medie, medie ) ( mic, mare ) ( mare, mic )

Fig. 19 Cele mai bune rspunsuri ale selectorului

Feliatorul
1

## tiere egal tiere inegal

Selectorul 2 3 Selectorul

## alege medie alege mare alege mic

( medie, medie ) ( mic, mare ) ( mare, mic )
Fig. 20 Cele mai bune rspunsuri ale feliatorului i selectorului
Calea real a jocului n echilibrul de redresare se gsete prin punerea n comun a micrilor
optime ale fiecrui juctor pentru a asambla o istorie real. n figura 20, aceasta este secvena gsit
urmnd ramurile cu aciuni ncercuite de la rdcin la frunz:
{ (1, tiere egal), (2, alege medie) }.

## 3. Holmes-Moriarty ( The Holmes-Moriarty Game )

Acesta este un joc static n informaie incomplet, un joc n care un juctor nu cunoate alegerea
celuilalt atunci cnd trebuie s se mute. Cu alte cuvinte, juctorii fac micri n condiii de incertitudine.
Teoria jocurilor ofer juctorilor sfaturi sntoase despre ce s fac n astfel de circumstane.
Acest exemplu este din cartea celebr de von Neumann i Morgenstern (1944), care a nceput
teoria jocului ca o ramur activ de cercetare. S presupunem c profesorul Moriarty l urmrete pe
Sherlock Holmes, fr ndoial, cu intenie rea. Desigur, Holmes vrea s se sustrag lui Moriarty. Pentru a
face acest lucru, a urcat pe un tren spre Dover, de unde intenioneaz s fug pe continent. Cum ar fi
norocul, Holmes l observ pe Moriarty pe platform n timp ce trenul se retrage. n plus, Holmes are toate
motivele s cread c Moriarty l-a vzut i c acesta tie astfel exact n ce tren se afl Holmes. Chiar mai
ru, Holmes poate s presupun n siguran c Moriarty l va urmri n trenul su privat, care va ajunge n
mod inevitabil la trenul lui Holmes nainte de a ajunge la Dover. Trenul face o singur oprire la
Canterbury, aa c Holmes putea s schimbe trenul acolo. Bineneles, Moriarty tie acest lucru i poate s-
i schimbe i el trenul propriu.
Ce ar trebui s fac Holmes?
S stabilim problema ca pe un joc. Figura 21 arat jocul n form normal. Alegerile juctorilor
sunt aranjate ntr-o matrice, cu plile n celulele matricei. Holmes este juctorul de pe rnd. El are dou
opiuni: poate s schimbe trenul la Dover sau poate ajunge la Canterbury. Moriarty este juctorul de pe
coloan. El, de asemenea, poate cobor la Dover sau la Canterbury.

Moriarty

Dover Canterbury

## Dover -100, 100 50, -50

Holmes
Canterbury 0, 0 100, 100
Fig. 21 Matricea jocului

Observm c suma plilor din fiecare celul este zero. Holmes i Moriarty joac un joc cu sum
zero, un joc strict competitiv, cu un ctigtor clar i un pierztor clar.
Celulele matricei din figura 21 pot fi citite ca plile atribuite lui Holmes i lui Moriarty. n general,
juctorul de pe rnd primete primul ctigul, iar juctorul de pe coloan primete al doilea. Deci, dac
Holmes i Moriarty coboar la Dover, Moriarty l prinde pe Holmes, deoarece, ajungnd acolo mai
devreme, a avut ansa de a pregti o capcan. El primete un ctig de 100 de puncte. Lui Holmes, evident,

nu-i place aceast alternativ. El are o pierdere de 100 de puncte. Plile sunt aceleai dac i Holmes i
Moriarty i iau trenurile la Canterbury.
S presupunem c Holmes ajunge la Dover, n timp ce Moriarty s-a oprit la Canterbury. Holmes
este fericit, deoarece el poate sri acum pe continent, unde are mai multe anse s scape de ghearele lui
Moriarty. n acest caz, Holmes primete un ctig de 50 de puncte, deoarece el l-a evitat pe Moriarty i este
probabil s continue s fac acest lucru. Moriarty are o pierdere de 50 puncte. n cele din urm, s
presupunem c Holmes se oprete la Canterbury, n timp ce Moriarty continu spre Dover. Holmes a
scpat pentru moment de Moriarty, dar scparea lui prin Dover nu este disponibil. Moriarty nc nu l-a
capturat pe Holmes, dar este bine poziionat pentru a face acest lucru. Fiecare juctor primete un salariu
de 0.
Holmes, fiind un gnditor strlucit, motiv pentru care cel mai bun mod de a se sustrage lui
Moriarty ar fi s-l fac s fie indiferent la alegerea dintre Dover i Canterbury. Ideea este c, dac Moriarty
se poate atepta la acelai ctig dac se oprete la Canterbury, aa cum se poate atepta dac merge la
Dover, atunci Moriarty devine indiferent de alegere i poate alege ntre cele dou probabilistici. Altfel,
dac Holmes adopt o strategie pur, Moriarty ar putea s ghiceasc i s ctige cu uurin.
S aplicm ideea de utilitate ateptat problemei lui Holmes. El vrea s-l fac pe Moriarty
infiferent ntre oprirea la Canterbury i continuarea spre Dover. Cu alte cuvinte, el dorete ca utilitatea
ateptat a lui Moriarty pentru alegerea Canterbury s fie aceeai cu utilitatea ateptat pentru alegerea
Dover:
EU (Canterbury) = EU (Dover).
Acum, Holmes va ajunge la Canterbury cu o probabilitate p. Deoarece singura lui opiune este de a
merge la Dover, mergnd la Dover are probabilitate (1 - P). Deci, utilitatea ateptat a lui Moriarty de a
ajunge la Canterbury este:
[ ( 1-p ) (-50) ] + ( p100 ),
iar utilitatea ateptat de a ajunge la Dover este:
[ ( 1-p ) 100 ] + ( p0 ).
Holmes trebuie s stabileasc probabilitatea, p, care face utilitatea ateptat de a alege Canterbury
egal cu utilitatea ateptat de a alege Dover. Adic, Holmes trebuie s rezolve urmtoarea ecuaie:
[ ( 1-p ) (-50) ] + ( p100 ) = [ ( 1-p ) 100 ] + ( p0 ).
Puin algebr arat c cele dou laturi ale ecuaiei sunt egale cnd p = 3/5. Adic, Holmes ar
trebui s se opreasc la Canterbury n proporie de 60% i s continue la Dover n proporie de 20%. Prin
urmare, el poate decide prin aruncarea unei monede cu faete cu probabiliti 60%, respectiv 40%.
Desigur, Holmes nu este garantat c va scpa de Moriarty jucnd aceast strategie. Din pcate, viaa nu are
garanii. Dar nu poate face mai bine dect s joace n acest fel. Ofer cea mai bun ans s scape de
Moriarty. Observai c strategia este o strategie mixt. Holmes ar trebui s-i fac alegerea prin alegerea
probabilist ntre mai multe opiuni.
Jocul Holmes-Moriarty arat cum se poate lucra de la utiliti la probabiliti. Deoarece Holmes
este contient de utilitile lui Moriarty, el poate s-i determine probabilitatea de a se opri la Canterbury.
Dar utilitatea este nc utilizat ca scar de preferin aici. Atta timp ct Holmes este contient de gradul
n care Moriarty prefer un rezultat fa de cellalt, el poate atribui utiliti n aa fel nct s elaboreze o
strategie mixt.

