Documente Academic
Documente Profesional
Documente Cultură
Rodica Brânzei
Contents
PREFAŢĂ 5
LISTA FIGURILOR 8
1 INTRODUCERE 9
1.1 Forme de reprezentare a jocurilor . . . . . . . . . . . . . . . . 10
1.2 Modelarea situaţiilor decizionale interactive ca jocuri . . . . . 13
2 JOCURI NECOOPERATIVE 15
2.1 Jocuri ı̂n formă normală şi echilibre Nash . . . . . . . . . . . . 16
2.2 Jocuri ı̂n formă extensivă şi echilibre Nash perfecte pe subjoc 29
2.3 Forma extensivă şi forma normală . . . . . . . . . . . . . . . . 37
2.4 Extensia mixtă şi echilibre Nash ı̂n strategii mixte . . . . . . . 44
2.5 Informaţie şi jocuri necooperative . . . . . . . . . . . . . . . . 51
3 JOCURI COOPERATIVE 57
3.1 Jocuri cooperative ı̂n forma strategică . . . . . . . . . . . . . . 58
3.2 Jocuri cooperative ı̂n forma funcţiei caracteristice şi sâmburele 61
3.3 Valoarea Shapley şi AL-valoarea . . . . . . . . . . . . . . . . . 68
3.4 σ-valoarea şi τ -valoarea . . . . . . . . . . . . . . . . . . . . . . 72
3.5 Nucleolul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.6 Comunicare şi informaţie ı̂n jocuri cooperative . . . . . . . . . 78
BIBLIOGRAFIE 87
3
PREFAŢĂ
Teoria jocurilor este o teorie matematică care se ocupă cu modelarea şi ana-
liza situaţiilor decizionale interactive care implică conflict de interese indi-
viduale sau de grup. Primele lucrări dedicate teoriei jocurilor sunt cele ale
lui Borel (1921) şi von Neumann (1928), dar bazele teoriei matematice a
jocurilor au fost puse prin monografia având ca autori pe von Neumann şi
Morgenstern (1944). După o perioadă mai puţin fructuoasă, teoria jocurilor
a cunoscut şi cunoaşte o perioadă de ı̂nflorire şi recunoaştere pe plan mon-
dial. Există un mare număr de cercetători şi cadre didactice ı̂n domeniul
teoriei jocurilor, iar numărul studenţilor ı̂n programe de masterat şi doc-
torat dedicate teoriei jocurilor sau frontierei dintre teoria jocurilor şi alte
domenii este ı̂n creştere. Societatea de Teoria Jocurilor (”Game Theory
Society”) ı̂şi lărgeşte numărul de membri şi a avut deja două congrese mon-
diale la: Bilbao (Spania), 2000; Marsilia (Franţa), 2005. În 2005 a fost inau-
gurat la Maastricht (Olanda) un ciclu de conferinţe anuale la nivel european
SING (Spain-Italy-Netherlands Games) care continuă tradiţia conferinţelor
anuale dedicate teoriei jocurilor ı̂n Italia şi Spania ı̂ncepând din 1983 (Ber-
gamo (Italia)); SING2 a avut loc anul acesta la Foggia (Italia). În luna
iulie a fiecărui an, la Stony Brook (Statele Unite) se ţine aşa-numitul ”Game
Theory Festival” unde se ı̂ntâlnesc cercetători şi studenţi din lumea ı̂ntreagă.
Numeroase workshop-uri, conferinţe şi seminarii dedicate unor ramuri par-
ticulare ale teoriei jocurilor au loc anual, bianual, trimestrial sau lunar ı̂n
diferite centre universitare sau de cercetare ştiinţifică. Numeroase manifes-
tări ştiinţifice cu spectru larg (spre exemplu EJOR Conference) şi cu spe-
cific economic sau de informatică includ o secţie pentru teoria jocurilor.
Există un număr mare de jurnale internaţionale care publică articole de teoria
jocurilor şi aplicaţii ale sale, dintre care menţionăm aici: International Jour-
nal of Game Theory, Games and Economic Behavior, European Journal of
Operational Research, Mathematics of Operations Research, Mathematical
Methods of Operations Research, International Game Theory Review, TOP.
5
Recunoaşterea importanţei teoriei jocurilor este materializată de asemenea
prin acordarea unor Premii Nobel pentru Economie pentru contribuţii ı̂n
domeniul teoriei jocurilor: Nash, Harsanyi şi Selten (1994), Vickrey (1996),
Aumann şi Schelling (2005). În ultimii ani, teoria jocurilor se bucură de o
atenţie crescândă ı̂n informatica teoretică şi aplicată pe plan mondial. La
Facultatea de Informatică a Universităţii ”Alexandru Ioan Cuza” din Iaşi,
studenţii anului 2 pot opta pentru cursul de Teoria Jocurilor pentru o in-
troducere ı̂n domeniul teoriei jocurilor şi al interacţiunii dintre aceasta şi
informatică. Prezentul material este conceput ca un suport de curs pentru
studenţii secţiei Învăţământ la Distanţă, care a fost solicitat autoarei pe 8
iulie 2006 pentru a fi gata pentru tipar la sfârşitul lunii august 2006.
Am organizat materialul ı̂n trei capitole: Introducere, Jocuri necoope-
rative şi Jocuri cooperative. Am muncit din greu să fac acest curs ”self-
contained” şi posibil de citit pentru studenţi fără vreo cunoaştere prealabilă
a teoriei jocurilor. Accentul este pe exemple care ilustrează folosirea mode-
lelor matematice de joc şi calcularea soluţiilor jocurilor necooperative şi coo-
perative corespunzând unor situaţii practice variate. Selectarea rezultatelor
(leme, propoziţii, teoreme) din cadrul teoriei jocurilor s-a făcut pe baza ideii
de a furniza studenţilor fundamentele teoriei jocurilor fără a solicita un efort
matematic deosebit. Studenţii interesaţi ı̂n demonstraţiile rezultatelor din
capitolele 2 şi 3 le pot găsi ı̂n Anexa A şi, respectiv, Anexa B. Capitolul 2 a
necesitat ı̂ncorporarea ı̂n text a unor figuri care au fost desenate manual de
autoare şi scanate pentru a crea fişiere cu extensia eps de inserat ı̂n text ı̂n
locul cel mai potrivit posibil. Timpul extrem de scurt pentru editarea acestui
material nu a permis desenarea tuturor figurilor cu software specific, ceea ce
justifică diferenţa de stil ı̂n reprezentarea grafică. În prezentarea materialului
am folosit termenul de ”jucător” (sau pronumele ”el”) pentru a referi orice
participant, indiferent de sex.
Acest suport de curs a fost pregătit ı̂n timpul concediului meu de odihnă
ı̂n Olanda şi, datorită faptului că a fost scris ı̂n limba română, nu a fost citit
de nimeni altcineva, aşa că toate greşelile rămase ı̂n text sunt desigur ale
mele.
Aş vrea să mulţumesc celor care au contribuit ı̂ntr-un fel sau altul la
pregătirea acestui suport de curs.
Apreciez mult ajutorul acordat de Annemiek Dankers şi Ruud Hendrickx
pentru scanarea figurilor şi crearea fişierelor eps la Universitatea din Tilburg
(Olanda). Un rol important pentru pregătirea acestui suport de curs l-a avut
Stef Tijs care mi-a pus la dispoziţie biblioteca sa şi a fost o gazdă ideală, deşi
6
de la bun ı̂nceput a considerat că e imposibil ca cineva să scrie un curs de
teoria jocurilor pentru studenţi ı̂ntr-un interval aşa de scurt. Mulţumesc
din suflet prietenei mele Elena Mocanu din Iaşi care a muncit din greu ı̂n
weekend-urile lunii august şi şi-a folosit talentul să facă din fişierele word,
pdf şi eps trimise de mine via e-mail prezentul suport de curs. Aş vrea de
asemenea să mulţumesc mamei mele, Elena Vătămanu, care a făcut faţă
căldurii tropicale din iulie-august ı̂n Iaşi fără ajutorul meu şi a considerat că
scrierea acestui curs pentru studenţi e activitatea cea mai potrivită pentru
concediul meu de odihnă ı̂n străinătate. Mulţumesc fratelui meu, Valentin
Vătămanu, pentru că a oferit suport mamei mele suplinind prezenţa mea
ı̂n Iaşi ı̂n această vară fierbinte. Dedic acest suport de curs pentru teoria
jocurilor fiicelor mele Oana, Dana şi Roxana Brânzei pe care le port ı̂n suflet
şi gând cu dragoste nemărginită oriunde şi oricând.
7
LISTA FIGURILOR
9
operaţionale. Interacţiunea ı̂ntre teoria jocurilor şi informatică se referă la
ramuri variate ale informaticii, cum sunt: proiectarea şi analiza algoritmilor,
inteligenţa artificială, logică şi decidabilitate, teoria complexităţii, calcul pa-
ralel şi distribuit, baze de date, reţele de calculatoare, internet.
Cele mai utilizate forme pentru a reprezenta jocuri sunt: forma extensivă,
forma normală (sau strategică) şi forma coaliţională.
Forma extensivă a unui joc este un arbore ale cărui noduri reprezintă
poziţiile posibile ale jocului şi ale cărui arce (ramuri) reprezintă mutările posi-
bile pentru participanţii la joc. Jocul se desfăşoară ca o alternare de mutări
ale participanţilor la joc (jucătorii), motiv pentru care un joc ı̂n formă exten-
sivă este numit un joc dinamic. Fiecare nod neterminal are ataşată eticheta
(de identificare a) jucătorului care trebuie să ia o decizie (să facă o mutare)
ı̂n acea poziţie a jocului. Adesea etichetele nodurilor sunt 1, 2, ..., n. Nodurile
terminale conţin vectorul plăţilor jucătorilor dacă jocul se termină ı̂n acea
poziţie. Fiecare arc are ataşată eticheta unei acţiuni. Reprezentarea ı̂n formă
extensivă a unui joc ilustrează desfăşurarea ı̂n timp a jocului. Unele mutări
pot fi aleatoare (mutări ale şansei sau naturii); pentru asemenea mutări există
distribuţii de probabilitate bine-definite care sunt folosite ca etichete pentru
arcele ce ies din nodurile aparţinând şansei. Nodurile de decizie ale jucătorilor
10
din arborele jocului sunt partiţionate ı̂n mulţimi de informaţie. O mulţime de
informaţie pentru un jucător constă din acele poziţii de joc ı̂n care jucătorul
s-ar putea afla atunci când este rândul său să facă o mutare. În reprezentarea
ı̂n forma extensivă a jocului, mulţimile de informaţie ale jucătorilor care
conţin mai mult decât un nod de decizie sunt marcate grafic, spre exemplu
cu contur de tipul − − −. Evident, pentru o anumită mulţime de informaţie,
numărul deciziilor posibile pentru acel jucător trebuie să fie acelaşi pentru
toate nodurile aparţinând acelei mulţimi. Dacă toate mulţimile de informaţie
a tuturor jucătorilor constau dintr-un singur nod, aceasta ı̂nseamnă că orice
jucător cunoaşte perfect situaţia ı̂n care se află atunci când trebuie să aleagă
o acţiune, motiv pentru care jocul se numeşte joc cu informaţie perfectă.
Într-un joc cu informaţie perfectă fiecare jucător cunoaşte ı̂ntreaga istorie de
desfăşurare a jocului până ı̂n momentul când trebuie să facă o mutare. Şahul
este un joc cu informaţie perfectă. Dacă cel puţin un jucător nu cunoaşte
toată istoria de desfăşurare a jocului, atunci jocul este un joc cu informaţie
imperfectă. Jocurile de cărţi (bridge, poker) sunt jocuri cu informaţie imper-
fectă. Presupunerea de raţionalitate a participanţilor la joc implică luarea
deciziilor personale astfel ı̂ncât plata individuală să fie maximizată sau cos-
tul individual să fie minimizat. Dacă jocul nu are mutări ale şansei şi plăţile
jucătorilor sunt cunoscute cu certitudine avem un joc dinamic cu informaţie
completă şi perfectă. Dacă există mutări ale şansei şi plăţile din nodurile ter-
minale ale arborelui sunt cunoscute de toţi jucătorii, atunci plăţile de primit
de către jucători depind de distribuţia de probabilitate a oricărei mutări
aleatoare. În acest caz se acceptă presupunerea că jucătorii acţionează astfel
ı̂ncât să-şi maximizeze plata aşteptată (medie). Plata aşteptată de un jucător
este o medie ponderată prin distribuţia de probabilitate corespunzătoare a
plăţilor din nodurile terminale. Spre exemplu, ı̂ntr-un joc cu aruncarea unei
monede, dacă un jucător obţine plata 2 ı̂n caz de ”pajură” şi plata 6 ı̂n caz
de ”cap”, plata ”aşteptată” de jucător este 1/2 · 2 + 1/2 · 6 = 4. O strategie
a unui jucător este un plan complet de acţiune de-a lungul arborelui jocului,
adică o listă ordonată a mutărilor jucătorului (câte una pentru fiecare din
mulţimile sale de informaţie) de-a lungul arborelui jocului, de la nodul iniţial
către nodurile terminale. Analiza unui joc ı̂n forma extensivă are ca scop de-
terminarea strategiilor optimale ale jucătorilor şi a plăţilor corespunzătoare.
11
Conceptul de soluţie folosit pentru determinarea strategiilor optimale ı̂ntr-un
joc ı̂n forma extensivă este acela de echilibru Nash perfect pe subjoc (Selten,
1975).
Forma normală a unui joc listează pentru fiecare jucător strategiile (pure)
disponibile şi plăţile de obţinut pentru fiecare combinaţie de strategii (pure),
câte una pentru fiecare jucător (profil strategic). Se presupune că jucătorii
ı̂şi aleg strategiile simultan şi independent, motiv pentru care un joc ı̂n formă
normală este numit un joc static. Totuşi, jucarea repetată de un număr finit
sau infinit de ori a unui joc ı̂n formă normală este un joc dinamic. Analiza
unui joc ı̂n formă normală are ca scop determinarea strategiilor optimale ale
jucătorilor şi a plăţilor corespunzătoare. Conceptul de soluţie fundamental
pentru forma normală a unui joc este acela de echilibru Nash (Nash, 1950a).
Forma extensivă a unui joc cu informaţie completă (şi perfectă sau imper-
fectă) şi fără mutări ale şansei generează o formă normală unic definită a
jocului, ı̂n care plăţile jucătorilor sunt cele din nodurile terminale ale arbore-
lui jocului. Forma extensivă a unui joc cu informaţie completă şi mutări ale
şansei generează de asemenea o formă normală unică, dar plăţile jucătorilor
ı̂n forma normală a jocului sunt plăţile aşteptate (medii) din jocul ı̂n forma
extensivă. Forma normală a unui joc poate genera mai multe jocuri ı̂n formă
extensivă. Orice echilibru Nash perfect pe subjoc al jocului ı̂n formă ex-
tensivă este un echilibru Nash al jocului corespunzător ı̂n formă normală.
În schimb, numai un echilibru Nash ”credibil” al jocului ı̂n formă normală
este un echilibru Nash perfect pe subjoc pentru o formă extensivă generată
de forma normală a jocului. Forma normală şi forma extensivă sunt un bun
candidat pentru reprezentarea unei situaţii cu conflict de interese individuale
atunci când nu sunt permise acorduri preliminare ı̂ntre jucători, deşi comuni-
carea ı̂ntre jucători ı̂nainte de ı̂nceperea jocului nu este ı̂ntotdeauna interzisă.
Dacă acordurile preliminare (şi eventual plăţile laterale) sunt permise atunci
forma coaliţională a jocului este un bun candidat pentru descrierea unei
situaţii decizionale interactive ca un joc.
Forma coaliţională a unui joc, cunoscută şi sub numele de forma funcţiei
caracteristice, este o descriere foarte generală a unei situaţii, care specifică
doar suma (maximă) ce poate fi obţinută (pe cont propriu) de fiecare grup
de jucători (coaliţie), incluzând coaliţiile formate dintr-un singur jucător şi
marea coaliţie (grupul format din toţi participanţii la joc). Analiza formei
coaliţionale a unui joc are ca scop determinarea coaliţiei care se va forma
12
şi a modului ı̂n care valoarea acelei coaliţii va fi distribuită ı̂ntre membrii
săi. Adesea, se presupune că marea coaliţie se formează şi problema de
rezolvat este ca jucătorii să cadă de acord asupra modului de alocare a valorii
obţinute de marea coaliţie ı̂ntre membrii săi. O regulă de alocare corespunde
unui anumit concept de soluţie din teoria jocurilor cooperative. Există mai
multe concepte de soluţie a căror atractivitate este prezentată ı̂n termeni
de proprietăţi caracteristice (caracterizare axiomatică). Sâmburele, valoarea
Shapley, τ -valoarea şi nucleolul sunt concepte de soluţie fundamentale pentru
jocuri cooperative ı̂n forma coaliţională. Forma coaliţională a unui joc se
poate construi pornind de la forma normală a jocului sau direct, pe baza
analizei situaţiei interactive ı̂n studiu.
13
(”binding agreements”) ı̂nainte de ı̂nceperea jocului nu sunt permise, atunci
modelul folosit va aparţine ı̂n principiu teoriei necooperative a jocurilor. În
acest caz, modelatorul va trebui să aleagă ı̂ntre forma extensivă şi forma nor-
mală (strategică) pentru a descrie formal situaţia studiată. Forma extensivă
prezintă avantajul unei modelări mai uşoare şi al unei analize mai simple, dar
rezolvarea jocurilor mari este de obicei dificilă şi uneori imposibilă. Forma
normală are avantajul unei rezolvări mai simple; ea este folosită mult pentru
rezolvarea jocurilor de două persoane. Dacă participanţii la joc au posibilităţi
largi de comunicare (incluzând deseori şi posibilitatea efectuării de plăţi late-
rale), atunci un model din teoria cooperativă a jocurilor va fi preferabil. Mai
departe, modelatorul are ı̂ncă de decis asupra tipului de model de joc coo-
perativ folosit şi va alege forma cea mai adecvată de reprezentare a situaţiei
analizate. Forma coaliţională este folosită adesea.
Încheiem introducerea ı̂n teoria jocurilor cu o motivaţie pentru studiul
acestei teorii. Cunoaşterea modelelor teoriei jocurilor şi a conceptelor de
soluţie specifice diferitelor modele furnizează suport pentru ı̂mbunătăţirea
luării deciziilor strategice ı̂n viaţa de zi cu zi, ı̂n profesie şi ı̂n afaceri. Des-
crierea unui număr relativ mare de situaţii conflictuale variate, modelarea
lor ca jocuri şi rezolvarea jocurilor construite (pentru a furniza soluţii pentru
situaţia conflictuală supusă studiului) crează abilităţi de aplicare a teoriei
jocurilor ı̂n practică. Cunoaşterea teoriei jocurilor poate de asemenea ı̂mbu-
nătăţi performanţa ı̂n jocuri de societate, jocuri de divertisment şi jocuri de
noroc, ridicând astfel calitatea vieţii ı̂n timpul liber. În plus, teoria jocurilor
şi interacţiunea sa cu alte discipline, ı̂n particular cu informatica, constitue
un domeniu de cercetare activ prin programe de masterat şi doctorat la multe
universităti din lumea ı̂ntreagă, oferind un domeniu interesant pentru conti-
nuarea studiilor. Aprecierea teoriei jocurilor pe plan mondial este confirmată
de premiile Nobel pentru Economie obţinute pentru contribuţii ı̂n domeniul
teoriei jocurilor: Nash, Harsanyi, Selten (1994), Vickrey (1996), Aumann şi
Schelling (2005).
14
2 JOCURI NECOOPERATIVE
15
2.1 Jocuri ı̂n formă normală şi echilibre Nash
16
şi coloanei respective. Dacă ı̂ntr-un joc finit cu doi jucători etichetăm strate-
giile fiecărui jucător astfel ı̂ncât X = {1, .., m} şi Y = {1, .., n}, atunci jocul
este descris printr-o (bi)matrice (K(i, j), L(i, j))i=1,...,m;j=1,...,n , unde K(i, j)
şi L(i, j) reprezintă, respectiv, plata obţinută de jucătorul 1 şi de jucătorul
2 ı̂n situaţia ı̂n care jucătorul 1 alege strategia i şi jucătorul 2 alege strategia
j. Un joc strategic finit de două persoane se numeşte un joc bimatriceal.
Etichete explicite pot fi ataşate liniilor şi coloanelor bimatricii ı̂n cazul unui
joc bimatriceal. Exemplul 2.1 modelează o situaţie de interacţiune strategică
legată de avantaj competitiv ca un joc bimatriceal, reprezentat ı̂n Figura 2.1.
I N
I 0, 0 a, −a
N −a, a 0, 0
Când cel puţin unul dintre jucători are infinit de multe strategii posibile, jocul
nu este finit. Exemplul 2.2 modelează o situaţie strategică de parteneriat ı̂n
afaceri ca un joc infinit de două persoane.
Exemplul 2.2. (Parteneriat ı̂n afaceri) Doi prieteni doresc să-şi deschidă
ı̂mpreună o afacere şi trebuie să decidă simultan şi independent asupra nivelu-
lui de efort investit ı̂n această afacere. Presupunem că nivelul de efort poate
fi ı̂n intervalul [0, 4], iar profitul obţinut de fiecare dintre ei depinde de nivelul
de efort investit de ambii prin funcţiile de plată K : [0, 4]×[0, 4] −→ IR şi
L : [0, 4]×[0, 4] −→ IR, definite prin:
17
¡ ¢
unde c ∈ 0, 14 este o constantă care măsoară complementaritatea muncii
celor doi parteneri de afaceri. Un echilibru Nash corespunzând maximizării
funcţiilor de plată individuale este x∗ = y ∗ = 1/(1 − c). Acesta se obţine
rezolvând ı̂n raport cu x şi y sistemul format din ecuaţiile ∂K(x, y)/∂x = 0,
∂L(x, y)/∂y = 0. Totuşi, dacă ambii jucători urmăresc maximizarea functiei
de plată totale, K + L, echilibrul Nash este x b = yb = 2/(1 − 2c) < 1/(1 − c).
Astfel, ı̂n cazul ı̂n care cei doi parteneri de afaceri au un ţel comun, un nivel
mai mic de efort e necesar din partea fiecăruia. Echilibrul Nash (x∗ , y ∗ ) este
ilustrat ı̂n Figura 2.5.
X
Un joc finit hN, {Xi }i∈N , {Ki }i∈N i este un joc cu sumă nulă dacă Ki =0.
i∈N
Un joc finit de două persoane cu sumă nulă satisface L = −K şi, de aceea,
poate fi reprezentat printr-un tablou sau o matrice, [K(i, j)]i=1,...,m;j=1,...,n ,
conţinând doar plăţile pentru jucătorul 1 (primite de la jucătorul 2). Un
astfel de joc se numeşte joc matriceal. Un joc cu sumă nulă pentru două
persoane este de asemenea cunoscut sub numele de joc strict competitiv,
ı̂ntrucât cooperarea dintre jucători este exclusă. Jocul din Figura 2.1 este un
joc pur competitiv; ı̂n Figura 2.2 (a) găsiţi descrierea sa (mai simplă) ca un
joc matriceal. Şahul este un joc finit de două persoane cu sumă nulă: când
jucătorul 1 câstigă, el obţine plata 1 iar jucătorul 2 obţine plata −1; când
jucătorul 2 câstigă, acesta obţine plata 1, iar jucătorul 1 obţine plata −1; ı̂n
caz de remiză ambii jucători obţin plata 0.
2 2 1 4 6 2 1
0 a
0 2 5 3 4 3 5
−a 0
4 2 3 2 0 1 6
Un joc strategic hN, {Xi }i∈N , {Ki }i∈N i este un joc cu sumă constantă dacă
X
Ki = C, unde C este o constantă. Orice joc cu sumă constantă poate fi
i∈N
transformat ı̂ntr-un joc cu suma nulă, aşa cum ilustrăm ı̂n Exemplul 2.3 şi
Figura 2.3.
18
Exemplul 2.3. (Jocul canalelor TV) Un canal de televiziune specializat ı̂n
transmisiuni sportive şi un canal de televiziune specializat ı̂n telenovele speră
să-şi lărgească audienţa la telespectori dacă ambele vor transmite atât sport
cât şi telenovele. Sondajele efectuate permit evaluarea ı̂n procente a audienţei
celor două canale ı̂n rândurile telespectatorilor, conform cu Figura 2.3 (a),
ı̂n care situaţia descrisă este modelată ca un joc cu sumă constantă. Figura
2.3 (b) conţine jocul cu sumă nulă echivalent jocului cu sumă constantă.
T S T S
T 55%, 45% 52%, 48% T 10%, −10% 4%, −4%
S 50%, 50% 45%, 55% S 0%, 0% −10%, 10%
(a) (b)
Cele mai multe jocuri bimatriceale nu sunt ı̂nsă cu suma nulă sau con-
stantă; acestea sunt cunoscute sub numele de jocuri cu sumă variabilă. Figura
2.4 conţine exemple de jocuri cu sumă variabilă care vor fi utilizate ulterior.
3, 1 0, 0 5, 5 0, 10 2, 2 0, 0
0, 0 1, 3 10, 0 1, 1 0, 0 1, 2
(a) (b) (c)
Figure 2.4: Exemple de jocuri cu sumă variabilă
În cele ce urmează, prin jocuri bimatriceale vom referi numai jocurile
de două persoane cu sumă variabilă. Întrucât ı̂ntr-un astfel de joc ambii
jucători pot câştiga sau ambii jucători pot pierde, ı̂n acelaşi timp, depinzând
de acţiunile luate de cei doi jucători, un joc bimatriceal hX, Y, K, Li poate fi
reprezentat ca o pereche de jocuri matriceale, K şi L, ambii jucători urmărind
acelaşi scop (maximizarea câştigului propriu sau minimizarea costului pro-
priu).
Conceptul de soluţie de bază pentru jocuri ı̂n formă strategică este cel
de echilibru Nash (Nash, 1950a). Un echilibru Nash este un profil strategic
care este stabil ı̂n sensul că nici-un jucător nu-şi poate ı̂mbunătăţi plata
deviind unilateral de la acest profil strategic prin alegerea unei alte strategii.
19
Elementele mulţimilor Xi se mai numesc strategii pure pentru a le distinge de
strategii mixte, care sunt distribuţii de probabilitate pe mulţimea strategiilor
pure ale unui jucător. Acest paragraf se referă ı̂n exclusivitate la echilibre
Nash ı̂n strategii pure, numite şi echilibre Nash pure. Echilibrele Nash ı̂n
strategii mixte, numite şi echilibre Nash mixte, sunt definite folosind extensia
mixtă a unui joc ı̂n formă normală; ele vor fi studiate ı̂n paragraful 2.4.
Profilul strategic xb = (bx1 , ..., x
bn ) este un echilibru Nash (pur) al jocului
hN, {Xi }i∈N , {Ki }i∈N i dacă pentru toţi i ∈ N şi toţi xi ∈ Xi avem
Ki (xi , x
b−i ) ≤ Ki (b
xi , x
b−i ).
Exemplul 2.4. Considerăm jocul ı̂n formă normală reprezentat ı̂n Figura
2.1, unde a > 0. Combinaţia de strategii (I, N ) nu este un echilibru Nash,
deoarece jucătorul 2 ı̂şi poate ı̂mbunătăţi plata (de la −a la 0) prin deviere
unilaterală, alegând strategia I. Combinaţia de strategii (I, I) este un echili-
bru Nash deoarece prin deviere unilaterală oricare dintre jucători obţine plata
−a care e mai mică decât 0.
Un joc care are cel puţin un echilibru Nash se numeşte un joc determi-
nat. Dacă un joc matriceal hX, Y, K, −Ki este un joc determinat atunci
spunem că jocul are ”punct şa”; plata jucătorului 1 ı̂ntr-un echilibru Nash
se numeşte valoarea jocului şi se notează cu v (hX, Y, K, −Ki) , sau v(K). În
cazul existenţei mai multor echilibre Nash pentru un joc matriceal, fiecare
echilibru Nash are aceeaşi valoare şi echilibrele Nash sunt interschimbabile.
Teorema 2.5. Fie hX, Y, K, −Ki un joc de două persoane cu sumă nulă şi
fie (x1 , y1 ) şi (x2 , y2 ) echilibre Nash ale jocului. Atunci:
(i) (Proprietatea de interschimbare) (x1 , y2 ) şi (x2 , y1 ) sunt de asemenea
echilibre Nash;
(ii) (Proprietatea plăţilor egale) K(xi , yj )=K(x1 , y1 ) pentru toţi i,j ∈ {1, 2}.
Într-un echilibru Nash al unui joc bimatriceal, fiecare jucător ı̂şi maxi-
mizează utilitatea proprie dat fiind ceea ce face celălalt jucător. O strategie
x ∈ X pentru care există y ∈ Y astfel că (x, y) este un echilibru Nash se
numeste strategie optimală pentru jucătorul 1. Analog se defineşte o strate-
gie optimală pentru jucătorul 2. O pereche de strategii optimale corespunde
ı̂ntotdeauna unui echilibru Nash al jocului. Dacă un joc are un singur echili-
bru Nash, el se numeşte un joc strict determinat. Într-un joc matriceal (strict)
determinat, cunoaşterea de către un jucător a strategiei celuilalt jucător nu-l
20
determină pe jucător să-şi schimbe planurile proprii. În cazul multiplicităţii
echilibrelor Nash ale unui joc bimatriceal determinat, plăţile jucătorilor pot
fi diferite pentru echilibre Nash distincte. Din acest motiv, un jucător poate
prefera un echilibru Nash iar celălalt jucător poate prefera un alt echilibru
Nash, caz ı̂n care rezultatul jocului nu va fi un echilibru Nash. Chiar şi ı̂n
cazul unui echilibru Nash unic, acest rezultat al jocului poate fi nesatisfăcător.
În orice joc de două persoane cu sumă nulă putem determina valoarea
inferioară şi valoarea superioară a jocului definite prin
Are loc relaţia v(X, Y, K, −K) ≤ v̄(X, Y, K, −K) pentru orice joc
hX, Y, K, −Ki.
Valoarea inferioară şi superioară pentru un joc de două persoane cu sumă
nulă pot fi privite ca nivele de securitate ale jucătorilor, ı̂ntrucât reprezintă
suma minimă pe care jucătorul 1 şi-o poate garanta ı̂n jocul respectiv şi, res-
pectiv, suma maximă pe care jucătorul 2 ar putea-o pierde ı̂n jocul respectiv,
indiferent de acţiunea aleasă de adversarul său (sub presupunerea că acesta
este raţional şi inteligent). Dacă valoarea superioară şi valoarea inferioară a
unui joc matriceal au aceeaşi valoare, atunci jocul are punct şa. Un punct
şa are cea mai mică valoare ı̂n linie (astfel ı̂ncât jucătorul 2 nu poate câştiga
prin schimbarea coloanei) şi cea mai mare valoare ı̂n coloană (deci jucătorul
1 nu poate câştiga prin schimbarea liniei). Dacă un joc are punct şa, ambii
jucători ar trebui să aleagă strategii care duc la acest punct. Jocul din
Figura 2.2. (c) este strict determinat: punctul şa este 3 şi echilibrul Nash al
jocului este profilul strategic (linia 2, coloana 2). Pentru jocuri determinate
de două persoane, determinarea punctelor de echilibru Nash se poate face
pe baza considerării multifuncţiilor ”cel mai bun răspuns” ale jucătorilor.
Multifuncţia cel mai bun răspuns (ı̂n strategii pure) a unui jucător asociază
la fiecare dintre strategiile pure ale celuilalt jucător, mulţimea strategiilor
pure care ar putea fi optimale (cel mai bun răspuns) pentru acel jucător ı̂n
acea situaţie. Un echilibru Nash pur este un profil strategic care constă din
strategii pure care sunt cel mai bun răspuns la cel mai bun răspuns. O metodă
analitică pentru determinarea funcţiilor cel mai bun răspuns pentru jocuri
infinite de două persoane este prezentată după Teorema 2.12. Din punct de
vedere grafic, echilibrele Nash pure ale unui astfel de joc sunt punctele de
21
intersecţie ale graficelor funcţiilor cel mai bun răspuns. Figura 2.5 ilustrează
aceasta pentru jocul ”Parteneriat ı̂n afaceri” din Exemplul 2.2.
22
−→ ←−
8, 9 8, 7 −10, 4 −5, 0
↑ ↓ ↓ ↑
11, 12 7, 6∗ 2, −10 −5, 5
−→ −→
(a) (b)
−→ −→
50, 50 80, 100∗ 130 180∗
↓ ↑ ↓ ↑
100, 80∗ 60, 60 180∗ 160
←− ←−
(c) (d)
23
• Xi este mulţimea strategiilor jucătorului i, o submulţime nevidă a
lui M .
1 2
R10 R20 −→
AB 2 5
14 12
BC 3 6 R1 8, 9 8, 7 ↑ ↓
17 11∗
AD 4 10 R2 11, 12 7, 6∗
−→
DC 1 3
(a) (b) (c)
Exemplul 2.7. (Un joc al documentării) Studenţii din doi semiani de studii
trebuie să se pregătească pentru un examen folosind un suport de curs tipărit
existent la biblioteca facultăţii şi un laborator cu calculatoare. Dacă toţi
24
studenţii ı̂nvaţă la bibliotecă, ori toţi la laborator, aglomeraţia creată dimi-
nuează eficienţa documentării lor. Jocul din Figura 2.6 (c) poate fi considerat
ca un joc al documentării.
Fie
Y G = hN, {Xi }i∈N , {Ki }i∈N i un joc strategic de n persoane şi fie
P : Xi −→ IR o funcţie cu valori reale definită pe mulţimea profilurilor
i∈N
strategice. Funcţia P este un potenţial
Y exact pentru G dacă pentru orice
i ∈ N , pentru orice x−i ∈ X−i = Xj şi pentru orice xi , yi ∈ Xi , are loc
j∈N \{i}
Ki (xi , x−i ) − Ki (yi , x−i ) = P (xi , x−i ) − P (yi , x−i ).
O funcţie P potenţial exact pentru G induce un joc potenţial GP =
hN, {Xi }i∈N , P, ..., P i . Figura 2.6 (d) conţine un joc potenţial pentru ”Jocul
documentării” din Figura 2.6 (c).
Teorema 2.8. Fie G = hN, {Xi }i∈N , {Ki }i∈N i un joc finit de n persoane şi
fie P un potenţial exact pentru G. Atunci
Propoziţia 2.9. (Rosenthal) Fie hN, M, (Xi )i∈N , (cj )j∈M i un model de con-
gestie şi fie G jocul de tip congestie corespunzător. Atunci G Yeste un joc
potenţial exact. O funcţie potenţial pentru G este dată de P : Xi −→ IR,
i∈N
definită pentru orice x = (xi )i∈N prin
X X
P (x) = − cj (`).
S
j∈ xi `=1,...,nj (x)
i∈N
Întrucât multe jocuri strategice finite au echilibre Nash multiple, ı̂n teo-
ria jocurilor necooperative au fost introduse variante (rafinări) ale noţiunii
de echilibru Nash, care impun condiţii suplimentare asupra echilibrelor Nash.
Noţiunea de echilibru Nash nedominat (sau echilibru Nash ı̂n strategii ne-
dominate) şi cea de echilibru Nash puternic prezintă un interes particular.
Spunem că o strategie xbi a jucătorului i domină strategia xi a aceluiaşi jucător
dacă prima nu este niciodată mai nefavorabilă jucătorului i decât cea de-a
25
doua şi uneori Y
e mai avantajoasă, adică pentru toate profilurile strategice
x−i ∈ X−i = Xj ale celorlalţi jucători are loc
j∈N \{i}
(∗) Ki (b
xi , x−i ) ≥ Ki (xi , x−i )
cu cel puţin o inegalitate strictă pentru cel puţin un x−i ∈ X−i . O strategie
care nu este dominată de către nici-o altă strategie se numeşte strategie ne-
dominată. Un profil strategic x = (xi )i∈N este un echilibru Nash nedominat
dacă el este un echilibru Nash ı̂n strategii nedominate, adică este un echili-
bru Nash ı̂n care xi este o strategie nedominată pentru fiecare i ∈ N. Un
echilibru Nash ı̂n strategii nedominate poate fi găsit prin eliminarea iterativă
a strategiilor dominate, aşa cum ilustrăm ı̂n Figura 2.8.
2 2 1 4 2 2 1
0 2 5 0 2
0 2 5 3 −→ 0 2 5 −→ −→ −→ 4 2 −→ 2
4 2 3 4 2
4 2 3 2 4 2 3
Un caz special apare ı̂n situaţia ı̂n care un jucător are o strategie care ı̂i
dă o plată la fel de bună cu plata pe care o poate obţine utilizând oricare din
celelalte strategii ale sale pentru orice profil strategic al celorlalţi jucători.
O strategie x bi ∈ Xi se numeşte o strategie slab dominantă dacă relaţia (∗)
are loc pentru orice xi ∈ Xi şi pentru orice x−i ∈ X−i . Un jucător poate
avea mai multe strategii slab dominante. Asemenea strategii ar trebui să
ofere jucătorului aceeaşi plată pentru orice profil strategic fixat al celorlalţi
jucători. Dacă o strategie slab dominantă x bi ∈ Xi este astfel ı̂ncât pentru
fiecare xi ∈ Xi există un profil strategic x−i astfel ı̂ncât (∗) are loc cu ine-
galitate strictă, atunci strategia xbi ∈ Xi domină toate celelalte strategii ale
jucătorului şi se numeşte strategie dominantă. Un jucător poate avea cel
mult o strategie dominantă.
Exemplul 2.10. În jocul de tip ”ultimatum” descris ı̂n Exemplul 2.18 şi
reprezentat ı̂n formă normală ı̂n Figura 2.17 (a), jucătorul 2 are o singură
strategie dominantă: (a1 , a2 , a3 ). Toate celelate strategii ale jucătorului 2 sunt
dominate. Spre exemplu, strategia (r1 , a2 , r3 ) este dominată de (r1 , a2 , a3 )
deoarece aceasta dă jucătorului 2 aceeaşi plată dacă jucătorul 1 foloseşte
26
strategia 5-1 sau 4-2, dar dacă jucătorul 1 foloseşte strategia 3-3, strategia
(r1 , a2 , a3 ) dă jucătorului 2 o plată mai mare decât strategia (r1 , a2 , r3 ).
Un echilibru Nash care satisface condiţia că este stabil ı̂mpotriva tuturor
deviaţiilor de către coaliţii de jucători se numeşte un echilibru Nash puternic.
Un echilibru Nash x∗ = (x∗i )i∈N al jocului hN, {Xi }i∈N , {Ki }i∈N i este un
echilibru Nash puternic Ydacă pentru toate coaliţiile S ⊂ N nu există nici-un
xS = (xi )i∈S ∈ XS = Xi astfel ı̂ncât Ki (xS , x∗ (N \ S)) ≥ Ki (x∗ ) pentru
i∈S
toţi i ∈ N , cu inegalitate strictă pentru cel puţin un jucător i ∈ S.
Exemplul 2.11. Pentru jocul din Exemplul 2.19, dintre cele trei echili-
bre Nash marcate cu ∗ ı̂n Figura 2.19 (b), două sunt echilibre Nash pu-
ternice: (A1 , (I, L2 , A3 )) şi (A1 , (I, A2 , A3 )). Echilibrul Nash (L1 , (I, L2 , L3 ))
nu este puternic deoarece coaliţia {1, 2} poate creşte plata jucătorului 1 de
la 2 la 3, menţinând plata 2 pentru jucătorul 2, prin folosirea strategiei
xS = (A1 , (I, A2 , L3 )).
27
În cele ce urmează, prezentăm o metodă analitică pentru determinarea
echilibrelor Nash a unui joc infinit de două persoane. Notăm cu f1 : X2 −→ X1
funcţia cel mai bun răspuns a jucătorului 1, unde f1 (x2 ) este cel mai bun
răspuns a jucătorului 1 la x2 , unde x2 este o strategie arbitrară fixată a
jucătorului 2. Această funcţie se obţine din ∂K1 (x1 , x2 )/∂x1 = 0 şi furnizează
valoarea lui x1 care maximizează K1 (x1 , x2 ) pentru orice x2 fixat. Notăm cu
f2 : X1 −→ X2 funcţia cel mai bun răspuns a jucătorului 2, unde f2 (x1 ) este
cel mai bun răspuns a jucătorului 2 la x1 , unde x1 este o strategie arbitrară
fixată a jucătorului 1. Această funcţie se obţine din ∂K2 (x1 , x2 )/∂x2 = 0 şi
furnizează valoarea lui x2 care maximizează K2 (x1 , x2 ) pentru orice x1 fixat.
Funcţia f definită prin f = (f1 , f2 ) se numeşte funcţia cel mai bun răspuns a
jocului. Această funcţie este continuă şi asociază fiecărei perechi de strategii
(x1 , x2 ) plata (f1 (x2 ), f2 (x1 )). Un echilibru Nash al jocului, x∗ = (x∗1 , x∗2 ), sa-
tisface simultan x∗1 = f1 (x∗2 ) şi x∗2 = f2 (x∗1 ). Din punct de vedere grafic, echili-
brele Nash ale jocului se află la intersecţia funcţiilor ”cel mai bun răspuns”
a celor doi jucători.
Exemplul 2.13. (Jocul publicităţii) Două firme concurente pe piaţa de
bunuri de consum trebuie să decidă simultan şi independent asupra nivelu-
lui optim al cheltuielilor lor cu publicitatea (ı̂n vederea maximizării profi-
tului individual). Presupunem că ambele firme au un plafon bugetar pen-
tru publicitate de 1000 e şi că profitul lor individual depinde de cheltu-
ielile cu publicitatea x1 şi x2 prin funcţiile de plată K1 : X1 ×X2 −→ IR şi
K2 : X1 ×X2 −→ IR, definite prin: K1 (x1 , x2 ) = 1000x1 −x21 −x22 , K2 (x1 , x2 ) =
1000x2 − x1 x2 − x22 . Această situaţie de decizie interactivă poate fi modelată
ca un joc infinit de două persoane cu sumă nulă h[0, 1000], [0, 1000], K1 , K2 i.
Deciziile optime privind cheltuielile cu publicitatea sunt determinate prin
calcularea echilibrelor Nash ale jocului. Acestea se obţin rezolvând sistemul
liniar 1000 − 2x1 = 0, 1000 − x1 − 2x2 = 0. Echilibrul Nash al jocului conside-
rat este x∗ = (500, 250), generând profitul K1 (500, 250) = 187.500 e pentru
jucătorul 1 şi K2 (500, 250) = 62.500 e pentru jucătorul 2.
Conceptul de echilibru Nash este fundamental pentru rezolvarea jocurilor
necooperative ı̂n formă strategică. Încheiem acest paragraf ı̂ncercând să
furnizăm un răspuns la ı̂ntrebarea: Este un echilibru Nash o soluţie a jocului?
O condiţie suficientă este asigurată de strategii nedominate ı̂n profilul strate-
gic corespunzând unui echilibru Nash. Presupunem că (s, t) este un echilibru
Nash şi că o altă strategie s∗ domină s pentru jucătorul 1 şi o strategie t∗
domină t pentru jucătorul 2. Atunci (s, t) nu este o soluţie a jocului.
28
2.2 Jocuri ı̂n formă extensivă şi echilibre Nash perfecte
pe subjoc
Forma extensivă a unui joc este o pereche hN, T i , unde N = {1, 2, ..., n}
este mulţimea (finită a) jucătorilor şi T este arborele jocului, oferind posibi-
litatea unei descrieri dinamice detaliate a unei situaţii de interacţiune strate-
gică. Un arbore este un graf orientat cu un nod special, numit rădăcină,
o mulţime de noduri terminale şi una de noduri neterminale şi un drum
unic de la rădăcină la fiecare din nodurile grafului. În arborele unui joc (ı̂n
formă extensivă) orice drum pornind de la rădăcină la un nod terminal in-
dică un mod ı̂n care ”istoria” jocului poate evolua. Nodurile neterminale ale
arborelui jocului (incluzând rădăcina), numite noduri de decizie, corespund
persoanelor ce iau decizii (jucătorii). Nodurile terminale indică rezultatele
(plăţile) posibile ale jucătorilor dacă jocul se sfârşeşte ı̂n acel nod termi-
nal. Arcele corespund ”mutărilor” (acţiunilor, strategiilor, deciziilor) jucă-
torilor care mută consecutiv (secvenţial ı̂n timp). Reprezentarea corectă a
unei situaţii conflictuale ca un joc ı̂n formă extensivă implică ı̂ncorporarea
corectă a tuturor regulilor jocului. Aceasta implică necesitatea identificării
pentru fiecare jucător a aşa-numitelor mulţimi de informaţie. O mulţime de
informaţie a unui jucător conţine toate nodurile de decizie ce aparţin acelui
jucător când acelui jucător ı̂i vine rândul la mutare. Mulţimile de informaţie
care conţin cel puţin două noduri de decizie se marchează grafic ı̂n arborele
jocului, de obicei folosind un contur de forma − − −. Dacă o mulţime
de informaţie a unui jucător constă dintr-un singur nod de decizie, atunci
acel jucător ştie precis care e poziţia sa ı̂n arborele jocului, adică jucătorul
cunoaşte toată istoria desfăşurării jocului până ı̂n acel moment. Dacă toate
mulţimile de informaţie ale tuturor jucătorilor constau dintr-un singur nod,
jocul este un joc (dinamic) cu informaţie perfectă. Jocul de şah este un
joc cu informaţie perfectă. De obicei, mulţimile de informaţie cu un singur
nod de decizie nu se marchează distinct ı̂n reprezentarea arbore a jocului.
Dacă o mulţime de informaţie a unui jucător conţine mai mult decât un
nod de decizie, aceasta ı̂nseamnă că ı̂n momentul ı̂n care jucătorul trebuie
să ia o decizie, el ştie doar că se poate afla ı̂n oricare din nodurile mulţimii
sale de informaţie; ı̂n acest caz, alegerea strategiei sale se face ı̂n condiţii
de informaţie imperfectă. Un joc ı̂n care cel puţin un jucător are cel puţin
o mulţime de informaţie ce conţine cel puţin două noduri de decizie este
un joc (dinamic) cu informaţie imperfectă. Jocul de bridge este un joc cu
informaţie imperfectă. Arborele unui joc ı̂n formă extensivă este un arbore
etichetat care satisface următoarele reguli:
29
1. Orice nod este un succesor al nodului iniţial (rădăcină).
2. Orice nod cu excepţia nodului iniţial are exact un predecesor imediat.
Nodul iniţial nu are predecesori.
3. Ramuri (arce) multiple ce corespund unui acelaşi nod au etichete (de
acţiuni) diferite.
4. Fiecare mulţime de informaţie conţine noduri de decizie ale unui singur
jucător.
5. Toate nodurile ı̂ntr-o anumită mulţime de informaţie trebuie să aibă
acelaşi număr de succesori imediaţi şi aceeaşi mulţime de etichete pen-
tru ramurile corespunzătoare.
În paragraful următor, trei variante ale unei situaţii de piaţă sunt modelate
ca jocuri necooperative folosind forma extensivă a unui joc. În forma exten-
sivă din Figura 2.14 (a), fiecare jucător are o singură mulţime de informaţie
conţinând un singur nod. În forma extensivă din Figura 2.14 (b), mulţimea
de informaţie a jucătorului 1 conţine două noduri de decizie şi mulţimea de
informaţie a jucătorului 2 conţine un singur nod de decizie. În forma ex-
tensivă din Figura 2.18 (a), jucătorul 1 are o singură mulţime de informaţie
constând dintr-un singur nod de decizie, iar jucătorul 2 are trei mulţimi de
informaţie cu câte un singur nod de decizie. Paragraful următor conţine
de asemenea un joc de tip ”ultimatum” descris verbal ı̂n Exemplul 2.18 şi
modelat ca un joc ı̂n formă extensivă ı̂n Figura 2.16 (a).
30
În modelarea unei situaţii ca un joc ı̂n formă extensivă, se presupune de
obicei ”perfect recall”, adică capacitatea perfectă a fiecărui jucător de a-şi
aminti mutările sale anterioare. Jocurile din exemplele precedente sunt jocuri
cu ”perfect recall”.Teoria jocurilor studiază de asemenea jocuri cu ”imperfect
recall”. Un asemenea joc este ilustrat ı̂n Figura 2.9. Jocurile cu imperfect
recall au aplicaţii in informatică.
(a)
(b)
31
Dat un joc ı̂n formă extensivă, un nod x al arborelui se spune că iniţiază
un subjoc dacă nici x şi nici unul dintre succesorii lui x nu sunt ı̂ntr-o mulţime
de informaţie care conţine şi noduri care nu sunt succesori ai lui x. Un subjoc
este un arbore definit de x şi succesorii săi. Într-un joc cu informaţie perfectă
orice nod iniţiază un subjoc. În Figura 2.10 evidenţiem toate subjocurile unui
joc cu informaţie perfectă şi ale unui joc cu informaţie imperfectă.
Există numeroase situaţii practice ı̂n care şansa joacă un rol. Spre exem-
plu, ı̂n fotbal şansa decide care echipă ı̂ncepe jocul. Şansa poate interveni
la ı̂nceperea jocului sau/şi la anumite momente ı̂n cursul desfăşurării jocu-
lui. În astfel de situaţii, şansa este considerată ea ı̂nsăşi ca un jucător, caz
ı̂n care spunem că avem un joc cu mutări ale şansei. În forma extensivă a
unui asemenea joc, nodurile aparţinând şansei sunt etichetate corespunzător
(de obicei cu C (”chance”) sau cu 0) iar arcele ce ies din asemenea noduri
indică mutările şansei prin distribuţii de probabilitate ale evenimentelor posi-
bile. Figura 2.11 conţine două forme extensive ale unor jocuri cu mutări ale
şansei: Figura 2.11 (a) conţine forma extensivă a unui joc cu informaţie per-
fectă, iar Figura 2.11 (b) conţine forma extensivă a unui joc cu informaţie
imperfectă.
Conceptul de soluţie specific jocurilor ı̂n formă extensivă este acela de
echilibru Nash perfect pe subjoc. Un echilibru Nash perfect pe subjoc este
un profil strategic secvenţial raţional, ı̂n sensul că ı̂ncorporează raţionalitatea
secvenţială a jucătorilor prin evaluarea individuală a subjocurilor. Raţiona-
litatea secvenţială implică faptul că o strategie optimală pentru un jucător
ar trebui să maximizeze plata sa condiţionat de oricare din mulţimile sale de
informaţie. Presupunerea obişnuită pentru jocuri ı̂n formă extensivă este că
raţionalitatea secvenţială este ”common knowledge”. Ideea care stă la baza
determinării unui echilibru Nash perfect pe subjoc este că fiecare jucător,
ı̂nainte de a-şi alege o strategie (adică un plan complet de acţiune de-a lungul
arborelui jocului), ı̂ncearcă să anticipeze alegerile de alternative ale celorlalţi
jucători ı̂n urma fiecărei decizii posibile pentru el. Procedând astfel, un
jucător ı̂ncearcă să determine (ghicească) care nod final va fi atins ca urmare
a selectării de către el a oricăreia dintre alternativele disponibile. Apoi,
jucătorul foloseşte această informaţie pentru a lua decizia optimă. Astfel,
fiecare jucător va studia reprezentarea jocului şi va considera ce vor face
ceilalţi jucători (raţionali şi inteligenţi) ı̂n viitor ca răspuns la mutarea sa ı̂ntr-
o mulţime de informaţie particulară. Folosirea acestei abordări pentru jocul
ı̂n formă extensivă din Figura 2.16 (a) conduce la determinarea echilibrului
Nash perfect pe subjoc reprezentat prin săgeţi ı̂n Figura 2.16 (b).
32
(a)
(b)
33
jocul ı̂n forma extensivă din Figura 2.14 (a). În jocul ı̂n formă extensivă din
Figura 2.18 (a) strategiile jucătorului 2 sunt 3-uple ı̂n care prima componentă
corespunde primei mulţimi de informaţie a acestui jucător (rădăcina arbore-
lui), a doua componentă corespunde mulţimii de informaţie a jucătorului 2
situată la stânga pe nivelul 2 al arborelui, iar a treia componentă corespun-
de mulţimii de informaţie a jucătorului 2 situată la dreapta pe nivelul 2 al
arborelui. Prima componentă poate lua valori ı̂n mulţimea {I, R}, a doua
componentă poate lua valori ı̂n mulţimea {L2 , A2 }, iar a treia componentă
poate lua valori ı̂n mulţimea {L3 , A3 }. Jucătorul 2 are, prin urmare, 8 strate-
gii posibile ı̂n jocul din Figura 2.18 (a): (I, L2 , L3 ), (I, L2 , A3 ), (I, A2 , L3 ),
(I, A2 , A3 ), (R, L2 , L3 ), (R, L2 , A3 ), (R, A2 , L3 ) şi (R, A2 , A3 ).
Un profil strategic este un echilibru Nash perfect pe subjoc dacă el specifică
un echilibru Nash ı̂n orice subjoc al jocului original; un asemenea profil strate-
gic este raţional secvenţial. Dacă nu există egalitate de plăţi, adică două sau
mai multe noduri terminale ce conduc la aceeaşi plată pentru vreunul dintre
jucători, atunci inducţia ı̂napoi identifică un singur echilibru Nash perfect
pe subjoc. În cele ce urmează, exemplificăm determinarea echilibrulor Nash
perfecte pe subjoc prin metoda inducţiei ı̂napoi pentru jocurile din Figura
2.10.
Exemplul 2.14. Analizăm jocul din Figura 2.10 (a) folosind metoda inducţiei
ı̂napoi. Ultimele decizii care trebuie făcute sunt acelea ı̂n care jucătorul 2
trebuie să decidă dacă să lupte sau să se acomodeze, după ce a observat de-
cizia luată de jucătorul 1. În subjocul 1, jucătorul 2 va prefera acţiunea L2
care-i asigură plata 2 (fiindcă 2 > 1), iar ı̂n subjocul 2, jucătorul 2 va prefera
acţiunea A3 care-i asigură plata 4 (fiindcă 4 > 3). Acum, analizăm subjocul
3 care ı̂ncepe cu decizia jucătorului 1 (L1 sau A1 ) ı̂n situaţia ı̂n care jucătorul
2 a selectat acţiunea I. Dacă jucătorul 1 ar alege L1 , atunci am văzut că
jucătorul 2 alege L2 , implicând plata 2 pentru jucătorul 1; dacă jucătorul
1 ar alege A1 , am văzut că jucătorul 2 alege A3 , implicând plata 5 pentru
jucătorul 1. Acţiunea optimală pentru jucătorul 1 ı̂n subjocul 3 este aşadar
A1 (fiindcă 5 > 2). Acum analizăm jocul complet pentru a stabili care e
acţiunea optimală a jucătorului 2 la ı̂nceputul jocului. Dacă jucătorul 2 ar
alege R, atunci el ar obţine plata 0; dacă el ar alege I, am văzut din analiza
anterioară a subjocului 3 că jucătorul 1 alege A1 , urmată de acţiunea A3 a
jucătorului 2, implicând plata 4 pentru jucătorul 2 (care este mai mare decât
0). Echilibrul perfect pe subjoc al acestui joc, (A1 , L2 , A3 ), este reprezentat
prin săgeţi ı̂n Figura 2.18 (b).
34
Exemplul 2.15. Analizăm jocul din Figura 2.10 (b) prin metoda inducţiei
ı̂napoi, ı̂ncepând cu subjocul care ı̂ncepe ı̂n situatia ı̂n care jucătorul 1 a ales
anterior acţiunea U . Fiindcă jucătorul 2 nu ştie dacă jucătorul 1 alege A sau
B, el va prefera (pentru mulţimea de informaţie ı̂n care se află) acţiunea X
care-i asigură o plată mai bună (1 > 0) sau cel puţin la fel de bună (4 = 4) ca
strategia Y . Jucătorul 1 va prefera acţiunea A care-i asigură plata 3 (fiindcă
3 > 1). Acum rămâne de analizat jocul complet. Dacă jucătorul 1 ar alege
D, el ar primi plata 2; dacă, ı̂n schimb, el ar alege U , tocmai am văzut că
ulterior el poate alege A, urmat de alegerea X de către jucătorul 2, rezultând
plata 3 pentru jucătorul 1, care e mai mare decât 2. Prin urmare, ı̂n rădăcina
arborelui jocului jucătorul 1 va alege U . Echilibrul Nash perfect pe subjoc
al jocului analizat, (U A, X), este reprezentat prin săgeţi ı̂n Figura 2.12.
35
Simbolul grafic arc de cerc este folosit pentru a reprezenta o mulţime infinită
de strategii pure. Pentru exemplificare folosim forma extensivă a jocului
parteneriatului din Exemplul 2.2, reprezentată ı̂n Figura 2.13.
36
2.3 Forma extensivă şi forma normală
37
corespunzând luptei cu firma 2, spre exemplu printr-o campanie publicitară
costisitoare –, iar firma 2 are două strategii: I – corespunzând deciziei de
a intra pe piaţă – şi R – corespunzând deciziei de renunţare la intenţia de
intrare pe piaţă. În ceea ce priveşte plăţile jucătorilor, ı̂n cazul ı̂n care firma 2
decide să nu intre pe piaţă, ambele firme realizează profitul lor curent. Dacă
firma 2 decide să intre pe piaţă şi firma 1 se acomodează situaţiei, profitul
firmei 2 va creşte, spre exemplu la 2 unităţi valorice, ı̂n timp ce profitul
firmei 1 va scădea, spre exemplu la 2 unităţi valorice. Dacă ı̂nsă firma 2 intră
pe piată şi firma 1 luptă pentru ı̂nlăturarea firmei 2, piaţa de jocuri video
va avea de suferit asigurând ambelor firme profit zero. Modelarea acestei
situaţii ca un joc ı̂n formă extensivă necesită informaţii suplimentare privind
desfăşurarea temporală a jocului şi regulile privind informaţia disponibilă ju-
cătorilor. Presupunem că firma 2 trebuie să decidă ı̂ntâi dacă intră sau nu
pe piaţă şi considerăm următoarele două variante privind informaţia de care
dispune firma 1 atunci când decide tipul său de comportare faţă de firma 2
pe piaţa de jocuri video:
(a) Firma 1 observă intrarea pe piaţă a firmei 2 şi apoi decide comportarea
sa. Această variantă este modelată ca un joc necooperativ cu informaţie
(completă şi) perfectă, al cărui arbore este descris ı̂n Figura 2.14 (a);
(b) Firma 1 trebuie să decidă comportarea sa pe piaţa video (ı̂n caz de
intrare a firmei 2) fără a şti decizia luată de firma 2. Această variantă
este modelată ca un joc necooperativ cu informaţie (completă dar)
imperfectă, al cărui arbore este descris ı̂n Figura 2.14 (b).
Scopul acestui paragraf este să studieze legătura ı̂ntre forma extensivă şi
forma normală a unui joc necooperativ şi ı̂ntre conceptele de soluţie speci-
fice fiecărei forme. Modul ı̂n care forma extensivă a unui joc generează o
formă normală unică este ilustrat cu ajutorul a două situaţii de interacţiune
strategică prezentate ı̂n Exemplul 2.18 şi Exemplul 2.19.
38
(a)
(b)
I R
L 0, 0 5, 1
A 2, 2 5, 1
Exemplul 2.18. (Joc de tip ”ultimatum”) Doi jucători pot primi o sumă de
6 unităţi valorice dacă ei cad de acord asupra modului de ı̂mpărţire (ı̂n unităţi
valorice ı̂ntregi) a acestei sume. În vederea atingerii unui acord, jucătorii
urmează o procedură strictă: unul dintre jucători, jucătorul 1, propune o
schemă de ı̂mpărţire a celor 6 unităţi valorice iar celălalt jucător, jucătorul
2, reacţionează la propunerea făcută acceptând-o sau refuzând-o. Alterna-
tivele rezonabile (şi realizabile) pentru jucătorul 1 sunt schemele de divizare
39
5-1, 4-2 şi 3-3. Dacă jucătorul 2 acceptă propunerea făcută de jucătorul 1,
cele 6 unităţi valorice sunt ı̂mpărţite conform propunerii respective, dar dacă
jucătorul 2 refuză propunerea făcută de jucătorul 1, oferta este anulată (adică
ambii jucători primesc 0 unităţi valorice). Situaţia descrisă poate fi mode-
lată uşor ca un joc ı̂n formă extensivă cu informaţie (completă şi) perfectă,
reprezentat ı̂n Figura 2.16 (a), unde alternativele disponibile jucătorului 2 –
a(cceptă) şi r(espinge) – sunt indexate pentru a face clar la care propunere
a jucătorului 1 se referă. Echilibrul perfect pe subjoc al jocului dinamic
din Figura 2.16 (a) este reprezentat ı̂n Figura 2.16 (b) cu ajutorul săgeţilor.
Este natural (sub presupunerea de raţionalitate perfectă) ca jucătorul 2 să ac-
cepte oricare dintre cele trei propuneri ale jucătorului 1 fiindcă ı̂n caz contrar
acest jucător va primi 0 unităţi valorice ı̂n loc de 1, 2 sau 3 unităţi valorice.
Bazat pe aceasta, jucătorul 1 va alege alternativa cea mai atractivă pentru el
(5-1). În termeni de strategii ale jucătorilor (planuri complete de acţiune ale
fiecărui jucător de-a lungul arborelui jocului), echilibrul perfect pe subjoc
este profilul strategic (5-1,(a1 , a2 , a3 )).
(a)
(b)
40
Formei extensive din Figura 2.16 (a) ı̂i corespunde o formă normală unică
reprezentată ı̂n Figura 2.17 (a) ca un joc bimatriceal ale cărui linii corespund
la strategiile pure ale jucătorului 1, ı̂n ordinea 5-1, 4-2, 3-3, şi ale cărui
coloane corespund la cele 8 strategii ale jucătorului 2, ı̂n ordinea: (a1 , a2 , a3 ),
(a1 , a2 , r3 ), (a1 , r2 , a3 ), (a1 , r2 , r3 ), (r1 , a2 , a3 ), (r1 , a2 , r3 ), (r1 , r2 , a3 ) şi
(r1 , r2 , r3 ). Acest joc ı̂n formă normală are 7 echilibre Nash care sunt marcate
cu ∗ ı̂n Figura 2.17 (b). Dintre aceste echilibre Nash numai echilibrul Nash
(5-1, (a1 , a2 , a3 )), adică (linia 1, coloana 1) a bimatricei, este ”credibil” fiind
unicul echilibru Nash ı̂n strategii nedominate al jocului. Acest echilibru Nash
coincide cu echilibrul perfect pe subjoc din Figura 2.16 (b) pentru jocul ı̂n
formă extensivă care a generat această formă normală.
5, 1 5, 1 5, 1 5, 1 0, 0 0, 0 0, 0 0, 0
4, 2 4, 2 0, 0 0, 0 4, 2 4, 2 0, 0 0, 0
3, 3 0, 0 3, 3 0, 0 3, 3 0, 0 3, 3 0, 0
(a)
5, 1∗ 5, 1∗ 5, 1∗ 5, 1∗ 0, 0 0, 0 0, 0 0, 0
4, 2 4, 2 0, 0 0, 0 4, 2∗ 4, 2∗ 0, 0 0, 0
3, 3 0, 0 3, 3 0, 0 3, 3 0, 0 3, 3∗ 0, 0
(b)
Exemplul 2.19. (Un joc de piaţă extins) Considerăm o versiune mai amplă
a unui joc de piaţă de tipul celui descris ı̂n Exemplul 2.17. Presupunem, ca
şi ı̂n prima versiune a Exemplului 2.17, că ı̂ntâi firma 2 decide dacă intră
pe piaţa de jocuri video (strategia I) sau renunţă (strategia R), după care
firma 1, observând alternativa aleasă de firma 2, decide dacă va lupta cu
firma 2 (spre exemplu printr-o campanie publicitară costisitoare) ı̂n scopul
distrugerii acesteia sau se va acomoda intrării pe piaţă a firmei 2. Firma
2, observând alternativa de comportare adoptată de firma 1 ca răspuns la
intrarea sa pe piaţă, va trebui să decidă modul său de comportare strategică
ı̂n continuare: ori să intre ı̂n luptă cu firma 1 ca să-şi consolideze poziţia pe
piaţă, ori, pur şi simplu, să se acomodeze situaţiei existente.
41
O situaţie de tipul celei descrise ı̂n Exemplul 2.19 este modelată ca un
joc ı̂n formă extensivă ı̂n Figura 2.18 (a). Alternativele L (luptă) şi A (se
acomodează) sunt indexate pentru a face clar jucătorul la care se referă şi,
pentru jucătorul 2, situaţia particulară ı̂n desfăşurarea jocului. Un echilibru
perfect pe subjoc pentru acest joc este reprezentat ı̂n Figura 2.18 (b) cu aju-
torul săgeţilor. El poate fi determinat cu uşurinţă folosind metoda inducţiei
ı̂napoi. Figura 2.10 (a) marchează subjocurile jocului iniţial, folosite ı̂n cadrul
inducţiei ı̂napoi.
(a)
(b)
Formei extensive din Figura 2.18 (a) ı̂i corespunde o formă normală unică
reprezentată ı̂n Figura 2.19 (a) ca un joc bimatriceal. Jucătorul 1 are două
42
strategii pure: L1 – să lupte ı̂mpotriva firmei 2 – şi A1 – să se acomodeze
intrării pe piaţă a firmei 2, corespunzând, ı̂n această ordine, liniilor bimatricii.
Jucătorul 2 are 8 strategii pure, ce corespund coloanelor bimatricei ı̂n or-
dinea: (I, L2 , L3 ), (I, L2 , A3 ), (I, A2 , L3 ), (I, A2 , A3 ), (R, L2 , L3 ), (R, L2 , A3 ),
(R, A2 , L3 ), (R, A2 , A3 ). Acest joc ı̂n formă normală are 3 echilibre Nash
marcate cu ∗ ı̂n Figura 2.19 (b). Dintre acestea numai profilul strategic
(A1 , (I, L2 , A3 )), adică (linia 2, coloana 2) a bimatricei, este un echilibru
Nash ”credibil” fiind unicul echilibru Nash ı̂n strategii nedominate. Acest
echilibru Nash coincide cu echilibrul perfect pe subjoc din Figura 2.18 (b)
pentru jocul ı̂n formă extensivă care a generat această formă normală.
2, 2 2, 2 4, 1 4, 1 9, 0 9, 0 9, 0 9, 0
2, 3 5, 4 2, 3 5, 4 9, 0 9, 0 9, 0 9, 0
(a)
2, 2∗ 2, 2 4, 1 4, 1 9, 0 9, 0 9, 0 9, 0
2, 3 5, 4∗ 2, 3 5, 4∗ 9, 0 9, 0 9, 0 9, 0
(b)
Exemplul 2.20. Considerăm jocul ı̂n formă extensivă din Figura 2.10 (b) şi
Figura 2.12. Forma sa normală şi cea a subjocului său sunt reprezentate ı̂n
Figura 2.20. Echilibrul Nash al subjocului este profilul strategic (A, X). Jocul
complet are trei echilibre Nash: (U A, X), (DA, Y ) şi (DB, Y ). Considerând
restricţia acestor echilibre Nash la subjoc obţinem (A, X), (A, Y ) şi (B, Y ).
Concludem ca numai echilibrul Nash (U A, X) este perfect pe subjoc. Acest
echilibru perfect pe subjoc este de asemenea obţinul folosind forma extensivă
(vezi Figura 2.12).
43
X Y
UA 3, 4 1, 4 X Y
UB 2, 1 2, 0 A 3, 4 1, 4
DA 2, 6 2, 6 B 2, 1 2, 0
DB 2, 6 2, 6
(a) (b)
44
strategie mixtă care atribuie probabilitatea 1 acelei strategii pure şi proba-
bilitatea 0 tuturor celelalte strategii pure ale jucătorului respectiv.
YNotăm
cu Σi mulţimea strategiilor mixte σi ale jucătorului i. Atunci Σ = Σi de-
i∈N
semnează mulţimea (convexă a) tuturor combinaţiilor de strategii mixte ale
jucătorilor. Dacă σ = (σ1 , ..., σn ) ∈ Σ, atunci Ki (σ) este plata aşteptată de
jucătorul i când jucătorii aleg profilul strategic σ. Extensia mixtă a jocului
hN, {Xi }i∈N , {Ki }i∈N i este jocul hN, {Σi }i∈N , {Ki }i∈N i care foloseşte strate-
giile mixte şi plăţile aşteptate ale jucătorilor. Un echilibru Nash ı̂n strategii
mixte, numit şi echilibru Nash mixt, este o combinaţie σ ∗ = (σ1∗ , ..., σn∗ ) de
strategii mixte astfel ı̂ncât strategia σi∗ a fiecărui jucător i maximizează plata
aşteptată de acest jucător dacă strategiile celorlalţi jucători (notate cu σ−i )
sunt menţinute fixe, adică
Existenţa echilibrelor Nash ı̂n strategii mixte pentru jocuri finite a fost
demonstrată de Nash (1950a) folosind teorema de punct fix a lui Brouwer.
Teorema 2.21. (Nash) Orice joc strategic finit are cel puţin un echilibru
Nash ı̂n strategii mixte.
45
Lema 2.22. Valoarea inferioară şi valoarea superioară pentru jocul A satis-
fac relaţiile:
(ii) v̄(A) = infn max eTi Aq, unde ej este vectorul j din baza standard
q∈∆ i∈{1,...,m}
ı̂n IRn .
Teorema 2.23. (Minmax, John von Neumann) Pentru fiecare joc matriceal
v(A) = v̄(A).
Strategiile mixte optimale ale jucătorilor şi valoarea unui joc matriceal pot
fi determinate ı̂ntotdeauna prin rezolvarea unei perechi de programe liniare.
Această metodă generală de rezolvare a jocurilor matriceale nu va fi tratată
ı̂n acest curs. În cele ce urmează prezentăm metode pentru a rezolva jocuri
matriceale mici, adică jocuri de tip 2 × 2, 2 × n şi m × 2, şi jocuri simetrice.
Multe jocuri matriceale obţinute prin modelarea unei situaţii pur competitive
sunt ori de tip 2×2, 2 × n, m × 2, ori pot fi reduse la un astfel de joc pe baza
eliminării iterative a liniilor şi coloanelor dominate. Strategiile dominate
sunt determinate prin relaţia de dominare introdusă ı̂n paragraful 2.1 şi/sau
prin relaţia de dominare stochastică, pe care o introducem aici. Spunem
că o strategie pură a unui jucător este dominată stochastic dacă există o
combinaţie liniară a altor strategii pure ale acelui jucător care o domină.
Rezolvarea jocului iniţial poate fi astfel redusă uneori la rezolvarea unui joc
matriceal de tipul 2 × 2, 2 × n sau m × 2. Strategiile optimale ale jocului
mic, completate cu componente egale cu zero pentru liniile şi/sau coloanele
ignorate (pe baza relaţiei de dominare (stochastică)), sunt strategii optimale
ale jocului iniţial.
46
cu probabilităţi (strict) pozitive. Pentru a le determina formăm matricea
adjunctă A∗ (interschimbând elementele de pe diagonala principală şi luând
opusul celorlalte două elemente). Vectorii JA∗ şi A∗ J T , unde J = (1, 1),
corespund atunci sumării liniilor şi coloanelor, iar strategiile optimale vor
fi proporţionale cu JA∗ şi A∗ J T ; constanta multiplicativă este aleasă astfel
ı̂ncât suma componentelor strategiilor optimale să fie egală cu 1. Valoarea
jocului se determină folosind formula v=(a11 a22 −a21 a12 )/(a11 +a22 −a21 −a12 ).
Rezolvarea jocurilor matriceale de tip 2×n şi m×2. În orice joc de
tipul 2 × n sau m × 2 există ı̂ntotdeauna ori un punct şa (ı̂n strategii pure)
ori o submatrice de tipul 2 × 2 care dă soluţia jocului. O procedură generală
pentru a rezolva un joc matriceal de tip 2 × n constă din următorii patru
paşi:
1. Caută un punct şa.
2. Dacă nu există puncte şa, vezi dacă există coloane dominate (stochas-
tic) şi şterge-le.
3. Din coloanele rămase ia toate combinaţiile de câte două coloane şi
rezolvă toate jocurile de tip 2 × 2 obţinute.
4. Ia jocul care are cea mai mică valoare. Strategiile optimale pentru
acest joc sunt strategii optimale ale jocului iniţial, completând cu 0
probabilităţile coloanelor nefolosite ı̂n acest joc de tip 2 × 2.
Pentru jocuri matriceale de tip m×2 există o procedură similară, constând
din următorii patru paşi:
1. Caută un punct şa.
2. Daca nu există puncte şa , vezi dacă există linii dominate (stochastic)
şi şterge-le.
3. Din liniile rămase ia toate combinaţiile de câte două linii şi rezolvă
toate jocurile de tip 2 × 2 obţinute.
4. Ia jocul care are cea mai mare valoare. Strategiile optimale pentru
acest joc sunt strategii optimale ale jocului iniţial, completând cu 0
probabilităţile liniilor nefolosite de acest joc de tip 2 × 2.
Aşa cum am menţionat deja, este uneori posibil ca jocuri matriceale de
tip m × n, cu m, n ≥ 3, să fie reduse la jocuri de tip 2 × 2, 2 × n sau m × 2,
prin eliminarea iterativă a liniilor şi coloanelor dominate (stochastic). Un
caz special este când matricea jocului iniţial este simetrică şi există simetrie
completă ı̂ntre strategiile de acelaşi tip, ceea ce permite reducerea jocului
47
iniţial astfel ı̂ncât (cel puţin) unul dintre jucători să aibă doar două strategii
pure. Pentru rezolvarea jocurilor de tip 2×2, 2×n şi m×2 sunt de asemenea
disponibile metode grafice.
Rezolvarea jocurilor matriceale simetrice. Un joc matriceal simetric
este descris printr-o matrice pătratică A = (aij )i,j=1,...,n strâmb-simetrică,
adică o matrice ale cărei elemente satisfac egalitatea aij = −aji , pentru
toţi i, j = 1, ..., n. Într-un joc matriceal simetric ambii jucători au aceleaşi
strategii (mixte) optimale şi valoarea jocului este egală cu zero. Rezolvarea
jocurilor simetrice se bazează pe ideea că dacă r este o strategie optimală ı̂n
Xn
jocul A, atunci ri aij ≥ 0 pentru toţi j şi unele inegalităţi sunt egalităţi
i=1
(altfel v > 0). Strategia optimală r este o necunoscută cu r1 +r2 +...+rn = 1.
Vom determina componentele lui r folosind, ı̂mpreună cu ecuaţia precedentă,
n − 1 ecuaţii obţinute alegând n − 1 inegalităţi şi considerându-le ca egalităţi
şi rezolvând sistemul liniar de n ecuaţii cu n necunoscute obţinut. Dacă
ri ≥ 0 pentru toţi i şi inecuaţia a n-a e verificată, am obţinut o strategie
optimală.
Jocurile bimatriceale fără echilibre Nash ı̂n strategii pure (şi de asemenea
cele cu echilibre Nash ı̂n strategii pure) pot fi studiate folosind extensia mixtă
a jocului bimatriceal. Extensia mixtă a unui joc bimatriceal (A, B) de tip
m × n este dată prin (∆m , ∆n , K, L), unde K(p, q) = pT Aq şi L(p, q) =
pT Bq, pentru toţi p ∈ ∆m şi toţi q ∈ ∆n . Teorema 2.21 asigură existenţa
echilibrelor Nash ı̂n strategii mixte pentru orice joc bimatriceal finit (A, B),
adică existenţa echilibrelor Nash pentru extensia mixtă a acestui joc. Notăm
cu N E(A, B) mulţimea echilibrelor Nash pentru extensia mixtă a lui (A, B).
Fie p ∈ ∆m şi q ∈ ∆n . Suportul strategiei mixte p a jucătorului 1 este C(p) :=
{i ∈ {1, ..., m} | pi > 0}. Mulţimea celor mai bune răspunsuri ı̂n strategii
pure ale jucătorului 1 la strategia mixtă q este P B1 (q) := {i ∈ {1, ..., m} |
eTi Aq = max eTr Aq}, iar mulţimea celor mai bune răspunsuri ı̂n strategii
r∈{1,...,m}
mixte ale jucătorului 1 la q este B1 (q) := {p ∈ ∆m | pT Aq = max eTr Aq}.
r∈{1,...,m}
Analog se definesc C(q), P B2 (p) şi B2 (p).
48
Strategiile mixte optimale ale jucătorilor şi plăţile jucătorilor corespunză-
toare acestor strategii pot fi ı̂ntotdeauna determinate folosind legatura dintre
teoria complementarităţii liniare şi jocuri bimatriceale. Acestă metodă ge-
nerală de rezolvare a jocurilor bimatriceale nu va fi prezentată aici. În cele
ce urmează prezentăm o metodă algebrică pentru determinarea echilibrelor
Nash ı̂n strategii mixte ale jocurilor bimatriceale de tip 2×2 şi o metodă
grafică pentru rezolvarea jocurilor de două persoane cu sumă variabilă.
Rezolvarea jocurilor bimatriceale de tip 2×2. Un echilibru Nash pen-
tru un joc bimatriceal (K(i, j)i=1,2; j=1,2 , L(i, j)i=1,2; j=1,2 ) poate fi determinat
folosind următoarea procedură:
1. Se formează jocurile matriceale K(i, j)i=1,2; j=1,2 şi L(i, j)i=1,2; j=1,2 , se-
parând plăţile celor doi jucători.
2. Se determină strategia mixtă optimală p∗ a jucătorului 1 ı̂n jocul ma-
triceal L şi strategia mixtă optimală q ∗ a jucătorului 2 ı̂n jocul K,
folosind metoda prezentată pentru jocuri matriceale de tip 2 × 2. Pe-
rechea (p∗ , q ∗ ) este o strategie mixtă optimală a jocului bimatriceal de
tip 2 × 2.
Această metodă este aplicabilă de asemenea ı̂n jocuri mai largi ce pot fi
reduse la tipul 2 × 2 prin eliminarea iterativă a liniilor şi coloanelor dominate
(stochastic).
Rezolvarea jocurilor de două persoane cu sumă variabilă. Fie G =
hX, Y, K, Li un joc de două persoane cu sumă variabilă. Fie B1 : Y →X,
B2 : X → Y multifuncţiile cel mai bun răspuns pentru jucătorul 1 şi, res-
pectiv, jucătorul 2 ı̂n jocul G. Fie G∗1 := {(x, y) ∈ X × Y | x ∈ B1 (y)}
şi G2 := {(x, y) ∈ X × Y | y ∈ B2 (x)}. Observăm că G2 este graficul
multifuncţiei B2 , iar G∗1 este imaginea graficului G1 ⊂ Y × X a lui B1 sub
aplicaţia Y × X → X × Y cu (y, x) → (x, y) pentru toţi (y, x) ∈ Y × X. De-
terminarea echilibrelor Nash ı̂n strategii mixte ale jocului se poate face prin
reprezentarea grafică, ı̂n acelaşi sistem de coordonate, a (multi)funcţiilor ”cel
mai bun răspuns” ale jucătorilor. Această metodă grafică se bazează pe fap-
tul că (x∗ , y ∗ ) ∈ N E(G) ←→ x∗ ∈ B1 (y ∗ ), y ∗ ∈ B2 (x∗ ) ←→ (x∗ , y ∗ ) ∈ G∗1 ,
(x∗ , y ∗ ) ∈ G2 ←→ (x∗ , y ∗ ) ∈ G∗1 ∩ G2 . Deci, (x∗ , y ∗ ) ∈ N E(G) ←→ (x∗ , y ∗ ) ∈
G∗1 ∩ G2 . Exemplificăm această metodă grafică folosind un joc denumit im-
propriu ”Bătălia sexelor”.
Exemplul 2.25. (Bătălia sexelor) Un cuplu trebuie să decidă dacă vor merge
ı̂mpreună la un meci de box sau la un spectacol de operă. Soţul preferă meciul
49
de box, ı̂n timp ce soţia preferă spectacolul de operă. Modelarea unei situaţii
de acest tip ca un joc necooperativ conduce la forma normală din Figura
2.21 (b). Notăm cu (x, 1 − x) strategia mixtă a jucătorului 1 şi cu (y, 1 − y)
strategia mixtă a jucătorului 2. Funcţiile de plată ale jucătorilor sunt:
K1 (x, y) = 3xy + (1 − x)(1 − y) = (4y − 1)x − y + 1,
K2 (x, y) = xy + 3(1 − x)(1 − y) = (4x − 3)y − 3x + 3.
Graficele corespunzătoare multifuncţiilor cel mai bun răspuns, G∗1 şi G2 , unde
G∗1 = {(x, y) | K1 (x, y) este maxim ı̂n raport cu x pentru y fixat},
G2 = {(x, y) | K2 (x, y) este maxim ı̂n raport cu y pentru x fixat},
sunt reprezentate ı̂n Figura 2.21(a) cu linie plină şi, respectiv, cu linie − − −.
Echilibrele Nash ale jocului, (0,0), (3/4, 1/4) şi (1,1), sunt de asemenea vi-
zualizate ı̂n Figura 2.21(a) ca puncte de intersecţie ale celor două grafice.
Meci Operă
Meci 3, 1 0, 0
Operă 0, 0 1, 3
(b)
Figure 2.21: Jocul ”Bătălia sexelor”
50
2.5 Informaţie şi jocuri necooperative
Teoria jocurilor necooperative ı̂ncearcă să prezică rezultatul ı̂n situaţii de de-
cizie interactivă, adică ı̂n situaţii ı̂n care rezultatul este determinat de către
acţiunile tuturor jucătorilor şi nici-un jucător nu are control complet asupra
situaţiei. Ea foloseşte presupunerea că jucătorii se comportă raţional, adică
urmează scopuri exogene bine-definite şi raţionează strategic, adică iau ı̂n
consideraţie atât cunoaşterea lor cât şi posibilităţile de comportare raţională
ale celorlalţi jucători. Informaţia disponibilă jucătorilor ı̂ntr-un joc necoope-
rativ face o mare diferenţă privind ceea ce jucătorii pot să facă sau ar trebui
să facă. În paragrafele precedente am studiat jocuri necooperative ı̂n formă
strategică (normală) şi ı̂n formă extensivă ı̂n care plăţile corespunzătoare ju-
cătorilor sunt deterministe şi ”common knowledge”. Forma extensivă a unui
joc are un caracter dinamic ı̂ntrucât ilustrează desfăşurarea secvenţială ı̂n
timp a jocului. Forma normală (strategică) analizează o situaţie conflictuală
folosind o descriere concisă, considerând o singură jucare a jocului şi pre-
supunând că jucătorii ı̂şi aleg alternativa strategică simultan şi independent.
Jocurile ı̂n formă normală studiate ı̂n paragrafele 2.1 şi 2.4 sunt de aceea
numite jocuri statice sau jocuri de tip ”one-shot”, ı̂n comparatie cu jocurile
ı̂n formă extensivă, care sunt numite jocuri dinamice. Jucarea repetată a
unui joc static (”one-shot”) de un număr finit sau infinit de ori are ı̂nsă un
caracter dinamic şi face obiectul de studiu al teoriei jocurilor prin modele
specifice. Mai departe, am văzut că ı̂ntr-un joc ı̂n formă extensivă jucătorii
pot avea informaţie perfectă şi/sau imperfectă. Un jucător are informaţie
perfectă când el ştie exact tot ce s-a ı̂ntâmplat până atunci, de fiecare dată
când o decizie trebuie făcută. Un joc are informaţie perfectă dacă fiecare
jucător ı̂n acel joc are informaţie perfectă. Dacă există jucători care nu au
informaţie perfectă, atunci jocul este un joc cu informaţie imperfectă.
O situaţie ı̂n care un jucător ştie ceva ce un alt jucător nu ştie, se numeşte
asimetrie de informaţie. Asimetriile de informaţie se ı̂ntâlnesc frecvent ı̂n
situaţiile practice. Informaţia imperfectă şi asimetriile informaţionale au
implicaţii pentru comportarea strategică a jucătorilor şi plăţile aşteptate
de jucători. Din punctul de vedere al caracterului simetric sau asimetric
al informaţiei de care dispun jucătorii, teoria necooperativă a jocurilor dis-
tinge ı̂ntre două tipuri de modele: jocuri cu informaţie completă şi jocuri cu
informaţie incompletă. Jocurile cu informaţie completă nu afişează asimetrii
informaţionale, cu excepţia posibilă a informaţiei asimetrice privind acţiunile
jucătorilor. Informaţia privată privind elemente intangibile ı̂n situaţii strate-
51
gice poate fi modelată prin ı̂ncorporarea unor evenimente aleatoare (numite
adeseori mutări ale naturii) ı̂n specificarea unui joc cu informaţie incom-
pletă. Expresia informaţie incompletă se referă la jocuri care au mutări ale
şansei (naturii) care generează informaţie asimetrică pentru jucători. Mo-
delele studiate ı̂n paragrafele 2.1-2.4 sunt jocuri cu informaţie completă.
Am studiat aşadar următoarele tipuri de jocuri necooperative: jocuri statice
cu informaţie completă; jocuri dinamice cu informaţie completă şi perfectă;
jocuri dinamice cu informaţie completă dar imperfectă. În toate aceste mo-
dele de jocuri necooperative se presupune că jucătorii au capacităţi ideale
de raţionare şi comportare strategică şi că plăţile posibil de obţinut de către
jucători sunt deterministe şi common knowledge, fiind ori indicate explicit ı̂n
descrierea jocului, ori plăţile aşteptate de jucători (când şansa joacă un rol)
care pot fi calculate de toţi jucătorii pe baza descrierii jocului. Selectarea
deciziilor optimale de către jucători se bazează pe principiul că a câştiga mai
mulţi bani (sau a pierde mai puţini bani) este ı̂ntotdeauna mai bine. În cazul
unui joc de tip cost , selectarea strategiei optimale se bazează pe principiul
că a plăti un cost mai mic e mai bine decât a plăti un cost mai mare.
Reamintim că jocurile statice cu informaţie completă sunt modele de
forma hN, {Xi }i∈N , {Ki }i∈N i . Predicţii privind comportarea optimală a ju-
cătorilor se pot obţine folosind noţiunea de echilibru Nash ı̂n strategii pure
(echilibru Nash pur) sau ı̂n strategii mixte (echilibru Nash mixt). Tehnici
folositoare pentru rezolvarea jocurilor statice cu informaţie completă sunt:
eliminarea iterativă a strategiilor (strict) dominate (stochastic), utilizarea
funcţiilor celui mai bun răspuns (ı̂n strategii pure sau mixte), teoria pro-
gramării liniare şi cea a complementarităţii liniare, metode pentru tipuri
particulare de jocuri (de tip 2×2, 2×n, m×2 şi simetrice).
Modelul de joc static cu informaţie incompletă, numit joc strategic de
tip Bayes (”static Bayesian game”), este o extensie a modelului de joc static
cu informaţie completă. Un joc static Bayesian este un model de forma
hN, {Ai }i∈N , {Ti }i∈N , {pi }i∈N , {ui }i∈N i, ı̂n care N este mulţimea jucătorilor
şi pentru fiecare i ∈ N :
• Ai este mulţimea acţiunilor posibile ale jucătorului i.
• Ti este mulţimea tipurilor posibile pentru jucătorul i.
• pi este distribuţia de probabilitate existentă pe multimea Ti a tipurilor
jucătorului i.
• ui este funcţia de utilitate a jucătorului i (analoagă funcţiei de plată
Ki ).
52
Conceptul de soluţie specific este acela de echilibru Nash de tip Bayes
(”Bayesian Nash equilibrium”), o extensie a noţiunii de echilibru Nash.
Reamintim că jocurile dinamice cu informaţie completă (şi perfectă sau
imperfectă) sunt modele de forma hN, T i, unde T este arborele jocului.
Recunoaştem dacă un joc ı̂n formă extensivă este cu informaţie perfectă
sau imperfectă privind la mulţimile de informaţie ale jucătorilor (delimitate
grafic prin − − −). Întrucât arborele jocului ı̂n formă extensivă conţine
toată informaţia necesară pentru determinarea strategiilor tuturor jucăto-
rilor, modelul de joc dinamic cu informaţie completă poate fi considerat
ca o extensie a modelului de joc static cu informaţie completă, de forma
hN, T, {Xi }i∈N i, unde Xi este mulţimea strategiilor jucătorului i (planuri
complete de acţiune ale jucătorului i de-a lungul arborelui T al jocului).
Predicţii privind comportarea optimală a jucătorilor pot fi obţinute folosind
conceptul de echilibru Nash perfect pe subjoc, care selectează dintre echili-
brele Nash ale jocului (ı̂n formă normală) corespunzător doar pe cele care
sunt ”credibile”. Am văzut că echilibrele Nash perfecte pe subjoc pot fi de-
terminate folosind metoda inducţiei ı̂napoi pe baza formei extensive a jocului
sau pe baza formelor normale ale jocului iniţial şi ale tuturor subjocurilor
sale.
Modelul de joc dinamic (ı̂n formă extensivă) cu informaţie incompletă
este o extensie a modelului de joc ı̂n formă extensivă cu informaţie com-
pletă care se bazează pe considerarea mulţimilor de informaţie ale jucătorilor
ı̂ncorporând elemente de tip ”belief” (”information set(s) with players’ be-
lief”). Figura 2.22 ilustrează deosebirea dintre forma extensivă a unui joc
cu informaţie completă (Figura 2.22(a)) şi a unuia cu informaţie incompletă
(Figura 2.22(b)) ce modelează o aceeaşi situaţie strategică, descrisă ı̂n Exem-
plul 2.26, pentru două ipostaze diferite.
Exemplul 2.26. (Jocul investiţiei) Doi prieteni trebuie să decidă dacă să
investească sau nu efort ı̂n repararea unui motociclete stricate ce aparţine
unuia dintre ei, dat fiind că după aceea ar putea-o folosi ı̂n comun. Unul
poate repara partea mecanică a motocicletei, iar celălalt partea ei electrică.
Presupunem că motocicleta e proprietatea jucătorului 1. Astfel, pe lângă
acţiunile posibile I (investeşte) şi N (nu investeşte), valabile ambilor jucători,
jucătorul 1 are posibilitatea să decidă dacă, după repararea motocicletei, o va
folosi singur sau ı̂n comun. Strategiile corespunzând acestor decizii le notăm
cu E (pentru cazul când jucătorul 1 e egoist) şi A (pentru cazul când el e
altruist).
53
Evident, ambii jucători ştiu că jucătorul 1 poate fi egoist sau altruist.
Plăţi posibile pentru acest joc cu informaţie completă sunt date ı̂n Figura
2.22 (a).
(a)
(b)
54
Situaţia analizată poate fi descrisă mai precis luând ı̂n consideraţie faptul
că majoritatea indivizilor sunt, ı̂n mod obişnuit, ı̂nclinaţi să pună intere-
sele individuale mai presus de cele colective (induse de cooperare) şi care
e tipul fiecărui individ particular depinde de fapt de natură, fiecare individ
cunoscându-şi propriul tip. Ca urmare, o modelare mai realistă a situaţiei ca
un joc se face considerând natura ca un jucător cu două strategii: O (pentru
tip obişnuit) cu probabilitate mai mare, spre exemplu 3/4, şi C (pentru tip
cooperant) cu probabilitate mai mică, spre exemplu 1/4. Jocul obţinut este
unul cu informaţie incompletă, fiindcă natura generează informaţie asimetri-
că pentru jucători. Jocul dinamic cu informaţie incompletă corespunzător
jocului dinamic cu informaţie completă din Figura 2.22 (a) este reprezentat
ı̂n Figura 2.22 (b).
UnDjoc ı̂n formă extensivă
E cu informaţie incompletă este un tiplet de
forma N, T , {Xi }i∈N , unde N este mulţimea jucătorilor, Te este ansamblul
e
mulţimilor de informaţie (continând informaţia de tip ”belief”) ale jucători-
lor, şi pentru fiecare i ∈ N, Xi este mulţimea strategiilor jucătorului i.
Conceptul de soluţie specific jocurilor dinamice cu informaţie incompletă
este acela de echilibru perfect de tip Bayes (”perfect Bayesian equilibrium”).
Acesta este o extensie a conceptului de perfect echilibru pe subjoc. Un
echilibru perfect de tip Bayes poate fi de asemenea considerat ca o extensie
a noţiunii de echilibru Nash de tip Bayes.
Adesea, participanţii ı̂ntr-o situaţie de interacţiune strategică trebuie să
facă decizii ı̂n condiţii de incertitudine. Ei pot fi:
• Incerţi cu privire la parametrii obiectiv ai mediului (”environment”) ı̂n
care acţionează.
55
cunoaşte jocul, fiecare jucător ştie că fiecare jucător cunoaşte jocul, ş.a.m.d.
Optimalitatea comportării jucătorilor se bazează pe cunoaşterea pe care o
au jucătorii. Nu numai cunoaşterea de către un jucător a unui parametru
exogen, ci şi cunoaşterea sa despre cunoaşterea celorlalţi jucători joacă un
rol. În modelele de joc studiate se presupune că posibilităţile de raţionare ale
jucătorilor sunt nelimitate, ceea ce asigură ı̂nvăţarea instantanee a jocului
şi selectarea ı̂n timp real a strategiei optimale. În cele mai multe situaţii
practice o asemenea presupunere nu este realistă. Jocurile cu raţionalitate
limitată (”bounded rationality”) fac de asemenea obiectul de studiu al teoriei
jocurilor.
56
3 JOCURI COOPERATIVE
Acest capitol este dedicat modelelor din teoria cooperativă a jocurilor. For-
mele de reprezentare a jocurilor folosite ı̂n aceste modele sunt forma strate-
gică şi forma coaliţională, iar noţiunea de coaliţie (grup de jucători) joacă
un rol central. Un joc ı̂n formă strategică sau ı̂n formă coaliţională este
cooperativ dacă jucătorii pot face acorduri ferme (”binding agreements”)
privind alegerea strategiilor sau distribuţia plăţilor, chiar dacă aceste acor-
duri nu sunt specificate de regulile jocului sau implicate de acestea. Un
acord (sau contract) este ferm dacă nerespectarea lui conduce la penalizări
monetare, fapt care ı̂i ı̂mpiedică pe jucători să nu-l respecte. În paragra-
ful 3.1 introducem jocuri cooperative ı̂n formă strategică şi arătăm că orice
joc necooperativ ı̂n formă normală (strategică) poate fi jucat ”cooperativ”
dacă acordurile ferme ı̂ntre jucători sunt permise. Într-un joc cooperativ ı̂n
formă strategică jucătorii ı̂şi corelează strategiile pure sau folosesc strategii
corelate. Paragrafele 3.2 - 3.5 sunt dedicate jocurilor cooperative ı̂n formă
coaliţională cu plăţi laterale, numite şi jocuri ı̂n forma funcţiei caracteris-
tice. Acest model teoretic de joc cooperativ a fost introdus de către John
von Neumann şi Oskar Morgenstern (1944) pornind de la forma strategică a
jocurilor cu utilităţi transferabile (adică utilităţi care sunt liniare ı̂n bani).
Valoarea fiecărei coaliţii S ⊆ N , unde N ={1, 2, ..., n} este mulţimea finită
şi nevidă a jucătorilor, ı̂ntr-un joc strategic cu utilităţi transferabile este va-
loarea sa maximă ı̂n jocul de două persoane cu sumă nulă unde adversarul
lui S este N \ S (ansamblul jucătorilor care nu sunt membri ai coaliţiei S) şi
strategii corelate sunt folosite de ambii jucători, S şi N \ S. În paragrafele
3.2-3.5 considerăm funcţia caracteristică (coaliţională) a unui joc cooperativ
ca o noţiune primară, ı̂ntrucât ı̂n multe situaţii de interacţiune strategică
unde cooperarea ı̂ntre jucători este posibilă şi benefică (adică conduce la
sporirea câştigurilor sau diminuarea costurilor) funcţia caracteristică poate
fi construită direct, din descrierea neformală a situaţiei, fără nici o referire la
un joc strategic. Paragraful 3.2 introduce noţiuni de bază ı̂n teoria jocurilor
57
cooperative ı̂n forma funcţiei caracteristice, incluzând noţiunea de sâmbure
(Gillies, 1953), care joacă ı̂n cadrul acestei teorii un rol similar cu cel al
noţiunii de echilibru Nash ı̂n teoria jocurilor necooperative. Paragrafele 3.3-
3.5 sunt dedicate conceptelor de soluţie de tip ”single-valued” cu rol predo-
minant ı̂n teoria jocurilor cooperative, şi anume: valoarea Shapley (Shapley,
1953), σ-valoarea şi τ -valoarea (Tijs, 1981), nucleolul (Schmeidler, 1969) şi
AL-valoarea (Tijs, 2005). În paragraful 3.6 analizăm rolul comunicării ı̂ntre
jucători şi al informaţiei disponibile jucătorilor ı̂n cadrul teoriei jocurilor
cooperative ı̂n forma funcţiei caracteristice. Sunt menţionate unele clase
de jocuri cooperative cu restricţii de comunicare ı̂ntre jucători şi jocuri cu
asimetrii informaţionale. Încheiem capitolul cu o privire globală asupra mo-
delelor teoriei jocurilor cooperative ı̂n formă coaliţională.
58
2.4 (b), care asigură jucătorilor plăţi egale cu câte 5 ani de ı̂nchisoare. Totuşi,
ambii jucători ar putea obţine ”plăţi” mai bune, anume câte un singur an de
ı̂nchisoare, dacă ar alege (de comun acord) profilul strategic (linia 2, coloana
2) din Figura 2.4 (b), prin corelarea strategiilor lor pure. Considerăm acum
jocul de tip ”ultimatum” din Exemplul 2.18. În jucarea necooperativă a aces-
tui joc, jucătorul 2 este de fapt forţat să accepte oricare dintre propunerile
jucătorului 1 fiindcă altfel nu primeşte nimic. Jucarea cooperativă a aces-
tui joc va conduce, prin acordul jucătorilor asupra diviziunii celor 6 unităţi
valorice, la schema de divizare 3-3, care este echitabilă (”fair”) pentru ambii
jucători.
În jucarea cooperativă a unui joc (de tip câştig) ı̂n formă strategică se
caută o soluţie optimală, adică un profil strategic care asigură o plată to-
tală maximă, şi o distribuţie echitabilă pentru toţi jucătorii a acestei plăţi
maxime. O asemenea distribuţie ar trebui să ia ı̂n consideraţie poziţiile de
negociere ale jucătorilor (care sunt diferite de abilităţile lor de negociere)
şi/sau posibilitatea efectuării de plăţi laterale ı̂ntre jucători. Într-un joc bi-
matriceal (A, B) (de tip câştig), o soluţie optimală şi o distribuţie echitabilă
a plăţii totale maxime ar putea fi calculate de către un arbitru imparţial şi
onest, urmând următoarea procedură:
59
1, şi jocul (A2 , B2 ) cu ν2 =1 şi P2 =5 care corespunde unui profil strategic care
dă jucătorului 1 plata 1 şi jucătorului 2 plata 4. Observăm că pentru jocul
(A1 , B1 ) distribuţia (4,1) corespunzătoare profilului strategic optimal este
rezonabilă pentru ambii jucători fiindcă ea ı̂ncorporează avantajul relativ
al jucătorului 1 faţă de jucătorul 2. În cazul jocului (A2 , B2 ), jucătorul
2 trebuie să facă o plată laterală de 2 unităţi valorice către jucătorul 1,
pentru a respecta avantajul relativ al jucătorului 1 faţă de el. Astfel, jucarea
cooperativă a jocului bimatriceal (A2 , B2 ) conduce ı̂n final la plata 3 pentru
jucătorul 1 şi plata 2 pentru jucătorul 2.
Evident, procedura descrisă mai sus poate fi aplicată de asemenea unui joc
bimatriceal de tip cost cu modificarea pasului 2 al procedurii, unde, ı̂n acest
caz, elementul minim al matricii A + B va fi selectat. Pentru jocul ”Dilema
prizonierilor”, ν=0, P =2 şi distribuţia plăţilor pentru profilul strategic care
asigură plata totală 2 este (1,1). Această distribuţie e echitabilă pentru ambii
jucători. Evident, ı̂n jocul ”Dilema prizonierilor” jucătorii nu pot face plăţi
laterale.
În cele ce urmează, introducem noţiunea de joc cooperativ ı̂n formă strate-
gică şi ataşăm fiecărui joc necooperativ ı̂n formă normală (strategică) jocul
cooperativ ı̂n formă strategică corespunzător.
60
permise şi orice strategie corelată σS pentru S 6= ∅ cu |S|=2 este sprijinită
printr-un acord ferm ı̂ntre membrii lui S. Pentru fiecare i ∈ N , considerăm
funcţia de plată ui : Σ(N ) −→ IR, definită prin
X
ui (σN )= σN (x)Ki (x) pentru toţi σN ∈ Σ(N ) şi toţi i ∈ N.
x∈XN
61
lei pe unitate. Cooperarea micilor ı̂ntreprinzători poate genera câştiguri, dar
ei vor intra ı̂n această afacere numai dacă vor cădea de acord asupra modu-
lui de distribuire a câştigului total. Teoria cooperativă a jocurilor poate fi
folositoare. Situaţia descrisă poate fi modelată ca un joc a cărui funcţie ca-
racteristică este v(∅) = v({1}) = v({2}) = 0, v({3}) = 200, v({1, 2}) = 50,
v({1, 3}) = v({2, 3}) = 250, v({1, 2, 3}) = 300. Un concept de soluţie din teo-
ria cooperativă a jocurilor poate fi apoi folosit pentru a propune o distribuţie
a celor 300 unităţi valorice ı̂ntre cei trei ı̂ntreprinzători (vezi Exemplul 3.19).
Un joc cooperativ de tip cost este o pereche hN, ci, unde N este mulţimea
finită şi nevidă a jucătorilor şi c : 2N −→ IR este funcţia coaliţională (carac-
teristică) cu c(∅)=0, unde pentru fiecare coaliţie S ∈ 2N \{∅}, c(S) reprezintă
costul pe care S trebuie să-l plătească dacă membrii ei cooperează. Exem-
plul 3.3 modelează ca un joc cooperativ de tip cost o situaţie privind insta-
larea unor sisteme de alarmă ı̂n apartamente. Orice joc cooperativ de tip
cost generează un joc cooperativ de tip câştig, unde pentru fiecare coaliţie
S ∈ 2N \{∅}, câştigul v(S) obţinut prin cooperare reprezintă economiile rea-
lizate de S prin reducerea costurilor ca urmare a cooperării membrilor săi şi
v(∅)=0, adică :
X
(3.1) v(S) := c({i}) − c(S), pentru toţi S ∈ 2N .
i∈S
Exemplul 3.3. Trei familii care locuiesc ı̂n acelaşi bloc de locuinţe vor să-şi
instaleze sisteme de alarmă cu aceeaşi firmă. Firma le face o ofertă cu cos-
turi pentru contracte individuale, costuri pentru contracte pentru câte două
familii şi costul pentru un contract colectiv. Cele trei familii trebuie să decidă
dacă cooperează sau nu ı̂n vederea reducerii costurilor şi, ı̂n situaţia ı̂n care
decid să coopereze, trebuie să cadă de acord asupra ı̂mpărţirii costului total.
Teoria cooperativă a jocurilor poate fi utilă pentru rezolvarea acestei proble-
me prin modelarea situaţiei ca un joc cooperativ de tip cost şi folosirea unui
concept de soluţie considerat rezonabil de către toate cele trei familii. Pentru
situaţia descrisă, N ={1, 2, 3}, iar oferta firmei generează funcţia coaliţiona-
lă c, cu c({1})=100, c({2})=90, c({3})=80, c({1, 2})=130, c({1, 3})=110,
c({2, 3})=110 şi c({1, 2, 3})=140. Evident, c(∅)=0. Economiile realizate de
cele trei familii prin cooperarea lor sunt descrise prin jocul de tip câştig cores-
punzător (obţinut folosind formula (3.1)): v(∅)=v({1})=v({2})=v({3})=0,
v({1, 2})=60, v({1, 3})=70, v({2, 3})=60 şi v({1, 2, 3})=130.
62
Într-un joc cooperativ de tip câştig jucătorii urmăresc maximizarea câş-
tigurilor, iar ı̂ntr-un joc de tip cost ei urmăresc minimizarea costurilor (sau,
echivalent, maximizarea economiilor ı̂n jocul de tip câştig asociat jocului de
tip cost). În cele de urmează, prin hN, vi vom subı̂nţelege un joc de tip câştig
şi prin hN, ci vom subı̂nţelege un joc de tip cost.
O reprezentare geometrică a jocurilor cooperative ı̂n forma funcţiei carac-
teristice identifică un joc hN, vi sau hN, ci cu |N |=n, cu un vector (punct)
n
ı̂n IR2 −1 , ale cărui componente sunt valorile funcţiei caracteristice pentru
o ordine fixată a celor 2n − 1 coaliţii nevide de jucători. În mod normal,
un joc este identificat cu funcţia sa caracteristică (coaliţională). Mulţimea
GN a funcţiilor coaliţionale v cu mulţimea jucătorilor N formează, ı̂n raport
cu adunarea şi ı̂nmulţirea cu un scalar a funcţiilor coaliţionale, un spaţiu
liniar (2n − 1)–dimensional. O bază interesantă a acestui spaţiu liniar este
mulţimea jocurilor unanime uT , T ∈ 2N \ {∅}, care sunt definite prin
(
1 dacă T ⊆S,
(3.2) uT (S)=
0 altfel.
Interpretarea unui joc unanim uT este că un câştig (sau o economie la costuri)
de o unitate valorică poate fi obţinut dacă şi numai dacă toţi jucătorii din
coaliţia T sunt implicaţi ı̂n cooperare. Orice joc v ∈ GN poate fi exprimat
ca o combinaţie liniară de jocuri unanime de forma
X X
(3.3) v= cT uT , cu cT = (−1)|T |−|S| v(S).
T ∈2N \{∅} S:S⊆T
Exemplul 3.4. Jocul v din Exemplul 3.3 se poate scrie sub forma
v = 60u{1,2} + 70u{1,3} + 60u2,3 − 60u{1,2,3} .
63
prin jocul simplu v definit pentru fiecare S ∈ 2N \ {∅} prin v(S)=1 dacă
|S| ≥ 51 şi v(S)=0, altfel. Al doilea de tip de votare e folosit ı̂n Consiliul
Naţiunilor Unite care e format din 15 membri dintre care 5 membri, etichetaţi
aici cu 1, 2, 3, 4, 5, au putere veto şi unde pentru a vota o lege sunt necesare
cel puţin 9 voturi pro incluzând voturile pro ale tuturor membrilor cu putere
veto. Această situaţie poate fi modelată prin jocul simplu v definit pentru
fiecare S ∈ 2N \ {∅} prin v(S)=1 dacă |S| ≥ 9 şi {1, 2, 3, 4, 5}⊆S şi v(S)=0,
altfel.
64
v(N )−v(N \{i}). Un joc v ∈ GN se numeşte un joc big boss cu n ca big
boss (Muto et al., 1988) dacă: (i) v este un joc veto unde coaliţia {n} are
putere veto; (ii) v este un joc monoton; (iii) v are proprietatea uniunii, adică
X
v(N ) − v(S) ≥ Mi (N, v) pentru fiecare S cu n ∈ S.
i∈N \S
Jocurile convexe şi jocurile big boss sunt cazuri speciale de jocuri balansate.
Definiţia jocurilor balansate se bazează pe noţiunea de aplicaţie balansată
N
(echilibrată). O aplicaţie
X λ : 2 \{∅} −→ IR+ se numeşte aplicaţie balansată
(echilibrată) dacă λ(S)eS =eN , unde eS este vectorul caracteristic al
S∈2N \{∅}
lui S, cu (e )i =1 dacă i ∈ S şi (eS )i =0 altfel. Un joc v ∈ GN se numeşte
S
65
strategică. Fiecare joc v ∈ GN este strategic N
X echivalent cu un joc w ∈ G care
este 0-normalizat, unde w(S)=v(S) − v({i}) pentru orice S ∈ 2N . Într-o
i∈S
clasă de echivalenţă se consideră adesea jocul (0,1)-normalizat corespunzător
acelei clase. Fiecare joc N -esenţial v ∈ GN este strategic echivalent cu un
joc w ∈ GN X care este (0,1)-normalizat. Se poate X verifica uşor că pentru
k=1/(v(N )− v({i})) şi ai =−v({i})/(v(N )− v({i})), pentru toţi i ∈ N,
i∈N i∈N
jocul w definit prin w(S)=k · v(S) + a(S) pentru toţi S ∈ 2N \ {∅}, este (0,1)-
normalizat.
Spunem că f : GN −→ IRn satisface proprietatea de invarianţă cu privire
la echivalenţa strategică (S-echivalenţă) dacă pentru toţi v, w ∈ GN , toate
jocurile aditive a ∈ GN şi toţi k > 0, avem
66
Mulţimea imputaţiilor unui joc v ∈ GN este
( )
X
I(v) = x ∈ IRn | xi = v(N ) şi xi ≥ v({i}) pentru toţi i ∈ N .
i∈N
Teorema 3.6. Mulţimea I(v) este nevidă dacă şi numai dacă jocul v este
N-esenţial.
Mulţimea I(v) este un simplex cu punctele extremef 1 (v), ..., f n (v), unde
pentru fiecare i ∈ N, f i (v)=(f1i , ..., fji , ..., fni ) cu
v({i})
dacă i 6= j
i X
fj = v(N ) − v({k}) dacă i=j.
k∈N \{i}
i=1
geometric, CIS(v) este baricentrul lui I(v).
Conceptul de soluţie dominant ı̂n teoria cooperativă a jocurilor este sâm-
burele (Gillies, 1953).
67
Sâmburele unui joc se determină prin rezolvarea unui sistem de inecuaţii
liniare. Sâmburele unui joc poate fi mulţimea vidă, poate consta dintr-un
singur element (spre exemplu, jocul cost din Exemplul 3.3 are sâmburele
C(c)={(30, 30, 80)}) sau poate conţine o infinitate de elemente. Sâmburele
unui joc cooperativ de n persoane este o mulţime poliedrală ı̂n IRn .
(i) C(v) 6= ∅.
68
privire la permutarea σ. Pentru v ∈ GN şi σ ∈ Π(N ) vectorul contribuţiilor
marginale mσ (v) are coordonate de forma mσi (v) := v(P σ (i) ∪ {i}) − v(P σ (i))
pentru orice i ∈ N. Valoarea Shapley Φ(v) a unui joc v ∈ GN este media
aritmetică a vectorilor contribuţiilor marginale ai jocului, adică
X
(3.4) Φ(v) := 1/n! mσ (v).
σ∈Π(N )
aceasta este numită soluţia standard a unui joc cooperativ de două persoane.
Valoarea Shapley a unui joc aditiv v este Φ(v)=(v({1}), ..., v({n})). Pen-
tru jocul unanim pe T, uT , valoarea Shapley este Φ(uT ) = 1/|T | eT .
Valoarea Shapley satisface următoarele proprietăţi care o fac un con-
cept de soluţie interesant pentru teoria cooperativă a jocurilor: eficienţa, S-
echivalenţa, proprietatea jucătorului fictiv, anonimitatea, aditivitatea, sime-
tria (tratament egal al jucătorilor simetrici).
Valoarea Shapley este singura soluţie care satisface proprietăţile : eficienţă,
anonimitate, proprietatea jucătorului fictiv şi aditivitate (caracterizare axio-
matică).
Spunem că f : GN −→ IRn satisface proprietatea:
X
• eficienţă dacă fi (v) = v(N ) pentru fiecare v ∈ GN .
i∈N
• anonimitate dacă f (v σ ) = σ ∗ (f (v)) pentru orice σ ∈ Π(N ), unde σ ∗ :
IRn −→ IRn este definită prin (σ ∗ (x))σ(k) := xk pentru toţi x ∈ IRn şi
k ∈ N, iar v σ este jocul cu v σ (σ(U )) := v(U ) pentru toţi U ∈ 2N .
• proprietatea jucătorului fictiv dacă fi (v) = v({i}) pentru toţi v ∈ GN
şi pentru toţi jucătorii fictivi i, i.e. jucători i ∈ N astfel că v(S ∪ {i}) =
v(S) + v({i}) pentru toţi S ∈ 2N \{i} .
• aditivitate dacă f (v + w) = f (v) + f (w) pentru toţi v, w ∈ GN .
69
• simetrie (tratament egal al jucătorilor simetrici) dacă fi (v) = fj (v)
pentru toţi i, j ∈ N astfel ı̂ncât v(S ∪ {i}) = v(S ∪ {j}) pentru toţi
S ∈ 2N \{i,j} .
• raţionalitate individuală dacă fi (v) ≥ v({i}) pentru toţi v ∈ GN şi
i ∈ N.
Valoarea Shapley nu satisface ı̂n general proprietatea de raţionalitate indi-
viduală. Există multe jocuri cooperative pentru care valoarea Shapley nu
este un element al sâmburelui.
Exemplul 3.10. În jocul v({1})=v({2})=v({3})=0, v({1, 2})=10, v({1, 3})
= 8, v({2, 3}) = 6, v({1, 2, 3}) = 12, Φ(v)=(5, 4, 3) ∈/ C(v) deoarece inegali-
tatea x1 + x2 ≥ v({1, 2}) nu este satisfăcută (5 + 4 < 10).
Pentru jocuri convexe valoarea Shapley este un element al sâmburelui
jocului şi ocupă o poziţie centrală ı̂n cadrul acestuia: ea coincide cu ”bari-
centrul” sâmburelui. Folosind proprietăţile caracteristice ale valorii Shapley
ı̂mpreună cu formula (3.3) şi expresia valorii Shapley a unui joc unanim,
obţinem o altă formulare a valorii Shapley, care are mare aplicabilitate prac-
tică
X cT X
(3.5) Φ(v) = eT pentru toţi v ∈ GN cu v = c T uT .
N
|T | N
T ∈2 \{∅} T ∈2 \{∅}
70
• x >L y dacă există r ∈ {1, .., n} astfel ca xk = yk pentru k < r şi
xr > y r ;
• x ≥L y dacă x = y sau x >L y.
Spre exemplu, x = (8, 5, 11, 0) >L (8, 5, 10, 100) = y.
Ordinea lexicografică este o relaţie de ordine liniară pe IRn . Pentru o
mulţime compactă C ⊆ IRn există un maxim lexicografic unic x̂ ∈ C (cu
proprietatea x̂ ≥L x pentru toţi x ∈ C), notat cu L(C). Dacă C este un
politop, atunci L(C) este un punct extrem al lui C care poate fi determinat
rezolvând o problemă de optimizare.
Fie v ∈ GN un joc balansat şi σ = (σ(1), ..., σ(n)) ∈ Π(N ). Maximul lexi-
cografic al sâmburelui C(v) al lui v ı̂n raport cu σ, notat cu Lσ (v), este unicul
element al lui C(v) cu proprietăţile: (Lσ (v))σ(1) = max{xσ(1) | x ∈ C(v)},
(Lσ (v))σ(2) = max{xσ(2) | x ∈ C(v) cu xσ(1) = (Lσ (v))σ(1) }, ..., (Lσ (v))σ(n) =
max{xσ(n) | x ∈ C(v) cu (xσ(1) , xσ(2) , ..., xσ(n−1) )=((Lσ (v))σ(1) , (Lσ (v))σ(2) , ...,
(Lσ (v))σ(n−1) )}. Observăm că Lσ (v) este un punct extrem al lui C(v) pentru
fiecare σ ∈ Π(N ). AL-valoarea AL(v) a lui v este media aritmetică a tuturor
Lσ (v), adică media lexicografică a jocului (”average lexicographic value”).
Pentru orice joc balansat v ∈ GN , AL-valoarea AL(v) a jocului v este
X
(3.6) AL(v) = 1/n! Lσ (v).
σ∈Π(N )
71
3.4 σ-valoarea şi τ -valoarea
Ambele valori au fost introduse de Tijs (1981) pentru a furniza un vector pla-
tă eficient care este un cel mai bun compromis ı̂ntre doi vectori plată cores-
punzând la situaţii extreme: situaţia ”ideală” (de fapt ”utopică”) şi situaţia
”catastrofală”(cea mai rea posibilă). Pentru ambele valori, σ-valoarea şi τ -va-
loarea, vectorul ideal al plăţilor este vectorul contribuţiilor marginale ale ju-
cătorilor la marea coaliţie, adică vectorul M (N, v) = (M1 (N, v), ..., Mn (N, v)).
Cel mai nefavorabil vector plată pentru σ-valoarea jocului este vectorul i(v) al
valorilor individuale ale jucătorilor, adică i(v) = (v{1}), v({2}), ..., v({n})).
Pentru τ -valoarea jocului cel mai nefavorabil vector de plată este aşa-numitul
vector al dreptului minim, ce va definit ı̂n cele ce urmează pe baza vectoru-
lui contribuţiilor marginale ale jucătorilor la marea coaliţie. Pentru fiecare
S ∈ 2N \{∅} şi pentru fiecare i ∈ N, restul R(S, i) disponibil pentru jucătorul
i dacă coaliţia S se formează şi toţi ceilalţi jucători j ∈ S primesc plata ideală,
Mj (N, v), este X
R(S, i) := v(S) − Mj (N, v).
j∈S\{i}
Cel mai nefavorabil vector plată pentru τ -valoarea jocului este aşadar vec-
torul m(v) ale cărui coordonate sunt mi (v) pentru toţi i ∈ N.
Un joc v ∈ GN se numeşte semibalansat dacă
• i(v) ≤ M (N, v) şi
X X
• v({i}) ≤ v(N ) ≤ Mi (N, v).
i∈N i∈N
72
Exemplul 3.13. Considerăm o situaţie cu un vânzător al unui tablou şi
doi cumpărători potenţiali, unul oferind 100 e şi celălalt 200 e. Modelăm
această situaţie ca un joc de trei persoane, unde jucătorul 1 este vânzătorul,
jucătorul 2 este cumpătorul care oferă 100 e şi jucătorul 3 este cumpărătorul
care oferă 200 e. Funcţia caracteristică a jocului este v({1}) = 0, v({1, 2}) =
100, v({1, 3}) = 200, v({1, 2, 3}) = 200, v(S) = 0 ı̂n rest. Verificăm dacă
jocul este semibalansat şi, dacă este, calculăm σ-valoarea jocului folosind
formula (3.7). Vectorul cel mai nefavorabil este i(v) = (0, 0, 0), iar vec-
torul ideal este M (N, v) = (200, 0, 100). Jocul este semibalansat deoarece
(0, 0, 0) ≤ (200, 0, 100) şi 0 ≤ 200 ≤ 300. Prin formula (3.7) obţinem σ(v) =
α(0, 0, 0) + (1 − α)(200, 0, 100), unde α este determinat din condiţia σ1 (v) +
σ2 (v) + σ3 (v) = 200. Obţinem α = 1/3, deci σ(v) = (400/3, 0, 200/3).
Din punct de vedere geometric, σ-valoarea σ(v) a unui joc semibalansat
v este unicul punctX
de intersecţie al segmentului [i(v), M (v)] cu hiperplanul
n
E(v) = {x ∈ IR | xi = v(N )} al vectorilor de plată eficienţi pentru v.
i∈N
Un joc v ∈ GN se numeşte quasi-balansat dacă
• m(v) ≤ M (N, v) şi
X X
• mi (v) ≤ v(N ) ≤ Mi (N, v).
i∈N i∈N
Pentru orice joc convex v, τ (v) = σ(v). Din punct de vedere geometric,
τ -valoarea τ (v) a unui joc quasi-balansat v este unicul punct de intersecţie al
segmentului [m(v), M (v)] cu hiperplanul E(v) al vectorilor de plată eficienţi
pentru v.
73
Proprietăţi satisfăcute de τ -valoare sunt: eficienţa, raţionalitatea indivi-
duală, S-echivalenţa, proprietatea jucătorului fictiv, anonimitatea, proprie-
tatea dreptului minim, proprietatea de proporţionalitate restrictivă.
O aplicaţie f : QN −→ IRn are
unde, pentru fiecare i ∈ N, Mi (N, c) = c(N )−c(N \{i}), mi (c) = min (c(S)−
X S:S3i
Mj (N, c)); vectorul m(c) este vectorul contribuţiilor maximale.
j∈S\{i}
Pentru
à un joc big boss cu n ca big boss τ -valoarea jocului este
!
n−1
X
1 1 1 1
τ (v) = M1 (N, v), M2 (N, v), ..., Mn−1 (N, v), v(N ) − Mi (N, v) şi
2 2 2 2 i=1
τ (v) = AL(v).
Pentru un joc big boss convex, τ (v) = Φ(v).
Pentru un joc quasi-balansat c, τ -valoarea τ (c) este definită prin
74
3.5 Nucleolul
Nucleolul a fost introdus de Schmeidler (1969) pe baza ideii de tratare echi-
tabilă a coaliţiilor ı̂n distribuirea valorii marii coaliţii ı̂ntre jucători. Pentru
fiecare joc v ∈ GN cu I(v) 6= ∅, orice vector x = (x1 , x2 , ..., xn ) ∈ I(v)
reprezintă un mod posibil de distribuire a lui v(N ) dar acceptul de cooperare
ı̂n cadrul marii coaliţii depinde de acordul tuturor coaliţiilor asupra unei
anumite distribuţii x ∈ I(v), pe baza posibilităţilor v(S) ale coaliţiilor S ∈
2N \{∅, N }. Evaluarea unei distribuţii x de către o coaliţie S ∈ 2N \{∅, N }
ı̂n jocul v se face ı̂n mod natural calculând diferenţa ı̂ntre ceea ce coaliţia
S poate obţine pe cont propriu, adică v(S), şi ceea ce coaliţia S ar primi
conform X cu distribuţia x dacă ea ar coopera ı̂n cadrul marii coaliţii, adică
x(S) = xi . Diferenţa v(S) − x(S) a fost numită de Schmeidler excesul
i∈S
coaliţiei S cu privire la imputaţia x ı̂n jocul v, notat cu e(S, x; v). Pentru
fiecare joc cooperativ v ∈ GN , fiecare x ∈ I(v) şi orice S ∈ 2N \{∅, N },
excesul coaliţiei S cu privire la x ı̂n jocul v este
(3.9) e(S, x; v) := v(S) − x(S).
Considerăm situaţia când o anumită distribuţie x este propusă jucătorilor.
Fiecare coaliţie S ∈ 2N \{∅, N } va evalua e(S, x; v). Evident, dacă e(S, x; v)>0,
coaliţia S are o nemulţumire directă faţă de x şi poate să refuze cooperarea
ı̂n marea coaliţie. Dacă e(S, x; v) ≤ 0, coaliţia S va compara excesul său
cu cel al celorlalte coaliţii, pentru a decide dacă acceptă imputaţia x sau
o refuză. Notăm vectorul exceselor, pentru o ordine fixată a coaliţiilor, cu
e(x; v) ≤ (e(S, x; v))S∈2N \{∅,N } şi notăm cu θ(x; v) vectorul obţinut din e(x; v)
prin rearanjarea componentelor sale e(S, x; v) ı̂n ordine descrescătoare.
75
au de ales o imputaţie din două imputaţii propuse, x şi y, ei vor prefera
acea imputaţie care minimizează nemulţumirea maximă a coaliţiilor. Această
selecţie se poate obţine prin compararea lexicografică a vectorilor θ(x; v) şi
θ(y; v).
Faptul că nucleolul unui joc este ı̂n sâmburele jocului ori de câte ori
sâmburele jocului este nevid, este adesea folositor pentru calcularea nucleolu-
lui: dacă sâmburele unui joc v constă dintr-un singur element, atunci η(v) =
C(v); dacă sâmburele jocului este nevid şi elementele sale sunt funcţii de un
parametru, atunci componentele imputaţiei selectate de nucleol sunt aceleaşi
76
funcţii liniare de acel parametru şi valoarea parametrului corespunzătoare
nucleolului poate fi determinată printr-o metodă grafică ce va fi descrisă mai
jos şi ilustrată ı̂n Exemplul 3.19. Determinarea nucleolului unui joc se poate
face ı̂n general prin rezolvarea unei succesiuni de programe liniare; această
metodă generală nu va fi prezentată ı̂n acest curs. Relaţia dintre nucleolul
unui joc şi sâmburele jocului, când sâmburele este nevid, este de asemenea
utilă pentru a răspunde (negativ) la ı̂ntrebarea dacă o anumită imputaţie
este sau nu cea selectată de nucleol.
Două proprietăţi ale nucleolului pot juca un rol ı̂n calcularea nucleolului
sau ı̂n furnizarea răspunsului (negativ sau pozitiv) la problema dacă o anu-
mită imputaţie este sau nu cea selectată de nucleol: proprietatea jucătorului
fictiv şi proprietatea jucătorilor simetrici (vezi Exemplul 3.19).
Ori de câte ori componentele unui vector de plată candidat pentru a fi
imputaţia selectată de nucleol sunt funcţii liniare de un parametru, deter-
minarea nucleolului poate fi făcută printr-o metodă grafică simplă:
• Se determină intervalul pentru valorile parametrului din condiţia ca
vectorul de plată respectiv să fie o imputaţie.
• Se calculează excesele tuturor coaliţiilor nevide, cu excepţia marii coaliţii;
acestea sunt funcţii liniare de parametrul respectiv.
• Se reprezintă grafic aceste funcţii (excesele tuturor coaliţiilor) pentru
valorile parametrului ı̂n intervalul determinat specific problemei.
• Se trasează graficul maximului acestor funcţii şi se determină valoarea
parametrului pentru care această funcţie ı̂şi atinge minimul.
Exemplul 3.19. Considerăm jocul v din Exemplul 3.2. Observăm că
jucătorii 1 şi 2 sunt simetrici, ceea ce implică η1 (v) = η2 (v). Evident, η3 (v) =
v(N ) − η1 (v) − η2 (v). Nucleolul jocului este de forma (x, x, 300 − 2x), cu
0 ≤ x ≤ 50, ı̂ntrucât acest vector trebuie să fie o imputaţie. Calculăm exce-
sele tuturor coaliţiilor cu privire la imputaţia (x, x, 300 − 2x). Reprezentăm
funcţiile de x obţinute ı̂n sistemul de coordonate xOy, pentru x ∈ [0, 50].
Trasăm conturul funcţiei care este maximul funcţiilor exceselor şi vedem
care este valoarea lui x pentru care această funcţie are valoarea minimă.
Pentru jocul nostru, obţinem x = 100/3. Nucleolul jocului este, prin urmare,
η(v) = (100/3, 100/3, 700/3).
Criteriul lui Kohlberg este un instrument cu valabilitate generală util
pentru a răspunde la ı̂ntrebarea dacă o anumită imputaţie este sau nu nu-
cleolul unui joc N -esenţial. Considerăm mulţimea exceselor coaliţiilor S ∈
77
2N \{∅, N, {1}, ..., {n}} cu privire la imputaţia x ı̂n ordine descrescătoare:
ε1 , ε2 , ..., εk(x) .
78
a jucătorilor. Adeseori comunicarea ı̂ntre participanţi are loc prin reţele, sis-
teme de relaţii bilaterale descentralizate. Reţelele pot fi integrate ı̂n jocuri
coaliţionale pentru a forma aşa-numitele ”network-restricted games” (Slikker
şi van den Nouweland, 2001).
Informaţia disponibilă jucătorilor ı̂n situaţii de interacţiune decizională
bazată pe interese de grup joacă, de asemenea, un rol important ı̂n teo-
ria jocurilor cooperative. În teoria clasică a jocurilor cooperative ı̂n forma
funcţiei caracteristice jucătorii au informaţie simetrică şi plăţile coaliţiilor
sunt cunoscute cu certitudine de către toţi jucătorii. Totuşi, există multe
situaţii practice cu asimetrii informaţionale şi, ı̂n unele situaţii, informaţia
pe care o deţin unii jucători reprezintă o resursă cu rol important ı̂n evaluarea
posibilităţilor economice ale coaliţiilor. Pentru a modela astfel de situaţii au
fost introduse clase speciale de jocuri cooperative ı̂n forma funcţiei caracter-
istice, cum sunt: ”information market games” (Muto, Potters şi Tijs, 1989),
”information collecting games” (Brânzei, Tijs şi Timmer, 2001; Tijs, Timmer
şi Brânzei, 2006), ”information sharing games” (Slikker, Norde şi Tijs, 2003).
Pentru a modela situaţii de interacţiune decizională ı̂n care plăţile coaliţiilor
sunt incerte, au fost introduse noi modele teoretice de jocuri cooperative ı̂n
forma funcţiei caracteristice, cum sunt: ”games in stochastic characteristic
function form” (Charnes şi Granot, 1973; Granot, 1977), ”stochastic coope-
rative games” (Suijs, 1999; Suijs şi Borm, 1999), ”cooperative games with
random payoffs” (Timmer, Borm şi Tijs, 2000). Există un interes actual
crescând ı̂n teoria jocurilor cooperative cu informaţie incompletă motivat
atât din punct de vedere teoretic cât şi al aplicaţiilor practice (Ichiishi şi
Yamazaki, 2006).
Toate modelele de jocuri cooperative ı̂n forma funcţiei caracteristice stu-
diate ı̂n paragrafele 3.2 - 3.5 şi discutate mai sus, se bazează pe noţiunea
clasică de coaliţie, aceea de grup de jucători, unde fiecare jucător poate fi
sau nu membru al uneia sau mai multor coaliţii. Situaţii cu posibilităţi de
cooperare mai relaxată au condus la introducerea unor noţiuni mai sofisti-
cate de coaliţie, cum sunt cea de coaliţie multi-choice şi coaliţie fuzzy, şi
modele corespunzătoare de jocuri cooperative ı̂n forma funcţiei caracteristice:
”multi-choice games” (Hsiao şi Raghavan, 1993a, 1993b; van den Nouweland
et al., 1995; Calvo şi Santos, 2000) şi ”fuzzy games” (Aubin,1974, 1981).
Într-un joc de tip multi-choice fiecare jucător are un număr finit de nivele
de activitate privind cooperarea cu ceilalţi jucători şi plata fiecărei coaliţii
multi-choice depinde de nivelele de activitate ale (tuturor) jucătorilor ı̂n
cadrul acelei coaliţii. Jocurile cooperative clasice ar putea fi considerate ca
79
un caz special al jocurilor multi-choice, unde fiecare jucător are exact două
nivele de activitate, corespunzând la participare (completă) ı̂ntr-o coaliţie sau
neparticipare. Într-un joc fuzzy fiecare jucător are posibilitatea să coopereze
la (infinit de) multe nivele, variind de la necooperare la cooperare totală şi
plata fiecărei coaliţii fuzzy depinde de nivelele de participare ale (tuturor)
jucătorilor ı̂n cadrul acelei coaliţii. Modele de jocuri cooperative ı̂n forma
funcţiei caracteristice bazate pe noţiunea clasică de coaliţie (crisp), coaliţie
multi-choice şi coaliţie fuzzy, sunt prezentate ı̂n monografia având ca autori
pe Brânzei, Dimitrov şi Tijs (2005).
Toate modelele de jocuri cooperative ı̂n forma funcţiei coaliţionale discu-
tate până acum fac parte din teoria jocurilor cu utilităţi transferabile. Ele
se mai numesc TU-games (Transferable Utility games). Calificativul ”cu
utilităţi transferabile” este menit să facă clar faptul că ı̂n astfel de jocuri
sunt permise plăţi laterale ı̂ntre jucători ı̂n sensul că valoarea (plata, uti-
litatea) marii coaliţii poate fi distribuită ı̂ntre jucători ı̂n (infinit de) multe
moduri, iar transformări ale valorilor (plăţilor, utilităţilor) coaliţiilor datorate
schimbării unităţii monetare sau acordării de bonus sau amendă unor jucători
nu afectează ı̂n mod esenţial modelul de joc. Teoria jocurilor cooperative ı̂n
formă coaliţională include, pe lângă jocurile de tip TU, jocuri de tip NTU,
adică jocuri cu utilitate netransferabilă (NTU-games). Un joc de tip NTU
este o pereche hN, V i, unde N este mulţimea finită şi nevidă a jucătorilor şi
V este o aplicaţie care asociază fiecărei coaliţii S ∈ 2N \ {∅} o submulţime
V (S)⊆IRS , cu proprietăţi specifice pe care nu le definim aici, ce poate fi in-
terpretată astfel: dacă coaliţia S se formează, atunci pot fi obţinuţi vectorii
x ∈ V (S), care dau fiecărui jucător i ∈ N plata (utilitatea) xi . Jocurile
cooperative cu utilităţi netransferabile au fost introduse de Aumann şi Peleg
(1960). Ele sunt potrivite pentru analiza multor fenomene economice com-
petitive şi cooperative. Un joc de tip NTU poate fi construit pornind de la
un joc cooperativ ı̂n formă strategică sau direct, pe baza descrierii narative
a situaţiei de interacţiune decizională analizată.
Jocurile de negociere pentru două persoane (”bargaining games”) pot fi
considerate un caz particular al jocurilor de tip NTU. Un joc de negociere
de două persoane este o pereche hF, di, unde F ⊆IR2 şi d = (d1 , d2 ) ∈ IR2 .
Elementele lui F , perechi de plăţi (utilităţi), se numesc rezultate admisibile,
pe care jucătorii le pot obţine prin cooperare (acord bilateral). În cazul ı̂n
care cooperarea ı̂ntre jucători nu are loc, jucătorii obţin perechea de plăţi
(d1 , d2 ), motiv pentru care d se numeşte rezultatul dezacordului. Modelul de
joc de negociere a fost introdus de Nash (1950b).
80
ANEXA A
Demonstraţii privind Capitolul 2
unde egalităţile au loc ı̂ntrucât (x1 , y1 ) şi (x2 , y2 ) sunt echilibre Nash ale
jocului.
Schimbând rolurile lui (x1 , y1 ) şi (x2 , y2 ) obţinem, ı̂n mod similar,
Din (A.1) şi (A.2) rezultă că K(x1 , y1 ) = K(x2 , y2 ) şi toate inegalităţile
ı̂n (A.1) şi (A.2) sunt de fapt egalităţi. Aceasta implică
Prin urmare, (x2 , y1 ) este un echilibru Nash şi K(x2 , y1 ) = K(x1 , y1 ). În mod
similar, rezultă că (x1 , y2 ) este un echilibru Nash cu K(x1 , y2 ) = K(x1 , y1 ).
(i) urmează din definiţia unei funcţii potenţial exact pentru jocul G.
(ii) urmează din (i) pe baza observaţiei că x∗ este un echilibru Nash pentru
GP dacă ( )
Yn
P (x∗ ) = max P (x) | x ∈ Xi .
i=1
81
Teorema de punct fix a lui Brouwer. Fie C o mulţime nevidă convexă
şi compactă a lui IRk şi fie f : C −→ C o funcţie continuă. Atunci există un
x∗ ∈ C cu f (x∗ ) = x∗ .
Demonstraţia Teoremei 2.21. (Nash) Pentru i ∈ N şi xi ∈ Xi considerăm
Uixi (σ) = max(0, Ki (xi , σ−i )−Ki (σ)) şi f : Σ −→ Σ definită (pe componente)
prin
X x0
fixi (σ) = (σixi + Uixi (σ))/ 1 + Ui i (σ) ,
x0i ∈Xi
Evident,
inf pT Aq ≤ min pT Aej . (A.3)
q∈∆n j∈{1,...,n}
82
Demonstraţia Teoremei 2.23. (Tijs) Întâi observăm că
implică
sup inf K(x, z) ≤ sup K(x, y) pentru toţi y ∈ Y,
x∈X z∈Y x∈X
şi atunci
sup inf K(x, z) ≤ inf sup K(x, y),
x∈X z∈Y y∈Y x∈X
sau
v(X, Y, K, −K) ≤ v̄(X, Y, K, −K), i.e., v(A) ≤ v̄(A).
Demonstrăm că v(A) = v̄(A) prin inducţie matematică după mărimea s(A)
a lui A, unde s(A) := m + n. Evident, s(A) ≥ 0. Definim funcţia ”gap” a lui
A prin g(A) := v̄(A) − v(A). Am arătat anterior că g(A) ≥ 0. Arătăm acum
că g(A) = 0, prin inducţie după mărimea lui A.
1. În (A.6) şi (A.7) avem numai egalităţi. Atunci (p∗ )T Aq ∗ = v(A) =
v̄(A), deci g(A) = 0.
2. Există un k ∈ {1, ..., n} astfel ı̂ncât (p∗ )T Aek > v(A), ceea ce
implică n > 1.
3. Există un ` ∈ {1, ..., m} astfel ı̂ncât eT` Aq ∗ < v̄(A), ceea ce implică
m > 1.
83
Fie A−k matricea care se obţine din A prin eliminarea coloanei k. Din
presupunerea inductivă, g(A−k ) = 0. Este uşor de arătat că
¡ ¢
v(A−k ) ≥ v(A) şi v̄(A−k ) ≥ v̄(A) .
În cele ce urmează, vom arăta, prin metoda reducerii la absurd, că
v(A−k ) = v(A).
Presupunem că v(A−k ) > v(A). Acesta ı̂nseamnă că există p̄ ∈ ∆m care
este maximin pentru A−k , deci p̄Aej > v(A) pentru toţi j ∈ {1, ..., n}\{k}.
Pentru orice ε ∈ (0, 1) avem atunci
Dar atunci
v(A) ≥ min (εp̄ + (1 − ε)p∗ )T Aej > v(A),
j∈{1,...,n}
84
ANEXA B
Demonstraţii privind Capitolul 3
85
şi b = (v({1}), ..., v({n}), v(N ), −v(N )), unde pentru fiecare i ∈ N, ei
este al i-lea vector al bazei standard ı̂n IRn şi 1n este vectorul ı̂n IRn cu
toate coodonatele egale cu 1.
Teorema B.2. (teorema dualităţii ı̂n programarea liniară) Fie A o matrice
n × p, b ∈ IRp şi c ∈ IRn . Atunci
min{xT c | xT A ≥ bT } = max{bT y | Ay = c, y ≥ 0}
dacă {x ∈ IRn | xT A ≥ bT } 6= ∅ şi {y ∈ IRp | Ay = c, y ≥ 0} 6= ∅.
Demonstraţia Teoremei 3.8. Întâi observăm că C(v) 6= ∅ dacă şi numai
dacă ( )
X X
v(N ) = min xi | xi ≥ v(S) pentru toţi S ∈ 2N \{∅} . (B.1)
i∈N i∈S
86
BIBLIOGRAFIE
1. Aubin, J.P. (1974). Coeur et valeur des jeux flous à paiements latéraux.
Comptes-Rendus de l’Académie des Sciences Paris 279 A, 891-894.
8. Brânzei, R., T. Solymosi and S. Tijs (2005). Strongly essential coalitions and
the nucleolus of peer group games. International Journal of Game Theory
33, 447-460.
10. Calvo, E. and J.C. Santos (2000). A value for multichoice games. Mathe-
matical Social Sciences 40, 341-354.
87
11. Charnes, A. and D. Granot (1973). Prior solutions: extensions of convex
nucleolus solutions to chance-constrained games. Proceedings of the Com-
puter Science and Statistics Seventh Symposium at Iowa State University,
323-332.
12. Gardner, R. (1995). Games for Business and Economics. John Wiley &
Sons.
13. Gibbons, R. (1992). A primer in Game Theory. Harvester/Wheatsheaf.
14. Gillies, D.B. (1953). Some Theorems on n-person Games. Ph. D. Disserta-
tion, Princeton University Press.
15. Granot, D. (1977) Cooperative games in stochastic function form. Manage-
ment Science 23, 621-630.
16. Harsanyi, J.C. (1967/68). Games with incomplete information played by
’Bayesian’ players, Part I, II, and III. Management Science 14, 159-182,
320-334, and 486-502.
17. Hsiao, C.-R. and TES Raghavan (1993a). Monotonicity and dummy free
property for multi-choice cooperative games. International Journal of Game
Theory 21, 301-312.
18. Hsiao, C.-R. and TES Raghavan (1993b). Shapley value for multi-choice
cooperative games (I). Games and Economic Behavior 5, 240-256.
19. Kohlberg, E. (1971). On the nucleolus of a characteristic function game.
SIAM Journal on Applied Mathematics 20, 62-66.
20. Ichiishi, T. and A. Yamazaki (2006). Cooperative Extensions of the Bayesian
Game. Series on Mathematical Economics and Game Theory, Vol. 3.
21. Monderer, D. and L. Shapley (1996). Potential games. Games and Economic
Behavior 14, 124-143.
22. Morris, P. (1994). Introduction to Game Theory. Springer-Verlag.
23. Muto, S., M. Nakayama, J. Potters and S. Tijs (1988). On big boss games.
Economic Studies Quarterly 39, 303-321.
24. Muto, S., J. Potters and S. Tijs (1989). Information market games. Inter-
national Journal of Game Theory 18, 209-226.
25. Myerson, R. (1977). Graphs and cooperation in games. Mathematics of
Operations Research 2, 225-229.
88
26. Myerson, R. (1980). Conference structures and fair allocation rules. Inter-
national Journal of Game Theory 9, 169-182.
29. Nash, J.F. (1951). Non-cooperative games. Annals of Mathematics 54, 286-
295.
30. van den Nouweland, A., S. Tijs, J. Potters and J. Zarzuelo (1995). Cores and
related solution concepts for multi-choice games. Mathematical Methods of
Operations Research 41, 289-311.
32. von Neumann, J. and O. Morgenstern (1944). Theory of Games and Eco-
nomic Behavior. Princeton University Press.
35. Owen, G. (1999). Discrete Mathematics and Game Theory. Theory and
Decision Library: Series C, Kluwer Academic Publishers.
89
41. Shapley, L.(1953). A value for n-person games. In: Tucker, A. and H. Kuhn
(Eds.), Contributions to the Theory of Games II, pp. 307-317.
43. Slikker, M., H. Norde and S. Tijs (2003). Information sharing games. Inter-
national Game Theory Review 5, 1-12.
44. Slikker, M. and A. van den Nouweland (2001). Social and Economic Net-
works in Cooperative Game Theory. Theory and Decision Library: Series
C, Kluwer Academic Publishers.
47. Tijs, S.H. (1981). Bounds for the core of a game and the τ -value. In:
Moeschlin, O. and D. Pallaschke (Eds.), Game Theory and Mathematical
Economics, Amsterdam: North Holland, pp.123-132.
50. Tijs, S. (2005). The first steps with Alexia, the lexicographic order. CentER
DP 2005-123, Tilburg University, Tilburg, The Netherlands.
52. Timmer, J., P. Borm and S. Tijs (2000). Convexity in stochastic cooperative
situations. International Game Theory Review 7, 25-42.
90