Sunteți pe pagina 1din 90

TEORIA JOCURILOR

Rodica Brânzei
Contents
PREFAŢĂ 5

LISTA FIGURILOR 8

1 INTRODUCERE 9
1.1 Forme de reprezentare a jocurilor . . . . . . . . . . . . . . . . 10
1.2 Modelarea situaţiilor decizionale interactive ca jocuri . . . . . 13

2 JOCURI NECOOPERATIVE 15
2.1 Jocuri ı̂n formă normală şi echilibre Nash . . . . . . . . . . . . 16
2.2 Jocuri ı̂n formă extensivă şi echilibre Nash perfecte pe subjoc 29
2.3 Forma extensivă şi forma normală . . . . . . . . . . . . . . . . 37
2.4 Extensia mixtă şi echilibre Nash ı̂n strategii mixte . . . . . . . 44
2.5 Informaţie şi jocuri necooperative . . . . . . . . . . . . . . . . 51

3 JOCURI COOPERATIVE 57
3.1 Jocuri cooperative ı̂n forma strategică . . . . . . . . . . . . . . 58
3.2 Jocuri cooperative ı̂n forma funcţiei caracteristice şi sâmburele 61
3.3 Valoarea Shapley şi AL-valoarea . . . . . . . . . . . . . . . . . 68
3.4 σ-valoarea şi τ -valoarea . . . . . . . . . . . . . . . . . . . . . . 72
3.5 Nucleolul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.6 Comunicare şi informaţie ı̂n jocuri cooperative . . . . . . . . . 78

ANEXA A. Demonstraţii privind Capitolul 2 81

ANEXA B. Demonstraţii privind Capitolul 3 85

BIBLIOGRAFIE 87

3
PREFAŢĂ

Teoria jocurilor este o teorie matematică care se ocupă cu modelarea şi ana-
liza situaţiilor decizionale interactive care implică conflict de interese indi-
viduale sau de grup. Primele lucrări dedicate teoriei jocurilor sunt cele ale
lui Borel (1921) şi von Neumann (1928), dar bazele teoriei matematice a
jocurilor au fost puse prin monografia având ca autori pe von Neumann şi
Morgenstern (1944). După o perioadă mai puţin fructuoasă, teoria jocurilor
a cunoscut şi cunoaşte o perioadă de ı̂nflorire şi recunoaştere pe plan mon-
dial. Există un mare număr de cercetători şi cadre didactice ı̂n domeniul
teoriei jocurilor, iar numărul studenţilor ı̂n programe de masterat şi doc-
torat dedicate teoriei jocurilor sau frontierei dintre teoria jocurilor şi alte
domenii este ı̂n creştere. Societatea de Teoria Jocurilor (”Game Theory
Society”) ı̂şi lărgeşte numărul de membri şi a avut deja două congrese mon-
diale la: Bilbao (Spania), 2000; Marsilia (Franţa), 2005. În 2005 a fost inau-
gurat la Maastricht (Olanda) un ciclu de conferinţe anuale la nivel european
SING (Spain-Italy-Netherlands Games) care continuă tradiţia conferinţelor
anuale dedicate teoriei jocurilor ı̂n Italia şi Spania ı̂ncepând din 1983 (Ber-
gamo (Italia)); SING2 a avut loc anul acesta la Foggia (Italia). În luna
iulie a fiecărui an, la Stony Brook (Statele Unite) se ţine aşa-numitul ”Game
Theory Festival” unde se ı̂ntâlnesc cercetători şi studenţi din lumea ı̂ntreagă.
Numeroase workshop-uri, conferinţe şi seminarii dedicate unor ramuri par-
ticulare ale teoriei jocurilor au loc anual, bianual, trimestrial sau lunar ı̂n
diferite centre universitare sau de cercetare ştiinţifică. Numeroase manifes-
tări ştiinţifice cu spectru larg (spre exemplu EJOR Conference) şi cu spe-
cific economic sau de informatică includ o secţie pentru teoria jocurilor.
Există un număr mare de jurnale internaţionale care publică articole de teoria
jocurilor şi aplicaţii ale sale, dintre care menţionăm aici: International Jour-
nal of Game Theory, Games and Economic Behavior, European Journal of
Operational Research, Mathematics of Operations Research, Mathematical
Methods of Operations Research, International Game Theory Review, TOP.

5
Recunoaşterea importanţei teoriei jocurilor este materializată de asemenea
prin acordarea unor Premii Nobel pentru Economie pentru contribuţii ı̂n
domeniul teoriei jocurilor: Nash, Harsanyi şi Selten (1994), Vickrey (1996),
Aumann şi Schelling (2005). În ultimii ani, teoria jocurilor se bucură de o
atenţie crescândă ı̂n informatica teoretică şi aplicată pe plan mondial. La
Facultatea de Informatică a Universităţii ”Alexandru Ioan Cuza” din Iaşi,
studenţii anului 2 pot opta pentru cursul de Teoria Jocurilor pentru o in-
troducere ı̂n domeniul teoriei jocurilor şi al interacţiunii dintre aceasta şi
informatică. Prezentul material este conceput ca un suport de curs pentru
studenţii secţiei Învăţământ la Distanţă, care a fost solicitat autoarei pe 8
iulie 2006 pentru a fi gata pentru tipar la sfârşitul lunii august 2006.
Am organizat materialul ı̂n trei capitole: Introducere, Jocuri necoope-
rative şi Jocuri cooperative. Am muncit din greu să fac acest curs ”self-
contained” şi posibil de citit pentru studenţi fără vreo cunoaştere prealabilă
a teoriei jocurilor. Accentul este pe exemple care ilustrează folosirea mode-
lelor matematice de joc şi calcularea soluţiilor jocurilor necooperative şi coo-
perative corespunzând unor situaţii practice variate. Selectarea rezultatelor
(leme, propoziţii, teoreme) din cadrul teoriei jocurilor s-a făcut pe baza ideii
de a furniza studenţilor fundamentele teoriei jocurilor fără a solicita un efort
matematic deosebit. Studenţii interesaţi ı̂n demonstraţiile rezultatelor din
capitolele 2 şi 3 le pot găsi ı̂n Anexa A şi, respectiv, Anexa B. Capitolul 2 a
necesitat ı̂ncorporarea ı̂n text a unor figuri care au fost desenate manual de
autoare şi scanate pentru a crea fişiere cu extensia eps de inserat ı̂n text ı̂n
locul cel mai potrivit posibil. Timpul extrem de scurt pentru editarea acestui
material nu a permis desenarea tuturor figurilor cu software specific, ceea ce
justifică diferenţa de stil ı̂n reprezentarea grafică. În prezentarea materialului
am folosit termenul de ”jucător” (sau pronumele ”el”) pentru a referi orice
participant, indiferent de sex.
Acest suport de curs a fost pregătit ı̂n timpul concediului meu de odihnă
ı̂n Olanda şi, datorită faptului că a fost scris ı̂n limba română, nu a fost citit
de nimeni altcineva, aşa că toate greşelile rămase ı̂n text sunt desigur ale
mele.
Aş vrea să mulţumesc celor care au contribuit ı̂ntr-un fel sau altul la
pregătirea acestui suport de curs.
Apreciez mult ajutorul acordat de Annemiek Dankers şi Ruud Hendrickx
pentru scanarea figurilor şi crearea fişierelor eps la Universitatea din Tilburg
(Olanda). Un rol important pentru pregătirea acestui suport de curs l-a avut
Stef Tijs care mi-a pus la dispoziţie biblioteca sa şi a fost o gazdă ideală, deşi

6
de la bun ı̂nceput a considerat că e imposibil ca cineva să scrie un curs de
teoria jocurilor pentru studenţi ı̂ntr-un interval aşa de scurt. Mulţumesc
din suflet prietenei mele Elena Mocanu din Iaşi care a muncit din greu ı̂n
weekend-urile lunii august şi şi-a folosit talentul să facă din fişierele word,
pdf şi eps trimise de mine via e-mail prezentul suport de curs. Aş vrea de
asemenea să mulţumesc mamei mele, Elena Vătămanu, care a făcut faţă
căldurii tropicale din iulie-august ı̂n Iaşi fără ajutorul meu şi a considerat că
scrierea acestui curs pentru studenţi e activitatea cea mai potrivită pentru
concediul meu de odihnă ı̂n străinătate. Mulţumesc fratelui meu, Valentin
Vătămanu, pentru că a oferit suport mamei mele suplinind prezenţa mea
ı̂n Iaşi ı̂n această vară fierbinte. Dedic acest suport de curs pentru teoria
jocurilor fiicelor mele Oana, Dana şi Roxana Brânzei pe care le port ı̂n suflet
şi gând cu dragoste nemărginită oriunde şi oricând.

31 august 2006 Rodica Brânzei

Prefaţă la ediţia a doua


Prezenta ediţie păstrează structura şi conţinutul de bază ale ediţiei prece-
dente dar conţine variante ı̂mbunătăţite ale figurilor 2.6 (b), 2.10 (b), 2.11
(a), 2.13, 2.14 (a) şi (b), 2.15, 2.21 şi 2.22; greşelile de tipărire existente ı̂n
ediţia precedentă sunt acum corectate şi redactarea textului este pe alocuri
ı̂mbunătăţită.

10 septembrie 2007 Rodica Brânzei

7
LISTA FIGURILOR

• Figura 2.1 Jocul ”Avantaj competitiv” p. 17


• Figura 2.2 Exemple de jocuri matriceale p. 18
• Figura 2.3 Jocul canalelor TV p. 19
• Figura 2.4 Exemple de jocuri cu sumă variabilă p. 19
• Figura 2.5 Echilibre Nash ale jocului ”Parteneriat ı̂n afaceri” p. 22
• Figura 2.6 Diagrame cu săgeţi p. 23
• Figura 2.7 Un joc de alegere a rutei p. 24
• Figura 2.8 Eliminarea iterativă a strategiilor dominate p. 26
• Figura 2.9 Un joc cu ”imperfect recall” p. 30
• Figura 2.10 Subjocurile unor jocuri ı̂n formă extensivă p. 31
• Figura 2.11 Jocuri ı̂n formă extensivă cu mutări ale şansei p. 33
• Figura 2.12 Echilibru Nash perfect pe subjoc p. 35
• Figura 2.13 Forma extensivă a jocului parteneriatului p. 36
• Figura 2.14 Jocuri de piaţă ı̂n formă extensivă p. 39
• Figura 2.15 Forma normală corespunzătoare jocurilor de piaţă p. 39
• Figura 2.16 Forma extensivă a unui joc de tip ”ultimatum” p. 40
• Figura 2.17 Forma normală a unui joc de tip ”ultimatum” p. 41
• Figura 2.18 Forma extensivă a unui joc de piaţă extins p. 42
• Figura 2.19 Forma normală a unui joc de piaţă extins p. 43
• Figura 2.20 Forme normale folosite ı̂n inducţia ı̂napoi p. 44
• Figura 2.21 Jocul ”Bătălia sexelor” p. 50
• Figura 2.22 Jocul investiţiei p. 54
1 INTRODUCERE

Jocurile de societate (table, jocuri de cărţi, şah), jocurile sportive (fotbal,


baschet, tenis) şi jocurile de divertisment (incluzând jocurile video) sunt
practicate ı̂n lumea ı̂ntreagă. Elementele comune acestor jocuri sunt:
• Jucătorii (participanţii la joc): persoane, şansa (norocul), natura, com-
putere, echipe, firme, agenţi, ţări, etc.
• Regulile: specifică posibilităţile de comunicare ı̂ntre jucători, rezul-
tatele acordurilor asupra jucării jocului, informaţia disponibilă diferiţi-
lor jucători şi ceea ce este ”common knowledge”.
• Posibilităţile strategice ale jucătorilor: acţiuni, decizii, strategii ce pot
fi folosite de către fiecare jucător.
• Rezultatele posibile: plăţi psihologice (fericire, satisfacţie, prestigiu),
plăţi numerice sau de altă natură (utilităţi).
• Preferinţele jucătorilor asupra rezultatelor posibile.
Teoria jocurilor este ştiinţa care studiază jocuri ı̂ntr-un sens mult mai larg
decât jocurile menţionate mai sus: un joc este orice situaţie strategică guver-
nată de reguli, cu un rezultat bine definit, caracterizat prin interdependenţa
strategică a jucătorilor, care au relaţii de preferinţă asupra rezultatelor posi-
bile. Negocierile economice şi politice, afacerile şi multe alte domenii fur-
nizează numeroase exemple de jocuri. Teoria jocurilor este o ramură a
matematicii. Ea foloseşte rezultate şi metode din alte ramuri ale mate-
maticii cum sunt: algebra, geometria, analiza matematică, probabilităţi şi
statistică, matematici discrete, ecuaţii, fundamentele matematicii. Teoria
jocurilor interacţionează cu multe alte ştiinţe şi domenii fundamentale ale
vieţii: ştiinţe economice, management, administrarea afacerilor, drept, psi-
hologie socială, ştiinţe politice, biologie, sociologie, informatică, cercetări

9
operaţionale. Interacţiunea ı̂ntre teoria jocurilor şi informatică se referă la
ramuri variate ale informaticii, cum sunt: proiectarea şi analiza algoritmilor,
inteligenţa artificială, logică şi decidabilitate, teoria complexităţii, calcul pa-
ralel şi distribuit, baze de date, reţele de calculatoare, internet.

Teoria jocurilor este o teorie matematică care se ocupă cu modelarea şi


analiza situaţiilor de interacţiune ce implică conflict de interese individuale
sau de grup. Borel (1921), John von Neumann (1928) şi John von Neumann
şi Oskar Morgenstern (1944) au pus bazele teoriei matematice a jocurilor ca o
teorie a modelării şi a soluţiilor. Există multe clasificări ale modelelor teore-
tice de joc. Din punctul de vedere al naturii intereselor jucătorilor distingem
ı̂ntre teoria jocurilor necooperative (cu accent pe interesele individuale) şi
teoria jocurilor cooperative (cu accent pe interesele de grup). Ambele tipuri
de modele, jocuri necooperative şi cooperative, se bazează pe presupuneri va-
riate privind: raţionalitatea jucătorilor (jucători perfect raţionali sau jucători
cu raţionalitate limitată); ceea ce este ”common knowledge” pentru jucători;
informaţia (simetrică sau asimetrică) asupra situaţiei analizate disponibilă
jucătorilor.

1.1 Forme de reprezentare a jocurilor

Cele mai utilizate forme pentru a reprezenta jocuri sunt: forma extensivă,
forma normală (sau strategică) şi forma coaliţională.

Forma extensivă a unui joc este un arbore ale cărui noduri reprezintă
poziţiile posibile ale jocului şi ale cărui arce (ramuri) reprezintă mutările posi-
bile pentru participanţii la joc. Jocul se desfăşoară ca o alternare de mutări
ale participanţilor la joc (jucătorii), motiv pentru care un joc ı̂n formă exten-
sivă este numit un joc dinamic. Fiecare nod neterminal are ataşată eticheta
(de identificare a) jucătorului care trebuie să ia o decizie (să facă o mutare)
ı̂n acea poziţie a jocului. Adesea etichetele nodurilor sunt 1, 2, ..., n. Nodurile
terminale conţin vectorul plăţilor jucătorilor dacă jocul se termină ı̂n acea
poziţie. Fiecare arc are ataşată eticheta unei acţiuni. Reprezentarea ı̂n formă
extensivă a unui joc ilustrează desfăşurarea ı̂n timp a jocului. Unele mutări
pot fi aleatoare (mutări ale şansei sau naturii); pentru asemenea mutări există
distribuţii de probabilitate bine-definite care sunt folosite ca etichete pentru
arcele ce ies din nodurile aparţinând şansei. Nodurile de decizie ale jucătorilor

10
din arborele jocului sunt partiţionate ı̂n mulţimi de informaţie. O mulţime de
informaţie pentru un jucător constă din acele poziţii de joc ı̂n care jucătorul
s-ar putea afla atunci când este rândul său să facă o mutare. În reprezentarea
ı̂n forma extensivă a jocului, mulţimile de informaţie ale jucătorilor care
conţin mai mult decât un nod de decizie sunt marcate grafic, spre exemplu
cu contur de tipul − − −. Evident, pentru o anumită mulţime de informaţie,
numărul deciziilor posibile pentru acel jucător trebuie să fie acelaşi pentru
toate nodurile aparţinând acelei mulţimi. Dacă toate mulţimile de informaţie
a tuturor jucătorilor constau dintr-un singur nod, aceasta ı̂nseamnă că orice
jucător cunoaşte perfect situaţia ı̂n care se află atunci când trebuie să aleagă
o acţiune, motiv pentru care jocul se numeşte joc cu informaţie perfectă.
Într-un joc cu informaţie perfectă fiecare jucător cunoaşte ı̂ntreaga istorie de
desfăşurare a jocului până ı̂n momentul când trebuie să facă o mutare. Şahul
este un joc cu informaţie perfectă. Dacă cel puţin un jucător nu cunoaşte
toată istoria de desfăşurare a jocului, atunci jocul este un joc cu informaţie
imperfectă. Jocurile de cărţi (bridge, poker) sunt jocuri cu informaţie imper-
fectă. Presupunerea de raţionalitate a participanţilor la joc implică luarea
deciziilor personale astfel ı̂ncât plata individuală să fie maximizată sau cos-
tul individual să fie minimizat. Dacă jocul nu are mutări ale şansei şi plăţile
jucătorilor sunt cunoscute cu certitudine avem un joc dinamic cu informaţie
completă şi perfectă. Dacă există mutări ale şansei şi plăţile din nodurile ter-
minale ale arborelui sunt cunoscute de toţi jucătorii, atunci plăţile de primit
de către jucători depind de distribuţia de probabilitate a oricărei mutări
aleatoare. În acest caz se acceptă presupunerea că jucătorii acţionează astfel
ı̂ncât să-şi maximizeze plata aşteptată (medie). Plata aşteptată de un jucător
este o medie ponderată prin distribuţia de probabilitate corespunzătoare a
plăţilor din nodurile terminale. Spre exemplu, ı̂ntr-un joc cu aruncarea unei
monede, dacă un jucător obţine plata 2 ı̂n caz de ”pajură” şi plata 6 ı̂n caz
de ”cap”, plata ”aşteptată” de jucător este 1/2 · 2 + 1/2 · 6 = 4. O strategie
a unui jucător este un plan complet de acţiune de-a lungul arborelui jocului,
adică o listă ordonată a mutărilor jucătorului (câte una pentru fiecare din
mulţimile sale de informaţie) de-a lungul arborelui jocului, de la nodul iniţial
către nodurile terminale. Analiza unui joc ı̂n forma extensivă are ca scop de-
terminarea strategiilor optimale ale jucătorilor şi a plăţilor corespunzătoare.

11
Conceptul de soluţie folosit pentru determinarea strategiilor optimale ı̂ntr-un
joc ı̂n forma extensivă este acela de echilibru Nash perfect pe subjoc (Selten,
1975).

Forma normală a unui joc listează pentru fiecare jucător strategiile (pure)
disponibile şi plăţile de obţinut pentru fiecare combinaţie de strategii (pure),
câte una pentru fiecare jucător (profil strategic). Se presupune că jucătorii
ı̂şi aleg strategiile simultan şi independent, motiv pentru care un joc ı̂n formă
normală este numit un joc static. Totuşi, jucarea repetată de un număr finit
sau infinit de ori a unui joc ı̂n formă normală este un joc dinamic. Analiza
unui joc ı̂n formă normală are ca scop determinarea strategiilor optimale ale
jucătorilor şi a plăţilor corespunzătoare. Conceptul de soluţie fundamental
pentru forma normală a unui joc este acela de echilibru Nash (Nash, 1950a).
Forma extensivă a unui joc cu informaţie completă (şi perfectă sau imper-
fectă) şi fără mutări ale şansei generează o formă normală unic definită a
jocului, ı̂n care plăţile jucătorilor sunt cele din nodurile terminale ale arbore-
lui jocului. Forma extensivă a unui joc cu informaţie completă şi mutări ale
şansei generează de asemenea o formă normală unică, dar plăţile jucătorilor
ı̂n forma normală a jocului sunt plăţile aşteptate (medii) din jocul ı̂n forma
extensivă. Forma normală a unui joc poate genera mai multe jocuri ı̂n formă
extensivă. Orice echilibru Nash perfect pe subjoc al jocului ı̂n formă ex-
tensivă este un echilibru Nash al jocului corespunzător ı̂n formă normală.
În schimb, numai un echilibru Nash ”credibil” al jocului ı̂n formă normală
este un echilibru Nash perfect pe subjoc pentru o formă extensivă generată
de forma normală a jocului. Forma normală şi forma extensivă sunt un bun
candidat pentru reprezentarea unei situaţii cu conflict de interese individuale
atunci când nu sunt permise acorduri preliminare ı̂ntre jucători, deşi comuni-
carea ı̂ntre jucători ı̂nainte de ı̂nceperea jocului nu este ı̂ntotdeauna interzisă.
Dacă acordurile preliminare (şi eventual plăţile laterale) sunt permise atunci
forma coaliţională a jocului este un bun candidat pentru descrierea unei
situaţii decizionale interactive ca un joc.

Forma coaliţională a unui joc, cunoscută şi sub numele de forma funcţiei
caracteristice, este o descriere foarte generală a unei situaţii, care specifică
doar suma (maximă) ce poate fi obţinută (pe cont propriu) de fiecare grup
de jucători (coaliţie), incluzând coaliţiile formate dintr-un singur jucător şi
marea coaliţie (grupul format din toţi participanţii la joc). Analiza formei
coaliţionale a unui joc are ca scop determinarea coaliţiei care se va forma

12
şi a modului ı̂n care valoarea acelei coaliţii va fi distribuită ı̂ntre membrii
săi. Adesea, se presupune că marea coaliţie se formează şi problema de
rezolvat este ca jucătorii să cadă de acord asupra modului de alocare a valorii
obţinute de marea coaliţie ı̂ntre membrii săi. O regulă de alocare corespunde
unui anumit concept de soluţie din teoria jocurilor cooperative. Există mai
multe concepte de soluţie a căror atractivitate este prezentată ı̂n termeni
de proprietăţi caracteristice (caracterizare axiomatică). Sâmburele, valoarea
Shapley, τ -valoarea şi nucleolul sunt concepte de soluţie fundamentale pentru
jocuri cooperative ı̂n forma coaliţională. Forma coaliţională a unui joc se
poate construi pornind de la forma normală a jocului sau direct, pe baza
analizei situaţiei interactive ı̂n studiu.

1.2 Modelarea situaţiilor decizionale interactive


ca jocuri

Teoria jocurilor a apărut din necesitatea de a oferi suport pentru optimizarea


luării deciziilor ı̂n situaţii conflictuale. Multe situaţii practice sau din alte
ştiinţe pot fi analizate şi soluţionate folosind modelele existente de joc şi
conceptele de soluţie disponibile sau introducând noi modele de joc şi/sau
noi concepte de soluţie. Folosirea teoriei jocurilor ı̂n aplicaţii presupune două
etape: o etapă de modelare şi o etapă de (analiză şi) rezolvare a modelului de
joc ales. Soluţia obţinută este oferită ca variantă optimală, din punctul de
vedere al teoriei jocurilor, pentru rezolvarea problemei studiate.
Modelarea unei situaţii cu conflict de interese constă ı̂n construirea unui
model formal de joc, ı̂n sensul teoriei jocurilor, pornind de la o descriere nefor-
mală a situaţiei, adesea narativă. Pentru a alege cel mai potrivit model teo-
retic de joc, modelatorul va trebui să analizeze situaţia respectivă din punctul
de vedere al tipului predominant al conflictului de interese existent (interese
individuale sau de grup) şi al regulilor privind comunicarea şi informaţia
disponibilă diferitelor părţi implicate şi capacitatea lor de raţionare. Decizia
modelatorului priveşte de asemenea forma cea mai adecvată de reprezentare
a jocului. Modelele necooperative şi cooperative de joc sunt complementare,
oferind modelatorului o paletă largă de posibilităţi. Un criteriu fundamen-
tal pentru alegerea tipului modelului de joc, necooperativ sau cooperativ, ı̂l
constituie tipul comunicării şi al acordurilor de comportare strategică per-
mise (sau interzise) participanţilor la joc. Dacă acorduri ferme ale jucătorilor

13
(”binding agreements”) ı̂nainte de ı̂nceperea jocului nu sunt permise, atunci
modelul folosit va aparţine ı̂n principiu teoriei necooperative a jocurilor. În
acest caz, modelatorul va trebui să aleagă ı̂ntre forma extensivă şi forma nor-
mală (strategică) pentru a descrie formal situaţia studiată. Forma extensivă
prezintă avantajul unei modelări mai uşoare şi al unei analize mai simple, dar
rezolvarea jocurilor mari este de obicei dificilă şi uneori imposibilă. Forma
normală are avantajul unei rezolvări mai simple; ea este folosită mult pentru
rezolvarea jocurilor de două persoane. Dacă participanţii la joc au posibilităţi
largi de comunicare (incluzând deseori şi posibilitatea efectuării de plăţi late-
rale), atunci un model din teoria cooperativă a jocurilor va fi preferabil. Mai
departe, modelatorul are ı̂ncă de decis asupra tipului de model de joc coo-
perativ folosit şi va alege forma cea mai adecvată de reprezentare a situaţiei
analizate. Forma coaliţională este folosită adesea.
Încheiem introducerea ı̂n teoria jocurilor cu o motivaţie pentru studiul
acestei teorii. Cunoaşterea modelelor teoriei jocurilor şi a conceptelor de
soluţie specifice diferitelor modele furnizează suport pentru ı̂mbunătăţirea
luării deciziilor strategice ı̂n viaţa de zi cu zi, ı̂n profesie şi ı̂n afaceri. Des-
crierea unui număr relativ mare de situaţii conflictuale variate, modelarea
lor ca jocuri şi rezolvarea jocurilor construite (pentru a furniza soluţii pentru
situaţia conflictuală supusă studiului) crează abilităţi de aplicare a teoriei
jocurilor ı̂n practică. Cunoaşterea teoriei jocurilor poate de asemenea ı̂mbu-
nătăţi performanţa ı̂n jocuri de societate, jocuri de divertisment şi jocuri de
noroc, ridicând astfel calitatea vieţii ı̂n timpul liber. În plus, teoria jocurilor
şi interacţiunea sa cu alte discipline, ı̂n particular cu informatica, constitue
un domeniu de cercetare activ prin programe de masterat şi doctorat la multe
universităti din lumea ı̂ntreagă, oferind un domeniu interesant pentru conti-
nuarea studiilor. Aprecierea teoriei jocurilor pe plan mondial este confirmată
de premiile Nobel pentru Economie obţinute pentru contribuţii ı̂n domeniul
teoriei jocurilor: Nash, Harsanyi, Selten (1994), Vickrey (1996), Aumann şi
Schelling (2005).

14
2 JOCURI NECOOPERATIVE

În teoria jocurilor există două modele de bază de jocuri necooperative,


jocuri ı̂n formă normală (sau strategică) şi jocuri ı̂n formă extensivă. Un
joc ı̂n formă normală este o descriere statică şi concisă a unei situatii con-
flictuale ı̂n care jucătorii ı̂şi aleg simultan şi independent strategiile lor (pure
sau mixte) şi primesc plăţi determinate de acele strategii. Conceptul de
soluţie fundamental pentru jocurile ı̂n formă normală (strategică) este acela
de echilibru Nash. Jocurile ı̂n formă normală (cu informaţie completă) şi
conceptul de echilibru Nash (ı̂n strategii pure) sunt introduse ı̂n paragraful
2.1. Acest paragraf tratează de asemenea două clase speciale de jocuri strate-
gice, jocurile de tip potenţial şi congestie, care au ı̂ntotdeauna echilibre Nash
(ı̂n strategii pure); ele joacă un rol important ı̂n interacţiunea dintre teoria
jocurilor şi informatică. Un joc ı̂n formă extensivă este o descriere dinamică
detaliată a unei situaţii conflictuale, specificând cine şi când face o ”mu-
tare” (adică ia o decizie sau acţiune) ı̂n joc şi care sunt opţiunile disponibile
fiecărui jucător de fiecare dată când are dreptul la o ”mutare”. Concep-
tul de soluţie fundamental pentru jocuri ı̂n formă extensivă (cu informaţie
completă) este acela de echilibru Nash perfect pe subjoc. Jocurile ı̂n formă
extensivă cu informaţie completă şi conceptul de echilibru Nash perfect pe
subjoc sunt introduse ı̂n paragraful 2.2. Paragraful 2.3 tratează legatura
ı̂ntre forma extensivă şi forma normală şi relaţia dintre conceptele corespun-
zătoare de echilibru Nash. Extensia mixtă a unui joc ı̂n forma normală şi
conceptul de echilibru Nash ı̂n strategii mixte sunt introduse ı̂n paragraful
2.4, care tratează de asemenea rezolvarea jocurilor matriceale şi bimatriceale
(ı̂n strategii mixte). Capitolul se ı̂ncheie cu o vedere de ansamblu asupra
jocurilor necooperative analizând rolul informaţiei ı̂n modelele teoriei ne-
cooperative a jocurilor (informaţie completă versus informaţie incompletă,
informaţie perfectă versus informaţie imperfectă, informaţie simetrică versus
informaţie asimetrică).

15
2.1 Jocuri ı̂n formă normală şi echilibre Nash

Un joc necooperativ ı̂n formă normală (strategică) este un model al unei


situaţii ı̂n care sunt implicaţi n participanţi cu interese proprii conflictuale,
jucătorii, ale căror acţiuni posibile sunt cunoscute de către toţi jucătorii.
Fiecare jucător alege planul său de acţiune (o dată şi pentru totdeauna ı̂n
situaţia dată) şi toate deciziile jucătorilor sunt făcute simultan (adică atunci
când un jucător alege planul său de acţiune, el nu este informat asupra planu-
lui de acţiune a nici unui alt jucător). Jucătorii aleg simultan şi independent
acţiunile lor şi apoi primesc plăţi care depind de combinaţia strategiilor alese.
Presupunem că plăţile sunt deterministe şi cunoscute de toţi jucătorii. Un
joc necooperativ ı̂n formă normală constă din trei elemente. Întâi, o mulţime
N = {1, 2, ..., n} a jucătorilor. Apoi, fiecare jucător i ∈ N are o mulţime
de acţiuni (strategii
Y pure) Xi disponibile pentru el şi o funcţie de plată (sau
utilitate) Ki : Xj −→ IR, care descrie plăţile jucătorului i rezultate din
j∈N
toate alegerile posibile de strategii de către jucători (câte una pentru fiecare
jucător), adică pentru fiecare profil strategic x = (x1 , x2 , ..., xn ).

Un joc necooperativ ı̂n formă normală (strategică) este un triplet


hN, {Xi }i∈N , {Ki }i∈N i, unde N este mulţimea jucătorilor şi, pentru fiecare
i ∈ N, XY i este mulţimea acţiunilor sau strategiilor pure ale jucătorului i,
iar Ki : Xj −→ IR, este funcţia de plată (sau funcţia de utilitate) a
j∈N
jucătorului i. Y
Un element din Xj este un profil strategic; el se mai numeşte rezultat
j∈N
(posibil) al jocului. Uneori notăm
Y un profil strategic (x1 , ..., xi , ..., xn ) cu
(xi , x−i ), unde x−i ∈ X−i = Xj .
j∈N \{i}
Un joc hN, {Xi }i∈N , {Ki }i∈N i e un joc finit dacă N este o mulţime finită
şi mulţimile X1 , ..., Xn sunt mulţimi finite. Un joc finit de două persoane va
fi desemnat ı̂n cele ce urmează prin hX, Y, K, Li . Un asemenea joc este de
obicei reprezentat printr-un tablou ale cărui linii sunt ı̂nsoţite de etichetele
strategiilor jucătorului 1 şi ale cărui coloane sunt ı̂nsoţite de etichetele strate-
giilor jucătorului 2, iar la intersecţia fiecărei linii cu o coloană se găseşte
o pereche de numere, reprezentând plata jucătorului 1 urmată de plata
jucătorului 2 pentru combinaţia de strategii (pure) corespunzătoare liniei

16
şi coloanei respective. Dacă ı̂ntr-un joc finit cu doi jucători etichetăm strate-
giile fiecărui jucător astfel ı̂ncât X = {1, .., m} şi Y = {1, .., n}, atunci jocul
este descris printr-o (bi)matrice (K(i, j), L(i, j))i=1,...,m;j=1,...,n , unde K(i, j)
şi L(i, j) reprezintă, respectiv, plata obţinută de jucătorul 1 şi de jucătorul
2 ı̂n situaţia ı̂n care jucătorul 1 alege strategia i şi jucătorul 2 alege strategia
j. Un joc strategic finit de două persoane se numeşte un joc bimatriceal.
Etichete explicite pot fi ataşate liniilor şi coloanelor bimatricii ı̂n cazul unui
joc bimatriceal. Exemplul 2.1 modelează o situaţie de interacţiune strategică
legată de avantaj competitiv ca un joc bimatriceal, reprezentat ı̂n Figura 2.1.

Exemplul 2.1. (Avantaj competitiv) Două companii cu acelaşi tip de acti-


vitate trebuie să decidă simultan şi independent dacă să introducă o tehnolo-
gie nouă (strategia I) sau nu (strategia N). Dacă ambele companii introduc
tehnologia nouă sau ambele decid să nu o introducă, profitul curent al fiecărei
companii nu este afectat. Dacă ı̂nsă o companie decide să introducă noua
tehnologie, iar cealaltă companie nu o introduce, atunci profitul companiei
care adoptă noua tehnologie va creşte cu a unităţi valorice (spre exemplu
miliarde de lei), ı̂n timp ce profitul curent al celeilalte companii va ı̂nregistra
o scădere de a unităţi valorice.

I N
I 0, 0 a, −a
N −a, a 0, 0

Figure 2.1: Jocul ”Avantaj competitiv”

Când cel puţin unul dintre jucători are infinit de multe strategii posibile, jocul
nu este finit. Exemplul 2.2 modelează o situaţie strategică de parteneriat ı̂n
afaceri ca un joc infinit de două persoane.

Exemplul 2.2. (Parteneriat ı̂n afaceri) Doi prieteni doresc să-şi deschidă
ı̂mpreună o afacere şi trebuie să decidă simultan şi independent asupra nivelu-
lui de efort investit ı̂n această afacere. Presupunem că nivelul de efort poate
fi ı̂n intervalul [0, 4], iar profitul obţinut de fiecare dintre ei depinde de nivelul
de efort investit de ambii prin funcţiile de plată K : [0, 4]×[0, 4] −→ IR şi
L : [0, 4]×[0, 4] −→ IR, definite prin:

K(x, y) = 2(x + y + cxy) − x2 , L(x, y) = 2(x + y + cxy) − y 2 ,

17
¡ ¢
unde c ∈ 0, 14 este o constantă care măsoară complementaritatea muncii
celor doi parteneri de afaceri. Un echilibru Nash corespunzând maximizării
funcţiilor de plată individuale este x∗ = y ∗ = 1/(1 − c). Acesta se obţine
rezolvând ı̂n raport cu x şi y sistemul format din ecuaţiile ∂K(x, y)/∂x = 0,
∂L(x, y)/∂y = 0. Totuşi, dacă ambii jucători urmăresc maximizarea functiei
de plată totale, K + L, echilibrul Nash este x b = yb = 2/(1 − 2c) < 1/(1 − c).
Astfel, ı̂n cazul ı̂n care cei doi parteneri de afaceri au un ţel comun, un nivel
mai mic de efort e necesar din partea fiecăruia. Echilibrul Nash (x∗ , y ∗ ) este
ilustrat ı̂n Figura 2.5.
X
Un joc finit hN, {Xi }i∈N , {Ki }i∈N i este un joc cu sumă nulă dacă Ki =0.
i∈N
Un joc finit de două persoane cu sumă nulă satisface L = −K şi, de aceea,
poate fi reprezentat printr-un tablou sau o matrice, [K(i, j)]i=1,...,m;j=1,...,n ,
conţinând doar plăţile pentru jucătorul 1 (primite de la jucătorul 2). Un
astfel de joc se numeşte joc matriceal. Un joc cu sumă nulă pentru două
persoane este de asemenea cunoscut sub numele de joc strict competitiv,
ı̂ntrucât cooperarea dintre jucători este exclusă. Jocul din Figura 2.1 este un
joc pur competitiv; ı̂n Figura 2.2 (a) găsiţi descrierea sa (mai simplă) ca un
joc matriceal. Şahul este un joc finit de două persoane cu sumă nulă: când
jucătorul 1 câstigă, el obţine plata 1 iar jucătorul 2 obţine plata −1; când
jucătorul 2 câstigă, acesta obţine plata 1, iar jucătorul 1 obţine plata −1; ı̂n
caz de remiză ambii jucători obţin plata 0.

2 2 1 4 6 2 1
0 a
0 2 5 3 4 3 5
−a 0
4 2 3 2 0 1 6

(a) (b) (c)

Figure 2.2: Exemple de jocuri matriceale

Un joc strategic hN, {Xi }i∈N , {Ki }i∈N i este un joc cu sumă constantă dacă
X
Ki = C, unde C este o constantă. Orice joc cu sumă constantă poate fi
i∈N
transformat ı̂ntr-un joc cu suma nulă, aşa cum ilustrăm ı̂n Exemplul 2.3 şi
Figura 2.3.

18
Exemplul 2.3. (Jocul canalelor TV) Un canal de televiziune specializat ı̂n
transmisiuni sportive şi un canal de televiziune specializat ı̂n telenovele speră
să-şi lărgească audienţa la telespectori dacă ambele vor transmite atât sport
cât şi telenovele. Sondajele efectuate permit evaluarea ı̂n procente a audienţei
celor două canale ı̂n rândurile telespectatorilor, conform cu Figura 2.3 (a),
ı̂n care situaţia descrisă este modelată ca un joc cu sumă constantă. Figura
2.3 (b) conţine jocul cu sumă nulă echivalent jocului cu sumă constantă.

T S T S
T 55%, 45% 52%, 48% T 10%, −10% 4%, −4%
S 50%, 50% 45%, 55% S 0%, 0% −10%, 10%
(a) (b)

Figure 2.3: Jocul canalelor TV

Cele mai multe jocuri bimatriceale nu sunt ı̂nsă cu suma nulă sau con-
stantă; acestea sunt cunoscute sub numele de jocuri cu sumă variabilă. Figura
2.4 conţine exemple de jocuri cu sumă variabilă care vor fi utilizate ulterior.

3, 1 0, 0 5, 5 0, 10 2, 2 0, 0
0, 0 1, 3 10, 0 1, 1 0, 0 1, 2
(a) (b) (c)
Figure 2.4: Exemple de jocuri cu sumă variabilă

În cele ce urmează, prin jocuri bimatriceale vom referi numai jocurile
de două persoane cu sumă variabilă. Întrucât ı̂ntr-un astfel de joc ambii
jucători pot câştiga sau ambii jucători pot pierde, ı̂n acelaşi timp, depinzând
de acţiunile luate de cei doi jucători, un joc bimatriceal hX, Y, K, Li poate fi
reprezentat ca o pereche de jocuri matriceale, K şi L, ambii jucători urmărind
acelaşi scop (maximizarea câştigului propriu sau minimizarea costului pro-
priu).
Conceptul de soluţie de bază pentru jocuri ı̂n formă strategică este cel
de echilibru Nash (Nash, 1950a). Un echilibru Nash este un profil strategic
care este stabil ı̂n sensul că nici-un jucător nu-şi poate ı̂mbunătăţi plata
deviind unilateral de la acest profil strategic prin alegerea unei alte strategii.

19
Elementele mulţimilor Xi se mai numesc strategii pure pentru a le distinge de
strategii mixte, care sunt distribuţii de probabilitate pe mulţimea strategiilor
pure ale unui jucător. Acest paragraf se referă ı̂n exclusivitate la echilibre
Nash ı̂n strategii pure, numite şi echilibre Nash pure. Echilibrele Nash ı̂n
strategii mixte, numite şi echilibre Nash mixte, sunt definite folosind extensia
mixtă a unui joc ı̂n formă normală; ele vor fi studiate ı̂n paragraful 2.4.
Profilul strategic xb = (bx1 , ..., x
bn ) este un echilibru Nash (pur) al jocului
hN, {Xi }i∈N , {Ki }i∈N i dacă pentru toţi i ∈ N şi toţi xi ∈ Xi avem

Ki (xi , x
b−i ) ≤ Ki (b
xi , x
b−i ).

Exemplul 2.4. Considerăm jocul ı̂n formă normală reprezentat ı̂n Figura
2.1, unde a > 0. Combinaţia de strategii (I, N ) nu este un echilibru Nash,
deoarece jucătorul 2 ı̂şi poate ı̂mbunătăţi plata (de la −a la 0) prin deviere
unilaterală, alegând strategia I. Combinaţia de strategii (I, I) este un echili-
bru Nash deoarece prin deviere unilaterală oricare dintre jucători obţine plata
−a care e mai mică decât 0.
Un joc care are cel puţin un echilibru Nash se numeşte un joc determi-
nat. Dacă un joc matriceal hX, Y, K, −Ki este un joc determinat atunci
spunem că jocul are ”punct şa”; plata jucătorului 1 ı̂ntr-un echilibru Nash
se numeşte valoarea jocului şi se notează cu v (hX, Y, K, −Ki) , sau v(K). În
cazul existenţei mai multor echilibre Nash pentru un joc matriceal, fiecare
echilibru Nash are aceeaşi valoare şi echilibrele Nash sunt interschimbabile.
Teorema 2.5. Fie hX, Y, K, −Ki un joc de două persoane cu sumă nulă şi
fie (x1 , y1 ) şi (x2 , y2 ) echilibre Nash ale jocului. Atunci:
(i) (Proprietatea de interschimbare) (x1 , y2 ) şi (x2 , y1 ) sunt de asemenea
echilibre Nash;
(ii) (Proprietatea plăţilor egale) K(xi , yj )=K(x1 , y1 ) pentru toţi i,j ∈ {1, 2}.

Într-un echilibru Nash al unui joc bimatriceal, fiecare jucător ı̂şi maxi-
mizează utilitatea proprie dat fiind ceea ce face celălalt jucător. O strategie
x ∈ X pentru care există y ∈ Y astfel că (x, y) este un echilibru Nash se
numeste strategie optimală pentru jucătorul 1. Analog se defineşte o strate-
gie optimală pentru jucătorul 2. O pereche de strategii optimale corespunde
ı̂ntotdeauna unui echilibru Nash al jocului. Dacă un joc are un singur echili-
bru Nash, el se numeşte un joc strict determinat. Într-un joc matriceal (strict)
determinat, cunoaşterea de către un jucător a strategiei celuilalt jucător nu-l

20
determină pe jucător să-şi schimbe planurile proprii. În cazul multiplicităţii
echilibrelor Nash ale unui joc bimatriceal determinat, plăţile jucătorilor pot
fi diferite pentru echilibre Nash distincte. Din acest motiv, un jucător poate
prefera un echilibru Nash iar celălalt jucător poate prefera un alt echilibru
Nash, caz ı̂n care rezultatul jocului nu va fi un echilibru Nash. Chiar şi ı̂n
cazul unui echilibru Nash unic, acest rezultat al jocului poate fi nesatisfăcător.
În orice joc de două persoane cu sumă nulă putem determina valoarea
inferioară şi valoarea superioară a jocului definite prin

v(X, Y, K, −K) := sup inf K(x, y);


x∈X y∈Y

v̄(X, Y, K, −K) := inf sup K(x, y).


y∈Y x∈X

Are loc relaţia v(X, Y, K, −K) ≤ v̄(X, Y, K, −K) pentru orice joc
hX, Y, K, −Ki.
Valoarea inferioară şi superioară pentru un joc de două persoane cu sumă
nulă pot fi privite ca nivele de securitate ale jucătorilor, ı̂ntrucât reprezintă
suma minimă pe care jucătorul 1 şi-o poate garanta ı̂n jocul respectiv şi, res-
pectiv, suma maximă pe care jucătorul 2 ar putea-o pierde ı̂n jocul respectiv,
indiferent de acţiunea aleasă de adversarul său (sub presupunerea că acesta
este raţional şi inteligent). Dacă valoarea superioară şi valoarea inferioară a
unui joc matriceal au aceeaşi valoare, atunci jocul are punct şa. Un punct
şa are cea mai mică valoare ı̂n linie (astfel ı̂ncât jucătorul 2 nu poate câştiga
prin schimbarea coloanei) şi cea mai mare valoare ı̂n coloană (deci jucătorul
1 nu poate câştiga prin schimbarea liniei). Dacă un joc are punct şa, ambii
jucători ar trebui să aleagă strategii care duc la acest punct. Jocul din
Figura 2.2. (c) este strict determinat: punctul şa este 3 şi echilibrul Nash al
jocului este profilul strategic (linia 2, coloana 2). Pentru jocuri determinate
de două persoane, determinarea punctelor de echilibru Nash se poate face
pe baza considerării multifuncţiilor ”cel mai bun răspuns” ale jucătorilor.
Multifuncţia cel mai bun răspuns (ı̂n strategii pure) a unui jucător asociază
la fiecare dintre strategiile pure ale celuilalt jucător, mulţimea strategiilor
pure care ar putea fi optimale (cel mai bun răspuns) pentru acel jucător ı̂n
acea situaţie. Un echilibru Nash pur este un profil strategic care constă din
strategii pure care sunt cel mai bun răspuns la cel mai bun răspuns. O metodă
analitică pentru determinarea funcţiilor cel mai bun răspuns pentru jocuri
infinite de două persoane este prezentată după Teorema 2.12. Din punct de
vedere grafic, echilibrele Nash pure ale unui astfel de joc sunt punctele de

21
intersecţie ale graficelor funcţiilor cel mai bun răspuns. Figura 2.5 ilustrează
aceasta pentru jocul ”Parteneriat ı̂n afaceri” din Exemplul 2.2.

Figure 2.5: Echilibre Nash ale jocului ”Parteneriat ı̂n afaceri”

O diagramă cu săgeţi poate fi folositoare pentru determinarea echilibrelor


Nash (pure) pentru jocuri finite de două persoane. Pentru fiecare jucător se
consideră pe rând toate strategiile celuilalt jucător. Pentru o strategie fixată
a partenerului de joc se trasează săgeţi ı̂n sensul strategiilor ce sunt mai avan-
tajoase jucătorului respectiv din punctul de vedere al plăţilor (sau costurilor)
generate. Săgeţile converg spre un echilibru Nash (vezi Figura 2.6 unde (a) si
(b) reprezintă jocuri de tip cost, iar (c) şi (d) reprezintă jocuri de tip câştig).
Dacă nu există săgeţi care converg, atunci jocul respectiv nu are echilibre
Nash (pure); el va avea ı̂nsă echilibre Nash ı̂n strategii mixte (vezi para-
graful 2.4). Fiecare pereche de săgeţi convergente indică un echilibru Nash.
Jocurile matriceale determinate au deseori echilibre Nash multiple; acestea
au aceeaşi valoare. Jocurile cu sumă variabilă au ı̂n mod obişnuit puncte
de echilibru Nash multiple; acestea pot avea valori foarte diferite. Figura
2.6 ilustrează existenţa sau nu a unui echilibru Nash, respectiv unicitatea
sau multiplicitatea echilibrelor Nash, marcând cu simbolul ∗ toate echilibrele
Nash existente.

22
−→ ←−
8, 9 8, 7 −10, 4 −5, 0
↑ ↓ ↓ ↑
11, 12 7, 6∗ 2, −10 −5, 5
−→ −→
(a) (b)
−→ −→
50, 50 80, 100∗ 130 180∗
↓ ↑ ↓ ↑
100, 80∗ 60, 60 180∗ 160
←− ←−
(c) (d)

Figure 2.6: Diagrame cu săgeţi

Exemplul 2.6. (Un joc de alegere a rutei) Două companii de transporturi


trebuie să aleagă ruta cea mai puţin costisitoare luând ı̂n consideraţie efectul
aglomeraţiei pe sectoarele de drum folosite ı̂n comun. Presupunem că o
companie trebuie să facă transporturi de la localitatea A la localitatea C şi
poate face aceasta via B sau via D, iar cealaltă companie trebuie să facă
transporturi de la localitatea B la localitatea D şi poate face aceasta via
A sau via C. Costurile aferente sectoarelor de drum AB, BC, AD şi CD,
pentru fiecare utilizator, sunt mai mari ı̂n caz de folosinţă ı̂n comun; ambele
costuri posibile sunt precizate ı̂n Figura 2.7 (a). Spre exemplu, sectorul de
drum AB implică un cost de 2 unităţi valorice dacă are un singur utilizator,
şi un cost de 5 unităţi valorice pe utilizator, ı̂n cazul ı̂n care ambele companii
folosesc acest sector de drum. Această situaţie de alegere a rutei poate fi
modelată ca un joc bimatriceal unde jucătorul 1 are două strategii, R1 şi
R2 , corespunzând rutelor A − B − C şi A − D − C, iar jucătorul 2 are două
strategii, R10 şi R20 , corespunzând rutelor B − A − D şi B − C − D. Costurile
aferente sunt indicate ı̂n Figura 2.7 (b).

Jocul din Exemplul 2.6 este generat de un model de congestie introdus


de Rosenthal (1973).
Un model de congestie poate fi descris ca hN, M, (Xi )i∈N , (cj )j∈M i unde
• N este mulţimea jucătorilor implicaţi (călători, şoferi, producători).
• M este mulţimea facilităţilor implicate ı̂n folosinţa comună (secţiuni de
drum, utilaje, etc.)

23
• Xi este mulţimea strategiilor jucătorului i, o submulţime nevidă a
lui M .

• cj : {1, 2, ..., n} −→ IR este funcţia de cost pentru facilitatea j, unde


cj (k) ı̂nseamnă costurile facilităţii j, pentru fiecare utilizator al ei, ı̂n
cazul ı̂n care există exact k utilizatori.

1 2
R10 R20 −→
AB 2 5
14 12
BC 3 6 R1 8, 9 8, 7 ↑ ↓
17 11∗
AD 4 10 R2 11, 12 7, 6∗
−→
DC 1 3
(a) (b) (c)

Figure 2.7: Un joc de alegere a rutei

Situaţiile corespunzătoare unui model de congestie pot fi modelate ca


jocuri (de tip) congestie. Un joc de tip congestie este un joc ı̂n Y formă strate-
gică hN, {Xi }i∈N , {Ki }i∈N i, unde pentru fiecare i ∈ N , Ki (x) : Xj −→ IR
j∈N
X
este definită prin Ki (x) = − cj (nj (x)), unde nj (x) = |{i ∈ N |j ∈ xi }| este
j∈xi
numărul de utilizatori ai facilităţii j dacă jucătorii aleg strategiile conform cu
profilul strategic x. Într-un joc congestie de tip cost, toţi jucătorii urmăresc
minimizarea costului individual total. Echilibrele Nash ale unui joc con-
gestie recomandă jucătorilor evitarea congestiei (aglomeraţiei). Jocurile (de
tip) congestie sunt jocuri strategice determinate şi au multe aplicaţii ı̂n infor-
matică. Ele formează o subclasă interesantă a jocurilor potenţial introduse
de către Monderer şi Shapley (1996) pe baza noţiunii de funcţie potenţial
(exact). O funcţie potenţial (exact) măsoară diferenţa plăţilor fiecărui jucător
ı̂n caz de deviere unilaterală. În Figura 2.7 (c) este dată o funcţie potenţial
(exact) pentru jocul de alegere a rutei.

Exemplul 2.7. (Un joc al documentării) Studenţii din doi semiani de studii
trebuie să se pregătească pentru un examen folosind un suport de curs tipărit
existent la biblioteca facultăţii şi un laborator cu calculatoare. Dacă toţi

24
studenţii ı̂nvaţă la bibliotecă, ori toţi la laborator, aglomeraţia creată dimi-
nuează eficienţa documentării lor. Jocul din Figura 2.6 (c) poate fi considerat
ca un joc al documentării.

Fie
Y G = hN, {Xi }i∈N , {Ki }i∈N i un joc strategic de n persoane şi fie
P : Xi −→ IR o funcţie cu valori reale definită pe mulţimea profilurilor
i∈N
strategice. Funcţia P este un potenţial
Y exact pentru G dacă pentru orice
i ∈ N , pentru orice x−i ∈ X−i = Xj şi pentru orice xi , yi ∈ Xi , are loc
j∈N \{i}
Ki (xi , x−i ) − Ki (yi , x−i ) = P (xi , x−i ) − P (yi , x−i ).
O funcţie P potenţial exact pentru G induce un joc potenţial GP =
hN, {Xi }i∈N , P, ..., P i . Figura 2.6 (d) conţine un joc potenţial pentru ”Jocul
documentării” din Figura 2.6 (c).

Teorema 2.8. Fie G = hN, {Xi }i∈N , {Ki }i∈N i un joc finit de n persoane şi
fie P un potenţial exact pentru G. Atunci

(i) Jocurile G şi GP au aceeaşi mulţime de echilibre Nash;

(ii) G are cel puţin un echilibru Nash.

Propoziţia 2.9. (Rosenthal) Fie hN, M, (Xi )i∈N , (cj )j∈M i un model de con-
gestie şi fie G jocul de tip congestie corespunzător. Atunci G Yeste un joc
potenţial exact. O funcţie potenţial pentru G este dată de P : Xi −→ IR,
i∈N
definită pentru orice x = (xi )i∈N prin
X X
P (x) = − cj (`).
S
j∈ xi `=1,...,nj (x)
i∈N

Întrucât multe jocuri strategice finite au echilibre Nash multiple, ı̂n teo-
ria jocurilor necooperative au fost introduse variante (rafinări) ale noţiunii
de echilibru Nash, care impun condiţii suplimentare asupra echilibrelor Nash.
Noţiunea de echilibru Nash nedominat (sau echilibru Nash ı̂n strategii ne-
dominate) şi cea de echilibru Nash puternic prezintă un interes particular.
Spunem că o strategie xbi a jucătorului i domină strategia xi a aceluiaşi jucător
dacă prima nu este niciodată mai nefavorabilă jucătorului i decât cea de-a

25
doua şi uneori Y
e mai avantajoasă, adică pentru toate profilurile strategice
x−i ∈ X−i = Xj ale celorlalţi jucători are loc
j∈N \{i}

(∗) Ki (b
xi , x−i ) ≥ Ki (xi , x−i )

cu cel puţin o inegalitate strictă pentru cel puţin un x−i ∈ X−i . O strategie
care nu este dominată de către nici-o altă strategie se numeşte strategie ne-
dominată. Un profil strategic x = (xi )i∈N este un echilibru Nash nedominat
dacă el este un echilibru Nash ı̂n strategii nedominate, adică este un echili-
bru Nash ı̂n care xi este o strategie nedominată pentru fiecare i ∈ N. Un
echilibru Nash ı̂n strategii nedominate poate fi găsit prin eliminarea iterativă
a strategiilor dominate, aşa cum ilustrăm ı̂n Figura 2.8.

2 2 1 4 2 2 1
0 2 5 0 2
0 2 5 3 −→ 0 2 5 −→ −→ −→ 4 2 −→ 2
4 2 3 4 2
4 2 3 2 4 2 3

Figure 2.8: Eliminarea iterativă a strategiilor dominate

Un caz special apare ı̂n situaţia ı̂n care un jucător are o strategie care ı̂i
dă o plată la fel de bună cu plata pe care o poate obţine utilizând oricare din
celelalte strategii ale sale pentru orice profil strategic al celorlalţi jucători.
O strategie x bi ∈ Xi se numeşte o strategie slab dominantă dacă relaţia (∗)
are loc pentru orice xi ∈ Xi şi pentru orice x−i ∈ X−i . Un jucător poate
avea mai multe strategii slab dominante. Asemenea strategii ar trebui să
ofere jucătorului aceeaşi plată pentru orice profil strategic fixat al celorlalţi
jucători. Dacă o strategie slab dominantă x bi ∈ Xi este astfel ı̂ncât pentru
fiecare xi ∈ Xi există un profil strategic x−i astfel ı̂ncât (∗) are loc cu ine-
galitate strictă, atunci strategia xbi ∈ Xi domină toate celelalte strategii ale
jucătorului şi se numeşte strategie dominantă. Un jucător poate avea cel
mult o strategie dominantă.
Exemplul 2.10. În jocul de tip ”ultimatum” descris ı̂n Exemplul 2.18 şi
reprezentat ı̂n formă normală ı̂n Figura 2.17 (a), jucătorul 2 are o singură
strategie dominantă: (a1 , a2 , a3 ). Toate celelate strategii ale jucătorului 2 sunt
dominate. Spre exemplu, strategia (r1 , a2 , r3 ) este dominată de (r1 , a2 , a3 )
deoarece aceasta dă jucătorului 2 aceeaşi plată dacă jucătorul 1 foloseşte

26
strategia 5-1 sau 4-2, dar dacă jucătorul 1 foloseşte strategia 3-3, strategia
(r1 , a2 , a3 ) dă jucătorului 2 o plată mai mare decât strategia (r1 , a2 , r3 ).
Un echilibru Nash care satisface condiţia că este stabil ı̂mpotriva tuturor
deviaţiilor de către coaliţii de jucători se numeşte un echilibru Nash puternic.
Un echilibru Nash x∗ = (x∗i )i∈N al jocului hN, {Xi }i∈N , {Ki }i∈N i este un
echilibru Nash puternic Ydacă pentru toate coaliţiile S ⊂ N nu există nici-un
xS = (xi )i∈S ∈ XS = Xi astfel ı̂ncât Ki (xS , x∗ (N \ S)) ≥ Ki (x∗ ) pentru
i∈S
toţi i ∈ N , cu inegalitate strictă pentru cel puţin un jucător i ∈ S.
Exemplul 2.11. Pentru jocul din Exemplul 2.19, dintre cele trei echili-
bre Nash marcate cu ∗ ı̂n Figura 2.19 (b), două sunt echilibre Nash pu-
ternice: (A1 , (I, L2 , A3 )) şi (A1 , (I, A2 , A3 )). Echilibrul Nash (L1 , (I, L2 , L3 ))
nu este puternic deoarece coaliţia {1, 2} poate creşte plata jucătorului 1 de
la 2 la 3, menţinând plata 2 pentru jucătorul 2, prin folosirea strategiei
xS = (A1 , (I, A2 , L3 )).

Există totuşi multe jocuri strategice finite care nu au nici-un echilibru


Nash (ı̂n strategii pure). Într-o asemenea situaţie (şi de asemenea când jocul
are echilibre Nash ı̂n strategii pure), se poate considera extensia mixtă a jocu-
lui. Aceasta este construită pe baza randomizării pe mulţimea strategiilor
pure, aşa-numitele strategii mixte. Extensia mixtă a unui joc necooperativ
ı̂n formă normală şi determinarea echilibrelor Nash ı̂n strategii mixte pentru
jocuri matriceale şi bimatriceale sunt tratate ı̂n paragraful 2.4.
Considerăm acum jocuri de două persoane cu (infinit de) multe strategii
şi tratăm determinarea echilibrelor lor Nash. Fie x1 o strategie a jucătorului
1, x2 o strategie a jucătorului 2, K1 : X1 ×X2 −→ IR, funcţia de plată a
jucătorului 1, şi K2 : X1 ×X2 −→ IR, funcţia de plată a jucătorului 2. Dacă
x1 şi x2 pot lua, spre exemplu, 100 de valori diferite, utilizarea unei bimatrice
de dimensiune 100×100 devine cel puţin anevoioasă. Dacă x1 şi x2 iau valori
ı̂ntr-un interval, spre exemplu [0,1], situaţia conflictuală este imposibil să
fie reprezentată printr-o (bi)matrice. Într-un asemenea caz, dacă funcţiile
de plată ale jucătorilor sunt diferenţiabile, pentru determinarea echilibrelor
Nash se poate folosi analiza matematică.
Teorema 2.12. Fie hN, {Xi }i∈N , {Ki }i∈N i un joc strategic cu N mulţime
finită. Dacă pentru fiecare i ∈ N mulţimea strategiilor Xi este un interval
mărginit şi funcţia de plată Ki este de clasă C 2 şi strict concavă ı̂n xi , atunci
există un echilibru Nash x∗ al jocului.

27
În cele ce urmează, prezentăm o metodă analitică pentru determinarea
echilibrelor Nash a unui joc infinit de două persoane. Notăm cu f1 : X2 −→ X1
funcţia cel mai bun răspuns a jucătorului 1, unde f1 (x2 ) este cel mai bun
răspuns a jucătorului 1 la x2 , unde x2 este o strategie arbitrară fixată a
jucătorului 2. Această funcţie se obţine din ∂K1 (x1 , x2 )/∂x1 = 0 şi furnizează
valoarea lui x1 care maximizează K1 (x1 , x2 ) pentru orice x2 fixat. Notăm cu
f2 : X1 −→ X2 funcţia cel mai bun răspuns a jucătorului 2, unde f2 (x1 ) este
cel mai bun răspuns a jucătorului 2 la x1 , unde x1 este o strategie arbitrară
fixată a jucătorului 1. Această funcţie se obţine din ∂K2 (x1 , x2 )/∂x2 = 0 şi
furnizează valoarea lui x2 care maximizează K2 (x1 , x2 ) pentru orice x1 fixat.
Funcţia f definită prin f = (f1 , f2 ) se numeşte funcţia cel mai bun răspuns a
jocului. Această funcţie este continuă şi asociază fiecărei perechi de strategii
(x1 , x2 ) plata (f1 (x2 ), f2 (x1 )). Un echilibru Nash al jocului, x∗ = (x∗1 , x∗2 ), sa-
tisface simultan x∗1 = f1 (x∗2 ) şi x∗2 = f2 (x∗1 ). Din punct de vedere grafic, echili-
brele Nash ale jocului se află la intersecţia funcţiilor ”cel mai bun răspuns”
a celor doi jucători.
Exemplul 2.13. (Jocul publicităţii) Două firme concurente pe piaţa de
bunuri de consum trebuie să decidă simultan şi independent asupra nivelu-
lui optim al cheltuielilor lor cu publicitatea (ı̂n vederea maximizării profi-
tului individual). Presupunem că ambele firme au un plafon bugetar pen-
tru publicitate de 1000 e şi că profitul lor individual depinde de cheltu-
ielile cu publicitatea x1 şi x2 prin funcţiile de plată K1 : X1 ×X2 −→ IR şi
K2 : X1 ×X2 −→ IR, definite prin: K1 (x1 , x2 ) = 1000x1 −x21 −x22 , K2 (x1 , x2 ) =
1000x2 − x1 x2 − x22 . Această situaţie de decizie interactivă poate fi modelată
ca un joc infinit de două persoane cu sumă nulă h[0, 1000], [0, 1000], K1 , K2 i.
Deciziile optime privind cheltuielile cu publicitatea sunt determinate prin
calcularea echilibrelor Nash ale jocului. Acestea se obţin rezolvând sistemul
liniar 1000 − 2x1 = 0, 1000 − x1 − 2x2 = 0. Echilibrul Nash al jocului conside-
rat este x∗ = (500, 250), generând profitul K1 (500, 250) = 187.500 e pentru
jucătorul 1 şi K2 (500, 250) = 62.500 e pentru jucătorul 2.
Conceptul de echilibru Nash este fundamental pentru rezolvarea jocurilor
necooperative ı̂n formă strategică. Încheiem acest paragraf ı̂ncercând să
furnizăm un răspuns la ı̂ntrebarea: Este un echilibru Nash o soluţie a jocului?
O condiţie suficientă este asigurată de strategii nedominate ı̂n profilul strate-
gic corespunzând unui echilibru Nash. Presupunem că (s, t) este un echilibru
Nash şi că o altă strategie s∗ domină s pentru jucătorul 1 şi o strategie t∗
domină t pentru jucătorul 2. Atunci (s, t) nu este o soluţie a jocului.

28
2.2 Jocuri ı̂n formă extensivă şi echilibre Nash perfecte
pe subjoc
Forma extensivă a unui joc este o pereche hN, T i , unde N = {1, 2, ..., n}
este mulţimea (finită a) jucătorilor şi T este arborele jocului, oferind posibi-
litatea unei descrieri dinamice detaliate a unei situaţii de interacţiune strate-
gică. Un arbore este un graf orientat cu un nod special, numit rădăcină,
o mulţime de noduri terminale şi una de noduri neterminale şi un drum
unic de la rădăcină la fiecare din nodurile grafului. În arborele unui joc (ı̂n
formă extensivă) orice drum pornind de la rădăcină la un nod terminal in-
dică un mod ı̂n care ”istoria” jocului poate evolua. Nodurile neterminale ale
arborelui jocului (incluzând rădăcina), numite noduri de decizie, corespund
persoanelor ce iau decizii (jucătorii). Nodurile terminale indică rezultatele
(plăţile) posibile ale jucătorilor dacă jocul se sfârşeşte ı̂n acel nod termi-
nal. Arcele corespund ”mutărilor” (acţiunilor, strategiilor, deciziilor) jucă-
torilor care mută consecutiv (secvenţial ı̂n timp). Reprezentarea corectă a
unei situaţii conflictuale ca un joc ı̂n formă extensivă implică ı̂ncorporarea
corectă a tuturor regulilor jocului. Aceasta implică necesitatea identificării
pentru fiecare jucător a aşa-numitelor mulţimi de informaţie. O mulţime de
informaţie a unui jucător conţine toate nodurile de decizie ce aparţin acelui
jucător când acelui jucător ı̂i vine rândul la mutare. Mulţimile de informaţie
care conţin cel puţin două noduri de decizie se marchează grafic ı̂n arborele
jocului, de obicei folosind un contur de forma − − −. Dacă o mulţime
de informaţie a unui jucător constă dintr-un singur nod de decizie, atunci
acel jucător ştie precis care e poziţia sa ı̂n arborele jocului, adică jucătorul
cunoaşte toată istoria desfăşurării jocului până ı̂n acel moment. Dacă toate
mulţimile de informaţie ale tuturor jucătorilor constau dintr-un singur nod,
jocul este un joc (dinamic) cu informaţie perfectă. Jocul de şah este un
joc cu informaţie perfectă. De obicei, mulţimile de informaţie cu un singur
nod de decizie nu se marchează distinct ı̂n reprezentarea arbore a jocului.
Dacă o mulţime de informaţie a unui jucător conţine mai mult decât un
nod de decizie, aceasta ı̂nseamnă că ı̂n momentul ı̂n care jucătorul trebuie
să ia o decizie, el ştie doar că se poate afla ı̂n oricare din nodurile mulţimii
sale de informaţie; ı̂n acest caz, alegerea strategiei sale se face ı̂n condiţii
de informaţie imperfectă. Un joc ı̂n care cel puţin un jucător are cel puţin
o mulţime de informaţie ce conţine cel puţin două noduri de decizie este
un joc (dinamic) cu informaţie imperfectă. Jocul de bridge este un joc cu
informaţie imperfectă. Arborele unui joc ı̂n formă extensivă este un arbore
etichetat care satisface următoarele reguli:

29
1. Orice nod este un succesor al nodului iniţial (rădăcină).
2. Orice nod cu excepţia nodului iniţial are exact un predecesor imediat.
Nodul iniţial nu are predecesori.
3. Ramuri (arce) multiple ce corespund unui acelaşi nod au etichete (de
acţiuni) diferite.
4. Fiecare mulţime de informaţie conţine noduri de decizie ale unui singur
jucător.
5. Toate nodurile ı̂ntr-o anumită mulţime de informaţie trebuie să aibă
acelaşi număr de succesori imediaţi şi aceeaşi mulţime de etichete pen-
tru ramurile corespunzătoare.
În paragraful următor, trei variante ale unei situaţii de piaţă sunt modelate
ca jocuri necooperative folosind forma extensivă a unui joc. În forma exten-
sivă din Figura 2.14 (a), fiecare jucător are o singură mulţime de informaţie
conţinând un singur nod. În forma extensivă din Figura 2.14 (b), mulţimea
de informaţie a jucătorului 1 conţine două noduri de decizie şi mulţimea de
informaţie a jucătorului 2 conţine un singur nod de decizie. În forma ex-
tensivă din Figura 2.18 (a), jucătorul 1 are o singură mulţime de informaţie
constând dintr-un singur nod de decizie, iar jucătorul 2 are trei mulţimi de
informaţie cu câte un singur nod de decizie. Paragraful următor conţine
de asemenea un joc de tip ”ultimatum” descris verbal ı̂n Exemplul 2.18 şi
modelat ca un joc ı̂n formă extensivă ı̂n Figura 2.16 (a).

Figure 2.9: Un joc cu ”imperfect recall”

30
În modelarea unei situaţii ca un joc ı̂n formă extensivă, se presupune de
obicei ”perfect recall”, adică capacitatea perfectă a fiecărui jucător de a-şi
aminti mutările sale anterioare. Jocurile din exemplele precedente sunt jocuri
cu ”perfect recall”.Teoria jocurilor studiază de asemenea jocuri cu ”imperfect
recall”. Un asemenea joc este ilustrat ı̂n Figura 2.9. Jocurile cu imperfect
recall au aplicaţii in informatică.

(a)

(b)

Figure 2.10: Subjocurile unor jocuri ı̂n forma extensivă

31
Dat un joc ı̂n formă extensivă, un nod x al arborelui se spune că iniţiază
un subjoc dacă nici x şi nici unul dintre succesorii lui x nu sunt ı̂ntr-o mulţime
de informaţie care conţine şi noduri care nu sunt succesori ai lui x. Un subjoc
este un arbore definit de x şi succesorii săi. Într-un joc cu informaţie perfectă
orice nod iniţiază un subjoc. În Figura 2.10 evidenţiem toate subjocurile unui
joc cu informaţie perfectă şi ale unui joc cu informaţie imperfectă.
Există numeroase situaţii practice ı̂n care şansa joacă un rol. Spre exem-
plu, ı̂n fotbal şansa decide care echipă ı̂ncepe jocul. Şansa poate interveni
la ı̂nceperea jocului sau/şi la anumite momente ı̂n cursul desfăşurării jocu-
lui. În astfel de situaţii, şansa este considerată ea ı̂nsăşi ca un jucător, caz
ı̂n care spunem că avem un joc cu mutări ale şansei. În forma extensivă a
unui asemenea joc, nodurile aparţinând şansei sunt etichetate corespunzător
(de obicei cu C (”chance”) sau cu 0) iar arcele ce ies din asemenea noduri
indică mutările şansei prin distribuţii de probabilitate ale evenimentelor posi-
bile. Figura 2.11 conţine două forme extensive ale unor jocuri cu mutări ale
şansei: Figura 2.11 (a) conţine forma extensivă a unui joc cu informaţie per-
fectă, iar Figura 2.11 (b) conţine forma extensivă a unui joc cu informaţie
imperfectă.
Conceptul de soluţie specific jocurilor ı̂n formă extensivă este acela de
echilibru Nash perfect pe subjoc. Un echilibru Nash perfect pe subjoc este
un profil strategic secvenţial raţional, ı̂n sensul că ı̂ncorporează raţionalitatea
secvenţială a jucătorilor prin evaluarea individuală a subjocurilor. Raţiona-
litatea secvenţială implică faptul că o strategie optimală pentru un jucător
ar trebui să maximizeze plata sa condiţionat de oricare din mulţimile sale de
informaţie. Presupunerea obişnuită pentru jocuri ı̂n formă extensivă este că
raţionalitatea secvenţială este ”common knowledge”. Ideea care stă la baza
determinării unui echilibru Nash perfect pe subjoc este că fiecare jucător,
ı̂nainte de a-şi alege o strategie (adică un plan complet de acţiune de-a lungul
arborelui jocului), ı̂ncearcă să anticipeze alegerile de alternative ale celorlalţi
jucători ı̂n urma fiecărei decizii posibile pentru el. Procedând astfel, un
jucător ı̂ncearcă să determine (ghicească) care nod final va fi atins ca urmare
a selectării de către el a oricăreia dintre alternativele disponibile. Apoi,
jucătorul foloseşte această informaţie pentru a lua decizia optimă. Astfel,
fiecare jucător va studia reprezentarea jocului şi va considera ce vor face
ceilalţi jucători (raţionali şi inteligenţi) ı̂n viitor ca răspuns la mutarea sa ı̂ntr-
o mulţime de informaţie particulară. Folosirea acestei abordări pentru jocul
ı̂n formă extensivă din Figura 2.16 (a) conduce la determinarea echilibrului
Nash perfect pe subjoc reprezentat prin săgeţi ı̂n Figura 2.16 (b).

32
(a)

(b)

Figure 2.11: Jocuri ı̂n formă extensivă cu mutări ale şansei

Metoda de bază pentru determinarea echilibrelor Nash perfecte pe subjoc


este inducţia ı̂napoi (”backward induction”). Inducţia ı̂napoi este un proces
de analizare a jocului de la nodurile terminale ale arborelui jocului către
rădăcina sa, prin identificarea tuturor subjocurilor jocului şi determinarea
soluţiilor optimale ale jucătorilor la nivel de subjoc. Determinarea soluţiilor
optimale ı̂n cadrul fiecărui subjoc (şi a jocului iniţial) se realizează astfel: pen-
tru fiecare dintre mulţimile de informaţie ale jucătorilor, date fiind nodurile
terminale ce pot fi atinse, se renunţă la acţiunile dominate ale jucătorului
respectiv. O strategie a unui jucător ı̂ntr-un (sub)joc ı̂n formă extensivă este
un plan complet de acţiune al jucătorului de-a lungul arborelui (sub)jocului.
Strategiile posibile ale unui jucător trebuie să aibă câte o singură compo-
nentă pentru fiecare din mulţimile de informaţie ale jucătorului respectiv ı̂n
arborele jocului, considerând o ordine fixată de parcurgere a arborelui jocului
(de obicei, pe nivele ale arborelui de la rădăcină spre nodurile terminale, şi ı̂n
cadrul fiecărui nivel de la stânga la dreapta). Fiecare componentă a strate-
giei unui jucător poate primi ca valoare oricare dintre etichetele acţiunilor
posibile pentru jucătorul respectiv din mulţimea de informaţie corespunză-
toare acelei componente. Spre exemplu, strategiile jucătorului 2 sunt I şi R ı̂n

33
jocul ı̂n forma extensivă din Figura 2.14 (a). În jocul ı̂n formă extensivă din
Figura 2.18 (a) strategiile jucătorului 2 sunt 3-uple ı̂n care prima componentă
corespunde primei mulţimi de informaţie a acestui jucător (rădăcina arbore-
lui), a doua componentă corespunde mulţimii de informaţie a jucătorului 2
situată la stânga pe nivelul 2 al arborelui, iar a treia componentă corespun-
de mulţimii de informaţie a jucătorului 2 situată la dreapta pe nivelul 2 al
arborelui. Prima componentă poate lua valori ı̂n mulţimea {I, R}, a doua
componentă poate lua valori ı̂n mulţimea {L2 , A2 }, iar a treia componentă
poate lua valori ı̂n mulţimea {L3 , A3 }. Jucătorul 2 are, prin urmare, 8 strate-
gii posibile ı̂n jocul din Figura 2.18 (a): (I, L2 , L3 ), (I, L2 , A3 ), (I, A2 , L3 ),
(I, A2 , A3 ), (R, L2 , L3 ), (R, L2 , A3 ), (R, A2 , L3 ) şi (R, A2 , A3 ).
Un profil strategic este un echilibru Nash perfect pe subjoc dacă el specifică
un echilibru Nash ı̂n orice subjoc al jocului original; un asemenea profil strate-
gic este raţional secvenţial. Dacă nu există egalitate de plăţi, adică două sau
mai multe noduri terminale ce conduc la aceeaşi plată pentru vreunul dintre
jucători, atunci inducţia ı̂napoi identifică un singur echilibru Nash perfect
pe subjoc. În cele ce urmează, exemplificăm determinarea echilibrulor Nash
perfecte pe subjoc prin metoda inducţiei ı̂napoi pentru jocurile din Figura
2.10.

Exemplul 2.14. Analizăm jocul din Figura 2.10 (a) folosind metoda inducţiei
ı̂napoi. Ultimele decizii care trebuie făcute sunt acelea ı̂n care jucătorul 2
trebuie să decidă dacă să lupte sau să se acomodeze, după ce a observat de-
cizia luată de jucătorul 1. În subjocul 1, jucătorul 2 va prefera acţiunea L2
care-i asigură plata 2 (fiindcă 2 > 1), iar ı̂n subjocul 2, jucătorul 2 va prefera
acţiunea A3 care-i asigură plata 4 (fiindcă 4 > 3). Acum, analizăm subjocul
3 care ı̂ncepe cu decizia jucătorului 1 (L1 sau A1 ) ı̂n situaţia ı̂n care jucătorul
2 a selectat acţiunea I. Dacă jucătorul 1 ar alege L1 , atunci am văzut că
jucătorul 2 alege L2 , implicând plata 2 pentru jucătorul 1; dacă jucătorul
1 ar alege A1 , am văzut că jucătorul 2 alege A3 , implicând plata 5 pentru
jucătorul 1. Acţiunea optimală pentru jucătorul 1 ı̂n subjocul 3 este aşadar
A1 (fiindcă 5 > 2). Acum analizăm jocul complet pentru a stabili care e
acţiunea optimală a jucătorului 2 la ı̂nceputul jocului. Dacă jucătorul 2 ar
alege R, atunci el ar obţine plata 0; dacă el ar alege I, am văzut din analiza
anterioară a subjocului 3 că jucătorul 1 alege A1 , urmată de acţiunea A3 a
jucătorului 2, implicând plata 4 pentru jucătorul 2 (care este mai mare decât
0). Echilibrul perfect pe subjoc al acestui joc, (A1 , L2 , A3 ), este reprezentat
prin săgeţi ı̂n Figura 2.18 (b).

34
Exemplul 2.15. Analizăm jocul din Figura 2.10 (b) prin metoda inducţiei
ı̂napoi, ı̂ncepând cu subjocul care ı̂ncepe ı̂n situatia ı̂n care jucătorul 1 a ales
anterior acţiunea U . Fiindcă jucătorul 2 nu ştie dacă jucătorul 1 alege A sau
B, el va prefera (pentru mulţimea de informaţie ı̂n care se află) acţiunea X
care-i asigură o plată mai bună (1 > 0) sau cel puţin la fel de bună (4 = 4) ca
strategia Y . Jucătorul 1 va prefera acţiunea A care-i asigură plata 3 (fiindcă
3 > 1). Acum rămâne de analizat jocul complet. Dacă jucătorul 1 ar alege
D, el ar primi plata 2; dacă, ı̂n schimb, el ar alege U , tocmai am văzut că
ulterior el poate alege A, urmat de alegerea X de către jucătorul 2, rezultând
plata 3 pentru jucătorul 1, care e mai mare decât 2. Prin urmare, ı̂n rădăcina
arborelui jocului jucătorul 1 va alege U . Echilibrul Nash perfect pe subjoc
al jocului analizat, (U A, X), este reprezentat prin săgeţi ı̂n Figura 2.12.

Figure 2.12: Echilibru Nash perfect pe subjoc

Determinarea prin metoda inducţiei ı̂napoi a echilibrelor Nash perfecte pe


subjoc pentru jocurile (ı̂n formă extensivă) finite cu informaţie perfectă sau
imperfectă se poate face, de asemenea, folosind forma normală (corespunză-
toare formei extensive) pentru fiecare subjoc al jocului şi pentru jocul iniţial.
Un echilibru Nash al jocului strategic este un echilibru perfect pe subjoc al
jocului ı̂n formă extensivă dacă restricţia sa la fiecare subjoc este un echilibru
Nash al acelui subjoc. Această metodă este ilustrată ı̂n Exemplul 2.20.
În cele ce urmează tratăm reprezentarea ı̂n formă extensivă a jocurilor
(cu sau fără mutări ale şansei) ı̂n care jucătorii au (infinit de) multe strategii.

35
Simbolul grafic arc de cerc este folosit pentru a reprezenta o mulţime infinită
de strategii pure. Pentru exemplificare folosim forma extensivă a jocului
parteneriatului din Exemplul 2.2, reprezentată ı̂n Figura 2.13.

Figure 2.13: Forma extensivă a jocului parteneriatului

În aplicarea metodei inducţiei ı̂napoi pentru determinarea echilibrelor


Nash perfecte pe subjoc pentru jocuri infinite, se recomandă pornirea cu
acele subjocuri (care sunt spre sfârsitul jocului original) pentru care există
speranţa să aibă un singur echilibru Nash. Apoi, se foloseşte inducţia ı̂napoi
ı̂ncorporând aceste rezultate de echilibru ı̂n subjocuri mai ample. Desigur,
determinarea echilibrelor Nash perfecte pe subjoc se poate face folosind
metoda analitică bazată pe funcţiile cel mai bun răspuns ale jucătorilor (vezi
de asemenea paragraful 2.4). Exemplificăm aceasta pentru un joc de piaţă
cu infinit de multe strategii.

Exemplul 2.16. Considerăm o piaţă cu două firme concurente, firma 1 şi


firma 2, care trebuie să-şi aleagă simultan şi independent nivelul (optim) al
producţiei, q1 şi, respectiv, q2 , după ce firma 1 a selectat nivelul (optim al)
publicităţii. Presupunem că preţul pieţei este p = a − q1 − q2 , unde a este
nivelul publicităţii ales de firma 1 (şi observat de firma 2). Presupunem de
asemenea că cele două firme produc la cost zero şi costul publicităţii firmei 1
este 2a3 /81. Profitul firmei 1 este de forma (a−q1 −q2 )q1 −2a3 /81, iar profitul
firmei 2 este (a − q1 − q2 )q2 . Observăm că BR1 (q2 ) = (a − q2 )/2, BR2 (q1 ) =
(a − q1 )/2. Echilibrul Nash al jocului corespunde la q1∗ (a) = q2∗ (a) = a/3,
implicând p∗ (a) = a/3. Profitul generat pentru firma 1 va fi funcţia z1 definită
prin z1 (a) = a2 − 2a3 /81. Maximixarea profitului firmei 1 determină nivelul
optim a∗ = 3 al publicităţii. Nivelul optim al producţiei ambelor firme este,
prin urmare, q1∗ = q2∗ = 1.

36
2.3 Forma extensivă şi forma normală

Situaţii practice pot fi uneori studiate folosind instrumentele teoriei jocurilor.


În orice aplicaţie a teoriei jocurilor trebuie să transpunem descrierea nefor-
mală (adesea narativă) a problemei ı̂ntr-un model teoretic din teoria jocurilor
alegând forma cea mai potrivită pentru a reprezenta jocul şi apoi să-l re-
zolvăm. Situaţiile practice ı̂n care conflictul existent este ı̂n principal gene-
rat de interese individuale, iar acordurile ferme (de comportare strategică)
ale jucătorilor nu sunt permise (deşi comunicarea ı̂ntre jucători ı̂nainte de
ı̂nceperea jocului nu este ı̂ntotdeauna interzisă) pot fi adesea modelate cu
uşurintă folosind un model din teoria necooperativă a jocurilor. O decizie
importantă care trebuie făcută este aceea a selectării formei celei mai potri-
vite de reprezentare a jocului. Forma extensivă este o descriere dinamică şi
detaliată a jocului. Ea prezintă avantajul unei analize naturale a situaţiei
modelate folosind arborele jocului. Forma normală este o descriere statică şi
concisă. Ea se bazează pe presupunerea că jucătorii iau decizii simultan şi
independent şi prezintă un avantaj din punctul de vedere al rezolvării jocu-
lui. Adesea, descrierea neformală a unei situaţii conflictuale este mai uşor
tradusă ı̂n forma extensivă a unui joc. Pentru a folosi avantajele formei nor-
male ı̂n rezolvarea jocului, forma extensivă obţinută poate fi apoi translatată
ı̂n forma normală corespunzătoare, pe baza determinării strategiilor jucă-
torilor ı̂n arborele jocului. Oricărui joc ı̂n formă extensivă ı̂i corespunde o
formă normală unică. Totusi, forme extensive diferite pot genera acelaşi joc
ı̂n formă normală. Ilustrăm relaţia dintre forma extensivă şi forma normală
prin următorul exemplu care modelează, ı̂n două variante privind regulile
jocului, comportarea pe piaţa de jocuri video a două firme de software.

Exemplul 2.17. Considerăm următoarea situaţie decizională interactivă pe


piaţa de jocuri video. Presupunem că pe piaţă se află o firmă specializată ı̂n
jocuri video, jucătorul 1, care realizează un profit curent de 5 unităţi valo-
rice (spre exemplu miliarde de lei). O altă firmă de software, firma 2, care
realizează un profit curent de o unitate valorică din alte tipuri de activităţi,
intenţionează să intre pe piaţa de jocuri video. Ea trebuie să decidă dacă intră
sau nu pe piaţă ştiind că firma 1 va reacţiona, ori ostil (ı̂ncercând să distrugă
firma 2) ori acceptând situaţia de concurenţă creată prin intrarea firmei 2.
Situaţia descrisă poate fi modelată ca un joc necooperativ de două persoane,
unde firma 1 are două alternative (ı̂n caz de intrare pe piaţă a firmei 2):
A – corespunzând acomodării sale cu prezenţa pe piaţă a firmei 2 – şi L –

37
corespunzând luptei cu firma 2, spre exemplu printr-o campanie publicitară
costisitoare –, iar firma 2 are două strategii: I – corespunzând deciziei de
a intra pe piaţă – şi R – corespunzând deciziei de renunţare la intenţia de
intrare pe piaţă. În ceea ce priveşte plăţile jucătorilor, ı̂n cazul ı̂n care firma 2
decide să nu intre pe piaţă, ambele firme realizează profitul lor curent. Dacă
firma 2 decide să intre pe piaţă şi firma 1 se acomodează situaţiei, profitul
firmei 2 va creşte, spre exemplu la 2 unităţi valorice, ı̂n timp ce profitul
firmei 1 va scădea, spre exemplu la 2 unităţi valorice. Dacă ı̂nsă firma 2 intră
pe piată şi firma 1 luptă pentru ı̂nlăturarea firmei 2, piaţa de jocuri video
va avea de suferit asigurând ambelor firme profit zero. Modelarea acestei
situaţii ca un joc ı̂n formă extensivă necesită informaţii suplimentare privind
desfăşurarea temporală a jocului şi regulile privind informaţia disponibilă ju-
cătorilor. Presupunem că firma 2 trebuie să decidă ı̂ntâi dacă intră sau nu
pe piaţă şi considerăm următoarele două variante privind informaţia de care
dispune firma 1 atunci când decide tipul său de comportare faţă de firma 2
pe piaţa de jocuri video:

(a) Firma 1 observă intrarea pe piaţă a firmei 2 şi apoi decide comportarea
sa. Această variantă este modelată ca un joc necooperativ cu informaţie
(completă şi) perfectă, al cărui arbore este descris ı̂n Figura 2.14 (a);

(b) Firma 1 trebuie să decidă comportarea sa pe piaţa video (ı̂n caz de
intrare a firmei 2) fără a şti decizia luată de firma 2. Această variantă
este modelată ca un joc necooperativ cu informaţie (completă dar)
imperfectă, al cărui arbore este descris ı̂n Figura 2.14 (b).

Ambelor forme extensive privind jocul firmelor pe piaţa de jocuri video


le corespunde un acelaşi joc ı̂n formă normală, reprezentat ı̂n Figura 2.15.

Scopul acestui paragraf este să studieze legătura ı̂ntre forma extensivă şi
forma normală a unui joc necooperativ şi ı̂ntre conceptele de soluţie speci-
fice fiecărei forme. Modul ı̂n care forma extensivă a unui joc generează o
formă normală unică este ilustrat cu ajutorul a două situaţii de interacţiune
strategică prezentate ı̂n Exemplul 2.18 şi Exemplul 2.19.

38
(a)

(b)

Figure 2.14: Jocuri de piaţă ı̂n formă extensivă

I R
L 0, 0 5, 1
A 2, 2 5, 1

Figure 2.15: Forma normală corespunzătoare jocurilor de piaţă

Exemplul 2.18. (Joc de tip ”ultimatum”) Doi jucători pot primi o sumă de
6 unităţi valorice dacă ei cad de acord asupra modului de ı̂mpărţire (ı̂n unităţi
valorice ı̂ntregi) a acestei sume. În vederea atingerii unui acord, jucătorii
urmează o procedură strictă: unul dintre jucători, jucătorul 1, propune o
schemă de ı̂mpărţire a celor 6 unităţi valorice iar celălalt jucător, jucătorul
2, reacţionează la propunerea făcută acceptând-o sau refuzând-o. Alterna-
tivele rezonabile (şi realizabile) pentru jucătorul 1 sunt schemele de divizare

39
5-1, 4-2 şi 3-3. Dacă jucătorul 2 acceptă propunerea făcută de jucătorul 1,
cele 6 unităţi valorice sunt ı̂mpărţite conform propunerii respective, dar dacă
jucătorul 2 refuză propunerea făcută de jucătorul 1, oferta este anulată (adică
ambii jucători primesc 0 unităţi valorice). Situaţia descrisă poate fi mode-
lată uşor ca un joc ı̂n formă extensivă cu informaţie (completă şi) perfectă,
reprezentat ı̂n Figura 2.16 (a), unde alternativele disponibile jucătorului 2 –
a(cceptă) şi r(espinge) – sunt indexate pentru a face clar la care propunere
a jucătorului 1 se referă. Echilibrul perfect pe subjoc al jocului dinamic
din Figura 2.16 (a) este reprezentat ı̂n Figura 2.16 (b) cu ajutorul săgeţilor.
Este natural (sub presupunerea de raţionalitate perfectă) ca jucătorul 2 să ac-
cepte oricare dintre cele trei propuneri ale jucătorului 1 fiindcă ı̂n caz contrar
acest jucător va primi 0 unităţi valorice ı̂n loc de 1, 2 sau 3 unităţi valorice.
Bazat pe aceasta, jucătorul 1 va alege alternativa cea mai atractivă pentru el
(5-1). În termeni de strategii ale jucătorilor (planuri complete de acţiune ale
fiecărui jucător de-a lungul arborelui jocului), echilibrul perfect pe subjoc
este profilul strategic (5-1,(a1 , a2 , a3 )).

(a)

(b)

Figure 2.16: Forma extensivă a unui joc de tip ”ultimatum”

40
Formei extensive din Figura 2.16 (a) ı̂i corespunde o formă normală unică
reprezentată ı̂n Figura 2.17 (a) ca un joc bimatriceal ale cărui linii corespund
la strategiile pure ale jucătorului 1, ı̂n ordinea 5-1, 4-2, 3-3, şi ale cărui
coloane corespund la cele 8 strategii ale jucătorului 2, ı̂n ordinea: (a1 , a2 , a3 ),
(a1 , a2 , r3 ), (a1 , r2 , a3 ), (a1 , r2 , r3 ), (r1 , a2 , a3 ), (r1 , a2 , r3 ), (r1 , r2 , a3 ) şi
(r1 , r2 , r3 ). Acest joc ı̂n formă normală are 7 echilibre Nash care sunt marcate
cu ∗ ı̂n Figura 2.17 (b). Dintre aceste echilibre Nash numai echilibrul Nash
(5-1, (a1 , a2 , a3 )), adică (linia 1, coloana 1) a bimatricei, este ”credibil” fiind
unicul echilibru Nash ı̂n strategii nedominate al jocului. Acest echilibru Nash
coincide cu echilibrul perfect pe subjoc din Figura 2.16 (b) pentru jocul ı̂n
formă extensivă care a generat această formă normală.

5, 1 5, 1 5, 1 5, 1 0, 0 0, 0 0, 0 0, 0
4, 2 4, 2 0, 0 0, 0 4, 2 4, 2 0, 0 0, 0
3, 3 0, 0 3, 3 0, 0 3, 3 0, 0 3, 3 0, 0
(a)

5, 1∗ 5, 1∗ 5, 1∗ 5, 1∗ 0, 0 0, 0 0, 0 0, 0
4, 2 4, 2 0, 0 0, 0 4, 2∗ 4, 2∗ 0, 0 0, 0
3, 3 0, 0 3, 3 0, 0 3, 3 0, 0 3, 3∗ 0, 0
(b)

Figure 2.17: Forma normală a unui joc de tip ”ultimatum”

Exemplul 2.19. (Un joc de piaţă extins) Considerăm o versiune mai amplă
a unui joc de piaţă de tipul celui descris ı̂n Exemplul 2.17. Presupunem, ca
şi ı̂n prima versiune a Exemplului 2.17, că ı̂ntâi firma 2 decide dacă intră
pe piaţa de jocuri video (strategia I) sau renunţă (strategia R), după care
firma 1, observând alternativa aleasă de firma 2, decide dacă va lupta cu
firma 2 (spre exemplu printr-o campanie publicitară costisitoare) ı̂n scopul
distrugerii acesteia sau se va acomoda intrării pe piaţă a firmei 2. Firma
2, observând alternativa de comportare adoptată de firma 1 ca răspuns la
intrarea sa pe piaţă, va trebui să decidă modul său de comportare strategică
ı̂n continuare: ori să intre ı̂n luptă cu firma 1 ca să-şi consolideze poziţia pe
piaţă, ori, pur şi simplu, să se acomodeze situaţiei existente.

41
O situaţie de tipul celei descrise ı̂n Exemplul 2.19 este modelată ca un
joc ı̂n formă extensivă ı̂n Figura 2.18 (a). Alternativele L (luptă) şi A (se
acomodează) sunt indexate pentru a face clar jucătorul la care se referă şi,
pentru jucătorul 2, situaţia particulară ı̂n desfăşurarea jocului. Un echilibru
perfect pe subjoc pentru acest joc este reprezentat ı̂n Figura 2.18 (b) cu aju-
torul săgeţilor. El poate fi determinat cu uşurinţă folosind metoda inducţiei
ı̂napoi. Figura 2.10 (a) marchează subjocurile jocului iniţial, folosite ı̂n cadrul
inducţiei ı̂napoi.

(a)

(b)

Figure 2.18: Forma extensivă u unui joc de piaţă extins

Formei extensive din Figura 2.18 (a) ı̂i corespunde o formă normală unică
reprezentată ı̂n Figura 2.19 (a) ca un joc bimatriceal. Jucătorul 1 are două

42
strategii pure: L1 – să lupte ı̂mpotriva firmei 2 – şi A1 – să se acomodeze
intrării pe piaţă a firmei 2, corespunzând, ı̂n această ordine, liniilor bimatricii.
Jucătorul 2 are 8 strategii pure, ce corespund coloanelor bimatricei ı̂n or-
dinea: (I, L2 , L3 ), (I, L2 , A3 ), (I, A2 , L3 ), (I, A2 , A3 ), (R, L2 , L3 ), (R, L2 , A3 ),
(R, A2 , L3 ), (R, A2 , A3 ). Acest joc ı̂n formă normală are 3 echilibre Nash
marcate cu ∗ ı̂n Figura 2.19 (b). Dintre acestea numai profilul strategic
(A1 , (I, L2 , A3 )), adică (linia 2, coloana 2) a bimatricei, este un echilibru
Nash ”credibil” fiind unicul echilibru Nash ı̂n strategii nedominate. Acest
echilibru Nash coincide cu echilibrul perfect pe subjoc din Figura 2.18 (b)
pentru jocul ı̂n formă extensivă care a generat această formă normală.

2, 2 2, 2 4, 1 4, 1 9, 0 9, 0 9, 0 9, 0
2, 3 5, 4 2, 3 5, 4 9, 0 9, 0 9, 0 9, 0
(a)

2, 2∗ 2, 2 4, 1 4, 1 9, 0 9, 0 9, 0 9, 0
2, 3 5, 4∗ 2, 3 5, 4∗ 9, 0 9, 0 9, 0 9, 0
(b)

Figure 2.19: Forma normală a unui joc de piaţă extins

Încheiem acest paragraf cu un exemplu de utilizare a formei normale


ı̂n cadrul inducţiei ı̂napoi pentru determinarea echilibrului Nash perfect pe
subjoc.

Exemplul 2.20. Considerăm jocul ı̂n formă extensivă din Figura 2.10 (b) şi
Figura 2.12. Forma sa normală şi cea a subjocului său sunt reprezentate ı̂n
Figura 2.20. Echilibrul Nash al subjocului este profilul strategic (A, X). Jocul
complet are trei echilibre Nash: (U A, X), (DA, Y ) şi (DB, Y ). Considerând
restricţia acestor echilibre Nash la subjoc obţinem (A, X), (A, Y ) şi (B, Y ).
Concludem ca numai echilibrul Nash (U A, X) este perfect pe subjoc. Acest
echilibru perfect pe subjoc este de asemenea obţinul folosind forma extensivă
(vezi Figura 2.12).

43
X Y
UA 3, 4 1, 4 X Y
UB 2, 1 2, 0 A 3, 4 1, 4
DA 2, 6 2, 6 B 2, 1 2, 0
DB 2, 6 2, 6
(a) (b)

Figure 2.20: Forme normale folosite ı̂n inducţia ı̂napoi

2.4 Extensia mixtă şi echilibre Nash ı̂n strategii mixte

În paragraful 2.1 am introdus forma normală pentru jocuri necooperative de n


persoane (n ≥ 2) şi noţiunea de echilibru Nash ı̂n strategii pure. Problemele
fundamentale abordate au fost existenţa şi calcularea echilibrelor Nash pure
pentru jocuri matriceale şi bimatriceale. Am văzut că nu toate jocurile ma-
triceale şi bimatriceale au echilibre Nash pure. Clase de jocuri necooperative
care au echilibre Nash pure, cum sunt jocurile de tip potenţial şi congestie, au
fost introduse şi unele exemple rezolvate. Identificarea jocurilor matriceale
care au echilibre Nash pure s-a bazat ı̂n principal pe căutarea punctelor şa (ı̂n
strategii pure) folosind matricea iniţială a jocului sau cea obţinută prin eli-
minarea iterativă a liniilor şi coloanelor dominate. Determinarea echilibrelor
Nash pure pentru jocuri (bi)matriceale s-a făcut folosind diagrame cu săgeţi,
metoda eliminării iterative a liniilor şi coloanelor dominate, şi funcţiile cel
mai bun răspuns (ı̂n strategii pure) ale fiecărui jucător la toate strategiile
pure ale celuilalt jucător. Totuşi multe jocuri matriceale obţinute prin mo-
delarea de situaţii practice nu au punct şa ı̂n strategii pure, şi cele mai multe
jocuri bimatriceale nu au echilibre Nash ı̂n strategii pure. Pentru asemenea
jocuri e dificil să se recomande jucătorilor strategii optimale (din punctul
de vedere al teoriei jocurilor) de folosit ı̂n situatia de joc analizată. Este
ı̂nsă ı̂ntotdeauna posibil, ı̂ntr-un joc finit, să se recomande fiecărui jucător
o (schemă raţională de) randomizare pe mulţimea strategiilor sale (pure),
adică o strategie mixtă optimală.
O strategie mixtă pentru jucătorul i ı̂n jocul hN, {Xi }i∈N , {Ki }i∈N i este
|X |
o distribuţie de probabilitate σi = (σi1 , ...., σi i ) pe mulţimea Xi a strategi-
ilor sale pure, adică un vector cu componente nenegative a căror sumă este
egală cu 1. O strategie pură poate fi considerată ca un caz degenerat de

44
strategie mixtă care atribuie probabilitatea 1 acelei strategii pure şi proba-
bilitatea 0 tuturor celelalte strategii pure ale jucătorului respectiv.
YNotăm
cu Σi mulţimea strategiilor mixte σi ale jucătorului i. Atunci Σ = Σi de-
i∈N
semnează mulţimea (convexă a) tuturor combinaţiilor de strategii mixte ale
jucătorilor. Dacă σ = (σ1 , ..., σn ) ∈ Σ, atunci Ki (σ) este plata aşteptată de
jucătorul i când jucătorii aleg profilul strategic σ. Extensia mixtă a jocului
hN, {Xi }i∈N , {Ki }i∈N i este jocul hN, {Σi }i∈N , {Ki }i∈N i care foloseşte strate-
giile mixte şi plăţile aşteptate ale jucătorilor. Un echilibru Nash ı̂n strategii
mixte, numit şi echilibru Nash mixt, este o combinaţie σ ∗ = (σ1∗ , ..., σn∗ ) de
strategii mixte astfel ı̂ncât strategia σi∗ a fiecărui jucător i maximizează plata
aşteptată de acest jucător dacă strategiile celorlalţi jucători (notate cu σ−i )
sunt menţinute fixe, adică

Ki (σ ∗ ) = max K(σi , σ−i



) pentru toţi i ∈ N.
σi

Existenţa echilibrelor Nash ı̂n strategii mixte pentru jocuri finite a fost
demonstrată de Nash (1950a) folosind teorema de punct fix a lui Brouwer.

Teorema 2.21. (Nash) Orice joc strategic finit are cel puţin un echilibru
Nash ı̂n strategii mixte.

În cele ce urmează ne concentrăm atenţia asupra calculării echilibrelor


Nash (ı̂n strategii mixte) ale jocurilor matriceale şi bimatriceale. Fie A =
(a(i, j))i=1,...,m;j=1,...,n un joc matriceal (de tip m×n). Mulţimea strategiilor
mixte pentru jucătorul 1 este
( m
)
X
∆m = p ∈ IRm | p ≥ 0, pi = 1 ,
i=1

iar mulţimea strategiilor mixte ale jucătorului 2 este


( n
)
X
∆n := q ∈ IRn | q ≥ 0, qj = 1 .
j=1

Extensia mixtă a lui A este jocul infinit


m X
X n
m n
h∆ , ∆ , K, Li cu K(p, q) := pi aij qj = pT Aq; L(p, q) := −K(p, q).
i=1 j=1

45
Lema 2.22. Valoarea inferioară şi valoarea superioară pentru jocul A satis-
fac relaţiile:

(i) v(A) = sup min pT Aej ;


p∈∆m j∈{1,...,n}

(ii) v̄(A) = infn max eTi Aq, unde ej este vectorul j din baza standard
q∈∆ i∈{1,...,m}
ı̂n IRn .

Teorema 2.23. (Minmax, John von Neumann) Pentru fiecare joc matriceal
v(A) = v̄(A).

Strategiile mixte optimale ale jucătorilor şi valoarea unui joc matriceal pot
fi determinate ı̂ntotdeauna prin rezolvarea unei perechi de programe liniare.
Această metodă generală de rezolvare a jocurilor matriceale nu va fi tratată
ı̂n acest curs. În cele ce urmează prezentăm metode pentru a rezolva jocuri
matriceale mici, adică jocuri de tip 2 × 2, 2 × n şi m × 2, şi jocuri simetrice.
Multe jocuri matriceale obţinute prin modelarea unei situaţii pur competitive
sunt ori de tip 2×2, 2 × n, m × 2, ori pot fi reduse la un astfel de joc pe baza
eliminării iterative a liniilor şi coloanelor dominate. Strategiile dominate
sunt determinate prin relaţia de dominare introdusă ı̂n paragraful 2.1 şi/sau
prin relaţia de dominare stochastică, pe care o introducem aici. Spunem
că o strategie pură a unui jucător este dominată stochastic dacă există o
combinaţie liniară a altor strategii pure ale acelui jucător care o domină.
Rezolvarea jocului iniţial poate fi astfel redusă uneori la rezolvarea unui joc
matriceal de tipul 2 × 2, 2 × n sau m × 2. Strategiile optimale ale jocului
mic, completate cu componente egale cu zero pentru liniile şi/sau coloanele
ignorate (pe baza relaţiei de dominare (stochastică)), sunt strategii optimale
ale jocului iniţial.

Rezolvarea jocurilor matriceale de tip 2×2. Fie A un joc matriceal de


tip 2×2. Pentru a determina strategiile optimale ale celor doi jucători, căutăm
ı̂ntâi un punct şa (ı̂n strategii pure) verificând dacă valoarea inferioară a
jocului coincide cu valoarea superioară a jocului, adică dacă există un element
al matricei care este cel mai mic ı̂n linia sa şi cel mai mare ı̂n coloana sa. Dacă
există un punct şa, atunci el determină strategiile optimale (linia şi coloana
corespunzătoare), care sunt deci strategii pure. Dacă nu există punct şa (ı̂n
strategii pure), aceasta ı̂nseamnă că strategiile optimale (dacă există) trebuie
să fie strategii mixte, ı̂n care fiecare jucător foloseşte ambele strategii pure

46
cu probabilităţi (strict) pozitive. Pentru a le determina formăm matricea
adjunctă A∗ (interschimbând elementele de pe diagonala principală şi luând
opusul celorlalte două elemente). Vectorii JA∗ şi A∗ J T , unde J = (1, 1),
corespund atunci sumării liniilor şi coloanelor, iar strategiile optimale vor
fi proporţionale cu JA∗ şi A∗ J T ; constanta multiplicativă este aleasă astfel
ı̂ncât suma componentelor strategiilor optimale să fie egală cu 1. Valoarea
jocului se determină folosind formula v=(a11 a22 −a21 a12 )/(a11 +a22 −a21 −a12 ).
Rezolvarea jocurilor matriceale de tip 2×n şi m×2. În orice joc de
tipul 2 × n sau m × 2 există ı̂ntotdeauna ori un punct şa (ı̂n strategii pure)
ori o submatrice de tipul 2 × 2 care dă soluţia jocului. O procedură generală
pentru a rezolva un joc matriceal de tip 2 × n constă din următorii patru
paşi:
1. Caută un punct şa.
2. Dacă nu există puncte şa, vezi dacă există coloane dominate (stochas-
tic) şi şterge-le.
3. Din coloanele rămase ia toate combinaţiile de câte două coloane şi
rezolvă toate jocurile de tip 2 × 2 obţinute.
4. Ia jocul care are cea mai mică valoare. Strategiile optimale pentru
acest joc sunt strategii optimale ale jocului iniţial, completând cu 0
probabilităţile coloanelor nefolosite ı̂n acest joc de tip 2 × 2.
Pentru jocuri matriceale de tip m×2 există o procedură similară, constând
din următorii patru paşi:
1. Caută un punct şa.
2. Daca nu există puncte şa , vezi dacă există linii dominate (stochastic)
şi şterge-le.
3. Din liniile rămase ia toate combinaţiile de câte două linii şi rezolvă
toate jocurile de tip 2 × 2 obţinute.
4. Ia jocul care are cea mai mare valoare. Strategiile optimale pentru
acest joc sunt strategii optimale ale jocului iniţial, completând cu 0
probabilităţile liniilor nefolosite de acest joc de tip 2 × 2.
Aşa cum am menţionat deja, este uneori posibil ca jocuri matriceale de
tip m × n, cu m, n ≥ 3, să fie reduse la jocuri de tip 2 × 2, 2 × n sau m × 2,
prin eliminarea iterativă a liniilor şi coloanelor dominate (stochastic). Un
caz special este când matricea jocului iniţial este simetrică şi există simetrie
completă ı̂ntre strategiile de acelaşi tip, ceea ce permite reducerea jocului

47
iniţial astfel ı̂ncât (cel puţin) unul dintre jucători să aibă doar două strategii
pure. Pentru rezolvarea jocurilor de tip 2×2, 2×n şi m×2 sunt de asemenea
disponibile metode grafice.
Rezolvarea jocurilor matriceale simetrice. Un joc matriceal simetric
este descris printr-o matrice pătratică A = (aij )i,j=1,...,n strâmb-simetrică,
adică o matrice ale cărei elemente satisfac egalitatea aij = −aji , pentru
toţi i, j = 1, ..., n. Într-un joc matriceal simetric ambii jucători au aceleaşi
strategii (mixte) optimale şi valoarea jocului este egală cu zero. Rezolvarea
jocurilor simetrice se bazează pe ideea că dacă r este o strategie optimală ı̂n
Xn
jocul A, atunci ri aij ≥ 0 pentru toţi j şi unele inegalităţi sunt egalităţi
i=1
(altfel v > 0). Strategia optimală r este o necunoscută cu r1 +r2 +...+rn = 1.
Vom determina componentele lui r folosind, ı̂mpreună cu ecuaţia precedentă,
n − 1 ecuaţii obţinute alegând n − 1 inegalităţi şi considerându-le ca egalităţi
şi rezolvând sistemul liniar de n ecuaţii cu n necunoscute obţinut. Dacă
ri ≥ 0 pentru toţi i şi inecuaţia a n-a e verificată, am obţinut o strategie
optimală.
Jocurile bimatriceale fără echilibre Nash ı̂n strategii pure (şi de asemenea
cele cu echilibre Nash ı̂n strategii pure) pot fi studiate folosind extensia mixtă
a jocului bimatriceal. Extensia mixtă a unui joc bimatriceal (A, B) de tip
m × n este dată prin (∆m , ∆n , K, L), unde K(p, q) = pT Aq şi L(p, q) =
pT Bq, pentru toţi p ∈ ∆m şi toţi q ∈ ∆n . Teorema 2.21 asigură existenţa
echilibrelor Nash ı̂n strategii mixte pentru orice joc bimatriceal finit (A, B),
adică existenţa echilibrelor Nash pentru extensia mixtă a acestui joc. Notăm
cu N E(A, B) mulţimea echilibrelor Nash pentru extensia mixtă a lui (A, B).
Fie p ∈ ∆m şi q ∈ ∆n . Suportul strategiei mixte p a jucătorului 1 este C(p) :=
{i ∈ {1, ..., m} | pi > 0}. Mulţimea celor mai bune răspunsuri ı̂n strategii
pure ale jucătorului 1 la strategia mixtă q este P B1 (q) := {i ∈ {1, ..., m} |
eTi Aq = max eTr Aq}, iar mulţimea celor mai bune răspunsuri ı̂n strategii
r∈{1,...,m}
mixte ale jucătorului 1 la q este B1 (q) := {p ∈ ∆m | pT Aq = max eTr Aq}.
r∈{1,...,m}
Analog se definesc C(q), P B2 (p) şi B2 (p).

Teorema 2.24. Fie (A, B) un joc bimatriceal de tip m × n, p ∈ ∆m şi


q ∈ ∆n . Profilul strategic (p∗ , q ∗ ) este un echilibru Nash al extensiei mixte a
lui (A, B) dacă şi numai dacă C(p∗ ) ⊆ P B1 (q ∗ ) şi C(q ∗ ) ⊆ P B2 (p∗ ).

48
Strategiile mixte optimale ale jucătorilor şi plăţile jucătorilor corespunză-
toare acestor strategii pot fi ı̂ntotdeauna determinate folosind legatura dintre
teoria complementarităţii liniare şi jocuri bimatriceale. Acestă metodă ge-
nerală de rezolvare a jocurilor bimatriceale nu va fi prezentată aici. În cele
ce urmează prezentăm o metodă algebrică pentru determinarea echilibrelor
Nash ı̂n strategii mixte ale jocurilor bimatriceale de tip 2×2 şi o metodă
grafică pentru rezolvarea jocurilor de două persoane cu sumă variabilă.
Rezolvarea jocurilor bimatriceale de tip 2×2. Un echilibru Nash pen-
tru un joc bimatriceal (K(i, j)i=1,2; j=1,2 , L(i, j)i=1,2; j=1,2 ) poate fi determinat
folosind următoarea procedură:
1. Se formează jocurile matriceale K(i, j)i=1,2; j=1,2 şi L(i, j)i=1,2; j=1,2 , se-
parând plăţile celor doi jucători.
2. Se determină strategia mixtă optimală p∗ a jucătorului 1 ı̂n jocul ma-
triceal L şi strategia mixtă optimală q ∗ a jucătorului 2 ı̂n jocul K,
folosind metoda prezentată pentru jocuri matriceale de tip 2 × 2. Pe-
rechea (p∗ , q ∗ ) este o strategie mixtă optimală a jocului bimatriceal de
tip 2 × 2.
Această metodă este aplicabilă de asemenea ı̂n jocuri mai largi ce pot fi
reduse la tipul 2 × 2 prin eliminarea iterativă a liniilor şi coloanelor dominate
(stochastic).
Rezolvarea jocurilor de două persoane cu sumă variabilă. Fie G =
hX, Y, K, Li un joc de două persoane cu sumă variabilă. Fie B1 : Y →X,
B2 : X → Y multifuncţiile cel mai bun răspuns pentru jucătorul 1 şi, res-
pectiv, jucătorul 2 ı̂n jocul G. Fie G∗1 := {(x, y) ∈ X × Y | x ∈ B1 (y)}
şi G2 := {(x, y) ∈ X × Y | y ∈ B2 (x)}. Observăm că G2 este graficul
multifuncţiei B2 , iar G∗1 este imaginea graficului G1 ⊂ Y × X a lui B1 sub
aplicaţia Y × X → X × Y cu (y, x) → (x, y) pentru toţi (y, x) ∈ Y × X. De-
terminarea echilibrelor Nash ı̂n strategii mixte ale jocului se poate face prin
reprezentarea grafică, ı̂n acelaşi sistem de coordonate, a (multi)funcţiilor ”cel
mai bun răspuns” ale jucătorilor. Această metodă grafică se bazează pe fap-
tul că (x∗ , y ∗ ) ∈ N E(G) ←→ x∗ ∈ B1 (y ∗ ), y ∗ ∈ B2 (x∗ ) ←→ (x∗ , y ∗ ) ∈ G∗1 ,
(x∗ , y ∗ ) ∈ G2 ←→ (x∗ , y ∗ ) ∈ G∗1 ∩ G2 . Deci, (x∗ , y ∗ ) ∈ N E(G) ←→ (x∗ , y ∗ ) ∈
G∗1 ∩ G2 . Exemplificăm această metodă grafică folosind un joc denumit im-
propriu ”Bătălia sexelor”.
Exemplul 2.25. (Bătălia sexelor) Un cuplu trebuie să decidă dacă vor merge
ı̂mpreună la un meci de box sau la un spectacol de operă. Soţul preferă meciul

49
de box, ı̂n timp ce soţia preferă spectacolul de operă. Modelarea unei situaţii
de acest tip ca un joc necooperativ conduce la forma normală din Figura
2.21 (b). Notăm cu (x, 1 − x) strategia mixtă a jucătorului 1 şi cu (y, 1 − y)
strategia mixtă a jucătorului 2. Funcţiile de plată ale jucătorilor sunt:
K1 (x, y) = 3xy + (1 − x)(1 − y) = (4y − 1)x − y + 1,
K2 (x, y) = xy + 3(1 − x)(1 − y) = (4x − 3)y − 3x + 3.
Graficele corespunzătoare multifuncţiilor cel mai bun răspuns, G∗1 şi G2 , unde
G∗1 = {(x, y) | K1 (x, y) este maxim ı̂n raport cu x pentru y fixat},
G2 = {(x, y) | K2 (x, y) este maxim ı̂n raport cu y pentru x fixat},
sunt reprezentate ı̂n Figura 2.21(a) cu linie plină şi, respectiv, cu linie − − −.
Echilibrele Nash ale jocului, (0,0), (3/4, 1/4) şi (1,1), sunt de asemenea vi-
zualizate ı̂n Figura 2.21(a) ca puncte de intersecţie ale celor două grafice.

Meci Operă
Meci 3, 1 0, 0
Operă 0, 0 1, 3
(b)
Figure 2.21: Jocul ”Bătălia sexelor”

50
2.5 Informaţie şi jocuri necooperative
Teoria jocurilor necooperative ı̂ncearcă să prezică rezultatul ı̂n situaţii de de-
cizie interactivă, adică ı̂n situaţii ı̂n care rezultatul este determinat de către
acţiunile tuturor jucătorilor şi nici-un jucător nu are control complet asupra
situaţiei. Ea foloseşte presupunerea că jucătorii se comportă raţional, adică
urmează scopuri exogene bine-definite şi raţionează strategic, adică iau ı̂n
consideraţie atât cunoaşterea lor cât şi posibilităţile de comportare raţională
ale celorlalţi jucători. Informaţia disponibilă jucătorilor ı̂ntr-un joc necoope-
rativ face o mare diferenţă privind ceea ce jucătorii pot să facă sau ar trebui
să facă. În paragrafele precedente am studiat jocuri necooperative ı̂n formă
strategică (normală) şi ı̂n formă extensivă ı̂n care plăţile corespunzătoare ju-
cătorilor sunt deterministe şi ”common knowledge”. Forma extensivă a unui
joc are un caracter dinamic ı̂ntrucât ilustrează desfăşurarea secvenţială ı̂n
timp a jocului. Forma normală (strategică) analizează o situaţie conflictuală
folosind o descriere concisă, considerând o singură jucare a jocului şi pre-
supunând că jucătorii ı̂şi aleg alternativa strategică simultan şi independent.
Jocurile ı̂n formă normală studiate ı̂n paragrafele 2.1 şi 2.4 sunt de aceea
numite jocuri statice sau jocuri de tip ”one-shot”, ı̂n comparatie cu jocurile
ı̂n formă extensivă, care sunt numite jocuri dinamice. Jucarea repetată a
unui joc static (”one-shot”) de un număr finit sau infinit de ori are ı̂nsă un
caracter dinamic şi face obiectul de studiu al teoriei jocurilor prin modele
specifice. Mai departe, am văzut că ı̂ntr-un joc ı̂n formă extensivă jucătorii
pot avea informaţie perfectă şi/sau imperfectă. Un jucător are informaţie
perfectă când el ştie exact tot ce s-a ı̂ntâmplat până atunci, de fiecare dată
când o decizie trebuie făcută. Un joc are informaţie perfectă dacă fiecare
jucător ı̂n acel joc are informaţie perfectă. Dacă există jucători care nu au
informaţie perfectă, atunci jocul este un joc cu informaţie imperfectă.
O situaţie ı̂n care un jucător ştie ceva ce un alt jucător nu ştie, se numeşte
asimetrie de informaţie. Asimetriile de informaţie se ı̂ntâlnesc frecvent ı̂n
situaţiile practice. Informaţia imperfectă şi asimetriile informaţionale au
implicaţii pentru comportarea strategică a jucătorilor şi plăţile aşteptate
de jucători. Din punctul de vedere al caracterului simetric sau asimetric
al informaţiei de care dispun jucătorii, teoria necooperativă a jocurilor dis-
tinge ı̂ntre două tipuri de modele: jocuri cu informaţie completă şi jocuri cu
informaţie incompletă. Jocurile cu informaţie completă nu afişează asimetrii
informaţionale, cu excepţia posibilă a informaţiei asimetrice privind acţiunile
jucătorilor. Informaţia privată privind elemente intangibile ı̂n situaţii strate-

51
gice poate fi modelată prin ı̂ncorporarea unor evenimente aleatoare (numite
adeseori mutări ale naturii) ı̂n specificarea unui joc cu informaţie incom-
pletă. Expresia informaţie incompletă se referă la jocuri care au mutări ale
şansei (naturii) care generează informaţie asimetrică pentru jucători. Mo-
delele studiate ı̂n paragrafele 2.1-2.4 sunt jocuri cu informaţie completă.
Am studiat aşadar următoarele tipuri de jocuri necooperative: jocuri statice
cu informaţie completă; jocuri dinamice cu informaţie completă şi perfectă;
jocuri dinamice cu informaţie completă dar imperfectă. În toate aceste mo-
dele de jocuri necooperative se presupune că jucătorii au capacităţi ideale
de raţionare şi comportare strategică şi că plăţile posibil de obţinut de către
jucători sunt deterministe şi common knowledge, fiind ori indicate explicit ı̂n
descrierea jocului, ori plăţile aşteptate de jucători (când şansa joacă un rol)
care pot fi calculate de toţi jucătorii pe baza descrierii jocului. Selectarea
deciziilor optimale de către jucători se bazează pe principiul că a câştiga mai
mulţi bani (sau a pierde mai puţini bani) este ı̂ntotdeauna mai bine. În cazul
unui joc de tip cost , selectarea strategiei optimale se bazează pe principiul
că a plăti un cost mai mic e mai bine decât a plăti un cost mai mare.
Reamintim că jocurile statice cu informaţie completă sunt modele de
forma hN, {Xi }i∈N , {Ki }i∈N i . Predicţii privind comportarea optimală a ju-
cătorilor se pot obţine folosind noţiunea de echilibru Nash ı̂n strategii pure
(echilibru Nash pur) sau ı̂n strategii mixte (echilibru Nash mixt). Tehnici
folositoare pentru rezolvarea jocurilor statice cu informaţie completă sunt:
eliminarea iterativă a strategiilor (strict) dominate (stochastic), utilizarea
funcţiilor celui mai bun răspuns (ı̂n strategii pure sau mixte), teoria pro-
gramării liniare şi cea a complementarităţii liniare, metode pentru tipuri
particulare de jocuri (de tip 2×2, 2×n, m×2 şi simetrice).
Modelul de joc static cu informaţie incompletă, numit joc strategic de
tip Bayes (”static Bayesian game”), este o extensie a modelului de joc static
cu informaţie completă. Un joc static Bayesian este un model de forma
hN, {Ai }i∈N , {Ti }i∈N , {pi }i∈N , {ui }i∈N i, ı̂n care N este mulţimea jucătorilor
şi pentru fiecare i ∈ N :
• Ai este mulţimea acţiunilor posibile ale jucătorului i.
• Ti este mulţimea tipurilor posibile pentru jucătorul i.
• pi este distribuţia de probabilitate existentă pe multimea Ti a tipurilor
jucătorului i.
• ui este funcţia de utilitate a jucătorului i (analoagă funcţiei de plată
Ki ).

52
Conceptul de soluţie specific este acela de echilibru Nash de tip Bayes
(”Bayesian Nash equilibrium”), o extensie a noţiunii de echilibru Nash.
Reamintim că jocurile dinamice cu informaţie completă (şi perfectă sau
imperfectă) sunt modele de forma hN, T i, unde T este arborele jocului.
Recunoaştem dacă un joc ı̂n formă extensivă este cu informaţie perfectă
sau imperfectă privind la mulţimile de informaţie ale jucătorilor (delimitate
grafic prin − − −). Întrucât arborele jocului ı̂n formă extensivă conţine
toată informaţia necesară pentru determinarea strategiilor tuturor jucăto-
rilor, modelul de joc dinamic cu informaţie completă poate fi considerat
ca o extensie a modelului de joc static cu informaţie completă, de forma
hN, T, {Xi }i∈N i, unde Xi este mulţimea strategiilor jucătorului i (planuri
complete de acţiune ale jucătorului i de-a lungul arborelui T al jocului).
Predicţii privind comportarea optimală a jucătorilor pot fi obţinute folosind
conceptul de echilibru Nash perfect pe subjoc, care selectează dintre echili-
brele Nash ale jocului (ı̂n formă normală) corespunzător doar pe cele care
sunt ”credibile”. Am văzut că echilibrele Nash perfecte pe subjoc pot fi de-
terminate folosind metoda inducţiei ı̂napoi pe baza formei extensive a jocului
sau pe baza formelor normale ale jocului iniţial şi ale tuturor subjocurilor
sale.
Modelul de joc dinamic (ı̂n formă extensivă) cu informaţie incompletă
este o extensie a modelului de joc ı̂n formă extensivă cu informaţie com-
pletă care se bazează pe considerarea mulţimilor de informaţie ale jucătorilor
ı̂ncorporând elemente de tip ”belief” (”information set(s) with players’ be-
lief”). Figura 2.22 ilustrează deosebirea dintre forma extensivă a unui joc
cu informaţie completă (Figura 2.22(a)) şi a unuia cu informaţie incompletă
(Figura 2.22(b)) ce modelează o aceeaşi situaţie strategică, descrisă ı̂n Exem-
plul 2.26, pentru două ipostaze diferite.

Exemplul 2.26. (Jocul investiţiei) Doi prieteni trebuie să decidă dacă să
investească sau nu efort ı̂n repararea unui motociclete stricate ce aparţine
unuia dintre ei, dat fiind că după aceea ar putea-o folosi ı̂n comun. Unul
poate repara partea mecanică a motocicletei, iar celălalt partea ei electrică.
Presupunem că motocicleta e proprietatea jucătorului 1. Astfel, pe lângă
acţiunile posibile I (investeşte) şi N (nu investeşte), valabile ambilor jucători,
jucătorul 1 are posibilitatea să decidă dacă, după repararea motocicletei, o va
folosi singur sau ı̂n comun. Strategiile corespunzând acestor decizii le notăm
cu E (pentru cazul când jucătorul 1 e egoist) şi A (pentru cazul când el e
altruist).

53
Evident, ambii jucători ştiu că jucătorul 1 poate fi egoist sau altruist.
Plăţi posibile pentru acest joc cu informaţie completă sunt date ı̂n Figura
2.22 (a).

(a)

(b)

Figure 2.22: Jocul investiţiei

54
Situaţia analizată poate fi descrisă mai precis luând ı̂n consideraţie faptul
că majoritatea indivizilor sunt, ı̂n mod obişnuit, ı̂nclinaţi să pună intere-
sele individuale mai presus de cele colective (induse de cooperare) şi care
e tipul fiecărui individ particular depinde de fapt de natură, fiecare individ
cunoscându-şi propriul tip. Ca urmare, o modelare mai realistă a situaţiei ca
un joc se face considerând natura ca un jucător cu două strategii: O (pentru
tip obişnuit) cu probabilitate mai mare, spre exemplu 3/4, şi C (pentru tip
cooperant) cu probabilitate mai mică, spre exemplu 1/4. Jocul obţinut este
unul cu informaţie incompletă, fiindcă natura generează informaţie asimetri-
că pentru jucători. Jocul dinamic cu informaţie incompletă corespunzător
jocului dinamic cu informaţie completă din Figura 2.22 (a) este reprezentat
ı̂n Figura 2.22 (b).
UnDjoc ı̂n formă extensivă
E cu informaţie incompletă este un tiplet de
forma N, T , {Xi }i∈N , unde N este mulţimea jucătorilor, Te este ansamblul
e
mulţimilor de informaţie (continând informaţia de tip ”belief”) ale jucători-
lor, şi pentru fiecare i ∈ N, Xi este mulţimea strategiilor jucătorului i.
Conceptul de soluţie specific jocurilor dinamice cu informaţie incompletă
este acela de echilibru perfect de tip Bayes (”perfect Bayesian equilibrium”).
Acesta este o extensie a conceptului de perfect echilibru pe subjoc. Un
echilibru perfect de tip Bayes poate fi de asemenea considerat ca o extensie
a noţiunii de echilibru Nash de tip Bayes.
Adesea, participanţii ı̂ntr-o situaţie de interacţiune strategică trebuie să
facă decizii ı̂n condiţii de incertitudine. Ei pot fi:
• Incerţi cu privire la parametrii obiectiv ai mediului (”environment”) ı̂n
care acţionează.

• Imperfect informaţi asupra evenimentelor ce pot apărea ı̂n joc.

• Incerţi cu privire la acţiunile (posibil nedeterministe ale) altor jucători.

• Incerţi cu privire la modul de raţionare a celorlalţi jucători.

Principiile de raţionalitate şi cunoaşterea de către jucători a posibilităţilor


de raţionare ale jucătorilor joacă un rol fundamental ı̂n teoria necooperativă
a jocurilor. În teoria jocurilor necooperative se presupune curent că regulile
jocului sunt cunoscute perfect de către toţi jucătorii şi că abilitatea jucăto-
rilor de a analiza jocul este ideală. Este common knowledge că toţi jucătorii
sunt raţionali şi ı̂nţeleg perfect jocul care este jucat, adică fiecare jucător

55
cunoaşte jocul, fiecare jucător ştie că fiecare jucător cunoaşte jocul, ş.a.m.d.
Optimalitatea comportării jucătorilor se bazează pe cunoaşterea pe care o
au jucătorii. Nu numai cunoaşterea de către un jucător a unui parametru
exogen, ci şi cunoaşterea sa despre cunoaşterea celorlalţi jucători joacă un
rol. În modelele de joc studiate se presupune că posibilităţile de raţionare ale
jucătorilor sunt nelimitate, ceea ce asigură ı̂nvăţarea instantanee a jocului
şi selectarea ı̂n timp real a strategiei optimale. În cele mai multe situaţii
practice o asemenea presupunere nu este realistă. Jocurile cu raţionalitate
limitată (”bounded rationality”) fac de asemenea obiectul de studiu al teoriei
jocurilor.

56
3 JOCURI COOPERATIVE

Acest capitol este dedicat modelelor din teoria cooperativă a jocurilor. For-
mele de reprezentare a jocurilor folosite ı̂n aceste modele sunt forma strate-
gică şi forma coaliţională, iar noţiunea de coaliţie (grup de jucători) joacă
un rol central. Un joc ı̂n formă strategică sau ı̂n formă coaliţională este
cooperativ dacă jucătorii pot face acorduri ferme (”binding agreements”)
privind alegerea strategiilor sau distribuţia plăţilor, chiar dacă aceste acor-
duri nu sunt specificate de regulile jocului sau implicate de acestea. Un
acord (sau contract) este ferm dacă nerespectarea lui conduce la penalizări
monetare, fapt care ı̂i ı̂mpiedică pe jucători să nu-l respecte. În paragra-
ful 3.1 introducem jocuri cooperative ı̂n formă strategică şi arătăm că orice
joc necooperativ ı̂n formă normală (strategică) poate fi jucat ”cooperativ”
dacă acordurile ferme ı̂ntre jucători sunt permise. Într-un joc cooperativ ı̂n
formă strategică jucătorii ı̂şi corelează strategiile pure sau folosesc strategii
corelate. Paragrafele 3.2 - 3.5 sunt dedicate jocurilor cooperative ı̂n formă
coaliţională cu plăţi laterale, numite şi jocuri ı̂n forma funcţiei caracteris-
tice. Acest model teoretic de joc cooperativ a fost introdus de către John
von Neumann şi Oskar Morgenstern (1944) pornind de la forma strategică a
jocurilor cu utilităţi transferabile (adică utilităţi care sunt liniare ı̂n bani).
Valoarea fiecărei coaliţii S ⊆ N , unde N ={1, 2, ..., n} este mulţimea finită
şi nevidă a jucătorilor, ı̂ntr-un joc strategic cu utilităţi transferabile este va-
loarea sa maximă ı̂n jocul de două persoane cu sumă nulă unde adversarul
lui S este N \ S (ansamblul jucătorilor care nu sunt membri ai coaliţiei S) şi
strategii corelate sunt folosite de ambii jucători, S şi N \ S. În paragrafele
3.2-3.5 considerăm funcţia caracteristică (coaliţională) a unui joc cooperativ
ca o noţiune primară, ı̂ntrucât ı̂n multe situaţii de interacţiune strategică
unde cooperarea ı̂ntre jucători este posibilă şi benefică (adică conduce la
sporirea câştigurilor sau diminuarea costurilor) funcţia caracteristică poate
fi construită direct, din descrierea neformală a situaţiei, fără nici o referire la
un joc strategic. Paragraful 3.2 introduce noţiuni de bază ı̂n teoria jocurilor

57
cooperative ı̂n forma funcţiei caracteristice, incluzând noţiunea de sâmbure
(Gillies, 1953), care joacă ı̂n cadrul acestei teorii un rol similar cu cel al
noţiunii de echilibru Nash ı̂n teoria jocurilor necooperative. Paragrafele 3.3-
3.5 sunt dedicate conceptelor de soluţie de tip ”single-valued” cu rol predo-
minant ı̂n teoria jocurilor cooperative, şi anume: valoarea Shapley (Shapley,
1953), σ-valoarea şi τ -valoarea (Tijs, 1981), nucleolul (Schmeidler, 1969) şi
AL-valoarea (Tijs, 2005). În paragraful 3.6 analizăm rolul comunicării ı̂ntre
jucători şi al informaţiei disponibile jucătorilor ı̂n cadrul teoriei jocurilor
cooperative ı̂n forma funcţiei caracteristice. Sunt menţionate unele clase
de jocuri cooperative cu restricţii de comunicare ı̂ntre jucători şi jocuri cu
asimetrii informaţionale. Încheiem capitolul cu o privire globală asupra mo-
delelor teoriei jocurilor cooperative ı̂n formă coaliţională.

3.1 Jocuri cooperative ı̂n forma strategică


În capitolul 2 am studiat şi rezolvat jocuri necooperative, ı̂n care comuni-
carea ı̂ntre jucători ı̂nainte de ı̂nceperea jocului (”pre-play communication”),
acordurile ferme (contractele) şi plăţile laterale sunt interzise prin regulile
jocului. Chiar dacă comunicarea ı̂ntre jucători ı̂nainte de ı̂nceperea jocului
nu e interzisă, ea nu poate conduce la acorduri ferme ı̂ntre jucători privind
alegerea strategiilor sau distribuirea plăţilor. Rezolvarea jocurilor necoo-
perative s-a făcut folosind noţiunea de echilibru Nash şi variante ale sale.
Totuşi, aşa cum am văzut ı̂n paragraful 2.1, un profil strategic corespunzător
unui echilibru Nash pur ı̂n jucarea necooperativă a unui joc ar putea să nu
ofere cea mai avantajoasă alternativă de plată tuturor jucătorilor, chiar şi
ı̂n situaţia ı̂n care jocul are un echilibru Nash unic. Jucarea cooperativă a
unui joc ı̂n formă strategică, ı̂n situaţia când acordurile ferme ı̂ntre jucători
sunt permise (explicit sau implicit) poate ı̂nlătura acest inconvenient. Jocul
”Dilema prizonierilor”, reprezentat ı̂n Figura 2.4 (b), este un exemplu clasic
pentru evidenţierea diferenţelor dintre jucarea necooperativă şi cooperativă
a unui joc. În jocul ”Dilema prizonierilor”, doi suspecţi de crimă ı̂nchişi
pentru un conflict minor şi puşi ı̂n celule separate sunt interogaţi (sepa-
rat) făcându-li-se promisiunea de graţiere ı̂n caz de recunoaştere a crimei şi
denunţare a complicelui. Plăţile din jocul bimatriceal din Figura 2.4 (b) sunt
anii de ı̂nchisoare ce ı̂i aşteaptă pe cei doi deţinuţi pentru diferitele situaţii de
comportare strategică, fiecare dintre ei putând folosi una din două strategii:
R – recunoaşte crima făcută – şi N – nu o recunoaşte. Jucarea necooperativă
a acestui joc conduce la echilibrul Nash (unic), (linia 1, coloana 1) ı̂n Figura

58
2.4 (b), care asigură jucătorilor plăţi egale cu câte 5 ani de ı̂nchisoare. Totuşi,
ambii jucători ar putea obţine ”plăţi” mai bune, anume câte un singur an de
ı̂nchisoare, dacă ar alege (de comun acord) profilul strategic (linia 2, coloana
2) din Figura 2.4 (b), prin corelarea strategiilor lor pure. Considerăm acum
jocul de tip ”ultimatum” din Exemplul 2.18. În jucarea necooperativă a aces-
tui joc, jucătorul 2 este de fapt forţat să accepte oricare dintre propunerile
jucătorului 1 fiindcă altfel nu primeşte nimic. Jucarea cooperativă a aces-
tui joc va conduce, prin acordul jucătorilor asupra diviziunii celor 6 unităţi
valorice, la schema de divizare 3-3, care este echitabilă (”fair”) pentru ambii
jucători.
În jucarea cooperativă a unui joc (de tip câştig) ı̂n formă strategică se
caută o soluţie optimală, adică un profil strategic care asigură o plată to-
tală maximă, şi o distribuţie echitabilă pentru toţi jucătorii a acestei plăţi
maxime. O asemenea distribuţie ar trebui să ia ı̂n consideraţie poziţiile de
negociere ale jucătorilor (care sunt diferite de abilităţile lor de negociere)
şi/sau posibilitatea efectuării de plăţi laterale ı̂ntre jucători. Într-un joc bi-
matriceal (A, B) (de tip câştig), o soluţie optimală şi o distribuţie echitabilă
a plăţii totale maxime ar putea fi calculate de către un arbitru imparţial şi
onest, urmând următoarea procedură:

1. Se determină valoarea ν a jocului A − B; aceasta reprezintă avantajul


relativ pe care jucătorul 1 ı̂l are asupra jucătorului 2.

2. Se determină plata totală maximă posibil de obţinut, notată cu P , ca


valoarea maximă a elementelor matricei A + B.

3. Dacă e posibil, se ı̂mparte plata totală maximă P astfel ı̂ncât jucătorul


1 primeşte ν unităţi valorice mai mult decât jucătorul 2 (adică se
păstrează avantajul relativ ν al jucătorului 1). Dacă profilul strate-
gic care corespunde plăţii totale maxime P dă prea mult unui jucător,
atunci (pentru a păstra cooperarea şi plata P ) acel jucător ar trebui să
facă o plată laterală (oferind celuilalt jucător parte din plata sa) astfel
ı̂ncât să se obţină o ı̂mpărţire a plăţii P care păstrează avantajul relativ
al jucătorului 1.

Exemplul 3.1. Ilustrăm aplicarea procedurii descrise mai sus considerând


două jocuri bimatriceale: jocul (A1 , B1 ) cu ν1 =3 şi P1 =5 care corespunde
unui profil strategic care asigură jucătorului 1 plata 4 şi jucătorului 2 plata

59
1, şi jocul (A2 , B2 ) cu ν2 =1 şi P2 =5 care corespunde unui profil strategic care
dă jucătorului 1 plata 1 şi jucătorului 2 plata 4. Observăm că pentru jocul
(A1 , B1 ) distribuţia (4,1) corespunzătoare profilului strategic optimal este
rezonabilă pentru ambii jucători fiindcă ea ı̂ncorporează avantajul relativ
al jucătorului 1 faţă de jucătorul 2. În cazul jocului (A2 , B2 ), jucătorul
2 trebuie să facă o plată laterală de 2 unităţi valorice către jucătorul 1,
pentru a respecta avantajul relativ al jucătorului 1 faţă de el. Astfel, jucarea
cooperativă a jocului bimatriceal (A2 , B2 ) conduce ı̂n final la plata 3 pentru
jucătorul 1 şi plata 2 pentru jucătorul 2.

Evident, procedura descrisă mai sus poate fi aplicată de asemenea unui joc
bimatriceal de tip cost cu modificarea pasului 2 al procedurii, unde, ı̂n acest
caz, elementul minim al matricii A + B va fi selectat. Pentru jocul ”Dilema
prizonierilor”, ν=0, P =2 şi distribuţia plăţilor pentru profilul strategic care
asigură plata totală 2 este (1,1). Această distribuţie e echitabilă pentru ambii
jucători. Evident, ı̂n jocul ”Dilema prizonierilor” jucătorii nu pot face plăţi
laterale.
În cele ce urmează, introducem noţiunea de joc cooperativ ı̂n formă strate-
gică şi ataşăm fiecărui joc necooperativ ı̂n formă normală (strategică) jocul
cooperativ ı̂n formă strategică corespunzător.

Un joc cooperativ ı̂n formă strategică este un triplet

hN, (Σ(S))∅6=S⊆N , {ui }i∈N i ,


unde: N este mulţimea finită şi nevidă a jucătorilor; pentru fiecare submul-
ţime nevidă S de jucători, Σ(S) este mulţimea nevidă a strategiilor lui S,
cu proprietatea Σ(S ∪ T )⊇Σ(S)×Σ(T ) pentru toţi S, T astfel ı̂ncât ∅ 6= S,
T ⊆N, S ∩ T = ∅; pentru fiecare i ∈ N, ui : Σ(N ) −→ IR este funcţia de plată
a jucătorului i.
Orice joc necooperativ finit ı̂n formă normală (strategică),
hN, {Xi }i∈N , {Ki }i∈N i ,

generează un joc cooperativ ı̂n formă strategică prin considerarea strategiilor


corelate. Fie S o submulţime nevidă de jucători (coaliţie).YO strategie core-
lată pentru S este o distribuţie de probabilitate pe XS = Xi . Notăm cu
i∈S
Σ(S) mulţimea tuturor strategiilor corelate pentru S şi cu σS o strategie core-
lată arbitrară ı̂n Σ(S). Presupunem că acordurile ferme ı̂ntre jucători sunt

60
permise şi orice strategie corelată σS pentru S 6= ∅ cu |S|=2 este sprijinită
printr-un acord ferm ı̂ntre membrii lui S. Pentru fiecare i ∈ N , considerăm
funcţia de plată ui : Σ(N ) −→ IR, definită prin
X
ui (σN )= σN (x)Ki (x) pentru toţi σN ∈ Σ(N ) şi toţi i ∈ N.
x∈XN

Astfel, situaţii de interacţiune strategică ı̂n care jucătorilor li se interzicea


ı̂ncheierea acordurilor ferme, modelate ı̂n capitolul 2 ca jocuri necooperative,
pot fi modelate ca jocuri cooperative ı̂n formă strategică dacă restricţiile
iniţiale privind comunicarea şi cooperarea ı̂ntre jucători sunt ridicate. Un
caz particular de joc cooperativ ı̂n formă strategică, obţinut pornind de la
un joc necooperativ ı̂n formă strategică prin admiterea acordurilor ferme
ı̂ntre jucători, este cel ı̂n care pentru fiecare coaliţie nevidă S considerăm
Σ(S)=XS , ceea ce corespunde corelării strategiilor pure ale jucătorilor. Ju-
carea cooperativă a jocului ”Dilema prizonierilor” corespunde astfel unui joc
cooperativ ı̂n formă strategică ı̂n care profilurile strategice pure sunt alese
prin acordul jucătorilor.

3.2 Jocuri cooperative ı̂n forma funcţiei caracteristice


şi sâmburele
Situaţii practice ı̂n care părţile implicate pot să-şi sporească câştigurile sau
să-şi reducă costurile prin cooperare pot fi modelate adesea folosind jocuri
cooperative ı̂n forma funcţiei caracteristice (cu plăţi laterale) de tip câştig
sau de tip cost.
Un joc cooperativ de tip câştig este o pereche hN, vi, unde N este mulţimea
finită şi nevidă a jucătorilor, adesea de forma N ={1, 2, ..., n}, iar v : 2N −→ IR
este funcţia caracteristică (coaliţională), cu v(∅)=0, unde pentru fiecare coali-
ţie (grup de jucători) S ∈ 2N \{∅}, v(S) reprezintă câştigul pe care S ı̂l poate
obţine prin cooperarea membrilor săi (fără ajutorul nici-unui alt jucător din
afara lui S).

Exemplul 3.2. Trei prieteni, etichetaţi ı̂n continuare cu 1, 2, 3, posesori


de materii prime de tip A şi B ı̂n cantităţile A1 = 0, A2 = 1, A3 = 5,
B1 = 3, B2 = 1, B3 = 9, plănuiesc să deschidă ı̂mpreună o ı̂ntreprindere
mică pentru a fabrica un produs care necesită pe unitate o unitate din ma-
teria primă A şi două unităţi din materia primă B şi se poate vinde cu 50

61
lei pe unitate. Cooperarea micilor ı̂ntreprinzători poate genera câştiguri, dar
ei vor intra ı̂n această afacere numai dacă vor cădea de acord asupra modu-
lui de distribuire a câştigului total. Teoria cooperativă a jocurilor poate fi
folositoare. Situaţia descrisă poate fi modelată ca un joc a cărui funcţie ca-
racteristică este v(∅) = v({1}) = v({2}) = 0, v({3}) = 200, v({1, 2}) = 50,
v({1, 3}) = v({2, 3}) = 250, v({1, 2, 3}) = 300. Un concept de soluţie din teo-
ria cooperativă a jocurilor poate fi apoi folosit pentru a propune o distribuţie
a celor 300 unităţi valorice ı̂ntre cei trei ı̂ntreprinzători (vezi Exemplul 3.19).

Un joc cooperativ de tip cost este o pereche hN, ci, unde N este mulţimea
finită şi nevidă a jucătorilor şi c : 2N −→ IR este funcţia coaliţională (carac-
teristică) cu c(∅)=0, unde pentru fiecare coaliţie S ∈ 2N \{∅}, c(S) reprezintă
costul pe care S trebuie să-l plătească dacă membrii ei cooperează. Exem-
plul 3.3 modelează ca un joc cooperativ de tip cost o situaţie privind insta-
larea unor sisteme de alarmă ı̂n apartamente. Orice joc cooperativ de tip
cost generează un joc cooperativ de tip câştig, unde pentru fiecare coaliţie
S ∈ 2N \{∅}, câştigul v(S) obţinut prin cooperare reprezintă economiile rea-
lizate de S prin reducerea costurilor ca urmare a cooperării membrilor săi şi
v(∅)=0, adică :
X
(3.1) v(S) := c({i}) − c(S), pentru toţi S ∈ 2N .
i∈S

Exemplul 3.3. Trei familii care locuiesc ı̂n acelaşi bloc de locuinţe vor să-şi
instaleze sisteme de alarmă cu aceeaşi firmă. Firma le face o ofertă cu cos-
turi pentru contracte individuale, costuri pentru contracte pentru câte două
familii şi costul pentru un contract colectiv. Cele trei familii trebuie să decidă
dacă cooperează sau nu ı̂n vederea reducerii costurilor şi, ı̂n situaţia ı̂n care
decid să coopereze, trebuie să cadă de acord asupra ı̂mpărţirii costului total.
Teoria cooperativă a jocurilor poate fi utilă pentru rezolvarea acestei proble-
me prin modelarea situaţiei ca un joc cooperativ de tip cost şi folosirea unui
concept de soluţie considerat rezonabil de către toate cele trei familii. Pentru
situaţia descrisă, N ={1, 2, 3}, iar oferta firmei generează funcţia coaliţiona-
lă c, cu c({1})=100, c({2})=90, c({3})=80, c({1, 2})=130, c({1, 3})=110,
c({2, 3})=110 şi c({1, 2, 3})=140. Evident, c(∅)=0. Economiile realizate de
cele trei familii prin cooperarea lor sunt descrise prin jocul de tip câştig cores-
punzător (obţinut folosind formula (3.1)): v(∅)=v({1})=v({2})=v({3})=0,
v({1, 2})=60, v({1, 3})=70, v({2, 3})=60 şi v({1, 2, 3})=130.

62
Într-un joc cooperativ de tip câştig jucătorii urmăresc maximizarea câş-
tigurilor, iar ı̂ntr-un joc de tip cost ei urmăresc minimizarea costurilor (sau,
echivalent, maximizarea economiilor ı̂n jocul de tip câştig asociat jocului de
tip cost). În cele de urmează, prin hN, vi vom subı̂nţelege un joc de tip câştig
şi prin hN, ci vom subı̂nţelege un joc de tip cost.
O reprezentare geometrică a jocurilor cooperative ı̂n forma funcţiei carac-
teristice identifică un joc hN, vi sau hN, ci cu |N |=n, cu un vector (punct)
n
ı̂n IR2 −1 , ale cărui componente sunt valorile funcţiei caracteristice pentru
o ordine fixată a celor 2n − 1 coaliţii nevide de jucători. În mod normal,
un joc este identificat cu funcţia sa caracteristică (coaliţională). Mulţimea
GN a funcţiilor coaliţionale v cu mulţimea jucătorilor N formează, ı̂n raport
cu adunarea şi ı̂nmulţirea cu un scalar a funcţiilor coaliţionale, un spaţiu
liniar (2n − 1)–dimensional. O bază interesantă a acestui spaţiu liniar este
mulţimea jocurilor unanime uT , T ∈ 2N \ {∅}, care sunt definite prin
(
1 dacă T ⊆S,
(3.2) uT (S)=
0 altfel.

Interpretarea unui joc unanim uT este că un câştig (sau o economie la costuri)
de o unitate valorică poate fi obţinut dacă şi numai dacă toţi jucătorii din
coaliţia T sunt implicaţi ı̂n cooperare. Orice joc v ∈ GN poate fi exprimat
ca o combinaţie liniară de jocuri unanime de forma
X X
(3.3) v= cT uT , cu cT = (−1)|T |−|S| v(S).
T ∈2N \{∅} S:S⊆T

Exemplul 3.4. Jocul v din Exemplul 3.3 se poate scrie sub forma
v = 60u{1,2} + 70u{1,3} + 60u2,3 − 60u{1,2,3} .

Jocurile unanime sunt un caz special de jocuri simple. Un joc v ∈ GN


se numeşte simplu dacă v(S) ∈ {0, 1} pentru toţi S ∈ 2N \ {∅}, v(∅)=0 şi
v(N )=1.

Exemplul 3.5. Considerăm următoarele situaţii de votare: votare prin


majoritate simplă (jumătate plus 1) şi votare cu majoritate minimă fixată şi
un grup cu putere veto. Primul tip de votare este folosit frecvent, inclusiv
pentru trecerea legilor ı̂n parlament. Presupunând că parlamentul constă din
100 membri, pentru a trece o lege prin parlament sunt necesare cel puţin 51
de voturi ı̂n favoarea legii supuse votului. Această situaţie poate fi modelată

63
prin jocul simplu v definit pentru fiecare S ∈ 2N \ {∅} prin v(S)=1 dacă
|S| ≥ 51 şi v(S)=0, altfel. Al doilea de tip de votare e folosit ı̂n Consiliul
Naţiunilor Unite care e format din 15 membri dintre care 5 membri, etichetaţi
aici cu 1, 2, 3, 4, 5, au putere veto şi unde pentru a vota o lege sunt necesare
cel puţin 9 voturi pro incluzând voturile pro ale tuturor membrilor cu putere
veto. Această situaţie poate fi modelată prin jocul simplu v definit pentru
fiecare S ∈ 2N \ {∅} prin v(S)=1 dacă |S| ≥ 9 şi {1, 2, 3, 4, 5}⊆S şi v(S)=0,
altfel.

Un joc v ∈ GN este 0-normalizat dacă v({i})=0 pentru toţi i ∈ N. Un joc


v ∈ GN este (0,1)-normalizat dacă v({i})=0 pentru fiecare i ∈ N şi v(N )=1.
Un joc v ∈ GN se numeşte monoton dacă v(S) ≤ v(T ) pentru toţi S, T ∈ 2N
cu S⊆T. Un joc v ∈ GN se numeşte nenegativ dacă pentru orice S ∈ 2N
avem v(S) ≥ 0. Un joc v ∈ GN se numeşte aditiv dacă v(S ∪ T )=v(S) + v(T )
pentru toţi S, T ∈ 2N cu S ∩ T = ∅. Un joc aditiv X este determinat de către
n
vectorul a=(v({1}), .., v({n})) ∈ IR ı̂ntrucât v(S)= ai pentru toţi S ∈ 2N .
i∈S
Jocurile aditive formează un subspaţiu liniar n-dimensional al spaţiului liniar
GN . Un joc v ∈ GN se numeşte neesenţial dacă X el este un joc aditiv. Un
N
joc v ∈ G se numeşte N -esenţial dacă v(N ) > v({i}). Cele mai multe
i∈N
jocuri cooperative de tip câştig care apar prin modelarea situaţiilor reale sunt
jocuri superaditive. Un joc v ∈ GN se numeşte superaditiv dacă v(S ∪ T ) ≥
v(S) + v(T ) pentru toţi S, T ∈ 2N cu S ∩ T = ∅. Cele mai multe jocuri
cooperative de tip cost care apar prin modelarea situaţiilor reale sunt jocuri
subaditive. Un joc v ∈ GN se numeşte subaditiv dacă v(S ∪ T ) ≤ v(S) + v(T )
pentru toţi S, T ∈ 2N cu S ∩ T = ∅. Un joc v ∈ GN se numeşte convex (Sha-
pley, 1971) dacă v(S ∪ T ) + v(S ∩ T ) ≥ v(S) + v(T ) pentru toţi S, T ∈ 2N .
Evident, orice joc convex este un joc superaditiv. Un joc care se exprimă
ca o combinaţie liniară cu coeficienţi pozitivi de jocuri unanime, conform cu
formula (3.3), este un joc convex. O coaliţie S ∈ 2N \ {∅} se zice că are
putere veto dacă v(T )=0 pentru toţi T astfel că S 6⊆ T. Un joc se numeşte
joc veto dacă există o coaliţie S ∈ 2N \ {∅} cu putere veto. Jocul de votare
corespunzând Consiliului Naţiunilor Unite, din Exemplul 3.5, este un joc veto
(coaliţia {1, 2, 3, 4, 5} are putere veto).
În jocul v ∈ GN , pentru fiecare S ∈ 2N şi pentru fiecare i ∈ S, contribuţia
marginală a lui i la S este Mi (S, v) := v(S)−v(S\{i}). În particular, pen-
tru fiecare i ∈ N , contribuţia marginală a lui i la N este Mi (N, v) :=

64
v(N )−v(N \{i}). Un joc v ∈ GN se numeşte un joc big boss cu n ca big
boss (Muto et al., 1988) dacă: (i) v este un joc veto unde coaliţia {n} are
putere veto; (ii) v este un joc monoton; (iii) v are proprietatea uniunii, adică
X
v(N ) − v(S) ≥ Mi (N, v) pentru fiecare S cu n ∈ S.
i∈N \S

Jocurile convexe şi jocurile big boss sunt cazuri speciale de jocuri balansate.
Definiţia jocurilor balansate se bazează pe noţiunea de aplicaţie balansată
N
(echilibrată). O aplicaţie
X λ : 2 \{∅} −→ IR+ se numeşte aplicaţie balansată
(echilibrată) dacă λ(S)eS =eN , unde eS este vectorul caracteristic al
S∈2N \{∅}
lui S, cu (e )i =1 dacă i ∈ S şi (eS )i =0 altfel. Un joc v ∈ GN se numeşte
S

balansatX(echilibrat) dacă pentru orice aplicaţie balansată λ : 2N \{∅} −→ IR+


avem λ(S)v(S) ≤ v(N ). Importanţa acestei noţiuni urmează din Teo-
S∈2N \{∅}
rema 3.8 care a fost demonstrată independent de Bondareva (1963) şi Sha-
pley (1967). O colecţie B de coaliţii S ∈ 2N \ {∅} este o colecţie balansată
(echilibrată) dacă există o aplicaţie balansată λ astfel ı̂ncât B={S ∈ 2N \{∅} |
λ(S) > 0}. O colecţie balansată se numeşte colecţie balansată minimală dacă
nu conţine o altă colecţie balansată. O colecţie B={S1 , S2 , ..., Sk } de coaliţii
nevide este balansată (echilibrată) dacă există αS1 , ..., αSk ∈ IR, αSj > 0,
X
j=1, ..., k, astfel ı̂ncât pentru toţi i ∈ N, αSj =1, unde coeficienţii αSj
j|i∈Sj
sunt ponderi asociate la fiecare coaliţie Sj (aceste ponderi sunt unic deter-
minate pentru colecţii balansate minimale).
Mulţimea GN a jocurilor cooperative de n persoane poate fi partiţionată
ı̂n clase echivalenţă ı̂n raport cu o relaţie de echivalenţă strategică, numită
S-echivalenţă, două jocuri v, w ∈ GN ı̂n aceeaşi clasă de echivalenţă fiind
”ı̂n esenţă” acelaşi joc. Jocul w este strategic echivalent cu jocul v dacă
k > 0 şi un joc aditiv a ∈ GN astfel că w(S)=kv(S) + a(S), unde
există X
a(S)= ai pentru toţi S ∈ 2N \ {∅}. Putem considera că w se obţine
i∈S
din v prin următoarele transformări: (i) unitatea valorică este schimbată,
unde rata de schimb este k; ı̂n jocul w fiecare jucător primeşte ori un bonus
(dacă ai > 0) ori o penalizare (dacă ai < 0) ı̂nainte ca suma k · v(N ) să
fie distribuită ı̂ntre jucători. Pentru cele mai multe concepte de soluţie este
suficient să ne ocupăm de un singur joc ı̂ntr-o anumită clasă de echivalenţă

65
strategică. Fiecare joc v ∈ GN este strategic N
X echivalent cu un joc w ∈ G care
este 0-normalizat, unde w(S)=v(S) − v({i}) pentru orice S ∈ 2N . Într-o
i∈S
clasă de echivalenţă se consideră adesea jocul (0,1)-normalizat corespunzător
acelei clase. Fiecare joc N -esenţial v ∈ GN este strategic echivalent cu un
joc w ∈ GN X care este (0,1)-normalizat. Se poate X verifica uşor că pentru
k=1/(v(N )− v({i})) şi ai =−v({i})/(v(N )− v({i})), pentru toţi i ∈ N,
i∈N i∈N
jocul w definit prin w(S)=k · v(S) + a(S) pentru toţi S ∈ 2N \ {∅}, este (0,1)-
normalizat.
Spunem că f : GN −→ IRn satisface proprietatea de invarianţă cu privire
la echivalenţa strategică (S-echivalenţă) dacă pentru toţi v, w ∈ GN , toate
jocurile aditive a ∈ GN şi toţi k > 0, avem

w=k · v + a implică f (k · v + a)=k · f (v) + a.

O sarcină fundamentală a teoriei jocurilor cooperative este să facă lumină


asupra structurii diferitelor clase de jocuri, considerate ca subclase ale spa-
ţiului liniar GN . Cele mai multe dintre clasele de jocuri cooperative pot fi
văzute ca nişte conuri poliedrale, fiind intersecţii finite de semispaţii ı̂nchise.
Exemple de conuri poliedrale de jocuri cooperative sunt conurile jocurilor
superaditive, convexe, balansate, big boss.
Problema esenţială ı̂n teoria jocurilor cooperative ı̂n forma funcţiei ca-
racteristice este cum să se distribuie v(N ) ı̂ntre jucători dacă marea coaliţie
N se formează. Această problemă este rezolvată folosind concepte de soluţie
din teoria cooperativă a jocurilor. Un concept de soluţie este o aplicaţie care
asociază fiecărui joc dintr-o anumită clasă de jocuri unul sau mai mulţi vectori
de plată x=(x1 , ..., xn ) ∈ IRn . Conceptele de soluţie care asociază fiecărui joc
v ∈ GN un singur vector plată se numesc de tip ”single-valued” sau ”one-
point”. În paragrafele 3.3 - 3.5 vom prezenta următoarele soluţii de acest
tip: valoarea Shapley, σ-valoarea, τ -valoarea, nucleolul şi AL-valoarea. Ele
fac selecţii din mulţimi particulare de vectori de plată, si anume: mulţimea
preimputaţiilor, mulţimea imputaţiilor şi sâmburele jocului.
Mulţimea preimputaţiilor unui joc v ∈ GN este
( )
X
P I(v) := x ∈ IRn | xi = v(N ) .
i∈N

Mulţimea P I(v) este un hiperplan ı̂n IRn .

66
Mulţimea imputaţiilor unui joc v ∈ GN este
( )
X
I(v) = x ∈ IRn | xi = v(N ) şi xi ≥ v({i}) pentru toţi i ∈ N .
i∈N

Teorema 3.6. Mulţimea I(v) este nevidă dacă şi numai dacă jocul v este
N-esenţial.

Mulţimea I(v) este un simplex cu punctele extremef 1 (v), ..., f n (v), unde
pentru fiecare i ∈ N, f i (v)=(f1i , ..., fji , ..., fni ) cu

 v({i})
 dacă i 6= j
i X
fj = v(N ) − v({k}) dacă i=j.


k∈N \{i}

Teorema 3.7 Fie v ∈ GN un joc N-esenţial. Atunci


(i) I(v) este o mulţime infinită.
(ii) I(v) este ı̂nfăşurătoarea convexă a punctelor f 1 (v), ..., f n (v).
Notăm cu I N ={v ∈ GN | I(v) 6= ∅}. I N este un con ı̂n mulţimea GN
şi CIS : I N −→ IRn este un concept de soluţie de tip single-valued definit
n
X
pentru fiecare v ∈ I prin CIS(v) := 1/n f i (v). Din punct de vedere
N

i=1
geometric, CIS(v) este baricentrul lui I(v).
Conceptul de soluţie dominant ı̂n teoria cooperativă a jocurilor este sâm-
burele (Gillies, 1953).

Sâmburele unui joc v ∈ GN este


X
C(v) := {x ∈ I(v) | xi ≥ v(S) pentru toţi S ∈ 2N \ {∅}}.
i∈S

Dacă ı̂ntr-un joc este propus un element al sâmburelui, nici-un subgrup de


jucători nu poate obţine mai mult prin separarea sa de restul jucătorilor.

Sâmburele unui joc c ∈ GN este


X X
C(c) := {x ∈ IRN | xi ≤ c(S) pentru toţi S ∈ 2N \ {∅} şi xi =c(N )}.
i∈S i∈N

67
Sâmburele unui joc se determină prin rezolvarea unui sistem de inecuaţii
liniare. Sâmburele unui joc poate fi mulţimea vidă, poate consta dintr-un
singur element (spre exemplu, jocul cost din Exemplul 3.3 are sâmburele
C(c)={(30, 30, 80)}) sau poate conţine o infinitate de elemente. Sâmburele
unui joc cooperativ de n persoane este o mulţime poliedrală ı̂n IRn .

Teorema 3.8 Fie v ∈ GN . Următoarele afirmaţii sunt echivalente:

(i) C(v) 6= ∅.

(ii) Jocul v este balansat.

Faptul că sâmburele C(v) al unui joc v ∈ GN este soluţia mărginită


a unui sistem de inecuaţii liniare ı̂nseamnă că sâmburele unui joc este un
politop, adică ı̂nfăşurătoarea convexă a unei mulţimi finite de vectori x ∈ IRn .
Sâmburele unui joc convex şi a unui joc big boss sunt politopi speciali cu
o structură geometrică frumoasă. Forma sâmburelui unui joc convex este
descrisă de către Shapley (1971). Forma sâmburelui unui joc big boss este
descrisă de Muto, Potters şi Tijs (1989). Sâmburele unui joc big boss cu n
ca big boss este

C(v)={x ∈ I(v) | 0 ≤ xi ≤ Mi (N, v) pentru fiecare i ∈ N \{n}}.

Sâmburele C este un concept de soluţie care satisface proprietatea de S-


echivalenţă. Un joc (balansat) v ∈ GN cu C(v)=I(v) se numeşte joc (balan-
N
sat) simplex. Un joc v ∈ GX se numeşte exact dacă pentru fiecare S ∈ 2N \{∅}
există un x ∈ C(v) cu xi =v(S). Jocurile convexe sunt jocuri exacte.
i∈S
Exactificarea unui joc v ∈ GN este E E
( jocul v cu v (∅)=0,
) definit pentru fiecare
X
S ∈ 2N \ {∅} prin v E (S)= min xi | x ∈ C(v) .
i∈S

3.3 Valoarea Shapley şi AL-valoarea


Valoarea Shapley (Shapley, 1953) asociază cu fiecare v ∈ GN o preimputaţie
pe baza vectorilor contribuţiilor marginale mσ (v) ai jocului, unde
σ = (σ(1), ..., σ(n)) este o ordine (permutare) a jucătorilor. Notăm cu
Π(N ) mulţimea tuturor permutărilor σ : N −→ N ale lui N . Mulţimea
P σ (i) := {r ∈ N | σ −1 (r) < σ −1 (i)} constă din toţi predecesorii lui i cu

68
privire la permutarea σ. Pentru v ∈ GN şi σ ∈ Π(N ) vectorul contribuţiilor
marginale mσ (v) are coordonate de forma mσi (v) := v(P σ (i) ∪ {i}) − v(P σ (i))
pentru orice i ∈ N. Valoarea Shapley Φ(v) a unui joc v ∈ GN este media
aritmetică a vectorilor contribuţiilor marginale ai jocului, adică
X
(3.4) Φ(v) := 1/n! mσ (v).
σ∈Π(N )

Exemplul 3.9. Considerăm jocul cooperativ cu v({1})=v({2})=v({3})=0,


v({1, 2})=4, v({1, 3})=7, v({2, 3})=15, v({1, 2, 3})=20. Vectorii contribu-
ţiilor marginale sunt m(1,2,3) = (0, 4, 16), m(1,3,2) = (0, 13, 7), m(2,1,3) =
(4, 0, 16), m(2,3,1) = (5, 0, 15), m(3,1,2) = (7, 13, 0), m(3,2,1) = (5, 15, 0). Prin
formula (3.4) obţinem Φ(v) = 1/3!(21, 45, 54) = (7/2, 15/2, 9).

Valoarea Shapley a unui joc cooperativ v de două persoane este

Φ(v)=(v({1})+(v(N )−v({1})−v({2}))/2, v({2})+(v(N )−v({1})−v({2}))/2);

aceasta este numită soluţia standard a unui joc cooperativ de două persoane.
Valoarea Shapley a unui joc aditiv v este Φ(v)=(v({1}), ..., v({n})). Pen-
tru jocul unanim pe T, uT , valoarea Shapley este Φ(uT ) = 1/|T | eT .
Valoarea Shapley satisface următoarele proprietăţi care o fac un con-
cept de soluţie interesant pentru teoria cooperativă a jocurilor: eficienţa, S-
echivalenţa, proprietatea jucătorului fictiv, anonimitatea, aditivitatea, sime-
tria (tratament egal al jucătorilor simetrici).
Valoarea Shapley este singura soluţie care satisface proprietăţile : eficienţă,
anonimitate, proprietatea jucătorului fictiv şi aditivitate (caracterizare axio-
matică).
Spunem că f : GN −→ IRn satisface proprietatea:
X
• eficienţă dacă fi (v) = v(N ) pentru fiecare v ∈ GN .
i∈N
• anonimitate dacă f (v σ ) = σ ∗ (f (v)) pentru orice σ ∈ Π(N ), unde σ ∗ :
IRn −→ IRn este definită prin (σ ∗ (x))σ(k) := xk pentru toţi x ∈ IRn şi
k ∈ N, iar v σ este jocul cu v σ (σ(U )) := v(U ) pentru toţi U ∈ 2N .
• proprietatea jucătorului fictiv dacă fi (v) = v({i}) pentru toţi v ∈ GN
şi pentru toţi jucătorii fictivi i, i.e. jucători i ∈ N astfel că v(S ∪ {i}) =
v(S) + v({i}) pentru toţi S ∈ 2N \{i} .
• aditivitate dacă f (v + w) = f (v) + f (w) pentru toţi v, w ∈ GN .

69
• simetrie (tratament egal al jucătorilor simetrici) dacă fi (v) = fj (v)
pentru toţi i, j ∈ N astfel ı̂ncât v(S ∪ {i}) = v(S ∪ {j}) pentru toţi
S ∈ 2N \{i,j} .
• raţionalitate individuală dacă fi (v) ≥ v({i}) pentru toţi v ∈ GN şi
i ∈ N.
Valoarea Shapley nu satisface ı̂n general proprietatea de raţionalitate indi-
viduală. Există multe jocuri cooperative pentru care valoarea Shapley nu
este un element al sâmburelui.
Exemplul 3.10. În jocul v({1})=v({2})=v({3})=0, v({1, 2})=10, v({1, 3})
= 8, v({2, 3}) = 6, v({1, 2, 3}) = 12, Φ(v)=(5, 4, 3) ∈/ C(v) deoarece inegali-
tatea x1 + x2 ≥ v({1, 2}) nu este satisfăcută (5 + 4 < 10).
Pentru jocuri convexe valoarea Shapley este un element al sâmburelui
jocului şi ocupă o poziţie centrală ı̂n cadrul acestuia: ea coincide cu ”bari-
centrul” sâmburelui. Folosind proprietăţile caracteristice ale valorii Shapley
ı̂mpreună cu formula (3.3) şi expresia valorii Shapley a unui joc unanim,
obţinem o altă formulare a valorii Shapley, care are mare aplicabilitate prac-
tică
X cT X
(3.5) Φ(v) = eT pentru toţi v ∈ GN cu v = c T uT .
N
|T | N
T ∈2 \{∅} T ∈2 \{∅}

Exemplul 3.11. Determinăm valoarea Shapley a jocului v din Exemplul


3.4. folosind formula (3.5): Φ1 (v) = 60 · 1/2 + 70 · 1/2 + 0 − 60 · 1/3 = 45;
Φ2 (v) = 40, Φ3 (v) = 45. Deci Φ(v) = (45, 40, 45).
Alte formulări ale valorii Shapley existente ı̂n literatura teoriei jocurilor
cooperative, cum sunt cele bazate pe interpretarea sa probabilistă, pe divi-
dende şi pe extensia multiliniară a unui joc cooperativ, nu sunt prezentate
ı̂n acest curs.
AL-valoarea (Tijs, 2005) este un concept de soluţie definit pe mulţimea
jocurilor balansate (adică jocuri v ∈ GN cu C(v) 6= ∅). Ca şi ı̂n definiţia
valorii Shapley, se face o medie aritmetică a n! vectori care corespund celor
n! permutări posibile ale celor n jucători ı̂ntr-un joc cooperativ de n per-
soane. Dar, spre deosebire de valoarea Shapley, unde aceşti vectori sunt vec-
torii contribuţiilor marginale, vectorii utilizaţi de AL-valoarea jocului sunt
elementele x ∈ C(v) care sunt optimale din punctul de vedere al ordinii
lexicografice.
În IRn ordinea lexicografică ≥L este definită după cum urmează.
Pentru fiecare x, y ∈ IRn :

70
• x >L y dacă există r ∈ {1, .., n} astfel ca xk = yk pentru k < r şi
xr > y r ;
• x ≥L y dacă x = y sau x >L y.
Spre exemplu, x = (8, 5, 11, 0) >L (8, 5, 10, 100) = y.
Ordinea lexicografică este o relaţie de ordine liniară pe IRn . Pentru o
mulţime compactă C ⊆ IRn există un maxim lexicografic unic x̂ ∈ C (cu
proprietatea x̂ ≥L x pentru toţi x ∈ C), notat cu L(C). Dacă C este un
politop, atunci L(C) este un punct extrem al lui C care poate fi determinat
rezolvând o problemă de optimizare.
Fie v ∈ GN un joc balansat şi σ = (σ(1), ..., σ(n)) ∈ Π(N ). Maximul lexi-
cografic al sâmburelui C(v) al lui v ı̂n raport cu σ, notat cu Lσ (v), este unicul
element al lui C(v) cu proprietăţile: (Lσ (v))σ(1) = max{xσ(1) | x ∈ C(v)},
(Lσ (v))σ(2) = max{xσ(2) | x ∈ C(v) cu xσ(1) = (Lσ (v))σ(1) }, ..., (Lσ (v))σ(n) =
max{xσ(n) | x ∈ C(v) cu (xσ(1) , xσ(2) , ..., xσ(n−1) )=((Lσ (v))σ(1) , (Lσ (v))σ(2) , ...,
(Lσ (v))σ(n−1) )}. Observăm că Lσ (v) este un punct extrem al lui C(v) pentru
fiecare σ ∈ Π(N ). AL-valoarea AL(v) a lui v este media aritmetică a tuturor
Lσ (v), adică media lexicografică a jocului (”average lexicographic value”).
Pentru orice joc balansat v ∈ GN , AL-valoarea AL(v) a jocului v este
X
(3.6) AL(v) = 1/n! Lσ (v).
σ∈Π(N )

Exemplul 3.12. Pentru jocul v cu v({1})=v({2})=v({3}) = 0, v({1, 2})=


v({1, 3}) = v({2, 3}) = 1, v({1, 2, 3}) = 3 avem L(1,2,3) (v) = (2, 1, 0), L(1,3,2) (v)
= (2, 0, 10), ..., L(3,2,1) (v) = (0, 1, 2). Deci, AL(v) = 1/3!(L(1,2,3) (v)+L(1,3,2) (v)
+ ... + L(3,2,1) (v)) = (1, 1, 1).
Pentru un joc (balansat) de două persoane AL-valoarea jocului coincide
cu soluţia standard a jocului (deci şi cu valoarea Shapley a jocului). Pentru
orice joc convex v, AL-valoarea şi valoarea Shapley coincid, adică AL(v) =
Φ(v). Pentru orice joc balansat de trei persoane, pentru orice joc (balansat)
simplex şi pentru orice joc big boss (cu n ca big boss), AL(v) = Φ(v E ), unde
v E este exactificarea lui v (proprietatea de invarianţă cu privire la exactifi-
care).
AL-valoarea satisface o gamă largă de proprietăţi: eficienţă, raţionalitate
individuală, S-echivalenţă, simetrie, proprietatea jucătorului fictiv, invarianţă
cu privire la exactificare, aditivitate pe subconurile de jocuri exacte unde
sâmburele este o corespondenţă aditivă.

71
3.4 σ-valoarea şi τ -valoarea
Ambele valori au fost introduse de Tijs (1981) pentru a furniza un vector pla-
tă eficient care este un cel mai bun compromis ı̂ntre doi vectori plată cores-
punzând la situaţii extreme: situaţia ”ideală” (de fapt ”utopică”) şi situaţia
”catastrofală”(cea mai rea posibilă). Pentru ambele valori, σ-valoarea şi τ -va-
loarea, vectorul ideal al plăţilor este vectorul contribuţiilor marginale ale ju-
cătorilor la marea coaliţie, adică vectorul M (N, v) = (M1 (N, v), ..., Mn (N, v)).
Cel mai nefavorabil vector plată pentru σ-valoarea jocului este vectorul i(v) al
valorilor individuale ale jucătorilor, adică i(v) = (v{1}), v({2}), ..., v({n})).
Pentru τ -valoarea jocului cel mai nefavorabil vector de plată este aşa-numitul
vector al dreptului minim, ce va definit ı̂n cele ce urmează pe baza vectoru-
lui contribuţiilor marginale ale jucătorilor la marea coaliţie. Pentru fiecare
S ∈ 2N \{∅} şi pentru fiecare i ∈ N, restul R(S, i) disponibil pentru jucătorul
i dacă coaliţia S se formează şi toţi ceilalţi jucători j ∈ S primesc plata ideală,
Mj (N, v), este X
R(S, i) := v(S) − Mj (N, v).
j∈S\{i}

Jucătorul i ar putea pretinde de la marea coaliţie N , cel mai mare dintre


toate resturile disponibile pentru el ı̂n coaliţiile ı̂n care el este un membru,
adică dreptul minim al jucătorului i ı̂n jocul v este

mi (v) := max R(S, i).


S:i∈S

Cel mai nefavorabil vector plată pentru τ -valoarea jocului este aşadar vec-
torul m(v) ale cărui coordonate sunt mi (v) pentru toţi i ∈ N.
Un joc v ∈ GN se numeşte semibalansat dacă
• i(v) ≤ M (N, v) şi
X X
• v({i}) ≤ v(N ) ≤ Mi (N, v).
i∈N i∈N

Notăm cu SB mulţimea jocurilor v ∈ GN care sunt semibalansate. Pentru


N

un joc v ∈ SB N , σ-valoarea σ(v) a jocului este definită prin

(3.7) σ(v) := α i(v) + (1 − α)M (N, v),


X
unde α ∈ [0, 1] este unic determinat prin σi (v) = v(N ).
i∈N

72
Exemplul 3.13. Considerăm o situaţie cu un vânzător al unui tablou şi
doi cumpărători potenţiali, unul oferind 100 e şi celălalt 200 e. Modelăm
această situaţie ca un joc de trei persoane, unde jucătorul 1 este vânzătorul,
jucătorul 2 este cumpătorul care oferă 100 e şi jucătorul 3 este cumpărătorul
care oferă 200 e. Funcţia caracteristică a jocului este v({1}) = 0, v({1, 2}) =
100, v({1, 3}) = 200, v({1, 2, 3}) = 200, v(S) = 0 ı̂n rest. Verificăm dacă
jocul este semibalansat şi, dacă este, calculăm σ-valoarea jocului folosind
formula (3.7). Vectorul cel mai nefavorabil este i(v) = (0, 0, 0), iar vec-
torul ideal este M (N, v) = (200, 0, 100). Jocul este semibalansat deoarece
(0, 0, 0) ≤ (200, 0, 100) şi 0 ≤ 200 ≤ 300. Prin formula (3.7) obţinem σ(v) =
α(0, 0, 0) + (1 − α)(200, 0, 100), unde α este determinat din condiţia σ1 (v) +
σ2 (v) + σ3 (v) = 200. Obţinem α = 1/3, deci σ(v) = (400/3, 0, 200/3).
Din punct de vedere geometric, σ-valoarea σ(v) a unui joc semibalansat
v este unicul punctX
de intersecţie al segmentului [i(v), M (v)] cu hiperplanul
n
E(v) = {x ∈ IR | xi = v(N )} al vectorilor de plată eficienţi pentru v.
i∈N
Un joc v ∈ GN se numeşte quasi-balansat dacă
• m(v) ≤ M (N, v) şi
X X
• mi (v) ≤ v(N ) ≤ Mi (N, v).
i∈N i∈N

Notăm cu Q mulţimea jocurilor v ∈ GN care sunt quasi-balansate. Pentru


N

un joc v ∈ QN , τ -valoarea τ (v) a jocului este definită prin

(3.8) τ (v) := αm(v) + (1 − α)M (N, v),


X
unde α ∈ [0, 1] este unic determinat prin τi (v) = v(N ).
i∈N

Exemplul 3.14. Considerăm jocul v din Exemplul 3.13. Verificăm dacă


jocul este quasi-balansat şi, dacă este, calculăm τ -valoarea sa folosind formula
(3.8). Calculăm vectorul dreptului minim m(v) = (100, 0, 0). Jocul este
quasi-balansat deoarece (100, 0, 0) ≤ (200, 0, 100) şi 100 ≤ 200 ≤ 300. Prin
formula (3.8) obţinem τ (v) ≤ (150, 0, 50) 6= σ(v).

Pentru orice joc convex v, τ (v) = σ(v). Din punct de vedere geometric,
τ -valoarea τ (v) a unui joc quasi-balansat v este unicul punct de intersecţie al
segmentului [m(v), M (v)] cu hiperplanul E(v) al vectorilor de plată eficienţi
pentru v.

73
Proprietăţi satisfăcute de τ -valoare sunt: eficienţa, raţionalitatea indivi-
duală, S-echivalenţa, proprietatea jucătorului fictiv, anonimitatea, proprie-
tatea dreptului minim, proprietatea de proporţionalitate restrictivă.
O aplicaţie f : QN −→ IRn are

• proprietatea dreptului minim dacă f (v) = m(v) + f (v − m(v)) pentru


orice v ∈ QN .

• proprietatea de proporţionalitate restrictivă dacă f (v) este un multiplu


al lui M (v) ı̂n cazul când m(v) = 0.

τ -valoarea este unica regulă de alocare pe QN care satisface proprietăţile:


eficienţă, proporţionalitate restrictivă şi proprietatea dreptului minim
(caracterizare axiomatică (Tijs, 1987)).
În general, τ -valoarea nu este un element al sâmburelui jocului.
Un joc hN, ci este quasi-balansat dacă
X X
• Mi (N, c) ≤ c(N ) ≤ mi (c);
i∈N i∈N

• Mi (N, c) ≤ mi (c) pentru fiecare i ∈ N,

unde, pentru fiecare i ∈ N, Mi (N, c) = c(N )−c(N \{i}), mi (c) = min (c(S)−
X S:S3i
Mj (N, c)); vectorul m(c) este vectorul contribuţiilor maximale.
j∈S\{i}

Propoziţia 3.15. Dacă v ∈ GN este un joc balansat, atunci v ∈ SB N şi


v ∈ QN .

Pentru
à un joc big boss cu n ca big boss τ -valoarea jocului este
!
n−1
X
1 1 1 1
τ (v) = M1 (N, v), M2 (N, v), ..., Mn−1 (N, v), v(N ) − Mi (N, v) şi
2 2 2 2 i=1
τ (v) = AL(v).
Pentru un joc big boss convex, τ (v) = Φ(v).
Pentru un joc quasi-balansat c, τ -valoarea τ (c) este definită prin

τ (v) = αm(c) + (1 − α)M (N, c),

unde α ∈ [0, 1] este unic determinat prin condiţia de eficienţă.

74
3.5 Nucleolul
Nucleolul a fost introdus de Schmeidler (1969) pe baza ideii de tratare echi-
tabilă a coaliţiilor ı̂n distribuirea valorii marii coaliţii ı̂ntre jucători. Pentru
fiecare joc v ∈ GN cu I(v) 6= ∅, orice vector x = (x1 , x2 , ..., xn ) ∈ I(v)
reprezintă un mod posibil de distribuire a lui v(N ) dar acceptul de cooperare
ı̂n cadrul marii coaliţii depinde de acordul tuturor coaliţiilor asupra unei
anumite distribuţii x ∈ I(v), pe baza posibilităţilor v(S) ale coaliţiilor S ∈
2N \{∅, N }. Evaluarea unei distribuţii x de către o coaliţie S ∈ 2N \{∅, N }
ı̂n jocul v se face ı̂n mod natural calculând diferenţa ı̂ntre ceea ce coaliţia
S poate obţine pe cont propriu, adică v(S), şi ceea ce coaliţia S ar primi
conform X cu distribuţia x dacă ea ar coopera ı̂n cadrul marii coaliţii, adică
x(S) = xi . Diferenţa v(S) − x(S) a fost numită de Schmeidler excesul
i∈S
coaliţiei S cu privire la imputaţia x ı̂n jocul v, notat cu e(S, x; v). Pentru
fiecare joc cooperativ v ∈ GN , fiecare x ∈ I(v) şi orice S ∈ 2N \{∅, N },
excesul coaliţiei S cu privire la x ı̂n jocul v este
(3.9) e(S, x; v) := v(S) − x(S).
Considerăm situaţia când o anumită distribuţie x este propusă jucătorilor.
Fiecare coaliţie S ∈ 2N \{∅, N } va evalua e(S, x; v). Evident, dacă e(S, x; v)>0,
coaliţia S are o nemulţumire directă faţă de x şi poate să refuze cooperarea
ı̂n marea coaliţie. Dacă e(S, x; v) ≤ 0, coaliţia S va compara excesul său
cu cel al celorlalte coaliţii, pentru a decide dacă acceptă imputaţia x sau
o refuză. Notăm vectorul exceselor, pentru o ordine fixată a coaliţiilor, cu
e(x; v) ≤ (e(S, x; v))S∈2N \{∅,N } şi notăm cu θ(x; v) vectorul obţinut din e(x; v)
prin rearanjarea componentelor sale e(S, x; v) ı̂n ordine descrescătoare.

Exemplul 3.16. Considerăm jocul v({1} = v({2}) = v({3}) = 0, v({1, 2}) =


v({1, 3}) = 8, v({2, 3}) = 6, v({1, 2, 3}) = 12. Pentru imputaţia x = (5, 3, 4)
avem x({1}) = 5, x({2}) = 3, x({3}) = 4, x({1, 2}) = 8, x({1, 3}) = 9,
x({2, 3}) = 7. Excesele coaliţiilor sunt: e({1}, x; v) = −5, e({2}, x; v) = −3,
e({3}, x; v)= − 4, e({1, 2}, x; v)=0, e({1, 3}, x; v)= − 1, e({2, 3}, x; v) = −1.
Pentru ordinea coaliţiilor {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, vectorul exce-
selor este e(x; v) = (−5, −3, −4, 0, −1, −1). Rearanjând componentele lui
e(x; v) ı̂n ordine descrescătoare obţinem θ(x; v) = (0, −1, −1, −3, −4, −5).

Vectorul θ(x; v) permite evaluarea rapidă a efectului global al imputaţiei


x asupra (nemulţumirii) ansamblului coaliţiilor ı̂n jocul v. Dacă jucătorii

75
au de ales o imputaţie din două imputaţii propuse, x şi y, ei vor prefera
acea imputaţie care minimizează nemulţumirea maximă a coaliţiilor. Această
selecţie se poate obţine prin compararea lexicografică a vectorilor θ(x; v) şi
θ(y; v).

Exemplul 3.17. Considerăm jocul v şi imputaţia x din Exemplul 3.16.


Presupunem că jucătorii au de ales ı̂ntre imputaţia x şi imputaţia y =
(6, 4, 2). Un calcul similar ce cel făcut pentru θ(x; v) conduce la θ(y; v) =
(0, 0, −2, −2, −4, −6). Comparând lexicografic

θ(x; v) = (0, −1, −1, −3, −4, −5) şi


θ(y; v) = (0, 0, −2, −2, −4, −6)

obţinem x ≤L y. Prin urmare, imputaţia x va fi preferată imputaţiei y, fiindcă


nemulţumirea cea mai mare a coaliţiilor cu privire la x este mai mică decât
nemulţumirea cea mai mare a coaliţiilor cu privire la y. În termeni de exces,
excesul maxim ı̂n raport cu x este mai mic decât excesul maxim ı̂n raport
cu y.

Nucleolul asociază fiecărui joc v ∈ GN , cu I(v) 6= ∅, mulţimea η(v) a


imputaţiilor x∗ = (x∗1 , x∗2 , ..., x∗n ) astfel ı̂ncât

θ(x∗ ; v) ≤L θ(x; v) pentru toţi x ∈ I(v).

Teorema 3.18. (Schmeidler, 1969) Fie v ∈ GN un joc N-esenţial (adică


cu I(v) 6= ∅). Atunci nucleolul θ(v) al jocului v există şi conţine un singur
element.

Adeseori referim imputaţia selectată de nucleol ı̂n jocul v ca η(v). Dacă


sâmburele unui joc v este nevid, adică C(v) 6= ∅, atunci nucleolul selectează
un element al sâmburelui jocului, adică η(v) ∈ C(v), ı̂ntrucât

C(v) = {x ∈ I(v) | e(S, x; v) ≤ 0 pentru toţi S ∈ 2N \ {∅}}.

Faptul că nucleolul unui joc este ı̂n sâmburele jocului ori de câte ori
sâmburele jocului este nevid, este adesea folositor pentru calcularea nucleolu-
lui: dacă sâmburele unui joc v constă dintr-un singur element, atunci η(v) =
C(v); dacă sâmburele jocului este nevid şi elementele sale sunt funcţii de un
parametru, atunci componentele imputaţiei selectate de nucleol sunt aceleaşi

76
funcţii liniare de acel parametru şi valoarea parametrului corespunzătoare
nucleolului poate fi determinată printr-o metodă grafică ce va fi descrisă mai
jos şi ilustrată ı̂n Exemplul 3.19. Determinarea nucleolului unui joc se poate
face ı̂n general prin rezolvarea unei succesiuni de programe liniare; această
metodă generală nu va fi prezentată ı̂n acest curs. Relaţia dintre nucleolul
unui joc şi sâmburele jocului, când sâmburele este nevid, este de asemenea
utilă pentru a răspunde (negativ) la ı̂ntrebarea dacă o anumită imputaţie
este sau nu cea selectată de nucleol.
Două proprietăţi ale nucleolului pot juca un rol ı̂n calcularea nucleolului
sau ı̂n furnizarea răspunsului (negativ sau pozitiv) la problema dacă o anu-
mită imputaţie este sau nu cea selectată de nucleol: proprietatea jucătorului
fictiv şi proprietatea jucătorilor simetrici (vezi Exemplul 3.19).
Ori de câte ori componentele unui vector de plată candidat pentru a fi
imputaţia selectată de nucleol sunt funcţii liniare de un parametru, deter-
minarea nucleolului poate fi făcută printr-o metodă grafică simplă:
• Se determină intervalul pentru valorile parametrului din condiţia ca
vectorul de plată respectiv să fie o imputaţie.
• Se calculează excesele tuturor coaliţiilor nevide, cu excepţia marii coaliţii;
acestea sunt funcţii liniare de parametrul respectiv.
• Se reprezintă grafic aceste funcţii (excesele tuturor coaliţiilor) pentru
valorile parametrului ı̂n intervalul determinat specific problemei.
• Se trasează graficul maximului acestor funcţii şi se determină valoarea
parametrului pentru care această funcţie ı̂şi atinge minimul.
Exemplul 3.19. Considerăm jocul v din Exemplul 3.2. Observăm că
jucătorii 1 şi 2 sunt simetrici, ceea ce implică η1 (v) = η2 (v). Evident, η3 (v) =
v(N ) − η1 (v) − η2 (v). Nucleolul jocului este de forma (x, x, 300 − 2x), cu
0 ≤ x ≤ 50, ı̂ntrucât acest vector trebuie să fie o imputaţie. Calculăm exce-
sele tuturor coaliţiilor cu privire la imputaţia (x, x, 300 − 2x). Reprezentăm
funcţiile de x obţinute ı̂n sistemul de coordonate xOy, pentru x ∈ [0, 50].
Trasăm conturul funcţiei care este maximul funcţiilor exceselor şi vedem
care este valoarea lui x pentru care această funcţie are valoarea minimă.
Pentru jocul nostru, obţinem x = 100/3. Nucleolul jocului este, prin urmare,
η(v) = (100/3, 100/3, 700/3).
Criteriul lui Kohlberg este un instrument cu valabilitate generală util
pentru a răspunde la ı̂ntrebarea dacă o anumită imputaţie este sau nu nu-
cleolul unui joc N -esenţial. Considerăm mulţimea exceselor coaliţiilor S ∈

77
2N \{∅, N, {1}, ..., {n}} cu privire la imputaţia x ı̂n ordine descrescătoare:

ε1 , ε2 , ..., εk(x) .

Propoziţia 3.20. (Criteriul lui Kolhberg, 1971) Fie v ∈ GN şi x ∈ I(v)


astfel ca xi 6= v({i}) pentru toţi i ∈ N. Imputaţia x este nucleolul jocului v
dacă şi numai dacă pentru toţi 1 ≤ j ≤ k(x)
j
[
B t este o colecţie balansată (echilibrată),
t=1

unde B i este mulţimea de coaliţii asociată cu al i-lea exces εi (ı̂n ordinea


descrescătoare a acestor excese).

3.6 Comunicare şi informaţie ı̂n jocuri cooperative


În teoria clasică a jocurilor cooperative ı̂n forma funcţiei caracteristice se
presupune că toţi jucătorii sunt capabili (şi li se permite) să comunice ı̂ntre
ei şi, prin urmare, toate coaliţiile (grupurile de jucători) se pot forma. Toate
felurile de acorduri, incluzând acordurile ferme, şi de asemenea plăţile la-
terale sunt permise. Totuşi, ı̂n multe situaţii practice, unii dintre jucători
sunt incapabili să comunice unul cu celălalt şi, prin urmare, unele coaliţii,
incluzând marea coaliţie nu pot fi formate. Restricţiile privind comunicarea
ı̂ntre jucătorii conduc astfel la cooperare restrictivă. Pentru a modela astfel
de situaţii cu cooperare restrictivă indusă de restricţii de comunicare, a fost
introdus un model specific de jocuri cooperative, aşa-numitele jocuri de co-
municare (Myerson, 1977, 1980; Owen, 1986). O situaţie (cu restricţii de coo-
perare datorate posibilităţilor limitate) de comunicare este o situaţie ı̂n care
posibilităţile economice ale participanţilor sunt descrise printr-un joc coope-
rativ hN, vi sau hN, ci şi posibilităţile de comunicare sunt descrise printr-o
pereche hN, Ai, unde N este mulţimea finită şi nevidă a jucătorilor şi A este
un graf neorientat, numit graful comunicării. Jocurile de comunicare sunt
numite şi jocuri cu restricţii de tip graf (”graph-restricted games”). O clasă
mică de jocuri de comunicare (dar interesantă atât din punct de vedere teo-
retic cât şi al aplicaţiilor practice) este clasa jocurilor numite ”peer group
games” (Brânzei, Fragnelli şi Tijs, 2002; Brânzei, Solymosi şi Tijs, 2005),
unde graful comunicării este un arbore ce corespunde ierarhiei organizaţionale

78
a jucătorilor. Adeseori comunicarea ı̂ntre participanţi are loc prin reţele, sis-
teme de relaţii bilaterale descentralizate. Reţelele pot fi integrate ı̂n jocuri
coaliţionale pentru a forma aşa-numitele ”network-restricted games” (Slikker
şi van den Nouweland, 2001).
Informaţia disponibilă jucătorilor ı̂n situaţii de interacţiune decizională
bazată pe interese de grup joacă, de asemenea, un rol important ı̂n teo-
ria jocurilor cooperative. În teoria clasică a jocurilor cooperative ı̂n forma
funcţiei caracteristice jucătorii au informaţie simetrică şi plăţile coaliţiilor
sunt cunoscute cu certitudine de către toţi jucătorii. Totuşi, există multe
situaţii practice cu asimetrii informaţionale şi, ı̂n unele situaţii, informaţia
pe care o deţin unii jucători reprezintă o resursă cu rol important ı̂n evaluarea
posibilităţilor economice ale coaliţiilor. Pentru a modela astfel de situaţii au
fost introduse clase speciale de jocuri cooperative ı̂n forma funcţiei caracter-
istice, cum sunt: ”information market games” (Muto, Potters şi Tijs, 1989),
”information collecting games” (Brânzei, Tijs şi Timmer, 2001; Tijs, Timmer
şi Brânzei, 2006), ”information sharing games” (Slikker, Norde şi Tijs, 2003).
Pentru a modela situaţii de interacţiune decizională ı̂n care plăţile coaliţiilor
sunt incerte, au fost introduse noi modele teoretice de jocuri cooperative ı̂n
forma funcţiei caracteristice, cum sunt: ”games in stochastic characteristic
function form” (Charnes şi Granot, 1973; Granot, 1977), ”stochastic coope-
rative games” (Suijs, 1999; Suijs şi Borm, 1999), ”cooperative games with
random payoffs” (Timmer, Borm şi Tijs, 2000). Există un interes actual
crescând ı̂n teoria jocurilor cooperative cu informaţie incompletă motivat
atât din punct de vedere teoretic cât şi al aplicaţiilor practice (Ichiishi şi
Yamazaki, 2006).
Toate modelele de jocuri cooperative ı̂n forma funcţiei caracteristice stu-
diate ı̂n paragrafele 3.2 - 3.5 şi discutate mai sus, se bazează pe noţiunea
clasică de coaliţie, aceea de grup de jucători, unde fiecare jucător poate fi
sau nu membru al uneia sau mai multor coaliţii. Situaţii cu posibilităţi de
cooperare mai relaxată au condus la introducerea unor noţiuni mai sofisti-
cate de coaliţie, cum sunt cea de coaliţie multi-choice şi coaliţie fuzzy, şi
modele corespunzătoare de jocuri cooperative ı̂n forma funcţiei caracteristice:
”multi-choice games” (Hsiao şi Raghavan, 1993a, 1993b; van den Nouweland
et al., 1995; Calvo şi Santos, 2000) şi ”fuzzy games” (Aubin,1974, 1981).
Într-un joc de tip multi-choice fiecare jucător are un număr finit de nivele
de activitate privind cooperarea cu ceilalţi jucători şi plata fiecărei coaliţii
multi-choice depinde de nivelele de activitate ale (tuturor) jucătorilor ı̂n
cadrul acelei coaliţii. Jocurile cooperative clasice ar putea fi considerate ca

79
un caz special al jocurilor multi-choice, unde fiecare jucător are exact două
nivele de activitate, corespunzând la participare (completă) ı̂ntr-o coaliţie sau
neparticipare. Într-un joc fuzzy fiecare jucător are posibilitatea să coopereze
la (infinit de) multe nivele, variind de la necooperare la cooperare totală şi
plata fiecărei coaliţii fuzzy depinde de nivelele de participare ale (tuturor)
jucătorilor ı̂n cadrul acelei coaliţii. Modele de jocuri cooperative ı̂n forma
funcţiei caracteristice bazate pe noţiunea clasică de coaliţie (crisp), coaliţie
multi-choice şi coaliţie fuzzy, sunt prezentate ı̂n monografia având ca autori
pe Brânzei, Dimitrov şi Tijs (2005).
Toate modelele de jocuri cooperative ı̂n forma funcţiei coaliţionale discu-
tate până acum fac parte din teoria jocurilor cu utilităţi transferabile. Ele
se mai numesc TU-games (Transferable Utility games). Calificativul ”cu
utilităţi transferabile” este menit să facă clar faptul că ı̂n astfel de jocuri
sunt permise plăţi laterale ı̂ntre jucători ı̂n sensul că valoarea (plata, uti-
litatea) marii coaliţii poate fi distribuită ı̂ntre jucători ı̂n (infinit de) multe
moduri, iar transformări ale valorilor (plăţilor, utilităţilor) coaliţiilor datorate
schimbării unităţii monetare sau acordării de bonus sau amendă unor jucători
nu afectează ı̂n mod esenţial modelul de joc. Teoria jocurilor cooperative ı̂n
formă coaliţională include, pe lângă jocurile de tip TU, jocuri de tip NTU,
adică jocuri cu utilitate netransferabilă (NTU-games). Un joc de tip NTU
este o pereche hN, V i, unde N este mulţimea finită şi nevidă a jucătorilor şi
V este o aplicaţie care asociază fiecărei coaliţii S ∈ 2N \ {∅} o submulţime
V (S)⊆IRS , cu proprietăţi specifice pe care nu le definim aici, ce poate fi in-
terpretată astfel: dacă coaliţia S se formează, atunci pot fi obţinuţi vectorii
x ∈ V (S), care dau fiecărui jucător i ∈ N plata (utilitatea) xi . Jocurile
cooperative cu utilităţi netransferabile au fost introduse de Aumann şi Peleg
(1960). Ele sunt potrivite pentru analiza multor fenomene economice com-
petitive şi cooperative. Un joc de tip NTU poate fi construit pornind de la
un joc cooperativ ı̂n formă strategică sau direct, pe baza descrierii narative
a situaţiei de interacţiune decizională analizată.
Jocurile de negociere pentru două persoane (”bargaining games”) pot fi
considerate un caz particular al jocurilor de tip NTU. Un joc de negociere
de două persoane este o pereche hF, di, unde F ⊆IR2 şi d = (d1 , d2 ) ∈ IR2 .
Elementele lui F , perechi de plăţi (utilităţi), se numesc rezultate admisibile,
pe care jucătorii le pot obţine prin cooperare (acord bilateral). În cazul ı̂n
care cooperarea ı̂ntre jucători nu are loc, jucătorii obţin perechea de plăţi
(d1 , d2 ), motiv pentru care d se numeşte rezultatul dezacordului. Modelul de
joc de negociere a fost introdus de Nash (1950b).

80
ANEXA A
Demonstraţii privind Capitolul 2

Demonstraţia Teoremei 2.5. Observăm că au loc relaţiile

K(x1 , y1 ) = max K(x, y1 ) ≥ K(x2 , y1 ) ≥ min K(x2 , y) = K(x2 , y2 ), (A.1)


x∈X y∈Y

unde egalităţile au loc ı̂ntrucât (x1 , y1 ) şi (x2 , y2 ) sunt echilibre Nash ale
jocului.
Schimbând rolurile lui (x1 , y1 ) şi (x2 , y2 ) obţinem, ı̂n mod similar,

K(x2 , y2 ) = max K(x, y2 ) ≥ K(x1 , y2 ) ≥ min K(x1 , y) = K(x1 , y1 ). (A.2)


x∈X y∈Y

Din (A.1) şi (A.2) rezultă că K(x1 , y1 ) = K(x2 , y2 ) şi toate inegalităţile
ı̂n (A.1) şi (A.2) sunt de fapt egalităţi. Aceasta implică

K(x2 , y1 ) = max K(x1 , y1 ); K(x2 , y1 ) = min K(x2 , y).


x∈X y∈Y

Prin urmare, (x2 , y1 ) este un echilibru Nash şi K(x2 , y1 ) = K(x1 , y1 ). În mod
similar, rezultă că (x1 , y2 ) este un echilibru Nash cu K(x1 , y2 ) = K(x1 , y1 ).

Demonstraţia Teoremei 2.8.

(i) urmează din definiţia unei funcţii potenţial exact pentru jocul G.

(ii) urmează din (i) pe baza observaţiei că x∗ este un echilibru Nash pentru
GP dacă ( )
Yn
P (x∗ ) = max P (x) | x ∈ Xi .
i=1

81
Teorema de punct fix a lui Brouwer. Fie C o mulţime nevidă convexă
şi compactă a lui IRk şi fie f : C −→ C o funcţie continuă. Atunci există un
x∗ ∈ C cu f (x∗ ) = x∗ .
Demonstraţia Teoremei 2.21. (Nash) Pentru i ∈ N şi xi ∈ Xi considerăm
Uixi (σ) = max(0, Ki (xi , σ−i )−Ki (σ)) şi f : Σ −→ Σ definită (pe componente)
prin  
X x0
fixi (σ) = (σixi + Uixi (σ))/ 1 + Ui i (σ) ,
x0i ∈Xi

unde σixi desemnează probabilitatea pe care σi o atribuie lui xi .


Observăm că Σ este o mulţime nevidă convexă şi compactă, iar f este o
funcţie continuă pe Σ. Prin teorema de punct fix a lui Brouwer, există un
punct fix σ ∗ . Verificarea faptului că σ ∗ este un echilibru Nash al jocului nu
este dificilă.
Demonstraţia Lemei 2.22. (Tijs) Arătăm doar că
v(A) = maxm min pT Aej .
p∈∆ j∈{1,...,n}

Evident,
inf pT Aq ≤ min pT Aej . (A.3)
q∈∆n j∈{1,...,n}

Întrucât pentru fiecare p ∈ ∆m


n
X n
X
T T T
p Aq = qj p Aej ≥ min p Aej qj = min pT Aej ,
j∈{1,...,n} j∈{1,...,n}
j=1 j=1
avem
inf pT Aq ≥ min pT Aej . (A.4)
q∈∆n j∈{1,...,n}

Din (A.3) şi (A.4) obţinem


inf pT Aq = min pT Aej . (A.5)
q∈∆n j∈{1,...,n}

Considerăm f : ∆m −→ IR, definită prin f (p) = min pT Aej . Această


j∈{1,...,n}
funcţie este continuă, iar mulţimea ∆m este o mulţime nevidă mărginită şi
ı̂nchisă. Prin urmare, există maxm f (p). Combinând aceasta cu (A.5) obţinem
p∈∆

v(A) := sup inf pT Aq = sup


n
min pT Aej = maxm min pT Aej .
p∈∆m q∈∆ p∈∆m j∈{1,...,n} p∈∆ j

82
Demonstraţia Teoremei 2.23. (Tijs) Întâi observăm că

inf K(x, z) ≤ K(x, y) pentru toţi x ∈ X şi y ∈ Y


z∈Y

implică
sup inf K(x, z) ≤ sup K(x, y) pentru toţi y ∈ Y,
x∈X z∈Y x∈X

şi atunci
sup inf K(x, z) ≤ inf sup K(x, y),
x∈X z∈Y y∈Y x∈X

sau
v(X, Y, K, −K) ≤ v̄(X, Y, K, −K), i.e., v(A) ≤ v̄(A).
Demonstrăm că v(A) = v̄(A) prin inducţie matematică după mărimea s(A)
a lui A, unde s(A) := m + n. Evident, s(A) ≥ 0. Definim funcţia ”gap” a lui
A prin g(A) := v̄(A) − v(A). Am arătat anterior că g(A) ≥ 0. Arătăm acum
că g(A) = 0, prin inducţie după mărimea lui A.

• Pentru s(A) = 2, A este de forma [a], deci g(A) = v̄(A) − v(A) =


a − a = 0.

• Presupunem că g(B) = 0 pentru toţi B cu s(B) < r. Luăm A ∈ IRm×n


cu m+n = r. Folosind Lema 2.22, putem găsi un p∗ ∈ ∆m şi un q ∗ ∈ ∆n
astfel ı̂ncât

(p∗ )T Aej ≥ v(A) pentru toţi j ∈ {1, ..., n}. (A.6)

eTi Aq ∗ ≤ v̄(A) pentru toţi i ∈ {1, ..., m}. (A.7)


Considerăm 3 cazuri:

1. În (A.6) şi (A.7) avem numai egalităţi. Atunci (p∗ )T Aq ∗ = v(A) =
v̄(A), deci g(A) = 0.
2. Există un k ∈ {1, ..., n} astfel ı̂ncât (p∗ )T Aek > v(A), ceea ce
implică n > 1.
3. Există un ` ∈ {1, ..., m} astfel ı̂ncât eT` Aq ∗ < v̄(A), ceea ce implică
m > 1.

Întrucât cazurile 2 şi 3 sunt similare, vom demonstra numai pentru


cazul 2 că g(A) = 0.

83
Fie A−k matricea care se obţine din A prin eliminarea coloanei k. Din
presupunerea inductivă, g(A−k ) = 0. Este uşor de arătat că
¡ ¢
v(A−k ) ≥ v(A) şi v̄(A−k ) ≥ v̄(A) .

În cele ce urmează, vom arăta, prin metoda reducerii la absurd, că

v(A−k ) = v(A).

Presupunem că v(A−k ) > v(A). Acesta ı̂nseamnă că există p̄ ∈ ∆m care
este maximin pentru A−k , deci p̄Aej > v(A) pentru toţi j ∈ {1, ..., n}\{k}.
Pentru orice ε ∈ (0, 1) avem atunci

(εp̄ + (1 − ε)p∗ )T Aej > v(A) pentru toţi j 6= k.

Pentru ε arbitrar de mic vom avea

(εp̄ + (1 − ε)p∗ )T Aej > v(A).

Dar atunci
v(A) ≥ min (εp̄ + (1 − ε)p∗ )T Aej > v(A),
j∈{1,...,n}

ceea ce contrazice presupunerea făcută. Prin urmare v(A−k ) = v(A).

Demonstraţia Teoremei 2.24.



 ∗ T ∗
 (p ) Aq = p∈∆ maxm pT Aq ∗ ,
(p∗ , q ∗ ) ∈ N E(A, B) ⇐⇒ ⇐⇒

 (p∗ )T Bq ∗ = maxn p∗ Bq,
q∈∆
 ∗ T ∗
max eTi Aq ∗ ,
 (p ) Aq = i{1,...,m}

⇐⇒ ⇐⇒

 (p∗ )T Bq ∗ = max (p∗ )T Bej ,
j∈{1,...,n}
(
C(p∗ )⊂P B1 (q ∗ ),
⇐⇒
C(q ∗ )⊂P B2 (p∗ ).

84
ANEXA B
Demonstraţii privind Capitolul 3

Demonstraţia Teoremei 3.6.


n
X n
X
(=⇒) Presupunem x ∈ I(v). Atunci v(N ) = xi ≥ v({i}), unde egali-
i=1 i=1
tatea urmează din proprietatea de eficienţă şi inegalitatea urmează din pro-
prietatea de raţionalitate individuală.
X n
(⇐=) Presupunem v(N ) ≥ v({i}). Atunci
à i=1 !
n−1
X
v({1}), ..., v({n − 1}), v(N ) − v({i})
i=1
este o imputaţie.

Teorema B.1. (caracterizarea punctelor extreme ale unei mulţimi poliedrale)


Fie A o matrice ı̂n IRn×p , b ∈ IRp şi fie P mulţimea poliedrală a soluţiilor
sistemului de inegalităţi xT A ≥ bT . Pentru x ∈ IRn , fie tight(x) mulţimea
coloanelor {Aej | xT Aej = bj } ale lui A, unde inegalităţile corespunzătoare
sunt egalităţi pentru x şi unde pentru fiecare j ∈ N, ej este al j-lea vector al
bazei standard ı̂n IRn . Atunci x este un punct extrem al lui P dacă şi numai
dacă tight(x) este un sistem complet de vectori ı̂n IRn .
Demonstraţia Teoremei 3.7.
X
(i) Întrucât v ∈ GN este un joc N -esenţial, avem a = v(N ) − xi > 0.
i∈N
Pentru orice n-uplu b = (b1 , ..., bn ) de numere nenegative astfel că
X
bi = a, vectorul plată x0 = (x01 , ..., x0n ) cu x0i = v({i}) + bi pen-
i∈N
tru toţi i ∈ N este o imputaţie.
(ii) Aceasta urmează din Teorema B.1 observând că I(v) = {x ∈ IRn |
xT A ≥ bT }, unde A este matricea n×(n+2) cu coloanele e1 , ..., en , 1n , −1n

85
şi b = (v({1}), ..., v({n}), v(N ), −v(N )), unde pentru fiecare i ∈ N, ei
este al i-lea vector al bazei standard ı̂n IRn şi 1n este vectorul ı̂n IRn cu
toate coodonatele egale cu 1.
Teorema B.2. (teorema dualităţii ı̂n programarea liniară) Fie A o matrice
n × p, b ∈ IRp şi c ∈ IRn . Atunci
min{xT c | xT A ≥ bT } = max{bT y | Ay = c, y ≥ 0}
dacă {x ∈ IRn | xT A ≥ bT } 6= ∅ şi {y ∈ IRp | Ay = c, y ≥ 0} 6= ∅.
Demonstraţia Teoremei 3.8. Întâi observăm că C(v) 6= ∅ dacă şi numai
dacă ( )
X X
v(N ) = min xi | xi ≥ v(S) pentru toţi S ∈ 2N \{∅} . (B.1)
i∈N i∈S

Prin Teorema B.2,


 egalitatea (B.1) are loc dacă şi numai dacă 
 X X 
S N
v(N ) = max λ(S)v(S) | λ(S)e = e , λ ≥ 0 , (B.2)
 N N

S∈2 \{∅} S∈2 \{∅}
caracteristici eS drept coloane). Acum, (B.2)
(luând matricea A cu vectorii X
are loc dacă şi numai dacă λ(S)v(S) ≤ v(N ) are loc, unde λ este o
S∈2N \{∅}
aplicaţie balansată. Prin urmare, (i) şi (ii) sunt echivalente.
Demonstraţia Propoziţiei 3.15. Fie x ∈ C(v). Pentru orice i ∈ N are loc
xi = x(N ) − x(N \{i}) = v(N ) − x(N \{i}) ≤ v(N ) − v(N \{i}) = (B.3)
= Mi (N, v).
Dacă i ∈ S, are loc
(B.3) X
xi = x(S) − x(S\{i}) ≥ v(S) − x(S\{i} ≥ v(S) − Mj (N, v) (B.4)
j∈S\{i}
=⇒ xi ≥ mi (v).
Din (B.3) şi (B.4) obţinem
mi (v) ≤ xi ≤ Mi (N, v) pentru toţi i ∈ N. (B.5)
Observăm că (B.5) ı̂nseamnă m(v) ≤ x ≤ M (N, v) pe coordonate şi implică
X X
mi (v) ≤ v(N ) ≤ Mi (N, v).
i∈N i∈N
Deci, am arătat că orice joc balansat este un joc quasi-balansat. Faptul
că orice joc balansat este de asemenea un joc semibalansat urmează simi-
lar din (B.3) şi din proprietatea de raţionalitate individuală a elementelelor
sâmburelui jocului.

86
BIBLIOGRAFIE

1. Aubin, J.P. (1974). Coeur et valeur des jeux flous à paiements latéraux.
Comptes-Rendus de l’Académie des Sciences Paris 279 A, 891-894.

2. Aubin, J.P. (1981). Cooperative fuzzy games. Mathematics of Operations


Research 6, 1-13.

3. Aumann, R.J. and B. Peleg (1960). Von Neumann-Morgenstern solutions


to cooperative games without side payments. Bulletin of the American Ma-
thematical Society 66, 173-179.

4. Bondareva, O.N. (1963). Some applications of linear programming methods


to the theory of cooperative games (in Russian). Problemi Kibernetiki 10,
119-139.

5. Borel, E. (1921). La théorie du jeu et les equations integrales à noyau


symétrique. Comptes Rendus de l’Académie des Sciences 173, 1304-1308.

6. Brânzei, R., D. Dimitrov and S. Tijs (2005). Models in Cooperative Game


Theory: Crisp, Fuzzy and Multi-Choice Games. Springer.

7. Brânzei, R., V. Fragnelli and S. Tijs (2002). Tree-connected peer group


situations and peer group games. Mathematical Methods of Operations
Research 55, 93-106.

8. Brânzei, R., T. Solymosi and S. Tijs (2005). Strongly essential coalitions and
the nucleolus of peer group games. International Journal of Game Theory
33, 447-460.

9. Brânzei, R., S. Tijs and J. Timmer (2001). Collecting information to improve


decision making. International Game Theory Review 3, 1-12.

10. Calvo, E. and J.C. Santos (2000). A value for multichoice games. Mathe-
matical Social Sciences 40, 341-354.

87
11. Charnes, A. and D. Granot (1973). Prior solutions: extensions of convex
nucleolus solutions to chance-constrained games. Proceedings of the Com-
puter Science and Statistics Seventh Symposium at Iowa State University,
323-332.
12. Gardner, R. (1995). Games for Business and Economics. John Wiley &
Sons.
13. Gibbons, R. (1992). A primer in Game Theory. Harvester/Wheatsheaf.
14. Gillies, D.B. (1953). Some Theorems on n-person Games. Ph. D. Disserta-
tion, Princeton University Press.
15. Granot, D. (1977) Cooperative games in stochastic function form. Manage-
ment Science 23, 621-630.
16. Harsanyi, J.C. (1967/68). Games with incomplete information played by
’Bayesian’ players, Part I, II, and III. Management Science 14, 159-182,
320-334, and 486-502.
17. Hsiao, C.-R. and TES Raghavan (1993a). Monotonicity and dummy free
property for multi-choice cooperative games. International Journal of Game
Theory 21, 301-312.
18. Hsiao, C.-R. and TES Raghavan (1993b). Shapley value for multi-choice
cooperative games (I). Games and Economic Behavior 5, 240-256.
19. Kohlberg, E. (1971). On the nucleolus of a characteristic function game.
SIAM Journal on Applied Mathematics 20, 62-66.
20. Ichiishi, T. and A. Yamazaki (2006). Cooperative Extensions of the Bayesian
Game. Series on Mathematical Economics and Game Theory, Vol. 3.
21. Monderer, D. and L. Shapley (1996). Potential games. Games and Economic
Behavior 14, 124-143.
22. Morris, P. (1994). Introduction to Game Theory. Springer-Verlag.
23. Muto, S., M. Nakayama, J. Potters and S. Tijs (1988). On big boss games.
Economic Studies Quarterly 39, 303-321.
24. Muto, S., J. Potters and S. Tijs (1989). Information market games. Inter-
national Journal of Game Theory 18, 209-226.
25. Myerson, R. (1977). Graphs and cooperation in games. Mathematics of
Operations Research 2, 225-229.

88
26. Myerson, R. (1980). Conference structures and fair allocation rules. Inter-
national Journal of Game Theory 9, 169-182.

27. Nash, J. (1950a). Equilibrium points in n-person games. Proceedings of the


National Academy of Sciences 36, 48-49.

28. Nash, J. (1950b). The bargaining problem. Econometrica 18, 155-162.

29. Nash, J.F. (1951). Non-cooperative games. Annals of Mathematics 54, 286-
295.

30. van den Nouweland, A., S. Tijs, J. Potters and J. Zarzuelo (1995). Cores and
related solution concepts for multi-choice games. Mathematical Methods of
Operations Research 41, 289-311.

31. von Neumann, J. (1928). Zur Theorie der Gesellschaftsspiele. Mathema-


tische Annalen 100, 295-320.

32. von Neumann, J. and O. Morgenstern (1944). Theory of Games and Eco-
nomic Behavior. Princeton University Press.

33. Osborne, M. and A. Rubinstein (1994). A Course in Game Theory. MIT


Press.

34. Owen, G. (1986). Values of graph-restricted games. SIAM Journal on Al-


gebraic and Discrete Mathematics 7, 210-220.

35. Owen, G. (1999). Discrete Mathematics and Game Theory. Theory and
Decision Library: Series C, Kluwer Academic Publishers.

36. Peleg, B. and P. Sudhölter (2004). Introduction to the Theory of Coope-


rative Games. Theory and Decision Library: Series C, Kluwer Academic
Publishers.

37. Rafels, C. (Coordinació) (1999). Jocs cooperatius i aplicacions econòmiques.


Col-lecció UB.

38. Rosenthal, R.W. (1973). A class of games possessing pure-strategy Nash


Equilibria. International Journal of Game Theory 2, 65-67.

39. Schmeidler, D. (1969). The nucleolus on a characteristic function game.


SIAM Journal on Applied Mathematics 17, 1163-1170.

40. Selten, R. (1975). Reexamination of the perfectness concept for equilibrium


points in extensive games. International Journal of Game Theory 4, 25-55.

89
41. Shapley, L.(1953). A value for n-person games. In: Tucker, A. and H. Kuhn
(Eds.), Contributions to the Theory of Games II, pp. 307-317.

42. Shapley, L. (1971). Cores of convex games. International Journal of Game


Theory 1, 11-26.

43. Slikker, M., H. Norde and S. Tijs (2003). Information sharing games. Inter-
national Game Theory Review 5, 1-12.

44. Slikker, M. and A. van den Nouweland (2001). Social and Economic Net-
works in Cooperative Game Theory. Theory and Decision Library: Series
C, Kluwer Academic Publishers.

45. Suijs, J. (1999). Cooperative Decision-Making under Risk. Boston: Kluwer.

46. Suijs, J. and . Borm (1999). Stochastic cooperative games: superadditivity,


convexity and certain equivalents. Games and Economic Behavior 27, 331-
345.

47. Tijs, S.H. (1981). Bounds for the core of a game and the τ -value. In:
Moeschlin, O. and D. Pallaschke (Eds.), Game Theory and Mathematical
Economics, Amsterdam: North Holland, pp.123-132.

48. Tijs, S.H. (1987). An axiomatization of the τ -value. Mathematical Social


Sciences 13, 177-181.

49. Tijs, S. (2003). Introduction to Game Theory. Hindustan Book Agency.

50. Tijs, S. (2005). The first steps with Alexia, the lexicographic order. CentER
DP 2005-123, Tilburg University, Tilburg, The Netherlands.

51. Tijs, S., J. Timmer and R. Brânzei (2006). Compensations in information


collecting situations: A cooperative approach. Journal of Public Economic
Theory 8, 181-191.

52. Timmer, J., P. Borm and S. Tijs (2000). Convexity in stochastic cooperative
situations. International Game Theory Review 7, 25-42.

53. Watson, J. (2002). An Introduction to Game Theory. W.W. Norton &


Company.

90

S-ar putea să vă placă și