Teoria Jocurilor

TEORIA JOCURILOR
Rodica Brânzei
Contents
PREFAŢĂ 5
LISTA FIGURILOR 8
1 INTRODUCERE 9
1.1 Forme de reprezentare a jocurilor . . . . . . . . . . . . . . . . 10
1.2 Modelarea situaţiilor decizionale interactive ca jocuri . . . . . 13
2 JOCURI NECOOPERATIVE 15
2.1 Jocuri ı̂n formă normală şi echilibre Nash . . . . . . . . . . . . 16
2.2 Jocuri ı̂n formă extensivă şi echilibre Nash perfecte pe subjoc 29
2.3 Forma extensivă şi forma normală . . . . . . . . . . . . . . . . 37
2.4 Extensia mixtă şi echilibre Nash ı̂n strategii mixte . . . . . . . 44
2.5 Informaţie şi jocuri necooperative . . . . . . . . . . . . . . . . 51
3 JOCURI COOPERATIVE 57
3.1 Jocuri cooperative ı̂n forma strategică . . . . . . . . . . . . . . 58
3.2 Jocuri cooperative ı̂n forma funcţiei caracteristice şi sâmburele 61
3.3 Valoarea Shapley şi AL-valoarea . . . . . . . . . . . . . . . . . 68
3.4 σ-valoarea şi τ -valoarea . . . . . . . . . . . . . . . . . . . . . . 72
3.5 Nucleolul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.6 Comunicare şi informaţie ı̂n jocuri cooperative . . . . . . . . . 78
ANEXA A. Demonstraţii privind Capitolul 2 81
ANEXA B. Demonstraţii privind Capitolul 3 85
BIBLIOGRAFIE 87
3
PREFAŢĂ
Teoria jocurilor este o teorie matematică care se ocupă cu modelarea şi ana-
liza situaţiilor decizionale interactive care implică conflict de interese indi-
viduale sau de grup. Primele lucrări dedicate teoriei jocurilor sunt cele ale
lui Borel (1921) şi von Neumann (1928), dar bazele teoriei matematice a
jocurilor au fost puse prin monografia având ca autori pe von Neumann şi
Morgenstern (1944). După o perioadă mai puţin fructuoasă, teoria jocurilor
a cunoscut şi cunoaşte o perioadă de ı̂nflorire şi recunoaştere pe plan mon-
dial. Există un mare număr de cercetători şi cadre didactice ı̂n domeniul
teoriei jocurilor, iar numărul studenţilor ı̂n programe de masterat şi doc-
torat dedicate teoriei jocurilor sau frontierei dintre teoria jocurilor şi alte
domenii este ı̂n creştere. Societatea de Teoria Jocurilor (”Game Theory
Society”) ı̂şi lărgeşte numărul de membri şi a avut deja două congrese mon-
diale la: Bilbao (Spania), 2000; Marsilia (Franţa), 2005. În 2005 a fost inau-
gurat la Maastricht (Olanda) un ciclu de conferinţe anuale la nivel european
SING (Spain-Italy-Netherlands Games) care continuă tradiţia conferinţelor
anuale dedicate teoriei jocurilor ı̂n Italia şi Spania ı̂ncepând din 1983 (Ber-
gamo (Italia)); SING2 a avut loc anul acesta la Foggia (Italia). În luna
iulie a fiecărui an, la Stony Brook (Statele Unite) se ţine aşa-numitul ”Game
Theory Festival” unde se ı̂ntâlnesc cercetători şi studenţi din lumea ı̂ntreagă.
Numeroase workshop-uri, conferinţe şi seminarii dedicate unor ramuri par-
ticulare ale teoriei jocurilor au loc anual, bianual, trimestrial sau lunar ı̂n
diferite centre universitare sau de cercetare ştiinţifică. Numeroase manifes-
tări ştiinţifice cu spectru larg (spre exemplu EJOR Conference) şi cu spe-
cific economic sau de informatică includ o secţie pentru teoria jocurilor.
Există un număr mare de jurnale internaţionale care publică articole de teoria
jocurilor şi aplicaţii ale sale, dintre care menţionăm aici: International Jour-
nal of Game Theory, Games and Economic Behavior, European Journal of
Operational Research, Mathematics of Operations Research, Mathematical
Methods of Operations Research, International Game Theory Review, TOP.
5
Recunoaşterea importanţei teoriei jocurilor este materializată de asemenea
prin acordarea unor Premii Nobel pentru Economie pentru contribuţii ı̂n
domeniul teoriei jocurilor: Nash, Harsanyi şi Selten (1994), Vickrey (1996),
Aumann şi Schelling (2005). În ultimii ani, teoria jocurilor se bucură de o
atenţie crescândă ı̂n informatica teoretică şi aplicată pe plan mondial. La
Facultatea de Informatică a Universităţii ”Alexandru Ioan Cuza” din Iaşi,
studenţii anului 2 pot opta pentru cursul de Teoria Jocurilor pentru o in-
troducere ı̂n domeniul teoriei jocurilor şi al interacţiunii dintre aceasta şi
informatică. Prezentul material este conceput ca un suport de curs pentru
studenţii secţiei Învăţământ la Distanţă, care a fost solicitat autoarei pe 8
iulie 2006 pentru a fi gata pentru tipar la sfârşitul lunii august 2006.
Am organizat materialul ı̂n trei capitole: Introducere, Jocuri necoope-
rative şi Jocuri cooperative. Am muncit din greu să fac acest curs ”self-
contained” şi posibil de citit pentru studenţi fără vreo cunoaştere prealabilă
a teoriei jocurilor. Accentul este pe exemple care ilustrează folosirea mode-
lelor matematice de joc şi calcularea soluţiilor jocurilor necooperative şi coo-
perative corespunzând unor situaţii practice variate. Selectarea rezultatelor
(leme, propoziţii, teoreme) din cadrul teoriei jocurilor s-a făcut pe baza ideii
de a furniza studenţilor fundamentele teoriei jocurilor fără a solicita un efort
matematic deosebit. Studenţii interesaţi ı̂n demonstraţiile rezultatelor din
capitolele 2 şi 3 le pot găsi ı̂n Anexa A şi, respectiv, Anexa B. Capitolul 2 a
necesitat ı̂ncorporarea ı̂n text a unor figuri care au fost desenate manual de
autoare şi scanate pentru a crea fişiere cu extensia eps de inserat ı̂n text ı̂n
locul cel mai potrivit posibil. Timpul extrem de scurt pentru editarea acestui
material nu a permis desenarea tuturor figurilor cu software specific, ceea ce
justifică diferenţa de stil ı̂n reprezentarea grafică. În prezentarea materialului
am folosit termenul de ”jucător” (sau pronumele ”el”) pentru a referi orice
participant, indiferent de sex.
Acest suport de curs a fost pregătit ı̂n timpul concediului meu de odihnă
ı̂n Olanda şi, datorită faptului că a fost scris ı̂n limba română, nu a fost citit
de nimeni altcineva, aşa că toate greşelile rămase ı̂n text sunt desigur ale
mele.
Aş vrea să mulţumesc celor care au contribuit ı̂ntr-un fel sau altul la
pregătirea acestui suport de curs.
Apreciez mult ajutorul acordat de Annemiek Dankers şi Ruud Hendrickx
pentru scanarea figurilor şi crearea fişierelor eps la Universitatea din Tilburg
(Olanda). Un rol important pentru pregătirea acestui suport de curs l-a avut
Stef Tijs care mi-a pus la dispoziţie biblioteca sa şi a fost o gazdă ideală, deşi
6
de la bun ı̂nceput a considerat că e imposibil ca cineva să scrie un curs de
teoria jocurilor pentru studenţi ı̂ntr-un interval aşa de scurt. Mulţumesc
din suflet prietenei mele Elena Mocanu din Iaşi care a muncit din greu ı̂n
weekend-urile lunii august şi şi-a folosit talentul să facă din fişierele word,
pdf şi eps trimise de mine via e-mail prezentul suport de curs. Aş vrea de
asemenea să mulţumesc mamei mele, Elena Vătămanu, care a făcut faţă
căldurii tropicale din iulie-august ı̂n Iaşi fără ajutorul meu şi a considerat că
scrierea acestui curs pentru studenţi e activitatea cea mai potrivită pentru
concediul meu de odihnă ı̂n străinătate. Mulţumesc fratelui meu, Valentin
Vătămanu, pentru că a oferit suport mamei mele suplinind prezenţa mea
ı̂n Iaşi ı̂n această vară fierbinte. Dedic acest suport de curs pentru teoria
jocurilor fiicelor mele Oana, Dana şi Roxana Brânzei pe care le port ı̂n suflet
şi gând cu dragoste nemărginită oriunde şi oricând.
31 august 2006 Rodica Brânzei
Prefaţă la ediţia a doua

Prezenta ediţie păstrează structura şi conţinutul de bază ale ediţiei prece-
dente dar conţine variante ı̂mbunătăţite ale figurilor 2.6 (b), 2.10 (b), 2.11
(a), 2.13, 2.14 (a) şi (b), 2.15, 2.21 şi 2.22; greşelile de tipărire existente ı̂n
ediţia precedentă sunt acum corectate şi redactarea textului este pe alocuri
ı̂mbunătăţită.
10 septembrie 2007 Rodica Brânzei
7
LISTA FIGURILOR
• Figura 2.1 Jocul ”Avantaj competitiv” p. 17

• Figura 2.2 Exemple de jocuri matriceale p. 18
• Figura 2.3 Jocul canalelor TV p. 19
• Figura 2.4 Exemple de jocuri cu sumă variabilă p. 19
• Figura 2.5 Echilibre Nash ale jocului ”Parteneriat ı̂n afaceri” p. 22
• Figura 2.6 Diagrame cu săgeţi p. 23
• Figura 2.7 Un joc de alegere a rutei p. 24
• Figura 2.8 Eliminarea iterativă a strategiilor dominate p. 26
• Figura 2.9 Un joc cu ”imperfect recall” p. 30
• Figura 2.10 Subjocurile unor jocuri ı̂n formă extensivă p. 31
• Figura 2.11 Jocuri ı̂n formă extensivă cu mutări ale şansei p. 33
• Figura 2.12 Echilibru Nash perfect pe subjoc p. 35
• Figura 2.13 Forma extensivă a jocului parteneriatului p. 36
• Figura 2.14 Jocuri de piaţă ı̂n formă extensivă p. 39
• Figura 2.15 Forma normală corespunzătoare jocurilor de piaţă p. 39
• Figura 2.16 Forma extensivă a unui joc de tip ”ultimatum” p. 40
• Figura 2.17 Forma normală a unui joc de tip ”ultimatum” p. 41
• Figura 2.18 Forma extensivă a unui joc de piaţă extins p. 42
• Figura 2.19 Forma normală a unui joc de piaţă extins p. 43
• Figura 2.20 Forme normale folosite ı̂n inducţia ı̂napoi p. 44
• Figura 2.21 Jocul ”Bătălia sexelor” p. 50
• Figura 2.22 Jocul investiţiei p. 54
1 INTRODUCERE
Jocurile de societate (table, jocuri de cărţi, şah), jocurile sportive (fotbal,

baschet, tenis) şi jocurile de divertisment (incluzând jocurile video) sunt
practicate ı̂n lumea ı̂ntreagă. Elementele comune acestor jocuri sunt:
• Jucătorii (participanţii la joc): persoane, şansa (norocul), natura, com-
putere, echipe, firme, agenţi, ţări, etc.
• Regulile: specifică posibilităţile de comunicare ı̂ntre jucători, rezul-
tatele acordurilor asupra jucării jocului, informaţia disponibilă diferiţi-
lor jucători şi ceea ce este ”common knowledge”.
• Posibilităţile strategice ale jucătorilor: acţiuni, decizii, strategii ce pot
fi folosite de către fiecare jucător.
• Rezultatele posibile: plăţi psihologice (fericire, satisfacţie, prestigiu),
plăţi numerice sau de altă natură (utilităţi).
• Preferinţele jucătorilor asupra rezultatelor posibile.
Teoria jocurilor este ştiinţa care studiază jocuri ı̂ntr-un sens mult mai larg
decât jocurile menţionate mai sus: un joc este orice situaţie strategică guver-
nată de reguli, cu un rezultat bine definit, caracterizat prin interdependenţa
strategică a jucătorilor, care au relaţii de preferinţă asupra rezultatelor posi-
bile. Negocierile economice şi politice, afacerile şi multe alte domenii fur-
nizează numeroase exemple de jocuri. Teoria jocurilor este o ramură a
matematicii. Ea foloseşte rezultate şi metode din alte ramuri ale mate-
maticii cum sunt: algebra, geometria, analiza matematică, probabilităţi şi
statistică, matematici discrete, ecuaţii, fundamentele matematicii. Teoria
jocurilor interacţionează cu multe alte ştiinţe şi domenii fundamentale ale
vieţii: ştiinţe economice, management, administrarea afacerilor, drept, psi-
hologie socială, ştiinţe politice, biologie, sociologie, informatică, cercetări
9
operaţionale. Interacţiunea ı̂ntre teoria jocurilor şi informatică se referă la
ramuri variate ale informaticii, cum sunt: proiectarea şi analiza algoritmilor,
inteligenţa artificială, logică şi decidabilitate, teoria complexităţii, calcul pa-
ralel şi distribuit, baze de date, reţele de calculatoare, internet.
Teoria jocurilor este o teorie matematică care se ocupă cu modelarea şi

analiza situaţiilor de interacţiune ce implică conflict de interese individuale
sau de grup. Borel (1921), John von Neumann (1928) şi John von Neumann
şi Oskar Morgenstern (1944) au pus bazele teoriei matematice a jocurilor ca o
teorie a modelării şi a soluţiilor. Există multe clasificări ale modelelor teore-
tice de joc. Din punctul de vedere al naturii intereselor jucătorilor distingem
ı̂ntre teoria jocurilor necooperative (cu accent pe interesele individuale) şi
teoria jocurilor cooperative (cu accent pe interesele de grup). Ambele tipuri
de modele, jocuri necooperative şi cooperative, se bazează pe presupuneri va-
riate privind: raţionalitatea jucătorilor (jucători perfect raţionali sau jucători
cu raţionalitate limitată); ceea ce este ”common knowledge” pentru jucători;
informaţia (simetrică sau asimetrică) asupra situaţiei analizate disponibilă
jucătorilor.
1.1 Forme de reprezentare a jocurilor
Cele mai utilizate forme pentru a reprezenta jocuri sunt: forma extensivă,
forma normală (sau strategică) şi forma coaliţională.
Forma extensivă a unui joc este un arbore ale cărui noduri reprezintă
poziţiile posibile ale jocului şi ale cărui arce (ramuri) reprezintă mutările posi-
bile pentru participanţii la joc. Jocul se desfăşoară ca o alternare de mutări
ale participanţilor la joc (jucătorii), motiv pentru care un joc ı̂n formă exten-
sivă este numit un joc dinamic. Fiecare nod neterminal are ataşată eticheta
(de identificare a) jucătorului care trebuie să ia o decizie (să facă o mutare)
ı̂n acea poziţie a jocului. Adesea etichetele nodurilor sunt 1, 2, ..., n. Nodurile
terminale conţin vectorul plăţilor jucătorilor dacă jocul se termină ı̂n acea
poziţie. Fiecare arc are ataşată eticheta unei acţiuni. Reprezentarea ı̂n formă
extensivă a unui joc ilustrează desfăşurarea ı̂n timp a jocului. Unele mutări
pot fi aleatoare (mutări ale şansei sau naturii); pentru asemenea mutări există
distribuţii de probabilitate bine-definite care sunt folosite ca etichete pentru
arcele ce ies din nodurile aparţinând şansei. Nodurile de decizie ale jucătorilor
10
din arborele jocului sunt partiţionate ı̂n mulţimi de informaţie. O mulţime de
informaţie pentru un jucător constă din acele poziţii de joc ı̂n care jucătorul
s-ar putea afla atunci când este rândul său să facă o mutare. În reprezentarea
ı̂n forma extensivă a jocului, mulţimile de informaţie ale jucătorilor care
conţin mai mult decât un nod de decizie sunt marcate grafic, spre exemplu
cu contur de tipul − − −. Evident, pentru o anumită mulţime de informaţie,
numărul deciziilor posibile pentru acel jucător trebuie să fie acelaşi pentru
toate nodurile aparţinând acelei mulţimi. Dacă toate mulţimile de informaţie
a tuturor jucătorilor constau dintr-un singur nod, aceasta ı̂nseamnă că orice
jucător cunoaşte perfect situaţia ı̂n care se află atunci când trebuie să aleagă
o acţiune, motiv pentru care jocul se numeşte joc cu informaţie perfectă.
Într-un joc cu informaţie perfectă fiecare jucător cunoaşte ı̂ntreaga istorie de
desfăşurare a jocului până ı̂n momentul când trebuie să facă o mutare. Şahul
este un joc cu informaţie perfectă. Dacă cel puţin un jucător nu cunoaşte
toată istoria de desfăşurare a jocului, atunci jocul este un joc cu informaţie
imperfectă. Jocurile de cărţi (bridge, poker) sunt jocuri cu informaţie imper-
fectă. Presupunerea de raţionalitate a participanţilor la joc implică luarea
deciziilor personale astfel ı̂ncât plata individuală să fie maximizată sau cos-
tul individual să fie minimizat. Dacă jocul nu are mutări ale şansei şi plăţile
jucătorilor sunt cunoscute cu certitudine avem un joc dinamic cu informaţie
completă şi perfectă. Dacă există mutări ale şansei şi plăţile din nodurile ter-
minale ale arborelui sunt cunoscute de toţi jucătorii, atunci plăţile de primit
de către jucători depind de distribuţia de probabilitate a oricărei mutări
aleatoare. În acest caz se acceptă presupunerea că jucătorii acţionează astfel
ı̂ncât să-şi maximizeze plata aşteptată (medie). Plata aşteptată de un jucător
este o medie ponderată prin distribuţia de probabilitate corespunzătoare a
plăţilor din nodurile terminale. Spre exemplu, ı̂ntr-un joc cu aruncarea unei
monede, dacă un jucător obţine plata 2 ı̂n caz de ”pajură” şi plata 6 ı̂n caz
de ”cap”, plata ”aşteptată” de jucător este 1/2 · 2 + 1/2 · 6 = 4. O strategie
a unui jucător este un plan complet de acţiune de-a lungul arborelui jocului,
adică o listă ordonată a mutărilor jucătorului (câte una pentru fiecare din
mulţimile sale de informaţie) de-a lungul arborelui jocului, de la nodul iniţial
către nodurile terminale. Analiza unui joc ı̂n forma extensivă are ca scop de-
terminarea strategiilor optimale ale jucătorilor şi a plăţilor corespunzătoare.
11
Conceptul de soluţie folosit pentru determinarea strategiilor optimale ı̂ntr-un
joc ı̂n forma extensivă este acela de echilibru Nash perfect pe subjoc (Selten,
1975).
Forma normală a unui joc listează pentru fiecare jucător strategiile (pure)
disponibile şi plăţile de obţinut pentru fiecare combinaţie de strategii (pure),
câte una pentru fiecare jucător (profil strategic). Se presupune că jucătorii
ı̂şi aleg strategiile simultan şi independent, motiv pentru care un joc ı̂n formă
normală este numit un joc static. Totuşi, jucarea repetată de un număr finit
sau infinit de ori a unui joc ı̂n formă normală este un joc dinamic. Analiza
unui joc ı̂n formă normală are ca scop determinarea strategiilor optimale ale
jucătorilor şi a plăţilor corespunzătoare. Conceptul de soluţie fundamental
pentru forma normală a unui joc este acela de echilibru Nash (Nash, 1950a).
Forma extensivă a unui joc cu informaţie completă (şi perfectă sau imper-
fectă) şi fără mutări ale şansei generează o formă normală unic definită a
jocului, ı̂n care plăţile jucătorilor sunt cele din nodurile terminale ale arbore-
lui jocului. Forma extensivă a unui joc cu informaţie completă şi mutări ale
şansei generează de asemenea o formă normală unică, dar plăţile jucătorilor
ı̂n forma normală a jocului sunt plăţile aşteptate (medii) din jocul ı̂n forma
extensivă. Forma normală a unui joc poate genera mai multe jocuri ı̂n formă
extensivă. Orice echilibru Nash perfect pe subjoc al jocului ı̂n formă ex-
tensivă este un echilibru Nash al jocului corespunzător ı̂n formă normală.
În schimb, numai un echilibru Nash ”credibil” al jocului ı̂n formă normală
este un echilibru Nash perfect pe subjoc pentru o formă extensivă generată
de forma normală a jocului. Forma normală şi forma extensivă sunt un bun
candidat pentru reprezentarea unei situaţii cu conflict de interese individuale
atunci când nu sunt permise acorduri preliminare ı̂ntre jucători, deşi comuni-
carea ı̂ntre jucători ı̂nainte de ı̂nceperea jocului nu este ı̂ntotdeauna interzisă.
Dacă acordurile preliminare (şi eventual plăţile laterale) sunt permise atunci
forma coaliţională a jocului este un bun candidat pentru descrierea unei
situaţii decizionale interactive ca un joc.
Forma coaliţională a unui joc, cunoscută şi sub numele de forma funcţiei
caracteristice, este o descriere foarte generală a unei situaţii, care specifică
doar suma (maximă) ce poate fi obţinută (pe cont propriu) de fiecare grup
de jucători (coaliţie), incluzând coaliţiile formate dintr-un singur jucător şi
marea coaliţie (grupul format din toţi participanţii la joc). Analiza formei
coaliţionale a unui joc are ca scop determinarea coaliţiei care se va forma
12
şi a modului ı̂n care valoarea acelei coaliţii va fi distribuită ı̂ntre membrii
săi. Adesea, se presupune că marea coaliţie se formează şi problema de
rezolvat este ca jucătorii să cadă de acord asupra modului de alocare a valorii
obţinute de marea coaliţie ı̂ntre membrii săi. O regulă de alocare corespunde
unui anumit concept de soluţie din teoria jocurilor cooperative. Există mai
multe concepte de soluţie a căror atractivitate este prezentată ı̂n termeni
de proprietăţi caracteristice (caracterizare axiomatică). Sâmburele, valoarea
Shapley, τ -valoarea şi nucleolul sunt concepte de soluţie fundamentale pentru
jocuri cooperative ı̂n forma coaliţională. Forma coaliţională a unui joc se
poate construi pornind de la forma normală a jocului sau direct, pe baza
analizei situaţiei interactive ı̂n studiu.
1.2 Modelarea situaţiilor decizionale interactive

ca jocuri
Teoria jocurilor a apărut din necesitatea de a oferi suport pentru optimizarea

luării deciziilor ı̂n situaţii conflictuale. Multe situaţii practice sau din alte
ştiinţe pot fi analizate şi soluţionate folosind modelele existente de joc şi
conceptele de soluţie disponibile sau introducând noi modele de joc şi/sau
noi concepte de soluţie. Folosirea teoriei jocurilor ı̂n aplicaţii presupune două
etape: o etapă de modelare şi o etapă de (analiză şi) rezolvare a modelului de
joc ales. Soluţia obţinută este oferită ca variantă optimală, din punctul de
vedere al teoriei jocurilor, pentru rezolvarea problemei studiate.
Modelarea unei situaţii cu conflict de interese constă ı̂n construirea unui
model formal de joc, ı̂n sensul teoriei jocurilor, pornind de la o descriere nefor-
mală a situaţiei, adesea narativă. Pentru a alege cel mai potrivit model teo-
retic de joc, modelatorul va trebui să analizeze situaţia respectivă din punctul
de vedere al tipului predominant al conflictului de interese existent (interese
individuale sau de grup) şi al regulilor privind comunicarea şi informaţia
disponibilă diferitelor părţi implicate şi capacitatea lor de raţionare. Decizia
modelatorului priveşte de asemenea forma cea mai adecvată de reprezentare
a jocului. Modelele necooperative şi cooperative de joc sunt complementare,
oferind modelatorului o paletă largă de posibilităţi. Un criteriu fundamen-
tal pentru alegerea tipului modelului de joc, necooperativ sau cooperativ, ı̂l
constituie tipul comunicării şi al acordurilor de comportare strategică per-
mise (sau interzise) participanţilor la joc. Dacă acorduri ferme ale jucătorilor
13
(”binding agreements”) ı̂nainte de ı̂nceperea jocului nu sunt permise, atunci
modelul folosit va aparţine ı̂n principiu teoriei necooperative a jocurilor. În
acest caz, modelatorul va trebui să aleagă ı̂ntre forma extensivă şi forma nor-
mală (strategică) pentru a descrie formal situaţia studiată. Forma extensivă
prezintă avantajul unei modelări mai uşoare şi al unei analize mai simple, dar
rezolvarea jocurilor mari este de obicei dificilă şi uneori imposibilă. Forma
normală are avantajul unei rezolvări mai simple; ea este folosită mult pentru
rezolvarea jocurilor de două persoane. Dacă participanţii la joc au posibilităţi
largi de comunicare (incluzând deseori şi posibilitatea efectuării de plăţi late-
rale), atunci un model din teoria cooperativă a jocurilor va fi preferabil. Mai
departe, modelatorul are ı̂ncă de decis asupra tipului de model de joc coo-
perativ folosit şi va alege forma cea mai adecvată de reprezentare a situaţiei
analizate. Forma coaliţională este folosită adesea.
Încheiem introducerea ı̂n teoria jocurilor cu o motivaţie pentru studiul
acestei teorii. Cunoaşterea modelelor teoriei jocurilor şi a conceptelor de
soluţie specifice diferitelor modele furnizează suport pentru ı̂mbunătăţirea
luării deciziilor strategice ı̂n viaţa de zi cu zi, ı̂n profesie şi ı̂n afaceri. Des-
crierea unui număr relativ mare de situaţii conflictuale variate, modelarea
lor ca jocuri şi rezolvarea jocurilor construite (pentru a furniza soluţii pentru
situaţia conflictuală supusă studiului) crează abilităţi de aplicare a teoriei
jocurilor ı̂n practică. Cunoaşterea teoriei jocurilor poate de asemenea ı̂mbu-
nătăţi performanţa ı̂n jocuri de societate, jocuri de divertisment şi jocuri de
noroc, ridicând astfel calitatea vieţii ı̂n timpul liber. În plus, teoria jocurilor
şi interacţiunea sa cu alte discipline, ı̂n particular cu informatica, constitue
un domeniu de cercetare activ prin programe de masterat şi doctorat la multe
universităti din lumea ı̂ntreagă, oferind un domeniu interesant pentru conti-
nuarea studiilor. Aprecierea teoriei jocurilor pe plan mondial este confirmată
de premiile Nobel pentru Economie obţinute pentru contribuţii ı̂n domeniul
teoriei jocurilor: Nash, Harsanyi, Selten (1994), Vickrey (1996), Aumann şi
Schelling (2005).
14
2 JOCURI NECOOPERATIVE
În teoria jocurilor există două modele de bază de jocuri necooperative,

jocuri ı̂n formă normală (sau strategică) şi jocuri ı̂n formă extensivă. Un
joc ı̂n formă normală este o descriere statică şi concisă a unei situatii con-
flictuale ı̂n care jucătorii ı̂şi aleg simultan şi independent strategiile lor (pure
sau mixte) şi primesc plăţi determinate de acele strategii. Conceptul de
soluţie fundamental pentru jocurile ı̂n formă normală (strategică) este acela
de echilibru Nash. Jocurile ı̂n formă normală (cu informaţie completă) şi
conceptul de echilibru Nash (ı̂n strategii pure) sunt introduse ı̂n paragraful
2.1. Acest paragraf tratează de asemenea două clase speciale de jocuri strate-
gice, jocurile de tip potenţial şi congestie, care au ı̂ntotdeauna echilibre Nash
(ı̂n strategii pure); ele joacă un rol important ı̂n interacţiunea dintre teoria
jocurilor şi informatică. Un joc ı̂n formă extensivă este o descriere dinamică
detaliată a unei situaţii conflictuale, specificând cine şi când face o ”mu-
tare” (adică ia o decizie sau acţiune) ı̂n joc şi care sunt opţiunile disponibile
fiecărui jucător de fiecare dată când are dreptul la o ”mutare”. Concep-
tul de soluţie fundamental pentru jocuri ı̂n formă extensivă (cu informaţie
completă) este acela de echilibru Nash perfect pe subjoc. Jocurile ı̂n formă
extensivă cu informaţie completă şi conceptul de echilibru Nash perfect pe
subjoc sunt introduse ı̂n paragraful 2.2. Paragraful 2.3 tratează legatura
ı̂ntre forma extensivă şi forma normală şi relaţia dintre conceptele corespun-
zătoare de echilibru Nash. Extensia mixtă a unui joc ı̂n forma normală şi
conceptul de echilibru Nash ı̂n strategii mixte sunt introduse ı̂n paragraful
2.4, care tratează de asemenea rezolvarea jocurilor matriceale şi bimatriceale
(ı̂n strategii mixte). Capitolul se ı̂ncheie cu o vedere de ansamblu asupra
jocurilor necooperative analizând rolul informaţiei ı̂n modelele teoriei ne-
cooperative a jocurilor (informaţie completă versus informaţie incompletă,
informaţie perfectă versus informaţie imperfectă, informaţie simetrică versus
informaţie asimetrică).
15
2.1 Jocuri ı̂n formă normală şi echilibre Nash
Un joc necooperativ ı̂n formă normală (strategică) este un model al unei

situaţii ı̂n care sunt implicaţi n participanţi cu interese proprii conflictuale,
jucătorii, ale căror acţiuni posibile sunt cunoscute de către toţi jucătorii.
Fiecare jucător alege planul său de acţiune (o dată şi pentru totdeauna ı̂n
situaţia dată) şi toate deciziile jucătorilor sunt făcute simultan (adică atunci
când un jucător alege planul său de acţiune, el nu este informat asupra planu-
lui de acţiune a nici unui alt jucător). Jucătorii aleg simultan şi independent
acţiunile lor şi apoi primesc plăţi care depind de combinaţia strategiilor alese.
Presupunem că plăţile sunt deterministe şi cunoscute de toţi jucătorii. Un
joc necooperativ ı̂n formă normală constă din trei elemente. Întâi, o mulţime
N = {1, 2, ..., n} a jucătorilor. Apoi, fiecare jucător i ∈ N are o mulţime
de acţiuni (strategii
Y pure) Xi disponibile pentru el şi o funcţie de plată (sau
utilitate) Ki : Xj −→ IR, care descrie plăţile jucătorului i rezultate din
j∈N
toate alegerile posibile de strategii de către jucători (câte una pentru fiecare
jucător), adică pentru fiecare profil strategic x = (x1 , x2 , ..., xn ).
Un joc necooperativ ı̂n formă normală (strategică) este un triplet

hN, {Xi }i∈N , {Ki }i∈N i, unde N este mulţimea jucătorilor şi, pentru fiecare
i ∈ N, XY i este mulţimea acţiunilor sau strategiilor pure ale jucătorului i,
iar Ki : Xj −→ IR, este funcţia de plată (sau funcţia de utilitate) a
j∈N
jucătorului i. Y
Un element din Xj este un profil strategic; el se mai numeşte rezultat
j∈N
(posibil) al jocului. Uneori notăm
Y un profil strategic (x1 , ..., xi , ..., xn ) cu
(xi , x−i ), unde x−i ∈ X−i = Xj .
j∈N \{i}
Un joc hN, {Xi }i∈N , {Ki }i∈N i e un joc finit dacă N este o mulţime finită
şi mulţimile X1 , ..., Xn sunt mulţimi finite. Un joc finit de două persoane va
fi desemnat ı̂n cele ce urmează prin hX, Y, K, Li . Un asemenea joc este de
obicei reprezentat printr-un tablou ale cărui linii sunt ı̂nsoţite de etichetele
strategiilor jucătorului 1 şi ale cărui coloane sunt ı̂nsoţite de etichetele strate-
giilor jucătorului 2, iar la intersecţia fiecărei linii cu o coloană se găseşte
o pereche de numere, reprezentând plata jucătorului 1 urmată de plata
jucătorului 2 pentru combinaţia de strategii (pure) corespunzătoare liniei
16
şi coloanei respective. Dacă ı̂ntr-un joc finit cu doi jucători etichetăm strate-
giile fiecărui jucător astfel ı̂ncât X = {1, .., m} şi Y = {1, .., n}, atunci jocul
este descris printr-o (bi)matrice (K(i, j), L(i, j))i=1,...,m;j=1,...,n , unde K(i, j)
şi L(i, j) reprezintă, respectiv, plata obţinută de jucătorul 1 şi de jucătorul
2 ı̂n situaţia ı̂n care jucătorul 1 alege strategia i şi jucătorul 2 alege strategia
j. Un joc strategic finit de două persoane se numeşte un joc bimatriceal.
Etichete explicite pot fi ataşate liniilor şi coloanelor bimatricii ı̂n cazul unui
joc bimatriceal. Exemplul 2.1 modelează o situaţie de interacţiune strategică
legată de avantaj competitiv ca un joc bimatriceal, reprezentat ı̂n Figura 2.1.
Exemplul 2.1. (Avantaj competitiv) Două companii cu acelaşi tip de acti-

vitate trebuie să decidă simultan şi independent dacă să introducă o tehnolo-
gie nouă (strategia I) sau nu (strategia N). Dacă ambele companii introduc
tehnologia nouă sau ambele decid să nu o introducă, profitul curent al fiecărei
companii nu este afectat. Dacă ı̂nsă o companie decide să introducă noua
tehnologie, iar cealaltă companie nu o introduce, atunci profitul companiei
care adoptă noua tehnologie va creşte cu a unităţi valorice (spre exemplu
miliarde de lei), ı̂n timp ce profitul curent al celeilalte companii va ı̂nregistra
o scădere de a unităţi valorice.
I N
I 0, 0 a, −a
N −a, a 0, 0
Figure 2.1: Jocul ”Avantaj competitiv”
Când cel puţin unul dintre jucători are infinit de multe strategii posibile, jocul
nu este finit. Exemplul 2.2 modelează o situaţie strategică de parteneriat ı̂n
afaceri ca un joc infinit de două persoane.
Exemplul 2.2. (Parteneriat ı̂n afaceri) Doi prieteni doresc să-şi deschidă
ı̂mpreună o afacere şi trebuie să decidă simultan şi independent asupra nivelu-
lui de efort investit ı̂n această afacere. Presupunem că nivelul de efort poate
fi ı̂n intervalul [0, 4], iar profitul obţinut de fiecare dintre ei depinde de nivelul
de efort investit de ambii prin funcţiile de plată K : [0, 4]×[0, 4] −→ IR şi
L : [0, 4]×[0, 4] −→ IR, definite prin:
K(x, y) = 2(x + y + cxy) − x2 , L(x, y) = 2(x + y + cxy) − y 2 ,
17
¡ ¢
unde c ∈ 0, 14 este o constantă care măsoară complementaritatea muncii
celor doi parteneri de afaceri. Un echilibru Nash corespunzând maximizării
funcţiilor de plată individuale este x∗ = y ∗ = 1/(1 − c). Acesta se obţine
rezolvând ı̂n raport cu x şi y sistemul format din ecuaţiile ∂K(x, y)/∂x = 0,
∂L(x, y)/∂y = 0. Totuşi, dacă ambii jucători urmăresc maximizarea functiei
de plată totale, K + L, echilibrul Nash este x b = yb = 2/(1 − 2c) < 1/(1 − c).
Astfel, ı̂n cazul ı̂n care cei doi parteneri de afaceri au un ţel comun, un nivel
mai mic de efort e necesar din partea fiecăruia. Echilibrul Nash (x∗ , y ∗ ) este
ilustrat ı̂n Figura 2.5.
X
Un joc finit hN, {Xi }i∈N , {Ki }i∈N i este un joc cu sumă nulă dacă Ki =0.
i∈N
Un joc finit de două persoane cu sumă nulă satisface L = −K şi, de aceea,
poate fi reprezentat printr-un tablou sau o matrice, [K(i, j)]i=1,...,m;j=1,...,n ,
conţinând doar plăţile pentru jucătorul 1 (primite de la jucătorul 2). Un
astfel de joc se numeşte joc matriceal. Un joc cu sumă nulă pentru două
persoane este de asemenea cunoscut sub numele de joc strict competitiv,
ı̂ntrucât cooperarea dintre jucători este exclusă. Jocul din Figura 2.1 este un
joc pur competitiv; ı̂n Figura 2.2 (a) găsiţi descrierea sa (mai simplă) ca un
joc matriceal. Şahul este un joc finit de două persoane cu sumă nulă: când
jucătorul 1 câstigă, el obţine plata 1 iar jucătorul 2 obţine plata −1; când
jucătorul 2 câstigă, acesta obţine plata 1, iar jucătorul 1 obţine plata −1; ı̂n
caz de remiză ambii jucători obţin plata 0.
2 2 1 4 6 2 1
0 a
0 2 5 3 4 3 5
−a 0
4 2 3 2 0 1 6
(a) (b) (c)
Figure 2.2: Exemple de jocuri matriceale
Un joc strategic hN, {Xi }i∈N , {Ki }i∈N i este un joc cu sumă constantă dacă
X
Ki = C, unde C este o constantă. Orice joc cu sumă constantă poate fi
i∈N
transformat ı̂ntr-un joc cu suma nulă, aşa cum ilustrăm ı̂n Exemplul 2.3 şi
Figura 2.3.
18
Exemplul 2.3. (Jocul canalelor TV) Un canal de televiziune specializat ı̂n
transmisiuni sportive şi un canal de televiziune specializat ı̂n telenovele speră
să-şi lărgească audienţa la telespectori dacă ambele vor transmite atât sport
cât şi telenovele. Sondajele efectuate permit evaluarea ı̂n procente a audienţei
celor două canale ı̂n rândurile telespectatorilor, conform cu Figura 2.3 (a),
ı̂n care situaţia descrisă este modelată ca un joc cu sumă constantă. Figura
2.3 (b) conţine jocul cu sumă nulă echivalent jocului cu sumă constantă.
T S T S
T 55%, 45% 52%, 48% T 10%, −10% 4%, −4%
S 50%, 50% 45%, 55% S 0%, 0% −10%, 10%
(a) (b)
Figure 2.3: Jocul canalelor TV
Cele mai multe jocuri bimatriceale nu sunt ı̂nsă cu suma nulă sau con-
stantă; acestea sunt cunoscute sub numele de jocuri cu sumă variabilă. Figura
2.4 conţine exemple de jocuri cu sumă variabilă care vor fi utilizate ulterior.
3, 1 0, 0 5, 5 0, 10 2, 2 0, 0
0, 0 1, 3 10, 0 1, 1 0, 0 1, 2
(a) (b) (c)
Figure 2.4: Exemple de jocuri cu sumă variabilă
În cele ce urmează, prin jocuri bimatriceale vom referi numai jocurile
de două persoane cu sumă variabilă. Întrucât ı̂ntr-un astfel de joc ambii
jucători pot câştiga sau ambii jucători pot pierde, ı̂n acelaşi timp, depinzând
de acţiunile luate de cei doi jucători, un joc bimatriceal hX, Y, K, Li poate fi
reprezentat ca o pereche de jocuri matriceale, K şi L, ambii jucători urmărind
acelaşi scop (maximizarea câştigului propriu sau minimizarea costului pro-
priu).
Conceptul de soluţie de bază pentru jocuri ı̂n formă strategică este cel
de echilibru Nash (Nash, 1950a). Un echilibru Nash este un profil strategic
care este stabil ı̂n sensul că nici-un jucător nu-şi poate ı̂mbunătăţi plata
deviind unilateral de la acest profil strategic prin alegerea unei alte strategii.
19
Elementele mulţimilor Xi se mai numesc strategii pure pentru a le distinge de
strategii mixte, care sunt distribuţii de probabilitate pe mulţimea strategiilor
pure ale unui jucător. Acest paragraf se referă ı̂n exclusivitate la echilibre
Nash ı̂n strategii pure, numite şi echilibre Nash pure. Echilibrele Nash ı̂n
strategii mixte, numite şi echilibre Nash mixte, sunt definite folosind extensia
mixtă a unui joc ı̂n formă normală; ele vor fi studiate ı̂n paragraful 2.4.
Profilul strategic xb = (bx1 , ..., x
bn ) este un echilibru Nash (pur) al jocului
hN, {Xi }i∈N , {Ki }i∈N i dacă pentru toţi i ∈ N şi toţi xi ∈ Xi avem
Ki (xi , x
b−i ) ≤ Ki (b
xi , x
b−i ).
Exemplul 2.4. Considerăm jocul ı̂n formă normală reprezentat ı̂n Figura
2.1, unde a > 0. Combinaţia de strategii (I, N ) nu este un echilibru Nash,
deoarece jucătorul 2 ı̂şi poate ı̂mbunătăţi plata (de la −a la 0) prin deviere
unilaterală, alegând strategia I. Combinaţia de strategii (I, I) este un echili-
bru Nash deoarece prin deviere unilaterală oricare dintre jucători obţine plata
−a care e mai mică decât 0.
Un joc care are cel puţin un echilibru Nash se numeşte un joc determi-
nat. Dacă un joc matriceal hX, Y, K, −Ki este un joc determinat atunci
spunem că jocul are ”punct şa”; plata jucătorului 1 ı̂ntr-un echilibru Nash
se numeşte valoarea jocului şi se notează cu v (hX, Y, K, −Ki) , sau v(K). În
cazul existenţei mai multor echilibre Nash pentru un joc matriceal, fiecare
echilibru Nash are aceeaşi valoare şi echilibrele Nash sunt interschimbabile.
Teorema 2.5. Fie hX, Y, K, −Ki un joc de două persoane cu sumă nulă şi
fie (x1 , y1 ) şi (x2 , y2 ) echilibre Nash ale jocului. Atunci:
(i) (Proprietatea de interschimbare) (x1 , y2 ) şi (x2 , y1 ) sunt de asemenea
echilibre Nash;
(ii) (Proprietatea plăţilor egale) K(xi , yj )=K(x1 , y1 ) pentru toţi i,j ∈ {1, 2}.
Într-un echilibru Nash al unui joc bimatriceal, fiecare jucător ı̂şi maxi-
mizează utilitatea proprie dat fiind ceea ce face celălalt jucător. O strategie
x ∈ X pentru care există y ∈ Y astfel că (x, y) este un echilibru Nash se
numeste strategie optimală pentru jucătorul 1. Analog se defineşte o strate-
gie optimală pentru jucătorul 2. O pereche de strategii optimale corespunde
ı̂ntotdeauna unui echilibru Nash al jocului. Dacă un joc are un singur echili-
bru Nash, el se numeşte un joc strict determinat. Într-un joc matriceal (strict)
determinat, cunoaşterea de către un jucător a strategiei celuilalt jucător nu-l
20
determină pe jucător să-şi schimbe planurile proprii. În cazul multiplicităţii
echilibrelor Nash ale unui joc bimatriceal determinat, plăţile jucătorilor pot
fi diferite pentru echilibre Nash distincte. Din acest motiv, un jucător poate
prefera un echilibru Nash iar celălalt jucător poate prefera un alt echilibru
Nash, caz ı̂n care rezultatul jocului nu va fi un echilibru Nash. Chiar şi ı̂n
cazul unui echilibru Nash unic, acest rezultat al jocului poate fi nesatisfăcător.
În orice joc de două persoane cu sumă nulă putem determina valoarea
inferioară şi valoarea superioară a jocului definite prin
v(X, Y, K, −K) := sup inf K(x, y);

x∈X y∈Y
v̄(X, Y, K, −K) := inf sup K(x, y).

y∈Y x∈X
Are loc relaţia v(X, Y, K, −K) ≤ v̄(X, Y, K, −K) pentru orice joc
hX, Y, K, −Ki.
Valoarea inferioară şi superioară pentru un joc de două persoane cu sumă
nulă pot fi privite ca nivele de securitate ale jucătorilor, ı̂ntrucât reprezintă
suma minimă pe care jucătorul 1 şi-o poate garanta ı̂n jocul respectiv şi, res-
pectiv, suma maximă pe care jucătorul 2 ar putea-o pierde ı̂n jocul respectiv,
indiferent de acţiunea aleasă de adversarul său (sub presupunerea că acesta
este raţional şi inteligent). Dacă valoarea superioară şi valoarea inferioară a
unui joc matriceal au aceeaşi valoare, atunci jocul are punct şa. Un punct
şa are cea mai mică valoare ı̂n linie (astfel ı̂ncât jucătorul 2 nu poate câştiga
prin schimbarea coloanei) şi cea mai mare valoare ı̂n coloană (deci jucătorul
1 nu poate câştiga prin schimbarea liniei). Dacă un joc are punct şa, ambii
jucători ar trebui să aleagă strategii care duc la acest punct. Jocul din
Figura 2.2. (c) este strict determinat: punctul şa este 3 şi echilibrul Nash al
jocului este profilul strategic (linia 2, coloana 2). Pentru jocuri determinate
de două persoane, determinarea punctelor de echilibru Nash se poate face
pe baza considerării multifuncţiilor ”cel mai bun răspuns” ale jucătorilor.
Multifuncţia cel mai bun răspuns (ı̂n strategii pure) a unui jucător asociază
la fiecare dintre strategiile pure ale celuilalt jucător, mulţimea strategiilor
pure care ar putea fi optimale (cel mai bun răspuns) pentru acel jucător ı̂n
acea situaţie. Un echilibru Nash pur este un profil strategic care constă din
strategii pure care sunt cel mai bun răspuns la cel mai bun răspuns. O metodă
analitică pentru determinarea funcţiilor cel mai bun răspuns pentru jocuri
infinite de două persoane este prezentată după Teorema 2.12. Din punct de
vedere grafic, echilibrele Nash pure ale unui astfel de joc sunt punctele de
21
intersecţie ale graficelor funcţiilor cel mai bun răspuns. Figura 2.5 ilustrează
aceasta pentru jocul ”Parteneriat ı̂n afaceri” din Exemplul 2.2.
Figure 2.5: Echilibre Nash ale jocului ”Parteneriat ı̂n afaceri”
O diagramă cu săgeţi poate fi folositoare pentru determinarea echilibrelor

Nash (pure) pentru jocuri finite de două persoane. Pentru fiecare jucător se
consideră pe rând toate strategiile celuilalt jucător. Pentru o strategie fixată
a partenerului de joc se trasează săgeţi ı̂n sensul strategiilor ce sunt mai avan-
tajoase jucătorului respectiv din punctul de vedere al plăţilor (sau costurilor)
generate. Săgeţile converg spre un echilibru Nash (vezi Figura 2.6 unde (a) si
(b) reprezintă jocuri de tip cost, iar (c) şi (d) reprezintă jocuri de tip câştig).
Dacă nu există săgeţi care converg, atunci jocul respectiv nu are echilibre
Nash (pure); el va avea ı̂nsă echilibre Nash ı̂n strategii mixte (vezi para-
graful 2.4). Fiecare pereche de săgeţi convergente indică un echilibru Nash.
Jocurile matriceale determinate au deseori echilibre Nash multiple; acestea
au aceeaşi valoare. Jocurile cu sumă variabilă au ı̂n mod obişnuit puncte
de echilibru Nash multiple; acestea pot avea valori foarte diferite. Figura
2.6 ilustrează existenţa sau nu a unui echilibru Nash, respectiv unicitatea
sau multiplicitatea echilibrelor Nash, marcând cu simbolul ∗ toate echilibrele
Nash existente.
22
−→ ←−
8, 9 8, 7 −10, 4 −5, 0
↑ ↓ ↓ ↑
11, 12 7, 6∗ 2, −10 −5, 5
−→ −→
(a) (b)
−→ −→
50, 50 80, 100∗ 130 180∗
↓ ↑ ↓ ↑
100, 80∗ 60, 60 180∗ 160
←− ←−
(c) (d)
Figure 2.6: Diagrame cu săgeţi
Exemplul 2.6. (Un joc de alegere a rutei) Două companii de transporturi

trebuie să aleagă ruta cea mai puţin costisitoare luând ı̂n consideraţie efectul
aglomeraţiei pe sectoarele de drum folosite ı̂n comun. Presupunem că o
companie trebuie să facă transporturi de la localitatea A la localitatea C şi
poate face aceasta via B sau via D, iar cealaltă companie trebuie să facă
transporturi de la localitatea B la localitatea D şi poate face aceasta via
A sau via C. Costurile aferente sectoarelor de drum AB, BC, AD şi CD,
pentru fiecare utilizator, sunt mai mari ı̂n caz de folosinţă ı̂n comun; ambele
costuri posibile sunt precizate ı̂n Figura 2.7 (a). Spre exemplu, sectorul de
drum AB implică un cost de 2 unităţi valorice dacă are un singur utilizator,
şi un cost de 5 unităţi valorice pe utilizator, ı̂n cazul ı̂n care ambele companii
folosesc acest sector de drum. Această situaţie de alegere a rutei poate fi
modelată ca un joc bimatriceal unde jucătorul 1 are două strategii, R1 şi
R2 , corespunzând rutelor A − B − C şi A − D − C, iar jucătorul 2 are două
strategii, R10 şi R20 , corespunzând rutelor B − A − D şi B − C − D. Costurile
aferente sunt indicate ı̂n Figura 2.7 (b).
Jocul din Exemplul 2.6 este generat de un model de congestie introdus

de Rosenthal (1973).
Un model de congestie poate fi descris ca hN, M, (Xi )i∈N , (cj )j∈M i unde
• N este mulţimea jucătorilor implicaţi (călători, şoferi, producători).
• M este mulţimea facilităţilor implicate ı̂n folosinţa comună (secţiuni de
drum, utilaje, etc.)
23
• Xi este mulţimea strategiilor jucătorului i, o submulţime nevidă a
lui M .
• cj : {1, 2, ..., n} −→ IR este funcţia de cost pentru facilitatea j, unde

cj (k) ı̂nseamnă costurile facilităţii j, pentru fiecare utilizator al ei, ı̂n
cazul ı̂n care există exact k utilizatori.
1 2
R10 R20 −→
AB 2 5
14 12
BC 3 6 R1 8, 9 8, 7 ↑ ↓
17 11∗
AD 4 10 R2 11, 12 7, 6∗
−→
DC 1 3
(a) (b) (c)
Figure 2.7: Un joc de alegere a rutei
Situaţiile corespunzătoare unui model de congestie pot fi modelate ca

jocuri (de tip) congestie. Un joc de tip congestie este un joc ı̂n Y formă strate-
gică hN, {Xi }i∈N , {Ki }i∈N i, unde pentru fiecare i ∈ N , Ki (x) : Xj −→ IR
j∈N
X
este definită prin Ki (x) = − cj (nj (x)), unde nj (x) = |{i ∈ N |j ∈ xi }| este
j∈xi
numărul de utilizatori ai facilităţii j dacă jucătorii aleg strategiile conform cu
profilul strategic x. Într-un joc congestie de tip cost, toţi jucătorii urmăresc
minimizarea costului individual total. Echilibrele Nash ale unui joc con-
gestie recomandă jucătorilor evitarea congestiei (aglomeraţiei). Jocurile (de
tip) congestie sunt jocuri strategice determinate şi au multe aplicaţii ı̂n infor-
matică. Ele formează o subclasă interesantă a jocurilor potenţial introduse
de către Monderer şi Shapley (1996) pe baza noţiunii de funcţie potenţial
(exact). O funcţie potenţial (exact) măsoară diferenţa plăţilor fiecărui jucător
ı̂n caz de deviere unilaterală. În Figura 2.7 (c) este dată o funcţie potenţial
(exact) pentru jocul de alegere a rutei.
Exemplul 2.7. (Un joc al documentării) Studenţii din doi semiani de studii
trebuie să se pregătească pentru un examen folosind un suport de curs tipărit
existent la biblioteca facultăţii şi un laborator cu calculatoare. Dacă toţi
24
studenţii ı̂nvaţă la bibliotecă, ori toţi la laborator, aglomeraţia creată dimi-
nuează eficienţa documentării lor. Jocul din Figura 2.6 (c) poate fi considerat
ca un joc al documentării.
Fie
Y G = hN, {Xi }i∈N , {Ki }i∈N i un joc strategic de n persoane şi fie
P : Xi −→ IR o funcţie cu valori reale definită pe mulţimea profilurilor
i∈N
strategice. Funcţia P este un potenţial
Y exact pentru G dacă pentru orice
i ∈ N , pentru orice x−i ∈ X−i = Xj şi pentru orice xi , yi ∈ Xi , are loc
j∈N \{i}
Ki (xi , x−i ) − Ki (yi , x−i ) = P (xi , x−i ) − P (yi , x−i ).
O funcţie P potenţial exact pentru G induce un joc potenţial GP =
hN, {Xi }i∈N , P, ..., P i . Figura 2.6 (d) conţine un joc potenţial pentru ”Jocul
documentării” din Figura 2.6 (c).
Teorema 2.8. Fie G = hN, {Xi }i∈N , {Ki }i∈N i un joc finit de n persoane şi
fie P un potenţial exact pentru G. Atunci
(i) Jocurile G şi GP au aceeaşi mulţime de echilibre Nash;
(ii) G are cel puţin un echilibru Nash.
Propoziţia 2.9. (Rosenthal) Fie hN, M, (Xi )i∈N , (cj )j∈M i un model de con-
gestie şi fie G jocul de tip congestie corespunzător. Atunci G Yeste un joc
potenţial exact. O funcţie potenţial pentru G este dată de P : Xi −→ IR,
i∈N
definită pentru orice x = (xi )i∈N prin
X X
P (x) = − cj (`).
S
j∈ xi `=1,...,nj (x)
i∈N
Întrucât multe jocuri strategice finite au echilibre Nash multiple, ı̂n teo-
ria jocurilor necooperative au fost introduse variante (rafinări) ale noţiunii
de echilibru Nash, care impun condiţii suplimentare asupra echilibrelor Nash.
Noţiunea de echilibru Nash nedominat (sau echilibru Nash ı̂n strategii ne-
dominate) şi cea de echilibru Nash puternic prezintă un interes particular.
Spunem că o strategie xbi a jucătorului i domină strategia xi a aceluiaşi jucător
dacă prima nu este niciodată mai nefavorabilă jucătorului i decât cea de-a
25
doua şi uneori Y
e mai avantajoasă, adică pentru toate profilurile strategice
x−i ∈ X−i = Xj ale celorlalţi jucători are loc
j∈N \{i}
(∗) Ki (b
xi , x−i ) ≥ Ki (xi , x−i )
cu cel puţin o inegalitate strictă pentru cel puţin un x−i ∈ X−i . O strategie
care nu este dominată de către nici-o altă strategie se numeşte strategie ne-
dominată. Un profil strategic x = (xi )i∈N este un echilibru Nash nedominat
dacă el este un echilibru Nash ı̂n strategii nedominate, adică este un echili-
bru Nash ı̂n care xi este o strategie nedominată pentru fiecare i ∈ N. Un
echilibru Nash ı̂n strategii nedominate poate fi găsit prin eliminarea iterativă
a strategiilor dominate, aşa cum ilustrăm ı̂n Figura 2.8.
2 2 1 4 2 2 1
0 2 5 0 2
0 2 5 3 −→ 0 2 5 −→ −→ −→ 4 2 −→ 2
4 2 3 4 2
4 2 3 2 4 2 3
Figure 2.8: Eliminarea iterativă a strategiilor dominate
Un caz special apare ı̂n situaţia ı̂n care un jucător are o strategie care ı̂i
dă o plată la fel de bună cu plata pe care o poate obţine utilizând oricare din
celelalte strategii ale sale pentru orice profil strategic al celorlalţi jucători.
O strategie x bi ∈ Xi se numeşte o strategie slab dominantă dacă relaţia (∗)
are loc pentru orice xi ∈ Xi şi pentru orice x−i ∈ X−i . Un jucător poate
avea mai multe strategii slab dominante. Asemenea strategii ar trebui să
ofere jucătorului aceeaşi plată pentru orice profil strategic fixat al celorlalţi
jucători. Dacă o strategie slab dominantă x bi ∈ Xi este astfel ı̂ncât pentru
fiecare xi ∈ Xi există un profil strategic x−i astfel ı̂ncât (∗) are loc cu ine-
galitate strictă, atunci strategia xbi ∈ Xi domină toate celelalte strategii ale
jucătorului şi se numeşte strategie dominantă. Un jucător poate avea cel
mult o strategie dominantă.
Exemplul 2.10. În jocul de tip ”ultimatum” descris ı̂n Exemplul 2.18 şi
reprezentat ı̂n formă normală ı̂n Figura 2.17 (a), jucătorul 2 are o singură
strategie dominantă: (a1 , a2 , a3 ). Toate celelate strategii ale jucătorului 2 sunt
dominate. Spre exemplu, strategia (r1 , a2 , r3 ) este dominată de (r1 , a2 , a3 )
deoarece aceasta dă jucătorului 2 aceeaşi plată dacă jucătorul 1 foloseşte
26
strategia 5-1 sau 4-2, dar dacă jucătorul 1 foloseşte strategia 3-3, strategia
(r1 , a2 , a3 ) dă jucătorului 2 o plată mai mare decât strategia (r1 , a2 , r3 ).
Un echilibru Nash care satisface condiţia că este stabil ı̂mpotriva tuturor
deviaţiilor de către coaliţii de jucători se numeşte un echilibru Nash puternic.
Un echilibru Nash x∗ = (x∗i )i∈N al jocului hN, {Xi }i∈N , {Ki }i∈N i este un
echilibru Nash puternic Ydacă pentru toate coaliţiile S ⊂ N nu există nici-un
xS = (xi )i∈S ∈ XS = Xi astfel ı̂ncât Ki (xS , x∗ (N \ S)) ≥ Ki (x∗ ) pentru
i∈S
toţi i ∈ N , cu inegalitate strictă pentru cel puţin un jucător i ∈ S.
Exemplul 2.11. Pentru jocul din Exemplul 2.19, dintre cele trei echili-
bre Nash marcate cu ∗ ı̂n Figura 2.19 (b), două sunt echilibre Nash pu-
ternice: (A1 , (I, L2 , A3 )) şi (A1 , (I, A2 , A3 )). Echilibrul Nash (L1 , (I, L2 , L3 ))
nu este puternic deoarece coaliţia {1, 2} poate creşte plata jucătorului 1 de
la 2 la 3, menţinând plata 2 pentru jucătorul 2, prin folosirea strategiei
xS = (A1 , (I, A2 , L3 )).
Există totuşi multe jocuri strategice finite care nu au nici-un echilibru

Nash (ı̂n strategii pure). Într-o asemenea situaţie (şi de asemenea când jocul
are echilibre Nash ı̂n strategii pure), se poate considera extensia mixtă a jocu-
lui. Aceasta este construită pe baza randomizării pe mulţimea strategiilor
pure, aşa-numitele strategii mixte. Extensia mixtă a unui joc necooperativ
ı̂n formă normală şi determinarea echilibrelor Nash ı̂n strategii mixte pentru
jocuri matriceale şi bimatriceale sunt tratate ı̂n paragraful 2.4.
Considerăm acum jocuri de două persoane cu (infinit de) multe strategii
şi tratăm determinarea echilibrelor lor Nash. Fie x1 o strategie a jucătorului
1, x2 o strategie a jucătorului 2, K1 : X1 ×X2 −→ IR, funcţia de plată a
jucătorului 1, şi K2 : X1 ×X2 −→ IR, funcţia de plată a jucătorului 2. Dacă
x1 şi x2 pot lua, spre exemplu, 100 de valori diferite, utilizarea unei bimatrice
de dimensiune 100×100 devine cel puţin anevoioasă. Dacă x1 şi x2 iau valori
ı̂ntr-un interval, spre exemplu [0,1], situaţia conflictuală este imposibil să
fie reprezentată printr-o (bi)matrice. Într-un asemenea caz, dacă funcţiile
de plată ale jucătorilor sunt diferenţiabile, pentru determinarea echilibrelor
Nash se poate folosi analiza matematică.
Teorema 2.12. Fie hN, {Xi }i∈N , {Ki }i∈N i un joc strategic cu N mulţime
finită. Dacă pentru fiecare i ∈ N mulţimea strategiilor Xi este un interval
mărginit şi funcţia de plată Ki este de clasă C 2 şi strict concavă ı̂n xi , atunci
există un echilibru Nash x∗ al jocului.
27
În cele ce urmează, prezentăm o metodă analitică pentru determinarea
echilibrelor Nash a unui joc infinit de două persoane. Notăm cu f1 : X2 −→ X1
funcţia cel mai bun răspuns a jucătorului 1, unde f1 (x2 ) este cel mai bun
răspuns a jucătorului 1 la x2 , unde x2 este o strategie arbitrară fixată a
jucătorului 2. Această funcţie se obţine din ∂K1 (x1 , x2 )/∂x1 = 0 şi furnizează
valoarea lui x1 care maximizează K1 (x1 , x2 ) pentru orice x2 fixat. Notăm cu
f2 : X1 −→ X2 funcţia cel mai bun răspuns a jucătorului 2, unde f2 (x1 ) este
cel mai bun răspuns a jucătorului 2 la x1 , unde x1 este o strategie arbitrară
fixată a jucătorului 1. Această funcţie se obţine din ∂K2 (x1 , x2 )/∂x2 = 0 şi
furnizează valoarea lui x2 care maximizează K2 (x1 , x2 ) pentru orice x1 fixat.
Funcţia f definită prin f = (f1 , f2 ) se numeşte funcţia cel mai bun răspuns a
jocului. Această funcţie este continuă şi asociază fiecărei perechi de strategii
(x1 , x2 ) plata (f1 (x2 ), f2 (x1 )). Un echilibru Nash al jocului, x∗ = (x∗1 , x∗2 ), sa-
tisface simultan x∗1 = f1 (x∗2 ) şi x∗2 = f2 (x∗1 ). Din punct de vedere grafic, echili-
brele Nash ale jocului se află la intersecţia funcţiilor ”cel mai bun răspuns”
a celor doi jucători.
Exemplul 2.13. (Jocul publicităţii) Două firme concurente pe piaţa de
bunuri de consum trebuie să decidă simultan şi independent asupra nivelu-
lui optim al cheltuielilor lor cu publicitatea (ı̂n vederea maximizării profi-
tului individual). Presupunem că ambele firme au un plafon bugetar pen-
tru publicitate de 1000 e şi că profitul lor individual depinde de cheltu-
ielile cu publicitatea x1 şi x2 prin funcţiile de plată K1 : X1 ×X2 −→ IR şi
K2 : X1 ×X2 −→ IR, definite prin: K1 (x1 , x2 ) = 1000x1 −x21 −x22 , K2 (x1 , x2 ) =
1000x2 − x1 x2 − x22 . Această situaţie de decizie interactivă poate fi modelată
ca un joc infinit de două persoane cu sumă nulă h[0, 1000], [0, 1000], K1 , K2 i.
Deciziile optime privind cheltuielile cu publicitatea sunt determinate prin
calcularea echilibrelor Nash ale jocului. Acestea se obţin rezolvând sistemul
liniar 1000 − 2x1 = 0, 1000 − x1 − 2x2 = 0. Echilibrul Nash al jocului conside-
rat este x∗ = (500, 250), generând profitul K1 (500, 250) = 187.500 e pentru
jucătorul 1 şi K2 (500, 250) = 62.500 e pentru jucătorul 2.
Conceptul de echilibru Nash este fundamental pentru rezolvarea jocurilor
necooperative ı̂n formă strategică. Încheiem acest paragraf ı̂ncercând să
furnizăm un răspuns la ı̂ntrebarea: Este un echilibru Nash o soluţie a jocului?
O condiţie suficientă este asigurată de strategii nedominate ı̂n profilul strate-
gic corespunzând unui echilibru Nash. Presupunem că (s, t) este un echilibru
Nash şi că o altă strategie s∗ domină s pentru jucătorul 1 şi o strategie t∗
domină t pentru jucătorul 2. Atunci (s, t) nu este o soluţie a jocului.
28
2.2 Jocuri ı̂n formă extensivă şi echilibre Nash perfecte
pe subjoc
Forma extensivă a unui joc este o pereche hN, T i , unde N = {1, 2, ..., n}
este mulţimea (finită a) jucătorilor şi T este arborele jocului, oferind posibi-
litatea unei descrieri dinamice detaliate a unei situaţii de interacţiune strate-
gică. Un arbore este un graf orientat cu un nod special, numit rădăcină,
o mulţime de noduri terminale şi una de noduri neterminale şi un drum
unic de la rădăcină la fiecare din nodurile grafului. În arborele unui joc (ı̂n
formă extensivă) orice drum pornind de la rădăcină la un nod terminal in-
dică un mod ı̂n care ”istoria” jocului poate evolua. Nodurile neterminale ale
arborelui jocului (incluzând rădăcina), numite noduri de decizie, corespund
persoanelor ce iau decizii (jucătorii). Nodurile terminale indică rezultatele
(plăţile) posibile ale jucătorilor dacă jocul se sfârşeşte ı̂n acel nod termi-
nal. Arcele corespund ”mutărilor” (acţiunilor, strategiilor, deciziilor) jucă-
torilor care mută consecutiv (secvenţial ı̂n timp). Reprezentarea corectă a
unei situaţii conflictuale ca un joc ı̂n formă extensivă implică ı̂ncorporarea
corectă a tuturor regulilor jocului. Aceasta implică necesitatea identificării
pentru fiecare jucător a aşa-numitelor mulţimi de informaţie. O mulţime de
informaţie a unui jucător conţine toate nodurile de decizie ce aparţin acelui
jucător când acelui jucător ı̂i vine rândul la mutare. Mulţimile de informaţie
care conţin cel puţin două noduri de decizie se marchează grafic ı̂n arborele
jocului, de obicei folosind un contur de forma − − −. Dacă o mulţime
de informaţie a unui jucător constă dintr-un singur nod de decizie, atunci
acel jucător ştie precis care e poziţia sa ı̂n arborele jocului, adică jucătorul
cunoaşte toată istoria desfăşurării jocului până ı̂n acel moment. Dacă toate
mulţimile de informaţie ale tuturor jucătorilor constau dintr-un singur nod,
jocul este un joc (dinamic) cu informaţie perfectă. Jocul de şah este un
joc cu informaţie perfectă. De obicei, mulţimile de informaţie cu un singur
nod de decizie nu se marchează distinct ı̂n reprezentarea arbore a jocului.
Dacă o mulţime de informaţie a unui jucător conţine mai mult decât un
nod de decizie, aceasta ı̂nseamnă că ı̂n momentul ı̂n care jucătorul trebuie
să ia o decizie, el ştie doar că se poate afla ı̂n oricare din nodurile mulţimii
sale de informaţie; ı̂n acest caz, alegerea strategiei sale se face ı̂n condiţii
de informaţie imperfectă. Un joc ı̂n care cel puţin un jucător are cel puţin
o mulţime de informaţie ce conţine cel puţin două noduri de decizie este
un joc (dinamic) cu informaţie imperfectă. Jocul de bridge este un joc cu
informaţie imperfectă. Arborele unui joc ı̂n formă extensivă este un arbore
etichetat care satisface următoarele reguli:
29
1. Orice nod este un succesor al nodului iniţial (rădăcină).
2. Orice nod cu excepţia nodului iniţial are exact un predecesor imediat.
Nodul iniţial nu are predecesori.
3. Ramuri (arce) multiple ce corespund unui acelaşi nod au etichete (de
acţiuni) diferite.
4. Fiecare mulţime de informaţie conţine noduri de decizie ale unui singur
jucător.
5. Toate nodurile ı̂ntr-o anumită mulţime de informaţie trebuie să aibă
acelaşi număr de succesori imediaţi şi aceeaşi mulţime de etichete pen-
tru ramurile corespunzătoare.
În paragraful următor, trei variante ale unei situaţii de piaţă sunt modelate
ca jocuri necooperative folosind forma extensivă a unui joc. În forma exten-
sivă din Figura 2.14 (a), fiecare jucător are o singură mulţime de informaţie
conţinând un singur nod. În forma extensivă din Figura 2.14 (b), mulţimea
de informaţie a jucătorului 1 conţine două noduri de decizie şi mulţimea de
informaţie a jucătorului 2 conţine un singur nod de decizie. În forma ex-
tensivă din Figura 2.18 (a), jucătorul 1 are o singură mulţime de informaţie
constând dintr-un singur nod de decizie, iar jucătorul 2 are trei mulţimi de
informaţie cu câte un singur nod de decizie. Paragraful următor conţine
de asemenea un joc de tip ”ultimatum” descris verbal ı̂n Exemplul 2.18 şi
modelat ca un joc ı̂n formă extensivă ı̂n Figura 2.16 (a).
Figure 2.9: Un joc cu ”imperfect recall”
30
În modelarea unei situaţii ca un joc ı̂n formă extensivă, se presupune de
obicei ”perfect recall”, adică capacitatea perfectă a fiecărui jucător de a-şi
aminti mutările sale anterioare. Jocurile din exemplele precedente sunt jocuri
cu ”perfect recall”.Teoria jocurilor studiază de asemenea jocuri cu ”imperfect
recall”. Un asemenea joc este ilustrat ı̂n Figura 2.9. Jocurile cu imperfect
recall au aplicaţii in informatică.
(a)
(b)
Figure 2.10: Subjocurile unor jocuri ı̂n forma extensivă
31
Dat un joc ı̂n formă extensivă, un nod x al arborelui se spune că iniţiază
un subjoc dacă nici x şi nici unul dintre succesorii lui x nu sunt ı̂ntr-o mulţime
de informaţie care conţine şi noduri care nu sunt succesori ai lui x. Un subjoc
este un arbore definit de x şi succesorii săi. Într-un joc cu informaţie perfectă
orice nod iniţiază un subjoc. În Figura 2.10 evidenţiem toate subjocurile unui
joc cu informaţie perfectă şi ale unui joc cu informaţie imperfectă.
Există numeroase situaţii practice ı̂n care şansa joacă un rol. Spre exem-
plu, ı̂n fotbal şansa decide care echipă ı̂ncepe jocul. Şansa poate interveni
la ı̂nceperea jocului sau/şi la anumite momente ı̂n cursul desfăşurării jocu-
lui. În astfel de situaţii, şansa este considerată ea ı̂nsăşi ca un jucător, caz
ı̂n care spunem că avem un joc cu mutări ale şansei. În forma extensivă a
unui asemenea joc, nodurile aparţinând şansei sunt etichetate corespunzător
(de obicei cu C (”chance”) sau cu 0) iar arcele ce ies din asemenea noduri
indică mutările şansei prin distribuţii de probabilitate ale evenimentelor posi-
bile. Figura 2.11 conţine două forme extensive ale unor jocuri cu mutări ale
şansei: Figura 2.11 (a) conţine forma extensivă a unui joc cu informaţie per-
fectă, iar Figura 2.11 (b) conţine forma extensivă a unui joc cu informaţie
imperfectă.
Conceptul de soluţie specific jocurilor ı̂n formă extensivă este acela de
echilibru Nash perfect pe subjoc. Un echilibru Nash perfect pe subjoc este
un profil strategic secvenţial raţional, ı̂n sensul că ı̂ncorporează raţionalitatea
secvenţială a jucătorilor prin evaluarea individuală a subjocurilor. Raţiona-
litatea secvenţială implică faptul că o strategie optimală pentru un jucător
ar trebui să maximizeze plata sa condiţionat de oricare din mulţimile sale de
informaţie. Presupunerea obişnuită pentru jocuri ı̂n formă extensivă este că
raţionalitatea secvenţială este ”common knowledge”. Ideea care stă la baza
determinării unui echilibru Nash perfect pe subjoc este că fiecare jucător,
ı̂nainte de a-şi alege o strategie (adică un plan complet de acţiune de-a lungul
arborelui jocului), ı̂ncearcă să anticipeze alegerile de alternative ale celorlalţi
jucători ı̂n urma fiecărei decizii posibile pentru el. Procedând astfel, un
jucător ı̂ncearcă să determine (ghicească) care nod final va fi atins ca urmare
a selectării de către el a oricăreia dintre alternativele disponibile. Apoi,
jucătorul foloseşte această informaţie pentru a lua decizia optimă. Astfel,
fiecare jucător va studia reprezentarea jocului şi va considera ce vor face
ceilalţi jucători (raţionali şi inteligenţi) ı̂n viitor ca răspuns la mutarea sa ı̂ntr-
o mulţime de informaţie particulară. Folosirea acestei abordări pentru jocul
ı̂n formă extensivă din Figura 2.16 (a) conduce la determinarea echilibrului
Nash perfect pe subjoc reprezentat prin săgeţi ı̂n Figura 2.16 (b).
32
(a)
(b)
Figure 2.11: Jocuri ı̂n formă extensivă cu mutări ale şansei
Metoda de bază pentru determinarea echilibrelor Nash perfecte pe subjoc

este inducţia ı̂napoi (”backward induction”). Inducţia ı̂napoi este un proces
de analizare a jocului de la nodurile terminale ale arborelui jocului către
rădăcina sa, prin identificarea tuturor subjocurilor jocului şi determinarea
soluţiilor optimale ale jucătorilor la nivel de subjoc. Determinarea soluţiilor
optimale ı̂n cadrul fiecărui subjoc (şi a jocului iniţial) se realizează astfel: pen-
tru fiecare dintre mulţimile de informaţie ale jucătorilor, date fiind nodurile
terminale ce pot fi atinse, se renunţă la acţiunile dominate ale jucătorului
respectiv. O strategie a unui jucător ı̂ntr-un (sub)joc ı̂n formă extensivă este
un plan complet de acţiune al jucătorului de-a lungul arborelui (sub)jocului.
Strategiile posibile ale unui jucător trebuie să aibă câte o singură compo-
nentă pentru fiecare din mulţimile de informaţie ale jucătorului respectiv ı̂n
arborele jocului, considerând o ordine fixată de parcurgere a arborelui jocului
(de obicei, pe nivele ale arborelui de la rădăcină spre nodurile terminale, şi ı̂n
cadrul fiecărui nivel de la stânga la dreapta). Fiecare componentă a strate-
giei unui jucător poate primi ca valoare oricare dintre etichetele acţiunilor
posibile pentru jucătorul respectiv din mulţimea de informaţie corespunză-
toare acelei componente. Spre exemplu, strategiile jucătorului 2 sunt I şi R ı̂n
33
jocul ı̂n forma extensivă din Figura 2.14 (a). În jocul ı̂n formă extensivă din
Figura 2.18 (a) strategiile jucătorului 2 sunt 3-uple ı̂n care prima componentă
corespunde primei mulţimi de informaţie a acestui jucător (rădăcina arbore-
lui), a doua componentă corespunde mulţimii de informaţie a jucătorului 2
situată la stânga pe nivelul 2 al arborelui, iar a treia componentă corespun-
de mulţimii de informaţie a jucătorului 2 situată la dreapta pe nivelul 2 al
arborelui. Prima componentă poate lua valori ı̂n mulţimea {I, R}, a doua
componentă poate lua valori ı̂n mulţimea {L2 , A2 }, iar a treia componentă
poate lua valori ı̂n mulţimea {L3 , A3 }. Jucătorul 2 are, prin urmare, 8 strate-
gii posibile ı̂n jocul din Figura 2.18 (a): (I, L2 , L3 ), (I, L2 , A3 ), (I, A2 , L3 ),
(I, A2 , A3 ), (R, L2 , L3 ), (R, L2 , A3 ), (R, A2 , L3 ) şi (R, A2 , A3 ).
Un profil strategic este un echilibru Nash perfect pe subjoc dacă el specifică
un echilibru Nash ı̂n orice subjoc al jocului original; un asemenea profil strate-
gic este raţional secvenţial. Dacă nu există egalitate de plăţi, adică două sau
mai multe noduri terminale ce conduc la aceeaşi plată pentru vreunul dintre
jucători, atunci inducţia ı̂napoi identifică un singur echilibru Nash perfect
pe subjoc. În cele ce urmează, exemplificăm determinarea echilibrulor Nash
perfecte pe subjoc prin metoda inducţiei ı̂napoi pentru jocurile din Figura
2.10.
Exemplul 2.14. Analizăm jocul din Figura 2.10 (a) folosind metoda inducţiei
ı̂napoi. Ultimele decizii care trebuie făcute sunt acelea ı̂n care jucătorul 2
trebuie să decidă dacă să lupte sau să se acomodeze, după ce a observat de-
cizia luată de jucătorul 1. În subjocul 1, jucătorul 2 va prefera acţiunea L2
care-i asigură plata 2 (fiindcă 2 > 1), iar ı̂n subjocul 2, jucătorul 2 va prefera
acţiunea A3 care-i asigură plata 4 (fiindcă 4 > 3). Acum, analizăm subjocul
3 care ı̂ncepe cu decizia jucătorului 1 (L1 sau A1 ) ı̂n situaţia ı̂n care jucătorul
2 a selectat acţiunea I. Dacă jucătorul 1 ar alege L1 , atunci am văzut că
jucătorul 2 alege L2 , implicând plata 2 pentru jucătorul 1; dacă jucătorul
1 ar alege A1 , am văzut că jucătorul 2 alege A3 , implicând plata 5 pentru
jucătorul 1. Acţiunea optimală pentru jucătorul 1 ı̂n subjocul 3 este aşadar
A1 (fiindcă 5 > 2). Acum analizăm jocul complet pentru a stabili care e
acţiunea optimală a jucătorului 2 la ı̂nceputul jocului. Dacă jucătorul 2 ar
alege R, atunci el ar obţine plata 0; dacă el ar alege I, am văzut din analiza
anterioară a subjocului 3 că jucătorul 1 alege A1 , urmată de acţiunea A3 a
jucătorului 2, implicând plata 4 pentru jucătorul 2 (care este mai mare decât
0). Echilibrul perfect pe subjoc al acestui joc, (A1 , L2 , A3 ), este reprezentat
prin săgeţi ı̂n Figura 2.18 (b).
34
Exemplul 2.15. Analizăm jocul din Figura 2.10 (b) prin metoda inducţiei
ı̂napoi, ı̂ncepând cu subjocul care ı̂ncepe ı̂n situatia ı̂n care jucătorul 1 a ales
anterior acţiunea U . Fiindcă jucătorul 2 nu ştie dacă jucătorul 1 alege A sau
B, el va prefera (pentru mulţimea de informaţie ı̂n care se află) acţiunea X
care-i asigură o plată mai bună (1 > 0) sau cel puţin la fel de bună (4 = 4) ca
strategia Y . Jucătorul 1 va prefera acţiunea A care-i asigură plata 3 (fiindcă
3 > 1). Acum rămâne de analizat jocul complet. Dacă jucătorul 1 ar alege
D, el ar primi plata 2; dacă, ı̂n schimb, el ar alege U , tocmai am văzut că
ulterior el poate alege A, urmat de alegerea X de către jucătorul 2, rezultând
plata 3 pentru jucătorul 1, care e mai mare decât 2. Prin urmare, ı̂n rădăcina
arborelui jocului jucătorul 1 va alege U . Echilibrul Nash perfect pe subjoc
al jocului analizat, (U A, X), este reprezentat prin săgeţi ı̂n Figura 2.12.
Figure 2.12: Echilibru Nash perfect pe subjoc
Determinarea prin metoda inducţiei ı̂napoi a echilibrelor Nash perfecte pe

subjoc pentru jocurile (ı̂n formă extensivă) finite cu informaţie perfectă sau
imperfectă se poate face, de asemenea, folosind forma normală (corespunză-
toare formei extensive) pentru fiecare subjoc al jocului şi pentru jocul iniţial.
Un echilibru Nash al jocului strategic este un echilibru perfect pe subjoc al
jocului ı̂n formă extensivă dacă restricţia sa la fiecare subjoc este un echilibru
Nash al acelui subjoc. Această metodă este ilustrată ı̂n Exemplul 2.20.
În cele ce urmează tratăm reprezentarea ı̂n formă extensivă a jocurilor
(cu sau fără mutări ale şansei) ı̂n care jucătorii au (infinit de) multe strategii.
35
Simbolul grafic arc de cerc este folosit pentru a reprezenta o mulţime infinită
de strategii pure. Pentru exemplificare folosim forma extensivă a jocului
parteneriatului din Exemplul 2.2, reprezentată ı̂n Figura 2.13.
Figure 2.13: Forma extensivă a jocului parteneriatului
În aplicarea metodei inducţiei ı̂napoi pentru determinarea echilibrelor

Nash perfecte pe subjoc pentru jocuri infinite, se recomandă pornirea cu
acele subjocuri (care sunt spre sfârsitul jocului original) pentru care există
speranţa să aibă un singur echilibru Nash. Apoi, se foloseşte inducţia ı̂napoi
ı̂ncorporând aceste rezultate de echilibru ı̂n subjocuri mai ample. Desigur,
determinarea echilibrelor Nash perfecte pe subjoc se poate face folosind
metoda analitică bazată pe funcţiile cel mai bun răspuns ale jucătorilor (vezi
de asemenea paragraful 2.4). Exemplificăm aceasta pentru un joc de piaţă
cu infinit de multe strategii.
Exemplul 2.16. Considerăm o piaţă cu două firme concurente, firma 1 şi

firma 2, care trebuie să-şi aleagă simultan şi independent nivelul (optim) al
producţiei, q1 şi, respectiv, q2 , după ce firma 1 a selectat nivelul (optim al)
publicităţii. Presupunem că preţul pieţei este p = a − q1 − q2 , unde a este
nivelul publicităţii ales de firma 1 (şi observat de firma 2). Presupunem de
asemenea că cele două firme produc la cost zero şi costul publicităţii firmei 1
este 2a3 /81. Profitul firmei 1 este de forma (a−q1 −q2 )q1 −2a3 /81, iar profitul
firmei 2 este (a − q1 − q2 )q2 . Observăm că BR1 (q2 ) = (a − q2 )/2, BR2 (q1 ) =
(a − q1 )/2. Echilibrul Nash al jocului corespunde la q1∗ (a) = q2∗ (a) = a/3,
implicând p∗ (a) = a/3. Profitul generat pentru firma 1 va fi funcţia z1 definită
prin z1 (a) = a2 − 2a3 /81. Maximixarea profitului firmei 1 determină nivelul
optim a∗ = 3 al publicităţii. Nivelul optim al producţiei ambelor firme este,
prin urmare, q1∗ = q2∗ = 1.
36
2.3 Forma extensivă şi forma normală
Situaţii practice pot fi uneori studiate folosind instrumentele teoriei jocurilor.

În orice aplicaţie a teoriei jocurilor trebuie să transpunem descrierea nefor-
mală (adesea narativă) a problemei ı̂ntr-un model teoretic din teoria jocurilor
alegând forma cea mai potrivită pentru a reprezenta jocul şi apoi să-l re-
zolvăm. Situaţiile practice ı̂n care conflictul existent este ı̂n principal gene-
rat de interese individuale, iar acordurile ferme (de comportare strategică)
ale jucătorilor nu sunt permise (deşi comunicarea ı̂ntre jucători ı̂nainte de
ı̂nceperea jocului nu este ı̂ntotdeauna interzisă) pot fi adesea modelate cu
uşurintă folosind un model din teoria necooperativă a jocurilor. O decizie
importantă care trebuie făcută este aceea a selectării formei celei mai potri-
vite de reprezentare a jocului. Forma extensivă este o descriere dinamică şi
detaliată a jocului. Ea prezintă avantajul unei analize naturale a situaţiei
modelate folosind arborele jocului. Forma normală este o descriere statică şi
concisă. Ea se bazează pe presupunerea că jucătorii iau decizii simultan şi
independent şi prezintă un avantaj din punctul de vedere al rezolvării jocu-
lui. Adesea, descrierea neformală a unei situaţii conflictuale este mai uşor
tradusă ı̂n forma extensivă a unui joc. Pentru a folosi avantajele formei nor-
male ı̂n rezolvarea jocului, forma extensivă obţinută poate fi apoi translatată
ı̂n forma normală corespunzătoare, pe baza determinării strategiilor jucă-
torilor ı̂n arborele jocului. Oricărui joc ı̂n formă extensivă ı̂i corespunde o
formă normală unică. Totusi, forme extensive diferite pot genera acelaşi joc
ı̂n formă normală. Ilustrăm relaţia dintre forma extensivă şi forma normală
prin următorul exemplu care modelează, ı̂n două variante privind regulile
jocului, comportarea pe piaţa de jocuri video a două firme de software.
Exemplul 2.17. Considerăm următoarea situaţie decizională interactivă pe

piaţa de jocuri video. Presupunem că pe piaţă se află o firmă specializată ı̂n
jocuri video, jucătorul 1, care realizează un profit curent de 5 unităţi valo-
rice (spre exemplu miliarde de lei). O altă firmă de software, firma 2, care
realizează un profit curent de o unitate valorică din alte tipuri de activităţi,
intenţionează să intre pe piaţa de jocuri video. Ea trebuie să decidă dacă intră
sau nu pe piaţă ştiind că firma 1 va reacţiona, ori ostil (ı̂ncercând să distrugă
firma 2) ori acceptând situaţia de concurenţă creată prin intrarea firmei 2.
Situaţia descrisă poate fi modelată ca un joc necooperativ de două persoane,
unde firma 1 are două alternative (ı̂n caz de intrare pe piaţă a firmei 2):
A – corespunzând acomodării sale cu prezenţa pe piaţă a firmei 2 – şi L –
37
corespunzând luptei cu firma 2, spre exemplu printr-o campanie publicitară
costisitoare –, iar firma 2 are două strategii: I – corespunzând deciziei de
a intra pe piaţă – şi R – corespunzând deciziei de renunţare la intenţia de
intrare pe piaţă. În ceea ce priveşte plăţile jucătorilor, ı̂n cazul ı̂n care firma 2
decide să nu intre pe piaţă, ambele firme realizează profitul lor curent. Dacă
firma 2 decide să intre pe piaţă şi firma 1 se acomodează situaţiei, profitul
firmei 2 va creşte, spre exemplu la 2 unităţi valorice, ı̂n timp ce profitul
firmei 1 va scădea, spre exemplu la 2 unităţi valorice. Dacă ı̂nsă firma 2 intră
pe piată şi firma 1 luptă pentru ı̂nlăturarea firmei 2, piaţa de jocuri video
va avea de suferit asigurând ambelor firme profit zero. Modelarea acestei
situaţii ca un joc ı̂n formă extensivă necesită informaţii suplimentare privind
desfăşurarea temporală a jocului şi regulile privind informaţia disponibilă ju-
cătorilor. Presupunem că firma 2 trebuie să decidă ı̂ntâi dacă intră sau nu
pe piaţă şi considerăm următoarele două variante privind informaţia de care
dispune firma 1 atunci când decide tipul său de comportare faţă de firma 2
pe piaţa de jocuri video:
(a) Firma 1 observă intrarea pe piaţă a firmei 2 şi apoi decide comportarea
sa. Această variantă este modelată ca un joc necooperativ cu informaţie
(completă şi) perfectă, al cărui arbore este descris ı̂n Figura 2.14 (a);
(b) Firma 1 trebuie să decidă comportarea sa pe piaţa video (ı̂n caz de
intrare a firmei 2) fără a şti decizia luată de firma 2. Această variantă
este modelată ca un joc necooperativ cu informaţie (completă dar)
imperfectă, al cărui arbore este descris ı̂n Figura 2.14 (b).
Ambelor forme extensive privind jocul firmelor pe piaţa de jocuri video

le corespunde un acelaşi joc ı̂n formă normală, reprezentat ı̂n Figura 2.15.
Scopul acestui paragraf este să studieze legătura ı̂ntre forma extensivă şi
forma normală a unui joc necooperativ şi ı̂ntre conceptele de soluţie speci-
fice fiecărei forme. Modul ı̂n care forma extensivă a unui joc generează o
formă normală unică este ilustrat cu ajutorul a două situaţii de interacţiune
strategică prezentate ı̂n Exemplul 2.18 şi Exemplul 2.19.
38
(a)
(b)
Figure 2.14: Jocuri de piaţă ı̂n formă extensivă
I R
L 0, 0 5, 1
A 2, 2 5, 1
Figure 2.15: Forma normală corespunzătoare jocurilor de piaţă
Exemplul 2.18. (Joc de tip ”ultimatum”) Doi jucători pot primi o sumă de
6 unităţi valorice dacă ei cad de acord asupra modului de ı̂mpărţire (ı̂n unităţi
valorice ı̂ntregi) a acestei sume. În vederea atingerii unui acord, jucătorii
urmează o procedură strictă: unul dintre jucători, jucătorul 1, propune o
schemă de ı̂mpărţire a celor 6 unităţi valorice iar celălalt jucător, jucătorul
2, reacţionează la propunerea făcută acceptând-o sau refuzând-o. Alterna-
tivele rezonabile (şi realizabile) pentru jucătorul 1 sunt schemele de divizare
39
5-1, 4-2 şi 3-3. Dacă jucătorul 2 acceptă propunerea făcută de jucătorul 1,
cele 6 unităţi valorice sunt ı̂mpărţite conform propunerii respective, dar dacă
jucătorul 2 refuză propunerea făcută de jucătorul 1, oferta este anulată (adică
ambii jucători primesc 0 unităţi valorice). Situaţia descrisă poate fi mode-
lată uşor ca un joc ı̂n formă extensivă cu informaţie (completă şi) perfectă,
reprezentat ı̂n Figura 2.16 (a), unde alternativele disponibile jucătorului 2 –
a(cceptă) şi r(espinge) – sunt indexate pentru a face clar la care propunere
a jucătorului 1 se referă. Echilibrul perfect pe subjoc al jocului dinamic
din Figura 2.16 (a) este reprezentat ı̂n Figura 2.16 (b) cu ajutorul săgeţilor.
Este natural (sub presupunerea de raţionalitate perfectă) ca jucătorul 2 să ac-
cepte oricare dintre cele trei propuneri ale jucătorului 1 fiindcă ı̂n caz contrar
acest jucător va primi 0 unităţi valorice ı̂n loc de 1, 2 sau 3 unităţi valorice.
Bazat pe aceasta, jucătorul 1 va alege alternativa cea mai atractivă pentru el
(5-1). În termeni de strategii ale jucătorilor (planuri complete de acţiune ale
fiecărui jucător de-a lungul arborelui jocului), echilibrul perfect pe subjoc
este profilul strategic (5-1,(a1 , a2 , a3 )).
(a)
(b)
Figure 2.16: Forma extensivă a unui joc de tip ”ultimatum”
40
Formei extensive din Figura 2.16 (a) ı̂i corespunde o formă normală unică
reprezentată ı̂n Figura 2.17 (a) ca un joc bimatriceal ale cărui linii corespund
la strategiile pure ale jucătorului 1, ı̂n ordinea 5-1, 4-2, 3-3, şi ale cărui
coloane corespund la cele 8 strategii ale jucătorului 2, ı̂n ordinea: (a1 , a2 , a3 ),
(a1 , a2 , r3 ), (a1 , r2 , a3 ), (a1 , r2 , r3 ), (r1 , a2 , a3 ), (r1 , a2 , r3 ), (r1 , r2 , a3 ) şi
(r1 , r2 , r3 ). Acest joc ı̂n formă normală are 7 echilibre Nash care sunt marcate
cu ∗ ı̂n Figura 2.17 (b). Dintre aceste echilibre Nash numai echilibrul Nash
(5-1, (a1 , a2 , a3 )), adică (linia 1, coloana 1) a bimatricei, este ”credibil” fiind
unicul echilibru Nash ı̂n strategii nedominate al jocului. Acest echilibru Nash
coincide cu echilibrul perfect pe subjoc din Figura 2.16 (b) pentru jocul ı̂n
formă extensivă care a generat această formă normală.
5, 1 5, 1 5, 1 5, 1 0, 0 0, 0 0, 0 0, 0
4, 2 4, 2 0, 0 0, 0 4, 2 4, 2 0, 0 0, 0
3, 3 0, 0 3, 3 0, 0 3, 3 0, 0 3, 3 0, 0
(a)
5, 1∗ 5, 1∗ 5, 1∗ 5, 1∗ 0, 0 0, 0 0, 0 0, 0
4, 2 4, 2 0, 0 0, 0 4, 2∗ 4, 2∗ 0, 0 0, 0
3, 3 0, 0 3, 3 0, 0 3, 3 0, 0 3, 3∗ 0, 0
(b)
Figure 2.17: Forma normală a unui joc de tip ”ultimatum”
Exemplul 2.19. (Un joc de piaţă extins) Considerăm o versiune mai amplă
a unui joc de piaţă de tipul celui descris ı̂n Exemplul 2.17. Presupunem, ca
şi ı̂n prima versiune a Exemplului 2.17, că ı̂ntâi firma 2 decide dacă intră
pe piaţa de jocuri video (strategia I) sau renunţă (strategia R), după care
firma 1, observând alternativa aleasă de firma 2, decide dacă va lupta cu
firma 2 (spre exemplu printr-o campanie publicitară costisitoare) ı̂n scopul
distrugerii acesteia sau se va acomoda intrării pe piaţă a firmei 2. Firma
2, observând alternativa de comportare adoptată de firma 1 ca răspuns la
intrarea sa pe piaţă, va trebui să decidă modul său de comportare strategică
ı̂n continuare: ori să intre ı̂n luptă cu firma 1 ca să-şi consolideze poziţia pe
piaţă, ori, pur şi simplu, să se acomodeze situaţiei existente.
41
O situaţie de tipul celei descrise ı̂n Exemplul 2.19 este modelată ca un
joc ı̂n formă extensivă ı̂n Figura 2.18 (a). Alternativele L (luptă) şi A (se
acomodează) sunt indexate pentru a face clar jucătorul la care se referă şi,
pentru jucătorul 2, situaţia particulară ı̂n desfăşurarea jocului. Un echilibru
perfect pe subjoc pentru acest joc este reprezentat ı̂n Figura 2.18 (b) cu aju-
torul săgeţilor. El poate fi determinat cu uşurinţă folosind metoda inducţiei
ı̂napoi. Figura 2.10 (a) marchează subjocurile jocului iniţial, folosite ı̂n cadrul
inducţiei ı̂napoi.
(a)
(b)
Figure 2.18: Forma extensivă u unui joc de piaţă extins
Formei extensive din Figura 2.18 (a) ı̂i corespunde o formă normală unică
reprezentată ı̂n Figura 2.19 (a) ca un joc bimatriceal. Jucătorul 1 are două
42
strategii pure: L1 – să lupte ı̂mpotriva firmei 2 – şi A1 – să se acomodeze
intrării pe piaţă a firmei 2, corespunzând, ı̂n această ordine, liniilor bimatricii.
Jucătorul 2 are 8 strategii pure, ce corespund coloanelor bimatricei ı̂n or-
dinea: (I, L2 , L3 ), (I, L2 , A3 ), (I, A2 , L3 ), (I, A2 , A3 ), (R, L2 , L3 ), (R, L2 , A3 ),
(R, A2 , L3 ), (R, A2 , A3 ). Acest joc ı̂n formă normală are 3 echilibre Nash
marcate cu ∗ ı̂n Figura 2.19 (b). Dintre acestea numai profilul strategic
(A1 , (I, L2 , A3 )), adică (linia 2, coloana 2) a bimatricei, este un echilibru
Nash ”credibil” fiind unicul echilibru Nash ı̂n strategii nedominate. Acest
echilibru Nash coincide cu echilibrul perfect pe subjoc din Figura 2.18 (b)
pentru jocul ı̂n formă extensivă care a generat această formă normală.
2, 2 2, 2 4, 1 4, 1 9, 0 9, 0 9, 0 9, 0
2, 3 5, 4 2, 3 5, 4 9, 0 9, 0 9, 0 9, 0
(a)
2, 2∗ 2, 2 4, 1 4, 1 9, 0 9, 0 9, 0 9, 0
2, 3 5, 4∗ 2, 3 5, 4∗ 9, 0 9, 0 9, 0 9, 0
(b)
Figure 2.19: Forma normală a unui joc de piaţă extins
Încheiem acest paragraf cu un exemplu de utilizare a formei normale

ı̂n cadrul inducţiei ı̂napoi pentru determinarea echilibrului Nash perfect pe
subjoc.
Exemplul 2.20. Considerăm jocul ı̂n formă extensivă din Figura 2.10 (b) şi
Figura 2.12. Forma sa normală şi cea a subjocului său sunt reprezentate ı̂n
Figura 2.20. Echilibrul Nash al subjocului este profilul strategic (A, X). Jocul
complet are trei echilibre Nash: (U A, X), (DA, Y ) şi (DB, Y ). Considerând
restricţia acestor echilibre Nash la subjoc obţinem (A, X), (A, Y ) şi (B, Y ).
Concludem ca numai echilibrul Nash (U A, X) este perfect pe subjoc. Acest
echilibru perfect pe subjoc este de asemenea obţinul folosind forma extensivă
(vezi Figura 2.12).
43
X Y
UA 3, 4 1, 4 X Y
UB 2, 1 2, 0 A 3, 4 1, 4
DA 2, 6 2, 6 B 2, 1 2, 0
DB 2, 6 2, 6
(a) (b)
Figure 2.20: Forme normale folosite ı̂n inducţia ı̂napoi
2.4 Extensia mixtă şi echilibre Nash ı̂n strategii mixte
În paragraful 2.1 am introdus forma normală pentru jocuri necooperative de n

persoane (n ≥ 2) şi noţiunea de echilibru Nash ı̂n strategii pure. Problemele
fundamentale abordate au fost existenţa şi calcularea echilibrelor Nash pure
pentru jocuri matriceale şi bimatriceale. Am văzut că nu toate jocurile ma-
triceale şi bimatriceale au echilibre Nash pure. Clase de jocuri necooperative
care au echilibre Nash pure, cum sunt jocurile de tip potenţial şi congestie, au
fost introduse şi unele exemple rezolvate. Identificarea jocurilor matriceale
care au echilibre Nash pure s-a bazat ı̂n principal pe căutarea punctelor şa (ı̂n
strategii pure) folosind matricea iniţială a jocului sau cea obţinută prin eli-
minarea iterativă a liniilor şi coloanelor dominate. Determinarea echilibrelor
Nash pure pentru jocuri (bi)matriceale s-a făcut folosind diagrame cu săgeţi,
metoda eliminării iterative a liniilor şi coloanelor dominate, şi funcţiile cel
mai bun răspuns (ı̂n strategii pure) ale fiecărui jucător la toate strategiile
pure ale celuilalt jucător. Totuşi multe jocuri matriceale obţinute prin mo-
delarea de situaţii practice nu au punct şa ı̂n strategii pure, şi cele mai multe
jocuri bimatriceale nu au echilibre Nash ı̂n strategii pure. Pentru asemenea
jocuri e dificil să se recomande jucătorilor strategii optimale (din punctul
de vedere al teoriei jocurilor) de folosit ı̂n situatia de joc analizată. Este
ı̂nsă ı̂ntotdeauna posibil, ı̂ntr-un joc finit, să se recomande fiecărui jucător
o (schemă raţională de) randomizare pe mulţimea strategiilor sale (pure),
adică o strategie mixtă optimală.
O strategie mixtă pentru jucătorul i ı̂n jocul hN, {Xi }i∈N , {Ki }i∈N i este
|X |
o distribuţie de probabilitate σi = (σi1 , ...., σi i ) pe mulţimea Xi a strategi-
ilor sale pure, adică un vector cu componente nenegative a căror sumă este
egală cu 1. O strategie pură poate fi considerată ca un caz degenerat de
44
strategie mixtă care atribuie probabilitatea 1 acelei strategii pure şi proba-
bilitatea 0 tuturor celelalte strategii pure ale jucătorului respectiv.
YNotăm
cu Σi mulţimea strategiilor mixte σi ale jucătorului i. Atunci Σ = Σi de-
i∈N
semnează mulţimea (convexă a) tuturor combinaţiilor de strategii mixte ale
jucătorilor. Dacă σ = (σ1 , ..., σn ) ∈ Σ, atunci Ki (σ) este plata aşteptată de
jucătorul i când jucătorii aleg profilul strategic σ. Extensia mixtă a jocului
hN, {Xi }i∈N , {Ki }i∈N i este jocul hN, {Σi }i∈N , {Ki }i∈N i care foloseşte strate-
giile mixte şi plăţile aşteptate ale jucătorilor. Un echilibru Nash ı̂n strategii
mixte, numit şi echilibru Nash mixt, este o combinaţie σ ∗ = (σ1∗ , ..., σn∗ ) de
strategii mixte astfel ı̂ncât strategia σi∗ a fiecărui jucător i maximizează plata
aşteptată de acest jucător dacă strategiile celorlalţi jucători (notate cu σ−i )
sunt menţinute fixe, adică
Ki (σ ∗ ) = max K(σi , σ−i

∗
) pentru toţi i ∈ N.
σi
Existenţa echilibrelor Nash ı̂n strategii mixte pentru jocuri finite a fost
demonstrată de Nash (1950a) folosind teorema de punct fix a lui Brouwer.
Teorema 2.21. (Nash) Orice joc strategic finit are cel puţin un echilibru
Nash ı̂n strategii mixte.
În cele ce urmează ne concentrăm atenţia asupra calculării echilibrelor

Nash (ı̂n strategii mixte) ale jocurilor matriceale şi bimatriceale. Fie A =
(a(i, j))i=1,...,m;j=1,...,n un joc matriceal (de tip m×n). Mulţimea strategiilor
mixte pentru jucătorul 1 este
( m
)
X
∆m = p ∈ IRm | p ≥ 0, pi = 1 ,
i=1
iar mulţimea strategiilor mixte ale jucătorului 2 este

( n
)
X
∆n := q ∈ IRn | q ≥ 0, qj = 1 .
j=1
Extensia mixtă a lui A este jocul infinit

m X
X n
m n
h∆ , ∆ , K, Li cu K(p, q) := pi aij qj = pT Aq; L(p, q) := −K(p, q).
i=1 j=1
45
Lema 2.22. Valoarea inferioară şi valoarea superioară pentru jocul A satis-
fac relaţiile:
(i) v(A) = sup min pT Aej ;

p∈∆m j∈{1,...,n}
(ii) v̄(A) = infn max eTi Aq, unde ej este vectorul j din baza standard
q∈∆ i∈{1,...,m}
ı̂n IRn .
Teorema 2.23. (Minmax, John von Neumann) Pentru fiecare joc matriceal
v(A) = v̄(A).
Strategiile mixte optimale ale jucătorilor şi valoarea unui joc matriceal pot
fi determinate ı̂ntotdeauna prin rezolvarea unei perechi de programe liniare.
Această metodă generală de rezolvare a jocurilor matriceale nu va fi tratată
ı̂n acest curs. În cele ce urmează prezentăm metode pentru a rezolva jocuri
matriceale mici, adică jocuri de tip 2 × 2, 2 × n şi m × 2, şi jocuri simetrice.
Multe jocuri matriceale obţinute prin modelarea unei situaţii pur competitive
sunt ori de tip 2×2, 2 × n, m × 2, ori pot fi reduse la un astfel de joc pe baza
eliminării iterative a liniilor şi coloanelor dominate. Strategiile dominate
sunt determinate prin relaţia de dominare introdusă ı̂n paragraful 2.1 şi/sau
prin relaţia de dominare stochastică, pe care o introducem aici. Spunem
că o strategie pură a unui jucător este dominată stochastic dacă există o
combinaţie liniară a altor strategii pure ale acelui jucător care o domină.
Rezolvarea jocului iniţial poate fi astfel redusă uneori la rezolvarea unui joc
matriceal de tipul 2 × 2, 2 × n sau m × 2. Strategiile optimale ale jocului
mic, completate cu componente egale cu zero pentru liniile şi/sau coloanele
ignorate (pe baza relaţiei de dominare (stochastică)), sunt strategii optimale
ale jocului iniţial.
Rezolvarea jocurilor matriceale de tip 2×2. Fie A un joc matriceal de

tip 2×2. Pentru a determina strategiile optimale ale celor doi jucători, căutăm
ı̂ntâi un punct şa (ı̂n strategii pure) verificând dacă valoarea inferioară a
jocului coincide cu valoarea superioară a jocului, adică dacă există un element
al matricei care este cel mai mic ı̂n linia sa şi cel mai mare ı̂n coloana sa. Dacă
există un punct şa, atunci el determină strategiile optimale (linia şi coloana
corespunzătoare), care sunt deci strategii pure. Dacă nu există punct şa (ı̂n
strategii pure), aceasta ı̂nseamnă că strategiile optimale (dacă există) trebuie
să fie strategii mixte, ı̂n care fiecare jucător foloseşte ambele strategii pure
46
cu probabilităţi (strict) pozitive. Pentru a le determina formăm matricea
adjunctă A∗ (interschimbând elementele de pe diagonala principală şi luând
opusul celorlalte două elemente). Vectorii JA∗ şi A∗ J T , unde J = (1, 1),
corespund atunci sumării liniilor şi coloanelor, iar strategiile optimale vor
fi proporţionale cu JA∗ şi A∗ J T ; constanta multiplicativă este aleasă astfel
ı̂ncât suma componentelor strategiilor optimale să fie egală cu 1. Valoarea
jocului se determină folosind formula v=(a11 a22 −a21 a12 )/(a11 +a22 −a21 −a12 ).
Rezolvarea jocurilor matriceale de tip 2×n şi m×2. În orice joc de
tipul 2 × n sau m × 2 există ı̂ntotdeauna ori un punct şa (ı̂n strategii pure)
ori o submatrice de tipul 2 × 2 care dă soluţia jocului. O procedură generală
pentru a rezolva un joc matriceal de tip 2 × n constă din următorii patru
paşi:
1. Caută un punct şa.
2. Dacă nu există puncte şa, vezi dacă există coloane dominate (stochas-
tic) şi şterge-le.
3. Din coloanele rămase ia toate combinaţiile de câte două coloane şi
rezolvă toate jocurile de tip 2 × 2 obţinute.
4. Ia jocul care are cea mai mică valoare. Strategiile optimale pentru
acest joc sunt strategii optimale ale jocului iniţial, completând cu 0
probabilităţile coloanelor nefolosite ı̂n acest joc de tip 2 × 2.
Pentru jocuri matriceale de tip m×2 există o procedură similară, constând
din următorii patru paşi:
1. Caută un punct şa.
2. Daca nu există puncte şa , vezi dacă există linii dominate (stochastic)
şi şterge-le.
3. Din liniile rămase ia toate combinaţiile de câte două linii şi rezolvă
toate jocurile de tip 2 × 2 obţinute.
4. Ia jocul care are cea mai mare valoare. Strategiile optimale pentru
acest joc sunt strategii optimale ale jocului iniţial, completând cu 0
probabilităţile liniilor nefolosite de acest joc de tip 2 × 2.
Aşa cum am menţionat deja, este uneori posibil ca jocuri matriceale de
tip m × n, cu m, n ≥ 3, să fie reduse la jocuri de tip 2 × 2, 2 × n sau m × 2,
prin eliminarea iterativă a liniilor şi coloanelor dominate (stochastic). Un
caz special este când matricea jocului iniţial este simetrică şi există simetrie
completă ı̂ntre strategiile de acelaşi tip, ceea ce permite reducerea jocului
47
iniţial astfel ı̂ncât (cel puţin) unul dintre jucători să aibă doar două strategii
pure. Pentru rezolvarea jocurilor de tip 2×2, 2×n şi m×2 sunt de asemenea
disponibile metode grafice.
Rezolvarea jocurilor matriceale simetrice. Un joc matriceal simetric
este descris printr-o matrice pătratică A = (aij )i,j=1,...,n strâmb-simetrică,
adică o matrice ale cărei elemente satisfac egalitatea aij = −aji , pentru
toţi i, j = 1, ..., n. Într-un joc matriceal simetric ambii jucători au aceleaşi
strategii (mixte) optimale şi valoarea jocului este egală cu zero. Rezolvarea
jocurilor simetrice se bazează pe ideea că dacă r este o strategie optimală ı̂n
Xn
jocul A, atunci ri aij ≥ 0 pentru toţi j şi unele inegalităţi sunt egalităţi
i=1
(altfel v > 0). Strategia optimală r este o necunoscută cu r1 +r2 +...+rn = 1.
Vom determina componentele lui r folosind, ı̂mpreună cu ecuaţia precedentă,
n − 1 ecuaţii obţinute alegând n − 1 inegalităţi şi considerându-le ca egalităţi
şi rezolvând sistemul liniar de n ecuaţii cu n necunoscute obţinut. Dacă
ri ≥ 0 pentru toţi i şi inecuaţia a n-a e verificată, am obţinut o strategie
optimală.
Jocurile bimatriceale fără echilibre Nash ı̂n strategii pure (şi de asemenea
cele cu echilibre Nash ı̂n strategii pure) pot fi studiate folosind extensia mixtă
a jocului bimatriceal. Extensia mixtă a unui joc bimatriceal (A, B) de tip
m × n este dată prin (∆m , ∆n , K, L), unde K(p, q) = pT Aq şi L(p, q) =
pT Bq, pentru toţi p ∈ ∆m şi toţi q ∈ ∆n . Teorema 2.21 asigură existenţa
echilibrelor Nash ı̂n strategii mixte pentru orice joc bimatriceal finit (A, B),
adică existenţa echilibrelor Nash pentru extensia mixtă a acestui joc. Notăm
cu N E(A, B) mulţimea echilibrelor Nash pentru extensia mixtă a lui (A, B).
Fie p ∈ ∆m şi q ∈ ∆n . Suportul strategiei mixte p a jucătorului 1 este C(p) :=
{i ∈ {1, ..., m} | pi > 0}. Mulţimea celor mai bune răspunsuri ı̂n strategii
pure ale jucătorului 1 la strategia mixtă q este P B1 (q) := {i ∈ {1, ..., m} |
eTi Aq = max eTr Aq}, iar mulţimea celor mai bune răspunsuri ı̂n strategii
r∈{1,...,m}
mixte ale jucătorului 1 la q este B1 (q) := {p ∈ ∆m | pT Aq = max eTr Aq}.
r∈{1,...,m}
Analog se definesc C(q), P B2 (p) şi B2 (p).
Teorema 2.24. Fie (A, B) un joc bimatriceal de tip m × n, p ∈ ∆m şi

q ∈ ∆n . Profilul strategic (p∗ , q ∗ ) este un echilibru Nash al extensiei mixte a
lui (A, B) dacă şi numai dacă C(p∗ ) ⊆ P B1 (q ∗ ) şi C(q ∗ ) ⊆ P B2 (p∗ ).
48
Strategiile mixte optimale ale jucătorilor şi plăţile jucătorilor corespunză-
toare acestor strategii pot fi ı̂ntotdeauna determinate folosind legatura dintre
teoria complementarităţii liniare şi jocuri bimatriceale. Acestă metodă ge-
nerală de rezolvare a jocurilor bimatriceale nu va fi prezentată aici. În cele
ce urmează prezentăm o metodă algebrică pentru determinarea echilibrelor
Nash ı̂n strategii mixte ale jocurilor bimatriceale de tip 2×2 şi o metodă
grafică pentru rezolvarea jocurilor de două persoane cu sumă variabilă.
Rezolvarea jocurilor bimatriceale de tip 2×2. Un echilibru Nash pen-
tru un joc bimatriceal (K(i, j)i=1,2; j=1,2 , L(i, j)i=1,2; j=1,2 ) poate fi determinat
folosind următoarea procedură:
1. Se formează jocurile matriceale K(i, j)i=1,2; j=1,2 şi L(i, j)i=1,2; j=1,2 , se-
parând plăţile celor doi jucători.
2. Se determină strategia mixtă optimală p∗ a jucătorului 1 ı̂n jocul ma-
triceal L şi strategia mixtă optimală q ∗ a jucătorului 2 ı̂n jocul K,
folosind metoda prezentată pentru jocuri matriceale de tip 2 × 2. Pe-
rechea (p∗ , q ∗ ) este o strategie mixtă optimală a jocului bimatriceal de
tip 2 × 2.
Această metodă este aplicabilă de asemenea ı̂n jocuri mai largi ce pot fi
reduse la tipul 2 × 2 prin eliminarea iterativă a liniilor şi coloanelor dominate
(stochastic).
Rezolvarea jocurilor de două persoane cu sumă variabilă. Fie G =
hX, Y, K, Li un joc de două persoane cu sumă variabilă. Fie B1 : Y →X,
B2 : X → Y multifuncţiile cel mai bun răspuns pentru jucătorul 1 şi, res-
pectiv, jucătorul 2 ı̂n jocul G. Fie G∗1 := {(x, y) ∈ X × Y | x ∈ B1 (y)}
şi G2 := {(x, y) ∈ X × Y | y ∈ B2 (x)}. Observăm că G2 este graficul
multifuncţiei B2 , iar G∗1 este imaginea graficului G1 ⊂ Y × X a lui B1 sub
aplicaţia Y × X → X × Y cu (y, x) → (x, y) pentru toţi (y, x) ∈ Y × X. De-
terminarea echilibrelor Nash ı̂n strategii mixte ale jocului se poate face prin
reprezentarea grafică, ı̂n acelaşi sistem de coordonate, a (multi)funcţiilor ”cel
mai bun răspuns” ale jucătorilor. Această metodă grafică se bazează pe fap-
tul că (x∗ , y ∗ ) ∈ N E(G) ←→ x∗ ∈ B1 (y ∗ ), y ∗ ∈ B2 (x∗ ) ←→ (x∗ , y ∗ ) ∈ G∗1 ,
(x∗ , y ∗ ) ∈ G2 ←→ (x∗ , y ∗ ) ∈ G∗1 ∩ G2 . Deci, (x∗ , y ∗ ) ∈ N E(G) ←→ (x∗ , y ∗ ) ∈
G∗1 ∩ G2 . Exemplificăm această metodă grafică folosind un joc denumit im-
propriu ”Bătălia sexelor”.
Exemplul 2.25. (Bătălia sexelor) Un cuplu trebuie să decidă dacă vor merge
ı̂mpreună la un meci de box sau la un spectacol de operă. Soţul preferă meciul
49
de box, ı̂n timp ce soţia preferă spectacolul de operă. Modelarea unei situaţii
de acest tip ca un joc necooperativ conduce la forma normală din Figura
2.21 (b). Notăm cu (x, 1 − x) strategia mixtă a jucătorului 1 şi cu (y, 1 − y)
strategia mixtă a jucătorului 2. Funcţiile de plată ale jucătorilor sunt:
K1 (x, y) = 3xy + (1 − x)(1 − y) = (4y − 1)x − y + 1,
K2 (x, y) = xy + 3(1 − x)(1 − y) = (4x − 3)y − 3x + 3.
Graficele corespunzătoare multifuncţiilor cel mai bun răspuns, G∗1 şi G2 , unde
G∗1 = {(x, y) | K1 (x, y) este maxim ı̂n raport cu x pentru y fixat},
G2 = {(x, y) | K2 (x, y) este maxim ı̂n raport cu y pentru x fixat},
sunt reprezentate ı̂n Figura 2.21(a) cu linie plină şi, respectiv, cu linie − − −.
Echilibrele Nash ale jocului, (0,0), (3/4, 1/4) şi (1,1), sunt de asemenea vi-
zualizate ı̂n Figura 2.21(a) ca puncte de intersecţie ale celor două grafice.
Meci Operă
Meci 3, 1 0, 0
Operă 0, 0 1, 3
(b)
Figure 2.21: Jocul ”Bătălia sexelor”
50
2.5 Informaţie şi jocuri necooperative
Teoria jocurilor necooperative ı̂ncearcă să prezică rezultatul ı̂n situaţii de de-
cizie interactivă, adică ı̂n situaţii ı̂n care rezultatul este determinat de către
acţiunile tuturor jucătorilor şi nici-un jucător nu are control complet asupra
situaţiei. Ea foloseşte presupunerea că jucătorii se comportă raţional, adică
urmează scopuri exogene bine-definite şi raţionează strategic, adică iau ı̂n
consideraţie atât cunoaşterea lor cât şi posibilităţile de comportare raţională
ale celorlalţi jucători. Informaţia disponibilă jucătorilor ı̂ntr-un joc necoope-
rativ face o mare diferenţă privind ceea ce jucătorii pot să facă sau ar trebui
să facă. În paragrafele precedente am studiat jocuri necooperative ı̂n formă
strategică (normală) şi ı̂n formă extensivă ı̂n care plăţile corespunzătoare ju-
cătorilor sunt deterministe şi ”common knowledge”. Forma extensivă a unui
joc are un caracter dinamic ı̂ntrucât ilustrează desfăşurarea secvenţială ı̂n
timp a jocului. Forma normală (strategică) analizează o situaţie conflictuală
folosind o descriere concisă, considerând o singură jucare a jocului şi pre-
supunând că jucătorii ı̂şi aleg alternativa strategică simultan şi independent.
Jocurile ı̂n formă normală studiate ı̂n paragrafele 2.1 şi 2.4 sunt de aceea
numite jocuri statice sau jocuri de tip ”one-shot”, ı̂n comparatie cu jocurile
ı̂n formă extensivă, care sunt numite jocuri dinamice. Jucarea repetată a
unui joc static (”one-shot”) de un număr finit sau infinit de ori are ı̂nsă un
caracter dinamic şi face obiectul de studiu al teoriei jocurilor prin modele
specifice. Mai departe, am văzut că ı̂ntr-un joc ı̂n formă extensivă jucătorii
pot avea informaţie perfectă şi/sau imperfectă. Un jucător are informaţie
perfectă când el ştie exact tot ce s-a ı̂ntâmplat până atunci, de fiecare dată
când o decizie trebuie făcută. Un joc are informaţie perfectă dacă fiecare
jucător ı̂n acel joc are informaţie perfectă. Dacă există jucători care nu au
informaţie perfectă, atunci jocul este un joc cu informaţie imperfectă.
O situaţie ı̂n care un jucător ştie ceva ce un alt jucător nu ştie, se numeşte
asimetrie de informaţie. Asimetriile de informaţie se ı̂ntâlnesc frecvent ı̂n
situaţiile practice. Informaţia imperfectă şi asimetriile informaţionale au
implicaţii pentru comportarea strategică a jucătorilor şi plăţile aşteptate
de jucători. Din punctul de vedere al caracterului simetric sau asimetric
al informaţiei de care dispun jucătorii, teoria necooperativă a jocurilor dis-
tinge ı̂ntre două tipuri de modele: jocuri cu informaţie completă şi jocuri cu
informaţie incompletă. Jocurile cu informaţie completă nu afişează asimetrii
informaţionale, cu excepţia posibilă a informaţiei asimetrice privind acţiunile
jucătorilor. Informaţia privată privind elemente intangibile ı̂n situaţii strate-
51
gice poate fi modelată prin ı̂ncorporarea unor evenimente aleatoare (numite
adeseori mutări ale naturii) ı̂n specificarea unui joc cu informaţie incom-
pletă. Expresia informaţie incompletă se referă la jocuri care au mutări ale
şansei (naturii) care generează informaţie asimetrică pentru jucători. Mo-
delele studiate ı̂n paragrafele 2.1-2.4 sunt jocuri cu informaţie completă.
Am studiat aşadar următoarele tipuri de jocuri necooperative: jocuri statice
cu informaţie completă; jocuri dinamice cu informaţie completă şi perfectă;
jocuri dinamice cu informaţie completă dar imperfectă. În toate aceste mo-
dele de jocuri necooperative se presupune că jucătorii au capacităţi ideale
de raţionare şi comportare strategică şi că plăţile posibil de obţinut de către
jucători sunt deterministe şi common knowledge, fiind ori indicate explicit ı̂n
descrierea jocului, ori plăţile aşteptate de jucători (când şansa joacă un rol)
care pot fi calculate de toţi jucătorii pe baza descrierii jocului. Selectarea
deciziilor optimale de către jucători se bazează pe principiul că a câştiga mai
mulţi bani (sau a pierde mai puţini bani) este ı̂ntotdeauna mai bine. În cazul
unui joc de tip cost , selectarea strategiei optimale se bazează pe principiul
că a plăti un cost mai mic e mai bine decât a plăti un cost mai mare.
Reamintim că jocurile statice cu informaţie completă sunt modele de
forma hN, {Xi }i∈N , {Ki }i∈N i . Predicţii privind comportarea optimală a ju-
cătorilor se pot obţine folosind noţiunea de echilibru Nash ı̂n strategii pure
(echilibru Nash pur) sau ı̂n strategii mixte (echilibru Nash mixt). Tehnici
folositoare pentru rezolvarea jocurilor statice cu informaţie completă sunt:
eliminarea iterativă a strategiilor (strict) dominate (stochastic), utilizarea
funcţiilor celui mai bun răspuns (ı̂n strategii pure sau mixte), teoria pro-
gramării liniare şi cea a complementarităţii liniare, metode pentru tipuri
particulare de jocuri (de tip 2×2, 2×n, m×2 şi simetrice).
Modelul de joc static cu informaţie incompletă, numit joc strategic de
tip Bayes (”static Bayesian game”), este o extensie a modelului de joc static
cu informaţie completă. Un joc static Bayesian este un model de forma
hN, {Ai }i∈N , {Ti }i∈N , {pi }i∈N , {ui }i∈N i, ı̂n care N este mulţimea jucătorilor
şi pentru fiecare i ∈ N :
• Ai este mulţimea acţiunilor posibile ale jucătorului i.
• Ti este mulţimea tipurilor posibile pentru jucătorul i.
• pi este distribuţia de probabilitate existentă pe multimea Ti a tipurilor
jucătorului i.
• ui este funcţia de utilitate a jucătorului i (analoagă funcţiei de plată
Ki ).
52
Conceptul de soluţie specific este acela de echilibru Nash de tip Bayes
(”Bayesian Nash equilibrium”), o extensie a noţiunii de echilibru Nash.
Reamintim că jocurile dinamice cu informaţie completă (şi perfectă sau
imperfectă) sunt modele de forma hN, T i, unde T este arborele jocului.
Recunoaştem dacă un joc ı̂n formă extensivă este cu informaţie perfectă
sau imperfectă privind la mulţimile de informaţie ale jucătorilor (delimitate
grafic prin − − −). Întrucât arborele jocului ı̂n formă extensivă conţine
toată informaţia necesară pentru determinarea strategiilor tuturor jucăto-
rilor, modelul de joc dinamic cu informaţie completă poate fi considerat
ca o extensie a modelului de joc static cu informaţie completă, de forma
hN, T, {Xi }i∈N i, unde Xi este mulţimea strategiilor jucătorului i (planuri
complete de acţiune ale jucătorului i de-a lungul arborelui T al jocului).
Predicţii privind comportarea optimală a jucătorilor pot fi obţinute folosind
conceptul de echilibru Nash perfect pe subjoc, care selectează dintre echili-
brele Nash ale jocului (ı̂n formă normală) corespunzător doar pe cele care
sunt ”credibile”. Am văzut că echilibrele Nash perfecte pe subjoc pot fi de-
terminate folosind metoda inducţiei ı̂napoi pe baza formei extensive a jocului
sau pe baza formelor normale ale jocului iniţial şi ale tuturor subjocurilor
sale.
Modelul de joc dinamic (ı̂n formă extensivă) cu informaţie incompletă
este o extensie a modelului de joc ı̂n formă extensivă cu informaţie com-
pletă care se bazează pe considerarea mulţimilor de informaţie ale jucătorilor
ı̂ncorporând elemente de tip ”belief” (”information set(s) with players’ be-
lief”). Figura 2.22 ilustrează deosebirea dintre forma extensivă a unui joc
cu informaţie completă (Figura 2.22(a)) şi a unuia cu informaţie incompletă
(Figura 2.22(b)) ce modelează o aceeaşi situaţie strategică, descrisă ı̂n Exem-
plul 2.26, pentru două ipostaze diferite.
Exemplul 2.26. (Jocul investiţiei) Doi prieteni trebuie să decidă dacă să
investească sau nu efort ı̂n repararea unui motociclete stricate ce aparţine
unuia dintre ei, dat fiind că după aceea ar putea-o folosi ı̂n comun. Unul
poate repara partea mecanică a motocicletei, iar celălalt partea ei electrică.
Presupunem că motocicleta e proprietatea jucătorului 1. Astfel, pe lângă
acţiunile posibile I (investeşte) şi N (nu investeşte), valabile ambilor jucători,
jucătorul 1 are posibilitatea să decidă dacă, după repararea motocicletei, o va
folosi singur sau ı̂n comun. Strategiile corespunzând acestor decizii le notăm
cu E (pentru cazul când jucătorul 1 e egoist) şi A (pentru cazul când el e
altruist).
53
Evident, ambii jucători ştiu că jucătorul 1 poate fi egoist sau altruist.
Plăţi posibile pentru acest joc cu informaţie completă sunt date ı̂n Figura
2.22 (a).
(a)
(b)
Figure 2.22: Jocul investiţiei
54
Situaţia analizată poate fi descrisă mai precis luând ı̂n consideraţie faptul
că majoritatea indivizilor sunt, ı̂n mod obişnuit, ı̂nclinaţi să pună intere-
sele individuale mai presus de cele colective (induse de cooperare) şi care
e tipul fiecărui individ particular depinde de fapt de natură, fiecare individ
cunoscându-şi propriul tip. Ca urmare, o modelare mai realistă a situaţiei ca
un joc se face considerând natura ca un jucător cu două strategii: O (pentru
tip obişnuit) cu probabilitate mai mare, spre exemplu 3/4, şi C (pentru tip
cooperant) cu probabilitate mai mică, spre exemplu 1/4. Jocul obţinut este
unul cu informaţie incompletă, fiindcă natura generează informaţie asimetri-
că pentru jucători. Jocul dinamic cu informaţie incompletă corespunzător
jocului dinamic cu informaţie completă din Figura 2.22 (a) este reprezentat
ı̂n Figura 2.22 (b).
UnDjoc ı̂n formă extensivă
E cu informaţie incompletă este un tiplet de
forma N, T , {Xi }i∈N , unde N este mulţimea jucătorilor, Te este ansamblul
e
mulţimilor de informaţie (continând informaţia de tip ”belief”) ale jucători-
lor, şi pentru fiecare i ∈ N, Xi este mulţimea strategiilor jucătorului i.
Conceptul de soluţie specific jocurilor dinamice cu informaţie incompletă
este acela de echilibru perfect de tip Bayes (”perfect Bayesian equilibrium”).
Acesta este o extensie a conceptului de perfect echilibru pe subjoc. Un
echilibru perfect de tip Bayes poate fi de asemenea considerat ca o extensie
a noţiunii de echilibru Nash de tip Bayes.
Adesea, participanţii ı̂ntr-o situaţie de interacţiune strategică trebuie să
facă decizii ı̂n condiţii de incertitudine. Ei pot fi:
• Incerţi cu privire la parametrii obiectiv ai mediului (”environment”) ı̂n
care acţionează.
• Imperfect informaţi asupra evenimentelor ce pot apărea ı̂n joc.
• Incerţi cu privire la acţiunile (posibil nedeterministe ale) altor jucători.
• Incerţi cu privire la modul de raţionare a celorlalţi jucători.
Principiile de raţionalitate şi cunoaşterea de către jucători a posibilităţilor

de raţionare ale jucătorilor joacă un rol fundamental ı̂n teoria necooperativă
a jocurilor. În teoria jocurilor necooperative se presupune curent că regulile
jocului sunt cunoscute perfect de către toţi jucătorii şi că abilitatea jucăto-
rilor de a analiza jocul este ideală. Este common knowledge că toţi jucătorii
sunt raţionali şi ı̂nţeleg perfect jocul care este jucat, adică fiecare jucător
55
cunoaşte jocul, fiecare jucător ştie că fiecare jucător cunoaşte jocul, ş.a.m.d.
Optimalitatea comportării jucătorilor se bazează pe cunoaşterea pe care o
au jucătorii. Nu numai cunoaşterea de către un jucător a unui parametru
exogen, ci şi cunoaşterea sa despre cunoaşterea celorlalţi jucători joacă un
rol. În modelele de joc studiate se presupune că posibilităţile de raţionare ale
jucătorilor sunt nelimitate, ceea ce asigură ı̂nvăţarea instantanee a jocului
şi selectarea ı̂n timp real a strategiei optimale. În cele mai multe situaţii
practice o asemenea presupunere nu este realistă. Jocurile cu raţionalitate
limitată (”bounded rationality”) fac de asemenea obiectul de studiu al teoriei
jocurilor.
56
3 JOCURI COOPERATIVE
Acest capitol este dedicat modelelor din teoria cooperativă a jocurilor. For-
mele de reprezentare a jocurilor folosite ı̂n aceste modele sunt forma strate-
gică şi forma coaliţională, iar noţiunea de coaliţie (grup de jucători) joacă
un rol central. Un joc ı̂n formă strategică sau ı̂n formă coaliţională este
cooperativ dacă jucătorii pot face acorduri ferme (”binding agreements”)
privind alegerea strategiilor sau distribuţia plăţilor, chiar dacă aceste acor-
duri nu sunt specificate de regulile jocului sau implicate de acestea. Un
acord (sau contract) este ferm dacă nerespectarea lui conduce la penalizări
monetare, fapt care ı̂i ı̂mpiedică pe jucători să nu-l respecte. În paragra-
ful 3.1 introducem jocuri cooperative ı̂n formă strategică şi arătăm că orice
joc necooperativ ı̂n formă normală (strategică) poate fi jucat ”cooperativ”
dacă acordurile ferme ı̂ntre jucători sunt permise. Într-un joc cooperativ ı̂n
formă strategică jucătorii ı̂şi corelează strategiile pure sau folosesc strategii
corelate. Paragrafele 3.2 - 3.5 sunt dedicate jocurilor cooperative ı̂n formă
coaliţională cu plăţi laterale, numite şi jocuri ı̂n forma funcţiei caracteris-
tice. Acest model teoretic de joc cooperativ a fost introdus de către John
von Neumann şi Oskar Morgenstern (1944) pornind de la forma strategică a
jocurilor cu utilităţi transferabile (adică utilităţi care sunt liniare ı̂n bani).
Valoarea fiecărei coaliţii S ⊆ N , unde N ={1, 2, ..., n} este mulţimea finită
şi nevidă a jucătorilor, ı̂ntr-un joc strategic cu utilităţi transferabile este va-
loarea sa maximă ı̂n jocul de două persoane cu sumă nulă unde adversarul
lui S este N \ S (ansamblul jucătorilor care nu sunt membri ai coaliţiei S) şi
strategii corelate sunt folosite de ambii jucători, S şi N \ S. În paragrafele
3.2-3.5 considerăm funcţia caracteristică (coaliţională) a unui joc cooperativ
ca o noţiune primară, ı̂ntrucât ı̂n multe situaţii de interacţiune strategică
unde cooperarea ı̂ntre jucători este posibilă şi benefică (adică conduce la
sporirea câştigurilor sau diminuarea costurilor) funcţia caracteristică poate
fi construită direct, din descrierea neformală a situaţiei, fără nici o referire la
un joc strategic. Paragraful 3.2 introduce noţiuni de bază ı̂n teoria jocurilor
57
cooperative ı̂n forma funcţiei caracteristice, incluzând noţiunea de sâmbure
(Gillies, 1953), care joacă ı̂n cadrul acestei teorii un rol similar cu cel al
noţiunii de echilibru Nash ı̂n teoria jocurilor necooperative. Paragrafele 3.3-
3.5 sunt dedicate conceptelor de soluţie de tip ”single-valued” cu rol predo-
minant ı̂n teoria jocurilor cooperative, şi anume: valoarea Shapley (Shapley,
1953), σ-valoarea şi τ -valoarea (Tijs, 1981), nucleolul (Schmeidler, 1969) şi
AL-valoarea (Tijs, 2005). În paragraful 3.6 analizăm rolul comunicării ı̂ntre
jucători şi al informaţiei disponibile jucătorilor ı̂n cadrul teoriei jocurilor
cooperative ı̂n forma funcţiei caracteristice. Sunt menţionate unele clase
de jocuri cooperative cu restricţii de comunicare ı̂ntre jucători şi jocuri cu
asimetrii informaţionale. Încheiem capitolul cu o privire globală asupra mo-
delelor teoriei jocurilor cooperative ı̂n formă coaliţională.
3.1 Jocuri cooperative ı̂n forma strategică

În capitolul 2 am studiat şi rezolvat jocuri necooperative, ı̂n care comuni-
carea ı̂ntre jucători ı̂nainte de ı̂nceperea jocului (”pre-play communication”),
acordurile ferme (contractele) şi plăţile laterale sunt interzise prin regulile
jocului. Chiar dacă comunicarea ı̂ntre jucători ı̂nainte de ı̂nceperea jocului
nu e interzisă, ea nu poate conduce la acorduri ferme ı̂ntre jucători privind
alegerea strategiilor sau distribuirea plăţilor. Rezolvarea jocurilor necoo-
perative s-a făcut folosind noţiunea de echilibru Nash şi variante ale sale.
Totuşi, aşa cum am văzut ı̂n paragraful 2.1, un profil strategic corespunzător
unui echilibru Nash pur ı̂n jucarea necooperativă a unui joc ar putea să nu
ofere cea mai avantajoasă alternativă de plată tuturor jucătorilor, chiar şi
ı̂n situaţia ı̂n care jocul are un echilibru Nash unic. Jucarea cooperativă a
unui joc ı̂n formă strategică, ı̂n situaţia când acordurile ferme ı̂ntre jucători
sunt permise (explicit sau implicit) poate ı̂nlătura acest inconvenient. Jocul
”Dilema prizonierilor”, reprezentat ı̂n Figura 2.4 (b), este un exemplu clasic
pentru evidenţierea diferenţelor dintre jucarea necooperativă şi cooperativă
a unui joc. În jocul ”Dilema prizonierilor”, doi suspecţi de crimă ı̂nchişi
pentru un conflict minor şi puşi ı̂n celule separate sunt interogaţi (sepa-
rat) făcându-li-se promisiunea de graţiere ı̂n caz de recunoaştere a crimei şi
denunţare a complicelui. Plăţile din jocul bimatriceal din Figura 2.4 (b) sunt
anii de ı̂nchisoare ce ı̂i aşteaptă pe cei doi deţinuţi pentru diferitele situaţii de
comportare strategică, fiecare dintre ei putând folosi una din două strategii:
R – recunoaşte crima făcută – şi N – nu o recunoaşte. Jucarea necooperativă
a acestui joc conduce la echilibrul Nash (unic), (linia 1, coloana 1) ı̂n Figura
58
2.4 (b), care asigură jucătorilor plăţi egale cu câte 5 ani de ı̂nchisoare. Totuşi,
ambii jucători ar putea obţine ”plăţi” mai bune, anume câte un singur an de
ı̂nchisoare, dacă ar alege (de comun acord) profilul strategic (linia 2, coloana
2) din Figura 2.4 (b), prin corelarea strategiilor lor pure. Considerăm acum
jocul de tip ”ultimatum” din Exemplul 2.18. În jucarea necooperativă a aces-
tui joc, jucătorul 2 este de fapt forţat să accepte oricare dintre propunerile
jucătorului 1 fiindcă altfel nu primeşte nimic. Jucarea cooperativă a aces-
tui joc va conduce, prin acordul jucătorilor asupra diviziunii celor 6 unităţi
valorice, la schema de divizare 3-3, care este echitabilă (”fair”) pentru ambii
jucători.
În jucarea cooperativă a unui joc (de tip câştig) ı̂n formă strategică se
caută o soluţie optimală, adică un profil strategic care asigură o plată to-
tală maximă, şi o distribuţie echitabilă pentru toţi jucătorii a acestei plăţi
maxime. O asemenea distribuţie ar trebui să ia ı̂n consideraţie poziţiile de
negociere ale jucătorilor (care sunt diferite de abilităţile lor de negociere)
şi/sau posibilitatea efectuării de plăţi laterale ı̂ntre jucători. Într-un joc bi-
matriceal (A, B) (de tip câştig), o soluţie optimală şi o distribuţie echitabilă
a plăţii totale maxime ar putea fi calculate de către un arbitru imparţial şi
onest, urmând următoarea procedură:
1. Se determină valoarea ν a jocului A − B; aceasta reprezintă avantajul

relativ pe care jucătorul 1 ı̂l are asupra jucătorului 2.
2. Se determină plata totală maximă posibil de obţinut, notată cu P , ca

valoarea maximă a elementelor matricei A + B.
3. Dacă e posibil, se ı̂mparte plata totală maximă P astfel ı̂ncât jucătorul

1 primeşte ν unităţi valorice mai mult decât jucătorul 2 (adică se
păstrează avantajul relativ ν al jucătorului 1). Dacă profilul strate-
gic care corespunde plăţii totale maxime P dă prea mult unui jucător,
atunci (pentru a păstra cooperarea şi plata P ) acel jucător ar trebui să
facă o plată laterală (oferind celuilalt jucător parte din plata sa) astfel
ı̂ncât să se obţină o ı̂mpărţire a plăţii P care păstrează avantajul relativ
al jucătorului 1.
Exemplul 3.1. Ilustrăm aplicarea procedurii descrise mai sus considerând

două jocuri bimatriceale: jocul (A1 , B1 ) cu ν1 =3 şi P1 =5 care corespunde
unui profil strategic care asigură jucătorului 1 plata 4 şi jucătorului 2 plata
59
1, şi jocul (A2 , B2 ) cu ν2 =1 şi P2 =5 care corespunde unui profil strategic care
dă jucătorului 1 plata 1 şi jucătorului 2 plata 4. Observăm că pentru jocul
(A1 , B1 ) distribuţia (4,1) corespunzătoare profilului strategic optimal este
rezonabilă pentru ambii jucători fiindcă ea ı̂ncorporează avantajul relativ
al jucătorului 1 faţă de jucătorul 2. În cazul jocului (A2 , B2 ), jucătorul
2 trebuie să facă o plată laterală de 2 unităţi valorice către jucătorul 1,
pentru a respecta avantajul relativ al jucătorului 1 faţă de el. Astfel, jucarea
cooperativă a jocului bimatriceal (A2 , B2 ) conduce ı̂n final la plata 3 pentru
jucătorul 1 şi plata 2 pentru jucătorul 2.
Evident, procedura descrisă mai sus poate fi aplicată de asemenea unui joc
bimatriceal de tip cost cu modificarea pasului 2 al procedurii, unde, ı̂n acest
caz, elementul minim al matricii A + B va fi selectat. Pentru jocul ”Dilema
prizonierilor”, ν=0, P =2 şi distribuţia plăţilor pentru profilul strategic care
asigură plata totală 2 este (1,1). Această distribuţie e echitabilă pentru ambii
jucători. Evident, ı̂n jocul ”Dilema prizonierilor” jucătorii nu pot face plăţi
laterale.
În cele ce urmează, introducem noţiunea de joc cooperativ ı̂n formă strate-
gică şi ataşăm fiecărui joc necooperativ ı̂n formă normală (strategică) jocul
cooperativ ı̂n formă strategică corespunzător.
Un joc cooperativ ı̂n formă strategică este un triplet
hN, (Σ(S))∅6=S⊆N , {ui }i∈N i ,

unde: N este mulţimea finită şi nevidă a jucătorilor; pentru fiecare submul-
ţime nevidă S de jucători, Σ(S) este mulţimea nevidă a strategiilor lui S,
cu proprietatea Σ(S ∪ T )⊇Σ(S)×Σ(T ) pentru toţi S, T astfel ı̂ncât ∅ 6= S,
T ⊆N, S ∩ T = ∅; pentru fiecare i ∈ N, ui : Σ(N ) −→ IR este funcţia de plată
a jucătorului i.
Orice joc necooperativ finit ı̂n formă normală (strategică),
hN, {Xi }i∈N , {Ki }i∈N i ,
generează un joc cooperativ ı̂n formă strategică prin considerarea strategiilor

corelate. Fie S o submulţime nevidă de jucători (coaliţie).YO strategie core-
lată pentru S este o distribuţie de probabilitate pe XS = Xi . Notăm cu
i∈S
Σ(S) mulţimea tuturor strategiilor corelate pentru S şi cu σS o strategie core-
lată arbitrară ı̂n Σ(S). Presupunem că acordurile ferme ı̂ntre jucători sunt
60
permise şi orice strategie corelată σS pentru S 6= ∅ cu |S|=2 este sprijinită
printr-un acord ferm ı̂ntre membrii lui S. Pentru fiecare i ∈ N , considerăm
funcţia de plată ui : Σ(N ) −→ IR, definită prin
X
ui (σN )= σN (x)Ki (x) pentru toţi σN ∈ Σ(N ) şi toţi i ∈ N.
x∈XN
Astfel, situaţii de interacţiune strategică ı̂n care jucătorilor li se interzicea

ı̂ncheierea acordurilor ferme, modelate ı̂n capitolul 2 ca jocuri necooperative,
pot fi modelate ca jocuri cooperative ı̂n formă strategică dacă restricţiile
iniţiale privind comunicarea şi cooperarea ı̂ntre jucători sunt ridicate. Un
caz particular de joc cooperativ ı̂n formă strategică, obţinut pornind de la
un joc necooperativ ı̂n formă strategică prin admiterea acordurilor ferme
ı̂ntre jucători, este cel ı̂n care pentru fiecare coaliţie nevidă S considerăm
Σ(S)=XS , ceea ce corespunde corelării strategiilor pure ale jucătorilor. Ju-
carea cooperativă a jocului ”Dilema prizonierilor” corespunde astfel unui joc
cooperativ ı̂n formă strategică ı̂n care profilurile strategice pure sunt alese
prin acordul jucătorilor.
3.2 Jocuri cooperative ı̂n forma funcţiei caracteristice

şi sâmburele
Situaţii practice ı̂n care părţile implicate pot să-şi sporească câştigurile sau
să-şi reducă costurile prin cooperare pot fi modelate adesea folosind jocuri
cooperative ı̂n forma funcţiei caracteristice (cu plăţi laterale) de tip câştig
sau de tip cost.
Un joc cooperativ de tip câştig este o pereche hN, vi, unde N este mulţimea
finită şi nevidă a jucătorilor, adesea de forma N ={1, 2, ..., n}, iar v : 2N −→ IR
este funcţia caracteristică (coaliţională), cu v(∅)=0, unde pentru fiecare coali-
ţie (grup de jucători) S ∈ 2N \{∅}, v(S) reprezintă câştigul pe care S ı̂l poate
obţine prin cooperarea membrilor săi (fără ajutorul nici-unui alt jucător din
afara lui S).
Exemplul 3.2. Trei prieteni, etichetaţi ı̂n continuare cu 1, 2, 3, posesori

de materii prime de tip A şi B ı̂n cantităţile A1 = 0, A2 = 1, A3 = 5,
B1 = 3, B2 = 1, B3 = 9, plănuiesc să deschidă ı̂mpreună o ı̂ntreprindere
mică pentru a fabrica un produs care necesită pe unitate o unitate din ma-
teria primă A şi două unităţi din materia primă B şi se poate vinde cu 50
61
lei pe unitate. Cooperarea micilor ı̂ntreprinzători poate genera câştiguri, dar
ei vor intra ı̂n această afacere numai dacă vor cădea de acord asupra modu-
lui de distribuire a câştigului total. Teoria cooperativă a jocurilor poate fi
folositoare. Situaţia descrisă poate fi modelată ca un joc a cărui funcţie ca-
racteristică este v(∅) = v({1}) = v({2}) = 0, v({3}) = 200, v({1, 2}) = 50,
v({1, 3}) = v({2, 3}) = 250, v({1, 2, 3}) = 300. Un concept de soluţie din teo-
ria cooperativă a jocurilor poate fi apoi folosit pentru a propune o distribuţie
a celor 300 unităţi valorice ı̂ntre cei trei ı̂ntreprinzători (vezi Exemplul 3.19).
Un joc cooperativ de tip cost este o pereche hN, ci, unde N este mulţimea
finită şi nevidă a jucătorilor şi c : 2N −→ IR este funcţia coaliţională (carac-
teristică) cu c(∅)=0, unde pentru fiecare coaliţie S ∈ 2N \{∅}, c(S) reprezintă
costul pe care S trebuie să-l plătească dacă membrii ei cooperează. Exem-
plul 3.3 modelează ca un joc cooperativ de tip cost o situaţie privind insta-
larea unor sisteme de alarmă ı̂n apartamente. Orice joc cooperativ de tip
cost generează un joc cooperativ de tip câştig, unde pentru fiecare coaliţie
S ∈ 2N \{∅}, câştigul v(S) obţinut prin cooperare reprezintă economiile rea-
lizate de S prin reducerea costurilor ca urmare a cooperării membrilor săi şi
v(∅)=0, adică :
X
(3.1) v(S) := c({i}) − c(S), pentru toţi S ∈ 2N .
i∈S
Exemplul 3.3. Trei familii care locuiesc ı̂n acelaşi bloc de locuinţe vor să-şi
instaleze sisteme de alarmă cu aceeaşi firmă. Firma le face o ofertă cu cos-
turi pentru contracte individuale, costuri pentru contracte pentru câte două
familii şi costul pentru un contract colectiv. Cele trei familii trebuie să decidă
dacă cooperează sau nu ı̂n vederea reducerii costurilor şi, ı̂n situaţia ı̂n care
decid să coopereze, trebuie să cadă de acord asupra ı̂mpărţirii costului total.
Teoria cooperativă a jocurilor poate fi utilă pentru rezolvarea acestei proble-
me prin modelarea situaţiei ca un joc cooperativ de tip cost şi folosirea unui
concept de soluţie considerat rezonabil de către toate cele trei familii. Pentru
situaţia descrisă, N ={1, 2, 3}, iar oferta firmei generează funcţia coaliţiona-
lă c, cu c({1})=100, c({2})=90, c({3})=80, c({1, 2})=130, c({1, 3})=110,
c({2, 3})=110 şi c({1, 2, 3})=140. Evident, c(∅)=0. Economiile realizate de
cele trei familii prin cooperarea lor sunt descrise prin jocul de tip câştig cores-
punzător (obţinut folosind formula (3.1)): v(∅)=v({1})=v({2})=v({3})=0,
v({1, 2})=60, v({1, 3})=70, v({2, 3})=60 şi v({1, 2, 3})=130.
62
Într-un joc cooperativ de tip câştig jucătorii urmăresc maximizarea câş-
tigurilor, iar ı̂ntr-un joc de tip cost ei urmăresc minimizarea costurilor (sau,
echivalent, maximizarea economiilor ı̂n jocul de tip câştig asociat jocului de
tip cost). În cele de urmează, prin hN, vi vom subı̂nţelege un joc de tip câştig
şi prin hN, ci vom subı̂nţelege un joc de tip cost.
O reprezentare geometrică a jocurilor cooperative ı̂n forma funcţiei carac-
teristice identifică un joc hN, vi sau hN, ci cu |N |=n, cu un vector (punct)
n
ı̂n IR2 −1 , ale cărui componente sunt valorile funcţiei caracteristice pentru
o ordine fixată a celor 2n − 1 coaliţii nevide de jucători. În mod normal,
un joc este identificat cu funcţia sa caracteristică (coaliţională). Mulţimea
GN a funcţiilor coaliţionale v cu mulţimea jucătorilor N formează, ı̂n raport
cu adunarea şi ı̂nmulţirea cu un scalar a funcţiilor coaliţionale, un spaţiu
liniar (2n − 1)–dimensional. O bază interesantă a acestui spaţiu liniar este
mulţimea jocurilor unanime uT , T ∈ 2N \ {∅}, care sunt definite prin
(
1 dacă T ⊆S,
(3.2) uT (S)=
0 altfel.
Interpretarea unui joc unanim uT este că un câştig (sau o economie la costuri)
de o unitate valorică poate fi obţinut dacă şi numai dacă toţi jucătorii din
coaliţia T sunt implicaţi ı̂n cooperare. Orice joc v ∈ GN poate fi exprimat
ca o combinaţie liniară de jocuri unanime de forma
X X
(3.3) v= cT uT , cu cT = (−1)|T |−|S| v(S).
T ∈2N \{∅} S:S⊆T
Exemplul 3.4. Jocul v din Exemplul 3.3 se poate scrie sub forma
v = 60u{1,2} + 70u{1,3} + 60u2,3 − 60u{1,2,3} .
Jocurile unanime sunt un caz special de jocuri simple. Un joc v ∈ GN

se numeşte simplu dacă v(S) ∈ {0, 1} pentru toţi S ∈ 2N \ {∅}, v(∅)=0 şi
v(N )=1.
Exemplul 3.5. Considerăm următoarele situaţii de votare: votare prin

majoritate simplă (jumătate plus 1) şi votare cu majoritate minimă fixată şi
un grup cu putere veto. Primul tip de votare este folosit frecvent, inclusiv
pentru trecerea legilor ı̂n parlament. Presupunând că parlamentul constă din
100 membri, pentru a trece o lege prin parlament sunt necesare cel puţin 51
de voturi ı̂n favoarea legii supuse votului. Această situaţie poate fi modelată
63
prin jocul simplu v definit pentru fiecare S ∈ 2N \ {∅} prin v(S)=1 dacă
|S| ≥ 51 şi v(S)=0, altfel. Al doilea de tip de votare e folosit ı̂n Consiliul
Naţiunilor Unite care e format din 15 membri dintre care 5 membri, etichetaţi
aici cu 1, 2, 3, 4, 5, au putere veto şi unde pentru a vota o lege sunt necesare
cel puţin 9 voturi pro incluzând voturile pro ale tuturor membrilor cu putere
veto. Această situaţie poate fi modelată prin jocul simplu v definit pentru
fiecare S ∈ 2N \ {∅} prin v(S)=1 dacă |S| ≥ 9 şi {1, 2, 3, 4, 5}⊆S şi v(S)=0,
altfel.
Un joc v ∈ GN este 0-normalizat dacă v({i})=0 pentru toţi i ∈ N. Un joc

v ∈ GN este (0,1)-normalizat dacă v({i})=0 pentru fiecare i ∈ N şi v(N )=1.
Un joc v ∈ GN se numeşte monoton dacă v(S) ≤ v(T ) pentru toţi S, T ∈ 2N
cu S⊆T. Un joc v ∈ GN se numeşte nenegativ dacă pentru orice S ∈ 2N
avem v(S) ≥ 0. Un joc v ∈ GN se numeşte aditiv dacă v(S ∪ T )=v(S) + v(T )
pentru toţi S, T ∈ 2N cu S ∩ T = ∅. Un joc aditiv X este determinat de către
n
vectorul a=(v({1}), .., v({n})) ∈ IR ı̂ntrucât v(S)= ai pentru toţi S ∈ 2N .
i∈S
Jocurile aditive formează un subspaţiu liniar n-dimensional al spaţiului liniar
GN . Un joc v ∈ GN se numeşte neesenţial dacă X el este un joc aditiv. Un
N
joc v ∈ G se numeşte N -esenţial dacă v(N ) > v({i}). Cele mai multe
i∈N
jocuri cooperative de tip câştig care apar prin modelarea situaţiilor reale sunt
jocuri superaditive. Un joc v ∈ GN se numeşte superaditiv dacă v(S ∪ T ) ≥
v(S) + v(T ) pentru toţi S, T ∈ 2N cu S ∩ T = ∅. Cele mai multe jocuri
cooperative de tip cost care apar prin modelarea situaţiilor reale sunt jocuri
subaditive. Un joc v ∈ GN se numeşte subaditiv dacă v(S ∪ T ) ≤ v(S) + v(T )
pentru toţi S, T ∈ 2N cu S ∩ T = ∅. Un joc v ∈ GN se numeşte convex (Sha-
pley, 1971) dacă v(S ∪ T ) + v(S ∩ T ) ≥ v(S) + v(T ) pentru toţi S, T ∈ 2N .
Evident, orice joc convex este un joc superaditiv. Un joc care se exprimă
ca o combinaţie liniară cu coeficienţi pozitivi de jocuri unanime, conform cu
formula (3.3), este un joc convex. O coaliţie S ∈ 2N \ {∅} se zice că are
putere veto dacă v(T )=0 pentru toţi T astfel că S 6⊆ T. Un joc se numeşte
joc veto dacă există o coaliţie S ∈ 2N \ {∅} cu putere veto. Jocul de votare
corespunzând Consiliului Naţiunilor Unite, din Exemplul 3.5, este un joc veto
(coaliţia {1, 2, 3, 4, 5} are putere veto).
În jocul v ∈ GN , pentru fiecare S ∈ 2N şi pentru fiecare i ∈ S, contribuţia
marginală a lui i la S este Mi (S, v) := v(S)−v(S\{i}). În particular, pen-
tru fiecare i ∈ N , contribuţia marginală a lui i la N este Mi (N, v) :=
64
v(N )−v(N \{i}). Un joc v ∈ GN se numeşte un joc big boss cu n ca big
boss (Muto et al., 1988) dacă: (i) v este un joc veto unde coaliţia {n} are
putere veto; (ii) v este un joc monoton; (iii) v are proprietatea uniunii, adică
X
v(N ) − v(S) ≥ Mi (N, v) pentru fiecare S cu n ∈ S.
i∈N \S
Jocurile convexe şi jocurile big boss sunt cazuri speciale de jocuri balansate.
Definiţia jocurilor balansate se bazează pe noţiunea de aplicaţie balansată
N
(echilibrată). O aplicaţie
X λ : 2 \{∅} −→ IR+ se numeşte aplicaţie balansată
(echilibrată) dacă λ(S)eS =eN , unde eS este vectorul caracteristic al
S∈2N \{∅}
lui S, cu (e )i =1 dacă i ∈ S şi (eS )i =0 altfel. Un joc v ∈ GN se numeşte
S
balansatX(echilibrat) dacă pentru orice aplicaţie balansată λ : 2N \{∅} −→ IR+

avem λ(S)v(S) ≤ v(N ). Importanţa acestei noţiuni urmează din Teo-
S∈2N \{∅}
rema 3.8 care a fost demonstrată independent de Bondareva (1963) şi Sha-
pley (1967). O colecţie B de coaliţii S ∈ 2N \ {∅} este o colecţie balansată
(echilibrată) dacă există o aplicaţie balansată λ astfel ı̂ncât B={S ∈ 2N \{∅} |
λ(S) > 0}. O colecţie balansată se numeşte colecţie balansată minimală dacă
nu conţine o altă colecţie balansată. O colecţie B={S1 , S2 , ..., Sk } de coaliţii
nevide este balansată (echilibrată) dacă există αS1 , ..., αSk ∈ IR, αSj > 0,
X
j=1, ..., k, astfel ı̂ncât pentru toţi i ∈ N, αSj =1, unde coeficienţii αSj
j|i∈Sj
sunt ponderi asociate la fiecare coaliţie Sj (aceste ponderi sunt unic deter-
minate pentru colecţii balansate minimale).
Mulţimea GN a jocurilor cooperative de n persoane poate fi partiţionată
ı̂n clase echivalenţă ı̂n raport cu o relaţie de echivalenţă strategică, numită
S-echivalenţă, două jocuri v, w ∈ GN ı̂n aceeaşi clasă de echivalenţă fiind
”ı̂n esenţă” acelaşi joc. Jocul w este strategic echivalent cu jocul v dacă
k > 0 şi un joc aditiv a ∈ GN astfel că w(S)=kv(S) + a(S), unde
există X
a(S)= ai pentru toţi S ∈ 2N \ {∅}. Putem considera că w se obţine
i∈S
din v prin următoarele transformări: (i) unitatea valorică este schimbată,
unde rata de schimb este k; ı̂n jocul w fiecare jucător primeşte ori un bonus
(dacă ai > 0) ori o penalizare (dacă ai < 0) ı̂nainte ca suma k · v(N ) să
fie distribuită ı̂ntre jucători. Pentru cele mai multe concepte de soluţie este
suficient să ne ocupăm de un singur joc ı̂ntr-o anumită clasă de echivalenţă
65
strategică. Fiecare joc v ∈ GN este strategic N
X echivalent cu un joc w ∈ G care
este 0-normalizat, unde w(S)=v(S) − v({i}) pentru orice S ∈ 2N . Într-o
i∈S
clasă de echivalenţă se consideră adesea jocul (0,1)-normalizat corespunzător
acelei clase. Fiecare joc N -esenţial v ∈ GN este strategic echivalent cu un
joc w ∈ GN X care este (0,1)-normalizat. Se poate X verifica uşor că pentru
k=1/(v(N )− v({i})) şi ai =−v({i})/(v(N )− v({i})), pentru toţi i ∈ N,
i∈N i∈N
jocul w definit prin w(S)=k · v(S) + a(S) pentru toţi S ∈ 2N \ {∅}, este (0,1)-
normalizat.
Spunem că f : GN −→ IRn satisface proprietatea de invarianţă cu privire
la echivalenţa strategică (S-echivalenţă) dacă pentru toţi v, w ∈ GN , toate
jocurile aditive a ∈ GN şi toţi k > 0, avem
w=k · v + a implică f (k · v + a)=k · f (v) + a.
O sarcină fundamentală a teoriei jocurilor cooperative este să facă lumină

asupra structurii diferitelor clase de jocuri, considerate ca subclase ale spa-
ţiului liniar GN . Cele mai multe dintre clasele de jocuri cooperative pot fi
văzute ca nişte conuri poliedrale, fiind intersecţii finite de semispaţii ı̂nchise.
Exemple de conuri poliedrale de jocuri cooperative sunt conurile jocurilor
superaditive, convexe, balansate, big boss.
Problema esenţială ı̂n teoria jocurilor cooperative ı̂n forma funcţiei ca-
racteristice este cum să se distribuie v(N ) ı̂ntre jucători dacă marea coaliţie
N se formează. Această problemă este rezolvată folosind concepte de soluţie
din teoria cooperativă a jocurilor. Un concept de soluţie este o aplicaţie care
asociază fiecărui joc dintr-o anumită clasă de jocuri unul sau mai mulţi vectori
de plată x=(x1 , ..., xn ) ∈ IRn . Conceptele de soluţie care asociază fiecărui joc
v ∈ GN un singur vector plată se numesc de tip ”single-valued” sau ”one-
point”. În paragrafele 3.3 - 3.5 vom prezenta următoarele soluţii de acest
tip: valoarea Shapley, σ-valoarea, τ -valoarea, nucleolul şi AL-valoarea. Ele
fac selecţii din mulţimi particulare de vectori de plată, si anume: mulţimea
preimputaţiilor, mulţimea imputaţiilor şi sâmburele jocului.
Mulţimea preimputaţiilor unui joc v ∈ GN este
( )
X
P I(v) := x ∈ IRn | xi = v(N ) .
i∈N
Mulţimea P I(v) este un hiperplan ı̂n IRn .
66
Mulţimea imputaţiilor unui joc v ∈ GN este
( )
X
I(v) = x ∈ IRn | xi = v(N ) şi xi ≥ v({i}) pentru toţi i ∈ N .
i∈N
Teorema 3.6. Mulţimea I(v) este nevidă dacă şi numai dacă jocul v este
N-esenţial.
Mulţimea I(v) este un simplex cu punctele extremef 1 (v), ..., f n (v), unde
pentru fiecare i ∈ N, f i (v)=(f1i , ..., fji , ..., fni ) cu

 v({i})
 dacă i 6= j
i X
fj = v(N ) − v({k}) dacă i=j.


k∈N \{i}
Teorema 3.7 Fie v ∈ GN un joc N-esenţial. Atunci

(i) I(v) este o mulţime infinită.
(ii) I(v) este ı̂nfăşurătoarea convexă a punctelor f 1 (v), ..., f n (v).
Notăm cu I N ={v ∈ GN | I(v) 6= ∅}. I N este un con ı̂n mulţimea GN
şi CIS : I N −→ IRn este un concept de soluţie de tip single-valued definit
n
X
pentru fiecare v ∈ I prin CIS(v) := 1/n f i (v). Din punct de vedere
N
i=1
geometric, CIS(v) este baricentrul lui I(v).
Conceptul de soluţie dominant ı̂n teoria cooperativă a jocurilor este sâm-
burele (Gillies, 1953).
Sâmburele unui joc v ∈ GN este

X
C(v) := {x ∈ I(v) | xi ≥ v(S) pentru toţi S ∈ 2N \ {∅}}.
i∈S
Dacă ı̂ntr-un joc este propus un element al sâmburelui, nici-un subgrup de

jucători nu poate obţine mai mult prin separarea sa de restul jucătorilor.
Sâmburele unui joc c ∈ GN este

X X
C(c) := {x ∈ IRN | xi ≤ c(S) pentru toţi S ∈ 2N \ {∅} şi xi =c(N )}.
i∈S i∈N
67
Sâmburele unui joc se determină prin rezolvarea unui sistem de inecuaţii
liniare. Sâmburele unui joc poate fi mulţimea vidă, poate consta dintr-un
singur element (spre exemplu, jocul cost din Exemplul 3.3 are sâmburele
C(c)={(30, 30, 80)}) sau poate conţine o infinitate de elemente. Sâmburele
unui joc cooperativ de n persoane este o mulţime poliedrală ı̂n IRn .
Teorema 3.8 Fie v ∈ GN . Următoarele afirmaţii sunt echivalente:
(i) C(v) 6= ∅.
(ii) Jocul v este balansat.
Faptul că sâmburele C(v) al unui joc v ∈ GN este soluţia mărginită

a unui sistem de inecuaţii liniare ı̂nseamnă că sâmburele unui joc este un
politop, adică ı̂nfăşurătoarea convexă a unei mulţimi finite de vectori x ∈ IRn .
Sâmburele unui joc convex şi a unui joc big boss sunt politopi speciali cu
o structură geometrică frumoasă. Forma sâmburelui unui joc convex este
descrisă de către Shapley (1971). Forma sâmburelui unui joc big boss este
descrisă de Muto, Potters şi Tijs (1989). Sâmburele unui joc big boss cu n
ca big boss este
C(v)={x ∈ I(v) | 0 ≤ xi ≤ Mi (N, v) pentru fiecare i ∈ N \{n}}.
Sâmburele C este un concept de soluţie care satisface proprietatea de S-

echivalenţă. Un joc (balansat) v ∈ GN cu C(v)=I(v) se numeşte joc (balan-
N
sat) simplex. Un joc v ∈ GX se numeşte exact dacă pentru fiecare S ∈ 2N \{∅}
există un x ∈ C(v) cu xi =v(S). Jocurile convexe sunt jocuri exacte.
i∈S
Exactificarea unui joc v ∈ GN este E E
( jocul v cu v (∅)=0,
) definit pentru fiecare
X
S ∈ 2N \ {∅} prin v E (S)= min xi | x ∈ C(v) .
i∈S
3.3 Valoarea Shapley şi AL-valoarea

Valoarea Shapley (Shapley, 1953) asociază cu fiecare v ∈ GN o preimputaţie
pe baza vectorilor contribuţiilor marginale mσ (v) ai jocului, unde
σ = (σ(1), ..., σ(n)) este o ordine (permutare) a jucătorilor. Notăm cu
Π(N ) mulţimea tuturor permutărilor σ : N −→ N ale lui N . Mulţimea
P σ (i) := {r ∈ N | σ −1 (r) < σ −1 (i)} constă din toţi predecesorii lui i cu
68
privire la permutarea σ. Pentru v ∈ GN şi σ ∈ Π(N ) vectorul contribuţiilor
marginale mσ (v) are coordonate de forma mσi (v) := v(P σ (i) ∪ {i}) − v(P σ (i))
pentru orice i ∈ N. Valoarea Shapley Φ(v) a unui joc v ∈ GN este media
aritmetică a vectorilor contribuţiilor marginale ai jocului, adică
X
(3.4) Φ(v) := 1/n! mσ (v).
σ∈Π(N )
Exemplul 3.9. Considerăm jocul cooperativ cu v({1})=v({2})=v({3})=0,

v({1, 2})=4, v({1, 3})=7, v({2, 3})=15, v({1, 2, 3})=20. Vectorii contribu-
ţiilor marginale sunt m(1,2,3) = (0, 4, 16), m(1,3,2) = (0, 13, 7), m(2,1,3) =
(4, 0, 16), m(2,3,1) = (5, 0, 15), m(3,1,2) = (7, 13, 0), m(3,2,1) = (5, 15, 0). Prin
formula (3.4) obţinem Φ(v) = 1/3!(21, 45, 54) = (7/2, 15/2, 9).
Valoarea Shapley a unui joc cooperativ v de două persoane este
Φ(v)=(v({1})+(v(N )−v({1})−v({2}))/2, v({2})+(v(N )−v({1})−v({2}))/2);
aceasta este numită soluţia standard a unui joc cooperativ de două persoane.
Valoarea Shapley a unui joc aditiv v este Φ(v)=(v({1}), ..., v({n})). Pen-
tru jocul unanim pe T, uT , valoarea Shapley este Φ(uT ) = 1/|T | eT .
Valoarea Shapley satisface următoarele proprietăţi care o fac un con-
cept de soluţie interesant pentru teoria cooperativă a jocurilor: eficienţa, S-
echivalenţa, proprietatea jucătorului fictiv, anonimitatea, aditivitatea, sime-
tria (tratament egal al jucătorilor simetrici).
Valoarea Shapley este singura soluţie care satisface proprietăţile : eficienţă,
anonimitate, proprietatea jucătorului fictiv şi aditivitate (caracterizare axio-
matică).
Spunem că f : GN −→ IRn satisface proprietatea:
X
• eficienţă dacă fi (v) = v(N ) pentru fiecare v ∈ GN .
i∈N
• anonimitate dacă f (v σ ) = σ ∗ (f (v)) pentru orice σ ∈ Π(N ), unde σ ∗ :
IRn −→ IRn este definită prin (σ ∗ (x))σ(k) := xk pentru toţi x ∈ IRn şi
k ∈ N, iar v σ este jocul cu v σ (σ(U )) := v(U ) pentru toţi U ∈ 2N .
• proprietatea jucătorului fictiv dacă fi (v) = v({i}) pentru toţi v ∈ GN
şi pentru toţi jucătorii fictivi i, i.e. jucători i ∈ N astfel că v(S ∪ {i}) =
v(S) + v({i}) pentru toţi S ∈ 2N \{i} .
• aditivitate dacă f (v + w) = f (v) + f (w) pentru toţi v, w ∈ GN .
69
• simetrie (tratament egal al jucătorilor simetrici) dacă fi (v) = fj (v)
pentru toţi i, j ∈ N astfel ı̂ncât v(S ∪ {i}) = v(S ∪ {j}) pentru toţi
S ∈ 2N \{i,j} .
• raţionalitate individuală dacă fi (v) ≥ v({i}) pentru toţi v ∈ GN şi
i ∈ N.
Valoarea Shapley nu satisface ı̂n general proprietatea de raţionalitate indi-
viduală. Există multe jocuri cooperative pentru care valoarea Shapley nu
este un element al sâmburelui.
Exemplul 3.10. În jocul v({1})=v({2})=v({3})=0, v({1, 2})=10, v({1, 3})
= 8, v({2, 3}) = 6, v({1, 2, 3}) = 12, Φ(v)=(5, 4, 3) ∈/ C(v) deoarece inegali-
tatea x1 + x2 ≥ v({1, 2}) nu este satisfăcută (5 + 4 < 10).
Pentru jocuri convexe valoarea Shapley este un element al sâmburelui
jocului şi ocupă o poziţie centrală ı̂n cadrul acestuia: ea coincide cu ”bari-
centrul” sâmburelui. Folosind proprietăţile caracteristice ale valorii Shapley
ı̂mpreună cu formula (3.3) şi expresia valorii Shapley a unui joc unanim,
obţinem o altă formulare a valorii Shapley, care are mare aplicabilitate prac-
tică
X cT X
(3.5) Φ(v) = eT pentru toţi v ∈ GN cu v = c T uT .
N
|T | N
T ∈2 \{∅} T ∈2 \{∅}
Exemplul 3.11. Determinăm valoarea Shapley a jocului v din Exemplul

3.4. folosind formula (3.5): Φ1 (v) = 60 · 1/2 + 70 · 1/2 + 0 − 60 · 1/3 = 45;
Φ2 (v) = 40, Φ3 (v) = 45. Deci Φ(v) = (45, 40, 45).
Alte formulări ale valorii Shapley existente ı̂n literatura teoriei jocurilor
cooperative, cum sunt cele bazate pe interpretarea sa probabilistă, pe divi-
dende şi pe extensia multiliniară a unui joc cooperativ, nu sunt prezentate
ı̂n acest curs.
AL-valoarea (Tijs, 2005) este un concept de soluţie definit pe mulţimea
jocurilor balansate (adică jocuri v ∈ GN cu C(v) 6= ∅). Ca şi ı̂n definiţia
valorii Shapley, se face o medie aritmetică a n! vectori care corespund celor
n! permutări posibile ale celor n jucători ı̂ntr-un joc cooperativ de n per-
soane. Dar, spre deosebire de valoarea Shapley, unde aceşti vectori sunt vec-
torii contribuţiilor marginale, vectorii utilizaţi de AL-valoarea jocului sunt
elementele x ∈ C(v) care sunt optimale din punctul de vedere al ordinii
lexicografice.
În IRn ordinea lexicografică ≥L este definită după cum urmează.
Pentru fiecare x, y ∈ IRn :
70
• x >L y dacă există r ∈ {1, .., n} astfel ca xk = yk pentru k < r şi
xr > y r ;
• x ≥L y dacă x = y sau x >L y.
Spre exemplu, x = (8, 5, 11, 0) >L (8, 5, 10, 100) = y.
Ordinea lexicografică este o relaţie de ordine liniară pe IRn . Pentru o
mulţime compactă C ⊆ IRn există un maxim lexicografic unic x̂ ∈ C (cu
proprietatea x̂ ≥L x pentru toţi x ∈ C), notat cu L(C). Dacă C este un
politop, atunci L(C) este un punct extrem al lui C care poate fi determinat
rezolvând o problemă de optimizare.
Fie v ∈ GN un joc balansat şi σ = (σ(1), ..., σ(n)) ∈ Π(N ). Maximul lexi-
cografic al sâmburelui C(v) al lui v ı̂n raport cu σ, notat cu Lσ (v), este unicul
element al lui C(v) cu proprietăţile: (Lσ (v))σ(1) = max{xσ(1) | x ∈ C(v)},
(Lσ (v))σ(2) = max{xσ(2) | x ∈ C(v) cu xσ(1) = (Lσ (v))σ(1) }, ..., (Lσ (v))σ(n) =
max{xσ(n) | x ∈ C(v) cu (xσ(1) , xσ(2) , ..., xσ(n−1) )=((Lσ (v))σ(1) , (Lσ (v))σ(2) , ...,
(Lσ (v))σ(n−1) )}. Observăm că Lσ (v) este un punct extrem al lui C(v) pentru
fiecare σ ∈ Π(N ). AL-valoarea AL(v) a lui v este media aritmetică a tuturor
Lσ (v), adică media lexicografică a jocului (”average lexicographic value”).
Pentru orice joc balansat v ∈ GN , AL-valoarea AL(v) a jocului v este
X
(3.6) AL(v) = 1/n! Lσ (v).
σ∈Π(N )
Exemplul 3.12. Pentru jocul v cu v({1})=v({2})=v({3}) = 0, v({1, 2})=

v({1, 3}) = v({2, 3}) = 1, v({1, 2, 3}) = 3 avem L(1,2,3) (v) = (2, 1, 0), L(1,3,2) (v)
= (2, 0, 10), ..., L(3,2,1) (v) = (0, 1, 2). Deci, AL(v) = 1/3!(L(1,2,3) (v)+L(1,3,2) (v)
+ ... + L(3,2,1) (v)) = (1, 1, 1).
Pentru un joc (balansat) de două persoane AL-valoarea jocului coincide
cu soluţia standard a jocului (deci şi cu valoarea Shapley a jocului). Pentru
orice joc convex v, AL-valoarea şi valoarea Shapley coincid, adică AL(v) =
Φ(v). Pentru orice joc balansat de trei persoane, pentru orice joc (balansat)
simplex şi pentru orice joc big boss (cu n ca big boss), AL(v) = Φ(v E ), unde
v E este exactificarea lui v (proprietatea de invarianţă cu privire la exactifi-
care).
AL-valoarea satisface o gamă largă de proprietăţi: eficienţă, raţionalitate
individuală, S-echivalenţă, simetrie, proprietatea jucătorului fictiv, invarianţă
cu privire la exactificare, aditivitate pe subconurile de jocuri exacte unde
sâmburele este o corespondenţă aditivă.
71
3.4 σ-valoarea şi τ -valoarea
Ambele valori au fost introduse de Tijs (1981) pentru a furniza un vector pla-
tă eficient care este un cel mai bun compromis ı̂ntre doi vectori plată cores-
punzând la situaţii extreme: situaţia ”ideală” (de fapt ”utopică”) şi situaţia
”catastrofală”(cea mai rea posibilă). Pentru ambele valori, σ-valoarea şi τ -va-
loarea, vectorul ideal al plăţilor este vectorul contribuţiilor marginale ale ju-
cătorilor la marea coaliţie, adică vectorul M (N, v) = (M1 (N, v), ..., Mn (N, v)).
Cel mai nefavorabil vector plată pentru σ-valoarea jocului este vectorul i(v) al
valorilor individuale ale jucătorilor, adică i(v) = (v{1}), v({2}), ..., v({n})).
Pentru τ -valoarea jocului cel mai nefavorabil vector de plată este aşa-numitul
vector al dreptului minim, ce va definit ı̂n cele ce urmează pe baza vectoru-
lui contribuţiilor marginale ale jucătorilor la marea coaliţie. Pentru fiecare
S ∈ 2N \{∅} şi pentru fiecare i ∈ N, restul R(S, i) disponibil pentru jucătorul
i dacă coaliţia S se formează şi toţi ceilalţi jucători j ∈ S primesc plata ideală,
Mj (N, v), este X
R(S, i) := v(S) − Mj (N, v).
j∈S\{i}
Jucătorul i ar putea pretinde de la marea coaliţie N , cel mai mare dintre

toate resturile disponibile pentru el ı̂n coaliţiile ı̂n care el este un membru,
adică dreptul minim al jucătorului i ı̂n jocul v este
mi (v) := max R(S, i).

S:i∈S
Cel mai nefavorabil vector plată pentru τ -valoarea jocului este aşadar vec-
torul m(v) ale cărui coordonate sunt mi (v) pentru toţi i ∈ N.
Un joc v ∈ GN se numeşte semibalansat dacă
• i(v) ≤ M (N, v) şi
X X
• v({i}) ≤ v(N ) ≤ Mi (N, v).
i∈N i∈N
Notăm cu SB mulţimea jocurilor v ∈ GN care sunt semibalansate. Pentru

N
un joc v ∈ SB N , σ-valoarea σ(v) a jocului este definită prin
(3.7) σ(v) := α i(v) + (1 − α)M (N, v),

X
unde α ∈ [0, 1] este unic determinat prin σi (v) = v(N ).
i∈N
72
Exemplul 3.13. Considerăm o situaţie cu un vânzător al unui tablou şi
doi cumpărători potenţiali, unul oferind 100 e şi celălalt 200 e. Modelăm
această situaţie ca un joc de trei persoane, unde jucătorul 1 este vânzătorul,
jucătorul 2 este cumpătorul care oferă 100 e şi jucătorul 3 este cumpărătorul
care oferă 200 e. Funcţia caracteristică a jocului este v({1}) = 0, v({1, 2}) =
100, v({1, 3}) = 200, v({1, 2, 3}) = 200, v(S) = 0 ı̂n rest. Verificăm dacă
jocul este semibalansat şi, dacă este, calculăm σ-valoarea jocului folosind
formula (3.7). Vectorul cel mai nefavorabil este i(v) = (0, 0, 0), iar vec-
torul ideal este M (N, v) = (200, 0, 100). Jocul este semibalansat deoarece
(0, 0, 0) ≤ (200, 0, 100) şi 0 ≤ 200 ≤ 300. Prin formula (3.7) obţinem σ(v) =
α(0, 0, 0) + (1 − α)(200, 0, 100), unde α este determinat din condiţia σ1 (v) +
σ2 (v) + σ3 (v) = 200. Obţinem α = 1/3, deci σ(v) = (400/3, 0, 200/3).
Din punct de vedere geometric, σ-valoarea σ(v) a unui joc semibalansat
v este unicul punctX
de intersecţie al segmentului [i(v), M (v)] cu hiperplanul
n
E(v) = {x ∈ IR | xi = v(N )} al vectorilor de plată eficienţi pentru v.
i∈N
Un joc v ∈ GN se numeşte quasi-balansat dacă
• m(v) ≤ M (N, v) şi
X X
• mi (v) ≤ v(N ) ≤ Mi (N, v).
i∈N i∈N
Notăm cu Q mulţimea jocurilor v ∈ GN care sunt quasi-balansate. Pentru

N
un joc v ∈ QN , τ -valoarea τ (v) a jocului este definită prin
(3.8) τ (v) := αm(v) + (1 − α)M (N, v),

X
unde α ∈ [0, 1] este unic determinat prin τi (v) = v(N ).
i∈N
Exemplul 3.14. Considerăm jocul v din Exemplul 3.13. Verificăm dacă

jocul este quasi-balansat şi, dacă este, calculăm τ -valoarea sa folosind formula
(3.8). Calculăm vectorul dreptului minim m(v) = (100, 0, 0). Jocul este
quasi-balansat deoarece (100, 0, 0) ≤ (200, 0, 100) şi 100 ≤ 200 ≤ 300. Prin
formula (3.8) obţinem τ (v) ≤ (150, 0, 50) 6= σ(v).
Pentru orice joc convex v, τ (v) = σ(v). Din punct de vedere geometric,
τ -valoarea τ (v) a unui joc quasi-balansat v este unicul punct de intersecţie al
segmentului [m(v), M (v)] cu hiperplanul E(v) al vectorilor de plată eficienţi
pentru v.
73
Proprietăţi satisfăcute de τ -valoare sunt: eficienţa, raţionalitatea indivi-
duală, S-echivalenţa, proprietatea jucătorului fictiv, anonimitatea, proprie-
tatea dreptului minim, proprietatea de proporţionalitate restrictivă.
O aplicaţie f : QN −→ IRn are
• proprietatea dreptului minim dacă f (v) = m(v) + f (v − m(v)) pentru

orice v ∈ QN .
• proprietatea de proporţionalitate restrictivă dacă f (v) este un multiplu

al lui M (v) ı̂n cazul când m(v) = 0.
τ -valoarea este unica regulă de alocare pe QN care satisface proprietăţile:

eficienţă, proporţionalitate restrictivă şi proprietatea dreptului minim
(caracterizare axiomatică (Tijs, 1987)).
În general, τ -valoarea nu este un element al sâmburelui jocului.
Un joc hN, ci este quasi-balansat dacă
X X
• Mi (N, c) ≤ c(N ) ≤ mi (c);
i∈N i∈N
• Mi (N, c) ≤ mi (c) pentru fiecare i ∈ N,
unde, pentru fiecare i ∈ N, Mi (N, c) = c(N )−c(N \{i}), mi (c) = min (c(S)−
X S:S3i
Mj (N, c)); vectorul m(c) este vectorul contribuţiilor maximale.
j∈S\{i}
Propoziţia 3.15. Dacă v ∈ GN este un joc balansat, atunci v ∈ SB N şi

v ∈ QN .
Pentru
Ã un joc big boss cu n ca big boss τ -valoarea jocului este
!
n−1
X
1 1 1 1
τ (v) = M1 (N, v), M2 (N, v), ..., Mn−1 (N, v), v(N ) − Mi (N, v) şi
2 2 2 2 i=1
τ (v) = AL(v).
Pentru un joc big boss convex, τ (v) = Φ(v).
Pentru un joc quasi-balansat c, τ -valoarea τ (c) este definită prin
τ (v) = αm(c) + (1 − α)M (N, c),
unde α ∈ [0, 1] este unic determinat prin condiţia de eficienţă.
74
3.5 Nucleolul
Nucleolul a fost introdus de Schmeidler (1969) pe baza ideii de tratare echi-
tabilă a coaliţiilor ı̂n distribuirea valorii marii coaliţii ı̂ntre jucători. Pentru
fiecare joc v ∈ GN cu I(v) 6= ∅, orice vector x = (x1 , x2 , ..., xn ) ∈ I(v)
reprezintă un mod posibil de distribuire a lui v(N ) dar acceptul de cooperare
ı̂n cadrul marii coaliţii depinde de acordul tuturor coaliţiilor asupra unei
anumite distribuţii x ∈ I(v), pe baza posibilităţilor v(S) ale coaliţiilor S ∈
2N \{∅, N }. Evaluarea unei distribuţii x de către o coaliţie S ∈ 2N \{∅, N }
ı̂n jocul v se face ı̂n mod natural calculând diferenţa ı̂ntre ceea ce coaliţia
S poate obţine pe cont propriu, adică v(S), şi ceea ce coaliţia S ar primi
conform X cu distribuţia x dacă ea ar coopera ı̂n cadrul marii coaliţii, adică
x(S) = xi . Diferenţa v(S) − x(S) a fost numită de Schmeidler excesul
i∈S
coaliţiei S cu privire la imputaţia x ı̂n jocul v, notat cu e(S, x; v). Pentru
fiecare joc cooperativ v ∈ GN , fiecare x ∈ I(v) şi orice S ∈ 2N \{∅, N },
excesul coaliţiei S cu privire la x ı̂n jocul v este
(3.9) e(S, x; v) := v(S) − x(S).
Considerăm situaţia când o anumită distribuţie x este propusă jucătorilor.
Fiecare coaliţie S ∈ 2N \{∅, N } va evalua e(S, x; v). Evident, dacă e(S, x; v)>0,
coaliţia S are o nemulţumire directă faţă de x şi poate să refuze cooperarea
ı̂n marea coaliţie. Dacă e(S, x; v) ≤ 0, coaliţia S va compara excesul său
cu cel al celorlalte coaliţii, pentru a decide dacă acceptă imputaţia x sau
o refuză. Notăm vectorul exceselor, pentru o ordine fixată a coaliţiilor, cu
e(x; v) ≤ (e(S, x; v))S∈2N \{∅,N } şi notăm cu θ(x; v) vectorul obţinut din e(x; v)
prin rearanjarea componentelor sale e(S, x; v) ı̂n ordine descrescătoare.
Exemplul 3.16. Considerăm jocul v({1} = v({2}) = v({3}) = 0, v({1, 2}) =

v({1, 3}) = 8, v({2, 3}) = 6, v({1, 2, 3}) = 12. Pentru imputaţia x = (5, 3, 4)
avem x({1}) = 5, x({2}) = 3, x({3}) = 4, x({1, 2}) = 8, x({1, 3}) = 9,
x({2, 3}) = 7. Excesele coaliţiilor sunt: e({1}, x; v) = −5, e({2}, x; v) = −3,
e({3}, x; v)= − 4, e({1, 2}, x; v)=0, e({1, 3}, x; v)= − 1, e({2, 3}, x; v) = −1.
Pentru ordinea coaliţiilor {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, vectorul exce-
selor este e(x; v) = (−5, −3, −4, 0, −1, −1). Rearanjând componentele lui
e(x; v) ı̂n ordine descrescătoare obţinem θ(x; v) = (0, −1, −1, −3, −4, −5).
Vectorul θ(x; v) permite evaluarea rapidă a efectului global al imputaţiei

x asupra (nemulţumirii) ansamblului coaliţiilor ı̂n jocul v. Dacă jucătorii
75
au de ales o imputaţie din două imputaţii propuse, x şi y, ei vor prefera
acea imputaţie care minimizează nemulţumirea maximă a coaliţiilor. Această
selecţie se poate obţine prin compararea lexicografică a vectorilor θ(x; v) şi
θ(y; v).
Exemplul 3.17. Considerăm jocul v şi imputaţia x din Exemplul 3.16.

Presupunem că jucătorii au de ales ı̂ntre imputaţia x şi imputaţia y =
(6, 4, 2). Un calcul similar ce cel făcut pentru θ(x; v) conduce la θ(y; v) =
(0, 0, −2, −2, −4, −6). Comparând lexicografic
θ(x; v) = (0, −1, −1, −3, −4, −5) şi

θ(y; v) = (0, 0, −2, −2, −4, −6)
obţinem x ≤L y. Prin urmare, imputaţia x va fi preferată imputaţiei y, fiindcă

nemulţumirea cea mai mare a coaliţiilor cu privire la x este mai mică decât
nemulţumirea cea mai mare a coaliţiilor cu privire la y. În termeni de exces,
excesul maxim ı̂n raport cu x este mai mic decât excesul maxim ı̂n raport
cu y.
Nucleolul asociază fiecărui joc v ∈ GN , cu I(v) 6= ∅, mulţimea η(v) a

imputaţiilor x∗ = (x∗1 , x∗2 , ..., x∗n ) astfel ı̂ncât
θ(x∗ ; v) ≤L θ(x; v) pentru toţi x ∈ I(v).
Teorema 3.18. (Schmeidler, 1969) Fie v ∈ GN un joc N-esenţial (adică

cu I(v) 6= ∅). Atunci nucleolul θ(v) al jocului v există şi conţine un singur
element.
Adeseori referim imputaţia selectată de nucleol ı̂n jocul v ca η(v). Dacă

sâmburele unui joc v este nevid, adică C(v) 6= ∅, atunci nucleolul selectează
un element al sâmburelui jocului, adică η(v) ∈ C(v), ı̂ntrucât
C(v) = {x ∈ I(v) | e(S, x; v) ≤ 0 pentru toţi S ∈ 2N \ {∅}}.
Faptul că nucleolul unui joc este ı̂n sâmburele jocului ori de câte ori
sâmburele jocului este nevid, este adesea folositor pentru calcularea nucleolu-
lui: dacă sâmburele unui joc v constă dintr-un singur element, atunci η(v) =
C(v); dacă sâmburele jocului este nevid şi elementele sale sunt funcţii de un
parametru, atunci componentele imputaţiei selectate de nucleol sunt aceleaşi
76
funcţii liniare de acel parametru şi valoarea parametrului corespunzătoare
nucleolului poate fi determinată printr-o metodă grafică ce va fi descrisă mai
jos şi ilustrată ı̂n Exemplul 3.19. Determinarea nucleolului unui joc se poate
face ı̂n general prin rezolvarea unei succesiuni de programe liniare; această
metodă generală nu va fi prezentată ı̂n acest curs. Relaţia dintre nucleolul
unui joc şi sâmburele jocului, când sâmburele este nevid, este de asemenea
utilă pentru a răspunde (negativ) la ı̂ntrebarea dacă o anumită imputaţie
este sau nu cea selectată de nucleol.
Două proprietăţi ale nucleolului pot juca un rol ı̂n calcularea nucleolului
sau ı̂n furnizarea răspunsului (negativ sau pozitiv) la problema dacă o anu-
mită imputaţie este sau nu cea selectată de nucleol: proprietatea jucătorului
fictiv şi proprietatea jucătorilor simetrici (vezi Exemplul 3.19).
Ori de câte ori componentele unui vector de plată candidat pentru a fi
imputaţia selectată de nucleol sunt funcţii liniare de un parametru, deter-
minarea nucleolului poate fi făcută printr-o metodă grafică simplă:
• Se determină intervalul pentru valorile parametrului din condiţia ca
vectorul de plată respectiv să fie o imputaţie.
• Se calculează excesele tuturor coaliţiilor nevide, cu excepţia marii coaliţii;
acestea sunt funcţii liniare de parametrul respectiv.
• Se reprezintă grafic aceste funcţii (excesele tuturor coaliţiilor) pentru
valorile parametrului ı̂n intervalul determinat specific problemei.
• Se trasează graficul maximului acestor funcţii şi se determină valoarea
parametrului pentru care această funcţie ı̂şi atinge minimul.
Exemplul 3.19. Considerăm jocul v din Exemplul 3.2. Observăm că
jucătorii 1 şi 2 sunt simetrici, ceea ce implică η1 (v) = η2 (v). Evident, η3 (v) =
v(N ) − η1 (v) − η2 (v). Nucleolul jocului este de forma (x, x, 300 − 2x), cu
0 ≤ x ≤ 50, ı̂ntrucât acest vector trebuie să fie o imputaţie. Calculăm exce-
sele tuturor coaliţiilor cu privire la imputaţia (x, x, 300 − 2x). Reprezentăm
funcţiile de x obţinute ı̂n sistemul de coordonate xOy, pentru x ∈ [0, 50].
Trasăm conturul funcţiei care este maximul funcţiilor exceselor şi vedem
care este valoarea lui x pentru care această funcţie are valoarea minimă.
Pentru jocul nostru, obţinem x = 100/3. Nucleolul jocului este, prin urmare,
η(v) = (100/3, 100/3, 700/3).
Criteriul lui Kohlberg este un instrument cu valabilitate generală util
pentru a răspunde la ı̂ntrebarea dacă o anumită imputaţie este sau nu nu-
cleolul unui joc N -esenţial. Considerăm mulţimea exceselor coaliţiilor S ∈
77
2N \{∅, N, {1}, ..., {n}} cu privire la imputaţia x ı̂n ordine descrescătoare:
ε1 , ε2 , ..., εk(x) .
Propoziţia 3.20. (Criteriul lui Kolhberg, 1971) Fie v ∈ GN şi x ∈ I(v)

astfel ca xi 6= v({i}) pentru toţi i ∈ N. Imputaţia x este nucleolul jocului v
dacă şi numai dacă pentru toţi 1 ≤ j ≤ k(x)
j
[
B t este o colecţie balansată (echilibrată),
t=1
unde B i este mulţimea de coaliţii asociată cu al i-lea exces εi (ı̂n ordinea

descrescătoare a acestor excese).
3.6 Comunicare şi informaţie ı̂n jocuri cooperative

În teoria clasică a jocurilor cooperative ı̂n forma funcţiei caracteristice se
presupune că toţi jucătorii sunt capabili (şi li se permite) să comunice ı̂ntre
ei şi, prin urmare, toate coaliţiile (grupurile de jucători) se pot forma. Toate
felurile de acorduri, incluzând acordurile ferme, şi de asemenea plăţile la-
terale sunt permise. Totuşi, ı̂n multe situaţii practice, unii dintre jucători
sunt incapabili să comunice unul cu celălalt şi, prin urmare, unele coaliţii,
incluzând marea coaliţie nu pot fi formate. Restricţiile privind comunicarea
ı̂ntre jucătorii conduc astfel la cooperare restrictivă. Pentru a modela astfel
de situaţii cu cooperare restrictivă indusă de restricţii de comunicare, a fost
introdus un model specific de jocuri cooperative, aşa-numitele jocuri de co-
municare (Myerson, 1977, 1980; Owen, 1986). O situaţie (cu restricţii de coo-
perare datorate posibilităţilor limitate) de comunicare este o situaţie ı̂n care
posibilităţile economice ale participanţilor sunt descrise printr-un joc coope-
rativ hN, vi sau hN, ci şi posibilităţile de comunicare sunt descrise printr-o
pereche hN, Ai, unde N este mulţimea finită şi nevidă a jucătorilor şi A este
un graf neorientat, numit graful comunicării. Jocurile de comunicare sunt
numite şi jocuri cu restricţii de tip graf (”graph-restricted games”). O clasă
mică de jocuri de comunicare (dar interesantă atât din punct de vedere teo-
retic cât şi al aplicaţiilor practice) este clasa jocurilor numite ”peer group
games” (Brânzei, Fragnelli şi Tijs, 2002; Brânzei, Solymosi şi Tijs, 2005),
unde graful comunicării este un arbore ce corespunde ierarhiei organizaţionale
78
a jucătorilor. Adeseori comunicarea ı̂ntre participanţi are loc prin reţele, sis-
teme de relaţii bilaterale descentralizate. Reţelele pot fi integrate ı̂n jocuri
coaliţionale pentru a forma aşa-numitele ”network-restricted games” (Slikker
şi van den Nouweland, 2001).
Informaţia disponibilă jucătorilor ı̂n situaţii de interacţiune decizională
bazată pe interese de grup joacă, de asemenea, un rol important ı̂n teo-
ria jocurilor cooperative. În teoria clasică a jocurilor cooperative ı̂n forma
funcţiei caracteristice jucătorii au informaţie simetrică şi plăţile coaliţiilor
sunt cunoscute cu certitudine de către toţi jucătorii. Totuşi, există multe
situaţii practice cu asimetrii informaţionale şi, ı̂n unele situaţii, informaţia
pe care o deţin unii jucători reprezintă o resursă cu rol important ı̂n evaluarea
posibilităţilor economice ale coaliţiilor. Pentru a modela astfel de situaţii au
fost introduse clase speciale de jocuri cooperative ı̂n forma funcţiei caracter-
istice, cum sunt: ”information market games” (Muto, Potters şi Tijs, 1989),
”information collecting games” (Brânzei, Tijs şi Timmer, 2001; Tijs, Timmer
şi Brânzei, 2006), ”information sharing games” (Slikker, Norde şi Tijs, 2003).
Pentru a modela situaţii de interacţiune decizională ı̂n care plăţile coaliţiilor
sunt incerte, au fost introduse noi modele teoretice de jocuri cooperative ı̂n
forma funcţiei caracteristice, cum sunt: ”games in stochastic characteristic
function form” (Charnes şi Granot, 1973; Granot, 1977), ”stochastic coope-
rative games” (Suijs, 1999; Suijs şi Borm, 1999), ”cooperative games with
random payoffs” (Timmer, Borm şi Tijs, 2000). Există un interes actual
crescând ı̂n teoria jocurilor cooperative cu informaţie incompletă motivat
atât din punct de vedere teoretic cât şi al aplicaţiilor practice (Ichiishi şi
Yamazaki, 2006).
Toate modelele de jocuri cooperative ı̂n forma funcţiei caracteristice stu-
diate ı̂n paragrafele 3.2 - 3.5 şi discutate mai sus, se bazează pe noţiunea
clasică de coaliţie, aceea de grup de jucători, unde fiecare jucător poate fi
sau nu membru al uneia sau mai multor coaliţii. Situaţii cu posibilităţi de
cooperare mai relaxată au condus la introducerea unor noţiuni mai sofisti-
cate de coaliţie, cum sunt cea de coaliţie multi-choice şi coaliţie fuzzy, şi
modele corespunzătoare de jocuri cooperative ı̂n forma funcţiei caracteristice:
”multi-choice games” (Hsiao şi Raghavan, 1993a, 1993b; van den Nouweland
et al., 1995; Calvo şi Santos, 2000) şi ”fuzzy games” (Aubin,1974, 1981).
Într-un joc de tip multi-choice fiecare jucător are un număr finit de nivele
de activitate privind cooperarea cu ceilalţi jucători şi plata fiecărei coaliţii
multi-choice depinde de nivelele de activitate ale (tuturor) jucătorilor ı̂n
cadrul acelei coaliţii. Jocurile cooperative clasice ar putea fi considerate ca
79
un caz special al jocurilor multi-choice, unde fiecare jucător are exact două
nivele de activitate, corespunzând la participare (completă) ı̂ntr-o coaliţie sau
neparticipare. Într-un joc fuzzy fiecare jucător are posibilitatea să coopereze
la (infinit de) multe nivele, variind de la necooperare la cooperare totală şi
plata fiecărei coaliţii fuzzy depinde de nivelele de participare ale (tuturor)
jucătorilor ı̂n cadrul acelei coaliţii. Modele de jocuri cooperative ı̂n forma
funcţiei caracteristice bazate pe noţiunea clasică de coaliţie (crisp), coaliţie
multi-choice şi coaliţie fuzzy, sunt prezentate ı̂n monografia având ca autori
pe Brânzei, Dimitrov şi Tijs (2005).
Toate modelele de jocuri cooperative ı̂n forma funcţiei coaliţionale discu-
tate până acum fac parte din teoria jocurilor cu utilităţi transferabile. Ele
se mai numesc TU-games (Transferable Utility games). Calificativul ”cu
utilităţi transferabile” este menit să facă clar faptul că ı̂n astfel de jocuri
sunt permise plăţi laterale ı̂ntre jucători ı̂n sensul că valoarea (plata, uti-
litatea) marii coaliţii poate fi distribuită ı̂ntre jucători ı̂n (infinit de) multe
moduri, iar transformări ale valorilor (plăţilor, utilităţilor) coaliţiilor datorate
schimbării unităţii monetare sau acordării de bonus sau amendă unor jucători
nu afectează ı̂n mod esenţial modelul de joc. Teoria jocurilor cooperative ı̂n
formă coaliţională include, pe lângă jocurile de tip TU, jocuri de tip NTU,
adică jocuri cu utilitate netransferabilă (NTU-games). Un joc de tip NTU
este o pereche hN, V i, unde N este mulţimea finită şi nevidă a jucătorilor şi
V este o aplicaţie care asociază fiecărei coaliţii S ∈ 2N \ {∅} o submulţime
V (S)⊆IRS , cu proprietăţi specifice pe care nu le definim aici, ce poate fi in-
terpretată astfel: dacă coaliţia S se formează, atunci pot fi obţinuţi vectorii
x ∈ V (S), care dau fiecărui jucător i ∈ N plata (utilitatea) xi . Jocurile
cooperative cu utilităţi netransferabile au fost introduse de Aumann şi Peleg
(1960). Ele sunt potrivite pentru analiza multor fenomene economice com-
petitive şi cooperative. Un joc de tip NTU poate fi construit pornind de la
un joc cooperativ ı̂n formă strategică sau direct, pe baza descrierii narative
a situaţiei de interacţiune decizională analizată.
Jocurile de negociere pentru două persoane (”bargaining games”) pot fi
considerate un caz particular al jocurilor de tip NTU. Un joc de negociere
de două persoane este o pereche hF, di, unde F ⊆IR2 şi d = (d1 , d2 ) ∈ IR2 .
Elementele lui F , perechi de plăţi (utilităţi), se numesc rezultate admisibile,
pe care jucătorii le pot obţine prin cooperare (acord bilateral). În cazul ı̂n
care cooperarea ı̂ntre jucători nu are loc, jucătorii obţin perechea de plăţi
(d1 , d2 ), motiv pentru care d se numeşte rezultatul dezacordului. Modelul de
joc de negociere a fost introdus de Nash (1950b).
80
ANEXA A
Demonstraţii privind Capitolul 2
Demonstraţia Teoremei 2.5. Observăm că au loc relaţiile
K(x1 , y1 ) = max K(x, y1 ) ≥ K(x2 , y1 ) ≥ min K(x2 , y) = K(x2 , y2 ), (A.1)

x∈X y∈Y
unde egalităţile au loc ı̂ntrucât (x1 , y1 ) şi (x2 , y2 ) sunt echilibre Nash ale
jocului.
Schimbând rolurile lui (x1 , y1 ) şi (x2 , y2 ) obţinem, ı̂n mod similar,
K(x2 , y2 ) = max K(x, y2 ) ≥ K(x1 , y2 ) ≥ min K(x1 , y) = K(x1 , y1 ). (A.2)

x∈X y∈Y
Din (A.1) şi (A.2) rezultă că K(x1 , y1 ) = K(x2 , y2 ) şi toate inegalităţile
ı̂n (A.1) şi (A.2) sunt de fapt egalităţi. Aceasta implică
K(x2 , y1 ) = max K(x1 , y1 ); K(x2 , y1 ) = min K(x2 , y).

x∈X y∈Y
Prin urmare, (x2 , y1 ) este un echilibru Nash şi K(x2 , y1 ) = K(x1 , y1 ). În mod
similar, rezultă că (x1 , y2 ) este un echilibru Nash cu K(x1 , y2 ) = K(x1 , y1 ).
Demonstraţia Teoremei 2.8.
(i) urmează din definiţia unei funcţii potenţial exact pentru jocul G.
(ii) urmează din (i) pe baza observaţiei că x∗ este un echilibru Nash pentru
GP dacă ( )
Yn
P (x∗ ) = max P (x) | x ∈ Xi .
i=1
81
Teorema de punct fix a lui Brouwer. Fie C o mulţime nevidă convexă
şi compactă a lui IRk şi fie f : C −→ C o funcţie continuă. Atunci există un
x∗ ∈ C cu f (x∗ ) = x∗ .
Demonstraţia Teoremei 2.21. (Nash) Pentru i ∈ N şi xi ∈ Xi considerăm
Uixi (σ) = max(0, Ki (xi , σ−i )−Ki (σ)) şi f : Σ −→ Σ definită (pe componente)
prin  
X x0
fixi (σ) = (σixi + Uixi (σ))/ 1 + Ui i (σ) ,
x0i ∈Xi
unde σixi desemnează probabilitatea pe care σi o atribuie lui xi .

Observăm că Σ este o mulţime nevidă convexă şi compactă, iar f este o
funcţie continuă pe Σ. Prin teorema de punct fix a lui Brouwer, există un
punct fix σ ∗ . Verificarea faptului că σ ∗ este un echilibru Nash al jocului nu
este dificilă.
Demonstraţia Lemei 2.22. (Tijs) Arătăm doar că
v(A) = maxm min pT Aej .
p∈∆ j∈{1,...,n}
Evident,
inf pT Aq ≤ min pT Aej . (A.3)
q∈∆n j∈{1,...,n}
Întrucât pentru fiecare p ∈ ∆m

n
X n
X
T T T
p Aq = qj p Aej ≥ min p Aej qj = min pT Aej ,
j∈{1,...,n} j∈{1,...,n}
j=1 j=1
avem
inf pT Aq ≥ min pT Aej . (A.4)
q∈∆n j∈{1,...,n}
Din (A.3) şi (A.4) obţinem

inf pT Aq = min pT Aej . (A.5)
q∈∆n j∈{1,...,n}
Considerăm f : ∆m −→ IR, definită prin f (p) = min pT Aej . Această

j∈{1,...,n}
funcţie este continuă, iar mulţimea ∆m este o mulţime nevidă mărginită şi
ı̂nchisă. Prin urmare, există maxm f (p). Combinând aceasta cu (A.5) obţinem
p∈∆
v(A) := sup inf pT Aq = sup

n
min pT Aej = maxm min pT Aej .
p∈∆m q∈∆ p∈∆m j∈{1,...,n} p∈∆ j
82
Demonstraţia Teoremei 2.23. (Tijs) Întâi observăm că
inf K(x, z) ≤ K(x, y) pentru toţi x ∈ X şi y ∈ Y

z∈Y
implică
sup inf K(x, z) ≤ sup K(x, y) pentru toţi y ∈ Y,
x∈X z∈Y x∈X
şi atunci
sup inf K(x, z) ≤ inf sup K(x, y),
x∈X z∈Y y∈Y x∈X
sau
v(X, Y, K, −K) ≤ v̄(X, Y, K, −K), i.e., v(A) ≤ v̄(A).
Demonstrăm că v(A) = v̄(A) prin inducţie matematică după mărimea s(A)
a lui A, unde s(A) := m + n. Evident, s(A) ≥ 0. Definim funcţia ”gap” a lui
A prin g(A) := v̄(A) − v(A). Am arătat anterior că g(A) ≥ 0. Arătăm acum
că g(A) = 0, prin inducţie după mărimea lui A.
• Pentru s(A) = 2, A este de forma [a], deci g(A) = v̄(A) − v(A) =

a − a = 0.
• Presupunem că g(B) = 0 pentru toţi B cu s(B) < r. Luăm A ∈ IRm×n

cu m+n = r. Folosind Lema 2.22, putem găsi un p∗ ∈ ∆m şi un q ∗ ∈ ∆n
astfel ı̂ncât
(p∗ )T Aej ≥ v(A) pentru toţi j ∈ {1, ..., n}. (A.6)
eTi Aq ∗ ≤ v̄(A) pentru toţi i ∈ {1, ..., m}. (A.7)

Considerăm 3 cazuri:
1. În (A.6) şi (A.7) avem numai egalităţi. Atunci (p∗ )T Aq ∗ = v(A) =
v̄(A), deci g(A) = 0.
2. Există un k ∈ {1, ..., n} astfel ı̂ncât (p∗ )T Aek > v(A), ceea ce
implică n > 1.
3. Există un ` ∈ {1, ..., m} astfel ı̂ncât eT` Aq ∗ < v̄(A), ceea ce implică
m > 1.
Întrucât cazurile 2 şi 3 sunt similare, vom demonstra numai pentru

cazul 2 că g(A) = 0.
83
Fie A−k matricea care se obţine din A prin eliminarea coloanei k. Din
presupunerea inductivă, g(A−k ) = 0. Este uşor de arătat că
¡ ¢
v(A−k ) ≥ v(A) şi v̄(A−k ) ≥ v̄(A) .
În cele ce urmează, vom arăta, prin metoda reducerii la absurd, că
v(A−k ) = v(A).
Presupunem că v(A−k ) > v(A). Acesta ı̂nseamnă că există p̄ ∈ ∆m care
este maximin pentru A−k , deci p̄Aej > v(A) pentru toţi j ∈ {1, ..., n}\{k}.
Pentru orice ε ∈ (0, 1) avem atunci
(εp̄ + (1 − ε)p∗ )T Aej > v(A) pentru toţi j 6= k.
Pentru ε arbitrar de mic vom avea
(εp̄ + (1 − ε)p∗ )T Aej > v(A).
Dar atunci
v(A) ≥ min (εp̄ + (1 − ε)p∗ )T Aej > v(A),
j∈{1,...,n}
ceea ce contrazice presupunerea făcută. Prin urmare v(A−k ) = v(A).


 ∗ T ∗
 (p ) Aq = p∈∆ maxm pT Aq ∗ ,
(p∗ , q ∗ ) ∈ N E(A, B) ⇐⇒ ⇐⇒

 (p∗ )T Bq ∗ = maxn p∗ Bq,
q∈∆
 ∗ T ∗
max eTi Aq ∗ ,
 (p ) Aq = i{1,...,m}

⇐⇒ ⇐⇒

 (p∗ )T Bq ∗ = max (p∗ )T Bej ,
j∈{1,...,n}
(
C(p∗ )⊂P B1 (q ∗ ),
⇐⇒
C(q ∗ )⊂P B2 (p∗ ).
84
ANEXA B
Demonstraţii privind Capitolul 3

n
X n
X
(=⇒) Presupunem x ∈ I(v). Atunci v(N ) = xi ≥ v({i}), unde egali-
i=1 i=1
tatea urmează din proprietatea de eficienţă şi inegalitatea urmează din pro-
prietatea de raţionalitate individuală.
X n
(⇐=) Presupunem v(N ) ≥ v({i}). Atunci
Ã i=1 !
n−1
X
v({1}), ..., v({n − 1}), v(N ) − v({i})
i=1
este o imputaţie.
Teorema B.1. (caracterizarea punctelor extreme ale unei mulţimi poliedrale)

Fie A o matrice ı̂n IRn×p , b ∈ IRp şi fie P mulţimea poliedrală a soluţiilor
sistemului de inegalităţi xT A ≥ bT . Pentru x ∈ IRn , fie tight(x) mulţimea
coloanelor {Aej | xT Aej = bj } ale lui A, unde inegalităţile corespunzătoare
sunt egalităţi pentru x şi unde pentru fiecare j ∈ N, ej este al j-lea vector al
bazei standard ı̂n IRn . Atunci x este un punct extrem al lui P dacă şi numai
dacă tight(x) este un sistem complet de vectori ı̂n IRn .
X
(i) Întrucât v ∈ GN este un joc N -esenţial, avem a = v(N ) − xi > 0.
i∈N
Pentru orice n-uplu b = (b1 , ..., bn ) de numere nenegative astfel că
X
bi = a, vectorul plată x0 = (x01 , ..., x0n ) cu x0i = v({i}) + bi pen-
i∈N
tru toţi i ∈ N este o imputaţie.
(ii) Aceasta urmează din Teorema B.1 observând că I(v) = {x ∈ IRn |
xT A ≥ bT }, unde A este matricea n×(n+2) cu coloanele e1 , ..., en , 1n , −1n
85
şi b = (v({1}), ..., v({n}), v(N ), −v(N )), unde pentru fiecare i ∈ N, ei
este al i-lea vector al bazei standard ı̂n IRn şi 1n este vectorul ı̂n IRn cu
toate coodonatele egale cu 1.
Teorema B.2. (teorema dualităţii ı̂n programarea liniară) Fie A o matrice
n × p, b ∈ IRp şi c ∈ IRn . Atunci
min{xT c | xT A ≥ bT } = max{bT y | Ay = c, y ≥ 0}
dacă {x ∈ IRn | xT A ≥ bT } 6= ∅ şi {y ∈ IRp | Ay = c, y ≥ 0} 6= ∅.
Demonstraţia Teoremei 3.8. Întâi observăm că C(v) 6= ∅ dacă şi numai
dacă ( )
X X
v(N ) = min xi | xi ≥ v(S) pentru toţi S ∈ 2N \{∅} . (B.1)
i∈N i∈S
Prin Teorema B.2,

 egalitatea (B.1) are loc dacă şi numai dacă 
 X X 
S N
v(N ) = max λ(S)v(S) | λ(S)e = e , λ ≥ 0 , (B.2)
 N N

S∈2 \{∅} S∈2 \{∅}
caracteristici eS drept coloane). Acum, (B.2)
(luând matricea A cu vectorii X
are loc dacă şi numai dacă λ(S)v(S) ≤ v(N ) are loc, unde λ este o
S∈2N \{∅}
aplicaţie balansată. Prin urmare, (i) şi (ii) sunt echivalente.
Demonstraţia Propoziţiei 3.15. Fie x ∈ C(v). Pentru orice i ∈ N are loc
xi = x(N ) − x(N \{i}) = v(N ) − x(N \{i}) ≤ v(N ) − v(N \{i}) = (B.3)
= Mi (N, v).
Dacă i ∈ S, are loc
(B.3) X
xi = x(S) − x(S\{i}) ≥ v(S) − x(S\{i} ≥ v(S) − Mj (N, v) (B.4)
j∈S\{i}
=⇒ xi ≥ mi (v).
Din (B.3) şi (B.4) obţinem
mi (v) ≤ xi ≤ Mi (N, v) pentru toţi i ∈ N. (B.5)
Observăm că (B.5) ı̂nseamnă m(v) ≤ x ≤ M (N, v) pe coordonate şi implică
X X
mi (v) ≤ v(N ) ≤ Mi (N, v).
i∈N i∈N
Deci, am arătat că orice joc balansat este un joc quasi-balansat. Faptul
că orice joc balansat este de asemenea un joc semibalansat urmează simi-
lar din (B.3) şi din proprietatea de raţionalitate individuală a elementelelor
sâmburelui jocului.
86
BIBLIOGRAFIE
1. Aubin, J.P. (1974). Coeur et valeur des jeux flous à paiements latéraux.
Comptes-Rendus de l’Académie des Sciences Paris 279 A, 891-894.
2. Aubin, J.P. (1981). Cooperative fuzzy games. Mathematics of Operations

Research 6, 1-13.
3. Aumann, R.J. and B. Peleg (1960). Von Neumann-Morgenstern solutions

to cooperative games without side payments. Bulletin of the American Ma-
thematical Society 66, 173-179.
4. Bondareva, O.N. (1963). Some applications of linear programming methods

to the theory of cooperative games (in Russian). Problemi Kibernetiki 10,
119-139.
5. Borel, E. (1921). La théorie du jeu et les equations integrales à noyau

symétrique. Comptes Rendus de l’Académie des Sciences 173, 1304-1308.
6. Brânzei, R., D. Dimitrov and S. Tijs (2005). Models in Cooperative Game

Theory: Crisp, Fuzzy and Multi-Choice Games. Springer.
7. Brânzei, R., V. Fragnelli and S. Tijs (2002). Tree-connected peer group

situations and peer group games. Mathematical Methods of Operations
Research 55, 93-106.
8. Brânzei, R., T. Solymosi and S. Tijs (2005). Strongly essential coalitions and
the nucleolus of peer group games. International Journal of Game Theory
33, 447-460.
9. Brânzei, R., S. Tijs and J. Timmer (2001). Collecting information to improve

decision making. International Game Theory Review 3, 1-12.
10. Calvo, E. and J.C. Santos (2000). A value for multichoice games. Mathe-
matical Social Sciences 40, 341-354.
87
11. Charnes, A. and D. Granot (1973). Prior solutions: extensions of convex
nucleolus solutions to chance-constrained games. Proceedings of the Com-
puter Science and Statistics Seventh Symposium at Iowa State University,
323-332.
12. Gardner, R. (1995). Games for Business and Economics. John Wiley &
Sons.
13. Gibbons, R. (1992). A primer in Game Theory. Harvester/Wheatsheaf.
14. Gillies, D.B. (1953). Some Theorems on n-person Games. Ph. D. Disserta-
tion, Princeton University Press.
15. Granot, D. (1977) Cooperative games in stochastic function form. Manage-
ment Science 23, 621-630.
16. Harsanyi, J.C. (1967/68). Games with incomplete information played by
’Bayesian’ players, Part I, II, and III. Management Science 14, 159-182,
320-334, and 486-502.
17. Hsiao, C.-R. and TES Raghavan (1993a). Monotonicity and dummy free
property for multi-choice cooperative games. International Journal of Game
Theory 21, 301-312.
18. Hsiao, C.-R. and TES Raghavan (1993b). Shapley value for multi-choice
cooperative games (I). Games and Economic Behavior 5, 240-256.
19. Kohlberg, E. (1971). On the nucleolus of a characteristic function game.
SIAM Journal on Applied Mathematics 20, 62-66.
20. Ichiishi, T. and A. Yamazaki (2006). Cooperative Extensions of the Bayesian
Game. Series on Mathematical Economics and Game Theory, Vol. 3.
21. Monderer, D. and L. Shapley (1996). Potential games. Games and Economic
Behavior 14, 124-143.
22. Morris, P. (1994). Introduction to Game Theory. Springer-Verlag.
23. Muto, S., M. Nakayama, J. Potters and S. Tijs (1988). On big boss games.
Economic Studies Quarterly 39, 303-321.
24. Muto, S., J. Potters and S. Tijs (1989). Information market games. Inter-
national Journal of Game Theory 18, 209-226.
25. Myerson, R. (1977). Graphs and cooperation in games. Mathematics of
Operations Research 2, 225-229.
88
26. Myerson, R. (1980). Conference structures and fair allocation rules. Inter-
national Journal of Game Theory 9, 169-182.
27. Nash, J. (1950a). Equilibrium points in n-person games. Proceedings of the

National Academy of Sciences 36, 48-49.
28. Nash, J. (1950b). The bargaining problem. Econometrica 18, 155-162.
29. Nash, J.F. (1951). Non-cooperative games. Annals of Mathematics 54, 286-
295.
30. van den Nouweland, A., S. Tijs, J. Potters and J. Zarzuelo (1995). Cores and
related solution concepts for multi-choice games. Mathematical Methods of
Operations Research 41, 289-311.
31. von Neumann, J. (1928). Zur Theorie der Gesellschaftsspiele. Mathema-

tische Annalen 100, 295-320.
32. von Neumann, J. and O. Morgenstern (1944). Theory of Games and Eco-
nomic Behavior. Princeton University Press.
33. Osborne, M. and A. Rubinstein (1994). A Course in Game Theory. MIT

Press.
34. Owen, G. (1986). Values of graph-restricted games. SIAM Journal on Al-

gebraic and Discrete Mathematics 7, 210-220.
35. Owen, G. (1999). Discrete Mathematics and Game Theory. Theory and
Decision Library: Series C, Kluwer Academic Publishers.
36. Peleg, B. and P. Sudhölter (2004). Introduction to the Theory of Coope-

rative Games. Theory and Decision Library: Series C, Kluwer Academic
Publishers.
37. Rafels, C. (Coordinació) (1999). Jocs cooperatius i aplicacions econòmiques.

Col-lecció UB.
38. Rosenthal, R.W. (1973). A class of games possessing pure-strategy Nash

Equilibria. International Journal of Game Theory 2, 65-67.
39. Schmeidler, D. (1969). The nucleolus on a characteristic function game.

SIAM Journal on Applied Mathematics 17, 1163-1170.
40. Selten, R. (1975). Reexamination of the perfectness concept for equilibrium

points in extensive games. International Journal of Game Theory 4, 25-55.
89
41. Shapley, L.(1953). A value for n-person games. In: Tucker, A. and H. Kuhn
(Eds.), Contributions to the Theory of Games II, pp. 307-317.
42. Shapley, L. (1971). Cores of convex games. International Journal of Game

Theory 1, 11-26.
43. Slikker, M., H. Norde and S. Tijs (2003). Information sharing games. Inter-
national Game Theory Review 5, 1-12.
44. Slikker, M. and A. van den Nouweland (2001). Social and Economic Net-
works in Cooperative Game Theory. Theory and Decision Library: Series
C, Kluwer Academic Publishers.
45. Suijs, J. (1999). Cooperative Decision-Making under Risk. Boston: Kluwer.
46. Suijs, J. and . Borm (1999). Stochastic cooperative games: superadditivity,

convexity and certain equivalents. Games and Economic Behavior 27, 331-
345.
47. Tijs, S.H. (1981). Bounds for the core of a game and the τ -value. In:
Moeschlin, O. and D. Pallaschke (Eds.), Game Theory and Mathematical
Economics, Amsterdam: North Holland, pp.123-132.
48. Tijs, S.H. (1987). An axiomatization of the τ -value. Mathematical Social

Sciences 13, 177-181.
49. Tijs, S. (2003). Introduction to Game Theory. Hindustan Book Agency.
50. Tijs, S. (2005). The first steps with Alexia, the lexicographic order. CentER
DP 2005-123, Tilburg University, Tilburg, The Netherlands.
51. Tijs, S., J. Timmer and R. Brânzei (2006). Compensations in information

collecting situations: A cooperative approach. Journal of Public Economic
Theory 8, 181-191.
52. Timmer, J., P. Borm and S. Tijs (2000). Convexity in stochastic cooperative
situations. International Game Theory Review 7, 25-42.
53. Watson, J. (2002). An Introduction to Game Theory. W.W. Norton &

Company.
90

Teoria Jocurilor

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Teoria Jocurilor

Încărcat de

Drepturi de autor:

Formate disponibile

TEORIA JOCURILOR

ANEXA A. Demonstraţii privind Capitolul 2 81

ANEXA B. Demonstraţii privind Capitolul 3 85

31 august 2006 Rodica Brânzei

Prefaţă la ediţia a doua

10 septembrie 2007 Rodica Brânzei

• Figura 2.1 Jocul ”Avantaj competitiv” p. 17

Jocurile de societate (table, jocuri de cărţi, şah), jocurile sportive (fotbal,

Teoria jocurilor este o teorie matematică care se ocupă cu modelarea şi

1.1 Forme de reprezentare a jocurilor

1.2 Modelarea situaţiilor decizionale interactive

Teoria jocurilor a apărut din necesitatea de a oferi suport pentru optimizarea

În teoria jocurilor există două modele de bază de jocuri necooperative,

Un joc necooperativ ı̂n formă normală (strategică) este un model al unei

Un joc necooperativ ı̂n formă normală (strategică) este un triplet

Exemplul 2.1. (Avantaj competitiv) Două companii cu acelaşi tip de acti-

Figure 2.1: Jocul ”Avantaj competitiv”

K(x, y) = 2(x + y + cxy) − x2 , L(x, y) = 2(x + y + cxy) − y 2 ,

(a) (b) (c)

Figure 2.2: Exemple de jocuri matriceale

Figure 2.3: Jocul canalelor TV

v(X, Y, K, −K) := sup inf K(x, y);

v̄(X, Y, K, −K) := inf sup K(x, y).

Figure 2.5: Echilibre Nash ale jocului ”Parteneriat ı̂n afaceri”

O diagramă cu săgeţi poate fi folositoare pentru determinarea echilibrelor

Figure 2.6: Diagrame cu săgeţi

Exemplul 2.6. (Un joc de alegere a rutei) Două companii de transporturi

Jocul din Exemplul 2.6 este generat de un model de congestie introdus

• cj : {1, 2, ..., n} −→ IR este funcţia de cost pentru facilitatea j, unde

Figure 2.7: Un joc de alegere a rutei

Situaţiile corespunzătoare unui model de congestie pot fi modelate ca

(i) Jocurile G şi GP au aceeaşi mulţime de echilibre Nash;

(ii) G are cel puţin un echilibru Nash.

Figure 2.8: Eliminarea iterativă a strategiilor dominate

Există totuşi multe jocuri strategice finite care nu au nici-un echilibru

Figure 2.9: Un joc cu ”imperfect recall”

Figure 2.10: Subjocurile unor jocuri ı̂n forma extensivă

Figure 2.11: Jocuri ı̂n formă extensivă cu mutări ale şansei

Metoda de bază pentru determinarea echilibrelor Nash perfecte pe subjoc

Figure 2.12: Echilibru Nash perfect pe subjoc

Determinarea prin metoda inducţiei ı̂napoi a echilibrelor Nash perfecte pe

Figure 2.13: Forma extensivă a jocului parteneriatului

În aplicarea metodei inducţiei ı̂napoi pentru determinarea echilibrelor

Exemplul 2.16. Considerăm o piaţă cu două firme concurente, firma 1 şi

Situaţii practice pot fi uneori studiate folosind instrumentele teoriei jocurilor.

Exemplul 2.17. Considerăm următoarea situaţie decizională interactivă pe

Ambelor forme extensive privind jocul firmelor pe piaţa de jocuri video

Figure 2.14: Jocuri de piaţă ı̂n formă extensivă

Figure 2.15: Forma normală corespunzătoare jocurilor de piaţă

Figure 2.16: Forma extensivă a unui joc de tip ”ultimatum”

Figure 2.17: Forma normală a unui joc de tip ”ultimatum”

Figure 2.18: Forma extensivă u unui joc de piaţă extins

Figure 2.19: Forma normală a unui joc de piaţă extins

Încheiem acest paragraf cu un exemplu de utilizare a formei normale

Figure 2.20: Forme normale folosite ı̂n inducţia ı̂napoi

2.4 Extensia mixtă şi echilibre Nash ı̂n strategii mixte

În paragraful 2.1 am introdus forma normală pentru jocuri necooperative de n

Ki (σ ∗ ) = max K(σi , σ−i

În cele ce urmează ne concentrăm atenţia asupra calculării echilibrelor

iar mulţimea strategiilor mixte ale jucătorului 2 este

Extensia mixtă a lui A este jocul infinit

(i) v(A) = sup min pT Aej ;

Rezolvarea jocurilor matriceale de tip 2×2. Fie A un joc matriceal de