Teoria Jocurilor

7.
T
eoria jocurilor
şi metode de analiză
a comportamentului strategic
Teoria jocurilor este un instrument util de analiză a comportamentului

uman.
Teoria jocurilor ne permite să descriem şi să analizăm fenomenele
economice şi sociale ca nişte jocuri strategice, precum şi să stabilim
echilibrele unui joc, adică stările în care nici un jucător nu doreşte să-şi
modifice comportamentul său ţinând cont de comportamentul celorlalţi
jucători.
Există diferite concepte de echilibru într-un joc. Vom insista asupra
echilibrelor care se bazează pe primejdii credibile. Economiştii utilizează
termenul de echilibre ale subjocurilor perfecte pentru a descrie astfel de
echilibre.
Un joc este caracterizat prin calitatea şi cantitatea informaţiei de care dispun
jucătorii.
Distingem jocuri cu informaţie completă şi incompletă, cât şi jocuri cu
informaţie perfectă şi imperfectă.
Analiza microeconomică a agenţilor economici în condiţii de piaţă
7.1 Definiţia unui joc strategic
Ce înţelegem printr-un joc strategic ?

O persoană este angajată într-un joc strategic cu o altă persoană (sau mai
multe persoane) când utilitatea sa şi câştigurile sale sunt afectate nu numai
de acţiunile întreprinse de el cât şi de acţiunile întreprinse de ceilalţi.
Primii care au aplicat teoria jocurilor în economie aui fost John Von
Neuman şi Oskar Morgenstern1. Von Neuman (1903-1957) era
matematician la Institutul de Studii Avansate de la Priceton, iar Morgenstern
(1902-1977) era economist la Universitatea Princeton. Putem chiar spune că
Von Neuman a inventat teoria jocurilor în 1928 când a demonstrat faimoasa
teoremă a minimaxului. Să notăm că matematicienii francezi Borel şi Ville
au participat de asemenea în perioada respectivă la elaborarea teoriei
jocurilor. Lui Ville i se datorează, de exemplu, demonstraţia geometrică
utilizată de obicei pentru a proba teorema minimax.
De exemplu, şahul este un joc strategic pentru că victoria sau înfrângerea
unuia dintre jucători depinde atât de propriile sale alegeri tactice, cât şi de
acelea ale rivalului său. Numeroase situaţii economice se reduc la jocuri
strategice.
De exemplu, profiturile unei firme de automobile ca Renault nu depind doar
de alegerile sale în materie de preţ, dar, de asemenea, depind de preţurile
anunţate de concurenţi (Peugeot, Volkswagen, Fiat, Ford etc.).
De asemenea, conflictele politice au caracteristicile unui joc strategic.
Pentru a fi mai expliciţi, putem spune că, un joc strategic este o mulţime de
reguli ce descriu comportamentul jucătorilor şi care determină câştigurile
1
« The Theory of Games and Economic Behaviour »( Princeton, New Jersey : Priceton
University Press, 1944)
Teoria jocurilor şi metode de analiză a comportamentului strategic
jucătorilor pe baza acţiunilor întreprinse. Conform acestei terminologii, un

joc strategic presupune o definire clară a regulilor de comportament ale
jucătorilor.
Ce trebuie să specifice aceste reguli?
9 În primul rând, trebuie să ne spună care sunt jucătorii şi dacă şansa
sau hazardul este prezent în joc (ca în jocul de cărţi); când şansa
intervine şi poate afecta jocul, ea este deseori transformată într-un
jucător numit « şansă »
9 În al doilea rând, regulile unui joc strategic trebuie să precizeze
ordinea în care jucătorii îşi efectuează alegerile. Trebuie să ştim cine
joacă primul, cine al doilea şi aşa mai departe. Trebuie să ştim de
asemenea care sunt alegerile posibile ale jucătorilor.
9 În sfârşit, regulile trebuie să ne spună ce utilitate va avea fiecare
jucător la sfârşitul jocului pentru fiecare combinaţie de alegeri
posibile. Când cumpărăm de exemplu un joc de societate ca
Monopoly, găsim întotdeauna în interiorul cutiei o notiţă sau o
regulă a jocului care dă toate aceste informaţii.
7.2 Arborele jocului ca modalitate de descriere

a unui joc strategic
Regulile jocului, cât şi eventualele câştiguri, pot să fie reprezentate prin ceea
ce teoreticienii jocurilor numesc un arbore. Acesta oferă o descriere
detaliată a regulilor jocului şi este de asemenea numit forma extensivă a
jocului.
Pentru a înţelege ce este un arbore sau o formă extensivă, să considerăm
exemplul următor.
Presupunem că nu există decât două firme în lume constructoare de

calculatoare : IBM şi Toshiba.
Înainte de a produce calculatoarele, aceste firme trebuie să decidă ( pentru a-
şi face calculatoarele compatibile sau nu ) adoptarea aceluiaşi sistem de
operare, de exemplu sistemele de operare UNIX sau DOS. Este evident că
de compatibilitate ar beneficia amândouă căci ar permite IBM-ului să-şi
vândă produsele periferice, cum ar fi CD-ROM-urile, utilizatorilor de
calculatoare Toshiba şi invers. ( Neglijăm în acest exemplu avantajele
posibile ale non compatibilităţii: de exemplu, faptul că fiecare din firme ar
face faţă unei pieţe captive)
Cu toate acestea, pentru raţiuni care ţin de istoria celor două firme, fiecare ar
prefera ca celălalt să facă efortul să se adapteze la sistemul său. Presupunem
că IBM preferă sistemul DOS şi Toshiba sistemul UNIX. Pentru a descrie
acest joc strategic, presupunem că IBM are un avans tehnologic asupra
firmei Toshiba privind concepţia calculatoarelor, ceea ce-i permite să anunţe
prima care este sistemul de exploatare pe care-l va folosi pentru
calculatoarele sale. Ca urmare, IBM ţine o conferinţă de presă pentru a
anunţa decizia sa. După acest anunţ, Toshiba decide să ţină o conferinţă de
presă anunţându-şi decizia sa. O dată ce cele două firme s-au angajat
pentru un sistem, producţia poate să înceapă. Profiturile fiecărei firme sunt
următoarele :
dacă cele doua firme aleg sistemul DOS, rezultatul se interpretează
ca o victorie a IBM pentru că sistemul său devine sistemul standard
pe piaţă
dacă cele două firme aleg sistemul UNIX, atunci Toshiba este
marele învingător.
Oricum, oricare ar fi sistemul ales, important este să fie acelaşi, căci

compatibilitatea produselor celor două firme este mai profitabilă pentru
ambele firme decât non-compatibilitatea.
Pentru a fi mai concreţi, să presupunem că dacă cele două firme aleg
sistemul DOS, IBM câştigă 600 milioane dolari şi Toshiba 200 milioane
dolari. Dacă ambele aleg sistemul UNIX, sistemul preferat al lui Toshiba,
aceasta câştigă 600 milioane dolari, iar IBM numai 200 milioane dolari.
Dacă ele nu aleg acelaşi sistem de operare ( cazul non-compatibilităţii ),
fiecare câştigă numai 100 milioane dolari.
Arborele acestui joc strategic este :
IBM
UNIX
DOS 1
Toshiba
Toshiba 2 3
UNIX DOS UNIX

DOS
IBM ⎛ 200 ⎞
⎛ 600 ⎞ ⎛100 ⎞ ⎛100 ⎞ ⎜⎜ ⎟⎟
Toshiba ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝ 600 ⎠
⎝ 200 ⎠ ⎝100 ⎠ ⎝100 ⎠
Arborele unui joc cu informaţie perfectă
Jucătorul 2 ( Toshiba ) ştie dacă jucătorul 1 ( IBM ) se deplasează la dreapta

( UNIX ) sau la stânga ( DOS ) în arbore. Astfel, jucătorul 2 ştie în
momentul alegerii sale, în ce nod se situează, un nod fiind un loc de decizie
în arbore.
Arborele din grafic descrie toate regulile jocului relativ la alegerile

sistemului de operare.
Să remarcăm că arborele ne informează asupra identităţii jucătorilor. În
exemplul nostru sunt 2 jucători. « Şansa » nu intervine în acest joc. Arborele
ne spune care din jucători trebuie să se deplaseze la fiecare loc sau nod de
decizie al jocului. Vedem că jocul începe cu alegerea IBM, urmată de
alegerea lui Toshiba. Faptul că arborele se termină după alegerea lui
Toshiba semnifică faptul că nu există decât două deplasări în acest joc. La
fiecare nod al arborelui, vedem alegerile ( ramurile arborelui ) care se oferă
jucătorilor. De exemplu, în primul nod al arborelui vedem că IBM are două
posibilităţi de alegere ( fie alege DOS, fie alege UNIX ). După cum IBM
decide, Toshiba va fi, fie în nodul din stânga, fie în cel din dreapta al
arborelui. La fiecare din aceste noduri, Toshiba are, de asemenea, două
alternative, ca şi IBM. Cifrele între paranteze la capătul fiecărei ramuri a
arborelui indică rezultatele financiare relative la alegerile jucătorilor. Cifra
de sus corespunde IBM, iar cea de jos lui Toshiba.
Jocurile se pot împărţi în două categorii :
- jocuri cu informaţie perfectă
- jocuri cu informaţie imperfectă
Această împărţire ne trimite la informaţia de care dispune fiecare jucător
când acesta atinge un nod de decizie.
7.3 Jocuri cu informaţie perfectă şi imperfectă

(ceea ce jucătorii cunosc în momentul
alegerii strategiilor lor)
În anumite jocuri, jucătorii, în momentul luării deciziilor, sunt la curent cu
tot ceea ce s-a petrecut până atunci. În acest caz, fiecare nod al arborelui este
vizibil de către jucători. În jocul descris în graficul de mai înainte, când
Toshiba alege sistemul de operare, ea ştie dacă IBM a ales sistemul DOS
sau sistemul UNIX la etapa precedentă. Un astfel de joc se numeşte joc cu
informaţie perfectă, pentru că un jucător, în momentul când joacă, cunoaşte
toate alegerile anterioare ale celorlalţi jucători.
Cu toate acestea, în anumite jocuri, trebuie să presupunem că atunci când un
jucător atinge un punct de decizie, el nu cunoaşte toate alegerile celorlalţi
jucători care l-au precedat. Astfel de jocuri se numesc jocuri cu informaţie
incompletă.
Pentru a reprezenta informaţia unui jucător în acest caz, trebuie să
introducem noţiunea de mulţime de informaţie a unui arbore.
Aceste mulţimi indică ceea ce un jucător cunoaşte în momentul deplasării.
Graficul următor prezintă acelaşi arbore al jocului ca şi precedentul,
excepţie este faptul că acest joc are o structură de informaţie diferită, pentru
că Toshiba nu ştie în momentul alegerii sale ce sistem a selecţionat IBM.
Să presupunem că companiile îşi anunţă deciziile în acelaşi timp. Astfel,
Toshiba(IBM) îşi alege sistemul fără a cunoaşte alegerea IBM(Toshiba). În
graficul următor, ovalul care înconjoară cele două noduri de decizie ale lui
Toshiba corespunde mulţimii de informaţie a lui Toshiba. Informaţia sa este
imperfectă pentru că ea nu ştie dacă este în nodul 2 sau 3. Altfel spus, ea nu
ştie dacă IBM a ales DOS sau UNIX.
În graficul anterior, fiecare mulţime de informaţie conţine numai un nod.
Informaţia este astfel perfectă, căci fiecare jucător ştie exact unde se
situează în arbore şi ştie exact ceea ce au făcut mai înainte ceilalţi jucători.
Jucătorul 2 ( Toshiba ) nu ştie dacă IBM a ales DOS sau UNIX (dacă s-a
deplasat la dreapta sau la stânga). Astfel, jucătorul 2 nu ştie dacă se găseşte
în nodul 2 sau 3.
IBM
UNIX
DOS 1
Toshiba
Toshiba 2 3
UNIX
DOS UNIX DOS
IBM ⎛ 200 ⎞
⎛ 600 ⎞ ⎛100 ⎞ ⎛100 ⎞ ⎜⎜ ⎟⎟
Toshiba ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝ 600 ⎠
⎝ 200 ⎠ ⎝100 ⎠ ⎝100 ⎠
Nu schimbăm situaţia strategică înlocuind Toshiba cu IBM la nodul 1 şi

IBM cu Toshiba la nodurile 2 şi 3, căci cele două firme aleg simultan
sistemul lor de operare.
În jocurile cu informaţie perfectă ca şi în cele cu informaţie incompletă,
arborele ne dă câştigurile jucătorilor condiţionate de alegerile acestora sau
drumul parcurs în arbore. De exemplu, dacă IBM şi Toshiba aleg DOS,
câştigurile vor fi de 600 pentru IBM şi 200 pentru Toshiba.
7.4 Descrierea jocului sub formă normală
În cazul în care un joc implică mai mulţi jucători şi alegeri multiple,

arborele poate să devină complex şi foarte greu de reprezentat. Pentru a
evita astfel de dificultăţi, se obişnuieşte să se simplifice prezentarea jocului
specificând strategia fiecărui jucător.
Prin strategie înţelegem un plan de acţiune complet, pentru fiecare jucător

specificând ceea ce va face acesta la fiecare nod al arborelui şi în fiecare
situaţie care poate interveni pe parcursul jocului.
Pentru a înţelege noţiunea de strategie, vom schimba metoda de analiză

trecând de la forma extinsă la forma normală a jocului. Pentru a înţelege
diferenţa între cele două forme, să revenim la forma extinsă a jocului între
IBM şi Toshiba (primul grafic).
Deoarece IBM se deplasează prima în joc şi apoi nu se mai deplasează, ea
are doar două strategii posibile : să aleagă DOS sau UNIX. Strategiile lui
Toshiba sunt definite condiţionat de alegerea IBM.
De exemplu, o strategie pentru Toshiba ar putea fi « alege DOS dacă IBM
alege DOS, alege UNIX dacă IBM alege UNIX ». Numim această strategie
DOS/DOS ( unde primul « DOS» reprezintă alegerea făcută de Toshiba
condiţionată de alegerea lui IBM, iar al doilea reprezintă alegerea făcută de
IBM ), respectiv UNIX/UNIX.
Putem inventaria 4 strategii pentru Toshiba : ( DOS/DOS ; UNIX/UNIX ),
( DOS/DOS ; DOS/UNIX ), ( UNIX/DOS ; DOS/UNIX ),
( UNIX/DOS ; UNIX/UNIX ).
Să remarcăm că, combinând strategiile celor doi jucători, putem defini un
grup complet în arborele jocului. De exemplu, să presupunem că IBM alege
( DOS ) şi Toshiba ( DOS/DOS ; DOS/UNIX ). Cei doi jucători parcurg
atunci drumul următor, în cursul căruia IBM alege DOS, apoi Toshiba alege
DOS. Acest drum conferă un câştig de 600 lui IBM şi 200 lui Toshiba.
Astfel, pentru fiecare combinaţie de strategii, există o pereche de câştiguri.
Evident, a lucra cu strategii simplifică analiza, căci putem reduce jocul între
IBM şi Toshiba la matricele de mai jos.
Joc sub formă normală între IBM şi Toshiba

( câştig în milioane de dolari )
Toshiba
(DOS/DOS, (DOS/DOS, (UNIX/DOS, (UNIX/DOS,
DOS/UNIX) UNIX/UNIX) UNIX/UNIX) DOS/UNIX)
IBM DOS 600, 200 600, 200 100, 100 100, 100
UNIX 100, 100 200, 600 200, 600 100, 100
Această matrice reprezintă situaţia strategică a celor două companii şi ne

indică câştigurile pe care le va primi fiecare firmă conform strategiei
adoptate. Primul număr reprezintă câştigul lui IBM, iar cel de-al doilea
corespunde câştigului lui Toshiba.
Presupunem, de exemplu, că IBM decide să pună în funcţiune strategia DOS
şi Toshiba strategia ( UNIX/DOS ; DOS/UNIX ). Această strategie poate să
se enunţe din punctul de vedere al lui Toshiba astfel : « dacă IBM alege
DOS, noi alegem UNIX ; dacă IBM alege UNIX, noi alegem DOS ».
Privind primul grafic, vedem că această combinaţie strategică conduce la un
câştig de 100 pentru IBM, ca şi pentru Toshiba.
Nu spunem că ar fi mai bine pentru IBM şi Toshiba dacă se alege DOS sau
UNIX.
Cu siguranţă că fiecare preferă să primească un câştig de 600 sau chiar şi de
200, mai curând decât un câştig de 100. Nu facem decât să reprezentăm sub
formă normală, ceea ce jucătorii ar câştiga pentru fiecare combinaţie
strategică posibilă.
7.5 Exemplu de joc cu informaţie incompletă şi cu sumă nulă
Pentru a ne familiariza cu formele normală şi extinsă, să considerăm jocul

următor numit « cap sau pajură ». În acest joc simplu, doi copii ascund în
palmă o monedă. Simultan fiecare deschide palma şi arată moneda. Dacă
cele două monede arată aceeaşi parte, atunci primul copil dă o monedă
celuilalt. În caz contrar, cel de-al doilea copil dă o monedă primului copil.
Este un joc cu informaţie incompletă (imperfectă) pentru că cei doi copii
deschid simultan mâna fără a şti fiecare cum a ascuns moneda. Graficul
următor redă forma extinsă a jocului.
Copilul 2 nu ştie dacă copilul 1 a ales cap sau pajură. Mulţimea de
informaţie a copilului 2 conţine 2 noduri.
Arborele de mai sus ( forma extinsă a jocului „cap sau pajură” ) arată că
copilul 1 se deplasează primul alegând cap sau pajură. Apoi copilul 2 care
nu ştie ce a ales primul copil, trebuie să aleagă între cap sau pajură.
Copilul 1
Pajură
Cap
Copil 2 Copil 2
Cap Cap
Pajură Pajură
1 2 3 4
Când cei doi au făcut aceeaşi alegere, fie cap, fie pajură, copilul 2 primeşte
un câştig 1 iar copilul 1 un câştig de -1 ( nod terminal 1 sau 4 ).
Când piesele nu coincid ( nodurile terminale 2 sau 3 ) câştigurile sunt
inverse. Să remarcăm că acest joc este un joc cu sumă nulă, suma
câştigurilor copiilor la fiecare nod terminal fiind egală cu zero.
Forma normală a acestui joc este foarte simplă deoarece cei doi copii au
doar două strategii posibile ( a alege cap sau pajură ) câştigurile pot fi
descrise ca în matricea următoare:
Cap Pajură
Copil 1 Cap -1, +1 +1, -1
Pajură +1, -1 -1, +1
7.6 Echilibrele jocului
Analiza unui joc permite să se prevadă echilibrul care va apărea dacă

jucătorii sunt raţionali.
Prin echilibru înţelegem o stare sau o situaţie din care nici un jucător nu
doreşte să-şi modifice comportamentul ţinând cont de comportamentul
celorlalţi jucători. Şi mai concret un echilibru este o combinaţie de strategii
astfel încât nici un jucător nu este nevoit să-şi schimbe strategia sa ţinând
seama de strategia celorlalţi jucători. O dată echilibrul atins ( nu are
importanţă modalitatea cum a fost obţinut ) nu există nici o raţiune pentru a-
l părăsi.
Pentru a putea uitliza în analize conceptul de echilibru al unui joc, trebuie să
facem precizări în plus asupra semnificaţiei acestui concept.
Ştim că un echilibru este constituit dintr-o combinaţie de alegeri strategice(

o alegere per jucător ) şi că odată ce alegerile sunt oprite, nu va interveni
nici o modificare. Adică, nici un jucător sau grup de jucători nu va fi nevoit
să-şi modifice acţiunile dacă presupune că rivalii săi nu şi le mai modifică
pe ale lor.
Jocurile care vor fi studiate corespund la situaţii în care fiecare jucător se
opreşte din alegerile sale strategice fără a-i consulta pe ceilalţi jucători.
Astfel de jocuri se numesc jocuri nou cooperative pentru că nu oferă
posibilitatea unei cooperări formale, adică a unei coordonări a strategiilor
diferiţilor jucători.
Nu vom vorbi de jocuri cooperative aici. Jocurile cooperative sunt jocuri în
care jucătorii pot vorbi între ei şi pot încheia contracte avantajoase. Pentru
jocurile de acest tip, se utilizează conceptul de echilibru deosebit. În teoria
schimburilor a fost introdusă noţiunea de nucleu al unei economii. Acesta se
defineşte ca o mulţime de alocări pe care nici un individ sau grup de
indivizi n-o poate contesta formând o coaliţie ( prin semnarea amiabilă a
unor contracte ) pentru a obţine o mai bună alocare a bunurilor. Deoarece se
consideră că oamenii negociază între ei îşi comunică intenţiile şi că
drepturile de proprietate permit să se încheie contracte avantajoase, un joc
cooperativ ar părea să aibă sens doar dintr-un punct de vedere teoretic. Cu
toate acestea în cea mai mare parte a situaţiilor(care vor fi luate în
considerate), este vorba de comunicarei. De exemplu, pe pieţele
oligopolistice, legile antitrust interzic firmelor de a comunica între ele şi de
a încheia acorduri în special asupra preţului produselor lor.
Astfel, când dorim să determinăm echilibrele unui joc nou cooperativ, nu
considerăm incitaţiile grupurilor de jucători pentru a-şi modifica
comportamentele între ei dat fiind comportamentul restului de jucători;

considerăm numai incitaţiile jucătorilor luaţi individual.
Pentru a înţelege cu ceea ce seamănă un echilibru, să considerăm din nou
matricea jocului între IBM şi Toshiba. Să privim căsuţa câştigului ( 200,
600 ) cu caractere bolduite. Putem susţine că perechea de strategii asociată
la aceste câştiguri ( UNIX ) şi ( UNIX / DOS; UNIX / UNIX ) este o
pereche de strategii de echilibru al jocului. Pentru a proba o astfel de
afirmaţie să considerăm în primul rând poziţia IBM. Dacă Toshiba alege (
UNIX / DOS; UNIX / UNIX ) ca strategie, atunci acest lucru se
interpretează astfel : Toshiba va alege întotdeauna UNIX ca sistem de
operare pentru calculatoarele sale indiferent de alegerea lui IBM. Faţă de
această strategie, IBM are de ales între un câştig de 100 dacă optează pentru
DOS şi un câştig de 200 dacă alege UNIX.
Este clar că răspunsul său cel mai bun va fi UNIX dacă strategia lui Toshiba
este ( UNIX / DOS; UNIX / UNIX ). Dacă IBM gândeşte că Toshiba are o
astfel de strategie, atunci alegerea sa va fi cu siguranţă UNIX. În acelaşi
mod, dacă Toshiba gândeşte că IBM optează pentru UNIX, ea câştigă 100
alegând ( DOS / DOS ; DOS / UNIX) ca strategie şi va câştiga 600 alegând
( UNIX / DOS; UNIX / UNIX ).
Dacă Toshiba crede că IBM va alege UNIX, răspunsul ei cel mai bun va fi (
UNIX / DOS; UNIX / UNIX ). Spus alt fel, dacă IBM se aşteaptă ca
Toshiba să aleagă ( UNIX / DOS; UNIX / UNIX ) şi dacă Toshiba se
aşteaptă ca IBM să aleagă UNIX, atunci acestea sunt exact alegerile la care
se opresc pentru că fiecare din aceste alegeri este cel mai bun răspuns la
alegerea celuilalt ( sau cel pentru cel mai bun răspuns la alegerea aşteptată a
celuilalt).
7.7 Echilibrul Nash
Echilibrul Nash provine de la numele matematicianului şi economistului

american John F. Nash2, care a introdus acest concept în 1951.
Echilibrul Nash este un concept fundamental în teoria jocurilor. El descrie o
soluţie în care nici un jucător nu doreşte să-şi modifice comportamentul (
sau strategia ) dat fiind comportamentul ( sau strategia ) rivalilor săi. Putem
formaliza echilibrul Nash astfel:
Fie un joc non-cooperativ cu n jucători şi s* = ( s1* , s 2* , ….., s n* ) o
combinaţie de alegeri strategice ale celor n jucători, unde si* - alegerea
strategică a jucătorului i, i= 1, n .
În plus fie π i ( s1* ,….., ŝ i , ….., s n* ) câştigul jucătorului i atunci când a fost
aleasă strategia s*, i = 1,2,…n Putem da acum o definiţie formală a
echilibrului Nash:
Definiţie: O combinaţie de alegeri strategice s* = ( s1* , s 2* , ….., s n* ) este un
echilibru Nash dacă π i ( s1* ,….., s i* , ….., s n* ) ≥ π i ( s1* ,….., ŝi , ….., s n* )
pentru ∀sˆi ∈ S i , ∀i = 1, n , unde si este mulţimea strategiilor individului i.

Această definiţie este uşor de înţeles.
Expresia π i ( s1* ,….., si* , ….., s n* ) reprezintă câştigul jucătorului i atunci
când el alege strategia si* iar ceilalţi aleg s *j , j ≠ i.
Termenul din dreapta inegalităţii π i ( s1* ,….., ŝ i , ….., s n* ) indică câştigul
jucătorului i când el alege ŝi iar ceilalţi n-1 jucători aleg s *j , j ≠ i.
2
premiul Nobel pentru economie în 1994
Ceea ce ne spun condiţiile de echilibru este că orice altă abatere de la

strategia s i* pentru jucătorul i (când ceilalţi nu-şi modifică strategiile) duce
la un câştig mai mic, deci jucătorul i nu va dori să-şi modifice strategia.
Cum i este oarecare înseamnă că nimeni nu poate beneficia de modificarea
strategiei s* (în sensul unui câştig mai mare) şi deci nimeni nu şi-o va
modifica. Asta înseamnă că s*= ( s1* ,…., s n* ) este un echilibru.
7.8 Echilibrul în cazul strategiei dominante
Conceptul de echilibru Nash este chiar definiţia unei situaţii de echilibru.

Pentru a înţelege acest concept trebuie să presupunem mai întâi că jucătorii
au ajuns la o anumită configuraţie a alegerilor strategice. Considerăm atunci
numai abaterile unilaterale ( individuale ) posibile ale acestei configuraţii în
care fiecare jucător care încearcă să se abată presupune că toţi ceilalţi n-o
fac.
În aceste condiţii, echilibrul Nash ne spune că nici un jucător nu va fi incitat
să devieze dată fiind configuraţia strategică. Ceea ce nu ne spune conceptul
de echilibru Nash este „cum, sau pentru ce, este fixată la început o anumită
configuraţie de alegeri strategice”.
Putem înţelege de ce apare un echilibru particular pentru anumite jocuri. Să
considerăm tabelul următor cu date despre 2 firme.
Peugeot
Preţ mare Preţ mic
Renault Preţ mare 500,500 100,700
Preţ mic 700,100
300,300
Presupunem că cele 2 firme construiesc maşini aproape identice şi deci ceea

ce contează în cumpărare este doar preţul. Prima cifră este profitul lui
Renault iar cea de-a doua este profitul lui Peugeot. Fiecare firmă are 2
strategii posibile de stabilire a preţului maşinilor sale: să fixeze un preţ mare
sau unul mic. Matricea câştigurilor indică consecinţele băneşti ale acestor
strategii diferite de preţ pentru fiecare firmă.
Să observăm că dacă ambele firme fixează un preţ ridicat ( situaţie de
“cârdăşie” ), ambele firme obţin un profit de 500 milioane EURO. Cu toate
acestea, dacă o firmă fixează un preţ mare, atunci cealaltă poate obţine un
profit şi mai mare scăzând preţul (abătându-se de la strategia unui preţ
ridicat ). Aceasta din urmă îi „fură” aproape 100 milioane EURO. Dacă cele
2 firme practică amândouă un preţ scăzut ele îşi împart în mod egal piaţa şi
obţin fiecare câte 300 milioane EURO ( ţinând totuşi seama de preţul scăzut
de vânzare ). În tabelul de mai sus conţinând elementele unui joc de preţ de
tipul „dilema prizonierului”, singura combinaţie de strategii care conduce la
un echilibru Nash este aceea încercuită ( adică în care fiecare firmă practică
preţuri mici şi obţin un profit fiecare de 300 milioane EURO ).
Dacă una din firme se aşteaptă ca cealaltă să fixeze un preţ mic, cea mai
bună alegere a sa ar fi să fixeze tot un preţ scăzut. Este singura combinaţie
de strategii care conduce la un echilibru, în ciuda faptului că cele 2 firme ar
avea mai curând un interes comun în a fixa preţuri mari ( profiturile s-ar
ridica în acest caz la 500 milioane EURO ). Dar combinaţia de strategii de
preţuri ridicate incită fiecare firmă să trişeze sau să se abată.
Echilibrul în preţuri scăzute poate să fie justificat şi într-un alt mod. Putem
să remarcăm că, a fixa un preţ scăzut este cea mai bună alegere pentru
fiecare firmă oricare ar fi alegerea aşteptată a rivalului său.
Să examinăm decizia lui Renault ( Peugeot fiind într-o situaţie simetrică,

acelaşi raţionament se aplică şi pentru această firmă ). Dacă Renault se
aşteaptă ca Peugeot să fixeze un preţ ridicat, cel mai bun răspuns al său este
să fixeze un preţ scăzut căci ea va câştiga 700 milioane EURO în loc de 500
milioane de EURO ( câştigul unei strategii de preţ ridicat ). Pe de altă parte
dacă Renault se aşteaptă ca Peugeot să fixeze un preţ scăzut, cea mai bună
alegere a sa ar fi să fixeze tot un preţ scăzut. Nealegând un preţ ridicat, ea
evită astfel să piardă bani: câştigul său este de 300 milioane EURO în loc de
100 milioane EURO. De fapt, Renault este întotdeauna în cea mai bună
situaţie fixând un preţ scăzut oricare ar fi strategia aşteptată a lui Peugeot.
Când strategia unui jucător este cel mai bun răspuns faţă de toate celelalte
strategii posibile ale rivalilor săi, se spune că este o strategie dominantă (
această strategie domină toate celelalte strategii ale jucătorului). În exemplul
precedent, cele 2 firme au o strategie dominantă care constă în fixarea
preţului la un nivel cât mai mic. Echilibrul unui astfel de joc se numeşte
atunci echilibru cu strategie dominantă.
7.9 Rezolvarea jocurilor prin eliminarea

strategiilor dominate
Un jucător raţional nu trebuie să utilizeze niciodata o strategie dominată,

adică o strategie care este dominată în ceea ce priveşte câştigurile de către
cel puţin o alta din strategiile sale faţă de toate strategiile posibile ale
rivalilor săi.
Când ne opunem unui jucător raţional putem presupune că acesta din urmă
nu va utiliza o astfel de strategie, putem deci să o eliminăm din mulţimea
strategiilor sale posibile.
O modalitate de a determina echilibrele unui joc constă în a elimina în

primul rând toate strategiile dominate apoi de a căuta în jocul redus,
echilibrele.
Pentru a ilustra această metodă, să considerăm tabelul următor unde sunt
descrise câştigurile unui joc cu 2 jucători care au fiecare 2 strategii posibile (
primul număr din fiecare căsuţă este câştigul jucătorului 1, iar al doilea celui
de-al doilea jucător ).
În acest joc, strategia B a jucătorului 2 domină uşor strategia sa A căci
strategia sa B este echivalentă strategiei sale A când jucătorul 1 a optat
pentru strategia a, şi strict mai bună când jucătorul 1 a optat pentru strategia
b. Dacă jucătorul 1 gândeşte că jucătorul 2 este raţional, el se aşteaptă că
acesta din urmă nu recurge niciodată la strategia A.
Jucător 2
Strategia A Strategia B
Jucător 1 Strategia a 4,4 4,4
Strategia b 0,1 6,3
Jucătorul 1 va elimina deci strategia A din mulţimea strategiilor posibile ale

jucătorului 2.
În faţa singurei strategii B a jucătorului 2, jucătorul 1 are posibilitatea să
aleagă între strategia a asociată unui câştig de 4 şi strategia b asociată unui
câştig de 6. Dacă acesta din urmă este raţional, va opta pentru strategia b
căci după eliminarea strategiei dominate a jucătorului 2, strategia sa b
domină strategia sa a. Eliminând strategiile dominate ( chiar slab dominate )
am determinat echilibrul acestui joc şi câştigurile asociate ( 6 ;3 ).
7.10 Un experiment în rezolvarea jocurilor prin eliminarea

strategiilor dominate
Este evident că un jucător raţional nu va utiliza niciodată o strategie

dominată. Cu toate acestea, când participăm la un joc nu ştim întotdeauna
dacă adversarul nostru este suficient de raţional sau inteligent pentru a
sesiza că anumite strategii ale sale sunt dominate. Dacă apar astfel de
îndoieli, nu este sigur ca echilibrul rezultat din eliminarea strategiilor
dominate să fie acela pe care-l observăm în realitate.
Pentru a studia această problemă, Schotter, Weigelt şi Wilson au cerut la
40 de studenţi să participe la jocul descris în tabelul anterior. Experimentul a
arătat că studenţii aflaţi în rolul jucătorului 1 alegeau strategia a în 57% din
cazuri, pe când cei în rolul jucătorului 2 îşi alegeau strategia dominată în
20% din cazuri. Altfel spus, mulţi studenţi în rolul jucătorului 1 îşi bănuiau
clar adversarii de a nu fi suficient de inteligenţi sau raţionali pentru a
înţelege că ei nu ar trebui să utilizeze niciodată strategia A. Astfel, pentru a
evita riscul unui câştig nul (celula din stânga jos în tabel) ei preferau să
joace în siguranţă şi alegeau strategia a care le garanta un câstig de 4.
Cei 3 autori au descoperit în timpul experimentului că luând un alt grup de
studenţi şi punându-i în faţa aceluiaşi joc dar în forma sa extinsă, rezultatele
au fost cu totul diferite.
Astfel, ei au prezentat jocul sub forma unui arbore noilor studenţi ca în

exemplul de mai jos:
jucător 1
stategia b strategia a
jucător 2 stategia A 4
strategia B 4
6 0
3 1
Să notăm că, situaţia strategică din reprezentarea extensivă din graficul de

mai sus este exact aceeaşi cu cea prezentată sub forma normală sau
matriceală primilor studenţi.
Cu toate acestea, numai 9% din noii studenţi interpretând rolul jucătorului 1
au optat pentru siguranţă (strategia A). Ceilalti 91% s-au comportat ca şi
cum gândeau că jucătorul 2 înţelesese că una din strategiile lor era
dominată.
Aceasta diferenţă de apreciere între cele 2 grupe de jucători 1 în ceea ce
priveşte capacităţile jucătorilor 2 de a recunoaşte strategia dominată, este
fără îndoială datorată faptului ca strategia a a jucatorului 2 era mai vizibil
dominată de strategia b în forma extinsă a jocului.
Dacă această explicaţie este fondată, suntem în măsură să gândim că modul
de prezentare a unui joc (forma normală sau extinsă) modifică rezultatul.
Acest rezultat experimental este problematic pentru teoria jocurilor pentru

că, situaţia strategică era identică în cele 2 experimente. ( În cele 2 cazuri,
jucătorii dispuneau de o aceeaşi informaţie dar aveau fără îndoială mai
multe dificultăţi în a trata această informaţie în primul caz (forma normală)
decât în cel de-al doilea caz (forma extinsă)). Aceasta permite, poate, să se
explice diferenţele de comportament observate.
Când acelaţi joc, este prezentat unui grup în forma normală şi unui grup în
forma sa extinsă, rezultatele sunt diferite. Modul de reprezentare a unui joc
afectează aparent modul în care fiecare grup concepe situaţia strategică şi
conduce jucătorii să se comporte diferit.
7.11 Jocuri cu echilibre multiple
Nici un joc nu are echilibru care să poată fi determinat prin simpla eliminare
a strategiilor dominate. În plus, anumite jocuri sunt caracterizate prin
echilibre multiple, adică combinaţii multiple de alegeri strategice
satisfacând definiţia echilibrului Nash.
De exemplu, să considerăm jocul de coordonare de mai jos:
Jucător 2
Strategia A (să Strategia B ( să
apeleze) aştepte)
Strategia A (să 0,0 3,6
apeleze)
Strategia B (să 6,3 0,0
aştepte)
Ca urmare a unor serii de incidente tehnice, cea mai mare parte a centralelor
telefonice a unui mare oraş ca Bucureşti sunt nefuncţionale. Romtelecom
este obligată să raţioneze accesul la reţea prin limitarea duratei apelurilor
telefonice.
Regula ar fi următoarea: dacă un apel depăşeşte un număr de minute,
Romtelecom taie legătura. Pentru a continua conversaţia, unul din cei doi
interlocutori trebuie să-l resune pe celălalt. Suntem confruntaţi cu problema
următoare: care dintre cei doi interlocutori trebuie să sune? Cel care a sunat
primul sau cel care a fost apelat?
Dacă impulsul telefonic este scump, putem presupune că fiecare persoană
preferă sa fie apelat. Avem 2 strategii pentru fiecare jucător: să apeleze sau
să aştepte. Dacă cei doi aşteaptă, conversaţia telefonică nu poate avea loc,
iar câştigul fiecăruia este nul (celula din dreapta jos din tabelul anterior).
Dacă cei doi încearcă să se apeleze, amândoi sunt puşi în faţa unui ton de
“ocupat”. Rezultatul este de asemenea un câştig nul (celula stânga sus). Cu
toate acestea, dacă unul dintre jucători îl cheamă pe celălalt iar acesta
aşteaptă, atunci câştigul este de 3 pentru cel care cheamă şi de 6 pentru cel
chemat. Acesta din urmă primeşte un câştig mai mare pentru că el nu
suportă costul apelului. Care este echilibrul unui astfel de joc? Altfel spus,
cine trebuie să apeleze şi cine să aştepte? Pentru a răspunde la această
întrebare să privim mai atent la tabelul anterior.
Este foarte clar că interesul celor 2 jucători este să-şi coordoneze strategiile
astfel ca unul să aleagă strategia A şi celălalt B. Numai o astfel de
coordonare permite jucatorilor să obţină un profit pozitiv.
Cu toate acestea, ei pot să nu fie de acord asupra modalităţii de a ajunge la
un astfel de rezultat. Amândoi preferă strategia B care le aduce un câştig de
6 (câştigul de la strategia A fiind doar de 3 ). În acest joc avem doua
echilibre Nash. Primul corespunde strategiei în care primul jucător alege

strategia A iar cel de-al doilea strategia B. Al doilea corespunde situaţiei în
care jucătorul 1 alege B iar jucatorul 2 alege A (De fapt există un alt
echilibru posibil într-un astfel de joc. Acest echilibru apare în strategiile
mixte, adică când fiecare jucător îşi utilizează cele 2 strategii cu o anumită
probabilitate).
Pentru a verifica că aceste 2 perechi de strategii sunt echilibre Nash,
considerăm situaţia în care jucătorul 1 alege strategia A iar jucătorul 2
strategia B. În acest caz, dacă jucătorul 1 gândeşte că jucătorul 2 va alege
strategia B, jucătorul 1 are interesul să aleagă strategia A căci îi dă un câştig
de 3 (în loc de 0 dacă ar alege strategia B). De asemenea, daca jucătorul 2
gândeşte că jucătorul 1 va alege strategia A, jucătorul 2 are interesul să
aleagă strategia B căci câştigul asociat acestei alegeri în valoare de 6 este
superior câştigului de 0 asociat strategiei A. Acelaşi raţionament este valabil
când jucătorul 1 alege strategia B iar jucătorul 2 alege A.
Acest exemplu arată că un joc poate comporta mai multe echilibre. Iniţial,
teoria jocurilor nu se preocupă de a şti care din aceste echilibre va fi
selecţionat de către jucători. De câţiva ani, teoria jocurilor s-a deschis unor
concepte de rafinament care permit să se reducă numarul echilibrelor.
De exemplu, echilibrele subjocurilor perfecte sau echilibrele robuste cu
renegociere aparţin conceptelor de rafinament.
7.12 Ameninţări credibile
La începutul teoriei jocurilor, se credea că formele extinsă şi normală ale

unui joc erau instrumentele echivalente pentru analiză strategică şi dădeau
aceleaşi rezultate. Astăzi, această credinţă a fost mult revizuită, în special
datorită lucrărilor economistului şi teoreticianului jocurilor, germanul

Reibhard Selten (profesor la Universitatea din Bonn, Premiul Nobel pentru
economie, 1994), iar noi suntem în măsura să înţelegem pentru ce cele 2
moduri de reprezentare ale unui joc nu sunt echivalente. Pentru a ilustra
acest lucru să considerăm arborele de mai jos:
jucătorul 1 (copilul)
stânga
1
dreapta
1 stânga jucătorul 2 (părinţii )

1
2
dreapta
-1
-1 2
0
Acest arbore reprezintă forma extinsă a unui joc pe care îl numim “copilul
răsfăţat” .Scenariul este urmatorul: într-o sâmbătă după-amiaza un copil
capricios (jucătorul 1) doreşte să meargă la cinema, dar părinţii săi
(jucătorul 2) au decis ca toată familia să facă o vizita mătuşii Sofia.
Jucătorul 1 începe să joace primul . El poate accepta să meargă la mătuşa
Sofia (deplasare la stânga în arbore) sau să refuze (deplasare la dreapta).
Dacă copilul decide să meargă la mătuşa Sofia, jocul se termină şi fiecare
jucător are un câştig de 1. Dacă copilul refuză să meargă şi joacă la dreapta,
atunci părinţii sunt în faţa alegerii următoare: îl pot pedepsi privându-l de
ieşire (deplasare la stânga) sau să cedeze şi toată familia va merge la cinema
(deplasare la dreapta). Dacă părinţii joacă la stânga, părinţii, ca şi copilul,

vor primi un câstig de -1. Dacă joacă la dreapta, atunci copilul primeşte 2 si
părinţii 0.
Echilibrul (stânga – stânga) se bazează pe o ameninţare noncredibilă din
partea jucătorului 2 de a se deplasa la stânga dacă jucătorul 1 se deplasează
la dreapta.
Acest joc conţine o ameninţare a părinţilor de a pedepsi copilul dacă acesta
refuză să meargă la mătuşa sa.
Cu toate acestea, după cum vom vedea, această ameninţare nu este credibilă.
De fapt, jucătorul 1 este un copil răsfăţat, el va plânge toată după-amiaza
dacă părinţii săi îl pedepsesc.
Pentru a fi liniştit, părinţii nu vor pune în aplicare executarea ameninţării lor
chiar dacă copilul a refuzat să meargă la mătuşa sa. Ei vor prefera să revină
asupra deciziei lor şi să meargă la cinema.
Tabelul următor prezintă forma normală a acestui joc. Să observăm că
această formă dă fiecărui jucător alegerea între 2 strategii: deplasarea la
dreapta sau la stânga.
Jucătorul 2 ( părinţii )
Stânga Dreapta
(pedeapsa) (cedare)
Jucătorul 1 Stânga 1, 1 1, 1
(copilul ( vizita la mătuşă)
rasfăţat)
Dreapta -1, -1 2, 0
(refuz de a merge la
mătusă)
În forma normală, jocul are 2 echilibre: primul corespunde la o deplasare a 2

jucători la stânga (acceptul de a merge la mătuşă, pedeapsa), al doilea
corespunde unei deplasări a jucătorilor la dreapta (refuzul de a merge la
mătuşa, a nu pedepsi). Jucătorul 2 are o incitaţie slabă în a adera la primul
din aceste echilibre sau cel puţin de a nu devia de acesta. Căci dacă jucătorul
1 alege să meargă la mătuşa, jucătorul 2 este indiferent între cele 2 strategii
ale sale (pedeapsa sau nu).
În ciuda acestui lucru, fiecare din aceste echilibre de la forma normală,
satisfac definiţia unui echilibru Nash: nici unul din jucători nu va face mai
bine deviind de la strategia sa de echilibru.
In forma extensivă a jocului (arborele precedent) deşi cele 2 echilibre sunt
echilibre Nash, unul din cele două (a merge la mătuşa, a pedepsi) este mai
puţin satisfăcător decât celalalt. De fapt, el se bazează pe o ameninţare
noncredebilă, ameninţarea preferată de părinţi faţă de copil.
Pentru a înţelege mai bine noţiunea de ameninţare noncredibilă, să
reformulăm echilibrul (a merge la mătuşa, a pedepsi) în termenii următori :
părinţii îşi previn copilul. “Noi vrem să mergi la mătuşa căci această alegere
ne dă o satisfacţie de 1. Dacă accepţi, şi tu vei primi o satisfacţie de 1. Din
contra, dacă nu accepţi te vom pedepsi, caz în care tu vei primi o satisfacţie
de -1. Astfel, tu vei face mai bine să accepţi”. Echilibrul care se bazează pe
pe această ameninţare este un echilibru Nash pentru următoarea raţiune.
Cunoscând ameninţarea jucătorului 2 cel mai bun răspuns al jucătorului 1
este să accepte şi dacă jucătorul 1 alege să meargă la mătuşa, alegerea
jucătorului 2 nu are nici o importanţă pentru că el nu va avea nevoie să joace
sau să răspundă alegerii jucătorului 2.
Acest echilibru pune probleme căci, ameninţarea jucătorului 2 nu este
credibilă. Să presupunem de exemplu, că părinţii ţin discursul citat mai sus
dar că, în ciuda acestor ameninţări, copilul nu acceptă. Dacă copilul sfidează
această ameninţare, jucătorul 2 (părinţii) se regăseşte în nodul 2 al arborelui.
Confruntat cu alegerea următoare: fie îşi pune în aplicare ameninţarea şi are
un câştig de -1, fie cedează şi are un câştig de 0. Dacă părinţii sunt
rezonabili, ei preferă o satisfacţie nulă uneia de -1. Doar rancuna i-ar putea
conduce să-şi pună în aplicare ameninţarea. Este evident că (a merge la
mătuşă, a pedepsi) nu este un echilibru satisfăcător, căci el se sprijină pe o
ameninţare noncredibilă. Puşi în faţa faptului împlinit (refuzul copilului de a
merge la mătuşă) părinţii preferă să meargă la cinema mai curând decât să-l
pedepsească.
7.13 Echilibre ale subjocurilor perfecte

(cu ameninţări credibile)
Discursul jucătorului 2 citat mai sus specifică un plan de acţiune care se

aplică întregului joc. Jucătorul 2 precizează că el va face faţă la toate
alegerile posibile ale jucătorului 1. Dacă jucătorul 1 se deplasează la dreapta
în loc de a merge la stânga, jocul atinge nodul 2 şi putem să considerăm că
partea rămasă din arbore care pleacă din acest nod constituie un subjoc al
jocului întreg.
Echilibrele Nash se sprijină adesea pe ameninţări în decursul cărora jucătorii
se angajează să-şi pedepsească adversarii, dacă jocul atinge un subjoc
particular.
Cu toate acestea, dorim să restrângem mulţimea echilibrelor pe ameninţări
credibile.
O ameninţare este credibilă dacă această ameninţare este efectiv pusă în

aplicare când jocul atinge nodul în care este presupusă că are efect (în
cazul nostru, nodul 2).
În exemplul nostru, jucătorul 2 nu-şi pune în aplicare ameninţarea în
subjocul care pleacă din nodul 2. De fapt, el nu are nici o incitare să o faca
chiar dacă declarase contrariul la inceputul jocului.
Strategiile jucătorilor 1 şi 2 nu conduc la un echilibru în subjocul care
pleacă din nodul 2. Aceste consideraţii ne conduc la definirea unui echilibru
al unui subjoc perfect ca o combinaţie de strategii (o strategie per jucător)
astfel că acţiunile prescrise de aceste strategii constituie un echilibru Nash
în toate subjocurile.
Putem defini un subjoc ca nodul unui arbore şi toate ramurile plecând din
acest nod.
7.14 Inducţia inversă şi echilibrele subjocurilor perfecte
În jocurile cu informaţie perfectă există o metodă simplă pentru a determina

echilibrele subjocurilor perfecte. Este vorba de inducţia inversă, un proces
de rezolvare a jocurilor care constă în a Începe de la sfârşitul jocului apoi
de a urca până la punctul de plecare pentru a înţelege modul în care se va
comporta fiecare jucător.
Să considerăm arborele de mai jos.
A raţiona de-andoaselea, de la nodurile terminale la nodul iniţial, elimină
echilibrele care se bazează pe ameninţări noncredibile.
1 1
Jucător
Câştig (4,4) Stânga Dreapta
Jucător 2 2 1 Câştig (3,3)
3 Jucător 2
Dreapta
Stânga 2 Stânga Dreapta
Câştig (7,1) Câştig (3,3)

Jucător 1 5 Jucător 1
⎛4⎞ ⎛4⎞
⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ 4
Stânga Dreapta
⎝4⎠ ⎝4⎠ Stânga Dreapta
⎛5⎞ ⎛7⎞ ⎛ 2⎞ ⎛3⎞

⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟
⎝0⎠ ⎝1 ⎠ ⎝1 ⎠ ⎝3⎠
În acest joc, jucătorul 1 se deplasează primul fie la stânga (S) fie la dreapta
(d). Dacă se deplasează la stânga jucătorul 2 are de ales între dreapta şi
stânga dar orice ar face jocul se termină cu un câştig de 4 pentru ambii
jucători.
Dacă jucătorul 1 se deplasează la dreapta, jucătorul 2 alege între stânga şi
dreapta. Dar oricare din aceste alegeri conduce jucătorul 1 la un mod de
decizie. El trebuie să decidă între stânga şi dreapta pentru ca jocul să se
termine. Câştigurile depind de drumul parcurs în arbore, adică de alegerile
succesive ale jucătorilor.
Pentru a determina echilibrele subjocurilor perfecte, parcurgem arborele de
la coadă plecând de la ultimele noduri de decizie. De exemplu, dacă jocul
atinge nodul 5, care va fi decizia jucătorului 1? Dacă alege dreapta, atunci el
şi jucătorul 2 vor primi fiecare un câştig de 3.
Dacă alege stânga, el va primi numai 2 iar adversarul 1. Dacă jucătorul 1
este raţional, va alege în final dreapta la nodul 5 şi va avea un câştig de 3.
La fel, dacă jocul atinge nodul 4, care este cea mai buna alegere a
jucătorului 1. Este evident că dacă jucătorul 1 este raţional el va alege
dreapta şi va câştiga 7 iar adversarul 1.
Să revenim la nodul care precede nodurile 4 şi 5 (adica la nodul 3).
Jucătorul 2 trebuie să aleagă între stânga şi dreapta. În momentul în care
examinează ce să aleagă (dreapta sau stânga), el ştie că dacă alege dreapta la
jucătorul 1 va alege dreapta la nodul 5 şi câştigul său va fi de 3. Dar dacă
alege stânga, jucătorul 1 va alege dreapta la nodul 4 şi câştigul sau va fi
numai de 1. Cum jucătorul 2 este raţional, el va alege dreapta.
Valoarea nodului 3 pentru jucătorul 2 este deci de 3. Putem să înlocuim
acest nod cu perechea de câştiguri (3,3) pentru că ştim că dacă jocul atinge
acest nod, el va continua până la nodul terminal (3,3). În final să revenim la
nodul de pornire 1. În momentul în care jucătorul 1 porneşte jocul, el ştie că
dacă alege dreapta jocul se va deplasa spre nodul 3, apoi spre 5 cu un câştig
final de 3. Dacă jucătorul 1 alege stânga, jocul se va deplasa spre nodul 2 şi
va câştiga oricare ar fi alegerea jucătorului 2 un câştig de 4. Deci dacă
jucătorul 1 este raţional, el va alege la nodul 1 stânga.
Strategia constând pentru jucătorul 1 să joace stânga la nodul 1, pentru
jucătorul 2 să joace dreapta la nodul 3 (dacă era atins vreodata, ceea ce nu
este cazul aici deoarece jucătorul 1 a ales stânga la nodul 1), şi în sfârşit
pentru jucătorul 1 să joace dreapta la nodul 5 (dacă acest punct era atins)
este un echilibru de subjoc perfect obţinut printr-un proces de inducţie de la
sfârşit spre început.
Acest proces elimină echilibrele cu ameninţări necredibile, căci el determină
ceea ce vor face jucătorii în fiecare subjoc plecând de la nodurile terminale
până la nodul iniţial.
Raţionalitate şi echitate
Se ştie că economiştii pun o serie de ipoteze relative la comportamentul

uman: de exemplu că indivizii sunt raţionali şi interesaţi (egoişti).
Teoreticienii teoriei jocurilor fac şi ei aceste ipoteze. Astfel, când se
consideră un joc, ei îşi fondează analiza strategică numai pe câştigurile
adversarilor doar în măsura în care aceste caştiguri orientează alegerile
acestora din urmă.
7.15 Un rezultat experimental
Această viziune tradiţională a comportamentului uman a fost contestată ca

urmare a unor rezultate experimentale.
Numeroşi economişti au arătat că indivizii plasaţi în situaţii ale jocului erau
foarte grijulii în ceea ce priveşte echitatea sfârşitului jocului. Evident că
rezultatele unor astfel de studii se opun ipotezelor tradiţionale de egoism şi
raţionalitate. Unul din cele mai celebre experimente a fost realizat îin
Germania de Guth, Schimittberger şi Scharze.
Ei au rugat nişte indivizi să participe la un joc simplu de „ultimatum”. Într-
un astfel de joc cu două persoane, jucătorul 1 împarte o sumă de bani C între
el şi jucătorul 2. El anunţă partea care doreşte să-i ramână. Fie a1 această
parte şi C- a1 suma care o dă jucătorului 2.
Jucătorul 2 poate să accepte sau să refuze ceea ce-i propune jucătorul 1.
Dacă el acceptă, atunci primeşte C- a1 şi jucătorul 1, a1 . Dacă jucătorul 2
refuză acest partaj, atunci ei nu vor mai primi nimic.
Dacă utilizăm inducţia inversă pentru a analiza acest joc, este clar că un
jucător raţional va oferi jucătorului 2 o parte din suma C cât mai mică.
În ultima etapă, jucătorul 2 are de ales între un câştig pozitiv (chiar foarte
mic) sau nimic. Dacă este raţional ar accepta orice sumă pe care i-o propune
jucătorul 1 pentru că este mai bine decât nimic.
După ipotezele tradiţionale în teoria jocurilor asupra comportamentului
uman, am putea prevedea că banii vor fi împărţiţi în aşa fel încât jucătorul 1
va primi aproape tot iar jucătorul 2 se va mulţumi cu o sumă derizorie.
Curios, dar rezultatul observat îin experimentele făcute de cei trei germani
este cu totul altfel.
Indivizii în rolul jucătorului 1 îşi opreau numai 50-60% din suma totală, în
ciuda avantajului strategic pe care îl deţineau. Ei nu au profitat de acest
avantaj strategic contrar a ceea ce prevedea inducţia inversă. În plus,
indivizii în rolul jucătorului 2 refuzau „firimiturile” oferite de jucătorul 1.
Altfel spus, preferau să nu primească nimic decât să accepte un partaj injust,
inechitabil. Deci nu acţionau ca nişte indivizi raţionali.
7.16 Jocuri repetate
Până în prezent am considerat că un joc se juca o singură dată; cu informaţie

completă sau incompletă. Cu toate acestea, ştim că agenţii economici, in
realitate, joacă acelaşi joc de mai multe ori.
De exemplu, Renault şi Peugeot, în fiecare an îşi aleg preţul şi modelele
maşinilor lor, apoi se supun concurenţei pe piaţă.
Deşi condiţiile acestui joc evoluează în decursul timpului, putem concepe ca
o repetare a aceluiaşi joc. Jocurile repetate constituie o categorie de joc
esentială în realitate.
Ce intelegem mai precis prin jocuri repetate? Le putem defini ca jocuri în
care o mulţime definită de jucători se întâlnesc într-un mod repetat.
Câteva exemple de jocuri repetate a căror condiţii nu se schimbă în decursul

timpului şi a căror câştiguri din fiecare perioadă nu sunt afectate de
câştigurile din perioadele precedente.
7.16.1 Dilema prizonierului
Să considerăm exemplul unui joc repetat cu doi jucători, celebra dilemă a

prizonierului.
Iată matricea cuprinzând câştigurile asociate jocului.
Jucător 2
A nega A mărturisi
Jucător 1 A nega 6,6 2,12
A mărturisi 12,2 4,4
Acest joc are o structură de câştiguri identică cu jocul în preţ (preţ ridicat,
preţ scăzut descris în paragrafele precedente).
Scenariul este următorul:
Două persoane au comis o crimă şi sunt arestate de poliţie. Aceşti prizonieri
ştiu că sunt vinovaţi dar ştiu deasemenea că poliţiei îi lipsesc probele pentru
a-i condamna, dacă nu vorbeşte cel puţin unul.
Dacă amândoi tac şi nu mărturisesc crima, poliţia nu poate să-i reţină în
închisoare decât câteva zile. Presupunem că aceasta corespunde cu un câştig
(sau o utilitate) de 6 pentru fiecare jucător (celula din stânga sus).
Dacă jucătorul 1 mărturiseşte şi jucătorul 2 neagă, atunci jucătorul 1 este
eliberat pentru mărturia sa, iar jucătorul 2 este condamnat pentru crimă şi va
petrece o lungă perioadă în închisoare. Această situaţie reprezintă un câştig
de 12 pentru jucătorul 1 şi de 2 pentru jucătorul 2 (celula din stânga jos).

Daca jucătorul 2 mărturiseşte şi jucătorul 1 neagă, câştigurile sunt inverse
(2,12). Dacă amândoi îşi mărturisesc crima, sunt condamnaţi dar beneficiază
de circumstanţe atenuante, obţinând fiecare o utilitate de 4.
Când cei doi prizonieri ajung la comisariat, ei sunt separaţi. Deci nu au
posibilitatea să se pună de acord asupra unei strategii comune. E clar că
suntem în cadrul unui joc noncooperativ. Care ar fi echilibrul Nash?
O examinare atentă a matricii cîştigurilor ne permite să predictăm ceea ce ar
face fiecare jucător.
Dacă jucătorul 2 gândeşte că şi complicele său va nega, el va putea de
asemenea să refuze să mărturisească crima. Fiecare va primi atunci o
utilitate de 6. Totuşi, cea mai buna alegere este aceea de a mărturisi căci va
fi eliberat şi va avea un câştig de 12.
Dacă jucătorul 1 gândeşte că jucătorul 2 va mărturisi crima, atunci a
mărturisi este de asemenea cel mai bun răspuns. Îşi va vedea pedeapsa
micşorată în raport cu o strategie de nemărturisire (o utilitate de 4 în loc
de 2).
În rezumat, a mărturisi este cea mai bună alegere pe care o poate face,
oricare ar fi alegerea complicelui său. A mărturisi este o strategie dominantă
pentru jucătorul 1. Cum jocul este simetric, este de asemenea o strategie
dominantă şi pentru jucătorul 2.
Deci, dacă cei doi jucători îşi urmează strategiile dominante, vor mărturisi
amândoi. Acestă situaţie este neliniştitoare căci prizonierii puteau spera un
câştig mai bun negând amândoi. Altfel spus, strategiile dominante conduc la
un sfârşit care nu este optimal-Pareto pentru jucători. Ar fi mult mai bine de
a nu mărturisi, dar niciunul nu are încredere în celălalt.
Fiecare îl bănuieşte pe celălalt de trădare sau de a-l denunţa.
7.16.2 Exerciţii
1) Considerăm jocul următor. Trei jucători A,B,C sunt aşezaţi în jurul

unei mese pe care se găsesc patru pietre. După regula jocului, A joacă
primul şi ia una sau două pietre, pe urma B decide să ia una sau două pietre,
apoi C decide să ia una sau două pietre (dacă mai ramân). În sfârşit, A
strânge ultima piatră (dacă a mai rămas una). Cel care a luat ultima piatră a
câştigat.
a) Reprezentaţi jocul sub formă extinsă
b) Care sunt subechilibrele subjocurilor-perfecte ?
c) Este posibil ca A să câştige? Justificaţi-vă răspunsul.
a) Arborele jocului, adica forma extinsă este:

A
1
B 2
1 2
C
C B
1 2
1 2
A câştigă
C câştigă C câştigă C câştigă B câştigă
b) Putem recurge la inducţia inversă pentru a determina echilibrele

subjocurilor perfecte.
Cum C joacă după B şi A, jocul se va termina înainte ca C să fi putut juca

sau se va afla în faţa unei pietre sau două pietre.
Dacă C are şansa de a putea juca, el va lua toate pietrele rămase.
Dacă A ia o piatră, B nu poate câştiga indiferent de numărul de pietre pe

care decide să le ia: lui B îi este indiferent dacă ia o piatră sau două.
În acest caz, C va lua una sau două pietre rămase pe tablă. Dacă A ia iniţial
două pietre, B poate câştiga luându-le pe cele două rămase. Există deci trei
echilibre de subjocuri perfecte:
i) A ia o piatră, B ia o piatră, C le ia pe cele două rămase şi câştigă.
ii) A ia o piatră, B ia două pietre, C ia piatra rămasă şi câştigă.
iii) A ia două pietre, B ia două pietre rămase şi câştigă.
c) Singura situaţie în care A ar putea câştiga este când A, B, C iau fiecare

câte o piatră, iar A poate lua ultima piatră rămasă. Dar C nu are nici un
interes să ia o singură piatră atunci când rămân două şi când are posibilitatea
să câştige. Cum comportamentele de echilibru presupun că fiecare jucător
îşi urmăreşte raţional propriul interes, A nu va avea nici o şansă să câştige;
altfel spus, C nu are nici un interes să îl lase pe A să câştige.
2) Considerăm jocul următor în care jucătorul 1 alege o linie (g sau d),

jucătorul 2 o coloană (G sau D) şi jucătorul 3 o matrice (A sau B).
Matricea A
G D
g 8,1,1 0,0,5
d 9,4,9 0,0,0
Matricea B
G D
g 6,3,2 4,8,6
d 2,3,9 4,2,0
Cifrele din căsuţe sunt câştigurile jucătorilor 1, 2 şi 3.
Determinaţi echilibrul Nash în acest caz.
Rezolvare: Acest joc admite două echilibre Nash (g,D,A) şi (d,G,B).
3) Considerăm jocul următor în care jucătorul 1 alege o linie (H,B sau M) şi

jucătorul 2 o coloană (G,C sau D). Numerele din căsuţe sunt câştigurile
jucătorilor (1,2 şi 3).
a) Jucătorul 1 are o strategie dominantă?
b) Jucătorul 2 are o strategie dominantă?
c) Care este echilibrul Nash al acestui joc?
Este posibil pentru unul sau altul din jucători să utilizeze o altă strategie
decât strategia dominantă? Explicaţi.
a) Jucătorul 1 are o strategie dominantă H.
Ea dă câştiguri mai mici decât strategiile B sau M indiferent care va fi

strategia aleasă de 2. În schimb, nu există o strategie dominantă căci B este
mai bună decât M faţă de D şi C, dar inferioară lui B faţă de G.
b) Jucătorul 2 are o strategie dominantă C. Ea domină strict G şi D oricare ar

fi strategia adoptată de jucătorul 1.
c) Echilibrul Nash este (B,C). De fapt, jucătorul 2 joacă în mod necesar

strategia sa dominantă C. Jucătorul 1 nu joacă niciodată strategia sa
dominată H; în plus, faţă de C, el alege strict B lui M.
Pe scurt, un jucător raţional nu joacă niciodată o strategie dominată şi dacă

el are o strategie dominantă el o joaca din necesitate (căci toate celalalte
strategii ale sale sunt dominate).

Teoria Jocurilor

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Teoria Jocurilor

Încărcat de

Drepturi de autor:

Formate disponibile

7.

Teoria jocurilor este un instrument util de analiză a comportamentului

7.1 Definiţia unui joc strategic

Ce înţelegem printr-un joc strategic ?

jucătorilor pe baza acţiunilor întreprinse. Conform acestei terminologii, un

7.2 Arborele jocului ca modalitate de descriere

Presupunem că nu există decât două firme în lume constructoare de

Oricum, oricare ar fi sistemul ales, important este să fie acelaşi, căci

UNIX DOS UNIX

Arborele unui joc cu informaţie perfectă

Jucătorul 2 ( Toshiba ) ştie dacă jucătorul 1 ( IBM ) se deplasează la dreapta

Arborele din grafic descrie toate regulile jocului relativ la alegerile

7.3 Jocuri cu informaţie perfectă şi imperfectă

Nu schimbăm situaţia strategică înlocuind Toshiba cu IBM la nodul 1 şi

7.4 Descrierea jocului sub formă normală

În cazul în care un joc implică mai mulţi jucători şi alegeri multiple,

Prin strategie înţelegem un plan de acţiune complet, pentru fiecare jucător

Pentru a înţelege noţiunea de strategie, vom schimba metoda de analiză

Joc sub formă normală între IBM şi Toshiba

Această matrice reprezintă situaţia strategică a celor două companii şi ne

7.5 Exemplu de joc cu informaţie incompletă şi cu sumă nulă

Pentru a ne familiariza cu formele normală şi extinsă, să considerăm jocul

7.6 Echilibrele jocului

Analiza unui joc permite să se prevadă echilibrul care va apărea dacă

Ştim că un echilibru este constituit dintr-o combinaţie de alegeri strategice(

comportamentele între ei dat fiind comportamentul restului de jucători;

7.7 Echilibrul Nash

Echilibrul Nash provine de la numele matematicianului şi economistului

combinaţie de alegeri strategice ale celor n jucători, unde si* - alegerea

pentru ∀sˆi ∈ S i , ∀i = 1, n , unde si este mulţimea strategiilor individului i.

când el alege strategia si* iar ceilalţi aleg s *j , j ≠ i.

Termenul din dreapta inegalităţii π i ( s1* ,….., ŝ i , ….., s n* ) indică câştigul

jucătorului i când el alege ŝi iar ceilalţi n-1 jucători aleg s *j , j ≠ i.

Ceea ce ne spun condiţiile de echilibru este că orice altă abatere de la

7.8 Echilibrul în cazul strategiei dominante

Conceptul de echilibru Nash este chiar definiţia unei situaţii de echilibru.

Presupunem că cele 2 firme construiesc maşini aproape identice şi deci ceea

Să examinăm decizia lui Renault ( Peugeot fiind într-o situaţie simetrică,

7.9 Rezolvarea jocurilor prin eliminarea

Un jucător raţional nu trebuie să utilizeze niciodata o strategie dominată,

O modalitate de a determina echilibrele unui joc constă în a elimina în

Jucătorul 1 va elimina deci strategia A din mulţimea strategiilor posibile ale

7.10 Un experiment în rezolvarea jocurilor prin eliminarea

Este evident că un jucător raţional nu va utiliza niciodată o strategie

Astfel, ei au prezentat jocul sub forma unui arbore noilor studenţi ca în

Să notăm că, situaţia strategică din reprezentarea extensivă din graficul de

Acest rezultat experimental este problematic pentru teoria jocurilor pentru

7.11 Jocuri cu echilibre multiple

echilibre Nash. Primul corespunde strategiei în care primul jucător alege

7.12 Ameninţări credibile

La începutul teoriei jocurilor, se credea că formele extinsă şi normală ale

datorită lucrărilor economistului şi teoreticianului jocurilor, germanul

1 stânga jucătorul 2 (părinţii )

(deplasare la dreapta). Dacă părinţii joacă la stânga, părinţii, ca şi copilul,

În forma normală, jocul are 2 echilibre: primul corespunde la o deplasare a 2

7.13 Echilibre ale subjocurilor perfecte

Discursul jucătorului 2 citat mai sus specifică un plan de acţiune care se

O ameninţare este credibilă dacă această ameninţare este efectiv pusă în

7.14 Inducţia inversă şi echilibrele subjocurilor perfecte

În jocurile cu informaţie perfectă există o metodă simplă pentru a determina

Câştig (7,1) Câştig (3,3)

⎛5⎞ ⎛7⎞ ⎛ 2⎞ ⎛3⎞

Se ştie că economiştii pun o serie de ipoteze relative la comportamentul