Documente Academic
Documente Profesional
Documente Cultură
T
eoria jocurilor
şi metode de analiză
a comportamentului strategic
1
« The Theory of Games and Economic Behaviour »( Princeton, New Jersey : Priceton
University Press, 1944)
Teoria jocurilor şi metode de analiză a comportamentului strategic
Regulile jocului, cât şi eventualele câştiguri, pot să fie reprezentate prin ceea
ce teoreticienii jocurilor numesc un arbore. Acesta oferă o descriere
detaliată a regulilor jocului şi este de asemenea numit forma extensivă a
jocului.
Pentru a înţelege ce este un arbore sau o formă extensivă, să considerăm
exemplul următor.
Analiza microeconomică a agenţilor economici în condiţii de piaţă
IBM
UNIX
DOS 1
Toshiba
Toshiba 2 3
IBM ⎛ 200 ⎞
⎛ 600 ⎞ ⎛100 ⎞ ⎛100 ⎞ ⎜⎜ ⎟⎟
Toshiba ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝ 600 ⎠
⎝ 200 ⎠ ⎝100 ⎠ ⎝100 ⎠
Toshiba alege sistemul de operare, ea ştie dacă IBM a ales sistemul DOS
sau sistemul UNIX la etapa precedentă. Un astfel de joc se numeşte joc cu
informaţie perfectă, pentru că un jucător, în momentul când joacă, cunoaşte
toate alegerile anterioare ale celorlalţi jucători.
Cu toate acestea, în anumite jocuri, trebuie să presupunem că atunci când un
jucător atinge un punct de decizie, el nu cunoaşte toate alegerile celorlalţi
jucători care l-au precedat. Astfel de jocuri se numesc jocuri cu informaţie
incompletă.
Pentru a reprezenta informaţia unui jucător în acest caz, trebuie să
introducem noţiunea de mulţime de informaţie a unui arbore.
Aceste mulţimi indică ceea ce un jucător cunoaşte în momentul deplasării.
Graficul următor prezintă acelaşi arbore al jocului ca şi precedentul,
excepţie este faptul că acest joc are o structură de informaţie diferită, pentru
că Toshiba nu ştie în momentul alegerii sale ce sistem a selecţionat IBM.
Să presupunem că companiile îşi anunţă deciziile în acelaşi timp. Astfel,
Toshiba(IBM) îşi alege sistemul fără a cunoaşte alegerea IBM(Toshiba). În
graficul următor, ovalul care înconjoară cele două noduri de decizie ale lui
Toshiba corespunde mulţimii de informaţie a lui Toshiba. Informaţia sa este
imperfectă pentru că ea nu ştie dacă este în nodul 2 sau 3. Altfel spus, ea nu
ştie dacă IBM a ales DOS sau UNIX.
În graficul anterior, fiecare mulţime de informaţie conţine numai un nod.
Informaţia este astfel perfectă, căci fiecare jucător ştie exact unde se
situează în arbore şi ştie exact ceea ce au făcut mai înainte ceilalţi jucători.
Jucătorul 2 ( Toshiba ) nu ştie dacă IBM a ales DOS sau UNIX (dacă s-a
deplasat la dreapta sau la stânga). Astfel, jucătorul 2 nu ştie dacă se găseşte
în nodul 2 sau 3.
Analiza microeconomică a agenţilor economici în condiţii de piaţă
IBM
UNIX
DOS 1
Toshiba
Toshiba 2 3
UNIX
DOS UNIX DOS
IBM ⎛ 200 ⎞
⎛ 600 ⎞ ⎛100 ⎞ ⎛100 ⎞ ⎜⎜ ⎟⎟
Toshiba ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝ 600 ⎠
⎝ 200 ⎠ ⎝100 ⎠ ⎝100 ⎠
Toshiba
(DOS/DOS, (DOS/DOS, (UNIX/DOS, (UNIX/DOS,
DOS/UNIX) UNIX/UNIX) UNIX/UNIX) DOS/UNIX)
IBM DOS 600, 200 600, 200 100, 100 100, 100
UNIX 100, 100 200, 600 200, 600 100, 100
Pajură
Cap
Copil 2 Copil 2
Cap Cap
Pajură Pajură
1 2 3 4
Analiza microeconomică a agenţilor economici în condiţii de piaţă
Când cei doi au făcut aceeaşi alegere, fie cap, fie pajură, copilul 2 primeşte
un câştig 1 iar copilul 1 un câştig de -1 ( nod terminal 1 sau 4 ).
Când piesele nu coincid ( nodurile terminale 2 sau 3 ) câştigurile sunt
inverse. Să remarcăm că acest joc este un joc cu sumă nulă, suma
câştigurilor copiilor la fiecare nod terminal fiind egală cu zero.
Forma normală a acestui joc este foarte simplă deoarece cei doi copii au
doar două strategii posibile ( a alege cap sau pajură ) câştigurile pot fi
descrise ca în matricea următoare:
Cap Pajură
Copil 1 Cap -1, +1 +1, -1
Pajură +1, -1 -1, +1
strategică a jucătorului i, i= 1, n .
În plus fie π i ( s1* ,….., ŝ i , ….., s n* ) câştigul jucătorului i atunci când a fost
aleasă strategia s*, i = 1,2,…n Putem da acum o definiţie formală a
echilibrului Nash:
Definiţie: O combinaţie de alegeri strategice s* = ( s1* , s 2* , ….., s n* ) este un
echilibru Nash dacă π i ( s1* ,….., s i* , ….., s n* ) ≥ π i ( s1* ,….., ŝi , ….., s n* )
2
premiul Nobel pentru economie în 1994
Analiza microeconomică a agenţilor economici în condiţii de piaţă
Jucător 2
Strategia A Strategia B
Jucător 1 Strategia a 4,4 4,4
Strategia b 0,1 6,3
jucător 1
stategia b strategia a
jucător 2 stategia A 4
strategia B 4
6 0
3 1
Nici un joc nu are echilibru care să poată fi determinat prin simpla eliminare
a strategiilor dominate. În plus, anumite jocuri sunt caracterizate prin
echilibre multiple, adică combinaţii multiple de alegeri strategice
satisfacând definiţia echilibrului Nash.
De exemplu, să considerăm jocul de coordonare de mai jos:
Jucător 2
Strategia A (să Strategia B ( să
apeleze) aştepte)
Strategia A (să 0,0 3,6
apeleze)
Strategia B (să 6,3 0,0
aştepte)
Teoria jocurilor şi metode de analiză a comportamentului strategic
Ca urmare a unor serii de incidente tehnice, cea mai mare parte a centralelor
telefonice a unui mare oraş ca Bucureşti sunt nefuncţionale. Romtelecom
este obligată să raţioneze accesul la reţea prin limitarea duratei apelurilor
telefonice.
Regula ar fi următoarea: dacă un apel depăşeşte un număr de minute,
Romtelecom taie legătura. Pentru a continua conversaţia, unul din cei doi
interlocutori trebuie să-l resune pe celălalt. Suntem confruntaţi cu problema
următoare: care dintre cei doi interlocutori trebuie să sune? Cel care a sunat
primul sau cel care a fost apelat?
Dacă impulsul telefonic este scump, putem presupune că fiecare persoană
preferă sa fie apelat. Avem 2 strategii pentru fiecare jucător: să apeleze sau
să aştepte. Dacă cei doi aşteaptă, conversaţia telefonică nu poate avea loc,
iar câştigul fiecăruia este nul (celula din dreapta jos din tabelul anterior).
Dacă cei doi încearcă să se apeleze, amândoi sunt puşi în faţa unui ton de
“ocupat”. Rezultatul este de asemenea un câştig nul (celula stânga sus). Cu
toate acestea, dacă unul dintre jucători îl cheamă pe celălalt iar acesta
aşteaptă, atunci câştigul este de 3 pentru cel care cheamă şi de 6 pentru cel
chemat. Acesta din urmă primeşte un câştig mai mare pentru că el nu
suportă costul apelului. Care este echilibrul unui astfel de joc? Altfel spus,
cine trebuie să apeleze şi cine să aştepte? Pentru a răspunde la această
întrebare să privim mai atent la tabelul anterior.
Este foarte clar că interesul celor 2 jucători este să-şi coordoneze strategiile
astfel ca unul să aleagă strategia A şi celălalt B. Numai o astfel de
coordonare permite jucatorilor să obţină un profit pozitiv.
Cu toate acestea, ei pot să nu fie de acord asupra modalităţii de a ajunge la
un astfel de rezultat. Amândoi preferă strategia B care le aduce un câştig de
6 (câştigul de la strategia A fiind doar de 3 ). În acest joc avem doua
Analiza microeconomică a agenţilor economici în condiţii de piaţă
jucătorul 1 (copilul)
stânga
1
dreapta
-1
-1 2
0
Acest arbore reprezintă forma extinsă a unui joc pe care îl numim “copilul
răsfăţat” .Scenariul este urmatorul: într-o sâmbătă după-amiaza un copil
capricios (jucătorul 1) doreşte să meargă la cinema, dar părinţii săi
(jucătorul 2) au decis ca toată familia să facă o vizita mătuşii Sofia.
Jucătorul 1 începe să joace primul . El poate accepta să meargă la mătuşa
Sofia (deplasare la stânga în arbore) sau să refuze (deplasare la dreapta).
Dacă copilul decide să meargă la mătuşa Sofia, jocul se termină şi fiecare
jucător are un câştig de 1. Dacă copilul refuză să meargă şi joacă la dreapta,
atunci părinţii sunt în faţa alegerii următoare: îl pot pedepsi privându-l de
ieşire (deplasare la stânga) sau să cedeze şi toată familia va merge la cinema
Analiza microeconomică a agenţilor economici în condiţii de piaţă
dar că, în ciuda acestor ameninţări, copilul nu acceptă. Dacă copilul sfidează
această ameninţare, jucătorul 2 (părinţii) se regăseşte în nodul 2 al arborelui.
Confruntat cu alegerea următoare: fie îşi pune în aplicare ameninţarea şi are
un câştig de -1, fie cedează şi are un câştig de 0. Dacă părinţii sunt
rezonabili, ei preferă o satisfacţie nulă uneia de -1. Doar rancuna i-ar putea
conduce să-şi pună în aplicare ameninţarea. Este evident că (a merge la
mătuşă, a pedepsi) nu este un echilibru satisfăcător, căci el se sprijină pe o
ameninţare noncredibilă. Puşi în faţa faptului împlinit (refuzul copilului de a
merge la mătuşă) părinţii preferă să meargă la cinema mai curând decât să-l
pedepsească.
1 1
Jucător
Câştig (4,4) Stânga Dreapta
Jucător 2 2 1 Câştig (3,3)
3 Jucător 2
Dreapta
Stânga 2 Stânga Dreapta
În acest joc, jucătorul 1 se deplasează primul fie la stânga (S) fie la dreapta
(d). Dacă se deplasează la stânga jucătorul 2 are de ales între dreapta şi
stânga dar orice ar face jocul se termină cu un câştig de 4 pentru ambii
jucători.
Dacă jucătorul 1 se deplasează la dreapta, jucătorul 2 alege între stânga şi
dreapta. Dar oricare din aceste alegeri conduce jucătorul 1 la un mod de
decizie. El trebuie să decidă între stânga şi dreapta pentru ca jocul să se
termine. Câştigurile depind de drumul parcurs în arbore, adică de alegerile
succesive ale jucătorilor.
Pentru a determina echilibrele subjocurilor perfecte, parcurgem arborele de
la coadă plecând de la ultimele noduri de decizie. De exemplu, dacă jocul
atinge nodul 5, care va fi decizia jucătorului 1? Dacă alege dreapta, atunci el
şi jucătorul 2 vor primi fiecare un câştig de 3.
Dacă alege stânga, el va primi numai 2 iar adversarul 1. Dacă jucătorul 1
este raţional, va alege în final dreapta la nodul 5 şi va avea un câştig de 3.
Teoria jocurilor şi metode de analiză a comportamentului strategic
La fel, dacă jocul atinge nodul 4, care este cea mai buna alegere a
jucătorului 1. Este evident că dacă jucătorul 1 este raţional el va alege
dreapta şi va câştiga 7 iar adversarul 1.
Să revenim la nodul care precede nodurile 4 şi 5 (adica la nodul 3).
Jucătorul 2 trebuie să aleagă între stânga şi dreapta. În momentul în care
examinează ce să aleagă (dreapta sau stânga), el ştie că dacă alege dreapta la
jucătorul 1 va alege dreapta la nodul 5 şi câştigul său va fi de 3. Dar dacă
alege stânga, jucătorul 1 va alege dreapta la nodul 4 şi câştigul sau va fi
numai de 1. Cum jucătorul 2 este raţional, el va alege dreapta.
Valoarea nodului 3 pentru jucătorul 2 este deci de 3. Putem să înlocuim
acest nod cu perechea de câştiguri (3,3) pentru că ştim că dacă jocul atinge
acest nod, el va continua până la nodul terminal (3,3). În final să revenim la
nodul de pornire 1. În momentul în care jucătorul 1 porneşte jocul, el ştie că
dacă alege dreapta jocul se va deplasa spre nodul 3, apoi spre 5 cu un câştig
final de 3. Dacă jucătorul 1 alege stânga, jocul se va deplasa spre nodul 2 şi
va câştiga oricare ar fi alegerea jucătorului 2 un câştig de 4. Deci dacă
jucătorul 1 este raţional, el va alege la nodul 1 stânga.
Strategia constând pentru jucătorul 1 să joace stânga la nodul 1, pentru
jucătorul 2 să joace dreapta la nodul 3 (dacă era atins vreodata, ceea ce nu
este cazul aici deoarece jucătorul 1 a ales stânga la nodul 1), şi în sfârşit
pentru jucătorul 1 să joace dreapta la nodul 5 (dacă acest punct era atins)
este un echilibru de subjoc perfect obţinut printr-un proces de inducţie de la
sfârşit spre început.
Acest proces elimină echilibrele cu ameninţări necredibile, căci el determină
ceea ce vor face jucătorii în fiecare subjoc plecând de la nodurile terminale
până la nodul iniţial.
Analiza microeconomică a agenţilor economici în condiţii de piaţă
Raţionalitate şi echitate
În ultima etapă, jucătorul 2 are de ales între un câştig pozitiv (chiar foarte
mic) sau nimic. Dacă este raţional ar accepta orice sumă pe care i-o propune
jucătorul 1 pentru că este mai bine decât nimic.
După ipotezele tradiţionale în teoria jocurilor asupra comportamentului
uman, am putea prevedea că banii vor fi împărţiţi în aşa fel încât jucătorul 1
va primi aproape tot iar jucătorul 2 se va mulţumi cu o sumă derizorie.
Curios, dar rezultatul observat îin experimentele făcute de cei trei germani
este cu totul altfel.
Indivizii în rolul jucătorului 1 îşi opreau numai 50-60% din suma totală, în
ciuda avantajului strategic pe care îl deţineau. Ei nu au profitat de acest
avantaj strategic contrar a ceea ce prevedea inducţia inversă. În plus,
indivizii în rolul jucătorului 2 refuzau „firimiturile” oferite de jucătorul 1.
Altfel spus, preferau să nu primească nimic decât să accepte un partaj injust,
inechitabil. Deci nu acţionau ca nişte indivizi raţionali.
Jucător 2
A nega A mărturisi
Jucător 1 A nega 6,6 2,12
A mărturisi 12,2 4,4
Acest joc are o structură de câştiguri identică cu jocul în preţ (preţ ridicat,
preţ scăzut descris în paragrafele precedente).
Scenariul este următorul:
Două persoane au comis o crimă şi sunt arestate de poliţie. Aceşti prizonieri
ştiu că sunt vinovaţi dar ştiu deasemenea că poliţiei îi lipsesc probele pentru
a-i condamna, dacă nu vorbeşte cel puţin unul.
Dacă amândoi tac şi nu mărturisesc crima, poliţia nu poate să-i reţină în
închisoare decât câteva zile. Presupunem că aceasta corespunde cu un câştig
(sau o utilitate) de 6 pentru fiecare jucător (celula din stânga sus).
Dacă jucătorul 1 mărturiseşte şi jucătorul 2 neagă, atunci jucătorul 1 este
eliberat pentru mărturia sa, iar jucătorul 2 este condamnat pentru crimă şi va
petrece o lungă perioadă în închisoare. Această situaţie reprezintă un câştig
Teoria jocurilor şi metode de analiză a comportamentului strategic
7.16.2 Exerciţii
1
B 2
1 2
C
C B
1 2
1 2
A câştigă
C câştigă C câştigă C câştigă B câştigă
Teoria jocurilor şi metode de analiză a comportamentului strategic
În acest caz, C va lua una sau două pietre rămase pe tablă. Dacă A ia iniţial
două pietre, B poate câştiga luându-le pe cele două rămase. Există deci trei
echilibre de subjocuri perfecte:
Matricea A
G D
g 8,1,1 0,0,5
d 9,4,9 0,0,0
Matricea B
G D
g 6,3,2 4,8,6
d 2,3,9 4,2,0
Este posibil pentru unul sau altul din jucători să utilizeze o altă strategie
decât strategia dominantă? Explicaţi.
Teoria jocurilor şi metode de analiză a comportamentului strategic