Introducere
Teoria jocurilor este o ramur relativ nou a microeconomiei dezvoltat n ultimii 60 de ani.
Ea a aprut odata cu publicarea lucrrii The Theory of Games and Economic Behaviour de ctre
John von Neumann i Oskar Morgenstern n 1943. Acetia au definit jocul ca orice interactiune
ntre diveri ageni, guvernat de un set de reguli specifice care stabilesc mutrile posibile ale
fiecrui participant i cstigurile pentru fiecare combinaie de mutri. Aceast descriere se poate
aplica aproape oricrui fenomen social. Astfel nct se astepta de la aceast tiina rezolvarea
tuturor situaiilor n care oamenii realizeaz c rezultatul aciunilor lor depinde nu numai de acestea,
dar i de aciunile celorlali participani la acea interaciune.
De la comportamentul n trafic pna la decizii de producie i de la rzboiul preurilor la
decizia de a avea copii, totul prea c va fi analizat tiinific cu ajutorul teoriei jocurilor. Dei nu a
satisfcut toate aceste ateptri, teoria jocurilor i-a gsit numeroase aplicaii n domeniul tiinelor
sociale, inclusiv, sau, poate, mai ales n domeniul economiei.
Teoria jocurilor utilizeaz trei ipoteze fundamentale: juctorii se comport raional; fiecare
stie c ceilali sunt raionali; toi juctorii cunosc regulile jocului.
Pentru a nelege un joc oarecare este necesar mai nti cunoaterea regulilor acestuia,
deoarece astfel se poate afla care aciuni sunt permise (posibile) la un anumit moment. Apoi este
necesar a se cunoate cum aleg jucatorii o aciune din mulimea aciunilor posibile.
Problema alegerii aciunilor de ctre juctori este legat de primele dou ipoteze amintite
anterior.
Juctorul care are un comportament raional are anumite preferine asupra lucrurilor: el
prefer mierea - zaharului, muzica clasic - jazz-ului, etc.; acest juctor este raional deoarece el va
alege acea aciune care i va satisface cel mai bine preferinele sale. Se poate spune, n consecin,
c juctorul raional are o anumita ierarhie a preferinelor, astfel nct este posibil exprimarea
acestora cu ajutorul unor funcii de utilitate.
Se poate observa c ipotezele cu care opereaz teoria jocurilor sunt aceleai cu care se
lucreaz n economie i n alte domenii.
Definiia 1.1 Jocul cu n juctori este o succesiune de decizii i evenimente aleatoare,
simultane sau nu, care respect o anumit structur a ctigului, dat de anumite reguli de
funcionare (regulile jocului).
Evenimentul aleator presupune o distribuie de probabilitate asupra unui cmp de
evenimente.
Regulile jocului vor indica modul n care se iau deciziile de ctre jucatori i ordinea
acestora.
Un jucator este raional dac va cuta s-i maximizeze satisfacia n raport cu ceilali
jucatori.
Jocuri i negocieri
Definiia 1.2 Vom numi strategie a unui juctor, o aciune realizabil (posibil), pe care
juctorul o poate alege n cadrul jocului. Mulimea strategiilor jocului este dat de mulimea
strategiilor tuturor juctorilor.
Vom nota multimea strategiilor jocului astfel:
S = S
1
x S
2
x ... x S
n
,
unde n este numarul de jucatori.
n unele situatii, natura (hazardul) este al (n + 1) -lea jucator.
Definiia 1.3 Numim funcie de cstig a jocului funcia u = (u
1
, u
2
, ...u
n
), format din
funciile de cstig ale fiecrui juctor. Notnd funcia de cstig a fiecarui jucator u
i
i funciile de
cstig ale celorlalti jucatori u
-i
, functia de cstig a jocului va fi: u : S R, u = (u
i
, u
-i
).
Definiia 1.4 Numim strategie optimal acea strategie care maximizeaz ctigul juctorului
i, indiferent de strategiile alese de ceilali juctori.
Echilibrul Nash (care a preluat numele creatorului sau, John Nash) este o multime de
strategii (s
1
*, s
2
*, ..., s
n
*) care respecta conditia:
u
i
(s
1
*, s
2
*,...,s
i
*, ..., s
n
*) u
i
(s
1
*, s
2
*,...,s
i
, ..., s
n
*) i = 1, n
sau
u
i
(s
i
*, s
-i
*) u
i
(s
i
, s
-i
*), i = 1, n
n continuare vom aminti o clasificare a jocurilor n raport cu diverse criterii:
a. n raport cu modul n care comunica jucatori ntre ei avem
- jocuri cooperative;
- jocuri necooperative.
Jocurile cooperative sunt acele jocuri n care juctorii comunic liber ntre ei nainte de
luarea deciziilor i pot face promisiuni (care vor fi respectate) nainte de alegerea strategiilor.
Jocurile necooperative sunt jocurile n care juctorii nu comunic ntre ei nainte de luarea
deciziilor.
b. n raport cu desfurarea n timp a jocurilor
- jocuri statice
- jocuri dinamice
Jocul static este acel joc n care deciziile juctorilor se iau simultan, dup care jocul ia
sfrsit.
Jocul dinamic este acel joc n care deciziile juctorilor sunt secveniale, adica evolueaza n
timp.
6
Introducere
7
c. n raport cu natura informatiei
- jocuri n informaie complet
- jocuri n informaie incomplet
Jocul n informatie completa este acel joc n care toti juctori cunosc numrul celorlali
juctori, strategiile fiecruia, funciile de cstig ale fiecruia, precum i regulile jocului.
Jocul n informatie incompleta este jocul n care cel puin unul dintre juctori nu cunoate
una sau mai multe funcii de ctig ale celorlali juctori, restul elementelor (numrul celorlali
juctori, strategiile fiecruia i regulile jocului) fiind cunoscute.
d. n cazul jocurilor dinamice, n raport cu tipul informatiei
- jocuri n informaie perfect
- jocuri n informaie imperfect
Jocul dinamic n informaie perfect este jocul dinamic n care fiecare dintre juctori
cunoate regulile, numrul juctorilor, strategiile acestora, precum i evoluia n timp a jocului
(istoria jocului).
Jocul dinamic n informaie imperfect este jocul dinamic n care mcar unul dintre juctori
nu cunoate istoria jocului, cunoscnd celelalte elemente.
e. n raport cu structura cstigurilor
- jocuri de sum nul
- jocuri de sum nenul
Jocul de suma nula este acel joc n care suma cstigurilor este zero .
Jocul de suma nenula este jocul n care suma cstigurilor este diferita de zero.
f. n raport cu numarul de jucatori
- jocuri cu doi jucatori
- jocuri multipersoana
- jocuri contra naturii.
Exista patru clase de jocuri care vor fi analizate n primele patru capitole ale cursului: jocuri
statice n informaie complet, jocuri dinamice n informaie complet, jocuri statice n informaie
incomplet i jocuri dinamice n informaie incomplet. Corespunzator celor patru clase de jocuri,
exist patru tipuri de echilibre n jocuri: echilibrul Nash, echilibrul perfect n subjoc, echilibrul
Bayesian, echilibrul Bayesian perfect.
CAPITOLUL 2
Jocuri statice n informaie complet
2.1. Jocuri sub form normal
Un joc sub form normal (sau strategic) este definit prin trei elemente: mulimea
juctorilor i , cu ={1,2,..I} o mulime finit, spaiul strategiilor pure S
i
pentru fiecare jucator
i i funciile de ctig ( sau de plat) u .
i
Vom nota acest joc cu { }
I I
u ,... u ; S ,..., S
1 1
= G .
Vom numi strategie pur pentru juctorul i aciunea realizabil care poate fi aleas
de juctorul i din spaiul strategiilor pure S
i i S s
i
i care i va aduce ctigul u
i
(s).
Vom nota cu i S s , vectorul aciunilor realizabile alese la un moment dat
de ctre juctori (uzual, vom mai nota
(
I
s s s s ..., ,
2 1
= )
( )
i i
s s
s = , , cu ( )
I i i i
s s s s s ,..., , ,...,
1 1 1 +
= fiind aciunile
(strategiile) alese de ctre juctorii care joac mpotriva juctorului i ).
Funciile de ctig u
i
(s) sunt definite ca funcii de utilitate de tip von Neumann
Morgenstern pentru fiecare profil al strategiilor realizabile ( )
I
s s s ,...,
1
= , adic n funcie de
strategiile alese de ctre toi juctorii.
De exemplu, la nivelul unui agent economic aceast funcie de utilitate poate fi nivelul
profitului, nivelul ncasrilor sau nivelul costului. Pentru analitii politici, aceste ctiguri pot fi
numrul de voturi ctigate sau alegerea unei platforme electorale.
O categorie special de jocuri o constituie jocurile de sum nul. n cazul acestor jocuri,
suma ctigurilor este zero, , 0
1
=
=
I
i
) s ( u
i
i S s , adic pierderea unor juctori reprezint
ctigul celorlali. Cum aceste jocuri reprezint doar un caz particular, este mai interesant analiza
jocurilor n general, indiferent de suma utilitilor (a ctigurilor).
Faptul c jocul se desfoar n informaie complet presupune c juctorii tiu care sunt
strategiile realizabile ale tuturor, precum i care sunt funciile de ctig ale fiecruia, n funcie de
strategiile alese.Vom numi acestea cunotin comun.
Exemplul 2.2. Dilema prizonierului
S considerm exemplul clasic al dilemei prizonierului. Aceasta presupune c doi suspeci
sunt arestai, fiind nvinuii de comiterea unei crime. Ei sunt anchetai n camere separate, i fiecare
are la dispoziie dou variante de rspuns: fie s pstreze tcerea, adic s nege c ar fi comis crima,
fie s l acuze pe cellalt prizonier. Dac suspecii se acuz reciproc, atunci ei vor primi ca pedeaps
cte 7 ani de nchisoare. Dac ambii neag, atunci pedeapsa va fi de 1 an nchisoare pentru fiecare,
iar dac unul neag, iar cellalt acuz, atunci cel care acuz va fi eliberat , iar cel care neag va fi
pedepsit cu 10 ani de nchisoare.
Jocuri statice n informaie complet
n aceast descriere a jocului avem toate elementele necesare pentru un joc sub form
normal (strategic). Mulimea juctorilor este finit, } 2 , 1 { i , mulimea strategiilor pentru fiecare
juctor este aceeai, ( cu A = Acuz, N = Neag), iar funciile de ctig vor fi: } , { N A S =
u ; ( ) 7
1
= A , A ( ) 7
2
= A , A u ;
( ) 0
1
= N , A u ; ( ) 10
2
= N , A u ;
( ) 10
1
= A , N u ; ( ) 0
2
= A , N u ;
( ) 1
1
= N , N u ; ( ) 1
2
= N , N u .
Acest joc n form normal poate fi reprezentat i sub form matriceal.
Matricea jocului va conine toate elementele necesare descrierii unui joc n form normal,
adic juctorii, strategiile disponibile i funciile de ctig .
n cazul nostru avem:
Prizonier2
A N
A
-7,-7
0,-10
Prizonier1
N
-10,0
-1,-1
Figura 2.1
Liniile i coloanele matricii indic strategiile realizabile ale juctorilor (strategiile pure), iar
celulele matricii vor conine ctigurile fiecrui juctor, n funcie de strategiile alese, cu primul
numr indicnd ctigul juctorului1, iar al doilea pe cel al juctorului 2.
Vom defini o strategie mixt a juctorului i o distribuie de probabilitate p
i
asupra mulimii
strategiilor realizabile (pure). Dac vom nota cu P spaiul strategiilor mixte, el va fi produsul
cartezian al strategiilor mixte realizabile pentru fiecare juctor: P = x P
i
, cu p
i
P
i
.
Suportul (baza) unei strategii mixte va fi format din strategiile pure pe care le au la
dispoziie juctorii, care au asignate probabiliti pozitive de a fi alese. Ctigul juctorului i care va
juca strategia mixt p
i
este:
=
S s
i
j
i j i i
) s ( u ) s ( p )) s ( p ( u .
Evident, . =
j
) s ( p
j i
1
n exemplul nostru, fie ( 2 1 2 1
1
, p = ) , iar ( ) 3 2 3 1
2
, p = (adic juctorul 1 va acuza cu
probabilitatea 1/2 i va nega cu probabilitatea 1/2, iar juctorul 2 va acuza cu probabilitatea 1/3 i va
nega cu probabilitatea 2/3). Atunci ctigul juctorului 1 pentru strategia mixt p
1
,innd cont de
faptul c juctorul 2 joac strategia mixt p
2
va fi :
10
Jocuri statice n informaie complet
( ) ( ) ( ) ( ) ( ) ( ) ( ) . p , p u 6 19 1 3 2 10 3 1
2
1
0 3 2 7 3 1
2
1
2 1 1
= + + + =
Pentru jucatorul 2 avem:
( ) ( ) ( ) ( ) ( ) ( ) ( ) . u p , p 6 23 1 2 1 10 2 1
3
2
0 2 1 7 2 1
3
1
2 1 2
= + + + =
Observaie. Putem considera strategiile mixte i ca o generalizare a strategiilor pure, dac
, cu probabilitatea 1 corespunztor strategiei pure i 0 pentru toate
celelalte.
( 0 1 0 0 ,.., ,.., , p
i
= )
i j
S s
2.2. Strategii dominate
Vom explica acest concept pornind de la exemplul precedent. n cazul juctorului 2, el
poate juca fie A, fie N. Dac primul juctor va juca A, atunci 2 are de ales ntre a juca A i a avea
ctigul (-7) sau a juca N i a avea ctigul (10). Evident c el va prefera s joace A, deoarece st
mai puin n nchisoare. Dac 1 joac N, atunci 2 poate juca A, cu cu ctigul (0) sau N, cu ctigul
(1). Evident, el va alege tot A.
Cu alte cuvinte, indiferent ce ar alege juctorul 1, pentru juctorul 2 este mai bine s joace
A dect N, adic vom spune c strategia N (de a nega) este dominat de strategia A (de a acuza). Un
raionament asemntor se face i pentru juctorul 1, strategia N fiind dominat de ctre strategia
A. Putem da acum urmtoarea definiie:
Definiia 2.2. n jocul sub forma normal { }
I I
u ,... u ; S ,..., S G
1 1
= , fie
i
s
i dou strategii
realizabile pentru juctorul i ( s ). Vom spune c strategia
i
s
i i i
S s ,
s
i
s
este strict dominat
(dominat) de strategia , dac oricare ar fi combinaia de strategii realizabile ale celorlali
juctori, ctigul juctorului i dac joac
i
s
i
este strict mai mic (respectiv mai mic sau egal) dect
ctigul pe care l are jucnd :
i
s
( ) ( )
I i i i i I i i i i
s ,.., s , s , s ,.., s u s ,.., s , s , s ,.. s u
1 1 1 1 1 1 + +
<
(sau ) ( ) ( )
i i i i i i
s , s u s , s u
cu
I i i i
S S S S S s
+
... ...
1 1 2 1
.
Vom presupune c juctorii raionali (vom nelege prin juctor raional acel juctor care
urmrete ntotdeauna maximizarea ctigului propriu in funcie de alegerea strategiilor de ctre
ceilali juctori) nu vor alege niciodat s joace o strategie dominat.
Pentru jocul nostru, vedem c soluia (echilibrul) jocului este ca fiecare juctor s joace A,
adic (A,A). Analog, putem defini o strategie strict dominant (slab dominant):
Definiia 2.3. Strategia pur este strict dominant (slab dominant) pentru juctorul i
dac p
i
s
i
P
i
astfel nct ( )
i i i i i
s , s ) s , P (
>
i
u u ,
i i
S s
( sau u ( )
i i i i i i
s , s u ) s , P (
).
Procesul de determinare a echilibrului reprezint algoritmul de eliminare iterativ a
strategiilor strict dominate.
11
Jocuri statice n informaie complet
Determinarea echilibrului prin algiritmul eliminrii strategiilor dominate
Vom descrie algoritmul pornind de la urmtorul exemplu: fie un joc static sub form
normal definit prin matricea jocului din figura 2.2.
Juctor 2
Stnga Mijloc Dreapta
Sus 2,1 2,3 1,2
Juctor1
Jos
1,4
1,2
3,1
Figura 2.2
n prima etap a algoritmului vom cuta s descoperim dac exist vreo strategie dominat
pentru unul din juctori:
Pentru juctorul 1, observm c strategia Sus nu domin strategia Jos (deoarece avem
dac juctorul 2 joac Stnga; dac juctorul 2 joac Mijloc, dar 1 , dac juctorul 2
joac Dreapta).
1 2 > 1 2 > 3 <
Pentru juctorul 2 avem: strategia Mijloc nu domin strategia Stnga ( 3 , dar 1 > 4 2 < ), n
schimb domin strategia Dreapta ( 3 ; ). 2 > 1 2 >
Deci pentru juctorul 2 este mai convenabil indiferent de ceea ce ar juca primul juctor
este s joace Mijloc dect Dreapta. Prin urmare, vom elimina strategia ( sau strategiile n cazul
n care sunt mai multe) dominat, iar noua matrice a jocului va fi :
Juctor2
Stnga Mijloc
Sus
2,1 2,3
Juctor1
Jos 1,4 1,2
Figura 2.3
Pentru acest nou joc analizm care sunt posibilitile de alegere pentru juctorul 1 (relum
algoritmul).Vedem c n acest caz strategia Sus domin strategia Jos ( ; ), pe care o vom
elimina . Noua matrice a jocului este:
1 2 > 1 2 >
Juctor2
Stnga Mijloc
Juctor1 Sus 2,1 2,3
Figura 2.4
Pentru juctorul 2 acum, strategia Stnga este dominat de strategia Mijloc (1 ), deci o
vom elimina.
3 <
Pentru jocul descris, rezult singurul echilibru posibil dat de alegerea strategiilor (Sus,
Mijloc), pentru care ctigurile vor fi (2,3).
Totui, doar pentru o categorie redus de jocuri se poate determina echilibrul prin algoritmul
de eliminare iterativ a strategiilor dominate.
12
Jocuri statice n informaie complet
De exemplu, pentru jocul sub form normal descris prin matricea jocului din figura 2.5 nu
se poate determina acest tip de echilibru. (deoarece nici o strategie nu este dominat pentru nici
unul din juctori).
Juctor 2
St M D
S 1,3 3,1 3,2
M
3,1
1,3
3,2
Juctor 1
J
2,3
2,3
4,4
Figura 2.5
Vom lrgi spaiul soluiilor posibile n cazul jocurilor statice prin introducerea conceptului
de echilibru Nash.
2.3 Echilibrul Nash
Definiia 2.4 n jocul sub form normal { }
I I
u ,... u ; S ,..., S G
1 1
= ,strategiile pure ( )
* *
1
,..,
I
s s
constituie un echilibru Nash dac pentru fiecare juctor i, este cel mai bun rspuns la strategiile
celorlali I - 1 juctori
*
i
s
( )
* *
1
*
1
*
1
,.., , ,..
I i i
s s s s
+
, adic:
( ) ( )
*
I
*
i i
*
i
*
i
*
I
*
i
*
i
*
i
*
i
s ,.., s , s , s ,.. s u s ,.., s , s , s ,.. s u
1 1 1 1 1 1 + +
,
i i
S s
sau va fi soluia problemei:
*
i
s
( ). s ,.., s , s , s ,.. s u
max
S s
*
I
*
i i
*
i
*
i
i i
1 1 1 +
Extinznd definiia i n spaiul strategiilor mixte vom avea:
Definiia 2.5. O strategie profil mixt p
*
= ( )
*
i
*
i
p , p
constituie un echilibru Nash al jocului
{ }
I I
u ,... u ; S ,..., S G
1 1
= dac oricare ar fi juctorul i, atunci ( ) ( )
*
i i i
*
i
*
i i
p , s u p , p
u , .
i i
S s
Observaie. Strategia s
i
*
care asigura maximizarea ctigului juctorului i in raport cu
strategiile jucate de ceilali jucturi se mai numeste cel mai bun rspuns (best response) al
juctorului i la strategiile alese de ceilali.
Cu alte cuvinte, ( ). s ,.., s , s , s ,.. s u max arg
S s
s
*
I
*
i i
*
i
*
i
i i
*
i 1 1 1 +
=
13
Jocuri statice n informaie complet
Vom spune c un echilibru Nash este puternic (strict) dac fiecare juctor are un cel mai bun
rspuns la strategiile oponenilor unic ( adic este un echilibru Nash puternic (strict) dac
*
s
( ) ( )
*
i i i
*
i
*
i i
s , s u s , s u
> ) oricare ar fi juctorul i).
Un echilibru Nash este slab (nestrict) dac el nu este unic. n cazul echilibrului obinut prin
eliminarea iterativ a strategiilor dominate, acesta este un echilibru Nash puternic, deoarece este
unicul echilibru al jocului, iar strategiile alese de juctori sunt cel mai bun rspuns posibil (
deoarece le-am eliminat pe toate celelalte care nu sunt rspunsuri acceptabile).
Deci att n cazul dilemei prizonierului, ct i n cazul jocului prezentat anterior, avem un
echilibru Nash unic, (Acuz,Acuz) n primul caz, respectiv (S,M) n al doilea.
Pentru jocul descris n figura 2.5, prin algoritmul eliminrii strategilor dominate nu poate fi
determinat echilibrul, deoarece nu exist strategii dominate. Pentru a determina totui acest
echilibru vom descrie un alt algoritm, respectiv algoritmul determinrii celui mai bun rspuns, (
sau algoritmul maximizrii ctigurilor relative).
Determinarea echilibrului prin algoritmul maximizrii ctigurilor relative
S determinm echilibrul Nash al jocului prezentat n Figura 2.6 :
Juctor2
St M D
S 1,3 3,1 3,2
M 3,1 1,3 3,2 Juctor1
J 2,3 2,3 4,4
Figura 2.6
Algoritmul este urmtorul: pentru fiecare juctor i vom determina cel mai bun rspuns pe
care l poate da n raport cu alegerile celorlali juctori. (n matricea jocului, vom sublinia
ctigurile juctorului i ce sunt obinute prin alegerea celui mai bun rspuns). Dac exist o
combinaie de strategii care s maximizeze ctigurile tuturor juctorilor (respectiv o casu a
matricei n care s fie subliniate ambele ctiguri) atunci acesta constituie echilibrul Nash al jocului
determinat prin algoritmul celui mai bun rspuns.
Aplicnd acest algoritm jocului din figura 2.6 rezult: dac juctorul 1 ar juca strategia S,
atunci pentru juctorul 2 cel mai bun rspuns este s joace St, deoarece 3 i , deci vom
sublinia ctigul corespunztor, 3, care corespunde strategiei St. Dac 1 ar juca M, atunci 2 va juca
M ( 3 ; ), i vom sublinia ctigul 3 ce corespunde strategiei M , iar dac 1 ar juca J, atunci
2 va juca D, obinnd ctigul 4, pe care l vom sublinia. Procedm n mod analog i pentru
juctorul 2. Dac 2 ar juca strategia St atunci cel mai bun rspuns al juctorului 1 este s joace M cu
ctigul 3, pe care l vom sublinia. Dac 2 joac M atunci 1 joac S, cu ctigul 3, subliniat, iar
dac 2 joac D, atunci 1 joac J, cu ctigul 4, subliniat la rndul su.
1 > 2 3 >
1 > 2 3 >
Observm c cele mai bune rspunsuri ale juctorilor 1 i 2 au un punct comun, respectiv
juctorul 1 s joace strategia J iar juctorul 2 s joace strategia D. Aceasta corespunde situaiei n
care n csua (J,D) a matricei ctigurilor sunt subliniate ambele ctiguri, (4,4).
Acesta este unicul echilibru Nash al jocului (fiind un echilibru Nash strict).
14
Jocuri statice n informaie complet
Exemplu. Btlia sexelor
S considerm acum un alt joc celebru i anume btlia sexelor. Acest joc const n
urmtoarele: ntr-o familie, soul i soia trebuie s decid unde vor merge ntr-o sear pentru a se
distra, avnd de ales ntre a merge la un meci de fotbal i a merge la teatru. Dintre aceste variante,
soul prefer s mearg la fotbal, iar soia la teatru. Dac unul din ei cedeaz, atunci cel care
cedeaz va avea ctigul 2, iar cel care nu cedeaz, va ctiga 4. n cazul n care nici unul nu
cedeaz, atunci vor ramne acas, iar ctigul fiecruia va fi 0.
Matricea jocului este urmtoarea:
Soie
F T
F 4,2 0,0
So
T
0,0
2,4
Figura 2.7
S determinm care este echilibrul Nash al acestui joc, prin algoritmul maximizrii
ctigurilor relative: dac soul alege s mearg la fotbal, atunci cel mai bun rspuns al soiei este s
cedeze, (deoarece dac nu cedeaz ctig 0, n timp ce dac va ceda va ctiga 2). Dac soul alege
s mearg la teatru, evident pentru soie este optim s aleag aceeai strategie. Raionnd analog i
pentru soie, obsevm c n cazul acestui joc, avem dou echilibre Nash n strategii pure, adic
(F,F), respectiv (T,T), cu ctigurile (4,2), respectiv (2,4).
Cum deja am gsit dou echilibre Nash ale jocului, intrebarea care se pune n continuare
este aceea de a vedea dac nu mai sunt i alte echilibre. Pentru aceasta vom cuta echilibre n
strategii mixte.
Algoritmul determinrii echilibrului n strategii mixte
Prin acest algoritm vom determina echilibrul (sau echilibrele) n strategii mixte. Pentru
aceasta vom asocia fiecrei strategii pure a juctorului i o anumit probabilitate. Pentru fiecare
juctor, mulimea strategiilor formeaz un cmp complet de evenimente, deci suma probabilitilor
asociate va fi unitar. n continuare, pentru fiecare strategie vom determina ctigul ateptat. Vom
elimina din calcule strategiile dominate - sau le asociem probabilitatea nul (0) de a fi jucate i
vom determina probabilitile pentru care ctigurile aduse de strategiile nedominate sunt egale.
Acesta va constitui echilibrul jocului n strategii mixte.
Observaie. Probabilitile asociate strategiilor reprezint ipoteze pe care le fac ceilali
juctori despre modul n care va juca juctorul i.
n cazul btliei sexelor vom avea: presupunem c soia crede c soul va merge la fotbal cu
probabilitatea p
1
i la teatru cu probabilitatea 1- p
1
,iar soul crede c soia va merge la fotbal cu
probabilitatea p
2
, respectiv la teatru cu probabilitatea 1- p
2
. n figura 2.8 avem reprezentarea sub
form matriceal :
15
Jocuri statice n informaie complet
Soie
p
2
1 p
2
F T
P
1
F
4,2 0,0
So
1 p
1
T 0,0 2,4
Figura 2.8
Atunci ctigul asociat strategiei mixte (p
1
, 1- p
1
) este ctigul ateptat de soie dac alege
s merg la teatru, respectiv la fotbal. Astfel, atunci utilitatea ateptat a soiei va fi:
( ) ( ) ( )
1 1 1 1 1 2
2 1 0 2 1 p p p F ; p , p u = + =
( ) ( ) ( )
1 1 1 1 1 2
4 4 1 4 0 1 p p p T ; p , p u = + = .
La echilibru, ( ) ( ) = F ; p , p
1 1 2
1 u ( ) ( ) T ; p , p u
1 1 2
1 i p
1
+ p
2
= 1
Din rezolvarea sistemului rezult 3 2
1
= p .
Deci dac soia crede c soul dorete s mearg la fotbal cu o probabilitate 3 2
1
> p atunci
soia va alege s mearg la fotbal, (adic 1
2
= p ), iar dac 3 2
1
< p atunci deci va alege s
mearg la teatru ( ). 0
2
= p
n cazul n care p
1
=2/3 atunci i este indiferent ce alege, deoarece ctigul ateptat este
acelai.
Cu alte cuvinte, dac 3 2
1
> p , atunci cel mai bun rspuns al soiei este s mearg la fotbal,
iar dac 3 2
1
< p atunci cel mai bun rspuns al soiei este s mearg la teatru.
Raionnd analog i pentru so, vom obine 3 1
2
= p , adic soul va alege s mearg la
fotbal dac el crede c soia dorete s mearg la fotbal cu o probabilitate 3 1
2
> p i s mearg la
teatru, dac 3 1
2
< p , fiind indiferent unde va merge dac 3 1
2
= p .
Prin urmare, mai exist un echilibru Nash al jocului, echilibru n strategii mixte, pentru care
strategiile mixte sunt: ( ) ( ) ( ) ( ) 3 2 3 1 3 1 3 2
2 1
, , , p , p
* *
= .
Reprezentnd grafic cel mai bun rspuns al fiecrui juctor figura 2.9:
.
Teatru
Fotbal
1
1/3
2/3 1
So
Soie
p
2
p
1
Figura 2.9.
16
Jocuri statice n informaie complet
La intersecia graficelor funciilor celor mai bune rspunsuri ale fiecruia se gsesc
echilibrele Nash ale acestui joc, care sunt dou n strategii pure: ( F,F), respectiv (T,T) i unul n
strategii mixte ((2/3,1/3),(1/3,2/3)).
2.4. Puncte focale, echilibre Nash multiple i optimalitatea Pareto
In cazul multor jocuri, echilibrul Nash nu este unic, ci pot exista echilibre Nash multiple.Un
exemplu este acela al btliei sexelor (care a fost prezentat n paragraful anterior), n care exist trei
echilibre Nash dou n strategii pure i unul n strategii mixte, dup cum urmeaz: (F,F) , (T,T)
,respectiv ((2/3,1/3),(1/3,2/3)).
Exemplu. Uliul i porumbelul
Un alt exemplu l constituie jocul uliul i porumbelul, care mai este cunoscut sub numele
de povestea celor doi berbeci. O versiune a sa este astfel: doi berbeci se intlnesc de o parte i de
alta a unei puni nguste peste o prpastie. Ei au la dispoziie dou strategii: fie s ncerce s treac
(T), fie s atepte (A). Dac vor ncerca s treac n acelai timp (vor juca T), atunci se vor ntlni la
mijlocul punii i se vor lua la btaie, utilitatea fiecruia fiind 2. Dac vor alege amndoi s
atepte, atunci vor avea funciile de ctig de valoare 0. Iar n cazul n care unul se hotrete s
treac, iar cellalt s atepte, vor ctiga 2 cel care trece , respectiv 1 cel care ateapt .
Prezentnd jocul sub form normal , prin matricea ctigurilor avem:
Berbec 2
T A
T -1,-1 2,1 Berbec 1
A 1,2 0,0
Figura 2.10
(Acest joc se numete uliul i porumbelul deoarece juctorul care se hotrte s trec va fi
uliul, iar cel care ateapt porumbelul). n cazul acestui joc, exist tot trei echilibre Nash, dou n
strategii pure (T,A) i (A,T) i unul n strategii mixte ( (1/2,1/2),(1/2,1/2) ).
Dac berbecul 1 joac cu probabilitatea x strategia T, iar berbecul 2 joac strategia T cu
probabilitatea y, atunci pentru ca berbecul 1 s fie indiferent ntre a trece i a atepta ctigurile
estimate medii trebuie s fie aceleai., adic:
( ) ( ) ( y y y y + ) = + 1 0 1 1 2 1 i p
1
+ p
2
= 1 y y = 3 2 2 1 = y
Pentru berbecul 2 obinem acelai rezultat i deci echilibrul n strategii mixte este dat de
credinele ambilor juctori c cellalt trece puntea cu probabilitatea 0,5.
In cazul n care doi juctori se ntlnesc pentru prima dat pentru a juca jocul uliul i
porumbelul,atunci este dificil de vzut care este soluia aleas de ctre juctori.Dac l-au mai
jucat nainte, atunci exist posibilitatea de a prezice care din echilibre va fi ales.
n 1960, s-a elaborat o teorie a punctelor focale, n care se sugereaz c n situaiile
particulare de via real, juctorii pot fi capabili s-i coordoneze aciunile pentru atingerea unui
echilibru particular utiliznd numai informaiile din jocul descris.De exemplu, numele strategiei
poate avea o putere focal. Dac vom cere ca doi juctori s stabileasc o or de ntlnire, facnd
17
Jocuri statice n informaie complet
alegerea orei simultan, atunci este foarte probabil s aleag ora 12
00
.Aceast or poate fi un punct
focal, n timp ce ora 14
37
nu poate fi.
Un alt exemplu: dac vom cere ca doi sau mai muli juctori s aleag simultan o celul din
cadrul unei matrice, atunci este foarte probabil s fie aleas celula (1,1) (cea din stnga ,sus), acesta
constituind un punct focal, n timp ce celelalte celule ale matricei nu sunt.
O alt problem la care trebuie s rspundem este urmtoarea: care este legtura dintre
echilibrele de tip Nash i optimul Pareto? (Reamintim c optimul Pareto reprezint acea situaie n
care juctorii sunt maxim posibil satisfcui, sau situaia n care nu exist o alt posibilitate n care
mcar unul dintre juctori s fie mai bine satisfcut, fr s se reduc satisfacia mcar a unuia
dintre ceilali juctori.)
In cazul dilemei prizonierului descris anterior,am vzut c echilibrul jocului l constituie
perechea de situaii (A,A) (adic ambii juctori se acuz reciproc), n timp ce optimul Pareto al
jocului este de a juca (N,N) ( ( ) ( 7 7 1 1 ) > , , ).
Deci n cazul n care prizonierii nu coopereaz, ei nu vor atinge optimul Pareto.
Exist posibilitatea de a juca optimul Pareto al jocului, aceasta n cazul n care juctorii ar
coopera (o soluie ce poate fi dat i de teoria coaliiilor), sau n cazul n care exist o ameninare.
(Jocurile cu ameninri vor fi abordate mai trziu).
Rezumnd, n cazul unui joc, echilibrul Nash (sau echilibrele Nash) existent nu este n mod
necesar i optimul Pareto al acestuia. Unele echilibre par mai probabile dect altele n cazul unui
joc, iar acestea sunt numite puncte focale.
2.5. Existena echilibrului Nash
n paragraful anterior, am definit echilibrul de tip Nash i am artat modul n care poate fi
determinat. ntrebarea care se impune n continuare este urmtoarea: n ce condiii exist un
echilibru de tip Nash? Rspunsul la aceast ntrebare este dat de teorema lui Nash:
Teorema Nash Orice joc finit sub form normal are un echilibru n strategii mixte.
Observaie. n cazul n care gsim un echilibru n strategii pure, el poate fi asimilat unui
echilibru n strategii mixte, n care probabilitile de realizare ale tuturor strategiilor sunt 0, mai
puin strategia care constituie echilibrul, care va avea probabilitatea de realizare 2.
Demonstraie
Ideea acestei demonstraii este de a aplica teorema de punct fix a lui Kakutani pentru
funciile de reacie (funciile care indic cel mai bun rspuns) ale juctorilor. Fie
funcia de reacie a juctorului i definit pe spaiul strategiilor cu valori n acelai spaiu. Un punct
fix al lui r este definit astfel: acea strategie (mixt) s astfel nct, pentru fiecare juctor i,
S S : r
i
( ) s r s = .
Observaie. Corespondena r(s) este definit ca fiind:
( ). s ,.., s , s , s ,.. s u max arg
S s
) s ( r
*
I
*
i i
*
i
*
i
i i
1 1 1 +
=
18
Jocuri statice n informaie complet
Aceast strategie reprezint chiar echilibrul Nash al jocului.
Teorema de punct fix a lui Kakutani (descris n condiiile jocului) afirm urmtoarele:
Teorema Kakutani
Fie o coresponden, astfel nct descrie funciile de reacie ale juctorilor, astfel
nct:
S S : r
a) S este o mulime compact, convex i nevid din spaiul euclidian (finit dimensional);
b) r(s) este continu ; S s
c) r(s) este convex ; S s
d) r(s) este nchis, adic irul ( ) , cu
n n
s s , ( )
n n
s r s = , avem ( ) ( ) s s s s
n n
, ,
Atunci exist un punct fix al corespondenei r(s): ( ) s r s .
n continuare vom verifica dac aceste condiii sunt satisfcute:
a) Cum
i
S S =
i reprezint un simplex n- dimensional, tim c aceast mulime este
compact,convex i nevid.
b) Fiecare funcie de ctig a juctorilor este liniar n raport cu probabilitile asociate
startegiilor jucate, deci este continu. Cum funciile de ctig sunt continue, i r(s), care este
determinata ca fiind argumentul care maximizeaz funciile de ctig este continu.
c) S presupunem c nu este convex.Atunci ( ) s r ( ) s r s
'
, i ( ) s r s ( ) 1 , 0
astfel nct : ( )s s + (s r ) 1 .
Dar pentru fiecare juctor i avem :
( ) ( ) ( ) ( ) ( )
i i i i i i i i i i
s , s u s , s u s , s s u
+
1 1
deci att ct i sunt cele mai bune rspunsuri pentru
i
s
i
s
i
s
, iar combinaia liniar a
acestora constituie de asemenea cel mai bun rspuns, deci aparine lui r(s).
n aceste condiii, presupunerea fcut este fals i deci r(s) este convex.
d) Vom demonstra i condiia d) prin reducere la absurd. Presupunem c ipoteza d) nu este
ndeplinit, adic exist un ir ( ) ( ) s s s s
n n
, , , cu ( )
n n
s r s , dar ( ) s r s . Atunci pentru
cel puin un juctor i i ca urmare exist
( ) s r s
i i
0 > i un
i
s
astfel nct:
( ) ( ) 3 + >
i i i i i i
s , s u s , s u .
Cum este continu , iar
i
u ( ) ( ) s s s s
n n
, , , pentru n suficient de mare avem:
( ) ( ) ( ) ( ) 3 2 + > + > >
i , n i , n i i i i i i i i i i
s , s u s , s u s , s u s , s u
19
Jocuri statice n informaie complet
Deci
i
s
este strict mai bun dect i dect
i n
s
, i n
s
,
i aceasta contrazice ipoteza c
, deoarece aceasta nseamn c exist o alt strategia care asigur un ctig mai mare
care nu face parte din r(s). Prin urmare ipoteza este fals, deci r(s) este inchis.
( )
n i i n
s r s
,
Cum avem verificate condiiile a),b),c), d), r(s) are un punct fix, deci exist un echilibru de
tip Nash pentru jocul considerat. q.e.d.
Un rezultat mai puternic a fost dat de Debreu(1952), prin urmtoarea teorem:
Teorema Debreu Fie un joc sub form normal n care spaiul strategiilor S
i
este o mulime
nevid, compact i convex i aparine unui spaiu euclidian (nu neaprat finit). Dac funciile de
ctig u
i
sunt continue n S i cvasi-concave n S
i
atuci exist un echilibru Nash n strategii pure.
Demonstraia este similar celei anterioare, dar n acest caz rezult c echilibrul Nash exist
nu neaprat n strategii mixte, ci i n strategii pure.
O problem ce poate apare aici este interpretarea echilibrului n strategii mixte. Ce
reprezint acest echilibru? Dac n strategii pure descrierea acestui echilibru este suficient de clar
ea reprezint strategia ce trebuie aleas asfel nct s se maximizeze funcia de ctig (sau utiliatea)
juctorilor un echilibru n strategii mixte este mai dificil de neles.Cum se alege o strategie mixt
n condiii practice? Aici apare acea doz de incertitudine datorat probabilitilor de alegere a uneia
sau alteia din strategii ( pentru c, n final, se va juca o strategie pur i nu una mixt!). Conceptul
de strategie mixt ne ajut ns n a determina punctul de echilibru, respectiv optimul unui joc.
Apoi, alegerea uneia sau alteia din strategii se va face n funcie de ct de apropiat este de strategia
mixt optimal n cazul n care avem de-a face cu strategii exprimate n form discret.
Problema este rezolvat n cazul unor strategii sub form continu ( aa cum ne asigur i
teorema anterioar), n acest caz determinndu-se cu precizie strategiile ce trebuie adoptate pentru a
se realiza maximizarea ctigului.
n cazul n care avem un joc al crui soluie poate fi determinat prin algoritmul de
determinare iterativ prin eliminarea strategiilor dominate, atunci echilibrul este i unic. Aceasta
poate fi rezumat n urmtoarea propoziie:
Propoziie
ntr-un joc cu n juctori sub form normal, { }
n n
u ,..., u ; S ,..., S G
1 1
= dac exist un
echilibru obinut prin eliminarea strategiilor strict dominate atunci acesta este unicul echilibru Nash
al jocului.
Demonstraie
Vom demonstra aceast propoziie prin reducere la absurd.
Fie ( )
*
n
* *
s s s
2 1
,..., , strategiile ce alctuiesc echilibrul jocului prin eliminarea strategiilor strict
dominate.S demonstrm mai nti c acesta este echilibrul Nash al jocului. Cum strategiile au
fost alese prin algoritmul de eliminare a strategiilor dominate,rezult c oricare ar fi o alt strategie
aleas de juctorul i, este satisfcut condiia:
*
i
s
i
s
( ) ( )
*
i
*
i i
*
i i i
s , s u s , s u
< .
20
Jocuri statice n informaie complet
21
Cu alte cuvinte, strategia este cel mai bun rspuns al juctorului i la alegerea de ctre
ceilali a strategiilor i deci strategia reprezint soluia problemei:
*
i
s
*
i
s
*
i
s
( )
*
i i i
i i
s , s u
max
S s
,
soluie care este echilibrul Nash al jocului.
Deci aceast soluie este un echilibru Nash.
S verificm acum unicitatea unui asemenea echilibru. Vom presupune c nu este unicul
echilibru Nash al jocului.Ca urmare, exist i o alt strategie , astfel nct aceasta este
soluia problemei de maximizare:
*
i i
s s
( )
*
i i i
i i
s , s u
max
S s
,
dar de aici rezult c
i i
S s ,
( ) ( )
*
i i i
*
i i i
s , s u s , s u
.
Deci i
( ) ( )
*
i i i
*
i
*
i i
s , s u s , s u
()
Cum ns strategia s a fost determinat astfel nct:
*
i
( ) ( )
*
i i i
*
i
*
i i
s , s u . s , s u
> ,
i i
S s , ()
deci i pentru , rezult o contradicie ntre () i ().
i i
s s =
Deci presupunerea fcut este fals i nu exist un alt echilibru n strategii dominante, ceea
ce era de demonstrat.
Observaii.
a) pentru jocurile n care strategiile sunt dintr-un spaiu discret, dac exist un echilibru n strategii
pure unic, atunci acel echilibru poate fi determinat prin algoritmul maximizrii ctigurilor
relative. n plus, toate echilibrele n strategii pure pot fi determinate prin acest algoritm.
b) Dac nu poate fi determinat echilibrul prin algoritmul maximizrii ctigurilor relative, atunci
pentru jocul considerat exist doar echilibre (sau echilibru) n strategii mixte.
Jocuri statice n informaie complet
2.6 Aplicaii
2.6.1 Duopolul Cournot
n 1838 Cournot a anticipat definiia dat da Nash echilibrului jocului i a elaborat modelul
duopolului care i poart numele.
Modelul este urmtorul: pe piaa unui produs omogen exist dou firme care l pot produce.
Fie q
1
i q
2
cantitile din bun produse de firma 1, respectiv de firma 2. Funcia invers de cerere
pentru produs este dat prin:
, cu a > 0.
<
=
a Q pentru
a Q pentru , Q a
) Q ( p
0
p reprezint preul bunului, iar Q = q
1
+ q
2
este cantitatea total de bun oferit pe pia.
Costul total al producerii cantitii de produs de ctre firma i este
C
q
i
C
q c ) q (
i
i i
i
+ = ,
unde c reprezint costul marginal (consum pentru ambele firme) iar
C
costul fix.
i
( Evident, vom presupune c att ct i sunt mai mici dect , altfel problema nu are
sens ).
c
Ci
a
n cazul modelului Cournot ambele firme aleg simultan cantitile pe care le ofer pe pia.
Pentru a determina echilibrul Nash al acestui joc s l transformm ntr-un joc sub form
normal. Pentru aceasta va trebui s specificm:
a) juctorii care sunt cele dou firme
b) strategiile disponibile pentru fiecare juctor cantitile alese de fiecare din marfa
considerat pentru a fi produse
c) ctigul obinut de fiecare juctor care vor fi reprezentate prin profiturile asociate.
Spaiul strategiilor , adic spaiul numerelor reale nenegative, deoarece n mod
uzual cantitile sunt nenegative . (Evident, aceste cantiti nu pot fi infinite i ca urmare
se poate face nc o restrngere a acestui spaiu, dar aceasta nu este esenial n rezolvarea
problemei).
) , [
S
i
= 0
q
i
0 q
i
Ctigurile fiecrui juctor , fiind profiturile nregistrate, vor avea urmtoarea form:
( ) ( ) | | | | 2 1, i
C
c q q a q c q q p q q , q
u
i
j i i j i i j i
i
= = + =
Dac perechea de strategii ( ) q , q
* *
2 1
este un echilibru Nash, atunci pentru fiecare juctor
. Sau echivalent, fiecare juctor trebuie s rezolve urmtoarea problem
de maximizare:
i
|
.
|
\
|
|
.
|
\
|
q
, q
u
q
, q
u
j
*
i
i j
*
i
*
i
( )
*
j
i
q ,
i
S q
q
u max
i
i
.
Pentru modelul nostru , problema va fi :
( ) 2 1
0 0
, i ,
C
c
q
q a q
max
q , q
u max
i j
*
i i
q
*
j
i
i
q
i i
=
(
|
.
|
\
|
+ =
Condiiile de ordin nti pentru aceasta problem conduc la :
22
Jocuri statice n informaie complet
|
.
|
\
|
= =
|
.
|
\
|
c
q
a q
q
q
, q
u
j
*
i
*
i
j
*
i
i
2
1
0
.
Deci cantitile ( ) q , q
* *
2 1
care reprezint echilibrul Nash sunt:
( ) ( )
( ) ( )
=
=
Y q c a q
X q c a q
* *
* *
1 2
2 1
2
1
2
1
Din rezolvarea sistemului de ecuaii rezult :
( )
3
2 1
c a
q q
* *
= =
iar profitul fiecrei firme
asociat va fi:
( )
C
c a
q
, q
i j
*
i
*
i
=
|
.
|
\
|
9
2
u
, evident dac q , adic dac a . a
q
j i
* *
<
+
c 2 >
Cum se poate explica un astfel de rezultat ? Intuiia este simpl: dac cele dou firme nu
sunt n condiii de concuren, atunci ele se pot comporta ca nite monopoliti. n acest caz
problema ce trebuie rezolvat va fi : ( ) 0 , q
u max
i
i
q
i
, pentru fiecare dintre acetia, ceea ce conduce la
cantitatea de monopol
2
c a
q
m
= , iar profitul asociat ar fi
( )
( )
4
0
2
c a
, q
m i
=
u
.
Cum exist dou firme , aceast cantitate se va diviza n dou , adic , pentru
fiecare i , cantitate mai mic dect n cazul anterior, dar care aduce un profit mai mare pentru fiecare
firm :
2 / q q
m i
=
4
c a
= q
i
,
( )
( )
8
2
c a
q , q
j i
i
=
u
.
n acest caz - dac firmele nu se neleg ntre ele atunci fiecare are interesul de a devia de
la aceast strategie adic de a produce mai mult n dezavantajul celuilalt ( Se poate observa uor
c o alegere q nu este cel mai bun rspuns al juctorului dac juctorul
alege q ). Aici cantitile de mrfuri oferite vor crete din partea fiecrei firme pn la
nivelul q .
2 / q
m i
=
2
2 / ) c
i j
/ q
m j
=
a (
i
=
Aceasta este soluia algebric a problemei. Dar se poate determina i o soluie grafic dup
cum urmeaz:
Ecuaiile (X) i(Y) dau forma funciei de rspuns al fiecrui juctor la alegerea fcut de
oponent i atunci :
( )
( ) c a q daca c q a ) q (
R
c a q dac c q a ) q (
R
< =
< =
2 2 2
1
1 1 1
2
2
1
2
1
unde i sunt funciile de cel mai bun rspuns pentru firmele 1 i 2.
R
1
R
2
n figura 2.11 se prezint rezolvarea, cu determinarea punctului de echilibru
( ) q , q
* *
2 1
.
O a treia modalitate de a determina echilibrul Nash al jocului este aceea de a elimina
strategiile strict dominate . Acest mod de rezolvare l vom lsa la latitudinea cititorului.
23
Jocuri statice n informaie complet
q
2
2
(
q
1
|
.
\
|
q q
2
,
1
* *
|
) (
1
2
q
R
) (
2
1
q
R
) 0 , ( c a
) ,
c a
0
2
) , 0 ( c a
)
c a
, ( 0
Figura 2.11
2.6.2. Duopolul Bertrand
In anul 1883 Bertrand a propus un alt model pentru comportamentul a 2 firme care se afl pe
o aceeai pia (cazul duopolului Bertrand). n acest caz vom presupune c cei doi juctori sunt
dou firme care produc pentru o pia 2 produse diferite, dar care pot fi substituibile. Funciile de
cerere ale consumatorilor sunt date prin relaia :
p b p a ) p , p ( q
j i j i i
+ =
( arat c cele 2 produse sunt substituibile iar b arat c cele dou produse sunt
complementare).
0 > b 0 >
Spaiul strategiilor celor doi juctori este dat de sensul dat de alegerea preurilor la care vor
vinde cele 2 produse i nu a cantitilor ca n cazul duopolului Cournot . Aducnd jocul sub
form normal avem :
- 2 juctori reprezint cele dou firme;
- spaiul strategiilor dat de alegerea preurilor cu p , p
j i
) , [
S
i
= 0 ;
- funciile de ctig - care vor fi profitul realizat de cele 2 firme, n cazul n care costul total
este dat prin
C
( presupunem de aceast dat c nu avem cost fix , iar costul
marginal este acelai pentru ambele firme ).
q c ) q (
i i
i
=
Atunci perechea ( ) p , p
* *
2 1
este un echilibru Nash al jocului considerat ( n care firmele aleg
simultan preul de desfacere ) dac fiecare firm rezolv urmtoarea problem de maximizare:
( ) | |( ) c p
p
b p a
max
p
, p
u max
i
*
i
*
i
i j
p
j
p
i i
+ =
0 0
Din condiiile de ordin nti rezult:
( )
( c
q
b a p
p
p
, p
u
j i
j * *
i
*
i i
+ + = =
2
1
0 )
Deci perechea de preuri ( )
p
, p
j
i
*
*
va satisface sistemul de ecuaii:
24
Jocuri statice n informaie complet
( )
( )
+ + =
+ + =
c p b a p
c p b a p
* *
* *
1 2
2 1
2
1
2
1
i de aici , soluia problemei:
( )
b
c a
p p
* *
+
= =
2
2 1
.
(Observm c aceast problem are soluie doar dac 2 < b , altfel vom obine preuri negative) .
Analog cu situaia anterioar putem determina i grafic echilibrul Nash al jocului.
Considernd funciile care dau cel mai bun rspuns al fiecrui juctor:
( )
( ) c p b a ) p (
R
c p b a ) p (
R
+ + =
+ + =
1 1
2
2 2
1
2
1
2
1
Reprezentnd grafic aceste funcii obinem figura 2.12:
c a +
2
Figura 2.12
) p (
R
1
2
2
c a +
b
c a +
b
c a +
p
2
p
1
)
b
c a
,
b
c a
(
+
2 2
) p (
R
2
1
2.6.3. Modelul Hottelling
Acest model a fost propus de Hottelling n 1929. El a presupus c intr-un ora exist dou
magazine, situate la cele 2 extremiti . ( Pentru uurina calculelor vom presupune c distana
dintre cele 2 magazine este 1). Fiecare din magazine vinde aceleai produse. Cumprtorii sunt
situai ntre cele 2 magazine i vom presupune c au o distribuie uniform de densitate 1 n acest
interval. S presupunem c primul magazin se afl situat la coordonata x = 0 iar cel de-al doilea la
x = 1. Costul unitar al mrfurilor din fiecare magazin este c.
25
Jocuri statice n informaie complet
Pentru consumatori va mai exista un cost suplimentar datorat transportului astfel nct
costul total pentru consumatori va fi t c C + = , unde t este costul transportului. Ei vor cumpra
mrfuri de la unul din magazine doar dac realizeaz un minim de cheltuieli C i dac nu
depesc venitul disponibil R .
Cererea pentru magazinul va fi dat de numrul de consumatori ce cumpr de la acest
magazin ( presupunnd c fiecare cumprtor a cumprat o unitate de marf la preul ) .
Figurnd acest joc sub form normal avem:
i
p
i
- juctorii cele dou magazine
- strategiile preurile pe care le aleg ; p , p
j i
- funciile de ctig sunt date de profitul magazinelor.
Cum ( ) X p , p
D
=
2 1
1
- funcia de cerere pentru magazinul 1, iar
( ) ( ) p , p
D
p , p
D
2 1 2 1
1 2
1 = alegerea consumatorilor se va face astfel nct:
( ) x t p tx p + = + 1
2 1
( cheltuielile pentru achiziionarea bunurilor sunt egale, indiferent da magazinul ctre care se vor
orienta) i de aici rezult relaiile:
( )
t
t p p
p , p
D
2
1 2
2 1
1
+
= ( )
t
t p p
p , p
D
2
2 1
2 1
2
+
=
n acest caz perechea ( ) p , p
* *
2 1
( echilibrul Nash al jocului) se obine din rezolvarea
problemei:
( ) ( ) ( )
p
, p
D
* c p
max
p
, p
U max
j
i
p
j
p
*
i
i
*
i
i
i i
=
0 0
cu R t c +
Condiiile de ordinul nti conduc la soluia :
( ) t c
q
p
j
i
*
*
=
2
1
i de aici la
t c p p
* *
+ = =
2 1
dac R
t
c +
2
3
2.6.4. Votul majoritar
Fie 3 juctori care au la dispoziie 3 alternative de vot: A , B i C . Aceti juctori voteaz
simultan pentru una din alternative, deci spaiul strategiilor va fi { } C , B , A
S
i
= .
Va ctiga alternativa cu cele mai multe voturi, iar dac nu exist o asemenea alternativ atunci va
fi aleas varianta A. Juctorii nu se pot abine de la vot . Funciile de ctig pentru cei 3 juctori
sunt:
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( ) 0
1
2
3 2 1
3 2 1
3 2 1
= = =
= = =
= = =
B
U
A
U
C
U
A
U
C
U
B
U
C
U
B
U
A
U
Pentru acest joc exist trei echilibre n strategii pure: A , B respectiv C . Totui mai exist i
alte echilibre . Dac juctorii 1 i 2 vor vota B , atunci oricare ar fi votul juctorului 3 acesta nu va
26
Jocuri statice n informaie complet
influena echilibrul, care va fi B . Deci i strategiile (B,B,B) respectiv (B,B,C) sunt echilibre Nash
ale jocului (observm c (B,B,A) nu este echilibru Nash deoarece dac juctorul 3 voteaz A, atunci
juctorul 1 va prefera i el s voteze A deoarece poate obine un ctig mai mare).
2.6.5. Tragedia bunurilor comune (publice)
Acest joc a fost propus pentru prima dat de David Hume (1739) care i-a pus problema
modului n care reacioneaz oamenii n privina unor bunuri care aparin comunitii (bunuri
comune sau bunuri publice). Vom presupune c ntr-un sat sunt n cresctori de oi care au la
dispoziie pentru creterea lor o pune comunal . Fie x
i
numrul de oi pe care le deine fiecare
cresctor (juctor). Atunci va fi numrul total de oi din sat. Costul unei oi care va
include cheltuielile pentru cumprarea i creterea sa l vom nota cu c , care este independent de
numrul de oi deinute de fiecare dintre ei (acesta poate fi privit i ca un cost marginal, egal pentru
toi juctorii).
=
=
n
i i
x
X
1
Cum preul unei oi se va stabili pe piaa liber, el va depinde de numrul total de oi existente
i fie acest pre V (X). Pentru creterea unei oi este necesar o anumit cantitate de iarb, iar
cantitatea total de iarb este limitat de dimensiunea punii, i n acest caz exist un numr
maxim de oi ce poate fi crescut pe acea pune, X
max
.
n acest caz :
( )
( )
X
X daca X V
X
X dac X V
max
max
=
< >
0
0
(Cu alte cuvinte, atta timp ct sunt suficient de puine oi, ele se pot dezvolta n voie, dar n
momentul n care sunt prea multe X > X
max
atunci nu mai exist suficient mncare pentru nici una
i nu mai pot supravieui). n mod formal, aceasta se poate exprima astfel:
( ) ( ) (*
X
X pentru X
V
X
V max
' ' '
< < < 0 0 )
Primvara fiecare cresctor va alege numrul de oi pe care l va crete ( S presupunem c
acest numr este perfect divizibil pentru uurina calculelor ) . Atunci spaiul strategiilor ar putea fi
obinut ca numrul de oi ce va fi ales , evident un numr pozitiv ntre ) , [
x
si
i
0 0 .
(Cum ns fiecare tie care este X
max
, numrul maxim de oi ce este suportat de pune,
n realitate . Funcia de ctig a juctorului i va fi dat de preul ce l poate obine
din vinderea oilor minus costul creterii acestora :
)
x
, [
x
max i
0
( )
x
c )
x
( V
x x i i i i U i
= .
( ) X V
X
max
X
Figura 2.13
27
Jocuri statice n informaie complet
Atunci pentru a obine echilibrul Nash al acestui joc ( x
i
astfel nct fiecare juctor s obin
utilitatea maxim posibil) va trebui s rezolve problema :
( ) ( * *
x
,
x u max
i
X x
*
i i
) , [
max i
0
)
pentru fiecare
juctor i. Condiiile de ordin I vor conduce la relaia :
( ) ( ) ( ) ( ) * * * n , i c
x
,
x V x x
,
x
V
i i
*
i
'
i
*
i
1 0 = = +
de unde rezult . Adunnd pentru toi juctorii relaia
x
i
*
( ) * * * obinem:
( ) ( )
x X
nc
X V X X
nV
n
i
*
i
* * ' * *
|
.
|
\
|
= = +
=1
0
sau echivalent:
( )
( )
( ) a c
n
X V X
X
* ' *
*
0 = + V
.
Relaia ne d optimul individual n condiiile jocului descris anterior . n contrast cu acesta
s calculm optimul social, adic optimul la nivelul ntregii colectiviti . Pentru aceasta va trebui s
rezolvm problema :
( ) Xc - X XV
max
) X 0
.
Condiia de ordin I pentru aceasta conduce la soluia : ( ) ( ) (b c
X V X X
* * ' * * * *
0 = + ) V cu X
* *
soluia
acestei ecuaii. Comparnd a) cu b) se observ c
X X
* * *
> .
S presupunem c nu este aa . Atunci iar
X X
* * *
< ( ) ( )
X
V
X
* * *
V deoarece 0 <
V
'
. n plus ,
( ) ( )
X V X V
* * ' * '
> 0 deoarece i 0 <
V
' '
. De aici rezult c
X
*
<
n
X
* *
adic partea stng din a) este strict
mai mare dect partea stng din b) ceea ce este imposibil, ambele fiind egale cu zero. Deci
presupunerea fcut este fals i
X X
* * *
> .
n cazul acestui joc observm c juctorii nu vor alege strategia care s conduc la optimul
social , adic situaia optim pentru comunitate . Ei vor fi tentai s creasc mai multe animale dect
nivelul optim, n acest fel reducndu-se i bunstarea lor .
2.6.6. Jocul inspeciei
n cazul acestei aplicaii vom arta c echilibrul Nash poate s nu existe n strategii pure, dar
exist n strategii mixte. Aceast situaie se poate aplica n diverse situaii cum ar fi inspecia
armelor (n armat, pentru ca soldaii s pstreze armele curate), prevenirea crimelor, controalele
financiare sau n supravegherea muncitorilor i incitarea lor la o munc. Vom descrie jocul astfel:
un muncitor (juctorul 1) lucreaz pentru un patron (juctorul 2). Muncitorul poate fie s
munceasc (M) fie s chiuleasc (C), acestea fiind strategiile pe care le are la dispoziie.
Patronul poate fie s vin n inspecie (I) fie s nu vin (NI). n cazul n care vine n
inspecie, patronul poate avea evidena clar a modului n care lucrez muncitorii si, dar este
costisitor, adic l va costa h . Patronul va plti salariul muncitorului mai puin n cazul n care l
prinde chiulind, caz n care i taie ziua de munc, deci muncitorul va primi 0. (Nu l poate obliga s
plteasc amend, dar l poate sanciona prin neplata acelei zile de munc).
w
28
Jocuri statice n informaie complet
Pentru muncitor costul unei zile de munc este c , iar n cazul n care muncete, produce
valoarea v pentru patron. Pentru simplificare s presupunem c c i c (altfel nu
are sens s munceasc).
0 > > h c w>
Jocul sub form normal este prezentat n figura 2.14:
P
y 1-y
I NI
x C 0,-h
w,-w
M
1-x
M
w-c,v-w-h
w-c,v-w
Figura 2.14
Observm uor c acest joc nu are un echilibru n strategii pure (Dac patronul nu va
inspecta atunci muncitorul prefer s chiuleasc . Dac patronul decide s inspecteze, iar muncitorul
tie aceasta , atunci este mai bine s munceasc . Patronul n schimb , tiind acest lucru adic
faptul c muncitorul prefer s munceasc este mai ctigat dac nu face inspecia ) . n acest caz
patronul trebuie s aleag o strategie mixt , fie x probabilitatea ca muncitorul s chiuleasc i
probabilitatea ca patronul s inspecteze. n figura (*) este reprezentat situaia . Muncitorul este
indiferent dac muncete sau chiulete n cazul n care :
y
( ) ( ) ( ) ( ) c w y c w y w y y + = + * 1 * * 1 0 * adic ( ) * *
w
c
y c w y = = .
El este indiferent ntre a chiuli i a munci dac valoarea ctigului din a chiuli ( ) este egal
cu pierderea de venit .
c
w y *
Patronul este indiferent ntre a inspecta i a nu inspecta dac :
( )( ) ( ) ( ) ( ) w v x w x h w v x h x + = + * 1 * 1 ) ( * adic ( ) * * *
w
h
x h w x = =
Pentru patron, dac este indiferent ntre a inspecta sau a nu inspecta, atunci costul inspeciei
( ) trebuie s fie egal cu salariul economisit la plata muncitorului . h w x *
Deci singurul echilibru al jocului considerat este un echilibru n strategii mixte descris prin
relaia :
|
|
.
|
\
|
.
|
\
|
|
.
|
\
|
w
c w
w
c
w
h w
w
h
, , ,
|
.
Observaie. Plecnd de la acest rezultat se poate calcula i contractul optimal ce este oferit
de patron, adic salariul ce va maximiza ctigul ataat al patronului: w
( ) ( ) hy w xy v x
max
w
1 1
0
.
Din rezolvarea acestei probleme rezult simplu c ( ) c hv dac hv w > = . Pentru un w dat
( w > c) patronul poate alege + =
w
c
y , cu arbitrar de mic i n acest caz muncitorul va munci
cu probabilitatea 1, iar pentru patron ctigul (aproximativ) va fi
w
w
h
v
w
c h
w v |
.
|
\
|
>
1
.
29
Jocuri statice n informaie complet
2.7. Probleme propuse
1.S se determine echilibrul Nash n cazul jocului descris sub form normal n urmtoarea
matrice a ctigurilor.
2
S M D
S 2,0 1,1 4,2
M 3,4 1,2 2,3 1
J 1,3 0,2 3,0
Figura 2.15
2. Doi joctori negocieaz modul n care s mpart un milion de lei. Ei vor alege simultan
suma pe care o doresc i fie respectiv acele sume (evident , . Dac
atunci juctorii vor primi sumele cerute iar dac
S
1
S
2
1 0
2 1
S
,
S
1 1
2 1
+
S S
2 1
> +
S S
atunci nu vor primi
nimic. Care este echilibrul Nash ( n strategii pure) asociat acestui joc?
3. n cazul modelului duopolului Cournot , n care funcia invers de cerere este
, iar firmele au costuri marginale diferite c ( ) Q a Q p =
1
pentru firma 1 i c
2
pentru firma 2.
Care este echilibrul Nash al jocului dac
2
0
Q
c i
< < ? Dar dac dar
?
Q
c c
< <
2 1
c
Q
c
1
2
2 + >
4. Artai c n cazul duopolului Bertrand pentru un produs omogen, singurul echilibru Nash
posibil al jocului este ca firmele s aleag preul egal cu costul marginal .
5. Pentru jocul sub form normal descris n figura urmtoare determinai condiiile ca
strategia ( s fie unicul echilibru Nash al jocului. ) D J,
2
S D
S a,b c,d 1
J e,f g,h
Figura 2.16
6. S se determine toate echilibrele Nash (n strategii pure i n strategii mixte) asociate
jocului sub forma normal descris n figura 2.17 :
2
S M D
S 0,0 4,5 5,4
M 5,4 0,0 4,5 1
J 4,5 5,4 0,0
Figura 2.17
30
Jocuri statice n informaie complet
31
7. Artai c jocul sub form normal din figur are un echilibru unic, iar acesta este n
strategii pure.
2
S M D
S 1,-2 -2,1 0,0
M -2,1 1,-2 0,0 1
J 0,0 0,0 1,1
Figura 2.18
8. Determinai echilibrele Nash ale jocului sub form normal descris prin urmtoarea
matrice a ctigurilor :
2
S D
S 2,1 0,2 1
J 1,2 3,0
Figura 2.19
9. Presupunem c dou firme doresc s angajeze cte un muncitor , oferind salarii diferite
i , astfel nct
w
1 w2 w w w 1 2 1
2
2
1
< <
. Presupunem c exist doi muncitori care vor cere slujbele .
Dac ambii se adreseaz unei singure firme , atunci va fi angajat doar unul, la ntmplare, n timp ce
al doilea va rmne omer. Dac se adreseaz fiecare la o alt firm, atunci vor fi ambii angajai.
Sub form normal jocul este urmtorul:
Muncitor 2
Se adreseaz firmei 1
Se adreseaz firmei 2
Se adreseaz firmei 1
1/2w
2,
1/2w
1
w
1,
w
2
Muncitor 1
Se adreseaz firmei 2
w
2,
w
1
1/2w
1,
1/2w
2
Figura 2.20
S se determine echilibrul jocului.
CAPITOLUL 3
Jocuri dinamice n informaie complet
3.1. Jocuri dinamice n informaie complet i perfect
3.1.1. Introducere
Un joc dinamic este acel joc n care alegerile juctorilor sunt efectuate la diverse momente
de timp.
Un exemplu clasic pentru asemenea jocuri este aa numitul joc al grenadei. Iat n ce
const acesta: un individ care are n mn o grenad i spune unui al doilea: daca nu mi dai 1
milion de USD voi detona grenada i vom muri mpreun. n aceste condiii celalalt juctor poate
fie s-i dea banii, fie s nu i dea, riscnd ca cellalt s detoneze grenada.
n acest joc vedem c exist trei momente n care se fac alegerile juctorilor, i anume:
ameninarea primului juctor, apoi decizia celui de-al doilea de a da sau de a nu da banii i n sfrit
decizia celui cu grenada de a o detona sau nu.
Definiia 3.1. Vom numi istorie a jocului la momentul t+1 (sau n etapa t+1) secvena
de decizie pe care au luat-o juctorii n cele t etape anterioare ale jocului.
1 + t
h
) , , , (
1 0 1 t t
s s s h K =
+
n aceste condiii vom defini mulimea aciunilor posibile pentru juctorul i ca fiind:
Definiia 3.2. Vom numi aciune fezabil a juctorului i la momentul (etapa) t+1 acea
aciune ce poate fi aleas de juctorul i din mulimea aciunilor pe care le are la dispoziie. Vom
nota mulimea aciunilor posibile (fezabile) a juctorului i la momentul t+1 cu . ) (
1 + t
i
h A
Definiie 3.3. Vom numi strategie pur a juctorului i un plan al aciunilor pe care le va juca
juctorul n fiecare etapa t.
Dac vom nota cu H
t
mulimea istoriilor jocului la momentul t, atunci ( )
U
t t
H h
t
i
t
i
h A H A
= ) ( .
Definiia 3.4. Vom numi funcie de ctig a juctorului i aplicaia
R H U
t
i i
+1
: ,
( ) R H s s u
t
i i i i
+
1
: , .
Definiia 3.5. Un echilibru Nash n strategii pure pentru jocul dinamic G va fi
acea strategie care respect condiia
(
i i i
u , S = )
( ) ( )
i i i i i i i i
S s s s u s s u
' '
, , (cu alte cuvinte cea mai bun
alegere posibil a juctorului i indiferent de alegerile celorlali juctori).
Definiie 3.6. Vom numi joc sub form extins acel joc dinamic n care se cunosc:
a) mulimea juctorilor;
b) mulimea strategiilor fiecrui juctor;
c) ordinea n care juctorii iau deciziile;
Jocuri dinamice n informaie complet
d) funciile de ctig ale juctorilor.
Reprezentarea grafic a juctorilor sub forma extins se face sub forma unui graf de tip
arbore.
n acest graf vom avea urmtoarele elemente:
- nodurile grafului sunt momentele la care juctorii aleg o strategie posibil;
- arcele grafului reprezint aciunile alese ale juctorilor;
- nodul iniial reprezint momentul de nceput al jocului;
- nodurile finale indic sfritul jocului i n dreptul lor sunt specificate ctigurile
juctorilor.
De exemplu, reprezentnd sub forma extins jocul grenadei obinem:
Figura 3.1
|
|
.
|
\
|
3
3
|
|
.
|
\
|
1
1
|
|
.
|
\
|
2
2
|
|
.
|
\
|
1
0
1 1
ND D ND D
NP P
2
Observaie Vom presupune c graful ce descrie forma extins a jocului nu conine cicluri i
duble precedene, cu alte cuvinte se poate defini o relaie de ordine parial pe acest graf: x
y care nseamn nodul lui x este naintea nodului y.
Definiia 3.7. Vom numi cale a jocului mulimea nodurilor i arcelor ce conduc din nodul
iniial ntr-un nod final.
Observaie O cale a jocului poate fi identificat cu istoria final a acestuia.
Definiia 3.8. Vom numi joc n informaie perfect acel joc n care toi juctorii tiu la orice
moment t ce decizii s-au luat n etapa anterioar (la momentul t-1).
Definiia 3.9. Vom numi joc cu memorie perfect (perfect recall) acel joc n care toi
juctorii tiu istoria jocului de la momentul 0 pn la momentul t.
Definiia 3.10. Vom numi echilibru perfect n subjoc (subgame perfect equilibrium) o
strategie s care, pentru orice istorie h
t
, ( )
t
h S din ( )
t
h G este un echilibru Nash al lui ( )
t
h G .
3.1.2. Determinarea echilibrului prin algoritmul induciei recursive (backward
induction).
Fie un joc dinamic cu doi juctori, dou etape, iar mulimile strategiilor juctorilor sunt S
1
i
S
2
, iar funciile de ctig sunt U
1
i U
2
.
34
Jocuri dinamice n informaie complet
Desfurarea jocului este urmtoarea:
Juctorul 1 alege aciunea a
1
din S
1
n prima etap. n etapa a doua juctorul 2 observ
alegerea juctorului 1, deci pe a
1
i alege aciunea sa a
2
din S
2
, dup care jocul ia sfrit. n acest
moment ctigurile juctorilor vor fi u
1
(a
1
,a
2
) respectiv u
2
(a
1
,a
2
).
Pentru jocul descris anterior vom formula algoritmul induciei recursive. Acest algoritm
pornete de la principiul c, la ultima etap a jocului, juctorul care urmeaz s decid tie deja care
au fost strategiile alese de ceilali deci n consecin va alege acea aciune care s i maximizeze
ctigul.
Etapa 1. Juctorul 2, observa alegerea juctorului 1 i caut aciunea care s i maximizeze
ctigul:
( ) ( )
2 1 2 1 2
2 2
a , a u max arg a R
S a
=
Aceasta constituie funcia de reacie (funcia celui mai bun rspuns) a juctorului 2 n raport
cu aciunea aleas de juctorul 1.
Etapa 2. Juctorul 1 tie c juctorul 2 va juca ( )
1 2
a R i prin urmare va caut s-i
maximizeze ctigul prin alegerea strategiei:
( ) ( )
1 2 1 2 1
1 1
a R , a u max arg a
S a
*
=
3.1.3. Duopolul Stackelberg
Pe piaa unui produs exist doi productori, firma 1 i respectiv firma 2. Strategiile posibile
pentru cele dou firme sunt cantitile produse, q
1
respectiv q
2
, pozitive. Funciile de ctig sunt
date de profiturile firmelor. Desfurarea jocului este urmtoarea: firma 1 alege cantitatea pe care o
produce i o trimite pe piaa. Firma 2 observ cantitatea produs de firma 1 i i stabilete la rndul
ei producia q
2
cutnd s maximizeze profitul.
Ambele firme au costuri marginale (i medii) egale, de valoare c. Funcia de cerere invers
este:
Q a Q P = ) ( , unde Q
2 1
q q + = .
Se cere s se determine echilibrul acestui joc.
Rezolvare
Sub forma extins, jocul are urmtoarea descriere:
1. firma 1 alege cantitatea produs q (aciunea a ). 0
1
1
2. firma 2 observ cantitatea produs de firma 1, i alege cantitatea produs
(aciunea a ).
0
2
q
2
3. jocul ia sfrit, funciile de ctig ale celor 2 firme fiind nivelurile profiturilor,
( ) ( ) ( ) 2 , 1 , , = = i c Q P q q q
i j i i
cu Q a Q P = ) ( , unde
2 1
q q Q + = .
Determinm echilibrul prin inducie recursiv:
Etapa 1 n ultima etap a jocului, firma 2 observ cantitatea q
1
aleas de prima firma i i
va alege producia q
2
astfel nct s rezolve problema:
( ) ( ) ( ) ( ) c q q P q q q q R
q
+ = =
2
*
1 2 2
*
1 2
*
1 2
, max arg
2
.
35
Jocuri dinamice n informaie complet
De aici obinem ( ) ( ) *
2 2
*
1 *
1 2
*
2
q c a
q R q
= = .
Etapa 2 Firma 1 tie c funcia de reacie a firmei 2 este cea din relaia (*) i alege
cantitatea produs astfel nct s-i maximizeze profitul:
*
1
q
( )
*
1
*
1 *
2 1 1
*
1
2 2
max arg , max arg
1 1
q c
q c a
a q q q
q q
(
|
|
.
|
\
|
= =
4
2
*
2
*
1
c a
q
c a
q
=
= .
Deci echilibrul jocului dinamic determinat prin inducie recursiv este:
( )
|
.
|
\
|
=
4
,
2
,
*
2
*
1
c a c a
q q .
Nivelul ctigurilor ce corespund acestor strategii sunt:
( )
( ) ( )
|
|
.
|
\
|
=
16
,
8
,
2 2
*
2
*
1
c a c a
.
Cu alte cuvinte, firma care alege prima strategie va fi avantajat, ea obinnd un profit dublu
fa de cea de-a doua firm.
n acest caz suplimentul de informaie pe care ce-a de-a doua firm l are (prin faptul c tie
cantitatea aleas de prima) se traduce printr-o pierdere de profit (de la
( ) ( )
16
la
9
2 2
c a c a
s c
=
\
|
1
2
|
|
.
|
\
|
0
0
|
|
.
|
\
|
1
1
|
|
.
|
\
|
2
3
2 2
D S D S
D S
1
Figura 3.2
36
Jocuri dinamice n informaie complet
Pornind de la forma extins vom construi forma normal echivalent :
2
(S,S) (S,D) (D,S) (D,D)
S 2, 1 2, 1 0, 0 0, 0 1
D -1, 1 3, 2 -1, 1 3, 2
Figura 3.3
Aceasta form normal se construiete ca un plan complet de aciune posibil n raport cu
alegerile juctorilor. (De exemplu, dac juctorul 1 alege strategia stnga (S), atunci juctorul 2
poate alege S sau D, dar netiind ce a ales juctorul 1, se gndete la 4 variante de ctig posibile,
n raport cu ce ar fi putut juca primul juctor).
Pentru aceast form putem determina echilibrul prin algoritmii descrii n capitolul
anterior. Astfel, jocul descris n figura 3.3 are un unic echilibru n strategii pure, i anume (D,D).
Acelai echilibru rezult i n cazul n care aplicm algoritmul induciei recursive.
3.2. Jocuri dinamice n informaie imperfect
3.2.1. jocuri dinamice n informaie imperfect
Jocurile dinamice n informaie imperfect sunt acele jocuri n care juctorii (unul sau mai
muli) nu cunosc istoria jocului (sau o etapa a acesteia).
S relum jocul de la exemplul anterior, de acest dat n informaie imperfect. (figura 3.4)
|
|
.
|
\
|
1
2
|
|
.
|
\
|
0
0
|
|
.
|
\
|
1
1
|
|
.
|
\
|
2
3
2 2
D S D S
D S
1
Figura 3.4
Observaie Linia punctat din dreptul juctorului 2 indic faptul c juctorul 2 nu tie care a
fost strategia aleas de juctorul 1 (S sau D) n prima etap a jocului. Aceasta situaie poate fi
considerat echivalent cu faptul c juctorul 2 alege simultan cu primul juctor strategia.
n acest caz putem reprezenta sub form normal jocul n informaie imperfect, respectiv
sub form matriceal, ca n figura 3.5:
2
S D
S 2,1 0,0 1
D -1,1 3,2
Figura 3.5
37
Jocuri dinamice n informaie complet
n acest caz jocul are dou echilibre, i anume (S, S), respectiv (D,D). Totui, echilibrul
(S,S) nu este credibil deoarece (D,D) aduce ctiguri mai mari ambilor juctori.
3.2.2 Echivalena strategiilor pure cu cele mixte
Definiia 3.11 Dou strategii pure s
i
i s
i
sunt echivalente dac au aceeai distribuie de
probabilitate oricare ar fi strategiile pure ale adversarilor.
Exemplu Se consider jocul sub form extins :
b a
1
1 1
d c d c
B A
2
Pentru juctorul 1, strategiile (b,c) i respectiv (b,d) sunt
echivalente deoarece probabilitatea de a fi jucate este zero.
Figura 3.6
Definiia 3.12 Vom numi forma strategic redus (sau forma normal redus) a unui joc
sub forma extins acel joc n care s-au pstrat doar clasele de strategii echivalente (se pstreaz doar
un singur membru al fiecrei clase de echivalen).
Analog modului n care am definit strategiile mixte pentru jocurile statice, le vom defini i
pentru jocurile dinamice.
Luce i Raiffa (1987) au fcut urmtoarea analogie pentru a explica relaiile dintre strategiile
mixte i cele pure (sau de comportament): o strategie pur este o carte de instruciuni, n aceast
carte se specific la fiecare pagin modul n care se va juca dac avem anumite informaii. Spaiul
strategiilor este mulimea crilor din bibliotec.
O strategie mixt este o distribuie de probabilitate asupra crilor din bibliotec, adic un
mod aleator de a selecta o carte.
n condiiile unor jocuri n informaie perfect (perfect recall) strategiile mixte i cele pure
(comportamentale) sunt echivalente.
Vom demonstra c orice strategie mixt p
i
a unei forme strategice genereaz o strategie pur
unic s
i
astfel :
Fie R
i
(h
i
) mulimea strategiilor pure ale juctorului i ce preced h
i
, atunci ( ) ( )
i i i
h R s
exist un profil s
-i
de strategii asociate h
i
.
Vom avea : ( ) ( )
( )
( )
( )
( )
=
=
i i i
i i i
i i i
h R s
i i
a a s
h R a
i i i i i
s P s P h a s .
Dac p
i
asociaz probabilitatea 0 (zero) pentru ( ) ( )
i i i
h R s atunci:
( ) ( )
( ) { }
=
=
i i i
a h s
i i i i i
s P h a s .
38
Jocuri dinamice n informaie complet
Cum (
i
s ) este nenegativ, atunci ( )
( )
1 =
i
h S a
i i i
h a s deoarece fiecare s
i
indic aciune
pentru juctorul i.
Exemplu Fie jocul sub forma extins din figura 3.7:
i istoriile : h
0
: (S)
D S
1
d s
2
h
1
: (D,d)
Figura 3.7
Fie , condiionat de faptul c se cunoate istoria h ( ) ( ) ( d , D / ; s , S / p 2 1 2 1
1
= )
1
.
Aceasta strategie mixt este echivalent cu strategia (D,d), deoarece strategia jucat n cazul
istoriei h
1
va fi d cu probabilitatea 1, adic ( ) ( )
'
1 1
, h R d s .
Ceea ce am artat pn aici este sintetizat de urmtoarea teorem:
Teorema Kuhn
ntr-un joc dinamic n informaie perfect strategiile mixte i strategiile pure sunt
echivalente (sau altfel spus, fiecare strategie mixt are echivalent o unic strategie pur, sau fiecare
strategie pur este echivalent cu fiecare strategie mixt generat de aceasta).
Observaie Mai multe strategii mixte pot genera aceeai strategie pur.
Exemplu Se consider jocul sub forma extins:
Z
4
Z
3
Z
2
Z
1
h h 2
D C B A
D S
1
Figura 3.8
Fie S
2
={A,B,C,D} mulimea strategiilor juctorului 2 i
S
2
= (A,C)
S
2
= (A,D)
S
2
= (B,C)
S
2
= (B,D)
- strategii pure
Fie strategiile mixte s
3
=( , , , ) i s
4
=( , 0 , 0 , )
39
Jocuri dinamice n informaie complet
Atunci:
p
2
(A/h)= p
2
(B/h)=
P
2
(C/h)= P
2
(D/h)= .
Deci, s
3
i s
4
sunt echivalente.
3.2.3. Dominan strict i echilibru Nash n jocurile dinamice
Se consider jocul sub forma extins, n care:
S
1
={A,B}
S
2
={C,D}
(0, 0) (3, 1)
(2, 2)
B A
1
D C
Figura 3.9
Reprezentarea acestui joc sub forma normal este:
2
C D
A 2, 2 2, 2
1
B 3, 1 0, 0
Figura 3.10
Observm c pentru juctorul 2 strategia C nu domin strict strategia D (2,1) (2,0). De aici
apare pentru juctorul 2 posibilitatea de ameninare: dac 1 nu joaca A, atunci 2 va juca D.
f
Acest joc, observm c are dou echilibre n strategii pure, i anume (A,D) respectiv (B,C).
Pentru a determina echilibrele unui joc dinamic vom utiliza teorema Zermelo Kuhn:
Teorema Zermelo Kuhn
Un joc finit n informaie perfect are un echilibru Nash n strategii pure.
Demonstraia acestei teoreme se face pe baza algoritmului lui Zermelo care este o
generalizare a induciei recursive cu mai muli juctori (pe baza programrii dinamice).
Cum jocul este finit, exist o mulime de noduri penultime, adic anterioare nodurilor
terminale. n aceste noduri se determin ctigurile maxime pe care le pot avea juctorii ce trebuie
s joace n acel moment.
De aici vom avansa n sens invers n cadrul arborelui pn la nodul iniial, pentru care vom
determina strategia de echilibru. Se verific uor c aceast strategie este un echilibru Nash al
jocului dinamic.
40
Jocuri dinamice n informaie complet
Observaie Dac vom slbi condiiile teoremei, atunci algoritmul lui Zermelo nu mai este
eficient. De exemplu, pentru jocurile infinite sau pentru jocurile cu strategii nestrict dominate nu se
poate determina echilibrul pornind de la acest algoritm.
3.2.4. Echilibrul perfect n subjoc
Definiia 3.13 Vom numi subjoc propriu G al unui joc sub form extins T secvena de
noduri i arce ce ncep dintr-un nod unic i se continu cu toi succesorii acelui nod (un subarbore al
arborelui iniial).
Definiie 3.14 Vom numi echilibru perfect n subjoc acea strategie p a jocului G care este
echilibru Nash al oricrui subjoc propriu al lui G.
Observaii
1. Cum orice joc poate fi privit ca propriul sau subjoc, un echilibru perfect al
subjocului este n mod necesar un echilibru Nash.
2. Echilibru perfect al subjocului este n cazul jocurilor finite acelai cu cel
determinat prin algoritmul induciei recursive.
Critici la adresa induciei recursive
Exemplu 1 Se consider jocul cu n juctori descris sub forma extins n figura 3.11:
O
3 2 C C
O
n
(2,2,,2)
C
O
( 1/n , 1/n ... ..1/n ) ( , ,, ) ( 1, 1,, 1 )
O
1
Figura 3.11
Strategia C nseamn continuare din partea fiecrui juctor i, iar O strategia de oprire a
jocului.
Fie p probabilitatea ca fiecare juctor s joace strategia C.
Aplicnd algoritmul induciei recursive obinem soluia (C,C,,C).
Totui, probabilitatea cu care privete juctorul 1 sau 2 posibilitatea ca jocul s continue prin
continuarea pn la sfrit este p
n-1
respectiv p
n-2
. Cum p(0,1), p
n-1
0, adic probabilitatea cu care
crede juctorul 1 c se va ajunge la sfritul jocului tinde la zero, deci apare credina c un alt
juctor poate opri jocul nainte de final cu o probabilitate tinznd la 1.
Exemplu 2 Centipedul lui Rosenthal
Se consider jocul sub forma extins (n 100 etape ) descris n figura de mai jos, n care
strategiile sunt C = continu, O = oprete jocul.
( 98,98 )
2 c c
O
( 97,99 ) ( 99,97)
O
1 2 c
( 3,1 )
O
1 c
O
( 1,3 ) ( 2,0 )
O
1 2 c c
O
( 0,1 ) ( 1,0)
O
1
Figura 3.12
41
Jocuri dinamice n informaie complet
42
Prin inducie recursiv rezult c echilibrul acestui joc va fi oprirea jocului de la prima
etap.
Aceast ipotez apare n realitate puin probabil, deoarece pentru orice nivel de ateptare (i
ncredere) suplimentare fiecare din cei doi juctori va ctiga mai mult.
Exemplu 3 Fie un joc sub forma extins descris n figura 3.13.
(6,0,6)
(8,6,8)
(0,0,0) (7,10,7) (7,10,7) (0,0,0)
D
3
C
A
1
1 1
H G H G
F E
2
B
Figura 3.13
Acest joc are trei echilibre n strategii pure, respectiv (B,D,E,H) ; (B,D,F,G) i un echilibru
n strategii mixte ( (B,D,E,H); (B,D,F,G)).
Aceast situaie nu poate fi rezolvat prin intermediul algoritmului induciei recursive sau
prin teorema Zermelo, deoarece echilibrul perfect n subjoc nu poate fi definit n strategii mixte.
3.3. Jocuri repetate
3.3.1. Introducere
O categorie special o reprezint jocurile repetate.
Definiia 3.15 Vom numi joc-etap acea secven de decizii (static sau dinamic) ce se
repet de un numr T de ori (T eventual infinit).
Jocurile pot fi finit sau infinit repetate, n raport cu orizontul T n care se desfoar jocul.
n continuare vom defini elementele fundamentale ale acestor tipuri de jocuri:
Vom nota cu G jocul-etap i ) ,U A (x
i
=
i
spaiul distribuiilor de probabilitate asupra aciunilor A
i
ale juctorului i;
Jocurile se desfoar n informaie perfect i complet, respectiv la sfritul fiecrei etape
orice juctor tie istoria jocului i ctigurile obinute.
Jocuri dinamice n informaie complet
Vom nota cu aciunile alese de cei n juctori la momentul t, i atunci
istoria jocului va fi .
) ,..... , (
2 1
t
n
t t t
a a a a =
,....a a , (a h
1 0 t
= )
1 t
O strategie pur n jocurile repetate este reprezentat de o secven de strategii pure ale jocului-
etap, de la nceput pn la sfritul jocului.
O strategie mixt P
i
va fi descris de o secven de strategii mixte
i i
.
Funciile de ctig vor fi descrise prin:
- pentru jocuri infinit repetate
=
=
0
)) ( ( ) 1 (
t
t t
i
t
p i
h p u E U
)) ( (
1
1
0
1
t t
i
T
t
t
T
p i
h p u E U
=
+
=
T
t
t t
i
T
h p u
T
E
0
)) ( ( )
1
( inf lim max
Pentru jocurile finit repetate soluia poate fi determinat prin algoritmul induciei recursive,
iar acest algoritm arat faptul c echilibrul Nash al jocului finit repetat este repetarea n fiecare
etap a echilibrului Nash al jocului etap.
3.3.2. Modelul de negociere Rubinstein Stahl
n 1982 Rubinstein i Stahl au propus urmtorul joc:
Doi juctori doresc s mpart suma de 1 milion de dolari. Jocul este dinamic, infinit repetat
i se desfoar astfel:
n perioadele pare, juctorul 1 propune o mprire a sumei n proporia x, respectiv 1-x
pentru juctorul 2;
n perioadele impare, juctorul 2 primete propunerea juctorului 1, o analizeaz, i fie o
accept fie o respinge. n cazul n care o va respinge, atunci va face la rndul su o
propunere de mprire a sumei (x, 1-x).
n cazul acestui joc dinamic avem informaie perfect deoarece juctorii tiu istoria jocului
n fiecare moment. Ctigurile juctorilor vor fi la momentul t, n cazul n care jocul ia sfrit,
de ( . )) 1 ( , ;
2
x x
t t
43
Jocuri dinamice n informaie complet
Echilibrul perfect n subjoc
Observm c avem un numr mare de echilibre Nash n acest joc. De exemplu strategia:
juctorul 1 cere x = 1 i refuz orice alt mprire, respectiv juctorul 2 ofer x=1 i accept
orice ofert este un echilibru Nash.
Totui, acest echilibru Nash nu este un echilibru perfect n subjoc. Dac juctorul 2 refuz
oferta juctorului 1 n a doua etap, i ofer la rndul su x > , atunci juctorul 1 trebuie s o
accepte deoarece este cel mai bun ctig posibil, deoarece refuznd aceast ofert, n etapa
urmtoare va primi (chiar dac 2 accept mprirea (1,0) doar , care este mai mic dect
2
1
1
).
Un echilibru perfect n subjoc va fi urmtorul: juctorul i va cere proporia
j i
j
1
) 1 (
atunci cnd i face oferta i va accepta orice proporie mai mare sau egal cu
j i
j i
1
) 1 (
, respectiv
va refuza orice proporie mai mic.
Demonstraie:
Fie
1
v respectiv
1
v ctigurile cele mai mici, respectiv cele mai mari pe care le poate obine
juctorul 1 dac va continua jocul pentru orice echilibru perfect n subjoc dac ncepe acesta, i n
mod analog definim aceste ctiguri pentru juctorul 2, (dac ncepe juctorul 1)
2
v respectiv
2
v .
Vom avea
1
w ,
1
w ctigurile minime, respectiv maxime de continuare a jocului pentru juctorul 1
dac va ncepe juctorul 2, i
2
w ,
2
w ctigurile minime (maxime) de continuare pentru juctorul 2
dac ncepe el jocul.
Dac ncepe juctorul 1, atunci 2 va accepta orice ofert x astfel nct oferta va depi
2 2
v ,
deoarece 2 nu poate atepta mai mult de
2
v din continuarea jocului. Deci avem
2 2 1
1 v v .
Simetric, juctorul 1 va accepta orice ofert
1 1
v i
1 1 2
1 v v .
Dac 2 nu va oferi niciodat mai mult de
1 1
v , atunci ctigurile juctorului 1 dac va
continua jocul, atunci cnd 2 face prima ofert respectiv
1
w , este cel mult
1 1
v .
Cum 2 poate obine cel puin
2
v din continuare - prin a refuza oferta lui 1, atunci 2 va
refuza orice ofert x astfel nct
2 2
v x 1 .
De aici, pentru juctorul 1 avem: ) v , v max( ) w , , v max( v
1
2
1 2 2 1 1 2 2 1
1 1 =
Dar:
2 2 1
2
1 2 2
1 1 v ) v , v max( =
deoarece dac
0
1 1
2
1 1
= v v v , dar
1
2
1 2 2
1 v v >
deoarece nici
2
nici
2
v nu pot fi mai mici ca 1, deci
2 2 1
1 v v .
44
Jocuri dinamice n informaie complet
Simetric,
1 12 2
1 v v .
Din inegalitile anterioare avem:
) 1 ( 1 1
1 1 2 2 2 1
v v v sau
2 1
2
1
1
1
v
i ) 1 ( 1
1 1 2 1
v v sau
2 1
2
1
1
1
v
.
Cum
2 1
2
1 1 1 1
1
1
= = v v v v .
n mod analog
2 1
2
2 2
1
1
= = v v iar
2 1
2 1
1 1
1
) 1 (
= = w w
respectiv
2 1
2 2
2 2
1
) 1 (
= = w w .
De aici rezult c echilibrul perfect n subjoc este unic.
Observaie
n condiiile n care juctorul 1 va muta primul, atunci acesta este n avantaj. De
exemplu, dac
1
=
2
, atunci
2
1
1
1
1
1
2
1
>
+
=
v
, deci 1 poate obine mai mult de
jumtate din ctig.
Totui, acest avantaj va dispare dac perioada n care se joac jocul va fi relativ mic,
deoarece depinde mult de rbdarea juctorilor. De exemplu, pentru cu t durata
jocului i , r
t r t r
e e
2 1
2 1
,
= =
0 t
1
1
i r
2
fiind indicatori ai rbdrii juctorilor, atunci
i
este aproximativ
iar converge ctre t r
i
1 v
2 1
2
r r
r
+
. Deci pentru r
1
= r
2
prile mprite de cei 2 juctori vor fi
egale.
3.3.3. Jocuri finit repetate
Vom considera urmtorul exemplu: fie jocul-etap G dilema prizonierului i este repetat
de un numr T de ori, finit. Jocul finit repetat va fi G(T).
Juctor 2
A N
A -8,-8 -10,0 Juctor 1
N 0,-10 -2,-2
Determinnd echilibrul prin inducie recursiv obinem: la ultima etap, ambii juctori vor
acuza deoarece nu au ncredere c jocul ar putea avea o desfurare cooperativ (adopt echilibrul
Nash). La penultima etap, deja se cunoate (anticipat) rezultatul ultimei etape, deci juctorii vor
45
Jocuri dinamice n informaie complet
adopta acelai comportament, respectiv se vor acuza reciproc. Continund raionamentul, atingem
etapa iniial a jocului prin determinarea la echilibru n fiecare etap a echilibrului Nash pentru
jocul-etap. Deci echilibrul jocului finit repetat este repetare de T ori a strategiei (A, A).
Propoziie Dac jocul-etap G are un echilibru Nash unic, atunci pentru orice joc finit
repetat G(T) exist un echilibru perfect n subjoc unic: repetarea echilibrului Nash asociat jocului-
etap.
Demonstraie Prin algoritmul induciei recursive, plecnd de la ultima etap se poate atinge
pentru orice subjoc propriu repetarea echilibrului Nash al jocului-etap, aa cum a fost artat
anterior.
Critici la echilibrul perfect n subjoc
Una dintre problemele care apare la interpretarea acestui rezultat este c acest echilibru nu
este credibil. De exemplu, dac dilema prizonierului se va repeta de trei ori (T=3), atunci avem
urmtoarele: la ultima etap juctorii vor alege strategia (A, A), dar pn atunci, cel puin o etap,
este mai bine pentru ei s aleag o strategie de cooperare, respectiv (N, N). n cazul n care
echilibrul jocului este repetarea strategiei (A, A) de trei ori (determinat prin inducie recursiv),
atunci ctigul total al juctorului i va fi
i
i
i i i i i
A A A A A A v
= + + = + + =
1
1
) 8 ( ) 1 )( 8 ( ) 8 ( ) 8 ( ) 8 ( )) , ( ), , ( ), , ((
3
2 2
Dac cel puin prima etap juctorii vor coopera, respectiv vor alege strategia de a nega
amndoi (N,N), atunci ctigurile vor fi:
) 8 ( ) 8 ( ) 2 ( )) , ( ), , ( ), , ((
2 '
+ + =
i i i
A A A A N N v
Evident v , cu alte cuvinte pentru cel puin o perioad juctorii vor alege s
coopereze, chiar dac jocul este necooperativ, deoarece ctigul adus de aceast strategie este mai
mare dect cel de necooperare. Acest rezultat a fost sintetizat de Benoit i Krishna (1985) n
urmtoarea teorem:
2 , 1 ) ( ,
'
= < i v
i i
Teorema Benoit-Krishna
Fie un joc finit repetat G(T), pentru care este un echilibru, i fie o alt strategie astfel
nct . Atunci exist un T<T, pentru T suficient de mare, astfel nct pentru T
perioade echilibrul jocului finit repetat este repetarea lui , iar pentru urmtoarele T-T perioade
repetarea lui .
*
s s
) ( ) (
*
s u s u >
*
s
s
Demonstraie
Pentru demonstraia acestei teoreme vom apela la principiul raionalitii juctorilor, care
vor dori maximizarea ctigului pentru tot jocul.
Astfel, dac juctorii vor adopta strategia la fiecare etap a jocului, atunci ctigul lor
mediu va fi:
*
s
=
+
=
T
t
t
i
t
i
T
i
i
i
s u s v
0
*
1
*
) (
1
1
) (
46
Jocuri dinamice n informaie complet
Dac pentru T etape vor adopta strategia , iar pentru restul de T-T etape strategia ,
atunci ctigul va fi:
s
*
s
|
.
|
\
|
+
=
= + =
+
'
0 1 '
*
1
'
) ( ) (
1
1
) (
T
t
T
T t
t
i
t
i
t
i
t
i
T
i
i
i
s u s u s v
cu ) ,.... , ,... , (
* 1 ' ' 2 1 ' T T T
s s s s s s
+
=
Cum , adic juctorul i, fie i ) ( ) (
*
s u s u > ) ( ), ( ) (
*
> s u s u
i i
1
juctorul pentru care se
atinge
)) ( ) ( min(
*
s u s u .
Atunci, pentru juctorul i
1
vom avea:
=
|
.
|
\
|
+
=
=
+
= + =
+
T
t
t
i
t
i
T
i
i
T
t
T
T t
t
i
t
i
t
i
t
i
T
i
i
i i
s u s u s u s v s u
0
*
1
'
0 1 '
*
1
*
) (
1
1
) ( ) (
1
1
) ( ) ' (
1 1
1
1
1 1 1 1
1
1
1
0 ) ( ) (
1
1
*
'
0
1 1 1 1
1
1
> |
.
|
\
|
=
+
t
i
T
t
t
i
t
i
T
i
i
s u s u
=
Deci pentru juctorul i
1
este strict mai bine s aleag s joace n T etape strategia de
cooperare, deoarece va ctiga strict mai bine.
Urmtoarea ntrebare care se pune este ct timp s se desfoare jocul astfel nct juctorii
s coopereze cel puin o perioad. Aceast problem se rezolv n urma adoptrii unei strategii de
pedepsire (trigger strategy). Aceast strategie presupune urmtoarea desfurare: juctorul i va
adopta un comportament cooperativ n prima etap i va continua acest comportament atta timp
ct i ceilali juctori adopt un comportament similar. n momentul n care unul din juctori
deviaz de la acest comportament, atunci pn la sfritul jocului se va adopta un comportament
de pedepsire, adic vor fi penalizai prin revenirea la comportamentul necooperativ .
Acest comportament se bazeaz pe existena unui ctig de rezerv, sau ctig minmax.
Astfel vom defini:
Definiia 3.16 Vom numi ctig de rezerv
i
u pentru juctorul i, ctigul minim ce l poate
obine n cele mai proaste condiii pentru el, sau altfel spus )] , ( max [ min
i i
s
i
s
i
s s u
i
i
u =
Fie m
-i
strategiile celorlali juctori pentru care se realizeaz
i
u , adic profilul minmax al
strategiilor celorlali juctori. Atunci
i i i i
u m m u =
) , ( .
Exemplul 3.1 Pentru dilema prizonierului, ctigul minmax este atins pentru strategiile (A,
A) i va coincide cu echilibrul Nash.
Juctor 2
A N
A -8,-8 -10,0 Juctor 1
N 0,-10 -2,-2
{ } { }
8 ) 0 , 8 min( )] , ( max [ min
2 1 1
, ,
1
1 2
= = =
s s u u
N A s N A s
47
Jocuri dinamice n informaie complet
Exemplu 3.2 Se consider jocul-etap static descris n figura 3.14
Juctor 2
D E
A -2, 2 1, -2
B 1, -2 -2, 2 Juctor 1
C 0,1 0, 1
Figura 3. 14
Observm c acest joc nu are un echilibru n strategii pure. Pentru juctorul 2, echilibrul n
strategii mixte este
)
2
1
,
2
1
(
, cu alte cuvinte, juctorul 2 este indiferent pe care dintre strategii o
adopt, D sau E. pentru juctorul 1 n schimb, cum nu tie care va fi comportamentul juctorului 2,
atunci el poate ctiga:
0 0
2
1
0
2
1
,.) (
5 , 0 ) 2 (
2
1
1
2
1
,.) (
5 , 0 )
2
1
( 1 ) 2 (
2
1
,.) (
1
1
1
= + =
= + =
= + =
C u
B u
A u
Deci ctigul minmax al juctorului 1 este 0, pentru strategia C (cel mai mic ctig pe care l
poate obine el cutnd s-i maximizeze ctigul, indiferent de ceea ce ar juca ceilali juctori).
3.3.4. Jocuri infinit repetate
Dac jocurile considerate sunt infinit repetate, atunci nu mai poate fi aplicat algoritmul
induciei recursive pentru c nu exist o etap final a jocului de la care s pornim n sens invers. n
aceste condiii echilibrul se va determina prin intermediul rezultatelor expuse de teorema folk
(popular):
Teorema folk Dat fiind jocul-etap G i jocul infinit repetat G() i
i
u ctigul minmax al
juctorului i, atunci pentru orice vector al ctigurilor cu v i u v
i i
) ( , > , exist 1 < , astfel nct
) 1 , ( ) ( exist un echilibru Nash al jocului G() dat de repetarea strategiilor care asigur
ctigul v .
Demonstraie
Presupunem c exist o strategie pur a astfel nct v a u = ) ( (cu u v > ) i fie pentru fiecare
juctor i urmtoarea strategie: voi juca a
i
n perioada 0 i voi continua s joc a
i
atta timp ct n
perioada anterioar s-a jucat a. Dac nu, atunci se va juca m
i
(strategiile corespunztoare
ctigului minmax) pentru restul jocului.
Este posibil ca juctorul i s ctige prin deviere de la aceast strategie?
48
Jocuri dinamice n informaie complet
n perioada n care deviaz el va ctiga , iar dup va ctiga ) ( max a u
i
a
i
u , respectiv
ctigul adus de strategia minmax, deci pn la sfritul jocului va ctiga
i
u n fiecare etap.
n concluzie, ctigul adus de devierea n etapa t va fi:
i
t
a
i
t
i
t
i D
u a u u u
1
) ( max ) 1 ( ) 1 (
+
+ + =
Observaie ntre ctiguri exist urmtoarea relaie:
i i
a
i
u u a u > > ) ( max
Acest ctig este mai mic dect u
i
ct timp se depete nivelul este
i
, definit prin:
i i i
a
i i
v u a u = + ) ( max ) 1 ( (*)
Cum
i i
u v > , atunci soluia
i
a ecuaiei (*) este mai mic dect 1.
Fie
i
i
max = , deci exist astfel nct > ) ( , echilibrul jocului este dat de
strategiile care asigur ctigul v . q.e.d.
Observaii
Dac optimul nu este atins pentru o strategie pur, atunci el se poate realiza pentru o
strategie mixt, iar demonstraia va rmne aceeai.
n demonstraie am considerat faptul c ntr-o etap a jocului deviaz doar un singur juctor.
Altfel spus, dac > atunci un juctor nu va fi tentat s devieze deoarece ctigul din
deviere nu acoper pierderile ulterioare.
M. Friedman (1971) a demonstrat aceast teorem n condiii slbite:
Teorema Friedman Fie un echilibru al jocului-etap cu ctigul c. Atunci oricare ar fi
cu
*
U u ) ( , ) ( , > i c u
i i
astfel nct > ) ( strategia asociat lui u s fie un echilibru
perfect n subjoc.
Exemplul 3.3 Revenind la dilema prizonierului infinit repetat, s determinm care este
pragul pentru care juctorii vor adopta un comportament cooperativ n cadrul jocului.
Juctor 2
A N
A -8,-8 -10,0 Juctor 1
N 0,-10 -2,-2
Pentru acest joc ctigul minmax este asigurat de strategia (A, A) cu ) 8 , 8 ( ) , ( = A A u .
Ctigul de cooperare este v N N u = ) , ( deoarece (-2, -2)>(-8, -8).
49
Jocuri dinamice n informaie complet
Ctigul adus de deviere pentru juctorul 1 va fi
{ }
0 ) (., max
,
1
= =
N u
i
N A a
u .
Observm c ) 8 2 0 ( ,
1 1 1
> > > > u v u - analog pentru juctorul 2.
De aici obinem ctigul mediu de deviere al juctorului 1 pentru jocul infinit repetat:
1 1 1 1 1 1 1 1 1
) 1 ( ) ( max ) 1 ( u u u a u u
a
D
+ = + = .
Ctigul mediu de cooperare va fi:
- deoarece ctig la fiecare etap , deci i n medie .
1 1
v u
C
=
1
v
1
v
De aici rezult:
1 1
1 1
1 1 1 1 1 1 1 1
) 1 (
u v
u v
v u u u u
C D
= = + = sau
25 , 0
8
2
) 8 ( 0
) 2 ( 0
1 1
1 1
1
= =
=
=
v u
v u
Cu alte cuvinte pragul de la care juctorii vor adopta un comportament cooperativ va fi
25 , 0 = , respectiv pentru orice ) 1 , 25 . 0 ( juctorii vor coopera.
Observaie Jocul fiind simetric obinem 25 , 0
2 1
= = .
3.3.5. Strategia de pedepsire i jocurile finit repetate
n cazul jocurilor finit repetate strategia de a se repeta echilibrul Nash al jocului-etap pare a
fi echilibrul jocului dinamic. Totui, am vzut c aceast strategie nu este credibil. n acest context
apare ntrebarea dac putem adopta comportamentul de pedepsire astfel nct s fie determinai
juctorii s adopte un comportament cooperativ chiar i n cadrul jocurilor finit repetate. Rspunsul
la aceast ntrebare este afirmativ, cu observaia c n acest caz soluia depinde att de nivelul
pragului dat de factorul de actualizare , ct i de durata jocului, respectiv de numrul de etape
jucate T.
Astfel avem teorema:
Teorem Dat fiind jocul-etap G i jocul finit repetat G(T),
i
u ctigul minmax al
juctorului i, atunci pentru orice vector al ctigurilor , cu v 1 ) ( , ) ( , < > i u v
i i
, pentru T
suficient de mare, astfel nct 0 ' ) ( ), 1 ( ) > ( T astfel nct repetarea de T ori a strategiilor ce
asigur ctigul constituie echilibrul Nash al jocului repetat pentru T etape. v
Demonstraie
Demonstraia se poate face analog cu cea a teoremei folk. Dac strategia adoptat este una
de pedepsire, atunci exist un prag al rbdrii i un numr minim de etape T n care trebuie
50
Jocuri dinamice n informaie complet
s se desfoare jocul pentru ca cel puin T etape juctorii vor adopta un comportament cooperativ
adoptnd strategia care aduce ctigul . v
T
i u (
u
v
Fie
i
u = ctigul minmax al juctorului i;
i i
u v > - ctigul de cooperare al juctorului i;
) ( max a u u
a
i = - ctigul de deviere al juctorului i.
n cazul n care deviaz, ctigul juctorului i este:
|
.
|
\
|
+ +
= + =
+
1 '
0 1 '
'
1
1
1
) ' (
T
t
T
T t
i
t
i
i
t
T
i
i D
i
u u v s u
cu T numrul de etape n care juctorul i coopereaz, T<T.
Ctigul de cooperare pe ntreaga perioad va fi :
=
+
=
T
t
i
t
T
i
i C
i
v u
0
1
1
1
Pragul de la care juctorul i nu este tentat s devieze este dat de inegalitatea
D
i
C
i
u u |
.
|
\
|
+ +
= + =
+
=
+
1 '
0 1 '
'
1
0
1
1
1
1
1
T
t
T
T t
i
t
i
T
i
t
T
i
i
T
t
i
t
T
i
i
u u v v
i
i
i i
T T
T T T
i i i
T
i
T
T t
i
t
i
i
T
v u
u v
u v v u v v u
+ =
'
' '
'
1 '
'
1
) 1 (
1
1
) ( ) ) ( ) (
(*)
Dat fiind numrul de etape T ce se doresc a fi cooperative i un prag de semnificaie , se
poate obine T, respectiv numrul de etape pe care le are jocul finit repetat ca juctorii s coopereze
T perioade. Vom avea:
|
|
.
|
\
|
+
i i
i
i
T T T T
i i
i
i
T
u v
v u
T
v
u
' 2 ' ' 2
) 1 ( log ) 1 (
Dac se d n schimb T i T atunci se poate determina , nivelul minim al factorului de actualizare
pentru care juctorii vor coopera, din relaia (*).
3.3.6. Aplicaii
1. Investiia strategic i duopolul
Pe piaa unui produs exist doi productori, firma 1 i firma 2, pentru care costul mediu este
acelai, c=3 u.m. pe unitatea de produs. Firma 1 poate s instaleze o nou tehnologie care i va
reduce costul la c
1
=1 u.m. pe unitatea de produs, dar costul acestei tehnologii este f. Firma 2
observ decizia de investiii a primei firme i apoi alege nivelul outputului simultan cu prima firm.
Funcia de cerere invers pe pia este P(Q) = a Q, cu Q = q
1
+q
2
.
51
Jocuri dinamice n informaie complet
Funciile de ctig sunt date de profiturile firmelor, respectiv pentru firma 1 avem:
=
q q c a
q c a
q q
1 1
2 1
2 1 1
(
(
) , (
f q
1 2
)
q q
1
)
- dac nu investete
- dac investete
2 2 1 2 1 2
) ( ) , ( q q q c a q q =
Se cere s se determine echilibrul acestui joc. Date numerice a=15, f parametru.
Rezolvare Dac firma 1 nu investete, atunci costurile medii pe unitatea de produs vor fi
identice pentru cele dou firme, care se vor afla n competiie de tip Cournot.
Funciile de reacie sunt: ,
2 2
) (
j
j i
q
c a
q R
= ,
iar nivelurile profiturilor vor fi
9
) (
2
*
2
*
1
c a
= = .
Pentru datele numerice avem:
) 16 , 16 ( ) , (
) 4 , 4 ( ) , (
*
2
*
1
*
2
*
1
=
=
q q
Dac firma 1 investete n schimb, atunci funciile de reacie se obin din problemele:
2 2 1 2 1 2
1 2 1 1 2 1 1
) ( max ) , ( max
) ( max ) , ( max
2 2
1 1
q q q c a q q
f q q q c a q q
q q
q q
=
=
De aici:
2 2
) ( ,
2 2
) (
2 1
2 1
1
1 2
q c a
q R
q c a
q R
=
De aici, nivelul de echilibru rezult din rezolvarea sistemului:
+
=
+
=
= +
= +
=
3
2
3
2
2
2
2 2
2 2
1 *
2
1 *
1
1 2 1
2 1
2 1
1
1
2
c c a
q
c c a
q
c a q q
c a q q
q c a
q
q c a
q
I
I
cu ctigurile
|
|
.
|
\
|
|
.
|
\
| +
|
.
|
\
| +
=
2
1
2
1 *
2
*
1
3
2
;
3
2
) , (
c c a
f
c c a
I I
Deci firma 1 va alege s investeasc doar dac , adic
1
*
1
>
I
f
c c a c a
+
<
9
) 2 (
9
) (
2
1
2
, adic dac
9
) (
9
) 2 (
2 2
1
c a c c a
f
+
< .
Numeric obinem
)
9
100
,
9
256
( ) , (
)
3
10
,
3
16
( ) , (
*
2
*
1
*
2
*
1
f
q q
I I
I I
=
=
52
Jocuri dinamice n informaie complet
53
Deci prima firm va investii doar dac pentru ea costul tehnologic, 16
9
256
9
112
= < f .
CAPITOLUL 4
Jocuri statice n informaie incomplet
(jocuri Bayesiene)
Jocurile n informaie incomplet sunt acele jocuri n care cel puin unul dintre juctori nu
cunoate funciile de ctig ale celorlali juctori.
Totui, acel juctor care nu tie ctigurile celorlali, i imagineaz care ar putea fi acestea
cu o anumit probabilitate.
4.1. Introducere
Exemplul 4.1 Jocul intrrii pe pia
Se consider un joc n care juctorii sunt dou firme, din care una este deja pe pia, iar a
doua dorete s ntre. Prima firm poate s se extind construind o nou fabric, iar cea de-a doua
nu cunoate costul noii construcii, tiind doar c poate fi 4 uniti sau 1 unitate.
Ctigurile sunt descrise n figura 4.1 a) i b):
F2
I N
C -1,-1 1,0
F1
NC 1,1 2,0
Cost mare: p
1
Figura 4.1.a)
F2
I N
C 2,1 4,0
F1
NC 1,1 2,0
Cost mic: p
2
Figura 4.1 b)
Observm c ctigurile juctorului 2 depind de faptul c primul a construit sau nu fabrica,
dar nu este influenat de costul acestei investiii.
Observm faptul c pentru juctorul 2 este preferabil s intre doar dac juctorul 1 nu
construiete.
Pentru juctorul 1 n schimb vedem c strategia de a construi este dominant doar dac are
un cost mic.
Jocuri statice n informaie incomplet
Dac notm cu probabilitatea cu care juctorul 2 credea c 1 are un cost mare, cum 1
construiete doar dac are un cost mic, atunci 2 va intra pentru probabilitatea >
1
p
1
p
2
1
i nu va intra
cu probabilitatea <
1
p
2
1
.
Modificnd jocul, cu ctigurile descrise n figura 4.2 avem:
F2
I N
C 0,-1 2,0
F1
NC 2,1 3,0
Cost mic
Figura 4.2 a)
F2
I N
C 1.5,1 3.5,0
F1
NC 2,1 3,0
Cost mare
Figura 4.2 b)
Fie y probabilitatea ca firma 2 s intre pe pia (deci (1 y) este probabilitatea ca firma 2 s
nu intre pe pia).
n acest caz strategia de a nu construi rmne dominant dac firma 1 are un cost mare.
Dac este un cost mic, atunci strategia optim a lui1 depinde de probabilitate ca 2 s intre pe
pe pia.
A construi este mai bine dect a nu construi dac:
1,5 y + 3,5 (1 y ) > 2 y + 3 (1 y ). Rezult 2 1 < y .
Astfel, 1 poate ncerca s prezic comportamentul lui 2 pentru a-i alege propria strategie.
Harsany a propus o transformare a acestui joc dintr-unul n informaie incomplet ntr-un joc
n informaie imperfect, descriind sub form extins jocul cu ajutorul Naturii. (figura 4.3):
Figura 4.3
2
(3,0) (2,1)
NI
NI
NI
I I I
NI
I
2 2
2
NC C NC C
1
1
[1 - p
1
] [p
1
]
(1.5,-1)
(3.5,0) (3,0)
(2,1)
(2,0) (0,-1)
Cost mic Cost mare
Natura
54
Jocuri statice n informaie incomplet
Prin aceast reprezentare am obinut un joc clasic, respectiv un joc dinamic n informaie
incomplet, al crui echilibru se poate determina prin metode deja prezentate. . Vedem c n raport
cu probabilitatea asignat de juctorul 1 pentru comportamentul juctorului 2 vom obine echilibrul
anterior, respectiv: dac firma 1 va crede c firma 2 intr pe pia cu probabilitatea
2
1
> y , atunci
el va alege s nu construiasc, iar dac probabilitatea cu care crede c firma 2 intr este
2
1
< y
atunci va alege s construiasc.
4.2 Reprezentarea jocurilor Bayesiene sub form normal
n informaie complet, reprezentam un joc sub form normal ca fiind: G(S,u), fiecare
juctor tiind care sunt strategiile i ctigurile asociate tuturor celorlali juctori.
n cazul jocurilor n informaie incomplet fiecare juctor i cunoate propriile funcii de
ctig, dar poate s nu cunoasc una a celorlali.
Atunci fie u funcia de utilitate a juctorului i dac este de tipul , cu
T (spaiul tipurilor posibile).
) ; ,..., , (
2 1 i n i
t a a a
i
t
i
t
i
Vom nota cu ) (
i i i
t t p
probabilitatea ca juctorul de tipul t s cread c ceilali sunt de
tipul .
i
i
t
Definiia 4.1 Reprezentarea sub form normal a unui joc Bayesian static cu n juctori
presupune s specificm spaiul aciunilor (strategiilor) , spaiul tipurilor juctorilor , apoi
credinele acestora , respectiv funciile de ctig, u
i
A
i
T
i
p
i
.
tipul juctorului i - t - este informaie privat a juctorului i i face parte din mulimea
tipurilor T .
i
i
credinele (ateptrile) juctorului i: ) (
i i i
t t p
i
descriu incertitudinea lui i asupra
tipurilor posibile (n-1) ale celorlalijuctori, t , dat fiind tipul su .
i
t
Atunci un joc static n informaie incomplet (joc bayesian) este G = {A, T, P, U}.
n abordarea lui Harsany desfurarea unui joc bayesian este urmtoarea:
natura alege tipul juctorilor t= ) ,..., , (
2 1 n
t t t ;
fiecare juctor i cunoate propriul tipt , dar nu l cunoate pe al celorlali t
i
-i
;
juctorii aleg simultan aciunile lor;
se recepioneaz ctigurile u . ) ; ,..., , (
2 1 i n i
t a a a
Observaia 1. Putem calcula ) (
1 i i
t t p
utiliznd regula Bayes:
= =
i i
T t
i i
i i
i
i i
i i i
t t p
t t p
t p
t t p
t t p
) , (
) , (
) (
) , (
) ( (4.1)
55
Jocuri statice n informaie incomplet
Observaia 2. n multe probleme tipul juctorilor este independent. Deci nu depinde
de t , dar va depinde totui de distribuia de probabilitate p(t) asupra tipurilor.
) (
i i
t p
i
Definiia 4.2. Vom numi strategie pentru juctorul i o funcie , n care specific
o aciune particular din mulimea aciunilor , pentru orice t
) (
i i
t S ) (
i i
t S
i
A
i
, ale jocului G (A, T, P, U).
Definiia 4.3. n jocul Bayesian static G = {A, T, P, U} strategiile *=( sunt
un echilibru Bayesian de tip Nash n strategii pure dac pentru fiecare juctor i i fiecare tip t din
, este soluie a problemei:
s *) s *,..., s *, s
n 2 1
i
i
T ) t ( * s
i i
( ) ( ) ( ) ( ) ( ) ( )
+ +
i i i i
T t
i i n
*
n i
*
i i i
*
i
*
i
A a
t t p t ; t s ,..., t s , a , t s ,..., t s u
max
1 1 1 1 1 1
. (4.2)
Astfel, la echilibru, nici un juctor nu i va modifica strategia, chiar dac se schimb
aciunea n cadrul aceluiai tip.
Exemplul 4.2 Duopolul Cournot n informaie incomplet
Se consider modelul duopolului Cournot, (analizat n capitolul 2), n condiii de informaie
incomplet. Astfel, pe piaa unui produs exist doi productori, care produc cantitile q
1
, respectiv
q
2
. Contitatea total de produs de pe pia va fi Q.
Funcia de cerere invers este: P(Q) = c Q, Q =
2 1
q q +
Costul mediu pe unitatea de produs al firmei 1 este c, iar costul total va fi:
.
1 1 1
) ( cq q c =
Firma 2 n schimb, poate avea dou tipuri de cost, i anume fie un cost mediu mare, c
M
, fie
un cost mediu mic, c
m
, astfel nct funcia de cost total a firmei 2 va fi:
= ) (
2 2
q c
2
2
q c
q c
m
M
cu c .
M m
c <
Firma 1 crede cu probabilitatea c firma 2 are costul mare, c
M
, i cu probabilitatea 1 -
c firma 2 are costul mic, c
m
. Tipul firmei 2 este dat de costul mediu pe care l poate avea. Aceasta
este o informaie privat, adic firma 2 i cunoate propriul cost, n schimb firma 1 nu tie acest
cost, deci nu poate determina profitul firmei 2. n schimb firma 1 i formeaz anumite credine,
presupuneri, asupra tipului care este firma 2. Astfel, presupune cu probabilitatea este firma 2 este
de tipul c , i cu probabilitatea 1- este de tipul c .
M m
Fiecare dintre firme are de rezolvat problema:
Pentru firma 2:
pentru tipul (4.3) ( )
1 2 1
2
q c q * q q
max
M
q
M
c
sau
( )
2 2 1
1
q c q * q q
max
m
q
pentru tipul c . (4.4)
m
56
Jocuri statice n informaie incomplet
Pentru firma 1:
( ) | | ( ) ( ) | |
1 2 1 1 2 1
1
1
q c c * q q q q c c * q q q
max
m M
q
+ (4.5)
Rezolvnd aceste probleme obinem soluiile (funciile de reacie ale firmei 2 n raport cu
cantitile elese de firma 1 i de tipul firmei):
( )
2
1
2
M
M
c * q c
c * q
= sau (4.6)
( )
2
1
2
m
m
c * q c
c * q
= . (4.7)
Rezult pentru firma 1 funcia de reacie (n raport cu funciile de reacie ale firmei 2 i cu
probabilitile cu care crede firma 1 c firma 2 este de un tip sau de altul):
( ) | | ( ) ( ) | |
2
* 1 *
*
2 2
1
c c q q c c q q
q
m M
+
=
(4.8)
Din relaiile (4.6) (4.8) rezult:
( ) (
m M
M
M
c c
c c q
c q
+
+
=
6
1
3
2
*
2
) (4.9)
( ) (
m M
m
m
c c
c c q
c q +
+
=
6 2
2
*
2
) (4.10)
( )
3
1 2
*
1
m M
c c c q
q
+ +
= . (4.11)
Observaie
n raport cu parametrul , respectiv cu probabilitatea cu care crede firma 1 c firma 2 are
costul mare, strategiile alese de cele dou firme tind ctre cele n informaie complet ( 0 sau
1 ).
4.3 Strategii mixte revizuite
Harsanyi (1973) a sugerat faptul c pentru juctorul i o strategie mixt reprezint
incertitudinea juctorului j despre alegerea de ctre i a unei strategii pure, iar aceasta depinde de
informaia privat pe care o are.
Putem extinde aceast idee i un echilibru Nash n strategii mixte poate fi interpretat (pentru
un joc n informaie complet) ca un echilibru Bayesian n strategii pure cu o anumit (puin)
informaie incomplet.
S reconsiderm jocul btlia sexelor descris n capitolul 2. Biatul i fata care au de ales
unde vor petrece seara respectiv vor decide asupra locului n care vor merge: la Teatru sau la
Fotbal. Matricea jocului este dat n figura 4.4:
57
Jocuri statice n informaie incomplet
Fata
T F
T
1,2
0,0
Biat
F
0,0
2,1
Figura 4.4
Acest joc are dou 2 echilibre: (T,T) i (F,F).
S presupunem acum faptul c ei nu sunt siguri n legtur cu ctigul pe care l are cellalt,
iar aceste ctiguri sunt 2 + t pentru fat (pentru teatru), respectiv 2 + t pentru biat (pentru
fotbal).
f b
i t sunt cunoscute de posesori (fat, respectiv biat), iar cellalt se presupune c sunt din
intervalul [0,x], uniform distribuite.
f
t
b
Atunci jocul bayesian G va fi G={ }
f b f b f b f b
U U P P T T A A , , , , , , , cu
- spaiul aciunilor: = ={T, F};
b
A
f
A
- spaiul tipurilor, care este continuu: | | x T
f b
, 0 T = = ;
- probabilitile cu care cred fata, respectiv biatul c cellalt are ctigurile t
b
, respectiv t
f
sunt: ( ) ( )
x
t p t p
f b b f
1
= = .
Ctigurile vor fi descrise de matricea din figura 4.5:
Fata
T F
T
2 + t ,1
b
0,0
Biat
F
0,0
1, 2 + t
f
Figura 4.5
n continuare vom determina un echilibru Bayesian n strategii pure pentru acest joc n
informaie incomplet.
n acest joc fata va alege teatrul dac depete un nivel critic f, altfel va merge la fotbal.
(Analog se definete i pentru biat strategia cu nivelul critic b).
f
t
Deci, la echilibru biatul va alege fotbalul cu probabilitatea
x
b x
, iar fata va alege teatrul
cu probabilitatea
x
f x
.
58
Jocuri statice n informaie incomplet
n continuare vom arta ca dac informaia complet dispare (x0), atunci comportamentul
juctorilor n strategii Bayesiene aproximeaz comportamentul n strategii mixte al jocului static
iniial (
3
2
0
x
x
c x
).
S determinm valorile critice f i b pentru dimensiunea intervalului ctigului, x, dat:
pentru biat :
( ) ( ) (
b b
t
x
f
x
f
t
x
f
F u + = |
.
|
\
|
+ + = 2 0 1 2
1
) (4.12)
( )
x
f
x
f
x
f
T u =
|
.
|
\
|
+ = 1 1 1 0
1
(4.13)
Deci va merge la fotbal doar dac:
b
f
x
t
b
= 3 (4.14)
Pentru fat, vom obine n mod analog:
f
b
x
t
f
= 3 (4.15).
Rezolvnd (4.14) i(4.15)simultan obinem:
2
4 9 3 x
f b
+ +
= = . (4.16)
Deci, probabilitatea ca biatul s mearg la fotbal va fi:
3
2
2
4 9 3
1
0
+ +
=
x
x
x
x
b x
. (4.17)
Cu alte cuvinte, dac dac informaia incomplet ar dispare, atunci se obine echilibrul Nash
n strategii mixte ale jocului n informaie complet.
4.4. Mecanisme design (descriptive) ale jocurilor Bayesiene
Modelul stabilirii preurilor neliniare
Un monopolist produce un bun la un cost marginal (i mediu) c i vinde o cantitate
din acest bun. Acest bun este cumprat de un consumator a crui satisfacie este descris de funcia
de ctig:
0 q
( ) ( ) T q V , T , q u =
1
cu: (4.18)
59
Jocuri statice n informaie incomplet
( ) q V - reprezint surplusul brut, unde este tipul cumprtorului;
T suma transferat de la consumator la vnztor;
V(q) reprezint funcia de utilitate, de tip von Neumann Morgenstern, ce are
proprietile:
( )
( ) 0 0
0 0
'
>
=
V
V
0 0 < ) ( ' ' V (utilitate marginal descresctoare)
V(q) este o cunotin comun, dar este informaie privat pentru consumator, respectiv
este cunoscut doar de consumator.
n cazul n care spaiul tipurilor este discret, vnztorul tie c = cu probabilitatea p i
= cu probabilitatea p , unde 0 > > i p + p =1.
Jocul va fi urmtorul:
Vnztorul ofer un tarif T(q) (posibil neliniar) n care i spune cumprtorului ct l cost
dac va cumpra cantitatea q.
Consumatorul fie va accepta oferta, fie va refuza.
Dac jocul ar fi n informaie complet, atunci vnztorul ar ti i va oferi q astfel nct
s-i maximizeze profitul, extrgnd tot surplusul consumatorului, adic:
( ) ( ) = = T q V , T , q u 0
1
( ) q V T = . (4.19)
Profitul monopolistului este dat de :
( ) cq q V cq T = =
2
(4.20)
Condiiile necesare de optim sunt:
( ) 0 = =
c q ' V
q
(4.21)
conduc la soluia:
( ) c q ' V = (4.22)
(Cum ) V , rezult c i condiia suficient este ndeplinit, deci profitul se
maximizeaz n punctul n care
0 0 < ( ' '
( ) c q ' V = ).
Cum ns consumatorul poate fi de dou tipuri, vnztorul poate cuta s ofere 2 pachete de
programe, cte unul pentru fiecare tip.
Fie ( ) T q, pachetul pentru tipul i ( ) T q, pachetul pentru tipul .
Atunci ctigul ateptat al monopolistului va fi:
60
Jocuri statice n informaie incomplet
( ) ( ) q c T p q c T p E + =
2
. (4.33)
n aceste condiii vnztorul are n fa 2 condiii:
prima (IR) restricia de raionalitate individual presupune c utilitatea net minim a
cumprtorilor este nenegativ, adic:
( )
1
IR ( ) 0 T q V
( )
2
IR ( ) 0 T q V .
(Consumatorii nu vor alege un consum ce ar asigura o utilitate negativ.)
al doilea tip de restricii sunt cele numite de compatibilitate incitativ, cu alte cuvinte
condiia ca fiecare consumator s consume doar pachetul care i este destinat:
(
1
IC ) ( ) ( ) T q V T q V
(
2
IC ) ( ) ( ) T q V T q V .
Problema pe care o are de rezolvat vnztorul este de maximizare a profitului ateptat cu
restriciile (IR) i (IC). In prima etap s observm c doar ( )
1
IR i ( )
2
IC sunt necesare, deoarece:
( ) ( ) ( ) 0 q V T q V . (4.34)
Deci monopolistul va trebui s rezolve problema:
( ) ( ) q c T p q c T p E max
q , q , T , T
+ = cu restriciile:
( ) 0 T q V (4.35)
( ) ( ) T q V T q V .
(Pentru nceput vom neglija . Dac soluia problemei satisface i atunci ea va fi
optimal.)
(
1
IC ) ) (
1
IC
Rezult:
( ) ( ) ( ) | | ( ) ( ) q c q V p q c p q V p p E max + = cu restriciile:
( ) 0 T q V (4.36)
( ) ( ) T q V T q V .
Condiiile de ordin I conduc la soluiile:
61
Jocuri statice n informaie incomplet
( )
( )
p
p
c
q ' V
=
1
i ( ) c q V = ' . (4.37)
Cu alte cuvinte, doar cantitatea cerut de consumatorul de tip este optim din punct de
vedere social (deoarece este verificat condiia din problema n informaie complet) .
Cantitatea cerut de consumatorul de tip nu va fi optimal deoarece va consuma o
cantitate q q < (deoarece V<0 ) .
Demonstraie.
Lagrangeanul asociat problemei (4.36) este:
( ) ( ) ( ) ( ) | | ( ) ( )+ + = q c q V p q c p q V p p , , q , q , T , T L
2 1
( ) ) T q V (
1
+
( ) ( ) ) T q V T q V ( +
2
Condiiile necesare de optim sunt:
( ) ( ) 0 ' '
2 1
= + =
q V q V Pc
q
L
0
2 1
= + =
P
T
L
Rezult p =
2 1
i cum p =
2
rezult: p p + =
1
.
Deci:
( ) ( ) ( ) c p q ' V p q ' V p p = + ( ) ( ) ( ) c q ' V
p
p
q ' V
p
p
q ' V = +
( ) c
p
p
p
p
q ' V =
(
(
+ ( )
p
p
p
p
c
q '
+
= V
( )
( )
p
p
c
p
p
c
p
p
c
p
p
p
p
c
q ' V
=
|
|
.
|
\
|
+
=
|
|
.
|
\
|
+
=
+
=
1
1 1 1
1
.
62
Jocuri statice n informaie incomplet
4.5 Aplicaie: Licitaia la primul pre
Considerm un joc, respectiv un proces de licitaie pentru un tablou de Grigorescu. n joc
exist doi licitatori i=1,2. Fiecare dintre acetia evalueaz tabloul pentru care liciteaz, la suma
(suma maxim pe care sunt dispui s o plteasc). Ei vor licita pentru tablou i vor plti n final
suma P, respectiv preul cel mai mare oferit n cadrul licitaiei.
i
v
n aceste condiii ctigul juctorului care ctig licitaia va fi: u P v
i i
= .
Presupunem c evalurile juctorilor sunt independente i distribuite uniform n intervalul
[0,1].
Evident, preul pltit nu poate fi negativ, . P 0
Cei doi juctori ofer simultan ofertele (n plic nchis) i va ctiga tabloul cel care ofer
preul maxim. n cazul n care ofertele sunt egale, atunci se trage la sori juctorul care va primi
tabloul. n plus, ambii juctori sunt neutri fa de risc.
Pentru nceput, vom descrie licitaia ca pe un joc static n informaie incomplet (joc
Bayesian). Informaia incomplet provine din faptul c fiecare dintre cei doi juctori nu cunoate
evaluarea celuilalt ( v este informaie privat).
i
Jocul Bayesian este G={ }, n care:
2 1 2 1 2 1 2 1
, , , , , , , U U P P T T A A
- spaiul aciunilor este | ) = , 0
i
A pentru fiecare juctor i reprezint preul oferit pentru
tablou;
- este spaiul tipurilor juctorilor,
i
T | | 1 , 0 =
i
T ;
- sunt probabilitile cu care fiecare dintre juctori presupune tipul celuilalt, sunt
independente (din independena tipurilor) i sunt uniform distribuite n [0,1] i nu
depind de ;
i
p
i
v
- funciile de ctig pentru cei doi juctori sunt:
( )
<
=
>
=
j i
j i
i i
j i i i
i
P dacaP ;
P dacaP ;
P v
P dacaP ; P v
v , v ; P , P u
0
2
2 1 2 1
. (4.38)
Strategiile juctorilor depind de tipul fiecruia, cu alte cuvinte, strategia juctorului i va fi
care reprezint cel mai bun rspuns la strategia ( )
i i
v P ( )
j j
v P aleas de cellalt juctor.
Cu alte cuvinte, perechea de strategii ( ( )
1 1
v P , ( )
2 2
v P ) este un echilibru Bayesian al jocului,
dac este soluia problemei: ( )
i i
v P
( ) ( ) ( ) ( ) ( ) ( )
j j i i i j j i i i
P
v P P prob P v v P P prob P v
max
i
= + >
2
1
. (4.39)
Vom simplifica problema presupunnd c funciile de pre sunt liniare, respectiv:
( )
1 1 1 1 1
v c a v P + = (4.40)
( )
2 2 2 2 2
v c a v P + = . (4.41)
63
Jocuri statice n informaie incomplet
Observaie: Aceast restricie nu este una strict, forma funciilor de pre putnd fi variabil
n realitate.
Cum distribuia juctorilor este uniform (evalurile acestora fiind uniform distribuite n
[0,1]), iar funcia de pre este liniar, soluia problemei va fi:
( )
2
i
i i
v
v P = . (4.42)
n continuare vom demonstra c aceasta este soluia unic a jocului.
Strategia adoptat de fiecare juctor este ( )
j j j j j
v c a v P + = .
Cum prob( ( )
j j i
v P P = ) = 0 (datorit distribuiei uniforme), funcia celui mai bun rspuns
este soluia problemei:
( ) ( )
j j j i i i
P
v c a P prob P v
max
i
+ > . (4.43)
Evident, putem restrnge spaiul strategiilor, deoarece este stupid pentru juctori s fac
oferte mai mici dect a (minimul oferit de cellalt) sau mai mari dect suma maxim
j
( )
j j
c a + ce
o poate oferi cellalt.
Deci
j j j j
c a P a + .
Atunci:
( )
j
j i
j
j i
j j j j i
c
a P
c
a P
v prob v c a P prob
=
|
|
.
|
\
|
< = + > . (4.44)
Deci cel mai bun rspuns al juctorului i va fi:
( )
<
+
=
j i j
j i
j i
i i
a v daca ; a
a v daca ;
a a
v P
2
. (4.45)
n continuare vom discuta existena cehilibrului n raport cu i .
j
a
j
c
Daca atunci nu este liniar (figura 4.6): ( 1 , 0
j
a ) ( )
i i
v P
P
i
v
i
a
j
a
j
Figura 4.6
64
Jocuri statice n informaie incomplet
Deci este fie negativ
j
a ( ) 0 <
j
a , fie supraunitar ( ) 1
j
a .
Evident 0
j
c (deoarece preul oferit crete cu valoarea pe care o are tabloul).
Pentru i rezult 1
j
a 0
j
c ( ) 1 + =
j j j j j
v c a v P , absurd, deoarece v , i ar
rezulta =1, c =0.
| 1 0,
i
|
j
a
j
Deci i de aici 0
j
a
( )
2
j i
i i
a v
v P
+
= . (4.46)
Rezult:
( )
( )
+
=
+
=
2
2
1 2
2 2
1 1
1 1
a v
v P
a v
v P
, deci
= =
= =
2
,
2
1
2
,
2
1
1
2 2
2
1 1
a
a c
a
a c
. (4.47)
Evident, c i 0
2 1
= = c
2
1
2 1
= = c c .
De aici rezult c ( )
2
i
i i
v
v P = , i=1,2.
Observaia1 Rezultatul jocului arat faptul c licitatorii vor oferi jumtate din preul maxim
ce ar fi dispui s-l ofere pentru tabloul respectiv, cu alte cuvinte nu se poate extrage ntreaga rent
a juctorului de ctre organizatorul licitaiei.
Observaia2 Se poate demonstra relativ uor faptul c, pentru alte forme ale funciei de pre
, condiia pentru ca un echilibru s existe i s fie unic este liniaritatea funciei de pre P. ( )
i i
v P
4.6. Principiul revelaiei
S presupunem c avem un joc cu n +1 juctori, i anume:
- un juctor principal (P), juctorul 0, care nu deine informaie privat;
- n juctori de tip =(
1
,,
n
), cu
i
.
Juctorul principal nu cunoate tipul al celorlali n juctori, dar presupune c fiecare dintre
tipurile
i
poate fi ntlnit cu probabilitatea p
i
.
Obiectul mecanismului design este acela de a determina o alocaie y ={x,t}, care const
dintr-un vector x (o decizie ce aparine unei mulimi compacte, convexe i nevide) i t (un vector de
transfer monetar de la juctorul principal ctre ceilali juctori eventual acest transfer poate fi i
negativ).
65
Jocuri statice n informaie incomplet
Juctorii i=1,,n au funcii de ctig de tip von Neumann-Morgenstern, descrise prin
u
i
(y,).
Presupunem c funciile de ctig u
i
sunt strict cresctoare n raport cu transferurile t
i
, iar u
0
este strict descresctoare n raport cu t
i
i, n plus, sunt de dou ori difereniabile.
Dac {y()}
0 0
= (4.49)
n aplicaiile cu care vom opera, ctigurile juctorilor depind doar de transferul propriu t
i
i
de tipul su
i
, nu i de tipurile celorlali juctori
-i
sau transferurile lor t
-i
.
Aplicaii economice
1) Discriminarea de pre, unde x=cantitatea cumprat de consumator
- t-preul pltit pentru bunul consumat
- -tipul consumatorului, dat de nivelul surplusului consumatorului.
2) Reglementarea cu x-vector de preuri (sau costuri)
- t-venitul firmei
- -parametru tehnologic al firmei.
3) Impozitarea veniturilor x-veniturile agenilor
- t-dimensiunea impozitului pltit de agenii economici
- -capacitatea agentului de a economisi bani.
4) Venituri publice x-cantitatea de bun public oferit
- t
i
-contribuiile monetare ale consumatorilor la finanarea produciei de
bun public
- -tipul consumatorului n raport cu surplusul consumatorilor de bun
public.
5) Licitaii x
i
-probabilitatea ca licitatorii s cumpere bunul
- t
i
-suma pltit pentru bun de cel care va ctiga licitaia
-
i
-preferinele consumarorului pentru bunul i.
6) Negocieri x-cantitatea vndut
- t
1
-transferul monetar ctre vnztor
- t
2
-transferul (negativ) monetar ctre cumprtor (t
1
+t
2
=0)
-
1
=c costul productorului
-
2
=v preferinele consumatorului.
66
Jocuri statice n informaie incomplet
67
Definiia 4.4
Vom numi mecanism sau contract dat de un anun de mesaje =(
1
,
2
,,
I
) ce aparine
spaiului mesajelor
i
.
Tipul juctorilor este informaie privat i de aici mecanismul y
n
:
i
YxR
n
, poate s
depind de =(
1
,,
I
).
Definiia 4.5
Vom numi mecanism direct acel mecanism n care spaiul mesajelor este spaiul tipurilor de
juctori, respectiv = .
Observaie. Un mesaj reprezint un anun, o operaiune efectuat de ctre unul dintre
juctori.
Dac spaiul mesajelor (anunurilor) este
i
, spaiul tipurilor pentru fiecare juctor, atunci
fiecare dintre acetia i anun tipul care poate fi cel adevrat sau poate s mint.
Fie ( tipurile declarate de ctre juctori. Atunci definim aceste tipuri prin:
, unde
) ,...,
1
n
)) ( (
y ) ( y
m
_
= )). ( ),..., ( ( ) (
1 1
n
n
=
Pentru jocul descris anterior, declararea de ctre fiecare juctor a tipului real (deci
declararea adevrului) constituie un echilibru bayesian al jocului, dat fiind , un echilibru
bayesian al jocului iniial, i i
i
.
Teorem (principiul revelaiei) Gibbard, Green-Laffont, Myerson.
Fie un mecanism cu spaiul mesajelor
i
i funcia de alocare y
m
(.) ce are un echilibru
bayesian ,
n , i i i
)} ( { ) ( y
1 =
=
i i
. Atunci exist un mecanism direct revelator
astfel nct spaiul mesajelor este chiar spaiul tipurilor agenilor (juctorilor),
= y y y
m
_
o
i
=
i
, i exist un
echilibru bayesian n care fiecare agent accept mecanismul propus i relev adevratul tip.
Observaie. Echilibrul asociat (bayesian) poate s nu fie unic (principiul revelaiei ne asigur
doar de existena echilibrului, nu i de unicitatea acestuia). Printre acestea se vor gsi i echilibre
necredibile, dar pot fi eliminate prin mbogirea spaiului mesajelor cu informaii care nu
influeneaza echilibrul real, dar le elimin pe cele necredibile.
CAPITOLUL 5
Jocuri dinamice n informaie incomplet
n acest capitol se va introduce un concept nou i anume acela de Echilibru Bayesian Perfect
(E.B.P).
n capitolele discutate pn acum s-au prezentat 3 tipuri de echilibre:
-echilibrul Nash - pentru jocurile statice n informaie complet;
-echilibrul perfect n subjoc - pentru jocurile dinamice n informaie complet;
-echilibrul bayesian - pentru jocurile statice n informaie incomplet.
Aceste tipuri de echilibre nu sunt diferite ci, n realitate, reprezint acelai tip de echilibru
aplicat diverselor tipuri de jocuri.
n continuare vom introduce conceptul de E.B.P.
5.1 Introducere
Fie jocul dinamic n informaie complet dar imperfect, reprezentat n figura 5.1 sub form
extins :
[p]
S M
2
0
1
2
0
0
1
0
S D D S
2
[1-p]
2
D 1
3
1
Figura 5.1
Reprezentnd sub form normal jocul descris n figira 5.1, vom obine matricea din figura
5.2:
2
S D
S 2,1 0,0
1 M 0,2 0,1
D 1,3 1,3
Figura 5.2
Acest joc, sub form normal, are dou echilibre n strategii pure: (S,S) i (D,D).
Jocuri dinamice n informaie incomplet
S determinm care dintre aceste echilibre sunt perfecte in subjoc.
Cum juctorul 2 nu tie ce a ales juctorul 1, nu exist subjocuri in acest joc, i n aceste
condiii echilibrele Nash sunt chiar echilibrele perfecte in subjoc.
Totui, echilibrul (D,D) nu este credibil, deoarece strategia S domin strategia D', deci
juctorul 2 fiind raional nu va juca D niciodat. Deci 1 nu va putea fi ameninat de 2 c va juca D
deoarece nu este credibil o asemenea ameninare, deci 1 nu va juca niciodat D. n acest caz unicul
echilibru va fi (S,S).
5.2. Echilibrul bayesian perfect
Pentru a defini E.B.P. vom face urmtoarele ipoteze:
Ipoteza 1 Pentru fiecare mulime de informaii, juctorul care mut (joac) trebuie s aib
anumite presupuneri (credine) despre ceea ce s-a jucat pn atunci.
Pentru o mulime de informaii ce nu este unic, o presupunere va fi o distribuie de
probabilitate asupra nodurilor din mulimea de informaii (pentru o mulime de informaii date, cu
nod unic, presupunerile juctorului vor avea probabilitatea 1).
Ipoteza 2 Date fiind presupunerile lor, strategiile juctorilor trebuie s fie secvenial
raionale (cu alte cuvinte pentru fiecare mulime de informaii date, strategia juctorului trebuie s
fie optimal date fiind presupunerile pe care le are).
Exemplu Pentru jocul descris anterior, Ipoteza 1 presupune c pentru fiecare mulime de
informaii nesingular (ex. S,M pentru juctorul 1), juctorul 2 crede c 1 va juca S cu
probabilitatea p i M cu probabilitatea 1-p.
Date fiind aceste presupuneri, ctigurile ateptate dac va juca D vor fi: 0p+1(1-p), iar
dac va juca S': 1p+2(1-p).
Cum Eu
2
(S)p > Eu
2
(D)=1-p, () p, rezult c juctorul 2 nu va juca niciodat strategia D.
Ipoteza 2 va elimina posibilitatea ca juctorul 2 s joace (din considerente de raionalitate).
Deci, ipotezele 1 i 2 consist n faptul c juctorii fac presupuneri despre modul n care
joac ceilali i date fiind aceste presupuneri fiecare juctor acioneaza raional, adic alege acele
strategii care i maximizeaz ctigul.
Definiia 5.1 Pentru un echilibru dat al unui joc n form extins o mulime de informaii
este pe calea de echilibru dac i este asociat o probabilitate pozitiv de a fi jucat i n afara
cii de echilibru dac este sigur c nu va fi jucat (p=0) de ctre juctori (aici, echilibrul poate fi
oricare din cele definite anterior).
Ipoteza 3 Pentru o mulime de informaii pe calea de echilibru, presupunerile sunt
determinate prin regula Bayes i strategiile de echilibru ale juctorilor.
Exemplu. Dat fiind un echilibru (de ex. S) juctorul 2 tie cu probabilitatea 1 c juctorul 1
va juca S.
n ipoteza 2, o strategie mixt va conduce la faptul c juctorul 2 crede c 1 joac S cu
probabilitatea q
1
, M cu probabiliatea q
2
i D cu probabiliatatea 1-q
1
-q
2
.
70
Jocuri dinamice n informaie incomplet
)
M) P(L
P(L)
P(L/M)
=
Atunci: (conform regulii Bayes:
q
2
q
1
q
1
p
+
=
Deci, noiunea de echilibru Bayesian perfect nu va include doar strategiile juctorilor, ci i
presupunerile pe care le fac despre strategiile alese de ceilali.
n multe cazuri, ipotezele 1-3 constituie chiar definiia E.B.P., dar noi vom mai impune o
condiie ce va cuta s elimine strategiile ce nu sunt credibile.
Ipoteza 4 Pe o mulime de informaii din afara cii de echilibru, presupunerile sunt
determinate de regula Bayes i de strategiile de echilibru ale juctorilor dac este posibil.
Definiia 5.2 Vom numi Echilibru Bayesian Perfect (EBP) o mulime de strategii i
presupuneri ce satisfac Ipotezele 1-4.
Exemplul 5.2
Se consider jocul dinamic n informaie incomplet descris sub form extins n figura 5.3
S
0
0
2
1
2
1
3
3
3
2
1
0
1
1
0
C
B
2
[p]
1 A
S D D
1
[1-p]
1
D
Figura 5.3
Observm c unicul echilibru Nash al jocului este (B,C,D).
Aceast strategie i presupunerea c p=1 satisfac ipotezele 1-3, (de asemenea i 4), deoarece
nu exist o mulime de informaii n afara cii de echilibru, deci este echilibru bayesian perfect.
Totui, fie strategia (A,C,S) cu p=0, care este un ehilibru Nash deoarece nici un juctor nu
este tentat s devieze de la ea.
Deci nu este suficient s avem ndeplinite doar ipotezele 1-3, deoarece acestea nu garanteaz
ce se ntmpl pentru mulimile de informaii din afara cii de echilibru.
71
Jocuri dinamice n informaie incomplet
Observaii
1. In cazul E.B.P., ipotezele 1 i 2 sunt echivalente cu faptul c nu exist strategii strict
dominate pentru cu orice mulime de informaii.
2. Ipoteza 4 arat faptul c juctorii nu pot amenina cu a juca strategii strict dominate.
Una dintre cele mai importante categorii de jocuri dinamice n informaie incomplet o
reprezint jocurile de semnalare.
5.3 Jocuri de semnalare
Un joc de semnalare este un joc dinamic n informaie incomplet ce presupune doi juctori:
Emitorul (E) i Receptorul (R) (sau Leader-Follower).
Jocul are urmtoarea desfurare:
Natura alege tipul t al emitorului din mulimea de tipuri posibile T={t
1
,,t
n
}i
probabilitaile asociate fiecriu tip t
i
: p(t
i
)>0, p(t
i
)=1.
Emitorul observ t
i
i alege un mesaj m
j
din mulimea mesajelor M={m
1
,,m
j
}.
Receptorul observ m
j
(nu i t
i
) i alege o aciune a
k
din mulimea aciunilor posibile
A={a
1
,,a
k
}.
Se determin ctigurile : U
E
(t
i
,m
i
,a
k
), U
R
(t
i
,m
j
,a
k
).
Observaie n multe aplicaii T,M i A sunt intervale din R, (nu doar mulimi discrete cum
am observat aici).
Acest tip de jocuri este foarte folosit n economie:
-Spence (1973) a oferit un model de semnalare pe piaa forei de munc;
-Myers-Maylef (1984) - au elaborat un model de investiii (emitorul - firma ce dorete
capital, receptorul eventualul investitor);
-Vickers (1986) model al politicii monetare (emitorul fiind Banca Naional. i
receptorul piaa forei de munc)
n continuare vom defini diverse tipuri de echilibru ce pot apare n aceste condiii. n figura
5.4 este reprezentat un joc de semnalare
m
2
m
1
m
1
m
1
natura
1-p
p
E
E
R
R
a
1
a
1
a
2
a
2
a
2
a
1
a
2
a
1
Figura 5.4
Astfel, vom avea:
72
Jocuri dinamice n informaie incomplet
Mulimea tipurilor, T= {t
1
,t
2
} ;
Probabilitatea cu care Natura alege tipul Emitorului, p{t
1
}=p;
Mulimea mesajelor: M={m
1
,m
2
};
Mulimea aciunilor receptorului este A={a
1
,a
2
}.
Reamintim c o strategie a juctorului 1 este dat de un plan complet de aciune n raport
cu tipul posibil.
n jocurile de semnalare, o strategie pur pentru Emitor (E) este m(t
i
) n care se specific
mesajul pe care l va emite n raport cu tipul su, iar o strategie pur pentru Receptor (R) este o
funcie a(m
j
) n care se va specifica ce aciune se va alege n raport cu mesajul emis.
n jocul descris anterior exist 4 strategii pure pentru E i 4 strategii pure pentru R:
1. E
1
joac m
1
dac este de tipul t
1
i joac m
1
dac este de tipul t
2
;
E
2
joac m
1
dac este de tipul t
1
i joac m
2
dac este de tipul t
2
;
E
3
joac m
2
dac este de tipul t
1
i joac m
1
dac este de tipul t
2
;
E
4
joac m
2
dac este de tipul t
1
i joac m
2
dac este de tipul t
2
;
2. R
1
joac a
1
dac observ mesajul m
1
i joac a
1
dac observ mesajul m
2
;
R
2
joac a
1
dac observ mesajul m
1
i joac a
2
dac observ mesajul m
2
;
R
3
joac a
2
dac observ mesajul m
1
i joac a
1
dac observ mesajul m
2
;
R
4
joac a
2
dac observ mesajul m
1
i joac a
2
dac observ mesajul m
2
.
E
1
i E
4
= se numesc strategii grupante (deoarece fiecare tip emite acelai mesaj);
E
2
i E
3
= se numesc strategii separatoare deoarece fiecare tip emite mesaje diferite.
Observaie n jocurile cu mai multe tipuri exist posibilitatea sa avem i stategii parial
grupate, respectiv parial separatoare(semiseparatoare).
n jocul descris anterior, o stategie mixt (sau hibrid) presupune c: t
1
alege m
1
, dar t
2
alege
cu o probabilitate (p) mesajul m
1
respectiv cu probabilitatea (1p) mesajul m
2
.
Pentru jocurile de semnalare vom defini Echilibrul Bayesian Perfect (aceasta presupune s
reformulm ipotezele 1-4 pentru acest tip de joc)
I
S1
Dup ce observ un mesaj m
j
din M, R face presupuneri despre tipul ce a emis
( )
=
T t
j i
i
1 /m t P
m
j
. Dac notm presupunerile cu p(t
i
/m
j
), cu p(t
i
/m
j
)0 ()t
i
n T i
I
R2
Pentru fiecare m
j
din M, aciunea actual a R, (a
*
(m
j
)) va maximiza utilitatea ateptat a
R, date fiind presupunerile sale asupra tipului t
i
ce a emis mesajul m
j
, (p(t
i
/m
j
)).
Astfel: .
( ) ) (
j i R j i
*
,m /m p max a ( =
T t
k
A a
j
j j
,a t U t arg m
I
S2
Oricare ar fi t
i
, mesajul lui E, (m
*
(t
i
)) va maximiza utilitatea ateptat a E date fiind
strategiile a*(mj) ale R.
73
Jocuri dinamice n informaie incomplet
Astfel: ( ) ( ) ( )
j
*
j i E
M m
i
*
m ,a ,m t U max arg t m
j
= .
I
S3
Pentru fiecare m
i
din M, dac exist t
i
T astfel nct m
*
(t
i
)=m
j
, atunci presupunerile R
despre mulimea de informaii corespunztoare lui m
j
trebuie s se determine conform regulii Bayes
i strategiilor E:
( )
( )
( )
=
T t
i
i
j i
i
t p
t p
/m t p
Definiia 5.4 Un E.B.P. n strategii pure pentru un joc de semnalare este o pereche de
strategii m
*
(t
i
) i a
*
(m
j
) i de presupuneri p(t
i
/m
j
) ce safisfac (I
S1
), (I
R2
), (I
S2
) i (I
S3
).
n raport cu strategiile E, echilibrul poate fi grupant sau separator.
Exemplul 5.3
Se consider jocul de semnalare descris n figura 5.5.
2,1
1,3
0,5
[1-q]
[q]
D
D
S
S
N
0,5
t
2
t
1
[1-p]
a
a
b
b
b
a
b
a
[p]
4,0
0,0
2,4
1,0
0,1
1,2
Figura 5.5
Exist 4 tipuri de E.B.P. n strategii pure posibile:
1) grupat n S;
2) grupat n D;
3) separat, cu t
1
-S, t
2
-D;
4) separat cu t
1
-D , t
2
-S.
Vom analiza cele patru posibiliti:
1) Presupunem c echilibrul pentru E este (S,S), cu (m,m) reprezint faptul c t
1
alege
mesajul m iar t
2
alege mesajul m.
Atunci mulimea de informaii corespunztoare lui S este o cale de echilibru, iar
presupunerile R vor fi (p,1-p) determinate prin regula Bayes i strategiile E: cu p=0,5, probabilitate
apriori.
Date fiind aceste presupuneri, cel mai bun rspuns al R este s joace a (cu ctigurile 3 sau
4).
74
Jocuri dinamice n informaie incomplet
Totui trebuie s analizm modul n care R va reaciona la strategia D.
Pentru tipul t
1
Dac rspunsul lui R la D este a, atunci ctigurile lui E vor fi mai mari
dect dac ar juca S (2 > 1).
Dac rspunsul este a, atunci Emitorul va ctiga 0, mai mic dect 4.
S deteminm probabilitatea q astfel nct orice echilibru s fie ((S,S),(a,b)).
u
R
((S,S), a) = u
R
((S,S),b) = (0,51)q+0,50(1q)0,50q+20,5(1-q)
0,5q=1-q, 1,5q=1, q=2/3
Deci pentru q < 2/3 , Receptorul va alege s joace aciunea a.
Deci a este optimal pentru R pentru orice q 2/3, i de aici rezult c echilibrul grupant
este [(L,L),(a,b), p=0,5; q].
2) Pentru tipul t
2
: q=0.5
BR(R) - cu ctigul 0 pentru (t
1
)
0,5
) a(t
) a(t
i
=
i
- cu ctigul 1 pentru (t
2
).
Dar t
1
ctig 1 jucnd S,
10,5<20,5 deci pentru R este optimal s joace a.
Acesta conduce la ctigurile de - 0 pentru (t1)
- 1 pentru (t2).
Deci (D,D) nu poate fi echilibru deoarece este dominat de strategia (S,S) .
3) echilibre separatoare :
t1-S
t2-D
Atunci ambele se gsesc pe calea de echilibru rezult p=1 i q=0.
q=p(t
1
/D)=p(t
1
)
1
5 , 0
5 , 0
) P(t
) P(t
/S) P(t
T t
i
1
1
i
= = =
q(t
1
/D)=0 (deoarece tipul 1 anun S)
S vedem dac pentru E este optimal s devieze de la aceste strategii. Dac tipul 2 deviaz i
alege S, atunci ctigul nu va fi 1, ci 2 deoarece i juctorul 2 va devia i va alege a, deci acesta nu
este un E.B.P.
4) echilibre separate
t
1
-D, t
2
- S
p=0 q=1
n aceste condiii B.R. pentru R va fi (a,a), iar ctigul pentru E va fi de 2. S verificm
dac a devia este optimal:
75
Jocuri dinamice n informaie incomplet
t
1
anun S R va juca a, cu ctigul lui E de 1. Deci nu este tentat s devieze.
t
2
anun D R va juca b, cu ctigul lui E de 1. Deci nici aici nu este tentat s devieze.
5.4 Aplicaii
A. Investiiile i structura capitalului
Presupunem cazul unui antreprenor ce dorete s nceap o nou afacere i are nevoie de
capital pentru a porni la lucru.
Antrepenorul (A) are informaii private despre profitabilitatea afacerii sale, dar ctigurile
nu pot fi desprite de cele ale companiei (deci i cele vechi).
Presupunem c A ofer un numr de aciuni n schimbul finanrii necesare.
n ce condiii va avea loc finanarea?
S traducem problema intr-un joc de semnalare.
Presupunem c profitul firmei poate fi de 2 tipuri: sczut S sau mare M, M>S>0 . Necesarul
de investiie este I, iar ctigul este R, atunci R > I(1+r).
Desfurarea jocului este urmtoarea:
1. Natura determin tipul firmei (cu probabilitatea p firma are profitul S).
2. A tie profitul i ofer investitorului o proporie din , cu 0S1.
3. Investitorul observ (nu i ) i decide s accepte sau s resping oferta.
4. Dac investitorul respinge oferta , atunci ctigurile pentru investitor sunt I(1+r), iar
pentru A este .
Dac investitorul accept atunci ctigurile pentru investitor sunt S(+R), iar pentru A (1-
S)(+R).
Myers i Mayluf (1984) au analizat acest model pornind de la o firm mare cu acionari i
manager .
Zenelor (1991) a determinat contractul optimal pe care trebuie sa-l ofere managerul
acionarilor.
Jocul este foarte uor datorit simplitii soluiei: mulimea aciunilor este limitat iar
mulimea semnalelor este mare dar ineficient.
S presupunem c dup ce a aprut oferta , investotorul presupune cu probabilitatea q c
=S. Atunci investitorul accept propunerea dac i numai dac:
[qS+(1-q)M+R] I(1+r) (1)
Pentru A: presupunem c tie c profitul este , va compara ctigul pe care l are n cele
dou variante i dac face investiia sau nu, in raport cu partea ce o va oferi:
(+R)=R
(1 - )( + R) ( + R) - ( + R) R ( + R)
(2)
+ R
R
76
Jocuri dinamice n informaie incomplet
Pentru un echilibru grupant presupunerea investitorului trebuie s fie q = p dup ce
primete oferta (din regula Bayes).
Dar restricia (2) este mult mai dificil de satisfcut pentru tipul M dect pentru tipul S.
Din (1) i (2) rezult:
i
R p)M pS
(1
r) I(1
+ +
+
R +
R
R
R p)M (1 pS
r) I(1
+
+ +
+
- pentru tipul =S cum M>S
R S R p)M ( pS +
+ +
R r) I( +
1
1
=M (3)
R r) I(
+
+ + R M R p)M ( pS
+
1
1
cum M>S
R M R S +
>
+
R R
- dac p 0, atunci relaia este adevrat, deoarece I(1+R) R
- dac p 1, atunci echilibrul este posibil doar dac:
R r) I( R
+ 1
0
1
+
+
+ R S
r) I(
R M
+ R M R S
SR+R
2
-MI(1+r)-RI(1+r)0
R[R-MI(1+r)]MI(1+r)-SR
S
R
r) I( R
r)M I( +
+
1
1
(4)
Interpretare Dificultatea obinerii unui echilibru grupant este aceea c tipul cu profit mare
trebuie s contribuie (subvenioneze) pe cel cu profit mic.
Dac investitorul este sigur c =M atunci q=0 astfel este la nivelul cel mai mic
R M
r) I(
+
+
=
1
posibil:
n acest caz pentru firma profitabil valoarea va fi prea mare, poate chiar prea mare pentru
a determina s realizeze proiectul.
Un echilibru grupant va exista pentru p 0 deci, fie costul subvenionrii este mic, fie
este ndeplinit relaia (3), adic se obine mai mult din costul dus de noul proiect dect din
subvenionare. Dac (2) nu este ndeplinit, atunci nu exist un echilibru grupant, i rezult n acest
caz existena unui echilibru separator.
77
Jocuri dinamice n informaie incomplet
78
n concluzie, firma S va oferi proporia ceea ce investitorul va accepta,
r)
=
R S
I(
+
+ 1
iar firma M va oferi proporia ceea ce investitorul va refuza.
r) I( +
<
R M
+
1
n asemenea situaie investiiile au o eficien sczut, chiar dac noua investiie este
profitabil, deoarece tipul bun nu va dori s o fac.
Aceasta arat modul n care semnalele nu sunt eficiente.
Problema se poate modifica, n sensul n care firma nu ofer aciuni, ci face un mprumut D.
Dac nu se d faliment atunci ctigul investitorului este D, iar al firmei: +R-D
Dac se d faliment, atunci pentru investitor ctigul este +R, iar pentru firm 0.
Cum S > 0, exist un echilibru grupant: ambele tipuri de firme ofer un contract D=I(1+r)
pe care investitorul nu l va accepta.
Dac D este negativ, astfel nct R + D < I (1+r), atunci tipul slab nu va putea plti datoria,
iar investitorul nu va accepta contactul.
Analog se poate raiona pentru cazul n care S i M reprezint profituri ateptate (cu
probabilitatea 1/2).
Dac profitul este + K cu probababilitatea 1/2 , atunci tipul slab nu va fi n stare s
plteasc dobnda, iar investitorul nu va accepta contractul.
Dac profitul este - K, cu probababilitatea 1/2, atunci nici firma, nici investitorul nu vor
accepta contractul.
CAPITOLUL 6
Teoria negocierilor
Una dintre activitile fundamentale n teoria economic este schimbul. n timp ce schimbul
pe o pia cu mai muli comerciani a fost explicat relativ bine, n cazul negocierilor ntre dou pri
este mult mai dificil. Faptul c pe pia sunt mai muli productori i consumatori de puteri relativ
apropiate (i n acelai timp nesemnificative pentru dimensiunea pieei) face posibil modelarea
comportamentului acestora, privindu-i ca indivizi reprezentativi. n schimb, n condiiile unor
grupuri mici, comportamentul individual se modific, aciunile alese de fiecare dintre participani
innd cont de alegerile celorlali, pe de o parte, iar pe de alt parte posibilitile proprii.
Teoria negocierilor are o tradiie ndelungat n teoria economic. Primele studii pot fi
atribuite lui Edgeworth, care a analizat problema i a descoperit unele caracteristici fundamentale
ale procesului de negociere. Totui o abordare complet nu s-a putut face mult timp, teoria jocurilor
fiind aceea care a dus mai departe n prezent analizele n acest domeniu.
6.1. Introducere
Exemplul 6.1. Schimbul n dreptunghiul Edgeworth
Fie 2 consumatori ce consum 2 bunuri n cantitile x i y. Presupun c cei 2 consumatori
au dotrile iniiale ) , (
i i
y x nenegative din cele dou bunuri, iar preferinele sunt reprezentate prin
funcii de utilitate u
i
(x
i
, y
i
) , i =1,2 cresctoare i cvasiconcave. Dreptunghiul Edgeworth n care
reprezentm situaia este dat n Figura 6.1.
2
y
1
x
1
y
2
x
y
2
x
2
O
2
O
1
y
1
x
1
1
x
Figura 6.1
Analizele tradiionale nu au ca rezultat o singur alocaie care s fie echilibru n cazul
procesului de negociere, deoarece se poate identifica o mulime de echilibru ca rezultate raionale
Jocuri i negocieri
ale negocierii. Acest mod de a determina echilibrele nu este bazat pe studiul negocierii nsi, dar
folosete ca ipoteze de rezolvare urmtoarele ipoteze:
a) Juctorii raionali nu vor accepta alocaii care s nruteasc utilitatea alocrii iniiale
(condiia de raionalitate individual);
b) Juctorii raionali vor accepta toate ctigurile poteniale ale schimbului (eficiente sau
Pareto optimale).
Prima dintre ipoteze afirm faptul c juctorii sunt liberi s refuze schimbul n cazul n care nu
i mbuntesc utilitatea. A doua presupune c juctorii, tiind preferinele partenerilor de
negociere, nu vor refuza ocazia de a-i mbuntii satisfacia.
Aceste principii sunt suficiente pentru a putea determina rezultatul unor negocieri ca partea
curbei contractelor ce este ngroat n figura 6.1. Aceste alocaii sunt ncadrate de curbele de
indiferen ale juctorilor generate de alocaia iniial (RI) i de faptul c fiecare agent i
maximizeaz utilitatea dat fiind un anumit nivel al utilitii dorit de cellalt juctor (eficien).
Un al doilea studiu economic foarte important deriv din analiza negocierilor privind contractele
de munc dintre sindicate i patronat.
Exemplul 6.2. Negocierile sindicate patronat
Considerm cazul unei negocieri dintre un sindicat i patronat cu privire la salariul individual w
i numrul de angajai n.
Presupunem c funcia de utilitate a sindicatului este dat prin:
v(w,n) = wn C(n)
unde C(n) reprezint funcia de cost a sindicatului (ce poate reprezenta costul de oportunitate
pentru membrii si).
Obiectivul firmei este de a-i maximiza profitul (n) pornind de la ncasri R(n) (care vor face
legtura dintre numrul de muncitori i venitul pe care l poate obine firma de pe urma folosirii
acestora) i de la costul pentru plata salariilor:
(w, n) = R(n) wn
Ce se poate spune despre rezultatele negocierilor? Ct timp fiecare juctor are interesul de a
mri surplusul total astfel nct s poat lua o parte ct mai mare de surplus, n va fi ales astfel nct
ncasrile marginale vor egala costul marginal de oportunitate pentru muncitori:
( ) ( )
* ' * '
n C n R =
Astfel se poate determina relativ lejer numrul de muncitori, deoarece n
*
va maximiza
nivelul surplusului total v (w, n) + (v, n), i aceasta nu depinde de nivelul salariului. Astfel,
numrul de muncitori este cel eficient, dar nivelul salariului rmne de determinat prin negocieri.
n figur este reprezentat o situaie tipic pentru o funcie de venit R(n) cresctoare i
concav i o funcie de cost C(n) cresctoare i convex.
Presupunnd c patronatul nu va accepta s lucreze n pierdere iar sindicatele doresc s fie
compensate pentru costul de oportunitate al membrilor si, rezult c C(n) wn R(n), atunci
80
Teoria negocierilor
vom obine nivelul salariilor posibile | | w w, . Mulimea contractelor ( ) | | { }
*
, , , u u w w w n w = este
individual raional i Pareto optimal.
w
( ) 0 , = n w
( ) 0 , = n w v
( )
, = n w
n
( ) v n w v , =
w
n
*
Figura 6.2
n cazul negocierilor dintre patronate i sindicat rezultatele pot fi transferate ntre juctori
deoarece funciile de ctig pentru firm ( ) n w, i pentru sindicat ( ) n w, v sunt ambele liniare n
raport cu salariul. Funciile de ctig liniare n raport cu un bun vor fi numite cvasi liniare, iar
dac juctorii au funcii de ctig cvasi liniare n raport cu acelai bun atunci utilitatea se poate
transfera ntre juctori. (Observm c n cazul dreptunghiului Edgeworth nu am presupus c
utilitile ar fi transferabile.)
n multe aplicaii negocierile pot fi privite ca un mod de a determina alocaii relative la
ctigurile ambilor juctori. Acesta este i cazul negocierilor sindicate patronate n care
utilitatea este transferabil prin intermediul salariului.
n cazul dreptunghiului Edgeworth un nivel de utilitate particular pentru unul dintre juctori
va determina n mod direct nivelul de utilitate al celuilalt juctor, fr ambiguitate. De aceea este
util uneori s analizm procesul de negociere doar n spaiul ctigurilor fezabile, dect s
determinm alocaia corespunztoare n tot spaiul.
Relund exemplul anterior, mulimea combinailor ctigurilor fezabile va fi determinat de
surplusul maximal ( ) ( )
* *
n C n R v + i de restriciile de raionalitate individual 0 i
. 0 v
Toate ctigurile negocierilor individual raionale i optimale Pareto sunt reprezentate de
segmentul de dreapt AB din figura 6.3.
Orice combinaie ( )
* *
, v de pe frontiera Pareto corespunde unui salariu particular din
intervalul | | w w, :
( ) ( )
* * * * * * * * *
/ / / / n v n n C n n n R w + = =
81
Jocuri i negocieri
Toate combinaiile de ctiguri de sub segmentul AB vor fi realizabile i individual
raionale, dar nu i Pareto optimale, de aceea este suficient s analizm combinaiile de pe frontiera
combinaiilor Pareto optimale.
( ) ( )
* *
n C R
B
A
( ) ( )
* *
n C R
*
v
v
*
Figura 6.3
Similar, putem transforma problema din exemplul 1 ntr-o problem de negociere pe baza
combinaiilor de utilitate (u
1
, u
2
) ale celor 2 consumatori. De exemplu, dac presupunem c funciile
de utilitate ale celor 2 juctori sunt:
( ) ( )
( )
+ =
=
2 2 2 2 2
1 1 1 1 1
4 ,
, ,
y x y x u
y x y x u
, cu = 0.5 .
Problema de optimizare va fi de a alege ( )
1 1
, y x ce maximizeaz cu restricia (
1 1
, y x )
( ) ( )
2 1 2 1 1
2 1 4 U y y y x x x + + + .
Notnd cu ( ) ( )
2 1
2 1 4 y y x x A + + + = obinem soluiile:
- curba contractelor este i de aici:
1 1
4y x =
| |
| |
=
=
2 1
2 1
2
5 . 0
u A y
U A x
nlocuind n funcia obiectiv i rezolvnd pentru U
2
obinem frontiera utilitilor posibile
(sau frontiera Pareto) ca , cu ( )
1 1
U A U F =
2
1
= .
Parametrul msoar concavitatea funciei de utilitate pentru primul consumator, deci cu
ct este mai mic , cu att va fi mai concav ( )
1 1 1
, y x U . Modificrile lui corespund unei
transformri monotone i nu vor afecta alocaiile de pe curba contractelor. Mai mult, adunnd sau
scznd o constant din valoarea funciei de utilitate nu se va afecta comportamentul
consumatorilor. Ca atare, U poate rezolva ( )
i
y
i
i
x , U din utilitatea fiecrui juctor astfel nct s
normalizm la 0 nivelul introdus al utilitii fiecrui juctor. n figura 6.4 am artat cum arat
aceast frontier pentru cazul considerat.
82
Teoria negocierilor
n general, o problem de negociere va fi descris ca o funcie f : R R continu i
descresctoare, care asociaz oricrui nivel al ctigurilor juctorului 1 nivelul maxim al ctigului
posibil pentru juctorul 2: . Funcia f este frontiera superioar a combinaiilor de
ctiguri fezabile (x
( )
1 2
x f x =
1
, x
2
). Combinaiile de ctiguri de sub aceast frontier sunt fezabile dar nu sunt
Pareto optimale. Ctigurile ce satisfac condiia , i=1,2 sunt individual raionale.
i i
d x
Figura 6.4 U
1
U
2
Frontiera utilitilor
posibile
n continuare vom presupune c exist ntotdeauna o pereche de ctiguri ( )
0
2
0
1
, x x ce satisfac
condiia ( )
0
1 2
x f d = i . ( )
1
0
2
d f x =
Definim o problem de negociere astfel:
Definiia 6.1 O negociere este dat prin perechea (X, d) unde X este mulimea
combinaiilor ctigurilor posibile ( ) ( ) { }
1 2
2
2 1
, x F x R x x X = precum i o combinaie de
ctiguri d ce se obine n cazul eecului negocierilor. ( ) X d d =
2 1
,
Dac F este o funcie continu atunci X este o submulime compact (nchis i mrginit)
din R
2
. Dac F este o funcie concav atunci X este o mulime convex.
n figura 6.5 prezentm o problem de negociere tipic.
F(x
1
)
d
2
d
1
x
1
0
x
2
Figura 6.5
n continuare vom prezenta 2 abordri distincte: n prima parte vom prezenta cazul unor
negocieri necooperative, iar n a doua cazul celor cooperative.
83
Jocuri i negocieri
6.2 Proceduri de negociere necooperative
n mod obinuit, descrierea unei probleme de negociere constituie detalierea tuturor
micrilor posibile pentru fiecare juctor. Odat cu mutrile posibile i ctigurile sunt specificate,
conceptul de echilibru conduce la soluia procesului de negociere.
Exemplul 6.3.
Fie 2 juctori negociind 3 dolari (indivizibili) astfel:
Fiecare juctor i=1,2 sugereaz o cot parte S
i
pentru el i dac cererile sunt fezabile
(posibile), adic 3
2 1
+ S S , atunci rezultatul este acceptat pentru negociere, n caz contrar, fiecare
juctor primete 0. Cum strategiile 0 i 3 sunt (slab) dominante, se poate renuna la ele, iar matricea
ctigurilor va fi:
J
2
1,1 1,2
J
1
2,1 0,0
Observm c pentru acest joc exist dou echilibre Nash n strategii pure {(1,2),(2,1)} n
care unul dintre juctori are 1$ iar cellalt 2$. Evident, fiecare dintre ei prefer alt echilibru, iar
ambele sunt la fel de raionale. Aceast specificare a procedurii de negociere nu este suficient
pentru a determina soluia negocierii. Nedeterminarea va putea fi ndeprtat prin specificarea
ctorva detalii suplimentare despre procedura de negociere.
1
(0, 0)
(,2)
(0, 0)
(2, )
(1, 2)
(0, 0)
(, 2)
(0, 0)
(2, )
2$
2
r
a
r
a
1$
r
a
a
r
a
a
r
r
1$
2$
1$
2$
(2, 1)
2
1
Figura 6.6
Presupunem c juctorul 1 propune primul o mprire a sumei. Juctorul 2 poate accepta
propunerea, a, caz n care el obine restul, sau o poate refuza, r. Dac el refuz atunci va face la
84
Teoria negocierilor
rndul su alt propunere, i juctorul 1 o poate accepta sau refuza. Dac i a doua propunere nu
este acceptat atunci ambii juctori primesc 0. Descrierea jocului sub form extins este ]n figura
6.6 (tiind c ambii juctori au aceeai rat de actualizare ):
Se poate determina echilibrul acestui joc prin inducie recursiv. Dac < 0.5, atunci juctorul 1
va cere 2$, iar juctorul 2 va accepta propunerea, iar dac > 0.5 va cere 1$, cerere acceptat
imediat de al doilea juctor.
Acest exemplu sugereaz faptul c soluia poate fi determinat printr-o detaliere a procesului de
propuneri i costuri de ateptare. Aceast idee poate fi generalizat n mai multe moduri. Cel uzual
privete numrul soluiilor posibile. Aplicnd procedura de negociere de la exemplul anterior unor
clase mai mari de negocieri, va trebui s descriem procedura de negociere astfel:
negocierea are loc pe etape i juctorul 1 ncepe;
n fiecare etap un juctor propune o alocaie (x
1
, x
2
);
cellalt va rspunde fie acceptnd, fie refuznd;
dac rspunsul este A(accept) atunci jocul ia sfrit, iar alocaia propus este implementat;
dac rspunsul este R(refuz), ncepe o nou rund de negocieri, cu juctorul care a refuzat
fcnd o nou propunere;
ratele de actualizare ale celor 2 juctori sunt
1
i
2
dac nu se atinge nici o nelegere la etapa T atunci ambii juctori vor primi 0.
n form extins, un astfel de joc este descris n figura 6.7, pentru T=5:
1
( )
4
2
4
1
, x x
( )
3
2
3
1
, x x
( )
2 1
, x x
( )
2 1
, x x
( )
4
2
3
2
4
1
3
1
, x x
( ) 0 , 0
( )
2
2 2
2
1 1
, x x
( )
3
2
2
2
3
1
2
1
, x x
( )
2
2
2
1
, x x
t = 5
t = 4
t = 3
t = 2
t = 1
1
A
R
A
R
A
R
A
2
2 1
1
2
2
Figura 6.7
Acesta este un joc extensiv n informaie perfect, n care se pot determina echilibrele
perfecte n fiecare subjoc prin inducie recursiv. Fiecare etap de ntrziere reduce mulimea
combinaiilor fezabile deoarece juctorii actualizeaz viitorul. n acest caz, frontiera ctigurilor
posibile la momentul t este ( ) ( )
1
1 1
1
2 1
/
=
t t
t
x f x F
85
Jocuri i negocieri
n figura 6.8 este reprezentat mulimea ctigurilor posibile n urma unui joc de negociere
cu 5 etape:
O
x
2
x
1
F
1
(x
1
)
F
2
(x
1
)
F
3
(x
1
)
F
4
(x
1
)
Figura 6.8
Analiznd exemplele 1 i 2 din aceast perspectiv vom obine:
Exemplul 6.4
Fie jocul de negociere Edgeworth n care frontiera ctigurilor posibile este
. Vom presupune c negocierea are loc n 5 etape, dup procedura descris
anterior. Este uor de determinat prin inducie recursiv echilibrul perfect n subjoc care este i unic.
( )
1 1
U A U f =
Etapa 4. Juctorul 2 propune mprirea sumei. Cum negocierile iau sfrit n etapa
urmtoare, ctigurile n cazul eecului sunt 0, atunci juctorul 2 va cere cea mai bun alocaie
posibil pentru el ( ) A f = = 0
4
2
U . Juctorul 1 va accepta propunerea, deoarece altfel ar ncasa 0.
Valoarea prezent a propunerii juctorului 2 este ( ) ( ) 0 0
4
3
2
F f = .
Etapa 3. Juctorul 1 va face propunerea tiind c juctorul 2 va refuza orice ofert care i
aduce un ctig mai mic de F
4
(0). Dat fiind aceast restricie, cel mai bun ctig ce poate fi obinut
de juctorul 1 este U , care las juctorului 2 exact ctigul ce-l poate obine anterior
3
1
( ) ( ) 0
4
3
1 3
F U F = .
Etapa 2. Pentru juctorul 2 este optimal s propun o alocare care las juctorului 1 ctigul
minim actualizat ce-l poate obine dac accept oferta ( )
2
2
3
1 3
U U F = .
Etapa 1. Juctorul 1 va cere U , astfel nct juctorul 2 s fie indiferent ntre a accepta sau a
refuza, adic
1
1
( ) ( )
3
1 2
2
2
1
1 1
U F U U F = = . Grafic, inducia recursiv este prezentat n figura 6.9,
artnd care este secvena de propuneri actualizate pentru juctorul 1 dup urmtorul sistem de
ecuaii recursive:
86
Teoria negocierilor
( ) (
( ) ( )
=
=
0
4
3
1 3
3
1 2
1
1 1
F U F
U F U F )
Propunerile actualizate ale juctorului 2 n perioadele pare sunt ( )
1
1 2 2
+
=
t t
U F U . Dat fiind
definiia lui F
t
(U
1
) se poate exprima aceast secven n raport cu frontiera ctigurilor neactualizate
f(U
1
) i cu factorii de actualizare
1
i
2
.
3
1
U
1
1
U
4
2
U
2
2
U
1
U
2
U
F
1
(.)
F
2
(.)
F
3
(.)
F
4
(.)
O
Figura 6.9
( ) ( )
1
3
1 2
1
1
/ U f U f =
( ) ( ) 0 /
3
2
2
1
3
1
2
2
f U f =
Din aceste ecuaii se determin unicul echilibru perfect n subjoc pentru juctorul 1:
( ) ( ) ( )( ) | | ( )( ) | |
|
|
.
|
\
|
+ + = A A A U f U
2 2 1
1
2 2 1
1
1
1
1
1 1 , 1 1 ,
pe care juctorul 2 l va accepta imediat.
n acest exemplu este uor de vzut formula recursiv ce determin echilibrul ntr-o form
general:
( ) ( )
t t t t t t t
x f x x f
1
2
1 2
1
2
1
1 1
1
2
/ /
+ +
= = pentru t impar i .
=
=
0
0
2
1
T
T
x
x
Pentru exemplul 2, frontiera ctigurilor posibile este ( ) = A f , cu ( ) ( )
* *
n C n R A = .
Vom presupune c negocierea se desfoar dup aceleai reguli, cu T=6. Din formula general,
ctigurile actualizate ale juctorului 1 sunt:
( ) ( )
1
3
2
1
/ f f =
( ) ( ) 0 /
3
2
2
1
3 2
2
f f =
nlocuind ( ) = A f n cele 2 ecuaii obinem:
87
| |
1
3
2
1
/ = A A
Jocuri i negocieri
| | | | 0 /
3
2
2
1
3 2
2
= A A , de unde
( )A
2
1
2
1
3
1 = i
( )( ) | |A
2 1 2
1
1 1 + =
Expresia din paranteza ptrat arat care este proporia din surplusul A ce este obinut de
patron dup 5 runde ale negocierii. Deci, n cazul n care sindicatul are ansa de a face ultima
propunere, el va obine un surplus mai mare, care este dat de ateptare, iar aceasta pentru
2
mai
mare. n plus, se vede uor c partea fiecrui juctor crete odat cu factorul de actualizare.
Acesta este de altfel un exemplu de negociere care este strns legat de rbdarea juctorului.
Un aspect nedorit al procedurii de negociere este dependena de orizontul final T. Dac T
este un numr par, atunci juctorul 2 va face ultima ofert i este n avantaj. Dac T este impar,
juctorul 1 face ultima ofert i deci va fi el n avantaj.
Este de asemenea important s vedem ce se ntmpl n cazul n care T tinde la infinit.
Echilibrul rmne unic n acest caz?
n cazul jocurilor finite tim c exist un echilibru perfect unic, dar acesta depinde de faptul
c T este par sau impar.
Teorema 6.1
Dac frontiera ctigurilor dat prin funcia f este concav i difereniabil i dac factorii de
actualizare
1
i
2
sunt ambii mai mici dect 1 atunci exist un echilibru perfect al subjocului unic
pentru jocul de negociere n care T = . Combinaia de ctiguri la echilibru ( ) ( )
*
1
*
1
, x f x este dat
prin: ( ) ( )
*
1 2 2
*
1
x x f f = (*).
Demonstraie. Demonstraia const n dou pri. Prima privete existena echilibrului, iar a
doua arat unicitatea sa.
Observaie. Ecuaia (*) poate descrie echilibrul jocului i din urmtoarea consideraie: orice
echilibru const ntr-o propunere a juctorului 1 care va fi imediat acceptat deoarece orice
ntrziere este costisitoare. Ceea ce se va accepta n viitor se va accepta i n etapa 1. n cazul
orizontului finit, prin inducie recursiv determinm secvena de propuneri a juctorului 1 dup
expresia:
*
1
x
( ) ( ) ( ) ( )
2
1 1 1
2
1 2
1
1 1
1
2 1
/ /
+
+
+
= = =
t
t
t t t t t t t
t
x F x f x f x F
Aplicnd aceast relaie pentru t = 1 i se obine ecuaia (*) ,
*
1
1
1
x x
t t
=
( ) ( )
1
1
*
1
2
1
1
2
0
1
*
1
0
2
/ / x f x f = .
Analizm situaia n cazul exemplelor 1 i 2 pentru cazul orizontului infinit.
Exemplul 1 (reluare)
Fie cazul n care nu exist limit temporal ntre negocierile ntre consumatori (T = ).
n acest caz graficul funciei descrie toate perechile Pareto optimale pe care
le pot obine cei doi consumatori. Deci din:
( )
1 1
U A u f =
( ) | |
1 1 2 1
u A U A =
88
Teoria negocierilor
se poate determina ctigul pentru juctorul 1:
( )
( )
1
2 1
2 *
1
1
1
(
= A U
Similar, pentru juctorul 2 obinem:
( )
( )
(
= A U
2 1
1 *
2
1
1
Aici este uor de verificat faptul c o transformare monoton a funciei de utilitate pentru
juctorul 1 va modifica ctigurile negocierii, chiar dac alocaiile Pareto optimale i restriciile de
raionalitate individual rmn nemodificate.
Pentru a vedea aceasta, o descretere a lui va crete
2
1
= . Difereniind U n raport cu
obinem:
*
2
( ) ( ) | | 0 ln 1 1
2 1 1 2
2
2 1
*
2
> =
A
U
deoarece ln 0
1
< i 1
2
< .
O cretere a lui va conduce la o cretere a ctigului juctorului 2, U , n spe cantitile
din cele 2 bunuri obinute de juctorul 2 meninndu-se pe curba contractelor ce va rmne
nemodificat.
*
2
Astfel, dac descrete, atunci negocierile vor conduce la o cretere a utilitii pentru
consumatorul 2 i o descretere pentru consumatorul 1.
Acest mod de determinare a echilibrului este foarte sensibil la toate detaliile procesului de
negociere, ca i la ntrzieri care sunt costisitoare pentru juctori.
)
6.3. Abordarea cooperativ. Proprieti necesare ale ctigurilor
O modalitate alternativ de determinare a ctigurilor unei negocieri este abordarea
cooperativ. n acest caz n loc s descriem procedura de negociere detaliat vom ncerca s o
caracterizm prin anumite axiome ce trebuie respectate. Urmtorul exemplu ilustreaz acest punct
de vedere.
Exemplul 6.5
Considerm cazul a 2 juctori ce trebuie s mpart 100 $. Dac nu vor ajunge la o
nelegere, atunci vor primi d = (0,0). Suma prilor primite de fiecare nu este n mod necesar 100.
Problema de negociere este prezentat i prin figura 6.10.
Presupunem c soluia obinut trebuie s satisfac dou criterii:
a) un vector de ctiguri ( trebuie s fie optimal Pareto;
2 1
, x x
89
Jocuri i negocieri
b) n problema de negociere fezabilitatea lui ( ) ( ) b a x x , ,
2 1
= implic fezabilitatea soluiei
, i n acest caz juctorii vor primi pri egale. ( ) ( a b x x , ,
2 1
= )
45
0
x
x
100
100
50
50
Figura 6.10
Prima cerin a fost discutat i anterior i pare rezonabil pentru juctori raionali i perfect
informai. Aceasta sugereaz c soluia se afl pe frontiera superioar a mulimii soluiilor.
A doua cerin se bazeaz pe faptul c juctorii i pot schimba locul ntre ei i ca urmare
ctigurile trebuie s fie simetrice. Simetria problemelor de negociere indic faptul c nu se poate
face distincie ntre juctori, i ca urmare nici partea primit nu trebuie s fie diferit.
Cum soluia problemei trebuie s fie simetric, ea se afl pe prima bisectoare, iar din cerina
(a) se afl pe frontiera Pareto, i deci ( ) ( ) 50 , 50 ,
*
2
*
1
= x x este unicul echilibru ce satisface (a) i (b).
Exemplul anterior ilustreaz ideea de abordare cooperativ: o mulime de cerine
rezonabile pentru rezultatele negocierii poate determina soluia. n fapt, optimalitatea Pareto i
simetria determin o soluie unic pentru toate problemele de negociere simetrice. De asemenea, n
negocierile ce nu sunt simetrice nu avem nici o raiune n a presupune c soluia ar fi simetric, de
aceea vom cuta ca prin axiomele introduse s nu se restrng clasa de probleme la care se aplic, ci
s fie ct mai larg. O soluie a negocierii va fi obinut astfel nct procedura ataat fiecrei
negocieri s conduc la un unic rezultat.
Definiia 6.2 Fie N mulimea problemelor de negociere. O soluie a negocierii este o funcie
f : N R
2
, care asociaz fiecrei probleme de negociere (x, d)N o soluie
particular ( ) ( ) d X f x x , ,
*
2
*
1
= .
Observm c aceast definiie poate fi privit ea nsi ca o axiom asupra modului n care
privim soluiile negocierilor. Ea presupune c numai mulimea ctigurilor posibile X i punctul d
(ameninarea de eec a negocierilor) pot fi atinse ca soluii i acest principiu se aplic tuturor
negocierilor din N.
Sistemul de axiome prezentat aici este o generalizare a celui propus de Nash (1953).
Primele dou axiome cer ca soluia negocierii s fie individual raional i optimal Pareto.
Aceste cerine sunt foarte sugestive i au fost discutate anterior.
90
Teoria negocierilor
Axioma 1. (raionalitate individual puternic)
Soluia unor probleme de negociere ( ) ( ) d X f x x , ,
*
2
*
1
=
*
1 1
x d <
trebuie s fie strict mai bun pentru
ambii juctori dect soluia obinut n cazul eecului: i .
*
2 2
x d <
Axioma 2. (optimalitate Pareto)
Nu exist combinaii de ctiguri fezabile ( )
2 1
, x x mai mari pentru ambii juctori dect
soluia negocierii ( ) ( ) d X f x x , ,
*
2
*
1
= : i implic
*
1 1
x x >
*
2
x
2
x > ( ) X x x
2 1
, .
O soluie a negocierii ce satisface primele dou axiome face legtura dintre frontiera Pareto
a problemei i relaia de preferin strict n raport cu ctigurile n caz de eec pentru ambii
juctori.
Figura 6.11
d
2
d
1
x
1
x
2
Combinaia de ctiguri ce satisface
axiomele 1 i 2.
Urmtoarea axiom afirm c problemele de negociere sunt n mod esenial identice i pot fi
transformate una n alta prin intermediul unei aplicaii liniare, i cu excepia acestei transformri
liniare toate problemele trebuie s aib aceeai soluie.
Axioma 3 (invariana).
Dac problema de negociere ( )
'
, d Y
( ) X x
este legat de alt problem (X, d) astfel nct
, ( ) (
2 2 2 1 1 1 2 1
, , x B A x B A y y + + = ) x
1 2
, i ( ) Y y y
2 1
, , atunci soluiile problemei de
negociere( ) ( ) d X f x x , ,
*
2
*
1
= i ( ) ( )
' *
2
, y
*
1
, d Y f = y trebuie s satisfac:
( ) ( )
*
2 2 2
*
1 1 1
*
2
*
1
, , x B A x B A y y + + = .
Invariana soluiei la transformare liniar este justificat de invariana funciilor de utilitate
la transformrile liniare. Dac ctigurile ambilor juctori vor fi considerate ca utiliti Von
Neumann Morgenstern atunci preferinele pot fi rezultate sub form unic, mai puin o
transformare afin.
Acestea arat c aceleai preferine n raport cu o loterie vor fi reprezentate dac ctigul x
t
este nlocuit de y
i
=
i
(x
i
), cu
i
(x
i
) de forma
i
(x
i
) = A
i
+ B
i
X
i
.
cu A
i
numere reale arbitrare, iar B
i
numere reale pozitive arbitrare.
91
Jocuri i negocieri
O asemenea transformare a utilitii nu va afecta preferinele i deci nici problema de
maximizare a utilitii ateptate, i prin urmare soluia nu depinde de valorile A
i
i B
i
. Aceast
axiom face posibil tratarea unui mare numr de negocieri ca echivalente. n particular, toate
negocierile cu frontiera Pareto a soluiilor liniar sunt echivalente.
Exemplul 6.6
Fie problema de negociere (X, d) cu frontiera Pareto liniar:
X = {(x
1
, x
2
)R
2
|x
2
a bx
1
} , cu a >0, b>0.
Fie transformarea liniar ( )
i i i i i
x B A x + = i mulimea
( ) { }
2 2 1 1 2 1
d x , d x X x , x D
x
=
din mulimea
( ) { } 2 0 0
2 1 2 1
2
2 1
+ = x x , x , x R x , x D .
Figura 6.12 ilustreaz aceast transformare.
Fie .(Formal aceast transformare poate fi obinut stabilind
astfel:
( ) ( 0 , 0 ,
2 1
= d d ) ( )
2 1 2 1
, , , B B A A
1
1
1
d a
d
A
= ,
1
1
1
d a
B
= ,
( )
2
2
2
/ d b a
d
A
= ,
( )
2
21
/
1
d b a
B
= .
Se verific uor c aceti parametri transform problema (X, d) n problema (D, 0).
Invariana cerut de axioma 3 arat astfel:
Dac este ( )
*
2
*
1
, x x soluia problemei (X, d) atunci:
( )
( )
|
|
.
|
\
|
=
2
2
*
2
1
1
*
1 *
2
*
1
/
, ,
d b a
d x
d a
d x
y y
este soluia pentru (D, 0) i reciproc.
Figura 6.12
f(x
1
) = a b x
1
1
1
d
2
d
1
x
2
x
1
D
x
92
Teoria negocierilor
Cea de-a patra axiom cere ca soluia negocierii s fie independent de combinaiile de
ctiguri fezabile i individual raionale care nu afecteaz soluia, cu alte cuvinte alternativele
irelevante vor lsa soluia nemodificat.
Axioma 4 (independena alternativelor irelevante)
Fie o negociere (X, d) cu soluia ( )
*
2
*
1
, x x . Dac o alt negociere (Y, d), cu X Y conine
punctul ( )
*
2
*
1
, x x atunci ( )
*
2
*
1
, x x trebuie s fie soluie i pentru negocierea (Y, d).
Figura 6.13 ilustreaz ideea prezentat de aceast axiom. nlocuind mulimea soluiilor,
fr a modifica soluia nsi, se poate obine o alt negociere cu aceeai soluie.
Figura 6. 13
(Y,d)
(X,d)
d
2
d
1
x
2
x
1
x
1
*
x
2
*
O implicaie imediat a axiomei 4 este aceea c soluia unei negocieri cu frontiera Pareto
liniar va fi soluie pentru toate negocierile cu frontiera Pareto tangent la acea soluie.
Ultima axiom este aceea de simetrie.
Axioma 5 (simetria)
Dac problema de negociere (X, d) satisface:
a) d
1
= d
2
b) (x
1
, x
2
) X (x
2
, x
1
) X
atunci soluia ( ) ( d X f x x , ,
*
2
*
1
= ) trebuie s satisfac .
*
2
*
1
x x =
n exemplul 6.5 am artat cum simetria i optimalitatea Pareto conduc la o soluie unic a
problemelor de negociere simetrice. Teorema urmtoare arat c cele 5 axiome conduc la o soluie
unic a negocierilor pentru orice mulime N ce conine doar probleme de negociere convexe.
Ideea demonstraiei este simpl: problema de negociere (D, 0) este simetric cu soluia unic
(0.5 , 0.5). Considernd o problem de negociere arbitrar a(X, d), dac aceasta este convex, atunci
fiecare punct Pareto optimal are o tangent ce poate fi trasat simplu. Teorema arat c exist un
punct unic pe frontiera Pareto pentru fiecare problem de negociere, a(X, d) care are proprietatea c
o transformare liniar a funciei liniare tangent n el la graficul frontierei va conducela tangenta la
punctul (0.5 ; 0.5) din problema (D, 0). Din axioma 3, a(X, d) trebuie s fie soluie a negocierilor cu
tangent la (X, d) n a(X, d) pe frontiera Pareto. Aplicnd axioma 4 se arat c a(X, d) este soluia
unic a problemei (X, d).
93
Jocuri i negocieri
Teorema 6.2 Presupunem c pentru orice ( ) N d X , , ( )
1
x f este o funcie concav i exist
( ) X x x ,
1
cu i . Dac soluia negocierii
1 1
d x >
2 2
d x > ( ) f satisface axiomele 1, 2, 3 i 4 atunci
exist ( 1 , ) 0 astfel nct:
( ) ( ) ( ) ( ) { } X x x d x d x X f =
2 1
1
2 2 1 1
, . max arg ,
.
Dac soluia satisface i axioma 5 atunci 5 . 0 = .
Teorema 2 face posibil determinarea soluiei negocierii pentru o problem dat (X, d) prin
rezolvarea unei probleme de optimizare pe X. Nash (1953) a artat c cele 5 axiome sunt suficiente
pentru a determina o soluie unic a problemei de negociere.
Pentru 5 . 0 = , soluia este uzual numit soluia Nash a negocierii. Pentru 5 . 0 soluia
se numete soluia asimetric Nash a negocierii. n fapt, acest poate indica puterea prilor: un
> 0.5 va indica faptul c juctorul 1 este mai puternic dect 2 i 5 . 0 < invers.
Relum exemplul 6.2 din acest punct de vedere.
Problema de negociere este (X, 0), frontiera Pareto este ( ) = A f cu A- surplusul
maxim posibil a fi realizat de patronat i sindicate. Ctigul, n caz de eec presupus 0 pentru
ambele pri. Fie puterea de negociere a firmei. Pentru a determina soluia ce satisface axiomele 1
4 trebuie s rezolvm urmtoarea problem de maximizare:
max
1
v
(, v)
cu restriciile:
A v ,
0 i . 0 v
Soluia problemei este:
( )
=
=
A v
A
1
*
*
Salariul de echilibru corespunztor va fi: ( )
( ) ( )
*
*
*
*
*
1
n
n C
n
n R
w + =
Observm c salariul de echilibru este o medie ponderat ntre venitul mediu i costul de
oportunitate mediu.
Dac puterea de negociere a patronatului se apropie de 1 atunci salariul tinde la costul de
oportunitate mediu. Aceasta arat c patronatul poate extrage tot surplusul sindicatelor. La extrema
cealalt, dac puterea de negociere a sindicatului se apropie de 1 ( 0 ) atunci firma va obine
profituri nule.
Pentru aplicaii, dezavantajul soluiei asimetrice Nash a negocierii este legat de puterea de
negociere , care este greu de determinat.
Exemplul 6.1 (reluare)
n acest exemplu, problema (X, d) are forma :
( ) { } A u u R u , u X + =
2 1
2
2 1
, d = (0, 0)
94
Teoria negocierilor
Notnd cu
1
puterea de negociere a consumatorului 1, atunci soluia problemei de
negociere asimetric este dat de soluia problemei de optimizare:
0 , 0
max
2 1
2 1
1
2 1
u u
A u u
u u
Grafic, problema este reprezentat n figura 6.14.
Soluia problemei este:
( )
1
1 1
1 *
1
1
(
+
=
A
u ,
( )
( )
(
+
=
1 1
1 *
2
1
1
A
u
n acest exemplu ctigul juctorului 1 este cresctor n raport cu , iar cel al juctorului 2
este descresctor n raport cu .
f(u
1
) = A u
1
u
2
u
1
u
1
*
u
2
*
Figura 6.14
6.4 Programul Nash
n cele dou abordri prezentate, soluia negocierii depinde n primul caz de specificarea
procedurii de negociere, iar n al doilea caz de gradul de ncredere pe care l avem n axiomele
prezentate. Nash (1952) a prezentat primul diferenele ntre aceste abordri fundamentale, i a
sugerat c orice sistem de axiome pe baza crora se determin o soluia particular trebuie s fie
suplimentate printr-o procedur de negociere care s implementeze aceast soluie.
Sugestia dat de programul Nash este urmtoarea:
Prin intermediul axiomelor 1 4 se identific o soluie pe frontiera Pareto; iar abordarea
strategic a ofertelor alternative conduce imediat la o nelegere care stabilete aceeai soluie.
Figurile 6.15 i 6.16 ilustreaz aceast idee:
95
Jocuri i negocieri
( )
1 1 2
x f
x
1
*
x
1
0
x
1
f(x
1
)
c x x =
1
2 1
f(0)
x
2
*
x
2
f(x
1
)
x
2
x
1
x
1
*
x
1
c
x
2
*
f(c)
Figura 6.15 Figura 6.16
Soluia din fig. (6.15) trebuie s satisfac:
*
1
x
( ) ( )
*
1 1 2
*
1
x f x f =
Soluia din fig. (6.16) trebuie s satisfac:
( )
( )
( )
*
1
*
1
*
1
1 x
x
x f
f
f
= , cu ( )
( )
( )
1
1
'
*
1
x f
x f
x
f
= .
Astfel puterea de negociere a juctorului 1, () poate fi legat de caracteristicile frontierei
Pareto ( ) i de factorii de actualizare ai ambilor juctori.
Exemplul 6.7
Fie problema de negociere (X, 0) cu frontiera Pareto dat de:
( )
1 1
1 x x f =
n acest caz elasticitatea este ( )
1
1 *
1
1 x
x
x
f
= ,
iar soluia pentru ( ) ( )
*
1 1 2
*
1
x f x f =
este
( )
2 1
2 *
1
1
1
= x .
De aici rezult simplu
( )
2 1
2 *
1
1
1