Teoria Jocurilor

Teoria jocurilor
CAPITOLUL 1. TEORIA JOCURILOR
1.1 DEFINIŢIE A TEORIEI JOCURILOR.
Teoria jocurilor este un studiu formal al conflictelor şi cooperaţiilor.

Conceptul teoreticienilor jocurilor se aplică totuşi în mai multe acţiuni ale agenţilor
interdependenţi. Aceşti agenti pot fi individuali, în grupuri sau o combinaţie între
aceste doua opţiuni. Conceptul de teorie a jocurilor furnizeaza o limbă de formulat,
structură, analiză si scenarii strategice de înţeles.
1.1.1 ISTORIC
Teoria jocurilor a apărut ca un provocator puternic la metoda convenţională

de examinare a economiei. Primul exemplu formal al teoriei jocurilor analizează
studiul jocului de 2 pesoane furnizat de Antoine Cournot în 1838. Matematicianul
Emile Borel sugerează o teorie formală a jocurilor în anul 1921, care suplimentată de
matematicianul John von Neumann în anul 1928 în o “teorie a jocurilor parloare”.
Teoria jocurilor a fost formulată ca un cămp propriu după 1944 în publicaţia în
volumul monumental “Teoria jocurilor si Comportamentul Economic” al lui John
von Neumann şi a economistului Oskar Morgenstern. Această carte a furnizat multe
terminologii de baza si crearea de probleme care este folosită şi în zilele noastre.
În 1950, John Nash a demonstrat că jocurile finite au întotdeauna un punct de

echilibru, la care toţi jucătorii aleg acţiunile care sunt cele mai bune pentru ei avănd
în vedere deciziile oponenţilor. Acest concept central al teoriei jocurilor
necooperative a fost un punct central de analiză din acel moment. Între anii 1950 şi
1960 teoria jocurilor a fost teoretic extinsa şi aplicata la probleme de razboi şi
politice. Din anu 1970 s-a dezvoltat o revoluţie în teoria economica. Adiţional, au
fost găsite aplicaţii în sociologie şi psihologie, şi s-a stabilit o legatură şi cu evoluţia
biologică. Teoria jocurilor a primit o atenţie specială în anul 1994 cu acordarea
premiului Nobel economistului Nash, John Harsanyi şi Reinhard Selten.
La sfărşitul aniilor 1990 o aplicaţie de înalt profil a teoriei jocurilor a fost

designul licitaţiilor. Teoreticieni ai jocurilor proeminenţi au fost implicaţi în designul
licitaţiilor pentru a aloca drepturi la folosirea benzilor de spectru electromagnetic a
industriei telecomunicaţiei mobile. Majoritatea licitaţiilor de acest gen au fost
proiectate cu scopul de alocare a resurselor mai eficient decăt aplicaţiile tradiţionale
guvernamentale şi adiţional au stăns milioane de dolari pentru Statele Unite ale
Americii.
1
Teoria jocurilor
1.2 REPREZENTAREA JOCURILOR
Jocurile pot fi reprezentate în doua forme:
1.2.1 Forma normală (strategică)
Definiţie Un joc cu un număr n de jucători este orice mulţime,

G = ( S 1 ,..., S n ; u1 , u n) unde fiecare i ∈N ={1,..., n} şi S i
este un set de
toate strategiile disponibile jucătorului I, şi ui : S × .... × S

i
1 n
→ ℜ este jucător;
este funcţia de utilitate a lui Neumann-Morgenstain.
Jocurile cu formă normală sunt reprezentate grafic printr-o matrice. Acestea

poate fi modul cel mai folositor de a determina strategii strict dominante şi echilibrul
Nash, totuşi, spre deosebire de forma reprezentativă, unele informaţii se pierd.
Reprezentarea prin formă normală a jocurilor include toate startegiile fiecărui jucător
şi rezultatul fiecărui profil strategic reprezentat.
Ca un joc să aibă formă normală, folosim urmatoarele date:existenţa unui set

finit P de jucători pe care îi numim {1, 2, ..., m} şi fiecare jucător k în P are un număr
finit de strategii pure
Profilul unei strategii pure este o asociaţie de startegii a jucătorilor,
aşa încăt
Denotăm un set de strategii profilate de ∑.Funcţia de caştig este o funcţie
cu scopul intepretării este premiul dat unui jucător ca rezultat al

jocului. În consecinţă, să specificăm complet un joc, funcţia de căstig trebuie să fie
specificată în setul fiecărui jucător P= {1, 2,…., m}.
Definiţie Un joc cu formă normală este o structură Unde P= {1,

2,…, m} este un set de jucători, Este un m-cvatriplu de
seturi de strategii pure, una pentru fiecare jucător, şi
este un m-cvartiplu de funcţii de căştig.
2
Teoria jocurilor
1.2.2. Forma extensivă
Un joc cu formă extensivă este specificarea unui joc în teoria jocurilor.

Forma ce reprezinta jocul este sub forma unui copac. Fiecare nod (numit nodul
deciziei) reprezintă fiecare mutare posibila a jocului în timpul acestuia. Jocul începe
într-un nod unic iniţial, şi parcurge copacul prin toate nodurile sale păna ajunge la
nodul terminal. Unde jucătorii încheie jocul şi rezultatul este asociat fiecărui jucător.
Fiecare nod neterminal aparţine fiecărui jucător; jucătorul alege orice posibilă mutare
cu nodul acestuia, fiecare mişcare posibilă este o muchie ce conduce de la acel nod la
altul.
Forma extensivă este o alternativă la reprezentarea formei normale. Spre

deosebire de forma normală, forma extensiva permite modelarea explicita a
interacţiunilor în care fiecare jucător face mai mult de o mutare în timpul jocului, şi
mută contingent pe stadiile variind.
Reprezentarea completă a formei extensive specifică:1. Jucătorii jocului;2.

Pentru fiecare jucător fiecare oportunitate care o pot muta;3. Ce poate face fiecare
jucător la fiecare mutare;4. Ce ştie fiecare jucător la fiecare mutare;5. Rezultatul
primit de fiecare jucător pentru toate combinaţiile posibile de mutări.
Jocul de mai jos are 2 jucători: 1 şi 2. Numărul pentru fiecare nod ne-terminal
indică fiecărui jucători nodul de decizie rezultat. Numărul pentru fiecare nod
terminal reprezintă rezultatul fiecărui jucător (ex. 2, 1 reprezinta răsplata de 2 a
jucătorului 1 şi rasplata de 1 a jucătorului 2). Denumirea fiecărei drepte a graficului
este numele acţiunii pe care aceasta o reprezintă.
Nodul iniţial aparţine jucătorului 1 indicănd că acesta face prima mutare.

Jucănd conform graficului: jucătorul 1 alege între U’ şi D, jucătorul 2 observă
decizia jucătorului 1 şi apoi alege între U’ şi D’. Raspalatele sunt specificate în
grafic. Sunt patru rezultate reprezentate de patru noduri terminale ale graficului: (U,
U’), (U, D’), (D, U’) şi (D, D’). Rasplatele asociate fiecărui rezultat sunt, respectiv,
următorelele: (0, 0), (2, 1), (1, 2) şi (3, 1).
Dacă jucătorul 1 mută D, jucătorul 2 va muta la U’ să-şi maximizeze

rezultatul şi deci jucătorul 1 va primi numai 1. Totuşi, dacă jucătorul 1 mută la U,
jucătorul 2 îşi maximizează rezultatul jucănd D’ şi jucătorul 1 primeşte 2. Jucătorul 1
preferă rezultatul 2 în locul rezultatului 1 deci va juca U şi jucătorul 2 va juca D’.
Acesta este un echilibru perfect al subjocului.
3
Teoria jocurilor
Figura 1
1.3 Tipuri de jocuri
Obiectivul studierii teoriei jocurilor îl

constitue jocul în sine, care este un model formal
de interacţiune a situaţiilor. Include tipic mai
mulţi jucători; un joc cu un singur jucător se
numeşte problemă de decizie. Definiţia formală
expune jucătorii, preferinţele lor, informaţiile lor,
acţiunile strategice disponibile, şi cum acestea le
influenţează rezultatul.
Clasificarea jocurilor:
1.3.1 Jocurile statice
Un joc static este un joc în care toţii jucătorii iau decizii (sau îşi aleg strategiile)
în acelaşi timp, fară a cunoaşte ce strategii au ales ceilalţi jucători. Chiar dacă
strategiile pot fi adoptate la perioade de timp diferite, jocul este simultan pentru că
fiecare jucător nu are nici o informaţie despre decizia celorlalţi, totuşi, este ca şi cănd
deciziile s-ar fi făcut simultan.Jocurile statice au o reprezentare prin formă normală
şi se rezolvă cu ajutorul conceptului de echilibru Nash.
Strategii dominante şi strategii dominatoare
Definitie Daca un jucător i are o strategie domina slab alta
strategie daca .
*
Definitie O strategie s domina stict o altă strategie dacă
.
Echilibru strategiilor dominante
În teoria jocurilor, strategiile dominante apar cănd o strategie este mai bună
decăt altă strategie, indiferent de strategia aleasă de jucătorii oponenţi.
Definitie În termeni matematici, pentru orice jucător i o strategie

este strict dominanta altei strategi dacă
.
Atunci s* domină strict dacă .
4
Teoria jocurilor
Echilibrul: să presupunem notaţia s −i

pentru setul de strategii s j jucate
de toţi jucătorii j alţii decăt i.
s −i
= ( s1 ,..., si −1 , si +1 ,..., s n) .
Definitie o strategie s∗ i este strict dominantă pentru s i dacă şi numai

dacă
U ( s∗ , s ) > u ( s , s ) ∨ s ∈ S
i i −i i i −i −i −i
,.
Nedepinzănd de ceea ce vor muta ceilalţi jucători, pentru jucătorul i este mai
avantajos să mute s∗i , decăt si. În acest caz, dacă jucătorul i este raţional, nu ar juca
strategia strict dominantă si.
O strategie mixta σi domină strategia si într-un mod similar, σi domină strict

strategia si dacă şi numai dacă
σi (si1 )ui (si1 , s−i ) + σi(si2 )ui(si2 , s−i) + · · · +σi (sik )ui(sik , s−i ) > ui(si, s−i), oricare
s−i apartine S−i .
Un jucător raţional nu ar juca niciodata strategia si daca si este dominată de o

strategie pură sau mixtă.
Similar putem defini si o strategie slab dominată.

Definitie: O strategie s∗ i domină slab si dacă şi numai dacă
ui (s∗i , s−i ) ≥ ui (si , s−i), oricare s−i apartine S−i
si ui(s∗i , s−i ) > ui(si, s−i) pentru orice s−i apartine S−i.
∗i
Asta este, necontănd de mutările celorlalţi jucători, jucănd s este cel puţin la fel
∗i
de bine ca jucănd si, şi sunt mai multe contingenţe în care jucănd s este mai bine decăt
jucănd si. În acest caz, raţional, jucătorul i joacă si numai dacă banuieşte că contingenţele nu se
vor întămpla. Daca este precaut în sensul că stabileşte probabilităţi posibile pentru fiecare
contingenţă, el nu va juca si.
Definitie o strategie sdi este una slab dominanăt pentru jucătorul i dacă şi
di di
numai dacă s slab domină toate strategiile posibile pentru jucătorul i. O strategie s
di
este strict dominantă pentru jucătorul i dacă şi numai dacă s domină strict toate
5
Teoria jocurilor
strategiile pentru jucătorul i.

di
Dacă jucătorul i este raţional, şi are o strategie strict dominantă s , atunci el nu
va juca orice alta strategie. Daca are o strategie slab dominantă si precauţii, atunci el nu
va juca altă strategie.
Exemplu: munceşte eschivează

2,2 1,3
angajează
0,0 0,0
nu angajează
Tabelul 1
În exemplul din tabelul 1 jucătorul 1 (firma) are o strategie dominantă

“angajează”. Jucătorul 2 are numai o strategie slab dominantă. Dacă jucătorii sunt
raţionali, şi aditional jucătorul 2 este precaut, atunci ne aşteptam ca jucătorul 1 să
“angajeze”şi jucătorul 2 să se “eschiveze”.
Definitie O strategie profil sd = (sd1, sd2 , ....sdN ) are echilibrul strategiei
di
dominante, dacă şi numai dacă f s este o stategie dominantă pentru orice jucător i .
Ca un exemplu considerăm exemplul clasic al “dilemei prizonierului”. Acestă

presupune ca doi suspecţi sunt arestaţi, fiind învinuiţi de comiterea unei crime. Ei sunt
anchetaţi în camere separate şi fiecare are la dispoziţie două variante de răspuns, fie
păstrează tăcereă, adică să nege că a comis crima, fie să il acuze pe celalt prizonier. Dacă
suspectii se acuza reciproc atunci ei vor primi ca pedeapsa cate 7 ani de închisoare. Daca
ambii neagă, atunci pedeapsa va fi de 1 an închisoare pentru fiecare, iar dacă unul neagă
iar celalt acuză, atunci cel care acuză va fi eliberat, iar cel care neagă va fi pedepsit la 10
ani de închisoare. Notarea strategiilor este urmatorea A=acuza, N=neaga, iar matricea
este cea din tabelul 2:
1/2 A N
-7,-7 0,-10
A
0,-10 -1,-1
6
Teoria jocurilor
Tabelul 2
A este o strategie dominantă pentru ambii jucători, deci strategia (A, A) este o
strategie dominantă de echilibru.
Echilibrul Nash
În teoria jocurilor, echilibrul Nash (denumit după John Forbes Nash, care l-a
publicat) este un exemplu de soluţie-concept a unui joc cu 2 sau mai mulţi jucători,
unde nici un jucător nu are nimic de căştigat schimbănd doar strategia sa unilateral.
Dacă fiecare jucător a ales o strategie şi nici un jucător nu are de caştigat dacă îşi
schimbă strategia în timp ce ceilalţi jucători nu o fac, atunci acest set de strategii de
alegere şi căştiguri constitue un echilibru Nash.
Conceptul echilibrului Nash nu este tocmai originar la Nash (Antoine

Augustin Cournot a arătat cum putem găsi ceea ce numim noi acum echilibrul Nash
la jocurile Cournot din duopol). Consecvent, nişte autori numesc acesta ca fiind un
echilibru Cournot-Nash (sau echilibru Nash-Cournot). Totuşi, Nash a arătat prima
oară în lucrarea sa de dezertaţie, “Non-cooperative games” din 1950, că echilibrul
Nash trebuie să existe pentru toate jocurile finite cu orice număr de jucători. Pană la
Nash, aceasta a fost dovedită doar pentru jocurile cu 2 jucători şi suma nenulă de
John von Neumann şi Oskar Morgenstern în 1947.
Definitie Să presupunem jocul (S, f) unde S este un set de strategii posibile

iar f un set de profiluri de rezultate. Să presupunem σ – I ca fiind o strategie pentru
toţi jucătorii mai puţin pentru jucătorul i. Cănd fiecare jucător
alege o strategie xi rezultată din strategia profil x = (x1,...,xn) jucătorul i obţine

rezulatul fi(x) . Notăm că acest rezultat depinde de strategia aleasă, atăt de
jucătorul I căt şi de ceilalţi jucători. O strategie profil este un echilibru
Nash dacă nici o deviaţie în strategie de nici un jucător este profitabilă, dacă toţi
Un joc poate avea o strategie pură a echilibrului Nash sau un echilibru Nash
în extensia sa mixtă. Nash a demonstrat că, dacă permitem strategiile mixte, atunci
toate jocurile cu n jucători în care fiecare jucător poate alege dintr-o mulţime finită
de strategii posibile se admite cel putin un echilibru Nash.
7
Teoria jocurilor
1.3.2. Jocuri dinamice

În teoria jocurilor, un joc este dinamic atunci cănd un jucător îşi alege acţiunea
înainte ca ceilalţi jucători să o poata face. Important este că ceilalţi jucători trebuie să
aibă o parte, cel puţin, din informaţii despre strategia adoptată de primul jucător,
astfel, în timp, nu ar avea nici un efect strategic.Astfel jucătorii pot observa acţiunea
unuia sau a mai multor jucători înainte de a decide strategia optimală pe care să o
aleagă. La aceste jocuri se foloseşte, de obicei, forma extinsă a teoriei jocurilor,
aceasta formă explicănd explicit aspectele dinamice ale jocurilor.
Exemplu: Avem 2 firme A şi B care încearca să se decidă dacă să intre sau nu
pe o piaţa nouă. Din nefericire, piaţa nu este suficient de mare să susţină decăt o
firmă. Dacă ambele firme intră pe piaţa atunci vor avea ambele o pierdere de 10
milioane RON. Daca doar o firmă intra pe piaţa aceasta va avea un profit de 50
milioane RON. Să presupunem că firma B poate observa dacă firma A intră sau nu
pe piaţa înainte să-şi stabilească strategia. Acest joc este reprezentat printr-o formă
extensivă în graficul din figura 2: SHAPE \* MERGEFORMAT
(-10,-10)
Firma B
Firma A
(50, 0)
(0, 50)
Firma B
(0, 0)
Figura 2
În perioada 1 de timp, Firma A ia prima decizia. Este de observat că Firma B ia
decizia de a intra sau nu pe piaţă în perioada 2. În forma extensivă nodurile deciziei
Firmei B au seturi de informaţii separate (daca ar fi avut aceiaşi set de informaţii ar fi
fost legate printr-o linie punctata). Aceasta înseamnă că Firma B observă mutarea
Firmei A înainte de a luat decizia de a intra sau nu pe piaţă. Dacă aceste două firme
şi-ar aplica strategia simultan atunci Firma B ar avea numai 2 strategii, de a intra sau
nu pe piaţă. Dar, pentru că Firma B observă mai întăi strategia Firmei A, va folosi
strategia condiţionată de strategia aplicată de Firma A. Cum Firma A are două
strategii posibile, la fel ca şi Firma B, aceasta înseamnă că Firma B are 4 strategii
posibile: de a intra pe piaţă indiferent ce face Firma A, de a nu intra pe piaţă
8
Teoria jocurilor
indiferent de ce face Firma A, să ia aceiaşi decizie ca Firma A, să ia decizia opusă

Firmei A. Cunoscănd aceste 4 posibilie strategii ale Firmei B putem reprezenta acest
joc şi în formă normală. Convertind aceasta într-o formă normală putem aplica
strategia echilibrului Nash astefel: 1. definim care este strategia optimală fiecărui
jucător ca raspuns la ce decizie poate lua celalalt jucător; 2. echilibrul Nash este
obţinut cănd toţi jucătorii îşi joacă strategiile optimale în acelaşi timp. În tabelul 3
vom arăta forma normală a acestui joc:
FIRMA A
Intra Nu intra La fel ca Opusul
indiferent indiferent Firma A Firmei A
FIRMA
de decizia de decizia B
celuilalt celuilalt
Intra pe -10 50 -10 50

piaţă -10 0 -10 0
Nu intra pe 0 0 0 0
piaţă 50 0 0 50
Tabelul 3
În tabelul de mai sus se vede că jocul are 3 posibile strategii de echilibru
Nash. În aceste 3 situaţii fiecare firmă acţionează raţional depinzănd de posibile
strategii pe care celălt jucător le-ar adopta. Fiecare firmă are scopul de a-şi maximiza
profitul depinzănd de ce crede cealaltă firmă are ca strategie. Pentru a putea întelege
aceste rezultate trebuie să ne găndim la firma B facănd multiple ameninţări şi
promisiuni şi la Firma A reactionand în concordanţă cu acestea. Putem intepreta
echilibrul Nash în urmatoarele 3 puncte:
1. Firma B ameninţă să intre oricum pe piaţă independent de strategia adoptată
de Firma A. Dacă Firma A crede aceste ameninţări nu va intra pe piaţă.
2. Firma B promite că nu va intra pe piaţă independent de ce strategie va adopta
firma A. Dacă Firma A crede această promisiune va intra cu certitudine pe
piaţă.
9
Teoria jocurilor
3. Firma B promite că va adopta o strategie opusă de cea adopatată de Firma A.

Dacă Firma A crede această promisiune va intra pe piaţă.
În primele 2 echilibre Nash acţiunea firmei B nu este condiţionată de ceea ce
va decide cealaltă firmă. În al treilea echilibru Nash Firma B adoptă o strategie
condiţionată. O strategie condţionată apare atunci cănd un jucător îşi condiţionează
acţiune după acţiunea a cel puţin unui jucător al jocului respectiv. Conceptul este în
particular important la jocurile repetate.
În fiecare dintre cele 3 echilibre Nash prezentate în tabelul 3 Firma A
acţionează raţional în concordanţă cu convingerile sale. Totuşi această consideră
fiecare convingere este raţională. Apare astefel întrebarea interesanta “Ar putea
Firma A să respingă ameninţările sau promisiunile Firmei B pe motiv de
minciună?” . Aceasta ridică problema credibilităţii. În teoria jocurilor, o promisiune
sau o ameninţare este credibilă numai dacă este în interesul jucătorului să adopte
acea strategie în perioada apropiată. În acest sens căteva dintre ameninţările sau
promisiunile Firmei B nu sunt credibile. De exemplu, Firma B poate ameninţa să
intre oricum pe piaţă indiferent de ce strategie adopta Firma A, ceea ce nu este
credibilă pentru că dacă intră amăndouă pe piaţă ambele vor pierde. De asemenea nu
este credibilă promisiunea de a nu intra pe piaţă indirent de ceea ce va decide Firma
A. În cazul în care Firma A nu va intra pe piaţă este în interesul Firmei B de a intra
pe piaţă. Presupunănd că jucătorii sunt raţionali şi că informaţiile sunt cunoscute de
ambii jucători, pare rezonabil să presupunem numai afirmaţiile credibile ale
jucătoriilor. Aceasta implică că declaraţiile neverosimile nu vor avea nici un efect
asupra acţiunilor celorlalţi jucători. Aceste idei sunt încorporate într-un concept
alternativ de echilibru Nash numit echilibru perfect al lui Nash la subjocuri.
Echilibru Nash perfect la subjocuri

În multe jocuri dinamice exită mai multe echilibre Nash. Adesea, aceste
echilibre implică promisiuni sau ameninţări neverosimile, care nu sunt în interesesul
jucătorilor care le aduc. Un subjoc este definit ca o parte mai mica dintr-un joc ce
începe de la un nod al jocului şi se termină la sfarşitul jocului, deci un joc care poate
fi jucat în viitor, şi este o parte relevantă a jocului în ansamblu. Pretinzănd că soluţia
unui joc dinamic trebuie să fie un echilibru Nash în fiecare subjoc înseamnă că
fiecare jucător acţionează în interes personal în orice perioadă a jocului. Aceasta
înseamna că ameninţările sau promisiunile nu vor crede sau acţiona în consecinţă.
Urmărind cum este aplicat acest tip de echilibru vom folosi acelaşi exemplu de mai
sus. După figura ce exemplifica forma extensivă a jocului putem observa două
subjocuri fiecare începănd de la fiecare nod al Firmei B. Pentru soluţia prevazută a
unui subjoc cu echilibru Nash trebuie să compromitem căte un echilibru Nash pentru
fiecare subjoc. Considerăm deci fiecare echilibru Nash identificat jocului în
ansamblu pentru a vedea care, dacă exista, sunt şi echilibre perfecte Nash ale
subjocurilor.
1. În primul echilibru Nash Firma B ameninţă să intre pe piaţă indiferent de
strategia celuilat jucător (Firma A). În această strategie este, totuşi, numai un
10
Teoria jocurilor
echilibru Nash pentru unul din subjocuri. Este optimal în subjocul începănd
după ce Firma A nu a intrat pe piaţă dar nu şi în cel în care aceasta intră pe
piaţă. Dacă Firma A intra pe piaţă nu este în interesul Firmei B să-şi respecte
ameninţarea şi să nu intre pe piaţă. Această amenintare nu este credibilă şi nu
trebuie previzionată de catre Firma A . Acest echilibru Nash nu este perfect în
subjoc.
2. În al 2-lea echilibru Nash, Firma B promite să nu intre pe piaţă indiferent de
ce strategie va adopta Firma A. Din nou, aceasta este un echilibru Nash
pentru unul din cele doua subjocuri. Este optimal în acest subjoc ce începe
dupa ce Firma A a intrat pe piaţă dar nu şi în cazul în care aceasta decide să
nu intre. Dacă Firma A decide să nu intre pe piaţă nu este în interesul Firmei
B să-şi ţină promisiunea şi deci nu va intra. Aceasta promisiune nu este
credibilă şi nu trebuie crezută de catre Firma A. Din nou, acesta nu este un
echilibru perfect Nash în acest subjoc.
3. Al 3-lea echilibru Nash este caracterizat de Firma B promiţănd să facă opusul
indiferent de strategia aleasa de Firma A. Acesta este un echilibru Nash
pentru ambele subjocuri. Dacă Firma A intră pe piaţă este optimal pentru
Firma B să nu intre, şi dacă Firma A nu intră pe piaţă este optimal pentru
Firma B să intre pe piaţă. Aceasta este o promisiune credibilă pentru că este
mereu în interesul Firmei B să-şi respecte promisiunea în viitor.
Singurul echilbru Nash perfect într-un subjoc este ca Firma A să intre pe
piaţă iar Firma B să nu intre, aceasta numai în cazul în care Firma A este primul
jucător care are posibilitatea să-işi aplice strategia. Firma B, observănd decizia de a
intra pe piaţă a Firmei A, nu va mai intra pe piaţă iar Firma A va detine o pozitie de
monopol.
Inductia inversă
Inductia inversă este principiul iterativ strict dominant aplicat la jocurile
secventiale în forma extensivă. Totuşi, acest principiu implică rulalrea acţiunilor, mai
degrabă decat a strategiilor, pe care jucătorii nu le pot juca pentru că alte acţiuni
deţin căştiguri mai mari. Aplicănd principiul jocurilor secventiale începem de la
ultima perioadă a jocului şi se încheie cănd se ajunge la începutul jocului.
Presupunănd informaţiile complete şi perfecte, şi că nici un jucător nu este indiferent
în alegere între două strategii în nici un moment al jocului, atunci această metodă ne
va conferi o predilecţie unică în care este şi un echilibru perfect Nash într-un subjoc.
Forma folosită în această metoda este, bineinţeles, forma extensiva.
Începănd de la ultima perioadă a jocului avem mai întai două noduri. În
fiecare dintre aceste 2 noduri Firma B decide dacă intra sau nu pe piaţă bazăndu-se
pe decizia luată de Firma A. La primul nod Firma A a intrat deja pe piaţă şi, deci,
Firma B ori are o pierdere de 10 milioane dacă intră pe piaţă, sau ramane la fel dacă
nu intră. În această situaţie Firma B va decide dacă intră sau nu pe piaţă, şi vom
elimina deci situatia în care ambele firme vor intra pe piaţă, punctănd printr-o linie
punctata solutia (-10,-10). În al 2-lea nod Firma A nu intra pe piaţă , Firma B va intra
pe piaţă şi deci putem elimina în aceiaşi mod solutia (0,0) în care ambele firme decid
11
Teoria jocurilor
să nu intre pe piaţă. Ne mutăm acum înapoi la nodul precedent care, în acest joc, este
nodul esenţial. Aici Firma A se decide dacă va intra sau nu pe piaţă. Daca Firma A
presupune că Firma B este raţionala atunci presupune că jocul nu va ajunge la
precedentele strategii excluse şi la rezultatele sale. Firma A realizează că ori căştiga
50 milioane sau nu căştiga şi nu pierde nimic dacă nu intra pe piaţă. Astfel eliminăm
posibilitatea de a nu intra pe piaţă a Firmei A şi deci putem elimina şi vectorul
rezultat (0, 50). Singurul vector care ramăne este acela corespunzator Firmei A
intrănd pe piaţă iar Firmei B neintrănd pe piaţă. Aceasta, cum am aratat mai sus, este
un echilibru Nash pefect al subjocului. În figura 3 arătăm forma extensiva a inducţiei
inverse corespunzătoare acestui exemplu.
(-10,-10)
Firma B
Firma A
(50, 0)
(0, 50)
Firma B
(0, 0)
Figura 3
1.5.3 Jocuri repetate
Multe jocuri în care economiştii sunt interesaţi implică interacţiune repetată

între agenţi. Intuitiv, se pare că interacţiunile repetate între agenti au un efect asupra
rezultatului prevăzut. De exemplu, pare rezonabil să asumăm că jocătorii jocurilor
repetate au mai multe oportunităţi de a învata să-şi coordoneze acţiunile şi să evite
dilema prizonierului prezentată anterior. Această sectiune se axeaza pe ideile şi
examinările asupra efectul repetiţiilor asupra rezultatului previzionat al jocului, şi
examinarea condiţiilor sub care soluţiile necooperative sunt posibile.
A. Jocuri repetate la infinit
Considerăm următoarea situaţie între 2 firme. Presupunem 2 firme, A şi B,
domină o piaţă specifică. Departamentele de marketing al ambelor pieţe au
12
Teoria jocurilor
descoperit că crescănd expansiunea publicitară, şi restul componentelor rămănănd la

fel, are un efect pozitiv asupra vanzărilor firmei. Însă vănzările totale depind şi
negativ de căt de mult celelalte firme investesc în publicitate. Asta se întamplă pentru
că afectează negativ cota de piaţă a primei companii. Daca presupunem că există
doar 2 nivele de publicitate (investiţie înaltă sau scăzută), pe care fiecare firmă şi-o
poate asuma , atunci matricea rezultat în termen de profit pentru fiecare din cele 2
companii arată ca în tabelul 4:
Firma 1
Înalt Scazut
Înalt
4,4 6,3
Scazut
3,6 5,5
Firma 2
Tabelul 4
Forma normală a acestui joc ne arată că cel mai bine pentru ambele firme este
să menţină o cheltuială de publicitate scăzută comparănd cu cea înaltă (care are ca
urmare scăderea profiturilor). Totuşi, fiecare firmă are o tendinţa de a-şi mări nivelul
de publicitate deasupra competitorilor săi ce are ca urmare creşterea cotei pe piaţă şi
deci a profiturilor totale.
Dacă acest joc ar fi jucat o singură data am avea un echilibru Nash unic cu
ambele firme recurgănd la strategia cu cele mai înalte costuri de publicitate. Această
problemă este de tipul dilemei prizonierului, în care ambele firme ar avea de căştigat
cel mai mult dacă ambele firme ar avea costuri scăzute de publicitate. Problema
firmelor este cum să-şi coordoneze acţiunile în acest rezultat dominant Pareto fară a
folosi contractele realizabile legal. Dacă interacţiunea dintre firme este infinită
repetată atunci este posibil pentru cele două firme să-şi coordoneze acţiunile la
rezultatul optimului Paretian. Aceasta se va produce dacă ambele firme adoptă
strategii condiţionate corespunzătoare şi nu ţin cont prea mult de viitor.
Strategiile condiţionate apar cănd strategiile exista condiţiile unui jucător
asupra ce strategie va urma a cel putin unui jucător. Aceasta permite posibilitatea ca
unul sau mai mulţi jucători să pedepsească ceilalţi jucători dacă au deviat de la
eficienţa Pareto. Aceasta se mai întalneşte şi sub denumirea de strategia pedeapsă.
Dacă prospectul pedepsei este suficient de sever, jucătorii vor fi destul de intimidaţi
de deviaţie. În acest sens, eficienţa Pareto poate fi menţinută la infinit. Încă odată
este foarte importantă problemă credibilităţii. De exemplu, ameninţarea cu pedeapsă
unui comportament deviant va reuşi să menţină rezultatul cooperativ dacă
ameninţarea este credibilă. Asta se va întămpla numai dacă deviaţia este observată.
13
Teoria jocurilor
Asta implică că o strategie pedeapsă ar fi de efect în a menţine solutia cooperativă

dacă face parte dintr-un echilibru Nash perfect la subjocului pentru întregul joc.
Cum este un joc repetitiv la infinit trebuie sa considerăm că viitoarele rezultate sunt
scontate, şi deci sa obtinem o valoare prezentă a profiturilor viitoare. Presupunem
1
∂= reprezentănd rata de discount a fiecărei firme, unde r este rata de interes
1+ r
sau rata de preferinţă a timpului a firmei. Aceasta înseamnă că o suna primită astazi
reprezintă mai mult decăt suma respectivă primită în viitor pentru că poate fi
investită la rata r de interes. Cu aceată rată de discount valoarea prezentă de a
menţine costuri scăzute în campania publicitară PV(scazut) este egala cu
PV(scazut)=5+5 ∂+5 ∂2 +……..
∂PV(scazut)=5 ∂+5 ∂2 +5 ∂3 +…….
(1- ∂)PV(scazut)=5
5
PV (scazut ) = .
1 −∂
Aletrnativ valoarea prezentă derivată din rezultatul cooperativ şi strategia de
costuri de campanie publicitară înalte PV (înalt), este egala cu:
PV(înalt)= 6+4 ∂+4 ∂2 +…..
∂PV(înalt)=6 ∂+4 ∂2 +4 ∂3 +….
(1- ∂)PV(înalt)=6(1- ∂)+4 ∂
4∂
PV (inalt ) = 6 + .
1−∂
De aceea rezultatul cooperativ se va menţine la infinit dacă:
PV(scazut) ≥ PV(înalt)
5 4∂
≥6+
1−∂ 1−∂
1
∂≥
2
Cu o interacţiune infinită, şi strategia tragaci data, ambele firme o să-şi
menţină costuri de publicitate scăzute dacă rata lor de discount e mai mare de
jumătate. Dat fiind că aceasta constitue este satisfăcută, aceasta înseamna că
promisiunea de a continua cu costuri scăzute de publicitate este credibilă. Cu ambele,
ameninţarea de pedepsire şi promisiunea de a menţine costuri scăzute, fiind credibile
corespunde unui echilibru perfect Nash pentru acest subjoc.
B. Paradoxul inducţiei inverse
Un rezultat obţinut din aplicarea inducţiei inverse logice la jocurile finite este
ca fiecare parte a jocului să aiba un echilibru Nash unic, atunci echilibrele perfecte
Nash ale subjocurilor pentru întregul joc este un echilibru Nash perfect jucat în orice
perioadă. Aceasta este valabilă indiferent de numarul de repetiţii.
Pentru a întelege acest rezultat considerăm urmatorul argument. Să
presupunem că un joc avănd echilibru Nash perfect este jucat de un număr specificat
finit de ori. Pentru a afla echilibrul perfect Nash unic pentru acest joc începem la
ultima perioadă mai întai. Cum ultima perioadă este numai un joc finit al jocului
14
Teoria jocurilor
însuşi, previzionăm rezultatul în această perioadă ca fiind rezultatul echilbrului Nash

perfect pentru această perioadă. Acum să considerăm penultima perioadă a jocului.
Jucătorii folosind principiul inducţiei inverse ştiu că în ultima perioadă echilibru
perfect Nash va fi jucat indiferent de ce se v-a întampla în această perioadă. Aceasta
implică că nu exista vreo promisiune sau ameninţare credibilă ce poate fi indusă de
vreun jucător pentru a se juca alt echilibru Nash perfect în această penultimă
perioadă. Toţi jucătorii cunosc aceasta şi deci echilibru Nash perfect este jucat din
nou. Acest argument poate fi aplicat la toate perioadele precedente păna la ajungerea
la prima perioadă, unde din nou echilibrul Nash perfect este jucat
C. Echilibru Nash multiplu
Paradoxul inducţiei inverse poate fi evitat dacă există echilibre Nash multiple
în joc. Cu echilibre Nash multiple nu există o previziune unică privind ultima
perioadă a jocului. Aceasta ofera jucătorilor ameninţări credibile privind viitorul
jucat ce induce ca ceilalţi jucători să joace soluţii cooperative. Aceasta este ilustrată
în jocul din tabelul 5 care să presupunem că este jucat de doua ori.
Jucator 1
Drepata Mijloc Stanga
Sus 1,1 5,0 0,0
Centru 0,5 4,4 0,0
Jos 0,0 0,0 3,3

Jucătorul 2
Tabelul 5
În acest joc există două echilbre Nash “sus/stanga” şi “dreapta/jos” însă
amebele sub ineficienţe Pareto. Dacă jucătorii ar putea coordona jocul în direcţia
“mijoc/centru” atunci ambi jucători ar avea de căştigat. În acest joc repetitiv
presupunem că amebele firme adopta urmatorea strategie pedeapsa:
“În prima perioada jucam mijloc/centru”. În perioada a doua jucăm “dreapta/jos”
dacă “mijloc/centru” a fost rezultatul în prima runda, altfel jucăm “sus/stanga”.
Presupunem ca aceste două perioade sunt suficient de apropiate una de cealalată ca
nu putem ignora orice rezultata de discount şi deci matricea pentru întreg jocul este
aratată în tabelul 6:
Jucătorul 1
15
Teoria jocurilor
Drepata Mijloc Stanga
Sus 2,2 6,1 1,1
Centru 1,7 7,7 1,1
Jos
1,1 1,1 4,4
Jucatorul 2
Tabelul 6
Varianta arătată în această matrice corespunde strategiei fiecărui jucător din
prima perioadă, dependent în adopatrea urmatorei strategi pedeapsă. Rezultatul în
această matrice este obţinut adaugănd 3 la runda a 2-a de rezultate. Acest joc are
acum 3 echilbre Nash , cele două precedente şi “mijloc/centru”. Jucănd
“mijloc/centru” în prima rundă şi “dreapta/jos” în a doua rundă este un echilibru
perfect Nash al subjocului. Jucătorii evita paradoxul inducţiei inverse şi ating
optimul Pareto în prima perioadă.
1.5.4 Jocuri statice cu informatie incompleta

Jocurile in informaţie incompletă sunt acele jocuri în care cel putin unul
dintre jucători nu cunoaşte funcţiile de căştig ale celorlalţi jucători. Totuşi, acel
jucător care nu ştie căştigurile celorlalţi, îşi imagineaza care ar putea fi acestea cu o
anumită probabilitate.
Jocurile statice cu informaţie incompletă mai sunt numite şi jocuri
bayesiene. Urmarind lucrarile lui John C. Harsanyi, un joc bayesian poate fi modelat
introducănd Natura ca un jucător într-un joc. Natura atribuie o variabilă aleatoare
fiecărui jucător care ar putea lua valori de tipuri pentru fiecare jucător şi să asocieze
funcţia densitaţii probabilitaţilor cu acele tipuri. Abordarea lui Harasanyi de a
modela jocurile bayesiene în aşa mod încăt să permită jocurilor cu informaţie
incompletă să devină jocuri cu informaţie imperfectă. Tipul jucătorului determină
funcţia de căştig a jucătorului şi probabilitatea asociată cu tipul de probabilitate ca
jucătorul a cărui tip este specificat este acel tip. Într-un joc bayesian,
imcompletitudinea informaţiilor înseamnă că cel puţin un jucător este nesigur pe
tipul (şi deci şi pe funcţia de căştig) a altui jucător.
La jocurile bayesiene este necesar să se specifice spaţiu de strategie, tipul
strategiei, funcţia de căştig şi probabilitaţile pentru fiecare jucător, o strategie pentru
aceste jocuri este un plan complet de acţiuni ce acopera fiecare contingenţa ce ar
putea apărea pentru fiecare tip care acel jucător ar putea fi. O strategie nu trebuie să
16
Teoria jocurilor
specifice acţiunea jucătorului dat de tipul care este, dar trebuie sa specifice acţiunea
care ar putea-o adopta dacă ar fi alt tip. Un spaţiu de tip pentru un jucător este un set
a tuturor posibilelor tipuri a acelui jucător. Previziunile acelui jucător descriu
incertitudinea lui la tipul celorlalţi jucători. Fiecare previziune este o probabilitate a
altui jucător avănd un tip particular, dat fiind, tipul acelui jucător care are
previziunea. Funcţia de căştig este o funcţie cu două necunoscute a strategiilor
profilurilor şi tipurilor. Dacă un jucător are o funcţie de caştig de tipul U(x, y), şi are
tipul t atunci funcţia devine U(x*, t), unde x* este strategia profil jucată .
Echilbru Nash al jocurilor bayesiene

Intr-un joc non-bayesian, strategia profil este un echilibru Nash dacă fiecare
strategie porfil este alegerea optimă la fiecare strategie în acel profil, într-un joc
Bayesian (unde jucătorii sunt modelaţi ca neutrii la risc), jucătorii raţionali caută să-
şi maximizeze căştigul aşteptat, dat fiind previziunile sale despre ceilalţi jucători(în
cazul general, unde jucătorii pot avea adversitate la risc sau o tendinta catre risc,
presupunerea este aceea ca jucătorii se asteapta sa-şi maximizeze utilitatea). Un
echilibru Nash bayesian este definit ca o strategie şi bazata pe previziunile pentru
fiecare jucător despre tipul celorlalti jucători care sa-şi maximizeze castigul asteptat
pentru fiecare jucător dat fiind previziunile despre tipul celorlalti jucători şi
strategiile jucate de ceilalti jucători.
Solutia-concept produce un echilibru neplauzibil în jocurile dinamice, unde
nici o restrictie viitoare nu este bazate pe previziunile celorlalti jucători. Aceasta face
echilibru Nash bayesian o unealta slaba ca sa analizeze jocuri dinamice cu informatie
incompleta.
Sa consideram jucătorul i ∈ I şi un tip particular al său θ ∈Θ .
i i
Presupunănd ca tipurile oponentilor sai , n-1, sunt descrişi de profilurile tip
θ −i
∈ Θ−i a ∈ A . Dacă jucătorul i alege
şi că ei joacă unele acţiuni profil −i −i
apoi o actiune a ∈ A , utilitatea lui va fi u ((a , a ), (θ ,θ )) . Mai

i i i i −i i −i
general, dacă jucătorii aleg un profil de acţiune mixtă α ∈ Α , utilitatea asteptătă de
jucătorului i va fi u ((α ,α
i i −i
), (θ i ,θ −i )) .
Acum să presupunem că jucătorul i cunoaşte tipul contingent al strategiei
mixte
σ ∈∑
−i −i
a componenţilor adversari, jucătorul i ştiind ce actiune
mexata vor adopta la orice set de tipuri. Totuşi, el nu stie tipul lor realizat, deci nu
cunoaşte actiunea mixta profil α −i
care va apărea ca rezultat a contingenţii
tipurilor lor strategice. Ce actiune ar trebui sa aleagă a ∈ A ? Chiar dacă

i i
17
Teoria jocurilor
jucătorul i nu cunoaşte θ −i
, ştie probabilitatea ca distribuţia p care este generata
ca tip de profil, ştie tipul său, θi , care îşi coordonează subiectul probabilităţii
asupra tipul θ −i
a oponenţilor săi. Pentru orice combinaţie particulară θ −i
a
tipului celorlalţi jucători, jucătotul i evaluează aceasta combinaţie pobilităţii
pˆ (θ θ ) . Ca urmare, el poate sa adauge aceasta probabilitate la evenimentul
i −i i
că componentele sale vor fi alese particular a strategiei mixte-profil
σ (θ −i −i
) ∈ Ai .
Utilitatea aşteptată a jucătorului i , atunci, stiind cunostiintele asupra tipului
său θi şi tipurile contingente strategice a oponenţilor săi σ −i
, dacă alege
acţiunea a ∈ A , este θ ∑Θ pˆ (θ θ ) u ((a ,σ (θ )), (θ ,θ )) .

i i ∈
−i −i
i −i i i i −i −i i −i
Ca a să fie cel mai bun raspuns al tipului θ al jucătorului i, atunci alegerea

i i
trebuie să maximizeze asupra spaţiul acţiunilor A . Definim cel mai bun raspuns al
i
jucătorului i corespondenţa BR : ∑ x Θ → A care direcţionează strategiile

i
−i
i i
oponenţilor şi tipul jucătorului –i la acţiunea jucătorului –i astfel:

BR (σ ,θ ) = arg maxa
i −i i ∈
i
∑
Ai θ −i∈Θ−i
pˆ (θ i θ i ) u i ((ai ,σ −i (θ −i )), (θ i ,θ −i ))
.
Cănd o strategie profil σ ∈ ∑ se întămplă ca fiecare tip al fiecărui jucător este
maximizator al utilităţii sale date de strategie contingentă de tip a oponenţilor săi,
atunci spunem că σ este un echilibru perfect bayesian al acestui joc de informaţie
incompletă.
1.5.5 Jocurile dinamice cu informaţie incompletă
Jocurile dinamice cu informaţie incompletă sunt acele jocuri în care jucătorii

iau decizi secvenţial iar unul sau unii jucători nu cunosc informaţiile
ceilorlalţi jucători. Aici, definim echilibru bayesian perfect şi îl aplicăm într-
un model de negociere secvenţială cu informaţie incompletă.
Echilibru bayesian perfect
În jocurile cu informaţie completă unele echilibre Nash erau bazate pe
presupunerea că unii jucători ar acţiona iraţional secvenţial la o informaţie certă
dezechilibrand jocul. În acele jocuri ingnorăm aceste echilibre concentrăndu-ne pe
18
Teoria jocurilor
echilibrele perfecte ale subjocurilor. La acest tip de jocuri extindem la noţiunea de

jco cu informaţie incompletă. În aceste jocuri, din nou, unele echilibre bayesiene
Nash sunt bazate pe mutări secvenţiale iraţionale a direcţiei echilibrului.
Considerăm jocul din figura 4. În acest joc, o firmă trebuie sa decidă dacă sa
anagajeze un muncitor, care poate fi harnic sau leneş. În contractul curent, dacă
muncitorul este harnic, şi firma face profit 1 dacă muncitorul munceşte. Dacă
muncitorul este leneş, atunci eschivarea este mai bună pentru el, şi firma va pierde 1
dacă muncitorul se eschivează. Dacă muncitorul este raţional secvenţial, atunci el va
lucra dacă este harnic si se va eschiva dacă este leneş. Din moment ce firma gaseşte
un muncitor mai degrabă a fi harnic, firma va angaja acel muncitor. Dar este al
echilibru bayesian Nash: muncitorul se eschivează mereu (independent de tipul său),
şi deci firma nu va angaja muncitorul. Acest echilibru indicat în figură de linia
punctată. Este bazat pe presupunerea că muncitorul se va eschiva cănd este harnic,
ceea ce este iraţional secvenţial.
harnic
(1, 2)
angajeaza
firma
(0,1)
lenes
harnic (0, 0)
nu angajeaza
harnic
(1, 1)
Natura
angajeaza
leneş lenes (-1, 2)
nu angajeaza
(0,0)
)
Figura 4
Acest echilibru este indicat în figura de liniile îngroşate. Este bazat pe

presupunerea că muncitorul se va eschiva cănd este harnic, ceea ce este iraţional
secvenţial. Din moment ce aceasta se va întămpla, echilibrul, asa iraţional este
ignorat în echilibrul bayesian Nash- ca un echilibru Nash normal.
Un ecjilibru raţional secvenţial la fiecare set de informaţii este un echilbru
Bayesian Nash perfect. Pentru fiecare set de informaTii, trebuie să specificăm
previziunile agenţilor care mută la informaţia set. Previziunile unui agent la un set de
informaţii date sunt reprezentate de o distribuţie de probabilităţi a setului de informa.
În jocurile din figura 4, previziunile jucătorilor sunt specificate. Consideram jocul
19
Teoria jocurilor
din figura 5. În acest joc avem nevoie să specificăm previziunile jucătorului 2 la

setul de informaţii la care joaca. În această figură, previziunile sale sunt sumarizate
de µ , care este probabilitatea că el a alocă la evenimentul jucătorului 1 jucandu-se T
dat că 2 este intrebat să facă mutarea.
Dat fiind o previziune a unui jucător , putem defini raţionalitatea secvenţiala:
Definiţie: un jucător este raţional secvenţial dacă, la fiecare set de
informaţii face o mutare , îşi maximizează utilitatea aşteptărilor date de previziunile
sale la setul de informaţii chiar dacă setul de informaţii este exclus de strategia sa.
1 X
(2, 6)
T
B
2 µ 1−µ
L L R
R
(0, 1) (3, 2) (-1, 3) (1, 5)
Figura 5
În jocul din figura 4, raţionalitatea secvenţială necesită ca

muncitorii să muncească dacă sunt harnici şi să se eschiveze dacă sunt leneşi.
Asemenea, în jocul din figura 5, raţionalitatea secvenţiala necesită ca jucătorul 2 să
joace R.
Considerăm acum jocul din figura 6. În acestă figură,
reprezentăm situaţia în care jucătorul 1 joacă T în timp ce jucătorul 2 joacă R, care
nu este raţionalizat. Jucătorul 2 I se alocă probabilitatea 9 la evenimentul în care
jucătorul 1 joacă B. dat fiind previziunile sale, mutarea jucătorului 2 este secvenţial
raţională. Jucătorul 1 joacă strategia sa dominantă, adică mutarea sa este raţională
secvenţial. Problema în această situaţie este că previziunile jucătorului 2 nu sunt
20
Teoria jocurilor
consistente cu strategia jucătorului 1. În contrast, într-un echilibru un jucător îşi

maximizează căstigurile aşteptate dat fiind strategia celuilalt jucător.
1
T
B
2 1 9
L L R
R
(0, 10) (3, 2) (-1, 3) (1, 5)
Figura 6
Definitie: Dată fiind orice (posibilă mixtă) strategie profil s, o

informaţie set este ca fiind în direcţia jocului dacă informaţia set este găsită cu o
porbabilitate pozitivă conform lui s.
Definiţie: Dată fiind orice strategie profil s si orice set de informaţii I
în direcţia jocului a lui s, previziunile unui jucător la I este dat ca fiind considerat
cu s dacă previziunile sunt derivate folosind regulile lui Bayes si s.
De exemplu, în figura 6, consistenţa necesită ca jucătorul 2 să considere
probabilitatea 1 a evenimentului care jucătorul 1 îl joacă în T.
În definiţia raţionalităţii secvenţiale de mai sus, previziunile
jucătorilor despre nodurile seturilor de informaţii sunt date dar previziunile despre
jocurile celorlalţi jucători în continuare jocului nu sunt specificate. Pentru a avea un
echilibru, avem nevoie deasemenea ca aceste previziuni să fie specificate complet cu
strategiile celorlalţi jucători.
Definiţie: O strategie profil este raţional secvenţială dacă, la fiecare
set de informaţii, jucătorul care execută mutarea îşi maximizează utilitatea aşteptată
dat fiind:
1. previziunile sale la setul de informaţii şi,
2. dat fiind că ceilalţi jucători joacă respectănd profilurilor de strategii în
continuarea jocului(şi fiind dat că se afla la setul de informaţii).
Definiţie: Un echilibru Bayesian Nash perfect este o pereche (s,b) de
strategii profil şi un set de previziuni precum
21
Teoria jocurilor
1. s este raţional secvenţial dat fiind previziunea b şi,

2. b este consistent cu s.
22

Teoria Jocurilor

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Teoria Jocurilor

Încărcat de

Drepturi de autor:

Formate disponibile

Teoria jocurilor

CAPITOLUL 1. TEORIA JOCURILOR

1.1 DEFINIŢIE A TEORIEI JOCURILOR.

Teoria jocurilor este un studiu formal al conflictelor şi cooperaţiilor.

Teoria jocurilor a apărut ca un provocator puternic la metoda convenţională

În 1950, John Nash a demonstrat că jocurile finite au întotdeauna un punct de

La sfărşitul aniilor 1990 o aplicaţie de înalt profil a teoriei jocurilor a fost

1.2 REPREZENTAREA JOCURILOR

Jocurile pot fi reprezentate în doua forme:

1.2.1 Forma normală (strategică)

Definiţie Un joc cu un număr n de jucători este orice mulţime,

toate strategiile disponibile jucătorului I, şi ui : S × .... × S

Jocurile cu formă normală sunt reprezentate grafic printr-o matrice. Acestea

Ca un joc să aibă formă normală, folosim urmatoarele date:existenţa unui set

Profilul unei strategii pure este o asociaţie de startegii a jucătorilor,

Denotăm un set de strategii profilate de ∑.Funcţia de caştig este o funcţie

cu scopul intepretării este premiul dat unui jucător ca rezultat al

Definiţie Un joc cu formă normală este o structură Unde P= {1,

este un m-cvartiplu de funcţii de căştig.

1.2.2. Forma extensivă

Un joc cu formă extensivă este specificarea unui joc în teoria jocurilor.

Forma extensivă este o alternativă la reprezentarea formei normale. Spre

Reprezentarea completă a formei extensive specifică:1. Jucătorii jocului;2.

Nodul iniţial aparţine jucătorului 1 indicănd că acesta face prima mutare.

Dacă jucătorul 1 mută D, jucătorul 2 va muta la U’ să-şi maximizeze

Obiectivul studierii teoriei jocurilor îl

1.3.1 Jocurile statice

Echilibru strategiilor dominante

Definitie În termeni matematici, pentru orice jucător i o strategie

Atunci s* domină strict dacă .

Echilibrul: să presupunem notaţia s −i

Definitie o strategie s∗ i este strict dominantă pentru s i dacă şi numai

O strategie mixta σi domină strategia si într-un mod similar, σi domină strict

Un jucător raţional nu ar juca niciodata strategia si daca si este dominată de o

Similar putem defini si o strategie slab dominată.

strategiile pentru jucătorul i.

Exemplu: munceşte eschivează

În exemplul din tabelul 1 jucătorul 1 (firma) are o strategie dominantă

Ca un exemplu considerăm exemplul clasic al “dilemei prizonierului”. Acestă

Conceptul echilibrului Nash nu este tocmai originar la Nash (Antoine

Definitie Să presupunem jocul (S, f) unde S este un set de strategii posibile

alege o strategie xi rezultată din strategia profil x = (x1,...,xn) jucătorul i obţine

1.3.2. Jocuri dinamice

indiferent de ce face Firma A, să ia aceiaşi decizie ca Firma A, să ia decizia opusă

Intra pe -10 50 -10 50

3. Firma B promite că va adopta o strategie opusă de cea adopatată de Firma A.

Echilibru Nash perfect la subjocuri

1.5.3 Jocuri repetate

Multe jocuri în care economiştii sunt interesaţi implică interacţiune repetată

descoperit că crescănd expansiunea publicitară, şi restul componentelor rămănănd la

Asta implică că o strategie pedeapsă ar fi de efect în a menţine solutia cooperativă

însuşi, previzionăm rezultatul în această perioadă ca fiind rezultatul echilbrului Nash

Drepata Mijloc Stanga

Sus 1,1 5,0 0,0

Centru 0,5 4,4 0,0

Jos 0,0 0,0 3,3

Drepata Mijloc Stanga

Sus 2,2 6,1 1,1

Centru 1,7 7,7 1,1

1.5.4 Jocuri statice cu informatie incompleta

Echilbru Nash al jocurilor bayesiene

apoi o actiune a ∈ A , utilitatea lui va fi u ((a , a ), (θ ,θ )) . Mai

tipurilor lor strategice. Ce actiune ar trebui sa aleagă a ∈ A ? Chiar dacă