Documente Academic
Documente Profesional
Documente Cultură
1.1.1 ISTORIC
1
Teoria jocurilor
aşa încăt
2
Teoria jocurilor
Jocul de mai jos are 2 jucători: 1 şi 2. Numărul pentru fiecare nod ne-terminal
indică fiecărui jucători nodul de decizie rezultat. Numărul pentru fiecare nod
terminal reprezintă rezultatul fiecărui jucător (ex. 2, 1 reprezinta răsplata de 2 a
jucătorului 1 şi rasplata de 1 a jucătorului 2). Denumirea fiecărei drepte a graficului
este numele acţiunii pe care aceasta o reprezintă.
3
Teoria jocurilor
Figura 1
1.3 Tipuri de jocuri
Clasificarea jocurilor:
Un joc static este un joc în care toţii jucătorii iau decizii (sau îşi aleg strategiile)
în acelaşi timp, fară a cunoaşte ce strategii au ales ceilalţi jucători. Chiar dacă
strategiile pot fi adoptate la perioade de timp diferite, jocul este simultan pentru că
fiecare jucător nu are nici o informaţie despre decizia celorlalţi, totuşi, este ca şi cănd
deciziile s-ar fi făcut simultan.Jocurile statice au o reprezentare prin formă normală
şi se rezolvă cu ajutorul conceptului de echilibru Nash.
Strategii dominante şi strategii dominatoare
Definitie Daca un jucător i are o strategie domina slab alta
strategie daca .
*
Definitie O strategie s domina stict o altă strategie dacă
.
În teoria jocurilor, strategiile dominante apar cănd o strategie este mai bună
decăt altă strategie, indiferent de strategia aleasă de jucătorii oponenţi.
4
Teoria jocurilor
s −i
= ( s1 ,..., si −1 , si +1 ,..., s n) .
U ( s∗ , s ) > u ( s , s ) ∨ s ∈ S
i i −i i i −i −i −i
,.
Nedepinzănd de ceea ce vor muta ceilalţi jucători, pentru jucătorul i este mai
avantajos să mute s∗i , decăt si. În acest caz, dacă jucătorul i este raţional, nu ar juca
strategia strict dominantă si.
σi (si1 )ui (si1 , s−i ) + σi(si2 )ui(si2 , s−i) + · · · +σi (sik )ui(sik , s−i ) > ui(si, s−i), oricare
s−i apartine S−i .
Definitie o strategie sdi este una slab dominanăt pentru jucătorul i dacă şi
di di
numai dacă s slab domină toate strategiile posibile pentru jucătorul i. O strategie s
di
este strict dominantă pentru jucătorul i dacă şi numai dacă s domină strict toate
5
Teoria jocurilor
nu angajează
Tabelul 1
1/2 A N
-7,-7 0,-10
A
0,-10 -1,-1
6
Teoria jocurilor
Tabelul 2
A este o strategie dominantă pentru ambii jucători, deci strategia (A, A) este o
strategie dominantă de echilibru.
Echilibrul Nash
În teoria jocurilor, echilibrul Nash (denumit după John Forbes Nash, care l-a
publicat) este un exemplu de soluţie-concept a unui joc cu 2 sau mai mulţi jucători,
unde nici un jucător nu are nimic de căştigat schimbănd doar strategia sa unilateral.
Dacă fiecare jucător a ales o strategie şi nici un jucător nu are de caştigat dacă îşi
schimbă strategia în timp ce ceilalţi jucători nu o fac, atunci acest set de strategii de
alegere şi căştiguri constitue un echilibru Nash.
Un joc poate avea o strategie pură a echilibrului Nash sau un echilibru Nash
în extensia sa mixtă. Nash a demonstrat că, dacă permitem strategiile mixte, atunci
toate jocurile cu n jucători în care fiecare jucător poate alege dintr-o mulţime finită
de strategii posibile se admite cel putin un echilibru Nash.
7
Teoria jocurilor
(-10,-10)
Firma B
Firma A
(50, 0)
(0, 50)
Firma B
(0, 0)
Figura 2
În perioada 1 de timp, Firma A ia prima decizia. Este de observat că Firma B ia
decizia de a intra sau nu pe piaţă în perioada 2. În forma extensivă nodurile deciziei
Firmei B au seturi de informaţii separate (daca ar fi avut aceiaşi set de informaţii ar fi
fost legate printr-o linie punctata). Aceasta înseamnă că Firma B observă mutarea
Firmei A înainte de a luat decizia de a intra sau nu pe piaţă. Dacă aceste două firme
şi-ar aplica strategia simultan atunci Firma B ar avea numai 2 strategii, de a intra sau
nu pe piaţă. Dar, pentru că Firma B observă mai întăi strategia Firmei A, va folosi
strategia condiţionată de strategia aplicată de Firma A. Cum Firma A are două
strategii posibile, la fel ca şi Firma B, aceasta înseamnă că Firma B are 4 strategii
posibile: de a intra pe piaţă indiferent ce face Firma A, de a nu intra pe piaţă
8
Teoria jocurilor
FIRMA A
Intra Nu intra La fel ca Opusul
indiferent indiferent Firma A Firmei A
FIRMA
de decizia de decizia B
celuilalt celuilalt
Tabelul 3
În tabelul de mai sus se vede că jocul are 3 posibile strategii de echilibru
Nash. În aceste 3 situaţii fiecare firmă acţionează raţional depinzănd de posibile
strategii pe care celălt jucător le-ar adopta. Fiecare firmă are scopul de a-şi maximiza
profitul depinzănd de ce crede cealaltă firmă are ca strategie. Pentru a putea întelege
aceste rezultate trebuie să ne găndim la firma B facănd multiple ameninţări şi
promisiuni şi la Firma A reactionand în concordanţă cu acestea. Putem intepreta
echilibrul Nash în urmatoarele 3 puncte:
1. Firma B ameninţă să intre oricum pe piaţă independent de strategia adoptată
de Firma A. Dacă Firma A crede aceste ameninţări nu va intra pe piaţă.
2. Firma B promite că nu va intra pe piaţă independent de ce strategie va adopta
firma A. Dacă Firma A crede această promisiune va intra cu certitudine pe
piaţă.
9
Teoria jocurilor
10
Teoria jocurilor
echilibru Nash pentru unul din subjocuri. Este optimal în subjocul începănd
după ce Firma A nu a intrat pe piaţă dar nu şi în cel în care aceasta intră pe
piaţă. Dacă Firma A intra pe piaţă nu este în interesul Firmei B să-şi respecte
ameninţarea şi să nu intre pe piaţă. Această amenintare nu este credibilă şi nu
trebuie previzionată de catre Firma A . Acest echilibru Nash nu este perfect în
subjoc.
2. În al 2-lea echilibru Nash, Firma B promite să nu intre pe piaţă indiferent de
ce strategie va adopta Firma A. Din nou, aceasta este un echilibru Nash
pentru unul din cele doua subjocuri. Este optimal în acest subjoc ce începe
dupa ce Firma A a intrat pe piaţă dar nu şi în cazul în care aceasta decide să
nu intre. Dacă Firma A decide să nu intre pe piaţă nu este în interesul Firmei
B să-şi ţină promisiunea şi deci nu va intra. Aceasta promisiune nu este
credibilă şi nu trebuie crezută de catre Firma A. Din nou, acesta nu este un
echilibru perfect Nash în acest subjoc.
3. Al 3-lea echilibru Nash este caracterizat de Firma B promiţănd să facă opusul
indiferent de strategia aleasa de Firma A. Acesta este un echilibru Nash
pentru ambele subjocuri. Dacă Firma A intră pe piaţă este optimal pentru
Firma B să nu intre, şi dacă Firma A nu intră pe piaţă este optimal pentru
Firma B să intre pe piaţă. Aceasta este o promisiune credibilă pentru că este
mereu în interesul Firmei B să-şi respecte promisiunea în viitor.
Singurul echilbru Nash perfect într-un subjoc este ca Firma A să intre pe
piaţă iar Firma B să nu intre, aceasta numai în cazul în care Firma A este primul
jucător care are posibilitatea să-işi aplice strategia. Firma B, observănd decizia de a
intra pe piaţă a Firmei A, nu va mai intra pe piaţă iar Firma A va detine o pozitie de
monopol.
Inductia inversă
Inductia inversă este principiul iterativ strict dominant aplicat la jocurile
secventiale în forma extensivă. Totuşi, acest principiu implică rulalrea acţiunilor, mai
degrabă decat a strategiilor, pe care jucătorii nu le pot juca pentru că alte acţiuni
deţin căştiguri mai mari. Aplicănd principiul jocurilor secventiale începem de la
ultima perioadă a jocului şi se încheie cănd se ajunge la începutul jocului.
Presupunănd informaţiile complete şi perfecte, şi că nici un jucător nu este indiferent
în alegere între două strategii în nici un moment al jocului, atunci această metodă ne
va conferi o predilecţie unică în care este şi un echilibru perfect Nash într-un subjoc.
Forma folosită în această metoda este, bineinţeles, forma extensiva.
Începănd de la ultima perioadă a jocului avem mai întai două noduri. În
fiecare dintre aceste 2 noduri Firma B decide dacă intra sau nu pe piaţă bazăndu-se
pe decizia luată de Firma A. La primul nod Firma A a intrat deja pe piaţă şi, deci,
Firma B ori are o pierdere de 10 milioane dacă intră pe piaţă, sau ramane la fel dacă
nu intră. În această situaţie Firma B va decide dacă intră sau nu pe piaţă, şi vom
elimina deci situatia în care ambele firme vor intra pe piaţă, punctănd printr-o linie
punctata solutia (-10,-10). În al 2-lea nod Firma A nu intra pe piaţă , Firma B va intra
pe piaţă şi deci putem elimina în aceiaşi mod solutia (0,0) în care ambele firme decid
11
Teoria jocurilor
să nu intre pe piaţă. Ne mutăm acum înapoi la nodul precedent care, în acest joc, este
nodul esenţial. Aici Firma A se decide dacă va intra sau nu pe piaţă. Daca Firma A
presupune că Firma B este raţionala atunci presupune că jocul nu va ajunge la
precedentele strategii excluse şi la rezultatele sale. Firma A realizează că ori căştiga
50 milioane sau nu căştiga şi nu pierde nimic dacă nu intra pe piaţă. Astfel eliminăm
posibilitatea de a nu intra pe piaţă a Firmei A şi deci putem elimina şi vectorul
rezultat (0, 50). Singurul vector care ramăne este acela corespunzator Firmei A
intrănd pe piaţă iar Firmei B neintrănd pe piaţă. Aceasta, cum am aratat mai sus, este
un echilibru Nash pefect al subjocului. În figura 3 arătăm forma extensiva a inducţiei
inverse corespunzătoare acestui exemplu.
(-10,-10)
Firma B
Firma A
(50, 0)
(0, 50)
Firma B
(0, 0)
Figura 3
12
Teoria jocurilor
Firma 1
Înalt Scazut
Înalt
4,4 6,3
Scazut
3,6 5,5
Firma 2
Tabelul 4
Forma normală a acestui joc ne arată că cel mai bine pentru ambele firme este
să menţină o cheltuială de publicitate scăzută comparănd cu cea înaltă (care are ca
urmare scăderea profiturilor). Totuşi, fiecare firmă are o tendinţa de a-şi mări nivelul
de publicitate deasupra competitorilor săi ce are ca urmare creşterea cotei pe piaţă şi
deci a profiturilor totale.
Dacă acest joc ar fi jucat o singură data am avea un echilibru Nash unic cu
ambele firme recurgănd la strategia cu cele mai înalte costuri de publicitate. Această
problemă este de tipul dilemei prizonierului, în care ambele firme ar avea de căştigat
cel mai mult dacă ambele firme ar avea costuri scăzute de publicitate. Problema
firmelor este cum să-şi coordoneze acţiunile în acest rezultat dominant Pareto fară a
folosi contractele realizabile legal. Dacă interacţiunea dintre firme este infinită
repetată atunci este posibil pentru cele două firme să-şi coordoneze acţiunile la
rezultatul optimului Paretian. Aceasta se va produce dacă ambele firme adoptă
strategii condiţionate corespunzătoare şi nu ţin cont prea mult de viitor.
Strategiile condiţionate apar cănd strategiile exista condiţiile unui jucător
asupra ce strategie va urma a cel putin unui jucător. Aceasta permite posibilitatea ca
unul sau mai mulţi jucători să pedepsească ceilalţi jucători dacă au deviat de la
eficienţa Pareto. Aceasta se mai întalneşte şi sub denumirea de strategia pedeapsă.
Dacă prospectul pedepsei este suficient de sever, jucătorii vor fi destul de intimidaţi
de deviaţie. În acest sens, eficienţa Pareto poate fi menţinută la infinit. Încă odată
este foarte importantă problemă credibilităţii. De exemplu, ameninţarea cu pedeapsă
unui comportament deviant va reuşi să menţină rezultatul cooperativ dacă
ameninţarea este credibilă. Asta se va întămpla numai dacă deviaţia este observată.
13
Teoria jocurilor
14
Teoria jocurilor
Jucator 1
Tabelul 5
În acest joc există două echilbre Nash “sus/stanga” şi “dreapta/jos” însă
amebele sub ineficienţe Pareto. Dacă jucătorii ar putea coordona jocul în direcţia
“mijoc/centru” atunci ambi jucători ar avea de căştigat. În acest joc repetitiv
presupunem că amebele firme adopta urmatorea strategie pedeapsa:
“În prima perioada jucam mijloc/centru”. În perioada a doua jucăm “dreapta/jos”
dacă “mijloc/centru” a fost rezultatul în prima runda, altfel jucăm “sus/stanga”.
Presupunem ca aceste două perioade sunt suficient de apropiate una de cealalată ca
nu putem ignora orice rezultata de discount şi deci matricea pentru întreg jocul este
aratată în tabelul 6:
Jucătorul 1
15
Teoria jocurilor
Jos
1,1 1,1 4,4
Jucatorul 2
Tabelul 6
Varianta arătată în această matrice corespunde strategiei fiecărui jucător din
prima perioadă, dependent în adopatrea urmatorei strategi pedeapsă. Rezultatul în
această matrice este obţinut adaugănd 3 la runda a 2-a de rezultate. Acest joc are
acum 3 echilbre Nash , cele două precedente şi “mijloc/centru”. Jucănd
“mijloc/centru” în prima rundă şi “dreapta/jos” în a doua rundă este un echilibru
perfect Nash al subjocului. Jucătorii evita paradoxul inducţiei inverse şi ating
optimul Pareto în prima perioadă.
16
Teoria jocurilor
specifice acţiunea jucătorului dat de tipul care este, dar trebuie sa specifice acţiunea
care ar putea-o adopta dacă ar fi alt tip. Un spaţiu de tip pentru un jucător este un set
a tuturor posibilelor tipuri a acelui jucător. Previziunile acelui jucător descriu
incertitudinea lui la tipul celorlalţi jucători. Fiecare previziune este o probabilitate a
altui jucător avănd un tip particular, dat fiind, tipul acelui jucător care are
previziunea. Funcţia de căştig este o funcţie cu două necunoscute a strategiilor
profilurilor şi tipurilor. Dacă un jucător are o funcţie de caştig de tipul U(x, y), şi are
tipul t atunci funcţia devine U(x*, t), unde x* este strategia profil jucată .
θ −i
∈ Θ−i a ∈ A . Dacă jucătorul i alege
şi că ei joacă unele acţiuni profil −i −i
mixte
σ ∈∑
−i −i
a componenţilor adversari, jucătorul i ştiind ce actiune
mexata vor adopta la orice set de tipuri. Totuşi, el nu stie tipul lor realizat, deci nu
cunoaşte actiunea mixta profil α −i
care va apărea ca rezultat a contingenţii
17
Teoria jocurilor
jucătorul i nu cunoaşte θ −i
, ştie probabilitatea ca distribuţia p care este generata
ca tip de profil, ştie tipul său, θi , care îşi coordonează subiectul probabilităţii
asupra tipul θ −i
a oponenţilor săi. Pentru orice combinaţie particulară θ −i
a
tipului celorlalţi jucători, jucătotul i evaluează aceasta combinaţie pobilităţii
pˆ (θ θ ) . Ca urmare, el poate sa adauge aceasta probabilitate la evenimentul
i −i i
σ (θ −i −i
) ∈ Ai .
Utilitatea aşteptată a jucătorului i , atunci, stiind cunostiintele asupra tipului
său θi şi tipurile contingente strategice a oponenţilor săi σ −i
, dacă alege
trebuie să maximizeze asupra spaţiul acţiunilor A . Definim cel mai bun raspuns al
i
.
Cănd o strategie profil σ ∈ ∑ se întămplă ca fiecare tip al fiecărui jucător este
maximizator al utilităţii sale date de strategie contingentă de tip a oponenţilor săi,
atunci spunem că σ este un echilibru perfect bayesian al acestui joc de informaţie
incompletă.
18
Teoria jocurilor
angajeaza
firma
(0,1)
lenes
harnic (0, 0)
nu angajeaza
harnic
(1, 1)
Natura
angajeaza
nu angajeaza
(0,0)
)
Figura 4
19
Teoria jocurilor
1 X
(2, 6)
T
B
2 µ 1−µ
L L R
R
Figura 5
20
Teoria jocurilor
T
B
2 1 9
L L R
R
Figura 6
21
Teoria jocurilor
22