Proiect Teoria Jocurilor

ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI
Facultatea de Cibernetică, Statistică și Informatică Economică
Proiect Teoria Jocurilor
Modul în care strategia teoriei jocurilor

înbunătățește capacitatea de a lua decizii
Student Asist. Univ. Dr.

Dumitrașcu Gabriela Manafi Ioana
-2018-
Teoria jocurilor, studiul luării deciziilor strategice, reunește discipline diferite, cum ar
fi matematica, psihologia și filosofia. Ea a fost inventată de John von Neumann și Oskar
Morgenstern în anul 1944 și a parcurs un drum lung de atunci. Importanța teoriei jocurilor
pentru analiza și luarea deciziilor moderne poate fi determinată de faptul că, începând cu anul
1970, cei 12 economiști și oameni de știință care au contribuit la teoria jocurilor au fost
premiați cu premii Nobel pentru științe economice de-a lungul timpului.
Teoria jocurilor este aplicată într-o serie de domenii, inclusiv afaceri, finanțe,
economie, științe politice și psihologie. Înțelegerea strategiilor de teorie a jocurilor - atât cele
populare, cât și unele dintre stratagemele relativ mai puțin cunoscute - este importantă pentru
a îmbunătăți abilitățile de gândire și de luare a deciziilor într-o lume complexă.
Un sistem ( 1 ,  2 ,..,  n ) de n strategii  i  i se numeşte punct de echilibru dacă

* * * *
pentru orice i  1, n şi orice  i  i avem:  i ( 1 ,.., i 1 ,  i ,  i 1 ,..,  n )   i ( 1 ,.., n ).

* * * * * *
Cu alte cuvinte, un sistem de n strategii formează un punct de echilibru dacă nici un jucător
nu are un motiv rezonabil să îşi modifice strategia, presupunând că toţi ceilalţi jucători îşi
păstrează strategia corespunzătoare. Vom vedea însă în partea de aplicaţii a acestei lucrări că
în majoritatea cazurilor, chiar în situaţii foarte simple, jucătorii nu aleg situaţiile optime.
Teoretic, dacă un jucător cunoaşte exact planurile celorlalţi, el va prefera strategiile care
împreună cu acelea ale oponenţilor formează un punct de echilibru, şi jocul va deveni stabil.
Dilema prizonierului pe scurt

Una dintre cele mai populare și de bază strategii ale teoriei jocului este dilema
prizonierului. Acest concept explorează strategia de luare a deciziilor adoptată de doi indivizi
care, acționând în interesul propriu, ajung la rezultate mai rele decât dacă ar coopera unul cu
altul de la început.
În această strategie, doi suspecți reținuți pentru o crimă sunt ținuți în camere separate
și nu pot comunica între ei. Procurorul informează în mod individual atât Suspectul 1, cât și
Suspectul 2 că, dacă mărturisește și depune mărturie împotriva celuilalt, el poate fi liber, dar
dacă nu cooperează și celălalt suspect o face, el va fi condamnat la trei ani de închisoare. Dacă
ambii mărturisesc, vor primi o sentință de doi ani, iar dacă nici nu mărturisește, vor fi
condamnați la un an de închisoare.
În timp ce cooperarea este cea mai bună strategie pentru cei doi suspecți, atunci când
se confruntă cu o astfel de dilemă, cercetările arată că majortatea oamenilor raționali preferă
să mărturisească și să depună mărturie împotriva celeilalte persoane decât să rămână tăcuți și
să ia șansa celeilalte părți să mărturisească.
Dilema prizonierului pune bazele strategiilor avansate de teorie a jocurilor, dintre care
cele mai populare includ:
Matching Pennies
În problema „aruncării monedei”, primul jucător A poate alege “stema” (S) sau
“banul” (B). Jucătorul B, fără a cunoaşte alegerea primului jucător, alege de asemenea stema
sau banul. Dacă alegerile coincid, atunci jucătorul B câştigă un dolar de la A. În caz contrar, A
câştigă un dolar de la B. În arborele jocului, reprezentat mai jos, vectorul ataşat nodurilor
finale reprezintă funcţia de câştig, iar numerele de lângă celelalte noduri indică jucătorul
căruia îi aparţine mutarea.
Problema investitorului
În problema investitorului, o persoană dispune de 1.000 de dolari şi are două variante: să nu
investească şi să rămână cu cei 1.000 de dolari sau să investească şi cu o probabilitate de 90%
să câştige 1.100 dolari iar cu o probabilitate de 10% să piardă 900 de dolari. Deşi din punct de
vedere matematic cele două situaţii sunt egale (având aceeaşi medie), o persoană optimistă va
alege să investească banii în timp ce o persoană pesimistă va alege să păstreze banii.
Se notează cu  i  i (i  1, n) strategiile jucătorilor şi cu
 ( 1 ,  2 ,...,  n )  ( 1 ( 1 ,  2 ,...,  n ),...,  n ( 1 ,  2 ,...,  n ))
valoarea medie a funcţiei de câştig. Funcţia  ( 1 ,  2 ,...,  n ) poate fi tabelată pentru toate
valorile posibile ale lui  1 ,...,  n fie sub forma unor relaţii, fie printr-un tabel n -
dimensional de n - vectori. Acest tabel n - dimensional se numeşte forma normală a jocului
.
Impas
Acesta este un scenariu de dilemă socială precum dilema prizonierului, prin faptul că
doi jucători pot fie să coopereze, fie să nu coopereze. În caz de blocaj, dacă jucătorul A și
jucătorul B cooperează, fiecare obține o recompensă de 1, iar dacă jucătorii nu cooperează,
fiecare obține o recompensă de 2. Dar dacă jucătorul A cooperează și jucatorul B nu
cooperează, atunci A obține o recompensă 0 și B obține un câștig de 3. În diagrama de plată
de mai jos, prima cifră din celule (a) până la (d) reprezintă câștigul jucătorului A, iar al doilea
este cel al jucătorului B:
Matricea câștigurilor
Jucător B Jucător B
„Impas”
Cooperează Nu cooperează
Jucător A Cooperează (a) 1, 1 (b) 0, 3
Nu cooperează (c) 3, 0 (d) 2, 2
Strategia Impas diferă de dilema prizonierului prin faptul că acțiunea de cel mai mare
beneficiu reciproc (adică ambele părți să nu coopereze) este, de asemenea, strategia
dominantă. O strategie dominantă pentru un jucător este definită ca o strategie care produce
cea mai mare sumă de câștig a oricărei strategii disponibile, indiferent de strategiile folosite
de ceilalți jucători.
Un exemplu frecvent citat de Impas este cel al două puteri nucleare care încearcă să
ajungă la un acord pentru a elimina arsenalele lor de bombe nucleare. În acest caz, cooperarea
implică aderarea la acord, în timp ce înfrângerea înseamnă refuzarea în mod secret a acordului
și păstrarea arsenalului nuclear. Cel mai bun rezultat pentru oricare dintre națiuni, din
nefericire, este acela de a refuza acordul și de a păstra opțiunea nucleară în timp ce cealaltă
națiune își elimină arsenalul, deoarece acest lucru îi va oferi un avantaj ascuns față de țara
care acceptă acordul. Cea de-a doua opțiune este aceea de a nu coopera, deoarece, astfel, cele
2 țări își păstrează statutul de puteri nucleare.
Competiția Cournot
Acest model este asemănător conceptual cu dilema prizonierului și este numit după
matematicianul francez Augustin Cournot, care la introdus în 1838. Cea mai comună aplicație
a modelului Cournot este descrierea unui duopol sau a doi producători principali pe o piață.
De exemplu, să presupunem că societățile A și B produc un produs identic și pot
produce cantități mari sau mici. Dacă ambii cooperează și sunt de acord să producă la niveluri
scăzute, atunci oferta limitată se va traduce într-un preț ridicat pentru produsul de pe piață și
profituri substanțiale pentru ambele companii. Pe de altă parte, în cazul în care acestea nu
cooperează și produc la niveluri înalte, piața va fi inundată și va duce la un preț scăzut pentru
produs și, prin urmare, la profituri mai mici pentru ambele. Dar dacă o firmă cooperează
(adică produce la nivele scăzute) și cealaltă firmă nu cooperează (adică producă pe furiș la
niveluri înalte), atunci cea din urmă câștigă un profit mai mare decât dacă ambele cooperează,
iar prima firmă nu câștigă nimic.
Matricea de plăți pentru companiile A și B este următoarea (cifrele reprezintă profitul
în milioane de dolari). Astfel, dacă A cooperează și produce la niveluri scăzute în timp ce B nu
cooperează și produce la niveluri ridicate, câștigul este așa cum este arătat în celula(b) -
compania A are un câștig de 0 milioane de dolari și compania B de 7 milioane dolari.
Compania B Compania B
Cournot
Cooperează Nu cooperează
Compania A Cooperează (a) 4, 4 (b) 0, 7
Nu cooperează (c) 7, 0 (d) 2, 2
Concluzia acestei strategii este că, individual, este mai bine să nu cooperezi, deoarece astfel
sunt generate câștiguri mai mari, umând ca cel care alege să coopereze să nu câștige nimic, iar
astfel s-ar obține monopolul pe piață.
Coordonare
În stategia Coordonare, jucătorii au câștiguri mai mari atunci când selectează același
mod de acțiune.
De exemplu, se iau în considerare doi giganți tehnologici care decid între introducerea
unei noi tehnologii radicale în chipurile de memorie care le-ar putea aduce un câștig de sute
de milioane de profituri sau o versiune revizuită a unei tehnologii mai vechi care le-ar putea
aduce un câștig mult mai mic. Dacă o singură companie decide să continue cu noua
tehnologie, rata de adoptare de către consumatori ar fi semnificativ mai mică și, ca rezultat, ar
câștiga mai puțin decât dacă ambele companii decid asupra aceluiași mod de acțiune.
Matricea de plată este prezentată mai jos (cifrele reprezintă profitul în milioane de dolari).
„Competiția”
Tehnologia nouă Tehnologia veche
Tehnologia
Compania A (a) 600, 600 (b) 0, 150
nouă
Tehnologia
(c) 150, 0 (d) 300, 300
veche
Astfel, dacă ambele companii decid să introducă noua tehnologie, ar câștiga 600
milioane dolari de fiecare, în timp ce introducerea unei versiuni revizuite a tehnologiei mai
vechi ar câștiga câte 300 milioane dolari fiecare, după cum se arată în celula d. Dar dacă
Compania A decide singură să introducă noua tehnologie, ar câștiga numai 150 de milioane de
dolari, chiar dacă Compania B ar câștiga 0 $ (probabil pentru că consumatorii ar putea să nu
fie dispuși să plătească pentru tehnologia actuală depășită). În acest caz, este indicat ca
ambele companii să coopereze și să aleagă același tip de tehnologie.
Jocul Centiped
Acesta este un joc în formă extinsă în care doi jucători au alternativ șansa de a lua o
parte mai mare dintr-un depozit de bani cu creștere înceată. Jocul centiped este secvențial,
deoarece jucătorii fac mișcările una după alta; fiecare jucător știe de asemenea strategiile alese
de jucătorul care au jucat înaintea sa. Jocul se încheie când un jucător primește porțiunea mai
mare, iar celălalt jucător primește porțiunea mai mică.
De exemplu, presupunem că jucătorul A este primul și trebuie să decidă dacă să "ia"
sau să "dea mai departe" depozitul, care în prezent este de 2 $. Dacă îl ia, atunci A și B obțin
câte 1 $, dar dacă A dă mai departe depozitul, decizia de a lua sau de a da mai departe acum
trebuie făcută de către Jucătorul B. Dacă B îl ia, primește 3 $ (adică suma inițială de 2 $ + 1 $
creștere) și A primește 0 $. Dar dacă B îl dă mai departe, A acum decide să ia sau să dea mai
departe, și așa mai departe. Dacă ambii jucători aleg întotdeauna să dea mai departe, fiecare
dintre ei primește câte o sumă de 100 $ la sfârșitul jocului.
Scopul jocului este că dacă A și B cooperează și continuă să dea mai departe depozitul
până la sfârșitul jocului, primesc plata maximă de 100 $ fiecare. Dar dacă nu au încredere în
celălalt jucător și se așteaptă ca el să "ia" depozitul la prima ocazie, echilibrul Nash prevede
că jucatorii vor lua cel mai mic câștig posibil (1 $ în acest caz). Studiile experimentale au
arătat totuși că acest comportament "rațional" (așa cum este prezis de teoria jocurilor) este rar
expus în viața reală. Acest lucru nu este intuitiv surprinzător, având în vedere dimensiunea
minimă a plății inițiale față de cea finală. Un comportament similar al subiecților
experimentali a fost, de asemenea, expus în dilema călătorului.
Dilema călătorului
Acest joc cu sumă non-zero, în care ambii jucători încearcă să-și maximizeze propriile
câștiguri fără a lua în considerare cealaltă parte, a fost conceput de economistul Kaushik Basu
în 1994. De exemplu, în dilema călătorului, o companie aeriană este de acord să plătească doi
călători despăgubiri pentru daune aduse bagajului personal. Cu toate acestea, cei doi călători
sunt obligați separat să evalueze valoarea bagajului, cu un minim de 2 $ și un maxim de 100
$. Dacă ambele înregistrează aceeași valoare, compania aeriană va rambursa fiecărui călător
suma respectivă. Dar dacă valorile diferă, compania aeriană le va plăti valoarea cea mai mică,
cu un bonus de 2 $ pentru călătorul care a înregistrat această valoare mai mică și o penalizare
de 2 $ pentru călătorul care a notat valoarea cea mai mare.
Nivelul de echilibru Nash, bazat pe inducția inversă, este de 2 $ în acest caz. Dar, ca și
în jocul centiped, experimentele de laborator demonstrează în mod constant că majoritatea
participanților, naiv sau altfel, aleg un număr mult mai mare decât 2 $.
Dilema călătorului poate fi aplicată pentru a analiza o varietate de situații din viața
reală. Procesul de inducție iversă, de exemplu, poate contribui la explicarea modului în care
două companii în competiție pot să scadă constant prețurile produselor în încercarea de a
câștiga o cotă de piață, ceea ce poate duce la pierderi din ce în ce mai mari în acest proces.
Un alt exemplu
O variabilă aleatoare ia valorile 1, 2, 3, 4, fiecare cu o probabilitate de ¼. Jucătorul A,
fără a cunoaşte rezultatul experimentului aleator, alege un număr x , iar jucătorul B, fără a
cunoaşte rezultatul experimentului aleator şi alegerea lui A, alege un număr y . Drept funcţie
de câştig se ia:
( y  z  x z, x z  y z),
adică se urmăreşte ghicirea cât mai exactă a valorii z luate de variabila aleatoare. În acest joc
fiecare jucător dispune de 4 strategii: 1, 2, 3, 4. Dacă A alege strategia 1 şi B alege strategia 3,
atunci câştigul este (2, -2) cu probabilitatea ¼, (0, 0) cu probabilitatea ¼ sau (-2, 2) cu
probabilitatea ½. Valoarea medie este deci  (1,3)  (1 / 2,1 / 2) . Calculând astfel toate
valorile  ( 1 ,  2 ) , se obţine următoarea matrice:
1 2 3 4
1 (0, 0) (- ½ , ½) (- ½, ½ ) (0, 0)
2 (½,-½) (0 ,0) (0, 0) (½,-½)
3 (½,-½) (0, 0) (0, 0) (½,-½)
4 (0, 0) (- ½ , ½) (- ½ , ½) (0, 0)
Strategii suplimentare privind teoria jocurilor

Bătălia sexelor
Aceasta este o altă formă a jocului de coordonare descris mai devreme. Este
reprezentat printr-un cuplu care încearcă să-și organizeze seara. Ei aveau următoarele opțiuni:
fie să meargă la bowling (preferința bărbatului), fie la o piesă de teatru (preferința femeii).
Astfel, ei au alegerea de stabili individual locul în care se vor întâlni în acea seară.
Matricea câștigurilor este prezentată mai jos, cu numerele din celule reprezentând
gradul relativ de bucurie a evenimentului pentru femeie și respectiv bărbat (utilitatea
fiecăruia). De exemplu, celula (a) reprezintă câștigul pentru femeie și bărbat dacă aleg să se
întâlnească la teatru și să vadă piesa (se bucură ea mai mult decât el). Celula (d) reprezintă
câștigul amândurora, dacă ambele părți aleg să se întâlnească la bowling (se bucură de el mai
mult decât ea). Celula (c) reprezintă nemulțumirea în cazul în care ambii aleg să se
întâlnească în locul diferit preferinței lor.
Bărbatul Bărbatul
„Bătălia sexelor”
Piesă de teatru Bowling
Femeia Piesă de teatru (a) 6, 3 (b) 2, 2
Bowling (c) 0, 0 (d) 3, 6
Jocul Dictatorului
Acesta este un joc simplu în care Jucătorul A trebuie să decidă cum să împartă un
premiu în bani cu Jucătorul B, care nu are nicio contribuție în decizia Jucătorului A. În timp
ce aceasta nu este o strategie de teorie a jocului în sine, ea oferă unele informații interesante în
comportamentul oamenilor. Experimentele arată că aproximativ 50% păstrează toți banii
pentru ei înșiși, 5% o împărțesc în mod egal, iar celelalte 45% dau celuilalt participant o cotă
mai mică. Jocul dictator este strâns legat de jocul ultimatum, în care jucătorului A i se dă o
sumă stabilită, o parte din care trebuie acordată jucătorului B, care poate accepta sau respinge
suma dată. Câștigul este dacă cel de-al doilea jucător respinge suma oferită, atât A cât și B nu
obțin nimic. Jocurile dictator și ultimatum dețin lecții importante pentru probleme cum ar fi
darul caritabil și filantropia.
Pace sau război

Aceasta este o variantă a dilemei prizonierului în care deciziile "cooperare sau
necooperare" sunt înlocuite cu "pace sau război". O analogie ar putea fi două companii
implicate într-un război al prețurilor. Dacă ambele se abțin de la reducerea prețurilor, ele se
bucură de o prosperitate relativă (celula a), dar un război al prețurilor ar reduce dramatic
beneficiile (celula d). Cu toate acestea, dacă A se angajează în reducerea prețurilor (război),
dar B nu, A ar avea o remunerație mai mare de 4, deoarece ar putea capta o cotă de piață
substanțială, iar acest volum mai mare ar compensa prețurile mai scăzute ale produselor.
„Pace sau război”
Pace Război
Compania A Pace (a) 3, 3 (b) 0, 4
Război (c) 4, 0 (d) 1, 1
Dilema voluntarului
Într-o dilemă a voluntarului, cineva trebuie să întreprindă o sarcină pentru binele
comun. Cel mai rău rezultat posibil este dacă nimeni nu se oferă voluntar pentru această
sarcină. De exemplu, se ia în considerare o companie în care frauda contabilă este prezentă,
dar managementul de top nu este conștient de aceasta. Unii angajați juniori din departamentul
contabil sunt conștienți de fraudă, dar ezită să spună conducerii, deoarece ar duce la
concedierea și cel mai probabil urmărirea penală a angajaților implicați în fraudă.
Eticheta de “turnător” are de obicei consecințe pentru persoana în cauză, dar, dacă
nimeni nu este voluntar să ia măsuri, fraudele de amploare pot duce la eventuala faliment al
companiei și la pierderea locurilor de muncă ale tuturor.
Acestea sunt doar câteva stategii de teorie a jocurilor, ele fiind foarte multe și foarte
complexe uneori. După cum s-a exemplificat mai sus, ele au o utilitate considerabilă in
capacitatea de luare de decizii, mai ales politice și economice, încât decide prin modele
matematice care este cea mai bună soluție pentru 2 sau mai multe părți implicate într-o
dilemă.
Bibliografie:
 Masterand Bogdan Negrilă, „Aplicaţii ale teoriei jocurilor”, 2013
 https://www.investopedia.com/articles/investing/111113/advanced-game-
theory-strategies-decisionmaking.asp

Proiect Teoria Jocurilor

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Proiect Teoria Jocurilor

Încărcat de

Drepturi de autor:

Formate disponibile

ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI

Facultatea de Cibernetică, Statistică și Informatică Economică

Proiect Teoria Jocurilor

Modul în care strategia teoriei jocurilor

Student Asist. Univ. Dr.

Un sistem ( 1 ,  2 ,..,  n ) de n strategii  i  i se numeşte punct de echilibru dacă

pentru orice i  1, n şi orice  i  i avem:  i ( 1 ,.., i 1 ,  i ,  i 1 ,..,  n )   i ( 1 ,.., n ).

Dilema prizonierului pe scurt

Se notează cu  i  i (i  1, n) strategiile jucătorilor şi cu

 ( 1 ,  2 ,...,  n )  ( 1 ( 1 ,  2 ,...,  n ),...,  n ( 1 ,  2 ,...,  n ))

Strategii suplimentare privind teoria jocurilor

Pace sau război

S-ar putea să vă placă și