Referat
la Managementul Operational
Teoria jocurilor
Prof. Coordonator:
Prof.univ.dr. Ionut Purica
Student:
Pluteanu Ștefan
Octavian
Teoria jocurilor este o ramură a matematicii care are că scop să determine metodele de
alegere a celor mai bune hotărâri în situațiile de conflict, în care se ciocnesc interesele unor părți
ce urmăresc scopuri opuse.
Pentru a înțelege un joc oarecare este necesară mai întâi cunoașterea regulilor acestuia,
deoarece astfel se poate află care acțiuni sunt permise (posibile) la un anumit moment. Apoi este
necesar a se cunoaște cum aleg jucătorii o acțiune din mulțimea acțiunilor posibile.
Jocul cu n jucători este o succesiune de decizii și evenimente aleatoare, simultane sau nu,
care respectă o anumită structura a câștigului, dată de anumite reguli de funcționare (regulile
jocului).
Regulile jocului vor indică modul în care se iau deciziile de către jucători și ordinea
acestora.
Echilibrul Nash (care a preluat numele creatorului sau, John Nash) este o mulțime de
strategii (s1*, s2*, ..., sn*) care respectă condiția:
ui (s1*, s2*,...,și*, ..., sn*) = ui (s1*, s2*,...,și, ..., sn*) i = 1, n sau ui (și*, s-i*) = ui
(și, s-i*), i = 1, n
Echilibrul Nash
Echilibrul Nash este un termen central al teoriei matematice a jocului. Prin jocuri este descrisă o
stare a echilibrului strategic, plecând de la care un jucător nu are nici un avantaj, schimbând de
unul singur strategia. Definiția si demonstrarea existenței echilibrului Nash au fost făcute in anul
1950 în disertația publicată de matematicianul John Forbes Nash Jr.
o Strategii pure
Cu condiția că toți ceilalți jucători rămân strict fideli strategiei alese, pentru jucătorul I nu exista
Se mai spune că recompensa jucătorului nu se poate îmbunătăți, atunci când o singură parte
deviază.
o Strategii mixte
În anumite cazuri se permite jucătorilor să nu rămână fideli unei anumite strategii, ci unei distribuții
este finit sau cel puțin se poate număra, atunci distribuția probabilistică poate fi descrisă printr-un
Jucătorul 2
Jucătorul
mijloc 2, 3 1 , 1 1, 4
1
dedesubt 3, 0 0, 2 1, 3
i = 1:
o se dă: jucătorul 2 joacă dreapta: Pentru jucătorul 1 sus este optim – 2 este marcat
i = 2:
o se dă: jucătorul 1 joacă sus: Pentru jucătorul 2 stânga este optim – 2 este marcat
În cazul în care trebuie verificat dacă un tuple de strategii mixte este echilibru Nash, algoritmul
de mai sus funcționează (trebuie variate, la pasul 1, doar strategiile pure ale celorlalți jucători,
deoarece distribuțiile probabilistice arbitrare asupra acestora nu pot să conducă la recompense
mai mari).
Prin această metodă se pot identifica și strategiile strict dominante: acele strategii pentru care nu
au fost marcată vreo recompensă.
Problema lui Nash reprezintă o formă simplificată în care se analizează modul în care
funcționează ceea ce în teoria jocului se numește echilibru Nash.
În contextul unei teorii a jocurilor în care punctul de vedere dominant era acela că în problemele
de negociere nu există o soluție determinată, nu se putea afirma despre soluția unei astfel de
probleme decât că (presupunând că părțile sunt agenți raționali) nici una dintre părți nu va
accepta o înțelegere care să îi ofere mai puțin decât ar fi obținut în absența înțelegerii și că părțile
nu vor încheia o anumită înțelegere atâta timp cât este disponibilă o altă înțelegere prin care una
dintre părți ar obține mai mult fără a diminua din cât obține cealaltă. Cu alte cuvinte, soluția se
va afla pe curba de optimalitate Paretto , dar nu putem specifica punctul în care se va încheia
înțelegerea, acesta depinzând de “psihologia jucătorilor”.
Vom considera două persoane, R (Rich) și P (Poor), una foarte bogată și alta săracă, care
trebuie să împartă suma de 100$2. Ei pot împărți această sumă în orice mod doresc, numai că
trebuie să hotărască împreună cum vor face acest lucru. Dacă nu reușesc să ajungă la o înțelegere
(prin negociere), atunci nici unul dintre ei nu va primi nimic din această sumă. Faptul că soluția
trebuie să se afle pe curba de optimalitate Pareto (și nu în interiorul ei) reprezintă faptul că
întreaga sumă va fi împărțită (nu se vor împărți doar 90$, sau o altă sumă mai mică decât 100$).
Deasemenea, soluția nu se poate afla în exteriorul frontierei Pareto, deoarece acest lucru ar
însemna depășirea sumei de 100$, după cum se poate observa în grafic. Însă mai departe de atât
nu putem merge în ceea ce privește modul de împărțire. Știm doar că soluția se află pe curba de
optimalitate Paretto, și în interiorul acesteia. Pentru a putea spune mai multe despre soluția care
se va obține, se introduce în discuție un aspect suplimentar: valoarea asociată de fiecare jucător
în fiecare dintre soluțiile posibile. În acest fel se va putea identifica printr-un calcul matematic
punctul în care cei doi vor cădea de acord. Acest punct reprezintă soluția Nash.
Vom considera unitatea de măsurare a utilității ca fiind utilitatea obținută în cazul în care
jucătorul în cauză primește întreaga sumă, iar utilitatea medie, aceea asociată punctului3 în care
jucătorul este indiferent între a primi cu siguranță suma din punctul respectiv sau o șansă egală
de a primi totul sau nimic. Acest punct în care jucătorul este indiferent între a obține cu siguranță
suma respectivă sau a risca să obțină totul sau nimic este punctul de interes. Sub acest punct
jucătorul este dispus să riște în negociere.
În cazul celor doi care au de împărțit 100$, utilitatea medie se obține la o sumă diferită.
Dacă pentru cel bogat, R, se obține, așa cum este de aștetat, la 50$, acest lucru însemnând că îi
este indiferent între a obține cu siguranță 50$ și a avea o șansă egală de a obține 100$ sau 0¤ (a
se renunța la înțelegere), pentru P nu se întâmplă la fel. Pentru P la suma de 15$ se atinge
utilitatea medie, adică lui P îi este indiferent dacă obține sigur 15$ sau are o șansă egală de a
primi 100 sau nimic. Punctul în care se vor înțelege va fi, conform acestui model, cel în care
produsul utilităților celor doi este maxim, mai exact cel în care utilitatea medie este atât pentru R
cât și pentru P de 0.7, adică R primește 70$ iar P primește 30$. Putem observa acest lucru dacă
privim în tabelul de mai jos, în care este reprezentată variația utilității în funcție de sumă pentru
fiecare jucător.
70 0,7 30 0,7
60 0,6 40 0,78
50 0,5 50 0,85
40 0,4 60 0,91
30 0,3 70 0,96
20 0,2 80 0,98
10 0,1 90 0,99
0 0,0 100 1,0
Privind pe grafic, se observă că punctul de pe curba Paretto în care cei doi cad la înțelegere este
punctul din care poate fi desenat dreptunghiul cu aria cea mai mare, având ca vârfuri originea
sistemului, respectivul punct Paretto și intersecția dintre paralele duse la fiecare dintre axe și axa
opusă. De fapt acesta se obține la o împărțire de 73/27 în favoarea bogatului.
Soluția Nash arată că în acest joc al negocierii are de câștigat cel care asociază o valoare medie
unei sume cât mai mari, deoarece el are o capacitate de amenințare mai mare (din moment ce
jucătorul celălalt asociază aceleiași sume o utilitate mai mare, are mai mult de pierdut). Acestă
soluție se bazează pe probabilitatea ca într-un proces de negocieri repetate, indiferent de la ce
sumă din interiorul intervalului (0, 100), exceptând valorile extreme, se începe negocierea,
jucătorul care are mai mult de pierdut (în utilitate, nu în bani) din rezistență (neacceptarea ofertei
aflate în discuție) va fi cea care va face o ofertă mai favorabilă pentru celălalt jucător. Cu alte
cuvinte P este mai deschis negocierii și este dispus să facă oferte mai avantajoase pentru R, în
timp ce R nu se află în această situație. Deoarece el asociază o utilitate mai mică pentru o sumă
mică de bani, el este dispus să riște mai mult și are de câștigat din negociere. În schimb P,
săracul, asociază o valoare mai mare sumelor mici și din acest motiv se teme să riște pierderea
acestora pentru un câștig mai mare.
Clasificarea Jocurilor
Există patru clase de jocuri: jocuri statice în informație completă, jocuri dinamice în informație
completă, jocuri statice în informație incompletă și jocuri dinamice în informație incomplete.
- jocuri cooperative;
- jocuri necooperative.
Jocurile cooperative sunt acele jocuri în care jucătorii comunica liber între ei înainte de luarea
deciziilor și pot face promisiuni (care vor fi respectate) înainte de alegerea strategiilor.
Jocurile necooperative sunt jocurile în care jucătorii nu comunica între ei înainte de luarea
deciziilor.
- jocuri statice
- jocuri dinamice
Jocul static este acel joc în care deciziile jucătorilor se iau simultan, după care jocul ia sfârșit.
Jocul dinamic este acel joc în care deciziile jucătorilor sunt secvențiale, adică evoluează în timp.
Bibliografie
Economia seria Management Anul VIII, Nr. 1, 2005 ( Caracteristici ale managementului operaţional al
producţiei, Editura AISTEDA, 2003 – Ilie Stefanescu)
https://www.qdidactic.com/bani-cariera/management/introducere-in-teoria-jocurilor-
strategice347.php
https://ro.wikipedia.org/wiki/Echilibru_Nash
https://ro.wikipedia.org/wiki/Problema_lui_Nash
ALLEN, R.G.D Analiza matematica pentru economisti, Bucuresti, Ed. Stiintifica, 1971.