REFERAT
Coordonator științific :
Prof. Univ. Dr. Manafi Ioana
Student :
Mihălcioiu Florian
Grupa : 1062
Seria : Statistică
- BUCUREȘTI, 2018 -
JOCURI CU SUMĂ NULĂ
Definiție
Proprietatea sumei zero (dacă cineva câștigă, altul pierde) înseamnă că
orice rezultat al unei situații cu sumă zero este optim Pareto.
În general, orice joc în care toate strategiile sunt optimale Pareto se
numește joc de conflict.
Jocurile cu sumă nulă sunt un exemplu specific de jocuri cu sumă
constantă, unde suma fiecărui rezultat este întotdeauna zero. Astfel de jocuri sunt
distributive, nu integrative; placinta nu poate fi extinsă printr-o bună negociere.
Situațiile în care participanții pot câștiga sau suferi împreună sunt numite
jocuri cu sumă nenulă.
Ideea unei plăți optime Pareto într-un joc cu sumă zero dă naștere unui
standard generalizat de raționalitate egoistă. Este vorba despre așa-zisul standard
de “pedepsire” a adversarului, în care ambii jucători încearcă întotdeauna să
reducă la minimum câștigul adversarului la un cost favorabil pentru el, mai
degrabă decat să prefere ca el să caștige mai mult.
Standardul de pedeapsă a adversarului poate fi folosit atât în jocurile cu
sumă zero (de exemplu jocul de război, șah), cât și în jocurile cu sumă non-zero
(de exemplu jocul de semnalizare).
Soluții
Pentru jocurile finite cu sumă nulă pentru doi jucători, diferitele soluționări
teoretice ale jocului (echilibrul Nash, minimax și maximin) dau aceeași soluție.
Dacă jucătorilor le este permis să joace o strategie mixtă, jocul are întotdeauna
un echilibru.
Exemplu
Matricea de câștig a jocului este o reprezentare convenabilă. Luați în
considerare, de exemplu, jocul cu doi jucători de sumă nulă imaginat mai jos.
Ordinea jocului se face după cum urmează: Primul jucător (roșu) alege în
secret una dintre cele două acțiuni 1 sau 2; al doilea jucător (albastru), care nu
știe de alegerea primului jucător, alege în secret una dintre cele trei acțiuni A, B
sau C. Apoi, alegerile sunt dezvăluite și numărul total de puncte al fiecărui jucător
este calculat în funcție de câștigul pentru acele alegeri.
Exemplu: Red alege acțiunea 2 și Blue alege acțiunea B. Când plata este
alocată, Red câștigă 20 de puncte, iar Blue pierde 20 de puncte.
Acum să presupunem că în acest exemplu ambii jucători cunosc matricea
de câștig și încearcă să-și maximizeze numărul punctelor. Ce ar trebui să facă?
Red putea să utilizeze următorul raționament: "Cu acțiunea 2, aș putea
pierde până la 20 de puncte și pot câștiga doar 20, în timp ce cu acțiunea 1 pot
pierde doar 10, dar pot câștiga până la 30, deci acțiunea 1 arată mult mai bine".
Cu un raționament similar, Blue va alege acțiunea C. Dacă ambii jucători
vor lua aceste acțiuni, Red va câștiga 20 de puncte.
Dar ce se întâmplă dacă Blue anticipează raționamentul lui Red și alegerea
acțiunii 1 și ia decizia să aleagă B, pentru a câștiga 10 puncte? Sau dacă Red, la
rândul său, anticipează acest truc ciudat și alege acțiunea 2, pentru a câștiga 20
de puncte în cele din urmă?
Émile Borel și John von Neumann au avut o viziune fundamentală și
surprinzătoare asupra faptului că probabilitățile ar putea oferi o cale de ieșire din
acest joc. În loc să decidă asupra unei acțiuni concrete de luat, cei doi jucători
atribuie probabilități acțiunilor lor, apoi folosesc un dispozitiv de alegere aleatorie
care în funcție de aceste probabilități ia o acțiune pentru ei.
Fiecare jucător calculează probabilitățile astfel încât să minimizeze
pierderea maximă așteptată, independentă de strategia adversarului.
Aceasta duce la o problemă de programare liniară cu strategii optimale
pentru fiecare jucător. Metoda minimax poate calcula strategii optimale pentru
toate jocurile cu sumă nulă de doi jucători.
Pentru exemplul dat mai sus, se pare că Red ar trebui să aleagă acțiunea 1
cu probabilitatea 4/7 și acțiunea 2 cu probabilitatea 3/7, în timp ce Blue ar trebui
să atribuie probabilitățile 0, 4/7 și 3/7 celor trei acțiuni A , B și C.
Red va câștiga 20/7 puncte, în medie pe joc.
Rezolvare
Echilibrul Nash pentru cu sumă nulă de doi poate fi găsit prin rezolvarea
unei probleme de programare liniară.
Să presupunem că un joc cu sumă nulă are o matrice de compensare M
unde elementul Mi,j este câștigul obținut atunci când jucătorul minimizator alege
strategia pură i,iar jucătorul maximizator alege strategia pură j (adică jucătorul
care încearcă să minimizeze câștigul alege linia și jucătorul care încearcă să
maximizeze câștigul alege coloana). Presupunem că fiecare element al matricii
M este pozitiv.
Jocul va avea cel puțin un echilibru Nash. Acesta poate fi găsit prin
rezolvarea următorului program liniar pentru a găsi un vector u:
Minimizarea cu următoarele condiții:
Prima constrângere spune că fiecare element al vectorului u trebuie să fie
nenegativ, iar a doua constrângere spune că fiecare element al vectorului M u
trebuie să fie cel puțin 1. Pentru vectorul u rezultat, inversul sumei elementelor
sale este valoarea jocului. Înmulțirea vectorului u cu această valoare dă un vector
de probabilitate, dând probabilitatea cu care jucătorul care maximizează să aleagă
fiecare dintre strategiile posibile.
Dacă matricea de joc nu are toate elementele pozitive, pur și simplu
adăugați o constantă la fiecare element care este suficient de mare pentru a le face
pozitive. Aceasta va crește valoarea jocului prin acea constantă și nu va avea
niciun efect asupra strategiilor mixte pentru echilibru.
Strategia mixtă de echilibru pentru jucătorul care minimizează poate fi
găsită prin rezolvarea dualei programului liniar dat.
Dacă se găsesc toate soluțiile programului liniar atunci ele vor constitui
echilibrul Nash pentru joc. Orice program liniar poate fi convertit într-un joc cu
doi jucători, cu sumă nulă, utilizând o schimbare a variabilelor care o plasează
sub forma ecuațiilor de mai sus. Deci, aceste jocuri sunt echivalente programelor
liniare, în general.
Soluție universală
Dacă evitarea unui joc cu sumă nulă este o acțiune care poate fi alesă cu o
anumită probabilitate de către jucători, atunci evitarea este întotdeauna o strategie
de echilibru pentru cel puțin un jucător la un joc cu sumă nulă.
Pentru oricare dintre cei doi jucători care joacă jocuri cu sumă nulă, în
cazul cărora o remiză de tipul “zero-zero” este imposibilă după începerea jocului,
cum ar fi Poker, nu există o strategie de echilibru Nash alta decât evitarea jocului.
Chiar dacă există o remiză credibilă de tipul “zero-zero”, după începerea
unui joc cu sumă nulă, nu este o variantă mai bunăs decât strategia de evitare.
Boala olandeză
Model
Modelul economic clasic care descrie boala olandeză a fost dezvoltat de
economiștii W. Max Corden și J. Peter Neary în 1982.
În model, există un sector necomercial (care include servicii) și două
sectoare tranzacționabile: sectorul în plină expansiune și sectorul ”întarziat” (sau
care nu are boom economic). Sectorul în plină expansiune este, de obicei,
extracția resurselor naturale, cum ar fi petrol, gaze naturale, aur, cupru, diamante
sau bauxite. Sectorul întârziat este, de obicei, cel industrial sau agricol.
Exemple
Dolarul canadian în creștere, datorat cererii externe de resurse
naturale a îngreunat sectorul său de producție de la începutul anilor
2000 până la prăbușirea prețului petrolului la sfârșitul anului 2014 /
începutul anului 2015
Indonezia a majorat considerabil veniturile din export după boom-ul
de petrol în 1974 și 1979
Nigeria și alte state africane post-coloniale în anii 1990
Petrolul și gazele naturale din Rusia în anii 2000
Aurul și alte bunuri importate în Spania și Portugalia în secolul al
XVI-lea din America
Efectul petrolului din Marea Nordului asupra sectoarelor de
producție din Norvegia și Marea Britanie în perioada 1970-1990.
Boom-ul post-dezastru însoțite de inflație, ca urmare a furnizării
unor sume mari de asistență pentru salvare și recuperare, care au avut
loc în unele locuri din Asia ca urmare a tsunami-ului asiatic în 2004
Analiștii au susținut că dependența crescândă a Regatului Unit de
sectorul financiar de la "Big Bang" din 1986 împiedică creșterea
producției. Această creștere a sectorului financiar a fost concentrată
aproape exclusiv asupra orașului Londra, exacerbând diferențele
economice regionale, cum ar fi diviziunea Nord-Sud - nordul având
în trecut o bază industrială și de producție puternică. Paul Krugman
a scris despre efectul unui puternic sector financiar asupra producției
din Marea Britanie și o eventuală reajustare după Brexit, în cazul în
care sectorul financiar își va reduce dependența de Londra.
1. https://en.wikipedia.org/wiki/Zero-sum_game#cite_note-3
2. https://en.wikipedia.org/wiki/Dutch_disease#Examples