Sunteți pe pagina 1din 95

Specializarea:

Elemente de
teoria jocurilor
ANUL II Semestrul IV

1
Cluj-Napoca 2013
Cuprins

Modulul 1 JOCURI STATICE DE INFORMATIE COMPLETA 7

Unitatea 1 Jocuri matriciale 7

Unitatea 2 Jocuri matriciale si programare liniara 19

Unitatea 3 Joc necooperativ 22

Unitatea 4 Aplicatii economice 35

TEME DE CONTROL 61

Modulul 2 JOC POZITIONAL 66

Unitatea 1 Jocuri dinamice (pozitionale) 66

Unitatea 2 Reducerea jocului pozitional 73

Unitatea 3 Rezolvarea jocului pozitional 77

TEME DE CONTROL 84

Modulul 3 JOCURI STATICE DE INFORMATIE INCOMPLETA 85

Unitatea 1 Joc static de tip Bayes 85

Unitatea 2 Echilibru de tip Nash-Bayes 92

TEME DE CONTROL 94

2
UNIVERSITATEA „BABEŞ-BOLYAI” CLUJ-NAPOCA

FACULTATEA DE ŞTIINŢE ECONOMICE ŞI GESTIUNEA


AFACERILOR

SPECIALIZAREA: MK, ECTS

ANUL UNIVERSITAR 2013/2014

SEMESTRUL: IV

I. Informaţii generale

Date de identificare a cursului

Date de contact ale titularului de curs:

Nume: Muresan Anton S.

Birou: Cabinetul 229, Etajul II

Telefon: 0264-418653

Fax: 0264-412570

E-mail: anton.muresan@econ.ubbcluj.ro

Consultatii: Joi orele 15,00-17,00

Date de identificare curs si contact tutori:

Numele cursului: ELEMENTE DE TEORIA JOCURILOR

Codul cursului: EBS0097

Anul II Semestrul IV

Tipul cursului: Optional

Pagina web a cursului: https://portal.portalid.ubbcluj.ro/

Tutori: Muresan Anton S.

Adresa e-mail tutori: anton.muresan@econ.ubbcluj.ro

3
Locul de desfăşurare a cursului: Clădirea Campus, săli etajul II

Programarea în orar a activităţilor (la învăţămâtul de zi):

Săptămânal 2 ore de curs + 1 oră de lucrări (seminar), conform orarului afişat la


sediul facultăţii

Condiţionări si cunosţinte prerechizite:

Pentru inscrierea la cursul de faţa este nevoie de parcurgerea si promovarea


anterioara a disciplinelor de Matematici aplicate in economie (anul I, semestrul I)
si Matematici financiare si actuariale (anul I, semestrul II). Este necesar a fi
cunoscute notiunile de derivate, integrale, probabilitati.

Descrierea cursului :

Se vor avea in vedere urmatoarele obiective:

• Familiarizarea studenţilor cu tehnicile şi metodele matematice utilizate în


modelerea unor fenomene si procese economice si de interese diferite
• Introducerea câtorva noţiuni despre jucator, strategie (mutare, decizie),
castig, solutie (punct de echilibru
• Crearea bazelor de rationament si calcul pentru aplicatiile din domeniul
economic

Organizarea temelor (partilor) in cadrul cursului:

Cursul va avea urmatoarele trei parti:

1. Jocuri statice de informatie completa


2. Joc pozitional
3. Jocuri statice de informatie incompleta
Organizarea temelor s-a facut avand in vederea ordinea fireasca si gradul de
dificultate sa urmeze o ordine crescatoare. Informatia relevanta referitoare la
fiecare tema (parte) se gaseste in lista bibliografica ce va fi prezentata ulterior,
iar accesul va fi realizat direct.

Formatul si tipul activitatilor implicate de curs:

Formatul va fi unul clasic, permitand studentului de a-si gestiona singur, fara


constrangeri, parcurgerea cursului. De sigur o participare la activitatile
planificate va usura intelegerea tematicii cursului. Tipurile de activitati ce vor fi
abordate in cadrul cursului vor fi atat cele clasice cat si proiecte de grup,
discutii pe anumite teme si proiecte de cercetare.

4
Materiale bibliografice obligatorii:

Principalele materiale bibliografice pe care le vom utiliza, si care se vor gasi


la biblioteca facultatii, iar unele vor putea fi accesate prin internet, sunt:

1. Blaga P. Muresan A.S., Lupas Al., Matematici aplicate in economie, vol. 2, ed.
Promedia Plus, Cluj-Napoca, 1999
2. Gibbons, R., Game theory for applied economists Princeton Univ. Press,
Prenceton, New Jersey
3. Muresan, A.S., Non cooperative games, Ed. Mega, Cluj-Napoca, 2012
4. Muresan A.S.Blaga P., Matematici aplicate in economie, vol. 2, ed.
Transilvania Press, Cluj-Napoca, 1996
5. Muresan A.S., Cercetari operationale, vol. 1 si 2, lito. UBB, Cluj-Napoca, 1997

Materiale si instrumente necesare pentru curs :

Vom folosi: calculator si softuri specifice pentru a putea vizualiza aplicatiile,


pentru a prelucra date. Astfel, mentionam aici: Word, Excel, Adobe Reader.

Politica de evaluare si notare:

Evaluarea si notarea finala se va face prin rezolvarea de probleme, intocmirea


unor referate si elaborarea unor proiecte aplicative. Toate acestea se vor realiza
in cadrul examenului (colocviului) din sesiunea de examene. Intrarea in
examenul final este conditionata de realizarea sarcinilor ce rezulta din temele de
control de la sfarsitul fiecarui modul al suportului de curs. Studentii vor primi
feed-back la rezultatele realizate in examenul final prin comunicare directa cu
cei care solicita. In cazul cand studentul doreste sa revina la un examen de
marire a notei, acest nou examen se va desfasura in aceleasi conditii, cu aceleasi
cerinte, ca si examenul initial.

Elemente de deontologie academica:

Pentru a evita situatiile care pun in discutie onestitatea studentilor facem de la


inceput precizarea ca se interzice categoric frauda, iar tentativele de frauda se
5
vor trata conform reglementarilor in vigoare elaborate la nivelul facultatii si
universitatii. Este normal ca atunci cand se utilizeaza anumite date, texte,
formulari, etc. luate din alte surse, sa se faca citarea, si astfel sa se asume
meritele doar pentru munca si contributia proprie. Se va cere studentului sa aiba
un comportament academic fata de profesori si colegi.

Studentii cu dizabilitati:

Nu vor avea nici o problema in a se incadra in cerintele cursului si a celorlalte


activitati, sansele in pregatire si obligatiile lor fiind de aceeasi factura ca si
pentru studentii fara dizabilitati.

Strategii de studiu recomandate:

Recomandam studentilor sa se pregateasca mai intai din aspectele teoretice, asa


incat, mai intai, din curs, sa fie studiate modulele cu teoria si exemplele
ilustrative formulate, apoi sa se abordeze problemele rezolvate, iar apoi si
problemele formulate spre rezolvare. Pentru tot cursul, apreciem ca fondul de
timp necesar insusirii complete este de 56 de ore, din care 40 pentru suportul de
curs, 8 pentru activitatile directe cu tutorii, iar 12 pentru sarcinile individuale de
studiu al bibliografiei si realizarea temelor de control.

6
I. Suportul de curs propriu-zis

Modulul 1

JOCURI STATICE DE INFORMATIE COMPLETA

Concepte de bazǎ Jucator, strategie, castig, joc matricial, punct de echilibru

Obiective:

a. definirea notiunii de joc matricial

b. considerarea diverselor tipuri de jocuri matriciale

c. notiunea de solutie

Recomandǎri privind studiul: se recomanda studentilor sa-si insuseasca notiunile


importante, in aplicatiile practice, de joc matricial si de solutii ale acestora. De
asemenea solutiile pentru diversele probleme formulate plecand de la jocurile
matriciale

Rezultate aşteptate:

a) se asteapta ca studentii sa poata formula si opera cu diversele tipuri de


jocuri matriciale, sa le recunoasca si sa le utilizeze in aplicatii
b) sa fie in stare sa gasesca solutiile pentru jocurile si problemele simple
intalnite in aplicatii
Unitatea 1

Jocuri matriciale : definitie, clasificari, solutie

Obiective:

a) evidentierea principalelor tipuri de jocuri matriciale


b) prezentarea diverselor tipuri de clasificari
c) lamurirea notiunii de solutie

Noţiuni cheie : Jucator, strategie, castig, joc matricial, punct de echilibru

CONŢINUTUL UNITĂŢII

Există situaţii în care modelele matematice la care se ajunge se prezintă sub forma
unor jocuri matriciale. Asa sunt, de exemplu, acelea in care 2 sau mai

multi parteneri, prin deciziile pe care le iau, influenteaza rezultatul (castigul)


fiecarui participant.
7
Jocuri statice de informaţie completa

In aceasta unitate consideram jocuri de urmatoarea simpla forma: mai intai


jucatorii aleg simultan actiuni (decizii), apoi ei obtin castiguri ce depind de
combinatia actiunilor ce tocmai au fost alese. In clasa unor astfel de jocuri statice
(sau cu miscare-simultana) ne restrangem atentia asupra jocurilor cu informatie
completa. Adica, functia de castig a fiecarui jucator (functia ce determina
castigurile jucatorilor de la fiecare combinatie de actiuni) este total cunoscuta de
toti jucatorii.
Jocuri cu suma nula de doua persoane

Consideram un joc cu doi jucatori : jucatorul 1 si jucatorul 2. Ceea ce jucatorul 1


castiga este tocmai ce jucatorul 2 pierde, si vice versa.
In continuare sa avem o intelegere intuitiva a unui astfel de joc introducem, prin
cateva exemple simple, ideile de baza.
Exemplul 1.1. (Potrivirea monedelor)
Fiecare din cei doi participanti (jucatori) pune pe masa o moneda, fara ca celalalt
jucator sa o vada. Daca monedele se potrivesc, adica, daca ambele monede sunt cu
“capul” sau ambele cu “pajura”, atunci jucatorul 1 ia ambele monede. Daca ele nu
se potrivesc, jucatorul 2 ia ambele monede. In alte cuvinte, primul caz, jucatorul 1
primeste un castig (o moneda) de la jucatorul 2, si, in al doilea caz, jucatorul 1
primeste un castig de -1 (isi pierde moneda sa).
Aceste castiguri pot fi listate in urmatorul tabel:
Jucătorul 2

Jucătorul 1 1 (capul) 2 (pajura)

1 (capul) 1 -1

2 (pajura) -1 1

De asemenea, ele pot fi scrise in matricele de castig pentru cei doi jucatori:
 1 − 1 − 1 1 
H1 =  , H2 =  
− 1 1   1 − 1

Spunem ca fiecare jucator are doua strategii (actiuni, mutari, decizii). In matricea
H1 prima linie reprezinta prima strategie a jucatorului 1, a doua linie reprezinta a
8
doua strategie a jucatorului 1. Daca jucatorul 1 alege strategia 1, inseamna ca
moneda sa arata capul deasupra. Strategia 2 inseamna pajura deasupra. Similar,
prima si a doua second coloana a matricei H1 corespunde respectiv la prima si a
doua strategie a jucatorului 2. In H 2 avem aceleasi situatii, dar pentru jucatorul 2.
Observatia 1.1. Acest ansamblu de “concurs” (competitie) este un joc de doua
persoane cu suma nula (zero). Simplu spunand, un joc este o multime de reguli
in care se precizeaza intregul process de competitie (sau concurs), incluzand
jucatorii, strategiile, si castigurile (rezultatele) dupa fiecare jucare a jocului. Toate
acestea sunt descrise complet.
Observatia 1.2. Datele (elementele) din tabelul de mai sus formeaza o matrice
de castig (payoff matrix a jucatorului 1, adica H1 ). Matricea H 2 este matricea
de castig a jucatorului 2, si avem

H1 H t2 O2 ,

unde H 2t este transpusa lui H 2 .


Observatia 1.3. Castigul este o functie de strategiile celor doi jucatori. Daca, de
exemplu , moneda jucatorului 1 este cu capul deasupra (strategia 1) si moneda
jucatorului 2 este cu capul deasupra (strategia 1), atunci elementul h11 = 1 noteaza
castigul pe care jucatorul 1 il primeste de la jucatorul 2. La fel, daca jucatorul 1
alege strategia 2 (pajura) si jucatorul 2 alege strategia 1 (capul), atunci elementul
h21 = −1 este castigul pe care jucatorul 1 il “primeste”. In acest caz, castigul pe care
jucatorul 1 il primeste este un numar negativ. Aceasta inseamna ca jucatorul 1
pierde o unitate monetara, deci jucatorul 1 plateste o unitate monetara jucatorului 2
Exemplul 1.2. (Piatra-hartia-foarfecele)
Foarfecele “bate” hartia, hartia “bate” piatra, si piatra “bate” foarfecele. Exista doi
jucatori: 1 si 2. Fiecare jucator are trei strategii. Fie strategiile 1, 2, 3 reprezentand
piatra, hartia respectiv foarfecele. Daca presupunem ca invingatorul cadstiga cate 1
unitatea monetara de la cel care pierde atunci matricea de castig este:

9
Jucătorul 2

1 2 3

Jucătorul 1 1 0 -1 1

2 1 0 -1

3 -1 1 0

Observatia 1.4. Matricele de castig pentru cei doi jucatori sunt:


 0 − 1 − 1  0 −1 1 
H 1 =  1 0 − 1, H 2 =  1 0 − 1,
 − 1 1 0  − 1 1 0 

Avem H1 = H 2 si H1 + H 2t = O3 .
Exemplul 1.3. Consideram jocul de doua personae cu suma nula pentru care
matricea de castig este data in urmatorul tabel:
Jucătorul 2

q 0 1 2

Jucătorul 1 0 0 1 4

1 -1 2 7

2 -4 1 8

3 -9 -2 7

Avem matricele de castig:


0 1 4
−1 2 0 1 4 9 
7
H1 =  , H 2 =  − 1 − 2 − 1 2 

− 4 1 8
  − 4 − 7 − 8 − 7 
− 9 − 2 7

Jucatorul 1 are patru strategii, in timp ce jucatorul 2 are trei strategii.


Observatia 1.5. Castigul jucatorului 1 (adica, ceea ce jucatorul 2 plateste la
jucatorul 1) poate fi determinat de functia
10
f : 0, 1, 2, 3 0, 1, 2 Z, f p, q q2 p2 2pq.

In fiecare din exemplele de mai sus exista doi jucatori, anume jucatorul 1 si
jucatorul 2, si o matrice de castig, H1 (exista de asemenea si matricea H 2 asa ca
H1 + H 2t = 0 ). Fiecare jucator are mai multe strategii. Strategiile jucatorului 1 sunt
reprezentate de liniile matricei de castig H1 , si acelea ale jucatorului 2 de
coloanele matricei de castig H1 . (Strategiile jucatorului 2 sunt reprezentate de
liniile matricei de castig H 2 , si acelea ale jucatorului 1 de coloanele matricei de
castig H 2 ).
Jucatorul 1 alege o strategie din multimea strategiilor sale, si jucatorul 2,
independent, alege o strategie din multimea strategiilor sale. Dupa ce cele doua
alegeri au fost facute, jucatorul 2 plateste jucatorului 1 o valoare, care este castigul
corespunzator acestei situatii jucare a jocului. Aceasta valoare este reprezentata in
matricea de castig. Aceasta valoare poate fi pozitiva, 0, sau negativa. Daca castigul
este pozitiv, jucatorul 1 primeste o valoare pozitiva de la jucatorul 2, adica,
jucatorul 1 castiga o valoare de la jucatorul 2. Daca castigul este negativ, jucatorul
1 primeste o valoare negativa de la jucatorul 2, adica, jucatorul 1 pierde o valoare
catre jucatorul 2 (jucatorul 2 castiga o valoare de la jucatorul 1). Castigul
jucatorului 1 este egal cu pierderea jucatorului 2. Ce jucatorul 1 castiga este tocmai
ceea ce jucatorul 2 pierde, si vice versa. De aceea, un astfel de joc este numit un
joc cu suma zero (nula).

Jocuri matriciale

In cele ce urmeaza presupunem ca jucatorul 1 are m strategii si jucatorul 2 are


n strategii. Notam prin aij , i = 1, m , j = 1, n castigul pe care jucatorul 1 il obtine

de la jucatorul 2 daca jucatorul 1 alege strategia i si jucatorul 2 alege strategia j .

Asa obtinem matricea de castig H1 (≡ A) :


 a11 a12 ... a1n 
a ... a 2 n 
A = (a ij ) =  21
a 22
 ... ... ... ... 
 
a m1 am2 ... a mn 

11
Definitia 1.1. Numim joc matricial jocul care este complet determinat de matricea
A de mai sus.

Sa rezolvam jocul, adica sa gasim solutia (ce castig maxim are jucatorul 1 si ce
startegii sunt alese de ambii jucatori pentru a obtine aceasta) examinam elementele
matricei A .
In acest joc, jucatorul 1 vrea sa obtina un castig aij cat mai mare posibil, in timp
ce jucatorul 2 va face alegerea sa cea mai buna si conduca la o valoare aij cat mai
mica posibil. Interesele celor doi jucatori sunt complet opuse (in conflict).

Daca jucatorul 1 alege strategia i el poate fi sigur ca va obtine cel putin castigul

min a ij . #
1 j n

Acesta este elementul minim al liniei i din matricea de castig A .


Deoarece jucatorul 1 vrea sa-si maximizeze castigul sau el poate alege strategia i
asa incat sa faca valoarea de mai sus cat de mare posibil. Adica, altfel spus
jucatorul 1 poate alege strategia i in asa fel incat el sa primeasca un castig nu mai
mic decat

max min a ij . #
1 i m 1 j n

Cu alte cuvinte, daca jucatorul 1 face cea mai buna alegere a sa, ceea ce obtine el
nu poate fi mai mic decat valoarea de mai sus.
Similar, daca jucatorul 2 alege strategia sa j , el va pierde cel mult

max a ij . #
1 i m

Dar, jucatorul 2 vrea sa-si minimizeze pierdearea sa, iar pentru asta va incerca sa
sa-si aleaga strategia sa j asa ca sa obtina minimul valorii de mai sus. Anume,
jucatorul 2 poate alege j asa incat pierderea sa sa fie nu mai mare decat

min max a ij . #
1 j n 1 i m

Asa, daca jucatorul 2 face cea mai buna alegere a sa, castigul pe care il obtine
jucatorul 1 nu poate fi mai mare decat valoarea de mai sus.
Am vazut ca jucatorul 1 poate alege strategia i care sa-I asigure un castig care sa
fie cel putin
12
v1 max min a ij ,
1 i m 1 j n

in timp ce jucatorul 2 poate alege strategia j asa ca sa faca pierderea sa (castigul


jucatorului 1) cel mult

v2 min max a ij .
1 j n 1 i m

Exista ceva relatie intre valorile v1 si v2 ? Raspunsul este dat prin


Lema 1.1. Urmatoarea inegalitate are loc: v1 ≤ v2 , adica

v1 max min a ij min max a ij v2. #


1 i m 1 j n 1 j n 1 i m

Demonstratie. Pentru fiecare i = 1, m avem

min aij ≤ aij , j = 1, n


1≤ j ≤ n

si pentru fiecare j = 1, n avem

a ij ≤ max a ij , i = 1, m
1≤ j ≤ n

Deci inegalitatea

min a ij max a ij
1 j n 1 i m

are loc, pentru fiecare i = 1, m , si fiecare j = 1, n .

Deoarece membrul stang al ultimei inegalitati este independent de j , luand


minimul in raport cu j in ambii membri avem
min aij ≤ min max aij = v 2 i = 1, m
1≤ j ≤ n 1≤ j ≤ n 1≤i ≤ m

adica,

min a ij v2.
1 j n

Deoarece membrul drept al ultimei inegalitati este independent de i , luand


maximul in raport cu i in ambii membri obtinem
13
max min a ij v 2,
1 i m 1 j n

adica, v1 ≤ v2 , si demonstratia este completa.


Sa examinam cele trei exemple din sectiunea 1.1.
In Exemplul 1.1 avem m = 2 , n = 2 , deci
v1 = max min aij = max(−1,−1) = −1,
1≤ i ≤ 2 1≤ j ≤ 2

v2 = min max aij = min (1,1) = 1.


1≤ j ≤ 2 1≤ i ≤ 2

Asa, in Exemplul 1.1 avem v1 < v2 .


In Exemplul 1.2, avem m = 3 , n = 3 , deci
v1 = max min aij = max(−1,−1,−1) = −1,
1≤ i ≤ 3 1≤ j ≤ 3

v2 = min max aij = min (1,1,1) = 1.


1≤ j ≤ 3 1≤ i ≤ 3

Asa, in Exemplul 1.2 avem v1 < v2 .


In Exemplul 1.3, avem m = 4 , n = 3 , deci
v1 = max min aij = max(0,−1,−4,−9) = 0,
1≤ i ≤ 4 1≤ j ≤ 3

v2 = min max aij = min (0, 2, 8) = 0.


1≤ j ≤ 3 1≤ i ≤ 4

Asa, in Exemplul 1.3 avem v1 = v2 .

Puncte sa in strategii pure

Exista situatii in care v1 = v2 . In consecinta dam


Definitia 1.2. Daca elementele matriei de castig A ale jocului matriceal satisfac
urmatoarea egalitate
v1 = max min aij = min max aij = v2 ,
1≤ i ≤ m 1≤ j ≤ n 1≤ j ≤ n 1≤ i ≤ m

cantitatea v(= v1 = v2 ) este numita valoarea jocului.


Observatia 1.6. Valoarea v este valoarea comuna a acelora date in (3) si (5).
Valoarea jocului din Exemplul 1.3 este v = 0 .

14
Daca egalitatea (7) are loc, atunci exista un i∗ si un j ∗ astfel incat
min ai ∗ j = max min aij = v,
1≤ j ≤ n 1≤ i ≤ m 1≤ j ≤ n

si
max aij ∗ = min max aij = v.
1≤ i ≤ m 1≤ j ≤ n 1≤ i ≤ m

Deci
min ai ∗ j = max aij ∗ .
1≤ j ≤ n 1≤ i ≤ m

Dar, evident avem


min ai ∗ j ≤ ai ∗ j ∗ ≤ max aij ∗ .
1≤ j ≤ n 1≤ i ≤ m

Astfel
max aij ∗ = ai ∗ j ∗ = v = min ai ∗ j .
1≤ i ≤ m 1≤ j ≤ n

Deci, pentru orice i si orice j


aij ∗ ≤ ai ∗ j ∗ = v ≤ ai ∗ j .

In consecinta, daca jucatorul 1 alege strategia i∗ , atunci castigul sau nu poate fi


mai mic decat v daca jucatorul 2 pleaca de la strategia j ∗ ; daca jucatorul 2
alege strategia j ∗ , atunci castigul sau nu poate sa depaseasca v daca jucatorul 1
se departeaza de la strategia i ∗ .
Definitia 1.3. Numim i ∗ si j ∗ strategii optimale ale jucatorilor 1 si 2
respectiv. Perechea (i∗ , j ∗ ) este un punct sa (saddle point) in strategii pure a
jocului. Spunem ca i = i ∗ , j = j ∗ este o solutie (sau echilibru Nash) a jocului.

Observatia 1.7. Relatia (8) ne arata ca valoarea castigului la punctul sa (i∗ , j ∗ )


(solutia jocului) este valoarea jocului. Cand jucatorul 1 isi mentine strategia sa
optimala i∗ , el se poate astepta sa-si creasca castigul sau daca jucatorul 2 se
departeaza de la startegia sa optimala j ∗ . Similar, daca jucatorul 2 isi mentine
strategia sa optimala j ∗ , castigul jucatorului 1 poate descreste daca el se
departeaza de la strategia sa optimala i ∗ . Astfel, daca jocul are un punct sa
(i ∗ , j ∗ ) atunci egalitatea (7) are loc si ai j = v .
∗ ∗

Observatia 1.8. Un joc matriceal poate avea mai mult decat un punct sa in
startegii pure. Totusi, castigurile la diferitele puncte sa sunt egale,. Valoarea lor
comuna fiind valoarea jocului.

15
Exemplul 1.4. Consideram jocul matrieal cu matricea de castig
 4 3 6 2
A = 1 2 0 0
5 6 7 5

Avem pentru minimul liniilor sale

min 4, 3, 6, 2 2, min 1, 2, 0, 0 0, min 5, 6, 7, 5 5

si atunci maximul acestor minime este:


max(2, 0, 5) = 5 = v1.

Acum, avem pentru maximele coloanelor sale


max (4,1, 5) = 5, max(3, 2, 6) = 6, max(6, 0, 7) = 7, max(2, 0, 5) = 5,

si atunci minimul acestor maxime este:


min (5, 6, 7, 5) = 5 = v2 .

Cum v1 = v2 = 5 avem punct sa in satrategii pure. Este usor de verificat ca (3,1) si


(3, 4) sunt ambele puncte sa in strategii pure pentru ca

a 31 a 34 v 5.

Observatia 1.9. Daca jocul matricial are un punct sa in startegii pure (i∗ , j ∗ ) ,
atunci el este foarte usor de gasit. Realmente, prin Definitia 1.3 a unui astfel de
punct sa in startegii pure (8), valoarea ai j este un element din matricea de castig
∗ ∗

A = (aij ) care este in acelasi timp minimul din linia sa si maximul din coloana sa.

In Exemplul 1.3, (1,1) este un punct sa in strategii pure al jocului deoarecei a11 = 0
este cel mai mic element din prima linie si in acelasi timp este cele mai mare
element din prima coloana.
In Exemplul 1.4 a31 = a34 = 5 sunt doua elemente cu cea mai mica valoare in linia
a treia si in acelasi timp cele mai mari din prima si a patra coloana, respective.
Un joc matricial poate avea mai multe puncte sa in strategii pure. In acest caz
putem demonstra urmatorul rezultat:

16
Lema 1.2. Fie (i∗ , j ∗ ) si (i∗∗ , j ∗∗ ) puncte sa in strategii pure ale unui joc
matricial. Atunci (i∗ , j ∗∗ ) si (i∗∗ , j ∗ ) sunt de asemnea puncte sa in strategii pure si
valorile la toate aceste puncte sa sunt egale, adica
ai ∗ j ∗ = ai ∗∗ j ∗∗ = ai ∗ j ∗∗ = ai∗∗ j ∗ .

Demonstratie. Dovedim ca i , j este un punct sa in startegii pure. Faptul ca


i ,j este un punct sa in startegii pure se face intr-un mod similar.
Deoarece (i∗ , j ∗ ) este un punct sa in strategii pure avem
aij ∗ ≤ ai∗ j ∗ ≤ ai ∗ j

pentru toti i=1,m si toti j=1,n . Deoarece (i∗∗ , j ∗∗ ) este un punct sa in strategii
pure avem
aij ∗∗ ≤ ai∗∗ j ∗∗ ≤ ai∗∗ j

pentru toti i=1,m si toti j=1,n . Din aceste inegalitati obtinem


ai ∗ j ∗ ≤ ai ∗ j ∗∗ ≤ ai∗∗ j ∗∗ ≤ ai ∗∗ j ∗ ≤ ai∗ j ∗ ,

care dovedesc (9). Prin (9) si prin inegalitatile de mai sus avem
aij ∗ ≤ ai ∗ j ∗∗ ≤ ai ∗ j

pentru toti i=1,m si toti j=1,n . Deci (i∗ , j ∗∗ ) este un punct sa in strategii pure.
Din aceasta lema rezulta ca un joc matricial cu puncte sa in strategii pure are
urmatoarele proprietati:
-- interschimarea sau proprietatea rectangulara a punctelor sa in strategii pure,
-- egalitatea valorilor la toate punctele sa in startegii pure.
Exemplul 1.5. Jocul cu matricea de castig
3 0 − 5
A = − 7 − 1 4 

 2 1 1 

are punctual sa in strategii pure (3, 2) deoarece v1 = 1 , v2 = 1 si a32 = v = 1 .


Exemplul 1.6. Perechea (3, 3) este un punct sa in strategii pure pentru jocul ca
matricea de castig

17
0 − 1 − 1
A = 1 0 − 1
1 1 0 

Avem v = 0 .
Exemplul 1.7. Perechea (2, 3) este un punct sa in strategii pure pentru jocul cu
matricea de castig
 2 − 3 −1 4 
A =  1 2 0 1 
− 2 3 − 1 − 2

Valoarea jocului este v = 0 .


Exemplul 1.8. Jocul cu matricea de castig
4 1 1

A= 2 1 1 
− 7 − 1 4

are patru puncte sa in strategii pure deoarece avem (vezi Lema 1.2)
a12 = a13 = a22 = a23 = 1 = v.

Exemplul 1.9. Jocul cu matricea de castig


 7 5 6
A =  0 9 4
14 1 8 

Nu are un punct sa in strategii pure, in sensul Definitiei 1.2 deoarece


v1 = max(5, 0,1) = 5

si v2 = min (14, 9, 8) = 8.

18
Unitatea 2

Jocuri matriciale si programare liniara

Obiective:

a) studentii trebuie sa cunoasca elementele de programare liniara

b) sa stie incadra un joc matricial in una din problemele de programare


liniara de care ea apartine

c) sa-si insuseasca metodele de rezolvare si sa interpreteze rezultatele


obtinute

Noţiuni cheie : ecuatii liniare, functii scop, probleme de programare liniara,


probleme duale, algoritmul simplex, solutii

CONTINUTUL UNITǍTII

Jocuri matriciale si programare liniara

In continuare, formulam jocul matricial ca o problema de programare liniara. Fie


A = (aij ) matricea de castig a jocului.

Nu este o restrictie sa presupunem ca aij > 0 pentru toti i = 1, m , si pentru toti


j = 1, n . Atunci valoarea v a jocului trebuie sa fie un nunar pozitiv.

Prin alegearea strategiei mixte X ∈ S m jucatorul 1 poate obtine celk putin castigul
asteptat

min XA j u.
1 j n

Deci avem XA• j ≥ u , j = 1, n adica


m

∑a
i =1
ij xi ≥ u , j = 1.n

cu
m

∑x
i =1
i =1 xi ≥ 0, i = 1, m.

Notam xi / u = xi, , i = 1, m . Atunci problema devine

19
∑a ij xi, ≥ 1, j = 1, n
1
∑x ,
i =
u

xi, ≥ 0, i = 1, m

Jucatorul 1 vrea sa-si maximizeze valoarea u , (acest maxim este valoarea v a


jocului), adica, el vrea sa minimizeze valoarea 1/u. Astfel problema se reduce la
urmatoarea problema de programare liniara

min f x1 x2 xm #
#
m
a ij x i 1, j #
i 1

#
xi 0, i #

Similar, jucatorul 2, prin alegerea unei strategii mixte Y ∈ S n , poate face ca


jucatorul 1 sa nu primeasca mai mult decat
max Ai•Y t = w.
1≤i ≤ m

Asa, avem Ai•Y t ≤ w , i = 1, m , adica,

∑a j =1
ij y j ≤ w, i = 1.m

unde
m

∑y
j =1
j =1 y j ≥ 0, j = 1, n,

Notam y j / w = y ,j , j = 1, n .

Deoarece jucatorul 2 vrea sa minimizeze w (acest minim este la fel valoarea v


a jocului), adica, el vrea sa maximizeze valoarea 1/w , problema de mai sus se
reduce la urmatoarea problema de programare liniara, care este duala lui (39),
formulata mai sus:

20
max g y1 y2 yn #
#
n
a ij y j 1, i #
j 1

#
yj 0, j . #

Astfel problema gasirii solutiei unui joc matricial este este echivalenta cu
problema rezolvarii unei perechi de probleme de programare liniara duale.
Observatia 1.28. Datorita teoremei dualitatii, bine cunoscuta in programarea
liniara, este suficient sa se rezolve una singura dintre acele probleme de mai sus.

Exemplul 1.18. Consideram acelasi joc matricial ca in Exemplul 1.17. Astfel


avem
 4 2 3
B = 3 4 2
4 0 8 

Sa obtinem aij > 0 vom aduna constanta 1 la fiecare element al matriei B si asa
vom obtine
5 3 4 
A = 4 5 3
5 1 9 

Corespunzatoarea problema de programare liniara (40) este


[max ]g = y1, + y 2, + y3,

5 y1, + 3 y 2, + 4 y 3, ≤ 1
4y + 5y + 3y
,
1
,
2
,
3 ≤ 1
5y + y + 9y
,
1
,
2
,
3 ≤ 1
, ,
y ,y ,y
1 2
,
3 ≥ 0

In continuare se rezolva aceasta problema folosim metoda simplex. Matricea


simplex poate fi scrisa si apoi folosim algoritmul simplex.

21
Unitatea 3

Joc necooperativ

Obiective:

a) studentii trebuie sa recunoasca tipurile de jocuri necooperative

b) sa stie incadra un joc necooperativ in unul din categoriile de care el


apartine

c) sa-si insuseasca metodele de solutionare directa in cazul diferitelor tipuri


de jocuri necooperative

Noţiuni cheie : jucator, strategie (mutare, decizie), castig, punct de echilibru

CONŢINUTUL UNITĂŢII

1. Definiţia jocului necooperativ

Teoria jocurilor este acea ramură a matematicii care formulează şi rezolvă


probleme legate de diferite modele ale situaţiilor conflictuale. Deoarece jocul este
prototipul situaţiilor conflictuale de orice fel, termenii teoriei jocurilor sunt în mare
parte daţi prin termeni uzuali folosiţi în jocurile efective. Astfel de termeni sunt, de
exemplu joc, câştig, strategie şi altele. Orice termen al teoriei jocurilor are însă un
conţinut cu caracter pur matematic. Termenul joc este folosit pentru denumirea
unui joc oarecare, definit matematic. Orice joc definit, pentru a i se scoate în
evidenţă aspectul concret în raport cu jocul în general, va fi supranumit prin
folosirea unui atribut, de obicei cu un anumit sens din limbajul de toate zilele.
Pentru a deosebi acest joc de jocul efectiv se mai adaugă uneori atributul
matematic şi se spune, mai complet, joc matematic.

La orice joc obişnuit participă un număr de n (număr natural) jucători. Din


punct de vedere matematic numai existenţa jucătorilor este esenţială, precum şi
posibilitatea identificării lor, respectiv deosebirii lor de toţi ceilalţi jucători. De
aceea mulţimea jucătorilor I se identică cu multimea primelor n numere naturale:
I = {1,..., n} . Fiecare jucător i, i ∈ I , poate aplica mai multe strategii. În cazul unui
joc efectiv jucătorul i poate, în momentele de decizie ale jocului, să aleagă dintr-o
mulţime S i de variante. Vom considera că S i este o multime finită pentru orice i.
Deoarece din punct de vedere matematic natura concretă a variantelor nu este
interesantă, doar posibilitatea de identificare a lor, se va nota S i = {1,..., mi }şi se
consideră în continuare notaţia generală S i = {si } , unde i = 1, n (i variază de la 1 la

22
n) şi pentru i fixat si = 1, mi ( si variază de la 1 la mi ). Luând câte o strategie a
fiecărui jucător se obţine o situaţie (strategie) a jocului s = (s1 ,..., s n ) , element al
produsului cartezian S = S1 x...xS n = Π S i .
i∈I

În fiecare situaţie s, fiecare jucător i, primeşte o sumă H i (s ) . Aceată funcţie,


definită pe mulţimea tuturor situaţiilor s, se numeşte matricea de câştig a
jucătorului i.

Definiţia 1. Se numeşte joc necooperativ sistemul


Γ =< I , {S i }, {H i }, i ∈ I >

în care I şi S i sunt mulţimi (secţiuni) de numere naturale, iar H i = H i (s ) sunt funcţii


reale definite pe mulţimea S , s ∈ S , S = Π S i .
i∈I

Observaţia 1. Denumirea de matrice de câştig pentru funcţia H i (s ) este


justificată prin aceea că mulţimea valorilor funcţiei poate fi scrisă efectiv în forma
unei matrice n-dimensionale de tip {m1 ,..., mn }. Prin aceasta se explică denumirea de
joc matriceal atunci când dorim să scoatem în evidenţă că jocul este dat prin
matrice n-dimensionale.

Exemplul 1. Doi jucători, independent unul de celălalt, pun pe masă câte o


monedă de acelaşi fel. Dacă ambii jucători au ales aceeaşi faţă, atunci primul
jucător ia ambele monede, iar în caz contrar, cel de-al doilea jucător ia ambele
monede.

Primul jucător este notat cu 1, al doilea jucător cu 2. Deci I = {1,2}. Fiecare


jucător are 2 strategii: S1 = {1,2} , S 2 = {1,2}. După cum s1 = 1, respectiv
s 2 = 1, jucătorul 1 a ales ,,banul”, respectiv ,,stema”. La fel se interpretează valoarea
s 2 = 1, respectiv s 2 = 2, pentru jucătorul 2. Prin urmare
S = S1 × S 2 = {(1,1), (1,2 ), (2,1), (2,2 )}. Acestui joc, notat Γ , i se atribuie simbolul:

Γ =< I , S1 , S 2 , H 1 , H 2 > .

Matricea de câştig H 1 (s ) a jucătorului 1 se poate scrie în forma:

 H 1 (1,1) H 1 (1,2 )   1 − 1
H 1 (s ) =  = 
 H 1 (2,1) H 1 (2,2 ) − 1 1 

unele linii corespund strategiilor jucătorului 1 şi coloanele corespund strategiilor


jucătorului 2.
23
Matricea de câştig a jucătorului 2 are următoarea exprimare:

 H 2 (1,1) H 2 (2,1)  − 1 1 
H 2 (s ) =  = 
 H 2 (1,2 ) H 2 (2,2 )  1 − 1

unde acum liniile corespund strategiilor jucătorului 2 şi coloanele corespund


strategiilor jucătorului 1.

Observaţia 2. O notaţie mai generală pentru matricele de câştig este în


forma unui tabel de tipul următor:

Situaţia Matricea de câştig

s1 ... sn H1 ... Hn

Astfel, în cazul exemplului considerat, matricele de câştig pot fi date şi în


următoarea formă:

Situaţia Matricea de câştig

s1 s2 H1 H2

1 1 1 -1

1 2 -1 1

2 1 -1 1

2 2 1 -1

1. Definiţia punctului de echilibru

Fie dat un joc necooperativ oarecare


Γ =< I , {S i }, {H i }, i ∈ I >

şi să presupunem că jocul se repetă de mai multe ori.

Analizând exemplul 1 din punctul precedent se constată că nu este avantajos


pentru nici unul dintre jucători să aplice permanent una şi aceeaşi strategie. Dacă,
de exemplu, jucătorul întâi ar aplica permanent strategia 1, jucătorul 2 ar observa
acest lucru şi ar aplica permanent strategia 2 şi jucătorul întâi ar pierde (ar avea

24
câştig negativ) permanent. Situaţie similară s-ar produce dacă jucătorul 1 ar aplica
permanent strategia a doua.

Dacă analiza s-ar fi făcut din punctul de vedere al jucătorului 2 am fi ajuns la


aceiaşi concluzie: nu este avantajos ca jucătorul 2 să aplice permanent una şi
aceiaşi strategie.

Din cele stabilite rezultă că în orice situaţie s = (s1 , s 2 ), unul dintre jucători are o altă
situaţie preferată s' , faţă de cea existentă s în acel moment, la care se poate ajunge
modificând numai strategia jucătorului cu altă preferinţă:

Situaţia preferată s' pentru

Situaţia dată s jucătorul

1 2

(1,1) (1,2)

(1,2) (2,2)

(2,1) (1,1)

(2,2) (2,1)

În concluzie, jocul repetându-se este necesară aplicarea fiecărei strategii si


cu probabilitatea (frecvenţa relativă) p is care să asigure un câştig cât mai mare, în
i

totalitatea jocurilor jucate, pentru fiecare jucător, sau, ceea ce este acelaşi lucru, de
a asigura valoarea medie cea mai mare posibilă a câştigului pentru fiecare jucător.

Pentru notarea matricei linie a tuturor probabilităţilor pis , si = 1, mi , asociate


i

jucătorului i, se foloseşte simbolul Pi = [ pi1 ,..., pim ]. . Vectorul Pi , indiferent de


i

valorile probabilităţilor, se numeşte strategie mixtă a jucătorului i. Dacă o singură


probabilitate din vectorul Pi , este diferită de 0, fiind egală cu 1, atunci Pi , este
(echivalentă cu) strategia pură si a jucătorului i. Dacă toate strategiile Pi , i = 1, n
sunt pure, P = (P1 , ..., Pn ) este (echivalentă cu ) strategia pură (situaţia s = (s1 , ..., s n ) ) a
întregului joc.

Notăm cu J i matricea linie formată din mi cifre egale cu 1 şi atunci se poate


scrie Pi J iT = 1, unde T este simbolul transpunerii matricei.

25
Cu Pi notăm strategia mixtă a tuturor jucătorilor j, cu excepţia jucătorului i,
luaţi la un loc, presupunând că fiecare jucător şi-a fixat strategia sa în mod
independent de restul jucătorilor: Pi = Π Pj . Aici înmulţirea vectorilor se consideră
j ≠i

componentă cu componenţă în sensul unui produs cartezian. Prin convenţie se


asigură ordonarea lexicografică la scrierea elementelor vectorului Pi . De exemplu,
dacă P1 = [ p11 , p12 ], P2 = [ p 21 , p 22 , p 23 ], P3 = [ p31 , p32 , p33 , p 34 ] , sunt strategiile mixte ale
jucătorilor I = {1,2,3} , avem

P1 = P2 × P3 =
= [ p 21 p31 , p 21 p 32 , p 21 p33 , p 21 p 34 , p 22 p31 , p 22 p 32 , p 22 p 33 , p 22 p34 , p 23 p31 , p 23 p32 , p 23 p33 , p 23 p34 ]

P2 = P1 × P3 =
= [ p11 p 31 , p11 p 32 , p11 p 33 , p11 p 34 , p12 p 31 , p12 p 32 , p12 p 33 , p12 p 34 ]

P3 = P1 × P2 =
= [ p11 p 21 , p11 p 22 , p11 p 23 , p12 p 21 , p12 p 22 , p12 p 23 ].

Cu notaţiile introduse dăm următoarea definiţie:

Definiţia 1. Rezolvarea jocului necooperativ constă în determinarea acelor


strategii mixte (soluţii) Pi , Pi J iT = 1, i = 1, n , pentru care, considerând constant
vectorul Pi , funcţia de câştig Fi = Pi H i Pi T are valoare maximă, oricare ar fi i.

Strategiile Pi , se notează cu P = (P1 ,..., Pn ) şi obiectul matematic astfel determinat se


numeşte punct de echilibru al jocului.

Exemplul 2. Datele jocului necooperativ din exemplul precedent. pot fi


reprezentate prin următoarele 2 tabele:

F1 F2

P2 p 21 p 22 P1 p11 p12

P1 P2

p11 1 -1 p 21 -1 1

p12 -1 1 p 22 1 -1

cărora le corespund următoarele sisteme de egalităţi

26
p11 + p12 = 1, p 21 + p 22 = 1,
F1 = ( p 21 − p 22 ) p11 + (− p 21 + p 22 ) p12 ,
F2 = (− p11 + p12 ) p 21 + ( p11 − p12 ) p 22 .

Dacă P1 , P2 este soluţia problemei, atunci nu există nici un vector de probabilitate

[ ] ( )
P10 = p110 , p120 pentru care F10 = F1 P10 , P2 > F1 = F1 (P1 , P2 ), unde

F10 = ( p 21 − p 22 ) p110 + (− p 21 + p 22 ) p120 şi nu există nici un vector de probabilitate

[
P20 = p 21
0 0
, p 22] ( )
pentru care F20 = F2 P1 , P20 > F2 = F2 (P1 , P2 ), unde

F20 = (− p11 + p12 ) p 21


0
+ ( p11 − p12 ) p 22
0
.

De exemplu, P1 =  , , P2 =  ,  este o soluţie a jocului şi avem


1 1 1 1
2 2 2 2
F1 = F2 = 0 .

3. Stabilirea punctelor de echilibru ale jocului necooperativ

Soluţia problemei exemplului 1 din punctul precedent a fost obţinută printr-


un procedeu particular, în funcţie de elementele matricelor asociate jocului
respectiv şi nu printr-o metodă care să fie valabilă în cazul oricărui joc
necooperativ şi pentru orice soluţie a acestuia.

Pentru a rezolva jocul necooperativ, potrivit definiţiei 1 din presupunem că


am obţinut strategiile mixte Pi , i = 1, n şi scriem funcţiile de câştig Fi , în formă
matriceală Fi = Pi Φ Ti , unde Φ i = [Fi ,..., Fi ] este o matrice linie cu mi componente
egale cu Fi .

Reamintim că J i este un vector linie format din mi componente egale cu 1.


Astfel, având în vedere definiţia amintită rezultă că se poate scrie

Pi H i PiT = Pi Φ Ti ,

adică

( )
Pi H i PiT − Φ Ti = 0,

unde

Pi ≥ 0, i = 1, n şi H i Pi T − Φ Ti ≤ 0.

27
Dacă componenta j a vectorului H i PiT − Φ Ti ar fi pozitivă, atunci prin
înmulţirea la stânga cu vectorul Pi ∗ cu toate componentele egale cu 0, exceptând
componenta j egală cu 1, ar rezulta Fi ∗ = Pi ∗ H i PiT > Fi , contrar definiţiei 1 conform
căreia Fi este valoarea maximă a expresiei Pi ∗ H i PiT pentru Pi fixat.

Astfel raţionând, Pi fiind un vector linie de probabilităţi pis , i


0 ≤ pisi ≤ 1
pentru orice valori ale probabilităţilor, deci şi pentru soluţia problemei pentru care
avem maxim, maximul funcţiei de câştig Fi este atins (între altele) pentru o
strategie si pentru care

( )
H i s i0 Pi T = max
0
si
( )
H i si0 Pi T ,

unde si0 este o strategie oarecare. Aici cu H i (si )PiT , respectiv H i (si0 )PiT am notat
elementul cu indice de linie si , respectiv si0 al matricei H i PiT .

Introducând o matrice linie Ti cu variabile independente nenegative t is , si = 1, mi i

[ ]
Ti = t i1 ,..., t imi ,

pentru fiecae jucător i, se poate scrie o ecuaţie matriceală echivalentă cu inecuaţia

H i Pi T − Φ Ti ≤ 0 ; Φ Ti − H i PiT = TiT .

În concluzie rezultă următoarea teoremă:

Teorema 1. Determinarea punctelor de echilibru ale jocului necooperativ


constă în rezolvarea, în numere negative, a sistemului de ecuaţii multiliniare:

Pi J iT = 1, Φ Ti − H i PiT = TiT , Pi Ti T = 0,

unde i = 1, n .

Observaţia 1. Valorile reale necunoscute Fi se consideră scrise ca


diferenţă a două valori nenegative Fi , şi Fi ,, , Fi = Fi , - Fi ,, pentru a avea toate
necunoscutele nenegative.

Observaţia 2. Pentru rezolvarea problemei formulate in teorema 1 şi în


mod implicit pentru rezolvarea problemei formulate prin definiţia 1 din punctul
precedent se poate aplica orice metodă pentru rezolvarea sistemelor de ecuaţii-
inecuaţii de grad oarecare în numere negative. O metodă destul de eficientă este
metoda eliminării complete.
28
Observaţia 3. Având în vedere că determinarea punctelor de echilibru ale
unui joc necooperativ constă în rezolvarea sistem de ecuaţii multiliniare, teoria ce
se prezintă ar putea fi intitulată ,,teoria jocurilor multiliniare,,

Prin faptul că am descris metoda de rezolvare a oricărui joc necooperativ încă nu


rezultă că soluţia este efectivă şi nu este vidă. De aceea este importantă următoare
teoremă a lui Nash

Teorema 2. (J. Nash) Orice joc necooperativ are soluţia nevidă.

Nu vom da demonstraţia acestei teoreme din următoarele două motive în


primul rând pentru că se bazează pe cunoştinţe matematice care depăşesc cadrul
cursului şi în al doilea rând pentru că nu este constructivă ci existenţială.

Exemplul 1. Problema din exemplul 1. punctul precedent, conform


teoremei 1, este echivalentă cu problema rezolvării în numere nenegative,
P1 ≥ 0, P2 ≥ 0, T1 ≥ 0, T2 ≥ 0, a sistemului de ecuaţii multiliniare:

P1 J 1T = 1, Φ 1T − H 1 P1T = T1T P1T1T = 0,

P2 J 2T = 1, Φ T2 − H 2 P2T = T2T P2T2T = 0,

unde

P1 = [ p11 , p12 ], P2 = [ p 21 , p 22 ],
P1 = P2 , P2 = P1 ,
J 1 = J 2 = [1,1]
T1 = [t11 , t12 ], T2 = [t 21 , t 22 ],
 1 − 1 − 1 1 
H1 =   , H2 =  
− 1 1   1 − 1
[ ] [
Φ 1 = F1' − F1'' , F1' − F1'' , Φ 2 = F2' − F2'' , F2' − F2'' , ]
unde

F1' ≥ 0, F1'' ≥ 0, F2' ≥ 0, F2'' ≥ 0, F1' − F1'' = F1 , F2' − F2'' = F2 ,

sau, în formă dezvoltată şi reordonată:


p11 + p12 = 1, p 21 + p 22 = 1,
p 21 − p 22 − F1' + F1'' + t11 = 0
− p 21 + p 22 − F1''

29
− p11 + p12 − F2' + F2'' + t 21 = 0,
p11 − p12 − F2' + F2'' + t 22 = 0

p11t11 = 0, p12 t12 = 0, p 21t 21 = 0, p 22 t 22 = 0.

Rezolvând acest sistem prin metoda eliminării se obţine soluţia găsită cu ocazia
rezolvării problemei din exemplul 1, punctul 2. prin procedeul particular.

Observaţia 4. Având în vedere nenegativitatea necunoscutelor, avem


următoarele echivalenţe
p11t11 + p12 t12 = 0 ⇔ p11t11 = 0, p12 t12 = 0,

p 21t 21 + p 22 t 22 = 0 ⇔ p 21t 21 = 0, p 22 t 22 = 0,

Şi prin urmare ecuaţia Pi TiT = 0 poate fi înlocuită cu mi ecuaţii de forma


pisi t isi = 0, si = 1, mi oricare ar fi i, i = 1, n.

4. Stabilirea punctelor de echilibru ale jocului bimatriceal

Definiţia 1. Jocul necooperativ în cazul a doi jucători se numeşte joc


bimatriceal.

Un astfel de joc permite o rezolvare mai simplă. Problema formulată prin teorema
1 din punctul 4.3. având în vedere că P1 = P2 şi P2 = P1 poate fi descompusă în trei
subprobleme independente. Subproblema (1) constă în rezolvarea în numere
nenegative P2 a sistemului de ecuaţii liniare

 P2 J 2T = 1,
 T , (1)
Φ 1 − H 1 P2 = T1
T T

Subproblema (2) constă în rezolvarea în numere nenegative P1 a sistemului de


ecuaţii

 P1 J 1T = 1,
 T (2)
Φ 2 − H 2 P1 = T2
T T

ambele subprobleme rezolvându-se prin metoda simplex. Deoarece soluţia


generală se obţine ca o combinaţie liniara convexă a soluţiilor de bază, rezultă că
trebuie să selectăm acele soluţii de bază (P1 , P2 ) pentru care se verifică şi
subproblema (3) formată din sistemul de ecuaţii

30
P1T1T = 0 , P2T2T = 0.

Dacă pentru un indice s1 oarecare, 1 ≤ s1 ≤ m1 necunoscuta t1s intră în soluţia de bază 1

a subproblemei (1) şi pe deasupra t1s ≠ 0 ( t1s = 0 în caz de degenerare), atunci


1 1

p1s1 = 0

Deci pentru toate cazurile t1s ≠ 0 avem p1s = 0 şi la fel pentru t 2 s ≠ 0 rezultă
1 1 21

p 2 s21 = 0 proprietatea care permite stabilirea soluţiei care verifică sistemul (3).

Soluţia generală se obţine scriind combinaţia liniară convexă a tuturor


soluţiilor de bază P1 asociate unui P2 fixat şi combinaţia liniară convexă a tuturor
soluţiilor de bază P2 asociate unui P1 .

Exemplu 1. Problema din exemplul 1 punctul 3. se referă la un joc


bimatriceal. Cele trei sisteme sunt următoarele

 p 21 + p 22 = 1,

 p 21 − p 22 − F1 + F1 + t11 = 0
' ''
(1 ) '

 − p + p − F ' + F '' + t = 0
 21 22 1 1 12

 p11 + p12 = 1,

− p11 + p 22 − F2 + F2 + t 21 = 0
' ''
(2 ) '

 p − p − F ' + F '' + t = 0
 11 12 2 2 22

p11t11 = 0, p12 t12 = 0, p 21t 21 = 0, p 22 t 22 = 0. (3 )


'

Subproblemei (1' ) îi corespunde matricea simplex (linia funcţiei de optimizat


(pentru fixarea ideilor se consideră minimizată) este linia egală cu 0):

1 1 0 0 0 0 1
 1 −1 −1 1 1 0 0
S1 =  .
− 1 1 − 1 1 0 1 0
 
0 0 0 0 0 0 0

Obţinem următoarele soluţii de bază


1 1 
X 11 =  , , 0, 0, 0, 0, X 12 = [1, 0,1, 0, 0, 2], X 13 = [0,1,1, 0, 2, 0 ] Aici simbolul X s-a folosit
2 2 
pentru uniformizarea notaţiei necunoscutelor

x1 = p 21 , x 2 = p 22 , x3 = F1' , x 4 = F1'' , x5 = t11 , x6 = t12 .

31
Astfel de uniformizări vor fi folosite şi în continuare, ori de câte ori va fi necesar
fără nici o precizare specială.

Subproblema (2 ' ) are următoarea matrice simplex

1 1 0 0 0 0 1
− 1 1 − 1 1 1 0 0
S2 = 
 1 −1 −1 1 0 1 0
 
0 0 0 0 0 0 0

şi are soluţiile de bază

1 1 
X 21 =  , , 0, 0, 0, 0, X 22 = [1, 0,1, 0, 2, 0], X 23 = [0,1,1, 0, 0,2 ]
2 2 

Să notăm cu X ij' , i = 1,2; j = 1,3, vectorii care se obţin prin omiterea componentelor
Fi ' , Fi '' , i = 1,2. Obţinem:

1 1  1 1 
X 11' =  , , 0, 0, '
X 21 =  , , 0, 0,
2 2  2 2 

X 12' = [1, 0, 0, 2], '


X 22 = [1, 0, 2, 0],

X 13' = [0,1, 2, 0], '


X 23 = [0,1, 0, 2]. .

Pentru a stabili perechile de soluţii (X 1'i , X 2' j ) care să fie soluţii ale problemei
de joc bimatriceal, trebuie să fie îndeplinită condiţia t1s ≠ 0 ⇒ p1s = 0 şi 1 1

1 1 
t 2 s21 ≠ 0 ⇒ p 2 s21 = 0 Se constată că există o singură soluţie P1 = P2 =  ,  obţinută
2 2
pentru t11 = t12 = t 21 = t 22 = 0 şi F1' = F1'' = F2' = F2'' = 0 şi prin urmare F1 = F2 = 0 .

4. Stabilirea punctelor de echilibru ale jocului antagonist

Definiţia 1. Se numeşte joc antagonist jocul bimatriceal cu matricele


(bidimensionale) H 1 şi H 2 dacă H 1 + H 2T = 0 unde 0 este matricea nulă.

32
Având în vedere că orice egalitate este echivalentă cu două inegalităţi,
sistemele (1), (2) şi (3) din punctul 4. pot fi scrise în următoarea formă:

 H 1 P2T − Φ 1T ≤ 0

 − J 2 P2 ≤ −1
T
(4)
 J P T ≤ 1,
 2 2

 P1 H 1 − Φ 2 ≥ 0

 P1 J 1 ≥ 1
T
(5)
 − P J T ≥ −1,
 1 1

 P1 ( H 1 P2T − Φ 1T ) = 0

( P1 H 1 − Φ 2 ) P2 = 0
T
(6)

unde Φ1 conţine ca elemente una şi aceiaşi valoare F1 , iar Φ 2 conţine una şi aceiaşi
valoare − F2 ,

Din subproblema (6) rezultă P1Φ 1T = Φ 2 P2T deci − F2 = F1

Aceste valori pot fi considerate şi ca alori minimax (minumul unor valori maxime)
obţinute prin minimizarea funcţiei F1 , (maximul este infinit), respectiv maximin
(maximul unor valori minime) obţinute prin maximizarea funcţiei − F2 = F1
(minimul este infinit).

Adăugând sistemului (4) funcţia F1 = F1' − F1'' iar sistemului (5)


funcţia − F2 = − F2' + F2'' rezultă două probleme de programare liniară, una duala
celeilalte. Desigur se poate folosi notaţia simplificată F = F1 = − F2 şi considerăm că
se determină F = MIN prin sistemul (4) şi F = MAX prin sistemul (5). Astfel, cel
puţin o soluţie prticulară a jocului antagonist se poate obţine rezolvând numai unul
dintre sistemele (4) şi (5). Jocul antagonist poate avea însă, ca joc bimatriceal, şi
alte soluţii, rezultând din rezolvarea sistemului (1), (2) şi (3) din punctul 4.
punând − F2 = F1 = F Având în vedere simetria celor două sisteme (4) şi (5) şi
notând F = F1 = − F2 , rezultă următoarea teoremă cu privire la jocurile antagoniste
(teorema von Neumann-Morgenstern).

Teorema 1. Minimul în raport cu P2 al maximelor (minimax)


funcţiei F (P1 , P2 ) în raport cu P1 , pentru P2 fixat, este egal cu maximul în raport cu
P1 al minimelor (maximin) funcţiei F (P1 , P2 ) în raport cu P2 , pentru P1 fixat, deci

33
min max F (P1 , P2 ) = max min F (P1 , P2 ).
P2 P1 P1 P2

Observaţia 1. În cazul unui joc bimatriceal oarecare, ca o extindere a


condiţiei de la jocul antagonist, se poate formula întrebarea: pentru care soluţie
(P1 , P2 ) funcţia F1 + F2 ia valoarea minimă? Această formulare conduce la problema
considerării cooperţiei: când poate avea loc cooperare şi când nu? La jocul
antagonist F1 + F2 = 0.

Exemplul 1. Jocul bimatriceal din exemplul 1 al punctului 4.4. este un joc


antagonist. Deoarece are o singură soluţie, aceeaşi soluţie se obţine şi dacă se
minimizează funcţia F = F1 deci F = F1' − F1'' , în ipoteza utilizării la rezolvare a
sistemului (4), înlocuind linia formată numai din zerouri în matricea simplex S1 cu
linia funcţiei de minimizat [0, 0,1, − 1, 0, 0, 0,0] . Astfel se obţine matrice simplex

1 1 0 0 0 0 1
 1 −1 −1 1 1 0 0

− 1 1 − 1 1 0 1 0
 
 0 0 1 −1 0 0 0

care prin reducere conduce la aceeaşi soluţie P1 = P2 =  ,  , pentru care


1 1
2 2
F1' = F1'' = 0, deci FMIN = 0.

34
Unitatea 4

Aplicatii economice

Obiective:

a) studentii trebuie sa cunoasca etapele unui proces de modelare matematica


folosind jocurile

b) sa stie incadra o problema economica in una din categoriile de jocuri de


care ea apartine

c) sa-si insuseasca metodele de rezolvare directa si sa interpreteze rezultatele


gasite

Noţiuni cheie : jucator, decizie, duopol, oligopol, punct de echilibru

CONŢINUTUL UNITĂŢII

Aplicatii in economie

In cele ce urmeaza dam ceva aplicatii ale jocurilor in economic. Vom evalua
functia de castig pentru fiecare jucator, care va fi dependenta de strategiile
jucatorilor. Aici multimile strategiilor vor fi intervale ale axei reale.
1. Modelul Cournot al duopolului

Consideram o foarte simpla versiune a modelului lui Cournot. Fie q1 si q2 notate


cantitatile unui produs omogen, produse de firmele 1 si 2, respectiv. Fie
P(Q) = a − Q pretul care “curata” piata (the market-clearing price) cand cantitatea
agregata pe piata este Q = q1 + q2 . Deci avem
a − Q , Q < a
P(Q ) = 
 0 , Q≥a

Presupunem ca costul total al firmei i de producere a cantitatii qi este


C i (q i ) = cqi . Adica, nu exista costuri fixe si costul marginal este constant c , unde
vom considera ca c < a . Presupunem ca firmele isi aleg cantitatile lor simultan.
Mai inati vom translata problema intr-un joc “continuu”. Pentru aceasta vom
specifica: jucatorii din acest joc (cele doua firme), strategiile posibile pentru
fiecare jucator (diferitele cantitati ce le pot produce), castigurile pe care le vor
primi fiecare jucator pentru fiecare combinatie de strategii ce pot fi alese de
jucatori (castigul firmei este profitul sau). Vom presupune ca outputul este
35
continuuu divizibil si outputuri negayive nu pot fi. Astfel, spatiul strategiilor
fiecarei firme este Si = [0, ∞) , numerele reale nenegative, in care caz o tipica
strategie si este o cantitate aleasa, qi ≥ 0 . Deoarece P(Q ) = 0 pentru Q ≥ a , nici
o firma nu va produce o cantitate qi > a . Castigul firmei i , o functie de
strategiile alese de ea si de cealalta firma, profitul sau, poate fi scris ca
π i (qi , q j ) = qi [a − (qi + q j ) − c].

Cum stim, un punct de echilibru (echilibrul Nash) este perechea (q1∗ , q2∗ ) unde qi∗ ,
pentru fiecare firma i , rezolva problema de optimizare
max π i (qi , q ∗j ) = max qi [a − (qi + q ∗j ) − c].
0 ≤ qi < ∞ 0 ≤ qi < ∞

Presupunand q∗j < a − c (ceea ce va fi aratat ca este adevarat), conditia de primul


ordin pentru problema de optimizare a firmei i este necesar si suficient ca

qi =
1
2
(
a − q *j − c )

Astfel, daca perechea de cantitati (q1∗ , q2∗ ) este un echilibru Nash, cantitatile alese
ale firmelor trebuie sa satisfaca sistemul de ecuatii

q1 =
1
2
(
a − q 2* − c , ) q1 =
1
2
(a − q1* − c )

Rezolvand acest sistem de ecuatii obtinem q1* =q2* = (a-c)/2, care este intr-adevar
mai mic decat a − c , cum a fost presupus.
Intuitiv interpretarea acestui echilibru este simpla.
Fiecare firma va dori, desigur, sa fie un monopol in aceasta piata, in care caz ea va
vrea sa aleaga cantitatea qi care sa maximizeze π i (qi , 0) = qi (a − qi − c) , si in
consecinta ea va produce cantitatea monopolista qm =(a-c)/2 , si va obtine
profitul monopolistic π(qm ,0) = (a-c)2 /4.
Dandu-se ca exista doua firme, profitul agregat pentru duopol va fi maximizat prin
luarea cantitatii agregate q1 + q2 egala cu cantitatea monopolista qm , care va apare
daca qi =qm /2 pentru fiecare i , de exemplu. Problema cu acest aranjament este ca
fiecare firma are tendinta de a devia: deoareca cantitatea monopolista este mica,
pretul asociat P(qm ) este inalt, si la acest pret fiecrae firma va dori sa-si mareasca
a ei cantitate, in speta datorita faptului ca o asa crestere a productiei conduce la un
pret care curata piata mai mic. Sa vedem aceasta , folosim (48) sa aratam ca qm /2
nu exista un cel mai bun raspuns al firmei 2 la alegerea qm /2 a firmei 1. In

36
echilibrul Cournot, din contra, cantitatea agregata este mare, asa ca pretul asociat
este scazut, asa ca tentatia de a creste outputul este redusa.
Observatia 1.37.
O alta rezolvare, inafara de cea algebrica, pentru echilibrul Nash in jocul Cournot
se poate lua un procedeu grafic folosind cel mai bun raspuns pentru o firma:

R2 (q1 ) = (a − q1 − c ) -- cel mai bun raspuns al firmei 2, si


1
2

R1 (q 2 ) = (a − q 2 − c ) -- cel mai bun raspuns al firmei 1.


1
2

Un al treilea mod de a rezolva pentru un echilibru Nash este sa aplicam procedeul


de eliminare iterata a strategiilor strict dominate.

2. Modelul Bertrand al duopolului

Acest model al lui Bertrand este bazat pe faptul ca firmele acum isi aleg preturile,
altfel decat la modelul lui Cournot. Modelul lui Bertrand este un joc diferit decat
modelul jocului lui Cournot deoarece spatial strategiilor este diferit si functiile de
castig sunt diferite. Astfel obtinem un alt punct de echilibru, dar conceptual de
echilibru folosit este tot de echilibru Nash definit in sectiunile precedente.
Consideram cazul produselor diferentiate. Daca firmele 1 si 2 aleg preturile p1 and
p2 , respectiv, cantitatea ce consumatorii o cer de la firma i este

qi ( pi , p j ) = a − pi + bp j ,

unde b > 0 reflecta extinderea la care produsul firmei i este un substitut pentru
produsul firmei j. Aceasta o nerealista functie de cerere pentru ca cererea pentru
produl firmei i este positiva chiar cand firma i isi alege un pret arbitrar de inalt,
cu conditia ca firma j de asemenea isi alege un pret destul de inalt. Presupunem ca
sunt costuri de productie constante, ca sunt costurile marginale constante, la c ,
unde c < a , si ca firmele actioneaza simultan (isi aleg preturile lor). Translatam
problema economica intr-un joc necooperativ. Exista din nou doi jucatori. In acest
moment totusi, strategiile posibile la fiecare firma sunt preturile diferite care se pot
schimba, altfel decat diferitele cantitati ce se pot produce. Vom presupune ca
preturile negative nu sunt admisibile, dar ca orice pret nenegativ poate fi ales – nu
exista nici o restrictie la preturi determinate de monede. Astfel la fiecare firma
spatiul strategiilor poate fi din nou reprezentat ca Si = [0, ∞) , si o strategie tipica
si esste acum un pret, pi ≥ 0 .
37
Vom presupune din nou ca functia de castig pentru fircare firma este tocmai
profitul. Profitul firmei i cand este ales pretul pi si rivala sa alege pretul pj este

i p i, p j q i p i, p j pi c a pi bp j p i c.

Astfel, perechea de preturi ( p1∗ , p2∗ ) este un echilibru Nash daca, pentru fiecare
firma i , pi∗ rezolva problema
max π i ( pi , p∗j ) = max ( a − pi + bp∗j )( pi − c).
0 ≤ pi < ∞ 0 ≤ pi < ∞

Solutia la problema de optimizare a firmei i este

pi* =
1
2
(
a + b ⋅ p *j + c )

Deci, daca perechea de preturi ( p1∗ , p2∗ ) este sa fie un echilibru Nash, pretul ales de
firme trebuie sa satisfaca sistemul

p1* =
1
2
(
a + b ⋅ p 2* + c , ) p 2* =
1
2
(
a + b ⋅ p1* + c , )
Rezolvand acest sistem de ecuatii suntem condusi la
a+c
p1* = p 2* = .
2−b

Teme pentru verificarea cunoştinţelor

Exercitii si probleme rezolvate


1. Fie jocul de două persoane, cu suma nulă, cu matricea de câştig
9 3 1
6 5 8 
H1 = A = 
3 4 10
 
6 5 6

Care este matricea de câştig a jucătorului 2?

Câte strategii are primul respectiv al doilea jucător?

Soluţie. Matricea de câştig a jucătorului 2 este

 − 9 − 6 − 3 − 6
H 2 =  − 3 − 5 − 4 − 5 deoarece H 1 + H 2t = 0 .
 − 1 − 8 − 10 − 6

Jucătorul 1 are 4 strategii deoarece matricea A are 4 linii. Jucătorul 2 are 3 strategii deoarece matricea
A are 3 coloane.

38
2. Doi jucători scriu, independent , unul din numerele 1, 2 sau 3. Dacă ei au scris acelaşi număr
atunci jucătorul 1 plăteşte jucătorului 2 un număr de unităţi monetare egal cu numărul scris de
primul jucător. În caz contrar, jucătorul 2 plăteşte jucătorului 1 numărul de unităţi monetare egal
cu numărul pe care jucătorul 1 l-a scris. Care este matricea de câştig a acestui joc?
Soluţie. Este uşor de constatat că matricea de câştig a jucătorului 1 este:

− 1 1 1
A =  2 − 2 2 

 3 3 − 3

3. Care dintre jocurile precedente are punct şa în strategii pure?


Soluţie. Pentru primul joc avem:

v1 = max min aij = max (1,5,3,5) = 5,


1≤ i ≤ 4 1≤ j ≤ 3

v 2 = min max a ij = min (9,5,10 ) = 5,


1≤ j ≤ 3 1≤ i ≤ 4

Cum v1 = v 2 = 5 rezultă că primul joc are punct şa în strategii pure. Este usor de verificat că (2,2) şi
(4,2) sunt puncte şa în strategii pure deoarece a 22 = a 42 = 5.

Astfel i ∗ = 2, i ∗∗ = 4 sunt strategii optimale ale jucătorului 1 şi j ∗ = 2 este strategia optimală a


jucătorului 2.

Pentru al doilea joc avem:

v1 = max min a ij = max(− 1,−2,−3) = −1,


1≤ i ≤ 3 1≤ j ≤3

v 2 = min max aij = min (3,3,2 ) = 2,


1≤ j ≤ 3 1≤i ≤3

Astfel al doilea joc nu are punct şa în strategii pure deoarece v1 = −1 < 2 = v 2 .

4. Care sunt câştigurile aşteptate pentru jucătorul 1 din jocurile precedente?


Soluţie. Pentru primul joc, fie X = ( x1 , x 2 , x3 , x 4 ) şi Y = ( y1 , y 2 , y 3 ) strategiile mixte ale
jucătorilor 1 respectiv 2.

Atunci câştigul aşteptat al jucătorului 1 este:

4 3
X ⋅ A ⋅Y t = ∑ ∑a ij xi y j = 9 x1 y1 + 3 x1 y 2 + x1 y 3 + 6 x 2 y1 + 5 x 2 y 2 +
i =1 j =1

+ 8 x 2 y 3 + 3 x3 y1 + 4 x3 y 2 + 10 x3 y 3 + 6 x 4 y1 + 5 x 4 y 2 + 6 x 4 y 3 .

39
Pentru al doilea joc, fie X = ( x1 , x 2 , x3 ) şi Y = ( y1 , y 2 , y 3 ) strategiile mixte ale jucătorului 1,
respectiv 2. Atunci câştigul aşteptat al jucătorului 1 este:

3 3
X ⋅ A ⋅Y t = ∑ ∑a ij xi y j = − x1 y1 + x1 y 2 + x1 y 3 + 2 x 2 y1 − 2 x 2 y 2 +
i =1 j =1

+ 2 x 2 y 3 + 3 x3 y1 + 3 x3 y 2 − 3 x3 y 3 .

5. Folosind eliminarea iterată a strategiilor strict dominate rezolvaţi jocul cu matricea de câştig:
0 − 1 − 1
A = 1 0 − 1
1 1 0 

Soluţie. În matricea A, elementele primei linii sunt mai mici decât elementele corespunzătoare din
linia a 3-a. În consecinţă, jucătorul 1 niciodată nu va folosi prima sa strategie. Prima linie va fi
eliminată. Obţinem astfel matricea de câştig redusă:

1 0 − 1
A' =  
1 1 0 

Acum, în această matrice A' fiecare element al primei coloane este mai mare decât elementele
corespunzătoare ale coloanei a 3-a. În consecinţă jucătorul 2 nu va folosi niciodată prima sa strategie,
deci prima coloană poate fi eliminată. Aşa obţinem matricea redusă:

0 − 1
A' ' =  
1 0 

Similar obţinem succesiv:

A' ' ' = [1 0], A IV = [0].

Astfel strategiile optimale (pure) sunt X ∗ = (0,0,1), Y ∗ = (0,0,1) şi valoarea jocului este v = 0.
( )
Avem, desigur, un punct şa în strategii pure i ∗ , j ∗ = (3,3) deoarece a 33 = v = 0.

6. Găsiţi strategiile optimale ale jocurilor cu matricile de câştig:


2 0 1 2  1 − 1
a) A =   , b) A =   , c) A =  
1 3   2 0 − 1 1 

Soluţie. Acestea sunt jocuri matriciale 2 x 2. Astfel, putem folosi strategiile mixte
X ∗ = ( p,1 − p ), Y ∗ = (q,1 − q ) unde

d −c d −b ad − bc
p∗ = , q∗ = , v=
a+ d −b−c a + d −b−c a+d −b−c

a) Obţinem:
3 −1 1 3−0 3 2 ⋅ 3 − 0 ⋅1 3
p∗ = = , q∗ = = , v= = ,
2 + 3 − 0 −1 2 2 + 3 − 0 −1 4 2 + 3 − 0 −1 2

40
1 1 3 1 3
Deci X ∗ =  , , Y ∗ =  , , v = .
2 2 4 4 2

b) Avem:
0−2 2 0−2 2 2⋅0 − 2⋅2 4
p∗ = = , q∗ = = , v= = ,
1+ 0 − 2 − 2 3 1+ 0 − 2 − 2 3 1+ 0 − 2 − 2 3

 2 1  2 1 4
Deci X ∗ =  , , Y ∗ =  , , v = .
 3 3  3 3 3

c) Obţinem:

1 − (− 1) 1 1 1 ⋅ 1 − (− 1) ⋅ (− 1)
p∗ = = , q∗ = , v = = 0,
1 + 1 − (− 1) − (− 1) 2 2 4

1 1
Deci X ∗ = Y ∗ =  , , v = 0.
2 2

7. Rezolvaţi problema precedentă folosind metoda lui Williams.


Soluţie. Fie X = ( x1 , x 2 ), Y = ( y1 , y 2 ) strategiile mixte pentru jucătorii 1 si 2 respectiv. Sunt
x1 c−d y d −b
satisfăcute relaţiile x1 + x 2 = 1, = , y1 + y 2 = 1, 1 = (conform metodei lui
x2 a−b y2 c−a
Williams).

x1 1− 3 1
a) Obţinem x1 + x 2 = 1, = = 1, deci x1 = x 2 , x1 = x 2 = , respectiv
x2 2−0 2
y1 3 − 0 3 1
y1 + y 2 = 1, = = 3, deci 3 y 2 = y1 , y1 = , y 2 = .
y2 1 − 2 4 4
1 1 3 1
Astfel X ∗ =  , , Y ∗ =  ,  şi atunci
2 2 4 4

3 3
∗ ∗ ∗t  1 1  2 0  4   1 1   2  3
v = X ⋅ A⋅Y =  ,   ⋅   =  ,   =
 2 2  1 3  1   2 2   3  2
4 2

x1 2−0 2 1
b) Avem x1 + x 2 = 1, = = 2, deci x1 = 2 x 2 , x1 = , x 2 = , respectiv
x2 1 − 2 3 3
y1 0−2 2 1  2 1
y1 + y 2 = 1, = , y1 = , y 2 = . Astfel X ∗ = Y ∗ =  , , şi
y2 2 −1 3 3  3 3

2 2
 2 1  1 2  3   4 4   3  4
v∗ = X ∗ ⋅ A ⋅ Y ∗ =  ,     =  ,   =
t

 3 3  2 0  1   3 3   1  3
3 3

41
x1 −1−1 1
c) Avem x1 + x 2 = 1, = = 1 deci x1 = x 2 , x1 = x 2 = , respectiv
x 2 1 − (− 1) 2
y1 1 − (− 1) 1 1 1
y1 + y 2 = 1, = = 1, y1 = y 2 , y1 = y 2 = . Astfel X ∗ = Y ∗ =  , , şi
y2 −1−1 2 2 2
1 
∗  1 1   1 − 1  2 
v =  ,   ⋅   = 0.
 2 2  − 1 1   1 
2
8. Rezolvaţi problema 6 cu metoda grafică descrisă pentru jocurile matriceale de tip 2 × n respectiv
m×2 .
Soluţie. Fie X = ( x,1 − x ), y = ( y,1 − y ) respectiv, strategiile mixte pentru jucătorii 1 şi 2. Trasăm
liniile drepte ac, bd şi ab, cd respectiv în cele două figuri (sistemele de coordonate) în planele xOv
respectiv yOv. Apoi determinăm coordonatele punctelor de intersecţie ale acestor linii drepte.

 2 0
a) Matricea de câştig este A =  , astfel avem liniile drepte care unesc punctele de coordonate
1 3
(1,2), (0,1) respectiv (1,0), (0,3). Ecuaţiile acestor drepte sunt:
x −1 v − 2 x −1 v − 0
= respectiv =
0 −1 1− 2 0 −1 3 − 0

Sau

v = x + 1 respectiv v = −3 x + 3

1 3 1 1
Punctul de intersecţie are coordonatele: x = , v = . Astfel X ∗ =  , , este strategia optimală
2 2 2 2
3
a jucătorului 1 iar v = este valoarea jocului.Pentru strategia optimală a jucătorului 2 considerăm
2
liniile drepte ce unesc punctele de coordonate (1,2), (0,1) respectiv (1,1), (0,3). Ecuaţiile acestor
drepte sunt:

y −1 v − 2 y −1 v −1
= respectiv =
0 −1 0 − 2 0 −1 3 −1

Sau

v = 2 y respectiv v = −2 y + 3

3 3 3 1
Punctul de intersecţie are coordonatele y = , v = . Astfel Y ∗ =  ,  este strategia optimală a
4 2 4 4
3
jucătorului 2, iar v = este valoarea jocului.
2

42
2 2 4
b) Procedând ca şi în cazul punctului a) găsim valorile x = , y = , v = aşa încât strategiile
3 3 3
 2 1 4
optimale sunt X ∗ = Y ∗ =  ,  şi valoarea jocului este v = .
 3 3 3
1 1 1 1
c) Găsim valorile x = , y = , v = 0, deci X ∗ = Y ∗ =  ,  sunt strategiile optimale, iar
2 2 2 2
valoarea jocului este v = 0 .
9. Folosind metoda grafică, rezolvaţi jocurile matriceale cu matricele de câştig:
5 6 
2 9 6 3
a) A =  , b) A = 9 4
8 3 7 5 1 8 

Soluţie.

a) Fie X = ( x,1 − x ) o strategie mixtă a jucătorului 1. Liniile drepte ae; df; cg; dh; care unesc
punctele: (1,2), (0,8); (1,9), (0,3); (1,6), (0,7); (1,3), (0,5) au ecuaţiile:
x −1 v − 2 x −1 v − 9 x −1 v − 6 x −1 v − 3
= ; = ; = ; = .
0 −1 8 − 2 0 −1 3 − 9 0 −1 7 − 6 0 −1 5 − 3

Punctul de intersecţie ce corespunde maximului minimelor este determinat de dreptele care unesc
punctele (1,9), (0,3) respectiv (1,3), (0,5), adică

x −1 v − 9 x −1 v − 3
= respectiv = ,
0 −1 3 − 9 0 −1 5 − 3

sau v = −2 x + 5 respectiv v = 6 x + 3.

1 9
Coordonatele punctului de intersecţie (maximul minimelor) sunt x = ,v= .
4 2

1 3 9
Astfel X ∗ =  ,  este strategia optimală a jucătorului 1, iar valoarea jocului este v = .
4 4 2

Pentru strategia mixtă a jucătorului 2 avem Y = ( y1 , y 2 , y 3 , y 4 ) şi ea se va determina aşa încât


9
y1 + y 2 + y 3 + y 4 = 1 şi X ∗ ⋅ A ⋅ Y t = v = .
2

Ajungem la sistemul de ecuaţii liniare

 y1 + y 2 + y 3 + y 4 = 1

26 y1 + 18 y 2 + 27 y 3 + 18 y 4 = 18
 yj ≥ 0 j = 1,4

care are soluţia y1 = 0, y 3 = 0, y 2 = q, y 4 = 1 − q, q ∈ [0,1].

1  1 3
Se consideră că q = , deci strategia optimală a jucătorului 2 este Y ∗ =  0, ,0,  .
4  4 4

43
b) Fie Y = ( y,1 − y ) o strategie mixtă pentru jucătorul 2. Liniile drepte ab, cd, ef care unesc
punctele (1,5), (0,6); (1,9), (0,4); (1,1), (0,8) au ecuaţiile
y −1 v − 5 y −1 v − 9 y −1 v −1
= , = , = .
0 −1 6 − 5 0 −1 4 − 9 0 −1 8 −1

Punctul de intersecţie (minimul maximelor este acelaşi pentru oricare două drepte) se obţine din
sistemul de ecuaţii (format cu ultimele două, pentru minimul maximelor)

v = 5 y + 4, v = −7 y + 8.

1 17 1 2
Astfel avem y = , v= şi atunci Y ∗ =  ,  este strategia optimală pentru jucătorul al doilea
3 3 3 3
17
iar valoarea jocului este v = .
3

Strategia mixtă a jucătorului 1 are forma X = ( x1 , x 2 , x3 ) şi se determină aşa încât x1 + x 2 + x3 = 1


17
şi X ⋅ A ⋅ Y ∗ = v =
t
.
3

Ajungem la sistemul de ecuaţii liniare

 x1 + x 2 + x3 = 1

17 x1 + 17 x 2 + 17 x3 = 17
 xi ≥ 0 i = 1,3

 7 5
Se constată că strategia optimală a jucătorului 1 este X ∗ =  0, , .
 12 12 

10. Rezolvaţi jocul matriceal pentru care matricea de câştig este

6 0 3
A = 8 − 2 3.
4 6 5

Soluţie. Folosim metoda descrisă pentru jocurile matriceale de forma 3x3.

Pentru jucătorul 1, cu strategia mixtă (coordinate baricentrice) X = ( x1 , x 2 , x3 ) calculăm

X ⋅ A•1 = 6 x1 + 8 x 2 + 4 x3 , X ⋅ A•2 = −2 x 2 + 6 x3 , X ⋅ A•3 = 3 x1 + 3 x 2 + 5 x3 .

Ecuaţia liniei X ⋅ A•1 = X ⋅ A•2 este 6 x1 + 10 x 2 − 2 x3 = 0.

Dar x1 + x 2 + x3 = 1 aşa încât găsim 2 x1 + 6 x3 = 5.

Ecuaţia liniei X ⋅ A•2 = X ⋅ A•3 este − 2 x1 + 6 x3 = 3 x1 + 3 x 2 + 5 x3 , sau 3 x1 + 5 x 2 − x3 = 0, adică


2 x1 + 6 x3 = 5.
44
Ecuaţia liniei X ⋅ A•3 = X ⋅ A•1 este
3 x1 + 3 x 2 + 5 x3 = 6 x1 + 8 x 2 + 4 x3 , sau 3 x1 + 5 x 2 − x3 = 0, adică 2 x1 + 6 x3 = 5

Regiunea R1 , în care min X ⋅ A• j = X ⋅ A •1 se determină din inegalităţile X ⋅ A•1 ≤ X ⋅ A• 2


1≤ j ≤3

şi X ⋅ A•1 ≤ X ⋅ A•3 care ne dau 2 x1 + 6 x3 = 5.

 1 5 1 3
Astfel regiunea R1 , este delimitată de punctele  0, ,   ,0,  şi (0,0,1)
 6 6 4 4

14 9
Întrucât X ⋅ A•1  1 5
= , X ⋅ A•1 1 3
= , X ⋅ A•1 (0, 0 ,1) = 4 constatăm că valoarea maximă
 0, , 
 6 6
3  , 0, 
4 4
2
14 14
este , max = .
3 3

Regiunea R2 , în care min X ⋅ A⋅ j = X ⋅ A⋅2 se determină din inegalităţile X ⋅ A⋅2 ≤ X ⋅ A12


1≤ j ≤ 3

şi X ⋅ A⋅2 ≤ X ⋅ A⋅3 care ne dau 2 x1 + 6 x3 ≤ 5.

 1 5 1 3
Astfel regiunea R2 , este delimitată de punctele (1,0,0 ), (0,1,0 ),  0, , ,  ,0,  .
 6 6 4 4

14 9
Întrucât X ⋅ A⋅2 (1,0 , 0 ) = 0, X ⋅ A⋅2 (0,1, 0 ) = −2, X ⋅ A⋅2  1 5
= , X ⋅ A⋅2 1 3
= , constatăm
 0, , 
 6 6
3  ,0, 
4 4
2
14 14
că valoarea maximă este , max = .
3 3

Regiunea R3 , în care min X ⋅ A⋅ j = X ⋅ A⋅3 se determină din inegalităţile X ⋅ A⋅3 ≤ X ⋅ A⋅1


1≤ j ≤3

şi X ⋅ A⋅3 ≤ X ⋅ A⋅2 care ne dau 3 x1 + 5 x 2 + x3 = 0.

 1 5 1 3
Astfel regiunea R3 , este determinată de punctele  0, , ,  ,0, .
 6 6 4 4

14 9
Întrucât X ⋅ A⋅3  1 5
= , X ⋅ A⋅3 1 3
= , constatăm că valoarea maximă este
 0, , 
 6 6
3  ,0, 
4 4
2
14 14
, max = .
3 3

Acum valoare jocului v este dată de relaţia

v = max min X ⋅ A⋅ j = min  max X ⋅ A⋅1 , max X ⋅ A⋅2 , max X ⋅ A⋅3  =


X ∈S 3 1≤ j ≤ 3  X ∈S3 I R1 X ∈S 3 I R2 X ∈S 3 I R3 

45
14 14 14  14
= min  , ,  = .
3 3 3 3

 1 5
Strategia optimală a jucătorului 1, pentru care se obţine valoarea jucătorului este X ∗ =  0, , .
 6 6

Pentru jucătorul 2 fie Y = ( y1 , y 2 , y 3 ) o strategie mixtă. Calculăm

A1⋅Y t = 6 y1 + 3 y 3 , A2⋅Y t = 8 y1 − 2 y 2 + 3 y 3 , A3⋅Y t = 4 y1 + 6 y 2 + 5 y 3 .

Regiunea T1 , în care max Ai⋅Y t = A1⋅Y t , se determină din inegalităţile A1⋅Y t ≥ A2⋅Y t şi A1⋅Y t ≥ A2⋅Y t ,
1≤i ≤3

1
care ne dau y1 − y 2 ≤ 0 şi y1 − y 2 ≥ .
2

Întrucât aceste inegalităţi se contrazic rezultă că regiunea T1 , este mulţimea vidă, T1 = φ .

Regiunea T2 , în care max Ai⋅Y t = A2⋅Y t , se determină din inegalităţile A2⋅Y t ≥ A1⋅Y t şi
1≤i ≤ 3

1
A2⋅Y t ≥ A3⋅Y t , care ne dau y1 − y 2 ≥ 0 şi y1 − y 2 ≥ .
3

 2 1  1 1
. Regiunea T2 este delimitată de punctele (1,0,0 ),  , ,0 ,  ,0  .
1
Rămâne doar y1 − y 2 ≥
3  3 3   3 3

14 14
Întrucât A2⋅Y t (1, 0 ,0 ) = 8, A2⋅Y t 2 1 
= , A2⋅Y t  2 1
= , constatăm că valoarea minimă este
 , ,0 
3 3 
3  ,0, 
 3 3
3
14 14
, min = .
3 3

Regiunea T3 , în care max Ai⋅Y t = A3⋅Y t , se determină din inegalităţile A3⋅Y t ≥ A1⋅Y t şi A3⋅Y t ≥ A2⋅Y t ,
1≤i ≤ 3

1 1
care ne dau y1 − y 2 ≤ şi y1 − y 2 ≤ .
2 3

1
Rămâne doar y1 − y 2 ≤ .
3

2 1  1 2
Regiunea T3 este delimitată de punctele  , ,0 , (0,1,0 ), (0,0,1),  ,0, .
3 3  3 3

14 14
Întrucât A3⋅Y t 2 1 
= , A3⋅Y t (0 ,1, 0 ) = 6, A3⋅Y t (0 , 0,1) = 5, A3⋅Y t 1 2
= , constatăm că
 , ,0 
3 3 
3  , 0, 
3 3
3
14 14
valoarea minimă este , v= .
3 3

Acum valoarea jocului v este dată de relaţia

46
14 14  14
v = min max Ai⋅Y t = max  min Ai⋅Y t , min Ai⋅Y t , max Ai⋅Y t  = max  ,  = .
X ∈S3 1≤i ≤3 Y ∈S3 IT1 X ∈S 3 IT2 X ∈S3 IT3  3 3 3

2 1  1 2
Strategiile optimale ale jucătorului 2 sunt Y1∗ =  , ,0 , Y2∗ =  ,0,  . Astfel soluţia (strategia
3 3  3 3

optimală) pentru jucătorul 2 este Y ∗ = λY1∗ + (1 − λ )Y2∗ cu λ ∈ [0,1], iar valoarea jocului
14
v= .
3

11. Folosind programarea liniară, rezolvaţi jocurile cu matricile de câştig:


6 0 3 5
0 2
a) A =  , b) A = 8 − 2 3 9 
5 1   4 6 5 4

Soluţie. Considerăm problema de programare liniară

n
[max ]g = y1' + y 2' + ... + y n' ∑ aij y 'j ≤ 1, i = 1, m y 'j ≥ 0, i = 1, n.
j =1

a) Avem, în primul caz, problema


[max]g = y1' + y 2'
2 y 2' ≤ 1
5y + y
'
1
'
2 ≤ 1
'
y ,y
1
'
2 ≥ 0.

Matricea simplex ataşată este

0 2 1 0 1 
5 1 0 1 1 
 
1 1 0 0 0

asupra căreia aplicăm ARS. Obţinem succesiv

   1 1 
 0 1 0
0 2 1 0 1  2 2 
 1 1 1   1 1 1 
1 0  → 1 0 − 
 5 5 5   10 5 10 
0 4
0 −
1

1  0 0 −
2

1
− 
3
 5 5 
5 
 5 5 5 

3 1 5 1 1
Astfel g max = = , deci w = şi y1' = deci y1 = w ⋅ y1' = ,
5 w 3 10 6

1 5
y 2' = , deci y 2 = .
2 6

47
În plus y 3' = y 4' = 0, deci y 3 = y 4 = 0.

2 2 1 1
De asemenea x1' = aşa încât x1 = w ⋅ x1' = , x 2' = , deci x 2 =
5 3 5 3

 2 1 1 5
În concluzie strategiile optimale ale celor doi jucători sunt X ∗ =  , , Y ∗ =  , , iar valoarea
 3 3 6 6
5
jocului este w = v = .
3

a) În cazul al doilea problema de programare liniară este:


[max ]g = y1' + y 2' + y 3' + y 4'
6 y1' + 3 y 3' + 5 y 4' ≤ 1
8 y1' + 2 y 2' + 3 y 3' + 9 y 4' ≤ 1
4 y1' + 6 y 2' + 5 y 3' + 4 y 4' ≤ 1
y 'j ≥ 0 , j = 1,4

pentru care matricea simplex este

6 0 3 5 1 0 0 1
8 − 2 3 9 0 1 0 1 
 .
4 6 5 4 0 0 1 1
 
1 1 1 1 0 0 0 0

Aplicând algoritmul reducerii simplex (ARS) obţinem succesiv

 3 3 7 3 1   23 9 3 1 
0 2 − 1 − 0 0 0 0 − 1 − −
4 4 4 4  14 14 14 7 
 1 3 9 1 1   1 31 3 1 1 
1 − 0 0  1 0 0 
 4 8 8 8 8 → 2 14 28 28 7 
0 7 7

1
0 −
1
1
1  0 1
1

1
0 −
1 1 1 
 2 2 2 2   2 14 14 7 14 
 5 5 1 1 1  1 1 5 3
0 − 0 − 0 −  0 0 0 − 0 − − − 
 4 8 8 8 8  28 28 28 14 

3 1 14
Astfel avem g max = = , deci w = respectiv
14 w 3
1 1 1
y1, = , y 2, = , y 3, = 0, y 4, = 0, y 5, = , y 6, = 0, y 7, = 0, aşa încât:
7 14 7

2 1 2
y1 = w ⋅ y1, = , y 2 = , y 3 = 0, y 4 = 0, y 5 = , y 6 = 0, y 7 = 0. În concluzie o strategie optimală
3 3 3
2 1  14
a jucătorului 2 este Y ∗ =  , ,0,0 , iar valoarea jocului este w = v = . De asemenea avem
3 3  3

48
1 5 1
x1, = 0, x 2, = , x3, = , x 4, = 0, x5, = 0, x6, = 0, x7, = , aşa încât
28 28 28
1 5 1
x1 = w ⋅ x1, = 0, x 2 = , x3 = , x 4 = 0, x5 = 0, x6 = 0, x7 = . Strategia optimală a jucătorului 1
6 6 6
 1 5
este X ∗ =  0, , . Observăm că există şi o altă soluţie pentru că în ultima linie a matricei precedente
 6 6
este un element egal cu 0 într-o coloană neredusă. Obţinem

 23 9 3 1 
0 0 0 − 1 − −
14 14 14 7 
 16 5 3 1 
1 − 1 0 0 − 
 7 28 28 14 
0 2 1 −
1
0 −
1 2 1 
 7 7 7 7 
 1 1 5 3
0 0 0 − 0 − − − 
 28 28 28 14 

1 1 1
Astfel y1, = , y 2, = 0, y 3, = , y 4, = 0, y 5, = , y 6, = 0, y 7, = 0, deci
14 7 7

1 2 2
y1 = , y 2 = 0, y 3 = , y 4 = 0, y 5 = , y 6 = 0, y 7 = 0.
3 3 3

∗ 1 2 
O altă soluţie (strategie optimală) pentru jucătorul 2 este Y2 =  ,0, ,0 .
3 3 

În concluzie, strategia optimală generală a jucătorului 2 este

Y ∗ = λY1∗ + (1 − λ )Y2∗ , λ ∈ [0,1], iar valoarea jocului este v =


14
.
3

12. Matricea de câştig în reprezentare generală

Trei firme utilizează, cu scop tehnologic, apa dintr-un acelaşi rezervor. Fiecare firmă are la dispoziţie
două strategii: îşi construieşte staţie de purificare (strategia 1) sau foloseşte apa nepurificată (strategia 2).
Se ştie că dacă cel mult o firma foloseşte apa nepurificată atunci apa din rezervor este bună şi nu apar
cheltuieli. Dacă, însă, cel puţin două firme folosesc apa nepurificată atunci fiecare firmă pierde 3 unităţi
monetare. Construirea staţiei de purificare costă o unitate monetară. Scrieţi matricele de câştig pentru
acest joc.

Soluţie. Având în vedere anunţul constatăm că este un joc de 3 ,,persoane” la care fiecare ,,jucător” are 2
strategii. Deci n = 3, m1 = m 2 = m3 = 2. Numărul situaţiilor jocului este m1 ⋅ m2 ⋅ m3 = 8 , iar
câştigurile jucătorilor sunt reprezentate în următorul tabel (reprezentare generală):

49
Situaţii Câştiguri

s1 s2 s3 H1(s) H2(s) H3(s)

1 1 1 -1 -1 -1

1 1 2 -1 -1 0

1 2 1 -1 0 -1

1 2 2 -4 -3 -3

2 1 1 0 -1 -1

2 1 2 -3 -4 -3

2 2 1 -3 -3 -4

2 2 2 -3 -3 -3

Valorile ,,câştigurilor au fost calculate având în vedere enunţul. Spre exemplu, în situaţia (1,2,2), firmele
2 şi 3 folosesc apa nepurificată deci (cum sunt două) fiecare firmă pierde 3 unităţi monetare. Firma 1,
însă, îşi construieşte staţie de purificare, deci mai cheltuieşte o unitate monetară, deci, ,,câştigul” ei este -
4.

13. Matricea de câştig în reprezentare bidimensională

Două fabrici produc acelaşi tip de produs A, respectiv B, în două sortimente A1 şi A2 respectiv
B1 şi B2 . Produsele sunt interschimbabile. În urma unui test, făcut în avans, s-a constatat că preferinţele
cumpărătorilor, exprimate în procente, sunt reprezentate în următorul tabel

A B1 B2

A1 40 90

A2 70 20

Precizăm că precedentele date se referă la prima fabrică (primul produs), în timp ce precedentele pentru a
doua fabrică (al doilea produs) sunt completare faţă de procentul de 100%. Scrieti matricele de câştig
pentru acest joc.

Soluţie. Sunt 2 jucători (fabricile) şi fiecare are câte 2 strategii (posibilităţi, sortimente). Din enunţ se
constată că sunt precizate în tabelul cu cu punctele chiar ,,câştigurile” primului ,,jucotor”. Astfel într-o
reprezentare generală (tabelară) matricile de câştig pentru cei doi jucători pot fi scrise în tabelul:

50
Situaţii Câştiguri

s1 s2 H1(s) H2(s)

1 1 40 60

1 2 90 10

2 1 70 30

2 2 20 80

În acest caz (pentru că sunt doar doi jucători) se poate utiliza şi reprezentarea bi-matriceală (obişnuită)
pentru matricele de câştig. Astfel avem:

40 90  60 30


H1 =  , H2 =  
70 20 10 80
14. Rezolvarea jocului bimatriceal

Reconsiderăm problema precedentă cu următoarele modificări în condiţiile privind cumpărarea: se ştie că


50% din cei care cumpără produsul A2 vor cumpăra şi produsul B2 respectiv se ştie că 50% din cei care
cumpără produsul B2 vor cumpăra şi produsul A2. Exprimând vânzările în valori absolute considerând
1000 de unităţi vândute şi păstrând celelalte consideraţii din enunţul problemei precedente, se cere:

a) scrieţi matricele de câştig

b) rezolvaţi jocul bimatriceal necooperativ.

Soluţie. Se păstrează datele privind jucătorii şi stagiile (,,mutările”) de la problema precedentă. Sunt
modificări doar la valorile ,,câştigurilor”.

a) Se obţine tabelul cu reprezentarea generală a matricelor de câştig

Situaţii Câştiguri

s1 s2 H1(s) H2(s)

1 1 400 600

1 2 900 100

2 1 700 300

2 2 600 900

Se consideră că modificările ,,esenţiale” sunt doar la situaţia (2,2) (în rest sunt datele de la problema
precedentă la care procentele (100%) au fost înlocuite cu unităţile vândute (1000)), care au fost calculate
conform relaţiilor

51
1 1
200 + ⋅ 800 = 600, 800 + ⋅ 200 = 900.
2 2

În scrierea bi-matriceală avem matricile de câştig:

400 900 600 300


H1 =  , H2 =  
700 600 100 900

b) Întrucât

1000 1000
H1 + H 2 = 
t

1000 1500

deci nu este o matrice cu toate elementele egale (sumă constantă) jocul din această problemă este un joc
bi-matriceal (nu este antagonist). Pentru a-l rezolva trebuie să găsim toate soluţiile admisibile de bază
pentru două sisteme de ecuaţii liniare, iar apoi se vor păstra doar perechile de soluţii care verifică şi al
treilea sistem de ecuaţii.

Primul sistem este:

 p 21 + p 22 =1

400 p 21 + 900 p 22 − F1 + F1 + t11 =0
' ''

700 p + 600 p − F ' + F '' + t =0


 21 22 1 1 12

pentru care avem succesiv:

 1 1 1 1 
 0 − 0 − 1
 1 1 0 0 0 0 1

7 700 700 700

400 900 − 1 1 1 0 0 → 0 3900 −
3 3
1 −
4
0 →
   7 7 7 7 
700 600 − 1 1 0 1 0 1 0
6 1 1 1
 − 0
7 700 700 700 

 1 5 
 0 0 1 −1 − − 650
0 100 1 − 1 0 − 1 700 
6 6
  1 1 1 
→ 0 600 0 0 1 − 1 300 → 0 1 0 0 − →
 600 600 2 
1 1 0 0 0 0 1  1 0 0 0 − 1 1 1 
 600 600 2 

500 0 1 − 1 − 1 0 900
→  1 1 0 0 0 0 1 .
600 0 0 0 − 1 1 300

Se constată că avem trei soluţii admisibile de bază:

52
Ι p 21 = 1, p 22 = 0, F1' = 700, F1'' = 0, t11 = 300, t12 = 0,
1 1
ΙΙ p 21 = , p 22 = , F1' = 650, F1'' = 0, t11 = 0, t12 = 0
2 2
ΙΙΙ p 21 = 0, p 22 = 1 F1' = 900, F1'' = 0 t11 = 0, t12 = 300.

Al doilea sistem este

 p 21 + p 22 =1

600 p11 + 300 p12 − F2 + F2 + t 21 =0
' ''

100 p + 900 p − F ' + F '' + t =0


 11 12 2 2 22

Pentru care avem succesiv

 1 1 1 1 
 0 − − 0 1
 1 1 0 0 0 0 1

2 600 600 600

600 300 − 1 1 1 0 0 → 1 1

1 1 1
0 0 →
   2 600 600 600 
100 900 − 1 1 0 1 0 0 1700 1 0
5 5 1
 − −
2 6 6 6 

 8 3 5100 
 0 0 1 −1 − −
0 300 1 − 1 − 1 0 600 11 11 11 
 6 

→ 1 1 0 0 
0 0 1  → 1 0 0 0
1

1
→
 1100 1100 11 
0 1100 0 0 − 1 1 500 0 1 0 0 − 1 1 5 
 1100 1100 11 

 800 0 1 − 1 0 − 1 900
→ 1100 0 0 0 1 − 1 600.
 1 1 0 0 0 0 1 

Şi acum, în acest caz, sunt trei soluţii admisibile de bază:

1. p11 = 1, p12 = 0, F2' = 600, F2'' = 0, t 21 = 0, t 22 = 500,


6 5 5100
2. p11 = , p12 = , F2' = , F2'' = 0, t 21 = 0, t 22 = 0
11 11 11
3. p11 = 0, p12 = 1 F2' = 900, F2'' = 0 t 21 = 600, t 22 = 0.

Ultimul sistem de ecuaţii este de forma

pisi ⋅ t isi = 0, i = 1,2, s i = 1,2,

deci produsul dintre un ,,p”, şi un ,,t” cu aceeaşi indici trebuie sa fie 0 (zero).

Testând toate cele 9 combinaţii posibile (fiecare cu fiecare) constatăm că doar soluţiile (combinaţiile) (2,
II) satisfac acest ultim sistem. Întradevăr

6 5 1 1
p11 ⋅ t11 = ⋅ 0 = 0, p12 ⋅ t12 = ⋅ 0 = 0, p 21 ⋅ t 21 = ⋅ 0 = 0, p 22 ⋅ t 22 = ⋅ 0 = 0.
11 11 2 2

53
Nici o alta combinaţie (din cele 8 rămase) nu se poate accepta pentru ca măcar o ecuaţie din ultimul
sistem nu este verificată. Spre exemplu combinaţia (3, I) nu convine pentru că deşi

p11 ⋅ t11 = 0 ⋅ 300 = 0, p12 ⋅ t12 = 1 ⋅ 0 = 0, p 22 ⋅ t 22 = 1 ⋅ 0 = 0.

totuşi p 21 ⋅ t 21 = 1 ⋅ 600 ≠ 0.

În concluzie unica soluţie (care verifică toate cele trei sisteme) este:

6 5 1 1 5100
p11 = , p12 = , p 21 = , p 22 = , F1, = 650, F1,, = 0, F2, = , F2,, = 0,
11 11 2 2 11

t11 = t12 = t 21 = t 22 = 0.

6 5
Astfel strategia optimală a jucatorului 1 este P1 =  , , cu caştigul

11 11 

1 1
F1 = F1, − F1,, = 650, iar strategia optimală a jucătorului 2 este P2 =  ,  cu caştigul
2 2

5100
F2 = F2, − F2,, = .
11

15. Rezolvarea jocului antagonist

Reconsiderăm jocul de la problema 13. Se cere:

a) Rezolvaţi jocul.

b) Scrieţi matricele de structură.

Soluţie. Matricele de câştig sunt:

40 90  60 30


H1 =  , H2 =  
70 20 10 80

şi cum

100 100
H1 + H 2 = 
t
 jocul este antagonist cu suma constantă 100.
100 100

a) Pentru a rezolva un astfel de joc este nevoie să rezolvăm problema de programare liniară
corespunzătoare. În cazul de faţă avem

54

 p 21 + p 22 =1

 40 p 21 + 90 p 22 − F1 + F1 + t11 =0
' ''

70 p 21 + 20 p 22 − F1' + F1'' + t12 =0



 F = F1' − F1'' → min .

Utilizăm pentru rezolvare ARS şi atunci putem scrie succesiv:

1 1 0 0 0 0 1 1 1 0 0 0 0 1
40 90 − 1 1 
1 0 0 40 90 − 1 1 1 0 0
 → →
70 20 − 1 1 0 1 0 70 20 − 1 1 0 1 0
   
 0 0 1 −1 0 0 0 1 1 0 0 0 0 1

 5 1 1 1 
0 7 − 0 − 1
70 70 70
 550 3 3 4  0 50 1 − 1 0 − 1 70
0 − 1 − 0 0 100 0 0 1 − 1 30
→ 7 7 7 7 → →
1 1 1 0 0 0 0 1
0
2 1 1 1
 − 0  
7 70 70 70
 5 1 1 1  0 0 0 0 0 0 0
0 − 0 − 1
 7 70 70 70 

0 50 1 − 1 0 − 1 70 0 50 1 −1 0 −1 70 
0 100 0 0 
1 − 1 30 0 100 0 0 1 − 1 30 
→ → →
1 1 0 0 0 0 1 1 1 0 0 0 0 1 
   
0 0 1 − 1 0 0 0 0 − 50 0 0 0 1 − 70

 1 1   1 1 
0 0 1 −1 − − 65  0 0 1 −1 − − 65 
2 2 2 2
 1 1 3  1 1 3
0 1 0 0 −  0 1 0 0 − 
→ 100 100 10  →  100 100 10  →
1 0 0 0 −
1 1 7 1 0 0 0 −
1 1 7
 100 100 10   100 100 10 
0 0 0 0 0 0 0  0 0 1 −1 0 0 0 

 1 1 
0 0 1 −1 − − 65 
2 2
 1 1 3 
0 1 0 0 − 
→ 100 100 10 .
1 0 0 0 −
1 1 7 
 100 100 10 
 1 1 
0 0 0 0 − 65
 2 2 

Astfel avem soluţia (unică)

55
7 3
p 21 = , p 22 = , F1' = 65, F1'' = 0, t11 = 0, t12 = 0.
10 10

Problema duală (pentru primul jucător) are soluţia (citibilă tot din ultima matrice)

1 1 1 1
p11 = , p12 = . Deci P1 =  ,  este strategia optimală a primului jucător, care va obţine câştigul
2 2 2 2
7 3
maxim F1 = 65, iar strategia optimală a jucătorului 2 este P2 =  ,  care va obţine câştigul
10 10 
maxim F2 = 65.

b) Matricele de structură (care reflectă împărţirea câştigurilor pe jucători, corespunzător deciziilor alese)
sunt date în următoarele tabele

B B1 B2

∑ A
= A1 14 13,5 27,5

A2 24,5 3 27,5

38,5 16,5 55

A A1 A2

∑ B
= B1 21 10,5 31,5

B2 1,5 12 13,5

22,5 22,5 45

Elementele din matricele de structură constituie termenii rezultaţi ca urmare a exprimării funcţiilor de
câştig. Astfel în prima matrice au fost trecuţi termenii lui

1
7 3  40 90   2 
F1 = P1 ⋅ H 1 ⋅ P = P1 ⋅ H 1 ⋅ P = 
t t
  
10 10  70 20  1 
1 2

2

după cum urmează:

⋅ 40 ⋅ = ( p11 ⋅ h11 ⋅ p 22 ), 13,5 = ⋅ 90 ⋅ = ( p12 ⋅ h12 ⋅ p 21 ),


7 1 3 1
14 =
10 2 10 2
56
⋅ 70 ⋅ = ( p11 ⋅ h21 ⋅ p 22 ), 3 = ⋅ 20 ⋅ = ( p12 ⋅ h22 ⋅ p 22 ). Apoi, pe ultima coloană, sunt
7 1 3 1
24,5 =
10 2 10 2
trecute sumele elementelor de pe liniile corespunzătoare, iar pe ultima linie sunt trecute sumele de pe
coloanele corespunzătoare. Tabelul (de 55) reprezintă câştigul final (maxim) al jucătorului 1. Într-un mod
cu totul analog se obţin elementele matricei de structură pentru al doilea jucător pornind de la

7
1 1  60 30 10 
F2 = P2 ⋅ H 2 ⋅ P2t = P2 ⋅ H 2 ⋅ P1t =   
2 2  10 80  3 
10 

De altfel situaţia sintetică, exprimată în procente, asupra structurii tipurilor de produse, este următoarea:

A1 : 27,5%, A2 : 27,5%, B1 : 31,5%, B2 : 13,5%.

Asta în condiţia că producţia ambelor fabrici este 100%. Datorită antagonicităţii pieţei, a doua fabrică
realizează o vânzare mai mică decât prima, care este de 45%.

16. Considerăm problema 15 în ipoteza că a doua fabrică, la momentul când îşi alege strategia sa,
cunoaţte strategia aplicată de prima fabrică. Se cere:

a) Scrieţi matricele de câştig ale acestui nou joc.

b) Rezolvaţi jocul.

c) Comparaţi rezultatul obţinut cu cel anterior şi interpretaţi diferenţa dintre ele.

Soluţie. a) Faţă de problema anterioară (15) acum al doilea jucător are o informaţie suplimentară: ştie
ce strategie a ales primul jucător. În consecinţă se va modifica matricea de câştig a jucătorului 1, deoarece
jucătorul 2 poate aplica alte două strategii obţinute prin combinarea strategiilor sale B1 şi B2 , după
cum urmează:

strategia B1 , ca răspuns la strategia A1 ,

strategia B1 , ca răspuns la strategia A2 ,

strategia B2 , ca răspuns la strategia A1 ,

strategia B2 , ca răspuns la strategia A2 .

Astfel avem matricea de câştig a jucătorului 1 dată de tabelul

57
B B1 B1 B2 B2

A B1 B2 B1 B2

B1 40 40 90 90

B2 70 20 70 20

Acum P2 va fi de forma P2 = [ p 21 , p 22 , p 23 , p 24 ], iar P1 = [ p11 , p12 ,].

a) Pentru rezolvare, observăm mai întâi că strategia a treia este dominantă aşa încât poate fi
eliminată, deci p 23 = 0 şi atunci problema de programari liniară ce trebuie rezolvată este


 p 21 + p 22 + p 24 =1

 40 p 21 + 40 p 22 + 90 p 24 − F1 + F1 + t11 =0
' ''

70 p 21 + 20 p 22 + 20 p 24 − F1' + F1'' + t12 =0



 F = F1' − F1'' → min .

Avem succesiv

1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1
40 40 90 − 1 1 1 0 0 40 40 90 − 1 1 1 0 0
 →  →
70 20 20 − 1 1 0 1 0 70 20 20 − 1 1 0 1 0
   
 0 0 0 1 −1 0 0 0 1 1 1 0 0 0 0 1

 5 5 1 1 1 
0 − 0 − 1
7 7 70 70 70
 200 550 3 3 4  0 50 50 1 − 1 0 − 1 70
0 − 1 − 0 0 50 100 0 0 1 − 1 30 
 7 7 7 7 7 →  →
1 1 1 0 0 1
0
2 2 1 1 1 1 0 0
 − 0  
7 7 70 70 70
 5 5 1 1 1  0 0 0 0 0 0 0 0
0 − 0 1
 7 7 70 70 70 

0 50 50 1 − 1 0 − 1 70 0 50 50 1 −1 0 −1 70 
0 50 100 0 0 
1 − 1 30  0 50 100 0 0 1 − 1 30 
→ → →
1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 
   
0 0 0 1 −1 0 0 0 0 − 50 − 50 0 0 0 1 − 70

58
 1 1 
0 25 0 1 −1 − 55 
2 2
 1 1 1 3 
0 1 0 0 − 
→ 2 100 100 10  →
1 1
0 0 0 −
1 1 7 
 2 100 100 10 
 1 1 
0 − 25 0 0 0 − 55
 2 2 
0 0 − 50 1 −1 −1 1 40 
 1 1 3 
0 1 2 0 0 −
→ 50 50 5 .
1 1 2 
1 0 −1 0 0 − 
 50 50 5 
0 0 50 0 0 1 0 − 40

2 3
Soluţia optimă este p 21 = , p 22 = , p 24 = 0, F1' = 40, F1'' = 0, t11 = 0, t12 = 0, deci
5 5
2 3 
P2' =  , ,0 este o strategie optimală a jucătorului 2. Se constată că mai există şi o altă soluţie,
5 5 
conform matricei

− 50 0 0 1 −1 0 0 20 
 1 1 1 0 0 0 0 1 
 ,
 50 0 − 50 0 0 − 1 1 20 
 
 0 0 50 0 0 1 0 − 40

2 3
deci p 21 = , p 22 = , p 24 = 0, F1' = 40, F1'' = 0, t11 = 0, t12 = 20.
5 5

Astfel o altă strategie optimală a jucătorului 2 este P2'' = [0,1,0].

În concluzie, ţinând cont şi de faptul că p 23 = 0, soluţia generală (strategia optimală a jucătorului 2) este

2 3 
P2 = λ1 P2' + λ2 P2'' = λ1  , ,0,0 + λ 2 [0,1,0,0], cu λ1λ2 ∈ [0,1] λ1 + λ 2 = 1 iar valoarea maximă a lui
5 5 
F1 este F1 = F1' − F1'' = 40, cu P1 = [1,0].

b) Compararea rezultatelor ne evidenţiază matricele de structură (simplificate necompletate unde


sunt zerouri)

59
B B1 B1

A B1 B2

∑ A
= A1 16λ2 40λ1+24λ2 40

16λ2 40λ1+24λ2 40

A A1

∑ B
= B1 B1 24λ2 24λ2

B1 B2 60λ1+36λ2 60λ1+36λ2

60 60

Constatăm o descreştere cu 15% pentru prima fabrică, ceea ce dă o creştere cu 15% pentru fabrica a doua.
Aceasta se datorează informaţiei suplimentare pe care a avut-o fabrica a doua. Mai putem spune că prima
fabrică va face 40% din sortimentul A1 iar a doua fabrică va face numai sortimentul B1, în total de 60%
(cu împărţirea: 24λ2% datorită ,,strategiei” B1: B1 şi (60λ1+36λ2) % datorită ,,strategiei” B1: B2, cu
λ1λ 2 ∈ [0,1], λ1 + λ2 = 1 ).

60
TEME DE CONTROL

1. Fie un joc de două persoane cu suma nulă dat cu matricea de câştig

 3 6 9 6
H 1 = A = 10 6 1 8
 4 5 3 5

Care este matricea de câştig a jucătorului 2? Câte strategii are jucătorul 1, respectiv jucătorul 2?

2. (Jocul Morra). Doi jucători arată simultan unul sau două degete de la mâna stângă şi în acelaşi timp
spun numărul de degete pe care ei cred că îl va arăta oponentul.Dacă un din jucător nimereşte numărul de
degete arătat de oponent, el primeşte aşa de multe unităţi monetare cât este numărul de degete pe care le-
au arătat împreună. Dacă ambii jucători nimeresc sau niciunul nu nimereşte atunci niciunul nu primeşte
nimic. Care este matricea de câştig a acestui joc?

3. Care dintre jocurile problemelor precedente au puncte şa în strategii pure?

4. Să se exprime câştigurile aşteptate de către jucătorul 1 în cazurile jocurilor precedente.

5. Folosind eliminarea iterată a strategiilor dominante rezolvaţi jocul cu matricea de câştig

1 − 1 − 2 0
3 0 2 4
A=
4 5 1 5
 
2 3 − 1 3

6. Găsiţi strategiile optimale şi valoarea jocului (cu relaţiile de calcul) pentru jocurile cu următoarele
matrice de câştig:

2 3 6 − 1  2 4
a) A =   ; b) A =   ; c) A =  .
5 2  4 5  3 1

7. Rezolvaţi problema 6 cu metoda Williams.

8. Rezolvaţi problema 6 cu metoda grafică pentru jocurile de tip 2 x n şi m x 2.

9. Folosind metoda grafică, rezolvaţi jocurile cu următoarele matrice de câştig:

61
2 4
3 1 
 2 1 4
a) A= , b) A = 
3 5 1  1 6
 
5 0

10. Folosind coordonatele boricentrice rezolvaţi jocul cu matricea de câştig:

 1 − 1 − 2
A = − 1 1 1 
 2 − 1 0 

11. Folosind programarea liniară rezolvaţi jocurile cu următoarele matrice de câştig:

2 3 0  7 5 6

a) A = − 1 8 − 3 ,
 
b) A = 0 9 4 .

   
 0 − 1 2  14 1 8 

12. O firmă produce trei tipuri de produse P1 , P2 , P3 , folosind trei tipuri de materiale M 1 , M 2 , M 3 .

Cheltuielile cu materialele încorporate în câte o unitate de produs sunt date în tabelul:

M P1 P2 P3

M1 4 4 6

M2 3 5 3

M3 5 2 4

Scrieţi matricele de câştig în reprezentare generală.

13. Două ramuri economice au de făcut investiţii în 4 obiective. Strategia cu codul i constă în a finanţa

obiectivul i, i = 1,4. Ca urmare a tuturor analizelor făcute s-a constatat că, pentru prima ramură,
câştigurile sunt date de matricea:

0 1 −1 2
− 1 0 3 2 
A=
0 1 2 − 1
 
2 0 0 0

Se presupune că fiecare ramură îşi materializează câştigul în înţelegere cu cealaltă, adică ceea ce câştigă
una pierde cealaltă şi invers.

Scrieţi matricele jocului în reprezentare generală.


62
14. Considerăm două persoane care joacă un joc necooperativ dat cu matricele:

1 7  1 8
H1 =  , H2 =  
3 4   7 8

Rezolvaţi jocul.

15. Pentru dezvoltarea economică şi socială a unui oraş apare problema construirii sau nu a două
obiective economice. Există două strategii corespunzătoare Ministerului tutelar şi pentru autorităţile
locale ale oraşului: 1 – a construi primul obiectiv, 2 – a construi al doilea obiectiv. Autorităţile oraşului au
2 strategii: 1 – agreează (acceptă) propunerea Ministerului, 2 – nu agreează (acceptă) propunerea.

Strategiile se aplică independent. Câştigurile sunt date de matricele:

 − 10 2   5 − 2
H1 =  , H2 = 
 1 − 1 
− 1 1 

Rezolvaţi acest joc necooperativ.

16. Fie reconsiderată Problema 12. Acum se cere:

16.1. Care sunt procentele p1 , p 2 , p3 pe care să le facem, în avans, pentru oferta cu materialele în aşa

fel încât stocul să fie sigur asigurat şi să se realizeze o valoare maximă a producţiei?

16.2. Găsiţi un plan de producţie corespunzător unui tabel de producţie de 4 milioane unităţi moetare.

17. Rrezolvaţi jocul antagonistic dat în Problema 13.

Răspunsuri.

1. Trei strategii pentru jucătorul 1 şi patru strategii pentru jucătorul 2. Matricea de câştig a
jucătorului 2 este

1.

 − 3 − 10 − 4
− 6 − 6 − 5 
H2 = 
− 9 − 1 − 3
 
− 6 − 8 − 5

2.

63
0 2 − 3 0  L11
− 2 0 0 3  L12
H1 = A = 
 3 0 0 − 4 L21
 
 0 −3 4 0  L22

L11 înseamnă : 1 deg et , 1 spune;


L12 înseamnă : 1 deg et , 2 spune;
unde
L21 înseamnă : 2 deg ete, 1 spune;
L22 înseamnă : 2 deg ete, 2 spune.

3. v1 = max min a ij = 3, v 2 = min max aij = 6, deci nu există punct şa în strategii pure, pentru

primul joc; v1 = −2, v 2 = 2; deci nu există punct şa în strategii pure, pentru al doilea joc.

3 4
4. ∑ ∑a
i =1 j =1
ij xi y j = 3 x1 y1 + 6 x1 y 2 + ... + 5 x3 y 4 ;

4 4

∑ ∑a
i =1 j =1
ij xi y j = 2 x1 y 2 − 3 x1 y 3 − 2 x 2 y1 + 3 x 2 y 4 + 3 x3 y1 − 4 x3 y 4 −

− 3x4 y 2 + 4 x4 y3 .

 2 1   1 5  5
5. X ∗ =  0, , ,0 , Y ∗ =  0, , ,0 , v = .
 3 3   6 6  3

6 – 8.

1 3 3 1
a) X ∗ =  , , Y ∗ =  , , v = 1.
4 4 4 4

3 1 1 7 17
b) X ∗ =  , , Y ∗ =  , , v = .
4 4 8 8 4

3 1 1 1 5
c) X ∗ =  , , Y ∗ =  , , v = .
4 4 2 2 2

9.

1 1 3 1 5
a) X ∗ =  , , Y ∗ =  ,0, , v = .
2 2 4 4 2

 1 2 1 2 1
b) X ∗ =  0, ,0, , Y ∗ =  , , v = .
 3 3 3 3 3
64
 3 2 2 3  1
10. X ∗ =  0, , , Y ∗ =  , ,0 , v = .
 5 5 5 5  5

4 4 6

12. H 1 = 3 5 3

 
5 2 4

0 1 −1 2
− 1 0 3 2 
13. H 1 = 
0 1 2 − 1
 
2 0 0 0

14. Prima soluţie: P1 = (1,0 ), P2 = (0,1), F1 = F2 = 7

3 2
A doua soluţii: P1 = (1,0 ), P2 =  , , P2'' = (1,0 ), F1 =
17
'
λ1 + 3λ2 , F2 = 8, unde
5 5 5

λ1 , λ2 ≥ 0, λ1 + λ2 = 1, P2 = λ1 P2' + λ 2 P2'' .

1 2
15. P1  , , P2 (0,21; 0,79 ), F1 = −0,57; F2 = 0,33
3 3 

16. 16.1. 1: 0:0

P1 : a = 2680000λ1 + 2000000λ 2 , u.m.


16.2. P2 : a = 1320000λ1 + 2000000λ 2 , u.m
λ1 , λ 2 = 0, λ1 + λ2 = 1

17. P1 = [0,3;0,11;0,26;0,33], P2 = [0,28;0,38;0,17;0,17].

Prima fabrică obţine câştigul 0,56 u.m.

Bibliografie modul
1. Blaga P. Muresan A.S., Lupas Al., Matematici aplicate in economie, vol. 2, ed. Promedia
Plus, Cluj-Napoca, 1999
2. Gibbons, R., Game theory for applied economists Princeton Univ. Press, Prenceton, New
Jersey
3. Muresan, A.S., Non cooperative games, Ed. Mega, Cluj-Napoca, 2012
4. Muresan A.S.Blaga P., Matematici aplicate in economie, vol. 2, ed. Transilvania Press,
Cluj-Napoca, 1996
5.Muresan A.S., Cercetari operationale, vol. 1 si 2, lito. UBB, Cluj-Napoca, 1997

65
Modulul 2

JOC POZITIONAL

Concepte de bazǎ jucator, decizie, pozitie, dinamica, arborescenta, drum redus


complet, clasa informationala

Obiective:

a. definirea notiunilor de joc pozitional, arborescenta, drum redus

b. considerarea diverselor tipuri de jocuri dinamice

c. definirea notiunii de punct de echilibru, de succesiune de decizii optimale

Recomandǎri privind studiul: se recomanda studentilor sa-si insuseasca notiunile


importante, in aplicatiile practice, de jucator, decizie (pozitie), arborescenta, drum
redus. De asemenea modelele pentru diversele probleme de jocuri dinamice.

Rezultate aşteptate:

a) se asteapta ca studentii sa poata opera cu diversele tipuri de jocuri


dinamice, sa le recunoasca si sa le utilizeze in aplicatii
b) sa fie in stare sa gasesca solutiile pentru jocurile dinamice si problemele
simple intalnite in aplicatii

Unitatea 1

Jocuri dinamice (pozitionale)

Obiective:

a) evidentierea principalelor tipuri de jocuri dinamice


b) prezentarea diverselor tipuri de modele
c) lamurirea notiunii de punct de echilibru
Noţiuni cheie : jucator, decizie (pozitie)

CONŢINUTUL UNITĂŢII

5. Definiţia jocului poziţional


Jocul, aşa cum a fost definit în punctul 1., nu reflectă decât parţial caracterul
dinamic, de desfăşurare în timp, al oricărui joc real. Un joc finit este format dintr-o

66
succesiune finită de acţiuni, declanşate în urma unor decizii luate în diferite
momente de către cei n jucători care participă la joc. Momentele de decizie se
succed în mod discret, fiind net separate unele de altele. În fiecre moment de
decizie se ştiu

- jucătorul care urmează să ia decizia


- variantele dintre care poate să aleagă jucătorul la rând
- momentul când s-a ajuns la ultima decizie când, în funcţie de succesiunea
deciziilor luate, se obţin câştigurile prevăzute pentru fiecare jucător.
În afara parametrilor raţionali, a jucătorilor propriu-zişi, care sunt persoane şi
care în momentele de decizie aleg în mod ferm cu probabilitatea egală cu 1 una
dintre variantele posibile, alegere fiind numită strategie pură locală, se poate
include în joc şi un partener neraţional, natura, care alege dintre variante, una, cu o
anumită probabilitate cunoscută, apreciată de dinainte. În momentul deciziei jocul
se află într-o anumită poziţie (stare). Dacă jucătorul nu poate deosebi două poziţii
diferite (informaţia de care dispune este aceiaşi) atunci el se găseşte în aceiaşi
situaţie informaţională, având aceleaşi variante pentru a lua decizia. Într-o
succesiune de decizii, luate de unul şi acelaşi jucător, nu apar situaţii
informaţionale identice. Doi jucători oarecare, diferiţi între ei, nu au situaţii
informaţionale identice.

În descrierea jocului poziţional se poate folosi terminologia teoriei grafelor.


Jocului poziţional i se poate asocia un graf G = (X,Y) unde X ={xj}, j = 1,m este
mulţimea vârfurilor, iar Y = {(xj,xk)}, 1 ≤ j ≤ m, 1 ≤ k ≤ m este mulţimea
arcelor.

Vârfurile grafului corespund poziţiilor jocului şi arcele grafului corespund


variantelor de decizie. Fără restrângerea generalităţii se poate presupune că nu
există circuite în graful G. Deciziile se succed într-o ramificare permanentă până ce
se ajunge la terminarea jocului. Astfel se poate presupune că fiecărui vârf xk , cu
excepţia unui singur vârf, fie acesta x1 , i se asociază exact un arc incident spre
interiorul vârfului dat (x j , x k ) . Un astfel de graf este conex şi simplu şi se numeşte
arborescenţă. Vârful x1 este rădăcina arborescenţei.

În continuare pentru notarea grafului G vom folosi simbolul arborescenţei A.

Din motive de formalizare a reprezentării prin arborescenţă a jocului,


introducem un vârf fictiv x0 care va fi legat, printr-un singur arc (x0 , x1 ) de rădăcina
x1 a arborescenţei. Astfel, în continuare x0 va fi rădăcina arborescenţei. Vom
presupune că decizia în x0 este luată de natură, cu probabilitatea egală cu 1, de a

67
trece în x1 , adică de a începe jocul. Pentru a deosebi clasele cu vârfuri iniţiale
echivalente din punct de vedere informaţional, asociem celor h clase
informaţionale diferite, tot atâtea simboluri diferite ct , t = 1, h . Aceste simboluri pot
fi, de exemplu, primele h numere naturale pozitive. Menţionăm că echivalenţa
informaţională a vârfurilor iniţiale implică echivalenţa informaţională a arcelor
incidente spre exterior. Jucătorii raţionali se vor nota cu primele n numere naturale
pozitive, iar natura cu numărul natural 0. Jocul poziţional asociat arborescenţei A
este o funcţie de arborescenţă (arc) F(A), definită prin 6+n caracteristici asociate
fiecărui arc: g codul (numărul) arcului, x j codul vârfului iniţial al arcului, xk codul
vârfului final al arcului, i codul (numărul) jucătorului care ia decizia în vârful
iniţial al arcului, ct codul (numărul) clasei de vârfuri echivalente din punct de
vedere informaţional de care aparţine vârful iniţial al arcului, p(g ) probabilitatea
alegerii variantei reprezentate de arcul respectiv, H 1 (g ),..., H n (g ) sunt componentele
vectorului de câştig, în cazul când arcul este un arc suspendat. Schematic, în formă
tabelară se poate scrie:

g xj xk i ct p(g ) H 1 (g ) … H n (g )

În cazul când i ≠ 0 avem p(g ) = 1, respectiv p(g ) = 0, după cum g aparţine


strategiei pure locale ce constă în alegerea variantei corespunzătoare în poziţia
fixată, respectiv nu aparţine strategiei pure locale. Toate variantele aparţinătoare
aceluiaşi vârf iniţial x j formează un sistem complet de evenimente şi de aceea
suma probabilităţilor respective este egală cu 1, fapt valabil şi când i = 0. Când
arcul (x j , x k ) nu este arc suspendat, coloanele H 1 (g ),..., H n (g ) nu se completează. Se
mai presupune, pentru fixarea ideilor, că pentru un ct comun arcele (x j , x k ) şi ' '

(x j ''
)
, x k '' pentru vârfurile iniţiale x j ' si x j '' diferite, se succed aceeaşi ordine, şi în
mod implicit, sunt în acelaşi număr.

În concluzie se poate da următoarea definiţie:

Definiţia 1. Se numeşte joc poziţional de n jucători, jocul finit care constă


din:

1. Arborescenţa A.
2. Funcţia de câştig H i (g ) definită pentru fiecare arc suspendat g şi
pentru fiecare jucător i, i ∈ I , I = {1,..., n} . Dacă jocul se termină în arcul suspendat g
jucătorul i primeşte suma H i (g ) .
68
3. Aplicaţia T a vârfurilor iniţiale x j , x j ∈ X , X = {x1 , ..., x m } , pe mulţimea
jucătorilor (inclusiv natura 0) I 0 , I 0 = I ∪ {0}. Deci Tx j = i , atunci jucătorul i este cel
care ia decizia în vârful x j .
4. Probabilităţile asociate arcelor incidente spre exterior vârfului x j .
Dacă în vârful x j decide natura 0 se asociază arcelor g k = (x j , x k ) probabilităţile
p( g k ) care însumate, în raport cu k , pentru toate arcele cu vârful iniţial x j , dau
valoarea 1. Dacă în vârful x j decide un jucător raţional i, i ≠ 0 , în ipoteza unei
strategii pure locale de alegere a variantei (x j , x k ) , arcului respectiv i se asociază
probabilitatea egală cu 1. Totodată restului arcelor cu acelaşi vârf iniţial x j li se
asociază probabilitatea egală cu 0.
5. O descompunere a mulţimii vârfurilor iniţiale într-o mulţime de clase
ct , t = 1, h , de vârfuri, echivalente din punct de vedere informaţional, caracterizată
prin următoarele:
a. Vârfurilor x j şi x j aparţinătoare aceleiaşi clase ct , li se asociază acelaşi
''

jucător i: Tx j = Tx j = i.
' ''

b. Alternativele asociate unor vârfuri diferite x j şi x j aparţinătoare aceleiaşi


''

clase informaţionale ct , sunt în acelaşi număr şi se consideră numerotate în aceeaşi


ordine, de la stânga la dreapta (sau în orice ordine prestabilită). Dacă (x j , xk ) este '' ''

al q-lea arc, în ordine, dintre arcele cu vârful iniţial x j , şi (x j , xk ) este al q-lea arc,
'' '' ''

în ordine, dintre arcele cu vârful iniţial x j , vârfurile x j şi x j aparţinând aceleiaşi


'' ''

clase informaţionale ct , atunci arcele corespund între ele, ceea ce înseamnă că în


cadrul aceleiaşi strategii pure complexe, formată din totalitatea strategiilor pure
locale, li se asociază simultan probabilităţi egale.
c. Toate vârfurile iniţiale x j cu Tx j = 0 formează câte o clasă informaţională
'

distinctă de celelalte clase.


d. Drumul care leagă rădăcina x0 de un vârf suspendat x S , este format din
vârfuri iniţiale care care nu aparţin aceleiaşi clase informaţionale.
Exemplu 1. Se consideră următorul joc poziţional cu sumă constantă (nulă):

Sunt doi jucători. Primul jucător alege unul dintre numerele 1 şi 2. Jucătorul 2,
cunoscând alegerea jucătorului 1, alege unul dintre numerele 1 şi 2. Jucătorul 1,
cunoscând alegerea jucătorului 2, dar necunoscând prima sa alegere, alege unul
dintre numerele 1 şi 2. Ce câştigă unul dintre jucători pierde celălalt jucător.
Funcţia de câştig este dată prin următoarele valori:

69
Tabelul 1

Numerele alese de jucători Valoarea funcţiei de


câştig

x y z H1 H2

1 1 1 -2 2

1 1 2 -1 1

1 2 1 3 -3

1 2 2 -4 4

2 1 1 5 -5

2 1 2 2 -2

2 2 1 2 -2

2 2 2 6 -6

Aici x este numărul ales de primul jucător la prima decizie, y este numărul ales de
cel de al doilea jucător şi z este numărul ales de primul jucător la a doua decizie.

1. Să se scrie jocul poziţional dat în formă tabelară.


2. Să se reprezinte grafic jocul (arborescenţa).
Trecem la rezolvarea problemelor formulate:

1. Introducem vârful fictiv x0 , care va fi rădăcina arborescenţei, şi în care se află


natura 0 care porneşte jocul: Tx 0 = 0 .

Notăm poziţia jocului, când începe primul jucător, cu x1 . Vârfului x0 îi asociem


clasa informaţională c1 = 1 şi arcului (x0 , x1 ) îi asociem probabilitatea p(1) = 1 . Arcul
(x0 , x1 ) nu este arc suspendat, deci nu i se asociază câştig.

70
Jucătorul 1, în vârful x1 , are două alternative, cărora le asociem arcul al
doilea (x1 , x 2 ) şi arcul al treilea (x1 , x3 ) . Clasa informaţională trebuie să difere de c1 :
punem c 2 = 2 pentru vârful x1 . Probabilitatea asociată poate fi 1, pentru arcul
(x1 , x2 ) şi 0, pentru arcul (x1 , x3 ) sau, 0 pentru arcul (x1 , x2 ) , şi 1, pentru arcul (x1 , x3 ) ,
în funcţie de strategia pură locală aleasă, după cum jucătorul 1 alege varianta
(x1 , x2 ) , respectiv alege varianta (x1 , x3 ) . Arcele nefiind suspendate, coloanele H 1 şi
H 2 nu se completează.

Construirea tabelului se continuă în acelaşi mod pentru jucătorul 2.

Deoarece jucătorul 2 cunoaşte alegerea jucătorului 1, pentru el poziţiile x 2 şi x3 vor


fi diferite din punct de vedere informaţional, şi de aceea se fixează pentru vârful x2
clasa informaţională c3 , iar pentru vârful x3 , clasa informaţională c 4 . Menţionăm
că strategiile pure locale considerate în vârfurile x2 şi x3 , aparţinând unor clase
informaţionale diferite, sunt independente între ele şi se pot schimba în toate
modurile posibile: (1,0) pentru x2 , (1,0) pentru x3 ; (1,0) pentru x2 , (0,1) pentru x3 ;
(0,1) pentru x2 , (1,0) pentru x3 ; (0,1) pentru x2 , (0,1) pentru x3 , formând strategii
pure combinate.

Urmează din nou primul jucător. Deoarece nu-şi cunoaşte prima sa alegere,
în vârfurile x4 şi x6 , respectiv x5 şi x7 posedă aceeaşi informaţie: în primul caz ştie
că jucătorul 2 a ales numărul 1, în al doilea caz ştie că jucătorul 2 a ales numărul 2.

Prin urmare, pentru cele două perechi de vârfuri avem două noi clase
informaţionale: c5 = 5 şi c6 = 6 . Strategiile pure locale, în poziţiile x 4 şi x6 ,
respectiv x5 şi x7 , nu sunt independente deoarece ele aparţin aceleiaşi clase
informaţionale. Astfel în vârfurile x4 şi x6 , aparţinătoare clasei informaţionale c5 ,
fie se aleg simultan variantele (x 4 , x8 ), (x6 , x12 ) , fie se aleg simultan variantele
(x4 , x9 ), (x6 , x13 ) . La fel se pune problema alegerii variantelor în vârfurile x5 şi x7 .
Toate arcele fiind suspendate, în coloanele H 1 (g ) şi H 2 (g ) sunt trecute câştigurile
corespunzătoare celor doi jucători. Jocul fiind cu sumă nulă, suma câştigurilor
corespunzătoare este egală cu 0 (şi de aceea se putea renunţa la precizarea
individuală a valorilor din coloana H 2 (g ) ).

Toate rezultatele de mai înainte sunt trecute în tabelul 2 şi cu aceasta s-a


răspuns la prima problemă.

71
Tabelul 2

g xj xk i ct p (g ) H 1 (g ) H 2 (g ) Numărul

ales

1 x0 x1 0 1 1

2 x1 x2 1 2 1 0 1

3 x1 x3 1 2 0 1 2

4 x2 x4 2 3 1 0 1

5 x2 x5 2 3 0 1 2

6 x3 x6 2 4 1 0 1

7 x3 x7 2 4 0 1 2

8 x4 x8 1 5 1 0 -2 2 1

9 x4 x9 1 5 0 1 -1 1 2

10 x5 x10 1 6 1 0 3 -3 1

11 x5 x11 1 6 0 1 -4 4 2

12 x6 x12 1 5 1 0 5 -5 1

13 x6 x13 1 5 0 1 2 -2 2

14 x7 x14 1 6 1 0 2 -2 1

15 x7 x15 1 6 0 1 6 -6 2

72
În completarea raţionamentelor de mai înainte, ne putem referi încă la
strategiile pure complexe care apar. Făcând produsul cartezian al mulţimilor M
aparţinătoare unor clase informaţionale distincte, având ca elemente mulţimi de
arce ce se aleg simultan ca variante, şi care, toate aparţin jucătorului 1, se obţine
mulţimea strategiilor pure complexe ale jucătorului 1:
{2,3}x {{8,12}, {9,13}} x {{10,14}, {11,15}} =
{{2, {8,12}, {10,14}}, {2, {8,12}, {11,15}}, {2, {9,13}, {10,14}},}
{2, {9,13}, {11,15}}, {3, {8,12}, {10,14}}, {3, {8,12}, {11,15}},
{3, {9,13}, {10,14}}, {3, {9,13}, {11,15}}},
formată din 8 strategii pure complexe. La fel, formând produsul cartezian
corespunzător în cazul jucătorului 2, se obţine mulţimea strategiilor pure complexe
ale acestuia:
{4,5} x {6,7} = {{4,6}, {4,7}, {5,6}, {5,7}},
formată din 4 strategii pure complexe.

3. Graficul jocului (arborescenţei) se poate reprezenta într-o figură.

Unitatea 2

Reducerea jocului pozitional

Obiective:

a) evidentierea principalelor elemente ce intra in constructia arborescentei


b) prezentarea diverselor tipuri de modele
c) lamurirea notiunii de drum redus,
Noţiuni cheie : varf, arc, ciclu, arbore, arborescenta

CONŢINUTUL UNITĂŢII

4. Reducerea jocului poziţional la un joc matriceal

Strategiile pure complexe ale jocului poziţional corespund (pot fi aplicate


pe) strategiile pure ale unui joc matriceal. Pentru a vedea intuitiv sensul afirmaţiei
făcute, să considerăm strategiile pure complexe obţinute în cazul exemplului 1 din
punctul 6. şi să realizăm corespondenţele respective.
73
Tabelul 3

Numărul Strategia pură


jucătorului
complexă a jocului a jocului
poziţional matriceal

{2 , {8,12}, {10,14}} 1

{2 , {8,12}, {11,15}} 2

{2 , {9,13}, {10,14}} 3

{2 , {9,13}, {11,15}} 4
1 {3 , {8,12}, {10,14}} 5

{3 , {8,12}, {11,15}} 6

{3 , {9,13}, {10,14}} 7

{3 , {9,13}, {11,15}} 8

{4,6} 1

2 {4,7} 2

{5,6} 3

{5,7} 4

În continuare vom arăta că fiecarei perechi de strategii pure complexe a


jocului poziţional i se poate asocia un câştig bine determinat al fiecărui jucător
raţional. În acest mod jocului poziţional i se asociază un joc matriceal.

Orice pereche (mai general n-uplet) de strategii pure complexe a jocului


poziţional determină o valoare a unei funcţii H(A), de arborescenţă, după cum
urmează. Arcelor, care intră în constituirea n-upletului, li se asociază probabilitatea
egală cu 1, dacă vârful iniţial al arcului corespunde unui jucător raţional, şi
74
totodată, restului arcelor, care pornesc din vârful respectiv, li se asociază
probabilitatea egală cu 0. Cu vectorul de câştig, H g = [ H 1 (g ),..., H n (g )] asociat
arcelor suspendate şi cu probabilitatea p(g ) se trece la un vector H (g ) definit pe
toate arcele g ale arborescenţei. Dacă g este arc suspendat H (g ) este dată. Dacă g
nu este arc suspendat, atunci H (g ) se calculează pe baza formulei:

H (g ) = ∑ p(q )H (q ) (1)
q∈G ( x )

unde G(x) este mulţimea tuturor arcelor incidente spre exterior vârfului final x al
arcului g. Vectorul (funcţia) de câştig căutat va fi cel care se va găsi pe arcul
rădăcină al arborescenţei.

Exemplul 1. Se reia jocul poziţional din exemplul 1 din punctul 6.

1. Să se construiască jocul matriceal asociat.


2. Să se reprezinte grafic problema.
1. Pentru exemplificarea construcţiei, legată de jocul matriceal, considerăm
cazul perechii de strategii pure (6,1) (din tabelul 3). Valorile H (g ) calculate
sunt trecute în coloanele H 1 (g ) şi H 2 (g ) ale tabelului 4.
Deoarece am ales, pentru jucătorul 1 strategia pură 6 a jocului matriceal, rezultă
că avem probabilitatea 1 pe arcele 3, 8, 12, 11, 15. La fel, alegând pentru
jucătorul 2 strategia pură 1 a jocului matriceal, avem probabilitatea 1 pe arcele
4, 6.

75
Tabelul 4

g xj xk i ct p (g ) H 1 (g ) H 2 (g )

1 x0 x1 0 1 1 -2 2

2 x1 x2 1 2 0 -2 2

3 x1 x3 1 2 1 5 -5

4 x2 x4 2 3 1 -2 2

5 x2 x5 2 3 0 -4 4

6 x3 x6 2 4 1 5 -5

7 x3 x7 2 4 0 6 -6

8 x4 x8 1 5 1 -2 2

9 x4 x9 1 5 0 -1 1

10 x5 x10 1 6 0 3 -3

11 x5 x11 1 6 1 -4 4

12 x6 x12 1 5 1 5 -5

13 x6 x13 1 5 0 2 -2

14 x7 x14 1 6 0 2 -2

15 x7 x15 1 6 1 6 -6

Pe restul arcelor, exceptând arcul fictiv (x 0 , x1 ) , avem probabilitatea egală cu 0.


Menţionăm că am pus simultan 1 pe arcele 8 şi 12, respectiv 11 şi 15 şi am pus
simultan 0 pe arcele 9 şi 13, respectiv 10 şi 14. Potrivit definiţiei funcţiei H (g ) ,
avem valori date pentru g = 8,15 . Pentru restul arcelor se poate aplica formula
(1). Astfel

76
H (7 ) = p (14)H (14) + p (15)H (15) = 0[2,−2] + 1[6,−6] = [6,−6],

H (6 ) = p(12)H (12) + p(13)H (13) = 1[5,−5] + 0[2,−2] = [5,−5],

H (5) = p(10)H (10 ) + p (11)H (11) = 0[3,−3] + 1[− 4,4] = [− 4,4],

H (4 ) = p (8)H (8) + p(9 )H (9 ) = 1[− 2,2] + 0[− 1,1] = [− 2,2],

H (3) = p (6 )H (6 ) + p (7 )H (7 ) = 1[5,−5] + 0[6,−6] = [5,−5],

H (2 ) = p (4 )H (4 ) + p (5)H (5) = 1[− 2,2] + 0[− 4,4] = [− 2,2],

H (1) = p (2 )H (2 ) + p (3)H (3) = 0[− 2,2] + 1[5,−5] = [5,−5].

Această ultimă valoare H (1) = [5,−5]. , este valoarea funcţiei de câştig asociată
perechii de strategii pure (6,1) a jocului matriceal, respectiv a perechii de
strategii pure complexe ({3, {8,12}, {11,15}}, {4,6}) a jocului poziţional iniţial dat.
Astfel o dată cu trecerea de la jocul poziţional la jocul matriceal asociat se poate
scrie H(6,1), în loc de H(1) şi sunt restabilite notaţiile din punctul 1.

Calculând în mod similar restul valorilor funcţiei de câştig se obţine, pentru


jucătorul 1, matricea bidimensională din tabelul 5. Pentru jucătorul 2 se poate
scrie un tabel similar schimbând semnul elementelor matricei din tabelul 5.

Tabelul 5

i 1 2 3 4

1 -2 -2 3 3

2 -2 -2 -4 -4

3 -1 -1 3 3

4 -1 -1 -4 -4

5 5 2 5 2

6 5 6 5 6

7 2 2 2 2

8 2 6 2 6

77
2. Graficul problemei pentru perechea de strategii (6,1) poate fi reprezentat
într-o figură.
Arcelor cărora le corespund probabilităţile egale cu 1 vor fi marcate cu linii
duble. Lângă fiecare arc se va trece simbolul g al arcului şi valoarea funcţiei
H (g ) . Calculul valorilor H ( g ) , trecute în coloanele H 1 (g ) şi H 2 ( g ) ale tabelului
4 pot fi urmărite pe figură.

Observaţia 1. Jocul poziţional este denumit joc în formă extinsă. Pentru a


deosebi jocul nepoziţional de cel poziţional, jocul nepoziţional se numeşte joc
normal, sau joc dat în formă normală.

Unitatea 3

Rezolvarea jocului pozitional

Obiective:

a) evidentierea principalelor tipuri de legaturi intre varfuri


b) prezentarea diverselor tipuri de abordari continue
c) lamurirea notiunii de drum redus complet
Noţiuni cheie : succesiune, radacina, varf de tranzit, varf suspendat, drum redus,
drum redus complet

CONŢINUTUL UNITĂŢII

6. Rezolvarea jocului poziţional în strategii mixte


Am văzut în punctele precedente că jocurile poziţionale sunt echivalente cu
jocurile matriceale. Aşa cum un joc matriceal poate fi antagonist, bimatriceal,
necooperativ, cooperativ, şi jocul poziţional poate avea una dintre aceste forme. În
acest sens folosim denumirile: joc poziţional antagonist, joc poziţional
necooperativ, joc poziţional cooperativ. În cazul exemplului 1 din punctul 7. am
considerat un joc antagonist. Oricare ar fi forma jocului matriceal, se pune
problema determinării unor strategii mixte. Acestora le corespund strategii mixte
ale jocului poziţional. Cu alte cuvinte arcelor li se pot asocia probabilităţi, care
corespund frecvenţelor relative, cu care urmează să fie folosite variantele în
diferite poziţii ale jocului de către jucătorii raţionali.

Definiţia 1. Rezolvarea jocului poziţional în strategii mixte, constă în


determinarea probabilităţilor asociate variantelor de decizie (arcele arborescenţei),
pornind de la strategiile mixte ale jocului matriceal asociat.

Presupunând că am rezolvat jocul matriceal asociat în strategii mixte, rezolvarea


jocului poziţional în strategii mixte se poate da în forma unui algoritm:

78
Teorema 1. Pentru a obţine strategii mixte asociate variantelor, în cazul
unui jucător fixat, se procedează după cum urmează:

1. Se asociază numărul 0 tuturor arcelor cu vârful iniţial aparţinător jucătorului


fixat.
2. Se ia prima strategie pură complexă, în ordine, a jucătorului fixat. Se iau
arcele aparţinătoare strategiei pure respective, care sunt legate tare conex cu
rădăcina arborescenţei, fiind excluse dintre arcele aparţinătoare jucătorului fixat,
cele care nu fac parte din strategia pură complexă. La probabilitatea arcelor, cu
această proprietate, se adună probabilitatea strategiei pure corespunzătoare jocului
matriceal asociat, obţinută prin rezolvarea în strategii mixte a acestui joc.
3. Dacă mai există strategii pure complexe se reia operaţia 2. În caz contrar se
trece la operaţia următoare.
4. Probabilităţile arcelor (variantelor de decizie) care pornesc dina celaşi vârf,
în care jucătorul fixat ia decizia, se împart cu suma probabilităţilor tuturor arcelor.
Exemplul 1. Considerăm jocul a cărui matrice este dată în tabelul 5. Jocul se
rezolvă ca un joc antagonist, prin problema de programe liniară asociată matricei
simplex din tabelul 6.

Tabelul 6

1 2 3 4 5 6 7
i

1 1 1 1 1 0 0 1 =

2 -2 -2 3 3 -1 1 0 ≤

3 -2 -2 -4 -4 -1 1 0 ≤

4 -1 -1 3 3 -1 1 0 ≤

5 -1 -1 -4 -4 -1 1 0 ≤

6 5 2 5 2 -1 1 0 ≤

7 5 6 5 6 -1 1 0 ≤

8 2 2 2 2 -1 1 0 ≤

9 2 6 2 6 -1 1 0 ≤

10 0 0 0 0 1 -1 0 MIN

Pentru jucătorul 1 obţinem strategia mixtă P = λ1 P1 + λ2 P2


79
P1 = [0,0,0,0,0,1,0,0], P2 = [0, 0, 0, 0, 0.25, 0.75, 0, 0 ], λ1 ≥ 0, λ1 + λ2 = 1

Valoarea jocului este V=5.

Observaţia 1. Prin valoarea jocului, în cazul unui joc antagonist,


înţelegem câştigul jucătorului 1.

Din cele stabilite rezultă că jucătorul 1 va aplica strategia pură complexă


{3, {8,12}, {11,15}} , cu probabilitatea λ1 + 0,75 λ2 , care se asociază arcelor componente:
p1 (3) = p1 (12) = p1 (15) = λ1 + 0,75 λ2 . Tot jucătorul 1 va aplica strategia pură complexă
{3, {8,12}, {10,14}} cu probabilitatea 0,25λ2 . Aceasta se asociază arcelor componente:
p 2 (3) = p 2 (12 ) = p 2 (14 ) = 0,25 λ 2 . Astfel probabilităţile, pe arce, sunt următoarele :

p (3) = p1 (3) + p 2 (3) = λ1 + 0,75λ 2 + 0,25λ2 = 1,

p (12 ) = p1 (12 ) + p 2 (12 ) = λ1 + 0,75λ2 + 0,25λ 2 = 1,

p (15) = p1 (15) = λ1 + 0,75λ 2 ,

p (14) = p 2 (14) = 0,25λ2 ,

Pentru jucătorul 2 obţinem strategia mixtă


Q = µ1Q1 + µ 2 Q2 , Q1 = [1,0,0,0], Q2 = [0,0,1,0,], µ1 ≥ 0, µ 2 ≥ 0, µ1 + µ 2 = 1 .

Astfel jucătorul 2 va putea aplica strategia pură complexă {4,6} respectiv {5,6} cu
probabilitatea µ1 respectiv µ 2 . Notând cu p probabilitatea pe arce şi în cazul
jucătorului 2, avem pe de o parte p1 (4) = µ1 , p1 (6) = µ1 , iar pe de altă parte
p 2 (5) = µ 2 , p 2 (6 ) = µ 2 , deci p (4 ) = p1 (4 ) = µ1 , p (5) = p 2 (5) = µ 2 ,

p (6) = p1 (6 ) + p 2 (6 ) = µ1 + µ 2 = 1.

Probabilitatea P(g ) ca jocul să se termine cu arcul g este egală cu 0 cu excepţia


arcului g=12 pe care este egală cu 1: P(12) = p(3) p(6) p(12) = 1x1x1 = 1.

În concluzie jucătorul 1, la prima decizie alege numărul 2, al doilea jucător


alege numărul 1 şi primul jucător, la a doua decizie, alege numărul 1.

Deoarece, în exemplului considerat, suma probabilităţilor corespunzătoare


arcelor care pornesc dintr-un acelaşi vârf este egală cu 1, nu a fost necesar să
aplicăm operaţia 4 din algoritmul teoremei 1. În cazul general este necesar să se
aplice şi această operaţie. Să arătăm că operaţia 4 poate fi executată atât în raport
cu soluţiile în strategii mixte de bază, cât şi în raport cu soluţia în strategii mixte
generală a jocului matriceal asociat.
80
Fie a ∗ = {a} un sistem complet de arce, variante de decizie, corespunzatoare
aceluiaşi vârf iniţial. Toate componentele soluţiilor în strategii mixte de bază
Pi , i = 1, s şi ale soluţiei în strategii mixte generale.

s s
P = ∑ λi P i , λi ≥ 0, i = 1, s; ∑λ i = 1,
i =1 i =1

se distribuie pe submulţimi disjuncte ale sistemului a ∗ . Fie J (a ) matricea linie cu


elementul 1 sau 0, anume 1, dacă componenta cu indicele respectiv se distribuie pe
arcul a şi 0 în caz contrar. Avem următoarele probabilităţi pe arce:
s

PJ T (a )
∑ λ P J (a )
1 i
T
s s
p (a ) = = i =1
= ∑λ P , λ ' ' '
≥ 0, i = 1, s; ∑λ '
= 1,
∑ PJ T (a ) ∑ PJ (a ) T 1 i i i
i =1 i =1
a∈a ∗ a∈a ∗

unde

λi ∑ Pi J T (a )
a∈a ∗ Pi J T (a )
λ'i = , Pi ' = .
∑ PJ (a ) T
∑ Pi J T (a )
a∈a ∗ a∈a ∗

Deoarece probabilitatea p(a ) asociată arcului a se exprimă ca o combinaţie


'
liniară convexă cu ajutorul soluţiilor în strategii mixte de bază pe arce Pi are loc
următoarea teoremă:

Teorema 2. Soluţia generală, în strategii mixte pe arce, poate fi calculată


pe baza soluţiilor în strategii mixte de bază, pe arce.

Teme pentru verificarea cunoştinţelor


Exercitii si probleme rezolvate

Exemplu de joc poziţional

Se consideră jocul poziţional cu următoarea desfăşurare. Primul pas este făcut de natură: sunt două
2 1
variante, prima se realizează cu probabilitatea , a doua cu probabilitatea . Al doilea pas este făcut de
3 3
jucătorul 1, care, necunoscând ce a realizat natura, alege unul dintre numerele 1,2. Pasul al treilea este
făcut de jucătorul 2, care, necunoscând ce s-a realizat la pasul aleatoriu, dar cunoscând numărul ales de
jucătorul 1 la al doilea pas, alege unul dintre numerele 1,2. Câştigul jucătorului 1, de la al doilea jucător,
este dat prin tabelul:

81
s 1 2 3 4 5 6 7 8

h(s) -1 5 2 -3 4 1 -2 6

unde s este codul situaţiei în ordonare lexicografică, iar h(s) este câştigul corespunzător.

1. Să se construiască graficul arborescenţei jocului.


2. Să se construiască tabelul jocului.
3. Să se reducă jocul la un joc matriceal.
4. Să se rezolve jocul matriceal asociat.
5. Să se construiască arborescenţa de structură şi să se interpreteze rezultatele.
Soluţie. 1. Arborescenţa jocului. Are 15 arce g , g = 1,15; are 16 vârfuri xi , i = 0,15; are 5 clase
informaţionale, ct , t = 1,5

2. Tabelul jocului. Jocul este trecut în tabelul următor.

g xj xk i ct p(g) H1(g) H2g)

1 x0 x1 0 1 1

2 x1 x2 0 2 2/3

3 x2 x3 1 3

4 x3 x4 2 4 -1 1

5 x3 x5 2 4 5 -5

6 x2 x6 1 3

7 x6 x7 2 5 2 -2

8 x6 x8 2 5 -3 3

9 x1 x9 0 2 1/3

10 x9 x10 1 3

11 x10 x11 2 4 4 -4

12 x10 x12 2 4 1 -1

13 x9 x13 1 3

14 x13 x14 2 5 -2 2

15 x13 x15 2 5 6 -6

3. Reducerea jocului. Corespondenţa între jocul poziţional şi jocul matriceal este stabilită în tabelul
următor.
Urmând calculele se poate scrie următoarea matrice a jocului (referitoare la jucătorul 1):
82
1 2 3 4
2 2 11 11
H =1
3 3 3 3
2 2
2 0 0
3 3

Nr. jucător Strategie pură

complexă a jocului a jocului matriceal


poziţional

1 {3, 10} 1

{6, 13} 2

2 {{4,11}, {7,14}} 1

{{4,11}, {8,15}} 2

{{5,12}, {7,14}} 3

{{5,12}, {8,15}} 4

4. Rezolvarea jocului. Coloana a treia este dominantă şi se poate elimina. Matricei rămase i se
asociază matricea simplex
i\j 1 2 3 4 5 6

1 1 1 1 0 0 1 =

2 2 2 11 -1 1 0 ≤
3 3 3

3 2 0 0 -1 1 0 ≤
3

4 0 0 0 1 -1 0 MIN

care rezolvată ne dă următoarea soluţie generală:

P = [1,0], Q = λ1Q2 + λ2 Q2 ,

Q1 = [1,0,0,0], Q2 = [0,1,0,0],

λ1 ≥ 0, λ 2 ≥ 0, λ1 + λ2 = 1

83
TEME DE CONTROL
1. Jucătorul 1 alege un număr a din mulţimea {x,y}. Jucătorul 2 , fiind informat asupra numărului a,
alege numărul b din aceeaşi mulţime {x,y}. Jucătorul 1, uitând numărul a, şi nefiind informat asupra
numărului b, alege un număr c din mulţimea {x,y}. Câştigul jucătorului 1 este dat prin funcţia M:

M ( x, x, x ) = −2, M (x, x, y ) = −1, M ( x, y, x ) = 3, M (x, y, y ) = −4

M ( y, x, x ) = 5, M ( y, x, y ) = 2, M ( y, y, x ) = 2, M ( y, y, y ) = 6

1. Să se reprezinte grafic arborescenţa jocului.


2. Să se scrie tabelul jocului.
3. Să se reducă jocul la un joc matriceal.

Bibliografie modul

1. Blaga P. Muresan A.S., Lupas Al., Matematici aplicate in economie, vol. 2,


ed. Promedia Plus, Cluj-Napoca, 1999
2. Gibbons, R., Game theory for applied economists Princeton Univ. Press,
Prenceton, New Jersey
3. Muresan, A.S., Non cooperative games, Ed. Mega, Cluj-Napoca, 2012
4. Muresan A.S.Blaga P., Matematici aplicate in economie, vol. 2, ed.
Transilvania Press, Cluj-Napoca, 1996
5.Muresan A.S., Cercetari operationale, vol. 1 si 2, lito. UBB, Cluj-Napoca,
1997

84
Modulul 3

JOCURI STATICE CU INFORMATIE INCOMPLETA

Concepte de bazǎ joc static, punct de echilibru de tip Nash-Bayes, revelatie

Obiective:

a. definirea notiunilor de joc static

b. considerarea diverselor tipuri de informatii

c. definirea notiunii de punct de echilibru la un joc static cu informatie


incompleta

Recomandǎri privind studiul: se recomanda studentilor sa-si insuseasca notiunile


importante, in aplicatiile practice, de joc static, informatii, punct de echilibru. De
asemenea modelele pentru diversele probleme formulate plecand de la cazul
jocurilor statice cu informatie completa

Rezultate aşteptate:

a) se asteapta ca studentii sa poata opera cu diversele tipuri de jocuri statice,


sa le recunoasca si sa le utilizeze in aplicatii
b) sa fie in stare sa gasesca solutiile pentru modelele si problemele simple
intalnite in aplicatii

Unitatea 1

Joc static de tip Bayes

Obiective:

a) evidentierea principalelor tipuri de jocuri statice


b) prezentarea diverselor tipuri de informatii
c) lamurirea notiunii de forma normala a unui joc static
Noţiuni cheie : joc static, informatie, forma normala

CONŢINUTUL UNITĂŢII

Jocuri statice de informaţie incompletǎ

Vom considera acum jocuri de informaţie incompletǎ (jocuri Bayes), adicǎ jocuri
în care cel puţin un jucǎtor nu este sigur (nu cunoaşte) de funcţia de câştig a altui
85
jucǎtor. Un exemplu specific de joc static de informaţie incompletǎ este cel al
vânzǎrii prin licitaţii. Fiecare ofertant cunoaşte evaluarea sa pentru un anumit bun
ce urmeazǎ a fi vândut dar nu ştie evluǎrile celorlalţi ofertanţi.

Jocuri Bayesiene statice şi şi echilibre Bayes – Nash

Definim forma normalǎ de eprezentare a unui joc Bayes static şi a unui echilibru
Bayes – Nash într-un astfel de joc. Întrucât aceste definiţii sunt abstracte şi destul
de complexe vom introduce ideile principale pentru exemplul simplu, anume
competiţia Cournot în informaţie asimetricǎ. Considerǎm un modul Cournot cu
inverse funcţiei cerere datǎ prin P(Q ) = a − Q, unde Q = q1 + q 2 este cantitatea
agregatǎ de pe piaţǎ. Funcţia cost a firmei 1 este C1 (q1 ) = cq1 . Funcţia cost a firmei 2
c L q 2 c H q2 
este C 2 (q 2 ) care are distribuţia probabilisticǎ C 2 (q 2 ) :  ,
1 − θ θ 

unde c L < c H . Mai mult, informaţia este asimetricǎ deoarece firma 2 cunoaşte
funcţia sa de cost şi funcţia de cost a firmei 1, dar firma 1 cunoaşte funcţia sa de
cost şi cunoşte numai cǎ pentru firma 2 costul marginal c are distribuţia
probabilisticǎ

 c cH 
c: L .
1 − θ θ 

Aceastǎ situaţie poate fi atunci când firma 2 vrea sǎ intre cu ceva sortiment nou pe
piaţǎ sau poate tocmai a inventat o nouǎ tehnologie. Toate acestea sunt în comun
cunoscute de cǎtre cele douǎ firme. Firma 1 ştie cǎ firma 2 are o informaţie în plus
(superioarǎ), firma 2 ştie cǎ firma 1 cunoaşte acest lucru şi aşa mai departe.
Natural, firma 2 poate vrea sǎ aleagǎ cantitǎţi diferite (de obicei mai mici) în cazul
când costul sǎu marginal este mai înalt decât atunci când costul este mai scǎzut.
Firma 1, din punctual sǎu de vedere, va anticipa cǎ firma 2 poate împǎrţi (alege)
cantitatea sa la costul sǎu în acest mod.

Fie q 2* (c ) notatǎ cantitatea pe care firm 2 o alege ca funcţie de costul sǎu, adicǎ

86
 q * (c ) , daca c = c L
q 2* (c ) =  *2 L .
q 2 (c H ) , daca c = c H

Fie q1* notatǎ singura cantitate pe care o allege firma 1. Când costul firmei 2 este
scǎzut, ea va alege q 2* (c L ) sǎ resolve problema

[( )
max a − q1* − q 2 − c L q 2 .
q2
]

Analog, când costul firmei 2 este înalt, q 2* (c H ) va rezolva problema

[( )
max a − q1* − q 2 − c H q 2 .
q2
]

Firma 1 cunoaşte cǎ la fima 2 costul este scǎzut cu probabilittea 1 − θ şi va anticipa


cǎ pentru firma 2 cantitatea aleasǎ va fi q 2* (c L ) sau q 2* (c H ) , aceasta depinzând de
costul firmei 2. Astfel firma 1 alege q1* sǎ rezolve problema

{ [( ) ] [(
max (1 − θ ) a − q1 − q 2* (c L ) − c q1 + θ a − q1 − q 2* (c H ) − c q1 ,
q1
) ] }

ca sǎ-şi maximizeze profilul aşteptat.

Condiţiile necesare de extrem pentru aceste trei probleme de optimizare sunt (dupǎ
anularea derivatelor de ordinul întâi)

q 2* (c L ) =
1
2
(
a − q1* − c L , ) q 2* (c H ) =
1
2
(
a − q1* − c H )

şi

q1* =
1
2
[
(1 − θ )(a − q 2* (c L ) − c ) + θ (a − q 2* (c H ) − c ) .]

Rezolvând acest sistem de trei ecuaţii obţinem

q 2* (c L ) =
1
(a − 2c L + c ) − θ (c H − c L ),
3 6

q 2* (c H ) =
1
(a − 2c H + c ) − 1 − θ (c H − c L ),
3 6

87
q1* =
1
[a − 2c + (1 − θ )c L + θc H ].
3

Sǎ comparǎm cantitǎţile q 2* (c L ) , q 2* (c H ) şi q1* cu cele de la echilibrul Cournot în


cazul informaţiei complete, când costurile marginale sunt c1 şi c 2 . Presupunând cǎ
valorile c1 şi c 2 sunt aşa încât cantitǎţile de echilibru ale ambelor firme sunt
pozitive, vom avea, în acst caz al informaţiei complete, cǎ firma i va produce
cantitatea:

q i+ =
1
(a − 2ci + c j ).
3

În cazul informaţiei incomplete cantitatea q 2* (c H ) este mai mare decât (a − 2c H + c ),


1
3

în timp ce q 2* (c L ) este mai micǎ decât (a − 2c L + c ).


1
3

Aceastǎ situaţie apare deoarece firma 2 nu numai cǎ îşi împarte cantitatea sa dupǎ
costurile sale dar la fel rǎspunde la faptul cǎ firma 1 nu poate sǎ o facǎ. Dacǎ
pentru firma 2 costul este înalt, de exemplu, ea produce mai puţin, dar la fel
produce mai mult deoarece ea cunoaşte cǎ firma 1 va produce o cantitate ce
maximizeazǎ profitul ei aşteptat şi astfel este mai micǎ decât cantitatea ce o va
produce dacǎ ea ştie cǎ va fi costul firmei 2 înalt.

Reamintim cǎ ansamblul Γ =< I , {S i }, {H i }, i ∈ I > este un joc necooperativ, unde S i


este spaţiul strategiilor jucǎtorului i şi H i (s ) este câştigul jucǎtorului i în situaţia
s = (s1 , s 2 ,..., s n ) a jocului.

Observaţie. Jocul necooperativ poate fi de asemenea descris ca şi ansamblul


Γ =< I , {Ai }, {H i }, i ∈ I > unde Ai este spaţiul acţiunilor jucǎtorului i în cazul când

jucǎtorii au ales acţiunea a = (a1 , a 2 ,..., a n ) . Într-un joc cu mutǎri (decizii) simultane
de informaţie completǎ o strategie pentru un jucǎtor este, simplu, o acţiune, dar
într-un joc dinamic

88
(cu mutǎri succesive) de informaţie completǎ (finit sau infinit repetat) o strategie
poate fi diferitǎ de o acţiune. O strategie a jucǎtorului este un plan complet de
acţiuni – ea specificǎ o acţiune admisibilǎ pentru jucǎtor în fiecare contingenţǎ în
care jucǎtorul poate fi gǎsit în timp ce acţioneazǎ. Deci, într-un joc dinamic o
strategie este mai complicatǎ. Sǎ pregǎtim descrierea unui joc de informaţie
incompletǎ descriem mai întâi un joc static de informaţie completǎ dupǎ cum
urmeazǎ: (1) jucǎtorii aleg simultan acţiuni (jucǎtorul i alege acţiunea ai din
mulţimea admisibilǎ Ai ) şi apoi (2) câştigul H i (a1 , a 2 ,..., a n ) este primit de jucǎtorul
i.

Vrem acum sǎ formulǎm reprezentarea în formǎ normalǎ a unui joc static


Bayesian, anume un joc cu mutǎri (decizii) simultane de informaţie incompletǎ.

Primul pas este sǎ prezentǎm ideea cǎ fiecare jucǎtor cunoaşte funcţia sa de câştig
dar poate fi nesigur asupra funcţiilor de câştig ale celorlalţi jucǎtori. Fie funcţiile
posibile de câştig ale jucǎtorului i reprezentate prin H i (a1 , a 2 ,..., a n ; t i ) unde t i este
numit tipul jucǎtorului i şi care aparţine la o mulţime posibilǎ de tipuri (sau spaţiul
tipurilor) Ti . Fiecǎrui tip t i îi corespunde o funcţie de câştig diferitǎ pe care
jucǎtorul i o poate avea.

Dând aceastǎ definiţie a tipului unui jucǎtor a spune cǎ jucǎtorul i cunoaşte funcţia
sa de câştig este echivalent cu a spune cǎ jucǎtorul i cunoaşte tipul sǎu. În
consecinţǎ a spune cǎ jucǎtorul i poate fi nesigur asupra funcţiilor de câştig ale
celorlalţi jucǎtori este echivalent cu a spune cǎ jucǎtorul i poate fi nesigur asupra
tipurilor celorllţi jucǎtori notate prin t −i = (t1 ,..., t i −1 , t i +1 ,..., t n ).

Notǎm T−i mulţimea tuturor valorilor posibile ale lui t −i , şi folosim distribuţia
probabilisticǎ pi (t −i / t i ) sǎ notǎm încrederea jucǎtorului i asupra tipurilor t −i ale
celorlalţi jucǎtori ştiind cǎ tipul jucǎtorului i este t i .

89
Observaţie. În multe aplicţii tipurile jucǎtorilor sunt independente, caz în care
pi (t −i / t i ) nu depinde de t i , aşa cǎ vom putea scrie încrederea jucǎtorului i ca

pi (t −i ) .

Definiţia 1. Reprezentarea într-o formǎ normalǎ a unui joc static Baysian cu n


jucǎtori specificǎ spaţiile acţiunilor jucǎtorilor A1 , A2 ,..., An , spaţiile tipurilor lor
T1 , T2 ,..., Tn , încrederile lor p1 , p 2 ,..., p n , şi funcţiile lor de câştig H 1 , H 2 ,..., H n .

Observaţie. Folosim notaţia Γ =< I , {Ai }, {Ti }, {pi }, {H i } i ∈ I > pentru un joc static
Bayesian cu n jucǎtori.

Observaţie. Tipul jucǎtorului i, t i , este cunoscut în mod privat de jucǎtorul i şi ca


atare determinǎ funcţia de câştig jucǎtorului i, H i (a1 , a 2 ,..., a n ; t i ) şi acest tip este un
element al mulţimii posibile de tipuri Ti . Încrederea jucǎtorului i, pi (t −i / t i ) descrie
nesiguranţa jucǎtorului i asupra tipurilor celorlalţi n – 1 jucǎtori, t −i când se dǎ tipul
t i a jucǎtorului i.

Exemplul 1. În jocul Cournot acţiunile firmelor sunt cantitǎţile lor luate q1 şi q 2 .

Firma 2 are douǎ funcţii cost posibile şi astfel douǎ posibile profituri sau funcţii de
câştig:

H 2 (q1 , q 2 ; c L ) = [(a − q1 − q 2 ) − c L ]q 2

şi

H 2 (q1 , q 2 ; c H ) = [(a − q1 − q 2 ) − c H ]q 2 .

Astfel, spaţiul tipurilor firmei 1 este T1 = {c} , iar al firmei 2 (spaţiul tipurilor) este
T2 = {c L , c H }.

Exemplul 2. Presupunem cǎ jucǎtorul i are douǎ funcţii de câştig posibile. Vom


spune cǎ jucǎtorul i are are douǎ tipuri, t i1 şi t i 2 , cǎ spaţiul tipurilor jucǎtorului i
este Ti = {t i1 , t i 2 }, şi cǎ funcţiile de câştig ale jucǎtorului i sunt H i (a1 , a 2 ,..., a n ; t i1 ) şi
90
H i (a1 , a 2 ,..., a n ; t i 2 ). Putem folosi idea cǎ fiecare din tipurile jucǎtorului corespunde la

o funcţie de câştig diferitǎ, jucǎtorul poate sǎ reprezinte posibilitatea cǎ jucǎtorul


poate sǎ aibǎ mulţimi de acţiuni posibile diferite dupǎ cum urmeazǎ.

Presupunem cǎ mulţimea de acţiuni posibile (admisibile) ale jucǎtorului i este


{a, b} cu probabilitatea q şi {a, b, c}cu probabilitatea 1-q. Atunci putem spune cǎ
jucǎtorul i are douǎ tipuri şi putem defini mulţimea de acţiuni posibile (admisibile)
a fi {a, b, c}pentru ambele tipuri, dar definim câştigul de la acţiunea c a fi − ∞ pentru
tipul t i1 .

Observatie. Formularea (desfǎşurarea) unui joc Bayesian static este dupǎ cum
urmeazǎ:
(1) natura alege vectorul tip t = (t1 , t2 , K, tn ) , unde ti este luat din mulţimea de
tipuri posible Ti ;
(2) natura releveazǎ t i la jucǎtorul i dar nu la orice alt jucǎtor;

(3) jucǎtorii aleg simultan acţiuni, jucǎtorul i alege ai din mulţimea posibilǎ
(admisibilǎ) Ai ;

(4) câştigurile H i (a1 , a2 ,K, an ; ti ) sunt primite.

Deoarece natura reveleazǎ tipul jucǎtorului i, dar la nici un alt jucǎtor j în pasul (2),
jucǎtorul j nu cunoaşte istoria completǎ a jocului când acţiunile sunt alese în pasul
(3).

Observatie. Sunt jocuri în care jucǎtorul i are o informaţie privatǎ nu numai a


asupra funcţiei sale de câştig dar la fel asupra funţiilor de câştig ale altor jucǎtori.
Vom evidenţia aceastǎ posibilitateprin precizarea cǎ la jucǎtorul i câştigul sǎ
depindǎ nu numai de acţiunile (a1 , a 2 ,..., a n ) ci şi de tipurile (t1 , t 2 ,..., t n ) . Scriem deci
acest câştig ca H i (a1 , a 2 ,..., a n ; t1 , t 2 ,..., t n ).
Observatie. Al doilea punct tehnic implicǎ încrederile pi (t −i / t i ). Vom presupune
cǎ este o cunoştinţǎ comunǎ cǎ în pasul (s) de la formularea unui joc Bayesian
static, natura alege un vector tip t = (t1 , t 2 ,..., t n ) conform cu distribuţia de

91
probabilitate p(t ). Când natura releveazǎ t i la jucǎtorul i, el poate calcula
încrederea pi (t −i / t i ) folosind regula lui Bayes
p (t− i , ti ) p (t− i , ti )
pi (t− i | ti ) = = .
p (ti ) ∑ p (t− i , ti )
t −i ∈T−i

Unitatea 2

Echilibru de tip Nash-Bayes

Obiective:

a) evidentierea principalelor tipuri de echilibre


b) prezentarea diverselor tipuri de metode de rezolvare
c) lamurirea notiunii de solutie optima
Noţiuni cheie : echilibru de tip Nash-Bayes

CONŢINUTUL UNITĂŢII

Definiţia echilibrului Bayesian Nash

Întâi definim spaţiile de strategii ale jucǎtorilor într-un jucǎtor Bayesian.


Cunoaştem cǎ o strategie a unui jucǎtor este un plan complet de acţiune,
specificând o acţiune posibilǎ (admisibilǎ) în fiecare moment în care poate fi pus sǎ
acţioneze. Dând o desfǎşurare a unui joc Bayesian static, în care natura începe
jocul prin alegerea tipurilor jucǎtorilor, o strategie (purǎ) pentru jucǎtorul i trebuie
sǎ specifice o acţiune posibilǎ (admisibilǎ) pentru fiecare tip posibil al jucǎtorului i.

Definiţie. Într-un joc Bayesian static T, o strategie pentru jucǎtorul i este o funcţie
si : Ti → Ai , care fiecǎrui tip t i ∈ Ti i se asociază acţiunea si (t i ) din mulţimea de

acţiuni posibile Ai i ce-i va corespunde tipului t i ce va fi ales de natură.

Spaţiile strategiilor nu sunt date în reprezentare în forma normală a jocului


Bayesian. Întradevăr, într-un joc Bayesian static spaţiile strategiilor sunt construite
din spaţiile de tipuri şi de acţiuni: mulţimea jucătorului i de strategii posibile (pure)
S i este mulţimea tuturor funcţiilor posibile cu domeniul Ti şi codomeniul Ai .

Observaţie. În discutarea jocurilor dinamice de informaţie incompletă va fi făcută


distincţia dintre două categorii de strategii. Astfel, într-o strategie separatorie
92
fiecărui tip t i ∈ Ti i se asociază o acţiune diferită ai ∈ Ai . În strategia unificatoare
toate tipurile au aceeaşi acţiune asociată. Vom introduce distincţia aici numai să
ajutăm descrierea unei varietăţi de strategii ce pot fi construite de la o pereche dată
de spaţii de tipuri şi de acţiuni, Ti şi Ai .

Exemplul 2.3. În jocul Cournot de informaţie asimetrică din Exemplul precedent,


soluţia constă din cele trei cantităţi alese: q 2* (c L ), q 2* (c H ) şi q1* . În termenii
definiţiei precedente a unei strategii, perechea (q 2* (c L ), q 2* (c H )) este strategia firmei 2
şi q1* este strategia firmei 1. Firma 2 va alege diferitele cantităţi depinzând de
costul ei. Este important să notăm, totuşi, că singura cantitate a firmei 1 va fi luată
ţinând cont că la firma 2 cantitatea va depinde de costul firmei 2, în acest mod.

Astfel, dacă conceptul nostru de echilibru este să cerem ca strategia firmei 1 să fie
un cel mai bun răspuns la strategia firmei 2, atunci strategia firmei 2 trebuie să fie
o pereche de cantităţi, câte una pentru fiecare tip de cost posibil, altfel firma 1 nu
poate calcula dacă strategia sa este întradevăr un cel mai bun răspuns al firmei 2.

Dând definiţia unei strategii într-un joc Bayesian, ne întoarcem la definiţia unui
punct de echilibru Nash Bayesian. Ideea centrală este ca să fie simplu şi familiar:
fiecare strategie a jucătorului trebuie să fie cu cel mai bun răspuns la strategiile
celorlalţi jucători. Adică, un echilibru Bayesian Nash este simplu un echilibru
Nash într-un joc Bayesian.

Definitia 2.3. Într-un joc static Bayesian Γ strategiile s∗ = ( s1∗ , s2∗ , K , sn∗ )
constituie (in strategii pure) un echilibru Bayesian Nash daca pentru fiecare
jucator i si pentru fiecare i tipul ti ∈ Ti , si (ti ) rezolva problema

max
a i ∈ Ai

t −i ∈T−i
H i ( s1∗ (t1 ), K , si∗−1 (ti −1 ), ai , si∗+1 (ti +1 ), K , sn∗ (tn ); t ) pi (t− i | ti ).

Observatia 2.9. Într-un echilibru Bayesian Nash nici un jucator nu vrea sa


schimbe startegia sa, chiar daca schimbarea implica numai o actiune de la un tip.

Observatia 2.10. Se poate arata ca la un joc static Bayesian finit exista un


echilibru Bayesian Nash, desi poate in strategii mixte.
93
Bibliografie modul

1. Blaga P. Muresan A.S., Lupas Al., Matematici aplicate in economie, vol. 2,


ed. Promedia Plus, Cluj-Napoca, 1999
2. Gibbons, R., Game theory for applied economists Princeton Univ. Press,
Prenceton, New Jersey
3. Muresan, A.S., Non cooperative games, Ed. Mega, Cluj-Napoca, 2012
4. Muresan A.S.Blaga P., Matematici aplicate in economie, vol. 2, ed.
Transilvania Press, Cluj-Napoca, 1996
5.Muresan A.S., Cercetari operationale, vol. 1 si 2, lito. UBB, Cluj-Napoca,
1997

TEME DE CONTROL

Exercitiul 1. În jocul Cournot acţiunile firmelor sunt cantitǎţile lor luate q1 şi q 2 .

Firma 2 are douǎ funcţii cost posibile şi astfel douǎ posibile profituri sau funcţii de
câştig:

H 2 (q1 , q 2 ; c L ) = [(a − q1 − q 2 ) − c L ]q 2

şi

H 2 (q1 , q 2 ; c H ) = [(a − q1 − q 2 ) − c H ]q 2 .

Astfel, spaţiul tipurilor firmei 1 este T1 = {c} , iar al firmei 2 (spaţiul tipurilor) este
T2 = {c L , c H }.

Exercitiul 2. Presupunem cǎ jucǎtorul i are douǎ funcţii de câştig posibile. Vom


spune cǎ jucǎtorul i are are douǎ tipuri, t i1 şi t i 2 , cǎ spaţiul tipurilor jucǎtorului i
este Ti = {t i1 , t i 2 }, şi cǎ funcţiile de câştig ale jucǎtorului i sunt H i (a1 , a 2 ,..., a n ; t i1 ) şi
H i (a1 , a 2 ,..., a n ; t i 2 ). Putem folosi idea cǎ fiecare din tipurile jucǎtorului corespunde la

94
o funcţie de câştig diferitǎ, jucǎtorul poate sǎ reprezinte posibilitatea cǎ jucǎtorul
poate sǎ aibǎ mulţimi de acţiuni posibile diferite dupǎ cum urmeazǎ.

Presupunem cǎ mulţimea de acţiuni posibile (admisibile) ale jucǎtorului i este


{a, b} cu probabilitatea q şi {a, b, c}cu probabilitatea 1-q. Atunci putem spune cǎ
jucǎtorul i are douǎ tipuri şi putem defini mulţimea de acţiuni posibile (admisibile)
a fi {a, b, c}pentru ambele tipuri, dar definim câştigul de la acţiunea c a fi − ∞ pentru
tipul t i1 .

Cuprins

Modulul 1 JOCURI STATICE DE INFORMATIE COMPLETA 7

Unitatea 1 Jocuri matriciale 7

Unitatea 2 Jocuri matriciale si programare liniara 19

Unitatea 3 Joc necooperativ 22

Unitatea 4 Aplicatii economice 35

TEME DE CONTROL 61

Modulul 2 JOC POZITIONAL 66

Unitatea 1 Jocuri dinamice (pozitionale) 66

Unitatea 2 Reducerea jocului pozitional 73

Unitatea 3 Rezolvarea jocului pozitional 77

TEME DE CONTROL 84

Modulul 3 JOCURI STATICE CU INFORMATIE INCOMPLETA 85

Unitatea 1 Joc static de tip Bayes 85

Unitatea 2 Echilibru de tip Nash-Bayes 92

TEME DE CONTROL 94

95

S-ar putea să vă placă și