Sunteți pe pagina 1din 110

Specializarea:

Elemente de
teoria jocurilor
ANUL II Semestrul IV

1
Cluj-Napoca 2013
Cuprins

Modulul 1 JOCURI STATICE DE INFORMATIE COMPLETA 7

Unitatea 1 Jocuri matriciale 7

Unitatea 2 Jocuri matriciale si programare liniara 19

Unitatea 3 Joc necooperativ 22

Unitatea 4 Aplicatii economice 35

TEME DE CONTROL 61

Modulul 2 JOC POZITIONAL 66

Unitatea 1 Jocuri dinamice (pozitionale) 66

Unitatea 2 Reducerea jocului pozitional 73

Unitatea 3 Rezolvarea jocului pozitional 77

TEME DE CONTROL 84

Modulul 3 JOCURI STATICE DE INFORMATIE INCOMPLETA 85

Unitatea 1 Joc static de tip Bayes 85

Unitatea 2 Echilibru de tip Nash-Bayes 92

TEME DE CONTROL 94

2
UNIVERSITATEA „BABE Ş-BOLYAI” CLUJ-NAPOCA

FACULTATEA DE ŞTIINŢE ECONOMICE ŞI GESTIUNEA


AFACERILOR

SPECIALIZAREA: MK, ECTS

ANUL UNIVERSITAR 2013/2014

SEMESTRUL: IV

I. Informaţii generale

Date de identificare a cursului

Date de contact ale titularului de curs:

Nume: Muresan Anton S.

Birou: Cabinetul 229, Etajul II

Telefon: 0264-418653

Fax: 0264-412570

E-mail: anton.muresan@econ.ubbcluj.ro

Consultatii: Joi orele 15,00-17,00

Date de identificare curs si contact tutori:

Numele cursului: ELEMENTE DE TEORIA JOCURILOR

Codul cursului: EBS0097

Anul II Semestrul IV

Tipul cursului: Optional

Pagina web a cursului: https://portal.portalid.ubbcluj.ro/

Tutori: Muresan Anton S.

Adresa e-mail tutori: anton.muresan@econ.ubbcluj.ro

3
Locul de desfăşurare a cursului: Clădirea Campus, săli etajul II

Programarea în orar a activităţilor (la învăţămâtul de zi):

Săptămânal 2 ore de curs + 1 or ă de lucrări (seminar), conform orarului afişat la


sediul facultăţii

Condiţionări si cunosţinte prerechizite:

Pentru inscrierea la cursul de faţa este nevoie de parcurgerea si promovarea


anterioara a disciplinelor de Matematici aplicate in economie (anul I, semestrul I)
si Matematici financiare si actuariale (anul I, semestrul II). Este necesar a fi
cunoscute notiunile de derivate, integrale, probabilitati.

Descrierea cursului :

Se vor avea in vedere urmatoarele obiective:

· Familiarizarea studenţilor cu tehnicile şi metodele matematice utilizate în


modelerea unor fenomene si procese economice si de interese diferite
· Introducerea câtorva no ţiuni despre jucator, strategie (mutare, decizie),
castig, solutie (punct de echilibru
· Crearea bazelor de rationament si calcul pentru aplicatiile din domeniul
economic

Organizarea temelor (partilor) in cadrul cursului:

Cursul va avea urmatoarele trei parti:

1. Jocuri statice de informatie completa


2. Joc pozitional
3. Jocuri statice de informatie incompleta
Organizarea temelor s-a facut avand in vederea ordinea fireasca si gradul de
dificultate sa urmeze o ordine crescatoare. Informatia relevanta referitoare la
fiecare tema (parte) se gaseste in lista bibliografica ce va fi prezentata ulterior,
iar accesul va fi realizat direct.

Formatul si tipul activitatilor implicate de curs:

Formatul va fi unul clasic, permitand studentului de a-si gestiona singur, fara


constrangeri, parcurgerea cursului. De sigur o participare la activitatile
planificate va usura intelegerea tematicii cursului. Tipurile de activitati ce vor fi
abordate in cadrul cursului vor fi atat cele clasice cat si proiecte de grup, discutii
pe anumite teme si proiecte de cercetare.

4
Materiale bibliografice obligatorii:

Principalele materiale bibliografice pe care le vom utiliza, si care se vor gasi


la biblioteca facultatii, iar unele vor putea fi accesate prin internet, sunt:

1. Blaga P. Muresan A.S., Lupas Al., Matematici aplicate in economie, vol. 2, ed.
Promedia Plus, Cluj-Napoca, 1999
2. Gibbons, R., Game theory for applied economists Princeton Univ. Press,
Prenceton, New Jersey
3. Muresan, A.S., Non cooperative games, Ed. Mega, Cluj-Napoca, 2012
4. Muresan A.S.Blaga P., Matematici aplicate in economie, vol. 2, ed. Transilvania
Press, Cluj-Napoca, 1996
5. Muresan A.S., Cercetari operationale, vol. 1 si 2, lito. UBB, Cluj-Napoca, 1997

Materiale si instrumente necesare pentru curs :

Vom folosi: calculator si softuri specifice pentru a putea vizualiza aplicatiile,


pentru a prelucra date. Astfel, mentionam aici: Word, Excel, Adobe Reader.

Politica de evaluare si notare:

Evaluarea si notarea finala se va face prin rezolvarea de probleme, intocmirea


unor referate si elaborarea unor proiecte aplicative. Toate acestea se vor realiza
in cadrul examenului (colocviului) din sesiunea de examene. Intrarea in
examenul final este conditionata de realizarea sarcinilor ce rezulta din temele de
control de la sfarsitul fiecarui modul al suportului de curs. Studentii vor primi
feed-back la rezultatele realizate in examenul final prin comunicare directa cu
cei care solicita. In cazul cand studentul doreste sa revina la un examen de
marire a notei, acest nou examen se va desfasura in aceleasi conditii, cu aceleasi
cerinte, ca si examenul initial.

Elemente de deontologie academica:

Pentru a evita situatiile care pun in discutie onestitatea studentilor facem de la


inceput precizarea ca se interzice categoric frauda, iar tentativele de frauda se
5
vor trata conform reglementarilor in vigoare elaborate la nivelul facultatii si
universitatii. Este normal ca atunci cand se utilizeaza anumite date, texte,
formulari, etc. luate din alte surse, sa se faca citarea, si astfel sa se asume
meritele doar pentru munca si contributia proprie. Se va cere studentului sa aiba
un comportament academic fata de profesori si colegi.

Studentii cu dizabilitati:

Nu vor avea nici o problema in a se incadra in cerintele cursului si a celorlalte


activitati, sansele in pregatire si obligatiile lor fiind de aceeasi factura ca si
pentru studentii fara dizabilitati.

Strategii de studiu recomandate:

Recomandam studentilor sa se pregateasca mai intai din aspectele teoretice, asa


incat, mai intai, din curs, sa fie studiate modulele cu teoria si exemplele
ilustrative formulate, apoi sa se abordeze problemele rezolvate, iar apoi si
problemele formulate spre rezolvare. Pentru tot cursul, apreciem ca fondul de
timp necesar insusirii complete este de 56 de ore, din care 40 pentru suportul de
curs, 8 pentru activitatile directe cu tutorii, iar 12 pentru sarcinile individuale de
studiu al bibliografiei si realizarea temelor de control.

6
I. Suportul de curs propriu-zis

Modulul 1

JOCURI STATICE DE INFORMATIE COMPLETA

Concepte de bazǎ Jucator, strategie, castig, joc matricial, punct de echilibru

Obiective:

a. definirea notiunii de joc matricial

b. considerarea diverselor tipuri de jocuri matriciale

c. notiunea de solutie

Recomandǎri privind studiul: se recomanda studentilor sa-si insuseasca notiunile


importante, in aplicatiile practice, de joc matricial si de solutii ale acestora. De
asemenea solutiile pentru diversele probleme formulate plecand de la jocurile
matriciale

Rezultate aşteptate:

a) se asteapta ca studentii sa poata formula si opera cu diversele tipuri de


jocuri matriciale, sa le recunoasca si sa le utilizeze in aplicatii
b) sa fie in stare sa gasesca solutiile pentru jocurile si problemele simple
intalnite in aplicatii
Unitatea 1

Jocuri matriciale : definitie, clasificari, solutie

Obiective:

a) evidentierea principalelor tipuri de jocuri matriciale


b) prezentarea diverselor tipuri de clasificari
c) lamurirea notiunii de solutie

Noţiuni cheie : Jucator, strategie, castig, joc matricial, punct de echilibru

CONŢINUTUL UNITĂŢII

Există situaţii în care modelele matematice la care se ajunge se prezintă sub forma
unor jocuri matriciale. Asa sunt, de exemplu, acelea in care 2 sau mai

multi parteneri, prin deciziile pe care le iau, influenteaza rezultatul (castigul)


fiecarui participant.
7
Jocuri statice de informaţie completa

In aceasta unitate consideram jocuri de urmatoarea simpla forma: mai intai


jucatorii aleg simultan actiuni (decizii), apoi ei obtin castiguri ce depind de
combinatia actiunilor ce tocmai au fost alese. In clasa unor astfel de jocuri statice
(sau cu miscare-simultana) ne restrangem atentia asupra jocurilor cu informatie
completa. Adica, functia de castig a fiecarui jucator (functia ce determina
castigurile jucatorilor de la fiecare combinatie de actiuni) este total cunoscuta de
toti jucatorii.
Jocuri cu suma nula de doua persoane

Consideram un joc cu doi jucatori : jucatorul 1 si jucatorul 2. Ceea ce jucatorul 1


castiga este tocmai ce jucatorul 2 pierde, si vice versa.
In continuare sa avem o intelegere intuitiva a unui astfel de joc introducem, prin
cateva exemple simple, ideile de baza.
Exemplul 1.1. (Potrivirea monedelor)
Fiecare din cei doi participanti (jucatori) pune pe masa o moneda, fara ca celalalt
jucator sa o vada. Daca monedele se potrivesc, adica, daca ambele monede sunt cu
“capul” sau ambele cu “pajura”, atunci jucatorul 1 ia ambele monede. Daca ele nu
se potrivesc, jucatorul 2 ia ambele monede. In alte cuvinte, primul caz, jucatorul 1
primeste un castig (o moneda) de la jucatorul 2, si, in al doilea caz, jucatorul 1
primeste un castig de -1 (isi pierde moneda sa).
Aceste castiguri pot fi listate in urmatorul tabel:
Jucătorul 2

Jucătorul 1 1 (capul) 2 (pajura)

1 (capul) 1 -1

2 (pajura) -1 1

De asemenea, ele pot fi scrise in matricele de castig pentru cei doi jucatori:
H1 1 -1 H2 -1 1
= , =
1
-1 1 -1

Spunem ca fiecare jucator are doua strategii (actiuni, mutari, decizii). In matricea
H1 prima linie reprezinta prima strategie a jucatorului 1, a doua linie reprezinta a
8
doua strategie a jucatorului 1. Daca jucatorul 1 alege strategia 1, inseamna ca
moneda sa arata capul deasupra. Strategia 2 inseamna pajura deasupra. Similar,
prima si a doua second coloana a matricei H1 corespunde respectiv la prima si a
doua strategie a jucatorului 2. In H 2 avem aceleasi situatii, dar pentru jucatorul 2.
Observatia 1.1. Acest ansamblu de “concurs” (competitie) este un joc de doua
persoane cu suma nula (zero). Simplu spunand, un joc este o multime de reguli
in care se precizeaza intregul process de competitie (sau concurs), incluzand
jucatorii, strategiile, si castigurile (rezultatele) dupa fiecare jucare a jocului. Toate
acestea sunt descrise complet.
Observatia 1.2. Datele (elementele) din tabelul de mai sus formeaza o matrice
de castig (payoff matrix a jucatorului 1, adica H1 ). Matricea H 2 este matricea de
castig a jucatorului 2, si avem

t
H1 H 2 O2 ,

unde H 2t este transpusa lui H 2 .


Observatia 1.3. Castigul este o functie de strategiile celor doi jucatori. Daca, de
exemplu , moneda jucatorului 1 este cu capul deasupra (strategia 1) si moneda
jucatorului 2 este cu capul deasupra (strategia 1), atunci elementul h11 = 1noteaza
castigul pe care jucatorul 1 il primeste de la jucatorul 2. La fel, daca jucatorul 1
alege strategia 2 (pajura) si jucatorul 2 alege strategia 1 (capul), atunci elementul
h21 = -1 este castigul pe care jucatorul
1 il “primeste”. In acest caz, castigul pe care
jucatorul 1 il primeste este un numar negativ. Aceasta inseamna ca jucatorul 1
pierde o unitate monetara, deci jucatorul 1 plateste o unitate monetara jucatorului 2
Exemplul 1.2. (Piatra-hartia-foarfecele)
Foarfecele “bate” hartia, hartia “bate” piatra, si piatra “bate” foarfecele. Exista doi
jucatori: 1 si 2. Fiecare jucator are trei strategii. Fie strategiile 1, 2, 3 reprezentand
piatra, hartia respectiv foarfecele. Daca presupunem ca invingatorul cadstiga cate 1
unitatea monetara de la cel care pierde atunci matricea de castig este:

9
Jucătorul 2

1 2 3

Jucătorul 1 1 0 -1 1

2 1 0 -1

3 -1 1 0

Observatia 1.4. Matricele de castig pentru cei doi jucatori sunt:


0 -1 -1 0 -1 1
H1 =
1 0 -1, H2 1 0 -1 ,
=
0 0
-1 1 -1 1

Avem H1 = H2 si H1 + H 2t = O3 .
Exemplul 1.3. Consideram jocul de doua personae cu suma nula pentru care
matricea de castig este data in urmatorul tabel:
Jucătorul 2

q 0 1 2
p

Jucătorul 1 0 0 1 4

1 -1 2 7

2 -4 1 8

3 -9 -2 7

Avem matricele de castig:


0 1 4 0 1 4 9
-1 2 7
H1 H2 -2 -1
= , -1 2
=
-4 1 8 -4
-7 -8 -7

-9 -2 7

Jucatorul 1 are patru strategii, in timp ce jucatorul 2 are trei strategii.


Observatia 1.5. Castigul jucatorului 1 (adica, ceea ce jucatorul 2 plateste la
jucatorul 1) poate fi determinat de functia
10
2 2
f : 0, 1, 2, 30, 1, 2Z, f p, q q p 2pq.

In fiecare din exemplele de mai sus exista doi jucatori, anume jucatorul 1 si
jucatorul 2, si o matrice de castig, H1 (exista de asemenea si matricea H 2 asa ca
H1 + H 2t = 0 ). Fiecare jucator are mai multe strategii. Strategiile jucatorului 1 sunt

reprezentate de liniile matricei de castig H1 , si acelea ale jucatorului 2 de


coloanele matricei de castig H1 . (Strategiile jucatorului 2 sunt reprezentate de
liniile matricei de castig H 2 , si acelea ale jucatorului 1 de coloanele matricei de
castig H 2 ).
Jucatorul 1 alege o strategie din multimea strategiilor sale, si jucatorul 2,
independent, alege o strategie din multimea strategiilor sale. Dupa ce cele doua
alegeri au fost facute, jucatorul 2 plateste jucatorului 1 o valoare, care este castigul
corespunzator acestei situatii jucare a jocului. Aceasta valoare este reprezentata in
matricea de castig. Aceasta valoare poate fi pozitiva, 0, sau negativa. Daca castigul
este pozitiv, jucatorul 1 primeste o valoare pozitiva de la jucatorul 2, adica,
jucatorul 1 castiga o valoare de la jucatorul 2. Daca castigul este negativ, jucatorul
1 primeste o valoare negativa de la jucatorul 2, adica, jucatorul 1 pierde o valoare
catre jucatorul 2 (jucatorul 2 castiga o valoare de la jucatorul 1). Castigul
jucatorului 1 este egal cu pierderea jucatorului 2. Ce jucatorul 1 castiga este tocmai
ceea ce jucatorul 2 pierde, si vice versa. De aceea, un astfel de joc este numit un
joc cu suma zero (nula).

Jocuri matriciale
In cele ce urmeaza presupunem ca jucatorul 1 are m strategii si jucatorul 2 are

n strategii. Notam prin aij , i = , j= castigul pe care jucatorul 1 il obtine


1, m 1, n
de la jucatorul 2 daca jucatorul 1 alege strategia i si jucatorul 2 alege strategia j .
Asa obtinem matricea de castig H1 (º A) :

a a ... a
11 12 1n
a a ... a
A
=
(aij )= 21 22 2n

...... ... ...


a a ... a
m1 m2 mn

11
Definitia 1.1. Numim joc matricial jocul care este complet determinat de matricea
A de mai sus.

Sa rezolvam jocul, adica sa gasim solutia (ce castig maxim are jucatorul 1 si ce
startegii sunt alese de ambii jucatori pentru a obtine aceasta) examinam elementele
matricei A .
In acest joc, jucatorul 1 vrea sa obtina un castig aij cat mai mare posibil, in timp ce
jucatorul 2 va face alegerea sa cea mai buna si conduca la o valoare aij cat mai mica
posibil. Interesele celor doi jucatori sunt complet opuse (in conflict).

Daca jucatorul 1 alege strategia i el poate fi sigur ca va obtine cel putin castigul

min a ij .
1j n

Acesta este elementul minim al liniei i din matricea de castig A .


Deoarece jucatorul 1 vrea sa-si maximizeze castigul sau el poate alege strategia i
asa incat sa faca valoarea de mai sus cat de mare posibil. Adica, altfel spus
jucatorul 1 poate alege strategia i in asa fel incat el sa primeasca un castig nu mai
mic decat

max min a ij .
1i m 1 j n

Cu alte cuvinte, daca jucatorul 1 face cea mai buna alegere a sa, ceea ce obtine el
nu poate fi mai mic decat valoarea de mai sus.
Similar, daca jucatorul 2 alege strategia sa j , el va pierde cel mult

max a ij .
1 i m

Dar, jucatorul 2 vrea sa-si minimizeze pierdearea sa, iar pentru asta va incerca sa
sa-si aleaga strategia sa j asa ca sa obtina minimul valorii de mai sus. Anume,
jucatorul 2 poate alege j asa incat pierderea sa sa fie nu mai mare decat

min max a ij .
1j n 1 i m

Asa, daca jucatorul 2 face cea mai buna alegere a sa, castigul pe care il obtine
jucatorul 1 nu poate fi mai mare decat valoarea de mai sus.
Am vazut ca jucatorul 1 poate alege strategia i care sa-I asigure un castig care sa
fie cel putin
12
v 1 max min a ij ,
1i m 1 j n

in timp ce jucatorul 2 poate alege strategia j asa ca sa faca pierderea sa (castigul


jucatorului 1) cel mult

v 2 min max a ij .
1j n 1 i m

Exista ceva relatie intre valorile v1 si v2 ? Raspunsul este dat prin


Lema 1.1. Urmatoarea inegalitate are loc: v1 £ v2 , adica

v 1max min a ij min max a ijv 2 .


1 i m 1 j n 1 j n1 i m
Demonstratie. Pentru fiecare i = avem
1, m
£ aij , j=
min aij 1,
n
1£ j £n

si pentru fiecare j = 1, n avem

a
ij £ max aij , i = 1, m
1£ j £n

Deci inegalitatea

min a ij max a ij
1 j n 1 i m
are loc, pentru fiecare i = , si fiecare j = .
1, m 1, n

Deoarece membrul stang al ultimei inegalitati este independent de j , luand


minimul in raport cu j in ambii membri avem
min aij £ min max aij = v2 i = 1, m
1£ j £n 1£ j £n 1£i£m

adica,

min a ij v2.
1 j n

Deoarece membrul drept al ultimei inegalitati este independent de i , luand


maximul in raport cu i in ambii membri obtinem
13
max min a ij v2,
1 i m 1 j n

adica, , si demonstratia este completa.


v1 £ v2

Sa examinam cele trei exemple din sectiunea 1.1.


In Exemplul 1.1 avem m = 2 , n = 2 , deci
v1 = max min aij = max(-1,-1) = -1,
1£i£2 1£ j £2

v2 = min max aij = min(1,1) = 1.


1£ j £2 1£i£2

Asa, in Exemplul 1.1 avem v1 < v2 .

In Exemplul 1.2, avem m = 3 , n = 3 , deci


v1 = max min aij = max(-1,-1,-1) = -1,
1£i£3 1£ j £3

v2 = min max aij = min(1,1,1) = 1.


1£ j £3 1£i £3

Asa, in Exemplul 1.2 avem v1 < v2 .


In Exemplul 1.3, avem m = 4 , n = , deci
3
v1 max min aij = max(0,-1,-4,-9) = 0,
1£i £4 1£ j £3
=

min max aij = min(0, 2,8) = 0.


v2 =1£ j £3 1£i £4

Asa, in Exemplul 1.3 avem v1 = .


v2

Puncte sa in strategii pure

Exista situatii in care v1 = v2 . In consecinta dam


Definitia 1.2. Daca elementele matriei de castig A ale jocului matriceal satisfac
urmatoarea egalitate
v1 = max min aij = min max aij =
v2 ,
1£i £m 1£ j £n 1£ j £n 1£i £m

cantitatea v(= v1 = v2 )este numita valoarea jocului.

Observatia 1.6. Valoarea v este valoarea comuna a acelora date in (3) si (5).
Valoarea jocului din Exemplul 1.3 este v = 0 .
14
Daca egalitatea (7) are loc, atunci exista un i* si un j* astfel incat
min a * j = max min aij =
v,
i 1£i£m 1£ j £n
1£ j £n

si
max a * min max aij = v.
1£ j £n 1£i £m
=
1£i£m ij

Deci
min a * j = max * .
a
i ij
1£ j £n 1£i£m

Dar, evident avem


min a * £ £ max a .
*
* *

a
1£ j £n i j i j
1£i £m
ij

Astfel
max a = a
*

= v = min a *
*

* .
1£i £m ij i j 1£ j £n i j

Deci, pentru orice i si orice j


aij * £ ai* j* = v £ ai* j .

In consecinta, daca jucatorul 1 alege strategia i* , atunci castigul sau nu poate fi


mai mic decat v daca jucatorul 2 pleaca de la strategia j* ; daca jucatorul 2
alege strategia j* , atunci castigul sau nu poate sa depaseasca v daca jucatorul 1
se departeaza de la strategia i* .
Definitia 1.3. Numim i* si strategii optimale ale jucatorilor 1 si 2
j*
respectiv. Perechea (i* , j* ) este un punct sa (saddle point) in strategii pure a
jocului. Spunem ca i = i* , j = j* este o solutie (sau echilibru Nash) a jocului.

Observatia 1.7. Relatia (8) ne arata ca valoarea castigului la punctul sa (i* , j* )

(solutia jocului) este valoarea jocului. Cand jucatorul 1 isi mentine strategia sa
optimala i* , el se poate astepta sa-si creasca castigul sau daca jucatorul 2 se
departeaza de la startegia sa optimala j* . Similar, daca jucatorul 2 isi mentine
strategia sa optimala j* , castigul jucatorului 1 poate descreste daca el se
departeaza de la strategia sa optimala i* . Astfel, daca jocul are un punct sa
(i* , j* ) atunci egalitatea (7) are loc si a = v .
i*j*

Observatia 1.8. Un joc matriceal poate avea mai mult decat un punct sa in
startegii pure. Totusi, castigurile la diferitele puncte sa sunt egale,. Valoarea lor
comuna fiind valoarea jocului.
15
Exemplul 1.4. Consideram jocul matrieal cu matricea de castig
4 3 6 2
A= 1 2 0 0
6 7
5 5

Avem pentru minimul liniilor sale

min 4, 3, 6, 2 2, min 1, 2, 0, 0 0, min 5, 6, 7, 5 5

si atunci maximul acestor minime este:


max(2, 0, 5) = 5 = v1.

Acum, avem pentru maximele coloanelor sale


max(4,1, 5) = 5, max(3, 2, 6) = 6, max(6, 0, 7) = 7, max(2, 0, 5) = 5,

si atunci minimul acestor maxime este:


min(5, 6, 7, 5) = 5 = v2 .

Cum v1 = v2 = 5 avem punct sa in satrategii pure. Este usor de verificat ca (3,1) si (3,
4) sunt ambele puncte sa in strategii pure pentru ca

a31 a34 v 5.

Observatia 1.9. Daca jocul matricial are un punct sa in startegii pure (i* , j* ) ,
atunci el este foarte usor de gasit. Realmente, prin Definitia 1.3 a unui astfel de
punct sa in startegii pure (8), valoarea este un element din matricea de castig

ai * j *

A = (aij ) care este in acelasi timp minimul din linia sa si maximul din coloana sa.

In Exemplul 1.3, (1,1) este un punct sa in strategii pure al jocului deoarecei a11 = 0
este cel mai mic element din prima linie si in acelasi timp este cele mai mare
element din prima coloana.
In Exemplul 1.4 a31 = a34 = 5 sunt doua elemente cu cea mai mica valoare in linia a
treia si in acelasi timp cele mai mari din prima si a patra coloana, respective.
Un joc matricial poate avea mai multe puncte sa in strategii pure. In acest caz
putem demonstra urmatorul rezultat:

16
Lema 1.2. Fie (i* , j* ) si (i** , j** ) puncte sa in strategii pure ale unui joc
matricial. Atunci (i* , j** ) si (i** , j* ) sunt de asemnea puncte sa in strategii pure si
valorile la toate aceste puncte sa sunt egale, adica
ai * j* = ai ** j ** = ai * j ** = ai ** j * .

i,j i,j
Demonstratie. Dovedim ca este un punct sa in startegii pure. Faptul ca
este un punct sa in startegii pure se face intr-un mod similar.
Deoarece (i* , j* ) este un punct sa in strategii pure avem
aij* £ ai* j * £ ai* j

pentru toti i=1, si toti j=1,n . Deoarece (i** , j** ) este un punct sa in strategii
m
pure avem
aij ** £ ai** j** £ ai** j

pentru toti i=1, si toti j=1,n . Din aceste inegalitati obtinem


m
ai* j* £ ai * j ** £ ai** j ** £ ai** j* £ ai* j * ,

care dovedesc (9). Prin (9) si prin inegalitatile de mai sus avem
aij * £ ai* j** £ ai* j

pentru toti i=1,m si toti j=1,n . Deci (i* , j** ) este un punct sa in strategii pure.
Din aceasta lema rezulta ca un joc matricial cu puncte sa in strategii pure are
urmatoarele proprietati:
- interschimarea sau proprietatea rectangulara a punctelor sa in strategii pure,
- egalitatea valorilor la toate punctele sa in startegii pure.
Exemplul 1.5. Jocul cu matricea de castig
3 0 -5
A=-7-1 4
1
2 1

are punctual sa in strategii pure (3, 2) deoarece v = 1 , v 2 = 1 si a 32 = v = 1 .


1

Exemplul 1.6. Perechea (3, 3) este un punct sa in strategii pure pentru jocul ca
matricea de castig
17
0 -1 -1
A=1 0 -1
1 0
1
Avem v = 0 .
Exemplul 1.7. Perechea (2, 3) este un punct sa in strategii pure pentru jocul cu
matricea de castig
2 -3 -1 4
A= 1 2 0 1
-2 3 -1 -2

Valoarea jocului este v = 0 .


Exemplul 1.8. Jocul cu matricea de castig
4 1 1
A= 2 1 1
-1
-7 4

are patru puncte sa in strategii pure deoarece avem (vezi Lema 1.2)
a12 = a13 = a22 = a23 = 1 = v.

Exemplul 1.9. Jocul cu matricea de castig


7 5 6
A= 0 9 4
1
14 8

Nu are un punct sa in strategii pure, in sensul Definitiei 1.2 deoarece


v1 max(5, 0,1) =5
=

si v2 min(14, 9, 8) = 8.
=

18
Unitatea 2

Jocuri matriciale si programare liniara

Obiective:

a) studentii trebuie sa cunoasca elementele de programare liniara

b) sa stie incadra un joc matricial in una din problemele de programare


liniara de care ea apartine

c) sa-si insuseasca metodele de rezolvare si sa interpreteze rezultatele


obtinute

Noţiuni cheie : ecuatii liniare, functii scop, probleme de programare liniara,


probleme duale, algoritmul simplex, solutii

CONTINUTUL UNITǍTII

Jocuri matriciale si programare liniara

In continuare, formulam jocul matricial ca o problema de programare liniara. Fie


A = (aij ) matricea de castig a jocului.
Nu este o restrictie sa presupunem ca aij > 0 pentru toti i = , si pentru toti
1, m
j= . Atunci valoarea v a jocului trebuie sa fie un nunar pozitiv.
1, n
Prin alegearea strategiei mixte X Î S m jucatorul 1 poate obtine celk putin castigul

asteptat

min XA j u.
1j n

Deci avem XA· j ³ u , j = 1, n adica


m

∑aij xi ³ u, j = 1.n
i =1

cu
m

∑ xi =1 xi ³ 0, i = 1, m.
i=1

Notam xi / u = xi, , i = 1, m . Atunci problema devine

19
∑aij xi, ³ 1, j = 1, n
1
∑ xi, =
u

xi, ³ 0, i = 1, m

Jucatorul 1 vrea sa-si maximizeze valoarea u , (acest maxim este valoarea v a


jocului), adica, el vrea sa minimizeze valoarea 1/u. Astfel problema se reduce la
urmatoarea problema de programare liniara

min f x1 x2 xm

a ij x i 1, j
i 1

xi 0, i

Similar, jucatorul 2, prin alegerea unei strategii mixte Y Î Sn , poate face ca


jucatorul 1 sa nu primeasca mai mult decat
max A Y t = w.
1£i£m i·
t
Asa, avem A Y £ w , i = , adica,
1, m
i
·

∑aij y j £ w, i = 1.m
j=1

unde
m

∑yj =1 y j ³ 0, j = 1, n,
j=1

Notam y j / w = y ,j , j = 1, n .

Deoarece jucatorul 2 vrea sa minimizeze w (acest minim este la fel valoarea v a


jocului), adica, el vrea sa maximizeze valoarea 1/w , problema de mai sus se
reduce la urmatoarea problema de programare liniara, care este duala lui (39),
formulata mai sus:

20
max g y 1 y2 yn

a ij yj 1, i
j 1

yj 0, j .

Astfel problema gasirii solutiei unui joc matricial este este echivalenta cu
problema rezolvarii unei perechi de probleme de programare liniara duale.
Observatia 1.28. Datorita teoremei dualitatii, bine cunoscuta in programarea
liniara, este suficient sa se rezolve una singura dintre acele probleme de mai sus.

Exemplul 1.18. Consideram acelasi joc matricial ca in Exemplul 1.17. Astfel


avem
4 2 3
=
B 3 4 2

Sa obtinem ai > 0 vom aduna constanta 1 la fiecare element al matriei B si asa


j

vom obtine
5 3 4
A= 4 5 3
1
5 9

Corespunzatoarea problema de programare liniara (40) este


[max]g = y1, + y2 , + y3 ,

5 y , + 3 y ,+ 4 y
,
£ 1
1 2 3
4 y , + 5 y ,+ 3 y , £ 1
1 2 3
, ,
5y, +y +9y £ 1
1 2 3
, ,
y, ,y ,y ³ 0
1 2 3

In continuare se rezolva aceasta problema folosim metoda simplex. Matricea


simplex poate fi scrisa si apoi folosim algoritmul simplex.

21
Unitatea 3

Joc necooperativ

Obiective:

a) studentii trebuie sa recunoasca tipurile de jocuri necooperative

b) sa stie incadra un joc necooperativ in unul din categoriile de care el


apartine

c) sa-si insuseasca metodele de solutionare directa in cazul diferitelor tipuri


de jocuri necooperative

Noţiuni cheie : jucator, strategie (mutare, decizie), castig, punct de echilibru

CONŢINUTUL UNITĂŢII

1. Definiţia jocului necooperativ

Teoria jocurilor este acea ramură a matematicii care formulează şi rezolvă


probleme legate de diferite modele ale situaţiilor conflictuale. Deoarece jocul este
prototipul situaţiilor conflictuale de orice fel, termenii teoriei jocurilor sunt în mare
parte daţi prin termeni uzuali folosiţi în jocurile efective. Astfel de termeni sunt, de
exemplu joc, câ ştig, strategie şi altele. Orice termen al teoriei jocurilor are însă un
conţinut cu caracter pur matematic. Termenul joc este folosit pentru denumirea
unui joc oarecare, definit matematic. Orice joc definit, pentru a i se scoate în
evidenţă aspectul concret în raport cu jocul în general, va fi supranumit prin
folosirea unui atribut, de obicei cu un anumit sens din limbajul de toate zilele.
Pentru a deosebi acest joc de jocul efectiv se mai adaugă uneori atributul matematic
şi se spune, mai complet, joc matematic.

La orice joc obişnuit participă un număr de n (număr natural) jucători. Din


punct de vedere matematic numai existenţa jucătorilor este esenţială, precum şi
posibilitatea identificării lor, respectiv deosebirii lor de toţi ceilalţi jucători. De
aceea mulţimea jucătorilor I se identică cu multimea primelor n numere naturale:
I = {1,..., n}. Fiecare jucător i, i Î I , poate aplica mai multe strategii. În cazul unui
joc efectiv jucătorul i poate, în momentele de decizie ale jocului, să aleagă dintr-o
mulţime Si de variante. Vom considera că Si este o multime finită pentru orice i.
Deoarece din punct de vedere matematic natura concretă a variantelor nu este
interesantă, doar posibilitatea de identificare a lor, se va nota Si = {1,..., mi }şi se
consideră în continuare notaţia generală Si = {si }, unde i = 1, n (i variază de la 1
la

22
n) şi pentru i fixat si = 1, mi ( si variază de la 1 la mi ). Luând câte o strategie a
fiecărui jucător se obţine o situaţie (strategie) a jocului s = (s1 ,..., sn ), element
al produsului cartezian S = S1 x...xS n = P Si .
iÎI

În fiecare situaţie s, fiecare jucător i, primeşte o sumă H i (s). Aceată funcţie,


definită pe mulţimea tuturor situaţiilor s, se numeşte matricea de câ ştig a
jucătorului i.

Definiţia 1. Se numeşte joc necooperativ sistemul

G =< I , {Si }{,H i }, i Î I >

în care I şi Si sunt mulţimi (secţiuni) de numere naturale, iar H i = H i (s) sunt funcţii
reale definite pe mulţimea S , s Î S , S = P Si .
iÎI

Observaţia 1. Denumirea de matrice de câ ştig pentru funcţia H i (s) este


justificată prin aceea că mulţimea valorilor funcţiei poate fi scrisă efectiv în forma
unei matrice n-dimensionale de tip {m1 ,..., mn }. Prin aceasta se explică denumirea
de joc matriceal atunci când dorim s ă scoatem în evidenţă că jocul este dat prin
matrice n-dimensionale.

Exemplul 1. Doi jucători, independent unul de celălalt, pun pe masă câte o


monedă de acelaşi fel. Dacă ambii jucători au ales aceeaşi faţă, atunci primul
jucător ia ambele monede, iar în caz contrar, cel de-al doilea jucător ia ambele
monede.
Primul jucător este notat cu 1, al doilea jucător cu 2. Deci I = {1,2}. Fiecare
jucător are 2 strategii: S1 = {1,2}, S2 = {1,2}. După cum s1 = 1, respectiv
s = 1, jucătorul 1 a ales ,,banul”, respectiv ,,stema”. La se interpretează valoarea
2
fel
s2 = 1, respectiv s2 = 2, pentru jucătorul 2. Prin urmare
S = S1 ´ S 2 = {(1,1), (1,2), (2,1), (2,2)}. Acestui joc, notat G , i se atribuie simbolul:

G =< I,S1,S2,H1,H2 > .

Matricea de câ ştig H1 (s) a jucătorului 1 se poate scrie în forma:


H1 H1 (1,1) H (1,2) 1 -1
1
(s)= =

H (2,1) -1 1
1
H1 (2,2)

unele linii corespund strategiilor jucătorului 1 şi coloanele corespund strategiilor


jucătorului 2.
23
Matricea de câ ştig a jucătorului 2 are următoarea exprimare:
H2 H 2 (1,1) H 2 (2,1) -1 1
(s) = = 1
H 2 (1,2) H 2 (2,2) -1

unde acum liniile corespund strategiilor jucătorului 2 şi coloanele corespund


strategiilor jucătorului 1.

Observaţia 2. O notaţie mai generală pentru matricele de câ ştig este în


forma unui tabel de tipul următor:

Situaţia Matricea de câ ştig

s ... sn H ... Hn
1 1

Astfel, în cazul exemplului considerat, matricele de câ ştig pot fi date şi în


următoarea formă:

Situaţia Matricea de câ ştig

s1 s2 H1 H2

1 1 1 -1
1 2 -1 1

2 1 -1 1

2 2 1 -1

1. Definiţia punctului de echilibru

Fie dat un joc necooperativ oarecare


G =< I , {Si },{H i }, i Î I >

şi să presupunem că jocul se repetă de mai multe ori.

Analizând exemplul 1 din punctul precedent se cons tată că nu este avantajos


pentru nici unul dintre jucători să aplice permanent una şi aceeaşi strategie. Dacă,
de exemplu, jucătorul întâi ar aplica permanent strategia 1, juc ătorul 2 ar observa
acest lucru şi ar aplica permanent strategia 2 şi jucătorul întâi ar pierde (ar avea

24
câ ştig negativ) permanent. Situaţie similară s-ar produce dacă jucătorul 1 ar aplica
permanent strategia a doua.

Dacă analiza s-ar fi făcut din punctul de vedere al jucătorului 2 am fi ajuns la


aceiaşi concluzie: nu este avantajos ca jucătorul 2 să aplice permanent una şi aceiaşi
strategie.

s = (s1 , s2 ),
Din cele stabilite rezultă că în orice situaţie unul dintre jucători are o altă
situaţie preferată s', faţă de cea existentă s în acel moment, la care se poate ajunge
modificând numai strategia juc ătorului cu altă preferinţă:

Situaţia preferată s' pentru


Situaţia dată s jucătorul

1 2

(1,1) (1,2)

(1,2) (2,2)

(2,1) (1,1)

(2,2) (2,1)

În concluzie, jocul repetându-se este necesar ă aplicarea fiecărei strategii si cu


probabilitatea (frecvenţa relativă) pis care să asigure un câ ştig cât mai mare, în
i

totalitatea jocurilor jucate, pentru fiecare jucător, sau, ceea ce este acelaşi lucru, de
a asigura valoarea medie cea mai mare posibilă a câ ştigului pentru fiecare jucător.

Pentru notarea matricei linie a tuturor probabilităţilor pis , si i 1, mi , asociate


=
Pi , indiferent de
jucătorului i, se foloseşte simbolul Pi = [pi1 ,..., pim ]. . Vectorul
i

valorile probabilităţilor, se numeşte strategie mixtă a jucătorului i. Dacă o singură


probabilitate din vectorul Pi , este diferită de 0, fiind egală cu 1, atunci Pi , este
(echivalentă cu) strategia pură si a jucătorului i. Dacă toate strategiile Pi , i = 1, n
sunt pure, P = (P1 ,..., Pn ) este (echivalentă cu ) strategia pură (situaţia s = (s1 ,..., sn )) a
întregului joc.

Notăm cu J i matricea linie formată din mi cifre egale cu 1 şi atunci se poate


scrie Pi J iT = 1, unde T este simbolul transpunerii matricei.
25
Cu Pi notăm strategia mixtă a tuturor jucătorilor j, cu excepţia jucătorului i,
luaţi la un loc, presupunând c ă fiecare jucător şi-a fixat strategia sa în mod
independent de restul jucătorilor: P =
i
P Pj . Aici înmulţirea vectorilor se consideră
j ¹i

componentă cu componenţă în sensul unui produs cartezian. Prin convenţie se


asigură ordonarea lexicografică la scrierea elementelor vectorului Pi . De exemplu,
dacă P1 = [p11 , p12 ], P2 = [p21 , p22 , p23 ], P3 = [p31 , p32 , p33 , p34 ], sunt strategiile
mixte ale jucătorilor I = {1,2,3}, avem

P1=P2´P3 =
= p p ,p p ,p p ,p p ,p p ,p p ,p p ,p p ,p p ,p p ,p p ,p p
[ 21 31 21 32 21 33 21 34 22 31 22 32 22 33 22 34 23 31 23 32 23 33 23 34 ]
P2 =P1´P3=
= p p ,p p ,p p ,p p ,p p ,p p ,p p ,p p
[ 11 31 11 32 11 33 11 34 12 31 12 32 12 33 12 34 ]
P3=P1´P2=
= p p ,p p ,p p ,p p ,p p ,p p .
[ 11 21 11 22 11 23 12 21 12 22 12 23 ]
Cu notaţiile introduse dăm următoarea definiţie:

Definiţia 1. Rezolvarea jocului necooperativ constă în determinarea acelor


strategii mixte (soluţii) Pi , Pi J iT = 1, i = 1, n , pentru care, considerând constant
vectorul P , funcţia de câ ştig Fi = Pi H PT are valoare maximă, oricare ar fi i.
i
i i

Strategiile Pi , se notează cu P = (P1 ,..., Pn ) şi obiectul matematic astfel determinat se


numeşte punct de echilibru al jocului.

Exemplul 2. Datele jocului necooperativ din exemplul precedent. pot fi


reprezentate prin următoarele 2 tabele:

F F
1 2

P p p P p p
2 21 22 1 11 12

P1 P2

p11 1 -1 p -1 1
21

p -1 1 p22 1 -1
12

cărora le corespund următoarele sisteme de egalităţi

26
p11 + p12 = 1, p21 + p22 = 1,
F1 = ( p21 - p22 ) p11 + (- p21 + p22 )p12 ,
F2 = (- p11 + p12 ) p21 + ( p11 - p12 )p22 .

Dacă P1 , P2 este soluţia problemei, atunci nu există nici un vector de probabilitate

[ ] (
P10 = p110 , p120 pentru care F10 = F1 P10 , P2 > F1 = F1 (P1 , P2 ), unde )
F10 = (p21 - p22 )p110 + (- p21 + p22 )p120 şi nu există nici un vector de probabilitate

P20 = F2
[ ]
= p210 , p220 pentru care F20 (P1, P20 )> F2 = F2 (P1 , P2 ), unde
F20 = (- p11 + p12 )p210 + (p11 - p12 )p220 .

De exemplu, 1 1 1 1 este o soluţie a jocului şi avem


P =
1 , , P
2 = ,
2 2 2 2
F =F2 =0.
1

3. Stabilirea punctelor de echilibru ale jocului necooperativ

Soluţia problemei exemplului 1 din punctul precedent a fost obţinută printr-


un procedeu particular, în funcţie de elementele matricelor asociate jocului
respectiv şi nu printr-o metodă care să fie valabilă în cazul oricărui joc necooperativ
şi pentru orice soluţie a acestuia.

Pentru a rezolva jocul necooperativ, potrivit definiţiei 1 din presupunem că


am obţinut strategiile mixte Pi , i = 1, n şi scriem funcţiile de câ ştig Fi , în formă
matriceală Fi = Pi FTi , unde Fi = [Fi ,..., Fi ] este o matrice linie cu mi componente
egale cu Fi .
Reamintim că J i este un vector linie format din mi componente egale cu 1.

Astfel, având în vedere defini ţia amintită rezultă că se poate scrie

Pi H i PiT = Pi FTi ,

adică

Pi (H i PiT - F T
i )= 0,
unde
P ³ 0, i = 1, n şi H PT -F T £0.
i i i
i

27
Dacă componenta j a vectorului H i PiT - F Ti ar fi pozitivă, atunci prin
înmulţirea la stânga cu vectorul Pi* cu toate componentele egale cu 0, exceptând
componenta j egală cu 1, ar rezulta Fi* = Pi* H i PiT > Fi , contrar definiţiei 1 conform
căreia F este valoarea maximă a expresiei P* H PT pentru P fixat.
i i i i i

Astfel raţionând, P fiind un vector linie de probabilităţi i pisi , 0 pis


i
£1
£
pentru orice valori ale probabilităţilor, deci şi pentru soluţia problemei pentru care
avem maxim, maximul funcţiei de câ ştig Fi este atins (între altele) pentru o
strategie si pentru care
H i (si0 )PT = max H i (si0 )PT ,
0
i i

si

unde si0 este o strategie oarecare. Aici cu H i (si )PiT , respectiv H i (si0 )PiT am
notat elementul cu indice de linie si , respectiv si0 al matricei H i PiT .
Introducând o matrice linie Ti cu variabile independente nenegative tis , si = 1, mi i

[
Ti = ti1 ,..., timi , ]
pentru fiecae jucător i, se poate scrie o ecuaţie matriceală echivalentă cu inecuaţia

H i PT - F T
i £0; FTi - H i PT = TiT .
i i

În concluzie rezultă următoarea teoremă:

Teorema 1. Determinarea punctelor de echilibru ale jocului necooperativ


constă în rezolvarea, în numere negative, a sistemului de ecuaţii multiliniare:

Pi J iT = 1, FTi - H i PT = TiT , PiTiT = 0,


i

unde i= .
1, n
Observaţia 1. Valorile reale necunoscute Fi se consideră scrise ca
,
diferenţă a două valori nenegative F şi F ,,, F =F ,
- F ,, pentru a avea toate
i i ii i

necunoscutele nenegative.

Observaţia 2. Pentru rezolvarea problemei formulate in teorema 1 şi în


mod implicit pentru rezolvarea problemei formulate prin definiţia 1 din punctul
precedent se poate aplica orice metodă pentru rezolvarea sistemelor de ecuaţii-
inecuaţii de grad oarecare în numere negative. O metodă destul de eficientă este
metoda eliminării complete.
28
Observaţia 3. Având în vedere c ă determinarea punctelor de echilibru ale
unui joc necooperativ constă în rezolvarea sistem de ecuaţii multiliniare, teoria ce
se prezintă ar putea fi intitulată ,,teoria jocurilor multiliniare,,

Prin faptul că am descris metoda de rezolvare a oricărui joc necooperativ încă nu


rezultă că soluţia este efectivă şi nu este vidă. De aceea este importantă următoare
teoremă a lui Nash

Teorema 2. (J. Nash) Orice joc necooperativ are soluţia nevidă.

Nu vom da demonstraţia acestei teoreme din următoarele două motive în


primul rând pentru c ă se bazează pe cunoştinţe matematice care depăşesc cadrul
cursului şi în al doilea rând pentru c ă nu este constructivă ci existenţială.

Exemplul 1. Problema din exemplul 1. punctul precedent, conform


teoremei 1, este echivalentă cu problema rezolvării în numere nenegative,
P1³0, P2 ³0,T1³0, T2 ³ 0, a sistemului de ecuaţii multiliniare:
P1J1T = 1, F1T - H1PT = T1T P1T1T = 0,
1

P2J2T =1, FT2 - H2PT = T2T P2T2T = 0,


2

unde
P1 = [p11 , p12 ], P2 = [p21 , p22 ],

P1 = P2, P2 = P1,
J1 = J2 = [1,1]
T1 = [t 11 , t12 ], T2 = [t 21 , t22 ],
H1 = 1 -1 H 2 -1 1
, =
-1 1 1 -1

[ ] [
F1 = F1' - F1', F1' - F1' , F2 = F2' - F2', F2' - F2' , ]
unde

F1' ³ 0, F1' ³ 0, F2' ³ 0, F2' ³ 0, F1' - F1' = F1, F2' - F2' = F2 ,

sau, în formă dezvoltată şi reordonată:

p11 + p12 = 1, p21 + p22 = 1,


p21 - p22 - F1' + F1 ' + t11 = 0
-
p21 + p22 - F1 '

29
- p11 + p12 - F2' + F2' + t21 = 0,
p11 - p12 - F2' + F2' + t22 = 0

p11t11 = 0, p12 t12 = 0, p21t21 = 0, p22 t22 = 0.

Rezolvând acest sistem prin metoda elimin ării se obţine soluţia găsită cu ocazia
rezolvării problemei din exemplul 1, punctul 2. prin procedeul particular.

Observaţia 4. Având în vedere nenegativitatea necunoscutelor, avem


următoarele echivalenţe

p t + p t = 0 Û p11t11 = 0, p t = 0,
11 11 12 12 12 12

p t + p t = 0 Û p21t21 = 0, p22t22 = 0,
21 21 22 22

Şi prin urmare ecuaţia PiTiT = 0 poate fi înlocuită cu mi ecuaţii de forma


pisi tisi = 0, si = 1, mi oricare ar fi i, i = 1, n.

4. Stabilirea punctelor de echilibru ale jocului bimatriceal

Definiţia 1. Jocul necooperativ în cazul a doi jucători se numeşte joc


bimatriceal.

Un astfel de joc permite o rezolvare mai simplă. Problema formulată prin teorema
P =P
1 2

1 din punctul 4.3. având în vedere c ă şi P2 = P1 poate fi descompusă în trei


subprobleme independente. Subproblema (1) constă în rezolvarea în numere
nenegative P2 a sistemului de ecuaţii liniare

P2J2T =1, , (1)


T
F1T T
- H1P2 = T1

Subproblema (2) constă în rezolvarea în numere nenegative P1 a sistemului de


ecuaţii

P1 J1T = 1, (2)
FT2 - H2P1T = T2T

ambele subprobleme rezolvându-se prin metoda simple x. Deoarece soluţia


generală se obţine ca o combinaţie liniara convexă a soluţiilor de bază, rezultă că
trebuie să selectăm acele soluţii de bază (P1 , P2 ) pentru care se verifică şi
subproblema (3) formată din sistemul de ecuaţii

30
P1T1T = 0 , P2T2T = 0.

Dacă pentru un indice s1 oarecare, 1 £ s1 £ m1 necunoscuta t1s intră în soluţia de bază 1

a subproblemei (1) şi pe deasupra t1s ¹ 0 ( t1s = 0 în caz de degenerare), atunci 1 1

p =0
1s1

Deci pentru toate cazurile t1s ¹ 0 avem p1s = 0 şi la fel pentru t2 s


1 1 21 ¹ 0 rezultă
p
2 s21 = 0 proprietatea care permite stabilirea soluţiei care verifică sistemul (3).

Soluţia generală se obţine scriind combinaţia liniară convexă a tuturor


soluţiilor de bază P1 asociate unui P2 fixat şi combinaţia liniară convexă a tuturor
soluţiilor de bază P2 asociate unui P1 .

Exemplu 1. Problema din exemplul 1 punctul 3. se referă la un joc


bimatriceal. Cele trei sisteme sunt următoarele
p +p = '
21
1, 22 (1 )
- p22 - F1 + F1 ' + t11 = 0
'

p
21
' '
+ t12 = 0
- p21 + p22 - F1 + F1
p +p
=
11 12

1,
(2')

- p11 + p22 - F2' + F2' + t21 = 0


' '
p + t22 = 0
11 - p12 - F2 + F2
p11t11 = 0, p t = 0, p t = 0, p t = 0. (3' )
12 12 21 21 22 22

Subproblemei (1' ) îi corespunde matricea simplex (linia funcţiei de optimizat


(pentru fixarea ideilor se consideră minimizată) este linia egală cu 0):
1 1 0 0 0 0 1

1
S1 = -1 -11100.
-1 1 -11010
0 0 0 0 0 0 0

Obţinem următoarele soluţii de bază


X11 = 1 1 = [1, 0,1, 0, 0, 2], X 13 = [0,1,1, 0, 2, 0 ]Aici simbolul X s-a folosit
, ,0,0,0,0 , X12
2 2
pentru uniformizarea notaţiei necunoscutelor
x = 21
,x2 = 22
, x 3 = F ', x 4 = F ', x 5 = 11
,x 6= 12
.
p p t t
1 1 1
31
Astfel de uniformizări vor fi folosite şi în continuare, ori de câte ori va fi necesar
fără nici o precizare specială.

Subproblema (2' ) are următoarea matrice simplex

1 1 0 0 0 0 1

S 2 = -1 1 -11100
1 -1 -11010
0 0 0 0 0 0 0

şi are soluţiile de bază


1 1 22 = [1, 0,1, 0, 2, 0], X 23 = [0,1,1, 0, 0,2 ]
X =
21 , ,0,0,0,0 , X
2 2
Să notăm cu X ij' , i = j= vectorii care se obţin prin omiterea componentelor
1,2; 1,3,
Fi ', Fi ', i = 1,2. Obţinem:
1 1 1 1
X11' = , ,0,0 , X21' = , ,0,0 ,
2 2 2 2
X12' = [1, 0, 0, 2], X 22' = [1, 0, 2, 0],

X13' = [0,1, 2, 0], X 23


'
= [0,1, 0, 2]. .
Pentru a stabili perechile de soluţii (X 1'i , X 2' j )care să fie soluţii ale problemei
de joc bimatriceal, trebuie să fie îndeplinită condiţia t1s ¹ 0 ⇒ p1s = 0 şi 1 1

t ¹ 0 ⇒ p2 s = 0 Se constată că există o singură soluţie P1 = P2 = 1 , 1 obţinută


2 s21 21

2 2
pentru t11 = t12 = t21 = t22 = 0 şi F1' = F1 '= F2'=F2 '
= 0 şi prin urmare F1 = F2 = 0 .

4. Stabilirea punctelor de echilibru ale jocului antagonist

Definiţia 1. Se numeşte joc antagonist jocul bimatriceal cu matricele


(bidimensionale) H1 şi H 2 dacă H1 + H 2T = 0 unde 0 este matricea nulă.

32
Având în vedere c ă orice egalitate este echivalentă cu două inegalităţi,
sistemele (1), (2) şi (3) din punctul 4. pot fi scrise în următoarea formă:

H1P2T - F1T £ 0
- J2P2T £ -1 (4)
J PT £1,
2 2

P1H1 -F2 ³0 (5)


P1 J1T ³ 1
T
³ -1,
- P1J1
P1(H1P2T - F1T ) = 0

(P1H1 - F2 )P2T = 0 (6)

unde F1 conţine ca elemente una şi aceiaşi valoare F1 , iar F2 conţine una şi aceiaşi
valoare - F2 ,

Din subproblema (6) rezultă P1F1T = F2 P2T deci - F2 = F1

Aceste valori pot fi considerate şi ca alori minimax (minumul unor valori maxime)
obţinute prin minimizarea funcţiei F1 , (maximul este infinit), respectiv maximin
(maximul unor valori minime) obţinute prin maximizarea funcţiei - F2 = F1
(minimul este infinit).

Adăugând sistemului (4) func ţia F1 = F1' - F1 ' iar sistemului (5)
funcţia - F2 = -F2' + F2 ' rezultă două probleme de programare liniară, una duala
celeilalte. Desigur se poate folosi notaţia simplificată F = F1 = -F2 şi considerăm că
se determină F = MIN prin sistemul (4) şi F = MAX prin sistemul (5). Astfel, cel
puţin o soluţie prticulară a jocului antagonist se poate obţine rezolvând numai unul
dintre sistemele (4) şi (5). Jocul antagonist poate avea însă, ca joc bimatriceal, şi
alte soluţii, rezultând din rezolvarea sistemului (1), (2) şi (3) din punctul 4.
punând - F2 = F1 = F Având în vedere simetria celor dou ă sisteme (4) şi (5) şi
notând F = F1 = -F2 , rezultă următoarea teoremă cu privire la jocurile antagoniste
(teorema von Neumann-Morgenstern).

Teorema 1. Minimul în raport cu P2 al maximelor (minimax)


funcţiei F (P1 , P2 ) în raport cu P1 , pentru P2 fixat, este egal cu maximul în raport
cu P1 al minimelor (maximin) funcţiei F (P1 , P2 ) în raport cu P2 , pentru P1 fixat, deci

33
min max F (P1 , P2 ) = max min F (P1 , P2 ).
P P P P
2 1 1 2

Observaţia 1. În cazul unui joc bimatriceal oarecare, ca o extindere a


condiţiei de la jocul antagonist, se poate formula întrebarea: pentru care soluţie
(P1 , P2 ) funcţia F1 + F2 ia valoarea minimă? Această formulare conduce la problema
considerării cooperţiei: când poate avea loc cooperare şi când nu? La jocul
antagonist F1 + F2 = 0.

Exemplul 1. Jocul bimatriceal din exemplul 1 al punctului 4.4. este un joc


antagonist. Deoarece are o singură soluţie, aceeaşi soluţie se obţine şi dacă se
F=F1
S1 cu
minimizează funcţia deci F = F1' - F1 ' , în ipoteza utilizării la rezolvare a
sistemului (4), înlocuind linia formată numai din zerouri în matricea simplex
linia funcţiei de minimizat [0, 0,1, -1, 0, 0, 0,0]. Astfel se obţine matrice simplex

1 1 0 0 0 0 1
-1 -1
1 1 1 0 0
-1
-1 1 1 0 1 0
0 0 1 -1 0 0 0

care prin reducere conduce la aceeaşi soluţie P = P =1 , 1 , pentru care


1 2
2 2
' '
F1 = F1 = 0, deci FMIN = 0.
34
Unitatea 4

Aplicatii economice

Obiective:

a) studentii trebuie sa cunoasca etapele unui proces de modelare matematica


folosind jocurile

b) sa stie incadra o problema economica in una din categoriile de jocuri de


care ea apartine

c) sa-si insuseasca metodele de rezolvare directa si sa interpreteze rezultatele


gasite

Noţiuni cheie : jucator, decizie, duopol, oligopol, punct de echilibru

CONŢINUTUL UNITĂŢII

Aplicatii in economie

In cele ce urmeaza dam ceva aplicatii ale jocurilor in economic. Vom evalua
functia de castig pentru fiecare jucator, care va fi dependenta de strategiile
jucatorilor. Aici multimile strategiilor vor fi intervale ale axei reale.
1. Modelul Cournot al duopolului

Consideram o foarte simpla versiune a modelului lui Cournot. Fie q1 si q2 notate


cantitatile unui produs omogen, produse de firmele 1 si 2, respectiv. Fie
P(Q) = a - Q pretul care “curata” piata (the market-clearing p rice) cand
cantitatea agregata pe piata este Q = q1 + q2 . Deci avem
a-Q , Q<a
P(Q) =
0 , Q³a
Presupunem ca costul total al firmei i de producere a cantitatii qi este

Ci (qi ) = cqi . Adica, nu exista costuri fixe si costul marginal este constant c , unde
vom considera ca c < a . Presupunem ca firmele isi aleg cantitatile lor simultan.
Mai inati vom translata problema intr-un joc “conti nuu”. Pentru aceasta vom
specifica: jucatorii din acest joc (cele doua firme), strategiile posibile pentru
fiecare jucator (diferitele cantitati ce le pot produce), castigurile pe care le vor
primi fiecare jucator pentru fiecare combinatie de strategii ce pot fi alese de
jucatori (castigul firmei este profitul sau). Vom presupune ca outputul este
35
continuuu divizibil si outputuri negayive nu pot fi. Astfel, spatiul strategiilor
fiecarei firme este Si = [0, ¥) , numerele reale nenegative, in care caz o tipica
strategie si este o cantitate aleasa, qi ³ 0 . Deoarece P(Q) = 0 pentru Q ³ a , nici
o firma nu va produce o cantitate qi > a . Castigul firmei i , o functie de
strategiile alese de ea si de cealalta firma, profitul sau, poate fi scris ca
pi (qi , q j ) = qi [a - (qi + q j ) - c].

Cum stim, un punct de echilibru (echilibrul Nash) este perechea (q1* , q2* )
unde qi* ,
pentru fiecare firma i , rezolva problema de optimizare
max p (q , q* )j = max q [ - (q + q* ) -ij c].
0£qi <¥ i 0£q <¥ i
i
a i

Presupunand q*j < a - c (ceea ce va fi aratat ca este adevarat), conditia de primul


ordin pentru problema de optimizare a firmei i este necesar si suficient ca
qi = 1
(a - q*j - c)
2
Astfel, daca perechea de cantitati (q , q* ) este un echilibru Nash, cantitatile alese
*

1 2

ale firmelor trebuie sa satisfaca sistemul de ecuatii


q1 1 q1 = 1
=
(a - q2* - c), (a - q1* - c)
2 2
Rezolvand acest sistem de ecuatii obtinem q1 =q2 * = (a-c)/2, care este intr-adevar
*

mai mic decat a - c , cum a fost presupus.


Intuitiv interpretarea acestui echilibru este simpla.

Fiecare firma va dori, desigur, sa fie un monopol in aceasta piata, in care caz ea va
vrea sa aleaga cantitatea qi care sa maximizeze pi (qi , 0) = qi (a - qi - c) , si in
consecinta ea va produce cantitatea monopolista qm =(a-c)/2 , si va obtine
profitul monopolistic π(qm ,0) = (a-c)2 /4.
Dandu-se ca exista doua firme, profitul agregat pentru duopol va fi maximizat prin
luarea cantitatii agregate q1 + q2 egala cu cantitatea monopolista qm , care va apare
daca qi =qm /2 pentru fiecare i , de exemplu. Problema cu acest aranjament este ca
fiecare firma are tendinta de a devia: deoareca cantitatea monopolista este mica,
pretul asociat P(qm ) este inalt, si la acest pret fiecrae firma va dori sa-si mareasca a
ei cantitate, in speta datorita faptului ca o asa crestere a productiei conduce la un
pret care curata piata mai mic. Sa vedem aceasta , folosim (48) sa aratam ca qm /2
nu exista un cel mai bun raspuns al firmei 2 la alegerea qm /2 a firmei 1. In

36
echilibrul Cournot, din contra, cantitatea agregata este mare, asa ca pretul asociat
este scazut, asa ca tentatia de a creste outputul este redusa.
Observatia 1.37.
O alta rezolvare, inafara de cea algebrica, pentru echilibrul Nash in jocul Cournot
se poate lua un procedeu grafic folosind cel mai bun raspuns pentru o firma:
1
R2 (q1 ) = (a - q1 - c) -- cel mai bun raspuns al firmei 2, si
2

1
R1 (q2 ) = (a - q2 - c) -- cel mai bun raspuns al firmei 1.
2

Un al treilea mod de a rezolva pentru un echilibru Nash este sa aplicam procedeul


de eliminare iterata a strategiilor strict dominate.

2. Modelul Bertrand al duopolului

Acest model al lui Bertrand este bazat pe faptul ca firmele acum isi aleg preturile,
altfel decat la modelul lui Cournot. Modelul lui Bertrand este un joc diferit decat
modelul jocului lui Cournot deoarece spatial strategiilor este diferit si functiile de
castig sunt diferite. Astfel obtinem un alt punct de echilibru, dar conceptual de
echilibru folosit este tot de echilibru Nash definit in sectiunile precedente.
Consideram cazul produselor diferentiate. Daca firmele 1 si 2 aleg preturile p1 and
p2 , respectiv, cantitatea ce consumatorii o cer de la firma i este

qi ( pi , p j ) = a - pi + bp j ,

unde b > 0 reflecta extinderea la care produsul firmei i este un substitut pentru
produsul firmei j. Aceasta o nerealista functie de cerere pentru ca cererea pentru
produl firmei i este positiva chiar cand firma i isi alege un pret arbitrar de inalt, cu
conditia ca firma j de asemenea isi alege un pret destul de inalt. Presupunem ca sunt
costuri de productie constante, ca sunt costurile marginale constante, la c , unde c <
a , si ca firmele actioneaza simultan (isi aleg preturile lor). Translatam problema
economica intr-un joc necooperativ. Exista din nou doi jucatori. In acest moment
totusi, strategiile posibile la fiecare firma sunt preturile diferite care se pot schimba,
altfel decat diferitele cantitati ce se pot produce. Vom presupune ca preturile
negative nu sunt admisibile, dar ca orice pret nenegativ poate fi ales – nu exista nici
o restrictie la preturi determinate de monede. Astfel la fiecare firma spatiul
strategiilor poate fi din nou reprezentat ca Si = [0, ¥) , si o strategie tipica si esste
acum un pret, pi ³ 0 .
37
Vom presupune din nou ca functia de castig pentru fircare firma este
tocmai profitul. Profitul firmei i cand este ales pretul pi si rivala sa
alege pretul pj este

i p i , p jq i p i , p j p i ca p i bp j p i c.

Astfel, perechea de preturi ( p* , p* ) este un echilibru Nash daca, pentru fiecare


1 2
firma i , p* rezolva problema
i

max pi ( pi , p j ) = max (a - pi + bp j )( pi - c).


* *

0£ pi <¥ 0£ pi <¥

Solutia la problema de optimizare a firmei i este


pi* = 1
(a + b × p*j + c)
2

Deci, daca perechea de preturi ( p* , p* ) este sa fie un echilibru Nash, pretul ales de
1 2

firme trebuie sa satisfaca sistemul


p1 * = 1 p2* = 1
(a + b × p2* + c), (a + b × p1* )
+c ,
2 2
Rezolvand acest sistem de ecuatii suntem condusi la
a c
p* = p* = + .
1 2
2-b

Teme pentru verificarea cunoştinţelor

Exercitii si probleme rezolvate


1. Fie jocul de două persoane, cu suma nulă, cu matricea de câ ştig
9 3 1
H =A= 6 5 8
1

3 4 10
6 5 6

Care este matricea de câ ştig a jucătorului 2?


Câte strategii are primul respectiv al doilea juc ător?

Soluţie. Matricea de câ ştig a jucătorului 2 este

-9 -6 -3 -6
t
-5 -4 H1+H
H2= -3 - 5 deoarece 2 =0.
-8 -10
-1 -6
Jucătorul 1 are 4 strategii deoarece matricea A are 4 linii. Jucătorul 2 are 3 strategii deoarece
matricea A are 3 coloane.

38
2. Doi jucători scriu, independent , unul din numerele 1, 2 sau 3. Dacă ei au scris acelaşi număr atunci
jucătorul 1 plăteşte jucătorului 2 un număr de unităţi monetare egal cu numărul scris de primul
jucător. În caz contrar, jucătorul 2 plăteşte jucătorului 1 numărul de unităţi monetare egal
cu numărul pe care jucătorul 1 l-a scris. Care este matricea de câ ştig a acestui joc?
Soluţie. Este uşor de constatat că matricea de câ ştig a jucătorului 1 este:

-1 1 1
A 2 -2 2
=
33-3

3. Care dintre jocurile precedente are punct şa în strategii


pure? Soluţie. Pentru primul joc avem:
v1 = max min aij = max(1,5,3,5) = 5,
1£i£4 1£ j£3
v2 = min max = min(9,5,10) = 5,
a
1£ j£3 1£i£4 ij

Cum v1 = v2 = 5 rezultă că primul joc are punct şa în strategii pure. Este usor de verificat că (2,2) şi

(4,2) sunt puncte şa în strategii pure deoarece a22 = a42 = 5.

Astfel i * = 2, i ** = 4 sunt strategii optimale ale jucătorului 1 şi j * = 2 este strategia optimală a


jucătorului 2.

Pentru al doilea joc avem:

v1 = max min aij = max(-1,-2,-3) = -1,


1£i£3 1£ j £3

v2 = min max aij = min(3,3,2) = 2,


1£ j£3 1£i£3

Astfel al doilea joc nu are punct şa în strategii pure deoarece v1 = -1 < 2 = v2 .

4. Care sunt câ ştigurile aşteptate pentru jucătorul 1 din jocurile precedente?


Soluţie. Pentru primul joc, fie X = (x1 , x2 , x3 , x4 ) şi Y = (y1 , y2 , y3 ) strategiile mixte
ale jucătorilor 1 respectiv 2.

Atunci câ ştigul aşteptat al jucătorului 1 este:

4 3
X × A ×Y t = ∑ ∑aij xi y j = 9x1 y1 + 3x1 y2 + x1 y3 + 6x2 + 5x2 y2 +
y1
i= j =1
1

+ 8x2 y3 + 3x3 y1 + 4x3 y2 + 10x3 y3 + 6x4 y1 + 5x4 y2 + 6x4 y3 .

39
Pentru al doilea joc, fie X = (x1 , x2 , x3 ) şi Y = (y1 , y2 , y3 ) strategiile mixte ale jucătorului
1, respectiv 2. Atunci câ ştigul aşteptat al jucătorului 1 este:
3 3
X × A ×Y t = ∑aij xi y j = -x1 y1 + x1 y2 + x1 y3 + 2x2 y1 - 2x2 y2 +

i j =1
=1

+ 2x2 y3 + 3x3 y1 + 3x3 y2 - 3x3 y3 .

5. Folosind eliminarea iterată a strategiilor strict dominate rezolvaţi jocul cu matricea de câ ştig:
0 -1 -1
A=1 0 -1
1 0
1
Soluţie. În matricea A, elementele primei linii sunt mai mici decât elementele corespunz ătoare
din linia a 3-a. În consecinţă, jucătorul 1 niciodată nu va folosi prima sa strategie. Prima linie va
fi eliminată. Obţinem astfel matricea de câ ştig redusă:

1 0 -1
A'= 1
1 0

Acum, în această matrice A' fiecare element al primei coloane este mai mare decât elementele
corespunzătoare ale coloanei a 3-a. În consecinţă jucătorul 2 nu va folosi niciodată prima sa
strategie, deci prima coloană poate fi eliminată. Aşa obţinem matricea redusă:

0 -1
A ''=
1 0
Similar obţinem succesiv:

A '''= [1 0], = [0].


AIV

Astfel strategiile optimale (pure) sunt X * = (0,0,1), Y * = (0,0,1) şi valoarea jocului este v = 0.

Avem, desigur, un punct şa în strategii pure i , j (* *


)= (3,3) deoarece a33 = v = 0.
6. Găsiţi strategiile optimale ale jocurilor cu matricile de câ ştig:
2 0 1 2 1 -1
a) A = , b) A= , c) A=
1 3 2 0 -1 1
Soluţie. Acestea sunt jocuri matriciale 2 x 2. Astfel, putem folosi strategiile mixte
X * = (p,1 - p), Y * = (q,1 - q) unde
p* = d-c , q* = d-b ,v= ad - bc

a+d-b-c a+ d - b - a+d-b-c
c
a) Obţinem:

p* = 3 -1 = 1 , q* = 3-0 =3 , v = 2×3-0×1 = 3 ,
2 +3-0-1 2 2 +3-0-1 4 2+3-0-1 2
40
1 1 Y*= 3 1 v=3
Deci X
* = , , , , .
2 2 4 4 2
b) Avem:

p* = 0-2 = 2 , q* = 0 - 2 =2,v=2×0-2×2 =4,


1 +0-2-2 3 1+0-2-2 3 1+0-2-2 3
2 1 Y*= 2 1 v= 4
Deci X
* = , , , , .
3 3 3 3 3

c) Obţinem:
p *= 1- (-1) = 1, q *
= 1, v = 1×1 - (-1)× (-1) = 0,

1+1- (-1)- (-1) 2 2 4


11
= *= =
Deci XY, , v 0.
2 2
7. Rezolvaţi problema precedentă folosind metoda lui Williams.*
Soluţie. Fie X = (x1 , x2 ), Y = (y1 , y2 ) strategiile mixte pentru jucătorii 1 si 2 respectiv. Sunt
satisfăcute relaţiile x1 + x2 = 1, x1 = c - d , y1 + y2 = 1, y1 = d - b (conform metodei lui

x2 a - b y2 c-a
Williams).
a) Obţinem x1 + x2= 1, x1 = 1 - 3 = 1, deci x1 = x2 , x1 = x2 = 1 , respectiv

x2 2-0
2
2
y1 + y2 = 1, y1 = 3 - 0 = 3, deci 3 y2 = y1 , y1 = 3 , y =1 .
y2 1-24 4
Astfel X
* 1 1 Y*= 3 1
= , , , şi atunci
2 2 4 4
2 0 3 3
t 1 1 4 = 1, 1
2 =3
v*
*
=X × A×Y
*
= , ×
2 2 1 3 13 2 22
4 2
b) Avem x1 + x2 = 1, x1 = 2 - 0 = 2, deci x1 = 2x2 , x1 = 2 , x2 = 1 , respectiv

x
2
1-23 3
+ y2 = y = 0-2 =2 =1 *
X =Y * 2 1
y1 1, , y1 , y2 . Astfel = , , şi
1

y2 2 -1 3 3 3 3
2 2
t
2 1 1 2 4 4 4
v * *
=X × A×Y *
= , 3 = , 3 =
3 2 0 13 13
3
3
3 3
4
1
c) Avem x1 + x2 = 1, x1 = -1-1 = 1 deci x1 = x2 , x1 = x2 =1 , respectiv
x2 1- (-1) 2
y 1- (-1) 1 1 1
y1 + y2 = 1, = = 1, y1 = y2 , y1 = y2 = . Astfel X *
=Y *
= , , şi
1

y2 -1 -1 2 2 2
*111-1 1

0. 2
1
v= ,2 2 -1 1 × 2 =
8. Rezolvaţi problema 6 cu metoda grafică descrisă pentru jocurile matriceale de tip 2 ´ n respectiv m ´ 2 .

Soluţie. Fie X = (x,1 - x), y = (y,1 - y) respectiv, strategiile mixte pentru jucătorii 1 şi 2. Trasăm
liniile drepte ac, bd şi ab, cd respectiv în cele două figuri (sistemele de coordonate) în planele xOv
respectiv yOv. Apoi determinăm coordonatele punctelor de intersecţie ale acestor linii drepte.
2 0
a) Matricea de câ ştig este A = , astfel avem liniile drepte care unesc punctele de coordonate
1 3
(1,2), (0,1) respectiv (1,0), (0,3). Ecuaţiile acestor drepte sunt:
x -1 = v - 2 respectiv x -1 = v - 0
0-1 1-2 0-1 3-0
Sau

v = x + 1 respectiv v = -3x + 3

Punctul de intersecţie are coordonatele: x = 1 , v = 3 . Astfel X * = 1 1


, , este strategia optimală

2 2 2 2
3
a jucătorului 1 iar v = este valoarea jocului.Pentru strategia optimală a jucătorului 2 considerăm
2
liniile drepte ce unesc punctele de coordonate (1,2), (0,1) respectiv (1,1), (0,3). Ecuaţiile
acestor drepte sunt:

y -1 = v - 2 respectiv y -1 = v -1
0-1 0-2 0-1 3-1
Sau

v = 2 y respectiv v = -2 y + 3

3 3 3 1
Punctul de intersecţie are coordonatele y = ,v= . Astfel Y * = , este strategia optimală a
4 2 4 4
3
jucătorului 2, iar v = este valoarea jocului.
2

42
b) Procedând ca şi în cazul punctului a) găsim valorile x = 2 , y = 2 , v = 4 aşa încât strategiile
3 3 3
2 1 4
optimale sunt X* =Y *
= , şi valoarea jocului este v= .

3 3 3
1 1 1 1
c) Găsim valorile x = , y= , v = 0, deci X *
=Y *
= , sunt strategiile optimale, iar

2 2 2 2
valoarea jocului este v = 0 .
9. Folosind metoda grafică, rezolvaţi jocurile matriceale cu matricele de câ ştig:
2 9 6 3 5 6
b) A = 9 4
a) A = ,
8
3 7 5
1 8
Soluţie.

a) Fie X = (x,1 - x) o strategie mixtă a jucătorului 1. Liniile drepte ae; df; cg; dh; care unesc
punctele: (1,2), (0,8); (1,9), (0,3); (1,6), (0,7); (1,3), (0,5) au ecuaţiile:
;
x -1 = v - 2 x -1 = v - 9 x -1 = v - 6 x -1 = v - 3 0-1 8-2
; ; .
0-1 3-9 0-1 7-6 0-1 5-3

Punctul de intersecţie ce corespunde maximului minimelor este determinat de dreptele care


unesc punctele (1,9), (0,3) respectiv (1,3), (0,5), adică

x -1 = v - 9 respectiv x -1 = v - 3 ,
0-1 3-9 0-1 5-3
sau v = -2x + 5 respectiv v = 6x + 3.

1 9
Coordonatele punctului de intersecţie (maximul minimelor) sunt x = ,v= .
4 2
Astfel X
* 1 3 v=9
= , este strategia optimală a jucătorului 1, iar valoarea jocului este .
4 4 2

Pentru strategia mixtă a jucătorului 2 avem Y = (y1 , y2 , y3 , y4 ) şi ea se va determina aşa încât

y1 + y2 + y3 + y4 = 1 şi X * × A ×Y t = v = 9 .
2
Ajungem la sistemul de ecuaţii liniare

y1 + y 2 + y 3 + y 4 = 1

26 y1 + 18 y 2 + 27 y3 + 18 y4 = 18
yj ³0 j = 1,4
care are soluţia y1 = 0, y3 = 0, y2 = q, y = 1 - q, q Î [0,1].
4

1 1 3
Se consideră că q = , deci strategia optimală a jucătorului 2 este Y *
= 0, ,0, .
4 4 4
43
b) Fie Y = (y,1 - y) o strategie mixtă pentru jucătorul 2. Liniile drepte ab, cd, ef care unesc
punctele (1,5), (0,6); (1,9), (0,4); (1,1), (0,8) au ecuaţiile
y -1 = v - 5 y -1 = v - 9 y -1 = v -1
, , .

0-1 6-5 0-1 4-9 0-1 8-1

Punctul de intersecţie (minimul maximelor este acelaşi pentru oricare două drepte) se obţine
din sistemul de ecuaţii (format cu ultimele două, pentru minimul maximelor)

v = 5 y + 4, v = -7 y + 8.
1 17 1 2
Astfel avem y = , v= şi atunci Y *
= , este strategia optimală pentru jucătorul al doilea
3
3 3 3
iar valoarea jocului este v = 17 .
3
Strategia mixtă a jucătorului 1 are forma X = (x , x , x ) şi se determină aşa încât x + x + x = 1
1 2 3 1 2 3

*t 17
şi X × A ×Y =v= .
3
Ajungem la sistemul de ecuaţii liniare

x1 + x2 + x3 = 1
17x1 +17 x2 +17 x3 = 17
xi ³ 0 i = 1,3

7 5
Se constată că strategia optimală a jucătorului 1 este X *
= 0, , .
12 12

10. Rezolvaţi jocul matriceal pentru care matricea de câ ştig este

6 0 3
A=8 -2 3.
6
4 5
Soluţie. Folosim metoda descrisă pentru jocurile matriceale de forma 3x3.

Pentru jucătorul 1, cu strategia mixtă (coordinate baricentrice) X = (x1 , x2 , x3 ) calculăm

X × A·1 = 6x1 + 8x2 + 4x3 , X × A·2 = -2x2 + 6x3 , X × A·3 = 3x1 + 3x2 + 5x3 .
Ecuaţia liniei X × A·1 = X × A·2 este 6x1 + 10x2 - 2x3 = 0.

Dar x1 + x2 + x3 = 1 aşa încât g ăsim 2x1 + 6x3 = 5.

Ecuaţia liniei X × A·2 = X × A·3 este - 2x1 + 6x3 = 3x1 + 3x2 + 5x3 , sau 3x1 + 5x2 - x3 = 0, adică

2x1 + 6x3 = 5.
44
Ecuaţia liniei X × A·3 = X × A·1 este
3x1 + 3x2 + 5x3 = 6x1 + 8x2 + 4x3 , sau 3x1 + 5x2 - x3 = 0, adică 2x1 + 6x3 = 5
Regiunea R1 , în care min X × A· j = X ×A·1 se determină din inegalităţile X×A·1 £X×A·2
1£ j £3

şi X × A·1 £X×A·3 care ne dau 2x1 + 6x3 = 5.

1 5 1 3 (0,0,1)
Astfel regiunea R1 , este delimitată de punctele 0, , ,0, şi
6 6 4 4
14
15 1 3
Întrucât X × A = , X×A =9, X×A (0,0,1) = 4 constatăm că valoarea maximă
·1
0, ,
3 ·1
,0,
2 ·1

4
66 4
este 14 , max = 14 .

3 3
Regiunea R2 , în care min X × A× j = X ×A×2 se determină din inegalităţile X×A×2 £ X×A12
1£ j £3

şi X × A×2 £X×A×3 care ne dau 2x1 + 6x3 £ 5.

1 5 1 3
Astfel regiunea R2 , este delimitată de punctele (1,0,0), (0,1,0), 0, , , ,0, .
6 6 4 4
1
15 3
Întrucât X × A (1,0,0) = 0, X × A (0,1,0) = -2, X × A = 14, X×A = 9, constatăm
×2 ×2 ×2
0, ,
3 ×2
4
,0,
2
66 4
că valoarea maximă este 14 , max = 14 .

3 3
Regiunea R3 , în care min X × A× j = X ×A×3 se determină din inegalităţile X×A×3 £ X×A×1
1£ j £3

şi X × A×3 £ X×A×2 care ne dau 3x1 + 5x2 + x3 = 0.

Astfel regiunea R3 , este determinată de punctele 1 5 1 3


0, , , ,0, .
6 6 4 4
14 9
Întrucât X × A = , X×A = , constatăm că valoarea maximă este
15 1 3
×3
0, , 3 ×3
,0, 2
6 4
6 4

14
14 , max = .
33

Acum valoare jocului v este dată de relaţia


v = max min X × A = min max X × A , max X × A , max X × A =
X ÎS ×j XÎS3 IR1 ×1 XÎS3IR2 ×2 XÎS3IR3 ×3
31£ j£3

45
= min 14, 14 ,14 =14 .
3 3 3 3
=1 5
Strategia optimală a jucătorului 1, pentru care se obţine valoarea jucătorului este
X *
0, , .
6 6
Pentru jucătorul 2 fie Y = (y1 , y2 , y3 ) o strategie mixtă. Calculăm
3
A Y t = 6 y + 3y , A Y t = 8 y - 2 y2 + 3
, A =4y +6y 2+ 5 y .
3y Yt
1× 1 2× 1 3× 1 3

Regiunea T , în care max A Y t = A Y t , se determină din inegalităţile AY t ³ A Y t şi A Y t ³ A Y t ,


1 1£i£3 i× 1×
1× 2× 1× 2×

care ne dau y1 - y2 £ 0 şi y1 - y2 ³1 .
2
Întrucât aceste inegalit ăţi se contrazic rezultă că regiunea T1 , este mulţimea vidă, T1 = f.

Regiunea T , în care max A =A , se determină din inegalităţile A Y t ³ A Y t şi


Y t Y t
2 1£i£3 i× 2× 2× 1×

A Y t ³ A Y t , care ne dau y - y ³ 0 şi y - y ³ 1 .
2 1 2
2× 3× 1
3
1 2 1 1 1
Rămâne doar y1 - y2 ³ . Regiunea T2 este delimitată de punctele (1,0,0), , ,0 , ,0 .
3 3 3 3 3
2
Întrucât A Y t (1,0,0 ) =8, A 21
=14 , A 1
= 14 , constatăm că valoarea minimă este
Yt Yt
2× 2×
, ,0 32× ,0, 3
3 3 3

14
14 , min = .
33
Regiunea T , în care max A Y t = A Y t , se determină din inegalităţile A Y t ³ A şi A Y t ³ A ,
Y t Yt
3 1£i£3 i× 3× 3× 1× 3× 2×

care ne dau y1 - y2 £1 şi y1 - y2 £1 .

2 3
Rămâne doar y1 - y2 £ 1 .

3
2 1 1 2
Regiunea T3 este delimitată de punctele , ,0 , (0,1,0), (0,0,1), ,0, .
3 3 3 3
=14 = 6, = 5, A Y t =14
t 21 1
Întrucât A Y , AYt (0,1,0) AY t (0,0,1) 2
, constatăm că

, ,0
3 3× 3× 3×
,0,
3
33 3 3

14 14
valoarea minimă este , v= .
3 3
Acum valoarea jocului v este dată de relaţia

46
v = min max A Y t = max min A Y t , min A Y t , max A Y t = max 14 , 14 =14.
X ÎS 3 3 3
i× i× i× i×
YÎS3 IT1 X ÎS3 IT2 X ÎS3 IT3
3 1£i£3

2 1 1 2
Strategiile optimale ale jucătorului 2 sunt Y1* = , ,0 , Y2* = ,0, . Astfel soluţia (strategia
3 3 3 3
14
ucătorul 2 este Y * = lY1* + (1 - l )Y2* cu l Î [0,1], iar valoarea jocului v = .3

11. Folosind programarea liniară, rezolvaţi jocurile cu matricile de câ ştig:


0 2 6 0 3 5
a) A = , b) A = 8 -2 3 9
5
1 6 5
4 4
Soluţie. Considerăm problema de programare liniară
n
[max]g = y1'
+ y2' + ... + yn' ∑aij y 'j £ 1, i = 1, m y 'j ³ 0, i = 1, n .
j =1
a) Avem, în primul caz, problema

[max]g = y1' + y2'


2 y2' £ 1
' '
5 y1 + y2 £ 1
y1' , y2' ³ 0.

Matricea simplex ataşată este

0 2 1 0 1
5 1 0 1 1
1 0 0
1 0
asupra căreia aplicăm ARS. Obţinem succesiv
1 1
0
0 2 1 0 1 1 2 0 2
1 1 1 1 1 1
1 0 ®1 0 -
5 5 5 10 5 10
0
4 -1 -1 -2 -1 - 3
5 0 5 5 0 0 5 5 5

Astfel g max =3 =1 , deci w = 5 şi y1' = 1 deci y1 = w × y1' = 1 ,


5 w 3 10 6
'
y2 = 1 , deci y2 =5 .

2 6
47
În plus y3' = y4' = 0, deci y3 = y4 = 0.
De asemenea x1' = 2 aşa încât x1 = w × x1' = 2 , x2' = 1 , dec x2 =1
i
5 3 5 3
X =2 * 1
1 5
În concluzie strategiile optimale ale celor doi jucători sunt , ,
Y* = , , iar valoarea
3 3 6 6
5
jocului este w = v = .
3
a) În cazul al doilea problema de programare liniară este:
[max]g = y1' + y2' + y3' + y4'
6 y1' + 3 y3' + 5 y4' £ 1
8 y1' + 2 y2' + 3y3' + 9 y4' £ 1
4 y1' + 6 y2' + 5 y3' + 4 y4' £ 1
y 'j ³ 0 , j = 1,4

pentru care matricea simplex este

6 0 3 5 1 0 0 1
8 -2 3 9 0 1 0 1
4 6 5 4 0 0 1 1
.

1 1 1 1 0 0 0 0

Aplicând algoritmul reducerii simplex (ARS) ob ţinem succesiv

3 3 -7 1 - 3 1 - 23 1 - 9 -3 1
0
2 4 4 4 0 4 0 0 0 14 14 14 7
1
- 1 3 9
0
1
0
1
1 0
1 31
0
3 1 1
4 8 8 8 8 ® 2 14 28 28 7
7 -1 0 - 1 1 1 - 1 0 - 1 1 1
07 2 2 2 2 2 1 0 1 14 14 7 14
5 5 -1 0 - 1 -1 - 1 0 - 1 - 5 - 3
0 0 0 0 0
4 8 8 8 8 28 28 28 14
Astfel avem g max = 3 = 1 , deci w = 14 respectiv

1 w 3
4
y1, = 1 , y2, = 1 , y3, = 0, y4, = 0, y5, = 1 , y 6, = 0, y7, = 0, aşa încât:
7 14 7
y1 = w × y1, = 2 , y2 = 1 , y3 = 0, y4 = 0, y5 = 2 , y6 = 0, y7 = 0. În concluzie o strategie optimală

3 3 3
2 1 14
a jucătorului 2 este Y *
= , ,0,0 , iar valoarea jocului este w =v= . De asemenea avem
3 3 3

48
x1, = 0, x2, = 1 , x3, = 5 , x4, = 0, x5, = 0, x6, = 0, x7, = 1 , aşa încât
2 28 28
8
x1 = w × x1, = 0, x2 = 1 , x3 = 5 , x4 = 0, x5 = 0, x6 = 0, x7 = 1 . Strategia optimală a jucătorului 1
6 6 6
1 5
este X
*
= 0, , . Observăm că există şi o altă soluţie pentru că în ultima linie a matricei precedente
6 6
este un element egal cu 0 într-o coloană neredusă. Obţinem
-2 -9 -3 1
3
0 0 0 14 1 14 14 7
-1 0 16 5 3 1
1 -
7 0 28 28 14

0
-1 -1 2 1
2 1 7 0 7 7 7
-1 -1 - 5 - 3
0 0 0 0
2 28 2
8 8
1
4
Astfel y1, = 1 , y2, = 0, y3, =1 , y4, = 0, y5, =1 , y6, = 0, y7, = 0, deci

1 7 7
4
y1 = 1 , y2 = 0, y3 = 2 , y4= 0, y5 = 2 , y 6 = 0, y7 = 0.

3 3 3
*
1 2
O altă soluţie (strategie optimală) pentru jucătorul 2 este Y2 = ,0, ,0 .
3 3
În concluzie, strategia optimală generală a jucătorului 2 este

Y * = lY1* + (1 - l )Y2* , l Î [0,1], iar valoarea jocului este v = 14 .

12. Matricea de câ ştig în reprezentare generală

Trei firme utilizează, cu scop tehnologic, apa dintr-un acelaşi rezervor. Fiecare firmă are la dispoziţie
două strategii: îşi construieşte staţie de purificare (strategia 1) sau foloseşte apa nepurificată (strategia
2). Se ştie că dacă cel mult o firma foloseşte apa nepurificată atunci apa din rezervor este bună şi nu
apar cheltuieli. Dacă, însă, cel puţin două firme folosesc apa nepurificată atunci fiecare firmă pierde 3
unităţi monetare. Construirea staţiei de purificare costă o unitate monetară. Scrieţi matricele de câ ştig
pentru acest joc.

Soluţie. Având în vedere anun ţul constatăm că este un joc de 3 ,,persoane” la care fiecare ,,juc ător”
are 2 strategii. Deci n = 3, m1 = m2 = m3 = 2. Numărul situaţiilor jocului este m1 × m2 × m3 = 8 , iar
câ ştigurile jucătorilor sunt reprezentate în următorul tabel (reprezentare generală):

49
Situaţii Câ ştiguri

s1 s2 s3 H1(s) H2(s) H3(s)

1 1 1 -1 -1 -1
1
1 2 -1 -1 0
1
2 1 -1 0 -1
1
2 2 -4 -3 -3
2
1 1 0 -1 -1
2
1 2 -3 -4 -3
2
2 1 -3 -3 -4
2
2 2 -3 -3 -3

Valorile ,,câ ştigurilor au fost calculate având în vedere enun ţul. Spre exemplu, în situaţia (1,2,2),
firmele 2 şi 3 folosesc apa nepurificată deci (cum sunt două) fiecare firmă pierde 3 unităţi monetare.
Firma 1, însă, îşi construieşte staţie de purificare, deci mai cheltuieşte o unitate monetară, deci, ,,câ
ştigul” ei este - 4.

13. Matricea de câ ştig în reprezentare bidimensională

Două fabrici produc acelaşi tip de produs A, respectiv B, în două sortimente A1 şi A2 respectiv
B1 şi B2 . Produsele sunt interschimbabile. În urma unui test, făcut în avans, s-a constatat că preferinţele
cumpărătorilor, exprimate în procente, sunt reprezentate în următorul tabel

B
A B1 B2

A1 40 90
A2
70 20

Precizăm că precedentele date se referă la prima fabrică (primul produs), în timp ce precedentele
pentru a doua fabrică (al doilea produs) sunt completare faţă de procentul de 100%. Scrieti matricele de
câ ştig pentru acest joc.

Soluţie. Sunt 2 jucători (fabricile) şi fiecare are câte 2 strategii (posibilit ăţi, sortimente). Din enunţ se
constată că sunt precizate în tabelul cu cu punctele chiar ,,câ ştigurile” primului ,,jucotor”. Astfel într-o
reprezentare generală (tabelară) matricile de câ ştig pentru cei doi jucători pot fi scrise în tabelul:

50
Situaţii Câ ştiguri

s1 s2 H1(s) H2(s)

1 1 40 60

1 2 90 10

2 1 70 30

2 2 20 80

În acest caz (pentru că sunt doar doi jucători) se poate utiliza şi reprezentarea bi-matriceală (obişnuită)
pentru matricele de câ ştig. Astfel avem:

H1 40 90 H2 60 30
= , =
70 20 10 80
14. Rezolvarea jocului bimatriceal

Reconsiderăm problema precedentă cu următoarele modificări în condiţiile privind cumpărarea: se ştie că


50% din cei care cumpără produsul A2 vor cumpăra şi produsul B2 respectiv se ştie că 50% din cei care
cumpără produsul B2 vor cumpăra şi produsul A2. Exprimând vânz ările în valori absolute considerând 1000
de unităţi vândute şi păstrând celelalte considera ţii din enunţul problemei precedente, se cere:

a) scrieţi matricele de câ ştig

b) rezolvaţi jocul bimatriceal necooperativ.

Soluţie. Se păstrează datele privind jucătorii şi stagiile (,,mutările”) de la problema precedent ă.


Sunt modificări doar la valorile ,,câ ştigurilor”.

a) Se obţine tabelul cu reprezentarea generală a matricelor de câ ştig

Situaţii Câ ştiguri

s1 s2 H1(s) H2(s)

1 1 400 600

1 2 900 100

2 1 700 300

2 2 600 900

Se consideră că modificările ,,esenţiale” sunt doar la situa ţia (2,2) (în rest sunt datele de la problema
precedentă la care procentele (100%) au fost înlocuite cu unităţile vândute (1000)), care au fost
calculate conform relaţiilor

51
200 + 1 ×800 = 600, 800 + 1 × 200 = 900.
2 2
În scrierea bi-matriceală avem matricile de câ ştig:

400 900 600 300


H1 = , H2 =
700 600 100 900

b) Întrucât
+H 1000 1000
H1 2t =
1000 1500

deci nu este o matrice cu toate elementele egale (sumă constantă) jocul din această problemă este un
joc bi-matriceal (nu este antagonist). Pentru a-l rezolva trebuie să găsim toate soluţiile admisibile de
bază pentru două sisteme de ecuaţii liniare, iar apoi se vor păstra doar perechile de soluţii care verifică
şi al treilea sistem de ecuaţii.

Primul sistem este:


p +p =1
21 22

400 p21 + 900 p22 -F1'+F1 ' + t11 =0


' '
+ F1 + t =0
700 p21 + 600 p22 - F1 12

pentru care avem succesiv:


1 1 - 1 - 1
0
1 1 0 0 0 0 1 7 700 700 0 700 1
3900 3 3 4
400 900 -1 1 1 00 ® 0 7 - 7 7 1 -7 0 ®
700
600 -1 1 0 1 0 6 1 1 1
1 -
7 70 0 700 0
700
0
1 -1 -1 -5
0
0 100 1 -1 0 -1 700 0 6 6 650
1 1 1
®0 600 0 0 1 -1 300 ® 0 1 0 0 600 - 600 2 ®
110000
1 1 1 1
1 0 0 0 -
600 600
2
500 0 1 -1 -1 0 900
® 1 1 0 0 0 0 1 .
-1
0 0 0 1
600 300
Se constată că avem trei soluţii admisibile de bază:

52
I p = 1, p = 0, F1' = 700, F1 '=0, t11 = 300, t = 0,
21 22 12

II p = 1 , p22 = 1 , F1' = 650, F1 '=0, t = 0, t =0


21 11 12
2 2
III p = 0, p = 1 F1' = 900, F1 ' = 0 t = 0, t = 300.
21 22 11 12

Al doilea sistem este


p +p =1
21 22

600 p
11
+ 300 p12 - F2' + F2 ' + t21 =0
' '
+ t22 =0
100 p11 + 900 p12 - F2 + F2
Pentru care avem succesiv
1 1 - 1 - 1

1 1 0 0 0 0 1 2 0 600 600 0 1
600

-1 ® 1 - 1 1 1 ®
0
600 300 1 1 0 1 2 600 600 600 0 0
100 900 -1 1 0 1 0 1700 - 5 5 -1
0
2 6 6 6 1 0

-1 - 8 - 3 5100
0
0 300 1 -1 -1 0 600 0 1 11 11 11
® ® 1 - 1 6 ®
1
1 0 0 0 01 1000 1100 1100 11
0
1100 0 0 -1 1 500 1 1 5
0 1 0 0 -
1100 11
1100
800 0 1 -1 0 -1 900
® 1100 0 0 0 1 -1 600 .
1 1 0 0 0 0 1

Şi acum, în acest caz, sunt trei soluţii admisibile de bază:


1. p11 = 1, p = 0, F2' = 600, F '
=0, t = 0, t22 = 500,
12 2 21

2. p11 = 6 , p12 = 5 , F2' = 5100 , F2 =0, t21 = 0,


' t =0
22
11 11 11
3. p = 0, p =1 F2' = 900, F '
= 0 t21 = 600, t = 0.
11 12 2 22

Ultimul sistem de ecuaţii este de forma


p × tis = 0, i = 1,2,i si = 1,2,
isi

deci produsul dintre un ,,p”, şi un ,,t” cu aceea şi indici trebuie sa fie 0 (zero).

Testând toate cele 9 combina ţii posibile (fiecare cu fiecare) constatăm că doar soluţiile (combinaţiile)
(2, II) satisfac acest ultim sistem. Întradevăr
p ×t = 6 × 0 = 0, p12 × t12 = 5 × 0 = 0, p × t21 = 1 × 0 = 0, p 22 × t = 1 ×0=0.
11 11
21 22

11 11 2 2
53
Nici o alta combinaţie (din cele 8 rămase) nu se poate accepta pentru ca măcar o ecuaţie din
ultimul sistem nu este verificată. Spre exemplu combinaţia (3, I) nu convine pentru că deşi

p11 × t11 = 0 × 300 = 0, p12 × t12 = 1× 0 = 0, p22 × t22 = 1× 0 = 0.

totuşi p21 × t21 = 1× 600 ¹ 0.

În concluzie unica soluţie (care verifică toate cele trei sisteme) este:

p11 = 6 , p12 = 5 , p21 = 1 , p22 = 1 , F1, = 650, F1,, = 0, F2, = 5100 , F2,, = 0,
11 11 2 2 11
t = t12 = t21 = t22 = 0.
11

6 5
P = ,
Astfel strategia optimală a jucatorului 1 este 1 , cu caştigul
11 11
1 1
=
F1 = F1, - F1,, = 650, iar strategia optimală a jucătorului 2 este P
2 , cu caştigul
2 2
5100
F2 = F2, - F2,, = .
11
15. Rezolvarea jocului antagonist

Reconsiderăm jocul de la problema 13. Se cere:

a) Rezolvaţi jocul.

b) Scrieţi matricele de structură.

Soluţie. Matricele de câ ştig sunt:

H1 40 90 H2 60 30
= , =
70 20 10 80
şi cum

H1 + H 100 100
2t = jocul este antagonist cu suma constantă 100.
100 100

a) Pentru a rezolva un astfel de joc este nevoie să rezolvăm problema de programare


liniară corespunzătoare. În cazul de faţă avem

54
p +p
21 22 =1
40 p
21
+ 90 p22 - F1' '
+ F1 + t11 =0
70 p21 + 20 p22 - F1' + F1 ' + t12 =0
' ' ® min .
F = - F1
F1
Utilizăm pentru rezolvare ARS şi atunci putem scrie succesiv:

110 0001 1100001


® ®
40 90 -11100 40 90 -11100
70 20 -11010 70 20 -11010
001-1000 1100001

5 1 - 1 -1
0 1
7 70 70 0 70 0501-10-170
550 3 3 4
0 - - 0 0
-1
® 7 7 7 1 7 ® 100 0 0 1 30 ®
2 -1 1 1 1100001
1 7 70 0 70 0
5 1
70
0000000
0 -1 0 - 1 1
770 7 70
0
0501-10-170 0501-10-170

® -1 30 -1
0 100 0 0 1 ® 0 100 0 0 1 30 ®

1100001 1 1 0000 1
001-1000 0-500001-70

-1 -1 -1 -1 - 1 -1
0 0 1 2 2 65 0 0 1 2 2 65
1 -1 3 1 -1 3
0100 0100
® 100 100 10 ® 100 100 10 ®
-1 1 7 -1 1 7
1 1
0 0 0 100 100 10 0 0 0 100 100 10
0 0 0 -1 0 0 0
0000 0 0 1

-1 -1 - 1
0 0 1 2 2 65
1 -1 3
0 1 0 0
® 100 10
1 .
0
0
-1 1 7
1
0 0 0 100 10
1
0
0

0 0 0 0 1 1 - 65
2 2

Astfel avem soluţia (unică)


55
p = 7 , p = 3 , F1' = 65, F1 ' = 0, t11 = 0, t12 = 0.
21 22

10 10
Problema duală (pentru primul jucător) are soluţia (citibilă tot din ultima matrice)

p
=1 =1 =
1 1
11 , p12 . Deci P1 , este strategia optimală a primului jucător, care va obţine câ ştigul
2 2 2 2
= 65, iar strategia optimală a jucătorului 2 este P2 =
7 3
maxim F1 , care va obţine câ ştigul
10 10
maxim F2 = 65.

b) Matricele de structură (care reflectă împărţirea câ ştigurilor pe jucători, corespunzător deciziilor


alese) sunt date în următoarele tabele

B B B
1 2

A
∑ A
= A1 14 13,5 27,5
A2 3

24,5 27,5

38,5 16,5 55

A A1 A2
B

∑ B
= B1 21 10,5 31,5
B2 12

1,5 13,5

22,5 22,5 45

Elementele din matricele de structură constituie termenii rezultaţi ca urmare a exprimării funcţiilor
de câ ştig. Astfel în prima matrice au fost trecuţi termenii lui

1
7 340 90 2
F1=P1 × H1 × P1t = P1 × H1 × P2t = 20 1
10 1070
2
după cum urmează:

14 = 7 ×40× 1 = ( p11 × h11 × p 22 ), 13,5 = 3 ×90× 1 = ( p12 × h12 × p 21 ),

10 2 10 2
56
24,5 = 7 ×70× 1 = ( p11 × h21 × p22 ), 3 = 3 ×20× 1 = ( p12 × h22 × p22 ). Apoi, pe ultima coloană, sunt
10 2 10 2
trecute sumele elementelor de pe liniile corespunzătoare, iar pe ultima linie sunt trecute sumele de pe
coloanele corespunzătoare. Tabelul (de 55) reprezintă câ ştigul final (maxim) al jucătorului 1. Într-un
mod cu totul analog se obţin elementele matricei de structură pentru al doilea jucător pornind de la

7
1 160 30
F2 = P2 × H 2 × P2t = P2 × H 2 × P1t = 10
2 21080 3

10

De altfel situaţia sintetică, exprimată în procente, asupra structurii tipurilor de produse, este următoarea:

A1 : 27,5%, A2 : 27,5%, B1 : 31,5%, B2 :13,5%.

Asta în condiţia că producţia ambelor fabrici este 100%. Datorită antagonicităţii pieţei, a doua
fabrică realizează o vânzare mai mic ă decât prima, care este de 45%.

16. Considerăm problema 15 în ipoteza că a doua fabrică, la momentul când î şi alege strategia
sa, cunoaţte strategia aplicată de prima fabrică. Se cere:

a) Scrieţi matricele de câ ştig ale acestui nou joc.

b) Rezolvaţi jocul.

c) Comparaţi rezultatul obţinut cu cel anterior şi interpretaţi diferenţa dintre ele.

Soluţie. a) Faţă de problema anterioară (15) acum al doilea jucător are o informaţie suplimentară: ştie ce
strategie a ales primul jucător. În consecinţă se va modifica matricea de câ ştig a jucătorului 1, deoarece

jucătorul 2 poate aplica alte două strategii obţinute prin combinarea strategiilor sale B1 şi B2 , după cum
urmează:

strategia B1 , ca răspuns la strategia A1 ,


strategia B1 , ca răspuns la strategia A2 ,

strategia B2 , ca răspuns la strategia A1 ,

strategia B2 , ca răspuns la strategia A2 .

Astfel avem matricea de câ ştig a jucătorului 1 dată de tabelul

57
B B1 B1 B2 B2
A B1 B2 B1 B2

B1 40 40 90 90
B2 20 70 20
70

Acum P2 va fi de forma P2 = [p21 , p22 , p23 , p24 ], iar P1 = [p11 , p12 ,].

a) Pentru rezolvare, observăm mai întâi c ă strategia a treia este dominantă aşa încât poate fi

eliminată, deci p23 = 0 şi atunci problema de programari liniară ce trebuie rezolvată este

p +p +p =1
21 22 24

40 p
+ 40 p22 + 90 p24 - F1' + F1 ' + t11 =0
21

70 p21 + 20 p22 + 20 p24 - F1' + F1 ' + t12 =0


® min .
' '

F = - F1
F1
Avem succesiv
1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1

-1 90 -1 ®
40 40 90 1 1 0 0 ®4040 1 1 0 0
70 20 20
-1 1 0 1 0 70 20
20 -1 1 0 1 0
0 0 0 1 -1 0 0 0 1 1 1 0 0 0 0 1

5 5 1 - 1 -1
0
7 7 70 70 0 7 1
050501 -1 0 -1 70
0
0 200 550 -3 3 1 -4 0
7 7 7 7 7 ®
0
50 100 0 0 1 -1 30 ®
2 2 - 1 1 1 1 1 10 0 0 01
1 7 7 7 70 0 70 0
0 0 0 00 0 0 00
0 5 5 1 -1 0 1 1
7 7 70 70 70
050501 -10-170 0 50 50 1-10-1 70

050 -1 0 -1 ®
® 100 0 0 1 30 ® 50 100 0 0 1 30
1 1
10 0001 1 1 1 0000 1
0 0 0 1 -1000 0-50-500001-70
58
0
-1 -1 1
25 0 1 2 2 55
1 1 - 1 3
0 1 0 0
® 100 10 ®
2 100
1 1 7 - 1
1
0 0 0 100 2 10 100

0 - 25 0 0 0 1 1 - 55
2 2
00-501-1-1 1 40
1 - 1 3
0 1 2 0 0 5
® 50 50 .
1 0 -1 0 0 - 1 1 2
50 50 -5
005000 1 0 40
Soluţia optimă este p = 2 , p = 3 , p = 0, F1 =' '
F =0, t = 0, t12 = 0, deci
22 24 1 11
21 40,

5 5
2 3
P2' = , ,0 este o strategie optimală a jucătorului 2. Se constată că mai există şi o altă soluţie,
5 5
conform matricei
-50 0 0 1 -1 0020

1 1 1 0 0 0 0 1
,
50 0 -500 0 -11 20
0 0500010-40

deci p21 = 2 , p =3 , p = 0, F1' = 40, '=0, t = 0, = 20.


22 24 11
F1 t12
5 5
Astfel o altă strategie optimală a jucătorului 2 este P2 '
= [0,1,0].
În concluzie, ţinând cont şi de faptul că p = 0, soluţia generală (strategia optimală a jucătorului 2) este
23

2 3
P2 = l1 P2' + l2 P2 ' = l1 , ,0,0 + l2 [0,1,0,0], cu l1l2 Î [0,1] l1 + = 1 iar valoarea maximă a lui
5 5 l2

F1 este F1 =F1'-F1 '


= 40, cu P1 = [1,0].

b) Compararea rezultatelor ne evidenţiază matricele de structură (simplificate necompletate


unde sunt zerouri)

59
B B1 B1
A B1 B2

∑= A A 16λ2 40λ1+24λ2 40
1

16λ2 40λ1+24λ2 40

A A1
B

∑= B BB 24λ2 24λ2
1 1

B1 B2 60λ1+36λ2 60λ1+36λ2

60 60

Constatăm o descreştere cu 15% pentru prima fabrică, ceea ce dă o creştere cu 15% pentru fabrica a doua.
Aceasta se datorează informaţiei suplimentare pe care a avut-o fabrica a doua. Mai putem spune că prima
fabrică va face 40% din sortimentul A1 iar a doua fabrică va face numai sortimentul B1, în total de 60% (cu
împărţirea: 24λ2% datorită ,,strategiei” B 1: B1 şi (60λ1+36λ2) % datorită ,,strategiei” B 1: B2, cu

l1l2 Î [0,1], l1 + l 2 = 1 ).

60
TEME DE CONTROL

1. Fie un joc de două persoane cu suma nulă dat cu matricea de câ ştig

3 6 9 6
H1=A=
10 6 1 8
4 5
3 5
Care este matricea de câ ştig a jucătorului 2? Câte strategii are juc ătorul 1, respectiv jucătorul 2?

2. (Jocul Morra). Doi jucători arată simultan unul sau două degete de la mâna stâng ă şi în acelaşi timp
spun numărul de degete pe care ei cred că îl va arăta oponentul.Dacă un din jucător nimereşte numărul
de degete arătat de oponent, el primeşte aşa de multe unităţi monetare cât este num ărul de degete pe
care le-au arătat împreună. Dacă ambii jucători nimeresc sau niciunul nu nimereşte atunci niciunul nu
primeşte nimic. Care este matricea de câ ştig a acestui joc?

3. Care dintre jocurile problemelor precedente au puncte şa în strategii pure?

4. Să se exprime câ ştigurile aşteptate de către jucătorul 1 în cazurile jocurilor precedente.

5. Folosind eliminarea iterată a strategiilor dominante rezolvaţi jocul cu matricea de câ ştig

1 -1 -2 0
3
A= 0 2 4
4
5 1 5
2 3 -1 3

6. Găsiţi strategiile optimale şi valoarea jocului (cu relaţiile de calcul) pentru jocurile cu
următoarele matrice de câ ştig:

2 3 6 -1 2 4
; ; .
a) A = b) A = c) A =
5 2 4 5 3 1
7. Rezolvaţi problema 6 cu metoda Williams.

8. Rezolvaţi problema 6 cu metoda grafică pentru jocurile de tip 2 x n şi m x 2.

9. Folosind metoda grafică, rezolvaţi jocurile cu următoarele matrice de câ ştig:

61
2 4
2 1 4 3 1
,
a) A = 5 1 b) A =
3
1 6

5 0

10. Folosind coordonatele boricentrice rezolvaţi jocul cu matricea de câ ştig:

1 -1-2
A
= -1 1 1
2-10

11. Folosind programarea liniară rezolvaţi jocurile cu următoarele matrice de câ ştig:


2 3 0 7 5 6
a) A = -1 8 - 3 , b) A = 0 9 4.
0 -1 2
14 1 8

12. O firmă produce trei tipuri de produse P1 , P2 , P3 , folosind trei tipuri de materiale M 1 , M 2 , M 3 .
Cheltuielile cu materialele încorporate în câte o u nitate de produs sunt date în tabelul:

P
M P1 P2 P3

M1 4 4 6
M2
3 5 3
M3
5 2 4

Scrieţi matricele de câ ştig în reprezentare generală.

13. Două ramuri economice au de făcut investiţii în 4 obiective. Strategia cu codul i constă în a finanţa

obiectivul i, i = 1,4. Ca urmare a tuturor analizelor făcute s-a constatat că, pentru prima
ramură, câ ştigurile sunt date de matricea:

0 1 -1 2

A -1 0 3 2
=
0
1 2 -1
2 0 0 0

Se presupune că fiecare ramură îşi materializează câ ştigul în înţelegere cu cealaltă, adică ceea ce câ
ştigă una pierde cealaltă şi invers.

Scrieţi matricele jocului în reprezentare generală.


62
14. Considerăm două persoane care joacă un joc necooperativ dat cu matricele:

H1 1 7 H2 1 8
=
, =

3 4 7 8

Rezolvaţi jocul.

15. Pentru dezvoltarea economică şi socială a unui oraş apare problema construirii sau nu a două
obiective economice. Există două strategii corespunzătoare Ministerului tutelar şi pentru autorităţile
locale ale oraşului: 1 – a construi primul obiectiv, 2 – a constru i al doilea obiectiv. Autorităţile oraşului
au 2 strategii: 1 – agreeaz ă (acceptă) propunerea Ministerului, 2 – nu agreeaz ă (acceptă) propunerea.

Strategiile se aplică independent. Câ ştigurile sunt date de matricele:

H1 -10 2 H2 5 -2
= 1 , =
-1 -1 1
Rezolvaţi acest joc necooperativ.

16. Fie reconsiderată Problema 12. Acum se cere:

16.1. Care sunt procentele p1 , p2 , p3 pe care să le facem, în avans, pentru oferta cu materialele în aşa
fel încât stocul s ă fie sigur asigurat şi să se realizeze o valoare maximă a producţiei?

16.2. Găsiţi un plan de producţie corespunzător unui tabel de producţie de 4 milioane unităţi moetare.

17. Rrezolvaţi jocul antagonistic dat în Problema 13.

Răspunsuri.

1. Trei strategii pentru jucătorul 1 şi patru strategii pentru jucătorul 2. Matricea de câ


ştig a jucătorului 2 este

1.
-3 -10 -4
-6
H2= -6 -5
-9 -1 -3

-6 -8 -5

2.

63
0 2 -3 0 L11

H1 =A=
-2 0 0 3 L12
3 0 0 - 4 L21

0 L22
-3 4
0
L înseamnă : 1 deg et, 1 spune;
11
L
12 înseamnă : 1deg et, 2 spune;
unde
L înseamnă : 2 deg ete, 1 spune;
21

L înseamnă : 2 deg ete, 2 spune.


22

3. v1 = max min aij = 3, v2 = min max aij = 6, deci nu există punct şa în strategii pure,
pentru
primul joc; v1 = -2, v2 = 2; deci nu există punct şa în strategii pure, pentru al doilea joc.
3 4

4. a x y = 3x y + 6x y
∑ ∑ ij i j 1 1 1 2 + ... + 5x3 y4 ;
i =1 j =1
4 4

∑ ∑aij xi y j = 2x1 y2 - 3x1 y3 - 2x2 y1 + 3x2 y4 + 3x3 y1 - 4x3 y4 -


i j =1
=1

- 3 x4 y2 + 4 x4 y3 .

2 1 1 5 5
5. X *
= 0, , ,0 , Y * = 0, , ,0 , v = .
3 3 6 6 3
6–8.

1 3 3 1
a) X *
= , , Y* = , , v = 1.
4 4 4 4
3 1 1 7 17
b) X *
= , , Y* = , , v= .
4 4 8 8 4
3 1 1 1 5
c) X *
= , , Y* = , , v= .
4 4 2 2 2
9.

1 1 3 1 5
a) X *
= , , Y* = ,0, ,v = .
2 2 4 4 2
1 2 1 2 1
b) X *
= 0, ,0, , Y* = , , v= .
3 3 3 3 3
64
3 2 2 3 1
10. X *
= 0, , , Y *
= , ,0 , v= .
5 5 5 5 5

4 4 6
12. H1=35 3
2
5 4
0 1 -1 2
-1
= 0 3 2
13. H
1
0 1 2 -1
2 0 0 0

14. Prima soluţie: P1 = (1,0), P = (0,1), F1=F2 = 7


2

= (1,0), 3 2 = (1,0), F1 = 17
A doua soluţii: P1 P2' = , , P2' l1 + 3l2 , F2 = 8, unde
5 5 5
l1 , l2 ³ 0, l1 + l2 = 1, P2 = l1 P2' + l2 P2'.

15. P1 1 , 2 , P2 (0,21; 0,79), F1= -0,57; F2 = 0,33

3 3
16. 16.1. 1: 0:0

P1 : a = 2680000l1 + 2000000l2 , u.m.

16.2. P2 : a = 1320000l1 + 2000000l2 , u.m


l1 , l2 = 0, l1 + l2 = 1
17.
P1 = [0,3;0,11;0,26;0,33], P2 = [0,28;0,38;0,17;0,17].

Prima fabrică obţine câ ştigul 0,56 u.m.

Bibliografie modul
1. Blaga P. Muresan A.S., Lupas Al., Matematici aplicate in economie, vol. 2, ed.
Promedia Plus, Cluj-Napoca, 1999
2. Gibbons, R., Game theory for applied economists Princeton Univ. Press, Prenceton,
New Jersey
3. Muresan, A.S., Non cooperative games, Ed. Mega, Cluj-Napoca, 2012
4. Muresan A.S.Blaga P., Matematici aplicate in economie, vol. 2, ed. Transilvania Press,
Cluj-Napoca, 1996
5.Muresan A.S., Cercetari operationale, vol. 1 si 2, lito. UBB, Cluj-Napoca, 1997

65
Modulul 2

JOC POZITIONAL

Concepte de bazǎ jucator, decizie, pozitie, dinamica, arborescenta, drum redus


complet, clasa informationala

Obiective:

a. definirea notiunilor de joc pozitional, arborescenta, drum redus

b. considerarea diverselor tipuri de jocuri dinamice

c. definirea notiunii de punct de echilibru, de succesiune de decizii optimale

Recomandǎri privind studiul: se recomanda studentilor sa-si insuseasca notiunile


importante, in aplicatiile practice, de jucator, decizie (pozitie), arborescenta, drum
redus. De asemenea modelele pentru diversele probleme de jocuri dinamice.

Rezultate aşteptate:

a) se asteapta ca studentii sa poata opera cu diversele tipuri de jocuri


dinamice, sa le recunoasca si sa le utilizeze in aplicatii
b) sa fie in stare sa gasesca solutiile pentru jocurile dinamice si problemele
simple intalnite in aplicatii

Unitatea 1

Jocuri dinamice (pozitionale)

Obiective:

a) evidentierea principalelor tipuri de jocuri dinamice


b) prezentarea diverselor tipuri de modele
c) lamurirea notiunii de punct de echilibru
Noţiuni cheie : jucator, decizie (pozitie)

CONŢINUTUL UNITĂŢII

5. Definiţia jocului poziţional


Jocul, aşa cum a fost definit în punctul 1., nu reflectă decât par ţial caracterul
dinamic, de desfăşurare în timp, al oricărui joc real. Un joc finit este format dintr-o

66
succesiune finită de acţiuni, declanşate în urma unor decizii luate în diferite
momente de către cei n jucători care participă la joc. Momentele de decizie se
succed în mod discret, fiind net separate unele de altele. În fiecre moment de
decizie se ştiu

- jucătorul care urmează să ia decizia


- variantele dintre care poate să aleagă jucătorul la rând
- momentul când s-a ajuns la ultima decizie când, în funcţie de succesiunea
deciziilor luate, se obţin câ ştigurile prevăzute pentru fiecare jucător.
În afara parametrilor raţionali, a jucătorilor propriu-zişi, care sunt persoane şi
care în momentele de decizie aleg în mod ferm cu probabilitatea egală cu 1 una
dintre variantele posibile, alegere fiind numită strategie pură locală, se poate
include în joc şi un partener neraţional, natura, care alege dintre variante, una, cu o
anumită probabilitate cunoscută, apreciată de dinainte. În momentul deciziei jocul
se află într-o anumită poziţie (stare). Dacă jucătorul nu poate deosebi două poziţii
diferite (informaţia de care dispune este aceiaşi) atunci el se găseşte în aceiaşi
situaţie informaţională, având acelea şi variante pentru a lua decizia. Într-o
succesiune de decizii, luate de unul şi acelaşi jucător, nu apar situaţii informaţionale
identice. Doi jucători oarecare, diferiţi între ei, nu au situaţii informaţionale
identice.

În descrierea jocului poziţional se poate folosi terminologia teoriei grafelor.


Jocului poziţional i se poate asocia un graf G = (X,Y) unde X ={xj}, j = 1,m este
mulţimea vârfurilor, iar Y = {(xj,xk)}, 1 ≤ j ≤ m, 1 ≤ k ≤ m este mulţimea arcelor.

Vârfurile grafului corespund pozi ţiilor jocului şi arcele grafului corespund


variantelor de decizie. Fără restrângerea generalit ăţii se poate presupune că nu
există circuite în graful G. Deciziile se succed într-o ramificare permanentă pân ă ce
se ajunge la terminarea jocului. Astfel se poate presupune că fiecărui vârf xk , cu
excepţia unui singur vârf, fie acesta x1 , i se asociază exact un arc incident spre
interiorul vârfului dat (x j , xk ). Un astfel de graf este conex şi simplu şi se numeşte
arborescenţă. Vârful x1 este rădăcina arborescenţei.
În continuare pentru notarea grafului G vom folosi simbolul arborescenţei A.

Din motive de formalizare a reprezentării prin arborescenţă a jocului,


introducem un vârf fictiv x0 care va fi legat, printr-un singur arc (x0 , x1 ) de rădăcina
x1 a arborescenţei. Astfel, în continuare x0 va fi rădăcina arborescenţei. Vom presupune
că decizia în x0 este luată de natură, cu probabilitatea egală cu 1, de a

67
trece în x1 , adică de a începe jocul. Pentru a deosebi clasele cu vâr furi iniţiale
echivalente din punct de vedere informaţional, asociem celor h clase
informaţionale diferite, tot atâtea simboluri diferite ct , t = 1, h . Aceste simboluri pot
fi, de exemplu, primele h numere naturale pozitive. Menţionăm că echivalenţa
informaţională a vârfurilor ini ţiale implică echivalenţa informaţională a arcelor
incidente spre exterior. Jucătorii raţionali se vor nota cu primele n numere naturale
pozitive, iar natura cu numărul natural 0. Jocul poziţional asociat arborescenţei A
este o funcţie de arborescenţă (arc) F(A), definită prin 6+n caracteristici asociate
fiecărui arc: g codul (numărul) arcului, x j codul vârfului ini ţial al arcului, xk codul
vârfului final al arcului, i codul (num ărul) jucătorului care ia decizia în vârful
iniţial al arcului, ct codul (numărul) clasei de vârfuri echivalente din punct de
vedere informaţional de care aparţine vârful ini ţial al arcului, p(g ) probabilitatea
alegerii variantei reprezentate de arcul respectiv, H1 (g ),..., H n (g ) sunt componentele
vectorului de câ ştig, în cazul când arcul este un arc suspendat. Sch ematic, în formă
tabelară se poate scrie:

g xj xk i ct p(g ) H1 (g ) … H n (g )

În cazul când i ¹ 0 avem p(g ) = 1, respectiv p(g ) = 0, după cum g aparţine


strategiei pure locale ce constă în alegerea variantei corespunzătoare în poziţia
fixată, respectiv nu aparţine strategiei pure locale. Toate variantele aparţinătoare
aceluiaşi vârf ini ţial x j formează un sistem complet de evenimente şi de aceea
suma probabilităţilor respective este egală cu 1, fapt valabil şi când i = 0. Când
arcul (x j , xk ) nu este arc suspendat, coloanele H1 (g ),..., H n (g ) nu se completează.
Se mai presupune, pentru fixarea ideilor, că pentru un ct comun arcele (x j , xk ' ' ) şi
(x j ' , xk ' ) pentru vârfurile ini ţiale x j ' si x j diferite, se succed aceeaşi ordine, şi
'

în mod implicit, sunt în acelaşi număr.


În concluzie se poate da următoarea definiţie:

Definiţia 1. Se numeşte joc poziţional de n jucători, jocul finit care constă


din:

1. Arborescenţa A.
2. Funcţia de câ ştig H i (g ) definită pentru fiecare arc suspendat g şi
pentru fiecare jucător i, i Î I , I = {1,..., n}. Dacă jocul se termină în arcul suspendat g jucătorul i primeşte suma

H i (g ).

68
3. Aplicaţia T a vârfurilor ini ţiale x j , x j Î X , X = {x1 ,..., xm }, pe mulţimea
jucătorilor (inclusiv natura 0) I 0 , I 0 = I È {0}. Deci Tx j = i , atunci jucătorul i este cel
care ia decizia în vârful x j .
4. Probabilităţile asociate arcelor incidente spre exterior vârful ui x j .
Dacă în vârful x j decide natura 0 se asociază arcelor g k = (x j , xk ) probabilităţile
p(g k ) care însumate, în raport cu k , pentru toate arcele cu vârful ini ţial x j , dau
valoarea 1. Dacă în vârful x j decide un jucător raţional i, i ¹ 0 , în ipoteza unei
strategii pure locale de alegere a variantei (x j , xk ), arcului respectiv i se
asociază probabilitatea egală cu 1. Totodată restului arcelor cu acelaşi vârf ini
ţial x j li se asociază probabilitatea egală cu 0.
5. O descompunere a mulţimii vârfurilor ini ţiale într-o mulţime de clase
ct , t = 1, h , de vârfuri, echivalente din punct de vedere infor maţional, caracterizată
prin următoarele:
a. Vârfurilor x j şi x j aparţinătoare aceleiaşi clase ct , li se asociază acelaşi
'

jucător i: Tx j = Tx j = i.
' '

b. Alternativele asociate unor vârfuri diferite x j şi x j ' aparţinătoare aceleiaşi clase


informaţionale ct , sunt în acelaşi număr şi se consideră numerotate în aceeaşi ordine,
(
de la stânga la dreapta (sau în orice ordin e prestabilită). Dacă x j ' , xk ' ) este
( )
al q-lea arc, în ordine, dintre arcele cu vârful in iţial x j ' , şi x j ' , xk ' este al q-lea arc,
în ordine, dintre arcele cu vârful ini ţial x j ' , vârfurile x j şi x j ' aparţinând aceleia şi
clase informaţionale ct , atunci arcele corespund între ele, ceea ce înseamnă că în
cadrul aceleiaşi strategii pure complexe, formată din totalitatea strategiilor pure
locale, li se asociază simultan probabilităţi egale.
c. Toate vârfurile ini ţiale x j cu Tx j ' = 0 formează câte o clas ă
informaţională distinctă de celelalte clase.
d. Drumul care leagă rădăcina x0 de un vârf suspendat xS , este format din
vârfuri ini ţiale care care nu aparţin aceleiaşi clase informaţionale.
Exemplu 1. Se consideră următorul joc poziţional cu sumă constantă (nulă):

Sunt doi jucători. Primul jucător alege unul dintre numerele 1 şi 2. Jucătorul 2,
cunoscând alegerea juc ătorului 1, alege unul dintre numerele 1 şi 2. Jucătorul 1,
cunoscând alegerea juc ătorului 2, dar necunoscând prima sa alegere, alege unul
dintre numerele 1 şi 2. Ce câ ştigă unul dintre jucători pierde celălalt jucător.
Funcţia de câ ştig este dată prin următoarele valori:

69
Tabelul 1

Numerele alese de jucători Valoarea funcţiei de


câ ştig

x y z H1 H2

1 1 1 -2 2
1 1 2 -1 1

1 2 1 3 -3

1 2 2 -4 4

2 1 1 5 -5

2 1 2 2 -2

2 2 1 2 -2

2 2 2 6 -6

Aici x este numărul ales de primul jucător la prima decizie, y este numărul ales de
cel de al doilea jucător şi z este numărul ales de primul jucător la a doua decizie.

1. Să se scrie jocul poziţional dat în formă tabelară.


2. Să se reprezinte grafic jocul (arborescenţa).
Trecem la rezolvarea problemelor formulate:

1. Introducem vârful fictiv x0 , care va fi rădăcina arborescenţei, şi în care se află


natura 0 care porneşte jocul: Tx0 = 0 .

Notăm poziţia jocului, când începe primul juc ător, cu x1 . Vârfului x0 îi asociem
clasa informaţională c1 = şi arcului (x0 , x1 îi asociem probabilitatea p(1) = 1. Arcul
1 )
(x0 , x1 nu este arc suspendat, deci nu i se asociază câ ştig.
)

70
Jucătorul 1, în vârful x1 , are două alternative, cărora le asociem arcul al
doilea (x1 , x2 ) şi arcul al treilea (x1 , x3 ). Clasa informaţională trebuie să difere de
c1 : punem c2 = 2 pentru vârful x1 . Probabilitatea asociată poate fi 1, pentru arcul

H 1 (g ) H 2 (g )

H 2 (g )

(x1 , x2 ) şi 0, pentru arcul (x1 , x3 ) sau, 0 pentru arcul (x1 , x2 ), şi 1, pentru arcul (x1 ,
x3 ), în funcţie de strategia pură locală aleasă, după cum jucătorul 1 alege varianta
(x1 , x2 ), respectiv alege varianta (x1 , x3 ). Arcele nefiind suspendate, coloanele H1
şi H 2 nu se completează.
Construirea tabelului se continuă în acelaşi mod pentru jucătorul 2.
Deoarece jucătorul 2 cunoaşte alegerea jucătorului 1, pentru el poziţiile x2 şi x3 vor
fi diferite din punct de vedere informaţional, şi de aceea se fixează pentru vârful x2
clasa informaţională c3 , iar pentru vârful x3 , clasa informaţională c4 . Menţionăm că
strategiile pure locale considerate în vârfurile x2 şi x3 , aparţinând unor clase
informaţionale diferite, sunt independente între ele şi se pot schimba în toate
modurile posibile: (1,0) pentru x2 , (1,0) pentru x3 ; (1,0) pentru x2 , (0,1) pentru x3 ;
(0,1) pentru x2 , (1,0) pentru x3 ; (0,1) pentru x2 , (0,1) pentru x3 , formând strategii
pure combinate.

Urmează din nou primul jucător. Deoarece nu-şi cunoaşte prima sa alegere,
în vârfurile x4 şi x6 , respectiv x5 şi x7 posedă aceeaşi informaţie: în primul caz ştie că
jucătorul 2 a ales numărul 1, în al doilea caz ştie că jucătorul 2 a ales numărul 2.

Prin urmare, pentru cele două perechi de vârfuri avem dou ă noi clase
informaţionale: c5 = 5 şi c6 = 6 . Strategiile pure locale, în poziţiile x4 şi x6 ,
respectiv x5 şi x7 , nu sunt independente deoarece ele aparţin aceleiaşi clase
informaţionale. Astfel în vârfurile x4 şi x6 , aparţinătoare clasei informaţionale c5 ,
fie se aleg simultan variantele (x4 , x8 ), (x6 , x12 ), fie se aleg simultan variantele
(x4 , x9 ), (x6 , x13 ). La fel se pune problema alegerii variantelor în vârfurile x5 şi x7
.
Toate arcele fiind suspendate, în coloanele şi sunt trecute câ ştigurile
corespunzătoare celor doi jucători. Jocul fiind cu sumă nulă, suma câ ştigurilor
corespunzătoare este egală cu 0 (şi de aceea se putea renunţa la precizarea
individuală a valorilor din coloana ).

Toate rezultatele de mai înainte sunt trecute în tabelul 2 şi cu aceasta s-a


răspuns la prima problemă.

71
Tabelul 2

g xj xk i ct p(g ) H1 (g ) H 2 (g ) Numărul
ales

1 x0 x1 0 1 1

2 x1 x2 1 2 1 0 1

3 x1 x3 1 2 0 1 2

4 x2 x4 2 3 1 0 1

5 x x 2 3 0 1 2
2 5

6 x3 x6 2 4 1 0 1

7 x3 x7 2 4 0 1 2

8 x4 x8 1 5 1 0 -2 2 1

9 x4 x9 1 5 0 1 -1 1 2

10 x5 x 1 6 1 0 3 -3 1
10

11 x x 1 6 0 1 -4 4 2
5 11

12 x6 x 1 5 1 0 5 -5 1
12

13 x6 x 1 5 0 1 2 -2 2
13

14 x7 x 1 6 1 0 2 -2 1
14

15 x7 x 1 6 0 1 6 -6 2
15

72
În completarea raţionamentelor de mai înainte, ne putem referi încă la
strategiile pure complexe care apar. Făcând produsul cartezian al mul ţimilor M
aparţinătoare unor clase informaţionale distincte, având ca elemente mul ţimi de
arce ce se aleg simultan ca variante, şi care, toate aparţin jucătorului 1, se obţine
mulţimea strategiilor pure complexe ale jucătorului 1:
{2,3}x {{8,12}, {9,13}}x {{10,14},{11,15}}=
{{2,{8,12},{10,14}},{2,{8,12},{11,15}},{2,{9,13},{10,14}},} {2,
{9,13},{11,15}},{3,{8,12},{10,14}},{3,{8,12},{11,15}}, {3,{9,13},
{10,14}},{3,{9,13},{11,15}}},

formată din 8 strategii pure complexe. La fel, formând pro dusul cartezian
corespunzător în cazul jucătorului 2, se obţine mulţimea strategiilor pure complexe
ale acestuia:
{4,5}x {6,7}= {{4,6},{4,7},{5,6},{5,7}},
formată din 4 strategii pure complexe.

3. Graficul jocului (arborescenţei) se poate reprezenta într-o figură.

Unitatea 2

Reducerea jocului pozitional

Obiective:

a) evidentierea principalelor elemente ce intra in constructia arborescentei


b) prezentarea diverselor tipuri de modele
c) lamurirea notiunii de drum redus,
Noţiuni cheie : varf, arc, ciclu, arbore, arborescenta

CONŢINUTUL UNITĂŢII

4. Reducerea jocului poziţional la un joc matriceal

Strategiile pure complexe ale jocului poziţional corespund (pot fi aplicate


pe) strategiile pure ale unui joc matriceal. Pentru a vedea intuitiv sensul afirmaţiei
făcute, să considerăm strategiile pure complexe obţinute în cazul exemplului 1 din
punctul 6. şi să realizăm corespondenţele respective.
73
Tabelul 3

Numărul Strategia pură


jucătorului
complexă a jocului a jocului
poziţional matriceal

{2,{8,12},{10,14}} 1

{2,{8,12},{11,15}} 2

{2,{9,13},{10,14}} 3

{2,{9,13},{11,15}} 4
1
{3,{8,12},{10,14}} 5

{3,{8,12},{11,15}} 6

{3,{9,13},{10,14}} 7

{3,{9,13},{11,15}} 8

{4,6} 1
2
{4,7} 2

{5,6} 3

{5,7} 4

În continuare vom arăta că fiecarei perechi de strategii pure complexe a


jocului poziţional i se poate asocia un câ ştig bine determinat al fiecărui jucător
raţional. În acest mod jocului poziţional i se asociază un joc matriceal.

Orice pereche (mai general n-uplet) de strategii pure complexe a jocului


poziţional determină o valoare a unei funcţii H(A), de arborescenţă, după cum
urmează. Arcelor, care intră în constituirea n-upletului, li se asociază probabilitatea
egală cu 1, dacă vârful ini ţial al arcului corespunde unui jucător raţional, şi
74
totodată, restului arcelor, care pornesc din vârful respect iv, li se asociază
probabilitatea egală cu 0. Cu vectorul de câ ştig, H g = [H1 (g ),..., H n (g )] asociat
arcelor suspendate şi cu probabilitatea p(g ) se trece la un vector H (g ) definit pe
toate arcele g ale arborescenţei. Dacă g este arc suspendat H (g ) este dată. Dacă g
nu este arc suspendat, atunci H (g ) se calculează pe baza formulei:

H (g ) = ∑ p(q)H (q) (1)


qÎG ( x )

unde G(x) este mulţimea tuturor arcelor incidente spre exterior vârful ui final x al
arcului g. Vectorul (funcţia) de câ ştig căutat va fi cel care se va găsi pe arcul
rădăcină al arborescenţei.

Exemplul 1. Se reia jocul poziţional din exemplul 1 din punctul 6.

1. Să se construiască jocul matriceal asociat.


2. Să se reprezinte grafic problema.
1. Pentru exemplificarea construcţiei, legată de jocul matriceal, considerăm
cazul perechii de strategii pure (6,1) (din tabelul 3). Valorile H (g ) calculate
sunt trecute în coloanele H1 (g ) şi H 2 (g ) ale tabelului 4.
Deoarece am ales, pentru jucătorul 1 strategia pură 6 a jocului matriceal, rezultă
că avem probabilitatea 1 pe arcele 3, 8, 12, 11, 15. La fel, alegând pentru
jucătorul 2 strategia pură 1 a jocului matriceal, avem probabilitatea 1 pe arcele
4, 6.

75
Tabelul 4

g xj xk i ct p( g ) H1 (g ) H 2 (g )

1 x0 x1 0 1 1 -2 2

2 x1 x2 1 2 0 -2 2

3 x1 x3 1 2 1 5 -5

4 x2 x4 2 3 1 -2 2

5 x2 x5 2 3 0 -4 4

6 x3 x6 2 4 1 5 -5

7 x3 x7 2 4 0 6 -6

8 x4 x8 1 5 1 -2 2

9 x4 x9 1 5 0 -1 1

10 x5 x 1 6 0 3 -3
10

11 x5 x 1 6 1 -4 4
11

12 x x 1 5 1 5 -5
6 12

13 x6 x 1 5 0 2 -2
13

14 x7 x 1 6 0 2 -2
14

15 x7 x 1 6 1 6 -6
15

Pe restul arcelor, exceptând arcul fictiv (x0 , x1 ), avem probabilitatea egală cu 0.


Menţionăm că am pus simultan 1 pe arcele 8 şi 12, respectiv 11 şi 15 şi am pus
simultan 0 pe arcele 9 şi 13, respectiv 10 şi 14. Potrivit definiţiei funcţiei H (g ),
avem valori date pentru g = 8,15 . Pentru restul arcelor se poate aplica formula
(1). Astfel

76
H (7) = p(14)H (14)+ p(15)H (15) = 0[2,-2]+1[6,-6] = [6,-6],

H (6) = p(12)H (12)+ p(13)H (13) = 1[5,-5]+ 0[2,-2] = [5,-5],

H (5) = p(10)H (10)+ p(11)H (11) = 0[3,-3]+1[- 4,4] = [- 4,4],

H (4) = p(8)H (8)+ p(9)H (9) = 1[- 2,2]+ 0[-1,1] = [- 2,2],

H (3) = p(6)H (6)+ p(7)H (7) = 1[5,-5]+ 0[6,-6] = [5,-5], H

(2) = p(4)H (4)+ p(5)H (5) = 1[- 2,2]+ 0[- 4,4] = [- 2,2],

H (1) = p(2)H (2)+ p(3)H (3) = 0[- 2,2]+1[5,-5] = [5,-5].

Această ultimă valoare H (1) = [5,-5]. , este valoarea funcţiei de câ ştig asociată
perechii de strategii pure (6,1) a jocului matriceal, respectiv a perechii de
strategii pure complexe ({3,{8,12},{11,15}},{4,6})a jocului poziţional iniţial dat.
Astfel o dată cu trecerea de la jocul poziţional la jocul matriceal asociat se poate
scrie H(6,1), în loc de H(1) şi sunt restabilite notaţiile din punctul 1.

Calculând în mod similar restul valorilor func ţiei de câ ştig se obţine, pentru
jucătorul 1, matricea bidimensională din tabelul 5. Pentru jucătorul 2 se poate
scrie un tabel similar schimbând semnul elementelor matricei din tabelul 5.

Tabelul 5

i 1 2 3 4
j

1 -2 -2 3 3
2 -2 -2 -4 -4

3 -1 -1 3 3

4 -1 -1 -4 -4

5 5 2 5 2

6 5 6 5 6

7 2 2 2 2

8 2 6 2 6

77
2. Graficul problemei pentru perechea de strategii (6,1) poate fi reprezentat
într-o figură.
Arcelor cărora le corespund probabilităţile egale cu 1 vor fi marcate cu linii
duble. Lâng ă fiecare arc se va trece simbolul g al arcului şi valoarea funcţiei
H (g ). Calculul valorilor H (g ), trecute în coloanele H1 (g ) şi H 2 (g ) ale tabelului
4 pot fi urmărite pe figură.

Observaţia 1. Jocul poziţional este denumit joc în formă extinsă. Pentru a


deosebi jocul nepoziţional de cel poziţional, jocul nepoziţional se numeşte joc
normal, sau joc dat în formă normală.

Unitatea 3

Rezolvarea jocului pozitional

Obiective:

a) evidentierea principalelor tipuri de legaturi intre varfuri


b) prezentarea diverselor tipuri de abordari continue
c) lamurirea notiunii de drum redus complet
Noţiuni cheie : succesiune, radacina, varf de tranzit, varf suspendat, drum redus,
drum redus complet

CONŢINUTUL UNITĂŢII

6. Rezolvarea jocului poziţional în strategii mixte


Am văzut în punctele precedente că jocurile poziţionale sunt echivalente cu
jocurile matriceale. Aşa cum un joc matriceal poate fi antagonist, bimatriceal,
necooperativ, cooperativ, şi jocul poziţional poate avea una dintre aceste forme. În
acest sens folosim denumirile: joc poziţional antagonist, joc poziţional
necooperativ, joc poziţional cooperativ. În cazul exemplului 1 din punctul 7. am
considerat un joc antagonist. Oricare ar fi forma jocului matriceal, se pune
problema determinării unor strategii mixte. Acestora le corespund strategii mixte
ale jocului poziţional. Cu alte cuvinte arcelor li se pot asocia probabilităţi, care
corespund frecvenţelor relative, cu care urmează să fie folosite variantele în
diferite poziţii ale jocului de către jucătorii raţionali.

Definiţia 1. Rezolvarea jocului poziţional în strategii mixte, constă în


determinarea probabilităţilor asociate variantelor de decizie (arcele arborescenţei),
pornind de la strategiile mixte ale jocului matriceal asociat.

Presupunând c ă am rezolvat jocul matriceal asociat în strategii mixte, rezolvarea


jocului poziţional în strategii mixte se poate da în forma unui algoritm:

78
Teorema 1. Pentru a obţine strategii mixte asociate variantelor, în cazul
unui jucător fixat, se procedează după cum urmează:

1. Se asociază numărul 0 tuturor arcelor cu vârful ini ţial aparţinător jucătorului


fixat.
2. Se ia prima strategie pură complexă, în ordine, a jucătorului fixat. Se iau
arcele aparţinătoare strategiei pure respective, care sunt legate tare conex cu
rădăcina arborescenţei, fiind excluse dintre arcele aparţinătoare jucătorului fixat,
cele care nu fac parte din strategia pură complexă. La probabilitatea arcelor, cu
această proprietate, se adună probabilitatea strategiei pure corespunzătoare jocului
matriceal asociat, obţinută prin rezolvarea în strategii mixte a acestui joc.
3. Dacă mai există strategii pure complexe se reia operaţia 2. În caz contrar se
trece la operaţia următoare.
4. Probabilităţile arcelor (variantelor de decizie) care pornesc dina celaşi vârf,
în care jucătorul fixat ia decizia, se împart cu suma probabilităţilor tuturor arcelor.
Exemplul 1. Considerăm jocul a cărui matrice este dată în tabelul 5. Jocul se
rezolvă ca un joc antagonist, prin problema de programe liniară asociată matricei
simplex din tabelul 6.

Tabelul 6

1 2 3 4 5 6 7
i
j

1 1 1 1 1 0 0 1 =
2 -2 -2 3 3 -1 1 0 £

3 -2 -2 -4 -4 -1 1 0 £

4 -1 -1 3 3 -1 1 0 £

5 -1 -1 -4 -4 -1 1 0 £

6 5 2 5 2 -1 1 0 £

7 5 6 5 6 -1 1 0 £

8 2 2 2 2 -1 1 0 £

9 2 6 2 6 -1 1 0 £

10 0 0 0 0 1 -1 0 MIN

Pentru jucătorul 1 obţinem strategia mixtă P = l1 P1 + l2 P2


79
P1 = [0,0,0,0,0,1,0,0],P2 = [0, 0, 0, 0, 0.25, 0.75, 0, 0 ], l1 ³ 0, l1 + l2 = 1

Valoarea jocului este V=5.

Observaţia 1. Prin valoarea jocului, în cazul unui joc antagonist,


înţelegem câ ştigul jucătorului 1.

Din cele stabilite rezultă că jucătorul 1 va aplica strategia pură complexă


{3, {8,12},{11,15}}, cu probabilitatea l1 + 0,75 l2 , care se asociază arcelor componente:
p1 (3) = p1 (12) = p1 (15) = l1 + 0,75 l2 . Tot jucătorul 1 va aplica strategia pură complexă
{3,{8,12},{10,14}}cu probabilitatea 0,25l2 . Aceasta se asociază arcelor componente:
p2 (3) = p2 (12) = p2 (14) = 0,25 l2 . Astfel probabilităţile, pe arce, sunt următoarele :

p(3) = p1 (3)+ p2 (3) = l1 + 0,75l2 + 0,25l2 = 1,

p(12) = p1 (12)+ p2 (12) = l1 + 0,75l2 + 0,25l2 = 1,

p(15) = p1 (15) = l1 + 0,75l2 ,

p(14) = p2 (14) = 0,25l2 ,

Pentru jucătorul 2 obţinem strategia mixtă


Q = m1Q1 + m2 Q2 , Q1 = [1,0,0,0], Q2 = [0,0,1,0,], m1 ³ 0, m2 ³ 0, m1 + m2 = 1.

Astfel jucătorul 2 va putea aplica strategia pură complexă {4,6} respectiv {5,6} cu
probabilitatea m1 respectiv m2 . Notând cu p probabilitatea pe arce şi în cazul
jucătorului 2, avem pe de o parte p1 (4) = m1 , p1 (6) = m1 , iar pe de altă parte
p2 (5) = m2 , p2 (6) = m2 , deci p(4) = p1 (4) = m1 , p(5) = p2 (5) = m2 ,

p(6) = p1 (6)+ p2 (6) = m1 + m2 = 1.

Probabilitatea P(g ) ca jocul să se termine cu arcul g este egală cu 0 cu excepţia


arcului g=12 pe care este egală cu 1: P(12) = p(3) p(6) p(12) = 1x1x1 = 1.

În concluzie jucătorul 1, la prima decizie alege numărul 2, al doilea jucător


alege numărul 1 şi primul jucător, la a doua decizie, alege numărul 1.

Deoarece, în exemplului considerat, suma probabilităţilor corespunzătoare


arcelor care pornesc dintr-un acelaşi vârf este egal ă cu 1, nu a fost necesar să
aplicăm operaţia 4 din algoritmul teoremei 1. În cazul general este necesar să se
aplice şi această operaţie. Să arătăm că operaţia 4 poate fi executată atât în raport
cu soluţiile în strategii mixte de bază, cât şi în raport cu soluţia în strategii mixte
generală a jocului matriceal asociat.
80
Fie a* = {a} un sistem complet de arce, variante de decizie, corespunzatoare
aceluiaşi vârf ini ţial. Toate componentele soluţiilor în strategii mixte de bază
Pi , i = 1, s şi ale soluţiei în strategii mixte generale.
s s

P = ∑li P i , li ³ 0, i = 1, s; ∑ li = 1,
i =1 i=1

se distribuie pe submulţimi disjuncte ale sistemului a* . Fie J (a) matricea linie cu


elementul 1 sau 0, anume 1, dacă componenta cu indicele respectiv se distribuie pe
arcul a şi 0 în caz contrar. Avem următoarele probabilităţi pe arce:
s
T
p(a) = PJ (a) = ∑ l1 P i J T s s

(a) =∑ l1'Pi ', li' ³ 0, i = 1, s ; ∑li' =


i=1
1,
∑PJ T ∑PJ T (a) i =1 i =1

(a)
* *
aÎa aÎa

unde
T
li ∑Pi J T Pi J (a)
( a) *
' aÎa '

li = ∑PJ (a) T , Pi = ∑Pi J T .


(a )
* *
aÎa aÎa

Deoarece probabilitatea p(a) asociată arcului a se exprimă ca o combinaţie


'
liniară convexă cu ajutorul soluţiilor în strategii mixte de bază pe arce P are loc
i

următoarea teoremă:

Teorema 2. Soluţia generală, în strategii mixte pe arce, poate fi calculată


pe baza soluţiilor în strategii mixte de bază, pe arce.

Teme pentru verificarea cunoştinţelor


Exercitii si probleme rezolvate

Exemplu de joc poziţional

Se consideră jocul poziţional cu următoarea desfăşurare. Primul pas este făcut de natură: sunt două
variante, prima se realizează cu probabilitatea 2 , a doua cu probabilitatea 1 . Al doilea pas este făcut de
3 3
jucătorul 1, care, necunoscând ce a realizat natura, al ege unul dintre numerele 1,2. Pasul al treilea este
făcut de jucătorul 2, care, necunoscând ce s-a realizat la pasul aleatoriu, dar cunoscând num ărul ales
de jucătorul 1 la al doilea pas, alege unul dintre numerele 1,2. Câ ştigul jucătorului 1, de la al doilea
jucător, este dat prin tabelul:
81
s 1 2 3 4 5 6 7 8

h(s) -1 5 2 -3 4 1 -2 6

unde s este codul situaţiei în ordonare lexicografică, iar h(s) este câ ştigul corespunzător.

1. Să se construiască graficul arborescenţei jocului.


2. Să se construiască tabelul jocului.
3. Să se reducă jocul la un joc matriceal.
4. Să se rezolve jocul matriceal asociat.
5. Să se construiască arborescenţa de structură şi să se interpreteze rezultatele.
Soluţie. 1. Arborescenţa jocului. Are 15 arce g, g = 1,15; are 16 vârfuri xi , i = 0,15; are 5 clase

informaţionale, ct , t = 1,5

2. Tabelul jocului. Jocul este trecut în tabelul următor.

g xj xk i ct p(g) H1(g) H2g)

1 x0 x1 0 1 1
2 x1 x2
0 2 2/3
3 x2 x3
1 3
4 x3 x4
2 4 -1 1
5 x3 x5
2 4 5 -5
6 x2 x6
1 3
7 x x
6 7 2 5 2 -2

8 x6 x8 2 5 -3 3
9 x1 x9
0 2 1/3
10 x9 x
10 1 3

11 x x 2 4 4 -4
10 11

12 x x 2 4 1 -1
10 12

13 x9 x 1 3
13

14 x x 2 5 -2 2
13 14

15 x x 2 5 6 -6
13 15

3. Reducerea jocului. Corespondenţa între jocul poziţional şi jocul matriceal este stabilită în
tabelul următor.
Urmând calculele se poate scrie urm ătoarea matrice a jocului (referitoare la jucătorul 1):
82
1 2 3 4
2 2 11 11
H=1
3 3 3 3
2 2
2 0 0
3 3

Nr. jucător Strategie pură

complexă a jocului a jocului matriceal


poziţional

1 {3, 10} 1
{6, 13} 2

2 {{4,11}, {7,14}} 1
{{4,11}, {8,15}} 2

{{5,12}, {7,14}} 3

{{5,12}, {8,15}} 4

4. Rezolvarea jocului. Coloana a treia este dominantă şi se poate elimina. Matricei rămase i
se asociază matricea simplex
i\j 1 2 3 4 5 6

1 1 1 1 0 0 1 =
2 2 11 -1 1 0 ≤
2
3 3 3
3 0 0 -1 1 0 ≤
2
3
4 0 0 1 -1 0 MIN
0

care rezolvată ne dă următoarea soluţie generală:

P = [1,0], Q = l1Q2 + l2 Q2 ,

Q1 = [1,0,0,0], Q2 = [0,1,0,0],

l1 ³ 0, l2 ³ 0, l1 + l2 = 1

83
TEME DE CONTROL
1. Jucătorul 1 alege un număr a din mulţimea {x,y}. Jucătorul 2 , fiind informat asupra numărului a,
alege numărul b din aceeaşi mulţime {x,y}. Jucătorul 1, uitând num ărul a, şi nefiind informat asupra
numărului b, alege un număr c din mulţimea {x,y}. Câ ştigul jucătorului 1 este dat prin funcţia M:

M (x, x, x) = -2, M (x, x, y ) = -1, M (x, y, x) = 3, M (x, y, y ) =

-4 M (y, x, x) = 5, M (y, x, y ) = 2, M (y, y, x) = 2, M (y, y, y) =

6
1. Să se reprezinte grafic arborescenţa jocului.
2. Să se scrie tabelul jocului.
3. Să se reducă jocul la un joc matriceal.

Bibliografie modul

1. Blaga P. Muresan A.S., Lupas Al., Matematici aplicate in economie, vol. 2,


ed. Promedia Plus, Cluj-Napoca, 1999
2. Gibbons, R., Game theory for applied economists Princeton Univ. Press,
Prenceton, New Jersey
3. Muresan, A.S., Non cooperative games, Ed. Mega, Cluj-Napoca, 2012
4. Muresan A.S.Blaga P., Matematici aplicate in economie, vol. 2, ed.
Transilvania Press, Cluj-Napoca, 1996
5.Muresan A.S., Cercetari operationale, vol. 1 si 2, lito. UBB, Cluj-Napoca,
1997

84
Modulul 3

JOCURI STATICE CU INFORMATIE INCOMPLETA

Concepte de bazǎ joc static, punct de echilibru de tip Nash-Bayes, revelatie

Obiective:

a. definirea notiunilor de joc static

b. considerarea diverselor tipuri de informatii

c. definirea notiunii de punct de echilibru la un joc static cu informatie


incompleta

Recomandǎri privind studiul: se recomanda studentilor sa-si insuseasca notiunile


importante, in aplicatiile practice, de joc static, informatii, punct de echilibru. De
asemenea modelele pentru diversele probleme formulate plecand de la cazul
jocurilor statice cu informatie completa

Rezultate aşteptate:

a) se asteapta ca studentii sa poata opera cu diversele tipuri de jocuri statice,


sa le recunoasca si sa le utilizeze in aplicatii
b) sa fie in stare sa gasesca solutiile pentru modelele si problemele simple
intalnite in aplicatii

Unitatea 1

Joc static de tip Bayes

Obiective:

a) evidentierea principalelor tipuri de jocuri statice


b) prezentarea diverselor tipuri de informatii
c) lamurirea notiunii de forma normala a unui joc static
Noţiuni cheie : joc static, informatie, forma normala

CONŢINUTUL UNITĂŢII

Jocuri statice de informaţie incompletǎ

Vom considera acum jocuri de informaţie incompletǎ (jocuri Bayes), adicǎ jocuri
în care cel puţin un jucǎtor nu este sigur (nu cunoaşte) de funcţia de câ ştig a altui
85
jucǎtor. Un exemplu specific de joc static de informaţie incompletǎ este cel al
vânz ǎrii prin licitaţii. Fiecare ofertant cunoaşte evaluarea sa pentru un anumit bun
ce urmeazǎ a fi vândut dar nu ştie evluǎrile celorlalţi ofertanţi.

Jocuri Bayesiene statice şi şi echilibre Bayes – Nash

Definim forma normalǎ de eprezentare a unui joc Bayes static şi a unui echilibru Bayes
– Nash într-un astfel de joc. Întrucât aceste definiţii sunt abstracte şi destul de
complexe vom introduce ideile principale pentru exemplul simplu, anume competiţia
Cournot în informaţie asimetricǎ. Considerǎm un modul Cournot cu inverse funcţiei
cerere datǎ prin P(Q) = a - Q, unde Q = q1 + q2 este cantitatea agregatǎ de pe piaţǎ.
Funcţia cost a firmei 1 este C1 (q1 ) = cq1 . Funcţia cost a firmei 2
este C2 (q2 ) care are distribuţia probabilisticǎ C2 c L q2 c H q 2 ,
(q2 ):
1-q q

unde cL < cH . Mai mult, informaţia este asimetricǎ deoarece firma 2 cunoaşte
funcţia sa de cost şi funcţia de cost a firmei 1, dar firma 1 cunoaşte funcţia sa de
cost şi cunoşte numai cǎ pentru firma 2 costul marginal c are distribuţia
probabilisticǎ
c : cL c
H .
1 -q q

Aceastǎ situaţie poate fi atunci când firma 2 vrea s ǎ intre cu ceva sortiment nou pe
piaţǎ sau poate tocmai a inventat o nouǎ tehnologie. Toate acestea sunt în comun
cunoscute de cǎtre cele douǎ firme. Firma 1 ştie cǎ firma 2 are o informaţie în plus
(superioarǎ), firma 2 ştie cǎ firma 1 cunoaşte acest lucru şi aşa mai departe.
Natural, firma 2 poate vrea sǎ aleagǎ cantitǎţi diferite (de obicei mai mici) în cazul
când costul s ǎu marginal este mai înalt decât atunci când costul este mai scǎzut.
Firma 1, din punctual sǎu de vedere, va anticipa cǎ firma 2 poate împǎrţi (alege)
cantitatea sa la costul sǎu în acest mod.

Fie q2* (c) notatǎ cantitatea pe care firm 2 o alege ca funcţie de costul sǎu, adicǎ

86
daca c = cL .
q * (c ) ,
q2* (c) = 2 L

q2* (cH ) , daca c = cH

Fie q* notatǎ singura cantitate pe care o allege firma 1. Când c ostul firmei 2 este
1

scǎzut, ea va alege q2* (cL ) sǎ resolve problema

[
max (a - q1* - q2 )- cL q2 . ]
q2

Analog, când costul firmei 2 este înalt, q2* (cH ) va rezolva problema

[
max (a - q1* - q2 )- cH q2 .
q
]
2

Firma 1 cunoaşte cǎ la fima 2 costul este scǎzut cu probabilittea 1 - q şi va anticipa


cǎ pentru firma 2 cantitatea aleasǎ va fi q2* (cL ) sau q2* (cH ), aceasta depinzând
de costul firmei 2. Astfel firma 1 alege q1* sǎ rezolve problema

max{(1 - q ) [(a - q1 - q2* (cL ))- c]q1 +q [(a - q1 - q2* (cH ))- c]q1 },
q1

ca sǎ-şi maximizeze profilul aşteptat.

Condiţiile necesare de extrem pentru aceste trei probleme de optimizare sunt (dupǎ
anularea derivatelor de ordinul întâi)

q2* (cL ) = 1 (a - q1* - cL ), q2* (cH ) = 1 (a - q1* - cH )


2 2
şi

q1 * 1
=
[(1 - q )(a - q2 (cL )- c)+ q (a - q2 (cH )- c)].
* *

2
Rezolvând acest sistem de trei ecua ţii obţinem

q2* (cL ) =1 (a - 2cL + c)- q (cH - cL ),

3 6
q2 (cH ) = 1 (a - 2cH
*
+ c)- 1 -q (cH - cL ),

3 6
87
1
q* = [a - 2c + (1 - q )c + qc ].

Observaţie.
1 L H

Sǎ comparǎm cantitǎţile q2* (cL ), q2* (cH ) şi q1* cu cele de la echilibrul Cournot în
cazul informaţiei complete, când costurile marginale sunt c1 şi c2 . Presupunând c ǎ
valorile c1 şi c2 sunt aşa încât cantit ǎţile de echilibru ale ambelor firme sunt
pozitive, vom avea, în acst caz al informaţiei complete, cǎ firma i va produce
cantitatea:
1
q i+ = (a - 2ci + c j ).
3

În cazul informaţiei incomplete cantitatea q2* (cH ) este mai mare decât 1 (a - 2cH + c),
3

în timp ce q* (c ) este mai micǎ decât 1 (a - 2c + c).


2 L L

Aceastǎ situaţie apare deoarece firma 2 nu numai cǎ îşi împarte cantitatea sa dupǎ
costurile sale dar la fel rǎspunde la faptul cǎ firma 1 nu poate sǎ o facǎ. Dacǎ
pentru firma 2 costul este înalt, de exemplu, ea produce mai puţin, dar la fel
produce mai mult deoarece ea cunoaşte cǎ firma 1 va produce o cantitate ce
maximizeazǎ profitul ei aşteptat şi astfel este mai micǎ decât cantitatea ce o va
produce dacǎ ea ştie cǎ va fi costul firmei 2 înalt.

Reamintim cǎ ansamblul G =< I ,{Si }{,H i }, i Î I > este un joc necooperativ, unde
Si este spaţiul strategiilor jucǎtorului i şi H i (s) este câ ştigul jucǎtorului i în
situaţia
s = (s1 , s2 ,..., sn ) a jocului.

Jocul necooperativ poate fi de asemenea descris ca şi ansamblul


G =< I ,{Ai }{,H i }, i Î I > unde Ai este spaţiul acţiunilor jucǎtorului i în cazul când

jucǎtorii au ales acţiunea a = (a1 , a2 ,..., an ). Într-un joc cu mutǎri (decizii)


simultane de informaţie completǎ o strategie pentru un jucǎtor este, simplu, o
acţiune, dar într-un joc dinamic

88
(cu mutǎri succesive) de informaţie completǎ (finit sau infinit repetat) o strategie

H i (a1 , a2 ,..., an )

H i (a1 , a2 ,..., an ; ti )

poate fi diferitǎ de o acţiune. O strategie a jucǎtorului este un plan complet de


acţiuni – ea specific ǎ o acţiune admisibilǎ pentru jucǎtor în fiecare contingenţǎ în
care jucǎtorul poate fi gǎsit în timp ce acţioneazǎ. Deci, într-un joc dinamic o
strategie este mai complicatǎ. Sǎ pregǎtim descrierea unui joc de informaţie
incompletǎ descriem mai întâi un joc static de informa ţie completǎ dupǎ cum
urmeazǎ: (1) jucǎtorii aleg simultan acţiuni (jucǎtorul i alege acţiunea ai din
mulţimea admisibilǎ Ai ) şi apoi (2) câ ştigul este primit de jucǎtorul
i.

Vrem acum sǎ formulǎm reprezentarea în formǎ normalǎ a unui joc static


Bayesian, anume un joc cu mutǎri (decizii) simultane de informaţie incompletǎ.

Primul pas este sǎ prezentǎm ideea cǎ fiecare jucǎtor cunoaşte funcţia sa de câ ştig
dar poate fi nesigur asupra funcţiilor de câ ştig ale celorlalţi jucǎtori. Fie funcţiile
posibile de câ ştig ale jucǎtorului i reprezentate prin unde ti este
numit tipul jucǎtorului i şi care aparţine la o mulţime posibilǎ de tipuri (sau spaţiul
tipurilor) Ti . Fiecǎrui tip ti îi corespunde o funcţie de câ ştig diferitǎ pe care
jucǎtorul i o poate avea.

Dând aceast ǎ definiţie a tipului unui jucǎtor a spune cǎ jucǎtorul i cunoaşte funcţia
sa de câ ştig este echivalent cu a spune cǎ jucǎtorul i cunoaşte tipul sǎu. În
consecinţǎ a spune cǎ jucǎtorul i poate fi nesigur asupra funcţiilor de câ ştig ale
celorlalţi jucǎtori este echivalent cu a spune cǎ jucǎtorul i poate fi nesigur asupra
tipurilor celorllţi jucǎtori notate prin t-i = (t1 ,...,ti-1 , ti+1 ,..., tn ).

Notǎm T-i mulţimea tuturor valorilor posibile ale lui t-i , şi folosim distribuţia

probabilisticǎ pi (t-i / ti ) sǎ notǎm încrederea jucǎtorului i asupra tipurilor t-i ale


celorlalţi jucǎtori ştiind cǎ tipul jucǎtorului i este ti .

89
Observaţie. În multe aplicţii tipurile jucǎtorilor sunt independente, caz în care pi
(t-i / ti ) nu depinde de ti , aşa cǎ vom putea scrie încrederea jucǎtorului i ca
pi (t-i ).

Definiţia 1. Reprezentarea într-o formǎ normalǎ a unui joc static Baysian cu n


jucǎtori specificǎ spaţiile acţiunilor jucǎtorilor A1 , A2 ,..., An , spaţiile tipurilor lor
T1 ,T2 ,...,Tn , încrederile lor p1 , p2 ,..., pn , şi funcţiile lor de câ ştig H1 , H 2 ,..., H n .

Observaţie. Folosim notaţia G =< I ,{Ai }, {Ti },{pi },{H i } i Î I > pentru un joc
static Bayesian cu n jucǎtori.

Observaţie. Tipul jucǎtorului i, ti , este cunoscut în mod privat de jucǎtorul i şi ca

atare determinǎ funcţia de câ ştig jucǎtorului i, H i (a1 , a2 ,..., an ; ti )şi acest tip este

un element al mulţimii posibile de tipuri Ti . Încrederea jucǎtorului i, pi (t-i / ti )


descrie nesiguranţa jucǎtorului i asupra tipurilor celorlalţi n – 1 juc ǎtori, t-i când se
d ǎ tipul ti a jucǎtorului i.

Exemplul 1. În jocul Cournot acţiunile firmelor sunt cantitǎţile lor luate q1 şi q2 .

Firma 2 are douǎ funcţii cost posibile şi astfel douǎ posibile profituri sau funcţii de
câ ştig:

H 2 (q1 , q2 ; cL ) = [(a - q1 - q2 )- cL ]q2

şi

H 2 (q1 , q2 ; cH ) = [(a - q1 - q2 )- cH ]q2 .

Astfel, spaţiul tipurilor firmei 1 este T1 = {c}, iar al firmei 2 (spaţiul tipurilor) este
T2 = {cL , cH }.

Exemplul 2. Presupunem cǎ jucǎtorul i are douǎ funcţii de câ ştig posibile. Vom


spune cǎ jucǎtorul i are are douǎ tipuri, ti1 şi ti 2 , cǎ spaţiul tipurilor jucǎtorului i este

Ti = {ti1 , ti 2 }, şi cǎ funcţiile de câ ştig ale jucǎtorului i sunt H i (a1 , a2 ,..., an ;ti1 ) şi


90
H i (a1 , a2 ,..., an ; ti 2 ). Putem folosi idea cǎ fiecare din tipurile jucǎtorului corespunde la

H i (a1 , a2 ,..., an ; t1 , t2 ,..., tn

o funcţie de câ ştig diferitǎ, jucǎtorul poate sǎ reprezinte posibilitatea cǎ jucǎtorul


poate sǎ aibǎ mulţimi de acţiuni posibile diferite dupǎ cum urmeazǎ.

Presupunem cǎ mulţimea de acţiuni posibile (admisibile) ale jucǎtorului i este


{a, b}cu probabilitatea q şi{a, b, c}cu probabilitatea 1-q. Atunci putem spune cǎ
jucǎtorul i are douǎ tipuri şi putem defini mulţimea de acţiuni posibile (admisibile)
a fi {a, b, c}pentru ambele tipuri, dar definim câ ştigul de la acţiunea c a fi - ¥
pentru tipul ti1 .

Observatie. Formularea (desfǎşurarea) unui joc Bayesian static este dupǎ cum
urmeazǎ:
(1) natura alege vectorul tip t = (t1, t2 ,K, tn ) , unde ti este luat din mulţimea de
tipuri posible Ti ;
(2) natura releveazǎ ti la jucǎtorul i dar nu la orice alt jucǎtor;

(3) jucǎtorii aleg simultan acţiuni, jucǎtorul i alege ai din mulţimea posibilǎ
(admisibilǎ) Ai ;

(4) câ ştigurile Hi (a1, a2 ,K, an ;ti ) sunt primite.

Deoarece natura reveleazǎ tipul jucǎtorului i, dar la nici un alt jucǎtor j în pasul (2),
jucǎtorul j nu cunoaşte istoria completǎ a jocului când ac ţiunile sunt alese în pasul
(3).

Observatie. Sunt jocuri în care jucǎtorul i are o informaţie privatǎ nu numai a asupra
funcţiei sale de câ ştig dar la fel asupra funţiilor de câ ştig ale altor jucǎtori. Vom
evidenţia aceastǎ posibilitateprin precizarea cǎ la jucǎtorul i câ ştigul sǎ depindǎ nu
numai de acţiunile (a1 , a2 ,..., an ) ci şi de tipurile (t1 , t2 ,...,tn ). Scriem deci
acest câ ştig ca
Observatie. Al doilea punct tehnic implicǎ încrederile pi (t-i / ti ). Vom presupune
cǎ este o cunoştinţǎ comunǎ cǎ în pasul (s) de la formularea unui joc Bayesian
static, natura alege un vector tip t = (t1 , t2 ,...,tn )conform cu distribuţia de

91
probabilitate p(t ). Când natura releveaz ǎ ti la jucǎtorul i, el poate calcula
încrederea pi (t-i / ti ) folosind regula lui Bayes
p (t |t) p(t-i , ti ) .
-i
p(t-i , ti ) =
=
i i
p(ti ) ∑ p(t-i , ti )
t ÎT
-i -i

Unitatea 2

Echilibru de tip Nash-Bayes

Obiective:

a) evidentierea principalelor tipuri de echilibre


b) prezentarea diverselor tipuri de metode de rezolvare
c) lamurirea notiunii de solutie optima
Noţiuni cheie : echilibru de tip Nash-Bayes

CONŢINUTUL UNITĂŢII

Definiţia echilibrului Bayesian Nash

Întâi definim spa ţiile de strategii ale jucǎtorilor într-un jucǎtor Bayesian.
Cunoaştem cǎ o strategie a unui jucǎtor este un plan complet de acţiune, specificând
o ac ţiune posibilǎ (admisibilǎ) în fiecare moment în care poate fi pus sǎ acţioneze.
Dând o desf ǎşurare a unui joc Bayesian static, în care natura începe jocul prin
alegerea tipurilor jucǎtorilor, o strategie (purǎ) pentru jucǎtorul i trebuie sǎ specifice
o acţiune posibilǎ (admisibilǎ) pentru fiecare tip posibil al jucǎtorului i.

Definiţie. Într-un joc Bayesian static T, o strategie pentru jucǎtorul i este o funcţie
si (ti )

si : Ti ® Ai , care fiecǎrui tip ti Î Ti i se asociază acţiunea din mulţimea de


acţiuni posibile Ai i ce-i va corespunde tipului ti ce va fi ales de natură.

Spaţiile strategiilor nu sunt date în reprezentare în forma normală a jocului


Bayesian. Întradevăr, într-un joc Bayesian static spaţiile strategiilor sunt construite
din spaţiile de tipuri şi de acţiuni: mulţimea jucătorului i de strategii posibile (pure)
Si este mulţimea tuturor funcţiilor posibile cu domeniul Ti şi codomeniul Ai .

Observaţie. În discutarea jocurilor dinamice de informaţie incompletă va fi făcută


distincţia dintre două categorii de strategii. Astfel, într-o strategie separatorie
92
fiecărui tip ti Î Ti i se asociază o acţiune diferită ai Î Ai . În strategia unificatoare
toate tipurile au aceeaşi acţiune asociată. Vom introduce distincţia aici numai să
ajutăm descrierea unei varietăţi de strategii ce pot fi construite de la o pereche dată
de spaţii de tipuri şi de acţiuni, Ti şi Ai .

Exemplul 2.3. În jocul Cournot de informaţie asimetrică din Exemplul precedent,


soluţia constă din cele trei cantităţi alese: q2* (cL ), q2* (cH ) şi q1* . În termenii
definiţiei precedente a unei strategii, perechea (q2* (cL ), q2* (cH )) este strategia firmei
2 şi q1* este strategia firmei 1. Firma 2 va alege diferitele cantităţi depinzând de
costul ei. Este important să notăm, totuşi, că singura cantitate a firmei 1 va fi luată
ţinând cont c ă la firma 2 cantitatea va depinde de costul firmei 2, în acest mod.

Astfel, dacă conceptul nostru de echilibru este să cerem ca strategia firmei 1 să fie
un cel mai bun răspuns la strategia firmei 2, atunci strategia firmei 2 trebuie să fie
o pereche de cantităţi, câte una pentru fiecare tip de cost posibil, alt fel firma 1 nu
poate calcula dacă strategia sa este întradevăr un cel mai bun răspuns al firmei 2.

Dând defini ţia unei strategii într-un joc Bayesian, ne întoarcem la definiţia unui
punct de echilibru Nash Bayesian. Ideea centrală este ca să fie simplu şi familiar:
fiecare strategie a jucătorului trebuie să fie cu cel mai bun răspuns la strategiile
celorlalţi jucători. Adică, un echilibru Bayesian Nash este simplu un echilibru
Nash într-un joc Bayesian.

Definitia 2.3. Într-un joc static Bayesian G strategiile s* = (s1*, s2*,K, sn* )
constituie (in strategii pure) un echilibru Bayesian Nash daca pentru fiecare
jucator i si pentru fiecare i tipul ti ÎTi , si (ti ) rezolva problema
max ∑ Hi (s1* (t1 ),K, si*-1 (ti -1 ), ai , si*+1 (ti +1 ),K, sn* (tn ); t) pi (t-i | ti ).
ai ÎAi t ÎT
-i -i

Observatia 2.9. Într-un echilibru Bayesian Nash nici un jucator nu vrea sa schimbe
startegia sa, chiar daca schimbarea implica numai o actiune de la un tip.

Observatia 2.10. Se poate arata ca la un joc static Bayesian finit exista un


echilibru Bayesian Nash, desi poate in strategii mixte.
93
Bibliografie modul

1. Blaga P. Muresan A.S., Lupas Al., Matematici aplicate in economie, vol. 2,


ed. Promedia Plus, Cluj-Napoca, 1999
2. Gibbons, R., Game theory for applied economists Princeton Univ. Press,
Prenceton, New Jersey
3. Muresan, A.S., Non cooperative games, Ed. Mega, Cluj-Napoca, 2012
4. Muresan A.S.Blaga P., Matematici aplicate in economie, vol. 2, ed.
Transilvania Press, Cluj-Napoca, 1996
5.Muresan A.S., Cercetari operationale, vol. 1 si 2, lito. UBB, Cluj-Napoca,
1997

TEME DE CONTROL

Exercitiul 1. În jocul Cournot acţiunile firmelor sunt cantitǎţile lor luate q1 şi q2 .

Firma 2 are douǎ funcţii cost posibile şi astfel douǎ posibile profituri sau funcţii de
câ ştig:

H 2 (q1 , q2 ; cL ) = [(a - q1 - q2 )- cL ]q2

şi

H 2 (q1 , q2 ; cH ) = [(a - q1 - q2 )- cH ]q2 .

Astfel, spaţiul tipurilor firmei 1 este T1 = {c}, iar al firmei 2 (spaţiul tipurilor) este
T2 = {cL , cH }.

Exercitiul 2. Presupunem cǎ jucǎtorul i are douǎ funcţii de câ ştig posibile. Vom


spune cǎ jucǎtorul i are are douǎ tipuri, ti1 şi ti 2 , cǎ spaţiul tipurilor jucǎtorului i este

Ti = {ti1 , ti 2 }, şi cǎ funcţiile de câ ştig ale jucǎtorului i sunt H i (a1 , a2 ,..., an ;ti1 ) şi


H i (a1 , a2 ,..., an ; ti 2 ). Putem folosi idea cǎ fiecare din tipurile jucǎtorului corespunde la

94
o funcţie de câ ştig diferitǎ, jucǎtorul poate sǎ reprezinte posibilitatea cǎ jucǎtorul
poate sǎ aibǎ mulţimi de acţiuni posibile diferite dupǎ cum urmeazǎ.

Presupunem cǎ mulţimea de acţiuni posibile (admisibile) ale jucǎtorului i este


{a, b}cu probabilitatea q şi{a, b, c}cu probabilitatea 1-q. Atunci putem spune cǎ
jucǎtorul i are douǎ tipuri şi putem defini mulţimea de acţiuni posibile (admisibile)
a fi {a, b, c}pentru ambele tipuri, dar definim câ ştigul de la acţiunea c a fi - ¥
pentru tipul ti1 .

Cuprins

Modulul 1 JOCURI STATICE DE INFORMATIE COMPLETA 7

Unitatea 1 Jocuri matriciale 7

Unitatea 2 Jocuri matriciale si programare liniara 19

Unitatea 3 Joc necooperativ 22

Unitatea 4 Aplicatii economice 35

TEME DE CONTROL 61

Modulul 2 JOC POZITIONAL 66

Unitatea 1 Jocuri dinamice (pozitionale) 66

Unitatea 2 Reducerea jocului pozitional 73

Unitatea 3 Rezolvarea jocului pozitional 77

TEME DE CONTROL 84

Modulul 3 JOCURI STATICE CU INFORMATIE INCOMPLETA 85

Unitatea 1 Joc static de tip Bayes 85

Unitatea 2 Echilibru de tip Nash-Bayes 92

TEME DE CONTROL 94

95