Sunteți pe pagina 1din 10

Seminarul2: Teoria jocurilor (capitolul1)

1) Jocuri matriceale:antagoniste (de sumă nulă)


Aplicație

Aplicaţia2: Se consideră jocul cu sumă nulă (antagonist),


caracterizat de matricea:

P2 B1 B2 B3 B4
P1
A1 4 3 6 2
A2 1 2 0 0
A3 5 6 7 5

Să se determine valorile inferioară şi superioară ale jocului, şi


apoi cercetaţi dacă jocul cu matricea de mai sus este sau nu cu punct şa
(se presupune că P1 și P2 sunt la fel de competitivi și acționează prudent).

Rezolvare:

D.p.d.v. formal - ambii jucători urmăresc acelaşi scop, și anume


ca ambii jucători să obțină cele mai bune rezultate pentru ei (să aleagă
cele mai bune opțiuni pentru ei), adică jucătorul maximizant
urmărește obținerea unui câștig maxim, deci cât mai mare, în timp ce
jucătorul minimizant urmărește obținerea unei pierderi minime, deci
cât mai mici.

În atingerea scopului lor, partenerii de joc folosesc criterii de


decizie proprii.

Maximizantul P1, folosește criteriul “MAXIMIN”. El pleacă de


la ipoteza că minimizantul este inteligent și informat asupra jocului.

1
Ca atare, jucătorul P1 va acţiona aşa încât cel mai mic câştig
asigurat pe care îl poate obţine de la P2 să fie cât mai mare.

P1 (adică maximizantul P1) face următorul raționament, folosind


criteriul propriu de decizie „MAXIMIN”.
În cele ce urmează, cu aij notăm elementul din matricea A, adică
cel de la intersecția liniei i a lui A cu coloana j a lui A.
P2 B1 B2 B3 B4
P1
A1 4=a11 3=a12 6=a13 2=a14
A2 1=a21 2=a22 0=a23 0=a24
A3 5=a31 6=a32 7=a33 5=a34
-întâi alege minimul liniilor sale, notat respectiv cu:
↓câștigul minim (sigur) al lui P1, când acesta alege modul de acțiune A1
α1 = min{4,3,6,2} = 2 = a14 (←minimul pe linia „1” din matricea
jocului),
↓câștigul minim (sigur) al lui P1, când acesta alege modul de acțiune A2
α2 = min{1,2,0,0} = 0 = a23 = a24 (←minimul pe linia „2” din
matricea jocului),
↓câștigul minim (sigur) al lui P1, când acesta alege modul de acțiune A3
α3 = min{5,6,7,5} = 5 = a31 = a34 (←minimul pe linia „3” din
matricea jocului),
-și apoi, alege maximul acestor minime, calculând cel mai mare
câștig minim al său, notat cu:
α1,α2,α3
α = v1 = max{2,0,5} = 5 (și numit valoarea inferioară a jocului).

a31 = a34 = α3 (obținut pe linia3 = (linia lui A3))

Strategia care asigură lui P1 un câştig egal cu α = v1 = 5 (deci cu


cel mai mare câștig minim al său) se numește strategie maximin, sau
strategie maxmin, fiind strategia care urmărește pentru P1
maximizarea câștigului său minim. În cazul nostru, deoarece α = 5 =

2
= α3, rezultă că strategia maximin, sau strategia maxmin a lui P1 este
A3.

Minimizantul P2 își selectează decizia după criteriul


“MINIMAX”. El știe că maximizantul vrea să câștige cât mai mult în
competiție.
Ca atare, jucătorul P2 va urmări să facă pe cât posibil mai mică,
cea mai mare valoare, pe care ar trebui să o dea lui P1.

P2 (adică minimizantul P2) face următorul raționament, folosind


criteriul propriu de decizie „MINIMAX”:
-întâi alege maximele coloanelor sale, notate respectiv cu:
P2 B1 B2 B3 B4
P1
A1 4=a11 3=a12 6=a13 2=a14
A2 1=a21 2=a22 0=a23 0=a24
A3 5=a31 6=a32 7=a33 5=a34
↓pierderea maximă (certă) a lui P2, când acesta alege modul de acțiune B1
β1 = max{4,1,5} = 5 = a31 (←maximul pe coloana „1” din matricea
jocului),
↓pierderea maximă (certă) a lui P2, când acesta alege modul de acțiune B2
β2 = max{3,2,6} = 6 = a32 (←maximul pe coloana „2” din matricea
jocului),
↓pierderea maximă (certă) a lui P2, când acesta alege modul de acțiune B3
β3 = max{6,0,7} = 7 = a33 (←maximul pe coloana „3” din matricea
jocului),
P2 B1 B2 B3 B4
P1
A1 4=a11 3=a12 6=a13 2=a14
A2 1=a21 2=a22 0=a23 0=a24
A3 5=a31 6=a32 7=a33 5=a34
↓pierderea maximă (certă) a lui P2, când acesta alege modul de acțiune B4
β4 = max{2,0,5} = 5 = a34 (←maximul pe coloana „4” din matricea
jocului),
3
-și apoi, alege minimele acestor maxime, calculând cea mai mică
pierdere maximă a sa, notată:
β1,β2,β3,β4
β = v2 = min{5,6,7,5} = 5 (numită valoarea superioară a jocului).

a31 = β1 (obținut pe coloana1 = (coloana lui B1))
||
a34 = β4 (obținut pe coloana4 = (coloana lui B4))

Strategiile care asigură lui P2 o pierdere egală cu β = v2 = 5 (deci


cea mai mică pierdere maximă a sa, echivalent cu cel mai mic câștig
maxim pentru P1) se numesc strategii minimax, sau strategii minmax,
fiind strategiile care urmăresc pentru P2 minimizarea câștigului maxim
al lui P1 sau minimizarea pierderii maxime pentru P2. În cazul nostru,
deoarece β = 5 = β1 = β4, rezultă că strategiile minimax, sau strategiile
minmax ale lui P2 sunt B1 și B4.

Deoarece avem:

α (= v1 = 5 = α3 = a31 = a34) = β (= v2 = 5 = β1 = a31 = β4 = a34),

atunci valoarea comună notată cu v (a datelor α și β) se numeşte


valoarea jocului, iar jocul respectiv se va numi joc cu punct şa. La noi
v = 5.
Elementul aij din matricea A, adică cel de la intersecția liniei i a
lui A cu coloana j a lui A, în care se realizează această egalitate: α (=
= v1= α3 = a31 = a34) = β (= v2 = β1 = a31 = β4 = a34)= v = 5 se numeşte
punct şa, iar jocul respectiv se va numi joc cu punct şa. La noi a31 = 5
și a34 = 5 sunt puncte şa.

4
Prin urmare, punctul şa, dacă acesta există într-un joc, poate să nu
fie unic, așa după cum ilustrează această problemă.

Orice două puncte șa (dintr-un joc matriceal antagonist sau de


sumă nulă) au aceeași valoare, ceea ce se verifică în cazul aplicației
noastre.

Din teorie, se ştie că: strategiile Ai (a liniei i sau a liniei lui Ai din
A, pe care se află punctului şa aij în A) şi Bj (a coloanei j sau a coloanei
lui Bj din A, pe care se află punctului şa aij în A) corespunzătoare
punctului şa aij formează o pereche de strategii maximin pentru P1,
respectiv minimax pentru P2 şi se vor numi strategii optime (sau
optimale) ale celor doi jucători.

La noi: a31 = 5 fiind punctul şa, rezultă că strategiile


corespunzătoare punctului şa a31, adică strategia A3 (a liniei 3 sau liniei
lui A3, pe care se află punctului şa a31 în A) şi strategia B1 (a coloanei
1 sau coloanei lui B1, pe care se află punctului şa a31 în A) sunt strategii
optime (sau optimale) pentru P1, respectiv pentru P2;
a34 = 5 fiind alt punctul şa, rezultă că strategiile corespunzătoare
punctului şa a34, adică strategia A3 (a liniei 3 sau liniei lui A3, pe care
se află punctului şa a34 în A) şi strategia B4 (a coloanei 4 sau coloanei
lui B4, pe care se află punctului şa a34 în A) sunt strategii optime (sau
optimale) pentru P1, respectiv pentru P2.

Prezența în matrice a mai multor puncte șa conduce la multiple


perechi de strategii optime. La noi, acestea sunt date de următoarele
perechi: (A3,B1) și (A3,B4).

5
Perechile sunt echivalente și se pot schimba între ele, permițând
astfel jucătorilor să aleagă pe cele convenabile și după alte criterii.

În concluzie, valoarea jocului care are puncte șa este


determinată de valoarea comună a acestora, adică a elementelor aij,
unde aij reprezintă elementul din matrice cu proprietatea minim pe
linie și maxim pe coloană.

P1 va alege numai strategia A3, iar P2 numai B1 sau B4, indiferent


de numărul partidelor ce se joacă, bineînțeles în ipoteza că P1 și P2 sunt
la fel de competitivi și acționează prudent.
(Dacă jucătorul P1 joacă strategia sa optimă A3, atunci câștigul său
așteptat nu va fi mai mic decât v = 5, indiferent ce joacă P2. Dacă
jucătorul P2 joacă strategia sa optimă B1, respectiv B4, pierderea sa
așteptată nu va fi mai mare decât v = 5, indiferent ce joacă P1)

[Dacă jocul are punct șa, atunci ambii jucători (agenți) trebuie să joace
numai strategia indicată (sau numai strategiile indicate) de acesta,
care sunt de fapt strategiile maximin, și respective minimax ale lor).]

Concluzii:

Valoarea inferioară (valoarea maximin) a jocului dat este: α =


= v1 = 5.
Valoarea superioară (valoarea minimax) a jocului dat este: β =
= v2 = 5.

[α = 5 = a31 = a34] = [β = 5 = a31 = a34] ⇒ [jocul dat are punct şa], iar la
noi, punctele şa ale jocului dat sunt a31 = 5 și a34 = 5.
6
[punctul şa este cel mai mic de pe linia şi cel mai mare de pe coloana
pe care acesta se află]

Strategia maximin, sau strategia maxmin a lui P1 este A3, iar


strategiile minimax, sau strategiile minmax ale lui P2 sunt B1 și B4,
echivalent cu a scrie că strategiile optime (sau optimale) ale celor doi
jucători sunt A3 pentru P1, și respectiv B1 și B4 pentru P2.
(A3 este strategia care asigură lui P1 un câştig egal cu α = v1 = 5 (deci
cu cel mai mare câștig minim al său))
(B1 și B4 sunt strategiile care asigură lui P2 o pierdere egală β = v2 = 5
(deci cea mai mică pierdere maximă a sa))

Valoarea jocului dat este: v = α = β = 5 și reprezintă valoarea


maximă a câștigului (minim) al lui P1, și în același timp valoarea
minimă a pierderii (maxime) a lui P2, dacă se utilizează strategiile A3
de către P1 și B1 de către P2, sau A3 de către P1 și B4 de către P2.
([v = 5 > 0] ⇒ [câștigă maximizantul])

Observaţie: În cele ce urmează, cu aij notăm elementul din


matricea A, adică cel de la intersecția liniei i a lui A cu coloana j a lui
A.

Calculele de mai sus pot fi simplificate prin organizarea lor într-


un tabel obţinut din cel care-l conține pe A, la care se adaugă coloana
elementelor αi (a celor mai mici elemente pe linie) şi linia elementelor
βj (a celor mai mari elemente pe coloană), astfel:

7
[minimul pe fiecare linie „i”
din matricea jocului]↓

P2 B1 B2 B3 B4 αi
P1
A1 4=a11 3=a12 6=a13 2=a14 α1=min{4,3,6,2}=
=2=a14
A2 1=a21 2=a22 0=a23 0=a24 α2=min{1,2,0,0}=
=0=a23=a24
A3 5=a31 6=a32 7=a33 5=a34 α3=min{5,6,7,5}=
=5=a31=a34
βj β1=max{4,1,5}= β2=max{3,2,6}= β3=max{6,0,7}= β4=max{2,0,5}= α=max{α1,α2,α3}=5=
=α3
=5=a31 =6=a32 =7=a33 =5=a34 β=min{β1,β2,β3,β4}=5
=β1=β4


[maximul pe fiecare coloană „j”
din matricea jocului]
[valoarea
superioară
a jocului
considerat]
β = min{β1, β2, β3, β4}=5
α=max{α1, α2, α3}=5
[valoarea inferioară a jocului dat]
Concluzii:
Valoarea inferioară (valoarea maximin/maxmin) a jocului dat, este: α = v1 = 5.
Valoarea superioară (valoarea minimax/minmax) a jocului dat, este: β = v2 = 5.
[α = 5 = α3 (= a31 = a34)] = [β = 5 = β1 (= a31) = β4 (= a34)] ⇒ [jocul dat are punct şa], iar
punctele şa ale jocului dat sunt a31 = 5 și a34 = 5 (a31, a34 sunt puncte șa, deoarece ele apar atât
la α, cât și la β).
[punctul şa este cel mai mic de pe linia pe care acesta se află şi cel mai mare de pe coloana pe
care acesta se află]
dată de linia3 pe care se află punctul șa a31 = 5

[primul punct șa a31 = 5] ⇒ [A3 strategia optimă a lui P1 și B1 strategia optimă a lui P2]

dată de coloana1 pe care se află punctul șa a31 = 5

8
dată de linia3 pe care se află punctul șa a34 = 5

[al doilea punct șa a34 = 5] ⇒ [A3 strategia optimă a lui P1 și B4 strategia optimă a lui
P2]. ↑

dată de coloana4 pe care se află punctul șa a34 = 5

Strategia maximin, sau strategia maxmin a lui P1 este dată de strategia optimă a lui P1,
și anume: A3.
Strategiile minimax, sau strategiile minmax ale lui P2 sunt date de strategiile optime ale
lui P2, și anume: B1 și B4.

Valoarea jocului dat este: v = α = β = 5 și reprezintă valoarea maximă a câștigului


(minim) al lui P1, și în același timp valoarea minimă a pierderii (maxime) a lui P2, dacă se
utilizează strategiile optime A3 de către P1 și B1 de către P2, sau respectiv A3 de către P1 și B4 de
către P2.
([v = 5 > 0] ⇒ [câștigă maximizantul])

Observație: La aceleași strategii optime se ajungea punând în evidență strategia


maxmin a lui P1, și respectiv strategiile minmax ale lui P2.
[α = 5 = α3] ⇒ [A3 este strategia maximin, sau strategia maxmin a lui P1].
↑(s-a obținut pe linia3 = (linia lui A3))
(A3 este o strategie care asigură lui P1 un câştig egal cu α = v1 = 5 (deci cu cel mai mare câștig
minim al său))
Deci, strategia optimă a lui P1 este dată de strategia maximin/maxmin a lui P1, și anume de A3.
[β = 5 = β1] ⇒ [B1 este strategia minimax, sau strategia minmax a lui P2]

(s-a obținut pe coloana1 = (coloana lui B1))
(B1 este strategia care asigură lui P2 o pierdere egală cu β = v2 = 5 (deci cu cea mai mică
pierdere maximă a sa))
[β = 5 = β4] ⇒ [B4 este o altă strategie minimax, sau strategie minmax a lui P2].
↑(s-a obținut pe coloana4 = (coloana lui B4))
(B4 este o altă strategie care asigură lui P2 o pierdere egală cu β = v2 = 5 (deci cu cea mai mică
pierdere maximă a sa))
Deci, strategiile optime ale lui P2 sunt date de strategiile minimax/minmax ale lui P2, și anume
de B1 și B4.

9
Observație: P1 va alege (să joace) numai strategia sa optimă
(maximin/maxmin) A3, iar P2 va alege (să joace) numai strategiile sale optime
(minimax/minmax) B1 sau B4, indiferent de numărul partidelor ce se joacă,
bineînțeles în ipoteza că P1 și P2 sunt la fel de competitivi și acționează prudent.
(Dacă jucătorul P1 joacă strategia sa optimă A3, atunci câștigul său așteptat
nu va fi mai mic decât v = 5, indiferent ce joacă P2. Dacă jucătorul P2 joacă
strategiile sale optimă B1 sau B4, pierderea sa așteptată nu va fi mai mare decât
v = 5, indiferent ce joacă P1).

Observație: Prin urmare, am constatat mai sus, că punctul şa, dacă acesta
există într-un joc, poate să nu fie unic, așa după cum ilustrează această problemă.
Orice două puncte șa (dintr-un joc matriceal antagonist sau de sumă nulă) au
aceeași valoare, ceea ce se verifică în cazul aplicației noastre.

Observație: Prezența în matrice a mai multor puncte șa conduce la


multiple perechi de strategii optime (sau optimale) ale celor doi jucători. La noi,
acestea sunt date de următoarele perechi: (A3,B1) și (A3,B4).

Observație: Perechile sunt echivalente și se pot schimba între ele,


permițând astfel jucătorilor să aleagă pe cele convenabile și după alte criterii.

Observaţie: În general, pe o suprafață punctul care se bucură de proprietatea


că este în acelasi timp punct de minim pe o direcție și punct de maxim pe direcția
perpendiculară se numește punct șa, întrucât suprafața respectivă se prezintă
geometric sub forma de șa (unei șei).

Observație:
Dacă v > 0, atunci câștigă maximizantul (P1).
Dacă v < 0, atunci câștigă mimimizantul (P2).
Dacă v = 0, atunci rezultatul este de egalitate (nu câștigă niciunul dintre cei
doi jucători P1 și P2).
Prof. matem. Virginia Atanasiu

10

S-ar putea să vă placă și