Sunteți pe pagina 1din 15

Seminarul3: Teoria jocurilor (capitolul1)

1) Jocuri matriceale:antagoniste (de sumă nulă)


Aplicație
Reducerea strategiilor jocului folosind relații de dominare:
Alternarea strategiilor pure, cu anumite probabilităţi

Aplicaţia3: Se consideră jocul matriceal cu sumă nulă


(antagonist):

P2 B1 B2 B3
P1
A1 2 -2 4
A2 0 4 1
A3 3 1 4

a) Să se determine strategiile dominate și să se cerceteze existența punctului


șa al jocului considerat. b) Să se afle punctul șa prin metoda matriceală.
(lucrăm în ipoteza raționalității jucătorilor; presupunem că niciodată jucătorii
raționali nu vor alege să joace o strategie dominată (adică nefavorabilă lor); prin
jucător rațional (în cazul lui P1, adică a jucătorului maximizant) vom înțelege
acel jucător care urmărește maximizarea câștigului propriu, în funcție de
alegerea strategiilor de către celălalt jucător P2, iar prin jucător rațional (în cazul
lui P2, adică a jucătorului minimizant) vom înțelege acel jucător care urmărește
minimizarea pierderii proprii, în funcție de alegerea strategiilor de către
celălalt jucător P1).

Rezolvare:

a)

P2 B1 B2 B3
P1
A1 2 -2 4
A2 0 4 1
A3 3 1 4

1
P2 B1 B2 B3
P1
A1 2 -2 4
A2 0 4 1
A3 3 1 4

Liniile A1, A2, A3 ale tabelului dau câștigurile jucătorului P1.


Strategia dominată (nefavorabilă) pentru P1 înseamnă o strategie
căreia îi corespund câștigurile cele mai mici. În acest sens, se compară
liniile (strategiile) între ele două câte două.
Coloanele B1, B2, B3 ale tabelului dau pierderile jucătorului P2.
Strategia dominată (nefavorabilă) pentru P2 înseamnă o strategie
căreia îi corespund pierderile cele mai mari. În acest sens, se compară
coloanele (strategiile) între ele două câte două.
Cercetăm dacă există strategii dominate (nefavorabile) printre
strategiile pure A1, A2 și A3, ale jucătorului 1.
Comparăm liniile între ele două câte două, adică strategiile lui
P1 între ele două câte două, astfel:

linia lui A1 cu linia lui A2:


căreia↓ ↓căreia P2 B1 B2 B3
îi ↓ ↓ îi P1
corespund ↓ ↓ corespund A1 2 -2 4
câștigurile ↓ ↓ câștigurile A2 0 4 1
lui P1: ↓ ↓ lui P1: A3 3 1 4
2 > 0
-2 < 4
4 ↓ 1
↓STOP
[nu rezultă nicio concluzie referitoare la strategiile A1 și A2].

2
linia lui A1 cu linia lui A3:
căreia↓ ↓căreia
P2 B1 B2 B3
îi ↓ ↓ îi
P1
corespund ↓ ↓ corespund
A1 2 -2 4
câștigurile ↓ ↓ câștigurile
A2 0 4 1
lui P1: ↓ ↓ lui P1:
A3 3 1 4
2 < 3
-2 < 1
4 = 4

[A1 < A3 (strategia A1 este dominată de strategia A3)].

Deci:

A3 = (este strategia dominantă sau favorabilă pentru P1), iar A1 =


= (este strategia dominată sau nefavorabilă pentru P1), astfel că se
elimină din joc strategia dominată (nefavorabilă) A1, păstrându-se în
joc strategia dominantă (favorabilă) A3.

linia lui A2 cu linia lui A3:


căreia↓ ↓căreia P2 B1 B2 B3
îi ↓ ↓ îi P1
corespund ↓ ↓ corespund
A1 2 -2 4
câștigurile ↓ ↓ câștigurile
A2 0 4 1
lui P1: ↓ ↓ lui P1:
A3 3 1 4
0 < 3
4 > 1
1 ↓ 4
↓STOP
[nu rezultă nicio concluzie referitoare la strategiile A2 și A3].

Prin urmare, se obține următoarea matrice a jocului redus


(rezultată din matricea jocului inițial aflată în interiorul tabelului de

3
𝟐𝟐 −𝟐𝟐
𝟒𝟒
mai sus, adică din �𝟎𝟎 𝟏𝟏� prin eliminarea lui A1, deci prin
𝟒𝟒
𝟑𝟑 𝟏𝟏
𝟒𝟒
𝟎𝟎 𝟒𝟒 𝟏𝟏
eliminarea liniei1 a sa), și anume: � �, cea aflată în interiorul
𝟑𝟑 𝟏𝟏 𝟒𝟒
tabelului de mai jos, astfel încât jocul inițial devine jocul redus de mai
jos:
tabelul de mai înainte al jocului inițial:
P2 B1 B2 B3
P1
A1 2 -2 4
A2 0 4 1
A3 3 1 4
devine următorul, și anume cel al jocului redus:
P2 B1 B2 B3
P1
A2 0 4 1
A3 3 1 4

Cercetăm dacă există strategii dominate (nefavorabile) printre


strategiile pure B1, B2 și B3, ale jucătorului 2.
Acum, comparăm coloanele (din tabelul de mai sus) între ele
două câte două, adică strategiile lui P2 între ele două câte două, astfel:

coloana lui B1 cu coloana lui B2:


căreia↓ ↓căreia
P2 B1 B2 B3
îi ↓ ↓ îi
P1
corespund ↓ ↓ corespund
A2 0 4 1
pierderile ↓ ↓ pierderile
A3 3 1 4
lui P2: ↓ ↓ lui P2:
0 < 4
3 > 1

[nu rezultă nicio concluzie referitoare la strategiile B1 și B2].

4
coloana lui B1 cu coloana lui B3:
căreia↓ ↓căreia
îi ↓ ↓ îi P2 B1 B2 B3
corespund ↓ ↓ corespund P1
pierderile ↓ ↓ pierderile A2 0 4 1
lui P2: ↓ ↓ lui P2: A3 3 1 4
0 < 1
3 < 4
↓[B1 < B3 (strategia B3 este dominată de strategia B1)].

Deci:

B1 = (este strategia dominantă sau favorabilă pentru P2), iar B3 =


= (este strategia dominată sau nefavorabilă pentru P2), astfel că se
elimină din jocul redus strategia dominată (nefavorabilă) B3,
păstrându-se în respectivul joc strategia dominantă (favorabilă) B1.

Eliminându-se B3, nu mai are sens comparația între B2 și B3.

Prin urmare, se obține următoarea matrice a jocului redus


𝟎𝟎 𝟒𝟒 𝟏𝟏
(rezultată din matricea anterioară � � pentru jocul de mai sus,
𝟑𝟑 𝟏𝟏 𝟒𝟒
aflată în interiorul tabelului de la pagina anterioară, prin eliminarea
𝟎𝟎 𝟒𝟒
lui B3, deci prin eliminarea coloanei3 a sa), și anume: � �, cea aflată
𝟑𝟑 𝟏𝟏
în interiorul tabelului de mai jos, astfel încât jocul anterior devine jocul
redus de mai jos:
P2 B1 B2 P2 B1 B2 B3
P1 P1
A2 0 4 A2 0 4 1
A3 3 1 A3 3 1 4

5
Deci, în ipoteza raționalității jucătorilor, jocul este redus prin
eliminarea strategiei dominate (nefavorabile) A1 pentru jucătorul 1 și
prin eliminarea strategiei dominate (nefavorabile) B3 pentru jucătorul
2 la cel cu matricea din interiorul tabelului de mai sus.

Cercetăm dacă jocul astfel redus are sau nu punct șa.

Astfel, maximizantul P1, folosește criteriul “MAXIMIN”. El


pleacă de la ipoteza că minimizantul este inteligent și informat asupra
jocului.
Ca atare, jucătorul P1 va acţiona aşa încât cel mai mic câştig
asigurat pe care îl poate obţine de la P2 să fie cât mai mare.

Deci, P1 (adică maximizantul P1) face următorul raționament:


P2 B1 B2
P1
A2 0 4
A3 3 1

-întâi alege minimul liniilor sale, notat respectiv cu:


↓câștigul minim (sigur) al lui P1, când acesta alege modul de acțiune A2
α2 = min{0,4} = 0 (←minimul pe linia „2” din matricea jocului),

↓câștigul minim (sigur) al lui P1, când acesta alege modul de acțiune A3
α3 = min{3,1} = 1 (←minimul pe linia „3” din matricea jocului),

-și apoi, alege maximul acestor minime, calculând cel mai mare
câștig minim al său, notat cu:
α2, α3
α = v1 = max{0, 1} = 1 (și numit valoarea inferioară a jocului).

a32 = α3 (obținut pe linia3 = (linia lui A3))
6
Strategia care asigură lui P1 un câştig egal cu α = v1 = 1 (deci cu
cel mai mare câștig minim al său) se numeşte strategie maximin, sau
strategie maxmin, fiind strategia care urmărește pentru P1
maximizarea câștigului său minim. În cazul nostru, deoarece α = 1 =
= α3, rezultă că strategia maximin, sau strategia maxmin a lui P1 este
A3.

Minimizantul P2 își selectează decizia după criteriul


„MINIMAX”. El știe că maximizantul vrea să câștige cât mai mult în
competiție.
Ca atare, jucătorul P2 va urmări să facă pe cât posibil mai mică,
cea mai mare valoare, pe care ar trebui să o dea lui P1.

În acest sens, P2 (adică minimizantul P2) face următorul


raționament:
P2 B1 B2
P1
A2 0 4
A3 3 1

-întâi alege maximele coloanelor sale, notate respectiv cu:

↓pierderea maximă (certă) a lui P2, când acesta alege modul de acțiune B1
β1 = max{0,3} = 3 (←maximul pe coloana „1” din matricea
jocului),
↓pierderea maximă (certă) a lui P2, când acesta alege modul de acțiune B2
β2 = max{4,1} = 4 (←maximul pe coloana „2” din matricea
jocului),

-și apoi, alege minimele acestor maxime, calculând cea mai mică
pierdere maximă a sa, notată:

7
β1, β2
β = v2 = min{3, 4} = 3 (și numită valoarea superioară a jocului).

a31 = β1 (obținut pe coloana1 = (coloana lui B1))

Strategia care asigură lui P2 o pierdere egală cu β = v2 = 3 (deci


cea mai mică pierdere maximă a sa, echivalent cu cel mai mic câștig
maxim pentru P1) se numeşte strategie minimax, sau strategie minmax,
fiind strategia care urmărește pentru P2 minimizarea câștigului maxim
al lui P1 sau minimizarea pierderii maxime pentru P2. În cazul nostru,
deoarece β = 3 = β1, rezultă că strategia minimax, sau strategia minmax
a lui P2 este B1.

Deoarece avem:

α (= v1 = 1 = α1) ≠ β (= v2 = 3= β3),

rezultă că jocul „redus” este un joc fără punct şa, iar de aici deducem
că nici jocul iniţial nu are punct şa, iar valoarea atât a jocului „redus”,
cât și a celui inițial, notată cu v are proprietatea că ea ∈ [α,β]. La noi:
v ∈ (α,β) = (1,3).
Deci, dacă jocul „redus” nu are punct şa, atunci nici cel iniţial nu
are punct şa, iar valoarea „v” a jocului are proprietatea că 1 = α < v <
< β = 3.
Observaţie: Calculele de mai sus pot fi simplificate prin
organizarea lor într-un tabel obţinut din cel care-l conține pe A redus,
la care se adaugă coloana elementelor αi (a celor mai mici elemente pe
linie) şi linia elementelor βj (a celor mai mari elemente pe coloană),
astfel:

8
↓minimul pe fiecare linie „i”
↓din matricea jocului redus

P2 B1 B2 αi
P1
A2 0=a21 4=a22 α2=min{0,4}=0=a21
A3 3=a31 1=a32 α3=min{3,1}=1=a32
βj β1=max{0,3}= β2=max{4,1}= α=max{α2, α3}=1=α3
=3=a31 =4=a22 β=min{β1, β2}=3=β1

maximul pe fiecare
coloană „j”
din matricea jocului redus
α = max{α2, α3}
β = min{β1, β2}

Concluzii:
Valoarea inferioară (valoarea maximin) a jocului dat este: α = v1 = 1.
Valoarea superioară (valoarea minimax) a jocului dat este: β = v2 = 3.
α (= v1 = 1 = α1) ≠ β (= v2 = 3= β3) ⇒ [jocul „redus” este un joc fără punct
şa] ⇒ [nici jocul iniţial nu are punct şa] ⇒ [valoarea atât a jocului „redus”, cât
și a celui inițial, notată cu v are proprietatea că ea ∈ (α,β) = (1,3)].
[α = 1 = α3] ⇒ [A3 este strategia maximin, sau strategia maxmin a lui P1].
↑(s-a obținut pe linia3 = (linia lui A3))
(A3 este strategia care asigură lui P1 un câştig egal cu α = v1 = 1 (deci cu cel mai
mare câștig minim al său))
[β = 3 = β1] ⇒ [B1 este strategia minimax, sau strategia minmax a lui P2]

(s-a obținut pe coloana1 = (coloana lui B1))
(B1 este strategia care asigură lui P2 o pierdere egală β = v2 = 3 (deci cu cea mai
mică pierdere maximă a sa))

9
([v ∈ (1,3) ⇒ v > 0] ⇒ [câștigă maximizantul, adică P1])

b) Determinarea punctului șa prin metoda matriceală. Reluăm tabelul pentru


jocul redus, obținut la a), adică cel de mai jos:
P2 B1 B2
P1
A2 0=a21 4=a22
A3 3=a31 1=a32

Pentru metoda matriceală lucrăm cu A = (matricea jocului redus obținută


𝟎𝟎 𝟒𝟒
la a) și conținută în interiorul tabelului de mai sus) = � � ∈ M2x2(ℝ), întrucât
𝟑𝟑 𝟏𝟏
metoda matriceală presupune ca matricea jocului antagonist (cu sumă nulă) și
fără punct șa să fie pătratică de ordinul 2, adică să aparțină lui M2x2(ℝ), deci să
aibă două linii și două coloane. Prin metoda matriceală, partidele se repetă, iar
jucătorii își pot alege (alterna) strategiile pure cu anumite frecvențe sau
probabilități, caz în care se spune că jucătorii folosesc strategii mixte.
Celor două strategii pure A2 și A3 ale jucătorului P1 le corespunde
strategia mixtă a lui P1 reprezentată sub forma vectorului linie x de două
componente (P(A2) P(A3)), unde P(A2) = (semnifică probabilitatea de alegere a
strategiei A2), iar P(A3) = (semnifică probabilitatea de alegere a strategiei A3), cu
P(A2), P(A3) ≥ 0 și a.î. P(A2) + P(A3) = 1, și analog celor două strategii pure B1 și
B2 ale jucătorului P2 le corespunde strategia mixtă a lui P2 reprezentată sub
forma vectorului linie y de două componente (P(B1) P(B2)), unde P(B1) =
= (semnifică probabilitatea de alegere a strategiei B1), iar P(B2) = (semnifică
probabilitatea de alegere a strategiei B2), cu P(B1), P(B2) ≥ 0 și a.î. P(B2) + P(B3)=
= 1.
Interesează determinarea strategiilor mixte optime ale celor doi jucători,
adică determinarea acelor strategii mixte ale lor, pentru care P1 obține cea mai
mare valoare a câștigului său, iar P2 obține cea mai mică valoare a pierderii sale.

10
P2 B1 B2
P1
A2 0=a21 4=a22
A3 3=a31 1=a32
Soluția jocului redus prin metoda matriceală este dată de următoarele
elemente:

conform metodei matriceale



𝟏𝟏
v = (valoarea jocului redus, dar și inițial) = |A|, reprezentând câștigul
𝐉𝐉𝐀𝐀∗ 𝐉𝐉 𝐓𝐓
maxim a lui P1 și în același timp pierderea minimă a lui P2, dacă se utilizează
strategiile mixte optime de mai jos, și anume x de către P1, respectiv y de către P2.

conform definiției

x = (strategia mixtă optimă a jucătorului P1 în jocul redus de la a)) =
𝟏𝟏
= (P(A2) P(A3)) = (J𝐀𝐀∗ ), cu P(A2), P(A3) ≥ 0 și a.î. P(A2) + P(A3) = 1.
𝐉𝐉𝐀𝐀∗ 𝐉𝐉 𝐓𝐓
↑conform metodei matriceale
[P(A2) = (probabilitatea de alegere a strategiei A2), P(A3) = (probabilitatea de
alegere a strategiei A3)]

conform definiției

y = (strategia mixtă optimă a jucătorului P2 în jocul redus de la a)) =
= (P(B1) P(B2)), cu P(B1), P(B2) ≥ 0 și a.î. P(B1) + P(B2) = 1.
[P(B1) = (probabilitatea de alegere a strategiei B1), P(B2) = (probabilitatea de
alegere a strategiei B2)]; y rezultă astfel:

𝟏𝟏
yT = (𝐀𝐀∗ JT), iar de aici se obține: y = (yT)T,
𝐉𝐉𝐀𝐀∗ 𝐉𝐉 𝐓𝐓

conform metodei matriceale
11
, unde: J = (1 1), A* = (matricea adjunctă a lui A) = (matricea obținută din AT
înlocuind elementele din AT cu complemenții lor algebrici) =
= (matricea ale cărei elemente sunt complemenții algebrici ai elementelor din AT).

↓liniile din A devin coloane în AT (sau coloanele lui A devin


linii în AT ↓
𝟎𝟎 𝟒𝟒 𝟎𝟎 𝟑𝟑
A=� � ⇒ AT = � �⇒
𝟑𝟑 𝟏𝟏 𝟒𝟒 𝟏𝟏
↑matricea ↑ reprezintă transpusa lui A
↑jocului redus de la pag. 10

(−𝟏𝟏)𝟏𝟏+𝟏𝟏 ∙ 𝟏𝟏 (−𝟏𝟏)𝟏𝟏+𝟐𝟐 ∙ 𝟒𝟒 𝟏𝟏 −𝟒𝟒


⇒A =� *
𝟐𝟐+𝟏𝟏 𝟐𝟐+𝟐𝟐 �=� �,
(−𝟏𝟏) ∙ 𝟑𝟑 (−𝟏𝟏) ∙ 𝟎𝟎 −𝟑𝟑 𝟎𝟎

𝟎𝟎 𝟒𝟒
|A| = � � = 0(1) – (4)(3) = 0 - 12 = -12.
𝟑𝟑 𝟏𝟏

𝟏𝟏 −𝟒𝟒
JA* = (1 1) � � = (1(1) + 1(-3) 1(-4) + 1(0)) = (1 - 3 -4 + 0) = (-2 -4) ⇒
−𝟑𝟑 𝟎𝟎

𝟏𝟏
⇒ JA*JT = (-2 -4)� � = (-2)1 + (-4)1 = -2 – 4 = -6.
𝟏𝟏
𝟏𝟏
↑J = (1 1) ⇒ JT = � �
𝟏𝟏

Deci:

𝟏𝟏 𝟏𝟏
v= |A| = (-12) = 2 ∈ (1,3).
𝐉𝐉𝐀𝐀∗ 𝐉𝐉 𝐓𝐓 (−𝟔𝟔)
≈0,33 ≈0,67
↓ ↓
𝟏𝟏 𝟏𝟏 −𝟐𝟐 −𝟒𝟒 𝟏𝟏 𝟐𝟐 𝟏𝟏 𝟐𝟐
x= (J𝐀𝐀∗ ) = (-2 -4) = ( )=( ) = ( = P(A2) = P(A3)).
𝐉𝐉𝐀𝐀∗ 𝐉𝐉 𝐓𝐓 (−𝟔𝟔) −𝟔𝟔 −𝟔𝟔 𝟑𝟑 𝟑𝟑 𝟑𝟑 𝟑𝟑

↑conform definiției

12
𝟏𝟏
Jucătorul P1 alege strategia A2 în o treime ( ) din cazuri, sau echivalent în
𝟑𝟑
𝟐𝟐
0,33(100)% = 33% din cazuri și strategia A3 în (restul de) două treimi ( ) din
𝟑𝟑
cazuri, sau echivalent în 0,67(100)%= 67% din cazuri.

x(0) = (strategia mixtă optimă a jucătorului P1 în jocul inițial) =(se obține


din x, completând cu 0 probabilitatea strategiei A1 nefolosite de P1 în jocul
𝟏𝟏 𝟐𝟐
redus) = (0 = P(A1) = P(A2) = P(A3)), cu P(A1), P(A2), P(A3) ≥ 0 și a.î. P(A1)+
𝟑𝟑 𝟑𝟑
𝟏𝟏 𝟐𝟐 𝟏𝟏+𝟐𝟐 𝟑𝟑
+ P(A2) + P(A3) = 0 + + = = = 1.
𝟑𝟑 𝟑𝟑 𝟑𝟑 𝟑𝟑

−𝟑𝟑 𝟏𝟏
𝟏𝟏 −𝟑𝟑𝟏𝟏
yT = ∗ 𝐓𝐓(𝐀𝐀∗ JT) = � � = �−𝟔𝟔
−𝟑𝟑 � = �𝟐𝟐𝟏𝟏�.
𝐉𝐉𝐀𝐀 𝐉𝐉 (−𝟔𝟔) −𝟑𝟑
−𝟔𝟔 𝟐𝟐

𝟏𝟏 −𝟒𝟒 𝟏𝟏 𝟏𝟏(𝟏𝟏) + (−𝟒𝟒)𝟏𝟏 𝟏𝟏 − 𝟒𝟒 −𝟑𝟑


𝐀𝐀∗ JT = � �� � = � �=� � = � �.
−𝟑𝟑 𝟎𝟎 𝟏𝟏 (−𝟑𝟑)(𝟏𝟏) + (𝟎𝟎)𝟏𝟏 −𝟑𝟑 + 𝟎𝟎 −𝟑𝟑
Deci: =0,5 =0,5
↓ ↓
𝟏𝟏 𝟏𝟏
𝟏𝟏 𝟏𝟏 𝟏𝟏 𝟏𝟏
yT = �𝟐𝟐𝟏𝟏� ⇒ y = (yT)T = �𝟐𝟐𝟏𝟏�T = ( ) = ( = P(B1) = P(B2)).
𝟐𝟐 𝟐𝟐 𝟐𝟐 𝟐𝟐
𝟐𝟐 𝟐𝟐

↑conform definiției
𝟏𝟏
Jucătorul P2 alege strategia B1 în jumătate ( ) din cazuri, sau echivalent în
𝟐𝟐
0,5(100)% = 50% din cazuri și strategia B2 în (restul de sau cealaltă) jumătate
𝟏𝟏
( ) din cazuri, sau echivalent în 0,5(100)% = 50% din cazuri.
𝟐𝟐

y(0) = (strategia mixtă optimă a jucătorului P2 în jocul inițial) =(se obține


din y, completând cu 0 probabilitatea strategiei B3 nefolosite de P2 în jocul
𝟏𝟏 𝟏𝟏
redus) = ( = P(B1) = P(B2) 0 = P(B3)), cu P(B1), P(B2), P(B3) ≥ 0 și a.î. P(B1) +
𝟐𝟐 𝟐𝟐
𝟏𝟏 𝟏𝟏 𝟏𝟏+𝟏𝟏 𝟐𝟐
+ P(B2) + P(B3) = + + 0 = = = 1.
𝟐𝟐 𝟐𝟐 𝟐𝟐 𝟐𝟐

13
Concluzii: Reluăm mai jos, tabelul jocului din enunțul problemei, și
anume:

P2 (1/2)B1 (1/2)B2 (0)B3


P1 50% 50% 0%
(0)A1 2 -2 4
0%
(1/3)A2 0 4 1
33%
(2/3)A3 3 1 4
67%

Valoarea „v = 2” a jocului redus, dar și a celui inițial reprezintă câștigul


maxim al lui P1 și în același timp pierderea minimă a lui P2, dacă se utilizează
𝟏𝟏 𝟏𝟏
strategiile mixte optime x(0) = ( = P(B1) = P(B2) 0 = P(B3)) de către P1 și y(0) =
𝟐𝟐 𝟐𝟐
𝟏𝟏 𝟏𝟏
= ( = P(B1) = P(B2) 0 = P(B3)) de către P2.
𝟐𝟐 𝟐𝟐
[v = 2 > 0] ⇒ [câștigă maximizantul, adică P1])]
Perechea de strategii mixte optime (x(0),y(0)) reprezintă punctul șa al jocului
mediat asociat jocului jocului matriceal antagonist (cu sumă nulă) și fără punct
șa dat în enunțul problemei, jocul mediat fiind jocul definit de tripletul (M, N, v),
unde:

M = (mulţimea tuturor strategiilor mixte ale jucătorului P1) = {x = (x1 x2 x3)


| x1, x2, x3 ≥ 0, x1 + x2 + x3 = 1}, unde x1 = P(A1) = (probabilitatea de alegere a
strategiei A1), x2 = P(A2) = (probabilitatea de alegere a strategiei A2), x3 =
= P(A3) = (probabilitatea de alegere a strategiei A3),
N = (mulţimea tuturor strategiilor mixte ale jucătorului P2) = {y = (y1 y2 y3)
| y1, y2, y3 ≥ 0, y1 + y2 + y3 = 1}, unde y1 = P(B1) = (probabilitatea de alegere a
strategiei B1), y2 = P(B2) = (probabilitatea de alegere a strategiei B2), y3 =
= P(B3) = (probabilitatea de alegere a strategiei B3),
v = v(x,y) este funcţia de câştig mediu, reprezentând câștigul mediu total al
lui P1 sau realizat de P1, și în același timp pierderea medie totală a lui P2, când P1

14
folosește strategia mixtă x = (x1 = P(A1) x2 = P(A2) x3 = P(A3)), iar P2 folosește
strategia mixtă y = (y1 = P(B1) y2 = P(B2) y3 = P(B3)), fiind definită ca mai jos:

v: M×N→R, v(x,y) = a11x1y1 + a12x1y2 + a13x1y3 + a21x2y1 + a22x2y2 + a23x2y3+


+ a31x3y1 + a32x3y2 + a33x3y3 = ∑𝟑𝟑𝐢𝐢=𝟏𝟏 ∑𝟑𝟑𝐣𝐣=𝟏𝟏 𝐚𝐚𝐢𝐢𝐢𝐢 𝐱𝐱 𝐢𝐢 𝐲𝐲𝐣𝐣 = 2x1y1 + (-2)x1y2 + 4x1y3 + 0x2y1
+ 4x2y2 + 1x2y3 + 3x3y1 + 1x3y2 + 4x3y3 = 2x1y1 - 2x1y2 + 4x1y3 + 4x2y2 + x2y3 +
+ 3x3y1 + x3y2 + 4x3y3, unde am ținut seama că aij -urile sunt date în interiorul
tabelului din enunțul problemei, redat de noi mai jos.
P2 B1 B2 B3
P1
A1 2=a11 -2=a12 4=a13
A2 0=a21 4=a22 1=a23
A3 3=a31 1=a32 4=a33

Concluzie (principiul strategiilor dominate)::


Din matricea câştigurilor unui joc se pot elimina:
-liniile care au toate elementele, respectiv, mai mici sau egale decât elementele
unei alte linii;
-coloanele care au toate elementele, respectiv, mai mari sau egale decât
elementele unei alte coloane.

[strategia pură este atunci când agentul P1 alege strategia sa Ai din mulțimea lui
P1 de strategii A = {A1, A2, …, Am}, sau același lucru când agentul P2 alege
strategia sa Bj din mulțimea lui P2 de strategii B = {B1, B2, …, Bn}; strategia
mixtă este atunci când agentul P1 alege strategia sa Ai cu probabilitatea P(Ai),
sau același lucru când agentul P2 alege strategia sa Bj cu probabilitatea P(Bj),
unde: P(Ai) ≥ 0 și ∑𝐦𝐦 𝐢𝐢=𝟏𝟏 𝐏𝐏(𝐀𝐀 𝐢𝐢 ) = P(A1) + P(A2) + ... + P(Am) = 1, și respectiv: P(Bj)≥
𝐧𝐧
≥ 0 și ∑𝐣𝐣=𝟏𝟏 𝐏𝐏(𝐁𝐁𝐣𝐣 ) = P(B1) + P(B2) + ... + P(Bn) = 1; strategia pură este o strategie
deterministă, adică este o strategie care nu implică probabilități].

Prof. matem Atanasiu Virginia.

15

S-ar putea să vă placă și