Documente Academic
Documente Profesional
Documente Cultură
P2 B1 B2 B3
P1
A1 2 -2 4
A2 0 4 1
A3 3 1 4
Rezolvare:
a)
P2 B1 B2 B3
P1
A1 2 -2 4
A2 0 4 1
A3 3 1 4
1
P2 B1 B2 B3
P1
A1 2 -2 4
A2 0 4 1
A3 3 1 4
2
linia lui A1 cu linia lui A3:
căreia↓ ↓căreia
P2 B1 B2 B3
îi ↓ ↓ îi
P1
corespund ↓ ↓ corespund
A1 2 -2 4
câștigurile ↓ ↓ câștigurile
A2 0 4 1
lui P1: ↓ ↓ lui P1:
A3 3 1 4
2 < 3
-2 < 1
4 = 4
↓
[A1 < A3 (strategia A1 este dominată de strategia A3)].
Deci:
3
𝟐𝟐 −𝟐𝟐
𝟒𝟒
mai sus, adică din �𝟎𝟎 𝟏𝟏� prin eliminarea lui A1, deci prin
𝟒𝟒
𝟑𝟑 𝟏𝟏
𝟒𝟒
𝟎𝟎 𝟒𝟒 𝟏𝟏
eliminarea liniei1 a sa), și anume: � �, cea aflată în interiorul
𝟑𝟑 𝟏𝟏 𝟒𝟒
tabelului de mai jos, astfel încât jocul inițial devine jocul redus de mai
jos:
tabelul de mai înainte al jocului inițial:
P2 B1 B2 B3
P1
A1 2 -2 4
A2 0 4 1
A3 3 1 4
devine următorul, și anume cel al jocului redus:
P2 B1 B2 B3
P1
A2 0 4 1
A3 3 1 4
4
coloana lui B1 cu coloana lui B3:
căreia↓ ↓căreia
îi ↓ ↓ îi P2 B1 B2 B3
corespund ↓ ↓ corespund P1
pierderile ↓ ↓ pierderile A2 0 4 1
lui P2: ↓ ↓ lui P2: A3 3 1 4
0 < 1
3 < 4
↓[B1 < B3 (strategia B3 este dominată de strategia B1)].
Deci:
5
Deci, în ipoteza raționalității jucătorilor, jocul este redus prin
eliminarea strategiei dominate (nefavorabile) A1 pentru jucătorul 1 și
prin eliminarea strategiei dominate (nefavorabile) B3 pentru jucătorul
2 la cel cu matricea din interiorul tabelului de mai sus.
↓câștigul minim (sigur) al lui P1, când acesta alege modul de acțiune A3
α3 = min{3,1} = 1 (←minimul pe linia „3” din matricea jocului),
-și apoi, alege maximul acestor minime, calculând cel mai mare
câștig minim al său, notat cu:
α2, α3
α = v1 = max{0, 1} = 1 (și numit valoarea inferioară a jocului).
↑
a32 = α3 (obținut pe linia3 = (linia lui A3))
6
Strategia care asigură lui P1 un câştig egal cu α = v1 = 1 (deci cu
cel mai mare câștig minim al său) se numeşte strategie maximin, sau
strategie maxmin, fiind strategia care urmărește pentru P1
maximizarea câștigului său minim. În cazul nostru, deoarece α = 1 =
= α3, rezultă că strategia maximin, sau strategia maxmin a lui P1 este
A3.
↓pierderea maximă (certă) a lui P2, când acesta alege modul de acțiune B1
β1 = max{0,3} = 3 (←maximul pe coloana „1” din matricea
jocului),
↓pierderea maximă (certă) a lui P2, când acesta alege modul de acțiune B2
β2 = max{4,1} = 4 (←maximul pe coloana „2” din matricea
jocului),
-și apoi, alege minimele acestor maxime, calculând cea mai mică
pierdere maximă a sa, notată:
7
β1, β2
β = v2 = min{3, 4} = 3 (și numită valoarea superioară a jocului).
↑
a31 = β1 (obținut pe coloana1 = (coloana lui B1))
Deoarece avem:
α (= v1 = 1 = α1) ≠ β (= v2 = 3= β3),
rezultă că jocul „redus” este un joc fără punct şa, iar de aici deducem
că nici jocul iniţial nu are punct şa, iar valoarea atât a jocului „redus”,
cât și a celui inițial, notată cu v are proprietatea că ea ∈ [α,β]. La noi:
v ∈ (α,β) = (1,3).
Deci, dacă jocul „redus” nu are punct şa, atunci nici cel iniţial nu
are punct şa, iar valoarea „v” a jocului are proprietatea că 1 = α < v <
< β = 3.
Observaţie: Calculele de mai sus pot fi simplificate prin
organizarea lor într-un tabel obţinut din cel care-l conține pe A redus,
la care se adaugă coloana elementelor αi (a celor mai mici elemente pe
linie) şi linia elementelor βj (a celor mai mari elemente pe coloană),
astfel:
8
↓minimul pe fiecare linie „i”
↓din matricea jocului redus
↓
P2 B1 B2 αi
P1
A2 0=a21 4=a22 α2=min{0,4}=0=a21
A3 3=a31 1=a32 α3=min{3,1}=1=a32
βj β1=max{0,3}= β2=max{4,1}= α=max{α2, α3}=1=α3
=3=a31 =4=a22 β=min{β1, β2}=3=β1
↑
maximul pe fiecare
coloană „j”
din matricea jocului redus
α = max{α2, α3}
β = min{β1, β2}
Concluzii:
Valoarea inferioară (valoarea maximin) a jocului dat este: α = v1 = 1.
Valoarea superioară (valoarea minimax) a jocului dat este: β = v2 = 3.
α (= v1 = 1 = α1) ≠ β (= v2 = 3= β3) ⇒ [jocul „redus” este un joc fără punct
şa] ⇒ [nici jocul iniţial nu are punct şa] ⇒ [valoarea atât a jocului „redus”, cât
și a celui inițial, notată cu v are proprietatea că ea ∈ (α,β) = (1,3)].
[α = 1 = α3] ⇒ [A3 este strategia maximin, sau strategia maxmin a lui P1].
↑(s-a obținut pe linia3 = (linia lui A3))
(A3 este strategia care asigură lui P1 un câştig egal cu α = v1 = 1 (deci cu cel mai
mare câștig minim al său))
[β = 3 = β1] ⇒ [B1 este strategia minimax, sau strategia minmax a lui P2]
↑
(s-a obținut pe coloana1 = (coloana lui B1))
(B1 este strategia care asigură lui P2 o pierdere egală β = v2 = 3 (deci cu cea mai
mică pierdere maximă a sa))
9
([v ∈ (1,3) ⇒ v > 0] ⇒ [câștigă maximizantul, adică P1])
10
P2 B1 B2
P1
A2 0=a21 4=a22
A3 3=a31 1=a32
Soluția jocului redus prin metoda matriceală este dată de următoarele
elemente:
conform definiției
↓
x = (strategia mixtă optimă a jucătorului P1 în jocul redus de la a)) =
𝟏𝟏
= (P(A2) P(A3)) = (J𝐀𝐀∗ ), cu P(A2), P(A3) ≥ 0 și a.î. P(A2) + P(A3) = 1.
𝐉𝐉𝐀𝐀∗ 𝐉𝐉 𝐓𝐓
↑conform metodei matriceale
[P(A2) = (probabilitatea de alegere a strategiei A2), P(A3) = (probabilitatea de
alegere a strategiei A3)]
conform definiției
↓
y = (strategia mixtă optimă a jucătorului P2 în jocul redus de la a)) =
= (P(B1) P(B2)), cu P(B1), P(B2) ≥ 0 și a.î. P(B1) + P(B2) = 1.
[P(B1) = (probabilitatea de alegere a strategiei B1), P(B2) = (probabilitatea de
alegere a strategiei B2)]; y rezultă astfel:
𝟏𝟏
yT = (𝐀𝐀∗ JT), iar de aici se obține: y = (yT)T,
𝐉𝐉𝐀𝐀∗ 𝐉𝐉 𝐓𝐓
↑
conform metodei matriceale
11
, unde: J = (1 1), A* = (matricea adjunctă a lui A) = (matricea obținută din AT
înlocuind elementele din AT cu complemenții lor algebrici) =
= (matricea ale cărei elemente sunt complemenții algebrici ai elementelor din AT).
𝟎𝟎 𝟒𝟒
|A| = � � = 0(1) – (4)(3) = 0 - 12 = -12.
𝟑𝟑 𝟏𝟏
𝟏𝟏 −𝟒𝟒
JA* = (1 1) � � = (1(1) + 1(-3) 1(-4) + 1(0)) = (1 - 3 -4 + 0) = (-2 -4) ⇒
−𝟑𝟑 𝟎𝟎
𝟏𝟏
⇒ JA*JT = (-2 -4)� � = (-2)1 + (-4)1 = -2 – 4 = -6.
𝟏𝟏
𝟏𝟏
↑J = (1 1) ⇒ JT = � �
𝟏𝟏
Deci:
𝟏𝟏 𝟏𝟏
v= |A| = (-12) = 2 ∈ (1,3).
𝐉𝐉𝐀𝐀∗ 𝐉𝐉 𝐓𝐓 (−𝟔𝟔)
≈0,33 ≈0,67
↓ ↓
𝟏𝟏 𝟏𝟏 −𝟐𝟐 −𝟒𝟒 𝟏𝟏 𝟐𝟐 𝟏𝟏 𝟐𝟐
x= (J𝐀𝐀∗ ) = (-2 -4) = ( )=( ) = ( = P(A2) = P(A3)).
𝐉𝐉𝐀𝐀∗ 𝐉𝐉 𝐓𝐓 (−𝟔𝟔) −𝟔𝟔 −𝟔𝟔 𝟑𝟑 𝟑𝟑 𝟑𝟑 𝟑𝟑
↑conform definiției
12
𝟏𝟏
Jucătorul P1 alege strategia A2 în o treime ( ) din cazuri, sau echivalent în
𝟑𝟑
𝟐𝟐
0,33(100)% = 33% din cazuri și strategia A3 în (restul de) două treimi ( ) din
𝟑𝟑
cazuri, sau echivalent în 0,67(100)%= 67% din cazuri.
−𝟑𝟑 𝟏𝟏
𝟏𝟏 −𝟑𝟑𝟏𝟏
yT = ∗ 𝐓𝐓(𝐀𝐀∗ JT) = � � = �−𝟔𝟔
−𝟑𝟑 � = �𝟐𝟐𝟏𝟏�.
𝐉𝐉𝐀𝐀 𝐉𝐉 (−𝟔𝟔) −𝟑𝟑
−𝟔𝟔 𝟐𝟐
↑conform definiției
𝟏𝟏
Jucătorul P2 alege strategia B1 în jumătate ( ) din cazuri, sau echivalent în
𝟐𝟐
0,5(100)% = 50% din cazuri și strategia B2 în (restul de sau cealaltă) jumătate
𝟏𝟏
( ) din cazuri, sau echivalent în 0,5(100)% = 50% din cazuri.
𝟐𝟐
13
Concluzii: Reluăm mai jos, tabelul jocului din enunțul problemei, și
anume:
14
folosește strategia mixtă x = (x1 = P(A1) x2 = P(A2) x3 = P(A3)), iar P2 folosește
strategia mixtă y = (y1 = P(B1) y2 = P(B2) y3 = P(B3)), fiind definită ca mai jos:
[strategia pură este atunci când agentul P1 alege strategia sa Ai din mulțimea lui
P1 de strategii A = {A1, A2, …, Am}, sau același lucru când agentul P2 alege
strategia sa Bj din mulțimea lui P2 de strategii B = {B1, B2, …, Bn}; strategia
mixtă este atunci când agentul P1 alege strategia sa Ai cu probabilitatea P(Ai),
sau același lucru când agentul P2 alege strategia sa Bj cu probabilitatea P(Bj),
unde: P(Ai) ≥ 0 și ∑𝐦𝐦 𝐢𝐢=𝟏𝟏 𝐏𝐏(𝐀𝐀 𝐢𝐢 ) = P(A1) + P(A2) + ... + P(Am) = 1, și respectiv: P(Bj)≥
𝐧𝐧
≥ 0 și ∑𝐣𝐣=𝟏𝟏 𝐏𝐏(𝐁𝐁𝐣𝐣 ) = P(B1) + P(B2) + ... + P(Bn) = 1; strategia pură este o strategie
deterministă, adică este o strategie care nu implică probabilități].
15