Sunteți pe pagina 1din 13

Seminarul1 Teoria jocurilor (capitolul1)

1) Jocuri matriceale: antagoniste (de sumă nulă)


Aplicația1

Aplicația1: Fie jocul matriceal, cu sumă nulă (sau antagonist) din tabelul
de mai jos, asociat unei situații de concurență dintre două companii/firme, notate
cu C1, și respectiv cu C2:

C2 B1 B2 B3 B4
C1
A1 3 -1 0 7
A2 6 8 3 5
A3 2 5 1 3

(fiecare valoare din tabel reprezintă câștigul lui C1 și în același timp pierderea lui
C2 pentru perechea corespunzătoare de variante)

Cerințe:

Câte strategii are C1 (prima firmă/companie), respectiv C2 (a doua


firmă/companie)?
Care este matricea de câștig a companiei 1 (C1)?
Care este matricea de câștig a companiei 2 (C2)?
Să se rezolve acest joc sau să se determine soluția acestuia, ceea ce înseamnă
să determinăm câștigul maxim al companiei 1 (adică valoarea jocului) și ce
strategii sunt alese de ambii jucători pentru a obține această valoare (adică
strategiile optime ale celor doi jucători), în ipoteza că C1 și C2 sunt la fel de
competitive și acționează prudent.

Rezolvare:

C2 B1 B2 B3 B4
C1
A1 3 -1 0 7
A2 6 8 3 5
A3 2 5 1 3

1
C2 B1 B2 B3 B4
C1
A1 3 -1 0 7
A2 6 8 3 5
A3 2 5 1 3

Liniile din tabel corespund strategiilor lui C1 (la noi, în număr de 3), notate
conform celor de mai sus cu: A1, A2, A3, iar coloanele lui corespund strategiilor lui
C2 (la noi, în număr de 4), notate conform celor de mai sus cu: B1, B2, B3, B4.

Deci, cele 2 companii au următoarele strategii realizabile (numite strategii


pure, adică alternative, variante, alegeri, moduri de acțiune):
-pentru C1:
A1 = (linia 1 a tabelului din cadrul problemei),
A2 = (linia 2 a tabelului din cadrul problemei),
A3 = (linia 3 a tabelului din cadrul problemei),

-pentru C2:
B1 = (coloana 1 a tabelului din cadrul problemei),
B2 = (coloana 2 a tabelului din cadrul problemei),
B3 = (coloana 3 a tabelului din cadrul problemei),
B4 = (coloana 4 a tabelului din cadrul problemei),

Situația descrisă în cadrul problemei se referă la un joc matriceal (adică un


joc în 2 parteneri, la noi partenerii fiind cele 2 companii, în care un jucător, și
anume primul P1 = C1 are m = 3 strategii pure (alternative), iar celălalt, respectiv
al doilea P2 = C2 are n = 4 strategii pure (alternative)), cu sumă nulă ceea ce
înseamnă că „valoarea câștigată de una dintre companii este pierdută de cealaltă
companie”, sau echivalent: câștigul (+a) al unuia dintre jucători este egal cu
pierderea (-a) a celuilalt jucător, astfel încât, efectuând suma acestora, se obține
valoarea „zero” [(+a) + (-a) = a – a = 0]. Jocul matriceal cu sumă nulă se mai
numește joc matriceal antagonist, deoarece interesele celor doi jucători sunt
complet opuse (în conflict), sunt diametral opuse, adică ceea ce este optim pentru
unul este diametral opus pentru celălalt.

2
C2 B1 B2 B3 B4
C1
A1 3 -1 0 7
Semnificația fiecărei valori din tabel de pe linia variantei X1 pentru C1:
3 reprezintă câștigul lui C1, fiind valoare > 0, pentru perechea
corespunzătoare de variante (A1, B1) și în același timp 3 reprezintă pierderea lui
C2, sau „câștigul” lui C2, egal cu: -3 < 0 pentru perechea corespunzătoare de
variante (A1, B1) [C1 câștigă 3, iar C2 pierde 3 sau „câștigă” -3, fiind vorba de o
pierdere]; evident suma câștigurilor celor doi jucători pentru perechea de
strategii (A1, B1), și anume: 3 + (-3) = 0.
-1 reprezintă pierderea sau „câștigul” lui C1, fiind valoare < 0, pentru
perechea corespunzătoare de variante (A1, B2) și în același timp –(-1) = 1 reprezintă
câștigul lui C2, fiind valoare > 0, pentru perechea corespunzătoare de variante (A1,
B2) [C1 pierde 1 sau „câștigă” -1, fiind vorba de o pierdere, iar C2 câștigă 1];
evident suma câștigurilor celor doi jucători pentru perechea de strategii (A1, B2),
și anume: (-1) + (1) = 0.
0 reprezintă câștigul nul al lui C1, pentru perechea de strategii (A1, B3) și în
același timp tot 0 reprezintă câștigul nul al lui C2, pentru perechea de strategii (A1,
B3), deci câştigul fiecăruia este nul (adică niciunul nu primeşte nimic) pentru
perechea corespunzătoare de variante (A1, B3); evident suma câștigurilor celor
doi jucători pentru perechea de strategii (A1, B3), și anume: (0) + (0) = 0.
7 reprezintă câștigul lui C1, fiind valoare > 0, pentru perechea
corespunzătoare de variante (A1, B4) și în același timp 7 reprezintă pierderea lui
C2, sau „câștigul” lui C2, egal cu: -7 < 0 pentru perechea corespunzătoare de
variante (A1, B4) [C1 câștigă 7, iar C2 pierde 7 sau „câștigă” -7, fiind vorba de o
pierdere]; evident suma câștigurilor celor doi jucători pentru perechea de
strategii (A1, B4), și anume: 7 + (-7) = 0. Ș.a.m.d..

Mulţimea strategiilor jucătorului P1 = C1 se notează cu A, fiind


următoarea, și anume: A = {A1, A2, A3}(A reprezintă alegerile lui P1 = C1).
Mulţimea strategiilor jucătorului P2 = C2 se notează cu B, fiind
următoarea, și anume: B = {B1, B2, B3, B4} (B reprezintă alegerile lui P2 = C2).
Matricea câștigurilor lui C1 se notează cu A sau cu H1 și ea este conținută
în interiorul tabelului din cadrul problemei.
(liniile lui A sau ale lui H1 corespund strategiilor lui C1 (la noi, în număr de 3), iar
coloanele ei corespund strategiilor lui C2 (la noi, în număr de 4);

3
-A = H1 se poate reprezintă sub forma tabelului cu 3 linii și 4 coloane din
enunț, astfel:

C2 B1 B2 B3 B4
C1
A1 3 -1 0 7
A2 6 8 3 5
A3 2 5 1 3

A = H1 se poate reprezenta și sub forma matricei cu 3 linii și 4 coloane,


astfel:
3 -1 0 7
A = H1 = 6 8 3 5
2 5 1 3
(celulele (căsuțele) matricei conțin câștigurile lui P1 = C1 în funcție de strategiile
alese de către cei doi jucători)

Matricea câștigurilor lui C1, adică A = H1 se mai numește matricea jocului


matriceal și cu sumă nulă/antagonist considerat.

Tabelul de mai sus (reamintit mai jos) conține în interiorul său, matricea
jocului considerat (adică matricea câștigurilor A = H1 a lui C1).

C2 B1 B2 B3 B4
C1
A1 3 -1 0 7
A2 6 8 3 5
A3 2 5 1 3
↑Matricea sau tabelul de câștiguri pentru jocul considerat (pentru P1 = C1)

Observație: Jocul din problemă sub formă matriceală se notează cu G și


este dat de tripletul (A, B, A), iar matematic scriem G = (A, B, A = H1).

Observație: Jocul din problemă sub formă normală (strategică) se notează


tot cu G și este descris de: mulțimea jucătorilor ({P1, P2}), mulțimea strategiilor
pentru fiecare jucător (A pentru P1 = C1, B pentru P2 = C2) și câștigurile lui P1 =
4
= C1 în funcție de strategiile alese (adică valorile precizate la începutul rezolvării
pentru fiecare pereche de strategii ale celor doi jucători).

Observație: Forma matriceală este evident echivalentă cu forma normală


(strategică) a jocului din orice problemă.

Întotdeauna, P1 primul jucător (la noi C1) se mai numeşte jucătorul


maximizant, fiind jucătorul ce urmărește obținerea unui câștig maxim, deci cât
mai mare, în timp ce P2 al doilea jucător (la noi C2) se numeşte jucător
minimizant, fiind jucătorul ce urmărește obținerea unei pierderi minime, deci
cât mai mici.

Observație: Întotdeauna, matricea jocului, adică A = H1 se scrie în raport


cu un singur jucător, şi anume P1, primul jucător (deci în raport cu jucătorul
maximizant).

În matricea câștigurilor lui P2 = C2, notată cu H2, toate elementele


respectivei matrice au semn contrar elementelor din A = H1 (din matricea
câștigurilor lui P1). Matricea H2 se poate repezenta (ca și matricea A = H1) sub
forma unui tabel în care liniile tabelului corespund strategiilor lui P2 = C2, iar
coloanele lui corespund strategiilor lui P1 = C1, deci sub forma unui tabel cu 4 linii
și 3 coloane, astfel:

C1 A1 A2 A3
C2
B1 -3 -6 -2
B2 1 -8 -5
B3 0 -3 -1
B4 -7 -5 -3
Într-adevăr din tabelul de mai jos al lui A = H1:
C2 B1 B2 B3 B4
C1
A1 3 -1 0 7
A2 6 8 3 5
A3 2 5 1 3

5
C2 B1 B2 B3 B4
C1
A1 3 -1 0 7
A2 6 8 3 5
A3 2 5 1 3
s-a obținut tabelul următor al lui H2, și anume:
C1 A1 A2 A3
C2
B1 -3 -6 -2
B2 1 -8 -5
B3 0 -3 -1
B4 -7 -5 -3
↑Matricea sau tabelul de câștiguri pentru P2 = C2
(liniile tabelului care-l conține pe A = H1 au devenit coloane mai sus, sau coloanele
aceluiași tabel au devenit linii mai sus, iar elementele lui A = H1 le-am scris cu
semn contrar mai sus, în tabelul lui H2).

H2 se poate reprezenta și sub forma matricei cu 4 linii și 3 coloane, astfel:

-din tabelul de mai jos al lui H2:

C1 A1 A2 A3
C2
B1 -3 -6 -2
B2 1 -8 -5
B3 0 -3 -1
B4 -7 -5 -3

am extras matricea H2 conținută în interiorul acestui tabel:


-3 -6 -2
1 -8 -5
H2 = 0 -3 -1
-7 -5 -3

6
Observație (verificare): Relația existentă între A = H1 și H2 este
următoarea: H1 + H2t = 0.

3 -1 0 7 -3 1 0 -7
H1 + H2t = 6 8 3 5 + -6 -8 -3 -5 =
2 5 1 3 -2 -5 -1 -3

3 + (-3) -1 + (1) 0 + (0) 7 + (-7) 0 0 0 0


= 6 + (-6) 8 + (-8) 3 + (-3) 5 + (-5) = 0 0 0 0 = 0.
2 + (-2) 5 + (-5) 1 + (-1) 3 + (-3) 0 0 0 0

[cu H2t s-a notat matricea transpusă a lui H2, ea obținându-se după cum urmează:
liniile lui H2 au devenit coloane în H2t, sau echivalent coloanele lui H2 au devenit
linii în H2t; cu 0 s-a notat mai sus matricea zero, adică matricea care are toate
elementele egale cu numărul real 0]

În cele ce urmează, cu aij notăm elementul din matricea A, adică cel de la


intersecția liniei i a lui A cu coloana j a lui A.
C2 B1 B2 B3 B4
C1
A1 3=a11 -1=a12 0=a13 7=a14
A2 6=a21 8=a22 3=a23 5=a24
A3 2=a31 5=a32 1=a33 3=a34

D.p.d.v. formal - ambii jucători urmăresc acelaşi scop, și anume ca ambii


jucători să obțină cele mai bune rezultate pentru ei (să aleagă cele mai bune
opțiuni pentru ei), adică jucătorul maximizant urmărește obținerea unui câștig
maxim, deci cât mai mare, în timp ce jucătorul minimizant urmărește obținerea
unei pierderi minime, deci cât mai mici.

În atingerea scopului lor, partenerii de joc folosesc criterii de decizie


proprii.

7
C2 B1 B2 B3 B4
C1
A1 3=a11 -1=a12 0=a13 7=a14
A2 6=a21 8=a22 3=a23 5=a24
A3 2=a31 5=a32 1=a33 3=a34
P1 (adică maximizantul P1) face următorul raționament, folosind criteriul
propriu de decizie „MAXIMIN”:
-întâi alege minimul liniilor sale, notat respectiv cu:
↓câștigul minim (sigur) al lui P1, când acesta alege modul de acțiune A1
α1 = min{3,-1,0,7} = -1 = a12 (←minimul pe linia „1” din matricea jocului
de mai sus),
↓câștigul minim (sigur) al lui P1, când acesta alege modul de acțiune A2
α2 = min{6,8,3,5} = 3 = a23 (←minimul pe linia „2” din matricea jocului
de mai sus),
↓câștigul minim (sigur) al lui P1, când acesta alege modul de acțiune A3
α3 = min{2,5,1,3} = 1 = a33 (←minimul pe linia „3” din matricea jocului
de mai sus),
-și apoi, alege maximul acestor minime, calculând cel mai mare câștig
minim al său, notat cu:
α1, α2, α3
α = v1 = max{-1, 3, 1} = 3 (și numit valoarea inferioară a jocului).

α2 (obținut linia2 = (linia lui A2, fiind = α2)
↑a23
Deoarece α = 3 = α2, rezultă că strategia maximin, sau strategia maxmin a
lui P1 este A2.
(A2 este strategia care asigură lui P1 un câştig egal cu α = v1 = 3 (deci cu cel mai
mare câștig minim al său))

C2 B1 B2 B3 B4
C1
A1 3=a11 -1=a12 0=a13 7=a14
A2 6=a21 8=a22 3=a23 5=a24
A3 2=a31 5=a32 1=a33 3=a34

8
C2 B1 B2 B3 B4
C1
A1 3=a11 -1=a12 0=a13 7=a14
A2 6=a21 8=a22 3=a23 5=a24
A3 2=a31 5=a32 1=a33 3=a34
P2 (adică minimizantul P2) face următorul raționament, folosind criteriul
propriu de decizie „MINIMAX”:
-întâi alege maximele coloanelor sale, notate respectiv cu:
↓pierderea maximă (certă) a lui P2, când acesta alege modul de acțiune B1
β1 = max{3,6,2} = 6 = a21 (←maximul pe coloana „1” din matricea jocului
de mai sus),
↓pierderea maximă (certă) a lui P2, când acesta alege modul de acțiune B2
β2 = max{-1,8,5} = 8 = a22 (←maximul pe coloana „2” din matricea jocului
de mai sus),
↓pierderea maximă (certă) a lui P2, când acesta alege modul de acțiune B3
β3 = max{0,3,1} = 3 = a23 (←maximul pe coloana „3” din matricea jocului
de mai sus),
↓pierderea maximă (certă) a lui P2, când acesta alege modul de acțiune B4
β4 = max{7,5,3} = 7 = a14 (←maximul pe coloana „4” din matricea jocului
de mai sus),
-și apoi, alege minimele acestor maxime, calculând cea mai mică pierdere
maximă a sa, notată:
β1, β2, β3, β4
β = v2 = min{6, 8, 3, 7} = 3 (și numită valoarea superioară a jocului).

a23 = β3 (obținut pe coloana3 = (coloana lui B3), fiind =
= β3)

Deoarece β = 3 = β3, rezultă că strategia minimax, sau strategia minmax a


lui P2 este B3.
(B3 este strategia care asigură lui P2 o pierdere egală β = v2 = 3 (deci cea mai
mică pierdere maximă a sa))

Deoarece avem:

9
α (= v1 = 3 = α2) = β (= v2 = 3= β3),

atunci valoarea comună (a datelor α și β) notată cu v se numeşte valoarea


jocului, iar jocul respectiv se va numi joc cu punct şa. La noi v = 3.
[în caz contrar, dacă α ≠ β, atunci jocul s-ar fi numit joc fără punct şa, iar valoarea
jocului, adică v ar fi avut proprietatea că ea ∈ [α, β])

Elementul aij din matricea A, adică cel de la intersecția liniei i a lui A cu


coloana j a lui A, în care se realizează această egalitate: α (=3= α2 = a23) = β (= 3=
= β3 = a23) = v = 3 se numeşte punct şa, iar jocul respectiv se va numi joc cu punct
şa. La noi a23 = 3 va fi punctul şa.

Din teorie, se ştie că: strategiile Ai (a liniei i sau a liniei lui Ai din A, pe care
se află punctului şa aij în A) şi Bj (a coloanei j sau a coloanei lui Bj din A, pe care
se află punctului şa aij în A) corespunzătoare punctului şa aij, formează o pereche
de strategii maximin pentru P1, respectiv minimax pentru P2 şi se vor numi
strategii optime (sau optimale) ale celor doi jucători.

La noi: a23 = 3 fiind punctul şa, rezultă că strategiile corespunzătoare


punctului şa a23, adică strategia A2 (a liniei 2 sau liniei lui A2, pe care se află
punctului şa a22 în A) şi strategia B3 (a coloanei 3 sau coloanei lui B3, pe care se
află punctului şa a23 în A) sunt strategii optime (sau optimale) pentru P1 = C1,
respectiv pentru P2 = C2.
C1 va alege numai strategia sa optimă (sau numai strategia sa maximin)
A2, iar C2 numai strategia sa (sau numai strategia sa minimax) optimă B3,
indiferent de numărul partidelor ce se joacă, bineînțeles în ipoteza că C1 și C2
sunt la fel de competitive și acționează prudent.
(Dacă jucătorul C1 joacă strategia sa optimă A2, atunci câștigul său așteptat
nu va fi mai mic decât v = 3, indiferent ce joacă C2. Dacă jucătorul C2 joacă
strategia sa optimă B3, pierderea sa așteptată nu va fi mai mare decât v = 3,
indiferent ce joacă C1)

10
[Dacă jocul are punct șa, atunci ambii jucători (agenți) trebuie să joace numai
strategia indicată (sau numai strategiile indicate) de acesta, care sunt de fapt
strategiile maximin, și respective minimax ale lor).]

Concluzii:

Valoarea inferioară (valoarea maximin) a jocului dat este: α = v1 = 3.

Valoarea superioară (valoarea minimax) a jocului dat este: β = v2 = 3.

[α = 3 = a23] = [β = 3 = a23] ⇒ [jocul dat are punct şa], iar punctul şa al


jocului dat este a23 = 3.
[punctul şa este cel mai mic de pe linia şi cel mai mare de pe coloana pe care
acesta se află]

Strategia maximin, sau strategia maxmin a lui P1 este A2, iar strategia
minimax, sau strategia minmax a lui P2 este B3, echivalent cu a scrie că strategiile
optime (sau optimale) ale celor doi jucători sunt A2 pentru P1, și respectiv B3
pentru P2.
(A2 este strategia care asigură lui P1 un câştig egal cu α = v1 = 3 (deci cu cel mai
mare câștig minim al său))
(B3 este strategia care asigură lui P2 o pierdere egală β = v2 = 3 (deci cea mai
mică pierdere maximă a sa))

Valoarea jocului dat este: v = α = β = 3 și reprezintă valoarea maximă a


câștigului (minim) al lui C1, și în același timp valoarea minimă a pierderii
(maxime) a lui C2, dacă se utilizează strategiile A2 de către C1 și B3 de către C2.
([v = 3 > 0] ⇒ [câștigă maximizantul])
Observaţie: Calculele de mai sus pot fi simplificate prin organizarea lor
într-un tabel obţinut din cel care-l conține pe A, la care se adaugă coloana
elementelor αi (a celor mai mici elemente pe linie) şi linia elementelor βj (a celor
mai mari elemente pe coloană), astfel:

11
C2 B1 B2 B3 B4 αi
C1
A1 3=a11 -1=a12 0=a13 7=a14 -1=a12=α1
A2 6=a21 8=a22 3=a23 5=a24 3=a23=α2
A3 2=a31 5=a32 1=a33 3=a34 1=a33=α3
α=max{α1, α2, α3}=3
βj 6=a21=β1 8=a22=β2 3=a23=β3 7=a14=β4 β=min{β1, β2, β3, β4}=3

Concluzii:

Valoarea inferioară (valoarea maximin) a jocului dat este: α = v1 = 3.


Valoarea superioară (valoarea minimax) a jocului dat este: β = v2 = 3.
[α = 3 = a23] = [β = 3 = a23] ⇒ [jocul dat are punct şa], iar punctul şa al
jocului dat este a23 = 3.
[punctul şa este cel mai mic de pe linia şi cel mai mare de pe coloana pe care
acesta se află]
Strategia maximin, sau strategia maxmin a lui P1 este A2, iar strategia
minimax, sau strategia minmax a lui P2 este B3, echivalent cu a scrie că strategiile
optime (sau optimale) ale celor doi jucători sunt A2 pentru P1, și respectiv B3
pentru P2.
(A2 este strategia care asigură lui P1 un câştig egal cu α = v1 = 3 (deci cu cel mai
mare câștig minim al său))
(B3 este strategia care asigură lui P2 o pierdere egală β = v2 = 3 (deci cea mai
mică pierdere maximă a sa))
Valoarea jocului dat este: v = α = β = 3 și reprezintă valoarea maximă a
câștigului (minim) al lui C1, și în același timp valoarea minimă a pierderii
(maxime) a lui C2, dacă se utilizează strategiile A2 de către C1 și B3 de către C2.
([v = 3 > 0] ⇒ [câștigă maximizantul])

Observaţie:

12
În general, pe o suprafață punctul care se bucură de proprietatea că este în
același timp punct de minim pe o direcție și punct de maxim pe direcția
perpendiculară se numește punct șa, întrucât suprafața respectivă se prezintă
geometric sub forma de șa (sub forma unei șei).

Observație:

Dacă v > 0, atunci câștigă maximizantul.


Dacă v < 0, atunci câștigă mimimizantul.
Dacă v = 0, atunci rezultatul este de egalitate.

Prof. matem. Virginia Atanasiu

13

S-ar putea să vă placă și