Documente Academic
Documente Profesional
Documente Cultură
TEORIA JOCURILOR
1. Noiuni generale
Teoria jocurilor este teoria matematic care se ocup cu determinarea metodelor de alegere a deciziilor n cazuri de competiie sau situaii conflictuale. O situaie conflictual este cea n care acioneaz doi sau mai muli factori (persoane fizice, firme, partide politice) avnd scopuri contrarii. Astfel de situaii sunt: concurena economic, vnzrile la licitaie, alegerile parlamentare etc.. Teoria jocurilor se ocup i de cazurile n care o activitate intr n conflict cu caracterul ntmpltor al unor evenimente naturale (epidemii, secet). Pentru construirea unui model formal, simplificat al situaiei cercetate se vor selecta caracteristicile principale, cele secundare neglijndu-se. Terminologia folosit este cea de la jocurile de societate sau de noroc. Prin joc sau joc strategic se nelege situaia n care acioneaz o mulime de elemente raionale (numite juctori sau parteneri) care n mod succesiv i independent, ntr-o ordine i condiii fixate ntr-un ansamblu de reguli, iau cte o decizie (efectueaz o mutare) dintr-o mulime dat de alternative. Regulile jocului fixeaz i situaiile n care se termin jocul, precum i ctigul sau recompensa pentru fiecare juctor. Un joc realizat se mai numete partid. Aciunile ntreprinse de juctori n cadrul unei partide se numesc mutri. Acestea pot fi: libere cnd alegerea alternativei este univoc sau
aleatoare, cnd alegerea alternativei este supus ntmplrii i e determinat de un mecanism aleator (zar). Dup cantitatea de informaie de care dispune fiecare juctor exist jocuri cu informaie complet (ahul) i jocuri cu informaie parial (bridgeul), necunoaterea inteniilor adversarului constituind elementul esenial al situaiilor conflictuale. Ansamblul de reguli ce definesc n mod unic micrile libere n funcie de situaia ivit n timpul jocului se numete strategie. Dac unul dintre adversari are la dispoziie m alternative, iar partida se ncheie printr-o alegere, se spune c juctorul are la dispoziie m strategii pure. Cnd partidele se repet, juctorii pot alege strategii pure cu anumite frecvene sau probabiliti i atunci se spune c utilizeaz o strategie mixt. Dac numrul strategiilor pure este finit, spunem c avem un joc finit, n caz contrar avem un joc infinit. Fiecare juctor urmrete aplicarea unei strategii care s i aduc un ctig maxim, deci i caut o strategie optim. Ctigul pi realizat de juctorul Pi are semnificaia unei sume bneti sau a unui numr de puncte, bunuri etc.. Dac pi > 0, juctorul Pi realizeaz un ctig n sensul uzual al cuvntului, iar dac pi < 0 nregistreaz o pierdere. Din punct de vedere al ctigului distingem: - jocuri cu sum nul cnd la sfritul unei partide suma pierdut de o parte din juctori este ctigat de ceilali i - jocuri cu sum nenul cnd juctorii pot s-i mreasc concomitent ctigurile, prin alegerea unor strategii adecvate. Dup numrul n al juctorilor, jocurile pot fi cu doi parteneri sau cu n > 2 parteneri.
Teoria jocurilor
Exemplu [2] Fie jocul cu doi parteneri P1 i P2 ce const n 3 mutri libere. O mutare nseamn alegerea unuia dintre numerele a sau b, a b. La prima mutare P1 alege liber pe a sau pe b; la a doua mutare P2, informat asupra alegerii fcute de P1, alege la rndul su unul din numerele a sau b. n sfrit, la a treia mutare P1, informat asupra alegerii fcute de P2, alege unul dintre numerele a sau b. Observm c este un joc n doi, cu mutri libere i informaie complet ce poate fi reprezentat printr-un arbore de forma: (1, -1) (2, 1) (-1, 2) (3, 1) (-2, 1) (1, -3) (2, 3) (1, 2) a b a b a b a b
a 1 a 2
b 1
a 1 b 2 0 1
b 1
Vrful 0 arat momentul iniial, iar cifra 1 scris sub 0 arat c prima mutare este a lui P1. Din 0 pornesc dou muchii spre vrfurile a i b, ce reprezint alegerile lui P1. Sub a i b scriem 2, pentru c urmtoarea mutare este a lui P2. Din fiecare vrf pornesc dou muchii spre alte vrfuri a i b, reprezentnd alegerile lui P2 i sub aceste vrfuri scriem 1 deoarece P1 face urmtoarea mutare spre alte vrfuri notate a i b (care vor fi vrfuri terminale). Sub ele nu mai scriem nimic, dar fiecruia i asociem un vector
bidimensional (p1, p2) ale crui componente reprezint respectiv ctigurile celor doi juctori, decurgnd din regulile jocului. S-au obinut 8 vrfuri terminale ce vor determina tot attea partide, deoarece o partid este reprezentat de un lan ce leag vrful 0 de unul din vrfurile terminale. Cele 8 partide sunt: (a, a, a), (a, a, b), (a, b, a), (a, b, b), (b, a, a), (b, a, b), (b, b, a) i (b, b, b). Jocul nu este cu sum nul deoarece dac, de exemplu, s-ar realiza partida (a, a, b) avem p1 = 2, p2 = 1 i p1 + p2 = 3 0. Mulimea strategiilor juctorului P1 este: A = (a, a), (a, b), (b, a), (b, b), unde primul element din fiecare pereche reprezint numrul ales la prima mutare, iar al doilea element indic numrul ales la a treia mutare. Mulimea strategiilor lui P2 este: B = (a), (b), reprezentnd alegerile la a doua mutare. Asociem jocului considerat un tabel cu dou intrri A = A1, ...,A4 - strategiile lui P1 i B = B1, B2, strategiile lui P2. La intersecia liniei lui Ai cu coloana lui Bj avem un dreptunghi n care deasupra diagonalei am scris partida, iar dedesubt vectorul (pi, pj) al ctigurilor celor doi juctori, cnd acetia aleg strategiile Ai, respectiv Bj. B A A1 = (a, a) A2 = (a, b) A3 = (b, a) A4 = (b, b) B1 = (a) (a, a, a) (1, -1) (a, a, b) (2, 1) (b, a, a) (-2, 1) (b, a, b) (1, -3) (1, 2) (2, 3) (b, b, b) (3, 1) (b, b, a) (-1, 2) (a, b, b) B2 = (b) (a, b, a)
Teoria jocurilor
Din acest exemplu observm c exist diferite moduri de reprezentare a unui joc, cu ajutorul unui arbore sau matricial. Observaie: Dac n acelai joc considerm ctigurile date de urmtoarea coresponden: (a, a, a) (2, -2) (a, a, b) (-1, 1) (a, b, a) (4, -4) (a, b, b) (5, -5) (b, a, a) (1, -1) (b, a, b) (3, -3) (b, b, a) (-2, 2) (b, b, b) (-3, 3)
jocul va fi: finit, cu informaie complet, cu mutri libere i cu sum nul, deoarece p1 + p2 = 0 pentru orice vector (p1, p2). n acest caz reprezentarea matricial poate fi simplificat, scriind n locul vectorului (p1, p2) doar ctigul p1 al lui P1, deoarece cel al lui P2 e cunoscut, egal cu p1. Forma simplificat a matricei este: B B1 = (a) B2 = (b) 2 -1 1 3 4 5 -2 -3
2. Jocuri matriceale Fie un joc finit ntre doi juctori, n care un juctor are m strategii pure, iar cellalt n strategii pure. Un astfel de joc se numete joc m n sau joc matriceal. Dac jocul este cu sum nul, el se va numi antagonist. n
acest din urm caz, funcia de ctig se poate prezenta sub forma unui tabel de pli, adic o matrice m n, notat cu A, astfel:
a11 L a1n M M sau A = (aij), i = 1, m , j = 1, n . A= M a m1 L a mn
Matricea A se numete matricea jocului (matricea ctigurilor). Elementul aij este ctigul juctorului P1 cnd alege strategia Ai i juctorul P2 alege strategia Bj. Aceast form matriceal de prezentare a jocului se va numi forma normal. Caracteristicile eseniale ale unui joc sunt: a) mulimea strategiilor pure ale juctorului P 1, P 2, notat
A = A1,..., Am;
b) mulimea
strategiilor
pure
ale
juctorului
notat
B = B1,...,Bn;
c) funcia de ctig f: A B , definit prin f(Ai, Bj) = aij, i = 1, m , j = 1, n . Imaginea prin f a produsului cartezian A B este matricea A. Matricea A se scrie deci n raport cu un singur juctor i anume P1, primul juctor (numit i juctorul maximizant, din punct de vedere formal ambii juctori urmrind acelai scop). Cnd P1 ctig valoarea aij, P2 pltete lui P1 valoarea aij, i = 1, m , j = 1, n . Pentru P2 toate elementele matricei au semn contrar (fiind un joc cu sum nul). P2 se mai numete juctor minimizant. Vom nota jocul definit n condiiile de mai sus prin tripletul: G = (A, B, f).
Teoria jocurilor
Exemplu
n jocul numit aruncarea monedei, fiecare juctor alege liber stema (S) sau valoarea (V). Dac alegerile coincid, juctorul P1 primete de la P2 un euro. Dac alegerile difer, P2 primete de la P1 un euro. Atunci forma normal a jocului pentru P1 este: P2 (S) P1 (S) 1 (V) -1 (V) -1 1
Fie un joc G = (A, B, f), cu matricea A = (aij), i = 1, m , j = 1, n . Juctorii sunt considerai la fel de competeni. Ei ader la un principiu de comportare, nscut din raionalitate. Astfel, P1 va aciona aa nct cel mai mic ctig asigurat pe care l poate obine de la P2 s fie ct mai mare, iar P2 urmrete s fac pe ct posibil mai mic, cea mai mare valoare pe care ar trebui s o dea lui P1. Acest principiu poart numele de principiul minimax. Dac P1 va alege strategia Ai A, se ateapt ca P2 s aleag acea strategie Bj B care s ofere un ctig ct mai mic pentru P1. Fie acesta
i = min aij, i = 1, m .
1 j n
Dintre cele m strategii pure, P1 va alege acea strategie Ai care d cea mai mare valoare a lui i. Notnd:
= max i = max min aij
i i
j
j = max aij, j = 1, n .
1 i m
Dintre cele n strategii pure, P2 va alege acea strategie Bj care d cel mai mic ctig lui P1, adic cea care d cea mai mic valoare lui j. Notnd
= min j = min max aij
j j
B1 0 1 2
B2 B3 1 0 4 -2 3 -3
B4 2 2 3
A1 A2 A3
Dac P1 alege strategia A1 viznd ctigul a14 = 2, P2 poate alege strategia B3, obligndu-l pe P1 la un ctig a13 = -2 (adic o pierdere); cnd P1 alege A2, P2 poate rspunde cu B2 i P1 ctig a12 = 0, iar cnd P1 alege A3, P2 poate alege strategia B3 i P1 ctig atunci a31 = -3. S determinm valorile inferioar i superioar ale jocului. Calculnd i = min aij, i = 1,3 , obinem:
1 j 4
1 = min0,1,-2,2 = -2
Teoria jocurilor
2 = min1,0,3,2 = 0 3 = min2,4,-3,3 = -3
= 3.
De aici rezult c strategia maximin este A2, iar strategia minimax este B1.
Observaie: Calculele de mai sus pot fi simplificate prin organizarea
lor ntr-un tabel obinut din cel iniial, la care se adaug coloana elementelor
i i linia elementelor j, astfel:
B A
B1 0 1 2 2
B2 B3 1 0 4 4 -2 3 -3 3
B4 2 2 3 3
-2 0 -3 0 2
valoarea comun v se numete valoarea jocului. Elementul aij n care se realizeaz aceast egalitate se numete punct a, iar jocul respectiv se va
numi joc cu punct a. Strategiile Ai i Bj corespunztoare punctului a aij formeaz o pereche de strategii minimax i se vor numi strategii optime. Ele determin valoarea jocului care este egal cu elementul corespunztor punctului a.
Exemplu
B1 1 3 2 3 3
B2 6 3 1 4 6
B3 0 5 0 5 5
B4 3 6 9 7 9
A1 A2 A3 A4 j
0 3 0 3 =3 =3
Observm c = v G = 3 = v G = Elementul a21 = 3 va fi punctul a. Strategiile A2 i B1 sunt strategii optime, iar valoarea jocului este v = 3.
Observaii: 1) i elementul a41 = 3 este punct a, deci i strategiile A4 i B1 sunt
optime, iar valoarea jocului este tot v = 3. Deci punctul a nu este unic.
2) Abaterea de la strategia optim poate duce la micorarea
ctigului lui P1. De exemplu, dac P1 alege A3 i P2 i rspunde cu B3, ctigul su este a33 = 0, deci scade (tentaia fiind aceea de a obine ctigul maxim, egal cu 9).
3) Elementul a21 = 3 este cel mai mic de pe linia i cel mai mare de
Teoria jocurilor
Exemplu
B1 4 3 1 2
B2 -1 -2 2 -6
B3 2 0 0 3
B4 1 -1 -1 1
B5 3 2 -2 0
A1 A2 A3 A4
Observm c strategia A1 are toate ctigurile respectiv mai mari ca ale strategiei A2. Juctorul P1 care dorete un ctig ct mai mare nu va alege A2, pentru c poate ctiga mai mult prin A1 oricare ar fi strategia aleas de P2. Spunem c strategia A1 domin strategia A2, care este dominat. A2 poate fi eliminat din joc. Pentru juctorul P2, strategia B4 domin strategiile B1 i B3, acestea din urm conducnd la pierderi mai mari pentru P2 dect B4. Deci se poate renuna la B1 i B3 i matricea A se reduce la:
3 1 1 A = 2 1 2 . 6 1 0
n concluzie, o strategie pur domin o alt strategie pur dac duce la ctiguri mai bune dect aceasta din urm. Un juctor nu trebuie s foloseasc niciodat strategii dominate, acestea fiindu-i nefavorabile. Din matricea A se elimin liniile care au toate elementele respectiv mai mici sau egale cu ale altei linii i coloanele ce au toate elementele respectiv mai mari sau egale dect ale altei coloane. Acest principiu poart numele de
principiul dominrii strategiilor. Aplicarea lui conduce la reducerea
eliminarea strategiilor dominate conduce la un joc care are aceeai valoare ca i jocul iniial. S observm c jocul redus, rezultat prin eliminarea strategiilor dominate nu are punct a, deci nici cel iniial.
n jocurile fr punct a, un juctor i poate majora ctigul folosind alt strategie dect cea minimax dac este informat asupra comportrii adversarului. Informaii asupra comportamentului adversarului se pot obine prin repetarea partidelor, dac acesta i menine n toate partidele strategia minimax. Un juctor nu trebuie s foloseasc mereu aceeai strategie i nici s foloseasc strategiile dup o regul ce poate fi descoperit de adversar. Va fi necesar alternarea strategiilor pure, cu anumite probabiliti. n cele ce urmeaz vom vedea c, n cazul unui joc matriceal fr punct a, valoarea jocului o vom determina folosind un alt joc matriceal asociat primului, numit joc mediat, notat = (X, Y, ), unde: a) X = x x = (x1, ..., xm), xi 0, i = 1, m ,
x
i =1
= 1, cu
xi = P(Ai), i = 1, m reprezentnd probabilitatea de alegere a strategiei Ai, iar X este mulimea strategiilor mixte pentru P1; b) Y = y y = (y1, ..., yn), yj 0, j = 1, n ,
y
j =1
= 1 unde
yj = P(Bj), j = 1, n , este probabilitatea de alegere a strategiei Bj, iar Y mulimea strategiilor mixte pentru P2;
Teoria jocurilor
c) : X Y , cu:
(x, y) =
a x y
i =1 j =1 ij i
x = (x1, ..., xm), iar P2 folosete strategia mixt y = (y1, ..., yn). Dac introducem variabila aleatoare:
a1j (x, j): x 1 a 2 j L a mj , valoarea medie a acesteia o notm: x2 L xm
ij
(x, j) =
a
i =1
xi
folosete strategia mixt x = (x1, ..., xm), iar P2 folosete strategia pur Bj. Analog, variabila aleatoare:
a i1 (i, y): y 1 a i 2 L a in va avea valoarea medie: y2 L yn
n ij j
(i, y) =
a y
j =1
folosete strategia Ai iar P2 folosete strategia mixt y = (y1, ..., yn). Atunci, putem scrie c:
(x, y) =
m n m n
c (x, y) semnific valoarea medie a jocului, care se mai scrie matriceal astfel: (x, y) = xAyT. Pentru jocul mediat = (X, Y, ), vom defini valoarea inferioar v i valoarea superioar v prin expresiile: v = max min (x, y)
xX yY
Prezentm acum, cu sau fr demonstraie, cteva rezultate din teoria funciilor de mai multe variabile reale ce vor fundamenta principiile matematice ale jocurilor matriceale.
Teorema 1
Fie X, Y dou subspaii ale unor spaii liniare i f: X Y . Dac exist mrimile: max min f(x, y) i min max f(x, y), atunci
xX yY yY xX
(1)
Demonstraie:
Din definiia extremelor, avem: g(x) f(x, y), () y Y i ()x X Atunci: max g(x) max f(x, y) = h(y), () y Y, i deci:
xX xX
Demonstraie:
Existena celor dou valori, v G i v G rezult din faptul c f are o mulime finit de valori. i dac n teorema 1 X = A, Y = B i f (Ai, Bj) = aij pentru orice Ai A i Bj B, atunci relaia (1) devine v G v G .
Teoria jocurilor
Teorema 2
n ipotezele teoremei 1, o condiie necesar i suficient ca max min f(x, y) = min max f(x, y).
xX yY yY xX
(2)
este s existe x0 X i y0 Y i un numr w astfel nct: f(x, y0) w f(x0, y), pentru orice x X i y Y. (3)
Demonstraie: Necesitatea: Presupunem relaia (2) adevrat. Fie x0 X punctul
xX
yY
nct relaia (3) s fie adevrat. Din f(x0, y) w, () y Y, rezult c i min f(x0, y) w.
yY
xX
xX
Aceast relaie, mpreun cu relaia (1), implic w = max min f(x,y) = min max f(x,y), fapt ce ncheie demonstraia.
xX
yY yY
xX
Se aplic teorema 2, n care X = A, Y = B, fG(Ai, Bj) = aij, i = 1, m , j = 1, n , lund w = fG(Aio, Bj0). Condiia necesar i suficient de existen a punctului a este s existe perechea de strategii pure Aio, Bjo astfel nct: aiojo = max min aij = min max aij
i j j i
adic elementul aiojo este cel mai mic din linia i0 i n acelai timp cel mai mare din coloana j0. Strategiile A i 0 i B j0 corespunztoare punctului a sunt strategii optime.
Teoria jocurilor
Fie un joc G = (A, B, f) de dou persoane, caracterizat de matricea jocului A = (aij), i = 1, m , j = 1, n i fie = (X, Y, ) jocul mediat corespunztor. Atunci exist expresiile: v = max min (x, y) i v = min max (x, y) i v = v .
xX yY yY xX
Demonstraie:
a x y
i =1 j =1 ij i n
marginile pe X. Deci exist max (x, y) pentru orice y Y, iar aceast funcie este
xX
liniar n y Y, deci este i continu. Cum Y este o parte nchis a lui n, rezult c exist max min (x, y).
xX yY
xX
(4)
adic v v .
Dac A = (aij), i = 1, m , j = 1, n i x = (x1, ..., xm), y = (y1, ..., yn) ndeplinesc condiiile: xi 0,
x
i =1
= 1, yj 0,
y
j=1
asemenea vectori x, y pentru care numai una din urmtoarele situaii este adevrat: i) ii)
m
a x
i =1 n
ij i
0, j = 1, n ;
a
j=1
ij
y j 0, i = 1, m .
Aplicnd aceast lem pentru matricea jocului A, dac are loc prima situaie (i), nseamn c exist x = (x1, ..., xm) astfel nct a1jx1 +...+amjxm 0, () j = 1, n , de unde: (x, y) =
(a
j=1
1j
x 1 + ... + a mj x m ) y j 0, () y Y, deci
yY
xX
Dac situaia (ii) din lem este adevrat, exist y = (y1, ..., yn) Y astfel nct ai1y1 + ... + ainyn 0, i = 1, m , de unde: (x, y) =
(a
i =1
i1 1
y + ... + a in y n ) x i 0, () x X, deci i
yY
Teoria jocurilor
Cum numai una dintre cele dou situaii din lem are loc, niciodat nu se va verifica relaia max min (x, y) < 0 < min max (x, y)
xX yY yY xX
(5)
Fie Gk = (A, B, fk) avnd matricea Ak = (aij k); i = 1, m , j = 1, n , k i jocul mediat corespunztor k = (X, Y, k), k fiind ctigul mediu n jocul mediat cu matricea Ak, adic: k(x, y) = Cum
m n m n m n
(a ij k )x i y j = a ijx i y j k x i y j .
i =1 j=1 i =1 j=1 i =1 j=1 i j
x y
i j
= 1, obinem: (6)
k(x, y) = (x, y) k max min k(x, y) < 0 < min max k(x, y)
xX
yY yY
sau innd seama de (6) nu poate avea loc relaia max min (x, y) k < 0 < min max (x, y) k
xX yY yY xX
care se mai scrie: max min (x, y) < k < min max (x, y), () k .
xX yY yY xX
xX
A = (aij), i = 1, m , j = 1, n fr punct a este dat de valoarea v = v = v a jocului mediat = (X, Y, ) asociat lui.
soluie. n mulimea strategiilor X i Y exist cel puin o pereche de strategii mixte x0, y0 pentru care: (x0, y0) = max min (x, y) = min max (x, y).
xX yY yY xX
Teorema 4 [6]
Asupra matricei A = (aij) a unui joc se pot efectua urmtoarele operaii: a) dac se permut liniile (coloanele) ntre ele, valoarea jocului nu se schimb i nici probabilitile de folosire a strategiilor de ctre juctorul P1 (respectiv P2); b) dac la fiecare element aij din matricea A a unui joc matriceal de valoare v se adaug acelai numr real k, atunci strategiile mixte optime rmn neschimbate, iar valoarea jocului devine v = v + k; c) dac toate elementele matricei A dintr-un joc matriceal de valoare v se nmulesc cu acelai numr k > 0, atunci strategiile mixte optime rmn neschimbate, iar valoarea jocului devine v = kv.
2.3 Rezolvarea jocurilor matriceale Teorema 3 (teorema minimax) asigur existena strategiilor optime
Teoria jocurilor
pot fi calculate aceste strategii. n cele ce urmeaz, vom prezenta cteva metode pentru soluia unor jocuri matriceale.
2.3.a Jocuri 2 2
Dac jocul are punct a, rezolvarea sa e banal. Presupunem c jocul nu are punct a. Atunci strategiile optime x = (x1, x2) i y = (y1, y2) vor avea toate componentele pozitive. Valoarea jocului v este: v = (x, y) = a11x1y1 + a12x1y2 + a21x2y1 + a22x2y2 i se mai scrie: x1(a11y1 + a12y2) + x2(a21y1 + a22y2) = v (7) Cum y este strategie optim, fiecare expresie din paranteze este cel mult egal cu v. Dac presupunem c una e strict mai mic dect v, de exemplu: a11y1 + a12y2 < v a21y1 + a22y2 v cum x1 > 0 i x1 + x2 = 1 ar rezulta c membrul stng din (7) este mai mic ca v. Deci va trebui ca: a11y1 + a12y2 = v a21y1 + a22y2 = v. Raionnd analog se obine: a11x1 + a21x2 = v a12x1 + a22x2 = v.
Sau matriceal:
v AyT = v i xA = (v, v). formulele de calcul pentru x, y i v. Dac A este nesingular, din (8) avem: xA = vJ i x = vJA-1. Dar x1 + x = 1 este echivalent cu xJT = 1. n (8), nmulind cu JT, avem: vJA-1JT = xJT = 1 de unde: v=
1 JA 1J T .
(8)
(8)
Prima relaie din (8) se mai scrie: AyT = vJT, de unde: yT = A-1(vJT) =
A 1J T . JA 1J T
Dac A este singular (A-1 nu exist), echivalentele formulelor de mai sus vor fi ([16]): x= A * JT |A| JA * T = ; y ; v= , T T JA * J JA * J JA * J T (9)
unde A* este matricea adjunct a lui A, A determinantul lui A i J = (1,1). Aceste formule se verific i cnd A este inversabil.
Teoria jocurilor
Exemplu
Rezolvare
3 1 Jocul nu are punct a. Matricea A* = 0 2 , A = 6, 3 1 T JA* = (1,1) 0 2 = (3, 1); A*J = 2 JA*JT = (1, 1) 2 = 4. 3 1 1 2 = 0 2 ; 1 2
matriceal a jocurilor, n care dac notm matricea ctigurilor cu C = (cij), i = 1, m , j = 1, n , pentru jocul = (X, Y, f), soluia i valoarea jocului se determin ([9], [21]) cu ajutorul formulelor: x= JrA * J r (A*)T |A| = , y , v= T * T JrA * Jr JrA Jr JrA * JT r (9)
n relaiile (9) avem: - A o matrice nesingular a lui C, de ordinul r, 2 r min(m, n); - A este determinantul matricei A; - Jr = (1, ..., 1), matrice de ordinul 1 r;
Determinarea soluiei se face astfel: a) se caut toate submatricele nesingulare A, pornind de la r = min(m,n); b) se rezolv jocurile corespunztoare matricelor de la a), care admit numai strategii pozitive; c) n
corespunztoare liniilor i coloanelor din C care nu intr n A, obinnd strategiile x0 i y0; d) se verific condiiile corespunztoare relaiilor (8), date de criteriul Neumann i anume x0A = vJ i AyT = vJT. Dac aceste relaii sunt ndeplinite x0 i y0 sunt strategii optime ale jocului , iar v este valoarea jocului.
2.3.b Jocuri 2 n i m 2
n acest caz presupunem c cel puin un juctor posed numai dou strategii pure. Fie P1 juctorul ce are numai dou strategii pure, adic analizm cazul 2 n. Jocurile m 2 se trateaz ntr-un mod similar. Dac matricea jocului este:
a 11 ...a 1n A= a ...a 21 2 n
i x = (x1, x2) e strategia juctorului P1, atunci acesta urmrete s maximizeze funcia v(x) valoarea jocului.
Teoria jocurilor
a1nx1 + a2nx2 v x1 + x2 = 1 x1, x2 0 i poate fi adus la forma matematic a unui model de programare liniar avnd necunoscutele x1, x2 i v, astfel: [max]f = v a11x1 + a21x2 v 0
2 4 4 A= 8 6 16 .
Rezolvare
Strategiile lui P1 verific sistemul: -2x1 + 8x2 v 4x1 6x2 v -4x1 + 16x2 v x1 +x2 = 1 x1, x2 0, v oarecare.
Forma
matematic
modelului
de
programare
liniar
necunoscutele x1, x2 i v va fi: [max]f = v -2x1 + 8x2 v 0 4x1 6x2 v 0 -4x1 + 16x2 v 0 x1 +x2 = 1 x1, x2 0, v oarecare. Cum x1 = 1 x2, x1, x2 [0,1], modelul de mai sus devine: [max]f = v 10x2 v 2 10x2 + v 4 20x2 v 4 x2 [0,1], v oarecare. Rezolvm grafic aceast problem i obinem:
v v = -4+20x2 4 2 1 0 -1 -2 -4 v = 4-10x2 v = -2+10x2
M(0,3; 1) 1 x2
Teoria jocurilor
Regiunea haurat conine mulimea punctelor ce satisfac restriciile modelului de programare liniar. Punctul M aflat la intersecia dreptelor generate de restriciile 1 i 2 (deci corespunztoare coloanelor 1 i 2 din A) are abcisa x2 = 0, 3 i ordonata v = 1. Atunci strategia lui P1 este x = (x1, x2), unde x2 = 0, 3 i x1 = 1 x2 = 0,7 i valoarea jocului este v = 1.
Observaie: Aceste valori pot fi obinute cu formulele (9) pentru
10 10 = - 20.
Fie jocul G = (A, B, f) cu matricea A = (aij), i = 1, m , j = 1, n de valoare v, avnd jocul mediat corespunztor = (X, Y, ).
Dac juctorul P1 folosete strategiile Ai, cu probabilitile xi, i = 1, m , poate spera la un ctig egal cel puin cu valoarea v a jocului, pentru orice strategie Bj, j = 1, n , a lui P2. Putem scrie sistemul de inecuaii: a11x1 + ... + am1xm v a12x1 + ... + am2xm v (I)
Dac juctorul P2 folosete strategiile Bj cu probabilitile yj, j = 1, n , el se ateapt la o pierdere cel mult egal cu valoarea v a jocului i putem scrie sistemul de inecuaii: a11y1 + ... + a1nyn v a21y1 + ... + a2nyn v (II)
am1y1 + ... + amnyn v y1 + ... + yn = 1 yj 0; j = 1, n . Sistemul (I) corespunde condiiei (x, j) v, j = 1, n , iar sistemul (II) corespunde condiiei (i, y) v pe care trebuie s le verifice strategiile x = (x1, ..., xm) i y = (y1, ..., yn) pentru a fi optime.
Teoria jocurilor
Pentru a transforma cele dou sisteme n modele de programare liniar este necesar ca valoarea v a jocului s fie pozitiv. Deci vom presupune v > 0 (n caz contrar se face modificarea matricei A n A = ( a ij )
cu a ij = aij + k > 0, ()i = 1, m , j = 1, n i k > 0. Notm Xi = yj xi , i = 1, m , Yj = , j = 1, n . v v
1 v 1 v 1 , el i propune s obin v
Y1 + ...+ Yn =
Deoarece juctorul P1 urmrete obinerea celei mai mari valori a ctigului v, deci a celei mai mici valori a lui minf = X1 + ... + Xm. Juctorul P2 urmrete obinerea celei mai mici pierderi v, adic cea mai mare valoare a lui
Astfel sistemele (I) i (II) corespunztoare celor doi juctori se pot scrie ca un cuplu de probleme duale de programare liniar i anume: [min]f = 1 = X1 + ...+ Xm v
[max]g =
1 = Y1 + ...+ Yn v
am1Y1 + ... + amnYn 1 Yj 0, j = 1, n Prin rezolvarea uneia dintre cele dou duale se obin strategiile mixte optime ale ambilor juctori precum i valoarea jocului v: v= 1 1 = . [min]f [max]g
Este de preferat rezolvarea lui II deoarece implic un volum mai mic de calcule.
Exemplu
O firm A dorete s lanseze pe pia un anumit tip de produs n trei sortimente A1, A2, A3. Concurenta ei, firma B, prezint produsul n sortimentele B1, B2, B3. Se cunoate, din sondajele fcute c dac cumprtorii trebuie s aleag ntre sortimentul Ai, i = 1,3 i Bj, j = 1,3 , ei prefer fie produsele firmei A (situaie notat cu 1), fie pe cele ale firmei B (situaie notat cu -1), fie sunt indifereni (situaie notat cu 0), conform tabelului urmtor: Bj Ai A1 A2 A3 B1 B2 1 -1 0 -1 1 1 B3 0 -1 1
Teoria jocurilor
Rezolvare
Fie x1, x2, x3 probabilitile corespunztoare celor 3 strategii pure ale firmei A i y1, y2, y3 probabilitile corespunztoare strategiilor firmei B. Determinm valoarea inferioar i valoarea superioar a jocului. y x x1 x2 x3
j
y1 1 -1 0 1
y2 -1 1 1 1
y3 0 -1 1 1
-1 -1 0 0 1
= max i = 0 este valoarea inferioar a jocului i = min j = 1 este valoarea superioar a jocului.
Deci jocul nu are punct a, iar valoarea v a jocului are proprietatea c 0 v 1. Modelele duale de programare liniar vor fi: x1 + x2 + x3 =1 x1 x2 (I) -x2 + x3 v xi 0, i = 1,3
v
-x1 + x2 + x3 v
sau cu notaiile Xi =
xi 1 , i = 1,3 i [min]f = v v
[min]f =
1 = X1 + X2 + X3 v
-y1 + y2 - y3 v
Cu notaiile Yj = [max]g =
yj v
, j = 1,3 i [max]g =
1 , avem: v
1 = Y1 + Y2 + Y3 v
Se rezolv prin algoritmul simplex al doilea model, aducnd problema la forma standard.
Teoria jocurilor
1 = Y1 + Y2 + Y3 + 0(Y4 + Y5 + Y6) v
YB 1 1 1 0 1 2 1 1 2 2 1 3 1 a1 1 -1 0 0 1 1 0 0 1 0 1 0 0 1 0 1 a2 -1 1 1 0 1 -1 0 1 -1 2 0 0 1 1 0 1 a3 0 -1 1 0 1 0 -1 1 0 1 1 -1 1 2 -1 0 a4 1 0 0 0 0 1 1 0 1 -1 1 1 0 1 -1 0 a5 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 a6 0 0 1 0 0 0 0 1 0 0 1 0 1 2 -2 1 -
[max]g = 3 = [min]f Y1 = 2, Y2 = 1, Y3 = 0 X1 = 1, X2 = 0, X3 = 2 Atunci v = y1 = vY1 = x1 = vX1 = 1 1 = . [max]g 3 2 1 1 1 1 2 = , y2 = vY2 = 1 = , y3 = vY3 = 0 = 0 3 3 3 3 3 2 1 1 1 1 1 = , x2 = vX2 = 0 = 0, x3 = vX3 = 2 = . 3 3 3 3 3
2 1 x = ( , 0, ), adic va trebui s produc 33, 33% produse din 3 3 primul sortiment iar restul 66,66% din al treilea sortiment. Acest plan de producie i asigur firmei A un ctig, fr nici un risc, de concurenta ei, firma B, va avea o pierdere de 1 . 3 1 n vreme ce 3
a jocului: - dac = , jocul are punct a, se determin strategiile pure i valoarea jocului; - dac < , jocul nu are punct a; vor trebui determinate strategiile mixte optime i valoarea jocului.
Pasul 2. Se elimin strategiile dominate. Pasul 3. Ne asigurm ca valoarea v a jocului s fie un numr pozitiv,
tiind c v [, ].
Pasul 4. Scriem modelul de programare liniar pentru juctorul P2 i
rezolvm prin algoritmul simplex problema din care citim [max]g, Y1,...,Yn i X1, ..., Xm.
Pasul 5. Determinm: v =
pasul 3 putem alege i alte metode n afara algoritmului simplex, cum ar fi cele prezentate la 2.3.a i 2.3.b.
Teoria jocurilor
Pn acum ne-am ocupat de jocuri n care alegerea strategiilor era determinat de matricea A a ctigurilor primului juctor P1. Sunt situaii n care riscurile cu care se iau hotrri nu pot fi cunoscute, deoarece juctorul P2 nu acioneaz raional. Un astfel de juctor poate fi considerat natura, de unde i denumirea de jocuri contra naturii. De analiza unor astfel de situaii se ocup teoria deciziilor. n cele ce urmeaz vom prezenta unele criterii de alegere a deciziei juctorului P1 (numit i statistician) n jocurile contra naturii (numite i jocuri n caz de incertitudine). Menionm c atitudinea fa de joc, diferit de la o persoan la alta, face ca n teoria deciziilor s nu existe criterii universal valabile. Aplicarea criteriilor poate conduce la rezultate diferite. Alegerea strategiei ar putea fi dat de rezultatul aplicrii mai multor criterii. Vom presupune c statisticianul juctorul P1, dispune de m strategii pure A1, ..., Am, iar natura are n stri B1, ..., Bn. Fie matricea A = (aij), i = 1, m , j = 1, n , unde aij este ctigul lui P1 cnd alege strategia Ai, iar natura se afl n starea Bj.
Criteriul lui Hurwicz (criteriul optimismului)
Optimismul juctorului P1 se definete ca un numr [0,1]. Se determin numerele reale: mi = min aij i Mi = max aij, i = 1, m .
j j
n folosirea acestui criteriu trebuie s se defineasc n prealabil optimismul juctorului, adic numrul [0, 1].
Exemplu
Se consider jocul contra naturii a crui matrice a ctigurilor lui P1 n orice strategie a sa Ai, i = 1,4 i n orice stare Bj, j = 1,4 a naturii este: B1 2 3 1 3 B2 4 2 5 3 B3 3 3 2 2 B4 3 2 1 3
A1 A2 A3 A4
S se determine n funcie de strategia optim a lui P1. Pentru = 2 care este strategia optim? 3
Rezolvare
Atam
matricei
date
coloanele
elementelor:
mi,
Mi
Mi + (1 - )mi, unde mi este respectiv cel mai mic, iar Mi este cel mai mare
A1 A2 A3 A4
Teoria jocurilor
corespunde strategiei A1, aceasta este strategia optim. 1 1 Pentru [ , ), tot 2 + 2 este valoarea maxim deci A1 e 3 2 strategie optim. 1 Pentru [ , 1], 4 + 1 e valoarea maxim i A3 este strategia 2 optim. n particular = 2 1 [ , 1], deci A3 este strategia optim. 3 2
n cazul acestui criteriu se va presupune c strile naturii sunt egal probabile. i cum numrul lor este n, probabilitatea ca natura s se afle n starea Bj este 1 , () j = 1, n . n
a
j=1
ij
discrete cu repartiia:
a i1 a i 2 L a in 1 1 . 1 L n n n
Observaia 1:
Dac se cunosc totui probabilitile diferitelor stri ale naturii respectiv y1, ..., yn, deci strategia y = (y1, ..., yn) cu yj 0, j = 1, n i
y
j=1
a y
j =1 ij
corespunztoare valorii:
1 i m
Observaia 2:
Criteriul lui Laplace introduce toate neajunsurile valorii medii. Dac estimrile au fost fcute grosolan apar erori n apreciere, ce vor duce la decizii greite. Criteriul devine uneori inacceptabil cnd elementele jocului sunt foarte dispersate.
Teoria jocurilor
Exemplu
Pentru jocul din exemplul precedent s se determine strategia optim a lui P1 n cazurile: a) cnd strile naturii sunt egal probabile; b) cnd probabilitile ca natura s se afle n strile ei sunt respectiv: 1 2 4 2 , , , . 9 9 9 9
Rezolvare a) Atam matricei jocului coloana
1 4 a ij : n j=1 B4 3 2 1 3
1 4 a ij n j=1 1 12 4 1 10 4 1 9 4 1 11 4
B1 A1 2 A2 3 A3 1 A4 3
B2 4 2 5 3
B3 3 3 2 2
Deci max
1i 4
1 2 4 2 1 2 + 4 + 3 + 3 = 28; 9 9 9 9 9
Savage compar rezultatul deciziei n cazul necunoaterii strii naturii cu cel care s-ar obine dac s-ar cunoate aceast stare. Diferena dintre ctigul realizat cnd se ia decizia fr a cunoate strile naturii i cel realizat dac se cunosc acestea reprezint regretul sau ce s-ar fi ctigat dac P1 ar fi cunoscut strile naturii. Pornind de la matricea A = (aij), i = 1, m , j = 1, n , se formeaz o nou matrice R = (rij), numit matricea regretelor, unde elementul: rij = max akj aij, i = 1, m , j = 1, n , adic rij este dat de diferena
1 k m
dintre cel mai mare element de pe coloana j i elementul aij. Se obine astfel un nou joc caracterizat de matricea R care va fi tratat dup criteriul minimax. P1 va alege strategia pe linia creia se obine:
1 i m
min max rij, adic linia pe care cel mai mare regret este minim.
1 j n
Exemplu
Pentru acelai joc din ultimele dou exemple, aplicnd criteriul regretelor, s se determine strategia ce va fi aleas de P1.
Teoria jocurilor
Rezolvare
Se determin mai nti matricea regretelor ale crei elemente de pe o coloan se obin scznd din cel mai mare element al coloanei fiecare element al acesteia. Se obine: B1 A1 A2 A3 A4 1 0 2 0 B2 1 3 0 2 B3 0 0 1 1 B4 0 1 2 0
max rij
j
1 3 2 2
Dac jocul are punct a, statisticianul P1 alege strategia Ai determinat de condiia: max ( min aij).
i
j
Dac jocul nu are punct a, se determin strategia mixt x = (x1, ..., xm) pentru care:
m min a ij x i , este maxim. j i =1
Exemplu
Aplicarea criteriului lui Wald jocului cercetat i cu celelalte criterii ne duce la concluzia c jocul nu are punct a. Procednd ca n paragraful 2.3.c, se determin strategia mixt a statisticianului i se gsete vectorul: x = (1/3, 1/3, 0, 1/3),
de unde rezult c P1 poate alege oricare dintre strategiile sale A1, A2 sau A 4.
Observaie: Criteriile aplicate nu au dus mereu la aceeai decizie dar
n majoritatea cazurilor s-a obinut c cea mai bun strategie este A1; statisticianul pe aceasta o va alege.
Aplicaie
Patronul unui magazin achiziioneaz un numr de frigidere de un anumit tip pe o perioad de 6 luni (primvar var), pentru a le vinde. Din observaiile statistice, bazate pe cererea din ultimii doi ani, el estimeaz c va vinde un numr de frigidere cuprins ntre: 15 i 25 cu probabilitatea de 0,1; ntre 25 i 35 cu probabilitatea de 0,4; ntre 35 i 45 cu 0,3 i ntre 45 i 55 cu 0,2. Costul unitar de achiziie este de 300 euro iar preul unitar de vnzare este 400 euro (incluznd cheltuielile de transport i garania de funcionare pe un an). Toate frigiderele nevndute pn n toamn se restituie furnizorului pentru 250 euro/bucata. S se stabileasc numrul optim de frigidere pe care s le achiziioneze patronul pentru a obine un ctig ct mai mare.
Rezolvare
Determinm matricea A = (aij), i, j = 1,4 , unde aij este ctigul obinut de patron cnd aplic strategia Ai, i = 1,4 i cererea este n starea Sj, j = 1,4 . Obinem astfel:
Cererea pieei Cantitatea achiziionat
S2:30 S3:40 S4:50 2000 3000 2500 2000 2000 3000 4000 3500 2000 3000 4000 5000
Teoria jocurilor
unde de exemplu elementul de pe linia A3 i coloana S2 se calculeaz astfel: din cele 40 frigidere achiziionate se vnd 30. Diferena dintre preul unitar de vnzare i cel de achiziionare este de 100 euro pentru un frigider, ce reprezint ctigul patronului. Pentru cele 30 frigidere vndute va ctiga 3000 euro. Dar alte 10 frigidere nevndute vor fi restituite furnizorului cu o pierdere unitar de 50 euro dat de diferena dintre costul de achiziie 300 i cel de restituire 250. Deci pierderea va fi de 500 euro i atunci beneficiul total va fi de: 3000 500 = = 2500 euro. Deoarece n stabilirea deciziei conteaz consecinele economice se pot aplica n rezolvarea problemei criteriile: maximin, minimax, Savage, Bayes-Laplace:
a) Prin criteriul maximin se alege minimul fiecrei linii i dintre
acestea se gsete maximul: A1 A2 A3 2000 1500 1000 care este 2000 i recomand strategia A1.
b) Criteriul minimax, bazat pe pruden, indic alegerea elementelor
A4 500
maxime pe fiecare linie i apoi determinarea celui mai mic dintre acestea. A1 A2 A3 2000 3000 4000 A4 5000
Acest element este 2000 i arat c cea mai prudent decizie este A1.
c) Criteriul lui Savage este de fapt criteriul minimax aplicat pe
matricea regretelor, ce va avea forma: 500 2000 3000 0 0 1000 2000 500 R= 1000 500 0 1000 1500 1000 500 0
pentru care vom cuta maximul pe fiecare linie i apoi cel mai mic dintre acestea. Gsim: A1 A2 A3 3000 2000 1000 A4 1500
pentru fiecare strategie folosind probabilitile date n enunul problemei i formulele din paragraful 2.2. Astfel:
(1,y) = 0,12000 + 0,42000 + 0,32000 + 0,22000 = 2000 (2,y) = 0,11500 + 0,43000 + 0,33000 + 0,23000 = 2850 (3,y) = 0,11000 + 0,42500 + 0,34000 + 0,24000 = 3100 (4,y) = 0,1500 + 0,42000 + 0,33500 + 0,25000 = 2900
Jocurile de dou persoane cu sum oarecare extind n mod natural jocurile cu sum nul de care ne-am ocupat pn acum. Ele produc i o schimbare calitativ important, n sensul c, dac regulile jocului o permit, juctorii pot cuta mpreun ci (strategii) de mbuntire a ctigurilor lor, ceea ce, n cazul jocurilor antagoniste, era exclus din punct de vedere logic. Obiectul teoriei jocurilor fiind dat de analiza situaiilor de tip competiional, regulile care reglementeaz concurena vor sta la baza dezvoltrilor ulterioare.
Teoria jocurilor
colaborarea ntre juctori i apoi jocurile de tip cooperativ, n care juctorii i pot corela strategiile i/sau pot apela la transferul mutual al unor pri din ctiguri. i ntr-un caz i n cellalt, preocuparea principal va fi de a defini un concept de soluie a jocului, de a cerceta condiii de existen i a identifica metode de determinare a acesteia. Ca o trstur care distinge jocurile cu sum arbitrar de cele cu sum nul se evideniaz interdependena strategiilor componente ale unei soluii a jocului.
Vom nota, ca i mai nainte, cei doi juctori cu P1 i P2 i vom presupune c strategiile lor (pure) sunt n numr finit:
A = A1, ..., Am reprezint mulimea strategiilor lui P1, iar B = B1, ..., Bn, mulimea strategiilor lui P2. Definiie: Se numete joc de dou persoane cu sum arbitrar dat n
form normal, un sistem G = A, B; f1, f2, unde A i B conin strategiile celor doi juctori iar fi(,), i = 1,2 sunt funcii definite pe A B cu valori reale, numite funcii de ctig, corespunztoare fiecruia dintre acetia. Pentru o pereche de strategii (Ai, Bj) vom nota f1(Ai, Bj) = aij i f2(Ai, Bj) = bij, i = 1, m , j = 1, n . n vederea unei scrieri compacte a
elementelor care definesc un joc de acest tip, apelm la o reprezentare matriceal ca cea de mai jos: P1 A1
Ai Am
P2
B1
...
Bj . . (aij, bij) . .
...
Bn
Deoarece elementele tabloului de mai sus sunt perechi de numere reale care ar putea proveni din suprapunerea a dou matrici de dimensiuni m n coninnd ctigurile celor doi juctori, luai separat, asemenea jocuri se mai numesc pe scurt jocuri bimatriceale. S remarcm faptul c asupra valorilor sumelor f1(Ai, Bj) + f2(Ai,Bj), i = 1, m , j = 1, n nu se impune nici o condiie. Considerm, spre exemplificare, urmtorul joc: G = A, B; f1, f2; A = A1, A2, B = B1, B2; f1(A1, B1) = 3, f1(A2, B1) = 1, f1(A1, B2) = 1, f1(A2, B2) = 0; f2(A1, B1) = 0, f2(A2, B1) = 4, f2(A1, B2) = 2, f2(A2, B2) = 1. Vom analiza jocul folosind forma sa matriceal. A1 A2 B1 (3,0) (1,4) B2 (1,2) (0,1)
Se observ c pentru juctorul P1 este preferabil s joace strategia A1 n raport cu A2, indiferent ce strategie adopt P2 (B1 sau B2), deoarece avem f1(A1, ) f1(A2, ) (ntr-adevr, 3 > 1 i 1 > 0). Recunoatem aici existena unei strategii dominate a juctorului 1, n spe A2.
Teoria jocurilor
Referitor la strategiile lui P2, s observm c nici una dintre ele nu o domin pe cealalt (0 < 2, dar 4 > 1). Obiectivul nostru fiind acela de a prevedea desfurarea jocului, prin precizarea strategiilor pe care juctorii, cel mai probabil, le vor folosi (n scopul raional al maximizrii ctigului), vom reduce matricea jocului renunnd la linia corespunztoare strategiei dominate (pe care ar fi iraional s o adopte P1). A1 B1 (3,0) B2 (1,2)
Este evident acum c juctorul P2 va alege strategia B2, care i asigur un ctig mai mare. n concluzie, perechea de strategii (A1, B2) se constituie ntr-o soluie a jocului, rezultat din confruntarea intereselor lui P1 i P2. Un efect, n acest caz, este acela c nici un juctor nu i realizeaz ctigul maxim admisibil (3, respectiv 4), fapt posibil din punct de vedere teoretic, n general. n exemplul precedent, raionamentul utilizat a urmrit identificarea unei convenii la care juctorii, n mod independent, sunt dispui s adere, concretizate printr-o soluie unic a jocului necooperativ. Aceasta conduce la ideea folosirii perechii de strategii (A1, B2) n mod liber, n mai multe partide (repetri ale jocului), de ctre juctori raionali care ateapt unul de la cellalt un astfel de comportament. Ideea cristalizrii unei convenii are, desigur, o latur ideal. Nu putem presupune c pentru un joc oarecare vom elimina pe rnd, strategiile (strict) dominate, rmnnd, n final, cu o singur pereche de strategii. Pe de alt parte, acest proces de eliminare poate s conduc la o mulime terminal de perechi de strategii, dintre care unele nu au calitile unei soluii.
n precizarea calitilor pe care trebuie s le aib o soluie a jocului, vom ine cont de faptul c tendina unilateral de ctig a unui juctor poate fi amendat de opiunile celuilalt, dar nu i anihilat. De aceea, apare natural cerina ca strategia unui juctor, care este o component a soluiei, s reprezinte cel mai bun rspuns la strategia aleas de cellat juctor, care completeaz soluia. O astfel de soluie poate fi numit strategic stabil, deoarece nici un juctor nu are interesul s se abat de la strategia sa, atta vreme ct nici ceilali nu ncearc acest lucru. Ideea de echilibru pe care trebuie s l realizeze strategiile care alctuiesc soluia jocului este acum transparent. Cele de mai nainte sunt redate n urmtoarea:
Definiie. ntr-un joc bimatriceal dat n form normal
f1(A*, B*) f1(Ai, B*), oricare ar fi Ai A i f2(A*, B*) f2(A*, Bj), oricare ar fi Bj B Altfel spus, maxf1(Ai, B*) este atins n A*, iar maxf2(A*, Bj) e atins
AiA BjB
n B*. Cum A* A i B* B, se obinuiete, pentru mai mult claritate, s se spun c (A*, B*) este punct de echilibru Nash n strategii pure.
Observaie: Noiunea de punct de echilibru Nash o generalizeaz pe
cea de punct a de la jocurile matriceale (cu sum nul). ntr-adevr, condiiile: f(Ai, Bjo) f(Aio, Bjo) f(Aio, Bj) () Ai A, () Bj B, care definesc punctul a aiojo = f(Aio, Bjo) se mai pot scrie: f(Aio, Bjo) f(Ai, Bjo), ()Ai A, -f(Aio, Bjo) -f(Aio, Bj), ()Bj B.
Teoria jocurilor
De aceea, unii folosesc termenul de punct de echilibru n loc de punct a atunci cnd se refer la soluia unui joc matriceal G = (A, B, f). Definiia precedent se poate extinde, fr dificultate, la cazul a n juctori, ale cror funcii de ctig sunt funcii reale de n argumente.
Exemplu
Se consider jocul n form normal G, cruia i corespunde matricea: B1 A1 (4,0) A2 (0,1) A3 (2,4) B2 (2,1) (2,0) (1,3) B3 (0,4) (3,3) (1,2) B4 (1,1) (5,2) (0,2)
Determinarea punctelor de echilibru Nash ale jocului se va face n modul urmtor: pentru fiecare juctor i pentru fiecare strategie a acestuia, se determin rspunsul optim al celuilalt juctor la respectiva strategie. Pentru a-l marca, vom sublinia n acea linie / coloan ctigul maxim corespunztor. Astfel, observm c dac P1 ar folosi strategia A1, atunci P2 ar trebui s foloseasc strategia B3 i vom scrie atunci (0,4) n poziia din matrice corespunztoare perechii (A1, B3). Asemntor, pentru strategiile A2 i A3 ale lui P1, vom selecta rspunsurile B3, respectiv B1 i vom completa (3, 3), respectiv (2, 4) n locurile potrivite din tabel. n privina replicilor lui P1 la alegerile posibile ale lui P2, strategiei B1 i va corespunde A1 i vom scrie n prima coloan (4, 0) (deoarece 4 > 0 i 4 > 2). Pentru coloanele a doua, a treia i a patra, vom selecta strategiile de rspuns A1, A2 i A2, respectiv.
Se obine aadar, dup procedura de marcare, urmtorul tabel: B1 A1 (4,0) A2 (0,1) A3 (2,4) B2 (2,1) (2,0) (1,3) B3 (0,4) (3,3) (1,2) B4 (1,1) (5,2) (0,2)
innd seama de definiia dat anterior, deducem c punctele de echilibru corespund acelor perechi de ctiguri n care ambele componente apar subliniate (dac exist). n exemplul analizat, aceast situaie apare doar n cazul perechii de strategii (A2, B3), care va reprezenta deci soluia Nash a jocului. Vom clarifica n continuare legtura care exist ntre eliminarea strategiilor strict dominate i existena punctelor de echilibru Nash. Au loc urmtoarele rezultate:
Propoziia 4.1
Dat fiind jocul G = A, B; f1, f2, dac eliminarea succesiv a strategiilor dominate strict conduce la desfiinarea tuturor combinaiilor de
* strategii, cu excepia lui (S 1 , S* 2 ), atunci aceast pereche constituie unicul
punct de echilibru Nash al jocului. Vom justifica cele afirmate n propoziia 4.1, folosind reducerea la
* absurd. S presupunem c (S 1 , S* 2 ) este un punct de echilibru al jocului, dar * , a fost eliminat la un c una dintre strategiile componente, de exemplu S 1 * , sau B\S * moment dat (eventual precedat de alte strategii din A\S 1 2 ,
Teoria jocurilor
echilibru. Cu aceasta, demonstraia se ncheie. Mai departe ne preocup problema existenei punctelor de echilibru
multiple ale unui joc bimatriceal. Conform propoziiei 4.1, nu este posibil ca
strategiile componente ale unuia dintre ele s fie evitate n procesul de eliminare succesiv a strategiilor strict dominate, iar altele, cu aceeai proprietate, nu. De aici rezult c n propoziia 4.2 este suficient s artm
* , S* c (S 1 2 ) este punct de echilibru Nash. (Demonstraia, asemntoare cu
cea precedent, se sprijin pe ipoteza c mulimile de strategii ale ambilor juctori sunt finite). Ne vom servi n discuia noastr de exemplul jocului G = (A, B; f1, f2) cu matricea ctigurilor: B1 A1 (2,0) A2 (3,4) A3 (1,3) B2 (2,1) (1,2) (0,2) B3 (4,2) (2,3) (3,0)
Se poate observa uor c strategia A1 domin strict pe A3 i c B3 domin strict pe B2 dup eliminarea lui A3. Dup ce suprimm strategiile dominate, jocul are forma simplificat: A1 A2 B1 (2,0) (3,4) B3 (4,2) (2,3)
Urmnd procedura descris anterior, sau prin verificare direct, folosind definiia, se deduce c (A1, B3) i (A2, B1) sunt puncte de echilibru Nash ale jocului. Aceasta ne permite s remarcm faptul c, spre deosebire de jocurile cu sum nul, n jocurile bimatriceale, prin interschimbarea strategiilor corespondente ntre dou puncte de echilibru, perechile rezultate nu mai sunt puncte de echilibru, aa cum o demonstreaz (A1, B1) i (A2, B3). Problema principal ns este ce anume trebuie neles prin soluia unui astfel de joc. Examinnd ctigurile fiecrui juctor n parte, constatm c nu putem privilegia vreunul din punctele de echilibru, deoarece juctorul P1 prefer, firesc, pe (A1, B3), iar P2 prefer pe (A2, B1). Teoretic, putem conveni c soluia jocului este format din ambele puncte de echilibru. Practic ns este nevoie de o negociere (uneori dur) ntre cei doi juctori sau de un arbitraj pentru a stabili pentru ce strategii vor opta fiecare. anse mai mari de concretizare ar putea avea n acest caz varianta care d ctigurile (3, 4), dar elemente de ordin subiectiv nu trebuie ignorate. O situaie de incertitudine n alegerea strategiilor optime ca cea de fa, este un teren propice pentru a testa utilitatea strategiilor de tip maximin.
Teoria jocurilor
Astfel, n ce privete strategia maximin a lui P1 vom gsi: min2,2,4 = 2 A1; min3,1,2 = 1 A2; min1,0,3 = 0 A3, deci strategia cutat este A1. Analog, pentru P2 avem: min0,4,3 = 0 B1; min1,2,2 = 1 B2; min2,3,0 = 0 B3, de unde rezult c strategia maximin a lui P2 este B2. Dup cum se observ, ns, perechea de strategii maximin (A1, B2) nu este un punct de echilibru. Oricare dintre juctori prefer ctigul care i revine ca urmare a alegerii n comun a unuia din punctele de echilibru fa de ctigul minim asigurat (ntr-adevr (4, 2) > (2,1) i (3, 4) > (2, 1)). n fapt, are loc urmtorul rezultat general:
Propoziia 4.3
Orice punct de echilibru furnizeaz fiecrui juctor n parte, un ctig cel puin egal cu ctigul su maximin.
Demonstraie:
Presupunem c (A*, B*) este punct de echilibru al jocului, n notaiile de mai nainte. Atunci avem, pentru P1: f1(A*, B*) f1(Ai, B*) minf 1(Ai, Bj) pentru orice strategie Ai A. B B
j
Pentru juctorul P2, obinem folosind din nou definiia punctului de (Ai, Bj), () Bj B, deci echilibru: f2(A*,B*) f2(A*, Bj) minf A A 2
i
n concluzie, ntr-un joc cu sum arbitrar, strategiile maximin i pierd din importan.
Posibilitatea existenei mai multor puncte de echilibru Nash ntr-un joc bimatriceal, cu implicaiile sale n stabilirea soluiei jocului nu este, totui, lucrul care stnjenete cel mai mult. O problem fundamental care apare n acest context este faptul c exist jocuri cu sum arbitrar chiar dintre cele mai simple, care nu admit strategii pure de echilibru. S considerm urmtorul joc: B1 A1 (2,1) A2 (1,2) B2 (0,2) (3,0)
Se poate observa pe acest exemplu c nici o pereche de strategii (Ai, Bj) nu poate realiza echilibrul. Astfel, pentru (A1, B1) observm c juctorul P2 are interesul s devieze de la strategia B1 ctre B2, care i asigur un ctig superior. Analog, (A2, B1) nu poate fi punct de echilibru, pentru c juctorul P1 va prefera strategia A1 lui A2, .a.m.d.. Este greu de admis ideea c astfel de jocuri nu admit soluie, n sensul echilibrului de tip Nash. Cheia de rezolvare st i aici, ca i n cazul jocurilor cu sum nul, n lrgirea conceptului de strategie i definirea noiunii de echilibru n aceast accepiune mai larg. Trebuie fcut precizarea c noul tip de strategie l nglobeaz pe cel utilizat pn acum n discuie i c identificarea unor puncte de echilibru corespunztoare lui nu suprim posibilitatea existenei, pentru un acelai joc, a punctelor de echilibru n strategii pure. Obinuim s numim strategie mixt pe mulimea A = A1, ..., Am a strategiilor (pure) ale juctorului P1 o repartiie de probabiliti: x = (x1, ..., xm), unde xi 0, i = 1, m i
m
x
i =1
= 1.
Teoria jocurilor
Mulimea tuturor acestor strategii o notm prin X. Analog vom considera: Y = y = (y1,..., yn) yj 0,
n
y = 1
j =1 j
ca
fiind
ansamblul
strategiilor mixte pe mulimea B, a strategiilor juctorului P2. Ideea de strategie mixt se leag, n mod natural, de alternarea strategiilor de ctre un juctor, n decursul mai multor partide. Cum probabilitile pot fi interpretate ca limite ale unor frecvene relative, se pune ntrebarea dac n situaii reale putem considera ca acceptabil repetarea (independent) a jocului de un numr de ori suficient de mare. Se poate ncerca evitarea acestei dificulti prin interpretarea unei strategii mixte a lui P2, y = (y1, ..., yn) ca reprezentnd probabilitile (subiective) pe care le atribuie P1 utilizrii uneia dintre strategiile pure B1, ..., Bn de ctre P2 i, asemntor, a unei strategii mixte a lui P1 (x1, ..., xm), schimbnd rolurile ntre juctori. Impasul ce se profileaz aici ine de tratarea jocurilor cu mai mult de doi juctori, caz n care doi juctori pot avea percepii diferite relative la comportarea unui ter. Oricare ar fi interpretarea dat strategiilor mixte, ele ne ajut s punem n termeni coreci problema maximizrii unui ctig incert, prin apelul la conceptul fundamental de medie a unei variabile aleatoare. n condiiile alegerii independente i simultane a strategiilor de ctre fiecare juctor n parte, folosindu-ne de notaiile de mai nainte, vom defini ctigurile celor doi, n ipoteza folosirii strategiilor mixte x i y, respectiv, prin:
1(x, y) = 2(x, y) =
m n
a x y
i =1 j =1 m n ij i
; ;
i: X Y , i = 1,2 ,
b x y
i =1 j=1 ij i
unde xi yj reprezint probabilitatea utilizrii perechii de strategii (Ai, Bj), iar aij i bij sunt ctigurile asociate ei ale juctorilor P1 i P2, respectiv. S observm c de exemplu, ctigul mediu 1(x, y) este o medie a unor ctiguri medii, considernd, pe rnd, strategiile din A fixate fa de cele din B, dup cum o arat relaia:
1(x, y) =
yj xi.
a
i =1 j=1
ij
Cu aceste precizri, putem s dm definiia extins a punctelor de echilibru ale unui joc bimatriceal n form normal:
Definiie: ntr-un joc bimatriceal G = A, B; f1, f2, o pereche de
strategii mixte (x*, y*) este un punct de echilibru Nash dac au loc urmtoarele inegaliti:
1(x*,y*) 1(x, y*) 2(x*,y*) 2(x*, y)
pentru orice strategii mixte x X i y Y. Cu alte cuvinte, x* este cea mai bun strategie (mixt) de rspuns a lui P1 la strategia y* a lui P2 i viceversa. Se deduce din cele de mai sus c putem porni la determinarea strategiilor mixte de echilibru ale unui joc (a cror existen o vom afirma ceva mai trziu) prin gsirea celui mai bun rspuns (n strategii mixte sau pure) al unui juctor la o strategie mixt a celuilalt. n demersul nostru ne servim de urmtorul rezultat:
Propoziia 4.4
Pentru ca o strategie mixt a lui P1 s fie un cel mai bun rspuns al acestuia la o strategie mixt dat y a lui P2, este necesar i suficient ca ea s asigneze probabiliti strict pozitive numai acelor strategii pure care sunt ele
Teoria jocurilor
nsele un cel mai bun rspuns la strategia y (sau numai unei pri a acestora, restul primind probabiliti nule).
Demonstraie:
S notm, pentru o strategie y dat, cu Imax mulimea indicilor acelor strategii pure ale lui P1 care sunt un cel mai bun rspuns la y: Imax = K
n n
a kj y j a ij y j , () i = 1, m .
j=1 j=1
S alegem un K0 Imax. Fie x = (x1, ..., xm) o strategie mixt a lui P1 i s presupunem c exist l 1, n \ Imax astfel nct xl > 0. Notm cu x strategia mixt obinut din x prin asocierea probabilitii x K 0 + xl la strategia A K 0 i a unei probabiliti nule la Al. Atunci vom avea:
1(x, y) =
n n n x a y + x a y + x i ij j K0 K0 j j l a lj y j < i K 0 ,l j =1 j=1 j=1
<
n n n a y + ( x + x ) a y + 0 a lj y j = 1 ( x ' , y) , ij j K 0 l K0 j j i K 0 , l j =1 j =1 j=1
de
unde deducem c x nu este cea mai bun strategie de rspuns la y. Pentru probarea suficienei, se consider I0 Imax i o strategie mixt x0 = x i0
( )
i =1
hI 0
x a
0 h
j =1
hj
mai departe:
1(x, y) =
n n m x a y x max a ij y j = 1(x0, y), oricare ar i ij j i i =1, m i =1 j =1 i =1 j=1 m
Un enun similar celui din propoziia 4.4 caracterizeaz strategiile mixte ale lui P2 care sunt rspunsuri optime la o strategie mixt x a lui P1, fixat. Reamintim c orice strategie pur a unui juctor poate fi interpretat ca o strategie mixt, exprimabil printr-un vector binar cu 1 pe poziia corespunztoare strategiei i avnd restul componentelor egale cu 0. Revenind la exemplul de mai nainte al jocului bimatriceal 2 2, s ncercm determinarea unui punct de echilibru n strategii mixte. Pentru simplitate, vom nota strategiile mixte ale lui P1 prin x = (p, 1 p) i strategiile mixte ale lui P2 cu y = (q, 1 q), p, q [0, 1]. ntr-o prim etap, vom gsi strategiile pure optime de rspuns ale fiecrui juctor, la o strategie mixt a adversarului. Pentru o strategie mixt dat (q, 1 q) pe B = B1, B2, ctigul mediu al lui P1 va fi 2q + 0(1 q) = 2q, dac folosete strategia A1 sau 1 q + 3(1 q) = 3 2q, dac folosete strategia A2. Rezolvnd inecuaia 2q > 3 2q pe intervalul [0, 1], deducem: - dac q [0, - dac q = 3 ), cel mai bun rspuns al lui P1 este A2; 4
3 , atunci A1 i A2 sunt rspunsuri la fel de bune; 4 3 , 1], cel mai bun rspuns al lui P1 este A1. 4
- dac q (
Inversnd rolurile, fie (p, 1 p) o strategie mixt pe A = A1, A2. Ctigul mediu al lui P2 va fi 1 p + 2(1 p) = 2 p, dac folosete strategia B1 sau 2p, dac utilizeaz strategia B2. Folosindu-ne de soluia inecuaiei 2 p > 2p pe [0, 1], constatm urmtoarele: - pentru p [0, 2 ), rspunsul optim al lui P2 este B1; 3
Teoria jocurilor
- pentru p =
2 , P2 poate rspunde att cu B1, ct i cu B2; 3 2 , 1], rspunsul optim al lui P2 este B2. 3
- pentru p (
Cutm acum o pereche de strategii mixte (x*, y*), x* = (p*, 1-p*), y* = (q*, 1 q*) cu proprietile din definiia extins a echilibrului Nash. Vom analiza pe rnd diversele situaii posibile.
I.
al lui P1 ar fi strategia pur A2, creia i corespunde p = 0 ca strategie mixt. ns rspunsul optim al juctorului P2 la aceast strategie este B1, corespunznd lui q = 1. Cum 1 (0, 3 ], acest 4
l identificm cu strategia mixt (1, 0). Cel mai bun rspuns al lui P2 la aceast strategie este strategia pur B2, pentru care 3 avem q = 0. Dar 0 ( , 1] i concluzia e identic celei de la 4 punctul precedent.
III. n cazul q* =
orice strategie mixt (r, 1 r) pe A1, A2, r [0, 1], conform cu propoziia 4.4. Dar situaiile r [0,
la valori ale rspunsurilor corespunztoare lui q = 1 i q = 0, respectiv, ambele diferite de 3 2 . Pentru r = , rspunsul optim 4 3
fiind orice strategie mixt (q, 1 q) pe B1, B2, n particular 3 1 2 ( , ), rezult c putem alege p* = . n concluzie, punctul de 4 4 3 echilibru al jocului, n strategii mixte, este: 2 1 3 1 (x*,y*) = (( , ), ( , )). 3 3 4 4 Importana considerrii strategiilor mixte n identificarea soluiilor posibile ale unui joc bimatriceal reiese din urmtorul rezultat (pe care l dm ntr-un caz particular):
Teorema lui Nash
Orice joc finit de dou persoane n form normal, G = A, B; f1, f2 posed cel puin un punct de echilibru, n strategii pure sau mixte. Demonstraia teoremei, al crei enun n form general se refer la jocuri de n persoane, are la baz o teorem de punct fix. (n cazul de fa, (x*,y*) cu proprietatea T(x*, y*) = (x*,y*) este punct fix al unei transformri T). Dei n demonstraie nu se construiete efectiv un punct de echilibru, concluzia sa este suficient de elocvent. Vom prezenta n cele ce urmeaz o procedur de determinare a punctelor de echilibru ale unui joc bimatriceal n form normal, atunci cnd juctorii P1, P2 au la dispoziie m i n strategii pure, respectiv, cu ajutorul unui exemplu concret. Vom avea n vedere cazul cnd ctigurile juctorilor sunt nenegative, dar aceasta, dup cum se constat, nu reprezint o restricie important. Sunt necesare cteva precizri i notaii. Astfel, vom nota cu C1 matricea ctigurilor juctorului P1 definit prin: C1 = (aij) i =1, m , aij = f1(Ai, Bj), Ai A, Bj B.
j=1, n
Teoria jocurilor
Pentru dou strategii mixte, x = (x1, ..., xm) a lui P1 i y = (y1,..., yn) a lui P2, se pot transcrie ctigurile medii ale fiecrui juctor n parte, astfel:
T T 1(x, y) = xC1yT, 2(x, y) = yC T nseamn operaia 2 x , unde indicii
de transpunere. Notnd Jm i Jn vectorii-linie cu m, respectiv n componente, toate egale cu 1, vom putea scrie relaiile:
T xJ T m = 1, y J n = 1
(1)
sinonime cu faptul c suma probabilitilor (xi)i1, m (respectiv (yj)j1, n ) face 1. S presupunem acum c (x, y) reprezint o pereche de strategii de echilibru i s notm, pentru simplitate, cu 1 i 2 ctigurile aferente ei ale celor doi juctori. Introducem vectorii 1 = (1, ..., 1) n i 2 = (2, ..., 2) n, care ne permit o scriere matriceal a proprietii de echilibru. Astfel, folosind propoziia 4.4, deducem relaiile:
T T T C1yT 1 , CT 2 x 2
(2)
n care inegalitile trebuie interpretate ca funcionnd ntre oricare dou componente corespondente ale vectorilor coloan. Ele exprim faptul c rspunsurile printr-o strategie pur la strategiile y, respectiv x pot s duc, n cel mai bun caz, la egalarea ctigurilor 1, respectiv 2. Acestea sunt atinse efectiv n (x, y), ceea ce reiese din relaiile:
T T xC1yT = x 1 x( 1 - C1yT) = 0
T T T T T yC T 2 x = y 2 y( 2 - C 2 x ) = 0
(3)
n care am inut seama de (1). Rezult din cele de mai nainte c un punct de echilibru Nash, (x, y), al unui joc bimatriceal trebuie s satisfac cele ase relaii date, la care se adaug condiiile x 0 i y 0. Concret, vom gsi soluiile urmtorului joc bimatriceal, folosind instrumentarul prezentat pentru cazul general. B1 A1 (4,0) A2 (6,12) B2 B3 (2,1) (8,6) (2,10) (4,9)
Suntem n cazul a m = 2 strategii pure ale juctorului P1 i a n = 3 strategii pure ale juctorului P2. Vom separa relaiile de tip liniar de cele neliniare i apoi le vom grupa astfel nct s ne ocupm separat de strategia (x1, x2), respectiv (y1, y2, y3). Din relaiile (1) i (2) va rezulta: x1 + x2 = 1 12x2 - 2 0 x1 + 10x2 - 2 0 6x1 + 9x2 - 2 0 x1, x2 0 y1, y2, y3 0 Pentru jocul analizat, att 1 ct i 2 sunt nenegative i ca atare, vom nota x3 = 2 i y4 = 1. De asemenea, vom transforma, n sistemele scrise anterior, inegalitile n egaliti, prin introducerea unor variabileecart, notate i, i = 1,2 , respectiv j, j = 1,3 . y1 + y 2 + y 3 = 1 4y1 + 2y2 + 8y3 - 1 0 6y1 + 2y2 + 4y3 - 1 0
Teoria jocurilor
Obinem: x1 + x2 = 1 (I) 12x2 x3 + 1 = 0 x1 + 10x2 - x3 + 2 = 0 6x1 + 9x2 - x3 + 3 = 0 x1, ..., x3 0; 1,...,3 0 y1, ..., y4 0; 1, 2 0 (II) y1 + y 2 + y 3 = 1 4y1 + 2y2 + 8y3 y4 + 1 = 0 6y1 + 2y2 + 4y3 - y4 + 2 = 0
Relaiile (3) vor avea drept corespondent urmtoarele egaliti: (III) x11 + x22 = 0 y11 + y22 + y33 = 0 Cutarea soluiilor jocului bimatriceal se structureaz aadar n: - rezolvarea n domeniul numerelor nenegative a sistemului liniar (I), n necunoscutele x1, x2, x3, 1, 2, 3; - rezolvarea n domeniul numerelor nenegative a sistemului liniar (II), n necunoscutele y1, y2, y3, y4, 1, 2; - filtrarea soluiilor, prin verificarea, de tip ncruciat, a ndeplinirii condiiilor (III). n fapt, obiectivul nostru principal este s deducem soluiile posibile
de baz pentru fiecare din sistemele (I) sau (II), deoarece soluia general se
poate obine ca o combinaie liniar convex a soluiilor de baz. Probarea condiiilor (III) o vom face aadar pentru diferite perechi de soluii de baz.
S considerm matricea sistemului liniar (I), n care fiecare coloan este notat cu ak, k = 1,6 : a1 a2 a3 a4 a5 a6 0 1 0 0 0 0 1 0 0 0 0 1
1 1 0 0 12 1 1 10 1 6 9 1
Procedura este cea cunoscut de la programarea liniar: se aleg patru coloane din cele 6 astfel nct ele s formeze o baz n 4, B = a k 1 , a k 2 , a k 3 , a k 4 . Atunci soluia de baz va fi dat de (x, ) = (B-1b, 0), unde b = (1, 0,0,0)T este coloana termenilor liberi i toate variabilele ale cror coloane asociate nu au intrat n baz iau valoarea 0. Fie de exemplu mulimea a1, a2, a3, a5. Deoarece: 1 1 0 0 12 1 det[a1, a2, a3, a5] = 1 10 1 6 9 1 0 0 = 9 0, rezult c 1 0
B = a1, a2, a3, a5 este o baz. Alegem 1 = 3 = 0. Avem de rezolvat sistemul: x1 + x2 = 1 12x2 x3 = 0 x1 + 10x2 - x3 + 2 = 0 6x1 + 9x2 - x3 = 0
Teoria jocurilor
Se deduce uor c x3 = 12x2, x2 = 2x1. Cum x1 + x2 = 1, rezult x1 = 1 2 , x2 = , x3 = 8 i 2 = 1. 3 3 1 2 Soluia de baz va fi deci (x, )1 = ( , ,8,0,1,0), avnd toate 3 3 componentele pozitive sau nule. Repetnd procedeul pentru alte baze i testnd nenegativitatea componentelor soluiilor, vom gsi nc dou soluii posibile de baz. (x, )2 = (1,0,6,6,5,0), corespunznd bazei a1, a3, a4, a5 i (x, )3 = (0,1,12, 0,2,3), corespunznd bazei a2, a3, a5, a6. Matricea sistemului (II) este: b1 b2 b3 b4 b5 b6
1 1 1 0 0 0 4 2 8 1 1 0 6 2 4 1 0 1
Putem alege o baz format din coloanele b1, b2 i b4, deoarece determinantul corespunztor lor are valoarea -2. Alegem y3 = 1 = 2 = 0. Din sistemul: y1 + y2 = 1 4y1 + 2y2 y4 = 0 6y1 + 2y2 y4 = 0 deducem y1 = 0, y2 = 1 i y4 = 2, care ne dau soluia posibil de baz: (y, )1 = (0,1,0,2,0,0). Pentru bazele b1, b3, b4, b3, b4, b6 i b1, b4, b5, vom obine alte soluii posibile de baz ale sistemului: 2 1 16 (y, )2 = ( , 0, , , 0, 0), (y, )3 = (0,0,1,8,0,4), 3 3 3
nainte de a trece la verificarea condiiilor (III), observm c, n ipotezele de nenegativitate a componentelor, x11 + x22 = 0 este echivalent cu x11 = 0 i x22 = 0 i similar y11 + y22 + y33 = 0 e ndeplinit dac i numai dac y11 = 0, y22 = 0 i y33 = 0. n consecin, dac un () este nenul, atunci componenta x (y) cu acelai indice trebuie s fie egal cu zero. Pentru facilitarea examinrilor necesare, vom construi dou tabele n care marcm n prima coloan cuplul de strategii (x, y) examinat, prin indicii corespunztori ordinilor date, iar n ultima coloan, prin *, dac perechea (x, y) respect condiia impus. Primul tabel este: (x,y) (1,1) (2,1) (3,1) (1,2) (2,2) (3,2) (1,3) (2,3) (3,3) (1,4) (2,4) (3,4) 1 0 0 0 0 0 0 0 0 0 2 2 2 2 0 0 0 0 0 0 4 4 4 0 0 0 x1 1/3 1 0 1/3 1 0 1/3 1 0 1/3 1 0 x2 2/3 0 1 2/3 0 1 2/3 0 1 2/3 0 1 */* * * * * * * *
Teoria jocurilor
Referitor la modul de completare a tabelului, am marcat cu * perechea (2,3), deoarece 1x1 = 0 1 = 0 i 2x2 = 4 0 = 0, n timp ce pentru perechea (1, 4) avem 1 = 2 0 i x1 = 1 0, .a.m.d.. 3
(x,y) (1,1) (1,2) (1,3) (1,4) (2,1) (2,2) (2,3) (2,4) (3,1) (3,2) (3,3) (3,4)
1 0 0 0 0 6 6 6 6 0 0 0 0
2 1 1 1 1 5 5 5 5 2 2 2 2
3 0 0 0 0 0 0 0 0 3 3 3 3
y2 1 0 0 0 1 0 0 0 1 0 0 0
*/* * * * *
1 = 1 0. 3
Vom extrage din fiecare tabel perechile de strategii marcate cu asterisc i apoi vom intersecta cele dou mulimi. Astfel obinem:
(1,1), (2,1), (3,1), (1,2), (2,2), (3,2), (2,3), (3, 4) (1,2), (1,3), (1,4), (2,3), (3, 4) = (1,2), (2,3), (3, 4).
Intersecia gsit conine strategiile de echilibru Nash (pure sau mixte) ale jocului considerat. Acestea sunt (respectnd ordinea):
Se observ c avem o pereche de strategii mixte (prima) i dou perechi de strategii pure, mai exact (A1, B3) i (A2, B1). n ncheierea discuiei despre punctele de echilibru ale unui joc bimatriceal, facem urmtoarele observaii:
1. n situaia n care elementele matricelor de ctiguri nu sunt toate
pozitive sau nule, trebuie s considerm c 1 i 2 sunt numere reale. Pentru a putea s ne folosim n continuare de procedeul descris mai nainte, putem proceda n dou moduri: a) s exprimm fiecare variabil i, i = 1,2 ca diferena a dou variabile crora li se impune s ia valori nenegative:
i = i - i, i 0, i 0, i = 1,2 ;
b) s adunm la matricile C1 sau C2 o matrice (m n) format din constante identice ntre ele, suficient de mari, transformarea neafectnd dect valorile ctigurilor medii, nu i determinarea strategiilor de echilibru;
2. n exemplul rezolvat mai nainte, trebuiau considerate cel mult
4 = 15 situaii care conduc la o baz pentru matricea sistemului C6
(I) i cel mult C 3 6 = 20 situaii de acelai tip n cazul sistemului (II). Pentru un numr mai mare de strategii ale fiecrui juctor, pentru a fi aplicabil, metoda face apel la un program care genereaz soluii posibile de baz i le testeaz n mod automat;
3. Asupra elementelor matricilor de ctiguri pot fi operate i alte
tipuri de transformri, ca de pild scalarea (nmulirea cu un factor pozitiv). De asemenea se poate discuta despre o strategie pur
Teoria jocurilor
dominat de o strategie mixt, care ar putea s o disloce, fr a afecta esenial gsirea punctelor de echilibru, (Cititorul este ndemnat s compare ultimul joc analizat cu unul prezentat anterior i s trag concluziile de rigoare).
Aa cum artam la nceputul discuiei privind jocurile cu sum arbitrar, un joc cooperativ este acela n care regulile sale permit alegerea n comun a strategiilor i transferul de ctiguri ntre juctori, n scopul cointeresrii lor ntr-o anumit aciune comun. Ne vom servi de exemplul ctorva jocuri, pentru a ilustra situaii n care juctorii au interesul s coopereze ntre ei. Punctul de plecare l va constitui, n ideea continuitii, noiunea de cuplu de strategii de echilibru Nash. S considerm jocul bimatriceal urmtor: B1 A1 (1,2) A2 (2,2) B2 B3 (2,-2) (3,1) (4,-1) (6,3)
Se observ cu uurin c perechea de strategii (A2, B3) reprezint un punct de echilibru al jocului (n strategii pure). n particular, ctigurile corespunztoare ale juctorilor (6, respectiv 3) sunt valorile maxime ale funciilor de ctig ale fiecruia, deci i suma ctigurilor (care nu mai poate fi mbuntit prin considerarea strategiilor mixte) este maxim, ntre toate combinaiile posibile de strategii. ntr-un asemenea caz, ipoteza cooperrii ntre cei doi juctori nu are nici un efect.
vom constata c, dei (A1, B1) este punct de echilibru al jocului, ctigurile care le revin juctorilor nu i pot mulumi. Chiar suma lor, 5, ia valoarea cea mai mic posibil. Eliminnd perechile (A2, B1) i (A1, B2), care favorizeaz un juctor i l defavorizeaz pe cellalt, rmne perechea (A2, B2), ale crui ctiguri aduc un plus amndurora fa de ce le ofer strategiile de echilibru. Ea este ns instabil. Ieirea din aceast dilem se face prin modificarea regulilor jocului, prin acceptarea cooperrii. Odat acceptat, ea aduce cu sine ns o alt problem, aceea a mpririi ntre cei doi juctori a ctigului comun, egal cu 12. Teoretic, se poate impune interzicerea plilor laterale ntre juctori, situaie n care distribuia ctigurilor poate s rmn cea de la nceput. Nu vom adopta o asemenea ipotez n cele ce urmeaz. Jocurile de tip cooperativ au o problematic specific i rezolvarea lor presupune att introducerea unor noiuni noi ct i revalorizarea altora mai vechi. Se pune astfel o prim ntrebare: sub ce limit a ctigului nu poate s accepte s coboare fiecare juctor? Rspunsul l furnizeaz acel ctig pe care l poate obine un juctor, acionnd n mod independent, indiferent de strategia (pur sau mixt) aleas de cellalt juctor. Referindu-ne la primul juctor, obinem valoarea maximin a jocului corespunztoare lui, dat de expresia:
Teoria jocurilor
unde x i y sunt strategii mixte pe mulimea strategiilor lui P1, respectiv ale lui P2. Analog, pentru P2 valoarea maximin va fi: v* = max min 2(x,y).
yY xX
Deci, notnd cu (u, v) o pereche de ctiguri ale celor doi juctori, ea ar putea constitui o soluie a jocului cooperativ numai dac avem (u, v) (u*, v*). La ntrebarea unde trebuie cutat soluia jocului, rspunsul l d noiunea fundamental de mulime admisibil. Aceasta, notat cu S, este mulimea tuturor perechilor de ctiguri (u, v) pe care le pot obine, prin cooperare n alegerea strategiilor, cei doi juctori. Datorit faptului c sunt acceptate strategiile mixte i, mai mult, ele pot fi corelate, aceast submulime a lui 2 are proprietatea de convexitate. Este de presupus c forma lui S va avea o influen asupra gsirii soluiei jocului. O alt noiune important este aceea de frontier Pareto-optimal a mulimii admisibile S. Astfel, un punct (u, v) S aparine acesteia dac oricare ar fi > 0, > 0 rezult (u + , v) S i (u, v + ) S. Vom ilustra noiunile introduse mai nainte i vom schia metoda de gsire a soluiei, folosindu-ne de exemplul urmtorului joc bimatriceal. A1 A2 A3 B2 B1 (3,8) (1,2) (4,5) (2,0) (3/2,6) (5,3)
Presupunem c regulile jocului permit cooperarea ntre juctori (dar nu ca o consecin a faptului c jocul nu admite puncte de echilibru n strategii pure). Inversnd ordinea de mai nainte, vom determina mai nti mulimea admisibil S, preciznd frontiera sa Pareto-optimal, folosindu-ne de o reprezentare grafic. Dac notm cu W11 punctul din plan de coordonate 3 (1, 2) i, mai departe, W12 = (3, 8), W21 = (2, 0), W22 = (4, 5), W31 = ( , 6), 2 W32 = (5, 3), unde legtura dintre perechile de indici i perechile de ctiguri este evident, atunci S va fi reprezentat prin aa-numita acoperire convex a punctelor W11, ..., W32 (adic cea mai mic mulime convex plan care le conine), dat n figura urmtoare prin mulimea haurat:
V W31 W22 S W32 W11 0 W21 u W12
S precizm c exist cazuri n care unele puncte - ctiguri W pot s fie situate n interiorul poligonului convex determinat de restul punctelor, caz n care mulimea S va fi generat folosind numai aceste din urm puncte. Frontiera Pareto-optimal a lui S va fi format, n mod firesc, din laturi ale poligonului W11W21 ... W31. Singurele care satisfac condiia dat sunt W12W22 i W22W32. (Pentru puncte (u, v) aparinnd altor segmente,
Teoria jocurilor
cum ar fi W21W32 sau W31W12 este suficient s lum (u, v + ) sau (u + , v), cu , > 0 alese corespunztor, pentru a constata c punctele obinute fac parte din S). Aceast frontier Pareto [W12, W22, W32] va constitui, de fapt, zona de interes n identificarea soluiei jocului, deoarece ea corespunde cursului de cretere, att n u ct i n v, a punctelor (u, v) din S, favorabil ambilor juctori. n continuare vom gsi valorile maximin ale jocului (n strategii mixte). Pentru a uura calculele, s facem observaia c atunci cnd dorim s minimizm 1(x, y) n raport cu y Y, pentru un x X fixat, este suficient s considerm strategiile pure y = (1, 0) i y = (0, 1) deoarece putem scrie:
2 1(x, y) = xC1yT = (x1, x2, x3)C 1 1 y1 + (x1, x2, x3) C 1 y2 2 unde y = (y1, y2), y1, y2 0, y1 + y2 = 1, iar C 1 1 i C 1 sunt respectiv prima i
a doua coloan a matricei de ctiguri a juctorului P1, notat C1. Concret, vom avea:
min 1(x, y) = minx1 + 2x2 +
yY
= x1 + 2x2 +
3 x3 2
Cum X = (x1, x2, x3)x1, x2, x3 0, x1 + x2 + x3 = 1 este un simplex n 3, vom gsi: u* = max min 1(x, y) = max (x1 + 2x2 +
xX yY xX
unde C2 este matricea ctigurilor lui P2, vom obine: min 2(x, y) = min2y1 + 8y2, 5y2, 6y1 + 3y2.
xX
Dar y2 = 1 y1, deci vom calcula: min-6y1 + 8, -5y1 + 5, 3y1 + 3 pentru y1 [0, 1]. Expresia acestuia este egal cu 3y1 + 3, dac y1 [0, 1 -5y1 + 5, dac y1 [ , 1]. n final, avem: 4 v* = max min 2(x, y) = 3
yY xX
1 ] i egal cu 4
Soluia jocului cooperativ dat, n sensul lui Nash, va fi o pereche ( u , v ) din S, cu proprietatea ( u , v ) (2,
(u u*)(v v*) pentru acele perechi (u, v) cu u 2 (n cazul n care exist (u, v) S cu u > u* i v > v*). Ea va aparine frontierei Pareto-optimale a lui S. Se demonstreaz c punctul cutat (unic prin construcie) are proprietatea c dreapta tangent la frontiera lui S, dus prin el, are panta (coeficientul unghiular) egal cu opusul pantei dreptei care unete (u*,v*) cu ( u , v ). Evident, aceast tangent trebuie s existe, drept pentru care punctele W12, W22 i W32 sunt tratate (eventual) separat. Cum coeficientul unghiular al dreptei care unete (2, 15 ) cu un 4
(u, v) de pe frontier este o mrime care variaz continuu, analiza decurge dup cum urmeaz. Panta dreptei care conine segmentul [W32W22] (i care joac rolul tangentei la frontiera lui S pentru punctele din interiorul su) este:
1 =
53 = -2. 45
Teoria jocurilor
15 4 = - 1 . Asemntor, dreapta care trece prin punctele (2, 15 ) i cu: 52 4 4 (4, 5) are panta egal cu 5 . Aadar, fcndu-l pe (u, v) s varieze n 8
interiorul lui [W32W22] obinem o dreapt cu panta care parcurge intervalul (1 5 , ). Cum opusul lui 1 nu se gsete n aceast plaj de 4 8
1 5 valori (2 (- , )), rezult c ( u , v ) nu aparine interiorului segmentului 4 8 menionat. Continund analiza cu punctele din interiorul segmentului [W22W12], constatm c panta dreptei suport a acestuia este 2 = unim pe (2, 85 = -3. Dac 34
atunci cnd (u, v) variaz ntre capetele W22 i W12, dreapta care l unete cu 5 17 (u*,v*) are panta ( , ). 8 4 5 17 n acest caz, - 2 = 3 ( , ) i rmne s l determinm pe 8 4 ( u , v ) ca un punct situat ntre W22 i W12. Dreapta care trece prin punctele (4, 5) i (3, 8) are ecuaia: v5 u 4 v = -3u + 17. Ea se va intersecta cu o dreapt care = 3 1 trece prin (2, 15 ), de pant egal cu 2 = 3, n ( u , v ). 4
Soluia de tip Nash a jocului cooperativ considerat mai sus este perechea de ctiguri ( u , v ) = (
La acest moment se cuvine a fi fcut o observaie referitoare la transferul ctigurilor. Astfel, din ecuaia: v = -3u + 17, rezult c o unitate valoric cedat de P1 se transfer n 3 uniti valorice ale lui P2, deoarece avem: -3(u 1) + 17 = -3u + 17 + 3 = v + 3. Putem vorbi deci de o rat de transfer a ctigurilor de la P1 ctre P2, egal cu 3(3 la 1). S facem diferenele ntre ctigul dat de soluia Nash i valoarea maximin pentru fiecare juctor n parte: 77 29 59 15 29 = -2= ; 24 24 8 4 8 Raportul lor (n ordinea P2 / P1) este 29 29 = 3, deci coincide cu 8 24
rata de transfer. Aceasta ne arat c prile de ctig obinute prin cooperare, n plus fa de ctigul maximin, de ctre fiecare juctor, se situeaz ntr-o proporie egal cu rata de transfer n punctul ( u , v ).
Teoria jocurilor
S nu pierdem din vedere faptul c scopul fiecrui juctor este ca si mbunteasc ctigul, inclusiv prin cooperare, dar neexcluznd influenele subiective. n acest context, putem observa c suma ctigurilor Nash:
u + v 3.208 + 7.375 = 10.583,
este strict inferioar sumei 3 + 8 = 11 ce rezult dac cei doi juctori convin s aplice strategiile A1 i B2, respectiv. Diferena rezultat ar putea s fie obiectul unui transfer de ctig n scopul amintit. Trebuie s acceptm din aceast cauz concluzia c soluia Nash nu e cea mai bun? S observm c n calculele de mai sus nu am inut seama de rata de transfer, egal cu 3 pentru toi (u, v) [W12, W22]. Acestea ar fi trebuit s arate astfel (n uniti ale lui P2): 3 3 + 1 8 = 9 + 8 = 17 3 3.208 + 1 7.375 = 9.624 + 7.375 = 16.999 17. n ncheiere s menionm c exist i un alt mod de producere a soluiei jocului cooperativ, bazat pe aa-numitele strategii de ameninare. Pentru lmuriri, ndrumm cititorul ctre referinele bibliografice date.
n cele ce urmeaz vom considera jocul de n persoane, n care notm cu N = 1, 2, ..., n mulimea tuturor juctorilor i presupunem permis cooperarea ntre acetia.
Definiia 1. Orice submulime nevid a lui N (inclusiv N i toate
funcia v, definit pe mulimea prilor lui N, care asociaz fiecrei coaliii S N valoarea maximin (corespunztoare lui S) a jocului de dou persoane jucat ntre coaliiile S i N S. Deci notm prin v(S) ctigul pe care juctorii din S l pot obine n joc (acionnd n cooperare), indiferent de ceea ce fac restul juctorilor. Prin definiie vom considera: v() = 0 (1) Dac S i T sunt coaliii disjuncte, unindu-i forele, ele pot realiza un ctig cel puin tot att ca n cazul cnd acioneaz separat. Acest lucru se scrie astfel: v(S T) v(S) + v(T), dac S T = (2) i nseamn c funcia caracteristic v are proprietatea de superaditivitate. Dac n jocul de dou persoane elementul esenial era studiul strategiilor mixte, n jocul de n persoane acest element esenial este formarea de coaliii. Funcia caracteristic d posibilitile diferitelor coaliii i este cea mai potrivit pentru studiul acestora.
Definiia 3: Prin joc de n persoane n form caracteristic se
nelege o funcie v cu valori reale definit pe submulimile lui N i care satisface condiiile (1) i (2). Prin definiie, v(S) este valoarea maximin a jocului ntre S i N - S. Dac presupunem c jocul este cu sum constant, adic suma ctigurilor tuturor juctorilor este constant, indiferent de desfurarea jocului, atunci: v(S) + v(N-S) = v(N). v(N) este valoarea ce se poate obine prin cooperare general i se mai numete valoare total.
Teoria jocurilor
Notm cu v(i) valoarea pe care juctorul i o poate obine acionnd independent. Evident juctorul i va intra n coaliia S dac valoarea ctigului este cel puin v(i).
Definiia 4: ntr-un joc v de n persoane vectorul x = (x1, ..., xn), cu
condiiile: a)
x
iN
b) xi v(i), () i N,
v(N) >
i) v({}
iN
Jocurile eseniale sunt acelea ce prezint interes. Deoarece jocurile n forma caracteristic (definiia 3) sunt funcii cu valori reale, are sens s vorbim despre suma a dou sau mai multe jocuri.
Definiia 6: Se numete suport al unui joc v o coaliie T cu
proprietatea: v(S) = v(S T) pentru orice coaliie S. Aceasta nseamn c orice juctor care nu aparine unui suport al jocului este lipsit de importan, adic nu aduce nimic unei coaliii.
Definiia 7: Fie v un joc de n persoane i o permutare arbitrar a
mulimii N. Prin v nelegem jocul obinut din v n care s-au interschimbat rolurile juctorilor prin permutarea .
Axiomele Shapley
Numim
valoare
unui
joc
de
persoane,
vectorul
[v] = (1[v],..., n[v]), unde i[v] reprezint partea care trebuie atribuit
juctorului i, i = 1, n , din ctigul total v(N), cu proprietile: a1) pentru orice suport S al lui v avem:
[v] = v(S) ;
iS i
a2) pentru orice permutare i orice juctor i N, (i)[v] = i[v]; a3) pentru oricare dou jocuri u i v avem: [u + v] = [u] + [v]. Aceste trei proprieti sunt axiomele lui Shapley i ele sunt suficiente pentru a determina o funcie valoare , definit pentru toate jocurile. Dm fr demonstraie urmtoarea:
Teorem [16]
Exist o funcie unic , definit pentru toate jocurile, care satisface axiomele a1, a2, a3 i anume: i[v] =
( t 1)!(n t )! [v(T) v(T {} i )] n! T N
(3)
iT
unde t este numrul juctorilor din coaliia T. Semnificaia termenului v(T) v(T - i) este ctigul primit de juctorul i, sau valoarea cu care acest juctor contribuie la ctigul total al coaliiei T din care face parte. Dac vom presupune c termenul v(T) v(T - i) poate lua numai valorile 0 sau 1, i anume ia valoarea 1 dac i numai dac T este o coaliie ctigtoare, dar T - i nu este ctigtoare, atunci jocul v este un joc simplu, iar formula (3) se simplific, astfel: i[v] = ( t 1)!(n t )! n! T N
(4)
iT
Teoria jocurilor
unde sumarea se face pentru toate coaliiile ctigtoare T pentru care T - i nu este ctigtoare.
Aplicaie [16]
O societate pe aciuni are 4 acionari ce posed respectiv 10, 20, 30 i 40% din aciuni. Toate deciziile privind activitatea societii se iau cu majoritatea simpl (cel puin 51% voturi, care sunt proporionale cu numrul de aciuni posedate). Considernd aceast situaie ca un joc simplu de 4 persoane se cere: a) s se gseasc toate coaliiile ctigtoare; b) s se scrie coaliiile ctigtoare T pentru care T - 1 nu este ctigtoare; c) s se determine valoarea Shapley = (1, 2, 3, 4), unde i este partea ce se atribuie juctorului i, i = 1,4 , din ctigul total; d) s se fac observaii asupra rezultatului obinut la punctul c).
Rezolvare a) Coaliiile ctigtoare sunt:
2, 4, 3, 4, 1, 2, 3, 1, 2, 4, 1, 3, 4, 2, 3, 4, 1, 2, 3, 4.
b) Dintre coaliiile ctigtoare ce l conin pe primul acionar
singura care devine nectigtoare cnd este scos din coaliie acesta este coaliia: 1, 2, 3, n care t (numrul acionarilor) este egal cu 3.
c) Aplicnd formula (4), unde t = 3, n = 4, i = 1, avem:
1 =
2!1! 1 = . 4! 12
Analog, coaliiile ctigtoare, care i pierd aceast proprietate dac acionarul 2 este nlturat sunt: 2, 4, 1, 2, 3,1, 2, 4.
Formula (4) va da pentru 2 suma a trei termeni, fiecare corespunznd uneia din coaliiile de mai sus. Astfel pentru coaliia 2, 4, t = 2, n = 4, i = 2, primul termen din (4) va fi: (2 1)! (4 2)! 1 = . 4! 12 Pentru 1, 2, 3, t = 3, n = 4, i = 2, obinem: (3 1)! (4 3)! 1 = . 4! 12 Iar pentru 1, 2, 4, t = 3, n = 4, i = 2, aceeai valoare ca mai sus, adic 1 . Atunci: 12
2 =
1 1 1 1 + + = . 12 12 12 4 5 1 i 4 = . 4 12 1 1 1 5 , , , ). 12 4 4 12
3 =
=(
definiiei 4.
d) Valoarea Shapley nu concord cu vectorul voturilor dat de
aciunilor deinute. Astfel 2 = 3 dei acionarul 3 posed mai multe aciuni ca acionarul 2. Acionarul 3 nu are posibiliti mai mari dect acionarul 2 de a
Teoria jocurilor
participa la o coaliie ctigtoare. Importana acionarului 4 este mai mare dect cea corespunztoare procentului aciunilor sale, iar a juctorului 1 este mai mic dect cea corespunztoare aciunilor sale. Dac acionarii ar deine respectiv 10, 30, 30, 30% din aciuni, oricare doi dintre acionarii 2, 3, 4 pot forma coaliii ctigtoare n timp ce acionarul 1 este lipsit de orice importan neputnd aduce nimic nici unei coaliii. Atunci valoarea jocului este vectorul: 1 1 1 , , ). 3 3 3
= (0,
jocul: B A A1 A2 A3 j
Rezolvare
B1 -4 8 -1 8
B2 4 6 0 6
B3 B4 2 5 1 5 11 7 -4 11
i
-4 5 -4
= 5 = 3 rezult c jocul are punct a, iar strategiile pure optime ale celor doi juctori sunt respectiv A2 i B3, iar valoarea jocului v = a23 = 5.
1 1 A= , pe cale matriceal. 6 0
Rezolvare
Jocul nu are punct a deoarece 6 i 1 nu sunt minime pe liniile lor. Vom folosi relaiile (9) de la 2.3.a. Cum A = -6 0 i:
0 1 A* = , JA* = (1, 1) 6 1
0 1 = (-6, -2); 6 1 1 = -8 1
A * JT 1 1 1/ 8 1 7 = = , de unde y = ( , ) T 8 8 JA * J 8 7 7 / 8 |A| 6 3 = . = T JA * J 8 4
6 2 1 5 3 4 1 5 2 2
Teoria jocurilor
Rezolvare
Observm c linia a cincea este dominat de linia a treia, deci vom renuna la linia a cincea i jocul va fi de forma 4 2,
6 2 1 5 A= . 3 4 1 5
Strategiile juctorului P2 verific relaiile: 6y1 2y2 v 5y1 + y2 v 3y1 + 4y2 v -y1 + 5y2 v y1 + y2 = 1 Punnd y1 = 1 y2 n primele 4 inegaliti, acestea devin: 6 8y2 v 5 4y2 v y2 + 3 v 6y2 1 v i sunt reprezentate grafic mai jos:
v 6 5 M 3 (d4) (d3) 5 4
(d2) 1 -1 -2 (d1) y2
unde am asociat fiecrei inegaliti (i), dreapta di, i = 1,4 , ce mparte semiplanele determinate de inegalitatea (i). Poriunea din plan cuprins ntre y2 = 0 i y2 = 1 (y2 este o probabilitate), i dedesubtul liniei frnte ngroate conine mulimea punctelor (y2, v) ce verific cele 4 inegaliti. Linia ngroat conine punctele cu cea mai mare valoare a lui v, iar dintre acestea punctul cu cea mai mic valoare dintre cele de pe linia frnt este M = d2 d3 i deci va avea coordonatele date de soluia sistemului: 5 4y2 = v y2 + 3 = v de unde y2 = 2 3 , y1 = iar v = 3, 4, deci y2 i v satisfac restriciile 2 i 3 cu 5 5
egaliti. Teorema ecarturilor ne spune c atunci componentele x2 i x3 din problema dual vor fi pozitive. 3 2 Deci strategia lui P2 este y = ( , ). 5 5 Soluia optim a juctorului P1 verific relaiile: 6x1 + 5x2 + 3x3 x4 v -2x1 + x2 + 4x3 + 5x4 v x1 + x2 + x3 + x4 = 1 n care x2, x3 > 0 iar x1 = x4 = 0. Atunci eliminnd prima i a patra linie din A va rezulta un joc redus cu matricea:
5 1 A1 = . 3 4
Determinarea strategiei lui P1 o vom face cu ajutorul formulelor (9) din 2.3.a, unde:
4 1 * * A1 = 17; A 1 = ; JA 1 = (1,1) 3 5
4 1 = (1, 4); 3 5
Teoria jocurilor
1 * T JA 1 J = (1, 4) = 5 deci: 1
x=
* JA1 1 4 1 4 1 i strategia lui = (1, 4) = ( , ), deci x2 = , x3 = * T JA1 J 5 5 5 5 5
P1 este x = (0,
1 4 , , 0). 5 5
4 1 2 1
0 2 1 3 4 5 . 3 1 1 1 2 3
Rezolvare
Aplicnd principiul strategiilor dominate observm c linia a doua are elementele respectiv mai mari ca linia a patra, deci o vom terge pe aceasta din urm. Coloana a treia domin coloana a patra, care va fi tears i matricea jocului se va restrnge la:
4 0 2 A = 1 3 4 . 2 3 1
Cercetm dac jocul este cu punct a, adugnd matricei A coloana
i (a celor mai mici elemente pe linie) i linia j (a celor mai mari elemente
pe coloan).
Obinem: A1 A2 A3 j B1 4 1 2 4 B2 0 3 3 3 B3 -2 4 1 4
i -2 1 1
de unde = maxi = 1, = minj = 3, deci , jocul nu are punct a, iar valoarea jocului v (1, 3).
a) Rezolvm nti problema pe cale matriceal, folosind formulele
A = -30;
9 6 6 A = 7 8 18 3 12 12
JA = ( 5,10, 0 ); A J T = ( 9, 3, 3); JA J T = 15
x= JA 1 1 2 = ( 5; 10, 0 ) = , , 0 T 15 JA J 3 3
AJ 1 3 1 1 = ( 9, 3, 3) = , , J= T 15 JA J 5 5 5
v=
A JA J
T
30 =2 15
Aplicm procedeul din observaia mai sus citat i verificm criteriul lui Neumann, astfel:
4 0 2 1 2 x A = , , 0 1 3 4 = (2, 2, 2 ) = 2J 3 3 2 3 1
Teoria jocurilor
4 0 2 3 / 5 2 A y = 1 3 4 1 / 5 = 2 = 2 J T 2 3 1 1 / 5 2
T
al jocului scris din punctul de vedere al celui de al doilea juctor cu strategia y = (y1 , y 2 , y 3 ) , va fi:
4 y1 2y 3 v y 1 + 3y 2 + 4 y 3 v 2 y 1 + 3y 2 + y 3 v y1 + y 2 + y 3 = 1; y j [0,1], j = 1,3 .
Cum v (1,3) deci este pozitiv, mprim relaiile de mai sus prin v i notm: Yj = yj v , j = 1,3
Deoarece P2 urmrete s fac minim v, atunci va dori s fac maxim 1 i obinem: v [max]g = 1 = Y1 + Y2 + Y3 v
4Y1
2Y3 1
Y1 + 3Y2 + 4Y3 1 2Y1 + 3Y2 + Y3 1 Yj 0 , j = 1,3 Aducem problema la forma standard i aplicm algoritmul simplex.
4Y1
2Y3 + Y4 = 1
B a4 a5 a6
0 1/6 1/4
a1 a5 a6
a1 a3 a6
Y1 = 1 / 3 , Y3 = 1 / 6 de unde y1 = v Y1 = 2 1 / 3 =
Teoria jocurilor
X1 =
1 1 , X 2 = , X 3 = 0 de unde : 6 3 2 1 1 1 2 x 1 = vX1 = 2 = ; x 2 = ; x 3 = 0 i x = , , 0 . 3 6 3 3 3
Observaie: Prin metoda b) strategia lui P1 este aceeai cu cea din a), dar strategia lui P2 difer. Acest lucru a aprut deoarece n rezolvarea prin simplex a problemei, n etapa de optim 2 = 0 dei a2 B. n acest caz problema are o infinitate de soluii. S mai gsim una continund simplexul cu nc o iteraie prin introducerea n baz a lui a2 i eliminarea lui a6.
a1 a3 a2
1 1 1 gj j=cj-gj
1 0 0 1 0
0 0 1 1 0
0 1 0 1 0
Dar Y1 =
3 1 1 , Y2 = , Y3 = , ce conduce la: 10 10 10
3 1 1 3 1 1 y1 = , y 2 = , y 3 = , adic y = , , soluie gsit i prin 5 5 5 5 5 5 metoda a). Dar dac o problem de programare liniar are dou soluii optime:
2 1 3 1 1 y = , 0, i y = , , ea va avea o infinitate de soluii optime, date 3 3 5 5 5
de combinaia liniar convex de y' i y''. Deci P2 are o infinitate de strategii date de:
1 2 3 1 1 y = y + (1 ) y = , 0, + (1 ) , , = 3 3 5 5 5 9 + 1 3 + 2 , , = , 0 1. 5 15 15
procedeul dat n paragraful 2.3.a, am fi gsit i alt soluie pentru jocul considerat i orice combinaie liniar convex de soluiile gsite ar fi fost tot o soluie a jocului, de unde infinitatea de soluii dat de algoritmul simplex.
5. S se rezolve jocul G = (A, B, f) n care matricea plilor A este: B A A1 A2 A3 Rezolvare
B1 3 6 2
B2 -1 8 5
B3 B4 0 3 1 7 5 3
Determinm valoarea inferioar i valoarea superioar ale jocului: i = min aij i v G = max i =
1 j 4 1 i 3
Avem:
B A A1 A2 A3 j
B1 3 6 2 6
B2 -1 8 5 8
B3 B4 0 3 1 3 7 5 3 7
i -1 3 1
1 = min3, -1, 0,7 = -1 2 = min6, 8, 3,5 = 3 3 = min2, 5, 1,3 = 1 de unde = max-1, 3, 1 = 3 = v G . 1 = max3, 6, 2 = 6; 2 = max-1, 8, 5 = 8;
Teoria jocurilor
3 = max0, 3, 1 = 3; = min6, 8, 3, 7 = 3 = v G .
4 = max7, 5, 3 = 7;
Cum vG = v G = 3, rezult c jocul are punct a i P1 va alege numai strategia A2 iar P2 numai B3, indiferent de numrul partidelor ce se joac.
6. S se rezolve jocul matriceal G = (A, B, f) asociat unei situaii de
B1 0 -2 1
B2 -5 2 -1
B3 2 -1 1
B1 0 -2 1 1
B2 -5 2 -1 2
B3 i 2 -1 1 2 -5 -2 -1
Din vG v G rezult c jocul nu are punct a i valoarea lui v (-1, 1). Cutm strategiile mixte x = (x1, x2, x3) pentru P1 i y = (y1, y2, y3) pentru P2, prin intermediul programrii liniare. Mai nti transformm elementele matricei A, pentru a avea v > 0.
Jocul corespunztor matricei A va avea aceleai strategii mixte optime ca jocul iniial, doar valoarea jocului este v = v + 2, adic cu 2 mai mare dect valoarea jocului iniial. Pentru P2 problema de programare liniar ce trebuie rezolvat va fi: 2y1 3y2 + 4y3 v 4y2 + y3 v 3y1 + y2 + 3y3 v y1 + y2 + y3 = 1 yj 0, j = 1,3 Cu v > 0, Yj = [max]g = yj v i
1 = [max]g, avem: v
1 = Y1 + Y2 + Y3 v
Teoria jocurilor
B a4 a5 a6 a4 a2 a6
a4 a2 a1
1 a1 2 0 3 0 1 4 0 3 0 1 0 0 1 1 0
1 a2 -3 4 1 0 1 0 1 0 1 0 0 1 0 1 0
1 a3 4 1 3 0 1 19/4 1/4 11/4 1/4 3/4 13/12 1/4 11/12 7/6 -1/6
0 a4 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0
0 a5 0 1 0 0 0 3/4 1/4 -1/4 1/4 -1/4 13/12 1/4 -1/2 1/6 -1/6
1/4 1/3
7/16 3/12
1 1 = , de unde v = 2 v 2
1 1 1 1 1 , de unde y1 = 2 = ; Y2 = , de unde y2 = , 4 4 2 4 2 y3 = 0;
X2 = deci: x = (0,
tip. Cantitatea necesar i condiiile de aprovizionare sunt date n urmtorul tabel [10]:
Dac aprovizionarea se face vara, preul unitar este de 60 u.m./t. Se cere: a) s se scrie matricea plilor tiind c aprovizionarea se face n timpul verii; b) s se decid strategia prin criteriul maximin; c) s se decid strategia prin criteriul minimax; d) s se decid strategia prin criteriul Savage; e) s se decid strategia cnd strile iernii sunt egal probabile; alternativ, cnd probabilitile sunt respectiv 0,2; 0,5 i 0,3; f) pentru = 0,75 s se determine strategia optim prin criteriul Hurwicz.
Rezolvare a) Matricea asociat jocului generat de problema dat va fi:
Strategia iernii uoar Cantitatea S1:4t contractat A1:4t -240 A2:5t -300 A3:6t -360
unde, de exemplu, elementul de pe linia lui A2 i coloana lui S3 s-a calculat astfel: s-au cumprat 5t a cte 60 u.m. pentru care s-au pltit 300 u.m.; iarna
Teoria jocurilor
fiind grea, mai este nevoie de o ton ce se cumpr iarna cu preul de 80 u.m., deci n total cheltuielile vor fi de 380 sau n matricea ctigurilor lui P1 vom scrie -380.
b) n aplicarea criteriului maximin se alege minimul elementelor de
pe fiecare linie i dintre acestea se determin maximul, astfel: A1 -400 A2 -380 A3 -360
fiecare linie i apoi determinarea celui mai mic dintre acestea. A1 -240 A2 -300 A3 -360
Determinm apoi n R cel mai mare element pe fiecare linie i apoi cel mai mic dintre acestea. Obinem: A1 40 A2 60 A3 120
cheltuielile medii pentru fiecare strategie Ai, i = 1,3 . Astfel: (1, y) = 1 1 1 955 (-240) + (-315) + (-400) = 3 3 3 3 980 1080 i (3, y) = . 3 3
(2, y) = -
Cea mai mare dintre aceste sume este (1, y) i recomand A1. Dac strile nu sunt egal probabile ci au respectiv probabilitile: 0,2; 0,5; 0,3, cheltuielile medii vor fi: (1, y) = 0,2(-240) + 0,5(-315) + 0,3(-400) = -325, 5 (2, y) = 0,2(-300) + 0,5(-300) + 0,3(-380) = -324 (3, y) = 0,2(-360) + 0,5(-360) + 0,3(-360) = -360 i cea mai mic cheltuial este (2, y) i recomand A2.
f) Atam matricei iniiale A coloanele elementelor mi = min aij i
1 j 3
Ai A1 A2 A3
Si
Pentru = 0,75, corespunztor lui A1, obinem pe ultima coloan 160 0,75 400 = - 280; pentru A2, 80 0,75 380 = -320 i pentru A3, - 360. Cea mai mic cheltuial este pentru A1.
Teoria jocurilor
P2
Se observ mai nti c strategia A4 a juctorului P1 domin strict strategia A2 (oricare ar fi strategia de rspuns Bj a lui P2, avem a4j > a2j). Dup eliminarea lui A2, care nu afecteaz punctele de echilibru, observm c strategia B4 a lui P2 domin strict pe B3 (deoarece 2 > 0, 5 > 2 i 6 > 4). Dup ce B3 este suprimat i ea, obinem un tabel restrns. A1 A3 A4 B1 (5,4) (6,8) (3,2) B2 (3,1) (1,3) (4,7) B4 (4,2) (3,5) (2,6)
n aceast faz nu vom mai gsi strategii dominate. Urmnd procedura de determinare a rspunsurilor optime, pe linii i pe coloane, vom obine marcrile de mai jos: A1 A3 A4 B1 (5,4) (6,8) (3,2) B2 (3,1) (1,3) (4,7) B4 (4,2) (3,5) (2,6)
Cum singurele perechi de ctiguri cu dou sublinieri sunt (6,8) i (4,7), rezult c (A3, B1) i (A4, B2) sunt puncte de echilibru ale jocului (n strategii pure). Observnd ctigurile corespunztoare, se poate spune c
(A3, B1) este preferabil lui (A4, B2) pentru ambii juctori i deci poate constitui soluia jocului.
9. S se construiasc un joc bimatriceal care s admit un punct de
Fie jocul cu sum arbitrar dat prin matricea: A1 A2 B1 (4,5) (2,6) B2 (3,4) (5,7)
Se observ, fr dificultate, c (A1, B1) i (A2, B2) sunt puncte de echilibru Nash al jocului. n acelai timp, avem valorile maximin:
max min aij = maxmin4,3, min2,5 = max3,2 = 3
i =1, 2 j=1, 2
Deci A1 e strategia maximin a lui P1 i B1 e strategia maximin a lui P2. Se confirm, pe de alt parte, faptul c orice punct de echilibru i promite fiecrui juctor un ctig mai mare sau egal cu valoarea maximin corespunztoare lui a jocului.
10. S se arate c jocul n form normal de mai jos nu admite
puncte de echilibru Nash n strategii mixte: A1 A2 B1 (1,0) (0,3) B2 (1,2) (0,1) B3 (0,1) (2,0)
Teoria jocurilor
Rezolvare
Fie (p, q, 1 p q) o strategie mixt pe B = B1, B2, B3. Avem deci p, q 0 i p + q 1. Cutm rspunsul optim al lui P1 la aceast strategie a lui P2. Dac P1 folosete strategia A1 atunci i revine un ctig mediu egal cu p + q, iar dac folosete strategia A2, ctigul mediu este 2(1 p q). Comparndu-le, se deduce imediat c dac p + q [0, 2/3) cel mai bun rspuns este A2 n timp ce pentru p + q (2/3, 1], cel mai bun rspuns este A1. Cazul p + q = 2 nu face deosebire ntre A1 i A2 ca replici optime 3
ale lui P1. Dac vom considera o strategie mixt (r, 1 r) pe A = A1, A2, 0 r 1, ctigurile medii ale lui P2 vor fi egale cu 3 3r, r + 1 sau r, dup cum folosete strategiile pure B1, B2 sau B3, respectiv. Din inegalitile 3 3r > r + 1 > r reiese c rspunsul optim al lui P2 este B1, pentru r< 1 1 1 i B2, pentru r > . n cazul r = , se rein ca cel mai bun rspuns 2 2 2 S presupunem c punctele de echilibru ale jocului sunt de forma ((r*, 1 r*), (p*, q*, 1 p* - q*)). Vom analiza situaiile posibile pentru r*:
I.
Dac r* [0,
1 ), rspunsul optim al lui P2 este B1, cruia i-ar 2 2 i, n replic, am avea strategia 3
optim A1 a lui P1. Cum A1 poate fi identificat cu strategia mixt (1, 0), rezult r* = 1, contrazicnd ipoteza iniial;
II. n cazul r* =
(, 1-, 0), 0 1 este un rspuns optim. Discuia continu ca mai nainte i se ajunge la concluzia r* = 1
III. Dac r* (
1 optim al lui P1 e din nou A1. Obinem, ca mai sus, r*= 1( ,1); 2
IV. Ultima posibilitate, r* = 1 ne conduce la o strategie de rspuns
cu p* = 0, q* = 1 i, de aceast dat, cu rspunsul n oglind al lui P1, lanul deduciilor se nchide. Am obinut astfel un punct de echilibru n strategii pure, ((1,0), (0,1,0)), fapt ce clarific cerina problemei vis--vis de teorema lui Nash. S mai observm c, deoarece strategia B3 este strict dominat, componenta corespunztoare ei ntr-o strategie optim a lui P2 nu putea fi dect nul.
11. ([12]) Dou firme cu profile asemntoare de activitate ofer
fiecare cte un loc de munc. S presupunem c se pltesc salarii diferite: firma i pltete salariul si, unde (1/2) s1 < s2 < 2s1. S presupunem c exist doi lucrtori ce doresc s se angajeze, dar fiecare nu poate opta dect pentru o singur firm, acest lucru fcndu-se simultan. Dac numai cte un singur lucrtor i ofer serviciile unei firme, el este angajat. Dac ambii lucrtori opteaz pentru aceeai firm, aceasta angajeaz pe unul dintre ei, la ntmplare, iar cellalt rmne, pe mai departe, fr serviciu (i cu o plat presupus nul). S se gseasc soluia n strategii de echilibru Nash a acestui joc.
Teoria jocurilor
Rezolvare
Vom construi pentru nceput forma normal a jocului descris. Juctorii sunt cei doi lucrtori, strategiile lor constnd din opiunile pe care le fac pentru firma 1 sau firma 2 i pe care le notm cu A1, A2, respectiv B1, B2. Vom nota, ca de obicei, cu f1(,) i f2(,) respectiv, funciile de ctig ale juctorilor. Considernd utilitile imediate ale celor doi lucrtori, rezultate n urma alegerilor fcute, putem construi urmtoarea matrice de pli (n ipoteza anselor egale): A1 A2 B1 1 1 ( s1, s1) 2 2 (s2,s1) B2 (s1,s2) 1 1 ( s2, s2) 2 2
de unde rezult c (A1, B2) este punct de echilibru Nash. Asemntor, obinem relaiile: f1(A2, B1) = s2 > f2(A2, B1) = s1 > 1 s1 = f1(A1, B1) 2 1 s2 = f2(A2, B2) 2
ceea ce arat c i (A2, B1) este un punct de echilibru Nash. Faptul c fiecare lucrtor este angajat dac se opteaz pentru una sau cealalt dintre perechile de strategii discutate vine n acord cu ideea de echilibru, chiar dac unul dintre juctori poate s nu fie mulumit pe deplin cu salariul pe care l obine.
Dac fiecare juctor ine la ansa sa de a fi angajat i de a primi un salariu mai bun, atunci are sens considerarea strategiilor mixte. Fie (y, 1-y) o strategie mixt a lui P2. Atunci ctigul mediu al lui P1 va fi dat de: 1 1 ys1 + (1 y)s1 = s1 - ys1, sau 2 2 ys2 + A1 sau A2. Din inegalitatea s1 1 1 1 ys1 > s2 + ys2, rezult c pentru 2 2 2 1 1 1 (1 y) s2 = s2 + ys2, dup cum folosete strategia pur 2 2 2
2s s y 0, 1 2 cel mai bun rspuns al lui P1 la strategia mixt a lui P2 este + s s 1 2 2s1 s 2 A1, iar pentru y s + s ,1] , acesta este A2 (s observm c s1 < 2s2 e 1 2 echivalent cu 2s1 s2 < s1 + s2). O analiz similar se face pornind de la o strategie mixt (x, 1 x) pe A1, A2. Urmnd procedeul de rezolvare descris n soluia la problema 10, vom obine urmtorul punct de echilibru Nash n strategii mixte: 2s1 s 2 2s 2 s1 2s1 s 2 2s 2 s1 s + s , s + s , s + s , s + s . 1 2 1 2 1 2 1 2 Desigur c n acest exemplu de joc nu se pune problema repetrii sale de un numr de ori care s permit alternarea strategiilor. Metoda de decizie pentru oricare juctor este s foloseasc un generator de numere aleatoare (de tipul funciei RND a unui calculator de buzunar); dac valoarea generat se gsete n intervalul (0, atunci el va alege strategia A1(B1), altfel va juca A2(B2). 2s1 s 2 ), s1 + s 2