Sunteți pe pagina 1din 3

TEMA NR.

2 LA DISCIPLINA TEORIA JOCURILOR îN TURISM

VEGHEŞ OVIDIU

octombrie 2011

Problemă de joc necooperativ bimatriceal


Un muncitor (M) lucreză pentru un patron (P). Muncitorul are în fiecare zi opţiuni: să num-
cească (m) sau să chiulească (c). Patronul poate să facă inspecţie (i) sau să facă inspecţie (ni).
Tinem cont de cheltuielile cu inspecţia pe care le are patronul, cheltuielile pe care le are munci-
torul pentru a putea desfăşura activitatea cerută de patron, salariul pe care patronul îl plăteşte
muncitorului pentru o zi de muncă. Dacă patronul îl prinde pe muncitor chiulind îi taie ziua de
muncă. Câştigurile nete (exprimate în unităţi monetare) ale muncitorului şi patronului aferente
unei zile de muncă sunt:
patron:
uM , uP i ni
muncitor: c 0, −1 6, −6 (p)
m 3, 29 3, 30 (1 − p)
(q) (1 − q)
Să se determine echilbrele Nash şi să se cerceteze implementarea
  lor.  
0 6 −1 −6
Rezolvare: Considerăm matricele C = [cij ]i,j=1,2 = şi D = [dij ]i,j=1,2 = .
3 3 29 30
Suntem în cadrul jocului în formă normală Γ = (N = {M, P } ; SM , SP ; uM , uP ), unde SM = {c, m},
SP = {i, ni} sunt mulţimile strategiilor pure ale celor 2 jucători, iar uM , uP : SM × SP → R, cu
uM (sM,i , sP,j ) = cij şi uP (sM,i , sP,j ) = dij sunt funcţiile de utilitate ale celor doi jucători.
Problema găsirii echilibrelor Nash în strategii pure cere găsirea (s∗M , s∗P ) ∈ SM × SP pentru care

uM (sM , s∗P )  uM (s∗M , s∗P ) , ∀sM ∈ SM
.
uP (s∗M , sP )  uP (s∗M , s∗P ) , ∀sP ∈ SP
Observăm uşor că acest joc nu are echilibru în strategii pure. Dacă patronul nu va inspecta, atunci
muncitorul preferă să chiulească. În consecinţă inspecţia este necesară. Dacă patronul decide
să inspecteze, iar muncitorul ştie acesta, atunci este mai bine să muncescă. Patronul ştiind că
muncitorul preferă atunci să muncescă este mai câştigat dacă nu face inspecţia.
uM , uP i ni
c 0,−1 6, −6
m 3, 29 3,30
Definim jocul extins Γe = (N; ΣM , ΣP ; um
M , uP ) atunci când se joacă strategiile mixte, unde
m

ΣM = {σM = (p, 1 − p) | p ∈ [0, 1]} ,


ΣP = {σ P = (q, 1 − q) | q ∈ [0, 1]} ,
iar um
M , uP : ΣM × ΣP → R, cu utilităţile medii ale celor doi jucători date de
m

  def.
umM (σ M , σ P ) = uM (sM , sP ) σM (sM ) σP (sP ) = −6pq + 3p + 3 = : ûm M (p, q) ,
sM ∈SM sP ∈SP
  def.
umP (σ M , σ P ) = uP (sM , sP ) σM (sM ) σP (sP ) = 6pq − 36p − q + 30 = : ûm
P (p, q) .
sM ∈SM sP ∈SP

Am definit ûm m
M , ûP : [0, 1] × [0, 1] → R.
1
2 VEGHE Ş OVIDIU

Problema găsirii echilibrelor Nash în strategii mixte cere găsirea (σ ∗M , σ ∗P ) ∈ ΣM × ΣP pentru


care  m
uM (σM , σ∗P )  um M (σ M , σ P ) , ∀σ M ∈ ΣM .
∗ ∗

uP (σ M , σ P )  uP (σM , σ∗P ) , ∀σP ∈ ΣP


m ∗ m ∗

Conform teoremei lui Nash orice joc finit are un echilibru în strategii mixte, deci problema are
întotdeauna soluţie.

 6 − 6q , q ∈ [0; 1/2) "pentru p = 1"
max ûmM (p, q) = max (−6q + 3) p + 3 = 3 , q = 1/2 "pentru ∀p ∈ [0, 1] "
p∈[0,1] p∈[0,1] 
3  , q ∈ (1/2; 1] "pentru p = 0"
 30 − 36p , p ∈ [0; 1/6) "pentru q = 0"
m
max ûP (p, q) = max (6p − 1) q + (−36p + 30) = 24 , p = 1/6 "pentru ∀q ∈ [0, 1] "
q∈[0,1] q∈[0,1] 
29 − 30p , p ∈ (1/6; 1] "pentru q = 1"
Folosind calculele precedente, problema găsirii echilibrelor Nash în strategii mixte cere echivalent
găsirea (p∗ , q ∗ ) ∈ [0, 1] × [0, 1] ce verifică
q
1.0
 

  1 , q ∈ [0; 1/2)

 ∗ ∗ m ∗
0.8


 p ∈ BRS (q ) = arg max û M (p, q ) = [0, 1] , q = 1/2
 p∈[0,1] 
 0 , q ∈ (1/2; 1] 0.6
.

  0 , p ∈ [0; 1/6)

 0.4

 q ∗ ∈ BRH (p∗ ) = arg max ûm ∗
P (p , q) = [0, 1] , p = 1/6
 q∈[0,1] 
1 , p ∈ (1/6; 1] 0.2

p
0.2 0.4 0.6 0.8 1.0

Jocul are un singur echilibru Nash



(σ∗M , σ∗P ) = 16 , 56 , 12 , 12 pentru care câştigurile sunt (um∗


M , uP ) = (3, 24) ;
m∗

Optimele Pareto în strategii pure sunt (6, −6) şi (3, 30). Echilibrul determinat nu este optim
Pareto, pentru ca (3, 30) este un câştig de preferat faţă de (3, 24). Acest fapt este o invitaţie
la deviere. Dar acest optim Pareto nu poate fi impus în practică ca soluţie a jocului, pentru că
muncitorul preferă (6, −6). Mai precis schimabarea este indiferenta muncitorului şi preferată de
patron. Dacă patronul

să devieze σ P = (q, 1 − q), cu q ∈ (1/2; 1], muncitorul alege în loc de
alege
câştigurile medii 72 − q, 24 câştigurile medii (3, 30 − q), conform raţionalităţii sale pentru σM =
(0, 1) (muncitorul lucreză întotdeuna). Constatăm că echilibrul Nash nu poate fi implementat
pentru că muncitorul nu are forţa de a-şi penaliza patronul pentru devierea sa (preferinţele între
sistemele de câştiguri sunt slabe).

Bibliografie
[1] M.Roman. Jocuri şi negocieri. Ed.Aisteda, 2000. [capitolul 2]
TEM A NR.2 LA DISCIPLINA TEORIA JOCURILOR îN TURISM 3

Ciornă cu calculele
  efectuate
 
0 6 q
p 1−p = − (3p + 3) (q − 1) − q (3p − 3) = 3p − 6pq + 3
 3 3 1− q 
−1 −6 q
p 1−p = (36p − 30) (q − 1) − q (30p − 29) = 6pq − q − 36p + 30
29 30 1−q
Dacă muncitorul
 deviază:
 1 
0 6
p 1−p 2 =3
1
3 3
 2 1 
−1 −6
p 1−p 2
1 = 59
2 − 33p
29 30 2
Dacă patronul
 deviază:
 
1 5 0 6 q
6 6 = 72 − q
 3 3 1
 − q 
1 5 −1 −6 q
6 6 = 24
29 30 1−q
Soluţii ale joculuipreferate:
 
0 6 q
0 1 =3
 3 3 1− q 
−1 −6 q
0 1 = 30 − q
29 30 1−q

S-ar putea să vă placă și