Sunteți pe pagina 1din 11

Capitolul 4 TEORIA DECIZIEI

Objective: insusirea de catre studenti a regulilor de luare a unei decizii optime a rotiunii de joc
determinist si aleator si a notiunii de lant !ar"ov#
Cuprins:
4#$ Decizii optime dupa di%erite reguli
4#& 'trategii optime in reoria jocurilor
4#( )anturi !ar"ov
4#4 Rezumat
4#* Intrebari
4#+ ,ibliogra%ie
Cuvinte-c.eie: decizie optima joc matricial lant !ar"ov
4#$ Decizii optime dupa di%erite reguli
/n proces decizional este %ormat din:
$0 !ultimea variantelor 1$###1
m
2
&0 !ultimea starilor 'I###'n2
(0 !ultimea valorilor economice a
u
ale %iecarei variante 1$ in raport cu %iecare stare 'i#
40 !ultimea probabilitatilor ale starilor 'I###'n 34i5###5pr 6 $0#
'intetic procesul decizional are %orma de tabel:
'TART --7
1ARIA8TE "
*$ ########################### '9
1
$
1
m
al
l ################################################
a
m
:###########################
am
am#
4robabilitati p$ ###########################
4n
4.1.1 Decizii optime in condi/ii de incertitudine
In acest caz probabili%atile pl###p9 nu se cunosc#
Alegerea deciziei optime se is dupa una din regulile:
$0 Regula optimistului3ma;i-ma;0
1arianta optima 1o este aceea dintre variantele pentru care avem:
!a;3!a; a
u
0
3cea mai mare valoare din valorile economice ma;ime ale liniilor0#
II0 Regula pesimistului 3ma;i-min0
1arianta optima 1
o
este aceea dintre variantele 1
$
####19 pentru care avem:
!a;3!in a 0
3cea mai mare valoare din valorile economice minime ale liniilor0#
Ill0 Re<uia rni;ta 3=unvicz0
>ie ae#?@2 I: coe%icientul de optimism si A- a E ?@2 $: coe%icientul de pesimism#
1arianta optima 1
o
este aceea dintre variantele 1
i
19 pentru care avem:
!a;?a B !a; a
l
5 3$C a0 B !in a
# :
:
3cea mai mare din valorile economice mi;te ale liniilor0#
I10 Regula mediei 3)aplace0
1arianta optima 1
o
este aceea dintre variantele 1
$
###19 pentru care avem:
!a;3DDDDDDDDDDDD5 5 a
rn 0
3cea mai mare dintre mediile valorilor economice ale liniilor0#
10 Regula regretului3'avage0
Regretul variantei %ata de starea '
i
este:
b
ij
6 !a; a
u
C
1arianta optima 1
o
este aceea dintre variantele pentru care avem:
!i n3 !a; b
i 0
3cel mai mic din regreteie ma;ime ale liniilor0#
4.1.2 Decizii optitne in eondifii de rise
Daca se cunosc probabilitatile p
i
###p9 ale starilor vom calcula mediile: 6
a ipl5###5alo49
pm 6 am p 5B B B 5amnpn
abaterile-standard 3riscurile0:
ip$&
E###Eainpn
&
pi
&
$
$F&
M
=
[am i pi
t
5### 5am
pn& pn$&:
1/2 si
coe%icientii de risc:
ri 6 F r9 6 G
m
Ilm#
$H*
1arianta optima in conditii de rise 1o va %i aceea dintre variantele 1i###1m pentru care
avem:
!a ; I s a u !i n r
J
E;emplu
/n agent economic are un magazin si vrea sa !aresca vanzarile#
1 ariante:
1K 6 Construirea unui magazin nou in alta zona:
1& 6 inc.irierea unui spatiu nou de vanzare in a"a zona2
1( 6 E;tinderea magazinulut e;istent2
14 6 !arirea nernarelui de ore intre care este dese.is magazineJ e;istent#
'tari:
*$ 6 Cerere mare2
*& 6 Cerere mijlocie2
'( 6 Cerere mica#
Tabloul decizional are %orma:
'TARI --7
1ARIA8TE le
'I *&
'(
1
I
*@ (@ $@
1& L@ M@ +@
1( $@@ H@ &@
14 L@ M@ *@
4robabilitati @#* @#& @#(
a0 sa se aleaga decizia optima dad# nu se cunosc probabilitatile starilor 'I *& '(
3incertitudine0#
b0 'a se aleaga decizia optima daca se cunosc probabilitatile starilor 'I '#0 '( 3rise0#
Solutie
a0 $0 !a;3a
l j
06 *@ 2 !a;3a
&j
0 6L@ 2 !a;3a
(
#06$@@ 2 !a;3a
4$
06L@
K B
!a;3*@2L@2$@@2L@06$@@
deci 1( este varianta optima dupd regula optimistului#
=0 !in3a
$
0--$@ 2 !in3a
&j
06 +@ 2 !in3a
(
06 &@ 2 !in3a
4j
06 *@
!a;3$@2+@2&@2*@06 +@
deci 1& este varianta optima dupa regula pesimistului#
III0 >ie a 6 @#4
$ H +
a B !a;3a
iK
05 3$ - a
B !a;3a
&K
0 5 3$ a
B !a;3a
(i
0 5 3$ a
B !a;3a
4K
0 5 3$
a0 B !in3a
&K
06 @#4 ; *@ 5 @#+ ;$@ 6 &+ 2
!a;3&+2 +L2 *&2 +&0 6 +L
deci 1& este varianta optima dupd criteriul mi;t#
I 1 0 (
D(@ 2
a
&$
5a
&&
5 a
&( 6M@2
(
a
($
5 a
(&
5 a
(( 6 M@ 2
a
4$
5
4&
5 a
4( D ++#M 2
( (
!a;3(@2 M@2 M@2 ++#M0 6 M@
deci variantele 1& si 1( sunt optime dupd regula mediei#
I10 1aloarea ma;ima aN pentru i 6 $&(4 si j 6 $&( este egala cu $@@ deci tabloul regretelor bij
este:
'TARA ---7
1ARIA8TE 4
'$ '& '(
1I *@ M@ H@
1& &@ (@ 4@
1( @ $@ L@
14 &@ (@ *@
!a;3b
li
0 6 H@ 2 !a;3b
&K
0 6 4@ 2 !a;3b
($
0 6 L@ 2 I1I#;3b 0 6 *@ 2
$ #$ K
!in 3H@24@2L@2*@064@
deci 1& este varianta optima dupd regula regretelor#
b0 Avem mediile:
$$$ 6 *@ ; @#* 5(@ ; @#& 5$@ ; @#( 6 (42 @& L@ ; @#* 5M@ ; @#& 5+@ ; @#( 6 M&2 g(6
$@@ ; @#* 5H@ ; @#& 5&@ ; @#( 6 M42 p#4 6L*@ ; @#* 5M@ ; @#& 5*@ ; @#( 6 +H2
!a;3(42 M&2 M42 +H0 6 M4
deci varianta 1( este optima dupa criteriul mediei ma;ime#
Avem riscurile:
61 6 ?*@
&
; @#* 5(@
&
; @#& 5$@
&
; @#( - (4&:
$ F & 6
$M#442
6& 6 ?L@
&
; @#* 5M@
&
; @#& 5+@
&
; @#( - M&
&
:
$$&
6 L#M&2
+( 6 :$@@
&
O @#* 5H@
&
; @#& 5&@
&
; @#( - M4
&
:
$
&
6 4L#4$2
a0 B !in3a
K
06 @#4 ; L@ 5 @#+ ; +@ 6 +L 2
a0 B !in3a
(K
06 @#4 ;$@@ 5 @#+ ; &@ 6 *& 2
a0 B !in3a
4j
0 6 @#4 ; L@ 5 @#+ ; *@ 6 +& 2
$HM
@4 6?L@
&
; @#* 5M@
&
; @#& 5*@
&
; @#( - +H
&
: P
&
6 $(2
r1C cr F C @#*$2 r& C 4$& 6 @#$&2 r(6 +( 4$( 6 @#+* 2 r4 C CT 4 ill @#$H2
!in 3@#*$2 @#$&2 @#+*2 @#$H0 6 @#$& deci varianta optima este 1
&
duna criteriul riscului
minim#
4rocesul decizional de mai sus este static adica valorile economice a2 j sunt constante
ceace este adevarat la un moment dat#
In realitate valorile economice
j
se sc.imba in timp decizii premature sau tardive
ajunaand sa %ie inoperante#
In procesul decizionai dinamie vorn avea:
a
tj
3t0 6 3O
i0
#t
&
$(9 #t 5 j2 3a o N2
j
Q @0
Aceste valori econornice au valori pozitive in intervalele
?3
C
@@J
$&
0 3-
&
@((0$ @
M
(i(53 A(@
$$&
0 F3-
& $$
d A
3$
J
$ 4
D ct i
n
unDe DD j 6 r Dj i i
I &
C
si au valoarea ma;ima pentru mornentul de timp%(2
(
F 3- & cc
j0# !omentul minim in luarea unei deeizii este:
T
$
6 !in
%
(
iK
#
A
I
#
K
# 3 c $ (
u

5 A
u
car eel ma;im este T
&
6 !a;
i
d
C& # a
Ij
i
C& #
R
a
u
4entru %iecare valoare concreta to ?T
i
2 T&: modelul devine static *i varianta optima 1o
se alege ca mai sus#
E;emplu
'TART - 'i *&
1ARIA8TE )
1$ -t
&
5$@t-&4 4
&
5+t-*
1& -t
&
5Mt-$& -t
&
5Mt-$@
vem 6 -t
&
5$@t-&4 7 @ pentru t ?42+:2
ai&3t0 6 4
&
5+t-* 7 @ pentru t E ?$2*:2
a&&3t0 6 4
&
5Mt-$& 7 @ pentru t e ?(24:2
a&&3t0 4
&
5Mt-$@ 7 @ pentru t e ?&2*:
Avem T$ 6 !! 342$2(2&0 6 $2 $
&
6 !a; 3+2*242*0 6 +#
4entru mice t e?$2+: modelul devine static *i se alege varianta optima 1o ca mai sus#
4#& 'trategii optime
4.2.1 Strategii deterministe optime
>ie I o multime de jucatori# >iecare jucator i El dispune de o multime ' de strategii
notate cu
!ultimea strategiilor alese cate una de %iecare jucator se numeste situatie *i are %orma
s 6
!ultimea tuturor situatiilor posibile este produsul cartezian ' 6 II ' cu i El#
$HL
>iecare jucator i El are %unctia de castle =i: '
-4
R, de%inita ast%el: in situatia s
jucatorul i jucatorul i realizeazd castigul = 3s0# 3s0 7 @ este castig iar = 3s0 Q @ este
pierdere#
'uma iocului este suma tuturor %unctiilor de castig ale tuturor jucatorilor adica este E
=3s0 cu r el si s E '#
'ituatia s este %avorabild jucatorului i E I daca = 3s0 este ma;ima in raport cu mate
strategiile s e 'i alese de acest jucator# 'ituatia s %avorabila tuturor jucatorilor se numeste
situatie de ec.ilibru a jocului#
Once joe poate %i cu coalitie sau %are coalitie# Coalitia este de%inita ca un grup de
jucator2 R
Ea poate %l privitN Ca un jucator <ile cu %unctia de castig =R 3s0 6 = 3s0
Data $ con%ine nurnai doi jueatori avem un ion antagonic si suma jocului este nula:
HI 3s0 5 =&3s0 6 @
S$ un joc cu coalitie poate %i privit ca un joc antagonic cu jucatorii unici R si I T R#
Kocurile antagonice cu coalitie modeleaza relatiile intre om si nature in asigurarea
conditiilor optime de vegetatie a piantelor de culturd si respectiv de intretinere optima a
animalelor domestice#
'trategiile ne%avorabile o%erite de nature micsoreaza %unctia de castig a productiei
vegetate respectiv zoote.nice2 strategiile compensatoare ale omului limiteaza aceasta#
micsorare#
Ast%el seceta este compensate de irigatii e;cesul de umiditate este compensat de
indiguiri si drenaje scaderea %ertilitatii solului este compensate de ingrasaminte scaderea
proli%icitatii animalelor domestice este compensate prin insamantari arti%iciale cresterea
morlalitatil la animate este compensate prin masuri sanitar-veterinare etc#
Kocul antagonic in care %iecare din cei doi jucatori are un numar %init de strategii se
numeste joc matricial# >ie 'I 6 U$###mV multimea strategiilor primului jucator si '& 6
U $ ###nV multimea strategiilor celui de al doilea jucator# 30rice situatie va avea %orma s 6
3ij0 cu i E 'i j E '&# 8otand cu atj 6 =i3s0 6 - =& 3s0 obtinem matricea iocului ! 6 3at0 de
tip m ; n#
aij 7 @ este castig pentru primul jucator si pierdere pentru al doilea jucator iar Q @
este pierdere pentru primul jucator si castig pentru al doilea jucator#
'ituatia s
W
6 3 i
W
j
W
0 este situatie de ec.ilibru sau punct-sa pentru joc clad pentru once
strategic i E 'I si pentru once strategic a celui de al doilea jucator j e '& avern a a @
#$
4#
at#
K
#
Teorema 4#$
@ conditie necesara si su%icienta de e;istents a unei situatii de ec.ilibru a unui joc
matricial este data de conditia minima;:
ma; min a 6 min ma; a
t i
Demonstratia se poate gasi in lucrari de teoria jocurilor din bibliogra%ia generals#
1aloarea comund a celor doi membri ai egalitatii din teorema (#$ se numeste valoarea
iocului si se noteza cu v3!0# Rezolvarea unui joc matricial consta in gasirea situatiei situatiei
de ec.ilibru Si a valorii jocului#
In matricea jocului ! 6 3a
i
0 cu m linii si n coloane se determine elementele minime de
pe %iecare din cele m linii# Cel mai mare din aceste elemente a%lat pe linia i
W
de%ineste strategia
optima i
W
a primului jucator#
$HH
In matricea jocului ! 6 3a
j
0 cu m linii Xi n coloane se determind elementele ma;ime
de pe %iecare din cele n coloane# Cel mai mic din aceste elemente a%lat pe coloana j
W
de%inete
strategia optimaj
W
a celui de al doilea jucator#
1aloarea jocului este:
v3!0 6 min a
I
# 6 ma; a #
E;emplu
'Y se rezolve jocul cu matricea:
3 & - ( @
!6$ 4 * -& I
L + &
Avem minU&(-$V6 -(2 minU42*2-&V 6 - &2 minUL2+2&V 6 & deci ma;U-(2-&2&V 6 & i i
W
6 (#
Avem ma;U&242LV 6 L2 ma;U-(2*2+V 6 +2 ma;U$2-&&V 6 & deci min UL2+2&V 6 & Xi j
W
6 (
Conditia minima; este indeplinita situatia de ec.ilibru este s
W
6 3i
W
6(2 j
W
6(0 iar valoarea
jocului este v3!0 6 &#
4.2.2 Strategii aleatoare optime
Kocul matricial prezentat mai sus a %ost un joc matricial determinist deoarece strategiile
sale i j au %ost deterministe 3alese cu probabilitatea $ i nealese cu probabilitatea @0#
Kocurile matriciale aleatoare %olosesc strategii i j aleatoare 3alese cu probabilitati p9 Z
j
cuprinse intre @ 'i $0#
>ie jocul matricial aleator cu matricea ! 6 3a$0 de tip m ; n i strategiile aleatoare p6
3p$###p
n
0 a primului jucator 3p$5###5pni 6 $0 i Z 6 3Zi###Z
n
0 a celui de al doilea jucator
3Z$E# n
6 $
0#
'ituatia aleatoare va fi s 6 3pZ0#
1aloarea medie a %unctiei de ca4tig pentru situaia aleatoare s 6 3pZ0 va %i:
m n
=3'06F a
i j
p
i
Z
j
6 p!Z
$6$ j6$
'ituatia aleatoare s
W
6 3p
W
Z
W
0 este situatie de ec.ilibru sau punct-a pentru joc dace
pentru orice strategie aleatoare pE '$ a primului jucator Xi pentru orice strategie aleatoare Z E
'& a celui de al doilea jucator avem:
p!ZWT
p
Wm
Z
WT
p
Wme
Teorema 4.2
'ituatia aleatoare de ec.ilibru s
W
e;ista totdeauna deoarece pentru orice matrice ! avem
indeplinita conditia minima;:
ma; mi n p!g
T
6 mi n ma; p!Z
T
Demonstratia teoremei se poate gasi in lucrare#
1aloarea comund a celor doi membri ai egalitatii di teorema (#& se numeXte valoarea
jocului i se noteaza cu v3!0# Avem:
& @ @
ma ; mi n
a u
v 3 !0 mi n ma ; a
i l
deoarece numarul strategiilor aleatoare pZ este mai mare ca numarul strategiilor deterministe j deci
minimul scade iar ma;imul creste prin trecerea de la i, j la pZ#
Rezolvarea jocului matricial consta in gasirea situatiei aleatoare de ec.ilibru si a valorii
jocului#
E;emplu
4entru jocul matricial aleator cu matricea ! 63aid0 de tip & ; & avem situatia aleatoare de
ec.ilibru
sW 3pW ZW0
4
W
6 33a&& C a&$0 F 3air a$&-a&$5a&&02 - a$&0 F 3ai a$&-azi5a&&@2
ZW 6 33a&&# C a$&0 F 3an- a$&-a&i5a&&02 3ai i C a&i0 F 3air a$&-
a&$5a&&00 iar valoarea jocului va %i:
v3!0 6 3a$ i a&& C at

a&$0 F 3au
-
arrazi5a&&0
/n joc matricial este simetric daca matricea sa este antisimetrica adica 6 - ag#
In acst caz multimea strategiilor optime ale celor doi jucatori coincud si valiarea jocului este
@#
E;ists o stransa legatura intre jocurile matriciale aleatoare simetrice si problemele de
optimizare duale: din demonstratia teoremei de dualitate $#$ din sectiunea $#$ rezulta ca jocul
matricial simetric cu matricea antisimetrica:
3@ -AT c $
!6 A @ - b
c 0J
T bT
are strategia optima comund a ambilor jucatori s 6 3pWZW0 unde pW6ZW63;WNWt0 3t#;t#Nt0
unde si N 6 cunt optime pentru problemele duale:
A; 7Db A
T
N c
; 7 @ N @
%6 c
T
;6minim g6
T
Nr-ma;im
iar t 6 $ F 5 7 a
E;emplu
'Y se a%le strategia optima comuna a ambilor jucatori pentru jocul simetric cu
matricea:
@$
3 @ @ -& -4 $
@ @ -( -( $
!6 & ( @ @ - +
4 ( @ @ - L
+ L
'olutie
Din matricea jocului ! rezulta:
3
& (
v 3
+ T2
c
i
###
L
# $ l
A6 2 b-
-
-
T 4 (
0
I J
deci avem perec.ea de probleme duale:
&;
$
5 (;
&
+ 4;
5 (;
&
[D L
;9;
&
&N
$
C 4N
&

(N 5 (N
2

$ N
&
@
%6;
$
5;
&
6minim 2 g6+N 5LN
&
6ma;im
Rezolvind duala cu metoda simple; obtinem solutiile optime ale ambelor probleme:
; 6 3$ 4F(02 N 6 3$F+2$F+0#
Avem t 6 $ F 3$ 5 4F(5$F+5$F+5$0 6 + F && deci pW6ZW6 3+F&&:LF&&2$F&&2$F&&2+F&&0 si
v3!06@#
9.3 Lanturi IVEarkov finite
@ functie aleatoare este o %unctie de variabila nealeatoare t notata cu O3t0 care pentru
%iecare valoare %i;atA t
o
a Iui t este variabilA aleatoare O3to0#
Exemplu X(t ! tO#
4entru t 6 1 avem variabila aleatoare O3I0 6 O iar pentru t 6 & avem variabila aleatoare
O3&0 6 &O#
Sec"iune a unei %unctii aleatoare O3t0 este variabila aleatoare O3t
o
0 deci %unctia aleatoare
este o multime UO3t0V de variabile aleatoare care depind de parametrul t#
Realizarea (traiectoria, functia de sondai) a unei %unctii aleatoare O3t0 este %unctia
nealeatoare de t in care variabila aleatoare O is o valoare data intr-o e;perientd concreta#
Exemplu. 4entru O3t0 6 tO dacA in prima e;perienta# avem O 6 * atunci prima
realizare este ;
i
3t0 6 't iar dacA in a $$-a e;perienta avem O 6 & atunci a doua realizare este
;
&
3t0 6 &t#
Deci o %unctie aleatoare este multimea tuturor realizarilor sale posibile#
/n proces aleator este o %unctie aleatoare O3t0 in care variabila t este timing.
&@&
In acest sens productia agricola vegetala si zoote.nica sunt procese aleatoare#
Daca t is un sir de valori to ### t
o
atunci procesul aleator este un fir aleator
#X(to, X(t,, X(t$, ...% numit si tang aleator.
/n e;emplu remarcabil de sir aleator este lantul !ar"ov %init#
>ie t E U@ $ ### nV si variabilele aleatoare O3@0 O3$0 ### O3n0# Steirile lantului finit
sunt numerele reale ;o ;i #B B ;n#
Daca realizarea evenimentului O3"0 6 ;
i
nu depinde decal de realizarea evenirnentului
precedent O3" C $0 6 pentru orice $ j " e U@ $ nV lantul %init se nurneste &an' (ar)o*
+u_ un nutria,, t-iit de sa)i.
4robabiiiiaMM643O3@0 6 ;0 se numesc initiate iar nrobabili%atile pi:
3"0 6 43O3"0 6 ;
j
$O33 C$0 6 ;
i
0 se numesc pro.a.ilitati de trecere din stares r in s-eet(
'e presupune ca
#
lantul !ar"ov este /mo*en adica probabilitatile de trecere nu depind
de " deci 6 po# >ie ! 6 3pi0 matricea patratica a probabilitatilor de trecere de ordin n 5
I# Avem Ep
p
6$#
$6@
>ie 4d3m0 probabilitatea ca sa trecem din starea ;i in starea ;i dupa m pasi#
Avem 4o3$0 6 p
o
# >ie !
3$$$0
6 3pij3m00 m E 8 deci !3$0 6 !#
>ie A evenimentul ea dupa m pasi sistemul trece din starea ; in starea ;i deci 43A0
6 p
o
3m0 sa %ie ,
r
evenimentele ea dup# s pasi sistemul trece din starea ; in starea ;3@ Q r Q
n0 deci 43,
r
0 6 p
o
3s0#
4u3A0 este probabilitatea conditionata a realizarii lui A daca s-a realizat ,
r
adica
dupa# m C s pasi sistemul trece din starea ;
r
in starea ;
i
deci 4er3A0 6 pd3m-s0#
>ormula probabilitatii totale din teorema $#& are %orma:
43A0 -6 43( 0 B 4gr 3A0 adica
r6@
0. (m 0
r
(s0
i
(m 1 s
r6@
relatie numita egalitatea (ar)o*.
4entru tn-&2s 6 I egalitatea !ar"ov devine:
0
" (
2
! E 4er @0
r6@
'ub %orma matriciala avea: !
3&(
6!#! 6 !
&

4entru m6(2 s6& egalitatea !ar"ov devine:
4
u
3(0 6 4
.
# 3&04
d
3$0
r6@
sau matricial !
3(0
6 !
3&0
# ! 6 !
(
In general !e
n0
6 !
m
Daca cunoastem vectorul de lungi me n 5 $ al probabilitat ilor initiale
vo
D p o o l
pr o0 0
si matricea ! 6 3po0 de ordin n 5 $ a probabilitatilor de trecere atunci
dupa m pasi situatia lantului !ar"ov este data de produsul 1o!
3m0
6 1o !
m
#
Exemplu
@ %erma comercializeaza un produs pentru agricultural impreund cu alte 3Iota %irme#
>irma are initial o pondere pe piata produsului de 4*\ iar celelalte %irme au ponderile de
&*\ si respectiv (@\ deci 1o 6 3@#4* @#&* @#(@0#
4re%erintele eumparatorilor pentru produs de la cele trei %ame cunt relativ stabile si date
de matricea:
(0.80 0.10 0.101
M = 0.35 0.50 0.15 1
X 0.10 0.15 @# M*0
'e sere evolutia ponderilor pe piata ale celor trei %irme dup rn 6 + etape de vanzare#
Solufie
2
o
isd/ ! 3@#*@: @#$H2 @#($0
deci produsul de la %irma $ este in crestere cel al %irmei & in scadere iar cel at %irmei (
este stationar#

S-ar putea să vă placă și