Documente Academic
Documente Profesional
Documente Cultură
VARIABILE ALEATOARE
6.1. Variabile aleatoare. Repartiii de probabilitate. Funcii de repartiie
O variabil aleatoare este o cantitate msurat n legtur cu un experiment aleator, de exemplu, numrul de produse cu defeciuni n producia zilnic (lunar) a unei fabrici, numrul de utilaje defecte ntr-o secie, numrul de solicitani, la un moment dat, ntr-o baz de aprovizionare, concentraia polurii ntr-un mediu chimic etc. S considerm c ntr-un experiment aleator s-a realizat rezultatul i printr-o operaie de msurare, acestuia i asociem numrul real f(). n acest mod putem s stabilim o funcie f : R. Aceast funcie se numete variabil aleatoare dac mulimea { : f() < x} a evenimentelor elementare pentru care f() < x este un eveniment, oricare ar fi x real, adic (6.1.1) { : f() < x} K, pentru orice x real. ntr-o form mai general, fiind dat un cmp de probabilitate (, K, ), o funcie f : R se numete variabil aleatoare real, dac pentru orice mulime
borelian de pe dreapta real (A B R ) f 1 (A ) K . Condiia din definiie, referitoare la K, este necesar pentru a permite studiul probabilitilor valorilor lui f, n cazul n care aceasta are o mulime finit sau numrabil de valori sau a probabilitilor intervalelor de valori ale lui f, n cazul n care aceasta are o mulime infinit nenumrabil de valori. n cazul n care mulimea este finit sau numrabil, conceptul de variabil aleatoare coincide cu cel de funcie real definit pe . Variabile aleatoare pot fi definite i pe baza conceptului echivalent de funcie msurabil.
112 Variabile aleatoare - 6 O variabil aleatoare f : R se numete simpl, dac mulimea valorilor ei f() este finit. n acest caz f se poate exprima sub forma f = x i A i , unde
n i =1
x i R, f () = {x i }i =1, n , A i K
(6.1.2)
partiie) a lui . O variabil aleatoare f : R se numete discret dac mulimea valorilor ei f() este finit sau numrabil. Fie acum (, K, P) un cmp de probabilitate i R n , B R n spaiu msurabil cu familia mulimilor boreliene BR n (generat de mulimile deschise din R n ). O funcie {K, BR n } msurabil f : R n se numete vector aleator n-dimensional dac aleatoare real. Dac f : R n este un vector aleator atunci funcia Pf : B R n R definit prin Pf ( A ) = P f 1 ( A ) este o probabilitate pe BR n i se numete repartiia (distribuia) vectorului aleator f. Din cele de mai sus rezult c fiecrei variabile aleatoare (vector aleator) i corespunde o probabilitate pe (R , B R ) , respectiv
(R n , BR )
n
reduce, de altfel, studiul variabilelor aleatoare cu valori n R ( R n ). Propoziia 1. Fie (, K, P) un cmp de probabiliti i f : R o variabil aleatoare. Atunci au loc: { : f() x} K, { : f() x} K i { : f() > x} K, oricare ar fi x R Demonstraia rezult din faptul c oricare din familia de intervale {(-, x] : x R}, {[x, +) : x R}, {(x, +) : x R} constituie sisteme de generatori pentru B R .
113
Propoziia 2. Fie (, K, P) un cmp de probabilitate i f, g : R dou variabile aleatoare. Atunci: { : f() < g()} K, { : f() g()} K, { : f() = g()} K Demonstraie: S notm cu r1 , r2 ,K irul numerelor raionale. Atunci:
Teorema1. Fie (, K, P) un cmp de probabilitate. Dac k, R, > 0 i f, g sunt variabile aleatoare reale (f, g : R), atunci f + g, f - g, f g, kf, f sunt de asemenea variabile aleatoare.
1 dac g 0, f + k, g
( ) n 1 este un ir de variabile aleatoare reale ( f n : R) i , adic funcia f definit pe cu valori n R este limita punctual a irului ( f n ) n 1
Teorema2. Dac f n
aleatoare real. Fie (, K, P) un cmp de probabilitate. Dac mulimea valorilor unei variabile aleatoare f : R conine un interval mrginit sau nemrginit (are cardinalul strict mai mare dect cel al numerelor naturale), atunci variabila aleatoare se numete continu, de exemplu, dac o variabil aleatoare reprezint temperatura ntr-un proces de prelucrare termic, atunci aceasta variaz ntr-un interval, deci variabila este una continu. Mai sus am prezentat cteva definiii i proprieti utile ale variabilelor aleatoare, care se gsesc expuse mai pe larg i mai complet n cursurile i tratatele de teoria probabilitilor. Nu vom insista asupra acestora, mai ales din motivul c n aplicaiile practice ale teoriei probabilitilor, dar i teoretic se lucreaz mai puin cu variabilele aleatoare nsi i mai mult cu legile de probabilitate (repartiie) corespunztoare, care ofer informaii asupra valorilor variabilelor aleatoare i a probabilitilor cu care iau aceste valori. Pentru a descrie o variabil discret trebuie cunoscute valorile reale i probabilitile p i = P f = x i. , i N cu care aceste valori sunt luate. Mai sus am
114 Variabile aleatoare - 6 adic vom nelege P(f A) = P({ : f() A}) = = P f 1 ( A ) . Cu aceast notaie, n cazul unei variabile aleatoare discrete vom avea: (6.1.3)
P(f A ) =
x i A
pi .
pentru orice i
( )i N , unde A i = { : f ( ) = x i } formeaz
iN
U A i = i A i A j =
pi = 1 .
i =1
Repartiia unei variabile aleatoare discrete se obinuiete s se descrie cu ajutorul unui tablou de forma: (6.1.5)
x1 f: p1
i 1
x 2 K x i K . p 2 K p i K
ia valorile x i = i, i N cu
cu p + q = 1, p, q > 0. Aceast variabil aleatoare este probabilitile p i = pq descris complet din punct de vedere al teoriei probabilitilor de tabloul:
K i 1 2 K f: . i 1 K p pq K pq
O variabil aleatoare cu o astfel de repartiie se numete variabil aleatoare geometric sau cu repartiie geometric. Dac variabila aleatoare f este simpl, n (5) avem n rndul superior al tabloului un numr finit de valori, iar n cel inferior acelai numr de probabiliti al cror sum este 1. S considerm o variabil aleatoare care ia valorile i = 0 cu probabilitatea p 0 i i = 1 cu probabilitatea p1 , acesteia i va corespunde tabloul:
0 f: p0
1 cu p 0 + p1 = 1 . p1
Fie acum f o variabil aleatoare real definit pe cmpul de probabilitate (, K, P), cum f este o funcie (K , B R ) msurabil i B R = B({( , x ) : x R }) , repartiia lui f este complet determinat de probabilitile:
115
Ff ( x) = P( { : f ( ) < x}) .
Definiia 1. Funcia Ff : R [0, 1], definit prin (6) se numete funcia de repartiie a variabilei aleatoare f. Aceast funcie de repartiie nu determin n mod unic variabila aleatoare f, n sensul c pot exista variabile aleatoare reale diferite la care corespund prin (6) aceeai funcie de repartiie. Din punctul de vedere al teoriei probabilitilor aceste variabile aleatoare sunt considerate echivalente i le vom identifica. Definiia 2. Fie acum A K cu P(A) > 0, atunci funcia: Ff , A : R [0, 1] definit prin: (6.1.7)
Ff , A ( x) = PA ( { : f ( ) < x})
se numete funcia de repartiie a variabilei aleatoare f condiionat de evenimentul A. Fie f o variabil aleatoare discret care ia valorile x n cu probabilitile
Pn = P( f = x n ), atunci rezult c:
(6.1.8)
F( x) =
xn <x
Pn ,
sumarea din (8) fiind fcut pentru toate valorile lui n N, pentru care x n < x . Funcia de repartiie a unei variabile aleatoare discrete se numete funcie de repartiie de tip discret. S notm S x = F( x + 0) F( x 0) saltul funciei F n punctul x. Dac x este un punct de continuitate al lui F atunci S x = 0 iar n caz contrar S x > 0. Atunci: (6.1.9) unde x n
F( x) =
{ } n N
xn <x
Sx
Deoarece funcia F crete prin salturi n punctele de discontinuitate graficul su va fi o funcie n scar. S considerm urmtorul exemplu simplu. Exemplul 1. naintea punerii pe pia, un produs finit (utilaj) este supus la trei probe succesive de funcionare. Probabilitatea ca s treac de oricare din cele trei probe este de 0,8. Dac se presupune c cele trei ncercri sunt independente una de alta, s se determine:
116 Variabile aleatoare - 6 a) Distribuia variabilei aleatoare care reprezint numrul de probe trecute pn la prima nereuit; b) S se determine funcia de repartiie i s se construiasc graficul funciei de repartiie al variabilei aleatoare de la punctul a). Rezolvare: Notm cu f variabila aleatoare cerut, ea va avea o distribuie de forma:
0 1 2 3 f: . P( f = 0) P( f = 1) P( f = 2) P( f = 3)
Din modul cum a fost definit variabila aleatoare f rezult: P(f = 0) = 0,2 P(f = 1) = 0,8 0,2 = 0,16 P(f = 2) = 0,8 0,8 0,2 = 0,128 P(f = 3) = 0,8 0,8 0,8 = 0,512 deci:
117
Propoziia 3. Fie (, K, P) un cmp de probabilitate, c R i f, g variabile aleatoare reale simple, definite pe avnd distribuiile date prin:
xi f: p i i = 1, n
y j g: . q j j = 1, m
Atunci variabilele aleatoare cf, f + g, f g sunt deasemenea variabile aleatoare simple, avnd distribuiile date prin:
cx i cf : p i i = 1, n
xi + y j f + g: p ij i = 1, n, j = 1, m
xi y j , f g: p ij i = 1, n, j = 1, m
p ij = 1,
i =1 j=1
p ij = q j,
i =1
p ij = p i .
j=1
Fie (, K, P) un cmp de probabilitate i f, g : R dou variabile aleatoare. Pe baza conceptului de independen definit pentru evenimente se definesc variabilele aleatoare independente. Dac f i g sunt dou variabile aleatoare simple, cu repartiiile considerate mai sus, atunci ele sunt independente dac sistemele complete de evenimente A i i i = 1, n
( )
(B j ) j=1, m
(
( )
( )
i = 1, n i j = 1, m sau punnd n eviden variabilele nsi i valorile lor, f i g sunt independente dac P f = x i i g = y j = P(f = x i ) P g = y j ,
oricare ar fi i = 1, n i j = 1, m . n cazul cnd variabilele f i g sunt discrete cu o infinitate de valori relaiile de definiie sunt aceleai, doar c indicii i i j parcurg mulimi numrabile. Dac f i g sunt variabile aleatoare continue, atunci acestea sunt independente dac:
118 Variabile aleatoare - 6 P(f < x i g < y) = P(f < x) P(g < y), pentru orice x i y din R. O familie de variabile aleatoare f i , cu I cel mult numrabil, definite pe i I acelai cmp de probabilitate sunt independente dac, pentru orice submulime finit de indici i1 , i 2 ,K , i n I are loc:
( )
) (
) (
( )
B j = g = y j , j = 1, 2, 3, formeaz sisteme complete de evenimente. Se verific imediat c i evenimentele C ij = A i B j , i,j = 1,2,3 formeaz un sistem complet de
evenimente. Variabila aleatoare f + g ia valorile x i + y j , i, j = 1, 2, 3 cu probabilitile P C ij = P A i B j = P A i P B j (ntre variabilele f i g nu a fost dat nici un fel de dependen deci le considerm independente, ceea ce este echivalent cu faptul c sistemele de evenimente definite de ele sunt independente). Variabila aleatoare f g ia valorile x i y j , i, j = 1, 2, 3 cu probabilitile P C ij iar variabila aleatoare
( )
( ) (
f2
( )
( )
( )
ia valorile
x2 i , i = 1, 2, 3 cu probabilitile
119
6 7 8 9 5 f + g: , 0.04 0,13 0,39 0,37 0,07 5 6 8 10 12 15 18 4 f g: ; 0,04 0,05 0,01 0,08 0,1 0,3 0,35 0,07 4 9 1 f 2 : . 0,1 0,2 0,7
n continuare vom prezenta cteva proprieti ale funciei de repartiie asociate unei variabile aleatoare. Teorema 3: Fie (, K, P) un cmp de probabilitate i f o variabil aleatoare real definit pe . Atunci funcia de repartiie asociat acestei variabile aleatoare F: R [0, 1], prin F(x) = P(f < x) are urmtoarele proprieti: 1) F este monoton cresctoare, 2) lim F( x) = 0, lim F( x) = 1
x x
3) F este continu la stnga n orice punct x R. Demonstraie: Fie x1 , x 2 R . Dac x1 < x 2 , atunci datorit proprietii de monotonie a probabilitii,
F( x1 ) F( x 2 ) .
{ }
deci
lim F( x) = 0 .
{ }
ir
irul
{f < x n } n N
este
un
ascendent
de
evenimente
lim {f < y n } =
n =1
U {f < y n } = .
Din relaia de mai sus, innd seama de comutarea limitei cu probabilitatea pentru iruri ascendente sau descendente rezult:
, arbitrar, convergent ctre x. Atunci irul de 3) S lum un ir cresctor z n n N este ascendent i: evenimente f < z n n N
n
( )
lim {f < z n } =
n =1
U {f < z n } = {f < x} .
121
Teorema 4. Fie (, K, P) un cmp de probabilitate, f : R o variabil aleatoare i F : R [0, 1], funcia sa de repartiie. Atunci are loc: 1) Pentru orice x R, F(x + 0) = F(x) + P(f = x) i F este continu n x R dac i numai dac P(f = x) = 0; 2) Pentru intervalele mrginite, de extremiti a i b (a < b) are loc: P(a f < b) = F(b) - F(a) P(a < f < b) = F(b) - F(a + 0) P(a f b) = F(b + 0) - F(a) P(a < f b) = F(b +0) - F(a +0). Demonstraie: 1) Pentru a calcula limita la dreapta n punctul x, considerm un ir descresctor x n cu lim x n = x . irul de evenimente f < x n este un n N n N n ir descendent i are limita:
n
( )
lim {f < x n } =
n =1
De aici rezult:
{ f x} = { f < x} U{ f = x} , cu { f < x} I{ f = x} = ,
de unde rezult:
P( f x) = P( f < x) + P( f = x) = F( x) + P( f = x) sau
F(x + 0) = F(x) + P(f = 0) = 0,
relaie ce arat c f este continu n x dac i numai dac P(f = x) = 0. Pentru a demonstra egalitile din 2) observm c:
122 Variabile aleatoare - 6 din cele dou egaliti de mai sus avem:
(x )dx
x a a
prin:
Spunem c integrala improprie de mai sus este convergent dac limita din membrul drept exist i este finit. Aceast integral improprie st la baza definiiei densitii de repartiie a unei variabile aleatoare. Definiia 3. Fie (, K, P) un cmp de probabilitate, f: R o variabil aleatoare i F funcia sa de repartiie. Dac exist o funcie : R [0, ) integrabil pe R, astfel ca:
F(x ) =
(t )dt,
atunci funcia se numete densitatea de repartiie sau densitatea de probabilitate a variabilei aleatoare f. Teorema 5. Dac variabila aleatoare f admite densitatea de repartiie , atunci: 1) 2)
(x )dx = 1 .
P(a f b) = F(b) - F(a) =
Demonstraie:
(x )dx (x )dx =
123
Teorema 6. Fie densitatea de repartiie corespunztoare variabilei aleatoare f. Dac este continu ntr-un punct x din R, atunci funcia de reparatiie F asociat variabilei aleatoare f este derivabil n x i F(x) = (x). Reciproc, dac funcia de repartiie F este derivabil pe R, atunci f admite o densitate de repartiie i F = . Demonstraie: n condiiile teoremei:
i integrala din membrul drept este o funcie derivabil n x, iar derivata ei este (x), deci F(x) = (x). Dac F este derivabil pe R, atunci putem scrie:
Deoarece funcia de repartiie F este cresctoare rezult c F(x) 0 pentru orice x R. Dac n egalitatea de mai sus trecem la limita pentru a - , obinem:
124 Variabile aleatoare - 6 unde (a, b) ( fiind continu am aplicat o teorem de medie integralei de mai sus, care asigur existena lui astfel ca ultima egalitate scris s fie adevrat). Din cele de mai sus rezult c:
( ) =
P( a f b ) , unde (a , b). ba
Teorema 6. Fie densitatea de repartiie corespunztoare variabilei aleatoare f. Dac este continu ntr-un punct x din R, atunci funcia de reparatiie F asociat variabilei aleatoare f este derivabil n x i F(x) = (x). Reciproc, dac funcia de repartiie F este derivabil pe R, atunci f admite o densitate de repartiie i F = . Demonstraie: n condiiile teoremei:
i integrala din membrul drept este o funcie derivabil n x, iar derivata ei este (x), deci F(x) = (x). Dac F este derivabil pe R, atunci putem scrie:
Deoarece funcia de repartiie F este cresctoare rezult c F(x) 0 pentru orice x R. Dac n egalitatea de mai sus trecem la limita pentru a - , obinem:
125
unde (a, b) ( fiind continu am aplicat o teorem de medie integralei de mai sus, care asigur existena lui astfel ca ultima egalitate scris s fie adevrat). Din cele de mai sus rezult c:
( ) =
P( a f b ) , unde (a , b). ba
Teorema 6. Fie densitatea de repartiie corespunztoare variabilei aleatoare f. Dac este continu ntr-un punct x din R, atunci funcia de reparatiie F asociat variabilei aleatoare f este derivabil n x i F(x) = (x). Reciproc, dac funcia de repartiie F este derivabil pe R, atunci f admite o densitate de repartiie i F = . Demonstraie: n condiiile teoremei:
i integrala din membrul drept este o funcie derivabil n x, iar derivata ei este (x), deci F(x) = (x). Dac F este derivabil pe R, atunci putem scrie:
Deoarece funcia de repartiie F este cresctoare rezult c F(x) 0 pentru orice x R. Dac n egalitatea de mai sus trecem la limita pentru a - , obinem:
unde (a, b) ( fiind continu am aplicat o teorem de medie integralei de mai sus, care asigur existena lui astfel ca ultima egalitate scris s fie adevrat). Din cele de mai sus rezult c:
( ) =
P( a f b ) , unde (a , b). ba
Fie x 0 un punct arbitrar din (a, b). Datorit continuitii funciei trecnd la limit pentru b - a 0 i x 0 (a , b) rezult c x 0 i are loc egalitatea:
( x 0 ) = P( a f b ) , ba ba0 lim
a<x0 <b
ce justific denumirea de densitate de probabilitate a variabilei aleatoare f, atribuit funciei . Exemplul 3. Se d funcia : R R , ( x) = x . e + e x a) S se determine constanta k astfel ca funcia s fie densitatea de repartiie a unei variabile aleatoare f; b) Dac f1 i f 2 sunt dou variabile aleatoare independente i identic repartizate, avnd aceeai densitate de repartiie, cea a lui f, s se calculeze P( f1 < 1 i f 2 > 1). Rezolvare: a) (x) este integrabil pe R i repartiie se impune k
(x )dx = k 2 .
)] 1 (x)dx (1 1 (x)dx ) =
2 2 arctg e 1 arctg e .
127
P f 1 (B ) = P f 1 (B ) . J J
Observaia 1. Dac F 1 este o subfamilie de variabile aleatoare a familiei F, adic F 1 F , atunci independena familiei F implic, evident independena subfamiliei F 1 . Acest concept de independen a fost introdus de matematicienii H. Steinhaus i M. Kac. S analizm o caracterizare a independenei unei familii finite de variabile aleatoare simple. Fie (f i )i =1, n o astfel de familie i fie x ij j =1, r valorile pe care le poate lua
( )
{
variabila aleatoare fi . Aceste variabile aleatoare genereaz familiile de partiii ale lui
( )
j=1,ri
i A ij = : f () = x ij
Demonstraie. Fie familia de indici (q i )i =1,n , cu 1 q i ri , pentru orice i = 1, n . S notm Bi = x i i , i = 1, n i s presupunem c variabilele independente. Atunci
{ }
q
{f i }, i=1,n
sunt
n qi n qi P = P Ai , I Ai i=1 i=1
cea ce arat prin arbitraritatea indicilor qi , c partiiile (D i )i=1,n sunt independente. Atunci Reciproc, fie (Bi )i=1,n o familie de submulimi boreliene de pe dreapta real.
( )
f i1 (Bi ) =
jI i
U A ij
, unde I i = j : j N si x ij Bi
n n n 1 j j U U A i = P U I A i l = ( ) = P f B P I i i i=1 jI jlIl i=1 i=1 i 1ln n jl n jj n j A = = P I i Ai = P Ai = jlIl i =1 i=1 jIi jlIl i=1
( )
1l n
1l n
n n = P U A ij = f i1 (Bi ) i =1 i =1 jI i
Am obinut astfel relaia care indic independena variabilelor aleatoare (f i )i =1, n . Cu ajutorul funciilor de repartiie asociate, un criteriu de independen pentru o familie de variabile aleatoare este dat prin teorema urmtoare. Teorema 1. Condiia necesar i suficient pentru ca o familie de variabile aleatoare F = (f )I s fie o familie de variabile independente este ca:
129
) ( ) ( ) ( ) pentru orice {1 , 2 ,..., n } I i {x , x ,..., x } R , unde F ... este funcia de repartiie a variabilei aleatoare n-dimensionale (f , f ,..., f ) , iar F este funcia
F1 2 ... n x 1 , x 2 , ..., x n = F x 1 F x 2 ... F x n ,
1 2 n 1 2 n 1 2 n i
de repartiie a variabilei aleatoare f i , i = 1, n . Observaia 2. n cazul n care variabilele aleatoare (f )I admit densitile de echivalent cu:
( ) ( )
( )
Aplicaie. Fie vectorul aleator bidimensional h = (f, g) dat prin tabloul: f, g 1 2 . 2 1/16 0 3 0 1/4 4 0 3/8 5 1/16 1/4
S se studieze independena variabilelor aleatoare f i g. Rezolvare. Variabilele aleatoare marginale f i g sunt definite prin:
2 1 f : , 1 / 8 7 / 8
Deoarece P(f = 2 i g = 3) =
3 4 5 2 g: 1 / 6 1 / 4 3 / 8 5 / 16
1 7 1 P(f = 2 i g = 3) = rezult c 4 8 4
variablele aleatoare f i g nu sunt independente. n paragraful urmtor vom stabili o msur a gradului de dependen
6.3.1.
xi f: , p i i I
unde I este cel mult numrabil i
pi = 1 , p i > 0 ,
iI
M (f ) = p i x i
iI
131
Dac f este o variabil aleatoare simpl (mulimea de indici I este finit), atunci suma din (1) conine un numr finit de termeni i M(f) are sens totdeauna. Pentru variabilele aleatoare discrete cu o infinitate de valori distincte (I mulime numrabil) suma din (1) conine o infinitate de termeni i necesitile privind posibilitatea schimbrii ordinii termenilor ntr-o serie, impun cerina ca seria pi x i ,
iI
care definete valoarea medie s fie nu numai convergent, ci absolut convergent. Valoarea medie a unei variabile aleatoare msoar tendina central a repartiiei valorilor variabilei aleatoare. Valoarea M(f) reprezint numrul n jurul cruia se constat o apropiere a valorilor variabilei aleatoare. S considerm variabila aleatoare care asociaz, n experiena aleatoare a aruncrii unui zar, numrul de puncte aflat pe faa superioar a zarului. Aceasta va avea tabloul de repartiie:
1 2 3 4 5 6 f: 1 1 1 1 1 1 6 6 6 6 6 6
i valoarea medie M (f ) =
k =1
pk x k =
1 6 67 1 7 k= = = 3,5 . 6 k =1 2 6 2
xk f : , p k k =1, n
atunci valoarea medie M (f ) = cu ponderile p k k = 1, n . Propoziia 1. Fie (, K, P) un cmp de probabilitate i f, g : R variabile aleatoare discrete. Dac valorile medii M(f) i M(g) exist, atunci i variabilele aleatoare f + g i f, cu R, au valori medii i au loc urmtoarele relaii: a) M(f + g) = M(f) + M(g), b) M(f) = M(f), c) dac n plus variabilele f i g sunt independente, atunci exist i M(f g) i are loc M(f g) = M(f) M(g).
( )
k =1
pk x k
( ) k =1, n
yj xi f : p , g : gj , i iI jJ
cu I i J cel mult numrabile. Variabila aleatoare f + g are distribuia:
M(f + g) =
=
x i pi + y jq j = M(f ) + M(g).
iI jJ
p i x i = p i x i = M(f ).
i I i I
x i , deci M( f ) = p i i I
M ( fg) =
x i y jp i q j = x i p i y jq j = M( f ) M(g).
i I jJ i I jJ
n general, valoarea medie a produsului a dou variabile aleatore difer de produsul valorilor medii ale celor dou variabile aleatoare. O legtur ntre aceste valori medii este dat de inegalitatea lui Schwartz. Teorema 1. Fie (, K, P) un cmp de probabilitate i f, g : R dou variabile aleatoare discrete astfel nct M f 2 i M g 2 exist. Atunci are loc (6.3.2)
( )
M( f g )
( ) M( f 2 ) M ( g 2 ) .
Observm c h 0 pentru orice R i deci, la fel M h 0 , pentru orice R. n baza Propoziiei 1 avem:
( )
)2 ,
unde R.
133
M( h ) = M f 2 2M( fg) + 2 M g 2 .
Obinem astfel inegalitatea:
( )
( )
( )
( )
= M( fg)
[ M( fg)]2 M( f 2 ) M(g 2 ),
de unde rezult inegalitatea (2) i teorema este demonstrat. Fie f : R o variabil aleatoare discret i A un eveniment din K (A K) astfel c P(A) > 0. S presupunem c f are distribuia de probabilitate mulime numrabil. Definiia 2. Dac seria (6.3.3)
xi , cu I p i i I
M( f A) =
x i PA (f = x i )
i I
se numete valoarea medie condiionat a variabilei aleatoare f, de evenimentul A. Dac n loc de evenimentul A considerm un sistem complet de evenimente
(A j )jJ , cu J cel mult numrabil i P(A j ) > 0 atunci are loc urmtoarea relaie de
M f A j , i anume:
(6.3.4)
legtur ntre valoarea medie a lui f, M(f) i valorile medii condiionate ale lui f,
M( f ) =
P(A j ) M( f A j ).
jJ
M(f). Atunci variabila aleatoare g : R, care are distribuia de probabilitate dat prin g:
innd seama c valoarea medie a unei variabile aleatoare constante este constanta nsi, rezult c M(g) = M(f) - M(M(f)) = M(f) -M(f) = 0. Definiia 4. Fie (, K, P) un cmp de probabilitate i f : R o variabil aleatoare discret. Pentru orice n N (n 1), valoarea medie a variabilei aleatoare f n , (6.3.5)
Mn(f) = M f n ,
( )
dac exist se numete momentul de ordinul n al variabilei aleatoare f. Valoarea medie a variabilei aleatoare f n , (6.3.6)
Mn( f ) = M f n
( )
n
se numete momentul absolut, de ordinul n, al variabilei aleatoare f. S notm, pentru simplificarea scrierii, M ( f ) = f i s presupunem c aceast valoare medie exist. Valoarea medie a variabilei aleatoare ( f f ) ,
(6.3.7)
mn (f ) = M (f f )
se numete momentul centrat de ordinul n al variabilei aleatoare f. Dac variabila aleatoare discret f, considerat mai sus, are distribuia
M n ( f ) = Pi x i
iI
m n (f ) = Pi (x i f ) .
n iI
Definiia 5. Fie (, K, P) un cmp de probabilitate i f : R o variabil aleatoare discret. Momentul centrat de ordinul doi al variabilei aleatoare f, dac exist, se
6.3. Caracteristici numerice ale variabilelor aleatoare numete dispersia sau variana variabilei aleatoare f i se noteaz
135 cu
D 2 (f ) = 2 (f ) = m 2 (f ) = Pi (x i f ) .
2 iI
Valoarea D(f) = (f) = m 2 ( f ) se numete abaterea medie ptratic a variabilei aleatoare f. Dac valoarea medie a unei variabile aleatoare este o valoare numeric n jurul creia se constat o grupare a valorilor variabilei aleatoare, dispersia i abaterea medie ptratic sunt indicatorii cei mai utilizai pentru a caracteriza mprtierea valorilor unei variabile aleatoare n jurul valorii medii. Teorema 2. Dac dispersia D 2 ( f ) a variabilei aleatoare discrete f exist, atunci au loc egalitile (6.3.10) (6.3.11) Demonstraie:
D 2 ( f ) = M 2 ( f ) [ M( f ) ]
D 2 ( f ) = 2 D 2 ( f ), pentru orice R .
D2 (f ) = M 2 (f f ) = M (f f )
] = M[f
2
2f f + (f )
]=
2 2 = M f 2 2 fM ( f ) + ( f ) = M 2 ( f ) [ M ( f )]
( )
D 2 ( f ) = M ( f f )
(amintim c f = M ( f ) ).
] = M[(f f ) ] = M (f f )
2 2 2
= 2 D 2 ( f )
D 2 ( f + g) = D 2 ( f ) + D 2 (g).
136 Variabile aleatoare - 6 Demonstraie: Fie variabilele aleatoare abateri f1 = f f i g1 = g g , unde f = M( f ) i g = M g . Dac f i g sunt independente rezult c f1 i g1 sunt independente.
()
D 2 ( f + g ) = M 2 f + g ( f + g) = M 2 ( f f ) + (g g ) =
= M 2 ( f1 + g1 ) = M ( f1 + g1 ) = D 2 ( f ) + D 2 ( g).
2 2 2 2 = M f1 + 2 M( f1 ) M(g1 ) + M g1 = M f1 + M g1 =
( )
] = M( f
( )
2 1
2 + 2 f1g1 + g1 =
( )
( )
Exemplul1. S aruncm o moned de trei ori i s considerm variabila aleatoare f, care ia ca valori numrul care indic de cte ori s-a obinut faa pe care este marcat banul. f ia valorile 0, 1, 2 sau 3. n aceast experien aleatoare exist 8 cazuri posibile. Variabila f ia valorile de mai sus cu probabilitile P( f = 0) =
1 , 8
P( f = 1) =
3 3 1 , P( f = 2) = i P( f = 3) = . 8 8 8
Distribuia de probabilitate a variabilei aleatoare f poate fi reprezentat prin urmtoarea histogram, iar tabelul urmtor conine elemente utile calculului valorii medii i dispersiei variabilei aleatoare f.
P(f)
f 0 1 2 3 Total
0 1 2 3 f
D(f)
1 8 3 8 3 8 1 8 8 8
fP(f) 0
3 8 6 8 3 8 M = 1,5
3 8 2 8 1 8
f2 0
f 2 P( f ) 0
3 8 12 8 9 8 M 2 = 3,0
1 4 9
6.3. Caracteristici numerice ale variabilelor aleatoare Din tabelul de mai sus avem M(f) = 1,5 ,
2 2
137
Exemplul 2. Un juctor este dispus s ncerce la un joc de noroc pn la prima nereuit. tiind c la fiecare ncercare n parte, ansele de reuit sunt de
1 , s se 3
scrie distribuia variabilei aleatoare a numrului de ncercri necesare pn la prima reuit i funcia de repartiie asociat acestei variabile aleatoare. S se calculeze valoarea medie i dispersia acestei variabile aleatoare. Rezolvare: Fie f numrul ncercrilor necesare pn la prima reuit. Se observ c
1 2 1 2 , P( f = 2) = P A1 I A2 = P (A1 ) P( A2 ) = = 2 3 3 3 3 unde A 1 este evenimentul la prima ncercare avem reuit, iar A 2 este evenimentul P( f = 1) =
la a doua ncercare se obine o reuit. Dup acelai raionament se stabilete c
P( f = k ) =
2 k 1 3k
1 f: 1 3
F(x ) = P(f < x ) =
1 n < x
2 2 32
3 22 33
n L L n 1 2 . L L 3n
pn
2 22 2 n 1 1 M( f ) = 1 + 2 2 + 3 3 +L+ n n +L = 3 3 3 3
2 n 1 1 2 2 2 +L = + + + L + n 1 2 3 . 3 3 3 3
Pentru a calcula suma de mai sus notm u = utiliznd seria geometric avem
138 Variabile aleatoare - 6 i derivat n raport cu variabila u, va avea n membrul drept suma din parantez a valorii medii M(f). Se obine M(f) = 3. Pentru a calcula dispersia variabilei aleatoare f, folosind formula (10) obinem
2 D 2 ( f ) = M f 2 [ M( f ) ] = M f 2 9 . Distribuia variabilei aleatoare f 2 este
( )
( )
1 dat prin f 2 : 1 3
22 2 32
32 22 33
Se obine M f 2 = 15, D 2 ( f ) = 15 9 = 6 i D( f ) =
( )
arat c, n medie, juctorul are nevoie de 3 ncercri pn la prima reuit, iar D(f) = 2,72 arat c abaterea (medie ptratic) de la valoarea medie 3, la care ne putem atepta n acest experiment aleator, este de 2,72.
a = x 0 < x1 < x 2 <L < x n = b se numete o diviziune a segmentului [a, b]. Numrul ( ) = max ( x k x k 1 ) se numete norma diviziunii .
Fie f, g : [a, b] R dou funcii mrginite i n plus presupunem c g este cresctoare. Definiia 6. Suma: (6.3.13)
1 k n
= {x 0 , x1 ,K , x n } ,
cu
( f , g, i ) =
f ( i )[g(x i ) g(x i 1 )] ,
i =1
unde i x i 1 , x i , poart numele de sum Riemann-Stieltjes a funciei f n raport cu funcia g. Definiia 7. Spunem c funcia f este integrabil Riemann-Stieltjes (R-S) n raport cu g pe [a, b], dac exist un numr real I cu proprietatea c pentru orice > 0, exist () > 0, astfel nct, oricare ar fi o diviziune a lui [a, b] cu norma () < () s avem:
139
( f , g, i ) I < ,
oricare ar fi alegerea punctelor i x i 1 , x i , i = 1, n . Numrul I este prin definiie integrala Riemann-Stieltjes a lui f n raport cu g pe [a, b] i se noteaz prin: (6.3.15)
I = a f (x )dg(x ) .
b
Observaia 2. Dac g(x) = x se obine integrala Riemann, dg(x) nu reprezint ntotdeauna difereniala funciei g, funcia g poate s nu fie difereniabil pe [a, b] i integrala R-S s existe. Teorema 4. Condiia necesar i suficient ca f s fie integrabil R-S, n raport cu g, pe [a, b], este ca oricare ar fi irul de diviziuni { n }nN , cu irul normelor
s fie
convergent la I. Pentru calculul unei integrale R-S putem folosi definiia, n anumite condiii, calculul integralei R-S se reduce la calculul unei integrale Riemann. Teorema 5. Dac funcia f este continu pe [a, b] i g derivabil cu derivata continu pe [a, b], atunci: (6.3.16)
(R S )a f (x )dg (x ) = (R )a f (x )g (x )dx .
b b
De asemenea are loc urmtorul rezultat de reversibilitate (formula de integrare prin pri), care se utilizeaz, de obicei, cnd nu sunt ndeplinite condiiile din teorema de mai sus, dar schimbnd rolul lui f cu g ele devin satisfcute. Teorema 6. Dac f este integrabil (R-S) n raport cu g pe [a, b], atunci g este integrabil (R-S) n raport cu f pe [a, b] i are loc: (6.3.17)
a f (x )dg(x )
b
lim a f (x )dg(x )
140 Variabile aleatoare - 6 exist i este finit, spunem c integrala (R-S) a funciei f(x), n raport cu g(x), pe [a, +), este convergent (are sens) i este dat de: (6.3.19)
b f (x )dg (x ) . a f (x )dg(x ) = blim a
Integralele R-S pe intervalele nemrginite (-, +), (-, a) pot fi reduse la cea definit mai sus. S considerm acum, cazul general al unei variabile aleatoare f, discrete sau continue. Fie F funcia sa de repartiie, aceasta este o funcie cresctoare, I(x) = x, funcia identic i fie o diviziune a intervalului [a, b). Atunci suma: (6.3.20)
mprit cu P(a f < b) = F(b) - F(a) poate fi considerat ca o aproximaie a valorii medii a variabilei aleatoare pe intervalul [a, b), aproximarea fiind cu att mai bun cu ct norma diviziunii este mai mic. Se poate atunci considera integrala R-S a funciei identice I(x) = x n raport cu funcia de repartiie F: (6.3.21)
( ) 0
mprit cu F(b) - F(a), ca valoare medie a variabilei aleatoare f pe intervalul [a, b). Deoarece funcia I(x) este continu, iar F este cresctoare, integrala exist i este independent de alegerea punctelor k x k 1 , x k . n ipoteza c
xdF(x )
b a
x dF(x )
este
M (f ) = xdF(x ) .
Dac f este o variabil aleatoare discret, lund punctele diviziunii , n aa fel ca ele s nu coincid cu valorile variabilei aleatoare f, iar punctele k chiar valorile variabilei aleatoare f, innd seama c dac n intervalul x k 1 , x k gsesc valori ale variabilei aleatoare f, atunci P x k 1 f < x k = 0 , din (22) obinem:
nu se
141
M (f ) = p k v k ,
kI
unde p k = P f = v k , iar v k sunt valorile variabilei aleatoare discrete f, adic exact relaia de definiie (1). Pe baza celor de mai sus are loc: Definiia 8. Fie (, K, P) un cmp de probabilitate, f : R o variabil aleatoare i F funcia sa de repartiie. Dac valoarea medie: (6.3.23)
f = M (f ) = xdF(x ) .
n cazul cnd variabila aleatoare f admite o densitate de repartiie continu pe poriuni, atunci F este derivabil n orice punct x n care este continu i valoarea medie: (6.3.24)
f = M (f ) = x(x )dx .
Pornind de la aceste exprimri ale valorii medii, ale unei variabile aleatoare f, atunci cnd integralele care intervin, sunt corect definite, exist i sunt finite, celelalte caracteristici numerice ale unei variabile aleatoare continue se exprim prin: a) Momentul de ordinul k:
M k (f ) = M f k = x k dF(x ) = x k (x )dx .
( )
k
b)
Mk (f ) = M f
c)
( )=
x dF(x ) = x (x )dx .
k k
d)
Dispersia:
D 2 (f ) = m 2 ( f ) =
( x f ) 2 dF( x ) =
(x f )
f ( x )dx .
D(f ) = f = M 2 (f ) =
(x f ) dF(x ) = (x f ) (x )dx
Cu exprimrile de mai sus se constat c proprietile caracteristicilor numerice ale unei variabile aleatoare discrete rmn valabile i n cazul continuu, deci sunt, n general, valabile. Fie f o variabil aleatoare i M(f) valoarea sa medie (deseori intereseaz frecvena abaterilor de la valoarea medie) depind o anumit limit L > 0 sau (a evenimentului opus) frecvena abaterilor sub limita L. Rspunsul este dat de: Teorema 7. (Inegalitatea lui Cebev). Dac 2 este dispersia variabilei aleatoare f, atunci probabilitatea ca modulul abaterii |f - M(f)| s ia valori mai mari dect un numr L > 0 este mai mic dect (6.3.25) sau: (6.3.25)
2 L2
, adic:
2 P( f M( f ) L) 2 , L 2
P( f M ( f ) )
unde = D(f) este abaterea medie ptratic a variabilei aleatoare f. Fie: A = : f ( ) M( f ) . Atunci avem:
2 = D 2 ( f ) = M[( f M( f ) )] = P(A ) M ( f M( f ) ) / A +
2 2
+ P( A ) M ( f M ( f ) ) / A
2 2
Deoarece [ f M( f ) ] 0 rezult c M ( f = M( f ) ) / A 0
2
6.4. Funcia caracteristic asociat unei variabile aleatoare 143 Din egalitatea de mai sus se obine inegalitatea:
2 = D 2 ( f ) M ( f M( f ) ) / A P A .
2
( )
2
Pe de alt parte, din modul cum a fost definit mulimea A , rezult c pe aceast mulime [ f M( f ) ] 2 2 , de unde avem M ( f M( f ) ) / A 2 2 . Am
2
obinut astfel inegalitatea 2 2 2 P A , care implic P A 2 , ceea ce arat c inegalitatea (6.3.26) este demonstrat, ea fiind echivalent cu inegalitile (6.3.25) i (6.3.25). Teorema este complet demonstrat.
( )
( )
( )
xk fi : , p k k = 1,
( t ) = e itx k p k .
k =1
Dac f este o variabil aleatoare continu i are densitatea de repartiie (x), atunci funcia caracteristic asociat lui f este dat prin: (6.4.4)
(t ) = e itx (x )dx .
Din cele prezentate pn acum, rezult c, unei variabile aleatoare f i se asociaz o funcie de repartiie F continu la stnga i o funcie caracteristic continu. Mai mult, aceste funcii caracterizeaz, probabilistic, variabila aleatoare f, putnd-o nlocui n diverse calcule, mai ales, cnd acestea se simplific prin folosirea uneia sau alteia din funciile asociate. Teorema 1. Funcia caracteristic, a unei variabile aleatoare f, admite urmtoarea dezvoltare n serie de puteri: (6.4.5)
(t ) =
unde M f n este momentul de ordinul n al variabilei aleatoare f. Demonstraie: ntr-adevr nlocuind n (t ) = M e itf = cu dezvoltarea ei n serie de puteri e itx =
( )
inM f n n n! t , n =0
( )
( )
n
itx
i t x n! n =0
n n
obinem (t ) =
( )
Aceast egalitate permite s se calculeze, mai uor, pe baza funciei caracteristice, momentele de orice ordin ale variabilei aleatoare f, i anume avem:
(t ) =
n =0
C n t n , unde C n =
d n ( t ) inM f n , dar C n = . n! n! dt n t = 0
( )
M fn =
( )
1 d n (t ) . i n dt n t =0
6.4. Funcia caracteristic asociat unei variabile aleatoare 145 Teorema 2. Dac variabila aleatoare f admite o repatiie continu, atunci densitatea de repartiie a variabilei aleatoare f, (x) este dat, cu ajutorul funciei caracteristice corespunztoare, prin:
(x ) =
1 itx e (t )dt . 2
a unei variabile aleatoare f,
Exemplul
1.
Se
funcia
caracteristic
aleatoare f. Rezolvare: ( t ) =
2 1 1 1 1 1 + e it = + e it + e 2it , de unde rezult c variabila 4 2 4 4 1 1 1 , , adic distribuia lui f este aleatoare ia valorile 0, 1, 2 cu probabilitile , 4 2 4 0 1 2 1 1 1 . f: 4 2 4
0 1 F( x) = 4 3 4 1
pentru
x0 .
(t ) =
1 nit 1 (1 r )1 = 1 1 = 1 r n = n e . +1 2 2 1 r 2 n =0 n =0 2
0 f: 1 2
i funcia de repartiie:
1 1 22
L L
n 1 2n
L L
0 1 F( x ) = n 1 2 1 k +1 k = 0 2
pentru pentru
x0 0 < x 1 .
cov( f , g) = M ( f f )( g g) .
Din definiia de mai sus, rezult imediat c, covariana are urmtoarele proprieti: a) cov (f, g) = cov (g, f) - proprietate de simetrie;
6.5. Dependena variabilelor aleatoare. Corelaie. Coeficient de corelaie b) c) cov (f, g) = cov (f, g) - proprietate de omogenitate; cov (f, g) = M(fg) - M(f) M(g).
147
Ultima proprietate stabilete legtura ntre covariana variabilelor aleatoare f i g, i valorile medii ale lui fg, f i g. Dac cov (f, g) = 0, se spune c variabilele aleatore sunt necorelate. Se observ imediat c, dac variabilele aleatoare f i g sunt independente, atunci M(fg) = M(f)M(g) i din c) rezult c ele sunt necorelate. Dac variabilele f i g sunt necorelate, atunci are loc M(fg) = M(f) M(g), dar ele nu sunt n mod obligatoriu independente. O msur standardizat a dependenei a dou variabile aleatoare o reprezint coeficientul de corelaie. Definiia 2. Se numete coeficient de corelaie al variabilelor f i g valoarea: (6.5.2)
( f , g) =
cov( f , g)
D 2 ( f ) D 2 ( g)
( )
( )
p ij = P( f = x i i g = y j i, j N atunci:
(f , g ) =
(x i f )(y j g )p ij
i =1 j=1
D 2 (f ) D 2 (g )
Din inegalitatea lui Schwartz rezult imediat c oricare ar fi dou variabile aleatoare f i g : R: (6.5.3) Mai mult, are loc: Teorema 1. ntre dou variabile aleatoare f i g exist o relaie liniar dac i numai dac: (6.5.4)
2 ( f , g) 1 .
2 ( f , g) = 1 .
Pe lng cele artate mai sus exist i alte msuri ale gradului de dependen a dou variabile, dintre care amintim coeficientul de contingen. Exemplul 1. Fie vectorul aleator h = (f, g) dat prin tabloul:
0 1 1 16 2 0
1 0 1 4
2 0 3 8
3 0 1 4
4 1 16 0
S se studieze independena i necorelarea variabilelor aleatoare f i g. Rezolvare: Variabila aleatoare f ia valorile 1 i 2 cu probabilitile
1 1 1 1 31 1 7 P( f = 1) = + = , P( f = 2) = + + = . Valoarea aleatoare g ia 16 16 8 4 8 4 8 1 1 3 , P( g = 1) = , P( g = 2) = , valorile: 0, 1, 2, 3, 4 cu probabilitile P( g = 0) = 16 4 8 1 1 P( g = 3) = i P( g = 4) = , adic distribuiile lui f i g sunt date prin: 4 16 1 1 f: 8 2 0 7 , g: 1 16 8 1 1 4
3
2 3 8
3 1 4
4 1. 16
0 1 2 1 1 f g: 16 0 4
4 7 0 16
6 8 1 . 0 4
15 , M(g) = 2, M(fg) = 8
15 15 15 , cov(f, g) = M(fg) - M(f) M(g) = 2 =0. Deci variabilele aleatoare f i 4 8 4 1 7 1 P(f = 2) P(g = 1) = , ceea ce arat g sunt necorelate, dar P(f = 2 i g = 1) = 4 8 4
c f i g nu sunt independente.