CSProbabil6 2008

Curs 6
Vectori aleatori continui. Independenţa variabilelor

aleatoare. Măsuri ale dependenţei.
6.1 Vectori aleatori

O pereche (X, Y ) sau mai general, un n–uplu de v.a. continue (X1 , X2 , . . . , Xn ) se numeşte
vector aleator. Vectorii aleatori sunt definiţi ı̂n experimente ı̂n care se observă sau măsoară
simultan n caracteristici ale sistemului sau procesului supus studiului.
Pentru a ı̂ntelege mai rapid problematica relativ la vectori aleatori studiem cazul cel
mai simplu, al vectorilor aleatori cu două componente.
Ca şi ı̂n cazul unei singure v.a. continue X, ne interesează relativ la vectorul aleator
(X, Y ), probabilităţile evenimentelor de forma ((X, Y ) ∈ D): ”evenimentul ca vectorul
(X, Y ) să ia valori ı̂n domeniul D ⊂ R2 ”. Cele mai uzuale domenii sunt cele dreptunghi-
ulare care pot conţine laturile de frontieră sau, nu: D = [a, b] × [c, d], D = [a, b) × [c, d),
etc.
Distribuţia de probabilitate a unui vector aleator se precizează dând densitatea de
probabilitate, care este o funcţie fX,Y : R2 → R cu proprietăţile:
1. fX,Y (x, y) ≥ 0, ∀ (x, y) ∈ R2 ;
2. fX,Y este integrabilă pe R2 şi integrala dublă:
ZZ Z ∞Z ∞
fX,Y (x, y)dxdy = fX,Y (x, y) dxdy = 1 (6.1)
R2 −∞ −∞
fX,Y se numeşte in english: joint probability density function.

Condiţia a doua din definiţia densităţii asigură că volumul domeniului din R3 mărginit
deasupra de graficul funcţiei, suprafaţa z = fX,Y (x, y), (x, y) ∈ R2 , iar dedesubt de planul
xOy de ecauţie z = 0, este egal cu unu (Fig.6.1).
Probabilitatea ca vectorul (X, Y ) să ia valori ı̂n domeniul D din plan este integrală
dublă pe D din densitate:
ZZ
P ((X, Y ) ∈ D) = fX,Y (x, y) dx dy (6.2)
D
1 −(x2 +y2 )/2

Densitatea din Fig.6.1 are expresia analitică, f (x, y) = e , adică este nenulă
2π
pe ı̂ntreg R2 . Deci vectorul ia cu o probabilitate nenulă, valori ı̂n orice domeniu D ⊂ R2 .
1
2 c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS
z
y
x
Fig.6.1: Graficul densităţii de probabilitate a unui vector aleator (X, Y ).
Domeniul G din plan pe care densitatea de probabilitate a unui vector aleator (X, Y )
este nenulă, se numeşte suportul densităţii. Cel mai adesea suportul densităţii este un
domeniu marginit din plan.
Exemplul 1. Fie (X, Y ) un vector aleator ce are densitatea:

2 − y dacă x ∈ [0, 2], y ∈ [1, 2]
fX,Y =
0 ı̂n rest
Suportul densităţii este domeniul dreptunghiular G = [0, 2] × [1, 2]. Graficul lui fX,Y este
vizualizat ı̂n Fig.6.2. El constă din planul haşurat ( de ecuaţie z = 2 − y, (x, y) ∈ G şi din
planul xoy minus dreptunghiul G
Să verificăm că funcţia dată este ı̂ntr-adevăr o densitate. Evident că f (x, y) ≥ 0,iar
ZZ Z 2Z 2 Z 2 Z 2
2 2
fX,Y (x, y)dxdy = 2 − ydx dy = (2y − y /2)|1 dx = 1/2 dx = 1
R2 0 1 0 0
Probabilitatea ca vectorul aleator (X, Y ) să ia valori ı̂n discul D centrat ı̂n punctul de
coordonate (1, 1.5) şi de rază r = 0.5
D = {(x, y) | (x − 1)2 + (y − 1.5)2 ≤ 0.52 }
este ZZ ZZ
P ((X, Y ) ∈ D) = fX,Y dxdy = (2 − y) dxdy
D D
Efectuând schimbarea de variabile:
x = 1 + ρ cos θ
y = 1.5 + ρ sin θ
c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS 3
z
(0, 2, 0)
y
x (2, 1, 0)
(2, 2, 0)
Fig.6.2: Graficul unei densităţi de probabilitate cu suport mărginit.
unde ρ ∈ [0, 0.5], θ ∈ [0, 2π] avem:

ZZ Z 0.5 Z 2π
(2 − y) dxdy = dρ ρ(2 − 1.5 − ρ sin θ)dθ = π/8
D 0 0
Densitatea de probabilitate fX,Y defineşte funcţia de repartiţie, FX,Y , a vectorului

aleator (X, Y ) prin:
Z x Z y
FX,Y (x, y) = P (X ≤ x, Y ≤ y) = fX,Y (x, y) dx dy (6.3)
−∞ −∞
Domeniul de integrare din R2 , pentru calculul funcţiei de repartiţie este ilustrat ı̂n Fig.6.3:
Observaţia 6.1.1 Dacă funcţia de repartiţie a vectorului aleator (X, Y ) este definită de
∂2F
densitatea fX,Y , continuă pe R2 , atunci există şi din (6.3) avem:
∂x∂y
∂ 2 FX,Y
(x, y) = fX,Y (x, y), ∀ (x, y) ∈ R2 . (6.4)
∂x∂y
Se ridică următoarea ı̂ntrebare: cunoscând densitatea de probabilitate fX,Y vectorului
aleator (X, Y ) putem afla densităţile de probabilitate fX , fY şi funcţiile de repartiţie
FX , FY ale coordonatelor sale X şi Y ?
Răpunsul este afirmativ, şi pentru a determina funcţiile asociate lui X, respectiv Y ,
observăm că dacă fX,Y este integrabilă ı̂n raport cu x, respectiv y, atunci avem:
RR R ∞ R ∞
1 = R2 fX,Y (x, y)dx dy = −∞ −∞ fX,Y (x, y) dx dy
R ∞ R ∞ (6.5)
= −∞ −∞ fX,Y (x, y) dy dx
y
(x, y)
(−∞, x] × (−∞, y]
Fig.6.3: Domeniul de integrare pentru calculul funcţiei de repartiţie a unui vector aleator
(X, Y ).
Notăm prin fX , fY funcţiile definite pe R cu valori ı̂n R, prin:

Z ∞ Z ∞
fX (x) = fX,Y (x, y) dy, fY (y) = fX,Y (x, y) dx, ∀ x, y ∈ R
−∞ −∞
Ambele funcţii sunt integrale dintr-o funcţie pozitivă fX,Y , deci sunt şi ele pozitive. Din
relaţia (6.5) rezultă de asemenea că:
Z ∞ Z ∞
fX (x) dx = 1, fY (x) dy = 1
−∞ −∞
şi deci funcţiile fX , fY sunt densităţi de probabilitate pentru variabile aleatoare definite
pe R. Să arătăm că fX este chiar densitatea variabilei X, iar fY a variabilei Y .
Într-adevăr conform relaţiei (6.2) funcţia de repartiţie a v.a. X este:
Z x Z ∞ Z x
FX (x) = P (X ≤ x) = P (X ≤ x, Y ∈ R) = fX,Y (x, y) dy dx = fX (x) dx
−∞ −∞ −∞
| {z }
fX (x)
(6.6)
Prin urmare fX este densitatea de probabilitate a variabilei X, pentru că este o densitate
de probabilitate ce defineşte funcţia de repartiţie a lui X.
fX se numeşte densitatea marginală a lui X, iar repartiţia asociată FX , repartiţia
marginală a lui X. Analog, definim densitatea marginală fY , respectiv repartiţia marginală
FY :
Z ∞
fY (y) = fX,Y (x, y) dx (6.7)
−∞
Z y Z y Z ∞
FY (y) = fY (y) dy = fX,Y (x, y) dx dy (6.8)
−∞ −∞ −∞
• Generalizând, un vector aleator de n componente (X1 , X2 , . . . , Xn ) este reprezentat

din punct de vedere probabilist de densitatea sa de probabilitate f : Rn → R, care
defineşte apoi funcţia de repartiţie F : Rn → R prin:
F (x1 , x2 , . . . , xn ) = P (X1 ≤ x1 , X2 ≤ x2 , . . . , Xn ≤ xn )
R x1 R xn (6.9)
= −∞
··· −∞
f (x1 , . . . xn ) dx1 · · · dxn
• Dacă (X, Y ) este un vector aleator având densitatea de probabilitate fX,Y şi g :
2
R → R este o funcţie continuă atunci Z = g(X, Y ) este o variabilă aleatoare, şi dacă ı̂n
plus funcţia produs |gf | este integrabilă pe R2 , atunci, v.a. Z are valoare medie şi:
M (g(X, Y )) =
Z ∞Z ∞
g(x, y)f (x, y) dx dy (6.10)
−∞ −∞
Pentru g(x, y) = x + y, g(x, y) = xy, ∀ x, y, ∈ R, avem:

Z ∞Z ∞
M (X + Y ) = (x + y)f (x, y) dx dy (6.11)
−∞ −∞
Z ∞Z ∞
M (XY ) = xyf (x, y) dx dy (6.12)
−∞ −∞
Proprietate. M (X + Y ) = M (X) + M (Y ).
Demonstraţie:
R∞ R∞
M (X + Y ) = −∞ −∞
(x + y)f (x, y) dx dy
R∞ R∞ R∞ R∞
= −∞ −∞
xf (x, y) dxdy + −∞ −∞
yf (x, y)dxdy
Z ∞ Z ∞
R∞ R∞
= −∞
x f (x, y) dy dx + −∞
y f (x, y) dx dy
−∞ −∞
| {z } | {z }
fX (x) fY (y)
R∞ R∞
= −∞
xfX (x) dx + −∞
yfY (y) dy = M (X) + M (Y )
Generalizând avem că media unei combinaţii liniare cu coeficienţi reali a n variabile
aleatore este combinaţia liniară cu aceeaşi coeficienţi a mediilor variabilelor:
M (a1 X1 + a2 X2 + · · · + an Xn ) = a1 M (X1 ) + a2 M (X2 ) + · · · + an M (Xn ), a1 , a2 , . . . , an ∈ R
Proprietate. În general M (XY ) 6= M (X)M (Y ).

Exemplul 2. Un vector aleator (X1 , X2 ) are densitatea de propbabilitate
x2
(0; x2 ) (1 x2 ; x2 )
(x 1 ; 1 x1 )
x1
(x1 ; 0)
Fig.6.4: Distribuţia de probabilitate a vectorului aleator din Exemplul 2 este nenulă pe domeniul
triunghiular haşurat.

24x1 x2 dacă x1 > 0, x2 > 0, 0 < x1 + x2 < 1
f (x1 , x2 ) =
0 ı̂n rest
a) Să se determine densităţile de probabilitate marginale fX1 şi fX2 ;
b) Să se calculeze media variabilei aleatoare Z = 2.5 − 2(X1 + X2 )
Rezolvare: Densitatea de probabilitate a vectorului aleator (X1 , X2 ) este nenulă ı̂n dome-
niul triunghiular, haşurat R ∞ ı̂n Fig.6.4. a)RPentru x1 ∈ (0, 1), densitatea de probabilitate a
1−x1
v.a. X1 este fX1 (x1 ) = −∞ f (x1 , t)dt = 0 24x1 tdt = 12x1 (1−x1 )2 (integrala s-a calcu-
lat pe ”un Rinterval vertical” Rilustrat ı̂n Fig.6.4), şi fX1 (x1 ) = 0 ı̂n rest. Pentru x2 ∈ (0, 1),
∞ 1−x
fX2 (x2 ) = −∞ f (t, x2 )dt = 0 2 24tx2 dt = 12x2 (1 − x2 )2 (integrala s-a calculat pe ”un
interval orizontal” ilustrat ı̂n Fig.6.4) şi fX2 (x2 ) = 0 ı̂n rest.
b)
R ∞Valoarea medie a Rvariabilei Z este M (Z) = 2.5 − 2(M R (X1 ) + M (X2 )). Dar M (X1 ) =
R1
1 2 2 ∞
−∞
x 1 fX 1 (x 1 )dx 1 = 0
12x 1 (1 − x 1 ) dx 1 , iar M (X 2 ) = −∞
x 2 fX 2 (x 2 )dx 2 = 0
12x22 (1 −
x2 )2 dx2 .
6.1.1 Variabile aleatoare independente

Definiţia 6.1.1 Variabilele aleatoare X1 , X2 , . . . , Xn se numesc v.a. independente dacă:
notaţie
P ((X1 ≤ x1 ) ∩ (X2 ≤ x2 ) ∩ . . . ∩ (Xn ≤ xn )) =
= P (X1 ≤ x1 , X2 ≤ x2 , . . . , Xn ≤ xn ) =
= P (X1 ≤ x1 )P (X2 ≤ x2 ) · · · P (Xn ≤ xn ), (6.13)
ceea ce este echivalent cu faptul că funcţia de repartiţie a vectorului aleator (X1 , X2 , . . . , Xn )
este produsul funcţiilor de repartiţie marginale:
F (x1 , x2 , . . . , xn ) = FX1 (x1 )FX2 (x2 ) · · · FXn (xn )

Se poate demonstra că varibilele aleatoare X1 , X2 , . . . , Xn sunt independente dacă şi numai
dacă oricare ar fi intervalele I1 , I2 , . . . In ⊂ R avem că:
P (X1 ∈ I1 , X2 ∈ I2 , . . . , Xn ∈ In ) = P (X1 ∈ I1 )P (X2 ∈ I2 ) · · · P (XN ∈ In )
În practică se consideră cazul ı̂n care repartiţiile sunt definite de densităţi de probabilitate.
Propoziţia 6.1.1 Variabilele aleatoare X, Y sunt independente dacă şi numai dacă den-
sitatea de probabilitate a vectorului aleator (X, Y ) este produsul densităţilor v.a. X, Y .
Demonstraţie: Variabilele aleatoare sunt independente dacă şi numai dacă:
FX,Y (x, y) = FX (x)FY (y), ∀ x, y ∈ R

Exprimând fiecare din cele trei funcţii de repartiţie cu ajutorul densităţii corespunzătoare
avem că variabilele aleatoare X, Y sunt independente dacă şi numai dacă:
Z x Z y Z x Z y Z x Z y
f (x, y)dx dy = fX (x) dx fY (y) dy = fX (x) fY (y) dx dy
−∞ −∞ −∞ −∞ −∞ −∞
∀ x, y ∈ R, adică:
fX,Y (x, y) = fX (x)fY (y), ∀ x, y ∈ R. (6.14)
Generalizând la n variabile aleatoare, variabilele X1 , X2 , . . . , Xn sunt independente dacă şi

numai dacă densitatea de probabilitate a vectorului aleator (X1 , X2 , . . . , Xn ) este produsul
densităţilor variabilelor:
f (x1 , x2 , . . . , xn ) = fX1 (x1 )fX2 (x2 ) · · · fXn (xn ), ∀ (x1 , x2 , . . . , xn ) ∈ Rn , (6.15)
unde f este densitatea de probabilitate a vectorului aleator (X1 , X2 , . . . , Xn ).

Exemplul 3. Un circuit electronic conţine doi tranzistori. Durata de viaţa a trazistorilor
este dată de variabilele aleatoare X şi Y . Densitatea de probabilitate a vectorului aleator
(X, Y ) este:
(1/8)x e−(x+y)/2 pentru x > 0, y > 0
f (x, y) = (6.16)
0 ı̂n rest
(măsurătorile se fac ı̂n sute de ore).
Să se verifice dacă duratele de viaţa sunt independente sau nu.
Calculăm densităţile marginale ale celor două variabile:
Z ∞
−x/2 −y)/2 −x/2 −y/2 lim
fX (x) = (1/8)x e e dy = (1/8)x e [−2e ] y=0y→∞
0
= (1/4))x e−x/2 , ∀ x > 0, (6.17)
iar pentru y > 0,

Z ∞ Z ∞
−x/2 −y/2 −y/2
fY (y) = (1/8)x e e dx = (1/8)e x e−x/2 = (1/2)e−y/2 . (6.18)
0 0
Evident că fX,Y (x, y) = fX (x)fY (y), ∀x, y ∈ R şi deci variabilele X şi Y sunt indepen-
dente.
• Un şir X1 , X2 , . . . , Xn , . . . de variabile aleatoare cu proprietatea că orice subşir finit

este constituit din v.a. independente se numeşte şir de v.a. independente.
• În statistică se folosesc preponderent şiruri finite X1 , X2 , . . . , Xn , de variabile a-
leatoare independente şi identic distribuite (notaţie i.i.d.), adică densitatea de
probabilitate a fiecărei variabile din şir este aceeaşi: fXk = f , ∀ k = 1, n.
6.1.2 Densitatea unei variabile aleatoare condiţionată de valoarea altei vari-

abile
Atunci când studiem un vector aleator (X, Y ) suntem interesaţi ı̂n a determina ı̂n ce fel
este influenţată probabilitatea ca X să ia valori ı̂ntr-un interval, de faptul că se ştie că
Y = y0 .
Propoziţia 6.1.2 Fie (X, Y ) un vector aleator de densitate de probabilitate fX,Y şi fX , fY
densităţile sale marginale.
1. Dacă fY (y0 ) 6= 0, atunci funcţia notată:
fXY (x, y0 )
g(x|y0 ) =
fY (y0 )
este o densitate de probabilitate şi o variabilă aleatoare ce are această densitate se notează
(X|Y = y0 ) şi se numeşte variabila aleatoare X condiţionată de evenimentul (Y = y0 ).
2. Dacă fX (x0 ) 6= 0, atunci funcţia notată:
fXY (x0 , y)
h(y|x0 ) =
fX (x0 )
este o densitate de probabilitate şi o variabilă aleatoare ce are această densitate se notează
(Y |X = y0 ) şi se numeşte variabila aleatoare Y condiţionată de evenimentul (X = x0 ).
Demonstraţie: Verificăm că g(·|y0 ) : R → R este densitate de probabilitate. Evident,

g(x|y0 ) ≥ 0, ∀ x ∈ R şi:
Z ∞ Z ∞ Z ∞
fXY (x, y0 ) 1 1
g(x|y0 ) dx = dx = fX,Y (x, y0 ) dx = fY (y0 ) = 1
−∞ −∞ fY (y0 ) fY (y0 ) −∞ fY (y0 )
Analog se arată că şi funcţia h(·|x0 ) este densitate de probabilitate.

Să stabilim relaţia dintre densitatea variabilei condiţionate de o alta variabilă şi den-
sitatea variabilei ce se condiţionează, ı̂n cazul ı̂n care cele două sunt independente. Am
arătat că variabilele aleatoare X, Y sunt independente dacă şi numai dacă
fX,Y (x, y) = fX (x)fY (y), ∀ (x, y) ∈ R2 . (6.19)
fX (x)fY (y)
În acest caz g(x|y) = = fX (x) şi analog h(y|x) = fY (y), ∀x, y ∈ R. Cu
fY (y)
alte cuvinte, dacă v.a. X, Y sunt independente, cunoaşterea valorii x a lui X, obţinută
printr-o observaţie, măsurare, etc, nu afectează ı̂n nici un fel distribuţia de probabilitate
a lui Y .
y
(x; 1)
(1; 1)
(x; x)
(0; y ) (y; y )
Fig.6.5: Densitatea de probabilitate a vectorului aleator din Exemplul 4 este nenulă pe domeniul
triunghiular haşurat.
Exemplul 4. Vectorul aleator (X, Y ) are densitatea de probabilitate:

6x pentru 0 < x < y < 1
fX,Y (x, y) =
0 ı̂n rest
a) Să se determine densitatea de probabilitate a variabilei aleatoare condiţionate (Y |X =

0.25);
b) Să se calculeze P (Y > 0.5) şi P (Y > 0.5|X = 0.25).
Rezolvare: a) Determinăm mai ı̂ntâi densităţile de probabilitate marginale fX şi fY .

Ţinând seama că densitatea de probabilitate fX,Y are suportul (este nenulă) pe domeniul
R1
triunghiular haşurat din Fig.6.5, avem că pentru x ∈ (0, 1), fX (x) = x fX,Y (x, t)dt =
R1
x
6xdt = 6x(1−x) (integrala s-a calculatRpe un segment vertical
R y ca ı̂n Fig.6.5) şi fX (x) =
y
0 ı̂n rest. Pentru y ∈ (0, 1), fY (y) = 0 fX,Y (t, y)dt = 0 6tdt = 3y 2 (integrala s-a
calculat pe un segment orizontal ca ı̂n Fig.6.5) şi fY (y) = 0 ı̂n rest. Astfel densitatea de
probabilitate a variabilei aleatoare (Y |X = 0.25) este:
fX,Y (0.25, y) 1
h(y|0.25) = = = 1.33, pentru y ∈ (0.25, 1)
fX (0.25) 0.75
şi h(y|0.25) = 0 ı̂n rest.

R∞ R1
b) P (Y > 0.5) = 0.5 fY (y)dy = 0.5 3y 2 dy = 0.875, iar P (Y > 0.5|X = 0.25) =
R∞ R1 1
0.5
h(y|0.25) dy = 0.5 0.75 dy = 2/3.
Propoziţia 6.1.3 Daca X1 , . . . , Xn sunt variabile aleatoare independente si h : R →

R este o bijecţie continuă, atunci şi variabilele aleatoare h(X1 ), h(X2 ), . . . , h(Xn ) sunt
independente.
Demonstraţie: Distingem două cazuri:

1. h este strict crecătoare. Să arătăm că variabilele aleatoare h(X1 ), h(X2 ), . . . , h(Xn )
sunt independente:
P (h(X1 ) ≤ y1 , h(X2 ) ≤ y2 , . . . , h(Xn ) ≤ yn ) =

P (X1 ≤ h−1 (y1 ), X2 ≤ h−1 (y2 ), . . . , Xn ≤ h−1 (yn )) =
P (X1 ≤ h−1 (y1 ))P (X2 ≤ h−1 (yn )) · · · P (Xn ≤ h−1 (yn )) =
P (h(X1 ) ≤ y1 )P (h(X2 ) ≤ y2 ) · · · P (h(Xn ) ≤ yn ), ∀ y1 , y2 , . . . yn ∈ R
2. h este strict descrescătoare. În acest caz se exprimă evenimentele (Xi ≥ h−1 (yi )) =
∁(X < h−1 (yi )) şi se exploatează faptul că dacă n evenimente sunt independente atunci
şi opusele lor sunt independente.
6.2 Covarianţa şi coeficientul de corelaţie

În secţiunea precedentă am prezentat modalitatea de identificare a proprietăţii de inde-
pendenţă a unui număr finit de v.a. În inteligenţa artificială se lucrează preponderent cu
variabile aleatoare dependente.
Intensitatea dependenţei dintre două v.a. este măsurată de covarianţa, respectiv coe-
ficientul lor de corelaţie.
Definiţia 6.2.1 Covarianţa variabilelor aleatoare X, Y ce au respectiv valorile medii mX :=

M (X), mY := M (Y ) este un număr real notat cov(X, Y ),
cov(X, Y ) = M [(X − mX )(Y − mY )]. (6.20)
Observaţia 6.2.1 Covarianţa unei variabile cu ea ı̂nsăşi coincide cu dispersia sa:
cov(X, X) = M [(X − mX )(X − mX )] = M [(X − mX )2 ] = σ 2 (X)
De aceea pentru cov(X, Y ) se mai foloseşte notaţia σ(X, Y ) sau σX,Y .
Pentru un calcul mai rapid al covarianţei avem:

Propoziţia 6.2.1 Covarianţa v.a. X, Y este egală cu:
cov(X, Y ) = M (XY ) − M (X)M (Y ) (6.21)

Demonstraţie: Efectuăm produsul (X − mX )(Y − mY ) = XY − mX Y − mY X + mX mY .

Aplicând proprietăţile operatorului valoare medie avem:
cov(X, Y ) = M (XY ) − mX M (Y ) − mY M (X) + mX mY
= M (XY ) − M (X)M (Y ). (6.22)
Definiţia 6.2.2 Două variabile aleatoare X, Y ce au covarianţa zero se numesc variabile

aleatoare necorelate.
Deoarece am introdus covarianţa ca o măsură a intensităţii dependenţei dintre două
variabile aleatoare este natural să ne aşteptăm ca două variabile independente să aibă
covarianţa zero, adică să fie necorelate.
Propoziţia 6.2.2 Dacă variabilele aleatoare X, Y sunt independente atunci M (XY ) =
M (X)M (Y ) şi deci variabilele sunt necorelate.
Demonstraţie: Fie variabilele aleatoare independente X, Y şi fX,Y densitatea de prob-
abilitate a vectorului aleator (X, Y ). Atunci, fX,Y (x, y) = fX (x)fY (y), ∀ x, y ∈ R.
Z ∞Z ∞
M (XY ) = xyfX,Y (x, y) dx dy
−∞ −∞
Z ∞Z ∞
= xyfX (x) fY (y) dx dy
−∞ −∞
Z ∞ Z ∞
= fx (x) dx fY (y) dy
−∞ −∞
= M (X)M (Y ) (6.23)
Astfel cov(X, Y ) = M (XY ) − M (X)M (Y ) = M (X)M (Y ) − M (X)M (Y ) = 0.
Observaţia 6.2.2 Reciproca nu este adevărată. Două variabile aleatoare necorelate nu
sunt ı̂n mod necesar independente.
Ca o consecinţă a Propoziţiei 6.2.2 demonstrăm:
Propoziţia 6.2.3 Fie X, Y două variabile aleatoare.
a) Dispersia sumei X + Y este σ 2 (X + Y ) = σ 2 (X) + σ 2 (Y ) + 2cov(X, Y );
b) Dacă X şi Y sunt v.a. independente, atunci σ 2 (X + Y ) = σ 2 (X) + σ 2 (Y ).
Demonstraţie: Fie mX , mY , mediile celor două v.a. Conform definiţiei dispersiei a două
variabile aleatoare, avem:
σ 2 (X + Y ) = M [(X + Y ) − M (X + Y )]2
= M [(X − mX ) + (Y − mY )]2

= M (X − mX )2 + (Y − mY ))2 + 2(X − mX )(Y − mY )
= M [(X − mX )2 ] + M [(Y − mY )2 ]
+ 2M [(X − mX )(Y − mY ]
= σ 2 (X) + σ 2 (Y ) + 2cov(X, Y ) (6.24)
Dacă v.a. X şi Y sunt independente, atunci, cov(X, Y ) = 0 şi deci σ 2 (X + Y ) = σ 2 (X) +
σ 2 (Y )
Ţinând seama că σ 2 (aX) = a2 σ 2 (X), ∀ a ∈ R, putem generaliza rezultatul de mai sus la:
Propoziţia 6.2.4 Dacă X1 , X2 , . . . , Xn sunt v.a. independente atunci:
σ 2 (a1 X1 + a2 X2 + · · · + an Xn ) = a21 σ 2 (X1 ) + a22 σ 2 (X2 ) + · · · + a2n σ 2 (Xn ), (6.25)
∀ai ∈ R, i = 1, n.
Deoarece covarianţa a două v.a. este un număr real, definim o altă măsură a dependenţei
lor, numită coeficient de corelaţie, care ia valori ı̂ntr-un interval mărginit.
Definiţia 6.2.3 Coeficientul de corelaţie a două v.a. X, Y de abateri standard nenule,

este un număr real notat ρ(X, Y ) şi definit prin:
cov(X, Y )
ρ(X, Y ) = , (6.26)
σ(X)σ(Y )
unde σ(X), σ(Y ) sunt abaterile standard ale variabilelor aleatoare X, Y .
Propoziţia 6.2.5 Coeficientul de corelaţie a două variabile aleatoare X, Y are valoarea

absolută subunitară, mai precis:
ρ(X, Y ) ∈ [−1, 1] (6.27)
Demonstraţie: Fie mX , mY valorile medii ale variabilelor aleatoare X, Y , iar σX , σY

abaterile standard. Evident, valoarea medie a variabilei aleatoare:
2
X − mX Y − mY
Z= ± (6.28)
σx σy
este nenegativă, deoarece Z ia valori nenegative. Exploatând proprietăţile operatorului
valoare medie avem:
2 2
X − mX Y − mY (X − mx )(Y − my )
M (Z) = M +M ± 2M
σX σY σX σY
1 1 2
= 2
M [(X − mX )2 ] + 2 M [(Y − mY )2 ] ± cov(X, Y )
σX σY σX σY
σ2 σY2
= X 2
+ ± 2ρ(X, Y ). (6.29)
σX σY2
Astfel 2 ± 2ρ(X, Y ) ≥ 0, ceea ce ste echivalent cu:
−1 ≤ ρ(X, Y ) ≤ 1. (6.30)
Observăm că pentru două variabile aleatoare independente, coeficientul de corelaţie este
0. Este natural să ne ı̂ntrebăm ı̂n ce caz coeficientul de corelaţie a două variabile aleatoare
ia valorile extreme ±1. Răspunsul este dat de:
Propoziţia 6.2.6 Dacă ı̂ntre variabilele X şi Y există o relaţie liniară de forma Y =
aX +b, a, b ∈ R, a 6= 0, atunci coeficientul de corelaţie al v.a. X,Y este ±1, şi anume dacă
a > 0, ρ(X, Y ) = 1, iar dacă a < 0, ρ(X, Y ) = −1. Reciproc, dacă modulul coeficientul
de corelaţie a două variabile aleatoare X, Y este 1 atunci ı̂ntre ele există o relaţie liniară:
Y = aX + b.
Demonstraţie: Dacă Y = aX + b, atunci:

cov (X, aX + b)
ρ(X, Y ) = (6.31)
σ(X)σ(aX + b)
Dar
cov (X, aX + b) = M [(X − mX )(aX + b − amX − b)]

= M [(X − mX ) [a(X − mX )]] = aM X − mX )2
= aσ 2 (X). (6.32)
Pe de altă parte, σ 2 (aX + b) = a2 σ 2 (X) şi deci σ(aX + b) = |a|σ(X). Rezultă, atunci că:
aσ 2 (X) a
ρ(X, Y ) = 2
= . (6.33)
|a|σ (X) |a|
Prin urmare, pentru a > 0, ρ(X, Y ) = 1, iar pentru a < 0, ρ(X, Y ) = −1.
Reciproc, considerăm funcţia g(a, b) = M [(Y − aX − b)2 ] (variabilele aleatoare X
şi Y sunt fixate) şi să determinăm a, b astfel ı̂ncât g să fie minimă, adică determinăm
parametrii a, b astfel ı̂ncât media abaterii la pătrat a lui Y , faţa de o funcţie liniară de X
să fie minimă.
Pentru a arăta că funcţia g are un minim global o descompunem astfel:
g(a, b) = M [(Y − aX − b)2 ] = M (Y 2 + a2 X 2 + b2 − 2aXY − 2bY + 2abX)

= M (Y 2 ) + a2 M (X 2 ) + b2 − 2aM (XY ) − 2bM (Y ) + 2abM (X)
Evident că M (Y 2 ), M (X 2 ), M (XY ), M (Y ), M (X) sunt constante. Rezolvând sis-

temul:
∂g
= 0
∂a
∂g
= 0
∂b
obţinem punctul critic (a0 , b0 ), unde
cov(X, Y )
a0 = , b0 = M (Y ) − a0 M (X)
σ 2 (X)
Se arată că (a0 , b0 ) este punct de minim, adică matricea:

 2 
∂ g ∂ 2g
 ∂a2 ∂a∂b 
 
  (a0 , b0 )
 ∂ 2g ∂ 2g 
∂a∂b ∂b2
este pozitiv definită.
Calculând g(a0 , b0 ) obţinem minimumul funcţiei g:
min g(a, b) = min M [(Y − aX − b)2 ] = σ 2 (Y )(1 − ρ2 (X, Y )) ≥ 0

a,b
Dar cum prin ipoteză corelaţia ρ(X, Y ) = ±1, avem că g(a0 , b0 ) = M [(Y −a0 X −b0 )2 ] = 0.
Deoarece variabila (Y − a0 X − b0 )2 este pozitivă, media sa este zero dacă şi numai dacă
Y − a0 X − b0 = 0 sau echivalent Y = a0 X + b0 .
În concluzie:
• când coeficientul de corelaţie a două variabile aleatoare este ı̂n valoare absolută
apropiat de zero, variabilele sunt slab corelate (intensitatea legăturii dintre ele este re-
dusă);
• dacă valoarea absolută a coeficientului de corelaţie este apropiată de 1, atunci relaţia
dintre v.a. este ”aproape liniară”, adică valorile (x, y) ale vectorului aleator (X, Y ) sunt
uşor dispersate ı̂n jurul unei drepte de ecuaţie y = ax + b.
• Un vector aleator (X, Y ) ce are modulul coeficientului de corelaţie apropiat de 1,
adica |ρ(X, Y )| = 1 − ǫ, cu ǫ foarte mic, are valorile de observaţie (x, y) legate printr-o
relaţie de forma y = ax + b + N , unde N este o variabilă aleatoare de medie 0 şi dispersie
redusă, independentă de X. Variabila N este numită ı̂n inginerie zgomot (numele, N, vine
de la noise=zgomot) (mai multe detalii despre distribuţia de probabilitate a zgomotului ı̂n
cursul 13, relativ la regresia liniară). Dispersia redusă a zgomotului asigură ı̂mprăstierea
redusă a valorilor de observaţie asupra vectorului (X, Y ) ı̂n jurul dreptei y = ax + b
(Fig.6.6)
În Fig.6.6 se remarcă ı̂mprăştierea mai mare a punctelor ı̂n jurul dreptei când zgomotul
are dispersie mai mare (0.52 > 0.22 ).
Ceea ce am studiat relativ la dependenţa variabilelor aleatoare constituie aspectul
teoretic al problemei. În practica experimentală, se ı̂nregistrează valorile de observaţie
asupra unui vector aleator (X, Y ), se vizualizează norul de puncte (ca ı̂n Fig.6.6). Apriori
nu se cunoaşte intensitatea legăturii dintre cele două variabile. Din punctele (xi , yi ),
i = 1, n, ı̂nregistrate se estimează panta a şi cota b a dreptei y = ax + b ce ”se potriveşte”
cel mai bine datelor. Apoi se decide dacă abaterea punctelor de la dreapta y = ax + b
este rezonabilă sau nu (această problematică va fi abordată ı̂n cursul 13).
Exemplul 5. Fie X o variabilă aleatoare ce are media M (X) = 3 şi dispersia σ 2 (X) = 1,
iar Y = −2X + 5.
Să se calculeze covarianţa şi coeficientul de corelaţie a variabilelor X, Y .
10
7 y = 2x + 1 + N
σ(N ) = 0.2
4
y
1
−2
−5
−3 −1.5 0 1.5 3
x
10
7 y = −1.5x + 2 + N
σ(N ) = 0.5
4
y
1
−2
−5
−3 −1.5 0 1.5 3
x
Fig.6.6: Valori de observaţie (x, y) asupra vectorului aleator (X, Y ) legate prin relaţia aproape
liniară y = ax + b + N . Abaterea de la liniaritate este determinată de un zgomot N de abatere
standard σ, redusă . Valorile de observaţie sunt marcate cu albastru, iar dreapta de ecuaţie
y = ax + b este vizualizată ı̂n roşu.
Rezolvare: Deoarece ı̂ntre X şi Y există o relaţie liniară, coeficientul de corelaţie este:
ρ(X, Y ) = −1
Dar cum
cov(X, Y )
ρ(X, Y ) =
σ(X) σ(Y )
calculând σ 2 (Y ) = σ 2 (−2X + 5) = 4σ 2 (X) = 4, rezultă că:
cov(X, Y )
−1 =
2
adică cov(X, Y ) = −2.
Observaţia 6.2.3 Covarianţa şi coeficientul de corelaţie se definesc nu numai pentru v.a.
continue ci şi pentru v.a. discrete. Toate proprietăţile enunţate mai sus sunt valabile, doar
că ı̂n demonstraţii ı̂n locul integralelor avem sume.
Probleme de antrenamnet
1. Vectorul aleator (X, Y ) are densitatea de probabilitate:

( 1
dacă x2 + y 2 ≤ 1
fX,Y = π
0 ı̂n rest
a) Să se calculeze P (X > 0).

b) Să se determine funcţia de repartiţie a v.a. Y;
c) Să se determine densitatea v.a. condiţionate (X|Y = 0.5) şi P (X < 0|Y = 0.5).
2. Timpii de viaţa a doi tranzistori ı̂ntr-un circuit electronic sunt daţi de coordonatele
vectorului aleator (X, Y ) ce are densitatea de probabilitate:
−(x+2y)
2e dacă x ≥ 0, y ≥ 0
fX,Y =
0 ı̂n rest
Să se calculeze M (X + Y ).
3. Fie (X, Y ) un vector aleator ce are densitatea de probabilitate fX,Y . Să se exprime
modul de calcul al probabilitătilor evenimentelor A, B, A ∪ B ∪ C cu ajutorul densităţii,
ştiind că evenimentele sunt:
A = (X ≤ 2, 1 < Y ≤ 3), B = (2 < X ≤ 3, Y ≤ 1), C = (2 < X ≤ 3, 1 < Y ≤ 3)
4. La adresa http://www.xyz.ro este postat un chestionar cu două ı̂ntrebări. Fie X

procentul de persoane ce vizitează pagina şi dau răspuns la ı̂ntrebarea 1 şi Y procen-
tul de persoane ce vizitează pagina şi răspund la ı̂ntrebarea 2. Densitatea comună de
probabilitate a vectorului (X, Y ) este:
( 2
(x + 4y) dacă x ∈ [0, 1] × [0, 1]
fX,Y = 5
0 ı̂n rest
a) Să se determine densităţile de probabilitate ale variabilelor condiţionate fX|y0 , fY |x0 .

b) Să se calculeze probabilitatea ca cel puţin 20% dintre vizitatori să dea răspuns la
ı̂ntrebarea 2;
c) Să se calculeze probabilitatea ca să se ı̂nregistreze cel puţin 20% răspunsuri la
ı̂ntrebarea 2, ştiind că s-au ı̂nregistrat 10% răspunsuri la ı̂ntrebarea 1.
5. Fie X o variabilă aleatoare ce are M (X) = 2 şi σ 2 (X) = 1, iar Y = 3X + 2.

a) Să se calculeze covarianţa variabilelor X, Y ;
Dacă N este un zgomot de medie 0 şi dispersie σ 2 = 0.42 , independent de variabila
aleatoare X, să se calculeze media şi dispersia variabilei Y = 3X + 3 + N .

CSProbabil6 2008

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

CSProbabil6 2008

Încărcat de

Drepturi de autor:

Formate disponibile

Curs 6

Vectori aleatori continui. Independenţa variabilelor

6.1 Vectori aleatori

fX,Y se numeşte in english: joint probability density function.

1 −(x2 +y2 )/2

Fig.6.1: Graficul densităţii de probabilitate a unui vector aleator (X, Y ).

D = {(x, y) | (x − 1)2 + (y − 1.5)2 ≤ 0.52 }

Fig.6.2: Graficul unei densităţi de probabilitate cu suport mărginit.

unde ρ ∈ [0, 0.5], θ ∈ [0, 2π] avem:

Densitatea de probabilitate fX,Y defineşte funcţia de repartiţie, FX,Y , a vectorului

Notăm prin fX , fY funcţiile definite pe R cu valori ı̂n R, prin:

• Generalizând, un vector aleator de n componente (X1 , X2 , . . . , Xn ) este reprezentat

Pentru g(x, y) = x + y, g(x, y) = xy, ∀ x, y, ∈ R, avem:

M (a1 X1 + a2 X2 + · · · + an Xn ) = a1 M (X1 ) + a2 M (X2 ) + · · · + an M (Xn ), a1 , a2 , . . . , an ∈ R

Proprietate. În general M (XY ) 6= M (X)M (Y ).

6.1.1 Variabile aleatoare independente

F (x1 , x2 , . . . , xn ) = FX1 (x1 )FX2 (x2 ) · · · FXn (xn )

P (X1 ∈ I1 , X2 ∈ I2 , . . . , Xn ∈ In ) = P (X1 ∈ I1 )P (X2 ∈ I2 ) · · · P (XN ∈ In )

Demonstraţie: Variabilele aleatoare sunt independente dacă şi numai dacă:

FX,Y (x, y) = FX (x)FY (y), ∀ x, y ∈ R

fX,Y (x, y) = fX (x)fY (y), ∀ x, y ∈ R. (6.14)

Generalizând la n variabile aleatoare, variabilele X1 , X2 , . . . , Xn sunt independente dacă şi

f (x1 , x2 , . . . , xn ) = fX1 (x1 )fX2 (x2 ) · · · fXn (xn ), ∀ (x1 , x2 , . . . , xn ) ∈ Rn , (6.15)

unde f este densitatea de probabilitate a vectorului aleator (X1 , X2 , . . . , Xn ).

iar pentru y > 0,

• Un şir X1 , X2 , . . . , Xn , . . . de variabile aleatoare cu proprietatea că orice subşir finit

6.1.2 Densitatea unei variabile aleatoare condiţionată de valoarea altei vari-

Demonstraţie: Verificăm că g(·|y0 ) : R → R este densitate de probabilitate. Evident,

Analog se arată că şi funcţia h(·|x0 ) este densitate de probabilitate.

fX,Y (x, y) = fX (x)fY (y), ∀ (x, y) ∈ R2 . (6.19)

Exemplul 4. Vectorul aleator (X, Y ) are densitatea de probabilitate:

a) Să se determine densitatea de probabilitate a variabilei aleatoare condiţionate (Y |X =

Rezolvare: a) Determinăm mai ı̂ntâi densităţile de probabilitate marginale fX şi fY .

şi h(y|0.25) = 0 ı̂n rest.

Propoziţia 6.1.3 Daca X1 , . . . , Xn sunt variabile aleatoare independente si h : R →

Demonstraţie: Distingem două cazuri:

P (h(X1 ) ≤ y1 , h(X2 ) ≤ y2 , . . . , h(Xn ) ≤ yn ) =

6.2 Covarianţa şi coeficientul de corelaţie

Definiţia 6.2.1 Covarianţa variabilelor aleatoare X, Y ce au respectiv valorile medii mX :=

cov(X, Y ) = M [(X − mX )(Y − mY )]. (6.20)

Observaţia 6.2.1 Covarianţa unei variabile cu ea ı̂nsăşi coincide cu dispersia sa:

cov(X, X) = M [(X − mX )(X − mX )] = M [(X − mX )2 ] = σ 2 (X)

De aceea pentru cov(X, Y ) se mai foloseşte notaţia σ(X, Y ) sau σX,Y .

Pentru un calcul mai rapid al covarianţei avem:

cov(X, Y ) = M (XY ) − M (X)M (Y ) (6.21)

Demonstraţie: Efectuăm produsul (X − mX )(Y − mY ) = XY − mX Y − mY X + mX mY .

Definiţia 6.2.2 Două variabile aleatoare X, Y ce au covarianţa zero se numesc variabile

σ 2 (a1 X1 + a2 X2 + · · · + an Xn ) = a21 σ 2 (X1 ) + a22 σ 2 (X2 ) + · · · + a2n σ 2 (Xn ), (6.25)

Definiţia 6.2.3 Coeficientul de corelaţie a două v.a. X, Y de abateri standard nenule,

Propoziţia 6.2.5 Coeficientul de corelaţie a două variabile aleatoare X, Y are valoarea

ρ(X, Y ) ∈ [−1, 1] (6.27)

Demonstraţie: Fie mX , mY valorile medii ale variabilelor aleatoare X, Y , iar σX , σY

Demonstraţie: Dacă Y = aX + b, atunci:

cov (X, aX + b) = M [(X − mX )(aX + b − amX − b)]

g(a, b) = M [(Y − aX − b)2 ] = M (Y 2 + a2 X 2 + b2 − 2aXY − 2bY + 2abX)

Evident că M (Y 2 ), M (X 2 ), M (XY ), M (Y ), M (X) sunt constante. Rezolvând sis-

Se arată că (a0 , b0 ) este punct de minim, adică matricea:

min g(a, b) = min M [(Y − aX − b)2 ] = σ 2 (Y )(1 − ρ2 (X, Y )) ≥ 0

1. Vectorul aleator (X, Y ) are densitatea de probabilitate:

a) Să se calculeze P (X > 0).

A = (X ≤ 2, 1 < Y ≤ 3), B = (2 < X ≤ 3, Y ≤ 1), C = (2 < X ≤ 3, 1 < Y ≤ 3)

4. La adresa http://www.xyz.ro este postat un chestionar cu două ı̂ntrebări. Fie X

a) Să se determine densităţile de probabilitate ale variabilelor condiţionate fX|y0 , fY |x0 .