Sunteți pe pagina 1din 16

Curs 6

Vectori aleatori continui. Independenţa variabilelor


aleatoare. Măsuri ale dependenţei.

6.1 Vectori aleatori


O pereche (X, Y ) sau mai general, un n–uplu de v.a. continue (X1 , X2 , . . . , Xn ) se numeşte
vector aleator. Vectorii aleatori sunt definiţi ı̂n experimente ı̂n care se observă sau măsoară
simultan n caracteristici ale sistemului sau procesului supus studiului.
Pentru a ı̂ntelege mai rapid problematica relativ la vectori aleatori studiem cazul cel
mai simplu, al vectorilor aleatori cu două componente.
Ca şi ı̂n cazul unei singure v.a. continue X, ne interesează relativ la vectorul aleator
(X, Y ), probabilităţile evenimentelor de forma ((X, Y ) ∈ D): ”evenimentul ca vectorul
(X, Y ) să ia valori ı̂n domeniul D ⊂ R2 ”. Cele mai uzuale domenii sunt cele dreptunghi-
ulare care pot conţine laturile de frontieră sau, nu: D = [a, b] × [c, d], D = [a, b) × [c, d),
etc.
Distribuţia de probabilitate a unui vector aleator se precizează dând densitatea de
probabilitate, care este o funcţie fX,Y : R2 → R cu proprietăţile:
1. fX,Y (x, y) ≥ 0, ∀ (x, y) ∈ R2 ;
2. fX,Y este integrabilă pe R2 şi integrala dublă:
ZZ Z ∞Z ∞
fX,Y (x, y)dxdy = fX,Y (x, y) dxdy = 1 (6.1)
R2 −∞ −∞

fX,Y se numeşte in english: joint probability density function.


Condiţia a doua din definiţia densităţii asigură că volumul domeniului din R3 mărginit
deasupra de graficul funcţiei, suprafaţa z = fX,Y (x, y), (x, y) ∈ R2 , iar dedesubt de planul
xOy de ecauţie z = 0, este egal cu unu (Fig.6.1).
Probabilitatea ca vectorul (X, Y ) să ia valori ı̂n domeniul D din plan este integrală
dublă pe D din densitate:
ZZ
P ((X, Y ) ∈ D) = fX,Y (x, y) dx dy (6.2)
D

1 −(x2 +y2 )/2


Densitatea din Fig.6.1 are expresia analitică, f (x, y) = e , adică este nenulă

pe ı̂ntreg R2 . Deci vectorul ia cu o probabilitate nenulă, valori ı̂n orice domeniu D ⊂ R2 .

1
2 c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS
z

y
x

Fig.6.1: Graficul densităţii de probabilitate a unui vector aleator (X, Y ).

Domeniul G din plan pe care densitatea de probabilitate a unui vector aleator (X, Y )
este nenulă, se numeşte suportul densităţii. Cel mai adesea suportul densităţii este un
domeniu marginit din plan.
Exemplul 1. Fie (X, Y ) un vector aleator ce are densitatea:

2 − y dacă x ∈ [0, 2], y ∈ [1, 2]
fX,Y =
0 ı̂n rest

Suportul densităţii este domeniul dreptunghiular G = [0, 2] × [1, 2]. Graficul lui fX,Y este
vizualizat ı̂n Fig.6.2. El constă din planul haşurat ( de ecuaţie z = 2 − y, (x, y) ∈ G şi din
planul xoy minus dreptunghiul G
Să verificăm că funcţia dată este ı̂ntr-adevăr o densitate. Evident că f (x, y) ≥ 0,iar
ZZ Z 2Z 2 Z 2 Z 2
2 2
fX,Y (x, y)dxdy = 2 − ydx dy = (2y − y /2)|1 dx = 1/2 dx = 1
R2 0 1 0 0

Probabilitatea ca vectorul aleator (X, Y ) să ia valori ı̂n discul D centrat ı̂n punctul de
coordonate (1, 1.5) şi de rază r = 0.5

D = {(x, y) | (x − 1)2 + (y − 1.5)2 ≤ 0.52 }

este ZZ ZZ
P ((X, Y ) ∈ D) = fX,Y dxdy = (2 − y) dxdy
D D
Efectuând schimbarea de variabile:
x = 1 + ρ cos θ
y = 1.5 + ρ sin θ
c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS 3
z

(0, 2, 0)
y
x (2, 1, 0)

(2, 2, 0)

Fig.6.2: Graficul unei densităţi de probabilitate cu suport mărginit.

unde ρ ∈ [0, 0.5], θ ∈ [0, 2π] avem:


ZZ Z 0.5 Z 2π
(2 − y) dxdy = dρ ρ(2 − 1.5 − ρ sin θ)dθ = π/8
D 0 0

Densitatea de probabilitate fX,Y defineşte funcţia de repartiţie, FX,Y , a vectorului


aleator (X, Y ) prin:
Z x Z y
FX,Y (x, y) = P (X ≤ x, Y ≤ y) = fX,Y (x, y) dx dy (6.3)
−∞ −∞

Domeniul de integrare din R2 , pentru calculul funcţiei de repartiţie este ilustrat ı̂n Fig.6.3:

Observaţia 6.1.1 Dacă funcţia de repartiţie a vectorului aleator (X, Y ) este definită de
∂2F
densitatea fX,Y , continuă pe R2 , atunci există şi din (6.3) avem:
∂x∂y
∂ 2 FX,Y
(x, y) = fX,Y (x, y), ∀ (x, y) ∈ R2 . (6.4)
∂x∂y
Se ridică următoarea ı̂ntrebare: cunoscând densitatea de probabilitate fX,Y vectorului
aleator (X, Y ) putem afla densităţile de probabilitate fX , fY şi funcţiile de repartiţie
FX , FY ale coordonatelor sale X şi Y ?
Răpunsul este afirmativ, şi pentru a determina funcţiile asociate lui X, respectiv Y ,
observăm că dacă fX,Y este integrabilă ı̂n raport cu x, respectiv y, atunci avem:
RR R ∞ R ∞ 
1 = R2 fX,Y (x, y)dx dy = −∞ −∞ fX,Y (x, y) dx dy
R ∞ R ∞  (6.5)
= −∞ −∞ fX,Y (x, y) dy dx
4 c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS
y

(x, y)

(−∞, x] × (−∞, y]

Fig.6.3: Domeniul de integrare pentru calculul funcţiei de repartiţie a unui vector aleator
(X, Y ).

Notăm prin fX , fY funcţiile definite pe R cu valori ı̂n R, prin:


Z ∞ Z ∞
fX (x) = fX,Y (x, y) dy, fY (y) = fX,Y (x, y) dx, ∀ x, y ∈ R
−∞ −∞

Ambele funcţii sunt integrale dintr-o funcţie pozitivă fX,Y , deci sunt şi ele pozitive. Din
relaţia (6.5) rezultă de asemenea că:
Z ∞ Z ∞
fX (x) dx = 1, fY (x) dy = 1
−∞ −∞

şi deci funcţiile fX , fY sunt densităţi de probabilitate pentru variabile aleatoare definite
pe R. Să arătăm că fX este chiar densitatea variabilei X, iar fY a variabilei Y .
Într-adevăr conform relaţiei (6.2) funcţia de repartiţie a v.a. X este:
Z x Z ∞  Z x
FX (x) = P (X ≤ x) = P (X ≤ x, Y ∈ R) = fX,Y (x, y) dy dx = fX (x) dx
−∞ −∞ −∞
| {z }
fX (x)
(6.6)
Prin urmare fX este densitatea de probabilitate a variabilei X, pentru că este o densitate
de probabilitate ce defineşte funcţia de repartiţie a lui X.
fX se numeşte densitatea marginală a lui X, iar repartiţia asociată FX , repartiţia
marginală a lui X. Analog, definim densitatea marginală fY , respectiv repartiţia marginală
FY :
Z ∞
fY (y) = fX,Y (x, y) dx (6.7)
−∞
Z y Z y Z ∞ 
FY (y) = fY (y) dy = fX,Y (x, y) dx dy (6.8)
−∞ −∞ −∞
c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS 5

• Generalizând, un vector aleator de n componente (X1 , X2 , . . . , Xn ) este reprezentat


din punct de vedere probabilist de densitatea sa de probabilitate f : Rn → R, care
defineşte apoi funcţia de repartiţie F : Rn → R prin:

F (x1 , x2 , . . . , xn ) = P (X1 ≤ x1 , X2 ≤ x2 , . . . , Xn ≤ xn )
R x1 R xn (6.9)
= −∞
··· −∞
f (x1 , . . . xn ) dx1 · · · dxn

• Dacă (X, Y ) este un vector aleator având densitatea de probabilitate fX,Y şi g :
2
R → R este o funcţie continuă atunci Z = g(X, Y ) este o variabilă aleatoare, şi dacă ı̂n
plus funcţia produs |gf | este integrabilă pe R2 , atunci, v.a. Z are valoare medie şi:

M (g(X, Y )) =
Z ∞Z ∞
g(x, y)f (x, y) dx dy (6.10)
−∞ −∞

Pentru g(x, y) = x + y, g(x, y) = xy, ∀ x, y, ∈ R, avem:


Z ∞Z ∞
M (X + Y ) = (x + y)f (x, y) dx dy (6.11)
−∞ −∞
Z ∞Z ∞
M (XY ) = xyf (x, y) dx dy (6.12)
−∞ −∞

Proprietate. M (X + Y ) = M (X) + M (Y ).
Demonstraţie:
R∞ R∞
M (X + Y ) = −∞ −∞
(x + y)f (x, y) dx dy
R∞ R∞ R∞ R∞
= −∞ −∞
xf (x, y) dxdy + −∞ −∞
yf (x, y)dxdy
Z ∞  Z ∞ 
R∞ R∞
= −∞
x f (x, y) dy dx + −∞
y f (x, y) dx dy
−∞ −∞
| {z } | {z }
fX (x) fY (y)

R∞ R∞
= −∞
xfX (x) dx + −∞
yfY (y) dy = M (X) + M (Y )

Generalizând avem că media unei combinaţii liniare cu coeficienţi reali a n variabile
aleatore este combinaţia liniară cu aceeaşi coeficienţi a mediilor variabilelor:

M (a1 X1 + a2 X2 + · · · + an Xn ) = a1 M (X1 ) + a2 M (X2 ) + · · · + an M (Xn ), a1 , a2 , . . . , an ∈ R

Proprietate. În general M (XY ) 6= M (X)M (Y ).


Exemplul 2. Un vector aleator (X1 , X2 ) are densitatea de propbabilitate
6 c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS

x2

(0; x2 ) (1 x2 ; x2 )

(x 1 ; 1 x1 )

x1
(x1 ; 0)

Fig.6.4: Distribuţia de probabilitate a vectorului aleator din Exemplul 2 este nenulă pe domeniul
triunghiular haşurat.


24x1 x2 dacă x1 > 0, x2 > 0, 0 < x1 + x2 < 1
f (x1 , x2 ) =
0 ı̂n rest
a) Să se determine densităţile de probabilitate marginale fX1 şi fX2 ;
b) Să se calculeze media variabilei aleatoare Z = 2.5 − 2(X1 + X2 )

Rezolvare: Densitatea de probabilitate a vectorului aleator (X1 , X2 ) este nenulă ı̂n dome-
niul triunghiular, haşurat R ∞ ı̂n Fig.6.4. a)RPentru x1 ∈ (0, 1), densitatea de probabilitate a
1−x1
v.a. X1 este fX1 (x1 ) = −∞ f (x1 , t)dt = 0 24x1 tdt = 12x1 (1−x1 )2 (integrala s-a calcu-
lat pe ”un Rinterval vertical” Rilustrat ı̂n Fig.6.4), şi fX1 (x1 ) = 0 ı̂n rest. Pentru x2 ∈ (0, 1),
∞ 1−x
fX2 (x2 ) = −∞ f (t, x2 )dt = 0 2 24tx2 dt = 12x2 (1 − x2 )2 (integrala s-a calculat pe ”un
interval orizontal” ilustrat ı̂n Fig.6.4) şi fX2 (x2 ) = 0 ı̂n rest.
b)
R ∞Valoarea medie a Rvariabilei Z este M (Z) = 2.5 − 2(M R (X1 ) + M (X2 )). Dar M (X1 ) =
R1
1 2 2 ∞
−∞
x 1 fX 1 (x 1 )dx 1 = 0
12x 1 (1 − x 1 ) dx 1 , iar M (X 2 ) = −∞
x 2 fX 2 (x 2 )dx 2 = 0
12x22 (1 −
x2 )2 dx2 .

6.1.1 Variabile aleatoare independente


Definiţia 6.1.1 Variabilele aleatoare X1 , X2 , . . . , Xn se numesc v.a. independente dacă:

notaţie
P ((X1 ≤ x1 ) ∩ (X2 ≤ x2 ) ∩ . . . ∩ (Xn ≤ xn )) =
= P (X1 ≤ x1 , X2 ≤ x2 , . . . , Xn ≤ xn ) =
= P (X1 ≤ x1 )P (X2 ≤ x2 ) · · · P (Xn ≤ xn ), (6.13)

ceea ce este echivalent cu faptul că funcţia de repartiţie a vectorului aleator (X1 , X2 , . . . , Xn )
este produsul funcţiilor de repartiţie marginale:

F (x1 , x2 , . . . , xn ) = FX1 (x1 )FX2 (x2 ) · · · FXn (xn )


c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS 7

Se poate demonstra că varibilele aleatoare X1 , X2 , . . . , Xn sunt independente dacă şi numai
dacă oricare ar fi intervalele I1 , I2 , . . . In ⊂ R avem că:

P (X1 ∈ I1 , X2 ∈ I2 , . . . , Xn ∈ In ) = P (X1 ∈ I1 )P (X2 ∈ I2 ) · · · P (XN ∈ In )

În practică se consideră cazul ı̂n care repartiţiile sunt definite de densităţi de probabilitate.
Propoziţia 6.1.1 Variabilele aleatoare X, Y sunt independente dacă şi numai dacă den-
sitatea de probabilitate a vectorului aleator (X, Y ) este produsul densităţilor v.a. X, Y .

Demonstraţie: Variabilele aleatoare sunt independente dacă şi numai dacă:

FX,Y (x, y) = FX (x)FY (y), ∀ x, y ∈ R


Exprimând fiecare din cele trei funcţii de repartiţie cu ajutorul densităţii corespunzătoare
avem că variabilele aleatoare X, Y sunt independente dacă şi numai dacă:

Z x Z y Z x Z y Z x Z y
f (x, y)dx dy = fX (x) dx fY (y) dy = fX (x) fY (y) dx dy
−∞ −∞ −∞ −∞ −∞ −∞

∀ x, y ∈ R, adică:

fX,Y (x, y) = fX (x)fY (y), ∀ x, y ∈ R. (6.14)

Generalizând la n variabile aleatoare, variabilele X1 , X2 , . . . , Xn sunt independente dacă şi


numai dacă densitatea de probabilitate a vectorului aleator (X1 , X2 , . . . , Xn ) este produsul
densităţilor variabilelor:

f (x1 , x2 , . . . , xn ) = fX1 (x1 )fX2 (x2 ) · · · fXn (xn ), ∀ (x1 , x2 , . . . , xn ) ∈ Rn , (6.15)

unde f este densitatea de probabilitate a vectorului aleator (X1 , X2 , . . . , Xn ).


Exemplul 3. Un circuit electronic conţine doi tranzistori. Durata de viaţa a trazistorilor
este dată de variabilele aleatoare X şi Y . Densitatea de probabilitate a vectorului aleator
(X, Y ) este: 
(1/8)x e−(x+y)/2 pentru x > 0, y > 0
f (x, y) = (6.16)
0 ı̂n rest
(măsurătorile se fac ı̂n sute de ore).
Să se verifice dacă duratele de viaţa sunt independente sau nu.
Calculăm densităţile marginale ale celor două variabile:

Z ∞
−x/2 −y)/2 −x/2 −y/2 lim
fX (x) = (1/8)x e e dy = (1/8)x e [−2e ] y=0y→∞
0
= (1/4))x e−x/2 , ∀ x > 0, (6.17)
8 c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS

iar pentru y > 0,


Z ∞ Z ∞
−x/2 −y/2 −y/2
fY (y) = (1/8)x e e dx = (1/8)e x e−x/2 = (1/2)e−y/2 . (6.18)
0 0

Evident că fX,Y (x, y) = fX (x)fY (y), ∀x, y ∈ R şi deci variabilele X şi Y sunt indepen-
dente.

• Un şir X1 , X2 , . . . , Xn , . . . de variabile aleatoare cu proprietatea că orice subşir finit


este constituit din v.a. independente se numeşte şir de v.a. independente.
• În statistică se folosesc preponderent şiruri finite X1 , X2 , . . . , Xn , de variabile a-
leatoare independente şi identic distribuite (notaţie i.i.d.), adică densitatea de
probabilitate a fiecărei variabile din şir este aceeaşi: fXk = f , ∀ k = 1, n.

6.1.2 Densitatea unei variabile aleatoare condiţionată de valoarea altei vari-


abile
Atunci când studiem un vector aleator (X, Y ) suntem interesaţi ı̂n a determina ı̂n ce fel
este influenţată probabilitatea ca X să ia valori ı̂ntr-un interval, de faptul că se ştie că
Y = y0 .

Propoziţia 6.1.2 Fie (X, Y ) un vector aleator de densitate de probabilitate fX,Y şi fX , fY
densităţile sale marginale.
1. Dacă fY (y0 ) 6= 0, atunci funcţia notată:

fXY (x, y0 )
g(x|y0 ) =
fY (y0 )

este o densitate de probabilitate şi o variabilă aleatoare ce are această densitate se notează
(X|Y = y0 ) şi se numeşte variabila aleatoare X condiţionată de evenimentul (Y = y0 ).
2. Dacă fX (x0 ) 6= 0, atunci funcţia notată:

fXY (x0 , y)
h(y|x0 ) =
fX (x0 )

este o densitate de probabilitate şi o variabilă aleatoare ce are această densitate se notează
(Y |X = y0 ) şi se numeşte variabila aleatoare Y condiţionată de evenimentul (X = x0 ).

Demonstraţie: Verificăm că g(·|y0 ) : R → R este densitate de probabilitate. Evident,


g(x|y0 ) ≥ 0, ∀ x ∈ R şi:
Z ∞ Z ∞ Z ∞
fXY (x, y0 ) 1 1
g(x|y0 ) dx = dx = fX,Y (x, y0 ) dx = fY (y0 ) = 1
−∞ −∞ fY (y0 ) fY (y0 ) −∞ fY (y0 )

Analog se arată că şi funcţia h(·|x0 ) este densitate de probabilitate.


c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS 9

Să stabilim relaţia dintre densitatea variabilei condiţionate de o alta variabilă şi den-
sitatea variabilei ce se condiţionează, ı̂n cazul ı̂n care cele două sunt independente. Am
arătat că variabilele aleatoare X, Y sunt independente dacă şi numai dacă

fX,Y (x, y) = fX (x)fY (y), ∀ (x, y) ∈ R2 . (6.19)

fX (x)fY (y)
În acest caz g(x|y) = = fX (x) şi analog h(y|x) = fY (y), ∀x, y ∈ R. Cu
fY (y)
alte cuvinte, dacă v.a. X, Y sunt independente, cunoaşterea valorii x a lui X, obţinută
printr-o observaţie, măsurare, etc, nu afectează ı̂n nici un fel distribuţia de probabilitate
a lui Y .

y
(x; 1)
(1; 1)

(x; x)

(0; y ) (y; y )

Fig.6.5: Densitatea de probabilitate a vectorului aleator din Exemplul 4 este nenulă pe domeniul
triunghiular haşurat.

Exemplul 4. Vectorul aleator (X, Y ) are densitatea de probabilitate:



6x pentru 0 < x < y < 1
fX,Y (x, y) =
0 ı̂n rest

a) Să se determine densitatea de probabilitate a variabilei aleatoare condiţionate (Y |X =


0.25);
b) Să se calculeze P (Y > 0.5) şi P (Y > 0.5|X = 0.25).

Rezolvare: a) Determinăm mai ı̂ntâi densităţile de probabilitate marginale fX şi fY .


Ţinând seama că densitatea de probabilitate fX,Y are suportul (este nenulă) pe domeniul
R1
triunghiular haşurat din Fig.6.5, avem că pentru x ∈ (0, 1), fX (x) = x fX,Y (x, t)dt =
R1
x
6xdt = 6x(1−x) (integrala s-a calculatRpe un segment vertical
R y ca ı̂n Fig.6.5) şi fX (x) =
y
0 ı̂n rest. Pentru y ∈ (0, 1), fY (y) = 0 fX,Y (t, y)dt = 0 6tdt = 3y 2 (integrala s-a
calculat pe un segment orizontal ca ı̂n Fig.6.5) şi fY (y) = 0 ı̂n rest. Astfel densitatea de
probabilitate a variabilei aleatoare (Y |X = 0.25) este:

fX,Y (0.25, y) 1
h(y|0.25) = = = 1.33, pentru y ∈ (0.25, 1)
fX (0.25) 0.75
10 c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS

şi h(y|0.25) = 0 ı̂n rest.


R∞ R1
b) P (Y > 0.5) = 0.5 fY (y)dy = 0.5 3y 2 dy = 0.875, iar P (Y > 0.5|X = 0.25) =
R∞ R1 1
0.5
h(y|0.25) dy = 0.5 0.75 dy = 2/3.

Propoziţia 6.1.3 Daca X1 , . . . , Xn sunt variabile aleatoare independente si h : R →


R este o bijecţie continuă, atunci şi variabilele aleatoare h(X1 ), h(X2 ), . . . , h(Xn ) sunt
independente.

Demonstraţie: Distingem două cazuri:


1. h este strict crecătoare. Să arătăm că variabilele aleatoare h(X1 ), h(X2 ), . . . , h(Xn )
sunt independente:

P (h(X1 ) ≤ y1 , h(X2 ) ≤ y2 , . . . , h(Xn ) ≤ yn ) =


P (X1 ≤ h−1 (y1 ), X2 ≤ h−1 (y2 ), . . . , Xn ≤ h−1 (yn )) =
P (X1 ≤ h−1 (y1 ))P (X2 ≤ h−1 (yn )) · · · P (Xn ≤ h−1 (yn )) =
P (h(X1 ) ≤ y1 )P (h(X2 ) ≤ y2 ) · · · P (h(Xn ) ≤ yn ), ∀ y1 , y2 , . . . yn ∈ R

2. h este strict descrescătoare. În acest caz se exprimă evenimentele (Xi ≥ h−1 (yi )) =
∁(X < h−1 (yi )) şi se exploatează faptul că dacă n evenimente sunt independente atunci
şi opusele lor sunt independente.

6.2 Covarianţa şi coeficientul de corelaţie


În secţiunea precedentă am prezentat modalitatea de identificare a proprietăţii de inde-
pendenţă a unui număr finit de v.a. În inteligenţa artificială se lucrează preponderent cu
variabile aleatoare dependente.
Intensitatea dependenţei dintre două v.a. este măsurată de covarianţa, respectiv coe-
ficientul lor de corelaţie.

Definiţia 6.2.1 Covarianţa variabilelor aleatoare X, Y ce au respectiv valorile medii mX :=


M (X), mY := M (Y ) este un număr real notat cov(X, Y ),

cov(X, Y ) = M [(X − mX )(Y − mY )]. (6.20)

Observaţia 6.2.1 Covarianţa unei variabile cu ea ı̂nsăşi coincide cu dispersia sa:

cov(X, X) = M [(X − mX )(X − mX )] = M [(X − mX )2 ] = σ 2 (X)

De aceea pentru cov(X, Y ) se mai foloseşte notaţia σ(X, Y ) sau σX,Y .

Pentru un calcul mai rapid al covarianţei avem:


Propoziţia 6.2.1 Covarianţa v.a. X, Y este egală cu:

cov(X, Y ) = M (XY ) − M (X)M (Y ) (6.21)


c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS 11

Demonstraţie: Efectuăm produsul (X − mX )(Y − mY ) = XY − mX Y − mY X + mX mY .


Aplicând proprietăţile operatorului valoare medie avem:
cov(X, Y ) = M (XY ) − mX M (Y ) − mY M (X) + mX mY
= M (XY ) − M (X)M (Y ). (6.22)

Definiţia 6.2.2 Două variabile aleatoare X, Y ce au covarianţa zero se numesc variabile


aleatoare necorelate.
Deoarece am introdus covarianţa ca o măsură a intensităţii dependenţei dintre două
variabile aleatoare este natural să ne aşteptăm ca două variabile independente să aibă
covarianţa zero, adică să fie necorelate.
Propoziţia 6.2.2 Dacă variabilele aleatoare X, Y sunt independente atunci M (XY ) =
M (X)M (Y ) şi deci variabilele sunt necorelate.
Demonstraţie: Fie variabilele aleatoare independente X, Y şi fX,Y densitatea de prob-
abilitate a vectorului aleator (X, Y ). Atunci, fX,Y (x, y) = fX (x)fY (y), ∀ x, y ∈ R.
Z ∞Z ∞
M (XY ) = xyfX,Y (x, y) dx dy
−∞ −∞
Z ∞Z ∞
= xyfX (x) fY (y) dx dy
−∞ −∞
Z ∞  Z ∞ 
= fx (x) dx fY (y) dy
−∞ −∞
= M (X)M (Y ) (6.23)
Astfel cov(X, Y ) = M (XY ) − M (X)M (Y ) = M (X)M (Y ) − M (X)M (Y ) = 0.
Observaţia 6.2.2 Reciproca nu este adevărată. Două variabile aleatoare necorelate nu
sunt ı̂n mod necesar independente.
Ca o consecinţă a Propoziţiei 6.2.2 demonstrăm:
Propoziţia 6.2.3 Fie X, Y două variabile aleatoare.
a) Dispersia sumei X + Y este σ 2 (X + Y ) = σ 2 (X) + σ 2 (Y ) + 2cov(X, Y );
b) Dacă X şi Y sunt v.a. independente, atunci σ 2 (X + Y ) = σ 2 (X) + σ 2 (Y ).
Demonstraţie: Fie mX , mY , mediile celor două v.a. Conform definiţiei dispersiei a două
variabile aleatoare, avem:
σ 2 (X + Y ) = M [(X + Y ) − M (X + Y )]2
= M [(X − mX ) + (Y − mY )]2
 
= M (X − mX )2 + (Y − mY ))2 + 2(X − mX )(Y − mY )
= M [(X − mX )2 ] + M [(Y − mY )2 ]
+ 2M [(X − mX )(Y − mY ]
= σ 2 (X) + σ 2 (Y ) + 2cov(X, Y ) (6.24)
12 c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS

Dacă v.a. X şi Y sunt independente, atunci, cov(X, Y ) = 0 şi deci σ 2 (X + Y ) = σ 2 (X) +
σ 2 (Y )

Ţinând seama că σ 2 (aX) = a2 σ 2 (X), ∀ a ∈ R, putem generaliza rezultatul de mai sus la:
Propoziţia 6.2.4 Dacă X1 , X2 , . . . , Xn sunt v.a. independente atunci:

σ 2 (a1 X1 + a2 X2 + · · · + an Xn ) = a21 σ 2 (X1 ) + a22 σ 2 (X2 ) + · · · + a2n σ 2 (Xn ), (6.25)

∀ai ∈ R, i = 1, n.

Deoarece covarianţa a două v.a. este un număr real, definim o altă măsură a dependenţei
lor, numită coeficient de corelaţie, care ia valori ı̂ntr-un interval mărginit.

Definiţia 6.2.3 Coeficientul de corelaţie a două v.a. X, Y de abateri standard nenule,


este un număr real notat ρ(X, Y ) şi definit prin:
cov(X, Y )
ρ(X, Y ) = , (6.26)
σ(X)σ(Y )
unde σ(X), σ(Y ) sunt abaterile standard ale variabilelor aleatoare X, Y .

Propoziţia 6.2.5 Coeficientul de corelaţie a două variabile aleatoare X, Y are valoarea


absolută subunitară, mai precis:

ρ(X, Y ) ∈ [−1, 1] (6.27)

Demonstraţie: Fie mX , mY valorile medii ale variabilelor aleatoare X, Y , iar σX , σY


abaterile standard. Evident, valoarea medie a variabilei aleatoare:
 2
X − mX Y − mY
Z= ± (6.28)
σx σy
este nenegativă, deoarece Z ia valori nenegative. Exploatând proprietăţile operatorului
valoare medie avem:
 2  2  
X − mX Y − mY (X − mx )(Y − my )
M (Z) = M +M ± 2M
σX σY σX σY
1 1 2
= 2
M [(X − mX )2 ] + 2 M [(Y − mY )2 ] ± cov(X, Y )
σX σY σX σY
σ2 σY2
= X 2
+ ± 2ρ(X, Y ). (6.29)
σX σY2
Astfel 2 ± 2ρ(X, Y ) ≥ 0, ceea ce ste echivalent cu:

−1 ≤ ρ(X, Y ) ≤ 1. (6.30)
c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS 13

Observăm că pentru două variabile aleatoare independente, coeficientul de corelaţie este
0. Este natural să ne ı̂ntrebăm ı̂n ce caz coeficientul de corelaţie a două variabile aleatoare
ia valorile extreme ±1. Răspunsul este dat de:
Propoziţia 6.2.6 Dacă ı̂ntre variabilele X şi Y există o relaţie liniară de forma Y =
aX +b, a, b ∈ R, a 6= 0, atunci coeficientul de corelaţie al v.a. X,Y este ±1, şi anume dacă
a > 0, ρ(X, Y ) = 1, iar dacă a < 0, ρ(X, Y ) = −1. Reciproc, dacă modulul coeficientul
de corelaţie a două variabile aleatoare X, Y este 1 atunci ı̂ntre ele există o relaţie liniară:
Y = aX + b.

Demonstraţie: Dacă Y = aX + b, atunci:


cov (X, aX + b)
ρ(X, Y ) = (6.31)
σ(X)σ(aX + b)
Dar

cov (X, aX + b) = M [(X − mX )(aX + b − amX − b)]



= M [(X − mX ) [a(X − mX )]] = aM X − mX )2
= aσ 2 (X). (6.32)

Pe de altă parte, σ 2 (aX + b) = a2 σ 2 (X) şi deci σ(aX + b) = |a|σ(X). Rezultă, atunci că:

aσ 2 (X) a
ρ(X, Y ) = 2
= . (6.33)
|a|σ (X) |a|
Prin urmare, pentru a > 0, ρ(X, Y ) = 1, iar pentru a < 0, ρ(X, Y ) = −1.
Reciproc, considerăm funcţia g(a, b) = M [(Y − aX − b)2 ] (variabilele aleatoare X
şi Y sunt fixate) şi să determinăm a, b astfel ı̂ncât g să fie minimă, adică determinăm
parametrii a, b astfel ı̂ncât media abaterii la pătrat a lui Y , faţa de o funcţie liniară de X
să fie minimă.
Pentru a arăta că funcţia g are un minim global o descompunem astfel:

g(a, b) = M [(Y − aX − b)2 ] = M (Y 2 + a2 X 2 + b2 − 2aXY − 2bY + 2abX)


= M (Y 2 ) + a2 M (X 2 ) + b2 − 2aM (XY ) − 2bM (Y ) + 2abM (X)

Evident că M (Y 2 ), M (X 2 ), M (XY ), M (Y ), M (X) sunt constante. Rezolvând sis-


temul:
∂g
= 0
∂a
∂g
= 0
∂b
obţinem punctul critic (a0 , b0 ), unde
cov(X, Y )
a0 = , b0 = M (Y ) − a0 M (X)
σ 2 (X)
14 c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS

Se arată că (a0 , b0 ) este punct de minim, adică matricea:


 2 
∂ g ∂ 2g
 ∂a2 ∂a∂b 
 
  (a0 , b0 )
 ∂ 2g ∂ 2g 
∂a∂b ∂b2
este pozitiv definită.
Calculând g(a0 , b0 ) obţinem minimumul funcţiei g:

min g(a, b) = min M [(Y − aX − b)2 ] = σ 2 (Y )(1 − ρ2 (X, Y )) ≥ 0


a,b

Dar cum prin ipoteză corelaţia ρ(X, Y ) = ±1, avem că g(a0 , b0 ) = M [(Y −a0 X −b0 )2 ] = 0.
Deoarece variabila (Y − a0 X − b0 )2 este pozitivă, media sa este zero dacă şi numai dacă
Y − a0 X − b0 = 0 sau echivalent Y = a0 X + b0 .

În concluzie:
• când coeficientul de corelaţie a două variabile aleatoare este ı̂n valoare absolută
apropiat de zero, variabilele sunt slab corelate (intensitatea legăturii dintre ele este re-
dusă);
• dacă valoarea absolută a coeficientului de corelaţie este apropiată de 1, atunci relaţia
dintre v.a. este ”aproape liniară”, adică valorile (x, y) ale vectorului aleator (X, Y ) sunt
uşor dispersate ı̂n jurul unei drepte de ecuaţie y = ax + b.
• Un vector aleator (X, Y ) ce are modulul coeficientului de corelaţie apropiat de 1,
adica |ρ(X, Y )| = 1 − ǫ, cu ǫ foarte mic, are valorile de observaţie (x, y) legate printr-o
relaţie de forma y = ax + b + N , unde N este o variabilă aleatoare de medie 0 şi dispersie
redusă, independentă de X. Variabila N este numită ı̂n inginerie zgomot (numele, N, vine
de la noise=zgomot) (mai multe detalii despre distribuţia de probabilitate a zgomotului ı̂n
cursul 13, relativ la regresia liniară). Dispersia redusă a zgomotului asigură ı̂mprăstierea
redusă a valorilor de observaţie asupra vectorului (X, Y ) ı̂n jurul dreptei y = ax + b
(Fig.6.6)
În Fig.6.6 se remarcă ı̂mprăştierea mai mare a punctelor ı̂n jurul dreptei când zgomotul
are dispersie mai mare (0.52 > 0.22 ).
Ceea ce am studiat relativ la dependenţa variabilelor aleatoare constituie aspectul
teoretic al problemei. În practica experimentală, se ı̂nregistrează valorile de observaţie
asupra unui vector aleator (X, Y ), se vizualizează norul de puncte (ca ı̂n Fig.6.6). Apriori
nu se cunoaşte intensitatea legăturii dintre cele două variabile. Din punctele (xi , yi ),
i = 1, n, ı̂nregistrate se estimează panta a şi cota b a dreptei y = ax + b ce ”se potriveşte”
cel mai bine datelor. Apoi se decide dacă abaterea punctelor de la dreapta y = ax + b
este rezonabilă sau nu (această problematică va fi abordată ı̂n cursul 13).
Exemplul 5. Fie X o variabilă aleatoare ce are media M (X) = 3 şi dispersia σ 2 (X) = 1,
iar Y = −2X + 5.
Să se calculeze covarianţa şi coeficientul de corelaţie a variabilelor X, Y .
c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS 15
10

7 y = 2x + 1 + N
σ(N ) = 0.2
4
y
1

−2

−5
−3 −1.5 0 1.5 3
x
10

7 y = −1.5x + 2 + N
σ(N ) = 0.5
4
y
1

−2

−5
−3 −1.5 0 1.5 3
x

Fig.6.6: Valori de observaţie (x, y) asupra vectorului aleator (X, Y ) legate prin relaţia aproape
liniară y = ax + b + N . Abaterea de la liniaritate este determinată de un zgomot N de abatere
standard σ, redusă . Valorile de observaţie sunt marcate cu albastru, iar dreapta de ecuaţie
y = ax + b este vizualizată ı̂n roşu.

Rezolvare: Deoarece ı̂ntre X şi Y există o relaţie liniară, coeficientul de corelaţie este:

ρ(X, Y ) = −1

Dar cum
cov(X, Y )
ρ(X, Y ) =
σ(X) σ(Y )
calculând σ 2 (Y ) = σ 2 (−2X + 5) = 4σ 2 (X) = 4, rezultă că:

cov(X, Y )
−1 =
2
adică cov(X, Y ) = −2.

Observaţia 6.2.3 Covarianţa şi coeficientul de corelaţie se definesc nu numai pentru v.a.
continue ci şi pentru v.a. discrete. Toate proprietăţile enunţate mai sus sunt valabile, doar
că ı̂n demonstraţii ı̂n locul integralelor avem sume.
16 c E. Petrişor, 2008
Cursul 6, Probabilităţi şi Statistică ı̂n CS

Probleme de antrenamnet

1. Vectorul aleator (X, Y ) are densitatea de probabilitate:


( 1
dacă x2 + y 2 ≤ 1
fX,Y = π
0 ı̂n rest

a) Să se calculeze P (X > 0).


b) Să se determine funcţia de repartiţie a v.a. Y;
c) Să se determine densitatea v.a. condiţionate (X|Y = 0.5) şi P (X < 0|Y = 0.5).

2. Timpii de viaţa a doi tranzistori ı̂ntr-un circuit electronic sunt daţi de coordonatele
vectorului aleator (X, Y ) ce are densitatea de probabilitate:
 −(x+2y)
2e dacă x ≥ 0, y ≥ 0
fX,Y =
0 ı̂n rest

Să se calculeze M (X + Y ).

3. Fie (X, Y ) un vector aleator ce are densitatea de probabilitate fX,Y . Să se exprime
modul de calcul al probabilitătilor evenimentelor A, B, A ∪ B ∪ C cu ajutorul densităţii,
ştiind că evenimentele sunt:

A = (X ≤ 2, 1 < Y ≤ 3), B = (2 < X ≤ 3, Y ≤ 1), C = (2 < X ≤ 3, 1 < Y ≤ 3)

4. La adresa http://www.xyz.ro este postat un chestionar cu două ı̂ntrebări. Fie X


procentul de persoane ce vizitează pagina şi dau răspuns la ı̂ntrebarea 1 şi Y procen-
tul de persoane ce vizitează pagina şi răspund la ı̂ntrebarea 2. Densitatea comună de
probabilitate a vectorului (X, Y ) este:
( 2
(x + 4y) dacă x ∈ [0, 1] × [0, 1]
fX,Y = 5
0 ı̂n rest

a) Să se determine densităţile de probabilitate ale variabilelor condiţionate fX|y0 , fY |x0 .


b) Să se calculeze probabilitatea ca cel puţin 20% dintre vizitatori să dea răspuns la
ı̂ntrebarea 2;
c) Să se calculeze probabilitatea ca să se ı̂nregistreze cel puţin 20% răspunsuri la
ı̂ntrebarea 2, ştiind că s-au ı̂nregistrat 10% răspunsuri la ı̂ntrebarea 1.

5. Fie X o variabilă aleatoare ce are M (X) = 2 şi σ 2 (X) = 1, iar Y = 3X + 2.


a) Să se calculeze covarianţa variabilelor X, Y ;
Dacă N este un zgomot de medie 0 şi dispersie σ 2 = 0.42 , independent de variabila
aleatoare X, să se calculeze media şi dispersia variabilei Y = 3X + 3 + N .

S-ar putea să vă placă și