Sunteți pe pagina 1din 13

B3.

Variabilă aleatoare cu spectrul discret


O variabilă x care, pentru fiecare probă Ai a unei experienţe, ia valoarea
xi , i ∈ I , realizând o corespondenţă între câmpul de evenimente şi mulţimea nume-
relor reale, se numeşte variabilă aleatoare. Precizăm că nu-i obligatoriu ca valorile
xi să fie diferite şi, în particular, dacă sunt toate egale, variabila aleatoare se reduce
la o constantă. În funcţie de proprietăţile evenimentelor, valorile variabilei alea-
toare pot fi incompatibile (compatibile) sau independente (dependente) constituind
spectrul discret de valori, finit sau numărabil; variabila aleatoare cu spectrul
continuu va fi definită ulterior.
Determinarea variabilei aleatoare necesită cunoaşterea spectrului de valori şi
a probabilităţilor acestora.
N
Notăm cu ν i = i frecvenţa relativă a valorii xi şi ţinând seama de (B2.4),
N
probabilitatea valorii xi , care reprezintă evenimentul {x = xi }, se defineşte:

 
lim ν=
N →∞
i P ({= = Pi , P  =
x xi })
 i∈I
{x x=
i }

∑=
P
i
i 1. (B3.1)

Spectrul variabilei aleatoare xi împreună cu probabilităţile valorilor Pi , i ∈ I


constituie distribuţia sau repartiţia, pe scurt partiţia, variabilei aleatoare. Conve-
nim să reprezentăm simbolic distribuţia variabilei aleatoare x, cu spectrul discret
finit sau numărabil, printr-un tablou de forma:
 x , x , , xm   xn 
x:  1 2  respectiv x:   , n ∈ N (numere naturale) (B3.2)
 P1 , P2 , , Pm   Pn 
cu condiţia ca elemetele din linia a doua a tabloului să fie pozitive şi suma lor să fie
egală cu unitatea: Pi ³ 0, i ∈ I , ∑ Pi =
i∈I
1.

Având în vedere corespondenţa câmp de evenimente ↔ variabilă aleatoare, se


definesc operaţii cu variabile aleatoare, dintre care vom prezenta pe cele de interes.
• Suma dintre constanta C ∈ R (mulţimea numerelor reale) şi variabila x
este variabila aleatoare C + x care ia valoarea C + xi când x = xi şi are distribuţia:

 C + xi 
C + x: , i ∈ I (B3.3)
 Pi 
• Produsul dintre constanta C ∈ R şi variabila x este variabila aleatoare
Cx care ia valoarea Cxi când x = xi şi are distribuţia:

604
 Cx 
Cx :  i  , i ∈ I (B3.4)
 Pi 
• Suma dintre variabilele x şi y este variabila aleatoare x + y care ia va-
loarea xi + y j când x = xi şi y = y j şi are distribuţia:

 xi + y j 
x + y :  , i, j ∈ I (B3.5)
 Pij 
• Produsul dintre variabilele x şi y este variabila aleatoare xy care ia va-
loarea xi y j când x = xi şi y = y j şi are distribuţia:

 xi y j 
xy :   , i, j ∈ I (B3.6)
 Pij 
În cazul distribuţiilor (B3.5-6), Pij este probabilitatea evenimentului
={x x=
i } ¡ {y y j }:
= =
Pij P ({ x xi }¡ =
{y y =
j }) P=
(x xi=
, y yj) (B3.7)
Probabilitatea evenimentului {x = xi }, oricare ar fi evenimentul {y = y j },
j ∈ I , se calculează în virtutea proprietăţii de adunare a probabilităţilor:

= =
Pi P (x =
xi ) P=
({x x=
i, y y1}¿=
{x x=
i, y y2 }¿  ¿=
{x x=
i, y y=
j })

= ∑ P=
({x
j∈I
x=
i, y y=
j }) ∑P .
j∈I
ij (B3.8)

În mod similar se calculează:


=
Pj P=
(y y=
j) ∑ P=
(x
i∈I
xi =
, y y=
j) ∑P .
i∈I
ij (B3.9)

Dacă variabilele x şi y sunt independente, rezultă:

Pij =
Pi ⋅ Pj , i, j ∈ I . (B3.10)

B4. Valori medii


Media statistică a variabilei aleatoare are importanţă fundamentală în studiul
fenomenelor statistice şi se calculează cunoscând distribuţia acesteia.
Considerăm, la început, variabila aleatoare x cu spectrul discret finit de N
valori, pe care le grupăm într-o ordine arbitrară.
x1 x1  x1 x2 x2  x2  xm xm  xm ,
    
N1 N2 Nm

astfel încât:
605
m
N= ∑N .
i =1
i

Se defineşte media aritmetică ponderată a valorilor variabilei x :


m m

∑ ∑
N i xi
x=
N = νi xi ,
=i 1=N i 1

N
unde ν i = i este frecvenţa relativă a valorii xi . Ţinând seama de (B2.4), se defi-
N
neşte media statistică a variabilei x:
m m
= =
x lim xN
N →∞
=
N →∞
i 1= i 1
∑ =
xi lim νi ∑Px , i i (B4.1)

care este perfect determinată de distribuţia ei statistică.


Pentru variabila aleatoare cu spectrul discret numărabil, media statistică se
exprimă:

x= ∑Px ,
i =1
i i (B4.2)

cu condiţia ca seria să fie absolut convergentă.


În general, pentru variabila cu spectrul discret, avem:

x= ∑Px .
i∈I
i i (B4.3)

Media statistică are o serie de proprietăţi care decurg din proprietăţile distri-
buţiei variabilei aleatore.
• Media constantei este egală cu constanta. Constanta C are distribuţia:
C 
C:  
1
şi media se calculează:
=C ∑
=
i∈I
∑P
CP C= i
i∈I
i C. (B4.4)

Ca urmare, variabila aleatoare ax + b, cu distribuţia:

 ax + b 
ax + b:  i , i ∈ I,
 Pi 
are media:
ax + b = ∑ (ax + b)P = a∑ x P + b∑ P =
i∈I
i i
i∈I
i i
i∈I
i ax + b. (B4.5)

606
În general, pentru funcţii care diferă de polinoame de gradul întâi:

f (x) ≠ f (x ). (B4.6)
• Media sumei este egală cu suma mediilor. Variabila x + y are distribuţia
(B3 .5) şi media se calculează:

x+
= y ∑ (x + y =
i , j∈I
)P ∑ x ∑ P + ∑ y ∑=
i j P ij
i∈I
i
j∈I
ij
j∈I
j
i∈I
ij

= ∑
xi Pi +
i∈I
∑y P
j∈I
j j =
x + y, (B4.7)

unde am ţinut seama de (B3.8–9).


• Media produsului a două variabile aleatoare independente este egală cu
produsul mediilor. Variabila xy are distribuţia (B3.6) şi media se calculează:

xy = ∑xy P
i , j∈I
i j ij == ∑x P∑ y P
i∈I
i i
j∈I
j j = x ⋅ y, (B4.8)

unde am ţinut seama de (B3.10).


Proprietăţile mediei, prezentate pentru una şi două variabile, se extind pentru
mai multe variabile şi pentru funcţii de acestea.
Convenim, în continuare, ca bara de deasupra variabilelor aleatoare să repre-
zinte operaţia de mediere şi proprietăţile mediei, care nu trebuie să mai fie scrise
explicit.

B5. Abaterea variabilei aleatoare.


Dispersia, fluctuaţia şi parametrul de corelaţie
În afară de media statistică a unei variabile aleatoare, de mare importanţă este
o măsură a gradului de împrăştiere a valorilor spectrului acesteia faţă de medie,
dată de un indicator numeric. Acest indicator numeric se alege având în vedere
câteva noţiuni.
• Abaterea de la medie este o variabilă aleatoare care se defineşte:
∆x = x − x . (B5.1)
Media statistică x este o constantă şi, ţinând seama de proprietăţile mediei, rezultă:

∆x = x − x = x − x = 0. (B5.2)
Cu alte cuvinte, media abaterii de la medie este nulă şi nu poate fi aleasă ca indica-
tor numeric al împrăştierii faţă de medie.
• Dispersia variabilei aleatoare:

607
(∆x) 2 =(x − x ) 2 =x 2 − x 2 ³ 0, (B5.3)
reprezintă media pătratului abaterii de la medie şi poate fi aleasă ca indicator
numeric al împrăştierii faţă de medie.
• Fluctuaţia (abaterea pătratică medie) absolută şi relativă:

σx = (∆x) 2 = x2 − x 2 (B5.4)
respectiv
σx
Ex =
, (B5.5)
x
se exprimă în unităţile variabilei respectiv în procente şi reprezintă, în modul cel
mai avantajos, indicatorul numeric menţionat. Se observă că:
2
 
σx > 0 ⇒ x > x ⇒
2 2

i∈I
xi2 Pi ∑
>  xi Pi 
 i∈I 
(B5.6)

şi
σ x = 0 ⇒ x 2 = x 2 , pentru x = C. (B5.7)
• Parametrul de corelaţie se defineşte pentru variabilele aleatoare x şi y,
ca măsură a gradului de corelaţie a acestora. Astfel, considerăm variabila aleatoare:
∆ (x, y ) = (x − x )(y − y ) = x ⋅ y − x ⋅ y − x ⋅ y + x ⋅ y (B5.8)
şi media ei se exprimă:
∆(x, y ) = x ⋅ y − x ⋅ y − x ⋅ y + x ⋅ y = x ⋅ y − x ⋅ y . (B5.9)
Se defineşte parametrul de corelaţie absolut şi relativ:

σ x , y = ∆(x, y ) = x ⋅ y − x ⋅ y (B5.10)
respectiv
σ x, y
Ex, y = (B5.11)
x⋅y

şi se observă că dacă E x , y → 0 ⇒ x ⋅ y = x ⋅ y , variabilele aleatoare x şi y sunt


statistic independente.
Un sistem constituit din N subsisteme identice, care se manifestă statistic
N
independente, are o proprietate determinată de variabila aleatoare aditivă: F = ∑F
i =1
i

608
şi Fi , F j , i ≠ j sunt variabile aleatoare independente. Pentru aceasta se demon-
1
strează că FF ~ . Astfel:
N
N N
=F
=i 1=i 1
∑=
Fi ∑
=
Fi NF1

2
  N  N
σ2F ∑ ∑
=(∆F ) = ∆  Fi   = (∆Fi ) 2 + 2 (∆Fi )(∆F j )
2

  i 1=
 ∑
=  i 1 i< j

(∆Fi )(∆F j ) = ∆Fi ⋅ ∆F j = 0, Fi , F j independente şi ∆Fi =


0.
Ca urmare:
N
σ 2F = ∑ (∆F )
i =1
i
2
= N (∆F1 ) 2

de unde:
σ σF 1
σ F =σ F1 N ⇒ FF = F = 1 ~ (B5.12)
F N N
şi dacă N este un număr foarte mare:

N → ∞ ⇒ FF → 0 ⇒ F = F . (B5.13)

B6. Variabila aleatoare cu spectrul continuu


De mare interes este variabila aleatoare cu spectru continuu x ∈ [a, b] sau
x ∈ (−∞, ∞).
În cazul acestei variabile nu prezintă interes probabilitatea ca variabila să ia o
1
valoare determinată, deoarece frecvenţa relativă a evenimentului ν ~ = 0 deşi

evenimentul nu este imposibil. În schimb are sens probabilitatea continuă ca varia-
bila aleatoare să ia valori într-un interval oricât de mic.
Considerăm variabila aleatoare x ∈ [0, ∞) şi valorile ei reprezintă puncte pe
semiaxa pozitivă. Probabilitatea continuă se defineşte tot experimental şi pentru
aceasta fie N , finit şi oricât de mare, numărul valorilor variabilei aleatoare, care
sunt incompatibile. Împărţim semiaxa în intervale de lungime ε oricât de mică şi
numărul N de valori se distribuie astfel: ∆N (1) valori x ∈ [0, ε], ∆N (2) valori
x ∈ [ε, 2ε] şi în general ∆N (x) x ∈ [x, x + ∆x] etc. Deoarece N → ∞, frecvenţele

609
relative coincid practic cu probabilităţile valorilor variabilei:

Se construieşte histograma variabilei aleatoare reprezentată în figura B6.1a,


astfel încât ariile figurilor plane, dintre care câteva au fost haşurate, să fie egale
respectiv cu şi suma lor să fie egală cu unitatea (condiţia
de normare). Histograma determină probabilităţile ca variabila să ia valori în
intervalele de lungime şi acestea sunt cu atât mai precise cu cât este mai mic.
La limită, când linia frântă care mărgineşte histograma tinde la o curbă con-
tinuă, reprezentată în figura B6.1b, determinată analitic de funcţia:

(B6.1)
Mărimea:
(B6.2)

se numeşte probabilitatea continuă ca variabila aleatoare să ia valori în interva-


lul cuprins între şi şi este determinată de funcţia numită densitate
de probabilitate sau funcţie de distribuţie a variabilei aleatoare Deoarece valo-
rile variabilei sunt distribuite continuu pe axă, probabilitatea oricărei valori din
intervalul este aceeaşi şi, în virtutea proprietăţii de adunare a probabilităţilor
evenimentelor incompatibile, probabilitatea este proporţională cu şi
arată că nu trebuie pusă problema determinării probabilităţii
unei valori exacte.

a) b)
Figura B6.1.

Proprietatea de adunare a probabilităţilor permite calculul probabilităţii ca


variabila să ia oricare valoare din intervalul finit

610
(B6.3)

şi condiţia de normare se scrie sub forma:

(B6.4)

Din punct de vedere geometric, probabilitatea are semnificaţie de arie


a figurii plane haşurate în figura B6.1b, iar condiţia de normare arată că aria figurii
plane de sub curbă este egală cu unitatea.
Distribuţia variabilei aleatoare cu spectrul continuu, se reprezintă prin tabloul:

(B6.5)

cu satisfacerea condiţiei (B6.4) şi, cu ajutorul ei, se calculează:


– media statistică a variabilei şi a funcţiei

(B6.6)

respectiv

(B6.7)

– fluctuaţia absolută şi relativă:

(B6.8)

respectiv

(B6.9)

iar integralele se calculează dacă se cunoaşte funcţia de distribuţie


În cazul experienţelor complexe, câmpului de evenimente i se asociază un set
de variabile aleatoare cu spectrul continuu şi rezultatele precedente se generalizează.
• Set de două variabile aleatoare. Considerăm experienţa de tragere la o
ţintă plană şi lovirea unui punct al acesteia,
determinat de coordonatele faţă de un sis-
tem cartezian plan de referinţă, i se asociază două
variabile aleatoare care coincid cu coordonatele
menţionate: şi În figura B6.2
611

Figura B6.2.
se prezintă un panou ale cărui puncte constituie un câmp continuu de evenimente
aleatoare. Şi în acest caz, are sens problema determinării probabilităţii ca să fie
lovită aria elementară dΣ =dxdy. Dacă N → ∞ şi dN (x, y ) sunt numerele de
puncte de pe panou respectiv de pe aria dΣ, atunci frecvenţa relativă a
evenimentului ca simultan x să ia valori în dx şi y să ia valori în dy, coincide cu
probabilitatea evenimentului care este proporţională cu aria dΣ:
d N (x, y )
= = P (x, y )dxdy,
dP (x, y ) (B6.10)
N
determinată de funcţia de distribuţie P (x, y ) şi satisface condiţia de normare:
b d

∫ ∫ P (x, y)dy = 1.
a c
(B6.11)

Pentru setul de variabile (x, y ), prezintă interes distribuţiile:


 x+ y   xy 
x + y :  şi xy :  . (B6.12)
 dP (x, y )   dP (x, y ) 
Similar cu relaţiile (B3.8-9), în virtutea proprietăţii de adunare a probabilită-
ţilor, se stabilesc relaţii pentru:
– probabilitatea ca x să ia valori în dx şi y să ia oricare valoare din
domeniul său de definiţie:
d d d

dP (x)= ∫
c
dP(x, y )= dx ∫ P (x, y)dy= P (x)dx ⇒ P (x)=
c
∫ P (x, y)dy
c
(B6.13)

– probabilitatea ca y să ia valori în dy şi x să ia oricare valoare din


domeniul său de definiţie:
b b b

dP (y )= ∫
a
dP(x, y )= dy ∫ P (x, y)dx= P (y)dy ⇒ P (y)=
a
∫ P (x, y)dx
a
(B6.14)

Dacă variabilele x şi y sunt independente, în virtutea proprietăţii de înmulţire


a probabilităţilor, se obţine:
=
dP (x, y ) P=
(x, y )dxdy d=
P (x)dP (y ) P (x)P (y)dxdy ⇒
⇒ P (x, y ) =
P (x)P (y) (B6.15)
Relaţiile (B6.13-14) permit calculul funcţiei de distribuţie pentru o singură
variabilă cunoscând funcţia de distribuţie pentru două variabile, iar relaţia (B6.15)
permite calculul funcţiei de distribuţie a două variabile cunoscând funcţia de distri-
buţie pentru fiecare din acestea.
Cu ajutorul relaţiilor (B6.12-15) se arată că proprietăţile mediei (B4.7-8)
rămân valabile şi în cazul variabilelor aleatoare cu spectrul continuu:

612
(B6.16)

(B6.17)

Cunoscând distribuţia:

(B6.18)

se calculează:
– media statistică a funcţiei

(B6.19)

– fluctuaţia:

(B6.20)

– parametrul de corelaţie pentru funcţiile şi

(B6.21)

Dacă:
(B6.22)

funcţiile şi sunt statistic independente.


• Set de trei variabile aleatoare. De data aceasta putem avea în vedere, de
exemplu, experienţa de tragere la o ţintă cu volumul reprezentată în figura B6.3
şi lovirea unui punct din interior este un eveniment
aleator complex căruia i se asociază un set de trei
variabile aleatoare cu spectrul continuu, coordo-
natele punctului P,
Interesează probabilitatea ca variabilele alea-
toare să ia simultan valori respectiv în inter-
613

Figura B6.3.
valele dx, dy, dz , adică în elementul de volum dV = dxdydz. Intervine şi în acest
caz experienţa
şi considerăm câmpul de evenimente constituit
din N → ∞ puncte (evenimente) dintre care dN (x, y, z ) se găsesc în dV .
Frecvenţa relativă a evenimentului coincide practic cu probabilitatea care, la rândul
ei, este proporţională cu elementul de volum:
d
d dN (r ) d
dP (x, =
y, z ) d=
P (r ) = P (r )dV . (B6.23)
N

Probabilitatea este determinată de funcţia de distribuţie P (r ) a setului de variabile
(x, y, z ) şi satisface condiţia de normare:
d d
=∫
dP (r )
V
∫=
V
P (r )dV 1. (B6.24)

Probabilitatea fiecărui eveniment elementar şi funcţia de distribuţie corespun-


zătoare se calculează ca în cazul setului de două variabile (vezi (B6.13–14)):

dP (x)= P (x)dx= dx ∫ P (x, y, z)dydz ⇒ P (x)= ∫ P (x, y, z)dydz


(y , z )∈V (y , z )∈V
(B6.25)

dP (y )= P (y)dy= dy ∫ P (x, y, z)dxdz ⇒ P (y)= ∫ P (x, y, z)dxdz


(x , z )∈V (x , z )∈V
(B6.26)

dP (z )= P (z )dz= dz ∫ P (x, y, z)dxdy ⇒ P (z)=


(x , y )∈V
∫ P (x, y, z)dxdy
(x , y )∈V
(B6.27)

În cazul evenimentelor aleatoare independente (variabilele x, y, z indepen-


dente) avem:
=
dP (x, y, z ) P=
(x, y, z )dxdydz d=
P (x)dP (y )dP (z )

= P (x)P (y )P (z )dxdydz ⇒ =
P (x, y, z ) P (x)P (y )P (z ). (B6.28)
Cunoscând distribuţia:
 F (x , y , z ) 
F:  , (B6.29)
 dP (x, y , z ) 
se calculează:
– media statistică:

=
F F= ∫ F (x, y, z )P (x, y, z )dxdydz
V
(B6.30)

– fluctuaţia:

614
(B6.31)

– parametrul de corelaţie:

(B6.32)

• Set de 2n variabile aleatoare se asociază, în cazul general, unui eveniment


compus. Pentru simplificare, notăm variabilele:

(B6.33)
În figura B6.4 se prezintă domeniul din spaţiul
2n-dimensional, mărginit de hipersuprafaţa închisă a
familiei de hipersuprafeţe determinată de parametrul C:

(B6.34)

Evenimentul aleator se reprezintă printr-un punct, în


Figura B6.4.
sistemul de referinţă cartezian 2n-dimensional, de coor-
donate iar câmpul de evenimente se reprezintă prin puncte
situate în domeniul
Considerăm elementul de volum:

(B6.35)

şi volumul domeniului, notat tot cu se calculează:

(B6.36)

Pentru domeniul cuprins între hipersuprafeţele corespunzătoare valorilor


parametrului şi reprezentat în figura B6.5, volumul se exprimă:

(B6.37)

615
Frecvenţa evenimentului ca variabilele aleatoare să ia valori simultan res-
pectiv în intervalele se identifică cu probabilitatea
care este proporţională cu elementul de volum

(B6.38)

Probabilitatea este determinată de funcţia de distribuţie


a setului de variabile şi satisface
Figura B6.5. condiţia de normare:

(B6.39)

Cunoscând distribuţia:

(B6.40)

ca în cazurile particulare precedente, se calculează:


– media statistică:

(B6.41)

– fluctuaţia:

(B6.42)

– parametrul de corelaţie:

(B6.43)

616

S-ar putea să vă placă și