Sunteți pe pagina 1din 81

2.

STATISTICĂ MATEMATICĂ

2.1. Teoria selecţiei


Definiţie 2.1.1. Numim colectivitate sau populaţie o mulţime C de
elemente care este cercetată din punct de vedere a uneia sau mai multor
caracteristici (proprietăţi), elementele colectivităţii fiind numite indivizi, iar
numărul indivizilor unei colectivităţi se va numi volumul colectivităţii.
Observaţie 2.1.2.
1) Problema esenţială a statisticii matematice este de a stabilii legea
de probabilitate pe care o urmează caracteristica X.
2) Caracteristicile sunt de tip discret şi de tip continuu.
Definiţie 2.1.3. Numim selecţie (sondaj) o subcolectivitate a
colectivităţii cercetate C, iar numărul elementelor selecţiei poartă numele de
volumul selecţiei (sondajului).
Definiţie 2.1.4. O selecţie se numeşte repetată sau bernoulliană dacă
după examinarea individului acesta se reintroduce în colectivitate, în caz
contrar selecţia este nerepetată.
Observaţie 2.1.5. Dacă volumul colectivităţii C este mult mai mare
decât volumul selecţiei atunci selecţia nerepetată poate fi considerată ca fiind
selecţie repetată. În continuare considerăm numai selecţii repetate.
Definiţie 2.1.6. Numim date de selecţie relative la caracteristica X
valorile obţinute pentru indivizii care intră în selecţie privind caracteristica X.
Dacă selecţia este de volum n vom nota datele de selecţie prin x1, x2,…,xn.
136 Elemente de teoria probabilităţilor şi statistică matematică

Definiţie 2.1.7. Datele de selecţie x1, x2,…,xn sunt valorile unor


variabile aleatoare, respectiv X1, X2,…,Xn care se vor numi variabile de
selecţie.
Observaţie 2.1.8.
1) Dacă selecţia este repetată atunci X1, X2,…,Xn sunt independente
şi identic repartizate cu X (urmează aceeaşi lege de probabilitate ca X).
2) Dacă datele de selecţie x1, x2,…,xn au valorile distincte x'1, x'2,

 x '1 x'2 ... x'N 


…,x'N atunci X :   , unde fi = frecvenţa apariţiei valorii
 f1 f2 ... f N 

x'i, se va numi distribuţia empirică de selecţie a lui X.


3) Dacă X este de tip continuu se obişnuieşte să se facă o grupare a

 x '1 x'2 ... x'N  a + ai


datelor de selecţie în clase astfel: X :   , x ' i = i −1
 f1 f2 ... fN  2

, fi este frecvenţa datelor de selecţie din intervalul [a i−1 , a i ) ,

f 1 + f 2 +... + f N = n , n = volumul selecţiei.

Această grupare se face chiar şi pentru cazul când X este de tip


discret.
Definiţie 2.1.9. Dacă avem funcţia h : R n → R numim funcţie de
selecţie sau statistică, variabila aleatoare Z n = h (X 1 , X 2 ,..., X n ) iar
valoarea numerică z n = h ( x 1 , x 2 ,..., x n ) o numim valoarea funcţiei de
selecţie.
Statistică matematică 137

Definiţie 2.1.10. Numim medie de selecţie funcţia de selecţie

1 n 1 n
definită prin X = ∑
n k =1
X k , iar valoarea numerică x = ∑ x k , o numim
n k =1
valoarea mediei de selecţie.
Observaţie 2.1.11.
1) Dacă X urmează legea normală N ( m, σ) atunci media de

σ
selecţie X urmează legea normală N( m, ).
n
Demonstraţie:
Avem ca variabile de selecţie X1, X2, ..., Xn urmează şi ele legea
normală N ( m, σ) . Funcţia caracteristică a variabilei Xk este de forma
t a 2t 2
σ 2t 2 im − 2
imt − n 2n
ϕ X k (t ) = e 2
dar ϕaX (t ) = ϕ X ( at ) atunci ϕ 1 X k (t ) = e
n

t σ 2t 2
n n im − 2 σ 2t 2
n 2n imt −
şi obţinem ϕ (t ) = ϕ n 1 (t ) =
X ∑ Xk
k =1 n
∏ϕ k =1
1
n
Xk (t ) = ∏ e
k =1
=e 2n

σ
adică X urmează legea normală N (m, ).
n

2) Dacă X urmează legea normală N ( m, σ) atunci statistica

X −m
Z=
σ urmează legea normală N(0,1).
n

Demonstraţie:
n n
Statistica Z = X − m
σ σ
138 Elemente de teoria probabilităţilor şi statistică matematică

Conform observaţiei 1, dacă se consideră caracteristica X care


urmează legea normală N ( m, σ) , atunci media de selecţie X urmează

σ
legea normală N (m ).
n

n n n
M (Z ) = M (X ) − m= ( m − m) = 0
σ σ σ

X −m n n n σ
D 2 (Z ) = D 2 ( n ) = 2 D 2 ( X − m) = 2 D 2 ( X ) = 2 2 = 1
σ σ σ σ n
adică Z urmează legea N(0,1).
3) Dacă X1, X2 independente urmează legea normală
N (m i , σi ), i = 1,2 atunci statistica

( X 1 − X 2 ) − (m 1 − m 2 )
Z=
σ12 σ 22 urmează legea normală N(0,1).
+
n1 n 2

Demonstraţie:
Funcţiile caracteristice ale mediilor de selecţie X / şi X // sunt

t 2σ / 2 t 2σ // 2
imt / − imt // −
respectiv şi X / şi X // fiind
ϕ X / (t ) = e ϕ X // (t ) = e
/
2n 2 n //

independente rezultă ϕX /
−X // (t ) = ϕ X / (t )ϕ−X // (t ) unde

t 2σ // 2
−itm // −
, iar
ϕ − X // (t ) = ϕ X // (−t ) = e 2 n //

/ //
ϕX /
− X // −( m / −m // ) (t ) = e −it ( m −m ) ϕ X / − X // (t )
Statistică matematică 139

Avem succesiv

t
ϕ Z (t ) = ϕ ( X / − X // )−( m / −m // ) (t ) = ϕ ( X / − X // )−( m/ −m// ) ( )=
σ / 2 σ // 2
+ //
/2 // 2
σ σ
+ //
n/ n n/ n
( m / − m // )
−it
σ / 2 σ // 2
+ // t
=e n/ n
ϕ ( X / − X // ) ( )=
σ / 2 σ // 2
+ //
n/ n
( m / − m // )
−it
σ / 2 σ // 2
+ // t −t
=e n/ n
ϕ X/ ( )ϕ − X // ( )=
σ / 2 σ // 2 σ / 2 σ // 2
+ // + //
n/ n n/ n
( m / − m // ) itm / t 2σ / 2 − itm // t 2σ // 2
−it − /2 // 2

σ /2
σ // 2
σ /2
σ // 2 σ σ σ/2
σ // 2 σ / 2 σ // 2 t2
+ // + // 2n/ ( + // ) + // 2 n // ( + // ) −
n/ n/
=e n/ n
e n/ n n
e n/ n n
=e 2

adică Z urmează legea N(0,1).


Definiţie 2.1.12. Numim moment de selecţie de ordin k funcţia de

1 n k 1 n k
selecţie σk = ∑ Xi ,
n k =1
iar valoarea numerică σk = ∑ xi
n k =1
o

numim
valoarea momentului de selecţie de ordin k.
Definiţie 2.1.13. Numim moment centrat de selecţie de ordin k

funcţia de selecţie µ k =
1 n
∑ Xi − X
n i =1
( ) iar µk =
1 n
∑ (x i − x) k o numim
n i =1
valoarea momentului centrat de selecţie de ordin k.
Observaţie 2.1.14.
140 Elemente de teoria probabilităţilor şi statistică matematică

1) Dacă X urmează legea normală N ( m, σ) atunci:


X −m
T=
statistica µ2 urmează legea Student cu n-1 grade de libertate.
n −1

nµ 2
statistica H 2 = urmează legea χ2 cu n-1 grade de libertate
σ 2

1 n
∑ (X k − X) 2 se numeşte dispersia
2
2) Funcţia de selecţie σ =
n − 1 k =1

X −m
T=
de selecţie; atunci statisticile din observaţia anterioară devin: σ şi
n

2
( n −1)σ
H =
2
.
σ2
3) Momentul centrat de selecţie µk de ordin k, pentru n mare,

urmează legea normală


 1 
N σ k , (σ 2 k − σ k2 ) 
 n 
Definiţie 2.1.15. Numim funcţie de repartiţie de selecţie funcţia de

K n (x)
selecţie definită prin Fn ( x ) = , ∀x ∈ R , unde K n ( x ) este numărul
n
valorilor variabilelor de selecţie mai mici decât x.
Teorema lui Glivenko 2.1.16. Dacă se consideră caracteristica X ce
are funcţia de repartiţie teoretică F şi fie funcţia de repartiţie de selecţie Fn ,

atunci P( lim sup Fn ( x ) − F( x ) = 0) =1 .


n →∞ x∈R
Statistică matematică 141

Teorema lui Kolmogorov 2.1.16. Fie caracteristica X de tip


continuu, care are funcţia de repartiţie teoretică F şi fie funcţia de repartiţie

de selecţie Fn , iar d n = sup


x∈R
Fn ( x ) − F( x ) , atunci

∑(−1)
2
x2
lim P( n ⋅ d n < x ) = K ( x ) = k
e −2 k , x > 0.
n →∞
k =−∞

Observaţie 2.1.17. Funcţia K(x) se numeşte funcţia lui Kolmogorov


şi are valorile tabelate.
Exemplul 2.1.18. Se consideră un eşantion de 20 de clienţi, care
intră într-un magazin alimentar, pentru a cerceta frecvenţa X cu care clienţii
fac apel la serviciile magazinului de-a lungul unei săptămâni şi respectiv
pentru cercetarea cheltuielilor lunare Y în mii lei ale clienţilor, pentru
procurarea de bunuri alimentare. S-au obţinut următoarele date de selecţie
pentru X şi respectiv Y.
X: 1,2,1,4,3,2,5,6,1,2,3,2,3,4,6,2,4,3,1,2;
Y: 9,90,101,88,85,77,102,100,86,97,76,121,113,110,96,9,2,108,112,103,109.
Se cere:
a) distribuţiile empirice de selecţie pentru fiecare din caracteristicile
X şi Y;
b) mediile de selecţie, momentele centrate de selecţie de ordinul al
doilea şi dispersiile de selecţie pentru caracteristicile X şi Y;
c) funcţiile de repartiţie de selecţie pentru X şi Y.
Rezolvare:
a) Se observă că datele de selecţie pentru caracteristica X au N = 6
valori distincte, deci distribuţia empirică de selecţie pentru X este:
1 2 3 4 5 6
X: 
  . Pentru caracteristica Y toate datele de
4 6 4 3 1 2

selecţie sunt distincte. Vom face o grupare a datelor de selecţie
142 Elemente de teoria probabilităţilor şi statistică matematică

corespunzătoare caracteristicii Y. Anume, prima clasă cuprinde valorile


datelor de selecţie în intervalul [70,80), a doua clasă cuprinde valorile din
intervalul [80,90) etc. După efectuarea acestei grupări, distribuţia empirică de
selecţie a lui Y devine:
75 85 95 105 115 125 
Y: 
 .
2 4 4 6 3 1 
b) Mediile de selecţie pentru cele două caracteristici sunt:
1 20 1 6 1
x= ∑
20 k =1
x k = ∑
20 k =1
x ' k ⋅f k = [4 ⋅ 1 + 6 ⋅ 2 + 4 ⋅ 3 + 3 ⋅ 4 + 1 ⋅ 5 + 2 ⋅ 6] = 2,85.
20
1 6 1
y= ∑
20 k =1
f k ⋅ y' k = [2 ⋅ 75 + 4 ⋅ 85 + 4 ⋅ 95 + 6 ⋅ 105 + 3 ⋅ 115 + 1 ⋅ 125] = 98,5.
20
Valorile momentelor centrate de selecţie de ordinul doi pentru cele
două caracteristici sunt respectiv:
1 20 1 6 1
µ 2 ( X) = ∑
20 k =1
( x k − x ) 2
= ∑
20 k =1
f k (x'k −x) 2 =
20
[4 ⋅ (1 − 2,85) 2 + 6 ⋅ ( 2 − 2,85) 2

+ 4 ⋅ (3 − 2,85 ) 2 + 3 ⋅ (4 − 2,85 ) 2 + 1 ⋅ (5 − 2,85 ) 2 + 2 ⋅ (6 − 2,85 ) 2 ] = 2,3275 .

1 20 1 6 1
µ 2 (Y ) = ∑
20 k =1
( y k − y ) 2
= ∑
20 k =1
f k ⋅ ( y'k − y ) 2 =
20
[2 ⋅ (75 − 98,5) 2 + 4 ⋅ (85 − 98,5) 2

+ 4 ⋅ (95 − 98 ,5) 2 + 6 ⋅ (105 − 98 ,5) 2 + 3 ⋅ (115 − 98 ,5) 2 +1 ⋅ (125 − 98 ,5) 2 ] = 182 ,5

Valorile dispersiilor de selecţie se calculează imediat, dacă se


cunosc momentele centrate de selecţie de ordinul doi.
1 20 20
σ 2 (X ) = ∑
19 k =1
( xk − x ) 2 =
19
⋅ µ 2 ( X ) = 2,45 .

1 20 20
σ 2 (Y) = ∑
19 k =1
( y k − y) 2 =
19
⋅ µ 2 (Y) = 192,105 .

Astfel, se poate obţine σ( X) = σ2 ( X ) =1,57 şi respectiv

σ( Y ) = σ2 ( Y) =13 ,86 .
Statistică matematică 143

c) Funcţiile de repartiţie de selecţie pentru cele două caracteristici


sunt respectiv:
 0, daca x ≤ 1  0, daca y ≤ 75
 4 / 20 , daca 1 < x ≤ 2  2 / 20 , daca 75 < y ≤ 85
 
10 / 20 , daca 2 < x ≤ 3  6 / 20 , daca 85 < y ≤ 95
 
F20 ( x ) = 14 / 20 , daca 3 < x ≤ 4 F20 ( y) = 10 / 20 , daca 95 < y ≤ 105
17 / 20 , daca 4 < x ≤ 5 16 / 20 , daca 105 < y ≤ 115
 
18 / 20 , daca 5 < x ≤ 6 19 / 20 , daca 115 < y ≤ 125
 1, daca x > 6.  1, daca x > 125 .
 

2.2. Teoria estimaţiei


Se consideră caracteristica X care urmează legea de probabilitate
dată prin funcţia de probabilitate f(x; λ), λ parametru necunoscut, unde f
este funcţia densitate de probabilitate dacă X este de tip continuu, respectiv
funcţia de frecvenţă dacă este de tip discret.
Teoria estimaţiei are ca scop evaluarea parametrilor de care depinde
legea de probabilitate a lui X, folosind datele de selecţie x 1 , x 2 ,..., x n şi
bazându-ne pe rezultatele teoretice relative la variabilele de selecţie
X 1 , X 2 ,..., X n .

Definiţie 2.2.1. Se numeşte funcţie de estimaţie (punctuală) sau


estimator al parametrului λ funcţia de selecţie (statistica)

λ∗ = λ∗ ( X 1 , X 2 ,..., X n ) cu ajutorul căreia se trag concluzii relative la λ.


Definiţie 2.2.2. Spunem că funcţia de estimaţie este estimator

consistent dacă nlim P( λ∗ − λ < ε) = 1, ∀ε > 0 , adică


→∞

λ∗ (X 1 , X 2 ,..., X n ) 
→
P
λ , iar valoarea numerică λ∗ ( x 1 , x 2 ,..., x n )
se numeşte estimaţie consistentă pentru λ.
144 Elemente de teoria probabilităţilor şi statistică matematică

Definiţie 2.2.3. Spunem că funcţia de estimaţie este estimator


absolut corect pentru λ dacă M (λ∗ ) = λ şi D 2 (λ∗ ) → 0 când n → ∞ , iar
valoarea numerică λ∗ ( x 1 , x 2 ,..., x n ) se numeşte estimaţie absolut corectă
pentru λ.
Definiţie 2.2.4. Spunem că funcţia de estimaţie este estimator corect

pentru λ dacă nlim M (λ∗ ) = λ şi lim D 2 (λ∗ ) = 0 , iar valoarea numerică


→∞ n →∞

λ∗ ( x 1 , x 2 ,..., x n ) se numeşte estimaţie corectă pentru λ.


Definiţie 2.2.5. Se numeşte distorsiunea (deplasarea) estimatorului

λ∗ diferenţa M( λ ) − λ , iar dacă distorsiunea este nulă, estimatorul λ∗ se
numeşte nedeplasat.
Propoziţie 2.2.6. Dacă λ∗ = λ∗ (X 1 , X 2 ,..., X n ) este un estimator
absolut corect pentru λ, atunci estimatorul este consistent.
Demonstraţie:
Din ipoteză avem că M (λ* ) = λ şi folosind inegalitatea lui Cebîşev

pentru λ *
(
obţinem P λ* − λ < ε ≥ 1 −) D 2 (λ* )
ε2
, pentru orice ε > 0.

Deoarece lim D 2 (λ* ) = 0 din inegalitatea lui Cebîşev se obţine


n →∞

n →∞
( )
lim P λ* − λ < ε = 1 , pentru orice ε > 0, deci λ *
este un estimator

consistent pentru parametrul λ .


Observaţie 2.2.7.
1) Se arată că momentul de selecţie σ k de ordin k este estimator

absolut corect pentru momentul teoretic σk = M ( X k );


Demonstraţie:
Statistică matematică 145

Într-adevăr
1 n k 1 n 1 n 1 n nσ k
M (σ k ) = M  ∑ X i  = ∑ M ( X i ) = ∑ M ( X ) = ∑ σ k =
k k
=σk ,
 n i =1  n i =1 n i =1 n i =1 n
respectiv
1 n  1 n
D 2 (σ k ) = D 2  ∑ X ik  = 2 ∑ D 2 ( X ik ) =
 n i =1  n i =1
1 n
nD 2 ( X k ) D 2 ( X k )
=
n2
∑D
i =1
2
(X k ) =
n2
=
n
→0,

când n → ∞ se obţine că σk este estimator absolut corect pentru σk .


2) Momentul centrat de selecţie de ordin doi µ2 este estimator

corect pentru momentul centrat teoretic de ordin doi µ 2 = D 2 (X) , adică


pentru dispersia teoretică;
Demonstraţie:
Avem succesiv
1 n  n −1 n −1 2
M (µ 2 ) = M  ∑ ( X k − X ) 2  = µ2 = D ( X ) → D 2 ( X ) când
n
 k =1  n n

n → ∞, respectiv
( n − 1) 2 ( n − 1)(n − 3) 2
D 2 (µ 2 ) = 3
µ4 − µ 2 → 0 când n → ∞ şi rezultă că µ2
n n3
este un estimator corect pentru µ2 .
3) Dispersia de selecţie σ2 este estimator absolut corect pentru
dispersia teoretică D 2 ( X ) .
Demonstraţie:
n
Folosind relaţia σ 2 = µ 2 se obţine
n −1
146 Elemente de teoria probabilităţilor şi statistică matematică

 n  n n n −1 2
M (σ 2 ) = M  µ2  = M ( µ2 ) = D (X ) = D2 (X ) ,
 n −1  n −1 n −1 n

respectiv
2
 n   n  2
D 2 (σ 2 ) = D 2  µ2  =   D ( µ 2 ) → 0 , când n → ∞ şi deci σ 2 este
 n −1   n −1 
un estimator absolut corect pentru dispersia teoretică.
Definiţie 2.2.8. Numim cantitate de informaţie relativ la parametrul
λ expresia:
 ∂ ln f ( x , λ) 2 
I( λ) = n ⋅ M   .

 ∂λ  

Observaţie 2.2.9. Se arată că estimatorul absolut corect λ∗ al lui λ

∗ 1
verifică inegalitatea Rao-Cramer D (λ ) ≥
2
.
I(λ)

Definiţie 2.2.10. Estimatorul λ∗ absolut corect pentru parametrul

∗ 1 ∗ [I(λ)] −1
λ se numeşte eficient dacă D (λ ) = , iar raportul e(λ ) = 2 ∗
2

I(λ) D (λ )

se numeşte eficienţa estimatorului λ∗ .


1 n
Aplicaţie 2.2.11. Să se arate că media de selecţie X = ∑X j
n j =1

constituie un estimator absolut corect şi eficient al parametrului λ din


repartiţia Poisson.
Rezolvare:
Ţinând seama că variabila aleatoare X are repartiţia Poisson cu
M ( X ) = D 2 ( X ) = λ avem:

1 n  1 n 1 n n
M ( X ) = M  ∑ X j  = ∑ M ( X j ) = ∑ M ( X ) = ⋅ λ = λ
 n j =1  n j =1 n j =1 n
Statistică matematică 147

1 n  1 n
1 n
n λ
D 2 ( X ) = D 2  ∑ X j  = 2 ∑ D2 (X j ) = ∑D 2
(X ) = ⋅λ = → 0
 n j =1  n j =1 n2 j =1 n 2
n

când n → ∞ şi deci media de selecţie este un estimator absolut corect al lui


λ .
Pentru determinarea cantităţii de informaţie avem:
λx
f ( x; λ) = e −λ , ln f ( x; λ) = −λ + x ln λ − ln x!
x!
∂ ln f ( x; λ) x
= −1 + iar
∂λ λ
 ∂ ln f ( x; λ)  2   x x2  2 1
  = M 1 − 2 + 2  = 1 − M ( X ) + 2 M ( X ) =
2
M 
 ∂ λ    λ λ  λ λ
2 1
= 1 − ⋅ λ + 2 (λ2 + λ)
λ λ

  ∂ ln f ( x; λ) 2  n
Rezultă cantitatea de informaţie I (λ) = nM   =
 ∂λ   λ

1
Întrucât egalitatea D ( X ) =
2
este verificată rezultă că X este
I (λ)

un estimator eficient al lui λ .


Exemplul 2.2.12. La un control de calitate se verifică diametrul
pieselor prelucrate de un strung. Pentru a se realiza acest control s-a efectuat
o selecţie de 18 piese şi s-a obţinut că diametrul X al pieselor are următoarele
dimensiuni (în cm):
Diametru 3,98 3,99 4,00 4,01 4,02
Nr. Piese 4 3 5 3 3
Să se determine:
a) o estimaţie absolut corectă pentru diametrul mediu al pieselor
realizate;
148 Elemente de teoria probabilităţilor şi statistică matematică

b) o estimaţie corectă şi una absolut corectă pentru dispersia


diametrelor faţă de diametrul mediu.
Rezolvare:
a) Distribuţia empirică de selecţie a caracteristicii X este:
3,98 3,99 4,00 4,01 4,02 
X: 
 .
 4 3 5 3 3 
Diametrul mediu este media teoretică M(X)=m. Dar se cunoaşte că
un estimator absolut corect pentru media teoretică m este media de selecţie

1 n
X= ∑X k
n k =1
1 n
Prin urmare, valoarea mediei de selecţie x = ∑ x k este o
n k =1
estimaţie absolut corectă pentru media teoretică m.
Se obţine:
1
x= ( 4 ⋅ 3,98 + 3 ⋅ 3,99 + 5 ⋅ 4,00 + 3 ⋅ 4,01 + 3 ⋅ 4,02 = 3,9989.
18
b) Deoarece un estimator corect al dispersiei teoretice D 2 ( X ) este
momentul centrat de selecţie de ordinul doi µ2 , rezultă că o estimaţie
corectă pentru dispersia teoretică este valoarea momentului centrat de selecţie
de ordinul doi, adică:
1 n 1
µ2 = ∑
n k =1
( x k − x ) 2 = [4 ⋅ (3,98 − 3,9989) 2 + 3 ⋅ (3,99 − 3,9989) 2 + 5 ⋅ (4 − 3,9989) 2 +
18
+ 3 ⋅ ( 4,01 − 3,9989 ) 2 + 3 ⋅ (4,02 − 3,9989 ) 2 = 1,877 ⋅10 −4 .

O estimaţie absolut corectă pentru dispersia teoretică este:


18
σ2 = ⋅ µ 2 = 1,987 ⋅ 10 −4 .
17
Statistică matematică 149

Exemplul 2.2.13. Fie caracteristica X ce urmează legea normală


N(m, σ ), unde m ∈ R este cunoscut, iar σ > 0 este necunoscut. Se consideră
o selecţie repetată de volum n. Să se arate că funcţia de selecţie V=

1 π n

n 2
∑ X −m
k =1
este o funcţie de estimaţie absolut corectă pentru

parametrul σ= D 2 (X) .
Rezolvare:

Arătăm că M(V)= σ şi nlim


→∞
D 2 (V ) = 0 . Avem

1 π n
1 π n
1 π
M (V ) =
n 2
∑M ( X k − m ) =
k =1 n 2
∑M ( X − m ) = n
k =1 2
nM ( X − m ) =

π
= M ( X − m ) . Deoarece X urmează legea normală N(m, σ ), avem că
2
( x −m ) 2
∞ 1 ∞ −
M( X −m) = ∫ x − m ρ ( x )dx = ∫ x − m ⋅e 2σ 2
dx =
−∞
σ 2π −∞


t
1 ∞ − 2
σ 2π ∫−∞
σt ⋅ e 2σdt =

t=
π
σ dacă s-a făcut schimbarea de

variabilă
x −m
=t.
σ
π 2
Prin urmare, avem M(V) = ⋅ σ = σ , deci prima condiţie este
2 π

satisfăcută.
Pentru verificarea celei de-a doua condiţii, scriem succesiv:
1 π 2 n 2 π n
π 2
D 2 (V ) = ( ) ∑D ( X k − m ) = 2 ∑D 2
( X −m) = D ( X −m) ⇒
n 2 k =1 2n k =1 2n
150 Elemente de teoria probabilităţilor şi statistică matematică

⇒ lim D 2 (V ) = 0
n →∞

Metoda verosimilităţii maxime 2.2.14.


Considerăm caracteristica X supusă cercetării ca având funcţia de
probabilitate f(x; λ1 , λ2 ,..., λs ) . Variabilele de selecţie X 1 , X 2 ,..., X n
sunt independente şi identic repartizate, rezultă că vectorul aleator (
X 1 , X 2 ,..., X n ) va avea funcţia de probabilitate
n
V ( X 1 , X 2 ,..., X n ; λ1 , λ2 ,..., λs ) = ∏ f ( X i ; λ1 , λ2 ,..., λs ) şi
i =1

care se numeşte funcţie de verosimilitate.


Spunem că estimatorii λ∗i = λ∗i (X 1 , X 2 ,..., X n ) sunt de

verosimilitate maximă pentru λi , i =1, s dacă realizează maximul funcţiei de


verosimilitate.
Determinarea estimatorilor de verosimilitate maximă se va face

∂V
rezolvând sistemul = 0, i = 1, s , care de regulă se înlocuieşte cu
∂λi

∂ ln V
= 0, i = 1, s numit sistem de verosimilitate maximă.
∂λi

Observaţie 2.2.15.
1) Se arată că un estimator eficient este un estimator de
verosimilitate maximă.
2) Un estimator de verosimilitate maximă este estimator consistent,
iar pentru valori mari ale lui n este o variabilă aleatoare ce urmează legea
normală N( λ, [ I(λ)] −1 ) , unde λ este parametrul estimat.
Statistică matematică 151

Exemplul 2.2.16. Să se determine estimatorii de verosimilitate


maximă pentru valoarea medie şi abaterea standard dacă se consideră
caracteristica X, care urmează legea normală N(m, σ ).
Rezolvare:
( x −m ) 2
1 −
M(X) = m şi σ( X) = σ, f(x; m, σ) = e 2 σ2 . Pentru a scrie
σ 2π
sistemul de verosimilitate maximă avem:
( x − m) 2
ln f(x; m, σ ) = - ln 2π − ln σ − , de unde
2σ 2
∂ ln f ( x; m, σ) x − m ∂ ln f ( x; m, σ) 1 ( x − m) 2
= , iar = − + .
∂m σ2 ∂σ σ σ3
Se obţine:
∂ ln V n
∂ ln f ( X k ; m, σ ) n
X −m 1 n
=∑ =∑ k 2 = 2 ∑( X − m) .
σ σ
k
∂m k =1 ∂m k =1 k =1

∂ ln V n
∂ ln f ( X k ; m, σ ) n
1 ( X k − m) 2 1 n
=∑ = ∑[ − + ] = 3 ∑[−σ 2 + ( X k − m) 2 ]
∂σ k =1 ∂σ k =1 σ σ 3
σ k =1

 n  1 n
 ∑k =1 (X k − m) = 0  m = ∑ Xk = X

 n k =1
sau:  n ⇒  n .
 ∑ [ − σ + (X k − m) ] = 0 1
 k =1
2 2 σ =


∑ (X k − X) = µ 2
n k =1
2

Exemplul 2.2.17. Se consideră caracteristica X ce urmează legea


binomială, adică are distribuţia teoretică:
 k 
X
P ( m, k ) 
 , unde P(m,k) = C km p k q m −k , q = 1 − p, cu
 k =0 , m

parametrul
p ∈(0,1) necunoscut. Folosind o selecţie de volum n, se cere:
a) estimatorul p ∗ de verosimilitate maximă pentru p;
152 Elemente de teoria probabilităţilor şi statistică matematică

b) să se arate că estimatorul p ∗ este un estimator absolut corect


pentru parametrul p;
c) să se arate că estimatorul p ∗ este un estimator eficient pentru
parametrul p.
Rezolvare:
a) Funcţia de probabilitate pentru caracteristica X este
f(x; p) = C mx p x (1 − p) m −x , x = 0, m . Pentru a scrie ecuaţia de verosimilitate

n
∂ ln f (X k ; p)
maximă ∑k =1 ∂p
= 0 , avem că

ln f(x; p) = ln C mx + x ln p + ( m − x ) ln(1 − p) , de unde


∂ln f ( x; p) x m −x
= − . Aşadar ecuaţia verosimilităţii maxime este:
∂p p 1 −p
n
Xk m − Xk nX mn nX 1 n
∑(
k =1 p

1− p
) = 0 , adică
p
− +
1 −p 1 −p
= 0 , unde X = ∑ X k
n k =1
.
Ecuaţia verosimilităţii maxime se mai scrie
(1 −p) X −mp +pX =0 , de unde se obţine estimatorul de verosimilitate

1
maximă p ∗ = p ∗ ( X 1 , X 2 ,..., X n ) = X pentru parametrul p.
m
Pentru aceasta avem, în primul rând, că:
1 1 1
M(p ∗ ) = M ( X ) = M ( X) = ⋅ mp = p , iar apoi pentru dispersie se
m m m
poate scrie succesiv:
Statistică matematică 153
n n
1 2 1 1
D 2 ( p∗ ) =
m 2
D (X ) = 2 2
m n
∑ D2 ( X k ) =
k =1 m2n2
∑D
k =1
2
(X ) =

1 D 2 ( X ) mpq pq
= nD 2
( X ) = = 2 = → 0, n → ∞ .
m2n 2 m2n m n mn

Prin urmare, s-a obţinut M( p ∗) = p şi lim D 2 (X) = 0 , deci


n →∞

estimatorul p ∗ este estimator absolut corect pentru parametrul p.


c) Cantitatea de informaţie relativă la parametrul p se poate calcula
după cum urmează:
∂ ln f ( X; p) 2 1 n
I( p) = nM [( ) ]=n 2 M[( X − mp ) 2 ] = 2 D 2 (X ) =
∂p p (1 − p) 2
p (1 − p) 2

n mn
= mp (1 − p) = .
p (1 − p)
2 2
p(1 − p)

∗ 1
Pe de altă parte, am văzut că D (p ) =
2
, deci estimatorul p ∗
I( p)

este estimator eficient pentru parametrul p.


Metoda momentelor 2.2.18.
Fie caracteristica X care are funcţia de probabilitate
f(x; λ1 , λ2 ,..., λs ). Această metodă de estimare a parametrilor
constă în determinarea parametrilor λi , i = 1, s din condiţiile că momentele
iniţiale teoretice ale lui X au ca estimatori absolut corecţi momentele de
selecţie de ordin corespondent. Astfel se obţine sistemul de ecuaţii σ k = σk ,

k= 1, s din care se obţin estimaţii pentru parametrii λ1 , λ2 ,..., λs .


Exemplul 2.2.19. Se consideră caracteristica X, care urmează legea
gamma de parametrii a>b>0 necunoscuţi. Vom estima aceşti parametri,
folosind metoda momentelor, pe baza datelor x 1 , x 2 ,..., x n de selecţie.
Funcţia densitate de probabilitate a caracteristicii X este:
154 Elemente de teoria probabilităţilor şi statistică matematică

 1 a −1

x

 x e b , daca x > 0
f ( x; a , b) =  Γ(a )b a , unde Γ este funcţia lui
 0, daca x ≤ 0

Euler de

speţa a doua, adică Γ(a ) = ∫0 x a −1e −x dx .

În cazul de faţă este vorba de doi parametri, deci sistemul de ecuaţii


este format din două ecuaţii, anume σ1 = σ1 şi σ 2 = σ2 .
Vom calcula momentul teoretic iniţial σk de ordin k:
x
∞ 1 ∞ −
σ k = ∫ x f ( x; a, b)dx =
k
∫ x a + k −1
e dx = ... = b k (a + k −1)( a + k − 2)... ⋅ a
b
−∞ Γ(a )b a 0

Rezultă sistemul:

 σ 1 = ab ∗ σ1
2
∗ σ 2−σ1
2
 care are soluţia a = ,b = , care
σ 2 = b a (a + 1)
2
σ2−σ1
2
σ1
reprezintă estimatorii pentru parametrii a şi b.
Metoda intervalelor de încredere 2.2.20.
Fie caracteristica X care are funcţia de probabilitate f(x; θ) , unde
θ este parametrul necunoscut. Metoda constă în determinarea a două funcţii

de selecţie θi = θi ( X 1 , X 2 ,..., X n ), i =1, n astfel încât P( θ1 < θ < θ 2 ) = 1-


α , unde α nu depinde de θ şi poartă numele de probabilitate de risc, iar 1-
α se numeşte probabilitate de încredere. Intervalul aleator ( θ1 , θ2 ) poartă
numele de interval de încredere pentru parametrul θ.
De regulă, pentru a construi un interval de încredere pentru
parametrul θ se caută determinarea unei statistici
Z n = Z n ( X 1 , X 2 ,..., X n ; θ) a cărei lege de probabilitate să fie cunoscută şi

să nu depindă de θ. Se determină apoi un interval numeric ( z1 , z 2 ) astfel


Statistică matematică 155

încât P( z 1 < Z n < z 2 ) = 1- α . Din z1 < Z n < z 2 se exprimă inegalitatea


θ1 < θ < θ 2 şi de aici intervalul aleator ( θ1 , θ2 ) este determinat. Intervalul

este cu atât mai bun cu cât are lungimea mai mică şi cu cât 1- α este mai
mare.

Aplicaţii 2.2.21.
1. Interval de încredere pentru valoarea medie teoretică dacă
dispersia teoretică este cunoscută.
Se consideră caracteristica X care urmează legea normală N(m, σ )
cu m ∈ R necunoscut şi σ > 0 cunoscut. Vom determina un interval de
încredere pentru m cu o probabilitate de încredere 1- α dată şi cunoscând
datele de selecţie x 1 , x 2 ,..., x n , respectiv variabilele de selecţie
X 1 , X 2 ,..., X n corespunzătoare.

X −m
Zn = 1 n
Considerăm statistica σ , unde X= ∑ X k , care
n k =1
n

urmează legea normală N(0,1) ce nu depinde de parametrul necunoscut m.


Deci putem determina intervalul ( z1 , z 2 ) astfel încât P( z1 < Z n < z 2 ) = 1- α

t2
1 x −
adică Φ(z 2 ) − Φ( z1 ) = 1 − α , Φ( x ) =


0
e 2
dt este funcţia lui Laplace

şi care are valorile tabelate. Intervalul are lungime minimă când este simetric

z 2 = − z1 = z1− α . 1− α
faţă de origine adică Rezultă că Φ (z 1 − α ) = şi
2 2 2

folosind tabelele de valori pentru funcţia Laplace găsim z1 − α .


2
156 Elemente de teoria probabilităţilor şi statistică matematică

X −m
− z1 −α < < z1 − α ) = 1 − α
Am obţinut P( 2 σ 2 adică
n

σ σ
P( X − z1 − α < m < X + z1 − α ) = 1- α . Deci intervalul de
n 2 n 2

σ
încredere pentru media teoretică m este ( m 1 , m 2 ) , unde m1 = X − z1 − α
n 2

şi
σ 1 n
m2 = X + z 1 − α , iar X = ∑X k .
n k =1
n 2

Observaţie 2.2.22. Când X nu urmează legea normală, dar volumul


selecţiei este mare (n>30) şi se cunoaşte σ( X) = σ > 0 atunci statistica

X −m
Zn = σ , unde m=M(X) necunoscută, este aproximativ repartizată
n

normal N(0,1). Deci se poate considera pentru m acelaşi interval de încredere


obţinut mai sus.
2. Interval de încredere pentru valoarea medie teoretică dacă
dispersia teoretică este necunoscută.
Fie caracteristica X ce urmează legea normală N(m, σ) cu m=M(X)
parametru necunoscut şi σ= D 2 (X) > 0 necunoscută. Considerăm

X −m n
T= 1 1 n
statistica σ , unde X =
n

k =1
X k şi σ =
2

n − 1 k =1
(X k − X ) 2 care
n

urmează legea Student cu n-1 grade de libertate. Determinăm intervalul (


t 1 , t 2 ) cu P( t 1 < T < t 2 ) = 1- α , adică Fn −1 ( t 2 ) − Fn −1 ( t 1 ) = 1 − α , unde
Statistică matematică 157

n +1
Γ( ) x n +1
2 s2 − 2
n ∫−∞
Fn ( x ) = (1 + ) ds este funcţia de repartiţie a legii
n
nπΓ( )
2
Student cu n grade de libertate şi care are valorile tabelate, iar

Fn ( −x ) = 1 − Fn ( x ) . Deci t 2 = t n −1,1− α = −t 1 se determină astfel încât


2

α
Fn −1 ( t α ) =1 − , apoi putem scrie
n −1,1−
2
2

X −m
P( −t α < <t α ) =1 − α
n −1,1−
2
σ n −1,1−
2 sau
n
σ σ
P( X − t α <m<X+ t α ) =1− α. Adică, intervalul de
n n −1,1−
2 n n −1,1−
2

σ
încredere pentru m este ( m1 , m 2 ) unde m1 = X − t α şi
n n −1,1−
2

σ
m2 = X + t α .
n n −1,1−
2

3. Intervalul de încredere pentru diferenţa mediilor a două populaţii


Fie două populaţii ζ1 şi ζ2 la care se analizează aceeaşi
caracteristică şi care pentru ζ1 este X 1 ce urmează legea normală N(
m 1 , σ1 ) , iar pentru ζ2 este X 2 ce urmează legea normală N ( m 2 , σ2 ) .

Vom determina un interval de încredere pentru diferenţa mediilor m1 − m 2


cu probabilitatea de încredere 1- α folosind datele de selecţie
x 11 , x 12 ,..., x 1n1 relativ la caracteristica X 1 , respectiv x 21 , x 22 ,..., x 2 n 2

relativ la caracteristica X 2 .
158 Elemente de teoria probabilităţilor şi statistică matematică

a) Presupunem abaterile standard ( σ1 , σ2 ) cunoscute. Statistica

( X1 − X 2 ) − (m 1 − m 2 )
Z= 1 n1
1 n2

σ1
2
σ
+ 2
2
, unde X1 =
n1
∑ X1k , X 2 =
k =1 n2
∑X
k =1
2k ,
n1 n2

urmează legea normală N(0,1). Se determină intervalul ( z1 , z 2 ) astfel încât


P( z1 < Z < z 2 ) = 1- α la fel ca în aplicaţia 1.
( X1 − X 2 ) − ( m1 − m 2 )
P( −z α < <z α ) = 1− α
1− 2 2 1−
Deci: 2 σ1 σ 2 sau
+ 2
n1 n2

σ1 σ 2 σ1 σ 2
2 2 2 2
P(( X 1 − X 2 ) − z α + < m1 − m2 < ( X 1 − X 2 ) + z α + )
1−
2
n1 n2 1−
2
n1 n2

adică intervalul de încredere pentru m1 − m 2 este (A,B) unde


2 2 2 2
σ1 σ σ1 σ
A = ( X1 − X 2 ) − z α + 2 şi B = ( X1 − X 2 ) + z α + 2 .
1−
2
n1 n2 1−
2
n1 n2

b) Presupunem abaterile standard σ1 = σ 2 = σ necunoscute.

( X1 − X 2 ) − ( m 1 − m 2 ) n1 + n 2 − 2
T= ⋅
Considerăm statistica 2
(n 1 − 1) σ1 + (n 2 − 1) σ 2
2 1 1 , unde X1
+
n1 n 2

2 2
şi X 2 sunt mediile de selecţie definite anterior, iar σ1 şi σ2 dispersiile de

1 n1 1 n2
selecţie σ1 =
2
∑ 1k 1
n 1 − 1 k =1
( X − X ) 2
şi σ 2
2
= ∑ (X 2 k − X 2 ) 2 , care
n 2 − 1 k =1

urmează legea Student cu n = n 1 + n 2 − 2 grade de libertate. La fel ca în


Statistică matematică 159

aplicaţia 2. se determină intervalul ( t 1 , t 2 ) astfel încât P( t 1 < T < t 2 ) = 1 − α

( X1 − X 2 ) − ( m 1 − m 2 ) n1 + n 2 − 2
P( − t α < < t α ) = 1− α
adică n ,1−
(n 1 − 1) σ1 + (n 2 − 1) σ 2
2 2 1 1 n ,1− .
2 + 2
n1 n 2

Rezultă intervalul de încredere (A,B) pentru m1 − m 2 unde

A = ( X1 − X 2 ) − t n ,1−α ⋅ S şi B = ( X1 − X 2 ) + t n ,1−α ⋅ S cu
2 2

1 1
+
2 2 n n2 .
S 2 = [(n 1 − 1) σ1 + (n 2 − 1) σ2 ] ⋅ 1
n1 + n 2 − 2

4. Intervalul de încredere pentru dispersia teoretică


Fie caracteristica X ce urmează legea normală N(m, σ ). Considerăm

( n − 1) σ 2 1 n 1 n
statistica H = 2

σ2
unde σ 2
= ∑ k
n − 1 k =1
( X − X ) 2
, iar X = ∑X k ,
n k =1
ce urmează legea χ2 cu n-1 grade de libertate. Pentru probabilitatea de

încredere 1- α se poate determina intervalul ( h 1 , h 2 ) , astfel încât


2 2

2 2
P(h 1 < H 2 < h 2 ) = 1 − α .
2
h1 = h 2 2 α
n −1,
α se determină din relaţia Fn −1 ( h 1 ) = şi
2 2

h2 = h2
2
2 α
n −1,1−
α se determină din relaţia Fn −1 (h 2 ) = 1 − , unde
2 2
Fn ( x ) este funcţia de repartiţie a legii χ2 cu n grade de libertate

n t
1 x −1 −
Fn ( x ) =
n
n ∫
0
t 2
e 2
dt
care are valorile tabelate.
2 Γ( )
2
2
160 Elemente de teoria probabilităţilor şi statistică matematică

(n − 1) σ 2
Deci P(h 1 2 < 2
< h 2 ) sau
σ 2

(n − 1) σ 2 ( n − 1) σ 2
P( 2
< σ2 < 2
) = 1 − α , adică s-a obţinut intervalul de
h2 h1

2 ( n − 1) σ 2 2 (n − 1) σ 2
2 2 σ1 = σ =
încredere ( σ1 ,σ 2 ) pentru σ , unde 2
h 2 α şi
2
h2 α ,
n −1,1− n −1,
2 2

iar intervalul de încredere pentru abaterea standard σ este (σ1 , σ2 ) .

Exemplul 2.2.23. Relativ la populaţia ζ se cercetează


caracteristica X privind media teoretică M(X) = m. Ştiind că dispersia
teoretică a caracteristicii X este D 2 (X) = 0,35 , să se stabilească un interval
de încredere pentru media teoretică m cu probabilitatea de încredere 1- α =
0,95, utilizând distribuţia empirică de selecţie:
22 ,7 22 ,8 22 ,9 23 ,0 23 ,1 23 ,2 23 ,3 23 ,4 
X: 
 .
 1 3 7 4 6 7 5 2  
Rezolvare:
Folosind aplicaţia 1., intervalul de încredere pentru media teoretică
σ σ z
m este ( m1 , m 2 ) , unde m 1 = x − z α şi m 2 = x + z α ; 1−
α
se
n 1−
2 n 1−
2
2

1−α 1−α
determină astfel încât Φ(z 1− α ) = 2
,
2
= 0,475 , folosind tabelele cu
2

⇒z = 1,96
valorile funcţiei Laplace, 1−
α
.
2

1
x= (1 ⋅ 22 ,7 + 3 ⋅ 22 ,8 + 7 ⋅ 22 ,9 + 4 ⋅ 23 + 6 ⋅ 23 ,1 + 7 ⋅ 23 , 2 + 5 ⋅ 23 ,3 + 2 ⋅ 23 , 4) = 23 ,077
35
Statistică matematică 161

0,35
Rezultă m1 = 23,077 − ⋅1,96 = 22 ,881 ,
35

0,35
m 2 = 23,077 + ⋅1,96 = 23,273 , adică m ∈( 22 ,881 ; 23 ,273 ) .
35
Exemplul 2.2.24. Pentru recepţionarea unei mărfi ambalată în cutii,
se efectuează un control, prin sondaj, privind greutatea X a unei cutii. Pentru
22 cutii cântărite s-a obţinut distribuţia empirică de selecţie, relativ la
caracteristica X:
2,7 2,8 2,9 3,0 3,1 3,2 3,3 
X:
 1 .
 2 5 3 5 4 2 
Folosind probabilitatea de încredere 0,98, să se determine un interval
de încredere pentru valoarea medie a greutăţii cutiilor, presupunând că X
urmează legea normală N ( m, σ) .
Rezolvare:
Deoarece abaterea standard σ= D 2 (X) este necunoscută,
conform aplicaţiei 2. intervalul de încredere pentru m este (m1,m2) unde

σ σ
m1 = x − t α şi m 2 = x + t α . Pentru n-1=21 şi 1 − α = 0,98
n n −1,1−
2 n n −1,1−
2

din tabelul cu valorile funcţiei de repartiţie a legii Student se determină

t = 2,158
n −1,1−
α
.
2

Folosind distribuţia empirică de selecţie se obţine:


1
x= (1 ⋅ 2,7 + 2 ⋅ 2,8 + 5 ⋅ 2,9 + 3 ⋅ 3,0 + 5 ⋅ 3,1 + 4 ⋅ 3,2 + 2 ⋅ 3,3) = 3,032 iar
22

1 7
σ= ∑ f k ( x k − x) 2 = 0,167
21 k =1
162 Elemente de teoria probabilităţilor şi statistică matematică

0,167
Obţinem: m1 = 3,032 − ⋅ 2,518 = 2,942 ;
22

0,167
m 2 = 3,032 + ⋅ 2,518 = 3,122 adică m ∈( 2,942 ;3,122 ) .
22
Exemplul 2.2.25. Masa de carne ambalată în produse de 1000
grame de maşinile M1 şi M2 este o caracteristică X1, ce urmează legea
normală N (m1 , σ1 ) şi respectiv o caracteristică X2 ce urmează legea normală
N(m 2 , σ2 ) . Cântărind 100 de pachete din cele produse de maşina M1 s-a

obţinut valoarea medie de selecţie x 1 = 1007 grame,iar din cântărirea a 150


pachete de la maşina M2 s-a obţinut x 2 = 1002 grame.
Folosind probabilitatea de încredere 0,98, să se determine intervalul
de încredere pentru diferenţa m1-m2 , dacă se ştie că abaterile standard sunt
σ1 = 3 şi σ 2 = 4 .

Rezolvare:
Conform aplicaţiei 3. a) intervalul de încredere pentru m1-m2 este
(A,B) unde

(
A = x1 − x 2 − z ) 1−
α
σ 12 σ 22
+
n1 n 2
( )
şi B = x 1 − x 2 + z α
1−
σ 12 σ 22
+
n1 n 2
iar
2 2

z   1 −α
1−
α
se determină a.î. Φ z1−α  = = 0,49 .
2
 2  2

Folosind tabelul cu valorile funcţiei lui Laplace obţinem

z = 2,33
1−
α
.
2
Statistică matematică 163

9 16
A = 5 − 2,33 + = 3,975
100 150
Deci :
9 16
B = 5 + 2,33 + = 3,975
100 150

⇒ m1 − m 2 ∈ (3,975 ;6,025 )

Exemplul 2.2.26. Fie caracteristica X1 ce urmează legea normală


N(m, σ ) şi care reprezintă vânzările în milioane lei pe săptămână la
magazinele alimentare în oraşul A şi X2 vânzările în milioane lei la
magazinele alimentare din oraşul B şi care urmează legea normală N(m2, σ ).
S-au efectuat două sondaje, respectiv pentru X1 şi X2 şi s-au obţinut
următoarele date de selecţie:
X1: 226,5;224,1;218,6;220,1;228,8;229,6;222,5.
X2: 221,5;230,2;223,4;224,3;230,8;223,8.
Cu probabilitatea de încredere 0,95 să se construiască un interval de
încredere pentru diferenţa m1-m2, dacă σ > 0 este necunoscut.
Rezolvare:
Conform aplicaţiei 3. b) intervalul de încredere pentru m1-m2 este

(A,B) unde A = x1 − x 2 − t α ⋅S şi B = x1 − x 2 − t α ⋅S dacă


n ,1− n ,1−
2 2

1 1
+
S=
n1 n 2
n 1 +n 2 −2
[
( n 1 − 1) σ1 + ( n 2 − 1) σ 2
2 2
] iar
t
n ,1−
α
2
se determină a.î.

 
Fn  t  =1 − α .
 n ,1 − 
α
2
 2 

t = 2,201
Pentru 1 − α = 0,96 şi n=1 obţinem n ,1 −
α
.
2

Calculăm:
164 Elemente de teoria probabilităţilor şi statistică matematică

1
x1 = ( 226 ,5 + 224 ,1 + 218 ,6 + 220 .1 + 228 ,8 + 229 ,6 + 222 ,5) = 224 ,314
7
1
x 2 = ( 221 ,5 + 230 ,2 + 223 ,4 + 224 ,3 + 230 ,8 + 223 ,8) = 225 ,667
6
1 7
( )
σ1 = ∑ x 1k − x 1 = 17 ,765
2

6 k =1
1 6
( )
σ2 = ∑ x 2 k − x 2 = 14 ,951
2

5 k =1
2

1 1
+
S = 7 6 (6 ⋅17 ,765 + 5 ⋅14 ,951 ) = 2,259
11
Re zult ă :
A = −1,353 − 2,201 ⋅ 2,259 = −6,325
B = −1,353 + 2,201 ⋅ 2,259 = 3,619
⇒ m 1 − m 2 ∈( −6,326 ;3,619 )

Exemplul 2.2.27. Fie caracteristica X ce reprezintă timpul de


producere a unei reacţii chimice, măsurat în secunde. Dacă X urmează legea
normală N ( m, σ) şi având o selecţie repetată de volum n=11, cu datele de
selecţie: 4,21;4,03;3,99;4,05;3,89;3,98;4,01;3,92;4,23;3,85;4,20. Să se
determine intervalul de încredere pentru dispersia σ2 = D 2 (X ) şi pentru

abaterea standard σ= D 2 (X) , cu probabilitatea de încredere 0,95.


Rezolvare:
Statistică matematică 165

Conform aplicaţiei 4. intervalul de încredere pentru σ2 este

(n − 1)σ 2 (n − 1)σ 2
(σ ) h2 2
2
,σ 2 σ
unde 1
2
= 2 şi σ 2
2 = 2 iar α şi h α se
1 2 h α h α n −1,1−
2
n −1,
2
n −1,1− n −1,
2 2

determină folosind tabelele de valori pentru funcţia de repartiţie a legii χ2


cu n-1 grade de libertate.
Avem: h 10 ;0 ,975 = 20 ,5 şi h 10 ; 0, 025 = 3,25
2 2

1
x= (4,21 + 4,03 + ... + 4,20 ) = 4,033
11
1 11
∑(x k − x ) 2 = 0,017
2
σ =
10 k =1
10 ⋅ 0,017 10 ⋅ 0,017
Rezultă: σ1 = = 0,008 şi σ22 = = 0,052
2

20 ,5 3, ,25

⇒ σ2 ∈(0,008 ;0,052 ) şi σ∈(0,089 ;0,228 ) .

2.3. Verificarea ipotezelor statistice


Definiţie 2.3.1. Numim ipoteză statistică o presupunere relativă la o
caracteristică X a unei populaţii C, fie privind legea de probabilitate a lui X,
fie privind parametrii de care depinde această lege.
Metoda prin care o ipoteză statistică ce trebuie verificată se acceptă
sau se respinge, poartă numele de test (criteriu) statistic.
Observaţie 2.3.2.
1) Dacă testul statistic se referă la parametrii de care depinde legea
de probabilitate a lui X spunem că avem un test parametric.
2) Dacă testul statistic se referă la natura legii de probabilitate atunci
spunem că avem un test de concordanţă . Considerând caracteristica X cu
legea de probabilitate f ( x; θ), θ parametru necunoscut, ipoteza principală
166 Elemente de teoria probabilităţilor şi statistică matematică

ce se face asupra lui θ o numim ipoteză nulă şi o notăm H 0 : θ ∈ A , iar


orice altă ipoteză ce se face relativ la parametrul θ o numim ipoteză
admisibilă şi o notăm H i : θ ∈ A i , i = 1,2,... .
Observaţie 2.3.3.
1) în continuare, relativ la parametrul θ, vom considera doar două
ipoteze: ipoteza nulă H 0 : θ ∈ A , şi o ipoteză alternativă H 1 : θ ∈ A1 .
2) Verificarea ipotezei nule în ipoteza alternativă pentru o
probabilitate de risc α se face determinând o regiune U ⊂ R n numită regiune
critică a.î. P(X1,X2,…,Xn) ∈ U H 0 ) = α. Din modul cum construim această
regiune critică U obţinem diferite teste de verificare a ipotezei statistice H0.
3) Probabilitatea de risc α se mai numeşte şi nivel de semnificaţie a
testului.
Definiţie 2.3.4. Numim eroare de genul I respingerea unei ipoteze
adevărate, iar probabilitatea de producere a acestei erori este

P((X1 , X 2 ,...,X n ) ∈ U H 0 ) = α şi poartă numele de riscul furnizorului.

Definiţie 2.3.5. Numim eroare de genul II admiterea unei ipoteze


false, iar probabilitatea de producere a acestei erori este

P((X1 , X 2 ,...,X n ) ∉ U H 1 ) =β şi poartă numele de riscul

beneficiarului.
Definiţie 2.3.6. Se numeşte puterea testului probabilitatea de

~
respingere a unei ipoteze false, adică
π (θ ) = P((X1 , X 2 ,...,X n ) ∈ U

~ ~
H 1 ) unde
H 1 : θ = θ sau π(θ) = 1 − β .
Statistică matematică 167

Observaţie 2.3.7. Nu există o metodă generală de construire a


regiunii critice U, care ne duce la testul de verificare a ipotezei nule H0, dar
se cunosc clase de probleme pentru care s-au construit astfel de regiuni critice
şi corespunzător lor avem teste de verificare a ipotezelor statistice.
Testul Z 2.3.8.
Fie caracteristica X ce urmează legea normală N ( m, σ) cu
m ∈ R necunoscut şi σ>0 cunoscut. Vrem să verificăm ipoteza nulă
H0:m=m0 în
ipoteza alternativă H1 : m ≠ m 0 cu probabilitatea de risc α şi datele de
selecţie x1, x2, …xn.

X−m 1 n
Considerăm statistica Z =
σ
, X = ∑ X k , ce urmează legea
n k =1
n
normală N(0,1). Deci pentru α dat putem determina intervalul
   
−z α, z α a.î. P−z α < Z < z α  =1 −α.
 1− 1−   1− 1− 
 2 2   2 2 

Se defineşte regiunea critică U∈ R n prin:


 
 u − m0   1 n
U = (u 1 , u 2 ,..., u n ) ∈ R
n
∉  − z α , z α , u = ∑ u k .
 σ  1− 2 1− 2  n k =1
 n 
Astfel am obţinut:

 
 X −m   
P (( X 1 , X 2 ,..., X n ) ∈ H 0 ) = P ∉
 − z , z α 
 H 0 =
σ
α
1− 1−
 2 2  
 n 
   
= P Z ∉− z α, z H 0  =α
  1− 1−
α  
  2 2  
168 Elemente de teoria probabilităţilor şi statistică matematică

Folosind regiunea critică U vom respinge ipoteza nulă H0 dacă

x − m0  
(x1, x2,…,xn) ∈ U adică z = σ ∉  − z α , z α  şi o admitem dacă
 1− 2 1− 2 
n

x − m0  
(x 1 , x 2 ,...,x n ) ∉ U adică z =
σ
∈ 

− z α
2
, z
 1− 1−  . α

2 
n
Observaţie 2.3.9.
1) Deoarece regiunea critică U corespunde complementarei
 
intervalului de încredere −z α, z α  pentru statistica Z în continuare nu
 1− 1− 
 2 2 

vom pune în evidenţă de fiecare dată regiunea critică U ci numai intervalul de


încredere pentru statistica utilizată.
2) Testul Z se poate folosi şi pentru o caracteristică X ce nu urmează
legea normală atunci când volumul selecţiei este mare (n>30).
3) Deoarece ipoteza alternativă este H1 : m ≠ m 0 testul Z se numeşte
testul Z bilateral. Dacă se consideră H1:m<m0 vom avea testul Z unilateral
dreapta. De exemplu pentru testul Z unilateral dreapta intervalul de încredere
pentru statistica Z devine (−
∞ , z 1−α) unde z1-α este determinat a.î..

1
Φ( z 1−α ) = −α.
2
Etapele aplicării testului:
1) Se consideră: α, σ, m = m 0 , x 1 , x 2 ,..., x n

z   1 −α
2) Se determină 1−
α
a.î. Φ z 1−α  =
2
 2  2
Statistică matematică 169

x − m0 1
3) Se calculează z = σ , x = ( x 1 , x 2 ,..., x n )
n
n

4) Dacă z < z1−α atunci ipoteza m=m0 este admisă, în caz contrar
2

este respinsă.
Exemplul 2.3.10. Caracteristica X reprezintă cheltuielile lunare în
mii lei pentru abonamentele la ziare şi reviste ale unei familii. Să se verifice,
cu nivelul de semnificaţie α=0,01 dacă media acestor cheltuieli lunare pentru
o familie este de 16 mii lei, ştiind că abaterea standard este σ = 3 mii lei şi
având o selecţie repetată de volum n=40, care ne dă distribuţia empirică de

11 13 15 17 20 
selecţie X : 
4 .
 6 12 10 8 

Rezolvare:
Deoarece n=40>30 şi σ = 3 este cunoscută, folosim testul Z pentru
verificarea ipotezei nule H0:m=16 cu alternativa H 1 : m ≠ 16 .
z = z 0 ,995
Pentru α=0,01 folosind testul se determină 1−
α
a.î.
2

1−α
Φ( z 0 ,995 ) = = 0,495 . Se obţine z0,995=2,58, care ne dă intervalul numeric
2

X−m
(-2,58;2,5 8) pentru statistica Z = σ . Calculăm
n
1
x= ( 4 ⋅11 + 6 ⋅13 + 12 ⋅15 ) + 10 ⋅17 + 8 ⋅ 20) = 15,8
40

x − m 15,8 − 16
z= = = −0,422 .
σ 3
n 40
170 Elemente de teoria probabilităţilor şi statistică matematică

Deoarece z = - 0,422 ∈( − 2,58 ;2,58 ) ipoteza se acceptă.


Testul T(Student) 2.3.11.
Fie caracteristica X ce urmează legea normală N(m, σ ) cu σ > 0 şi
m ∈ R necunoscuţi. Relativ la media teoretică m=M(X) facem ipoteza nulă
H0:m=m0 cu ipoteza alternativă H1 : m ≠ m 0 ; probabilitatea de risc fiind α iar
variabilele de selecţie x1,x2,…,xn.
Pentru verificarea ipotezei nule considerăm statistica

T=
X−m 1 n
, X = ∑ X k , σ2 =
1 n

n − 1 k =1
2
Xk − X , ( ) ce urmează legea
σ n k =1
n
Student cu n-1 grade de libertate. Deci se determină intervalul numeric

   
−t  P 
 n−1,1−
α, t
n−1,1− 
α a.î. −t n −1,1−α <T <t n −1,1−α  =1 −α, iar
 2 2   2 2 

complementara acestui interval ne defineşte regiunea critică U.


Etapele aplicării testului T:
1) Se consideră α; m = m 0 ; x 1 , x 2 ,..., x n

t   α
2) Se determină n −1,1−
α
a.î. Fn −1  
t n −1,1−α  =1 −
2
 2  2

3) Se calculează
t=
x − m0
σ
,x =
1 n

n k =1
2
xk ,σ =
1 n
∑ xk − x
n − 1 k =1
( ) 2

n
t <t
4) Dacă n −1,1−
α ipoteza m=m0 este admisă, altfel este
2

respinsă.
Observaţie 2.3.12. Deoarece ipoteza alternativă H1:este m ≠ m 0
testul T prezentat se numeşte testul T bilateral, există şi teste unilaterale.
Statistică matematică 171

Exemplul 2.3.13. Caracteristica X reprezintă gradul de ocupare


zilnică a unei unităţi hoteliere (în procente). Să se verifice, cu nivelul de
semnificaţie α=0,05, ipoteza că media de ocupare zilnică a hotelului este dată
prin m=80%, dacă dintr-o selecţie efectuată în 15 zile ale anului s-au obţinut
următoarele date de selecţie (în procente):
60,85,90,75,84,78,92,56,77,82,65,79,83,65,76.
Rezolvare:
Putem considera că X urmează legea normală N ( m, σ) cu m şi σ
necunoscuţi. Ipoteza nulă ce se face este H0:m=80, cu alternativa H 1 : m ≠ 80
.
Deoarece σ este necunoscută, folosind testul T, cu α=0,05 şi
tabelele

t   α
de valori se determină n −1,1−
α
a.î. Fn −1  
 t n −1,1−α  =1 − = 0,975 . Se
2
 2  2

obţine t14;0,975 =2,145. Prin urmare intervalul numeric pentru statistica

X −m
T=
σ este (-2,145;2,145).
n
1
Calculăm x = (60 + 85 + ... + 76 ) = 76 ,4
15

1 n x − m0 76,4 − 80
t= = = −1,291
∑ (x k − x) 2 = 116,686
2
σ = σ 10,80
14 k =1
n 15
Întrucât -1,291 ∈(−2,145 ;2,145 ) , ipoteza ca media de ocupare
zilnică a unităţii hoteliere este de 80% se acceptă.
Teste pentru compararea a două medii 2.3.14.
172 Elemente de teoria probabilităţilor şi statistică matematică

Fie două populaţii C2 şi C2 cercetate din punct de vedere al aceleiaşi


caracteristici anume X1 pentru C1 care urmează legea normală N (m1 , σ1 ) şi
C2 care urmează N(m 2 , σ2 ) , C1 şi C2 fiind independente.
Vrem să verificăm ipoteza nulă H0:m1=m2 în ipoteza alternativă
H 1 : m1 ≠ m 2 cu probabilitatea de risc α şi selecţiile de volum n1 şi n2 din cele

două populaţii.
a) Testul Z (dacă σ1 , σ2 sunt cunoscute)

( X 1 − X 2 ) − (m 1 − m 2 )
Z=
Considerăm statistica σ12 σ 22 care urmează
+
n1 n 2

legea normală N(0,1).


 
Pentru α dat se determină intervalul numeric  
−z 1−α, z 1−α ,astfel
 2 2 

încât
 
P 
−z 1−α < Z < z 1−α  =1 −α.
 2 2 

Etapele aplicării testului:


1) Se consideră σ1 , σ2 ; x 11 , x 12 ,..., x 1n1 ; x 21 , x 22 ,..., x 2 n 2 ; m1 = m 2

z   1 −α
2) Se determină 1−
α
a.î. Φ z 1−α  =
2
 2  2

x1 − x 2 1 n1 1 n2
z= , x1 = ∑
n 1 k =1
x 1k ; x 2 =
n2
∑x 2k
3) Se calculează σ 2
σ 2
k =1
+
1 2

n1 n 2

z <z
4) Dacă 1−
α ipoteza m1 = m 2 este admisă, altfel este
2

respinsă.
b) Testul T (dacă σ1 = σ 2 = σ necunoscute)
Statistică matematică 173

(X1 − X 2 ) − (m1 − m 2 ) n1 + n 2 − 2
T=
Considerăm statistica 2 2 1 1 care
(n 1 − 1)σ + (n 2 − 1)σ
1 2 +
n1 n 2

urmează legea Student cu n = n 1 + n 2 − 2 grade de libertate.


Pentru statistica T se determină intervalul numeric

   
−t α, t
 a.î. P−t α <T < t
 =1 −α
 n ,1− n ,1− 
α  n ,1− n ,1− 
α
 2 2   2 2 

Etapele aplicării testului:


1) Se consideră α; x 11 , x 12 ,..., x 1n1 ; x 21 , x 22 ,..., x 2 n 2 .

t   α
2) Se determină n ,1−
α
a.î. Fn  t n ,1−α  = 1 − , n = n 1 + n 2 − 2
2
 2  2

x1 − x 2 n1 + n 2 − 2
t=
3) Se calculează 2 2 1 1
(n 1 − 1)σ 1 + ( n 2 − 1)σ 2 +
n1 n 2

1 n1
( ) ( )
n2
1 1 n1 1 n2
∑ ∑ x 2k ; σ1 = ∑ 1k ∑ x 2k − x 2
2 2 2 2
x1 = x 1k ; x 2 = x − x 1 ; σ 2 =
n 1 k =1 n2 k =1 n 1 − 1 k =1 n 2 − 1 k =1

4) Dacă t < t n ,1−α atunci ipoteza m1 = m 2 este admisă, altfel este


2

respinsă.
c) Testul T (dacă σ1 ≠ σ 2 necunoscute)
(X 1 − X 2 ) − ( m1 − m 2 )
T=
2 2
Considerăm statistica σ1 σ 2 care urmează
+
n1 n 2

legea Student cu n grade de libertate, n este dat de


174 Elemente de teoria probabilităţilor şi statistică matematică

2
σ1
1 c2 (1 − c ) 2 n1
= + ;c =
n n1 − 1 n2 − 1  σ 12 σ 22  .
 + 
 n1 n2 
 
Pentru statistica T se determină intervalul numeric

   
−t α; t
 a.î. P−t α <T < t
 =1 −α.
 n ,1− n ,1− 
α  n ,1− n ,1− 
α
 2 2   2 2 

Etapele aplicării testului:


1) Se consideră α; x 11 , x 12 ,..., x 1n1 ; x 21 , x 22 ,..., x 2 n 2 ;

−t   α
2) Se determină n ,1−
α
a.î. Fn  
 t n ,1−α  =1 − 2 unde
2
 2 
2
σ1
1 c2 (1 − c) 2 c = n1
= + ;
n n1 −1 n2 −1  σ12 σ 22  ;
 + 
 n1 n 2 
 

2
σ =
1
1 n1
n 1 − 1 k =1
( 2 2
) 1 n2
∑ x 1k − x 1 ;σ 2 = n − 1 ∑ x 2k − x 2 ( ) 2

2 k =1

1 n1 1 n2
x 1 = ∑ x 1k ; x 2 = ∑x 2k
n 1 k =1 n2 k =1

x1 − x 2
t=
2 2
3) Se calculează σ1 σ 2
+
n1 n 2

4) Dacă t < t n ,1−α atunci ipoteza m1 = m 2 este admisă, altfel este


2

respinsă
Statistică matematică 175

Exemplul 2.3.15. La o unitate de îmbuteliere a laptelui există două


maşini care efectuează această operaţie în sticle de 1l. Pentru a cerceta
reglajul de îmbuteliere la cele două maşini s-au efectuat două selecţii relative
la sticlele îmbuteliate în cele două maşini şi s-au obţinut datele de selecţie:
X k/990 995 1000 1005 1010 X k// 985 990 995 1000 1005 1010
f k/ 7 9 11 8 5 f k// 5 5 6 7 6 4
Folosind nivelul de semnificaţie α = 0,05 , să se verifice dacă
mediile de umplere a sticlelor de către cele două maşini sunt aceleaşi, în
cazul în care abaterile standard sunt σ1 = 6 ml şi σ 2 = 7,5 ml.
Rezolvare:
Caracteristicile X1 şi X2 ce reprezintă cantitatea de lapte (în ml)
conţinută de o sticlă îmbuteliată de prima maşină, se consideră ca urmând
legile de probabilitate normale N(m1, 6) şi N(m2; 7,5).
Verificarea ipotezei nule N0:m1=m2 cu alternativa H1 : m1 ≠ m 2 , se
va face cu testul Z.
Folosind nivelul de semnificaţie α = 0,01 se determină din tabele

z = z 0, 995   1 −α
valoarea 1−
α
a.î. Φ z1−α  = = 0,495 . Se obţine z 0,995 = 2,58
2
 2  2

, care ne dă intervalul (-2,58; 2,58) pentru statistica

σ12 σ 22
Z = [(X1 − X 2 ) − (m1 − m 2 )] + .
n1 n 2

1
Calculăm: x1 = (7 ⋅ 990 + 9 ⋅ 995 + ... + 5 ⋅ 1010 ) = 999 ,375
40
1
x2 = (5 ⋅ 985 + 5 ⋅ 990 + ... + 4 ⋅1010 ) = 997 ,424
33

σ12 σ 22 36 56,25
z = (x1 − x 2 ) + = (999,375 − 997 ,424 ) + = 1,209
n1 n 2 40 33
176 Elemente de teoria probabilităţilor şi statistică matematică

Deoarece z =1,209 ∈(−2,58 ;2,58 ) , rezultă că mediile de umplere


a sticlelor nu diferă semnificativ pentru cele două maşini.
Exemplul 2.3.16.
Se cercetează două loturi de ulei pentru automobile, din punct de
vedere al vâscozităţii, obţinându-se datele de selecţie:
X k/10,27 10,28 10,29 10,30 10,32 X k// 10,26 10,27 10,29 10,30 10,31
f k/ 3 2 1 1 1 f k// 3 2 1 1 1
Analizele făcându-se cu acelaşi aparat, se consideră că abaterile
standard sunt aceleaşi. Considerând nivelul de semnificaţie α = 0,05 ; să se
verifice dacă mediile de vâscozitate pentru cele două laturi nu diferă
semnificativ.
Rezolvare:
Caracteristicile X1 şi X2, ce reprezintă vâscozităţile pentru cele două
loturi de ulei, se consideră că urmează fiecare legea normală, respectiv
N ( m 1 , σ) şi N (m 2 , σ) , cu abaterea standard σ > 0 necunoscută.

Verificarea ipotezei nule H 0 : m1 = m 2 cu alternativa H1 : m1 ≠ m 2 ,


se va face cu testul T, deoarece abaterea standard σ este necunoscută.
Folosind nivelul de semnificaţie α = 0,05 , se determină folosind tabelele,

t   α
valoarea n ,1−
α
, a.î. Fn  
 t n ,1−α  =1 − 2 , unde n=n1+n2-2. Adică se obţine
2
 2 

t 14 ; 0 , 975 = 2,145 , intervalul (-2,145;2, 145) pentru statistica

(X1 − X 2 ) − (m1 − m 2 ) n1 + n 2 − 2
T=
2 2 1 1 care urmează legea Student cu n
(n 1 − 1)σ 1 + (n 2 − 1)σ 2 +
n1 n 2

grade de libertate.
Statistică matematică 177

Calculăm:
1
x1 = (3 ⋅10 ,27 + 2 ⋅10 ,28 + ... +1 ⋅10 ,32 ) = 10 ,285
8
1
x2 = ( 2 ⋅10 ,26 +1 ⋅ 20 ,27 + ... + 3 ⋅10 ,31) = 10 ,289
8

2
σ1 =
1 n1
(
∑ x 1k − x 1
n 1 − 1 k =1
) 2
= 3,143 ⋅ 10 − 4

2
σ2 =
1 n2
(
∑ x 2k − x 2
n 2 − 1 k =1
) 2
= 4,983 ⋅ 10 − 4

(x1 − x 2 ) n1 + n 2 − 2 10,285 − 10,289 14


t= = = −0,397
2 2 1 1 (22,001 + 34,881) ⋅ 10 − 4 1 1
(n 1 − 1)σ1 + (n 2 − 1)σ 2 + +
n1 n 2 8 8

Deoarece t = −0,397 ∈( −2,145 ;2,145 ) , rezultă că vâscozităţile medii ale


celor două loturi de ulei nu diferă semnificativ.
Testul χ2 privind dispersia 2.3.17.
Fie caracteristica X ce urmează legea normală N(m, σ ) cu parametri

m ∈ R şi σ > 0 necunoscuţi. Vrem să verificăm ipoteza nulă H 0 : σ = σ 0 în


2 2

raport cu ipoteza alternativă H 1 : σ 2 ≠ σ02 , cunoscând probabilitatea de risc


α şi o selecţie de volum n.

∑(X ) = (n −σ1)σ
2
n
1 2
Considerăm caracteristica H 2 = k −X care
σ2 k =1
2

urmează legea χ2 cu n-1 grade de libertate, şi se determină pentru aceasta

 2 
intervalul numeric P 2 2

h n −1, α < H < h n −1,1−α  =1 −α
 2 2 

Etapele aplicării testului:


178 Elemente de teoria probabilităţilor şi statistică matematică

1) Se consideră αi ; σ = σ0 ; x 1 , x 2 ,..., x n .
2 2

   α 
2) Se determină    2 
h n −1, α , h n −1,1−α  a.î. Fn -1 h n −1, α  = 2 şi
2 2

 2 2   2 

 2  α
Fn −1  
 n −1,1−  =1 − 2 .
h α
 2 

n
1 1 n
3) Se calculează h =
2

σ 02
∑ (x k − x) 2 , x =
k =1
∑ xk
n k =1
 2 
h 2 ∈  atunci ipoteza σ 2 = σ 02 este admisă,
2
4) Dacă h n −1, α ; h n −1,1−α 
 2 2 

altfel este respinsă.


Exemplul 2.3.18. Se efectuează o selecţie repetată de volum n=12
relativă la caracteristica X ce urmează legea normală N ( m, σ) , obţinându-
se distribuţia empirică de selecţie
 − 0,5 − 0,4 − 0,2 0 0,2 0,6 0,8 1 1,2 1,5 
X:
 1 .
 2 1 1 1 1 1 1 2 1 
Să se verifice, cu nivelul de semnificaţie α = 0,05 , ipoteza nulă
H 0 : σ 2 = D 2 ( x ) = 0,5 , cu alternativa H 1 : σ 2 ≠ 0,5.

Rezolvare:
Se utilizează testul χ2 . La nivelul de semnificaţie α = 0,05 ; se

2
 2 
h  pentru statistica H = (n − 12)σ ,
2
determină intervalul  n −1; α; h n −1;1−α ,
 2 2  σ
care urmează legea χ2 cu n-1 grade de libertate; folosind tabelele de valori

din F11 ( h 11
2
; 0 , 025 ) = 0,025 ⇒ h 11 ; 0 , 025 = 3,82
2
şi

F11 ( h 11
2
; 0 , 975 ) = 0,975 ⇒ h 11; 0 , 975 = 21,9
2

Deci, intervalul pentru statistica H 2 este (3,82;21,9).


Statistică matematică 179

1
Calculăm x = [1 ⋅ (−0,5) + 2 ⋅ (−0,4) + ... +1 ⋅1,5] = 0,4167
12

( )
2
1 n
∑ xk − x = 0,518 ; h 2 = (n −12)σ = 11 ⋅ 0,518 = 11,396
2 2
σ =
n − 1 k =1 σ0 0,5

Deoarece h 2 =11,396 ∈(3,82 ;21,9) , ipoteza nulă făcută relativ la


dispersia teoretică este acceptată.
Testul F (Snédécor - Fischer) 2.3.19.
Fie două populaţii C1 şi C2 referitor la care ne interesează
caracteristicile: X1 ce urmează N (m1 , σ1 ) şi X2 ce urmează N(m 2 , σ2 ) . Cu

probabilitatea de risc α vrem să verificăm ipoteza nulă H 0 : σ12 = σ 22 în

raport cu ipoteza alternativă H 1 : σ12 ≠ σ 22 , considerând câte o selecţie din


fiecare populaţie, respectiv de volum n1 şi n2.
2 2
σ1 σ2
Statistica F = 2 urmează legea Snédécor - Fischer cu
σ1 σ 22

m = n 1 − 1 şi n = n 2 − 1 grade de libertate, iar intervalul numeric pentru

 
această statistică f  se determină a.î.
 m , n ; α, f m , n ;1−α
 2 2 

 
P 
f m , n ; α <F <f m , n ;1−α  =1 −α. Extremităţile intervalului se determină
 2 2 

  α   α
din relaţiile Fm ,n  
f m , n ; α  = şi Fm , n 
f 
α  =1 − , dacă Fm , n ( x )
 2  2  m , n ;1−
2 
2

este funcţia de repartiţie a legii "Fs" şi are valorile tabelate.


1
Are loc relaţia f m, n, β = şi de aceea tabelele pentru
f n , m ,1−β

Fm , n ( x ) sunt întocmite numai pentru valori mari ale lui βşi pentru F>1.
180 Elemente de teoria probabilităţilor şi statistică matematică

Dacă F<1 intervalul numeric pentru F este dat prin

 
   1 1 
f  = .
 m , n ; α m , n ;1−α   f
; f ;
 2 2   n , m ;1−α f n , m ; α 
 2 2 

Etapele aplicării testului F:


1) Se consideră:
α; m = n 1 −1; n = n 2 −1; x 11 , x 12 ,..., x 1n1 ; x 21 , x 22 ,..., x 2 n 2
 
2) Se determină: f  astfel încât
 m , n ; α; f m , n ;1−α
 2 2 

  α   α
Fm , n f =
 m,n;  2
α şi Fm , n
f α

 m ,n ;1−  =1 − 2 .
 2   2 

3) Se calculează:
2

( ) ( )
n
σ1 1 n1 1
∑ ∑ x 2k − x 2
2 2 2 2
f = 2 ;σ = 1 x 1k − x 1 ; σ 2 =
σ2 n 1 − 1 k =1 n 2 − 1 k =1

n1 n2
1 1
x1 =
n1

k =1
x 1k , x 2 =
n2
∑x
k =1
2k .

 
4) Dacă f ∈f
 m , n ; α; f m , n ;1−α
 atunci ipoteza σ12 = σ 22 este
 2 2 

admisă, altfel este respinsă.


Exemplul 2.3.20. Două strunguri produc acelaşi tip de piese.
Caracteristica cercetată este diametrul acestor piese. Se consideră două
selecţii de volum n 1 = 7 şi n 2 = 9 , relativ la diametrele pieselor produse de
cele două strunguri. Datele de selecţie sunt prezentate prin distribuţiile
empirice de selecţie:
Statistică matematică 181

3,4 3,6 3,8  3,5 3,6 3,7 3,8 


X1 
 1  şi X2   . Considerând
 4 2 
 1
 4 2 2 

nivelul de semnificaţie α = 0,05 ; să se verifice ipoteza nulă H 0 : σ1 = σ2 cu


alternativa H1 : σ1 ≠ σ 2 , dacă se presupune că X1 şi X2 urmează legea
normală N (m1 , σ1 ) şi respectiv N(m 2 , σ2 ) .
Rezolvare:
 
Se utilizează testul F. Se determină intervalul f 
 m , n ; α; f m , n ;1−α
 2 2 

  α
pentru statistica F folosind tabelele de valori, a.î. Fm ,n  
f m , n ; α  = şi
 2  2

  α
Fm , n  
f m , n ;1−α  =1 − 2 .
 2 

f 6 ,8; 0 ,975 = 4,65 deoarece F6,8 (4,65 ) = 0,975


1 1
f 6,8; 0 , 025 = = = 0,18 . Rezultă intervalul (0,18;4,65)
f 8, 6; 0, 975 5,60

Calculăm:

1 1
x1 = (1 ⋅ 3,4 + 4 ⋅ 3,6 + 2 ⋅ 3,8) = 3,629 ; x 2 = (1 ⋅ 3,5 + 4 ⋅ 3,6 + 2 ⋅ 3,7 + 2 ⋅ 3,8) = 3,656
7 9

2
σ1 =
1 n1
n 1 − 1 k =1
(
∑ x 1k − x 1 ) 2 2
= 0,01905 ; σ 2 =
1 n2
(
∑ x 2k − x 2
n 2 − 1 k =1
) 2
= 0,01028

2
σ1 0,01905
f = 2
= = 1,85 .
σ 2
0,01028

Deoarece f =1,85 ∈(0,18 ;4,65 ), rezultă că ipoteza făcută privind


egalitatea dispersiilor, este admisă.
Teste de concordanţă
Testul χ2 2.3.21.
182 Elemente de teoria probabilităţilor şi statistică matematică

Fie caracteristica X care are funcţia de repartiţie teoretică F. Ipoteza


statistică pe care o facem asupra caracteristicii X este că are funcţia de
repartiţie F = F0 ( x; λ1 ,..., λs ), unde λ1 ,..., λs sunt parametrii
necunoscuţi.
Folosind datele de selecţie x 1 , x 2 ,..., x n se estimează prin metoda

verosimilităţii maxime aceşti parametrii, obţinându-se λ1 , λ2 ,..., λs . Deci


* * *

ipoteza statistică devine F = F0 ( x; λ*1 ,..., λ*s ). În continuare se face o


grupare a datelor de selecţie obţinându-se distribuţia empirică de selecţie:

 x '1 x'2 ... x' N 


X
f  clasa x ' i reprezintă intervalul [ai-1,ai). Pentru
 1 f2 ... fN  

clasa x'i avem p i = F(a i ) − F(a i −1 ) necunoscută, dar putem calcula

p *i = F0 (a i ; λ*1 ,..., λ*s ) − F0 (a i −1 ; λ*1 ,..., λ*s ). Prin urmare, ipoteza făcută

asupra funcţiei de repartiţie devine ipoteza nulă H 0 : pi = pi* ; i = 1, N în

N
(f i − n p *i )
ipoteza alternativă H 1 : H 0 falsă. Valoarea numerică h =
2

i =1 n p *i

este valoarea unei variabile aleatoare H 2 ce urmează legea χ2 cu k = N-s-1


grade de libertate. Deci pentru probabilitatea de risc α se determină
intervalul numeric (0, h 2
k ,1−α ) corespunzător lui H2 a.î.

P ( H 2 < h 2k ,1−α ) = 1 − α adică Fk ( h 2k ,1−α ) = 1 − α .

Etapele aplicării testului:


1) Se consideră: α; x 1 , x 2 ,..., x n ; F = F0 ( x; λ1 ,..., λs )

2) Se determină intervalul (0, h k ,1−α ) a.î. Fk ( h k ,1−α ) = 1 − α


2 2
Statistică matematică 183

– estimările de verosimilitate maximă λ1 , λ2 ,..., λs .


* * *

 xi 
– distribuţia empirică de selecţie X 
 fi  i= 1,N
– se calculează p1* = F0 (a i ; λ*1 , λ*2 ,..., λ*s ) − F0 (a i −1 ; λ*1 , λ*2 ,..., λ*s )
– k = N-s-1
(f i − n p *i ) 2
N
3) Se calculează h = ∑
2

i =1 n p *i

4) Dacă h < h k ,1−α atunci ipoteza F = F0 este admisă, altfel este


2 2

respinsă.
Observaţie 2.3.22. Testul χ2 nu este aplicabil dacă n p *i sunt mai
mici decât 5, caz în care se recomandă o nouă grupare a datelor de selecţie.
Testul lui Kolmogorov 2.3.23.
Se consideră caracteristica X care are funcţia de repartiţie teoretică
F. Dacă F n (x) este funcţia de repartiţie de selecţie avem că

lim P( n d n < x ) = K ( x ) unde d n = sup F n ( x ) −F( x ) iar


n →∞ x∈R

+∞

∑(−1)
2
x2
K(x) = k
e −2 k este funcţia lui Kolmogorov. Se face ipoteza H0
k =−

că X urmează legea de probabilitate dată de funcţia de repartiţie F. Dacă H 0


este adevărată şi pentru probabilitatea de risc α se poate determina valoarea
184 Elemente de teoria probabilităţilor şi statistică matematică

x 1−α a.î. K ( x 1−α ) = 1 − α . Deci avem că P( n d n < x 1−α ) = 1 − α sau

 x  x
P d n < 1−α  = 1 − α , adică dacă dn satisface inegalitatea d n < 1−α
 n  n

admitem ipoteza H0 altfel o respingem.


Etapele aplicării testului lui Kolmogorov:

 x 'i 
1) Se consideră α;X:  ,Fn= f + 21 . + fN . .
fi i=1,N
2) Se calculează x 1−α a.î. K ( x 1−α ) =1 − α
a i −1 + a i
3) Se calculează d n = max F n (a i ) − F(a i ) ; x 'i =
i =1, N 2
4) Dacă n d n < x 1−α ipoteza este admisă, altfel este respinsă.

Exemplul 2.3.24. Se consideră caracteristica X ce reprezintă


rezistenţa, în KΩ, a unor tronsoane de ceramică acoperite cu carbon. Să se
verifice normalitatea lui X, folosind o selecţie de volum n=124, pentru, care
s-au obţinut datele de selecţie.

Clasa
(- ∞ ;1,65) [1,65;1,70) [1,70;1,75) [1,75;1,80) [1,80;1,85) [1,85;1,90) [1,90;1,95) [1,95;2,00) [2,0;+ ∞
)

Frecare 11 14 17 17 18 16 13 10 8

a) utilizând testul de concordanţă χ2 , cu nivelul de semnificaţie


α = 0,05 ;
Statistică matematică 185

b) utilizând testul de concordanţă al lui Kolmogorov, cu nivelul de


semnificaţie α = 0,05 ;
Rezolvare:
Se cunoaşte că estimările de verosimilitate maximă pentru m şi σ
sunt respectiv m * = x , σ* = µ2 .
Distribuţia empirică de selecţie pentru caracteristica X este
1,625 1,675 1,725 1,775 1,825 1,875 1,925 1,975 2,125 
X:
 11 

 14 17 17 18 16 13 10 8 
Calculăm
1
m* = x = (11 ⋅1,625 + 14 ⋅1,675 + ... + 8 ⋅ 2,125 ) = 1,82
124

σ* = µ 2 =
1 124 *

124 k =1
( x k − 1,82 ) = 0,129
2

a) se consideră valoarea numerică


(f i − n p *i ) 2
N
h =∑
2
, unde N =9,
i =1 n p *i

 a i − m*   a i −1 − m * 
p = Φ 
*
i
 − Φ  a ; s = 2; k = 9 − 2 − 1 = 6
 σ σ*
*
  

Se determină intervalul (0, h k ,1−α ), pentru statistica H 2 , folosind


2

tabelele de valori şi se obţine h 6;0 ,95 =12 ,59 adică intervalul (0;12,59).
2

Calculele pentru h 2 se fac în tabelul:

ai − m *  a − m*  (f i − n p *i ) 2
ai fi Φ  i *  p *i n p *i
σ*  σ  n p *i
1,65 11 -1,32 -0,4066 0,0934 11,5816 0,02921
1,70 14 -0,93 -0,3238 0,0828 10,2672 1,35712
1,75 17 -0,54 -0,2054 0,1184 14,6816 0,36610
186 Elemente de teoria probabilităţilor şi statistică matematică

1,80 17 -0,16 -0,0636 0,1418 17,5832 0,01934


1,85 18 0,23 -0,0910 0,1546 19,1704 0,07146
1,90 16 0,62 0,2324 0,1414 17,5336 0,13414
1,95 13 1,01 0,3437 0,1113 13,8012 0,04651
2,00 10 1,40 0,4192 0,0755 9,3620 0,04348
+∞ 8 +∞ 0,5000 0,0808 10,0192 0,40694
n=124 h = 2,4743
2

Valorile funcţiei lui Laplace Φ se iau din tabele şi se are în vedere


că Φ( −x ) = −Φ( x ) şi
 a1 − m*   a 0 − m* 

p = Φ  − Φ σ *  = Φ (−1,32) − Φ (−∞ ) =

*
1
 σ *
  
= −0,4066 + 0,5 = 0,0934

Deoarece h 2 = 2,4743 ∈(0;12 ,59 ), rezultă că se acceptă ipoteza


normalităţii lui X.
b) Pentru α = 0,05 , folosind tabelele de valori, se determină
x 1−α = x 0 ,95 a.î. K ( x 1−α ) = 1 − α, adică x 0,95 =1,36 .
Ipoteza că X urmează legea normală N( m * , σ* ) , cu m * şi σ*

calculaţi anterior, este acceptată dacă n d n < x 1−α , unde

d n = max F n (a i ) −F(a i ) .
i =1, N

Aici F n ( x ) este funcţia de repartiţie de selecţie, iar F(x) este


funcţia de repartiţie pentru legea normală N( m * , σ* ). Calculele pentru
determinarea lui dn sunt date în tabelul următor:
i
a i − m*
ai fi ∑f j F n (a i ) F(ai) F n (a i ) −F(a i )
j=1 σ*
1,65 11 11 0,0887 -1,32 0,0934 0,0047
1,70 14 25 0,2016 -0,93 0,1762 0,0254
Statistică matematică 187

1,75 17 42 0,3387 -0,54 0,2946 0,0441


1,80 17 59 0,4758 -0,16 0,4364 0,0394
1,85 18 77 0,6210 0,23 0,5910 0,0300
1,90 15 93 0,7500 0,62 0,7324 0,0176
1,95 13 106 0,8548 1,01 0,8437 0,0111
2,00 10 116 0,9355 1,40 0,9192 0,0163
+∞ 8 124 1,0000 +∞ 1,0000 0
dn= 0,0441
Deoarece n d n = 124 ⋅ 0,0441 = 0,491 < 1,36 , acceptăm ipoteza

că X urmează legea normală N (m * , σ* ).

2.4. Corelaţie şi regresie


Definiţie 2.4.1. Fie (X1,Y1), ..., (Xn, Yn) o selecţie repetată de volum
n asupra vectorului aleator (X, Y). Se numeşte coeficient de corelaţie de
selecţie
n

∑ (x 1 − x )( y1 − y )
1 n 1 n
r=
n
i =1
n
unde x = ∑ i
n i =1
x y = ∑ yi
n i =1
∑ ( x1 − x)2 ∑ ( y1 − y)2
i =1 i =1

Observaţia 2.4.2. Se arată că aceasta este o funcţie de estimaţie a lui


r, adică r tinde în probabilitate către r, n →∞.
Observaţia 2.4.3.
1) Coeficientul de corelaţie de selecţie r este cuprins între -1 şi 1.
2) Dacă r = ± 1, atunci punctele (X1,Y1), ..., (Xn, Yn) se găsesc pe
dreapta de ecuaţie
+σ y 2 2
y− y= ( x − x ) unde σ x si σ y
−σx
188 Elemente de teoria probabilităţilor şi statistică matematică

sunt respectiv funcţiile de estimaţie absolut corectă ale dispersiilor σX2 şi σY2,
adică
n n

2
∑ ( xi − x) 2 2
∑ ( y − y)
i
2

σx = i =1
, σy = i =1
n −1 n −1
Observaţia 2.4.4. Considerând funcţia de regresie liniară a
variabilei Y în raport cu variabila X dată de ecuaţia y = ax + b , unde
y = M (Y / x ) se obţine valoarea y 'i = ax i + b şi reziduul δi = y 'i −yi fiind

M (Y / xi ) .

Mulţimea valorilor δi determină variabila aleatoare reziduală δ, care,


prin prisma definiţiei funcţiei regresive are media nulă M (δ ) = 0 . Calculând
dispersia variabilei δ, pe care o numim dispersia reziduală, notând-o σR2,
avem D 2 (δ ) = M [(δ − 0) 2 ] = M {[Y / M (Y / x)] 2 } = D 2 (Y / x) unde dispersia
reziduală este tot una cu dispersia variabilei condiţionate Y / x .
2 2
Cum avem σ Y / x = σ Y (1 − r 2 ) rezultă de asemenea

2 2
σ R = σ Y (1 − r 2 ) pentru regresia variabilei Y în raport cu variabila X.
2 2
Inversând, se scrie r 2 = 1 − σ R / σ Y şi formula obţinută poate fi folosită

pentru determinarea coeficientului de corelaţie r, atunci când regresia


variabilei Y în raport cu X şi variabilele au repartiţii normale. Această
valoare a lui r este numită coeficientului de corelaţie în regresia liniară.
Exemplul 2.4.5. Fie caracteristicile:
X – reprezentând în procente suprafaţa comercială de expunere a mărfurilor
spre vânzare faţă de suprafaţa construită şi
Y – reprezentând volumul valoric al vânzărilor, raportat la metru pătrat
suprafaţă de prezentare a mărfurilor pe lună, în mii lei.
Statistică matematică 189

Acestea fiind cunoscute prin următoarele date de selecţie:


X 10 12 15 17 26
Y 40 45 42 53 60
Se cere:
a) Să se determine coeficientul de corelaţie al variabilelor X şi Y;
b) Să se determine dreapta de regresie a lui Y faţă de X;
c) Cu ajutorul dreptei de regresia de mai sus, să se facă prognoza
volumului valoric al vânzărilor Y când X ia valoarea 30.
Rezolvare:
Organizăm calculele în tabelul următor:
xi yi xi − x yi − y ( xi − x ) 2 ( yi − y ) 2 ( xi − x) 2 ( yi − y ) 2
10 40 36 64
12 45 -6 -8 16 9 48
15 42 -4 -3 1 36 12
17 53 -1 -6 1 25 6
26 60 1 5 100 144 5
----- ----- 10 12 ----- ----- 120
80 240 154 278
5 5
1 80 1 240 191
a) x = ∑ xi = = 16 ; y = ∑ yi = = 48 ; r = = 0,95
5 i =1 5 5 i =1 5 154 − 278

b) Pentru dreapta de regresie a lui Y în raport cu X calculăm:


1 n 154

2
σx = ( xi − x) 2 = = 30,8 de unde σx = 30 ,8 = 5,5
n − 1 i =1 4

1 n 278

2
σy = ( yi − y ) 2 = = 55,6 de unde σy = 55 ,6 = 7,3
n − 1 i=1 4
7,3
Obţinem y − 48 = 0,95 ⋅ 5,5 ( x −16 ) sau y =1,3 x +27 ,2
190 Elemente de teoria probabilităţilor şi statistică matematică

c) Prognoza volumului valoric al vânzărilor se obţine calculând


valoarea lui y pentru x = 30.
Avem: y6 = 1,3 ⋅ 30 + 27 ,2 = 66 ,2 .

2.5. Probleme rezolvate


1. Fie caracteristica X, care are distribuţia empirică de selecţie:
39 ,25 39 ,50 39 ,75 40 ,00 40 ,25 40 ,50 
X: 
 .
 2 4 2 4 2 1  
Se cere:
a) media de selecţie, momentul centrat de selecţie de ordinul doi şi
dispersia de selecţie;
b) funcţia de repartiţie de selecţie.
Rezolvare:
a) Media de selecţie este:
1 6 '
x= ∑ xk ⋅ f k =
15 k =1
1
= ( 39,25 ⋅ 2 + 39,5 ⋅ 4 + 39 ,75 ⋅ 2 + 40 ⋅ 4 + 40,25 ⋅ 2 + 40 ,5) = 39,80
15
Momentul centrat de selecţie de ordinul doi este:

µ2 ( X ) =
1 6

15 k =1
(
f k ⋅ xk' − x ) 2
=

=
1
15
[ 2 2 2
]
2 ⋅ ( 39,25 − 39 ,8) + 4 ⋅ ( 39 ,5 − 39 ,8) + 2 ⋅ ( 39 ,75 − 39 ,8) + ... = 0,135

Valoarea dispersiei de selecţie se calculează folosind momentul


centrat de selecţie de ordinul doi şi anume:
Statistică matematică 191

2 15
σ (X ) = µ2 ( X ) = 0,144
14
b) Funcţia de repartiţie de selecţie este:

 0, daca x ≤ 39 ,25
 2 / 15 , daca 39 ,25 < x ≤ 39 ,50

 6 / 15 , daca 39 ,50 < x ≤ 39 ,75

F 15 ( X ) =  8 / 15 , daca 39 ,75 < x ≤ 40 .
12 / 15 , daca 40 < x ≤ 40 ,25

14 / 15 , daca 40 ,25 < x ≤ 40 ,50

 1, daca x > 40 ,50

2. În urma unei selecţii de volum n = 100, privind caracteristica X s-


au obţinut următoarele date de selecţie:
xI 10,50 10,55 10,60 10,65 10,70 10,75 10,80
fI 10 12 16 21 18 14 9
Se cere:
a) o estimaţie absolut corectă pentru media teoretică m = M(X);
b) o estimaţie corectă şi una absolut corectă pentru dispersia
teoretică σ 2 = D2(X).
Rezolvare:
a) Media de selecţie este un estimator absolut corect pentru media
teoretică şi prin urmare valoarea mediei de selecţie este o estimaţie absolut
corectă . Folosind datele de selecţie avem următoarea distribuţie empirică de
selecţie:
192 Elemente de teoria probabilităţilor şi statistică matematică

10 ,50 10 ,55 10 ,60 10 ,65 10 ,70 10 ,75 10 ,80 


X : 
 10 12 16 21 18 14 9 

iar media de selecţie este:


1
x= (10 ,5 ⋅10 +10 ,55 ⋅12 +10 ,6 ⋅16 + ... ) =10 ,65
100
b) O estimaţie corectă pentru dispersia teoretică este reprezentată de
valoarea momentului centrat de selecţie de ordinul doi, adică:

µ2 ( X ) =
1
100
[ 2 2
]
10 ⋅ (10 ,50 −10 ,65 ) +12 ⋅ (10 ,55 −10 ,65 ) + ... = 0,0077

O estimaţie absolut corectă pentru dispersia teoretică este reprezentată


de valoarea dispersiei de selecţie, adică:
2 100
σ (X ) = µ2 ( X ) = 0,0078 .
99
1 0 
3. Fie caracteristica X, care are distribuţia teoretică X : 
 p 1− p

 

unde p∈(0,1) este necunoscut. Se consideră o selecţie de volum n, relativă la

1
caracteristica X. să se arate că funcţia de selecţie V = X (n X −1) ,
n −1

1 n
unde X = ∑ X k , este o funcţie de estimaţie nedeplasată pentru p2.
n k =1
Rezolvare:
Pentru caracteristica X avem M(X) = p şi D2(X) = p – p2.
Funcţia de estimaţie V este un estimator nedeplasat al parametrului
p2 dacă M(V) = p2.
Calculăm
Statistică matematică 193

 1
M (V ) = M 

(  n
X n X −1  = M  )
2
X −
1 
X =
 n −1   n −1 n −1 

=
n
n −1
M X −( )
2 1
n −1
M X ( )
Folosind faptul că variabilele de selecţie sunt liniar independente şi
identic repartizate cu X avem:

( ) 1 n  1 n 1 n
M X = M  ∑ Xk  = ∑ M ( Xk ) = ∑ M ( X ) = M ( X ) = p ;
 n k =1  n k =1 n k =1

( )
D2 X = M X ( ) −[M ( X )]
2 2

( ) 1 n  1 p − p2
n n
1
D2 X = D2  ∑ X k  = 2
 n k =1  n
∑ D2 ( X k ) =
k =1 n2
∑ D2 ( X ) =
k =1 n

M X( ) = p −n p
2
2
+ p2 =
p − p 2 + p 2n
n
.

Obţinem:
n p − p 2 + p 2n 1
M (V ) = ⋅ − ⋅ p = p2
n −1 n n −1
adică, V este un estimator nedeplasat al parametrului p2.

4. Fie caracteristica X ce urmează legea lui Poisson, cu parametrul


λ > 0 necunoscut. Se consideră o selecţie repetată de volum n. Se cere:

a) estimatorul λ de verosimilitate maximă pentru parametrul λ ;

b) să se arate că λ este estimator absolut corect pentru λ ;

c) să se arate că λ este estimator eficient pentru λ .
Rezolvare:
a) Ţinând seama că variabila aleatoare X are repartiţia Poisson cu

λx
M ( X ) = D 2 ( X ) = λ şi f ( x; λ) = e −λ , avem:
x!
194 Elemente de teoria probabilităţilor şi statistică matematică

ln f ( x; λ) = −λ + x ln λ − ln x! iar

∂ ln f ( x; λ) x
= −1 + .
∂λ λ
∂ ln V n
∂ ln f ( X k ; λ ) n
 X 
=∑ = ∑ −1 + k  .
∂λ k =1 ∂λ k =1  λ 
Ecuaţia de verosimilitate maximă devine
n
 Xk 
∑  − 1 +
k =1 λ 
 = 0 , iar estimatorul de verosimilitate maximă pentru

parametrul λ este λ* = X .
b) Calculăm:
1 n  1 n 1 n n
M ( X ) = M  ∑ X j  = ∑ M ( X j ) = ∑ M ( X ) = ⋅ λ = λ
 n j =1  n j =1 n j =1 n

1 n  1 n
1 n
n λ
D 2 ( X ) = D 2  ∑ X j  = 2 ∑ D2 (X j ) = ∑D 2
(X ) = ⋅λ = → 0
 n j =1  n j =1 n2 j =1 n 2
n

când n → ∞ şi deci media de selecţie este un estimator absolut corect al lui


λ .
c) Avem:
 ∂ ln f ( X ; λ) 2   X X2  2 1
M    = M 1 − 2 + 2  = 1 − M ( X ) + 2 M ( X 2 ) =
 ∂λ    λ λ  λ λ
2 1
= 1 − ⋅ λ + 2 (λ2 + λ)
λ λ
 ∂ ln f ( X ; λ) 2  n
Rezultă cantitatea de informaţie I ( λ) = nM   =

 ∂λ   λ

1
Întrucât egalitatea D ( X ) =
2
este verificată, rezultă că X
I (λ)

este un estimator eficient al lui λ .


Statistică matematică 195

5. Relativ la populaţia C, se cercetează caracteristica X ce urmează


legea normală N(m,σ ), cu media teoretică m = M(X) necunoscută şi
dispersia σ 2=0,06. Să se determine intervalul de încredere pentru m, cu
probabilitatea de încredere 1-α = 0,9 dacă se cunosc datele de selecţie:
10.5; 10.8; 11.2; 10.9; 10.4; 10.6; 10.9; 11.0; 10.3; 10.8; 10.6; 11.3;
10.5; 10.7; 10.8; 10.9; 10.8; 10.7; 10.9; 11.0.
Rezolvare:
Pentru caracteristica X avem următoarea distribuţie empirică de
selecţie:

10 ,3 10 ,4 10 ,5 10 ,6 10 ,7 10 ,8 10 ,9 11 11 ,2 11 ,3
X : 
 1 1 2 2 2 4 4 2 1 1 

Folosind aplicaţia 1., intervalul de încredere pentru media teoretică


σ σ
m este ( m1 , m 2 ) , unde m 1 = x − z α şi m 2 = x + z α ;
n 1−
2 n 1−
2

z 1 −α 1 −α
1−
α
se determină astfel încât Φ( z1−α ) = , = 0,450 , folosind
2
2
2 2

tabelele cu valorile funcţiei Laplace, ⇒ z1−α = 1,65 .


2

1
x = (10 ,3 +10 ,4 + 2 ⋅10 ,5 + 2 ⋅10 ,6 + 2 ⋅10 ,7 + 4 ⋅10 ,8 + 4 ⋅10 ,9 + 2 ⋅11 +11,2
20
+11,3) =10 ,78

0,06
Rezultă m1 =10 ,78 − ⋅1,65 =10 ,75 ,
20

0,06
m2 =10 ,78 + ⋅1,65 =10 ,80 , adică m ∈(10 ,75 ;10 ,80 ) .
20
196 Elemente de teoria probabilităţilor şi statistică matematică

6. Se efectuează 12 măsurători independente asupra caracteristicii X,


rezultatele obţinute dând distribuţia empirică de selecţie
−0.5 −0.4 −0.2 0 0.2 0.6 0.8 1 1.2 1.5 
X: 
 .
 1 2 1 1 1 1 1 1 2 1 
Folosind probabilitatea de încredere 0.95, să se determine intervalul
de încredere pentru valoarea medie teoretică m = M(X).
Rezolvare:
Deoarece abaterea standard σ= D 2 (X) este necunoscută,
conform aplicaţiei 2. intervalul de încredere pentru m este (m1,m2) unde

σ σ
m1 = x − t α şi m2 = x + t α . Pentru n-1=11 şi
n n −1,1−
2 n n −1,1−
2

α
1− = 0,975 din tabelul cu valorile funcţiei de repartiţie a legii Student se
2

determină t n −1,1−α = 2,201 .


2

Folosind distribuţia empirică de selecţie se obţine:


1
x= ( − 0,5 + 2 ⋅ (−0,4) + (−0,2) + 0,2 + 0,6 + 0,8 +1 + 2 ⋅1,2 +1,5) = 0,4 iar
12

1 10
σ= ∑
11 k =1
f k ( xk − x) 2 = 0,719

0,719
Obţinem: m1 = 0,4 − ⋅ 2,201 = −0,05 ;
12

0,719
m2 = 0,4 + ⋅ 2,201 = 0,85 adică m ∈(−0,05 ;0,85 ) .
12

7. Caracteristicile X1 şi X2 relative la două populaţii independente,


urmează fiecare legea normală, respectiv N(m1,σ 1) şi N(m2, σ 2), unde σ 1=
Statistică matematică 197

0.005 şi σ 2=0.0045. Relativ la aceste caracteristici s-au obţinut următoarele


date de selecţie:
X1 : 0.240; 0.240; 0.235; 0.250; 0.235;
X2 : 0.220; 0.225; 0.220; 0.225; 0.235.
Folosind probabilitatea de încredere 0.98 să se determine intervalul
de încredere pentru diferenţa m1- m2.
Rezolvare:
Conform aplicaţiei 3. a) intervalul de încredere pentru m1-m2 este
(A,B) unde

(
A = x1 − x 2 − z ) 1−
α
σ 12 σ 22
+
n1 n 2
(
şi B = x 1 − x 2 + z α
1−
) σ 12 σ 22
+
n1 n 2
2 2

z   1 −α
iar 1−
α
se determină a.î. Φ z1−α  = = 0,49 .
2
 2  2

Folosind tabelul cu valorile funcţiei lui Laplace obţinem

z = 2,33
1−
α
.
2

Valorile mediilor de selecţie pentru cele două caracteristici sunt:


1
x1 = ( 0,235 ⋅ 2 + 0,240 ⋅ 2 + 0,250 ) = 0,240
5
1
x2 = ( 0,220 ⋅ 2 + 0,225 ⋅ 2 + 0,235 ) = 0,225
5
Deci :
A =0,015 −2,33 0,000005 +0,00000405 =0,008
B =0,015 +2,33 0,000005 +0,00000405 =0,022

⇒ m1 − m2 ∈(0,008 ;0,022 )

8. Cu datele problemei precedente, dar cu σ 1 = σ 2 = σ necunoscut,


să se determine intervalul de încredere pentru diferenţa m1- m2.
198 Elemente de teoria probabilităţilor şi statistică matematică

Rezolvare:
Conform aplicaţiei 3. b) intervalul de încredere pentru m1-m2 este

(A,B) unde A = x1 − x 2 − t α ⋅S şi B = x1 − x 2 − t α ⋅S dacă


n ,1− n ,1−
2 2

1 1
+
S=
n1 n 2
n 1 +n 2 −2
[
( n 1 − 1) σ1 + ( n 2 − 1) σ 2
2 2
] iar
t
n ,1−
α
2
se determină a.î.

 
Fn  t  =1 − α .
 n ,1 − 
α
2
 2 

α
Pentru 1 − = 0,99 şi n=8 obţinem t n ,1−α = 2,896 .
2 2

Avem x1 = 0,240 , x 2 = 0,225 şi calculăm:

σ1 =
2 1 5
4 k =1
(
∑ x1k − x1 ) 2
= 0,0000375

σ2 =
2 1 5
4 k =1
(
∑ x2 k − x 2 ) 2
= 0,0000375

1 1
+
S = 5 5 ( 4 ⋅ 0,0000375 + 4 ⋅ 0,0000375 ) = 0,0038
8
Re zult ă :
A = 0,015 − 2,896 ⋅ 0,0038 = 0,004
B = 0,015 + 2,896 ⋅ 0,0038 = 0,026
⇒ m1 − m2 ∈ (0,004 ;0,026 )

9. Caracteristica X urmează legea normală N(m, σ ). Se consideră o


selecţie repetată de volum n = 15 relativă la X cu datele de selecţie:
23,1; 22,8; 22,9; 23,0; 22,7; 22,9; 23,2; 22,9; 23,3; 23,2; 23,0; 22,9;
23,1; 23,2; 22,9.
Statistică matematică 199

Să se determine intervalul de încredere pentru dispersia σ 2 = D2(X)


şi pentru abaterea standard σ , folosind probabilitatea de încredere 0,9.
Rezolvare:
Conform aplicaţiei 4. intervalul de încredere pentru σ2 este

(n − 1)σ 2 (n − 1)σ 2
(σ ) h2 2
2
,σ 2 σ
unde 1
2
= 2 şi σ 2
2 = 2 iar α şi h α se
1 2 h α h α n −1,1−
2
n −1,
2
n −1,1− n −1,
2 2

determină folosind tabelele de valori pentru funcţia de repartiţie a legii χ2


cu n-1 grade de libertate.
Avem: h14 ;0 ,995 = 29 ,14 şi h14 ;0, 005 = 4,07
2 2

22 ,7 22 ,8 22 ,9 23 23 ,1 23 ,2 23 ,3 
X :
 1 
 1 5 2 2 3 1  
1
x= ( 22 ,7 + 22,8 + 5 ⋅ 22 ,9 + 2 ⋅ 23 + 2 ⋅ 23,1 + 3 ⋅ 23,2 + 23,3) = 23
15
1 15
σ = ∑( xk − x) 2 =0,00029
2

14 k =1
14 ⋅ 0,00029
Rezultă: σ12 = = 0,00013 şi
29 ,14

14 ⋅ 0,00029
σ22 = = 0,00099
4,07

⇒σ 2 ∈(0,00013 ;0,00099 ) şi σ ∈(0,011 ;0,031 ) .

10. Caracteristica X reprezintă media obţinută de un student care a


promovat anul întâi de studii. Să se verifice, cu nivelul de semnificaţie α =
0,05, ipoteza că media teoretică m = M(X) = 7,25, dacă se consideră σ = 1,5
şi s-a făcut un sondaj de volum n = 42, pentru care s-au obţinut datele de
selecţie
Media 5 - 5,99 6 – 6,99 7 – 7,99 8 – 8,99 9 – 10
200 Elemente de teoria probabilităţilor şi statistică matematică

Frecvenţa 5 8 18 6 5
Rezolvare:
Deoarece n=42>30 şi σ =1,5 este cunoscut, folosim testul Z pentru
verificarea ipotezei nule H0:m=7,25 cu alternativa H 1 : m ≠ 7,25 .
Distribuţia empirică de selecţie este:
5,5 6,5 7,5 8,5 9,5 
X :
 5 
 8 18 6 5 

Pentru α=0,05 folosind testul Z se determină z1−α = z0,975 a.î.


2

1 −α
Φ( z0 ,975 ) = = 0,475 . Se obţine z0,975=1,96, care ne dă intervalul numeric
2

X−m
(-1,96;1,9 6) pentru statistica Z = σ . Calculăm
n
1
x= ( 5 ⋅ 5,5 + 8 ⋅ 6,5 + 18 ⋅ 7,5 + 6 ⋅ 8,5 + 5 ⋅ 9,5) = 7,45
42

x − m 7,45 − 7,25
z= = = 0,86
σ 1,5 .
n 42
Deoarece z = 0,86 ∈( −1,96 ;1,96 ) ipoteza se acceptă.
11. Caracteristica X reprezintă rezistenţa la rupere a cablurilor
produse de o anumită fabrică. Considerând că X urmează legea de
probabilitate normală N(m, σ ), să se verifice, folosind nivelul de
semnificaţie α = 0,05, ipoteza că media teoretică a rezistenţei la rupere a
cablurilor este de 400 kg, dacă se dispune de o selecţie de volum n = 10, cu
următoarele date de selecţie: 401; 403; 398; 398; 400,5; 399; 396; 401,5;
400,5; 398,5.
Rezolvare:
Statistică matematică 201

Ipoteza nulă ce se face este H0:m=400, cu alternativa H1 : m ≠ 400 .


Deoarece σ este necunoscută, folosind testul T, cu α=0,05 şi
tabelele

t   α
de valori se determină n −1,1−
α
a.î. Fn −1  
 t n −1,1−α  =1 − = 0,975 . Se
2
 2  2

obţine t9;0,975 =2,262. Prin urmare intervalul numeric pentru statistica

X −m
T=
σ este (-2,262; 2,262).
n
1
Calculăm x = (396 + 2 ⋅ 398 + 398 ,5 + 399 + ...) = 400 ,2
10

1 10 x − m0 400,2 − 400
t= = = 0,107

2
σ = ( xk − x) 2 = 5,86 σ 5,86
9 k =1
n 10
Întrucât 0,107 ∈(−2,262 ;2,262 ) , ipoteza că media de rezistenţă la
rupere a cablurilor este de 400 se acceptă.
12. Două maşini produc piese de acelaşi tip. Fie X1 dimensiunea
pieselor produse de prima maşină, respectiv X2 să fie dimensiunea pieselor
produse de a doua maşină, fiecare urmând legea normală, respectiv
N(m1,0,02) şi N(m2,0,15). Să se verifice, folosind nivelul de semnificaţie α =
0,05, ipoteza că mediile dimensiunilor pieselor (în mm) produse de cele două
maşini sunt egale, cu alternativa că ele diferă, dacă se dispune de selecţiile,
care au ca distribuţii empirice de selecţie, respectiv
4.90 4.95 5.00 5.05 
X1 : 
 11  şi X2 :
 16 19 14 

4.90 4.95 5.00 5.10 



 6 .
 8 14 7 
202 Elemente de teoria probabilităţilor şi statistică matematică

Rezolvare:
Verificarea ipotezei nule H0:m1=m2 cu alternativa H1 : m1 ≠ m 2 , se
va face cu testul Z.
Folosind nivelul de semnificaţie α = 0,05 se determină din tabele

  1 −α
valoarea z1−α = z0, 975 a.î. Φ z1−α  = = 0,475 . Se obţine z0,975 =1,96
2
 2  2

, care ne dă intervalul (-1,96; 1,96) pentru statistica

σ12 σ 22
Z = [(X1 − X 2 ) − (m1 − m 2 )] + .
n1 n 2

Calculăm:
1
x1 = (11 ⋅ 4,90 +16 ⋅ 4,95 +19 ⋅ 5 +14 ⋅ 5,05 ) = 4,98
60
1
x2 = (6 ⋅ 4,90 + 8 ⋅ 4,95 +14 ⋅ 5 + 7 ⋅ 5,10 ) = 4,99
35

σ 12 σ 22 0,0004 0,0225
z = ( x1 − x 2 ) + = (4,98 − 4,99) + = −0,0025
n1 n2 60 35

Deoarece z = −0,0025 ∈(−1,96 ;1,96 ) , rezultă că mediile dimensiunilor


pieselor nu diferă semnificativ pentru cele două maşini.
13. Două maşini produc acelaşi tip de articol. Se efectuează două
selecţii de volume n1=12 şi n2=15 şi se măsoară dimensiunea produselor,
datele de selecţie sunt trecute în tabelul următor
x1k 3,5 3,6 3,7 3,8 x2k 3,4 3,6 3,8
f1k 3 4 2 3 f2k 2 4 9
Considerând nivelul de semnificaţie α = 0,01, să se verifice ipoteza
că mediile dimensiunilor articolelor produse de cele două maşini nu diferă
semnificativ, ştiind că dispersiile teoretice pentru cele două caracteristici
coincid.
Statistică matematică 203

Rezolvare:
Caracteristicile X1 şi X2, ce reprezintă dimensiunile articolelor
produse de cele două maşini, se consideră că urmează fiecare legea normală,
respectiv N ( m1 , σ) şi N(m 2 , σ) , cu abaterea standard σ > 0 necunoscută.
Verificarea ipotezei nule H 0 : m1 = m 2 cu alternativa H1 : m1 ≠ m 2 ,
se va face cu testul T, deoarece abaterea standard σ este necunoscută.
Folosind nivelul de semnificaţie α = 0,01 , se determină folosind tabelele,

t   α
valoarea n ,1−
α
, a.î. Fn  
 t n ,1−α  =1 − 2 , unde n=n1+n2-2.
2
 2 

Adică se obţine t 25 ;0,995 = 2,787 , intervalul (-2,787;2, 787)

(X1 − X 2 ) − (m1 − m 2 ) n1 + n 2 − 2
T=
pentru statistica 2 2 1 1 care urmează
(n 1 − 1)σ 1 + (n 2 − 1)σ 2 +
n1 n 2

legea Student cu n grade de libertate.


Calculăm:
1
x1 = (3 ⋅ 3,5 + 4 ⋅ 3,6 + 2 ⋅ 3,7 + 3 ⋅ 3,8) = 3,64
12
1
x2 = (2 ⋅ 3,4 + 4 ⋅ 3,6 + 9 ⋅ 3,8) = 3,69
15

σ1 =
2 1 n1

n1 − 1 k =1
( 2
)
x1k − x1 = 0,0135

σ2 =
2 1 n2
n2 − 1 k =1
(
∑ x2 k − x 2 ) 2
= 0,0221
204 Elemente de teoria probabilităţilor şi statistică matematică

( x1 − x 2 ) n1 + n2 − 2
t= =
2 2 1 1
( n1 −1)σ 1 + ( n2 −1)σ 2 +
n1 n2
3,64 − 3,69 25
= = −0,954
11 ⋅ 0,0135 + 14 ⋅ 0,0221 1 1
+
12 15
Deoarece t = −0,954 ∈(−2,787 ;2,787 ) , rezultă că mediile articolelor
produse de cele două maşini nu diferă semnificativ.
14. Se cercetează caracteristica X ce reprezintă diametrul pieselor
produse de o maşină (în mm). Ştiind că X urmează legea normală N(m,σ ) şi
având o selecţie de volum n = 11, care ne dă distribuţia empirică de

10 ,50 10 ,55 10 ,60 10 ,65 


selecţie X : 
 2 ,
 3 5 1  

să se verifice ipoteza nulă H0 : σ 2 = 0,003, cu alternativa H1 : σ 2 ≠ 0,003, cu


nivelul de semnificaţie α = 0,01.
Rezolvare:
Se utilizează testul χ2 . La nivelul de semnificaţie α = 0,01 ; se

2
 2 
h  pentru statistica H = (n − 12)σ ,
2
determină intervalul  n −1; α; h n −1;1−α ,
 2 2  σ
care urmează legea χ2 cu n-1 grade de libertate; folosind tabelele de valori

din F10 ( h102 ; 0, 005 ) = 0,005 ⇒ h102 ;0, 005 = 2,16 şi

F10 ( h102 ; 0,995 ) = 0,995 ⇒ h102 ; 0,995 = 23,21

Deci, intervalul pentru statistica H 2 este (2,16; 23,21).


Calculăm
1
x= [ 2 ⋅10 ,5 + 3 ⋅10 ,55 + 5 ⋅10 ,6 +1 ⋅10 ,65 ] =10 ,57
11
Statistică matematică 205

( )
2
1 n ( n −1)σ 10 ⋅ 0,0021
∑ k
2 2
σ = x − x = 0,0021 ; h 2
= = = 7,3 .
n − 1 k =1 σ02
0,003

Deoarece h 2 = 7,3 ∈(2,16 ;23 ,21 ) , ipoteza nulă făcută relativ la


dispersia teoretică este acceptată.
15. Se cercetează aceeaşi caracteristică pentru două populaţii
independente, care este respectiv X1 pentru prima populaţie şi X2 pentru a
doua, fiecare urmând legea normală N(m1, σ 1) şi N(m2, σ 2). Se
consideră selecţiile de volume n1=10 şi n2=12, care ne dau distribuţiile
empirice de selecţie:
1,7 1,8 1,85 1,9 2
X1 : 
2  şi X2 :
 2 4 1 1

1,75 1,8 1,85 1,9 2 2,1



 1 .
 2 4 2 2 1 

Considerând nivelul de semnificaţie α = 0,02, să se compare


dispersiile celor două populaţii.
Rezolvare:
 
Se utilizează testul F. Se determină intervalul f 
 m , n ; α; f m , n ;1−α
 2 2 

  α
pentru statistica F folosind tabelele de valori, a.î. Fm ,n  
f m , n ; α  = şi
 2  2

  α
Fm , n  
f m , n ;1−α  =1 − 2 , m = n1-1 , n = n2 –1.
 2 

f 9,11 ; 0,99 =4,63 deoarece F9,11 (4,63 ) =0,99


1 1
f 9 ,11 ; 0 , 01 = = = 0,19 . Rezultă intervalul (0,19; 4,63)
f11 , 9; 0 ,99 5,18

Calculăm:
206 Elemente de teoria probabilităţilor şi statistică matematică

1
x1 = ( 2 ⋅1,7 + 2 ⋅1,8 + 4 ⋅1,9 + 1 ⋅1,9 + 1 ⋅ 2) = 1,83;
10
1
x2 = (1 ⋅1,75 + 2 ⋅ 1,8 + 4 ⋅ 1,85 + 2 ⋅1,9 + 2 ⋅ 2 + 1 ⋅ 2,1) = 1,88
12

σ1 =
2 1 n1

n1 − 1 k =1
( 2
)
x1k − x1 = 0,0078 ;

σ2 =
2 1 n2
n2 − 1 k =1
(
∑ x2 k − x 2 ) 2
= 0,0101

2
σ1 0,0078
f = 2
= = 0,77 .
σ 2
0,0101

Deoarece f = 0,77 ∈(0,19 ;4,63 ), rezultă că ipoteza făcută privind


egalitatea dispersiilor, este admisă.
16. Pentru a cerceta dacă durata de ardere a două loturi de becuri
este aceeaşi s-a luat câte un eşantion de 15 de becuri din fiecare lot, care au
fost încercate în privinţa caracteristici studiate şi s-au obţinut următoarele
rezultate:
1070; 1110; 1050; 1090; 1140; 1130; 1240; 1010; 1030; 1110; 1100; 1160;
1100; 1060; 1020;
ore de ardere pentru eşantionul din primul lot şi respectiv
1100; 1170; 990; 1180; 1140; 1130; 1110; 1090; 1100; 1130; 1220; 1030;
1010; 1130; 1110;
ore de ardere pentru eşantionul din al doilea lot.
a) folosind nivelul de semnificaţie α = 0,02, să se verifice dacă
dispersiile pentru cele două loturi nu diferă semnificativ;
b) folosind nivelul de semnificaţie α = 0,05 şi rezultatul de la
punctul precedent, să se verifice dacă duratele medii de ardere pentru cele
două loturi sunt aceleaşi.
Statistică matematică 207

Rezolvare:
a) Se utilizează testul F. Se determină intervalul

 
f  pentru statistica F folosind tabelele de valori, a.î.
 m , n ; α; f m , n ;1−α
 2 2 

  α   α
Fm , n    
f m , n ; α  = 2 şi Fm , n f m , n ;1−α  =1 − 2 , m = n1-1 , n = n2 –1.
 2   2 

f14 ,14 ; 0 , 99 =3,70 deoarece F14 ,14 (3,70 ) =0,99


1 1
f14 ,14 ; 0 , 01 = = = 0,27 . Rezultă intervalul (0,27;
f14 ,14 ; 0 ,99 3,70

3,70)
Calculăm:
1
x1 = (1070 + 1110 + 1050 + 1090 + ...) = 1095 ;
15
1
x2 = (1100 + 1170 + 990 + 1180 + ...) = 1110
15

2
σ =
1
1 n1

n1 − 1 k =1
2
(
x1k − x1 = 3569,64 ; )
2
σ =
2
1 n2
∑ x2 k − x 2
n2 − 1 k =1
( ) 2
= 3864,28

2
σ1 3569 ,64
f = 2
= = 0,92 .
σ 2
3864 ,28

Deoarece f = 0,92 ∈(0,27 ;3,70 ), rezultă că ipoteza făcută privind


egalitatea dispersiilor, este admisă.
b) Caracteristicile X1 şi X2, ce reprezintă duratele medii de ardere
pentru cele două loturi, se consideră că urmează fiecare legea normală,
respectiv N ( m1 , σ) şi N(m 2 , σ) , cu abaterea standard σ > 0 necunoscută.
208 Elemente de teoria probabilităţilor şi statistică matematică

Verificarea ipotezei nule H 0 : m1 = m 2 cu alternativa H1 : m1 ≠ m 2 ,


se va face cu testul T, deoarece abaterea standard σ este necunoscută.
Folosind nivelul de semnificaţie α = 0,05 , se determină folosind tabelele,

t   α
valoarea n ,1−
α
, a.î. Fn  
 t n ,1−α  =1 − 2 , unde n=n1+n2-2.
2
 2 

Adică se obţine t 28 ; 0 ,975 = 2,048 , intervalul (-2,048;2, 048)

(X1 − X 2 ) − (m1 − m 2 ) n1 + n 2 − 2
T=
pentru statistica 2 2 1 1 care urmează
(n 1 − 1)σ 1 + (n 2 − 1)σ 2 +
n1 n 2

legea Student cu n grade de libertate.


Calculăm:
( x1 − x 2 ) n1 + n2 − 2
t= =
2 2 1 1
(n1 −1)σ 1 + (n2 −1)σ 2 +
n1 n2
1095 −1110 28
= = −0,673
14 ⋅ 3569 ,64 + 14 ⋅ 3864 ,28 1 1
+
15 15
Deoarece t = −0,673 ∈(−2,048 ;2,048 ) , rezultă că duratele medii de
ardere pentru cele două loturi nu diferă semnificativ.
17. Se consideră caracteristica X ce reprezintă greutatea în grame a
unor cutii încărcate automat de un dispozitiv. Pentru verificarea normalităţii
lui X, se consideră o selecţie de volum n = 100, datele de selecţie fiind
următoarele:
Greutatea 47 – 48 48 – 49 49 – 50 50 – 51 51 – 52 52 – 53
Frecvenţa 12 18 22 21 19 8
Se cere:
Statistică matematică 209

a) aplicarea testului χ 2, cu nivelul de semnificaţie α = 0,05, pentru


verificarea normalităţii lui X;
b) aplicarea testului lui Kolmogorov, cu nivelul de semnificaţie α =
0,05, pentru verificarea normalităţii lui X.
Rezolvare:
Se cunoaşte că estimările de verosimilitate maximă pentru m şi σ
sunt respectiv m * = x , σ* = µ2 .
Distribuţia empirică de selecţie pentru caracteristica X este
47 ,5 48 ,5 49 ,5 50 ,5 51,5 52 ,5 
X :
 12 
 18 22 21 19 8  
Calculăm
1
m* = x = (12 ⋅ 47 ,5 +18 ⋅ 48 ,5 + ... + 8 ⋅ 52 ,5) = 49 ,9
100

σ * = µ2 =
1 6

100 k =1
(
f k xkţ − x ) 2
= 1,47

a) se consideră valoarea numerică


N
(f i − n p *i ) 2
h =∑
2
, unde N =6,
i =1 n p *i

 ai − m*   ai −1 − m* 
p = Φ
*
 − Φ a ; s = 2; k = 6 − 2 − 1 = 3
 σ σ * 
i *
 

Se determină intervalul (0, h k ,1−α ), pentru statistica H 2 , folosind


2

tabelele de valori şi se obţine h3;0, 95 = 7,81 adică intervalul (0;7,81).


2

Calculele pentru h 2 se fac în tabelul:

ai − m*  a − m*  (f i − n p *i ) 2
ai fi Φ  i *  p *
np *

 σ
i i
σ*  n p *i
48 12 -1,29 -0,4015 0,0985 9,85 0,4692
210 Elemente de teoria probabilităţilor şi statistică matematică

49 18 -0,61 -0,2291 0,1724 17,24 0,0335


50 22 0,07 0,0279 0,2570 25,70 0,5326
51 21 0,75 0,2734 0,2455 24,55 0,5133
52 19 1,42 0,4222 0,1488 14,88 1,1407
53 8 2,11 0,4826 0,0604 6,04 0,6360
n=100 h 2 = 3,3253

Valorile funcţiei lui Laplace Φ se iau din tabele şi se are în vedere


că Φ( −x ) = −Φ( x ) şi
 a1 − m*   a0 − m* 
p = Φ
*
 − Φ  = Φ(−1,29) − Φ(−∞ ) =
 σ  σ
1 * *
 
= −0,4015 + 0,5 = 0,0985

Deoarece h 2 = 3,3253 ∈(0;7,81 ), rezultă că se acceptă ipoteza


normalităţii lui X.
b) Pentru α = 0,05 , folosind tabelele de valori, se determină
x 1−α = x 0 ,95 a.î. K ( x 1−α ) = 1 − α, adică x 0,95 =1,36 .
Ipoteza că X urmează legea normală N( m * , σ* ) , cu m * şi σ*

calculaţi anterior, este acceptată dacă n d n < x 1−α , unde

d n = max F n (a i ) −F(a i ) .
i =1, N

Aici F n ( x ) este funcţia de repartiţie de selecţie, iar F(x) este


funcţia de repartiţie pentru legea normală N( m * , σ* ). Calculele pentru
determinarea lui dn sunt date în tabelul următor:
i
a i − m*
ai fi ∑f j Fn (a i ) F(ai) F n (a i ) −F(a i )
j=1 σ*
48 12 12 0,12 -1,29 0,0985 0,0215
49 18 30 0,30 -0,61 0,2709 0,0291
50 22 52 0,52 0,07 0,5279 0,0079
Statistică matematică 211

51 21 73 0,73 0,75 0,7734 0,0434


52 19 91 0,91 1,42 0,9222 0,0122
53 8 100 1,00 2,11 0,9826 0,0174
dn= 0,0434
Deoarece n d n = 100 ⋅ 0,0434 = 0,434 <1,36 , acceptăm ipoteza

că X urmează legea normală N (m * , σ* ).

4.6. Probleme propuse


1. Pentru a cerceta prezenţa studenţilor la un anumit curs s-a ales un
eşantion de n studenţi şi s-a înregistrat numărul absenţelor acestora la patru
cursuri consecutive.
Nr. studenţi xi 50 20 15 8 7
Nr. absenţe ni 0 1 2 3 4
a) Să se scrie distribuţia empirică de selecţie şi funcţia de repartiţie de
selecţie.
b) Să se calculeze media de selecţie, momentul centrat de selecţie de
ordinul doi şi dispersia de selecţie.
c) Să se calculeze F 100 ( 4 ) .
2. Fie caracteristica X ce urmează legea uniformă pe [0,θ] , cu
parametrul θ > 0 necunoscut. Se consideră o selecţie repetată de volum n.
a) Determinaţi estimatorul θ* de verosimilitate maximă al
parametrului θ .
b) Arătaţi că θ* este un estimator nedeplasat.
c) Este θ* un estimator efficient?
3. Urmărind sosirile la serviciu la o anumită instituţie unde programul
începe la ora 7, s-au cercetat la întâmplare 100 de fişe de pontaj automat şi s-
au constatat următoarele sosiri:
Ora sosirii (xi) 6,45 6,50 6,55 7 7,05 7,10 7,15
212 Elemente de teoria probabilităţilor şi statistică matematică

Nr.pers. (ni) 9 13 18 30 16 10 4
a) Scrieţi rezultatele sondajului ca pe o caracteristică aleatoare
reprezentând momentul sosirii la serviciu;
b) Scrieţi funcţia de repartiţie de selecţie F 100 ( x ) şi trasaţi-i
graficul;
c) Calculaţi media de selecţie x şi dispersia de selecţie σ2 ;
d) Luând la întâmplare o fişă de pontaj, cu ce probabilitate salariatul
va sosi înainte de ora 7.
4. Fie X o caracteristică ce urmează legea beta de parametrii p,q > 0
necunoscuţi. Să se estimeze parametrii p şi q folosind metoda momentelor, pe
baza datelor de selecţie x1 , x2 ,..., xn .
5. Într-o fabrică de ţesături s-a constatat că rezistenţa la rupere a unui
anumit fir textil este repartizată normal cu media m necunoscută şi dispersia
σ 2 = 625 . O selecţie de volum 25 dă o medie de selecţie x =180 .
Determinaţi un interval de încredere pentru media m cu
probabilitatea de încredere:
a) α = 0,90 ;
b) α = 0,95 ;
c) α = 0,98 .

6. Dintr-o populaţie repartizată normal cu dispersia necunoscută se


2
face o selecţie de volum 25 obţinându-se x =20 ,5 şi σ =6,25 . Să se scrie
un interval de încredere pentru parametrul m cu o probabilitate de încredere:
a) α = 0,95 ;
b) α = 0,98 .
7. Dintr-o populaţie normal repartizată se face o selecţie de volum
16 găsindu-se xi : 2,8; 2,8; 2,8; 3; 3; 3; 3,4; 3,2; 3; 3; 2,9; 2,9; 2,8; 3,4; 3; 3.
Statistică matematică 213

Scrieţi intervalele de încredere corespunzătoare pentru media m şi respectiv


pentru dispersia σ 2 cu o probabilitate de încredere α = 0,98 .
8. Un producător de automobile trebuie să aleagă între două tipuri de
pneuri A şi B. Pentru a decide, face un studiu privind rezistenţa acestora la
uzură. Numărul de kilometri parcurşi cu pneuri de tip A, respectiv b, până la
uzură este o variabilă aleatoare X, respectiv Y, normală de parametri
( m A , σ A ) , respectiv ( mB , σ B ) .
Construiţi un interval de încredere pentru mA – mB, ştiind că:
σ A = 2000 km , σ B = 5000 km , x = 20000 km , y =25000 km , nA = 9, nB =
21, 1 −α = 0,95 .
9. Pentru a testa viteza cu care este absorbit pe piaţă un produs nou,
firma producătoare pune în vânzare, prin 9 magazine, loturi identice.
Cantităţile se epuizează după un număr de zile variabil după cum urmează:
Magazin i 1 2 3 4 5 6 7 8 9
Nr.de zile xi 51 54 49 50 50 48 49 50 49
a) Să se estimeze printr-un interval de încredere 95% viteza cu care
este absorbit produsul pe piaţă (număr mediu de zile).
b) Să se determine un interval de încredere 90% pentru dispersia
numărului de zile X în care se epuizează produsul.
10. Nivelul de calciu în sângele unui adult este în medie 9,5
mgr/decilitru şi σ = 0,4 . O clinică măsoară nivelul calciului la 160 de
pacienţi tineri şi găseşte x =9,3 . Verificaţi ipoteza H 0 : m = 9,5 faţă de
H 1 : m ≠ 9,5 .

11. S-a stabilit experimental că nivelul colesterolului în organismul


unui adult este o variabilă aleatoare normală. O selecţie aleatoare de n = 41
2
adulţi a dat un nivel mediu observat al colesterolului x = 213 cu σ =48 , 4 .
214 Elemente de teoria probabilităţilor şi statistică matematică

Să se testeze ipoteza H0 : m = 200 cu alternativa H1 : m ≠ 200 la un nivel de


semnificaţie α = 0,05 .
12. Măsurători independente ale rezistenţei unor piese alese din două
loturi L1 şi L2 au condus la rezultatele:
Lot L1 0,140 0,138 0,143 0,142 0,138 0,136 0,141
Lot L2 0,137 0,136 0,139 0,143 0,140 0,138 0,139
a) Să se verifice ipoteza H0 : m1 = m2 faţă de H1 : m1 ≠ m2 la nivelul
de semnificaţie α = 0,01 ;
b) Să se verifice H 0 : σ 1 = σ 2 faţă de H1 : σ 12 ≠ σ 22 la acelaşi nivel de
2 2

semnificaţie.
Se presupune că rezistenţa este repartizată normal.
13. Se iau eşantioane din apa rezultată din răcirea la o centrală
nucleară. Se consideră că dacă temperatura apei evacuate nu depăşeşte 600C
nu constituie o primejdie pentru mediul înconjurător.
Se aleg 70 eşantioane de apă şi se măsoară temperatura fiecărui
asemenea eşantion. Se obţin rezultatele:
Temperatura în 0C 52 54 58 61 64 65
Frecvenţa 14 21 18 10 5 2
Să se verifice ipoteza H 0 : m = 60 C faţă de H1 : m ≠ 60 C la
0 0

nivelul de semnificaţie α = 0,01 .


14. Precizia în prelucrare a unui strung automat se verifică cu
ajutorul dispersiei dimensiunii controlate a pieselor produse. Dispersia nu
trebuie să depăşească 0,1. O selecţie extrasă la întâmplare de volum n = 25 a
dat rezultatele:
xi 3 3,5 3,8 4,4 4,5
ni 2 6 9 7 1
Statistică matematică 215

Presupunem că xi sunt observaţii asupra unei variabile aleatoare


normale. Să se verifice dacă strungul asigură precizia cerută, la nivelul de
semnificaţie α = 0,025 .
15. În tabelul următor se dau vânzările (în mii de bucăţi) dintr-un
sortiment de marfă în 6 oraşe din România
Oraşul Bucureşti Braşov Iaşi Timişoara Cluj Constanţa
Vânzările 140 120 130 160 140 130
Să se verifice că vânzările din acest sortiment reprezintă o
caracteristică repartizată uniform, folosind testul χ 2, cu nivelul de
semnificaţie α = 0,05.
16. Se ţin sub observaţie n = 100 motoare electrice. Se consideră
caracteristica X, ce reprezintă numărul miilor de ore de funcţionare.
Durata 0–30 30–60 60–90 90–20 120–150 150–180 180–300
Frecvenţa 11 17 21 20 18 7 6
Să se cerceteze exponenţialitatea caracteristicii X, folosind testul lui
Kolmogorov, cu nivelul de semnificaţie α = 0,05.