Documente Academic
Documente Profesional
Documente Cultură
STATISTICĂ MATEMATICĂ
1 n 1 n
definită prin X = ∑
n k =1
X k , iar valoarea numerică x = ∑ x k , o numim
n k =1
valoarea mediei de selecţie.
Observaţie 2.1.11.
1) Dacă X urmează legea normală N ( m, σ) atunci media de
σ
selecţie X urmează legea normală N( m, ).
n
Demonstraţie:
Avem ca variabile de selecţie X1, X2, ..., Xn urmează şi ele legea
normală N ( m, σ) . Funcţia caracteristică a variabilei Xk este de forma
t a 2t 2
σ 2t 2 im − 2
imt − n 2n
ϕ X k (t ) = e 2
dar ϕaX (t ) = ϕ X ( at ) atunci ϕ 1 X k (t ) = e
n
t σ 2t 2
n n im − 2 σ 2t 2
n 2n imt −
şi obţinem ϕ (t ) = ϕ n 1 (t ) =
X ∑ Xk
k =1 n
∏ϕ k =1
1
n
Xk (t ) = ∏ e
k =1
=e 2n
σ
adică X urmează legea normală N (m, ).
n
X −m
Z=
σ urmează legea normală N(0,1).
n
Demonstraţie:
n n
Statistica Z = X − m
σ σ
138 Elemente de teoria probabilităţilor şi statistică matematică
σ
legea normală N (m ).
n
n n n
M (Z ) = M (X ) − m= ( m − m) = 0
σ σ σ
X −m n n n σ
D 2 (Z ) = D 2 ( n ) = 2 D 2 ( X − m) = 2 D 2 ( X ) = 2 2 = 1
σ σ σ σ n
adică Z urmează legea N(0,1).
3) Dacă X1, X2 independente urmează legea normală
N (m i , σi ), i = 1,2 atunci statistica
( X 1 − X 2 ) − (m 1 − m 2 )
Z=
σ12 σ 22 urmează legea normală N(0,1).
+
n1 n 2
Demonstraţie:
Funcţiile caracteristice ale mediilor de selecţie X / şi X // sunt
t 2σ / 2 t 2σ // 2
imt / − imt // −
respectiv şi X / şi X // fiind
ϕ X / (t ) = e ϕ X // (t ) = e
/
2n 2 n //
independente rezultă ϕX /
−X // (t ) = ϕ X / (t )ϕ−X // (t ) unde
t 2σ // 2
−itm // −
, iar
ϕ − X // (t ) = ϕ X // (−t ) = e 2 n //
/ //
ϕX /
− X // −( m / −m // ) (t ) = e −it ( m −m ) ϕ X / − X // (t )
Statistică matematică 139
Avem succesiv
t
ϕ Z (t ) = ϕ ( X / − X // )−( m / −m // ) (t ) = ϕ ( X / − X // )−( m/ −m// ) ( )=
σ / 2 σ // 2
+ //
/2 // 2
σ σ
+ //
n/ n n/ n
( m / − m // )
−it
σ / 2 σ // 2
+ // t
=e n/ n
ϕ ( X / − X // ) ( )=
σ / 2 σ // 2
+ //
n/ n
( m / − m // )
−it
σ / 2 σ // 2
+ // t −t
=e n/ n
ϕ X/ ( )ϕ − X // ( )=
σ / 2 σ // 2 σ / 2 σ // 2
+ // + //
n/ n n/ n
( m / − m // ) itm / t 2σ / 2 − itm // t 2σ // 2
−it − /2 // 2
−
σ /2
σ // 2
σ /2
σ // 2 σ σ σ/2
σ // 2 σ / 2 σ // 2 t2
+ // + // 2n/ ( + // ) + // 2 n // ( + // ) −
n/ n/
=e n/ n
e n/ n n
e n/ n n
=e 2
1 n k 1 n k
selecţie σk = ∑ Xi ,
n k =1
iar valoarea numerică σk = ∑ xi
n k =1
o
numim
valoarea momentului de selecţie de ordin k.
Definiţie 2.1.13. Numim moment centrat de selecţie de ordin k
funcţia de selecţie µ k =
1 n
∑ Xi − X
n i =1
( ) iar µk =
1 n
∑ (x i − x) k o numim
n i =1
valoarea momentului centrat de selecţie de ordin k.
Observaţie 2.1.14.
140 Elemente de teoria probabilităţilor şi statistică matematică
nµ 2
statistica H 2 = urmează legea χ2 cu n-1 grade de libertate
σ 2
1 n
∑ (X k − X) 2 se numeşte dispersia
2
2) Funcţia de selecţie σ =
n − 1 k =1
X −m
T=
de selecţie; atunci statisticile din observaţia anterioară devin: σ şi
n
2
( n −1)σ
H =
2
.
σ2
3) Momentul centrat de selecţie µk de ordin k, pentru n mare,
K n (x)
selecţie definită prin Fn ( x ) = , ∀x ∈ R , unde K n ( x ) este numărul
n
valorilor variabilelor de selecţie mai mici decât x.
Teorema lui Glivenko 2.1.16. Dacă se consideră caracteristica X ce
are funcţia de repartiţie teoretică F şi fie funcţia de repartiţie de selecţie Fn ,
∑(−1)
2
x2
lim P( n ⋅ d n < x ) = K ( x ) = k
e −2 k , x > 0.
n →∞
k =−∞
1 20 1 6 1
µ 2 (Y ) = ∑
20 k =1
( y k − y ) 2
= ∑
20 k =1
f k ⋅ ( y'k − y ) 2 =
20
[2 ⋅ (75 − 98,5) 2 + 4 ⋅ (85 − 98,5) 2
1 20 20
σ 2 (Y) = ∑
19 k =1
( y k − y) 2 =
19
⋅ µ 2 (Y) = 192,105 .
σ( Y ) = σ2 ( Y) =13 ,86 .
Statistică matematică 143
λ∗ (X 1 , X 2 ,..., X n )
→
P
λ , iar valoarea numerică λ∗ ( x 1 , x 2 ,..., x n )
se numeşte estimaţie consistentă pentru λ.
144 Elemente de teoria probabilităţilor şi statistică matematică
pentru λ *
(
obţinem P λ* − λ < ε ≥ 1 −) D 2 (λ* )
ε2
, pentru orice ε > 0.
n →∞
( )
lim P λ* − λ < ε = 1 , pentru orice ε > 0, deci λ *
este un estimator
Într-adevăr
1 n k 1 n 1 n 1 n nσ k
M (σ k ) = M ∑ X i = ∑ M ( X i ) = ∑ M ( X ) = ∑ σ k =
k k
=σk ,
n i =1 n i =1 n i =1 n i =1 n
respectiv
1 n 1 n
D 2 (σ k ) = D 2 ∑ X ik = 2 ∑ D 2 ( X ik ) =
n i =1 n i =1
1 n
nD 2 ( X k ) D 2 ( X k )
=
n2
∑D
i =1
2
(X k ) =
n2
=
n
→0,
n → ∞, respectiv
( n − 1) 2 ( n − 1)(n − 3) 2
D 2 (µ 2 ) = 3
µ4 − µ 2 → 0 când n → ∞ şi rezultă că µ2
n n3
este un estimator corect pentru µ2 .
3) Dispersia de selecţie σ2 este estimator absolut corect pentru
dispersia teoretică D 2 ( X ) .
Demonstraţie:
n
Folosind relaţia σ 2 = µ 2 se obţine
n −1
146 Elemente de teoria probabilităţilor şi statistică matematică
n n n n −1 2
M (σ 2 ) = M µ2 = M ( µ2 ) = D (X ) = D2 (X ) ,
n −1 n −1 n −1 n
respectiv
2
n n 2
D 2 (σ 2 ) = D 2 µ2 = D ( µ 2 ) → 0 , când n → ∞ şi deci σ 2 este
n −1 n −1
un estimator absolut corect pentru dispersia teoretică.
Definiţie 2.2.8. Numim cantitate de informaţie relativ la parametrul
λ expresia:
∂ ln f ( x , λ) 2
I( λ) = n ⋅ M .
∂λ
∗ 1
verifică inegalitatea Rao-Cramer D (λ ) ≥
2
.
I(λ)
∗ 1 ∗ [I(λ)] −1
λ se numeşte eficient dacă D (λ ) = , iar raportul e(λ ) = 2 ∗
2
I(λ) D (λ )
1 n 1 n 1 n n
M ( X ) = M ∑ X j = ∑ M ( X j ) = ∑ M ( X ) = ⋅ λ = λ
n j =1 n j =1 n j =1 n
Statistică matematică 147
1 n 1 n
1 n
n λ
D 2 ( X ) = D 2 ∑ X j = 2 ∑ D2 (X j ) = ∑D 2
(X ) = ⋅λ = → 0
n j =1 n j =1 n2 j =1 n 2
n
∂ ln f ( x; λ) 2 n
Rezultă cantitatea de informaţie I (λ) = nM =
∂λ λ
1
Întrucât egalitatea D ( X ) =
2
este verificată rezultă că X este
I (λ)
1 n
X= ∑X k
n k =1
1 n
Prin urmare, valoarea mediei de selecţie x = ∑ x k este o
n k =1
estimaţie absolut corectă pentru media teoretică m.
Se obţine:
1
x= ( 4 ⋅ 3,98 + 3 ⋅ 3,99 + 5 ⋅ 4,00 + 3 ⋅ 4,01 + 3 ⋅ 4,02 = 3,9989.
18
b) Deoarece un estimator corect al dispersiei teoretice D 2 ( X ) este
momentul centrat de selecţie de ordinul doi µ2 , rezultă că o estimaţie
corectă pentru dispersia teoretică este valoarea momentului centrat de selecţie
de ordinul doi, adică:
1 n 1
µ2 = ∑
n k =1
( x k − x ) 2 = [4 ⋅ (3,98 − 3,9989) 2 + 3 ⋅ (3,99 − 3,9989) 2 + 5 ⋅ (4 − 3,9989) 2 +
18
+ 3 ⋅ ( 4,01 − 3,9989 ) 2 + 3 ⋅ (4,02 − 3,9989 ) 2 = 1,877 ⋅10 −4 .
1 π n
n 2
∑ X −m
k =1
este o funcţie de estimaţie absolut corectă pentru
parametrul σ= D 2 (X) .
Rezolvare:
1 π n
1 π n
1 π
M (V ) =
n 2
∑M ( X k − m ) =
k =1 n 2
∑M ( X − m ) = n
k =1 2
nM ( X − m ) =
π
= M ( X − m ) . Deoarece X urmează legea normală N(m, σ ), avem că
2
( x −m ) 2
∞ 1 ∞ −
M( X −m) = ∫ x − m ρ ( x )dx = ∫ x − m ⋅e 2σ 2
dx =
−∞
σ 2π −∞
2σ
t
1 ∞ − 2
σ 2π ∫−∞
σt ⋅ e 2σdt =
2π
t=
π
σ dacă s-a făcut schimbarea de
variabilă
x −m
=t.
σ
π 2
Prin urmare, avem M(V) = ⋅ σ = σ , deci prima condiţie este
2 π
satisfăcută.
Pentru verificarea celei de-a doua condiţii, scriem succesiv:
1 π 2 n 2 π n
π 2
D 2 (V ) = ( ) ∑D ( X k − m ) = 2 ∑D 2
( X −m) = D ( X −m) ⇒
n 2 k =1 2n k =1 2n
150 Elemente de teoria probabilităţilor şi statistică matematică
⇒ lim D 2 (V ) = 0
n →∞
∂V
rezolvând sistemul = 0, i = 1, s , care de regulă se înlocuieşte cu
∂λi
∂ ln V
= 0, i = 1, s numit sistem de verosimilitate maximă.
∂λi
Observaţie 2.2.15.
1) Se arată că un estimator eficient este un estimator de
verosimilitate maximă.
2) Un estimator de verosimilitate maximă este estimator consistent,
iar pentru valori mari ale lui n este o variabilă aleatoare ce urmează legea
normală N( λ, [ I(λ)] −1 ) , unde λ este parametrul estimat.
Statistică matematică 151
∂ ln V n
∂ ln f ( X k ; m, σ ) n
1 ( X k − m) 2 1 n
=∑ = ∑[ − + ] = 3 ∑[−σ 2 + ( X k − m) 2 ]
∂σ k =1 ∂σ k =1 σ σ 3
σ k =1
n 1 n
∑k =1 (X k − m) = 0 m = ∑ Xk = X
∗
n k =1
sau: n ⇒ n .
∑ [ − σ + (X k − m) ] = 0 1
k =1
2 2 σ =
∗
∑ (X k − X) = µ 2
n k =1
2
parametrul
p ∈(0,1) necunoscut. Folosind o selecţie de volum n, se cere:
a) estimatorul p ∗ de verosimilitate maximă pentru p;
152 Elemente de teoria probabilităţilor şi statistică matematică
n
∂ ln f (X k ; p)
maximă ∑k =1 ∂p
= 0 , avem că
1
maximă p ∗ = p ∗ ( X 1 , X 2 ,..., X n ) = X pentru parametrul p.
m
Pentru aceasta avem, în primul rând, că:
1 1 1
M(p ∗ ) = M ( X ) = M ( X) = ⋅ mp = p , iar apoi pentru dispersie se
m m m
poate scrie succesiv:
Statistică matematică 153
n n
1 2 1 1
D 2 ( p∗ ) =
m 2
D (X ) = 2 2
m n
∑ D2 ( X k ) =
k =1 m2n2
∑D
k =1
2
(X ) =
1 D 2 ( X ) mpq pq
= nD 2
( X ) = = 2 = → 0, n → ∞ .
m2n 2 m2n m n mn
n mn
= mp (1 − p) = .
p (1 − p)
2 2
p(1 − p)
∗ 1
Pe de altă parte, am văzut că D (p ) =
2
, deci estimatorul p ∗
I( p)
1 a −1
−
x
x e b , daca x > 0
f ( x; a , b) = Γ(a )b a , unde Γ este funcţia lui
0, daca x ≤ 0
Euler de
∞
speţa a doua, adică Γ(a ) = ∫0 x a −1e −x dx .
Rezultă sistemul:
σ 1 = ab ∗ σ1
2
∗ σ 2−σ1
2
care are soluţia a = ,b = , care
σ 2 = b a (a + 1)
2
σ2−σ1
2
σ1
reprezintă estimatorii pentru parametrii a şi b.
Metoda intervalelor de încredere 2.2.20.
Fie caracteristica X care are funcţia de probabilitate f(x; θ) , unde
θ este parametrul necunoscut. Metoda constă în determinarea a două funcţii
este cu atât mai bun cu cât are lungimea mai mică şi cu cât 1- α este mai
mare.
Aplicaţii 2.2.21.
1. Interval de încredere pentru valoarea medie teoretică dacă
dispersia teoretică este cunoscută.
Se consideră caracteristica X care urmează legea normală N(m, σ )
cu m ∈ R necunoscut şi σ > 0 cunoscut. Vom determina un interval de
încredere pentru m cu o probabilitate de încredere 1- α dată şi cunoscând
datele de selecţie x 1 , x 2 ,..., x n , respectiv variabilele de selecţie
X 1 , X 2 ,..., X n corespunzătoare.
X −m
Zn = 1 n
Considerăm statistica σ , unde X= ∑ X k , care
n k =1
n
t2
1 x −
adică Φ(z 2 ) − Φ( z1 ) = 1 − α , Φ( x ) =
2π
∫
0
e 2
dt este funcţia lui Laplace
şi care are valorile tabelate. Intervalul are lungime minimă când este simetric
z 2 = − z1 = z1− α . 1− α
faţă de origine adică Rezultă că Φ (z 1 − α ) = şi
2 2 2
X −m
− z1 −α < < z1 − α ) = 1 − α
Am obţinut P( 2 σ 2 adică
n
σ σ
P( X − z1 − α < m < X + z1 − α ) = 1- α . Deci intervalul de
n 2 n 2
σ
încredere pentru media teoretică m este ( m 1 , m 2 ) , unde m1 = X − z1 − α
n 2
şi
σ 1 n
m2 = X + z 1 − α , iar X = ∑X k .
n k =1
n 2
X −m
Zn = σ , unde m=M(X) necunoscută, este aproximativ repartizată
n
X −m n
T= 1 1 n
statistica σ , unde X =
n
∑
k =1
X k şi σ =
2
∑
n − 1 k =1
(X k − X ) 2 care
n
n +1
Γ( ) x n +1
2 s2 − 2
n ∫−∞
Fn ( x ) = (1 + ) ds este funcţia de repartiţie a legii
n
nπΓ( )
2
Student cu n grade de libertate şi care are valorile tabelate, iar
α
Fn −1 ( t α ) =1 − , apoi putem scrie
n −1,1−
2
2
X −m
P( −t α < <t α ) =1 − α
n −1,1−
2
σ n −1,1−
2 sau
n
σ σ
P( X − t α <m<X+ t α ) =1− α. Adică, intervalul de
n n −1,1−
2 n n −1,1−
2
σ
încredere pentru m este ( m1 , m 2 ) unde m1 = X − t α şi
n n −1,1−
2
σ
m2 = X + t α .
n n −1,1−
2
relativ la caracteristica X 2 .
158 Elemente de teoria probabilităţilor şi statistică matematică
( X1 − X 2 ) − (m 1 − m 2 )
Z= 1 n1
1 n2
σ1
2
σ
+ 2
2
, unde X1 =
n1
∑ X1k , X 2 =
k =1 n2
∑X
k =1
2k ,
n1 n2
σ1 σ 2 σ1 σ 2
2 2 2 2
P(( X 1 − X 2 ) − z α + < m1 − m2 < ( X 1 − X 2 ) + z α + )
1−
2
n1 n2 1−
2
n1 n2
( X1 − X 2 ) − ( m 1 − m 2 ) n1 + n 2 − 2
T= ⋅
Considerăm statistica 2
(n 1 − 1) σ1 + (n 2 − 1) σ 2
2 1 1 , unde X1
+
n1 n 2
2 2
şi X 2 sunt mediile de selecţie definite anterior, iar σ1 şi σ2 dispersiile de
1 n1 1 n2
selecţie σ1 =
2
∑ 1k 1
n 1 − 1 k =1
( X − X ) 2
şi σ 2
2
= ∑ (X 2 k − X 2 ) 2 , care
n 2 − 1 k =1
( X1 − X 2 ) − ( m 1 − m 2 ) n1 + n 2 − 2
P( − t α < < t α ) = 1− α
adică n ,1−
(n 1 − 1) σ1 + (n 2 − 1) σ 2
2 2 1 1 n ,1− .
2 + 2
n1 n 2
A = ( X1 − X 2 ) − t n ,1−α ⋅ S şi B = ( X1 − X 2 ) + t n ,1−α ⋅ S cu
2 2
1 1
+
2 2 n n2 .
S 2 = [(n 1 − 1) σ1 + (n 2 − 1) σ2 ] ⋅ 1
n1 + n 2 − 2
( n − 1) σ 2 1 n 1 n
statistica H = 2
σ2
unde σ 2
= ∑ k
n − 1 k =1
( X − X ) 2
, iar X = ∑X k ,
n k =1
ce urmează legea χ2 cu n-1 grade de libertate. Pentru probabilitatea de
2 2
P(h 1 < H 2 < h 2 ) = 1 − α .
2
h1 = h 2 2 α
n −1,
α se determină din relaţia Fn −1 ( h 1 ) = şi
2 2
h2 = h2
2
2 α
n −1,1−
α se determină din relaţia Fn −1 (h 2 ) = 1 − , unde
2 2
Fn ( x ) este funcţia de repartiţie a legii χ2 cu n grade de libertate
n t
1 x −1 −
Fn ( x ) =
n
n ∫
0
t 2
e 2
dt
care are valorile tabelate.
2 Γ( )
2
2
160 Elemente de teoria probabilităţilor şi statistică matematică
(n − 1) σ 2
Deci P(h 1 2 < 2
< h 2 ) sau
σ 2
(n − 1) σ 2 ( n − 1) σ 2
P( 2
< σ2 < 2
) = 1 − α , adică s-a obţinut intervalul de
h2 h1
2 ( n − 1) σ 2 2 (n − 1) σ 2
2 2 σ1 = σ =
încredere ( σ1 ,σ 2 ) pentru σ , unde 2
h 2 α şi
2
h2 α ,
n −1,1− n −1,
2 2
1−α 1−α
determină astfel încât Φ(z 1− α ) = 2
,
2
= 0,475 , folosind tabelele cu
2
⇒z = 1,96
valorile funcţiei Laplace, 1−
α
.
2
1
x= (1 ⋅ 22 ,7 + 3 ⋅ 22 ,8 + 7 ⋅ 22 ,9 + 4 ⋅ 23 + 6 ⋅ 23 ,1 + 7 ⋅ 23 , 2 + 5 ⋅ 23 ,3 + 2 ⋅ 23 , 4) = 23 ,077
35
Statistică matematică 161
0,35
Rezultă m1 = 23,077 − ⋅1,96 = 22 ,881 ,
35
0,35
m 2 = 23,077 + ⋅1,96 = 23,273 , adică m ∈( 22 ,881 ; 23 ,273 ) .
35
Exemplul 2.2.24. Pentru recepţionarea unei mărfi ambalată în cutii,
se efectuează un control, prin sondaj, privind greutatea X a unei cutii. Pentru
22 cutii cântărite s-a obţinut distribuţia empirică de selecţie, relativ la
caracteristica X:
2,7 2,8 2,9 3,0 3,1 3,2 3,3
X:
1 .
2 5 3 5 4 2
Folosind probabilitatea de încredere 0,98, să se determine un interval
de încredere pentru valoarea medie a greutăţii cutiilor, presupunând că X
urmează legea normală N ( m, σ) .
Rezolvare:
Deoarece abaterea standard σ= D 2 (X) este necunoscută,
conform aplicaţiei 2. intervalul de încredere pentru m este (m1,m2) unde
σ σ
m1 = x − t α şi m 2 = x + t α . Pentru n-1=21 şi 1 − α = 0,98
n n −1,1−
2 n n −1,1−
2
t = 2,158
n −1,1−
α
.
2
1 7
σ= ∑ f k ( x k − x) 2 = 0,167
21 k =1
162 Elemente de teoria probabilităţilor şi statistică matematică
0,167
Obţinem: m1 = 3,032 − ⋅ 2,518 = 2,942 ;
22
0,167
m 2 = 3,032 + ⋅ 2,518 = 3,122 adică m ∈( 2,942 ;3,122 ) .
22
Exemplul 2.2.25. Masa de carne ambalată în produse de 1000
grame de maşinile M1 şi M2 este o caracteristică X1, ce urmează legea
normală N (m1 , σ1 ) şi respectiv o caracteristică X2 ce urmează legea normală
N(m 2 , σ2 ) . Cântărind 100 de pachete din cele produse de maşina M1 s-a
Rezolvare:
Conform aplicaţiei 3. a) intervalul de încredere pentru m1-m2 este
(A,B) unde
(
A = x1 − x 2 − z ) 1−
α
σ 12 σ 22
+
n1 n 2
( )
şi B = x 1 − x 2 + z α
1−
σ 12 σ 22
+
n1 n 2
iar
2 2
z 1 −α
1−
α
se determină a.î. Φ z1−α = = 0,49 .
2
2 2
z = 2,33
1−
α
.
2
Statistică matematică 163
9 16
A = 5 − 2,33 + = 3,975
100 150
Deci :
9 16
B = 5 + 2,33 + = 3,975
100 150
⇒ m1 − m 2 ∈ (3,975 ;6,025 )
1 1
+
S=
n1 n 2
n 1 +n 2 −2
[
( n 1 − 1) σ1 + ( n 2 − 1) σ 2
2 2
] iar
t
n ,1−
α
2
se determină a.î.
Fn t =1 − α .
n ,1 −
α
2
2
t = 2,201
Pentru 1 − α = 0,96 şi n=1 obţinem n ,1 −
α
.
2
Calculăm:
164 Elemente de teoria probabilităţilor şi statistică matematică
1
x1 = ( 226 ,5 + 224 ,1 + 218 ,6 + 220 .1 + 228 ,8 + 229 ,6 + 222 ,5) = 224 ,314
7
1
x 2 = ( 221 ,5 + 230 ,2 + 223 ,4 + 224 ,3 + 230 ,8 + 223 ,8) = 225 ,667
6
1 7
( )
σ1 = ∑ x 1k − x 1 = 17 ,765
2
6 k =1
1 6
( )
σ2 = ∑ x 2 k − x 2 = 14 ,951
2
5 k =1
2
1 1
+
S = 7 6 (6 ⋅17 ,765 + 5 ⋅14 ,951 ) = 2,259
11
Re zult ă :
A = −1,353 − 2,201 ⋅ 2,259 = −6,325
B = −1,353 + 2,201 ⋅ 2,259 = 3,619
⇒ m 1 − m 2 ∈( −6,326 ;3,619 )
(n − 1)σ 2 (n − 1)σ 2
(σ ) h2 2
2
,σ 2 σ
unde 1
2
= 2 şi σ 2
2 = 2 iar α şi h α se
1 2 h α h α n −1,1−
2
n −1,
2
n −1,1− n −1,
2 2
1
x= (4,21 + 4,03 + ... + 4,20 ) = 4,033
11
1 11
∑(x k − x ) 2 = 0,017
2
σ =
10 k =1
10 ⋅ 0,017 10 ⋅ 0,017
Rezultă: σ1 = = 0,008 şi σ22 = = 0,052
2
20 ,5 3, ,25
beneficiarului.
Definiţie 2.3.6. Se numeşte puterea testului probabilitatea de
~
respingere a unei ipoteze false, adică
π (θ ) = P((X1 , X 2 ,...,X n ) ∈ U
~ ~
H 1 ) unde
H 1 : θ = θ sau π(θ) = 1 − β .
Statistică matematică 167
X−m 1 n
Considerăm statistica Z =
σ
, X = ∑ X k , ce urmează legea
n k =1
n
normală N(0,1). Deci pentru α dat putem determina intervalul
−z α, z α a.î. P−z α < Z < z α =1 −α.
1− 1− 1− 1−
2 2 2 2
X −m
P (( X 1 , X 2 ,..., X n ) ∈ H 0 ) = P ∉
− z , z α
H 0 =
σ
α
1− 1−
2 2
n
= P Z ∉− z α, z H 0 =α
1− 1−
α
2 2
168 Elemente de teoria probabilităţilor şi statistică matematică
x − m0
(x1, x2,…,xn) ∈ U adică z = σ ∉ − z α , z α şi o admitem dacă
1− 2 1− 2
n
x − m0
(x 1 , x 2 ,...,x n ) ∉ U adică z =
σ
∈
− z α
2
, z
1− 1− . α
2
n
Observaţie 2.3.9.
1) Deoarece regiunea critică U corespunde complementarei
intervalului de încredere −z α, z α pentru statistica Z în continuare nu
1− 1−
2 2
1
Φ( z 1−α ) = −α.
2
Etapele aplicării testului:
1) Se consideră: α, σ, m = m 0 , x 1 , x 2 ,..., x n
z 1 −α
2) Se determină 1−
α
a.î. Φ z 1−α =
2
2 2
Statistică matematică 169
x − m0 1
3) Se calculează z = σ , x = ( x 1 , x 2 ,..., x n )
n
n
4) Dacă z < z1−α atunci ipoteza m=m0 este admisă, în caz contrar
2
este respinsă.
Exemplul 2.3.10. Caracteristica X reprezintă cheltuielile lunare în
mii lei pentru abonamentele la ziare şi reviste ale unei familii. Să se verifice,
cu nivelul de semnificaţie α=0,01 dacă media acestor cheltuieli lunare pentru
o familie este de 16 mii lei, ştiind că abaterea standard este σ = 3 mii lei şi
având o selecţie repetată de volum n=40, care ne dă distribuţia empirică de
11 13 15 17 20
selecţie X :
4 .
6 12 10 8
Rezolvare:
Deoarece n=40>30 şi σ = 3 este cunoscută, folosim testul Z pentru
verificarea ipotezei nule H0:m=16 cu alternativa H 1 : m ≠ 16 .
z = z 0 ,995
Pentru α=0,01 folosind testul se determină 1−
α
a.î.
2
1−α
Φ( z 0 ,995 ) = = 0,495 . Se obţine z0,995=2,58, care ne dă intervalul numeric
2
X−m
(-2,58;2,5 8) pentru statistica Z = σ . Calculăm
n
1
x= ( 4 ⋅11 + 6 ⋅13 + 12 ⋅15 ) + 10 ⋅17 + 8 ⋅ 20) = 15,8
40
x − m 15,8 − 16
z= = = −0,422 .
σ 3
n 40
170 Elemente de teoria probabilităţilor şi statistică matematică
T=
X−m 1 n
, X = ∑ X k , σ2 =
1 n
∑
n − 1 k =1
2
Xk − X , ( ) ce urmează legea
σ n k =1
n
Student cu n-1 grade de libertate. Deci se determină intervalul numeric
−t P
n−1,1−
α, t
n−1,1−
α a.î. −t n −1,1−α <T <t n −1,1−α =1 −α, iar
2 2 2 2
t α
2) Se determină n −1,1−
α
a.î. Fn −1
t n −1,1−α =1 −
2
2 2
3) Se calculează
t=
x − m0
σ
,x =
1 n
∑
n k =1
2
xk ,σ =
1 n
∑ xk − x
n − 1 k =1
( ) 2
n
t <t
4) Dacă n −1,1−
α ipoteza m=m0 este admisă, altfel este
2
respinsă.
Observaţie 2.3.12. Deoarece ipoteza alternativă H1:este m ≠ m 0
testul T prezentat se numeşte testul T bilateral, există şi teste unilaterale.
Statistică matematică 171
t α
de valori se determină n −1,1−
α
a.î. Fn −1
t n −1,1−α =1 − = 0,975 . Se
2
2 2
X −m
T=
σ este (-2,145;2,145).
n
1
Calculăm x = (60 + 85 + ... + 76 ) = 76 ,4
15
1 n x − m0 76,4 − 80
t= = = −1,291
∑ (x k − x) 2 = 116,686
2
σ = σ 10,80
14 k =1
n 15
Întrucât -1,291 ∈(−2,145 ;2,145 ) , ipoteza ca media de ocupare
zilnică a unităţii hoteliere este de 80% se acceptă.
Teste pentru compararea a două medii 2.3.14.
172 Elemente de teoria probabilităţilor şi statistică matematică
două populaţii.
a) Testul Z (dacă σ1 , σ2 sunt cunoscute)
( X 1 − X 2 ) − (m 1 − m 2 )
Z=
Considerăm statistica σ12 σ 22 care urmează
+
n1 n 2
încât
P
−z 1−α < Z < z 1−α =1 −α.
2 2
z 1 −α
2) Se determină 1−
α
a.î. Φ z 1−α =
2
2 2
x1 − x 2 1 n1 1 n2
z= , x1 = ∑
n 1 k =1
x 1k ; x 2 =
n2
∑x 2k
3) Se calculează σ 2
σ 2
k =1
+
1 2
n1 n 2
z <z
4) Dacă 1−
α ipoteza m1 = m 2 este admisă, altfel este
2
respinsă.
b) Testul T (dacă σ1 = σ 2 = σ necunoscute)
Statistică matematică 173
(X1 − X 2 ) − (m1 − m 2 ) n1 + n 2 − 2
T=
Considerăm statistica 2 2 1 1 care
(n 1 − 1)σ + (n 2 − 1)σ
1 2 +
n1 n 2
−t α, t
a.î. P−t α <T < t
=1 −α
n ,1− n ,1−
α n ,1− n ,1−
α
2 2 2 2
t α
2) Se determină n ,1−
α
a.î. Fn t n ,1−α = 1 − , n = n 1 + n 2 − 2
2
2 2
x1 − x 2 n1 + n 2 − 2
t=
3) Se calculează 2 2 1 1
(n 1 − 1)σ 1 + ( n 2 − 1)σ 2 +
n1 n 2
1 n1
( ) ( )
n2
1 1 n1 1 n2
∑ ∑ x 2k ; σ1 = ∑ 1k ∑ x 2k − x 2
2 2 2 2
x1 = x 1k ; x 2 = x − x 1 ; σ 2 =
n 1 k =1 n2 k =1 n 1 − 1 k =1 n 2 − 1 k =1
respinsă.
c) Testul T (dacă σ1 ≠ σ 2 necunoscute)
(X 1 − X 2 ) − ( m1 − m 2 )
T=
2 2
Considerăm statistica σ1 σ 2 care urmează
+
n1 n 2
2
σ1
1 c2 (1 − c ) 2 n1
= + ;c =
n n1 − 1 n2 − 1 σ 12 σ 22 .
+
n1 n2
Pentru statistica T se determină intervalul numeric
−t α; t
a.î. P−t α <T < t
=1 −α.
n ,1− n ,1−
α n ,1− n ,1−
α
2 2 2 2
−t α
2) Se determină n ,1−
α
a.î. Fn
t n ,1−α =1 − 2 unde
2
2
2
σ1
1 c2 (1 − c) 2 c = n1
= + ;
n n1 −1 n2 −1 σ12 σ 22 ;
+
n1 n 2
2
σ =
1
1 n1
n 1 − 1 k =1
( 2 2
) 1 n2
∑ x 1k − x 1 ;σ 2 = n − 1 ∑ x 2k − x 2 ( ) 2
2 k =1
1 n1 1 n2
x 1 = ∑ x 1k ; x 2 = ∑x 2k
n 1 k =1 n2 k =1
x1 − x 2
t=
2 2
3) Se calculează σ1 σ 2
+
n1 n 2
respinsă
Statistică matematică 175
z = z 0, 995 1 −α
valoarea 1−
α
a.î. Φ z1−α = = 0,495 . Se obţine z 0,995 = 2,58
2
2 2
σ12 σ 22
Z = [(X1 − X 2 ) − (m1 − m 2 )] + .
n1 n 2
1
Calculăm: x1 = (7 ⋅ 990 + 9 ⋅ 995 + ... + 5 ⋅ 1010 ) = 999 ,375
40
1
x2 = (5 ⋅ 985 + 5 ⋅ 990 + ... + 4 ⋅1010 ) = 997 ,424
33
σ12 σ 22 36 56,25
z = (x1 − x 2 ) + = (999,375 − 997 ,424 ) + = 1,209
n1 n 2 40 33
176 Elemente de teoria probabilităţilor şi statistică matematică
t α
valoarea n ,1−
α
, a.î. Fn
t n ,1−α =1 − 2 , unde n=n1+n2-2. Adică se obţine
2
2
(X1 − X 2 ) − (m1 − m 2 ) n1 + n 2 − 2
T=
2 2 1 1 care urmează legea Student cu n
(n 1 − 1)σ 1 + (n 2 − 1)σ 2 +
n1 n 2
grade de libertate.
Statistică matematică 177
Calculăm:
1
x1 = (3 ⋅10 ,27 + 2 ⋅10 ,28 + ... +1 ⋅10 ,32 ) = 10 ,285
8
1
x2 = ( 2 ⋅10 ,26 +1 ⋅ 20 ,27 + ... + 3 ⋅10 ,31) = 10 ,289
8
2
σ1 =
1 n1
(
∑ x 1k − x 1
n 1 − 1 k =1
) 2
= 3,143 ⋅ 10 − 4
2
σ2 =
1 n2
(
∑ x 2k − x 2
n 2 − 1 k =1
) 2
= 4,983 ⋅ 10 − 4
∑(X ) = (n −σ1)σ
2
n
1 2
Considerăm caracteristica H 2 = k −X care
σ2 k =1
2
2
intervalul numeric P 2 2
h n −1, α < H < h n −1,1−α =1 −α
2 2
1) Se consideră αi ; σ = σ0 ; x 1 , x 2 ,..., x n .
2 2
α
2) Se determină 2
h n −1, α , h n −1,1−α a.î. Fn -1 h n −1, α = 2 şi
2 2
2 2 2
2 α
Fn −1
n −1,1− =1 − 2 .
h α
2
n
1 1 n
3) Se calculează h =
2
σ 02
∑ (x k − x) 2 , x =
k =1
∑ xk
n k =1
2
h 2 ∈ atunci ipoteza σ 2 = σ 02 este admisă,
2
4) Dacă h n −1, α ; h n −1,1−α
2 2
Rezolvare:
Se utilizează testul χ2 . La nivelul de semnificaţie α = 0,05 ; se
2
2
h pentru statistica H = (n − 12)σ ,
2
determină intervalul n −1; α; h n −1;1−α ,
2 2 σ
care urmează legea χ2 cu n-1 grade de libertate; folosind tabelele de valori
din F11 ( h 11
2
; 0 , 025 ) = 0,025 ⇒ h 11 ; 0 , 025 = 3,82
2
şi
F11 ( h 11
2
; 0 , 975 ) = 0,975 ⇒ h 11; 0 , 975 = 21,9
2
1
Calculăm x = [1 ⋅ (−0,5) + 2 ⋅ (−0,4) + ... +1 ⋅1,5] = 0,4167
12
( )
2
1 n
∑ xk − x = 0,518 ; h 2 = (n −12)σ = 11 ⋅ 0,518 = 11,396
2 2
σ =
n − 1 k =1 σ0 0,5
această statistică f se determină a.î.
m , n ; α, f m , n ;1−α
2 2
P
f m , n ; α <F <f m , n ;1−α =1 −α. Extremităţile intervalului se determină
2 2
α α
din relaţiile Fm ,n
f m , n ; α = şi Fm , n
f
α =1 − , dacă Fm , n ( x )
2 2 m , n ;1−
2
2
Fm , n ( x ) sunt întocmite numai pentru valori mari ale lui βşi pentru F>1.
180 Elemente de teoria probabilităţilor şi statistică matematică
1 1
f = .
m , n ; α m , n ;1−α f
; f ;
2 2 n , m ;1−α f n , m ; α
2 2
α α
Fm , n f =
m,n; 2
α şi Fm , n
f α
m ,n ;1− =1 − 2 .
2 2
3) Se calculează:
2
( ) ( )
n
σ1 1 n1 1
∑ ∑ x 2k − x 2
2 2 2 2
f = 2 ;σ = 1 x 1k − x 1 ; σ 2 =
σ2 n 1 − 1 k =1 n 2 − 1 k =1
n1 n2
1 1
x1 =
n1
∑
k =1
x 1k , x 2 =
n2
∑x
k =1
2k .
4) Dacă f ∈f
m , n ; α; f m , n ;1−α
atunci ipoteza σ12 = σ 22 este
2 2
α
pentru statistica F folosind tabelele de valori, a.î. Fm ,n
f m , n ; α = şi
2 2
α
Fm , n
f m , n ;1−α =1 − 2 .
2
Calculăm:
1 1
x1 = (1 ⋅ 3,4 + 4 ⋅ 3,6 + 2 ⋅ 3,8) = 3,629 ; x 2 = (1 ⋅ 3,5 + 4 ⋅ 3,6 + 2 ⋅ 3,7 + 2 ⋅ 3,8) = 3,656
7 9
2
σ1 =
1 n1
n 1 − 1 k =1
(
∑ x 1k − x 1 ) 2 2
= 0,01905 ; σ 2 =
1 n2
(
∑ x 2k − x 2
n 2 − 1 k =1
) 2
= 0,01028
2
σ1 0,01905
f = 2
= = 1,85 .
σ 2
0,01028
p *i = F0 (a i ; λ*1 ,..., λ*s ) − F0 (a i −1 ; λ*1 ,..., λ*s ). Prin urmare, ipoteza făcută
N
(f i − n p *i )
ipoteza alternativă H 1 : H 0 falsă. Valoarea numerică h =
2
∑
i =1 n p *i
xi
– distribuţia empirică de selecţie X
fi i= 1,N
– se calculează p1* = F0 (a i ; λ*1 , λ*2 ,..., λ*s ) − F0 (a i −1 ; λ*1 , λ*2 ,..., λ*s )
– k = N-s-1
(f i − n p *i ) 2
N
3) Se calculează h = ∑
2
i =1 n p *i
respinsă.
Observaţie 2.3.22. Testul χ2 nu este aplicabil dacă n p *i sunt mai
mici decât 5, caz în care se recomandă o nouă grupare a datelor de selecţie.
Testul lui Kolmogorov 2.3.23.
Se consideră caracteristica X care are funcţia de repartiţie teoretică
F. Dacă F n (x) este funcţia de repartiţie de selecţie avem că
+∞
∑(−1)
2
x2
K(x) = k
e −2 k este funcţia lui Kolmogorov. Se face ipoteza H0
k =−
∞
x x
P d n < 1−α = 1 − α , adică dacă dn satisface inegalitatea d n < 1−α
n n
x 'i
1) Se consideră α;X: ,Fn= f + 21 . + fN . .
fi i=1,N
2) Se calculează x 1−α a.î. K ( x 1−α ) =1 − α
a i −1 + a i
3) Se calculează d n = max F n (a i ) − F(a i ) ; x 'i =
i =1, N 2
4) Dacă n d n < x 1−α ipoteza este admisă, altfel este respinsă.
Clasa
(- ∞ ;1,65) [1,65;1,70) [1,70;1,75) [1,75;1,80) [1,80;1,85) [1,85;1,90) [1,90;1,95) [1,95;2,00) [2,0;+ ∞
)
Frecare 11 14 17 17 18 16 13 10 8
σ* = µ 2 =
1 124 *
∑
124 k =1
( x k − 1,82 ) = 0,129
2
a i − m* a i −1 − m *
p = Φ
*
i
− Φ a ; s = 2; k = 9 − 2 − 1 = 6
σ σ*
*
tabelele de valori şi se obţine h 6;0 ,95 =12 ,59 adică intervalul (0;12,59).
2
ai − m * a − m* (f i − n p *i ) 2
ai fi Φ i * p *i n p *i
σ* σ n p *i
1,65 11 -1,32 -0,4066 0,0934 11,5816 0,02921
1,70 14 -0,93 -0,3238 0,0828 10,2672 1,35712
1,75 17 -0,54 -0,2054 0,1184 14,6816 0,36610
186 Elemente de teoria probabilităţilor şi statistică matematică
d n = max F n (a i ) −F(a i ) .
i =1, N
∑ (x 1 − x )( y1 − y )
1 n 1 n
r=
n
i =1
n
unde x = ∑ i
n i =1
x y = ∑ yi
n i =1
∑ ( x1 − x)2 ∑ ( y1 − y)2
i =1 i =1
sunt respectiv funcţiile de estimaţie absolut corectă ale dispersiilor σX2 şi σY2,
adică
n n
2
∑ ( xi − x) 2 2
∑ ( y − y)
i
2
σx = i =1
, σy = i =1
n −1 n −1
Observaţia 2.4.4. Considerând funcţia de regresie liniară a
variabilei Y în raport cu variabila X dată de ecuaţia y = ax + b , unde
y = M (Y / x ) se obţine valoarea y 'i = ax i + b şi reziduul δi = y 'i −yi fiind
M (Y / xi ) .
2 2
σ R = σ Y (1 − r 2 ) pentru regresia variabilei Y în raport cu variabila X.
2 2
Inversând, se scrie r 2 = 1 − σ R / σ Y şi formula obţinută poate fi folosită
1 n 278
∑
2
σy = ( yi − y ) 2 = = 55,6 de unde σy = 55 ,6 = 7,3
n − 1 i=1 4
7,3
Obţinem y − 48 = 0,95 ⋅ 5,5 ( x −16 ) sau y =1,3 x +27 ,2
190 Elemente de teoria probabilităţilor şi statistică matematică
µ2 ( X ) =
1 6
∑
15 k =1
(
f k ⋅ xk' − x ) 2
=
=
1
15
[ 2 2 2
]
2 ⋅ ( 39,25 − 39 ,8) + 4 ⋅ ( 39 ,5 − 39 ,8) + 2 ⋅ ( 39 ,75 − 39 ,8) + ... = 0,135
2 15
σ (X ) = µ2 ( X ) = 0,144
14
b) Funcţia de repartiţie de selecţie este:
0, daca x ≤ 39 ,25
2 / 15 , daca 39 ,25 < x ≤ 39 ,50
6 / 15 , daca 39 ,50 < x ≤ 39 ,75
F 15 ( X ) = 8 / 15 , daca 39 ,75 < x ≤ 40 .
12 / 15 , daca 40 < x ≤ 40 ,25
14 / 15 , daca 40 ,25 < x ≤ 40 ,50
1, daca x > 40 ,50
µ2 ( X ) =
1
100
[ 2 2
]
10 ⋅ (10 ,50 −10 ,65 ) +12 ⋅ (10 ,55 −10 ,65 ) + ... = 0,0077
1
caracteristica X. să se arate că funcţia de selecţie V = X (n X −1) ,
n −1
1 n
unde X = ∑ X k , este o funcţie de estimaţie nedeplasată pentru p2.
n k =1
Rezolvare:
Pentru caracteristica X avem M(X) = p şi D2(X) = p – p2.
Funcţia de estimaţie V este un estimator nedeplasat al parametrului
p2 dacă M(V) = p2.
Calculăm
Statistică matematică 193
1
M (V ) = M
( n
X n X −1 = M )
2
X −
1
X =
n −1 n −1 n −1
=
n
n −1
M X −( )
2 1
n −1
M X ( )
Folosind faptul că variabilele de selecţie sunt liniar independente şi
identic repartizate cu X avem:
( ) 1 n 1 n 1 n
M X = M ∑ Xk = ∑ M ( Xk ) = ∑ M ( X ) = M ( X ) = p ;
n k =1 n k =1 n k =1
( )
D2 X = M X ( ) −[M ( X )]
2 2
( ) 1 n 1 p − p2
n n
1
D2 X = D2 ∑ X k = 2
n k =1 n
∑ D2 ( X k ) =
k =1 n2
∑ D2 ( X ) =
k =1 n
M X( ) = p −n p
2
2
+ p2 =
p − p 2 + p 2n
n
.
Obţinem:
n p − p 2 + p 2n 1
M (V ) = ⋅ − ⋅ p = p2
n −1 n n −1
adică, V este un estimator nedeplasat al parametrului p2.
λx
M ( X ) = D 2 ( X ) = λ şi f ( x; λ) = e −λ , avem:
x!
194 Elemente de teoria probabilităţilor şi statistică matematică
ln f ( x; λ) = −λ + x ln λ − ln x! iar
∂ ln f ( x; λ) x
= −1 + .
∂λ λ
∂ ln V n
∂ ln f ( X k ; λ ) n
X
=∑ = ∑ −1 + k .
∂λ k =1 ∂λ k =1 λ
Ecuaţia de verosimilitate maximă devine
n
Xk
∑ − 1 +
k =1 λ
= 0 , iar estimatorul de verosimilitate maximă pentru
parametrul λ este λ* = X .
b) Calculăm:
1 n 1 n 1 n n
M ( X ) = M ∑ X j = ∑ M ( X j ) = ∑ M ( X ) = ⋅ λ = λ
n j =1 n j =1 n j =1 n
1 n 1 n
1 n
n λ
D 2 ( X ) = D 2 ∑ X j = 2 ∑ D2 (X j ) = ∑D 2
(X ) = ⋅λ = → 0
n j =1 n j =1 n2 j =1 n 2
n
1
Întrucât egalitatea D ( X ) =
2
este verificată, rezultă că X
I (λ)
10 ,3 10 ,4 10 ,5 10 ,6 10 ,7 10 ,8 10 ,9 11 11 ,2 11 ,3
X :
1 1 2 2 2 4 4 2 1 1
z 1 −α 1 −α
1−
α
se determină astfel încât Φ( z1−α ) = , = 0,450 , folosind
2
2
2 2
1
x = (10 ,3 +10 ,4 + 2 ⋅10 ,5 + 2 ⋅10 ,6 + 2 ⋅10 ,7 + 4 ⋅10 ,8 + 4 ⋅10 ,9 + 2 ⋅11 +11,2
20
+11,3) =10 ,78
0,06
Rezultă m1 =10 ,78 − ⋅1,65 =10 ,75 ,
20
0,06
m2 =10 ,78 + ⋅1,65 =10 ,80 , adică m ∈(10 ,75 ;10 ,80 ) .
20
196 Elemente de teoria probabilităţilor şi statistică matematică
σ σ
m1 = x − t α şi m2 = x + t α . Pentru n-1=11 şi
n n −1,1−
2 n n −1,1−
2
α
1− = 0,975 din tabelul cu valorile funcţiei de repartiţie a legii Student se
2
1 10
σ= ∑
11 k =1
f k ( xk − x) 2 = 0,719
0,719
Obţinem: m1 = 0,4 − ⋅ 2,201 = −0,05 ;
12
0,719
m2 = 0,4 + ⋅ 2,201 = 0,85 adică m ∈(−0,05 ;0,85 ) .
12
(
A = x1 − x 2 − z ) 1−
α
σ 12 σ 22
+
n1 n 2
(
şi B = x 1 − x 2 + z α
1−
) σ 12 σ 22
+
n1 n 2
2 2
z 1 −α
iar 1−
α
se determină a.î. Φ z1−α = = 0,49 .
2
2 2
z = 2,33
1−
α
.
2
⇒ m1 − m2 ∈(0,008 ;0,022 )
Rezolvare:
Conform aplicaţiei 3. b) intervalul de încredere pentru m1-m2 este
1 1
+
S=
n1 n 2
n 1 +n 2 −2
[
( n 1 − 1) σ1 + ( n 2 − 1) σ 2
2 2
] iar
t
n ,1−
α
2
se determină a.î.
Fn t =1 − α .
n ,1 −
α
2
2
α
Pentru 1 − = 0,99 şi n=8 obţinem t n ,1−α = 2,896 .
2 2
σ1 =
2 1 5
4 k =1
(
∑ x1k − x1 ) 2
= 0,0000375
σ2 =
2 1 5
4 k =1
(
∑ x2 k − x 2 ) 2
= 0,0000375
1 1
+
S = 5 5 ( 4 ⋅ 0,0000375 + 4 ⋅ 0,0000375 ) = 0,0038
8
Re zult ă :
A = 0,015 − 2,896 ⋅ 0,0038 = 0,004
B = 0,015 + 2,896 ⋅ 0,0038 = 0,026
⇒ m1 − m2 ∈ (0,004 ;0,026 )
(n − 1)σ 2 (n − 1)σ 2
(σ ) h2 2
2
,σ 2 σ
unde 1
2
= 2 şi σ 2
2 = 2 iar α şi h α se
1 2 h α h α n −1,1−
2
n −1,
2
n −1,1− n −1,
2 2
22 ,7 22 ,8 22 ,9 23 23 ,1 23 ,2 23 ,3
X :
1
1 5 2 2 3 1
1
x= ( 22 ,7 + 22,8 + 5 ⋅ 22 ,9 + 2 ⋅ 23 + 2 ⋅ 23,1 + 3 ⋅ 23,2 + 23,3) = 23
15
1 15
σ = ∑( xk − x) 2 =0,00029
2
14 k =1
14 ⋅ 0,00029
Rezultă: σ12 = = 0,00013 şi
29 ,14
14 ⋅ 0,00029
σ22 = = 0,00099
4,07
Frecvenţa 5 8 18 6 5
Rezolvare:
Deoarece n=42>30 şi σ =1,5 este cunoscut, folosim testul Z pentru
verificarea ipotezei nule H0:m=7,25 cu alternativa H 1 : m ≠ 7,25 .
Distribuţia empirică de selecţie este:
5,5 6,5 7,5 8,5 9,5
X :
5
8 18 6 5
1 −α
Φ( z0 ,975 ) = = 0,475 . Se obţine z0,975=1,96, care ne dă intervalul numeric
2
X−m
(-1,96;1,9 6) pentru statistica Z = σ . Calculăm
n
1
x= ( 5 ⋅ 5,5 + 8 ⋅ 6,5 + 18 ⋅ 7,5 + 6 ⋅ 8,5 + 5 ⋅ 9,5) = 7,45
42
x − m 7,45 − 7,25
z= = = 0,86
σ 1,5 .
n 42
Deoarece z = 0,86 ∈( −1,96 ;1,96 ) ipoteza se acceptă.
11. Caracteristica X reprezintă rezistenţa la rupere a cablurilor
produse de o anumită fabrică. Considerând că X urmează legea de
probabilitate normală N(m, σ ), să se verifice, folosind nivelul de
semnificaţie α = 0,05, ipoteza că media teoretică a rezistenţei la rupere a
cablurilor este de 400 kg, dacă se dispune de o selecţie de volum n = 10, cu
următoarele date de selecţie: 401; 403; 398; 398; 400,5; 399; 396; 401,5;
400,5; 398,5.
Rezolvare:
Statistică matematică 201
t α
de valori se determină n −1,1−
α
a.î. Fn −1
t n −1,1−α =1 − = 0,975 . Se
2
2 2
X −m
T=
σ este (-2,262; 2,262).
n
1
Calculăm x = (396 + 2 ⋅ 398 + 398 ,5 + 399 + ...) = 400 ,2
10
1 10 x − m0 400,2 − 400
t= = = 0,107
∑
2
σ = ( xk − x) 2 = 5,86 σ 5,86
9 k =1
n 10
Întrucât 0,107 ∈(−2,262 ;2,262 ) , ipoteza că media de rezistenţă la
rupere a cablurilor este de 400 se acceptă.
12. Două maşini produc piese de acelaşi tip. Fie X1 dimensiunea
pieselor produse de prima maşină, respectiv X2 să fie dimensiunea pieselor
produse de a doua maşină, fiecare urmând legea normală, respectiv
N(m1,0,02) şi N(m2,0,15). Să se verifice, folosind nivelul de semnificaţie α =
0,05, ipoteza că mediile dimensiunilor pieselor (în mm) produse de cele două
maşini sunt egale, cu alternativa că ele diferă, dacă se dispune de selecţiile,
care au ca distribuţii empirice de selecţie, respectiv
4.90 4.95 5.00 5.05
X1 :
11 şi X2 :
16 19 14
Rezolvare:
Verificarea ipotezei nule H0:m1=m2 cu alternativa H1 : m1 ≠ m 2 , se
va face cu testul Z.
Folosind nivelul de semnificaţie α = 0,05 se determină din tabele
1 −α
valoarea z1−α = z0, 975 a.î. Φ z1−α = = 0,475 . Se obţine z0,975 =1,96
2
2 2
σ12 σ 22
Z = [(X1 − X 2 ) − (m1 − m 2 )] + .
n1 n 2
Calculăm:
1
x1 = (11 ⋅ 4,90 +16 ⋅ 4,95 +19 ⋅ 5 +14 ⋅ 5,05 ) = 4,98
60
1
x2 = (6 ⋅ 4,90 + 8 ⋅ 4,95 +14 ⋅ 5 + 7 ⋅ 5,10 ) = 4,99
35
σ 12 σ 22 0,0004 0,0225
z = ( x1 − x 2 ) + = (4,98 − 4,99) + = −0,0025
n1 n2 60 35
Rezolvare:
Caracteristicile X1 şi X2, ce reprezintă dimensiunile articolelor
produse de cele două maşini, se consideră că urmează fiecare legea normală,
respectiv N ( m1 , σ) şi N(m 2 , σ) , cu abaterea standard σ > 0 necunoscută.
Verificarea ipotezei nule H 0 : m1 = m 2 cu alternativa H1 : m1 ≠ m 2 ,
se va face cu testul T, deoarece abaterea standard σ este necunoscută.
Folosind nivelul de semnificaţie α = 0,01 , se determină folosind tabelele,
t α
valoarea n ,1−
α
, a.î. Fn
t n ,1−α =1 − 2 , unde n=n1+n2-2.
2
2
(X1 − X 2 ) − (m1 − m 2 ) n1 + n 2 − 2
T=
pentru statistica 2 2 1 1 care urmează
(n 1 − 1)σ 1 + (n 2 − 1)σ 2 +
n1 n 2
σ1 =
2 1 n1
∑
n1 − 1 k =1
( 2
)
x1k − x1 = 0,0135
σ2 =
2 1 n2
n2 − 1 k =1
(
∑ x2 k − x 2 ) 2
= 0,0221
204 Elemente de teoria probabilităţilor şi statistică matematică
( x1 − x 2 ) n1 + n2 − 2
t= =
2 2 1 1
( n1 −1)σ 1 + ( n2 −1)σ 2 +
n1 n2
3,64 − 3,69 25
= = −0,954
11 ⋅ 0,0135 + 14 ⋅ 0,0221 1 1
+
12 15
Deoarece t = −0,954 ∈(−2,787 ;2,787 ) , rezultă că mediile articolelor
produse de cele două maşini nu diferă semnificativ.
14. Se cercetează caracteristica X ce reprezintă diametrul pieselor
produse de o maşină (în mm). Ştiind că X urmează legea normală N(m,σ ) şi
având o selecţie de volum n = 11, care ne dă distribuţia empirică de
2
2
h pentru statistica H = (n − 12)σ ,
2
determină intervalul n −1; α; h n −1;1−α ,
2 2 σ
care urmează legea χ2 cu n-1 grade de libertate; folosind tabelele de valori
( )
2
1 n ( n −1)σ 10 ⋅ 0,0021
∑ k
2 2
σ = x − x = 0,0021 ; h 2
= = = 7,3 .
n − 1 k =1 σ02
0,003
α
pentru statistica F folosind tabelele de valori, a.î. Fm ,n
f m , n ; α = şi
2 2
α
Fm , n
f m , n ;1−α =1 − 2 , m = n1-1 , n = n2 –1.
2
Calculăm:
206 Elemente de teoria probabilităţilor şi statistică matematică
1
x1 = ( 2 ⋅1,7 + 2 ⋅1,8 + 4 ⋅1,9 + 1 ⋅1,9 + 1 ⋅ 2) = 1,83;
10
1
x2 = (1 ⋅1,75 + 2 ⋅ 1,8 + 4 ⋅ 1,85 + 2 ⋅1,9 + 2 ⋅ 2 + 1 ⋅ 2,1) = 1,88
12
σ1 =
2 1 n1
∑
n1 − 1 k =1
( 2
)
x1k − x1 = 0,0078 ;
σ2 =
2 1 n2
n2 − 1 k =1
(
∑ x2 k − x 2 ) 2
= 0,0101
2
σ1 0,0078
f = 2
= = 0,77 .
σ 2
0,0101
Rezolvare:
a) Se utilizează testul F. Se determină intervalul
f pentru statistica F folosind tabelele de valori, a.î.
m , n ; α; f m , n ;1−α
2 2
α α
Fm , n
f m , n ; α = 2 şi Fm , n f m , n ;1−α =1 − 2 , m = n1-1 , n = n2 –1.
2 2
3,70)
Calculăm:
1
x1 = (1070 + 1110 + 1050 + 1090 + ...) = 1095 ;
15
1
x2 = (1100 + 1170 + 990 + 1180 + ...) = 1110
15
2
σ =
1
1 n1
∑
n1 − 1 k =1
2
(
x1k − x1 = 3569,64 ; )
2
σ =
2
1 n2
∑ x2 k − x 2
n2 − 1 k =1
( ) 2
= 3864,28
2
σ1 3569 ,64
f = 2
= = 0,92 .
σ 2
3864 ,28
t α
valoarea n ,1−
α
, a.î. Fn
t n ,1−α =1 − 2 , unde n=n1+n2-2.
2
2
(X1 − X 2 ) − (m1 − m 2 ) n1 + n 2 − 2
T=
pentru statistica 2 2 1 1 care urmează
(n 1 − 1)σ 1 + (n 2 − 1)σ 2 +
n1 n 2
σ * = µ2 =
1 6
∑
100 k =1
(
f k xkţ − x ) 2
= 1,47
ai − m* ai −1 − m*
p = Φ
*
− Φ a ; s = 2; k = 6 − 2 − 1 = 3
σ σ *
i *
ai − m* a − m* (f i − n p *i ) 2
ai fi Φ i * p *
np *
σ
i i
σ* n p *i
48 12 -1,29 -0,4015 0,0985 9,85 0,4692
210 Elemente de teoria probabilităţilor şi statistică matematică
d n = max F n (a i ) −F(a i ) .
i =1, N
Nr.pers. (ni) 9 13 18 30 16 10 4
a) Scrieţi rezultatele sondajului ca pe o caracteristică aleatoare
reprezentând momentul sosirii la serviciu;
b) Scrieţi funcţia de repartiţie de selecţie F 100 ( x ) şi trasaţi-i
graficul;
c) Calculaţi media de selecţie x şi dispersia de selecţie σ2 ;
d) Luând la întâmplare o fişă de pontaj, cu ce probabilitate salariatul
va sosi înainte de ora 7.
4. Fie X o caracteristică ce urmează legea beta de parametrii p,q > 0
necunoscuţi. Să se estimeze parametrii p şi q folosind metoda momentelor, pe
baza datelor de selecţie x1 , x2 ,..., xn .
5. Într-o fabrică de ţesături s-a constatat că rezistenţa la rupere a unui
anumit fir textil este repartizată normal cu media m necunoscută şi dispersia
σ 2 = 625 . O selecţie de volum 25 dă o medie de selecţie x =180 .
Determinaţi un interval de încredere pentru media m cu
probabilitatea de încredere:
a) α = 0,90 ;
b) α = 0,95 ;
c) α = 0,98 .
semnificaţie.
Se presupune că rezistenţa este repartizată normal.
13. Se iau eşantioane din apa rezultată din răcirea la o centrală
nucleară. Se consideră că dacă temperatura apei evacuate nu depăşeşte 600C
nu constituie o primejdie pentru mediul înconjurător.
Se aleg 70 eşantioane de apă şi se măsoară temperatura fiecărui
asemenea eşantion. Se obţin rezultatele:
Temperatura în 0C 52 54 58 61 64 65
Frecvenţa 14 21 18 10 5 2
Să se verifice ipoteza H 0 : m = 60 C faţă de H1 : m ≠ 60 C la
0 0