Sunteți pe pagina 1din 17

ETTI, seria A și C, 2022

Estimatori
RECAPITULARE punctuali si
TPSM intervale de
31 mai 2022
incredere.
Lect.dr. Raluca Purnichescu Purtan
Teste statistice.
O populație statistică are caracteristica X , repartizată Weibull, cu densitatea de repartiție:

2ax  e − a x , x  0
2

f ( x) =  , a0
 0, în rest

În urma unei selecții de volum n se obține media de selecție 2.3. Să se estimeze parametrul a  0 folosind
metoda momentelor.

Deoarece repartiția dată are un singur parametru de estimat, se va folosi doar egalitatea momentelor de ordinul întâi:

M X  = x
  
M X  =  x  f ( x ) dx = 2a  x  e
2 − a x2
dx Punem în evidență o integrală Gamma  ( p ) =  e − x x p −1dx
− 0 0

t
Schimbare de variabilă: ax 2 = t  x =
a 1  −
1
1 1  
M X  =  t 2
 e− t dt =   =  =x
1 a 0
a 2 a a
dx = dt
2 at

a=
( x)
2


Din enunț știm că x = 2.3  = 2.3 de unde obținem a = 0.5929
a
Se consideră populația  cu caracteristica de interes X repartizată Rayleigh, cu densitatea de repartiție:

x2
x
f ( x) = e 2 2
x  0 ,  0
 2

Să se estimeze, prin metoda verosimilității maxime, parametrul  al densității de repartiție f ( x,  ) , pe


baza unei selecții aleatoare de volum n , x1 , x2 ,..., xn , extrasă din populația  .

Funcția de verosimilitate este:


xi2
n n
xi −
L( x, ) =  f ( xi , ) =   e 2
2

i =1 i =1  2

Se logaritmează funcția de verosimilitate și se obține:


 −
xi2  n
 =  ln x − n ln ( ) −
n n n
x 1
ln L( x, ) =  ln f ( xi , ) =  ln  i2  e 2 2  i
2 2
x2
i =1 i =1   i =1 i
2 i =1
 
n
Se poate nota  i =S , S 0
x 2

i =1

ln L( x, ) =  ln xi − n ln ( 2 ) −
n
1
S
i =1 2 2
Se scrie ecuația de verosimilitate:

 ln L ( x, ) 2n S
=0  − + =0
   3

S
Estimația de verosimilitate maximă ˆ este soluția acestei ecuații, deci ˆ =
2n

Verificăm că este punct de maxim:


 2 ln L ( x, ) S
0 pentru ˆ =
 2 2n

 2 ln L ( x, ) 2n 3S 4n 2 12n 2 8n 2
= − = − =− 0
 2  = 2 4  = S S S

S
În concluzie, estimația de maximă verosimilitate este: ˆ =
2n
Se consideră populația  cu caracteristica de interes X care are densitatea de repartiție:
f ( x,  ) =   x −1 , cu x  ( 0,1) .
Să se estimeze parametrul  al densității de repartiție f ( x,  ) , pe baza unei selecții aleatoare de volum n ,
x1 , x2 ,..., xn , extrasă din populația  :
a) Prin metoda momentelor;
b) Prin metoda verosimilității maxime.
Ați obținut același estimator? Care credeți că este motivul?

(2p) a) f ( x,  ) conține un singur parametru, deci  se estimează din ecuația: M  X  = x (0.5p) ;


Se calculează M  X  = x  f ( x, ) dx =  x   x dx =   x dx =
1 1 1

 −1
(1p) ;
0 0 0  +1

 x
Determinarea estimatorului ca soluție a ecuației: = x , de unde se obține:  = (0.5p).
 +1 1− x
n n
(6p) b) Funcția de verosimilitate este: L( x, ) =  f ( xi , ) =   xi −1 (0.5p);
i =1 i =1

Se logaritmează funcția de verosimilitate și se obține:

ln L( x, ) =  ln f ( xi , ) =  ln (  xi ) =  ln  + ( − 1) ln ( x ) = n ln  + ( − 1)  ln ( x )


n n n n
 −1
i i
(2p)
i =1 i =1 i =1 i =1

n
Se poate nota  ln x
i =1
i = S , deci ln L( x, ) = n ln  + ( − 1)  S ;

 ln L ( x, ) n
Se scrie ecuația de verosimilitate: = 0 care este echivalentă cu: + S = 0 . (1.5p)
 
n n
Estimația de verosimilitate maximă ˆ este soluția acestei ecuații, deci ˆ = − =− n
. (0.5p)
 ln ( x )
S
i
i =1

 2 ln L ( x, ) n  2 ln L ( x, ) n S2
Verificăm că este punct de maxim:  0 pentru  = − : =− =−  0 (2p)
 2 S  2  = 2  = n

n
În concluzie, estimația de maximă verosimilitate este ˆ = − n
.
 ln ( x )
i =1
i
(2p) Cei 2 estimatori pot diferi pentru că metoda momentelor NU asigură găsirea unui estimator eficient (pe când metoda verosimilității
maxime da).

Concluzia ar fi că estimatorul determinat prin metoda momentelor (în această problemă) NU este eficient.
O companie IT lansează pe piață un nou produs și este interesată de viteza de absorbție a produsului pe piață
(adică numărul de zile de la desfacere până la epuizarea produsului), reprezentată printr-o variabilă aleatoare
cu repartiția normală. Compania a trimis câte un produs la 6 dintre reprezentanțele sale și a primit informațiile
legate de viteza de absorbție:

Reprezentanța 1 2 3 4 5 6
Nr zile (absorbție) 35 52 35 45 38 35

Informațiile solicitate de compania IT sunt:


a) Un interval de încredere de 95% pentru viteza medie de absorbție;
b) Un interval de încredere de 95% pentru abaterea standard a vitezei de absorbție.

n=6
6


n 6

 ( xi − x )  ( xi − 40)
1 1 1 1 248
x= xi =  240 = 40 s = = = = 49.6
2 2 2

6 i =1 6 n −1 i =1 5 i =1 5

 = 0.05
a) Suntem în cazul  necunoscut. Intervalul de încredere pentru m este:

 s2 s2 
I =x −  t  ( n − 1) , x +  t  ( n − 1) 
 n 1− n 1− 
 2 2 

1− = 0.975
I = ( 32.6 , 47.4 )
2
t0.975 ( 5 ) = 2.571

 
 n −1 n −1 
b) Intervalul de încredere pentru  2 este: I = 2  s2 , 2  s2 
 1 −  ( n − 1)   ( n − 1) 
 2 2 
2
1−
 ( n − 1) =  0.025
2
(5) = 0.831
I = (19.32 , 298.43)
2

  ( n − 1) = 
2 2
0.975 (5) = 12.833
2

Pentru abaterea standard avem intervalul: I= ( 19.32 , )


298.43 = ( 4.4 , 17.8 )
Se dorește estimarea mediei salariilor angajaților unei firme. Directorul firmei solicită ca estimările să fie
corecte cu o probabilitate de 0.95. Dacă se presupune că salariile sunt distribuite normal, cu o abatere standard
de 1050, care este volumul selecției astfel încât media reală să nu difere cu mai mult de 200 de la media
selecției?

Suntem în cazul repartiției normale cu  cunoscut,  = 0.05 , media de selecție x .

Condiția ca media reală să nu difere cu mai mult de 200 de la media selecției se transcrie: x − m  200

x − 200  m  x + 200
Intervalul de încredere pentru medie în cazul  cunoscut se scrie ca inegalitate:
 
x− z  m x+ z 
n 1− n 1−
2 2

z  = 200
n 1− 1050
2 1.96 = 200 n = 106
n
 = 1050
Se testează rezistența în ohmi pentru 5 bucăți de cablu și se găsesc valorile: 1.51, 1.49, 1.54, 1.52 și 1.54. Dacă
cablul ar fi din argint pur, rezistența lui ar fi de 1.5 ohmi. Dacă argintul nu este pur, rezistența lui crește. Testați
la un nivel de semnificație de 0.05 faptul că argintul din cablu nu este pur.

Avem de testat media rezistenței la rupere a cablului

n=5 Folosim testul t pentru medie: Ipoteza de nul H 0 : m = 1.5


 = 0.05 Ipoteza alternativă H1 : m  1.5 (unilaterală dreapta).
m0 = 1.5
Rcr = t t  t1− (n − 1)
x − m0
Calculăm valoarea statisticii t=
s
n t1− ( n − 1)
5

 x = 1.52
1
x=
5 i =1
i
tcalc = 2.108 tcritic = t1− (n − 1) = t0.95 ( 4 ) = 2.132
5

 ( xi − 1.52)
1
s = = 0.00045
2 2

4 i =1 deoarece tcalc  Rcr , acceptăm ipoteza de nul, la nivelul de semnificație de 0.05


s = 0.021
Un laborator cumpără calculatoare de la două firme. Un sondaj arată că de la firma A s-au cumpărat 9 calculatoare
la un preț mediu de 715 euro cu abaterea standard de 32 euro, iar de la firma B s-au cumpărat 25 de calculatoare la
un preț mediu de 735 euro cu abaterea standard de 6 euro. Cu un nivel de semnificație de 0.01, se poate afirma că
firma B vinde calculatoare mai scump decât firma A? (Se consideră că variabilele aleatoare asociate prețurilor sunt
normale, dar dispersiile nu sunt egale).

Avem de testat egalitatea mediilor prețurilor de achiziție.


Folosim testul t pentru medii (dispersiile sunt necunoscute și diferite).

t ( n − 1)
 = 0.01
n1 = 9 n2 = 25
Rcr = t t  t (n − 1)
x1 = 715 x2 = 735
n = min(n1 −1, n2 −1) = 8
s = 32 = 1024
2 2
s = 6 = 36
2 2
1 2
x1 − x2
Calculăm valoarea statisticii t = tcalc = = −1.863
2 2
Ipoteza de nul H 0 : m1 = m2 s1
+
s 2
n1 n2
Ipoteza alternativă H1 : m1  m2 (unilaterală stânga).
tcritic = t (n − 1) = t0.01 ( 7 ) = −t0.99 ( 7 ) = −2.998

deoarece tcalc  Rcr , acceptăm ipoteza de nul, la nivelul de semnificație de 0.01


Un laborator are două tipuri de aparate de măsură a frecvenței. Șeful laboratorului afirmă că pentru întreținerea
celor două tipuri de aparate se fac aceleași cheltuieli. Se știe că variabilele aleatoare care reprezintă cheltuielile de
întreținere sunt repartizate normal, cu abaterile standard 252 și respectiv 280. Se selectează 20 de aparate din
primul tip și se obține media cheltuielilor de 1560 lei. Din aparatele de al doilea tip se selectează 15 aparate și se
găsește media cheltuielilor de 1432 lei. Cu un nivel de semnificație de 0.05, să se testeze afirmația șefului de
laborator.

Avem de testat egalitatea mediilor cheltuielilor.


Folosim testul t pentru medii (volumul celor 2 selecții este mai mic de 30, deci NU folosim testul z, chiar dacă știm
dispersiile din populație), varianta cu dispersii diferite – folosim dispersiile din populație în locul dispersiilor de
selecție.
Ipoteza de nul H 0 : m1 = m2
 = 0.05
Ipoteza alternativă H1 : m1  m2 (unilaterală dreapta).
n1 = 20 n2 = 15
x2 = 1432 t1− ( n − 1)
x1 = 1560 Calculăm valoarea statisticii

 1 = 252  2 = 280 t = tcalc =


x1 − x2
= 1.396 
Rcr = t t  t1− ( n − 1) 
 12  22
+
n = min ( n1 − 1, n2 − 1) = 14 n1 n2 tcritic = t1− ( n − 1) = t0.95 (13) = 1.771

deoarece tcalc  Rcr , acceptăm ipoteza de nul, la nivelul de semnificație de 0.05


Un sondaj efectuat asupra a 50 de familii în care ambii părinți lucrează arată că 36% dintre copii sunt preșcolari,
iar un sondaj efectuat asupra a 80 de familii în care un singur părinte lucrează arată că 25% dintre copii sunt
preșcolari. Există o diferență între cele două proporții, la un nivel de semnificație de 0.01?

Avem de testat egalitatea a două proporții. 1 0 1 0


X1 =   X2 =  
Folosim testul z pentru două proporții.  p1 q1   p2 q2 

 = 0.01 Ipoteza de nul H 0 : p1 = p2 p1 = 0.36 k1 =


36
 50 = 18
100
n1 = 50 Ipoteza alternativă H1 : p1  p2 p2 = 0.25
25
estimațiile lui p1 și p2 k2 =  80 = 20
n2 = 80 100
p1 − p2
Calculăm valoarea statisticii z = zcalc =  (0,1)    
1 1 Rcr =  z z  z    z z  z  
p * (1 − p *)  +   2  
1−
2
k1 + k2 38  n1 n2 
p* = = = 0.292 zcritic = z = z0.995 = 2.58
n1 + n2 130 1−

media ponderată a celor zcalc = 1.341 2

două frecvențe relative zcalc  Rcr z 


1−
acceptăm ipoteza de nul (proporțiile nu diferă). 2
Ce se modifică dacă facem o ipoteză alternativă unilaterală?

 = 0.01 Ipoteza de nul H 0 : p1 = p2 p1 = 0.36 k1 =


36
 50 = 18
n1 = 50 100
p2 = 0.25
n2 = 80 Ipoteza alternativă H A : p1  p2 k2 =
25
 80 = 20
estimațiile lui p1 și p2 100
k1 + k2 38
p* = = = 0.292
p1 − p2 n1 + n2 130
Valoarea statisticii nu se modifică: z = zcalc = = 1.341
1 1
p * (1 − p *)  + 
 n1 n2 

z1−

Rcr = z z  z1−  zcalc  Rcr
zcritic = z1 −  = z0.99 = 2.33 acceptăm ipoteza de nul (proporțiile nu diferă).
Președintele unei companii afirmă că angajații săi au un salariu mediu pe oră de 8.65 euro. Un sondaj asupra a
50 de angajați are următoarea distribuție:
Interval 8.35 - 8.43 8.44 - 8.52 8.53 - 8.61 8.62 - 8.70 8.71 - 8.79 8.80 - 8.88

Frecv. 2 6 12 18 10 2

Să se testeze afirmația președintelui, la un prag de semnificație de 0.05 (considerând repartiția salariilor ca fiind normală).

Avem de testat media salariului pe oră.

Ce este puțin diferit la acest enunț față de enunțurile ”clasice” este modul de prezentare al datelor, pe intervale de
valori (în statistică se numesc clase). Pentru acest tip de date de selecție se consideră valoarea din mijloc a fiecărui
interval ca fiind reprezentativă. Astfel obținem datele de selecție echivalente:

Interval 8.39 8.48 8.57 8.66 8.75 8.84


Frecv. 2 6 12 18 10 2

Pentru aceste date calculăm: 1


x= ( 2  8.39 + 6  8.48 + ... + 2  8.84 ) = 8.631
50
s2 =
1
49
(
2  ( 8.39 − 8.631) + 6  (8.48 − 8.631) + ... + 2  (8.84 − 8.631) = 0.011
2 2 2
)  s = 0.105
 = 0.05 Ipoteza de nul H 0 : m = 8.65 ( m0 = 8.65)
n = 50
Ipoteza alternativă H A : m  8.65 (unilaterală stânga)
x = 8.631
s = 0.105 t ( n − 1)

Rcr = t t  t (n − 1)
x − m0
Calculăm valoarea statisticii t = tcalc = = −0.866
s
n

tcritic = t ( n − 1) = t0.05 ( 49 ) = −t0.95 ( 49 ) = −1.676

deoarece tcalc  Rcr , acceptăm ipoteza de nul, la nivelul de semnificație de 0.05 (salariul mediu pe oră nu
diferă semnificativ de 8.65 euro)

S-ar putea să vă placă și