Documente Academic
Documente Profesional
Documente Cultură
Estimatori
RECAPITULARE punctuali si
TPSM intervale de
31 mai 2022
incredere.
Lect.dr. Raluca Purnichescu Purtan
Teste statistice.
O populație statistică are caracteristica X , repartizată Weibull, cu densitatea de repartiție:
2ax e − a x , x 0
2
f ( x) = , a0
0, în rest
În urma unei selecții de volum n se obține media de selecție 2.3. Să se estimeze parametrul a 0 folosind
metoda momentelor.
Deoarece repartiția dată are un singur parametru de estimat, se va folosi doar egalitatea momentelor de ordinul întâi:
M X = x
M X = x f ( x ) dx = 2a x e
2 − a x2
dx Punem în evidență o integrală Gamma ( p ) = e − x x p −1dx
− 0 0
t
Schimbare de variabilă: ax 2 = t x =
a 1 −
1
1 1
M X = t 2
e− t dt = = =x
1 a 0
a 2 a a
dx = dt
2 at
a=
( x)
2
Din enunț știm că x = 2.3 = 2.3 de unde obținem a = 0.5929
a
Se consideră populația cu caracteristica de interes X repartizată Rayleigh, cu densitatea de repartiție:
−
x2
x
f ( x) = e 2 2
x 0 , 0
2
i =1 i =1 2
i =1
ln L( x, ) = ln xi − n ln ( 2 ) −
n
1
S
i =1 2 2
Se scrie ecuația de verosimilitate:
ln L ( x, ) 2n S
=0 − + =0
3
S
Estimația de verosimilitate maximă ˆ este soluția acestei ecuații, deci ˆ =
2n
2 ln L ( x, ) 2n 3S 4n 2 12n 2 8n 2
= − = − =− 0
2 = 2 4 = S S S
S
În concluzie, estimația de maximă verosimilitate este: ˆ =
2n
Se consideră populația cu caracteristica de interes X care are densitatea de repartiție:
f ( x, ) = x −1 , cu x ( 0,1) .
Să se estimeze parametrul al densității de repartiție f ( x, ) , pe baza unei selecții aleatoare de volum n ,
x1 , x2 ,..., xn , extrasă din populația :
a) Prin metoda momentelor;
b) Prin metoda verosimilității maxime.
Ați obținut același estimator? Care credeți că este motivul?
Se calculează M X = x f ( x, ) dx = x x dx = x dx =
1 1 1
−1
(1p) ;
0 0 0 +1
x
Determinarea estimatorului ca soluție a ecuației: = x , de unde se obține: = (0.5p).
+1 1− x
n n
(6p) b) Funcția de verosimilitate este: L( x, ) = f ( xi , ) = xi −1 (0.5p);
i =1 i =1
n
Se poate nota ln x
i =1
i = S , deci ln L( x, ) = n ln + ( − 1) S ;
ln L ( x, ) n
Se scrie ecuația de verosimilitate: = 0 care este echivalentă cu: + S = 0 . (1.5p)
n n
Estimația de verosimilitate maximă ˆ este soluția acestei ecuații, deci ˆ = − =− n
. (0.5p)
ln ( x )
S
i
i =1
2 ln L ( x, ) n 2 ln L ( x, ) n S2
Verificăm că este punct de maxim: 0 pentru = − : =− =− 0 (2p)
2 S 2 = 2 = n
n
În concluzie, estimația de maximă verosimilitate este ˆ = − n
.
ln ( x )
i =1
i
(2p) Cei 2 estimatori pot diferi pentru că metoda momentelor NU asigură găsirea unui estimator eficient (pe când metoda verosimilității
maxime da).
Concluzia ar fi că estimatorul determinat prin metoda momentelor (în această problemă) NU este eficient.
O companie IT lansează pe piață un nou produs și este interesată de viteza de absorbție a produsului pe piață
(adică numărul de zile de la desfacere până la epuizarea produsului), reprezentată printr-o variabilă aleatoare
cu repartiția normală. Compania a trimis câte un produs la 6 dintre reprezentanțele sale și a primit informațiile
legate de viteza de absorbție:
Reprezentanța 1 2 3 4 5 6
Nr zile (absorbție) 35 52 35 45 38 35
n=6
6
n 6
( xi − x ) ( xi − 40)
1 1 1 1 248
x= xi = 240 = 40 s = = = = 49.6
2 2 2
6 i =1 6 n −1 i =1 5 i =1 5
= 0.05
a) Suntem în cazul necunoscut. Intervalul de încredere pentru m este:
s2 s2
I =x − t ( n − 1) , x + t ( n − 1)
n 1− n 1−
2 2
1− = 0.975
I = ( 32.6 , 47.4 )
2
t0.975 ( 5 ) = 2.571
n −1 n −1
b) Intervalul de încredere pentru 2 este: I = 2 s2 , 2 s2
1 − ( n − 1) ( n − 1)
2 2
2
1−
( n − 1) = 0.025
2
(5) = 0.831
I = (19.32 , 298.43)
2
( n − 1) =
2 2
0.975 (5) = 12.833
2
Condiția ca media reală să nu difere cu mai mult de 200 de la media selecției se transcrie: x − m 200
x − 200 m x + 200
Intervalul de încredere pentru medie în cazul cunoscut se scrie ca inegalitate:
x− z m x+ z
n 1− n 1−
2 2
z = 200
n 1− 1050
2 1.96 = 200 n = 106
n
= 1050
Se testează rezistența în ohmi pentru 5 bucăți de cablu și se găsesc valorile: 1.51, 1.49, 1.54, 1.52 și 1.54. Dacă
cablul ar fi din argint pur, rezistența lui ar fi de 1.5 ohmi. Dacă argintul nu este pur, rezistența lui crește. Testați
la un nivel de semnificație de 0.05 faptul că argintul din cablu nu este pur.
x = 1.52
1
x=
5 i =1
i
tcalc = 2.108 tcritic = t1− (n − 1) = t0.95 ( 4 ) = 2.132
5
( xi − 1.52)
1
s = = 0.00045
2 2
t ( n − 1)
= 0.01
n1 = 9 n2 = 25
Rcr = t t t (n − 1)
x1 = 715 x2 = 735
n = min(n1 −1, n2 −1) = 8
s = 32 = 1024
2 2
s = 6 = 36
2 2
1 2
x1 − x2
Calculăm valoarea statisticii t = tcalc = = −1.863
2 2
Ipoteza de nul H 0 : m1 = m2 s1
+
s 2
n1 n2
Ipoteza alternativă H1 : m1 m2 (unilaterală stânga).
tcritic = t (n − 1) = t0.01 ( 7 ) = −t0.99 ( 7 ) = −2.998
z1−
Rcr = z z z1− zcalc Rcr
zcritic = z1 − = z0.99 = 2.33 acceptăm ipoteza de nul (proporțiile nu diferă).
Președintele unei companii afirmă că angajații săi au un salariu mediu pe oră de 8.65 euro. Un sondaj asupra a
50 de angajați are următoarea distribuție:
Interval 8.35 - 8.43 8.44 - 8.52 8.53 - 8.61 8.62 - 8.70 8.71 - 8.79 8.80 - 8.88
Frecv. 2 6 12 18 10 2
Să se testeze afirmația președintelui, la un prag de semnificație de 0.05 (considerând repartiția salariilor ca fiind normală).
Ce este puțin diferit la acest enunț față de enunțurile ”clasice” este modul de prezentare al datelor, pe intervale de
valori (în statistică se numesc clase). Pentru acest tip de date de selecție se consideră valoarea din mijloc a fiecărui
interval ca fiind reprezentativă. Astfel obținem datele de selecție echivalente:
Rcr = t t t (n − 1)
x − m0
Calculăm valoarea statisticii t = tcalc = = −0.866
s
n
deoarece tcalc Rcr , acceptăm ipoteza de nul, la nivelul de semnificație de 0.05 (salariul mediu pe oră nu
diferă semnificativ de 8.65 euro)