Sunteți pe pagina 1din 12

Estimaii statistice.

Teste de ipotez

PARTEA a II-a
METODE DE PRELUCRARE I INTERPRETARE A
DATELOR STATISTICE
5. ESTIMAII STATISTICE. TESTE DE IPOTEZ
5.1.CONSIDERAII GENERALE ASUPRA SONDAJULUI
Experimentele statistice se fac ntotdeauna n vederea estimrii
valorilor necunoscute ale parametrilor unei legi de repartiie sau ale unor
funcii ale acestora. Observaiile, care se fac asupra unei populaii, pot fi
totale sau pariale, dac sunt cuprinse n cercetare toate unitile
elementare sau numai o parte. Unitile elementare (statistice) sau mai
simplu elementele statistice au caracteristici proprii ns, luate n ansamblul
unei populaii, acestea se supun unor legi statistice. Populaiile pot fi finite
(numrabile) sau infinite. n acelai timp populaiile finite sunt reale n
sensul c formeaz un numar finit de uniti determinate calitativ n spatiu
i timp.
n cercetare, n industrie, conceptul de populaie poate avea i alt
aspect. De exemplu msurm tensiunea de strpungere a unui interval.
Numrul de determinri fcut reprezint o populaie finit i real. n
acelai sens, se poate privi i producia de piese la o main automat care,
de asemenea, poate fi foarte mare, dar finit. Pe lang aceste populaii reale
putem s ne imaginm i o populaie ipotetic, format din mulimea
tuturor cazurilor posibile, adic mulimea tuturor determinrilor
experimentale posibile sau a tuturor elemntelor posibile a fi fabricate.
Cercetarea unitar a ntregii populaii, chiar i atunci cnd este finit este
greu de realizat i neeconomic. Practic, descrierea populaiei se face
considernd o parte din populaie (o subpopulaie). Astfel, dintr-o
populaie originar (lot), se cerceteaz o subpopulaie denumit
eantion sau selecie. Numrul de elemente cuprins n eantion se
numete volumul eantionului. Din punct de vedere al volumului,
eantionul poate fi de volum mic (n 30) sau mai mare (n > 30). Operaia
de extragere (prelevare) la ntmplare a unui eantion i de achiziie a
datelor se numete sondaj. Scopul principal al unui sondaj este acela de a
obine, cu un efort minim (volum minim de experimentri), un volum
maxim de informaii asupra populaiei originare.
Referitor la o caracteristic oarecare, cercetarea eantionar poate
avea ca scop stabilirea repartiiei de frecven sau a valorilor tipice.

129

CALITATEA PRODUSELOR I FIABILITATEA

O importan covritoare asupra preciziei rezultatelor o are modul


de efectuare a sondajului. Condiia esenial este reprezentativitatea.
Sondajul poate fi: pur aleator, dirijat sau mixt. Sondajul pur aleator se
obine prin prelevarea elementelor la ntmplare, fiecare element avnd
aceeai probabilitate de a fi extras. Prin acesta se obine o bun concordan
ntre structura eantionului i structura populaiei originare. Eantionul
populaiei este n acest caz reprezentativ. Eantionul nereprezentativ
conduce la un rezultat fals. Sondajul dirijat se efectueaz dup anumite
reguli prestabilite n scopul evitrii diferitelor influene (opinii personale,
inclinaii, caracteristica cercetat). Sondajul mixt const n divizarea
populaiei n straturi urmat de prelevarea aleatoare din fiecare strat.
Realizarea unui eantion se efectueaz n mai multe faze. Indiferent prin ce
procedeu se obine eantionul, rezultatele interpretrilor sunt dependente de
gradul n care este reprezentat structura populaiei originare n eantion.
Se numete eantion reprezentativ, eantionul care red cu fidelitate
structura populaiei. Sondajele incorecte duc la eanioane
nereprezentative. Erorile de sondaj pot avea mai multe cauze: tehnica
defectuoas de alegere, instrumente de msura imperfecte sau
necorespunzatoare i interveniile premeditate sau nepremeditate ale
observatorului.
Se subliniaz faptul, atestat experimental, c prin structura sa
pshihologic observatorul are tendina de a se ndeprta de caracterul pur
aleator n alegerile sale. Teoria sondajului a elaborat o serie de procedee i
tehnici pentru a realiza caracterul aleator al sondajului difereniat funcie de
volumul eantionului. Exist tabele cu numere ntamplatoare, stabilite prin
metoda Monte-Carlo, pentru obinerea unui eantion denumit randomizat
(ntamplator). Sondajul poate fi repetat, dac elementul prelevat este
reintrodus n populaia originar, i nerepetat, dac elementele nu se
introduc. Pentru sondajul repetat se mai utilizeaz denumirile de
bernoullian sau nonexhaustiv, iar pentru sondajul nerepetat
nebernoullian sau exhaustiv.
5.2.

ESTIMAII I ESTIMATORI

Considerm o variabil aleatoare X, la care legea de repartiie este


exprimat printr-o funcie dat (densitatea de repartiie sau funcie de
repartiie). Aceast funcie este specificat, dac conine anumii parametri
necunoscui (media, dispersia, etc.) sau complet specificat, dac sunt
cunoscui toi parametrii. Dac repartiia nu se cunoate se poate spune c
repartiia este nespecificat. Operaia prin care se determin valorile
parametrilor se numeste estimaie. Deci estimarea nseamn, n general, a
cerceta i determina parametrii unei legi de repartiie date sau a determina
indicatorii teoretici (valorile tipice) pe baza datelor de eantion.

130

Estimaii statistice. Teste de ipotez

Pentru a efectua estimarea, formula, regula aleas sau statistica


utilizat, se numete estimator (de exemplu x este estimatorul valorii
adevrate ). Estimatorul este la rndul sau o variabil aleatoare
dependent de eantion.
Estimaia poate fi punctual, dac parametrul a al populaiei se
estimeaz printr-o valoare izolat determinat cu un estimator E (
x1 , x2 ,...., xn ) pe baza datelor eantionare sau poate fi o estimaie cu
interval de ncredere dac se stabilete un interval ( E 1 , E 2 ), care s
includ, cu o probabilitate dat P, valoarea adevarat a, a parametrului
estimat, a[ E 1 , E 2 ]. Estimaia punctual nu coincide, n general, cu
adevarata valoare a parametrului, dar este apropiat.
Parametrii populaiei pot fi estimai cu ajutorul mai multor estimatori
diferii avnd n consecina i precizia diferite. Estimaia i estimatorii pot
fi apreciai prin prisma unor criterii denumite:
- consisten;
- nedeplasare;
- eficien;
- suficien.

Fie a valoarea unui parametru al populaiei i E ( x1 , x 2 ,...., x n )


valoarea estimatorului punctual determinat pe baza valorilor x1 , x 2 ,..., x n
ale eantionului.
Dac estimatorul tinde ctre valoarea a cnd numrul msurrilor n
crete necontenit:
lim E ( x1 , x 2 xn ) a

(5.1)
estimaia este consistena. Estimaia este deplasat i se mai numete
corect sau consistent deplasat dac estimatorul ndeplineste
condiiile:

M [ E ( x1 , x 2 ,...., x n )] a A(n)

lim A(n) 0

lim D[ E ( x1 , x 2 x n )] 0

(5.2)
Se numete estimaie nedeplasat (absolut corect sau
consistent nedeplasat) dac:
n

M [ E ( x1 , x2 ,...., xn )] a

lim D[ E ( x1 , x 2 ,...., x n )] 0
n

(5.3)
Estimaia se numete eficient dac estimatorul este nedeplasat i
are dispersie minim. De asemenea, estimaia este suficient sau

131

CALITATEA PRODUSELOR I FIABILITATEA

exhaustiv dac se utilizeaz complet ntreaga informaie a eantionului.


Se subliniaz faptul c estimatorul eficient al unui parametru pentru o
anumit lege de repartiie nu este identic cu estimatorul eficient al aceluiai
parametru, dar pentru alt lege de repartiie.
n general, un bun estimator trebuie s ndeplineasc urmtoarele
condiii (condiiile Yule): s fie obiectiv, s depind de toate observaiile
seriei, s aib semnificaii concrete, s fie simplu i uor de calculat i s
fie puin sensibil la fluctuaiile eantionului.
Ca notaii se folosesc n general litere latine x , m, s pentru parametrii
eantionului (valori estimate) i literele greceti ( , , ) pentru cei ai
populaiei (valori adevrate).
n continuare vom avea n vedere sondajul aleator simplu cu o
singur caracteristic a populaiei. n foarte multe cazuri, valorile
x1 , x2 ,...., xn ale unui eantion reprezint rezultatul unor experimente care
pot fi repetate la infinit i n consecin extragerea s se considere tiind
dintr-o populatie ipotetic infinit, (fiecare unitate ramnnd n cadrul
populaiei originare, iar variabilele eantionului fiind independente ntre
ele).
5.3.

ESTIMAII PUNCTUALE

5.3.1

ESTIMATORII PUNCTUALI AI VALORILOR TIPICE

5.3.1.1 Estimatorii mediei teoretice

a) Media de eantion x a unei caracteristici:


Media teoretic are ca estimator punctual media de eantion
(eantionar) x .
x

1 n
xi
n 1
.

Se tie c media eantionului se calculeaz cu relaia


Pentru exemplificare se va considera o populaie finit avnd N elemente
cu M[X] = , din care se extrag k eantioane cu volume egale n.
n tabelul 5.1 considerndu-se o populaie de rezistoare, sunt
cuprinse valorile rezistenelor msurate la ase eantioane (k = 6) cu
volume egale (n = 5) i mediile x j ale fiecrui eantion.
Media mediilor de selecie (mediilor eantionare) se obine cu
valorile din tabelul 5.1.

132

Estimaii statistice. Teste de ipotez

Valorile msurate ale caracteristicii R []. Tabelul 5.1


VariabiEantionul
la
1
2
3
4
5
6
x ij
999,1
1003,2 1002,1
999,2
989,7
1006,7
1012,3
916,4
1001,2
995,3
1008,7
993,4
998,1
947,9
1003,1 1002,6 1001,8
996,5
992,8
1006,5 1004,5 1000,3 1014,5
998,6
989,4
1002,9
949,3
994,7
1007,6 1000,9
xj
998,3
1001,4 1001,8
998,4
1004,5
999,2

Se consider

xj

cu o variabil eantionar, iar media mediilor x

este:
x

1 k
1 k 1 n
x j xij 1000,6

k j 1
k j 1 n i 1

Considernd populaia format din totalitatea eantioanelor, media


teoretic este:

1 N
x i 1000,6 x
N i 1

S analizm ce tip de estimator este media eantionar x .


Conform (5.1) la (5.3) trebuie s se calculeaze media M [x ] i D[x ] .
Media estimatorului x este dat de relaia:
1 n 1 n
n
xi M [ x i ]

n
n i 1 n i 1

M [x] M

Fiecare valoare
Deci :

xi

are ca medie teoretic M [ xi ] .

(5.4)

M [x ]

(5.5)
Dac estimarea punctual se face prin mai multe eantioane cu
volume diferite, n1 , n 2 ,...., n m , la care s-au obinut mediile de selecie
x1 , x 2 ,...., x n , media mediilor x (media general) va fi:
x

n1 x1 n2 x 2 ... nm x m 1 m
ni x i
n1 n2 ... nm
n 1

(5.6)

n ni

1
unde:
b) Dispersia mediei de eantion x2 .
Toate valorile x ale populaiei, deci i valorile xi ale eantionului;
definesc o dispersie teoretic (adevrat) D[ x] 2 . Dar x este un alt tip
de v.a.; este o statistic.

133

CALITATEA PRODUSELOR I FIABILITATEA

Se pune problema stabilirii dispersiei x2 a acestei variabile.


Cunoscnd c dispersia unei v.a. x nmulit cu o constant c este
D[cX ] c 2 D[ X ] c 2 2 rezult:
1 n
1
D[ x ] x2 D xi 2 D
n 1 n

1 n
n 2 2
x

D
[
x
]

i n2 i n2 n
1

1
n

(5.7)

Abaterea standard a mediei de eantion este:


x

(5.8)
Observaie: estimatorul punctual x are media egal cu i dispersia
x2

2
n

, adic
(nedeplasat).

lim x2 0
n

. n consecin, estimatorul x este absolut corect

Se observ faptul, foarte important, c media aritmetic pentru un


numr suficient de mare n i piedre caracterul de variabil aleatoare.
Dac eantionul provine dintr-o populaie infinit cu reprtiia
2
normal N ( , ) , media de eantion x , are de asemenea o repartiie

2
x : N ,
n

.
normal
n Fig. 5.1 sunt reprezentate densitile de probabilitate ale
variabilelor aleatoare x i x cu repartiii normale.
f ( x),

f (x)

f ( x ); N : ,
n

x,x

Fig. 5.1 Curba densitii de probabilitate a variabilelor x i x .

134

f ( x); N : , 2

Estimaii statistice. Teste de ipotez

5.3.1.2

Estimatorul momentului initial de ordin k(k > 1)

Se consider ca momentul teoretic iniial de ordin k, k este estimat


cu ajutorul unui eantion prin estimatorul:
mk'

1 n k
xi
n 1

(5.9)
Pentru a analiza ce tip de estimator este estimatorul punctual mk
calculm media M [m k ] i dispersia D[ mk ] .
Media estimatorului este:
M [m k'

1 n k 1 n
] M xi M [ xik ]
n 1
n 1

nlocuim conform (3.10)

(5.10)

M [ x k ] M [ X k ] k'

se obine:

1
M [m k' ] n k' k'
n

Statistica
dispersia:

mk'

(5.11)
fiind o variabil aleatoare independent, va avea

'
'2
n

1
D[mk' ] 2 {M [ xi2k ] M 2 [ xik ]} 2k k
n
n i1

(anexa 5.1)
(5.12)
n conformitate cu (5.3) statistica (5.9) este un estimator absolut
'
corect al momentului initial k .
5.3.1.3

Estimatorul dispersiei teoretice 2

Dispersia de eantion (eantionar) se determin cu relaia:


n

1
~ 2 ( xi x ) 2 m 2
n 1

(5.13)
S analizm ce fel de estimator este dispersia reprezentat de
expresia (5.13). Pentru aceasta se determin media i dispersia
estimatorului respectiv:
a) Media dispersiei de eantion.
1 n
1 n

M [~ 2 ] M ( xi x ) 2 M {( xi ) ( x )}2
n 1
n 1

1
M {( x i ) 2 2( x i )( x ) ( x ) 2 }
n 1

(5.14)

nlocuind:
n

2 ( xi )( x ) 2( x )
i 1

i 1

i 1

xi

135

2( x )(nx n ) 2n( x )

(5.15)

CALITATEA PRODUSELOR I FIABILITATEA

i
n

( x ) 2 n( x ) 2

(5.16)

i 1

se obine
1
M [~ 2 ] M
n

1
( x i ) 2 n( x ) 2 n
i 1

M [( xi ) 2 nM [( x ) 2 ]
(5.17)

Dar:
n

i 1

i 1

M [( x ) 2 ] 2 n 2

(5.18)

De asemenea, conform deniiei generale a dispersiei:


M [( x ) 2 ] x2

2
n

(5.19)

nlocuind (5.18) i (5.19) n (5.17), se obine:

1
1
n 1 2
M [~ 2 ] M [m 2 ] M [( x i x ) 2 ] (n 2 2 )

n
n
n
~2]
D[

(5.20)

b) Dispersia dispersiei de eantion


Considernd definiia momentelor centrate rezult c expresia (5.12)
reprezint estimatorul momentului centrat de ordin 2:

Deci:

1 n
2
~
( xi x ) 2 m2
n i 1

(5.21)

D[~ 2 ] D[ m2 ] M [(m2 M [ m2 ]) 2 ]

(5.22)

sau conform celor prezentate n anexa 5.2:


3

( n 1)
( n 1)(n 3) 4
D[~ 2 ] 2~ 2
M[X 4 ]

4
n
n3

(5.23)
2
Relaiile (5.20) i (5.23) arat c dispersia eantionar exprimat
prin (5.13) este un estimator deplasat.
c) Dispersia eantionar corectat (estimatorul corectat al
dispersiei).
Pornind de la relaia (5.20) se corecteaz estimatorul dispersiei de
2
selecie ~ cu raportul n n 1 . Acest estimator denumit dispersia de
2
eation corectat se noteaz cu s i are expresia:
s2

n ~2
n 1 n
1 n

( xi x ) 2
( xi x ) 2

n 1
n 1 n i 1
n 1 i 1

(5.24)

Media dispersiei de selecie corectat este:


M [s 2 ]

n
M [( xi x ) 2 ]
n 1

(5.25)

136

Estimaii statistice. Teste de ipotez

Conform notaiei (5.20):


M [( xi x ) 2 ] ( n 1) 2

(5.26)

Deci:
M [s 2 ] 2

(5.27)

n mod similar cazului anterior se poate obine:


lim D[ s 2 ] 0

Estimaia (5.24) este nedeplasat i consistent ns nu este eficient


(dispersia sa tinznd ctre valoarea minim cnd numrul msurtorilor
crete la infinit, adic este asimtotic eficient).
Dac exist m selecii de volum diferit, drept estimaie a dispersiei,
se ia media ponderat a dispersiilor de selecie:
m

s 2 ( ni 1) si2
i 1

(ni 1)

(5.28)

i 1

Pentru cazul particular n1 n2 .... nm n :


s2

1 m 2
si
m i 1

(5.29)
Dac dispersia de selecie, s , este calculat cu valori grupate pe
intervale cu amplitudunea intervalului se poate face o corecie (corecia
Sheppard):
*2

2 s *2 2 / 12

Abaterea standard eantionar se determin cu relaia:


1 n
~
( xi x ) 2

n i 1

(5.30)

sau cu estimatorul corectat:


s

1 n
( xi x ) 2

n 1 i 1
~

i s nu sunt nedeplasai

Estimatorii
Corectarea estimatorului prezint anumite dificulti.

(5.31)

( M [ s ] B( , n)) .

Se cunosc i alte relaii de calcul, dar expresiile (5.30) i (5.31) sunt


cele mai utilizate.
Considernd valorile unui eantion x1 , x 2 ,...., x n ca variabile
aleatoare independente, fiecare urmnd o lege de repartiie normal
N ( , 2 ) , rezult c variabila aleatoare definit de expresia:

are o repartiie

2.

x x
1

(n 1) s 2 n 1 2

zi
2
i 1

137

CALITATEA PRODUSELOR I FIABILITATEA

Fr demonstraie mai menionm urmtoarea concluzie general:


dac x1 , x 2 ,...., x n sunt variabile aleatoare independente cu repartiie
2
normal, cu aceeai medie dispersie, variabilele aleatoare x i s sunt
independente.
2
Deci repartiia probabilitii variabilei s nu depinde de valorile pe
care le capt variabila aleatoare x chiar dac sunt calculate pe acelai
eantion.
Atragem atenia c analizele statistice n industrie se ntlnesc de
multe ori cu procese nereglate sau nestabilizate (produs nou intrat n
fabricaie, o nou tehnologie, un nou material, etc.).
Calculul abaterii standard, n aceste situaii cnd i media populaiei
variaz, conduce la erori mari.
ESTIMAREA PUNCTUAL A PARAMETRILOR UNEI
LEGI DE REPARTIIE. METODA VEROSIMILITII
MAXIME.

5.3.2

Dac legea de repartiie a unei populaii este cunoscut i funcia


densitii de probabilitate depinde de anumii parametri 1 , 2 , 3
necunoscui, acetia pot fi estimai cu ajutorul metodei verosimilitii
maxime.
Estimatorii respectivi se numesc estimatori de verosimilitate maxim
i sunt estimatori punctuali.
Fie un eantion de volum n avnd valorile x1 , x 2 ,...., x n , ale unei
caracteristici X, a populaiei cu densitatea de probabilitate:
f ( xi , 1 , 2 ,...)
(5.32)
Se numete funcie de verosimilitate funcia:
n

L f ( x1 , 1 , 2 , ) f ( x 2 , 1 , 2 ,) f ( x n , 1 , 2 ,) f ( x1 , 1 , 2 ,)
1

(5.33)

Estimaia cu verosimilitate maxim pentru parametrii 1 , 2 , se


obine atunci cnd funcia L are valoarea maxim.
Estimatorii punctuali 1 , 2 ai parametrilor 1 , 2 , se obin din
soluiile ecuaiilor:
L

... 0

(5.34)

Calculele se simplific n general dac funcia de verosimilitate se


logaritmeaz,

138

Estimaii statistice. Teste de ipotez

ln L ln

i 1

ln f ( xi , 1 , 2 ,...)

f ( xi ,1 , 2 ,...)

(5.35)

i 1

Obinndu-se sistemul de verosimilitate:


ln L

ln L

... 0

(5.36)

Estimatorul este eficient dac soluia ecuaiei de verosimilitate


L
A[t ( )]

Este de forma: t ()
De exemplu, pentru a determina expresia estimatorului parametrului al
legii de repartiie normal, s considerm un eantion cu valorile
x1 , x2 ,..., xn . Funcia de verosimilitate a repartiiei normale va fi:
n

L
i 1

sau: L C e

1
2 2

1
f ( xi , , )
e
2

( xi ) 2
2

( xi ) 2
2 2

( xi ) 2
n

1
ln L ln C 2
2
Conform relaiei (5.35):

( xi ) 2
i 1

Estimatorul parametrului conform (5.36) este:


ln L

Deoarece

2
2 2

( xi ) 0
i 1

estimatorul de verosimilitate maxim rezult:


1 n
xi x
n i 1

Deci estimatorul punctual al mediei teoretice este media eantionar

x , fapt cunoscut.

Estimatorul dispersiei
verosimilitate scris sub forma:

1
L

2 2

se obine pornind de la funcia de


n/2 1
( x )2
2 i
2

sau:
n
1
ln L ln(2 2 )
2
2 2

Estimatorul

( xi ) 2
i 1

se determin din ecuaia:

ln L
2

n
1
4
2
2
2

( xi ) 2 0
i 1

de unde se ajunge la estimatorul de verosimilitate maxim a dispersiei


cunoscute:

139

CALITATEA PRODUSELOR I FIABILITATEA

( 2 )

1 n
( xi ) 2

n i 1
.

Estimatorul punctual de verosimilitate maxim al abaterii standard conform


definiiei este:
( 2 )

1 n
( xi ) 2

n i 1
.

Aceast relaie se poate obine i pornind de la funcia de


verosimilitate scriind ecuaia:
ln L

Se constat astfel proprietatea de invarian a estimaiilor de


2
2
verosimilitate conform egalitii care se poate enuna astfel: dac
este estimaia verosimil a lui , atunci f () este estimaia verosimil
a lui f ( ) .
Dispersia estimatorului unui parametru oarecare se poate
determina cu expresia:
2 ln L
2 2

(5.38)

n cazul repartiiei normale

N ( , 2 )

se obine:

2 ln L
n
2
2

Conform (5.38) dispersia estimatorului de verosimilitate maxim a


parametrului este:
2 ln L
x2 2

2
n

S-a ajuns la expresia cunoscut (5.8) aa cum era de ateptat.

140