Sunteți pe pagina 1din 12

PARTEA a II-a

METODE DE PRELUCRARE I INTERPRETARE


A DATELOR STATISTICE
5. ESTIMAII STATISTICE. TESTE DE IPOTEZ
5.1. CONSIDERAII GENERALE ASUPRA SONDAJULUI
Experimentele statistice se fac ntotdeauna n vederea estimrii
valorilor necunoscute ale parametrilor unei legi de repartiie sau ale unor
funcii ale acestora. Observaiile, care se fac asupra unei populaii, pot fi
totale sau pariale, dac sunt cuprinse n cercetare toate unitile
elementare sau numai o parte. Unitile elementare (statistice) sau mai
simplu elementele statistice au caracteristici proprii ns, luate n ansamblul
unei populaii, acestea se supun unor legi statistice. Populaiile pot fi finite
(numrabile) sau infinite. n acelai timp populaiile finite sunt reale n
sensul c formeaz un numar finit de uniti determinate calitativ n spatiu
i timp.
n cercetare, n industrie, conceptul de populaie poate avea i alt
aspect. De exemplu msurm tensiunea de strpungere a unui interval.
Numrul de determinri fcut reprezint o populaie finit i real. n
acelai sens, se poate privi i producia de piese la o main automat care,
de asemenea, poate fi foarte mare, dar finit. Pe lang aceste populaii reale
putem s ne imaginm i o populaie ipotetic, format din mulimea
tuturor cazurilor posibile, adic mulimea tuturor determinrilor
experimentale posibile sau a tuturor elemntelor posibile a fi fabricate.
Cercetarea unitar a ntregii populaii, chiar i atunci cnd este finit este
greu de realizat i neeconomic. Practic, descrierea populaiei se face
considernd o parte din populaie (o subpopulaie). Astfel, dintr-o
populaie originar (lot), se cerceteaz o subpopulaie denumit
eantion sau selecie. Numrul de elemente cuprins n eantion se
numete volumul eantionului. Din punct de vedere al volumului,
eantionul poate fi de volum mic (n 30) sau mai mare (n > 30). Operaia
de extragere (prelevare) la ntmplare a unui eantion i de achiziie a
datelor se numete sondaj. Scopul principal al unui sondaj este acela de a
obine, cu un efort minim (volum minim de experimentri), un volum
maxim de informaii asupra populaiei originare.
CALITATEA PRODUSELOR I FIABILITATEA
Referitor la o caracteristic oarecare, cercetarea eantionar poate
avea ca scop stabilirea repartiiei de frecven sau a valorilor tipice.
O importan covritoare asupra preciziei rezultatelor o are modul
de efectuare a sondajului. Condiia esenial este reprezentativitatea.
Sondajul poate fi: pur aleator, dirijat sau mixt. Sondajul pur aleator se
obine prin prelevarea elementelor la ntmplare, fiecare element avnd
aceeai probabilitate de a fi extras. Prin acesta se obine o bun concordan
ntre structura eantionului i structura populaiei originare. Eantionul
populaiei este n acest caz reprezentativ. Eantionul nereprezentativ
conduce la un rezultat fals. Sondajul dirijat se efectueaz dup anumite
reguli prestabilite n scopul evitrii diferitelor influene (opinii personale,
inclinaii, caracteristica cercetat). Sondajul mixt const n divizarea
populaiei n straturi urmat de prelevarea aleatoare din fiecare strat.
Realizarea unui eantion se efectueaz n mai multe faze. Indiferent prin ce
procedeu se obine eantionul, rezultatele interpretrilor sunt dependente de
gradul n care este reprezentat structura populaiei originare n eantion.
Se numete eantion reprezentativ, eantionul care red cu fidelitate
structura populaiei. Sondajele incorecte duc la eanioane
nereprezentative. Erorile de sondaj pot avea mai multe cauze: tehnica
defectuoas de alegere, instrumente de msura imperfecte sau
necorespunzatoare i interveniile premeditate sau nepremeditate ale
observatorului.
Se subliniaz faptul, atestat experimental, c prin structura sa
pshihologic observatorul are tendina de a se ndeprta de caracterul pur
aleator n alegerile sale. Teoria sondajului a elaborat o serie de procedee i
tehnici pentru a realiza caracterul aleator al sondajului difereniat funcie de
volumul eantionului. Exist tabele cu numere ntamplatoare, stabilite prin
metoda Monte-Carlo, pentru obinerea unui eantion denumit randomizat
(ntamplator). Sondajul poate fi repetat, dac elementul prelevat este
reintrodus n populaia originar, i nerepetat, dac elementele nu se
introduc. Pentru sondajul repetat se mai utilizeaz denumirile de
bernoullian sau nonexhaustiv, iar pentru sondajul nerepetat
nebernoullian sau exhaustiv.
5.2. ESTIMAII I ESTIMATORI
Considerm o variabil aleatoare X, la care legea de repartiie este
exprimat printr-o funcie dat (densitatea de repartiie sau funcie de
repartiie). Aceast funcie este specificat, dac conine anumii parametri
necunoscui (media, dispersia, etc.) sau complet specificat, dac sunt
cunoscui toi parametrii. Dac repartiia nu se cunoate se poate spune c
repartiia este nespecificat. Operaia prin care se determin valorile
parametrilor se numeste estimaie. Deci estimarea nseamn, n general, a
130
Estimaii statistice. Teste de ipotez
cerceta i determina parametrii unei legi de repartiie date sau a determina
indicatorii teoretici (valorile tipice) pe baza datelor de eantion.
Pentru a efectua estimarea, formula, regula aleas sau statistica
utilizat, se numete estimator (de exemplu
x
este estimatorul valorii
adevrate ). Estimatorul este la rndul sau o variabil aleatoare
dependent de eantion.
Estimaia poate fi punctual, dac parametrul a al populaiei se
estimeaz printr-o valoare izolat determinat cu un estimator
E

(
n
x x x ,...., ,
2 1
) pe baza datelor eantionare sau poate fi o estimaie cu
interval de ncredere dac se stabilete un interval (
2 1
, + E E
), care s
includ, cu o probabilitate dat P, valoarea adevarat a, a parametrului
estimat, a[
2 1
, + E E
]. Estimaia punctual nu coincide, n general, cu
adevarata valoare a parametrului, dar este apropiat.
Parametrii populaiei pot fi estimai cu ajutorul mai multor estimatori
diferii avnd n consecina i precizia diferite. Estimaia i estimatorii pot
fi apreciai prin prisma unor criterii denumite:
- consisten;
- nedeplasare;
- eficien;
- suficien.
Fie a valoarea unui parametru al populaiei i
) ,...., , (

2 1 n
x x x E

valoarea estimatorului punctual determinat pe baza valorilor
n
x x x ,..., ,
2 1

ale eantionului.
Dac estimatorul tinde ctre valoarea a cnd numrul msurrilor n
crete necontenit:
a x x x E
n
n


) , (

lim
2 1

(5.1)
estimaia este consistena. Estimaia este deplasat i se mai numete
corect sau consistent deplasat dac estimatorul ndeplineste
condiiile:

+


0 )] , (

[ lim
0 ) ( lim
) ( )] ,...., , (

[
2 1
2 1
n
n
n
n
x x x E D
n A
n A a x x x E M

(5.2)
Se numete estimaie nedeplasat (absolut corect sau
consistent nedeplasat) dac:


0 ) ] , . . . . , , (

[ l i m
) ] , . . . . , , (

[
2 1
2 1
n
n
n
x x x E D
a x x x E M
(5.3)
131
CALITATEA PRODUSELOR I FIABILITATEA
Estimaia se numete eficient dac estimatorul este nedeplasat i
are dispersie minim. De asemenea, estimaia este suficient sau
exhaustiv dac se utilizeaz complet ntreaga informaie a eantionului.
Se subliniaz faptul c estimatorul eficient al unui parametru pentru o
anumit lege de repartiie nu este identic cu estimatorul eficient al aceluiai
parametru, dar pentru alt lege de repartiie.
n general, un bun estimator trebuie s ndeplineasc urmtoarele
condiii (condiiile Yule): s fie obiectiv, s depind de toate observaiile
seriei, s aib semnificaii concrete, s fie simplu i uor de calculat i s
fie puin sensibil la fluctuaiile eantionului.
Ca notaii se folosesc n general litere latine
s m x , ,
pentru
parametrii eantionului (valori estimate) i literele greceti ( , , )
pentru cei ai populaiei (valori adevrate).
n continuare vom avea n vedere sondajul aleator simplu cu o
singur caracteristic a populaiei. n foarte multe cazuri, valorile
n
x x x ,...., ,
2 1
ale unui eantion reprezint rezultatul unor experimente care
pot fi repetate la infinit i n consecin extragerea s se considere tiind
dintr-o populatie ipotetic infinit, (fiecare unitate ramnnd n cadrul
populaiei originare, iar variabilele eantionului fiind independente ntre
ele).
5.3. ESTIMAII PUNCTUALE
5.3.1 ESTIMATORII PUNCTUALI AI VALORILOR TIPICE
5.3.1.1 Estimatorii mediei teoretice
a) Media de eantion
x
a unei caracteristici:
Media teoretic

are ca estimator punctual media de eantion


(eantionar)
x
.
Se tie c media eantionului se calculeaz cu relaia

n
i
x
n
x
1
1
.
Pentru exemplificare se va considera o populaie finit avnd N elemente
cu M[X] = , din care se extrag k eantioane cu volume egale n.
n tabelul 5.1 considerndu-se o populaie de rezistoare, sunt
cuprinse valorile rezistenelor msurate la ase eantioane (k = 6) cu
volume egale (n = 5) i mediile
j
x
ale fiecrui eantion.
Media mediilor de selecie (mediilor eantionare) se obine cu
valorile din tabelul 5.1.
132
Estimaii statistice. Teste de ipotez
Valorile msurate ale caracteristicii R [ ]. Tabelul 5.1
Variabi-
la
Eantionul
1 2 3 4 5 6
ij
x
999,1
1012,3
998,1
992,8
989,4
1003,2
916,4
947,9
1006,5
1002,9
1002,1
1001,2
1003,1
1004,5
949,3
999,2
995,3
1002,6
1000,3
994,7
989,7
1008,7
1001,8
1014,5
1007,6
1006,7
993,4
996,5
998,6
1000,9
j
x
998,3 1001,4 1001,8 998,4 1004,5 999,2
Se consider
j
x
cu o variabil eantionar, iar media mediilor
x

este:



6 , 1000
1 1 1
1 1 1
k
j
n
i
ij
k
j
j
x
n k
x
k
x
Considernd populaia format din totalitatea eantioanelor, media
teoretic este:
x x
N
N
i
i

6 , 1000
1
1

S analizm ce tip de estimator este media eantionar


x
.
Conform (5.1) la (5.3) trebuie s se calculeaze media
] [x M
i
] [x D
.
Media estimatorului
x
este dat de relaia:


1
]
1



n
n
x M
n
x
n
M x M
n
i
i
n
i
i
1 1
] [
1 1
] [
(5.4)
Fiecare valoare
i
x
are ca medie teoretic
] [
i
x M
.
Deci :
] [x M
(5.5)
Dac estimarea punctual se face prin mai multe eantioane cu
volume diferite,
m
n n n ,...., ,
2 1
, la care s-au obinut mediile de selecie
n
x x x ,...., ,
2 1
, media mediilor
x
(media general) va fi:

+ + +
+ + +

m
i i
m
m m
x n
n n n n
x n x n x n
x
1 2 1
2 2 1 1
1
...
...
(5.6)
unde:

m
i
n n
1
b) Dispersia mediei de eantion
2
x

.
Toate valorile x ale populaiei, deci i valorile x
i
ale eantionului;
definesc o dispersie teoretic (adevrat)
2
] [ x D
. Dar
x
este un alt tip
de v.a.; este o statistic.
133
CALITATEA PRODUSELOR I FIABILITATEA
Se pune problema stabilirii dispersiei
2
x

a acestei variabile.
Cunoscnd c dispersia unei v.a.
x
nmulit cu o constant c este
2 2 2
] [ ] [ c X D c cX D
rezult:
n n
n
x D
n
x D
n
x
n
D x D
n
i
n
i
n
i x
2
2
2
1
2
1
2
1
2
] [
1 1 1
] [


1
]
1

1
]
1



(5.7)
Abaterea standard a mediei de eantion este:
n
x


(5.8)
Observaie: estimatorul punctual
x
are media egal cu i
dispersia
n
x
2
2


, adic
0 lim
2

n
x

. n consecin, estimatorul
x
este absolut
corect (nedeplasat).
Se observ faptul, foarte important, c media aritmetic pentru un
numr suficient de mare n i piedre caracterul de variabil aleatoare.
Dac eantionul provine dintr-o populaie infinit cu reprtiia
normal
) , (
2
N
, media de eantion
x
, are de asemenea o repartiie
normal

,
_

n
N x
2
, :

.
n Fig. 5.1 sunt reprezentate densitile de probabilitate ale
variabilelor aleatoare
x
i
x
cu repartiii normale.
Fig. 5.1 Curba densitii de probabilitate a variabilelor
x
i
x
.
134

x
,
x

,
_

n
N x f
2
, : ); (

) ( ), ( x f x f
( )
2
, : ); ( N x f
Estimaii statistice. Teste de ipotez
5.3.1.2 Estimatorul momentului initial de ordin k(k > 1)
Se consider ca momentul teoretic iniial de ordin k,

este estimat
cu ajutorul unui eantion prin estimatorul:

n
k
i k
x
n
m
1
'
1
(5.9)
Pentru a analiza ce tip de estimator este estimatorul punctual

k
m

calculm media
] [

k
m M
i dispersia
] [

k
m D
.
Media estimatorului este:


1
]
1

n
k
i
n
k
i k
x M
n
x
n
M m M
1 1
'
] [
1 1
] [
(5.10)
nlocuim conform (3.10)
'
] [ ] [
k
k k
X M x M
se obine:
' ' '
1
] [
k k k
n
n
m M
(5.11)
Statistica
'
k
m
fiind o variabil aleatoare independent, va avea
dispersia:
n
x M x M
n
m D
k k k
i
n
i
k
i k
2 ' '
2 2
1
2
2
'
] } [ ] [ {
1
] [


(anexa 5.1) (5.12)


n conformitate cu (5.3) statistica (5.9) este un estimator absolut
corect al momentului initial
'
k

.
5.3.1.3 Estimatorul dispersiei teoretice
2

Dispersia de eantion (eantionar) se determin cu relaia:


n
i
m x x
n
1
2
2 2
) (
1
~

(5.13)
S analizm ce fel de estimator este dispersia reprezentat de
expresia (5.13). Pentru aceasta se determin media i dispersia
estimatorului respectiv:
a) Media dispersiei de eantion.

1
]
1


1
]
1



n
i
n
i
x x M
n
x x
n
M M
1
2
1
2 2
)} ( ) {(
1
) (
1
]
~
[
1
]
1

+

n
i i
x x x x M
n
1
2 2
} ) ( ) )( ( 2 ) {(
1

(5.14)
nlocuind:
) ( 2 ) )( ( 2 ) ( 2 ) )( ( 2
1 1 1

,
_




x n n x n x x x x x
n
i
n
i
i
n
i
i
(5.15)
135
CALITATEA PRODUSELOR I FIABILITATEA
i


n
i
x n x
1
2 2
) ( ) (
(5.16)
se obine

'


1
]
1

n
i
n
i
i
x nM x M
n
x n x M
n
M
1
2 2
1
2 2 2
] ) [( ) [(
1
) ( ) (
1
]
~
[
(5.17)
Dar:



n
i
n
i
n x M
1
2
1
2 2
] ) [(
(5.18)
De asemenea, conform deniiei generale a dispersiei:
n
x M
x
2
2 2
] ) [(


(5.19)
nlocuind (5.18) i (5.19) n (5.17), se obine:
2 2 2 2
2
2
1
) (
1
] ) [(
1
] [ ]
~
[
n
n
n
n
x x M
n
m M M
i


(5.20)
b) Dispersia dispersiei de eantion
]
~
[
2
D
Considernd definiia momentelor centrate rezult c expresia (5.12)
reprezint estimatorul momentului centrat de ordin 2:


n
i
i
m x x
n
1
2
2 2
) (
1
~

(5.21)
Deci:
] ]) [ [( ] [ ]
~
[
2
2 2 2
2
m M m M m D D
(5.22)
sau conform celor prezentate n anexa 5.2:
4
3
4
4
3
2
~
2
) 3 )( 1 (
] [
) 1 (
]
~
[
2

n
n n
X M
n
n
D


(5.23)
Relaiile (5.20) i (5.23) arat c dispersia eantionar
2

exprimat
prin (5.13) este un estimator deplasat.
c) Dispersia eantionar corectat (estimatorul corectat al
dispersiei).
Pornind de la relaia (5.20) se corecteaz estimatorul dispersiei de
selecie
2 ~

cu raportul
1 n n
. Acest estimator denumit dispersia de
eation corectat se noteaz cu
2
s
i are expresia:

n
i
i
n
i
i
x x
n
x x
n n
n
n
n
s
1
2
1
2 2 2
) (
1
1
) (
1
1
~
1

(5.24)
Media dispersiei de selecie corectat este:
] ) [(
1
] [
2 2
x x M
n
n
s M
i

(5.25)
136
Estimaii statistice. Teste de ipotez
Conform notaiei (5.20):
2 2
) 1 ( ] ) [( n x x M
i
(5.26)
Deci:
2 2
] [ s M
(5.27)
n mod similar cazului anterior se poate obine:
0 ] [ lim
2


s D
n
Estimaia (5.24) este nedeplasat i consistent ns nu este eficient
(dispersia sa tinznd ctre valoarea minim cnd numrul msurtorilor
crete la infinit, adic este asimtotic eficient).
Dac exist m selecii de volum diferit, drept estimaie a dispersiei,
se ia media ponderat a dispersiilor de selecie:



m
i
i
m
i
i i
n s n s
1 1
2 2
) 1 ( ) 1 (
(5.28)
Pentru cazul particular
n n n n
m
....
2 1
:

m
i
i
s
m
s
1
2 2
1
(5.29)
Dac dispersia de selecie,
2 *
s
, este calculat cu valori grupate pe
intervale cu amplitudunea intervalului se poate face o corecie (corecia
Sheppard):
12 /
2 2 * 2
s
Abaterea standard eantionar se determin cu relaia:


n
i
i
x x
n
1
2
) (
1
~

(5.30)
sau cu estimatorul corectat:

n
i
i
x x
n
s
1
2
) (
1
1
(5.31)
Estimatorii

~
i
s
nu sunt nedeplasai
)) , ( ] [ ( n B s M +
.
Corectarea estimatorului prezint anumite dificulti.
Se cunosc i alte relaii de calcul, dar expresiile (5.30) i (5.31) sunt
cele mai utilizate.
Considernd valorile unui eantion
n
x x x ,...., ,
2 1
ca variabile
aleatoare independente, fiecare urmnd o lege de repartiie normal
) , (
2
N
, rezult c variabila aleatoare definit de expresia:


,
_


1
1
2
2
2
1
2
) 1 (
n
i
i
z
s n x x

are o repartiie
2

.
137
CALITATEA PRODUSELOR I FIABILITATEA
Fr demonstraie mai menionm urmtoarea concluzie general:
dac
n
x x x ,...., ,
2 1
sunt variabile aleatoare independente cu repartiie
normal, cu aceeai medie dispersie, variabilele aleatoare
x
i
2
s
sunt
independente.
Deci repartiia probabilitii variabilei
2
s
nu depinde de valorile pe
care le capt variabila aleatoare
x
chiar dac sunt calculate pe acelai
eantion.
Atragem atenia c analizele statistice n industrie se ntlnesc de
multe ori cu procese nereglate sau nestabilizate (produs nou intrat n
fabricaie, o nou tehnologie, un nou material, etc.).
Calculul abaterii standard, n aceste situaii cnd i media populaiei
variaz, conduce la erori mari.
5.3.2 ESTIMAREA PUNCTUAL A PARAMETRILOR UNEI
LEGI DE REPARTIIE. METODA VEROSIMILITII
MAXIME.
Dac legea de repartiie a unei populaii este cunoscut i funcia
densitii de probabilitate depinde de anumii parametri
3 2 1
, ,

necunoscui, acetia pot fi estimai cu ajutorul metodei verosimilitii
maxime.
Estimatorii respectivi se numesc estimatori de verosimilitate maxim
i sunt estimatori punctuali.
Fie un eantion de volum n avnd valorile
n
x x x ,...., ,
2 1
, ale unei
caracteristici X, a populaiei cu densitatea de probabilitate:
,...) , , (
2 1

i
x f
(5.32)
Se numete funcie de verosimilitate funcia:


n
n
x f x f x f x f L
1
2 1 1 2 1 2 1 2 2 1 1
) , , , ( ) , , , ( ) , , , ( ) , , , (

(5.33)
Estimaia cu verosimilitate maxim pentru parametrii
, ,
2 1

se
obine atunci cnd funcia L are valoarea maxim.
Estimatorii punctuali
2 1
,
ai parametrilor
, ,
2 1

se obin din
soluiile ecuaiilor:
0 ...
2 1
2 1

1
]
1

1
]
1



L L
(5.34)
Calculele se simplific n general dac funcia de verosimilitate se
logaritmeaz,
138
Estimaii statistice. Teste de ipotez

1
]
1

n
i
i
n
i
i
x f x f L
1
2 1
1
2 1
,...) , , ( ln ,...) , , ( ln ln
(5.35)
Obinndu-se sistemul de verosimilitate:
0 ...
ln ln
2 1
2 1

1
]
1

1
]
1



L L
(5.36)
Estimatorul

este eficient dac soluia ecuaiei de verosimilitate


)] ( [

t A
L
Este de forma:
)

( t
De exemplu, pentru a determina expresia estimatorului parametrului al
legii de repartiie normal, s considerm un eantion cu valorile
n
x x x ,..., ,
2 1
. Funcia de verosimilitate a repartiiei normale va fi:
2
2
2
2
2
) (
1
2
) (
2
e
2
1
e
2
1
) , , (

,
_

1
1
]
1


i
i
x
n
n
i
x
i
x f L
sau:


2
2
) (
2
1
e

i
x
C L
Conform relaiei (5.35):


n
i
i
x C L
1
2
2
) (
2
1
ln ln

Estimatorul parametrului conform (5.36) este:


0 ) (
2
2 ln
1
2


1
]
1

n
i
i
x
L

Deoarece
0
2

estimatorul de verosimilitate maxim rezult:
x x
n
n
i
i


1
1

Deci estimatorul punctual al mediei teoretice este media eantionar
x
, fapt cunoscut.
Estimatorul dispersiei
2

se obine pornind de la funcia de


verosimilitate scris sub forma:

,
_


2
2
) (
2
1
2 /
2
e
2
1


i
x
n
L
sau:


n
i
i
x
n
L
1
2
2
2
) (
2
1
) 2 ln(
2
ln


Estimatorul
2

se determin din ecuaia:


0 ) (
2
1
2
ln
1
2
4 2

2
2
+
1
]
1

n
i
i
x
n L



de unde se ajunge la estimatorul de verosimilitate maxim a dispersiei
cunoscute:
139
CALITATEA PRODUSELOR I FIABILITATEA


n
i
i
x
n
1
2 2
) (
1
) (
.
Estimatorul punctual de verosimilitate maxim al abaterii standard conform
definiiei este:


n
i
i
x
n
1
2 2
) (
1
) (
.
Aceast relaie se poate obine i pornind de la funcia de
verosimilitate scriind ecuaia:
0
ln

,
_

L
Se constat astfel proprietatea de invarian a estimaiilor de
verosimilitate conform egalitii
( ) ( )
2 2

care se poate enuna astfel: dac

este estimaia verosimil a lui

, atunci
)

( f
este estimaia verosimil
a lui
) ( f
.
Dispersia estimatorului unui parametru oarecare

se poate
determina cu expresia:
1
2
2
2
ln


1
]
1

L
(5.38)
n cazul repartiiei normale
) , (
2
N
se obine:
2 2
2
ln

n L

Conform (5.38) dispersia estimatorului de verosimilitate maxim a


parametrului este:
n
n L
x
2
1
2
1
2
2
2
ln

,
_


1
]
1

S-a ajuns la expresia cunoscut (5.8) aa cum era de ateptat.


140

S-ar putea să vă placă și