Sunteți pe pagina 1din 32

CAPITOLUL 12

STATISTIC! MATEMATIC!
12.1. No!iuni de teoria selec!iei "i a estima!iei
S! consider!m o popula"ie , finit! sau infinit!, n sensul
c! este format! dintr-un num!r finit sau infinit de unit!"i. Dac!
popula"ia este finit!, vaom nota cu N num!rul unit!"ilor ce o
compun, iar N l vom numi volumul popula!iei .
Studiem popula"ia din punctul de vedere al unei
propriet!"i. Aceast! proprietate, care variaz! (n general) aleator de
la o unitate la alta a popula"iei o vom asimila cu o variabil!
aleatoare X #i o vom numi variabil! aleatoare teoretic! definit! pe
popula"ia .
Caracteristicile probabilistice ale variabilei aleatoare
teoretice X le vom numi caracteristici teoretice, astfel:
) ( X M m = , media teoretic!;
) (
2
X D D = = , dispersia teoretic!;
) (
r
r
X M m = , momentul ini"ial de ordinul r, teoretic;
] ) [(
r
r
m X M = , momentul centrat de ordinul r, teoretic.
Cercetarea unit!"ilor din popula"ia se poate face printr-o
observare total! sau par"ial!.
Cercetarea total! (care se efectueaz! de exemplu sub
form! de recens!mnt) este o opera"ie complex!, care de cele mai
multe ori prime#te mai multe caracteristici ale unit!"ilor, pentru a
realiza o analiz! multilateral!. Practic, o cercetare total! se
recomand! atunci cnd volumul popula"iei nu este prea mare,
pentru a evita cheltuieli ce pot dep!#i avantajele concluziilor trase.
Carcetarea par"ial! (selectiv!) se efectueaz! asupra unei
subpopula"ii , subpopula"ie de volum n. Variabila aleatoare
asimilat! caracteristicii studiate corespunz!toare subpopula"iei de
selec"ie este reprezentativ!, ceea ce nseamn! c! n subpopula"ia
sunt reflectate propriet!"ile ntregii popula"ii .
Construirea e"antionului (subpopula"iei de selec"ie) se
face cu unit!"i din popula"ia , alese dup! o animit! tehnic! (dup!
anumite reguli) numit! opera!ie de sondaj.
n efectuarea unui sondaj ntlnim dou! metode de baz!:
a) Sondaj cu revenire (sondaj non-exhaustiv):
Fiecare unitate de sondaj extras! din pentru a fi studiat!,
se reintroduce n , dup! cercetare, putnd deci s! apar! din nou n
procesul de construc"ie al e#antionului .
Efectuarea sondajului cu revenire are ca schem!
probabilistic! urna lui Bernoulli (urna cu bil! revenit!).
n acest caz vom spune c! s-a efectuat o selec"ie repetat! de
volum n. Sondajele astfel efectuate sunt:
Echiprobabile
Valorile de selec"ie astfel ob"inute sunt
independente
b) Sondaj f#r# revenire (sondaj exhaustiv):
Fiecare unitate de sondaj extras! din pentru a fi studiat!
nu mai este reintrodus! n dup! studiere (cercetare).
Efectuarea sondajului f!r! revenire are ca schem!
probabilistic! schema urnei cu bil! nerevenit!.
n acest caz vom spune c! s-a efectuat o selec"ie nerepetat!
de volum n.
OBSERVA$IE: Aplicarea selec"iei nerepetat! nu are sens
dect n cazul cnd volumul popula"iei este finit. Valorile de
selec"ie astfel ob"inute sunt dependente.
Selec"ia repetat! #i selec"ia nerepetat! sunt aplicate
colectivit!"ilor omogene.
DEFINI$IE: O colectivitate este omogen! dac! este
constituit! din elemente care sunt susceptibile de a avea sau de a nu
avea caracteristica studiat!, cu o aceea#i pondere.
n cazul cnd sondajul se efectueaz! dintr-o popula"ie
omogen!, el se nume#te sondaj simplu (selec"ie simpl!) .
n cazul cnd popula"ia nu este omogen! din punct de
vedere al caracteristicii (al propriet!"ii) cercetate dar poate fi
mp!r"it! n subpopula"ii
i
, fiecare n parte omogen!, ca ni#te
straturi ale popula"iei , se va efectua a#a numita selec!ie
stratificat#.
Fie , o popula"ie de selec"ie de volum n. Valorile
variabilei teoretice X pentru fiecare unitate din e#antionul
determin! #irul de valori
n j
X X X X ,..., ,..., ,
2 %
. Deoarece participarea
oric!rei unit!"i din popula"ia la e#antionul este echiprobabil!
(deoarece sondajul se face ntmpl!tor) , fiecare valoare
j
X din
#irul anterior se realizeaz! n e#antion cu aceea#i probabilitate
n
%
.
Astfel se construie#te variabila de selec!ie
*
X , cu reparti"ia :

n n n n
X X X X
X
n j
% % % %
:
2 %
*


Caracteristicile variabilei aleatoare de selec"ie
*
X , numite
caracteristici de selec"ie, sunt: (%)

=
= =
n
j
j
X
n
X m
%
*
%

=
=
n
j
j
X X
n
D
%
2 *
) (
%

=
=
n
j
r
j r
X
n
m
%
*
%

=
=
n
j
r
j r
X X
n
%
*
) (
%

OBSERVA$IE: E#antionul , la rndul lui, are un aspect


aleatoriu determinat n primul rnd de caracterul ntmpl!tor al
sondajului. Prin urmare, efectund alte sondaje se ob"in alte
e#antioane #i alte variabile aleatoare de selec"ie.
Putem considera c! fiecare valoare
j
X a argumentului
variabilei aleatoare de selec"ie
*
X este, la rndul ei, o variabil!
aleatoare identic! din punct de vedere probabilistic cu X, deoarece
poate fi oricare din valorile posibile ale lui X #i deci are acelea#i
caracteristici ca #i variabila aleatoare teoretic!. Adic!:
) ( ) ( X M X M
j
= , n j ,..., % =
) ( ) ( X D X D
j
= , n j ,..., % =
) ( ) (
r r
j
X M X M = , n j ,..., % =
n cazul cnd variabila aleatoare empiric!
*
X are reparti"ia
de forma :

k i
k i
n n n n
x x x x
X


2 %
2 % *
:
;
%
%
=

=
k
i
i
n
, unde
k i
x x x x , , , , ,
2 %
sunt valorile distincte ale lui
j
X , n j ,..., % = , iar
k i
n n n n , , , , ,
2 %
sunt frecven"ele de apari"ie. Deci rela"iile (%)
devin: (%)

=
= =
k
i
i i
n x
n
x m
%
*
%
i
k
i
i
n x x
n
D

=
=
%
2 *
) (
%
i
k
i
r
i r
n x
n
m

=
=
%
*
%
i
k
i
r
i r
n x x
n

=
=
%
*
) (
%

12.2. Reparti!ii de selec!ie


O anumit! caracteristic! (calitativ! sau cantitativ!) studiat!
pe o popula"ie oarecare poate fi considerat! ca o variabil!
aleatoare unidimensional! X care are o densitate de reparti"ie ) (x f
sau o func"ie de reaprti"ie ) (x F .
) (x f #i ) (x F se numesc legi teoretice de reparti!ie a
variabilei aleatoare X .
S! consider!m acum c! pe baza unei selec"ii de volum n din
popula"ia ob"inem valorile
n
X X X , , ,
2 %
. Cu ajutorul acestor
valori (cu ajutorul acestor date de selec"ie) putem calcula diferi"i
indicatori ca de exemplu:
Media de selec"ie :

=
= =
n
k
k
X
n
X X
%
*
%
Dispersia de selec"ie :

=
=
n
k
k
X X
n
D
%
2 *
) (
%
DEFINI$IE: O func"ie ) ,..., , (
2 % n n
X X X T de datele de
selec"ie
n
X X X , , ,
2 %
se nume#te statistic# .
OBSERVA$IE: Media de selec"ie
*
X #i dispersia de
selec"ie
*
D sunt func"ii de datele de selec"ie
n
X X X , , ,
2 %
, deci
sunt statistici.
Fiecare statistic! ) ,..., , (
2 % n n
X X X T (de exemplu media de
selec"ie #i dispersia de selec"ie) este, datorit! caracterului aleatoriu
al selec"iei, o variabil! aleatoare care la rndul ei are anumite legi de
reparti!ie (f #i F) numite reparti!ii de selec!ie .
Cunoa#terea legii de reparti!ie (reparti"iei de selec"ie) a
statisticii ) ,..., , (
2 % n n
X X X T este deoasebit de important! deoarece
cu ajutorul ei se poate face studiul probabilistic al statisticii
) ,..., , (
2 % n n
X X X T , calculndu-se probabilit!"i de forma ) ( a T P
n
< ,
) ( b T a P
n
< < ; ) (
n
T M , ) (
n
T D , etc.
OBSERVA$IE: Interpretarea datelor de selec"ie are un
dublu n"eles:

n
X X X , , ,
2 %
sunt ni#te numere cunoscute

i
X , n i ,..., % = sunt variabile aleatoare cu acelea#i
caracteristici ca #i X .
n acest fel, prin intermediul statisticii
n
T putem trage
concluzii referitoare la popula"ia general! din care a provenit
selec"ia (e#antionul) .
Teoria probabilit!"ilor ne ofer! procedee de determinare att
a reparti"iei exacte, ct #i a reparti"iei asimptotice a statisticii
n
T .
Prin reparti!ia exact# a statisticii
n
T n"elegem reparti"ia
determinat! pentru orice volum al selec"iei n, iar prin reparti!ia
asimptotic# n"elegem reparti"ia limit! a statisticii
n
T (cnd
n ) .
Reparti"ia exact! este util! cnd condi"iile concrete ale
caracteristicii studiate din popula"ia impune folosirea unei selec"ii
(e#antion) de volum redus 30 n .
n cazul unor selec"ii de volum mare ( 30 > n ) folosirea
reparti"iei asimptotice conduce la rezultate suficient de bune.
Reparti"ia de selec"ie a statisticii
n
T este strns legat! #i
unic determinat! de legea de reparti"ie teoretic! a variabilei
aleatoare X care a generat selec"ia.
n continuare vom cerceta repati"iile de selec"ie ale unor
statistici
n
T construite dintr-o selec"ie extras! dintr-o popula"ie cu
reparti"ie normal!.
%) X X X X T
n n
= ) ,..., , (
2 %
(media de selec"ie)
2) D X X X T
n n
= ) ,..., , (
2 %
(dispersia de selec"ie)
12.3. Reparti!ia mediei de selec!ie pentru o selec!ie dintr-o
popula!ie normal#
TEOREMA %: Dac!
n
X X X , , ,
2 %
este o selec"ie de volum
n dintr-o popula"ie normal! ) , ( m N , atunci media de selec"ie:
) (
%
2 % n
X X X
n
X + + + =
are o reparti"ie

n
m N

,
.
Demonstra!ie:
Deoarece variabila aleatoare de selec"ie
k
X , n k ,..., % = ,
este o variabil! aleatoare normal! ) , ( m N , ea are func"ia
caracteristic!
2 2
2
%
) (
t imt
X
e t c
k

= . (vezi capitolul %0, paragraful
%0.2.3.)
Aplicnd propriet!"ile func"iei caracteristice, ob"inem
func"ia caracteristic! a variabilei aleatoare
k
X
n
%
, n k ,..., % = :
2
2
2
2
%
%
) (
n
t
n
t
im
X
n
e t c
k

=
(deoarece ) ( ) ( at c t c
X aX
= ).
Dar
n n
X
n
X
n
X
n
X X X
n
X
% % %
) (
%
2 % 2 %
+ + + = + + + =
#i deci, aplicnd proprietatea P3 a func"iei caracteristice (vezi
capitolul 3, paragraful %.6.), avem:
2
2
2
2
%
2
2
2
2
2
2
2
%
2
%
2
%
%
2
%
) (
t
n
itm
t
n
itm
n
t
m
n
t
i n
k
n
t
m
n
t
i
X
e e e e t c
n
i

= =

= =
=

,
adic! X are reparti"ia

n
m N

,
.
OBSERVA$IE: Prin urmare, m X M = ) ( ,
n
X D
2
) (

=
.
CONSECIN$A %: Consider!m variabila aleatoare redus!
n
m X
Z

=
pe care o putem scrie sub forma unei expresii liniare
n func"ie de X , adic!
X
n
X
n
Z

=
. Atunci :
0 ] [ ] ) ( [ ) ( ) ( = = =


= m m
n
m X M
n
m
n
M X M
n
n
m X
M Z M

% ) ( ) (
2
2
= = =


=
n
n
X D
n
m
n
D X
n
D n
m X
D Z D


Prin urmare,
n
m X
Z

=
are reparti"ia normal! de tip
) % , 0 ( N .
TEOREMA 2: Dac!
%
% %%
, ,
n
X X este o selec"ie de volum
%
n din popula"ia normal! ) , (
% %
m N #i
2
2 2%
, ,
n
X X este o selec"ie
de volum
2
n din popula"ia normal! ) , (
2 2
m N , #i dac!

=
=
%
%
%
%
%
%
n
j
j
X
n
X
#i

=
=
2
%
2
2
2
%
n
k
k
X
n
X
sunt mediile de selec"ie
corespunz!toare, atunci variabila aleatoare ) (
2 % 2 %
X X X X Y + = =
are o reparti"ie normal!

+
2
2
2
%
2
%
2 %
;
n n
m m N

.
Demonstra!ie:
Func"ia caracteristic! a mediei de selec"ie
%
X este
%
2
%
2
%
%
2
) (
n
t
itm
X
e t c

=
#i ale mediei de selec"ie
2
X este
2
2
2
2
2
2
2
) (
n
t
itm
X
e t c

=
.
OBSERVA$IE: Func"ia caracteristic! a variabilei aleatoare
2
X este de forma :
2
2
2
2
2
2
2
) (
n
t
itm
X
e t c

=
, conform propriet!"ii P4 a
func"iei caracteristice (vezi capitolul 4, paragraful 4.2.3.) .
Deoarece
%
X #i
2
X sunt variabile aleatoare
independente, func"ia caracteristic! a variabilei aleatoare
) (
2 % 2 %
X X X X Y + = = este (conform propriet!"ii P3 a func"iei
caracteristice):

+

= =
2
2
2
%
2
%
2
2 %
2
2
2
2
2
%
2
%
2
%
2
) (
2 2
) (
n n
t
m m it
n
t
itm
n
t
itm
Y
e e e t c


Prin urmare Y are reparti"ia

+
2
2
2
%
2
%
2 %
;
n n
m m N

.
OBSERVA$IE: Ultima afirma"ie rezult! din faptul c!
variabila aleatoare X cu reparti"ia ) , ( m N are func"ia caracteristic!
2
2 2
) (
t
imt
X
e t c

= .
CONSECIN$A 2: Din teorema 2 rezult! c! reparti"ia
variabilei aleatoare normate
2
2
2
%
2
%
2 % 2 %
) (
n n
m m X X
Z

+

=
are o
reparti"ie de tipul ) % , 0 ( N .
12.3.1. Leg#tura cu variabila aleatoare
2
cu n grade de
libertate
Se #tie c! variabila aleatoare
2
are densitatea de
probabilitate:

>

\
|
=

0 , 0
0 ,
2
2
%
) ; (
2
%
2
2
x
x e x
k
k x f
x k
k
Se poate demonstra c! dac!
k
Z , n k ,..., % = sunt variabile
aleatoare normale ) % , 0 ( N , atunci variabila aleatoare

=
n
k
k
Z
%
2
este:

=
=
n
k
k
Z
%
2 2

, cu n grade de libertate #i are deci densitatea de


probabilitate :
0 ,
2
2
%
) (
2
%
2
2
>

=

x e x
n
x h
x n
n
.
&tim c! n M = ) (
2
#i n D 2 ) (
2
= (vezi capitolul %0,
paragraful %0.2.6).
Este adev!rat! urm!toarea teorem!:
TEOREMA 3: Dac!
n
X X X , , ,
2 %
este o selec"ie de
volum n dintr-o popula"ie normal! ) % , 0 ( N , atunci variabila aleatoare

=
=
n
k
k
X Y
%
2
este o variabil! aleatoare
2
cu n grade de libertate.
12.4. Reparti!ia dispersiei de selec!ie pentru o selec!ie dintr-o
popula!ie normal#
Dispersia D a unei popula"ii oarecare poate fi evaluat! pe
baza selec"iei
n
X X X , , ,
2 %
n urm!toarele moduri:
a) Dac! media m a popula"iei generale este cunoscut!, atunci
dispersia de selec!ie este dat! de:
2
*
%
2
) (
%
' S m X
n
D
n
k
k
= =

=
(%)
b) Dac! media m a popula"iei nu este cunoscut!, atunci media o
putem aproxima cu media de selec"ie

=
=
n
k
k
X
n
X
%
%
#i dispersia de
selec"ie este:
2
%
2 *
) (
%
S X X
n
D
n
k
k
= =

=
(2)
c) n cazul selec"iilor de volum mic, evalu!m dispersia D a
popula"iei cu dispersia de selec"ie dat! de rela"ia :
2
%
2
~
) (
%
% ~
s X X
n
D
n
k
k
=

=

=
n cele ce urmeaz! vom stabili reparti"ia unor func"ii de
variabilele aleatoare ' D ,
*
D , D
~
pentru selec"ii dintr-o popula"ie
normal!. Sunt adev!rate urm!toarele propriet!"i:
TEOREMA %: Dac!
n
X X X , , ,
2 %
este o selec"ie dintr-o
popula"ie ) , ( m N , atunci variabila aleatoare
2
'
'

nD
U =
are o
reparti"ie
2
cu n grade de libertate.
Demonstra!ie:

= =
=
=


=

= =
n
i
i
n
i
i
n
i
i
Z
m X
m X
n
n
nD
U
%
2
%
2
2
%
2
2
) (
%
'
'

,
unde
i
Z este o variabil! aleatoare cu reparti"ia ) % , 0 ( N . Conform
teoremei 3 din paragraful anterior, ' U este o reparti"ie
2
cu n
grade de libertate.
Prin urmare n U M = ) ' ( #i n U D 2 ) ' ( = . Deci :
2
2
) ' ( ) ' ( ) ' (

= = = D M n D M
n
U M
n
D D n D D
n
U D
4
2
2
) ' ( 2 ) ' ( ) ' (

= = =
TEOREMA 2: Dac!
n
X X X , , ,
2 %
este o selec"ie de
volum n dintr-o popula"ie ) , ( m N , atunci variabila aleatoare
2
~
) % (

D n
U

=
are o reparti"ie
2
cu ) % ( n grade de libertate.
Prin urmare, variabila
2
~
) % (

D n
U

=
are densitatea de
probabilitate de forma :
0 ,
2
2
%
%
) (
2
%
2
%
%
>

x e x
n
x h
x n
n
.
TEOREMA 3: Dac!
n
X X X , , ,
2 %
este o selec"ie de
volum n dintr-o popula"ie normal! ) , ( m N , atunci variabila
aleatoare
n
m X
t

=
, unde D
~
~
= , are o reparti"ie Student cu
) % ( n grade de libertate.
CONSECIN$': Dac!
%
% %%
, ,
n
X X este o selec"ie de
volum
%
n din popula"ia normal! ) , (
% %
m N #i
2
2 2%
, ,
n
X X este o
selec"ie de volum
2
n din popula"ia normal! ) , (
2 2
m N , #i dac!

=
=
%
%
%
%
%
%
n
j
j
X
n
X
#i

=
=
2
%
2
2
2
%
n
k
k
X
n
X
sunt mediile de selec"ie
corespunz!toare, iar

=
%
%
2
% %
%
%
) (
%
% ~
n
k
k
X X
n
D
#i

=
2
%
2
2 2
2
2
) (
%
% ~
n
k
k
X X
n
D
sunt
dispersiile de selec"ie corespunz!toare, atunci variabila aleatoare:
2
~
) % (
~
) % (
) ( ) (
2 %
2 %
2 % 2 %
+
+

=
n n
D n D n
m m X X
t
are o reparti"ie Student cu ) 2 (
2 %
+ n n grade de libertate.
TEOREMA 4: Fie
n
X X X , , ,
2 %
o selec"ie (independent!)
de volum n dintr-o popula"ie avnd o reparti"ie oarecare de medie m
#i abatere medie p!tratic! , finite. Atunci

=
=
n
k
k
X
n
X
%
%
are,
pentru n o reparti"ie normal!

n
m N

,
.
Demonstra"iile teoremelor enun"ate n acest paragraf se
g!sesc n /2/ , /%/, /3/ .
12.5. Estima!ie punctual#
Fie variabila de selec"ie
*
X sub una din formele empirice :

n n n n
X X X X
X
n j
% % % %
:
2 %
*


, sau

k i
k i
n n n n
x x x x
X


2 %
2 % *
:
, cu
%
%
=

=
k
i
i
n
.
Datorit! volumului de selec"ie n, modului de efectuare a
sondajului, valorile numerice oferite de selec"ie reflect! valorile
variabilei teoretice X care reprezint! caracteristica (proprietatea)
studiat! din .
Aceste aprecieri au la baz! teorema lui Glivenco (teorema
fundamental# a statisticii matematice) care se refer! la leg!tura
strns! care exist! ntre func"ia de reparti"ie teoretic! ) (x F a
variabilei aleatoare teoretice X #i func"ia de reparti"ie empiric!
) (x F
n
.
DEFINI$IE: Prin func"ia de reparti"ie empiric! a unei
variabile aleatoare X, dup! extragerea unei selec"ii de volum n,
n"elegem func"ia definit! de rela"ia
n
n
x F
x
n
= ) (
, unde
x
n reprezint!
num!rul de observa"ii n care a ap!rut o valoare a variabilei
aleatoare X (a caracteristicii X), mai mic! dect x.
Reamintim c! func"ia de reparti"ie teoretic! ) (x F a
variabilei aleatoare X este ) ( ) ( x X P x F < = .
TEOREMA LUI GLIVENCO: Fie ) (x F
n
func"ia de
reparti"ie empiric! corespunz!toare unei selec"ii de volum n ce
provine dintr-o popula"ie caracterizat! de variabila aleatoare X
avnd func"ia de reparti"ie ) (x F . Atunci:
% ) 0 ) ( ) ( sup lim ( = =


x F x F P
n
R x
n
.
Adic!, cu ct n este mai mare, cu att ) (x F
n
aproximeaz!
mai corect pe ) (x F .
Conform teoremei lui Glivenco, putem accepta principiul
de baz# al teoriei selec!iei:
Variabila aleatoare de selec"ie
*
X converge n lege c!tre
variabila aleatoare teoretic! X, iar caracteristicile variabilei de
selec"ie converg n probabilitate c!tre caracteristicile
corespunz!toare ale variabilei aleatoare teoretice.
DEFINI$IE: Opera"ia prin care se evalueaz! parametrii
necunoscu"i ai unei legi de probabilitate se nume#te estimarea
parametrilor.
Estimarea se face pe baza unei selec"ii
n
X X X , , ,
2 %
de
volum n, extras! din popula"ia pe care este definit! variabila X,
cu lege specificat!, care con"ine parametrul ce trebuie estimat.
12.5.1. Estimator; estimator consistent
Fie X variabila aleatoare cu legea ) , ( x f care depinde de
un parametru necunoscut .
Vrem s!-l determin!m pe din datele de selec"ie ale
variabilei aleatoare de selec"ie
*
X .
DEFINI$IE: Se nume#te estima!ie punctual# a
parametrului , o anumit! func"ie (statistic!) ) ,..., (
%
* *
n
X X = cu
ajutorul c!reia tragem concluzii asupra valorii necunoscute a
parametrului .
OBSERVA$IE:Estimatorul
*
astfel definit este o variabil!
aleatoare (fiind o func"ie care depinde de valorile de selec"ie
n
X X X , , ,
2 %
), pe cnd reprezint! o valoare constant! a
variabilei aleatoare teoretice X .
Orice valoare
*
C
(valoare calculat! a estimatorului
*
)
determinat! de o anumit! selec"ie reprezint! o valoare estimat!
pentru .
DEFINI$IE: Func"ia de estima"ie ) ,..., (
%
* *
n
X X = ,
pentru care
% ) ( lim
*
= <

P
n
se nume#te func!ie de estima!ie
consistent#, iar estimatorul
*
se nume#te estimator consistent.
12.5.2. Estimator absolut corect; estimator corect
DEFINI$IE: Estimatorul
*
este un estimator absolut
corect dac!:
%) = ) (
*
M
2)
0 ) (
*

n
D
Spunem atunci c! orice valoare calculat! a
*
C
a acestui
estimator, estimeaz! absolut corect pe .
DEFINI$IE: Estimatorul
*
este un estimator corect dac!:
%)

n
M ) (
*
2) 0 ) (
*

n
D
Spunem atunci c! orice valoare calculat!
*
C
a acestui
estimator, estimeaz! corect pe .
Se poate demonstra urm!toarea teorem! , a c!rei
demonstra"ie se g!se#te n /2/:
TEOREM': Orice estimator absolut corect este #i un
estimator consistent.
EXEMPLU: Fie reparti"ia Poisson
0 ,
!
:


x
x
e
x
X
x

cu = = ) ( ) ( x D x M . (vezi capitolul %0, paragraful %0.%.4. ) .


Vom ar!ta c! media de selec"ie

=
=
n
j
j
X
n
X
%
%
este un estimator
absolut corect pentru .
= = =

=

= =
n
n
X M
n
X
n
M X M
n
j
j
n
j
j
%
) (
% %
) (
% %
.
0
%
) (
% %
) (
2
%
2
%

= =
= = =

=

n
n
j
j
n
j
j
n
n
n
X D
n
X
n
D X D

Deci media de selec"ie X este un estimator absolut corect


al parametrului din reparti"ia Poisson.
12.5.3. Estimator de maxim# verosimilitate
Fie variabila aleatoare teoretic! X cu func"ia de probabilitate
) , ( x f , care depinde de parametrul . Acest parametru trebuie
estimat pe baza datelor de selec"ie
n
X X X , , ,
2 %
.
Func"ia de probabilitate ) , ( x f , corespunz!toare valorilor
n
X X X , , ,
2 %
este ) ( ) ; (
j j
X X P X f = = , n j ,..., % = . Deoarece
variabila de selec"ie
*
X presupune realizat evenimetul

=
=

n
j
j
X X
%
) (
, rezult! c! ns!#i realizarea variabilei de selec"ie
constituie un eveniment care are un anumit grad de reprezentare a
variabilei teoretice, constituind astfel verosimilitatea de reflectare a
variabilei teoretice X de c!tre variabila de selec"ie
*
X .
Aceast! verosimilitate este m!surat! de probabilitatea :

= =
=

n
j
j n
X X P X X X L
%
2 %
) ( ) ; ,..., , (
, adic!
) ; ( ) ; ,..., , (
%
2 %
=
=
n
j
j n
X f X X X L
) ; ( ) ; ,..., , (
%
2 %
=
=
n
j
j n
X f X X X L
, numit! func"ia de
verosimilitate a selec"iei.
Vom determina (estima) parametrul punnd condi"ia ca
verosimilitatea s! fie maxim!. Punem deci condi"ia
0
) ; ,..., (
%
=

n
X X L
sau
0
) ; (
%
=

n
j
j
X f
.
Deoarece maximul func"iei L are loc pentru acelea#i valori
ca #i maximul func"iei L ln , ecua"ia precedent! poate fi nlocuit!
prin una mai avantajoas! din punct de vedere al calculelor :
0
) ; ,..., ( ln
%
=

n
X X L
sau
0
) ; ( ln
%
=

=
n
j
j
X f

.
Ecua"ia
0
) ; ( ln
%
=

=
n
j
j
X f

se nume#te ecua"ia de
verosimilitate maxim!.
DEFINI$IE: Orice solu"ie a ecua"iei de verosimilitate
maxim! se nume#te estimator de maxim# verosimilitate .
OBSERVA$IE: n general, un estimator de maxim!
verosimilitate este #i un estimator consistent. Adic!
% ) ( lim
*
= <

P
n
.
EXEMPLU: S! se determine estimatorul de maxim!
verosimilitate din reparti"ia Poisson
0 ,
!
:


x
x
e
x
X
x

, unde
!
) ; (
x
e x f
x


=
.
Func"ia de verosimilitate este :

= =

= =
n
j
n
j j
X
j n
X
e X f X X L
j
% %
%
)! (
) ; ( ) ; ,..., (



Logaritmnd,
ob"inem:
[ ] { }

=
+ =
n
j
j j n
X X X X L
%
%
)! ( ln ln ) ; ,..., ( ln
.
Ecua"ia de maxim! verosimilitate este:
0
%
%
ln
%
=

+ =

=
n
j
j
X
L

sau
X
n
X
X n
n
j
j
n
j
j
= = = +

=
=
* % *
%
0
%

.
n concluzie, media de selec"ie n reparti"ia Poisson este un
estimator de maxim! verosimilitate pentru parametrul .
OBSERVA$IE: n cazul reparti"iilor X care au func"ia de
probabilitate depinznd de mai mul"i parametri ) ,..., , ; (
2 % s
x f ,
parametrii
n
,..., ,
2 %
se determin! din sistemul de ecua"ii
0
) ,..., ; ,..., ( ln
% %
=

i
s n
X X L


, s i ,..., % = .
EXEMPLU: S! se determine estima"iile de maxim!
verosimilitate ale parametrilor m #i ale unei variabile aleatoare
normale ) , ; ( m x f cu ajutorul unei selec"ii
n
X X X , , ,
2 %
.
2
2
%
2
%
) , ; (

m X
e m x f
, 0 > , R x , R m .

= =
=

=

n
i
i
m X
n
n
n
i
i n
e m X f m X X L
%
2
2
) (
2
%
2
%
%
) 2 (
%
) , ; ( ) , ; , , (


=
=
n
i
i n
m X
n
n m X X L
%
2
2
%
) (
2
%
) 2 ln(
2
ln ) , ; , , ( ln


0 ) % )( (
2
2
% ) , ; ,..., ( ln
%
2
%
= =

=
n
i
i
n
m X
m
m X X L

0 ) (
% ) , ; ,..., ( ln
%
2
3
%
= + =

=
n
i
i
n
m X
n m X X L

=
=

=
=
n m X
m X
n
i
i
n
i
i
%
2
2
%
) (
%
0 ) (

=
=

=
=
n
i
i
n
i
i
m X
n
X
n
m
%
2 2
%
) (
%
%

=
=


=
n
m X
X m
n
i
i
%
2
*
*
) (

n concluzie,
*
m #i
*
sunt estimatori de maxim!
verosimilitate pentru m #i din ) , ; ( m x f .
12.6. Estimarea prin intervale de ncredere
Am v!zut c! estima"iile punctuale sunt afectate de erori, ele
reprezentnd numai valori aproximative ale adev!ratelor valori ale
parametrilor estima"i. Deoarece o estima"ie variaz! n precizie, ea
trebuie s! fie nso"it! de o indica"ie cu privire la precizia ei, adic!
ct de aproape poate fi estima"ia de valoarea parametrului pe care
trebuie s!-l estimeze. Apare astfel necesitatea de a se indica un
interval despre care s! se poat! afirma, cu o probabilitate
cunoscut!, c! acoper! valoarea parametrului estimat, care este o
m!rime constant!.
Presupunem c! proprietatea studiat! este determinat! de o
variabil! aleatoare X care are legea de reparti"ie teoretic! ) ; ( x f
care depinde de parametrul .
Se efectueaz! o selec"ie de volum n din care ob"inem
valorile de selec"ie
n
X X X , , ,
2 %
.
S! presupunem de asemenea c! avem dou! func"ii de
selec"ie (statistici) ) , , (
% n
X X #i ) , , (
% n
X X , < , astfel
nct probabilitatea inegalit!"ii < < s! fie ndeplinit! de ,
adic! :
= < < % )] , , ( ) , , ( [
% % n n
X X X X P (%)
unde nu depinde de .
Pentru o selec"ie realizat!, func"iile #i iau valori bine
determinate #i vom spune c! am g!sit un interval ) , ( care
acoper! parametrul necunoscut [altfel spus ) , ( ] cu un grad
de siguran"! garantat de probabilitatea ) % ( unde este foarte
mic.
DEFINI$IE:
(i) Intervalul ) , ( se nume#te interval de ncredere pentru
parametrul (sau interval de estima!ie).
(ii) se nume#te limita inferioar# a intervalului de ncredere.
(iii) se nume#te limita superioar# a intervalului de ncredere.
(iv) Probabilitatea ) % ( se nume#te probabilitate confiden!ial#
sau coeficient de ncredere (siguran"!).
OBSERVA$II:
Parametrul este o valoare bine determinat!.
Intervalul ) , ( este un interval aleator care variaz! de la o
selec"ie la alta.
Cu ct intervalul ) , ( este mai mic #i este mai mic, cu
att estimarea parametrului este mai bun!. Practic, pentru
se iau valorile 05 , 0 = ; 0% , 0 = ; 02 , 0 = , etc.
Se consider! variabila aleatoare X cu func"ia de
probabilitate ) ; ( x f . Ne propunem ca pe baza unei selec"ii
n
X X X , , ,
2 %
s! determin!m un interval de ncredere pentru
parametrul necunoscut.
Metoda const! n g!sirea unei func"ii ) ; , , (
%

n
X X U care
depinde de datele de selec"ie #i de , #i are propriet!"ile:
a) U este bine definit! pe orice punct din intervalul valorilor
posibile ale lui .
b) U este continu! #i monoton! n raport cu .
c) Reparti"ia sa ) (u g nu depinde de parametrul #i nici de
al"i parametri.
Atunci, pentru fiecare coeficient de ncredere ) % ( ,
folosind reparti"ia ) (u g a statisticii U , putem g!si limitele
%
u #i
2
u
care depind de , dar sunt independente de datele de selec"ie, asftel
nct:
= = < <

% ) ( ) (
2
%
2 %
u
u
du u g u U u P
(2)
12.6.1. Intervale de ncredere pentru parametrii reparti!iei
normale :

) (
:
x f
x
X
, R x , R m , 0 > ,
2
2
%
2
%
) , ; (

m x
e m x f
(i) Interval de ncredere pentru media m cnd
2
este
cunoscut
Alegem statistica:
n
m X
m X X U
n

= ) ; , , (
%

(%)
care este monoton! #i continu! n raport cu m #i a c!rei func"ie de
reparti"ie este ) % ; 0 ( N , cu densitatea:
2 2
%
2
2
%
) (
u
e u g

=

(2).
Func"ia (2) nu depinde de m #i nici de al"i parametri .
Prin urmare vom putea determina numerele
%
u #i
2
u astfel
nct:
= = < <

% ) ( ) (
2
%
2 %
u
u
du u g u U u P
, sau:
(3)
= =

<

<

%
2
% 2
%
2
2
2 %
u
u
u
du e u n
m X
u P

< < X
n
u
m X
n
u
P

2 %

< < = %
% 2
n
u
X m
n
u
X P
(4)
Am ob"inut deci intervalul de ncredere pentru m,


n
u
X
n
u
X

% 2
,
(5)
cu probabilitatea % .
OBSERVA$IE: Deoarece ntre
%
u #i
2
u avem o singur!
rela"ie, dat! de (3) putem ob"ine o infinitate de intervale de
ncredere cu probabilitatea % .
Evident, un interval de ncredere este cu att mai bun cu ct
este ct mai mic. C!ut!m deci intervalul dat de rela"ia (5), de
lungime minim!.
Fie l lungimea intervalului. Atunci
) (
% 2
u u
n
l =

Vom minimiza lungimea intervalului l , cu condi"ia (3),
adic! rezolv!m problema:

=
=

% ) (
) ( min
2
%
% 2
u
u
du u g
u u
n
l
Utiliz!m metoda multiplicatorilor lui Lagrange:
Fie
)] % ( ) ( [ ) ( ) ; , (
2
%
% 2 2 %

+ =

u
u
du u g u u
n
u u L

= + =

= =

0 ) (
0 ) (
2
2
%
%
u g
n
u
L
u g
n
u
L

) ( ) (
2 %
u g u g = , care are solu"iile
2 %
u u = care nu convine #i solu"ia
2 %
u u =
Not!m
% 2
u u z = = . Atunci ecua"ia (4) devine

%
2
%
2
2
z
z
u
du e
= % ) ( ) ( z F z F , dar ) ( ) ( z F z F = ,
deci
2
% ) ( % % ) ( 2

= = z F z F

=

2
%
%

F z
.
Dar

=
= =
=

2
%
2
2
%
2
%
2
%
2



z u
z z u
z z
Deci intervalul de ncredere este :

+ < <

n
z X m
n
z X


2
%
2
%
(ii) Interval de ncredere pentru media m cnd este
necunoscut
Consider!m func"ia de selec"ie
t n
S
m X
m X X U
n
=

= ) ; , , (
%

,
unde

=
n
i
i
X X
n
S
%
2 2
) (
%
%
. Am v!zut c! t are o reparti"ie Student
cu ) % ( n grade de libertate. Analog punctului anterior se poate
ar!ta c! intervalul de ncredere este:

+ < <

n
S
t X m
n
S
t X
n n % ;
2
% % ;
2
%

12.7. Estimarea parametrilor unei variabile aleatoare prin
metoda momentelor
Fie popula"ia n care studiem o proprietate dat! de
variabila aleatoare teoretic! X definit! pe . Variabila X are
momentele ini"iale #i centrate
r
m #i
r
cunoscute.
Se efectueaz! o selec"ie de volum n #i se consider!
variabila aleatoare de selec"ie
*
X cu momentele ini"iale de selec"ie
#i momentele centrate de selec"ie
*
r
m ,
*
r
.
TEOREM': Momentul de selec"ie
*
r
m este un estimator
absolut corect al momentului teoretic
r
m .
Demonstra!ie:
*
r
m este un estimator absolut corect al lui
r
m dac!
r r
m m M = ) (
*
#i
0 ) ( lim
*


r
n
m D
. ntr-adev!r:
r r
r
j
n
j
r
j r
m m n
n
X M
n
X
n
M m M = = =

=

=
%
) (
% %
) (
%
*
0 ) (
%
) (
% %
) (
2
2
2
2
2
%
2
%
*

= =

= = =

=

n
r r
r r
n
j
r
j
n
j
r
j r
n
m m
m m n
n
X D
n
X
n
D m D
OBSERVA$IE: Aplicarea metodei momentelor la
estimarea parametrilor
s
, ,
%
a unei func"ii ) , , ; (
% s
x f
const! n scrierea unui sistem de s ecua"ii pentru cei s parametrii.
Acest sistem se formeaz! prin scrierea primelor s momente ale
variabilei aleatoare teoretice X care sunt egale cu momentele de
acela"i ordin ale variabilei aleatoare empirice
*
X .
EXEMPLU: Fie
x
e x x f

=
%
) (
%
) ; (

, 0 > x , 0 > . Se
efectueaz! o selec"ie de volum n :
n
X X X , , ,
2 %
. Scriem c!
momentul de ordinul % al variabilei aleatoare X este egal cu
momentul de selec"ie de ordinul %.

= =
=

+
=

= = =

n
i
j
x
X
n
m X M
dx e x dx x xf m X M
%
*
%
*
0 0
%
%
) (
) (
) % (
) (
%
) ; ( ) (

=
=
n
j
j
X
n
%
*
%

OBSERVA$IE: Ne putem pune ntrebarea ce moment


empiric este cel mai potrivit pentru estimarea momentului teoretic?
Din exemplul anterior rezult!:
) % (
2
+ = m

=
= +
n
j
j
X
n
%
%
) % (

=
= + + + + =
n
j
j
X
n
m
%
3
3
%
) 2 )( % ( ) 2 )( % (
Se observ! chiar c! valorile lui astfel determinate nu
satisfac (n general) #i ecua"iile anterioare, deci metoda se complic!.
n aceste situa"ii este indicat! aplicarea metodei intervalelor de
ncredere.
12.8. Verificarea ipotezei cu privire la legea de reparti!ie a
unei variabile aleatoare
O ipotez! statistic! se refer! fie la forma legii de reparti"ie a
unei popula"ii (normal!, exponen"ial!, etc.) fie la parametrii
con"inu"i n aceast! lege (medie, dispersie), #i ea se verific! folosind
rezultatele ob"inute ntr-o selec"ie aleatoare extras! din popula"ia
cercetat!.
Fie variabila aelatoare X care reprezint! o proprietate
considerat! pe o popula"ie a c!rei reparti"ie ) , ( x f are o form!
cunoscut!, dar care depinde de un parametru necunoscut . Ipoteza
conform c!reia are valoarea
0
, se noteaz! :
0 0
: = H #i poart!
numele de ipoteza nul# .
S! presupunem c! n afara valorii
0
, parametrul mai poate
avea #i una din valorile ,... ,
2 %
. Ipotezele
i i
H = : , ,... 2 , % , 0 = i
se numesc ipoteze admisibile, iar
i i
H = : , ,... 2 , % = i se numesc
ipoteze alternative ale ipotezei nule
0
H .
n cele ce urmeaz! vom considera dou! ipoteze: ipoteza
nul#
0
H #i alternativa ei,
%
H ca ipotez# contrar# ipotezei
0
H ,
explicnd n ce const! verificarea unei ipoteze statistice, procedeul
de verificare, precum #i unele no"iuni legate de acestea.
Testul statistic este o metod! sau un criteriu dup! care
ipoteza de verificat se accept! sau se respinge. El stabile#te, dup!
natura observa"iilor, pentru care selec"ii ipoteza se accept! #i pentru
care se respinge.
Datorit! caracterului ntmpl!tor al selec"iei, la verificarea
unei ipoteze statistice, exist! ntotdeauna riscul de a lua o decizie
eronat!. Cnd pe baza datelor selec"iei respingem ipoteza
0
H de
verificat, de#i n realitate este adev!rat!, spunem c! am comis o
eroare de genul nti, iar cnd accept!m ipoteza
0
H care n realitate
este fals!, spunem c! am comis o eroare de genul doi. Probabilitatea
erorii de genul nti se nume#te risc de genul nti (prag sau nivel de
semnifica"ie) #i-l not!m cu , iar probabilitatea erorii de genul doi
se nume#te risc de genul al doilea #i se noteaz! cu .
Pentru construirea testului statistic cu ajutorul c!ruia
verific!m ipoteza statistic!
0
H trebuie s! avem n vedere
urm!toarele:
a) determinarea unei func"ii (o statistic!) ) ,..., (
% n
X X T de
datele de selec"ie numit! statistica testului, cu caretest!m
ipoteza
0
H ;
b) valoarea admisibil! a pragului de semnifica"ie;
c) ipoteza alternativ!
%
H opus! ipotezei
0
H ;
d) regiunea critic! W a ipotezei
0
H corespunz!toare statisticii
T a testului, prin care n"elegem acea mul"ime de valori ale
statisticii T astfel nct dac! valoarea observat! a lui T
apar"ine acestei mul"imi, atunci ipoteza
0
H se respinge,
acceptndu-se
%
H . n caz contrar se accept!
0
H . Regiunea
critic! W este astfel determinat! nct probabilitatea
comiterii erorii de genul doi s! fie minim! #i probabilitatea
ca T ob"inut prin selec"ie s!-i apar"in! cnd
0
H este
adev!rat!, s! fie egal! chiar cu , adic! vor fi ndeplinite
condi"iile:
= ) / (
0
H W T P #i = ) / (
%
H W T P maxim
Conform defini"iei riscului , putem scrie = ) / (
%
H W T P ,
unde W este complementara mul"imii W .
Probabilitatea de a respinge
0
H ca fals! (fiind adev!rat!
%
H ) adic! de a nu comite eroarea de genul doi este:
= = % ) / ( ) , (
% %
H W T P H W
#i poart! numele de puterea testului, care este cu att mai mare cu
ct este mai mic.
Pn! acum am presupus c! reparti"ia teoretic! a variabilei
aleatoare X este specificat!, iar n cele mai multe cazuri este
reparti"ia normal!.
De foarte multe ori chiar specificarea reparti"iei reprezint! o
ipotez! care trebuie verificat!. De aceea, practica statistic! pune
problema realiz!rii unei leg!turi ntre variabila empiric! (de
selec"ie)
*
X #i variabila teoretic! X .
Fie variabilele:

k i
k i
n n n n
x x x x
X


2 %
2 % *
:
;
%
%
=

=
k
i
i
n
,
#i

) (
:
x f
x
X
.
Se va cerceta dac! #irul numeric al frecven"elor absolute
empirice
i
n reflect! legea ipotetic! a variabilei teoretice X ,
concretizat! n func"ia ) ,..., ; (
% k
a a x f .
Rezolvarea acestei probleme presupune urm!toarele etape:
%. Estimarea parametrilor, f!cut! "innd seama de eventualele
semnifica"ii pe care le pot avea n leg!tur! cu caracteristicile
distribu"iei teoretice #i de calit!"ile estima"iei respective.
2. Se construie#te, dup! estimarea parametrilor, variabila
pseudo-teoretic!:

k i
k i
n n n n
x x x x
X
' ' ' '
:
2 %
2 % '


;
% '
%
=

=
k
i
i
n
, f!cndu-se leg!tura
ntre variabila empiric!
*
X #i variabila teoretic! X .
Determinarea frecven"elor absolute calculate
i
n este
realizat! prin intermediul func"iei de probabilitate, folosind rela"ia:
) ,..., ; (
%
*
k
i
i
a a x f
n
n
=
, de unde ) ,..., ; (
%
*
k i i
a a x f n n = , n i ,..., % = .
OBSERVA$IE: Datorit! unor propriet!"i ale au func"iilor
de probabilitate ) (x f pentru determinarea frecven"elor calculate
i
n' , de cele mai multe ori se folosesc formulele de recuren"!,
pornindu-se de la valoarea dominant! (cu maximum de probabilitate
a realiz!rii argumentului).
3. Verificarea ipotezei
0
H de concordan"! ntre reparti"ia
empiric! #i reparti"ia teoretic!, ipotez! ce se verific! folosind a#a-
numitele teste de concordan!# .
a) Testul de concordan!#
2
:
Studiind func"ia

=
k
i
i
i i
n
n n
%
2
2
'
) ' (

, K.Pearson a ar!tat c!,


n cazul unui sondaj cu revenire n popula"ia studiat!, cnd
probabilit!"ile
i
p nu sunt apropiate de 0 sau %, iar produsele
i i i
p n n = ' , unde ) (
i i
x f p = , dup! estimarea parametrilor, nu sunt
prea mici (practic nu sunt mai mici dect 5), func"ia considerat! are
reparti"ia
2
cu k s ) % ( grade de libertate, s fiind num!rul de
valori observate, iar k num!rul parametrilor estima"i.
OBSERVA$II:
Dac! legea presupus! este legea Poisson, ea are un singur
parametru, deci % = k , iar num!rul gradelor de libertate va fi
2 % ) % ( = s s ; dac! legea presupus! este legea normal!, atunci
2 = k #i avem 3 2 ) % ( = s s grade de libertate.
Dup! cum am precizat mai sus, legea
2
condi"ia ca
i i i
p n n = ' s! nu fie numere mai mici dect 5. n cazul n care exist!
astfel de numere, se vor cumula la prima frecven"!
i
n mai mare ca
5. Aceasta face ca num!rul s s! fie modificat corespunz!tor noii
situa"ii, devenind s
~
, iar num!rul gradelor de libertate devenind
k s ) %
~
( . Dac! ntre reparti"ia de selec"ie #i reparti"ia teoretic!
exist! concordan"!, atunci statistica
2
definit! n rela"ia

=
k
i
i
i i
n
n n
%
2
2
'
) ' (

trebuie s! fie mai mic! #i nu va dep!#i o valoare


determinat!
2
; ) % (

k s
corespunz!toare num!rului gradelor de
libertate k s ) % ( #i pragului de semnifica"ie dat. Regiunea
critic! a testului va fi dat! de inegalitatea
2
; ) % (
2


k s
> #i deci,
dac!
2
; ) % (
2


k s
accept!m ipoteza
0
H , n caz contrar o
respingem.
b) Testul de concordan!# al lui Kolmogorov:
Din studierea convergen"ei func"iei empirice de reparti"ie
) (x F c!tre func"ia teoretic! de reparti"ie ) (x F , Kolmogorov a
demonstrat urm!toarea teorem!:


= =

<
k
k k
n
n
e K
n
d P
2 2
2
) % ( ) ( lim

, unde 0 > #i
) ( ) ( max x F x F d
n n
= .
Func"ia ) ( K este calculat! n tabele pentru diverse valori
ale lui (tabelul distribu"iei Kolmogorov) .
Cu ajutorul acestei teoreme se poate da un criteriu de
verificare a ipotezei
0
H c! reparti"ia empiric! urmeaz! o anumit!
lege de reparti"ie.
Dac! ipoteza
0
H este adev!rat!, atunci diferen"ele
) ( ) ( x F x F
n
nu vor dep!#i o anumit! valoare
n
d
;
pe care o fix!m
astfel nct:

= > ) / (
0 ;
H d d P
n n
, unde este riscul de gradul
nti. Dar ) ( % ) (
; ; n n n n
d d P d d P

= > .
Lund
n
d
n

=
;
, nseamn! c! atunci cnd
0
H este
adev!rat! #i n suficient de mare avem:


= =

> ) ( % % K
n
d P
n
d P
n n
.
Unui prag de semnifica"ie dat i corespunde prin rela"ia

= % ) ( K o valoare

astfel nct, pentru un volum n dat al


selec"iei g!sim valoarea
n
d
n

=
;
.
Regiunea critic! pentru ipoteza
0
H este dat! de rela"ia
n
d
n

>
. Deci:
dac!
n
d
n

<
, exist! concordan"! ntre ) ( x F
n
#i ) (x F #i se
accept! ipoteza
0
H .
dac!
n
d
n

, nu exist! concordan"! #i respingem ipoteza


0
H .
EXEMPLU:
Pentru a organiza mai bine serviciul n perioada de vrf, la
un sector al unui magazin se cerceteaz! sosirile cump!r!torilor la
raionul respectiv, ct #i timpul de servire al unei persoane. Astfel,
considernd intervalele de timp de 5 minute, luate la ntmplare n
perioada de vrf, se num!r! de fiecare dat! cte persoane sosesc la
raionul urm!rit. Au fost cercetate 200 perioade de cte 5 minute,
ob"inndu-se rezultatele din tabelul
%
T , n care am notat cu x
num!rul care arat! n cte perioade din cele 200 cercetate am
observat exact x sosiri. S-a m!surat, pe de alt! parte, timpul de
servire a 30 cump!r!tori, lua"i la ntmplare, n perioada de vrf,
ob"inndu-se datele din tabelul
2
T , unde am notat cu y timpul de
servire al unui cump!r!tor #i cu
y
n num!rul de cump!r!tori, pentru
care timpul de servire este y. Deoarece variabila aleatoare y este
continu!, crecetarea a fost f!cut! pe intervale de cte 30 secunde
(0,5 minute), pe care le vom reduce n calcule la jum!t!"ile lor.
a) S! se testeze ipoteza
0
H c! sosirile cump!r!torilor la
raionul considerat sunt de tip Poisson.
b) S! se testeze ipoteza
0
H c! timpul de servire a unui
cump!r!tor are o distribu"ie exponen"ial!.
Tabelul
%
T :
NR. SOSIRI N
5 MIN. (X)
FRECVEN$E
ABSOLUTE (
x
n )
0 %
% %6
2 3%
3 37
4 4%
5 30
6 23
7 %3
8 6
9 %
%0 0
%% %
%2 0
Total 200
Tabelul
2
T :
INTERVAL DE
TIMP ) ; (
% i i
y y

FRECVEN$E
ABSOLUTE ) (
y
n
0,5-% %8
%-%,5 8
%,5-2 2
2-2,5 %
2,5-3 %
Total 30
a) Facem o ajustare a reparti"iei empirice din tabelul
%
T dup! o
reparti"ie Poisson:
,... 2 , % ,
!
) ; ( = =

x
x
e x f
x


Deoarece media reparti"iei Poisson este egal! cu , vom
estima parametrul prin media de selec"ie X , deci:
4
200
800
= =

= =

x
x
x
x
n
n x
X
.
Determin!m frecven"ele
!
4
200 '
4
x
e n
x
x
=

, calculnd nti
pentru 4 = x , considerat! ca cea mai probabil! din tabelul
%
T :
% , 39
! 4
4
200 '
4
4
= =

e n
x
#i apoi celelalte, folosind formulele de
recuren"! care sunt u#or de dedus:
x x
n
x
n ' '
%
=

, pentru 4 < x #i
x x
n
x
n '
%
'
%

+
=
+

, pentru 4 > x . Rezultatele ob"inute se trec n


coloana
x
n' a tabelului:
Tabelul
3
T :
x
x
n
x
n x
x
n'
x x
n n '
x
x x
n
n n
'
) ' (
2

1 2 3 4 5 6
0 % 0 3,7 -%,4 0,%%
% %6 32 %4,7
2 3% 62 29,3 %,7 0,%0
3 37 %%% 39 -2 0,%%
4 4% %64 39,% %,9 0,99
5 30 %50 3%,4 %,4 0,06
6 23 %38 20,8 2,2 0,29
7 %3 9% %%,9 %,% 0,%0
8 6 48 6,0
9 % 9 2,6
%0 0 0 %,0 -2,% 0,44
%% % %% 0,4
%2 0 0 0,%
Total 200 800 200
%4 , 2
2
=
Pentru a testa ipoteza
0
H , aplic!m testul
2
, motiv pentru
care am cumulat valorile mici de pe coloanele lui
x
n #i
x
n' . S-a
ob"inut:
%4 , 2
'
) ' (
%2
0
2
2
=

= x
x
x x
n
n n

Pentru nivelul de semnifica"ie 05 , 0 = #i num!rul gradelor


de libertate 6, g!sim 59 , %2
2
6 ; 05 , 0
= . Avem
2
6 ; 05 , 0
2
<
C
, deci
accept!m ipoteza
0
H , adic! sosirile cump!r!torilor la raionul
respectiv sunt de tip Poisson, cu media 4 = persoane n 5 minute.
b) Facem aici o ajustare a reparti"iei empirice din tabelul
2
T ,
dup! o reparti"ie exponen"ial! de forma: 0 , ) ( > =

y e y f
y
.
Drept valori ale lui y vom considera tabelul
4
T mijloacele
intervalelor timpilor de servire #i calcul!m valoarea medie a
variabilei empirice cu formula:
07 , %
30
32
) ( = =

= =

y
y
n
n y
Y M Y
Pentru c! estimatorul de maxim! verosimilitate al
parametrului este
Y
%
, estim!m pe prin:
925 , 0
32
30 %
= = =
Y

.
Pentru a testa ipoteza
0
H vom aplica testul lui
Kolmogorov. n acest scop calcul!m mai nti coloana ) ( y F
n
a
func"iei de reparti"ie empirice, cumulnd pe fiecare linie frecven"ele
absolute din linia respectiv! #i de deasupra ei #i mp!r"ind rezultatul
la 30. De exemplu:
87 , 0
30
%8 8
) (
2
=
+
= y F
Calcul!m apoi valorile corespunz!toare ale func"iei de
reparti"ie teoretic! ) ( y F folosind formula cunoscut! a acesteia:
y
e y F

=

% ) ( , pentru 925 , 0 =
De exemplu: 87 , 0 % ) 25 , 2 (
925 , 0 25 , 2
= =

e F .
Ultima coloan! a tabelului
4
T con"ine diferen"ele
) ( ) ( x F x F
n
cu cea mai mare dintre ele eviden"iat!.
Tabelul
4
T :
) [
% i i
y y
i
y
i
n
i i
n y ) ( y F
n
) ( y F
) ( ) ( y F y F
n

0,5-% 0,75 %8 %3,50 0,66 0,60 0,00
%-%,5 %,25 8 %0,00 0,87 0,75 0,12
%,5-2 %,75 2 3,50 0,93 0,84 0,09
2-2,5 2,25 % 2,25 0,97 0,87 0,%0
2,5-3 2,75 % 2,75 %,00 0,94 0,06
Total 30 30,00
Considernd drept nivel de semnifica"ie 0% , 0 = , tabelul
corespunz!tor testului lui Kolmogorov d! 63 , % =

#i cum 5 = n
avem:
n n
d x F x F
n n
= = > = = ) ( ) ( max %2 , 0 73 , 0
63 , %

Accept!m ipoteza
0
H c! timpul de servire a unui
cump!r!tor are o reparti"ie exponen"ial! cu parametrul 925 , 0 = .

S-ar putea să vă placă și