Sunteți pe pagina 1din 19

1.

Elemente de teoria seleciei


1.1. Orice cercetare statistic are drept punct de plecare o mulime
(numit colectivitate sau populaie) alctuit din elemente care au n comun
o caracteristic general i care se difereniaz prin valori diferite sau
atribute.
Elementele colectivitii (populaiei) le vom numi uniti. Cnd se face
studiul unei colectiviti cel mai adesea suntem nevoii s ne limitm studiul
la o parte finit, bine determinat din ntreaga colectivitate. Ca atare, se
pune ntrebarea: dac concluziile pe care le tragem concord cu rezultatul pe
care l-am obine studiind ntreaga colectivitate. Apare problema studiului
modului n care valorile tipice (care stau la baza concluziilor) ale
colectivitii parial studiate, pot furniza informaii asupra valorilor tipice
ale ntregii colectiviti.
Vom presupune, n cele ce urmeaz, c urmrim o anumit
caracteristic a colectivitii generale i c aceast caracteristic este
descris de o variabil aleatoare X definit pe un cmp de probabilitate
( , K , P ) , n care elementele mulimii sunt tocmai elementele

colectivitii generale, K este un corp borelian de pri ale lui , iar P este o
probabilitate definit pe K.
Faptul c suntem obligai s cercetm numai o anumit parte din
populaie este impus de natura concret a colectivitii. Astfel, dac numrul
elementelor populaiei este infinit, n mod necesar vom cerceta doar un
numr finit de uniti i drept urmare vom obine o informaie trunchiat.
Chiar i n cazul n care numrul unitilor populaiei este finit, atunci cnd
cercetarea calitii unitilor conduce la distrugerea lor (exemplul unui lot de
conserve mbuteliate) evident c se impune alegerea unui numr finit pentru
cercetare. Dac vom ine cont i de faptul c orice cercetare implic i
anumite cheltuieli, rezult clar c suntem obligai s cercetm numai o parte
din ntreaga colectivitate.
Vom numi selecie (eantion) o colectivitate parial de elemente
(uniti) luate la ntmplare. Numrul elementelor dintr-o selecie l vom
numi volumul seleciei.
Vom spune c o selecie este repetat dac elementul luat la ntmplare
este reintrodus n colectivitatea general, nainte de efectuarea urmtoarei
extrageri. Selecia se va numi nerepetat dac elementele extrase la
ntmplare nu se mai introduc n colectivitatea general.
S considerm o populaie , finit sau infinit, n sensul c este
1

format dintr-un numr finit sau infinit de uniti. Dac populaia este
finit, vom nota cu N numrul unitilor ce o compun, iar N l vom numi
volumul populaiei . Studiem populaia din punctul de vedere al unei
proprieti X. Aceast proprietate, care variaz (n general) aleator de la o
unitate la alta a populaiei o vom asimila cu o variabil aleatoare X i o vom
numi variabil aleatoare teoretic definit pe populaia .
Caracteristicile probabilistice ale variabilei aleatoare teoretice X le vom
numi caracteristici teoretice, astfel:

m = M ( X ) , media teoretic;
D = 2 = D( X ) , dispersia teoretic (notat i D 2 ( X ) , aici 2 nu este
putere);

mr = M ( X r ) , momentul iniial de ordinul r, teoretic;

r = M [( X m) r ] , momentul centrat de ordinul r, teoretic.


Cercetarea unitilor din populaia se poate face printr-o observare
total sau parial.
Cercetarea total (care se efectueaz de exemplu sub form de

recensmnt) este o operaie complex, care de cele mai multe ori primete
mai multe caracteristici ale unitilor, pentru a realiza o analiz
multilateral. Practic, o cercetare total se recomand atunci cnd volumul
populaiei nu este prea mare, pentru a evita cheltuieli ce pot depi
avantajele concluziilor trase.
Cercetarea

parial

(selectiv)

se

efectueaz

asupra

unei

subpopulaii , subpopulaie de volum n. Variabila aleatoare asimilat


caracteristicii studiate corespunztoare subpopulaiei de selecie este
reprezentativ, ceea ce nseamn c n subpopulaia sunt reflectate
proprietile ntregii populaii .
2

Construirea eantionului (subpopulaiei de selecie) se face cu


uniti din populaia , alese dup o anumit tehnic (dup anumite reguli)
numit operaie de sondaj.
n efectuarea unui sondaj ntlnim dou metode de baz:
a) Sondaj cu revenire:
Fiecare unitate de sondaj extras din pentru a fi studiat, se
reintroduce n , dup cercetare, putnd deci s apar din nou n procesul
de construcie al eantionului . Efectuarea sondajului cu revenire are ca
schem probabilistic urna lui Bernoulli (urna cu bil revenit). n acest caz
vom spune c s-a efectuat o selecie repetat de volum n. Sondajele astfel
efectuate sunt echiprobabile, iar valorile de selecie astfel obinute sunt
independente.
b) Sondaj fr revenire:
Fiecare unitate de sondaj extras din pentru a fi studiat nu mai
este reintrodus n dup studiere (cercetare). Efectuarea sondajului fr
revenire are ca schem probabilistic schema urnei cu bil nerevenit. n
acest caz vom spune c s-a efectuat o selecie nerepetat de volum n.
Aplicarea seleciei nerepetat nu are sens dect n cazul cnd volumul
populaiei este finit. Valorile de selecie astfel obinute sunt dependente.
Selecia repetat i selecia nerepetat sunt aplicate colectivitilor omogene.
O colectivitate este omogen dac este constituit din elemente care sunt
susceptibile de a avea sau de a nu avea caracteristica studiat, cu o aceeai
pondere. n cazul cnd sondajul se efectueaz dintr-o populaie omogen, el
se numete sondaj simplu (selecie simpl) .
n cazul cnd populaia nu este omogen din punct de vedere al
caracteristicii (al proprietii) cercetate dar poate fi mprit n subpopulaii

i , fiecare n parte omogen, ca nite straturi ale populaiei , se va efectua


3

aa numita selecie stratificat.


Fie , o populaie de selecie de volum n. Valorile variabilei
teoretice X pentru fiecare unitate din eantionul determin irul de valori
X 1 , X 2 ,..., X j ,..., X n . Considerate aposteriori, valorile observate sunt valori
determinate ale variabilei aleatoare X. Privite apriori, valorile X1, X2,.., Xn
pot fi considerate ca variabile aleatoare independente, identic repartizate cu
variabila X (n cazul unei selecii repetate). Deoarece participarea oricrei
uniti din populaia la eantionul este echiprobabil (deoarece
sondajul se face ntmpltor) , fiecare valoare X j din irul anterior se
realizeaz n eantion cu aceeai probabilitate

1
. Astfel se construiete
n

variabila de selecie X * , cu repartiia :


X1 X 2 X j X n

*
X : 1
1
1
1

n
n
n
n
Caracteristicile variabilei aleatoare de

selecie X * ,

numite

caracteristici de selecie, sunt:


1 n
Xj ;
n j =1

media de selecie m * = X =

dispersia de selecie (notat i n sau ) D * =

1 n
( X j X )2

n j =1

(se numete dispersia de selecie nemodificat sau necorectat),


avem i dispersia de selecie modificat (sau corectat)

s2 =

1 n
( X j X )2 ;

n 1 j =1

2 =

1 n
( X j m)2 , unde m = M ( X ) .
n j =1

precum

dispersia

momentul iniial de selecie de ordin r: mr* =


m r sau cu M r );
4

de

selecie

1 n r
X j (notat i cu
n j =1

momentul centrat de selecie de ordin r: r* =

1 n
( X j X )r
n j =1

(notat i cu r );
-

Coeficientul de variaie al seleciei: cv =

Eantionul , la rndul lui, are un aspect aleatoriu determinat n primul


rnd de caracterul ntmpltor al sondajului. Prin urmare, efectund alte
sondaje se obin alte eantioane i alte variabile aleatoare de selecie.
Dac selecia este nerepetat, atunci variabilele X1, X2,.., Xn sunt
dependente, dependena fiind de tipul lanurilor cu legturi complete.
Dac volumul colectivitii generale este suficient de mare, iar volumul
seleciei este destul de mic, deosebirea dintre o selecie repetat i una
nerepetat este nesemnificativ i, ca atare, n aplicaiile practice, o selecie
nerepetat se trateaz dup modelul seleciei repetate.
Orice funcie de datele de selecie o vom numi funcie de selecie sau
statistic.
Vom introduce cteva funcii de selecie, spre exemplificare, pornind de
la o selecie de volum n: X1, X2,.., Xn. S aezm n ordine nedescresctoare
datele acestei selecii: X (1) X (2 ) .. X (n ) unde:

X (1) = min { X 1 , X 2 ,.., X n } i X ( n ) = max { X 1 , X 2 ,.., X n } .

Mulimea

{ X ( ) , X ( ) ,.., X ( ) }
1

o vom numi statistic a ordinei, iar pe

X (r ) statistic de ordine de rang r.

Pornind de la statistica ordinei definim amplitudinea de selecie:


W ( X 1 , X 2 ,.., X n ) = X ( n ) X (1) .
Un rol fundamental n statistica matematic l constituie funcia de
selecie numit funcia de repartiie empiric (sau de selecie), definit prin
n
Fn ( x ) = x , x R , unde n este volumul seleciei, iar nx este numrul
n
valorilor de selecie X1, X2,.., Xn mai mici dect x. Avem
1 pentru Y ( , x )
1 n
Fn ( x ) = I( , x ) ( X k ) , unde I ( , x ) (Y ) =
. Se
n k =1
0 n rest
constat imediat c

Fn ( x )

este o funcie de repartiie ca i

F ( x ) = P ( : X ( ) < x ) care este ns funcia de repartiie teoretic a

variabilei aleatoare X.
n cele ce urmeaz vom considera numai selecii repetate.
Vom meniona, fr demonstraii dou teoreme ce constituie justificarea
teoretic a metodei seleciei i anume teorema lui V.I.Glivenko (teorema
fundamental a statisticii matematice) i teorema lui A.N. Kolmogorov.
Teorema lui Glivenko
Dac F ( x ) este funcia de repartiie teoretic, iar Fn ( x ) funcia de

repartiie empiric, atunci: P lim sup Fn ( x ) F ( x ) = 0 = 1


n xR

Teorema lui Kolmogorov


Dac funcia de repartiie teoretic F ( x ) este continu, iar Fn ( x ) este

funcia de repartiie empiric corespunztoare, atunci :

2 2

k
lim P sup Fn ( x ) F ( x )
K
=
=
1) e k , > 0

(
)
(

n xR
n
k =
Rezult c teorema lui Kolomogorov d posibilitatea evalurii distanei
dintre funcia de repartiie F ( x ) i funcia empiric de repartiie Fn ( x ) .

1.2. Momente de selecie (momente empirice)


Printre cele mai importante caracteristici numerice de selecie se afl
momentele de selecie. Acestea sunt n realitate funcii de selecie, cu care se
opereaz atunci cnd nu se cunoate legea de repartiie a variabilei aleatoare
X, din care s-a prelevat selecia.
Definiia 1.2.1. Dac X1, X2,.., Xn este o selecie de volum n, atunci vom
numi moment de selecie de ordin r, pe care-l vom nota M r , expresia:
1 n
M r = X rj
n j =1
Se nelege c M r este o variabil aleatoare. Pentru r = 1 se obine
1 n
media de selecie: M 1 = X = X j .
n j =1

Definiia 1.2.2. Numim moment centrat de ordin r de selecie, notat r ,

1 n
expresia r = X j - X
n j =1

Pentru r = 2 se obine dispersia de selecie necorectat:


6

1
n

2 = = X j - X
j =1

Am numit 2 dispersia de selecie necorectat, pentru a o deosebi de


s2 =

n
1
X j X
n 1 j =1

, pe care o vom numi dispersie de selecie corectat.

Proprieti:
1. Media momentului iniial de selecie de ordin r este momentul iniial
teoretic de ordin r, adic M M r = M r ( X ) = mr .

( )

Calculnd media variabilelor aleatoare M r vom obine:


nM (X r )
1 n r 1 n
r
M M r = M X j = M ( X j ) =
= Mr ( X )
n
n j=1
n j=1
Deci media momentului iniial de selecie este momentul iniial teoretic.
2. Dispersia variabilei aleatoare M r este:
1 n
1
n

D M r = D X rj = 2 D X rj =
n j =1
n
j =1

2
n M 2r ( X ) M r ( X ) M 2r ( X ) M r2 ( X )
=
,
n2
n
n ipoteza c exist M r ( X ) i M 2r ( X ) . S-a aplicat aici faptul c

( )

( )

variabilele de selecie X1, X2,.., Xn sunt independente i identic repartizate cu


variabila aleatoare X.
3. S aplicm inegalitatea lui Cebev variabilei M r :
D Mr
M 2r ( X ) M r2 ( X )
1
P M r M r ( X ) < 1
=

2
n 2

( )

Prin trecere la limit se obine: lim P M r M r ( X ) < = 1 , ceea ce


n

p
M r ( X ) (momentele iniiale de selecie
conduce la faptul c M r
n

converg n probabilitate ctre momentele iniiale teoretice, cnd volumul


seleciei tinde la infinit).

4.

Dac exist M r ( X )

i M 2r ( X ) atunci, conform teoremei limit

central, variabila normat

M r Mr ( X )

Y N ( 0;1)

M 2r ( X ) M ( X ) n
n
n aplicaii practice, aceste rezultate asimptotice (n ) se aplic
astfel: dac volumul de selecie este suficient de mare atunci variabila
X M (X )
are aproximativ o lege de repartiie normal N(0,1), iar
D(X )
n
2
r

M r Mr ( X )

urmeaz aproximativ o lege normal N(0,1).


M 2r ( X ) M r2 ( X )
n
Aceste rezultate au loc oricare ar fi legea de repartiie a variabilei
aleatoare X, ce caracterizeaz colectivitatea din care s-a efectuat selecia,
respectndu-se condiiile impuse.
5. Ca i n cazul momentelor teoretice, putem exprima momentele
centrate de selecie cu ajutorul momentelor iniiale (obinuite) de selecie.
r
h
1 n
1 n r
h
r = X j - X = ( -1) Crh X rj -h X =

n
n
j =1

j =1 h =0

r
n

h 1
h
= ( 1) Crh X X rj h
h=0

n j =1

h
h
Deci r = ( 1) Crh X M r h i reciproc

h =0

M r = r + r X r 1 +

r ( r 1) 2
X r 2 +
2

, r N*

Pentru r = 2 se obine 2 = M 2 X .
Cu ajutorul momentelor de selecie putem pune n eviden i ali
indicatori de selecie ca: asimetria, excesul i coeficientul de corelaie,
calculate pe baza datelor de selecie. Astfel:

Coeficientul de asimetrie de selecie: 1 = 33


2
2

Coeficientul de exces de selecie: 2 =


Coeficientul
de
corelaie
n
1
X j X Yj Y
n j =1
=
2
1 n
1 n
X j X
Yj Y
n j =1
n j =1

)(

4
2

de

selecie

(empiric):

1.3. Selecia dintr-o populaie normal N(m, )

n aplicaii, adesea ntlnim situaii cnd suntem interesai s cunoatem


repartiia exact a diverselor statistici Tn ( X 1 , X 2 ,.., X n ) cnd volumul de
selecie n ia valori mici. Desigur, toate rezultatele obinute anterior, rmn
valabile dac selecia s-a efectuat dintr-o populaie normal N(m, ).
S presupunem acum c populaiile, din care se efectueaz seleciile,
sunt supuse unei legi normale N(m, ).
S aplicm inegalitatea lui Cebev variabilei M r :
D Mr
M 2r ( X ) M r2 ( X )
P M r M r ( X ) < 1
=

1
2
n 2

( )

Prin trecere la limit se obine: lim P M r M r ( X ) < = 1 , ceea ce


n

p
M r ( X ) . Acest lucru justific nlocuirea
conduce la faptul c M r
n

n aplicaii a momentelor teoretice de ordin r (cnd acestea exist) cu


momentele empirice de acelai ordin, dac n este suficient de mare.
Dac selecia efectuat este dintr-o colectivitate caracterizat de
variabila aleatoare X cu lege de repartiie arbitrar i pentru care exist M(X)
X M (X ) B
B
nseamn
i D(X), atunci :

Y N ( 0;1) , unde
D ( X ) n
n
converge n repartiie.
Vom stabili repartiiile exacte ale celor mai importante funcii de
selecie ce intervin curent n aplicaiile practice. Cel mai frecvent caz ntlnit
n practic este cel al erorilor de observaie ale msurtorilor, care, dup
cum se tie, sunt repartizate dup o lege normal.
Un prim rezultat se refer la legea de repartiie a mediei de selecie.

Teorema 1.3.1. Dac X1, X2,.., Xn este o selecie de volum n (oarecare)


X N ( m, ) atunci media de

dintr-o populaie caracterizat de variabila

1 n
X j are o lege de repartiie N m,
.
n j =1
n

Demonstraie. Cum X1, X2,.., Xn sunt independente i identic


repartizate, avnd repartiia N(m, ), rezult c fiecare are funcia
caracteristic :

selecie X =

X j (t ) = e

it m t 2

, 1 j n

Atunci:

X ( t ) = M eit X
n

it 1 X j
n
= M e j=1

X ( ) = e
t
n

j =1

n i t X
= M e n j

j =1

2
i t m t 2 2
n
2n

=e

it m t 2

2
2n

j =1

Conform teoremei de inversiune i unicitate, aceasta este funcia


caracteristic a unei variabile aleatoare normale N m,


.
n

Deci densitatea de repartiie a variabilei X este:

n
e
fX ( x) =
2

n( x - m )
2

S considerm variabila abatere normat Z =

X m

. Atunci:

Z ( t ) = M eit Z

Rezult
fZ ( x ) =

t n
m

1
e
2

x2

= M e

X m
i t

i t n X i t n m

=
M
e e =

t
t n i t n m i t n m t2n 2n

X j
e
=e 2
= e

densitatea de repartiie a variabilei

, adic Z urmeaz o lege normal N(0;1).

10

este

S considerm acum dou colectiviti C1 i C2, caracterizate de


variabilele
aleatoare
X N ( m1 ; 1 ) ,
respectiv
Y N ( m2 ; 2 ) ,
independente. Din colectivitatea C1 se efectueaz o selecie de volum n1:
X1, X2,.., X n1 , iar din colectivitatea C2 se efectueaz o selecie de volum n2:
Y1,Y2,..,. Yn2 .
Pe baza acestor selecii, obinem mediile de selecie X , Y i dispersiile de
n1
2
1 n1
1
selecie s12 , s22 : X = X j i s12 =
X j - X , respectiv
n1 j =1
n1 - 1 j =1

Y=

n2
1 n2
1
Yj i s22 =
Yj Y
n2 j=1
n2 1 j =1

n aceste condiii variabila aleatoare X Y urmeaz o lege de repartiie

2 2
normal N m1 m2 ; 1 + 2 .

n1 n2

ntr-adevr X , Y sunt independente i drept urmare:


i t ( X Y )
i t ( Y )
i t ( Y )
X Y ( t ) = M e
= M ei t X e
= M ei t X M e
=

X ( t ) Y ( t ) = e

) (

i t m1

t 2 12
2n1

i t ( m 2 )

t 2 22
2n 2

=e

it ( m1 m 2 )

t 2 12 22
+
2 n1 n 2

Acest rezultat conduce la concluzia c variabila X Y urmeaz o lege

2 2
normal N m1 m2 ; 1 + 2 .

n1 n2

Dac acum normm variabila aleatoare X Y obinem, ca i n cazul


X Y ( m1 m2 )
urmeaz o lege
unei singure colectiviti, c variabila Z =
12 22
+
n1 n2
de repartiie normal N(0;1).

Se demonstreaz c pentru o selecie dintr-o populaie normal X i 2


sunt variabile aleatoare independente.

11

Aplicaii
1. Pentru a cerceta prezena studenilor la un anumit curs s-a ales un
eantion de n = 100 studeni i s-a nregistrat numrul absenelor acestora la
patru cursuri consecutive. Rezultatele sunt n tabelul urmtor:
25
15
10 10
Nr. studeni ni 40
0
1
2
3
4
Nr. absene xi

a). S se scrie variabila aleatoare de selecie i funcia de repartiie empiric


Fn ( x ) .
b). S se calculeze media i dispersia de selecie.
c). S se calculeze F100 ( 3) .
Rezolvare: Fie X variabila aleatoare de selecie.
0
a). X = 40

100
*

1
25
100

2
15
100

3
10
100

4
10 ,

100

0, x 0
0, 4, 0 < x 1

0,65, 1 < x 2
F100 ( x ) =
0,8, 2 < x 3
0,9, 3 < x 4

1, x > 4

2
125
1 4
= 1, 25 , 2 = ni xi x =
100
n i =1
i =1
62,5 + 1,5625 + 8, 4375 + 30,625 + 75,625 178,75
=
= 1,7875
100
100
c). F100 ( 3) = 0, 8 .

1
n

b). x = ni xi =

2. Se consider o colectivitate de oameni a cror nlime are repartiia


normal cu media 170 cm. Probabilitatea ca media de selecie
corespunztoare unei selecii de volum 36 s depeasc 175 cm este
0,1977. S se determine probabilitatea ca lund la ntmplare un membru al
colectivitii, el s aib nlimea peste 195 cm.

Rezolvare.
Avem X ~ N 170, , P ( X > 175 ) = 0,1977, P ( X > 175 ) =

6
X 170
5
30
1 P X 175 = 1 P

= 1 F = 0,1977 , unde F este


6

6
30
= F 1 ( 0,8023) = 0,85,
funcia de repartiie a normalei N ( 0,1) . Rezult

12

30
= 35, 29411765 , probabilitatea cerut este
0,85
X 170 25
P ( X > 195 ) = 1 P ( X 195 ) = 1 P
= 1 F ( 0,7083333) =


1 0,760573 = 0,239427

3. Determinai volumul minim al seleciei dintr-o populaie normal, astfel


nct cu o probabilitate de 0,98 media de selecie X s estimeze media
teoretic m cu o eroare absolut mai mic de 0,2, tiind c abaterea standard
a populaiei este = 4.
Rezolvare: Fie n volumul seleciei i caracteristica X ~ N ( m, ) . Avem
X m 0, 2 n

X ~ N m,
<
= 0,98 ,
i P X m < 0, 2 = 0,98 . Deci P

n
n

0, 2 n
0, 2 n
0, 2 n
0, 2 n
X m
<Z <
Z=
~ N ( 0,1) , P
= F
=
F
4

0, 2 n
0, 2 n
n
2 F
= F 1 ( 0,99 ) = 2,33 ,
= 1, 98,
1 , obinem 2 F
4
4
20

2
n = ( 2,33 20 ) + 1 = 2172

4. Se constat c pe o suprafa de un m2 sunt 60 tulpini de lalea cu o


abatere standard = 12 tulpini. Pentru o selecie aleatoare de 64 parcele de
un m2, care este probabilitatea ca media de selecie s fie cuprins ntre 57 i
63 de tulpini.
Rezolvare: Avem m = 60 , n = 64 , X ~ N ( m, ) unde variabila X reprezint
numrul tulpinilor de lalea pe metru ptrat,
12

=
= 1,5 . Deci
X ~ N m = 60,

57 60 X m 63 60
<
<
P 57 < X < 63 = P
= F ( 2 ) F ( 2 ) =
1,5
n
1,5
2 F ( 2 ) 1 = 2 0,9772 1 = 0,9544

5. Proporia p de piese defecte dintr-un lot este necunoscut. Productorul


acestora susine c ar fi de 4%. Extragem la ntmplare, cu revenire, n = 9
piese i constatm c una este defect. Acceptm lotul respectiv sau nu ?
Rezolvare: Fie N variabila aleatoare care d numrul defectelor din
eantion. N are repartiia binomial de parametri n = 9 i p. Dac p = 0,04 ,

atunci avem P ( N = 1) = Cn1 p (1 p )

n 1

13

= 9 0,04 0,968 0, 2597 , care este o

probabilitate prea mic pentru a accepta lotul, deci l respingem. Cum


n
P ( N = 0 ) = Cn0 p 0 (1 p ) = 0,969 0,692534 , pentru a accepta lotul ar fi
trebuit s nu gsim piese defecte. Menionm c volumul seleciei fiind mic
nu putem utiliza teorema Moivre-Laplace, conform creia
N ~ N np , np (1 p ) .

6. Se consider c greutatea persoanelor dintr-o instituie are repartiia


normal cu media de 75 kg i cu o abatere standard de 10 kg. Liftul mare
suport o greutate de 2400 kg. S se determine probabilitate ca 30 de
salariai ce urc simultan n lift s aib o greutate ce depete capacitatea
liftului.

Rezolvare: Avem de aflat P X >


= 80 .
30

10

=
Cum X ~ N m = 75,
avem
2400

30

X m 80 75

5
P X > 80 = P
>
= 1 F
= 1 F ( 2,738613)
n 10 30
10 30
1 0,996886 = 0, 003114 .

.
Lectur suplimentar

Introducem o dispersie de selecie 2 dat de relaia: 2 =

1 n
( X j m) 2
n j =1

n 2
urmeaz o lege de repartiie (2n ) (hi ptrat cu n
Vom arta c
2

grade de libertate).
2
n
Xj m
n 2 n X j - m
2
ntr-adevr
sunt
=
=

Y j , unde Y j =
2


j =1
j =1
variabile aleatoare independente, repartizate normal N(0;1).
S artm c:
0, x 0

n
x
1

1
f n 2 ( x) =
x2 e 2 , x > 0
Yj
2n 2 n
j =1

14

Fie Y N ( 0;1) . Atunci:


0, x 0
FY 2 ( x ) = P Y 2 < x =
=
P
Y
<
x
x
>
,
0

0, x 0

x x , x > 0

( ) (

Rezult c:
0, x 0

x
x
fY 2 ( x ) = FY2 ( x ) = 1

1
1
1
2
2

e +

e , x > 0

2 x 2
2 x 2
0, x 0

1
x

Deci fY 2 ( x ) =
, care este densitatea de
1
2
2
,
0
x
e
x

>
2 ( 1 )
2

2
repartiie a unei variabile cu un grad de libertate. Drept urmare, funcia
1
caracteristic a variabilei Y2 este ( t ) = (1 2 i t ) 2 .
Y2

it Y j2
n it Y 2 n
Obinem: n 2 ( t ) = M e j=1 = M e j = Y 2 ( t ) ,

Y j
j =1
j =1 j
j =1

adic n

Y j2

( t ) = (1 2 i t )

n2

i din teorema de inversiune i unicitate se

j =1

obine:
0, x 0

n
x
1

f n 2 ( x) =
1
2
2

, x>0
x
e
Y
j
2 2n n
j =1
(
)
2

n 2
urmeaz o lege de repartiie (2n ) .
2

Acum putem enuna rezultatul ce urmeaz:


( n 1) s 2 urmeaz fiecare o lege
n 2
Teorema 1.3.2. Variabilele
i
2
2
de repartiie (2n1) (hi ptrat cu n-1 grade de libertate).

Rezult c

15

Demonstraie. Din 2 =

1 n
X j X
n j =1

rezult n 2 = X j X
j =1

Dar

(
n

j =1

Xj X

n X m 2 X m ( X j m) =
2

= ( X j m ) X m = ( X j m ) +

j =1
j =1
n

j =1

( X j m) n ( X m)
n

j =1

X
m

n 2
X m
= j
;
2


j =1

n
2

Rezult:

X j m
= (2n) ;
j =1

X m
n 1) s 2
(
n 2
2
2
= (2n1) .
= ( n1) i

= (1) , deci
2
2

n
Rezultatele obinute ne dau posibilitatea s obinem imediat:
2 ( n 1) 4
( n 1) 2 ;
;
M ( s 2 ) = 2 ;
M 2 =
D2 2 =
n
n2
2 4
D2 s2 =
.
n 1
n
n
M 2 = n 1
M 2 2 = n 1 ,
ntr-adevr
i
2

n 1 2
M 2 =
.
n
n n2
2 ( n 1) 4
D 2 2 2 = 4 D 2 2 = 2 ( n 1) i D 2 2 =
.
2
n

( n 1) s 2
( n 1) M s 2 = n 1
M
deci M ( s 2 ) = 2
= n 1 ;
2
2

( )

( )

( )

( )

( )

( )

( )

( )

( n 1) s 2
( n 1) D 2 s 2 = 2 n 1
D
( )
= 2 ( n 1) ;
2
4

2
4
Deci: D 2 s 2 =
n 1
2

( )

16

( )

Rezultatele de mai sus justific faptul c pe 2 am numit-o dispersie de


selecie necorectat iar pe s2 dispersie de selecie corectat.
Bazai pe rezultatul teoretic: dac X, Y sunt variabile aleatoare
X
independente, X N ( 0;1) i Y cu repartiie (2n ) atunci variabila T =
Y
n
urmeaz o lege de repartiie Student cu n grade de libertate, adic T are
densitatea de repartiie .
n +1
n +1

x 2 2
2 1+
fT ( x ) =

n
n
n
2
( n 1) s 2 , care sunt independente
X m
i
S considerm variabilele

2
n
i repartizate, dup cum am vzut, normal N(0;1), respectiv (2n1) , atunci:
X m

X m
n
=
= T( n 1)
2
s
n
s
1

( )
n
2 ( n 1)

adic are o repartiie Student cu n-1 grade de libertate.


Bazai pe faptul c suma a doua variabile aleatoare (2k1 ) i (2k2 )
independente, este tot o variabil 2 cu numrul gradelor de libertate egal
cu suma gradelor de libertate: (2k1 + k2 ) = (2k1 ) + (2k2 ) , se obine un alt rezultat
n1 1) s12
(
i
important. Colectivitile fiind independente rezult c
12

( n2 1) s22
22

sunt variabile aleatoare (2n1 1) , (2n2 1) independente i, ca atare:

( n1 1) s12 + ( n2 1) s22 = 2
( n + n 2)
2
2

1
2
1
2
Acest rezultat, combinat cu cel de mai sus duce la:

17

X 1 X 2 ( m1 m2 )
12 22
+
n1 n2

adic T( n1 + n2 2)

= T( n1 + n2 2)
( n1 1) s12 ( n2 1) s22
1
+

2
2

1
2

n1 + n2 2
are o lege de repartiie Student cu n1 + n2 2 grade de

libertate (se presupun cunoscute dispersiile 12 i 22 ).


Dac n particular 12 = 22 = 2 (necunoscut), atunci:
X 1 X 2 ( m1 m2 )
12 22
+
n1 n2

( n1 1) s + ( n2 1) s
( n1 + n2 2 ) 2
2
1

2
2

X 1 X 2 ( m1 m2 )

( n1 1) s + ( n2 1) s
2
1

2
2

n1 n2
= T( n1 + n2 2)
n1 + n2

n1 + n2 2

n virtutea rezultatului teoretic, care afirm c dac variabilele aleatoare

(2k1 )

(2k ) , (2k ) sunt independente, atunci


1

(2k2 )

k1

urmeaz o lege de repartiie

k2

Snedecor cu k1, k2 grade de libertate.


Rezult c

( n1 1) s12
( n1 1) 12
( n2 1) s22
( n2 1) 22

s12 22

= Fn1 1;n2 1 urmeaz o lege de repartiie


s22 12

Snedecor cu n1 1 , n 2 1 grade de libertate. Se mai spune c raportul celor


dou variabile 2 independente, este o variabil Fn1 1;n 2 1 , cu gradele de
libertate n ordinea menionat.
n particular, dac dispersiile 12 , 22 sunt egale ( 12 = 22 = 2 ),

s12
= Fn1 1;n2 1
s22
n aplicaiile practice va trebui s inem seama de faptul c tabelele
pentru repartiia Snedecor se construiesc pentru valori ale variabilei Fn1 1;n 2 1

variabila

18

mai mari dect unu. Cnd efectum calcule numerice, nu este nici un
inconvenient deoarece rmne la latitudinea noastr care dispersie de
selecie o vom pune la numrtor, cu atenie la numrul de grade de libertate
corespunztor.
Va trebui totui s fim ateni s nu inversm numrul de grade de
s22
1
1
libertate cci Fn2 1;n1 1 = 2 = 2 =
, fapt ce justific de ce s-au
s1
s1
Fn1 1;n2 1
s22
construit tabele numai pentru Fk1 ;k 2 > 1 .

19

S-ar putea să vă placă și