colectivitii generale, K este un corp borelian de pri ale lui , iar P este o
probabilitate definit pe K.
Faptul c suntem obligai s cercetm numai o anumit parte din
populaie este impus de natura concret a colectivitii. Astfel, dac numrul
elementelor populaiei este infinit, n mod necesar vom cerceta doar un
numr finit de uniti i drept urmare vom obine o informaie trunchiat.
Chiar i n cazul n care numrul unitilor populaiei este finit, atunci cnd
cercetarea calitii unitilor conduce la distrugerea lor (exemplul unui lot de
conserve mbuteliate) evident c se impune alegerea unui numr finit pentru
cercetare. Dac vom ine cont i de faptul c orice cercetare implic i
anumite cheltuieli, rezult clar c suntem obligai s cercetm numai o parte
din ntreaga colectivitate.
Vom numi selecie (eantion) o colectivitate parial de elemente
(uniti) luate la ntmplare. Numrul elementelor dintr-o selecie l vom
numi volumul seleciei.
Vom spune c o selecie este repetat dac elementul luat la ntmplare
este reintrodus n colectivitatea general, nainte de efectuarea urmtoarei
extrageri. Selecia se va numi nerepetat dac elementele extrase la
ntmplare nu se mai introduc n colectivitatea general.
S considerm o populaie , finit sau infinit, n sensul c este
1
format dintr-un numr finit sau infinit de uniti. Dac populaia este
finit, vom nota cu N numrul unitilor ce o compun, iar N l vom numi
volumul populaiei . Studiem populaia din punctul de vedere al unei
proprieti X. Aceast proprietate, care variaz (n general) aleator de la o
unitate la alta a populaiei o vom asimila cu o variabil aleatoare X i o vom
numi variabil aleatoare teoretic definit pe populaia .
Caracteristicile probabilistice ale variabilei aleatoare teoretice X le vom
numi caracteristici teoretice, astfel:
m = M ( X ) , media teoretic;
D = 2 = D( X ) , dispersia teoretic (notat i D 2 ( X ) , aici 2 nu este
putere);
recensmnt) este o operaie complex, care de cele mai multe ori primete
mai multe caracteristici ale unitilor, pentru a realiza o analiz
multilateral. Practic, o cercetare total se recomand atunci cnd volumul
populaiei nu este prea mare, pentru a evita cheltuieli ce pot depi
avantajele concluziilor trase.
Cercetarea
parial
(selectiv)
se
efectueaz
asupra
unei
1
. Astfel se construiete
n
*
X : 1
1
1
1
n
n
n
n
Caracteristicile variabilei aleatoare de
selecie X * ,
numite
media de selecie m * = X =
1 n
( X j X )2
n j =1
s2 =
1 n
( X j X )2 ;
n 1 j =1
2 =
1 n
( X j m)2 , unde m = M ( X ) .
n j =1
precum
dispersia
de
selecie
1 n r
X j (notat i cu
n j =1
1 n
( X j X )r
n j =1
(notat i cu r );
-
Mulimea
{ X ( ) , X ( ) ,.., X ( ) }
1
Fn ( x )
variabilei aleatoare X.
n cele ce urmeaz vom considera numai selecii repetate.
Vom meniona, fr demonstraii dou teoreme ce constituie justificarea
teoretic a metodei seleciei i anume teorema lui V.I.Glivenko (teorema
fundamental a statisticii matematice) i teorema lui A.N. Kolmogorov.
Teorema lui Glivenko
Dac F ( x ) este funcia de repartiie teoretic, iar Fn ( x ) funcia de
2 2
k
lim P sup Fn ( x ) F ( x )
K
=
=
1) e k , > 0
(
)
(
n xR
n
k =
Rezult c teorema lui Kolomogorov d posibilitatea evalurii distanei
dintre funcia de repartiie F ( x ) i funcia empiric de repartiie Fn ( x ) .
1 n
expresia r = X j - X
n j =1
1
n
2 = = X j - X
j =1
n
1
X j X
n 1 j =1
Proprieti:
1. Media momentului iniial de selecie de ordin r este momentul iniial
teoretic de ordin r, adic M M r = M r ( X ) = mr .
( )
D M r = D X rj = 2 D X rj =
n j =1
n
j =1
2
n M 2r ( X ) M r ( X ) M 2r ( X ) M r2 ( X )
=
,
n2
n
n ipoteza c exist M r ( X ) i M 2r ( X ) . S-a aplicat aici faptul c
( )
( )
2
n 2
( )
p
M r ( X ) (momentele iniiale de selecie
conduce la faptul c M r
n
4.
Dac exist M r ( X )
M r Mr ( X )
Y N ( 0;1)
M 2r ( X ) M ( X ) n
n
n aplicaii practice, aceste rezultate asimptotice (n ) se aplic
astfel: dac volumul de selecie este suficient de mare atunci variabila
X M (X )
are aproximativ o lege de repartiie normal N(0,1), iar
D(X )
n
2
r
M r Mr ( X )
n
n
j =1
j =1 h =0
r
n
h 1
h
= ( 1) Crh X X rj h
h=0
n j =1
h
h
Deci r = ( 1) Crh X M r h i reciproc
h =0
M r = r + r X r 1 +
r ( r 1) 2
X r 2 +
2
, r N*
Pentru r = 2 se obine 2 = M 2 X .
Cu ajutorul momentelor de selecie putem pune n eviden i ali
indicatori de selecie ca: asimetria, excesul i coeficientul de corelaie,
calculate pe baza datelor de selecie. Astfel:
)(
4
2
de
selecie
(empiric):
1
2
n 2
( )
p
M r ( X ) . Acest lucru justific nlocuirea
conduce la faptul c M r
n
Y N ( 0;1) , unde
D ( X ) n
n
converge n repartiie.
Vom stabili repartiiile exacte ale celor mai importante funcii de
selecie ce intervin curent n aplicaiile practice. Cel mai frecvent caz ntlnit
n practic este cel al erorilor de observaie ale msurtorilor, care, dup
cum se tie, sunt repartizate dup o lege normal.
Un prim rezultat se refer la legea de repartiie a mediei de selecie.
1 n
X j are o lege de repartiie N m,
.
n j =1
n
selecie X =
X j (t ) = e
it m t 2
, 1 j n
Atunci:
X ( t ) = M eit X
n
it 1 X j
n
= M e j=1
X ( ) = e
t
n
j =1
n i t X
= M e n j
j =1
2
i t m t 2 2
n
2n
=e
it m t 2
2
2n
j =1
n
e
fX ( x) =
2
n( x - m )
2
X m
. Atunci:
Z ( t ) = M eit Z
Rezult
fZ ( x ) =
t n
m
1
e
2
x2
= M e
X m
i t
i t n X i t n m
=
M
e e =
t
t n i t n m i t n m t2n 2n
X j
e
=e 2
= e
densitatea de repartiie a variabilei
10
este
Y=
n2
1 n2
1
Yj i s22 =
Yj Y
n2 j=1
n2 1 j =1
2 2
normal N m1 m2 ; 1 + 2 .
n1 n2
X ( t ) Y ( t ) = e
) (
i t m1
t 2 12
2n1
i t ( m 2 )
t 2 22
2n 2
=e
it ( m1 m 2 )
t 2 12 22
+
2 n1 n 2
2 2
normal N m1 m2 ; 1 + 2 .
n1 n2
11
Aplicaii
1. Pentru a cerceta prezena studenilor la un anumit curs s-a ales un
eantion de n = 100 studeni i s-a nregistrat numrul absenelor acestora la
patru cursuri consecutive. Rezultatele sunt n tabelul urmtor:
25
15
10 10
Nr. studeni ni 40
0
1
2
3
4
Nr. absene xi
100
*
1
25
100
2
15
100
3
10
100
4
10 ,
100
0, x 0
0, 4, 0 < x 1
0,65, 1 < x 2
F100 ( x ) =
0,8, 2 < x 3
0,9, 3 < x 4
1, x > 4
2
125
1 4
= 1, 25 , 2 = ni xi x =
100
n i =1
i =1
62,5 + 1,5625 + 8, 4375 + 30,625 + 75,625 178,75
=
= 1,7875
100
100
c). F100 ( 3) = 0, 8 .
1
n
b). x = ni xi =
Rezolvare.
Avem X ~ N 170, , P ( X > 175 ) = 0,1977, P ( X > 175 ) =
6
X 170
5
30
1 P X 175 = 1 P
12
30
= 35, 29411765 , probabilitatea cerut este
0,85
X 170 25
P ( X > 195 ) = 1 P ( X 195 ) = 1 P
= 1 F ( 0,7083333) =
1 0,760573 = 0,239427
X ~ N m,
<
= 0,98 ,
i P X m < 0, 2 = 0,98 . Deci P
n
n
0, 2 n
0, 2 n
0, 2 n
0, 2 n
X m
<Z <
Z=
~ N ( 0,1) , P
= F
=
F
4
0, 2 n
0, 2 n
n
2 F
= F 1 ( 0,99 ) = 2,33 ,
= 1, 98,
1 , obinem 2 F
4
4
20
2
n = ( 2,33 20 ) + 1 = 2172
=
= 1,5 . Deci
X ~ N m = 60,
57 60 X m 63 60
<
<
P 57 < X < 63 = P
= F ( 2 ) F ( 2 ) =
1,5
n
1,5
2 F ( 2 ) 1 = 2 0,9772 1 = 0,9544
n 1
13
10
=
Cum X ~ N m = 75,
avem
2400
30
X m 80 75
5
P X > 80 = P
>
= 1 F
= 1 F ( 2,738613)
n 10 30
10 30
1 0,996886 = 0, 003114 .
.
Lectur suplimentar
1 n
( X j m) 2
n j =1
n 2
urmeaz o lege de repartiie (2n ) (hi ptrat cu n
Vom arta c
2
grade de libertate).
2
n
Xj m
n 2 n X j - m
2
ntr-adevr
sunt
=
=
Y j , unde Y j =
2
j =1
j =1
variabile aleatoare independente, repartizate normal N(0;1).
S artm c:
0, x 0
n
x
1
1
f n 2 ( x) =
x2 e 2 , x > 0
Yj
2n 2 n
j =1
14
0, x 0
x x , x > 0
( ) (
Rezult c:
0, x 0
x
x
fY 2 ( x ) = FY2 ( x ) = 1
1
1
1
2
2
e +
e , x > 0
2 x 2
2 x 2
0, x 0
1
x
Deci fY 2 ( x ) =
, care este densitatea de
1
2
2
,
0
x
e
x
>
2 ( 1 )
2
2
repartiie a unei variabile cu un grad de libertate. Drept urmare, funcia
1
caracteristic a variabilei Y2 este ( t ) = (1 2 i t ) 2 .
Y2
it Y j2
n it Y 2 n
Obinem: n 2 ( t ) = M e j=1 = M e j = Y 2 ( t ) ,
Y j
j =1
j =1 j
j =1
adic n
Y j2
( t ) = (1 2 i t )
n2
j =1
obine:
0, x 0
n
x
1
f n 2 ( x) =
1
2
2
, x>0
x
e
Y
j
2 2n n
j =1
(
)
2
n 2
urmeaz o lege de repartiie (2n ) .
2
Rezult c
15
Demonstraie. Din 2 =
1 n
X j X
n j =1
rezult n 2 = X j X
j =1
Dar
(
n
j =1
Xj X
n X m 2 X m ( X j m) =
2
= ( X j m ) X m = ( X j m ) +
j =1
j =1
n
j =1
( X j m) n ( X m)
n
j =1
X
m
n 2
X m
= j
;
2
j =1
n
2
Rezult:
X j m
= (2n) ;
j =1
X m
n 1) s 2
(
n 2
2
2
= (2n1) .
= ( n1) i
= (1) , deci
2
2
n
Rezultatele obinute ne dau posibilitatea s obinem imediat:
2 ( n 1) 4
( n 1) 2 ;
;
M ( s 2 ) = 2 ;
M 2 =
D2 2 =
n
n2
2 4
D2 s2 =
.
n 1
n
n
M 2 = n 1
M 2 2 = n 1 ,
ntr-adevr
i
2
n 1 2
M 2 =
.
n
n n2
2 ( n 1) 4
D 2 2 2 = 4 D 2 2 = 2 ( n 1) i D 2 2 =
.
2
n
( n 1) s 2
( n 1) M s 2 = n 1
M
deci M ( s 2 ) = 2
= n 1 ;
2
2
( )
( )
( )
( )
( )
( )
( )
( )
( n 1) s 2
( n 1) D 2 s 2 = 2 n 1
D
( )
= 2 ( n 1) ;
2
4
2
4
Deci: D 2 s 2 =
n 1
2
( )
16
( )
x 2 2
2 1+
fT ( x ) =
n
n
n
2
( n 1) s 2 , care sunt independente
X m
i
S considerm variabilele
2
n
i repartizate, dup cum am vzut, normal N(0;1), respectiv (2n1) , atunci:
X m
X m
n
=
= T( n 1)
2
s
n
s
1
( )
n
2 ( n 1)
( n2 1) s22
22
( n1 1) s12 + ( n2 1) s22 = 2
( n + n 2)
2
2
1
2
1
2
Acest rezultat, combinat cu cel de mai sus duce la:
17
X 1 X 2 ( m1 m2 )
12 22
+
n1 n2
adic T( n1 + n2 2)
= T( n1 + n2 2)
( n1 1) s12 ( n2 1) s22
1
+
2
2
1
2
n1 + n2 2
are o lege de repartiie Student cu n1 + n2 2 grade de
( n1 1) s + ( n2 1) s
( n1 + n2 2 ) 2
2
1
2
2
X 1 X 2 ( m1 m2 )
( n1 1) s + ( n2 1) s
2
1
2
2
n1 n2
= T( n1 + n2 2)
n1 + n2
n1 + n2 2
(2k1 )
(2k2 )
k1
k2
( n1 1) s12
( n1 1) 12
( n2 1) s22
( n2 1) 22
s12 22
s12
= Fn1 1;n2 1
s22
n aplicaiile practice va trebui s inem seama de faptul c tabelele
pentru repartiia Snedecor se construiesc pentru valori ale variabilei Fn1 1;n 2 1
variabila
18
mai mari dect unu. Cnd efectum calcule numerice, nu este nici un
inconvenient deoarece rmne la latitudinea noastr care dispersie de
selecie o vom pune la numrtor, cu atenie la numrul de grade de libertate
corespunztor.
Va trebui totui s fim ateni s nu inversm numrul de grade de
s22
1
1
libertate cci Fn2 1;n1 1 = 2 = 2 =
, fapt ce justific de ce s-au
s1
s1
Fn1 1;n2 1
s22
construit tabele numai pentru Fk1 ;k 2 > 1 .
19