Sunteți pe pagina 1din 3

Cursul 10

Elemente de statistică matematică


Populaţie. Selecţie. Momente de selecţie.
O cercetare statistică porneşte de la o colectivitate (sau populaţie) alcătuită din elemente
(numite unităţi) care au o caracteristică generală comună. Vom presupune că această
caracteristică este descrisă de o variabilă aleatoare X.
Se numeşte selecţie sau eşantion o colectivitate parţială finită formată din elemente alese la
întâmplare. Numărul acestor elemente se numeşte volumul selecţiei. Selecţia este repetată dacă
elementul ales la întâmplare este reintrodus în colectivitatea generală înaintea efectuării
următoarei alegeri şi este nerepetată dacă elementele alese nu se mai introduc în colectivitatea
generală.
Vom nota cu X1 , X 2 , , X n valorile observate ale variabilei aleatoare X şi le vom numi date
(sau valori) de selecţie. Privite apriori, în cazul unei selecţii repetate, ele sunt variabile aleatoare
independente, identic repartizate cu variabila aleatoare X (se numesc variabile de selecţie). Când
volumul colectivităţii generale este suficient de mare (comparat cu volumul selecţiei), deosebirea
dintre o selecţie repetată şi una nerepetată este nesemnificativă.
Definiţie. Orice funcţie de datele de selecţie se numeşte funcţie de selecţie sau statistică.
Să considerăm că valorile de selecţie sunt aranjate în ordine crescătoare : x1  x2   xn .
Dacă sunt distincte, atunci construim variabila aleatoare X  (numită variabila aleatoare de
 x1 x2xn 
selecţie) : X  :  1 1

1  . Funcţia de repartiţie a acestei variabile se numeşte funcţia de
 
n n n
repartiţie empirică (sau funcţia de repartiţie de selecţie) şi o vom nota cu Fn . Avem
n
Fn  x   x ,  x  R , unde nx reprezintă numărul valorilor de selecţie mai mici decât x. Dacă
n
valorile de selecţie nu sunt distincte, atunci notând cu x1  x2   xk valorile de selecţie
 x1 x2 xk 
distincte, ordonate crescător, avem : X :  n1 
n2

nk  , unde k  n, ni este numărul
 
n n n 
k
valorilor de selecţie egale cu xi , i  1, k şi  ni  n. Fie F funcţia de repartiţie a lui X (numită şi
i 1
funcţia de repartiţie teoretică).
Teorema lui Glivenko (teorema fundamentală a statisticii matematice).
 
P  lim sup Fn  x   F  x   0   1
 n  xR 
adică, supremul diferenţei absolute dintre funcţia de repartiţie empirică şi funcţia de repartiţie
teoretică converge aproape sigur la zero.
Definiţii. Fie selecţia X1 , X 2 , , X n . Momentele variabilei aleatoare de selecţie X  se numesc
momente de selecţie (sau momente empirice). Numim moment iniţial de selecţie de ordin r
variabila aleatoare
1 n r
mr    Xi .
n i 1

1
În cazul particular r  1 , el se numeşte media de selecţie şi se notează cu X (sau cu X n ), deci
1 n
X  m1   Xi .
n i 1
Numim moment centrat de selecţie de ordin r variabila aleatoare
1 n
 
r
r   Xi  X
n i 1
.
2 2
Pentru r  2 el se numeşte dispersia de selecţie (se mai notează cu  sau cu  n ), deci
2
  2 
1 n

 Xi  X
n i 1

2
. Avem M     n n1  D  X  .
2

1 n
 
2
Numim dispersia de selecţie modificată (sau corectată) variabila aleatoare sn2   Xi  X
n  1 i 1
. Avem M  sn2   D  X  .
Cu ajutorul momentelor de selecţie definim şi alţi indicatori de selecţie :
 3
- asimetria de selecţie (sau asimetria empirică) :  1 
 2  2
3

4
- excesul de selecţie (sau excesul empiric) :  2  3
 
 2
2

- coeficientul de corelaţie de selecţie (sau coeficientul de corelaţie empiric) :


1 n

  X i  X  Yi  Y
n i 1
 
 X ,Y 
2 2
 X  Y

Propoziţie (Selecţia din populaţia normală).


Dacă X are repartiţia normală N  m,  , atunci:
  
a) media de selecţie X n are repartiţia normală N  m, ;
 n
2
b) variabilele aleatoare X n şi  n (media de selecţie şi dispersia de selecţie) sunt independente.

Exemple:

1). La o staţie meteorologică temperaturile (în grade Celsius) înregistrate în ultimii 8 ani, la ora
12 din data de 1 august, au fost : 30, 24, 35, 36, 32, 23, 31, 37. Să se scrie funcţia de repartiţie
empirică şi să se calculeze media de selecţie (temperatura medie multianuală a locului), dispersia
de selecţie şi dispersia de selecţie modificată.
 23 24 30 31 32 35 36 37 
Rezolvare. Avem : X :  1 1 1 1 1 1 1 1  ,

 
8 8 8 8 8 8 8 8

2
0, x  23
1 8, 23  x  24

1 4, 24  x  30

3 8, 30  x  31

 
F8  x   P X  x  1 2,

31  x  32 ,
5 8, 32  x  35

3 4, 35  x  36

7 8, 36  x  37
1, x  37
1 8
 
2
X   30  24  35  36  32  23  31  37  8  31 ,  Xi  X
2
  
8 i 1
 30  312   24  312  35  312  36  312  32  312   23  312 

1 192 1 8
 192
2
 31  312   37  312     24 , s82   X i  X   27,4286
8 8 7 i 1 7

2). Se consideră o colectivitate de oameni a căror înălţime are repartiţia normală cu media 170
cm. Probabilitatea ca media de selecţie corespunzătoare unei selecţii de volum 36 să depăşească
175 cm este 0,1977. Să se determine probabilitatea ca luând la întâmplare un membru al
colectivităţii, el să aibă înălţimea peste 190 cm.
 
Rezolvare. Avem X N 170, 6  , P X  175  0,1977, P  X  175 

 X  170 5 
 
1  P X  175  1  P  
 30 
  1      0,1977 , unde  este funcţia de repartiţie a
  6  6  
30 30
normalei N  0,1 . Rezultă   1  0,8023  0,85,   35, 29411765 , probabilitatea cerută
 0,85
 X  170 20 
este P  X  190   1 P  X  190   1  P     1   0,56666  
   
1  0,714567  0,285433