Documente Academic
Documente Profesional
Documente Cultură
STATISTICĂ MATEMATICĂ
CAPITOLUL 12
ELEMENTE DE TEORIA SELECŢIEI; SELECŢII DIN POPULAŢII NORMALE
BREVIAR TEORETIC
Ne propunem să studiem o anumită caracteristică a unei colectivităţi C. Presupunem că această caracteristică este modelată
de o variabilă aleatoare X definită pe un câmp de probabilitate (, K, P), în care elementele mulţimii sunt tocmai
elementele colectivităţii C.
Se numeşte selecţie (eşantion) o colectivitate parţială de elemente luate la întâmplare din C.
Numărul elementelor unei selecţii se numeşte volumul selecţiei.
Spunem că o selecţie este repetată dacă elementul luat la întâmplare din C este reintrodus în colectivitatea generală înaintea
efectuării următoarei alegeri.
Se efectuează o selecţie de volum n din populaţia considerată şi se notează cu x1, x2,...., xn valorile de observaţie (valori
de selecţie sau date de selecţie).
După efectuarea selecţiei, valorile de selecţie x1, x2,.., xn sunt valori bine determinate ale variabilei aleatoare X
Înainte de efectuarea selecţiei, acestea sunt variabile aleatoare independente X1, X2,......, Xn, identic repartizate cu
variabila aleatoare X , în cazul unei selecţii repetate.
Variabila aleatoare asociată experimentului cu n probe independente efectuate asupra caracteristicii modelate de variabila
aleatoare X se numeşte variabilă aleatoare de selecţie (empirică) şi se notează X*. Repartiţia variabilei aleatoare X, numită
x1 x2 ................xn
X * : 1 1
repartiţie empirică, este:
............. .... 1
n n n
Funcţia de repartiţie a variabilei aleatoare de selecţie se numeşte funcţie empirică de repartiţie
Se numeşte statistică o funcţie de variabilele aleatoare de selecţie: T (X1, X2,......, Xn).
După efectuarea selecţiei, statisticii T (X1, X2,......, Xn) i se asociază valoarea sa corespunzătoare valorilor de selecţie
obţinute, notată t (x1, x2,...., xn).
n
Pentru r = 1 obţinem media de selecţie: X 1
n
Xi
i 1
n
r 1n X i X
r
Se numeşte moment centrat de selecţie de ordin r statistica
i 1
X i X 1n X i2 X
2 n 2 n 2
S2 2 1
n
i 1 i 1
X
n
Dispersia de selecţie corectată (modificată) este: s 2 1
X
2
n 1 i
i 1
Elemente de teoria selecţiei. Selecţii din populaţii normale 239
Observaţie. Dacă după efectuarea selecţiei de volum n se obţin exact k n valori de selecţie distincte x1, x2,...., xk, valoarea
x1 x 2 . . . . . . . . . . . . . . . .x k
X * : , iar statisticile
xi apărând de ni ori, i 1, k şi k , atunci repartiţia empirică este:
ni n n1 n2 nk
i 1 . . . . . . . . . . . . . . . .
n n n
definite mai sus devin:
k k
mr* 1
n n X i i
r ; X 1n ni X i ;
i 1 i 1
2 ; 2
k r k k
r 1n ni X i X ; 2 S 2 1n ni X i X s 2 n11 ni X i X
i 1 i 1 i 1
Teorema 1. Dacă se efectuează o selecţie de volum n: X1, X2,......, Xn dintr-o populaţie caracterizată de o variabilă
aleatoare X pentru care există M(X) = m şi D (X) = 2 0, atunci statistica X m converge în repartiţie către o
/ n
variabilă aleatoare având repartiţie normală standard, Z N (0,1), adică
y2
X m 1 x
lim P x e 2 dy
n 2
n
Teorema 2. Dacă X1, X2,...., Xn este o selecţie de volum n dintr-opopulaţie caracterizată de o variabilă aleatoare X N(m,),
atunci media de selecţie X N m ,
n
Teorema 3. Dacă X1, X2,......, Xn este o selecţie de volum n dintr-o populaţie caracterizată de o variabilă aleatoare X N
X m
(m, ), atunci
t S n 1
s
n
Teorema 4. Dacă X1, X2,......, Xn este o selecţie de volum n dintr-o populaţie caracterizată de o variabilă aleatoare X N
PROBLEME REZOLVATE
1. Pentru a studia o anumită caracteristică X a unei populaţii statistice oarecare, s-a realizat un sondaj de volum n = 16
din populaţia respectivă şi s-au obţinut rezultatele:
xi -2 -1 0 2
ni 3 4 2 7
a) Să se scrie repartiţia variabilei aleatoare de selecţie.
b) Să se scrie funcţia empirică de repartiţie.
c) Să se calculeze media de selecţie, dispersia de selecţie şi dispersia de selecţie corectată.
Rezolvare:
0, x ,2
3
b) Funcţia empirică de repartiţie este: 16 , x 2,1
3 4
F16 x P X x 7 ,
* *
16 16 16
x 1,0
3 4 2 9 , x 0,2
16 16 16 16
1, x 2,
c) Media de selecţie este statistica: 4 , iar valoarea acesteia corespunzătoare selecţiei efectuate este
X 1n ni X i
i 1
4
x 1n ni xi
i 1
ni xi x
4 2
este 2
S 1n
i 1
4
Dispersia de selecţie corectată este statistica s 2 1 n X X , iar valoarea acesteia corespunzătoare selecţiei
2
n1 i i
i 1
ni xi x
4 2
efectuate este 2
s 1
n 1
i 1
Pentru determinarea valorilor cerute organizăm valorile de selecţie în următorul tabel:
xi ni xi ni xi x x x
i
2
ni xi x
2
2. Pentru a stabili conţinutul în magneziu al apei minerale provenite de la un anumit izvor s-a determinat cantitatea de
magneziu, exprimată în grame, conţiunută într-un litru de apă minerală. Efectuîndu-se 15 măsurători, s-au obţinut
următoarele rezultate: 7,2; 8,3; 6,7; 6,7; 7,2; 8,1; 8,3; 6,9; 7,2; 7,2; 8,1; 6,7; 6,7; 8,1; 6,7.
a) Să se scrie repartiţia variabilei aleatoare de selecţie.
b) Să se scrie funcţia de repartiţie de selecţie.
c) Să se calculeze probabilitatea ca probele prelevate să conţină sub 7 grame magneziu la litru.
d) Pe baza rezultatelor înregistrate, să se determine cantitatea medie de magneziu, exprimată în grame, conţinută într-un
litru de apă minerală şi modul în care variază aceasta.
Rezolvare:
0, x , 6,7
b) Funcţia de repartiţie de selecţie este: 5
15 , x 6,7; 6,9
5
x 6,9; 7,2
1 15 ,
6
*
F15 x P X * x 155 15
15 15 15 15 ,
1 4 10 x 7,2; 8,1
5 1 4 3 13 , x 8,1; 8,3
15 15 15 15 15
1, x 8,3;
c) Probabilitatea ca probele prelevate să conţină sub 7 grame magneziu la litru este: P X * 7 F * 7 6
15 15
d) Cantitatea medie de magneziu, exprimată în grame, conţinută într-un litru de apă minerală pe baza rezultatelor
înergistrate este reprezentată de media de selecţie x . Modul în care variază aceasta este pus în evidenţă de abterea medie
pătratică de selecţie S.
xi ni xi ni xi x x x
i
2
ni xi x
2
3. Pentru a stabili durata medie de timp necesară pentru înlocuirea unei anumite piese la un autoturism într-un service
auto, s-a cronometrat timpul de execuţie a acestei operaţiuni în cazul a 7 autoturisme luate întâmplător şi s-au obţinut
următoarele valori, exprimate în minute:
Numărul autoturismului (i) 1 2 3 4 5 6 7
Durata operaţiunii (xi) 19,2 20,3 18,7 19,8 20,1 17,9 18,4
2
Calculăm dispersia de selecţie: 7
S 2 17 xi x
i 1
19,219,2 20,319,2 18,719,2 19,819,2 20,119,2 17,919,2 18,419,2
2 2 2 2 2 2 2
7
0 1,21 0,25 0,36 0,811,69 0,64 4,96
0,708 ; S 0,708 0,841
7 7
Rezultă că înlocuirea piesei respective dureză în medie 19,2 minute, iar timpul necesar pentru executarea operaţiei variază
faţă de timpul mediu cu aproximativ 0,8 minute.
4. O bancă a acordă tinerilor credite pentru cumpărarea de bunuri de folosinţă îndelungată. S-a făcut o selecţie aleatoare
de 225 de credite acordate de această bancă şi s-au obţinut următoarele rezultate:
Valoarea creditului (euro) 100-200 200-300 300-400 400-500 500-600 600-700
Număr de credite acordate 15 18 27 66 54 45
Să se determine nivelul mediu al creditelor acordate de banca respectivă şi modul în care variază valoarea creditelor
acordate faţă de nivelul mediu.
Rezolvare:
242 Matematici aplicate în economie - culegere de probleme
Nivelul mediu al creditelor acordate de banca respectivă este exprimat de media de selecţie, iar modul în care variază
valoarea creditelor acordate faţă de nivelul mediu este evidenţiat de abaterea medie standard.
Pentru a determina aceste caracteristici numerice de selecţie, vom considera drept valori de observaţie mijloacele
intervalelor. Obţinem:
xi ni xi ni xi x x x
i
2
ni xi x
2
5. Se ştie că o caracteristică X a unei populaţii C are media egală cu m şi dispersia egală cu σ2 . Fie X1, X2,......, Xn o
selecţie aleatoare de volum n din populaţia C. Să se calculeze media şi dispersia mediei de selecţie.
Rezolvare:
Vom folosi faptul că dacă C este o populaţie, X este o caracteristică a acestei populaţii, şi X1, X2,......, Xn este o selecţie
de volum n din populaţia C, atunci variabilele aleatoare de selecţie X sunt independente şi identic repartizate cu
k k 1, n
X, deci
M (X k ) M (X ) m şi D( X k ) D( X ) 2 , k 1, n .
Astfel obţinem:
1 n 1 n 1 n
M X M X k M X k M X k n m m
1
k 1
n n k 1 n k 1 n
1 n 1 n 1 2
n
D X n n
1
D X D X k 2 D X k 2 k 2
2
n k 1 n k 1 n k 1 n
8. Pe baza observaţiilor statistice s-a constatat că abaterea nivelului apei din lacul de acumulare care deserveşte o
hidrocentrală faţă de nivelul de siguranţă este o variabilă aleatoare cu repartiţie normală N (m, ) . S-a măsurat abaterea
nivelului apei faţă de nivelul de siguranţă în 10 zile dintr-o anumită perioadă a anului şi s-au obţinut rezultatele:
Abaterea (cm) -2 0 2 3
Număr zile 2 2 4 2
Să se determine probabilitatea ca diferenţa dintre valoarea medie a abaterii nivelului apei calculată pe baza datelor de
selecţie şi valoarea reală a abaterii nivelului apei în perioada respectivă a anului să fie de cel puţin 0,324 cm.
Rezolvare:
Probabilitatea a cărei valoare se cere se scrie astfel:
X m 0,324
P X m 0,324 1 P X m 0,324 1 P s s
10 10
-2 2 -4 -3 9 18
0 2 0 -1 1 2
2 4 8 1 1 4
3 2 6 2 4 8
- 10 10 - - 32
Elemente de teoria selecţiei. Selecţii din populaţii normale 243
PROBLEME PROPUSE
1. S-a constatat că productivitatea medie lunară la o societate comercială este o variabilă aleatoare X. Luându-se la
întâmplare 20 de salariaţi, s-au înregistrat următoarele rezultate:
Productivitatea medie lunară (milioane lei) 10 12 15 18 20
Numărul de salariaţi 3 4 6 5 2
a) Să se scrie repartiţia variabilei aleatoare de selecţie.
b) Să se calculeze media de selecţie şi dispersia de selecţie.
2. S-a observat că nivelul vânzărilor unui anumit articol este o variabilă aleatoare X. Studiindu-se acest fenomen în
primele 10 zile ale lunii ianuarie 2003, s-au găsit rezultatele:
Ziua 1 2 3 4 5 6 7 8 9 10
Nivelul vânzărilor 6 10 6 6 8 8 6 5 10 6
a) Să se scrie repartiţia variabilei aleatoare de selecţie a nivelului vânzărilor şi funcţia de repartiţie de selecţie.
b) Să se calculeze media de selecţie şi dispersia de selecţie corectată.