Documente Academic
Documente Profesional
Documente Cultură
Statistic matematic
1. Teoria seleciei
1. 1. Populaii statistice
(11.1)
X x1 x2 ... xk
n n1 n2 ... nk
k
n ni
unde volumul seleciei i 1 .
Frecvena absolut cumulat cresctor (ascendent) este suma frecvenelor
j
n i
absolute corespunztoare valorilor mai mici sau egale cu valoarea xj : i 1 , jk.
xi , i 1, k a unei caracteristici este
Frecvena relativ (ponderea) a unei valori
n
f i i , i 1, k
raportul dintre frecvena absolut i volumul seleciei, adic n . Suma
k
fi 1
frecvenelor relative este egal cu 1: i 1 .
Frecvena relativ cumulat cresctor (ascendent) este suma frecvenelor
j
1 j
f i ni
n i 1 ,
relative corespunztoare valorilor mai mici sau egale cu valoarea xj : i 1
jk.
Tabloul de forma
x1 x2 ... xk
X :
f1 f 2 ... f k (11.2)
f x
unde i este frecvena relativ apariiei valorii i , se va numi distribuia empiric de
selecie (tablou de repartiie statistic) a caracteristicii X .
x 100 f i 100
procente corespunztoare valorii , definit prin
i i i . Evident, i 1 .
2. Distribuia (repartiia) empiric a unei caracteristici variaz de la o selec ie la
alta.
1. 2. Reprezentarea grafic a datelor statistice
n1 3 n 1 n 2 n 1
f1 , f 2 2 , f3 3 , f 4 4
n 7 n 7 n 7 n 7 . Suma acestor frecvene relative
Ex. Tab.11.2
Valorile -3 -1 +2. +5
Frecvenele 3 1 2 1
relative 7 7 7 7
Fig.11.1
iar cel al frecvenelor relative (se deosebete de primul doar prin mrimea unit ii
(scalei de reprezentare) pe axa ordonatelor Oy ) este:
Fig.11.1'
Fig.11.2
i 100
corespunztoare valorii xi , definit prin i 100 f i (unde i 1 ), pentru
reprezentarea grafic a datelor statistice se folosete deseori diagrama circular de
structur n forma unui disc circular mprit n sectoare proporionale cu
procentajele.
Ex. Tab.11.3
Grupa de vrst Tnr Adult n vrst
Efectivul 17 61 22
Frecv. relativ 17% 61% 22%
Fig.11.3
Dac X este variabil de tip continuu, aceasta se transform ntr-o variabil
discret n scopul prelucrrii mai uoare a datelor, n felul urmtor: se face o grupare
a datelor de selecie n clase (clasificare statistic) prin mprirea intervalului ( a, b)
, unde X ia valori, n subintervalele date prin
a t0 t1 t2 L tk b.
unde ni este numrul valorilor variabilei statistice aflate n intervalul [ti-1 , ti) i se
k
n ni
numete frecvena absolut. La fel i 1 este volumul seleciei.
ni
fi , i 1, k
Frecvena relativ corespunztoare ntervalului [ti-1 , ti) este n i
reprezint numrul valorilor variabilei statistice aflate n intervalul [ti-1 , ti) mprit la
volumul seleciei.
Analog se introduc i celelalte noiuni de frecven absolut cumulat, frecven
relativ cumulat.
Fig.11.4
Din histograma frecvenelor se obine poligonul frecvenelor unind mijloacele
segmentelor ce mrginesc superior dreptunghiurile histogramei.
Ex. Tab.11.5
Intervalu I1 I2 I3 I4 I5 I6 I7 I8
l
Frecven 2 9 24 43 51 37 26 8
a
Histograma:
Fig.11.5
Ex.Tab.11.6
Intervalu I1 I2 I3 I4 I5 I6 I7 I8
l
Frecven 2 9 24 43 51 37 26 8
a
1 2 3 4
X :
35 29 36 9
(deci de volum n 100 ) este dat prin:
0, daca x 1,
0,35, daca 1 x 2,
F100 ( x ) 0,55, daca 2 x 3,
0,91, daca 3 x 4,
1, daca x 4.
Reprezentarea grafic a acestei funcii este:
Fig.11.7
n
0 : p F ( x) Fn 0
.
1 n
Zn Yi
n i 1 , unde Yi este
Demonstraia folosete inegalitatea lui Cebev pentru variabila
x x Y1 , Y2 ,..., Yn
variabila aleatoare ce ia valoarea 1 dac i i 0 n caz contrar. Variabilele sunt
independente (seleciile sunt independente) i au distribuia simpl Bernoulli.
Observaie: Cu ct n este mai mare, cu att Fn ( x) aproximeaz mai corect pe
F ( x) .
1. 3. Caracteristici statistice ale datelor experimentale
Dac pentru variabilele discrete rezultatele sunt prezentate sub forma unui
tablou de forma (11.1), atunci media (aritmetic) de selecie (sperana matematic)
este:
1 k
ni xi
x
n i 1 , (11.9)
unde ni reprezint frecvena absolut de apariie a valorii xi a variabilei n selecia
k
n i n
considerat i i 1 .
Proprieti: 1. Media aritmetic este cuprins ntre cea mai mic i cea mai
1
x 0,143
Media aritmetic de selecie este: 7
Ex. Tab.11.9
Volumul vnzrilor (intervale) 0-10 10-20 20-30 30-40
Numrul unitilor comerciale 50 20 10 5
ni n x 'n
produsele xi 'ni . n josul tabelului se scriu totalurile
i i
i 1 i i 1 . Astfel:
Ex. Tab.11.10
x ,x
Intervalele i 1 i
ni xi ' xi 'ni
0-10 50 5 250
10-20 20 15 300
20-30 10 25 250
30-40 5 35 175
Total 85 - 975
975
x 11, 47
Media aritmetic este 85 milioane lei.
4. Distribuia unui eantion de firme de anumit profil, dup profitul net, n mii
lei, n anul trecut, este:
Ex. Tab.11.11
Profit net 0-2 2-4 4-6 6-8 8-10
Numr firme 40 50 90 15 5
xi 1 , xi , n i n
frecvenele absolute ni (n total se scrie i 1 ), frecvenele relative
k
ni xi 1 xi
fi
n (n total rezult
f i 1 xi '
2
i 1 ), mijloacele intervalelor i produsele
k
Ex. Tab.11.14
xi 1 , xi ni xi ' xi ' a xi ' a ni xi ' a ni
k c k c
0-30 25 15 -60 -2 5 -10
30-60 50 45 -30 -1 10 -10
60-90 60 75 0 0 12 0
90-120 45 105 30 1 9 9
120-150 15 135 60 2 3 6
150+ 5 165 90 3 1 3
Total 200 - - - 40 -2
2 2
x simplif .
x x simplif . k a 30 75 73,5
Astfel 40 40 minute.
Pentru datele negrupate (variabil discret) moda seleciei sau dominanta este
valoarea observat xi care are frecvena ni maxim.
Pentru datele grupate moda este orice valoare din clasa cu cel mai mare numr
de observaii. Deci moda seleciei este din intervalul modal Ik , ce corespunde
dreptunghiului cel mai nalt al histogramei (pentru care frecvena corespunztoare nk
este maxim). Pentru precizare, moda este aleas egal cu valoarea M o , care mparte
modal este
2, 7 , caruia i este atribuit frecvena absolut 15. Mai precis, M o
M o 2 15 8 31
Mo 1,9375
satisface 7 M o 15 6 , de unde 16 .
Dac mai multe valori (subgrupei) sunt la fel de nalte i detaate de celelalte,
se spune c selecia este plurimodal.
Frecvena maxim nregistrat este 14, ntlnit la dou intervale (grupe). Deci
selecia dat este bimodal (cu dou dominante).
Mediana unei selecii este valoarea xme care mparte irul ordonat de date n
dou pri egale: numrul de valori xi xme este egal cu numrul de valori xi xme .
Mai exact, dac irul are 2k + 1 uniti, atunci mediana coincide cu unitatea de ordin
k + 1, dac irul are 2k uniti, mediana este media aritmetic a unitilor de ordin k i
k+1; dac exist mai multe asemenea valori pentru xme , atunci ele formeaz un
interval i mediana este prin definiie mijlocul acestui interval.
Exemple: 1. Pentru irul impar de date: 2,5; 3,7; 1,4; 0,2; 5,4; 8,9; 4,2 irul
ordonat este 0,2; 1,4; 2,5; 3,7; 4,2; 5,4; 8,9. Deci 2k + 1 = 7, de unde k = 3 i unitatea
de ordin k +1 = 4 este 3,7 care este mediana.
2. Pentru irul par de date: 10; 40; 20; 15; 22; 35 irul ordonat cresctor este 10;
15; 20; 22; 35; 40. Deci cei doi termeni centrali ai seriei sunt 20 i 22, iar media
aritmetic a lor este 21, care este mediana xme .
Amplitudinea statistic este diferena dintre cea mai mare valoare M xmax i
cea mai mic valoare m xmin a repartiiei statistice:
A M m xmax xmin (11.10)
n cazul variabilelor aleatoare continue, amplitudinea este diferen a dintre
limita superioar a ultimului interval i limita inferioar a primului.
Exemplu: Pentru selecia dat prin Ex. Tab.11.15, amplitudinea statistic este
A 82,9 80,3 2, 6 , iar pentru selecia dat prin Ex. Tab.11.16, aceasta este
n i 1 (11.11)
pentru datele negrupate (variabile discrete), unde ni reprezint frecvena absolut de
k
n i n
apariie a valorii xi a variabilei n selecia considerat, i 1 i x este media
aritmetic de selecie. Dispersia este deci media aritmetic a ptratelor abaterilor de la
media colectivitii.
t t
xi i 1 i
n cazul datelor grupate xi se nlocuiete cu 2 (valoarea din mijloc a
intervalului [ti 1 , ti ) , iar numrul intervalelor (pentru care se efectueaz sumarea) este
2
1 r ti 1 ti
2 x ni
2
r dat de (11.5), deci: n i 1 (11.11')
De multe ori, este mai avantajos, a folosi drept dispersie statistic, mrimea
numit dispersie de selecie modificat (variana):
k
1 2
s2 xi x ni
n 1 i 1 (11.12)
t t
xi i 1 i
pentru datele negrupate , iar pentru cele grupate xi se nlocuiete cu 2
(valoarea din mijloc a intervalului [ti 1 , ti ) , iar numrul intervalelor (pentru care se
efectueaz sumarea) este r dat de (11.5).
s
2
2
repartiiei statistice n jurul mediei. Dac este mic atunci datele difer unele
s
2
2
de altele foarte putin, dac este mare, datele difer foarte mult.
2
Abaterea medie ptratic de selecie (nemodificat) este: (11.13)
Ex. Tab.11.18
xi ni
x x x x
2 2
xi ni xi x ni
i i
23
2,30x
Mai nti se calculeaz media statistic 10 mm., cu formula (11.9)
din primele 3 coloane ale tabelului, apoi se continu calculele pentru completarea
celorlalte coloane ale acestui tabel. Rezult conform (11.11) dispersia statistic (de
2 1
4 2,8 10
28 10 6
selecie) empiric: 10 , iar conform (11.12) dispersia de
1
4 3,11 10
s 2 28 10 6
selecie modificat (variana): 9 . Atunci abaterea medie
2
ptratic de selecie este, conform (11.13): 3,162 10 3 , iar abaterea
3
medie ptratic de selecie modificat este, conform (11.14): s s 5,578 10 .
2
v 1,374 10 3
n sfrit, conform (11.15) coeficientul de variaie este: x ,
s
v 2, 425 103
respectiv, conform (11.15') coeficientul de variaie modificat x .
xi 1 xi
xi '
Rezolvare: Mijloacele intervalelor vor fi 2 . Elementele de calcul se
sistematizeaz n urmtorul tabel:
Ex. Tab.11.20
xi 1 , xi ni xi ' xi 'ni xi ' x x ' x
i
2
x ' x
i
2
ni
176 178 20 177 354 -4,75 22,5625 451,25
178 180 25 179 4475 -2,75 7,5625 189,0625
180 182 40 181 7240 0,75 0,5625 22,5
182 184 35 183 6405 1,25 1,5625 54,6875
184 186 30 185 5550 3,25 10,5625 316,875
186 188 10 187 1870 5,25 27,5625 275,625
Total 160 - 29080 - - 1310
ptratic de selecie este, conform (11.13): 8,1875 2,8614 milioane lei, iar,
v 15, 744 103
n fine, conform (11.15), coeficientul de variaie este: x .
3. Din producia unui strung ce prelucreaz piese cilindrice metalice, s-au
extras la ntmplare n = 24 uniti, crora li s-au msurat nlimile. S-au obinut
urmtoarele date:
Ex. Tab.11.21
xi 30,2 30,3 30,5 30,6 30,7
ni 1 4 10 7 2
fi 1 x f x
), produsele xi fi (totalul
i i
total rezult i 1 i 1 = valoarea medie),
x x x x
2 2
xi x , i i f i
valorile , precum i produsele . La final totalul
x x
k 2 2
i f i
i 1 (dispersia de selecie).
Ex. Tab.11.22
xi fi
x x x x
2 2
xi ni fi xi x f i
i i
Total n 24 1 x ; 30,5 - - 2
; 0, 01667
Ex. Tab.11.23
xi 1 , xi ni xi ' xi 'ni xi ' x xi ' x xi ' x ni
176 178 20 177 354 -4,75 4,75 95,00
178 180 25 179 4475 -2,75 2,75 68,75
180 182 40 181 7240 0,75 0,75 30,00
182 184 35 183 6405 1,25 1,25 43,75
184 186 30 185 5550 3,25 3,25 97,50
186 188 10 187 1870 5,25 5,25 52,50
Total 160 - 29080 385,50
n i n
considerat i i 1 .
ti 1 ti
xi
n cazul datelor grupate xi se nlocuiete cu 2 (valoarea din mijloc a
intervalului [ti 1 , ti ) , iar r este numrul intervalelor, dat de (11.5).
m 1 m x
Observaie: Evident 0 i 1 .
Momentul statistic (de selecie) empiric centrat de ordin l se definete prin:
1 k
l
l ni xi x
n i 1 , (11.18)
unde ni reprezint frecvena absolut de apariie a valorii xi a variabilei n selecia
k
n i n
considerat , i 1 i x este media aritmetic de selecie.
t t
xi i 1 i
n cazul datelor grupate xi se nlocuiete cu 2 (valoarea din mijloc a
intervalului [ti 1 , ti ) , iar r este numrul intervalelor, dat de (11.5).
2
1 , 1 0 i 2 .
Observaii: 1. Evident 0
2. Momentele centrate sunt invariante la o translaie a valorilor reparti iei
statistice.
x x x x x x x x
3 3 4 4
i i ni i i ni
-3,652264 -3,652264 5,624487 5,624487
-0,405224 -0,810448 0,299866 0,599732
-0,157464 -0,472392 0,085030 0,255090
-0,085184 -0,340736 0,037481 0,149924
-0,013824 -0,041472 0,003318 0,009954
0,000216 0,000432 0,000013 0,000026
0,046656 0,186624 0,016796 0,067184
0,287496 0,287496 0,189747 0,189747
0,884736 3,538944 0,849346 3,397384
1,191016 1,191016 1,262477 1,262477
- 0,112804 - 11,556005
3 0,004512 4 0, 462240
Tab. 11.24: 3
0, 004512 i 0, 665131 rezult as 0.015334 0 , deci are
asimetrie de stnga (negativ).
2. Pentru repartiia cu datele date n Ex. Tab.11.16, prelucrate n Ex.
2
Tab. 11.25:
3 0, 241996 i 1, 059495 (de unde 1, 029318 ) rezult
Dac 2
3 2 0 , poligonul frecvenelor are un aspect ascuit i se spune
c repartiia este leptokurtic.
Dac, 2
3 2 0 , poligonul frecvenelor are un aspect turtit i se spune c
repartiia este platikurtic.
sau
2 0, 638222 0 , deci repartiia este platikurtic.
2. Pentru repartiia cu datele date n Ex. Tab.11.16, prelucrate n Ex. Tab. 11.25:
4 2,319677 i 1, 029318 rezult coeficienii 2 2, 066474 3 sau
2 0,933526 0 , deci i aceast repartiie este platikurtic.
Probleme rezolvate:
1
(4 2 2 6 12 4 0 2 3 12 1 2 2 2 3 2 ) 0,15 2
20
1
47 0,0225 2,35 0,0225 2,3275
20 .
Aceast valoare este egal cu dispersia (nemodificat) de selecie
2
2 ( X ) 2,3275 . Atunci abaterea medie ptratic (nemodificat) 1, 5256 .
Probleme propuse
2
x 39,8, 2 0,135, , s 2 0,145
Rspunsuri. a)
0 ,daca x 39 ,50,
2
,daca 39 ,25 x 39 ,50 ,
15
6 ,daca 39 ,50 x 39 ,75
15
8
,daca 39 ,75 x 40 ,00 ,
F15 ( x) 15
12
15 ,daca 40 ,00 x 40 ,25,
14
,daca 40 ,25 x 40 ,50,
15
1,daca x 40 ,50
b)
2. S se studieze urmtoarea serie statistic:
10,0; 6,6; 9,0; 11,0; 12,0; 11,0; 14,0; 7,2; 8,9; 9,9; 9,0; 8,3; 11,0; 8,1; 7,2;
8,8; 11,0; 8,8; 8,0; 9,1; 9,4; 7,8; 8,2; 8,4; 12,0; 7,0; 9,2; 7,0; 16,0; 8,1.
a) S se determine repartiia variabilei de selecie, s se reprezinte grafic
poligonul frecvenelor i histograma.
b) S se determine parametrii tendinei centrale: media, moda, mediana.
c) S se determine parametrii variabilit ii: dispersia, dispersia modificat,
asimetria, boltirea i excesul.
deci seria este pozitiv asimetric (de dreapta), 3 355,525 , 4 11685, 0911 ,
coeficientul de boltire: 2
20,396140 3 sau cel de exces: 2 17,396140 0 ,
deci aceast repartiie este leptokurtic.
nct
M 0 x 3 xme x . Aici M 0 3,353
2
c) 0,950574 ( 0,974974 ), s 1, 000604 ( s 1, 000302 ), 3 0, 253435
2
coeficientul de boltire: 2
2,111 3 sau cel de exces: 2 0,889 0 , deci aceast
repartiie este platikurtic (evident !).
4. La controlul diametrului (n mm.) unui eantion de n 25 piese, s-au obinut
urmtoarele dimensiuni : 3,24; 3,28; 3,29; 3,28; 3,32; 3,26; 3,32; 3,29; 3,31; 3,32;
3,25; 3,27; 3,30; 3,34; 3,33; 3,26; 3,27; 3,31; 3,30; 3,28; 3,29; 3,31; 3,30; 3,27; 3,28.
S se calculeze valoarea medie i dispersia acestei distribuii. Apoi s se grupeze pe 5
intervale egale aceste date de selecie i s se recalculeze valoarea medie i dispersia.
Rspunsuri:
xi 3,24 3,25 3,26 3,27 3,28 3,29 3,30 3,31 3,32 3,33 3,34
ni 1 1 2 3 4 3 3 3 3 1 1
2
x 3, 2908 , 6,31359 10 4 .
2
x 3, 2956 , 1, 66272 104 .