Documente Academic
Documente Profesional
Documente Cultură
Statistic matematic
1. Teoria seleciei
1. 1. Populaii statistice
Statistica matematic se definete ca fiind tiina care se ocup cu colectarea,
prezentarea, clasificarea, analiza i interpretarea cantitativ a datelor furnizate de
experien, prin aplicarea teoriei probabilitilor. Rolul statisticii matematice este de
determina informaii ct mai precise asupra repartiiei fenomenului aleator de mas
cercetat, n scopul obinerii unor previziuni asupra desfurrii viitoare a acestuia.
Populaia statistic sau colectivitatea statistic este o mulime finit sau infinit
C de elemente cercetat din punct de vedere a uneia sau mai multor proprieti
(caracteristici statistice). Un element al acestei populaii (individ din colectivitate:
persoan, obiect, fapt, fenomen, etc.) se numete unitate statistic, iar numrul
acestor uniti (indivizii acestei colectiviti), dac este finit, se va numi volumul
populaiei (colectivitii).
O colectivitate este omogen dac este constituit din elemente care sunt
susceptibile de a avea sau de a nu avea caracteristica studiat, cu o aceeai pondere.
nelese ca proprietate comun a tuturor unitilor statistice, caracteristicile
statistice pot fi:
- caracteristici cantitative sau variabile, dac pot fi msurate (cuantificate printr-un
numr),
- caracteristici calitative sau atribute, dac nu pot fi cuantificate printr-un numr
(msurate), ci prin aprecieri de tipul bun, foarte bun, mult, puin.
Valoarea numeric a unei caracteristici cantitative, care se variaz (n general)
aleator de la o unitate statistic la alta, constituie o variabil statistic X (ce ia
pentru fiecare unitate statistic o valoare numeric). Variaia nivelului unei
caracteristici de la o unitate la alta d caracteristicilor statistice caracterul de variabile
aleatoare.
Statistica matematic dispune de metode de organizare i prelucrare a
nregistrrilor datelor experimentale avnd ca scop s ncadreze fenomenul studiat n
una din clasele de fenomene care presupun o anumit lege teoretic i s determine
cel mai bine parametrii acestei legi. Aadar, problema central a statisticii matematice
este stabilirea legii de probabilitate pe care o urmeaz caracteristica (variabila
aleatoare) X . Din punct de vedere al teoriei probabilitilor, unei caracteristici a unei
colectiviti C i se asociaz o variabil aleatoare teoretic, ale crei valori
x , x ,..., xkn
kn ntre 1 i N , atunci un eantion aleator de volum n este: k1 k2
. De exemplu,
dac din 10000 de piese se aleg 100 n vederea controlului de calitate, se spune c
volumul colectivitii este N 10000 , iar volumul eantionului este n 100 .
x , i 1, k
Frecvena absolut a unei valori i
a unei caracteristici este numrul ni
care reprezint numrul de uniti statistice ale populaiei statistice care corespund
valorii xi a variabilei statistice X.
n cazul variabilelor discrete rezultatele sunt prezentate sub forma unui tablou
(tabel statistic) de forma:
(11.1)
X
n
x1
n1
x2
n2
...
...
xk
nk
n ni
i 1
unde volumul seleciei
.
Frecvena absolut cumulat cresctor (ascendent) este suma frecvenelor
j
n
i 1
, jk.
fi 1
frecvenelor relative este egal cu 1: i 1
.
Frecvena relativ cumulat cresctor (ascendent) este suma frecvenelor
j
f
i 1
1 j
ni
n i 1 ,
Tabloul de forma
x1 x2 ... xk
f1 f 2 ... f k
X :
(11.2)
f
x
unde i este frecvena relativ apariiei valorii i , se va numi distribuia empiric de
selecie (tablou de repartiie statistic) a caracteristicii X .
Observaii : 1. Uneori, n locul frecvenei relative fi , se folosete numrul de
k
i 100
100
f
i
i
i
i
1
procente corespunztoare valorii , definit prin
. Evident,
.
2. Distribuia (repartiia) empiric a unei caracteristici variaz de la o selec ie la
alta.
x ,n
x,f
de coordonate i i sau i i , i 1, k , prin segmente de dreapt. El sugereaz
forma reprezentarea grafic a repartiiei probabilistice (teoretice) a caracteristicii.
Altfel, datele statistice se mai pot reprezenta sub forma unor bare verticale
(coloane). Se unesc punctele de pe axa Ox :
xi , 0
xi , ni sau xi , f i , i 1, k . i aceste
aceast ax, cu punctele de coordonate
segmente (bare, batoane), de o lime mai mult sau mai puin pronunat, sugereaz
forma grafic a repartiiei probabilistice (teoretice) a caracteristicii (variabilei
aleatoare).
Exemplu: Ca rezultat a unui sondaj de s-au obinut numerele:
3, 2, 1, 3, 5, 3, 2 (7 numere). S se scrie tablourile frecvenelor absolute i a
celor relative, apoi s se reprezinte grafic poligoanele acestor frecvene i tot acestea
prin bare verticale (coloane).
Rezolvare: Valorile distincte a acestui sondaj (de volum n 7 ) se scriu n
ordine cresctoare: x1 3 (cu frecvena absolut n1 3 ), x2 1 (cu frecvena
absolut n2 1 ), x3 2 (cu frecvena absolut n3 2 ), x4 5 (cu frecvena
absolut n4 1 ). Suma acestor frecvene absolute este egal cu volumul sondajului:
n1 n2 n3 n4 7 . Frecvenele relative sunt cele de mai sus, mpr ite la n 7 :
n
n1 3
n
1
2
n
1
, f 2 2 , f3 3 , f 4 4
n 7
n 7
n 7
n 7 . Suma acestor frecvene relative
este evident, egal cu 1: f1 f 2 f3 f 4 1 . Tablourile acestor frecvene sunt:
Ex. Tab. 11.1
Valorile
-3
-1
+2
+5
Frecvenele
absolute
3
1
2
1
f1
Ex. Tab.11.2
Valorile
Frecvenele
relative
-3
3
7
-1
1
7
+2.
2
7
+5
1
7
Fig.11.1
iar cel al frecvenelor relative (se deosebete de primul doar prin mrimea unit ii
(scalei de reprezentare) pe axa ordonatelor Oy ) este:
Fig.11.1'
Graficul cu bare verticale (coloane) corespunztoare frecvenelor absolute este:
Fig.11.2
iar cele ale frecvenelor relative:
Fig.11.2'
Dac n locul frecvenei relative f i , se folosete numrul de procente
k
i 100
corespunztoare valorii xi , definit prin i 100 f i (unde i 1
), pentru
reprezentarea grafic a datelor statistice se folosete deseori diagrama circular de
structur n forma unui disc circular mprit n sectoare proporionale cu
procentajele.
Grupa de vrst
Efectivul
Frecv. relativ
Tnr
17
17%
Adult
61
61%
Ex. Tab.11.3
n vrst
22
22%
Fig.11.3
[t0,t1)
n1
[t1,t2)
n2
(11.3)
[tk-1,tk)
nk
...
...
unde ni este numrul valorilor variabilei statistice aflate n intervalul [ti-1 , ti) i se
k
n ni
i 1
ni
, i 1, k
n
Frecvena relativ corespunztoare ntervalului [ti-1 , ti) este
i
reprezint numrul valorilor variabilei statistice aflate n intervalul [ti-1 , ti) mprit la
volumul seleciei.
Analog se introduc i celelalte noiuni de frecven absolut cumulat, frecven
relativ cumulat.
fi
f1 f 2 ... f k
t t
xi i 1 i ,
x
2
unde, i este valoarea central a intervalului (
mijlocul intervalului), iar
f i este frecvena datelor de selecie din intervalul (clasa) [ti 1 , ti ).
Fig.11.4
Din histograma frecvenelor se obine poligonul frecvenelor unind mijloacele
segmentelor ce mrginesc superior dreptunghiurile histogramei.
Observaie: De multe ori este necesar o grupare a datelor de selecie chiar
pentru cazul cnd caracteristica X este de tip discret. De exemplu,
dac selecia x1 , x 2 ,..., x n este de volum mare i se obine n urma msurrii unor
mrimi fizice, tehnice, economice de care depinde evoluia unor procese sau
fenomene.
Se procedeaz astfel:
m min xi
M max xi
i
i
- se noteaz cu
i
(11.4)
- se divide intervalul [m, M] ntr-un numr de r de subintervale de aceeai lungime.
Pentru determinarea numrului (ntreg) de subintervale egale de grupare se
recomand a fi folosit formula lui H. A. Sturges:
lg n
r 1 log 2 n 1 1 3,322 lg n
lg 2
(11.5)
Se numete pasul de histogram numrul
M m
r
(11.6)
0, 07
r
8
Pasul de histogram este
i atunci intervalele
de grupare sunt: I1 = [6,13; 6,20), I2 = [6,20; 6,27), I3 = [6,27; 6,34), I4 = [6,34;
6,41), I5 = [6,41; 6,48), I6 = [6,48; 6,55), I7 = [6,55; 6,62), I8 = [6,62; 6,69].
h
Intervalu
l
Frecven
a
I1
I2
I3
I4
I5
I6
Ex. Tab.11.5
I7
I8
24
43
51
37
26
Histograma:
Fig.11.5
Observaie: Se poate alege scara la care se figureaz histograma, astfel nct
suma ariilor dreptunghiurilor histogramei s fie egal cu 1. Histograma astfel scalat
se poate suprapune peste graficul unei densiti de probabilitate n vederea intuirii
acesteia.
Pentru datele de selecie x1 , x 2 ,..., xn grupate n subintervale [ti-1 , ti), i 1, k ,
unde ni este numrul valorilor variabilei statistice aflate n intervalul [ti-1 , ti),
t t
xi i 1 i i n j
j 1
2
corespunztoare valorilor mai mici sau egale cu valoarea
:
,
i k , iar frecvena relativ cumulat cresctor i este suma frecvenelor relative
xi
ti 1 ti
2
1 i
n j
n j 1 , i k . Atunci o reprezentare grafic a acestor date i frecvene
j 1
cumulate este sub forma ogivei sau poligonului frecvenelor cumulate. Acesta se
i f j
xi , i , i 1, k prin
obine ntr-un reper xOy, unind punctele de coordonate
segmente de dreapt. El sugereaz forma reprezentarea grafic a funciei de reparti ie
probabilistic (teoretic) a caracteristicii.
Exemplu: Pentru distribuia cu date grupate din exemplul precedent
Intervalu
l
Frecven
a
I1
I2
I3
I4
I5
I6
Ex.Tab.11.6
I7
I8
24
43
51
37
26
Fig.11.6
funcia Fn : ,
Fn ( x)
numarul _ valorilor _ x j x
n
kx
n
(11.8)
(kx este deci numrul de observaii n care au aprut valori ale variabilei aleatoare
(caracteristicii) X, mai mici dect x dat)
Exemplu: Funcia de repartiie empiric pentru distribuia de selecie
1 2 3 4
X :
35 29 36 9
(deci de volum n 100 ) este dat prin:
daca x 1,
0,
0,35, daca 1 x 2,
F100
( x ) 0,55, daca 2 x 3,
0,91, daca 3 x 4,
daca x 4.
1,
Reprezentarea grafic a acestei funcii este:
Fig.11.7
F ( x) p X x
ca
mai
sus
funcia
de
repartiie
empiric
Fn
Atunci
0 : p F ( x) Fn 0
.
Zn
x x
1 n
Yi
n i 1 , unde Yi este
Y1 , Y2 ,..., Yn
sunt
F ( x) .
1 k
ni xi
n i 1
,
(11.9)
unde ni reprezint frecvena absolut de apariie a valorii xi a variabilei n selecia
x
considerat i
n
i 1
(11.9')
Proprieti: 1. Media aritmetic este cuprins ntre cea mai mic i cea mai
mare valoare a repartiiei statistice: xmin x xmax .
2. Au loc relaiile: x a x a i ax ax , a (translaia i scalarea
mediei de selecie).
Exemple: 1. Valoarea lucrrilor efectuate de o echip de muncitori la un punct
de lucru, pe parcursul a 7 zile se prezint astfel (n mii de lei): 200, 250, 500, 750,
1000, 1250, 1500. S se calculeze valoarea medie zilnic a lucrrilor efectuate de
aceast echip.
Rezolvare: n cazul de fa este o medie aritmetic simpl:
x
792,85
7
7
mii lei.
1
0,143
7
0-10
50
Ex. Tab.11.9
20-30
30-40
10
5
10-20
20
xi 1 , xi , frecvenele absolute
x ,x
Intervalele i 1 i
0-10
10-20
20-30
30-40
Total
ni n
i 1
xi 1 xi
2
i
x 'n
i 1
. Astfel:
ni
xi '
Ex. Tab.11.10
xi 'ni
50
20
10
5
85
5
15
25
35
-
250
300
250
175
975
975
11, 47
85
milioane lei.
4. Distribuia unui eantion de firme de anumit profil, dup profitul net, n mii
lei, n anul trecut, este:
Ex. Tab.11.11
Profit net
0-2
2-4
4-6
6-8
8-10
Numr firme
40
50
90
15
5
S se determine valoarea medie a profitului net anual.
Rezolvare: Calculele se pot sistematiza ntr-un tabel cuprinznd intervalele
k
xi 1 , xi ,
fi
ni
n (n total rezult
f
i 1
Profit net
0-2
2-4
4-6
6-8
8-10
Total
x 'f
i 1
ni
40
50
90
15
5
n 200
n
i 1
), mijloacele intervalelor
), frecvenele relative
xi '
xi 1 xi
2
i produsele
(valoarea medie).
fi
0,200
0,250
0,450
0,075
0,025
1
xi '
1
3
5
7
9
-
Ex. Tab.11.12
xi 'f i
0,200
0,750
2,250
0,525
0,225
3,950
Deci valoarea medie a profitului net anual a firmelor de acest profil este de 3,95
mii de lei.
5. Pentru timpul de deplasare zilnic la serviciu s-au nregistrat urmtoarele
date, pentru un eantion de 200 de persoane:
Ex. Tab.11.13
Timpul
de
deplasare
0-30
30-60
60-90
90-120
120-150
150 i
zilnic (min.)
peste
Numr
de
25
50
60
45
15
5
persoane
xi 1 xi
2
cu o valoare
ni ni
xi 1 , xi
ni
xi '
xi ' a
0-30
30-60
60-90
90-120
120-150
150+
Total
25
50
60
45
15
5
200
15
45
75
105
135
165
-
-60
-30
0
30
60
90
-
xi ' a
k
-2
-1
0
1
2
3
-
ni
c
5
10
12
9
3
1
40
Ex. Tab.11.14
xi ' a ni
k
c
-10
-10
0
9
6
3
-2
2
2
x x simplif . k a 30 75 73,5
40
40
Astfel
minute.
Pentru datele negrupate (variabil discret) moda seleciei sau dominanta este
valoarea observat xi care are frecvena ni maxim.
Pentru datele grupate moda este orice valoare din clasa cu cel mai mare numr
de observaii. Deci moda seleciei este din intervalul modal Ik , ce corespunde
dreptunghiului cel mai nalt al histogramei (pentru care frecvena corespunztoare nk
este maxim). Pentru precizare, moda este aleas egal cu valoarea M o , care mparte
x simplif .
nk nk 1 : nk nk 1 .
I k xk 1 , xk
intervalelor I k 1 , respectiv I k 1
M o xk 1 nk nk 1
I
x
M
nk nk 1 .
k
k
o
(adiacente lui ):
2, 7 ,
M o 2 15 8
31
Mo
1,9375
7
M
15
6
16
o
satisface
, de unde
.
Dac mai multe valori (subgrupei) sunt la fel de nalte i detaate de celelalte,
se spune c selecia este plurimodal.
Exemple: 1. Selecia de 25 de piese, msurate n mm. are 10 variante
distincte de lungime, cu urmtoarele frecvene:
Ex. Tab.11.15
xi
80,3 81,1 81,3 81,4 81,6 81,9 82,2 82,5 82,8 82,9
1
2
3
4
3
2
4
1
4
1
ni
Frecvena maxim nregistrat este 4, ntlnit la trei variante. Deci seria de
variante distincte ale caracteristicii observate este o selecie trimodal (cu trei
dominante).
2. Selecia de 100 de piese, msurate n mm. grupate n 10 intervale de
lungime are urmtoarele frecvene:
Ex. Tab.11.16
80,3- 80,7- 81,1- 81,5- 81,9- 82,3- 82,7- 83,1- 83,5- 83,9 x , x 80,7 81,1 81,5 81,9 82,3 82,7 83,1 83,5 83,9 84,3
i 1
ni
10
14
12
14
13
Frecvena maxim nregistrat este 14, ntlnit la dou intervale (grupe). Deci
selecia dat este bimodal (cu dou dominante).
Mediana unei selecii este valoarea xme care mparte irul ordonat de date n
dou pri egale: numrul de valori xi xme este egal cu numrul de valori xi xme .
Mai exact, dac irul are 2k + 1 uniti, atunci mediana coincide cu unitatea de ordin
k + 1, dac irul are 2k uniti, mediana este media aritmetic a unitilor de ordin k i
k+1; dac exist mai multe asemenea valori pentru xme , atunci ele formeaz un
interval i mediana este prin definiie mijlocul acestui interval.
Exemple: 1. Pentru irul impar de date: 2,5; 3,7; 1,4; 0,2; 5,4; 8,9; 4,2 irul
ordonat este 0,2; 1,4; 2,5; 3,7; 4,2; 5,4; 8,9. Deci 2k + 1 = 7, de unde k = 3 i unitatea
de ordin k +1 = 4 este 3,7 care este mediana.
2. Pentru irul par de date: 10; 40; 20; 15; 22; 35 irul ordonat cresctor este 10;
15; 20; 22; 35; 40. Deci cei doi termeni centrali ai seriei sunt 20 i 22, iar media
aritmetic a lor este 21, care este mediana xme .
Observaie : Datorit semnificaiei lor, media, moda, mediana constituie
parametrii tendinei centrale.
Amplitudinea statistic este diferena dintre cea mai mare valoare M xmax i
cea mai mic valoare m xmin a repartiiei statistice:
A M m xmax xmin
(11.10)
n cazul variabilelor aleatoare continue, amplitudinea este diferen a dintre
limita superioar a ultimului interval i limita inferioar a primului.
Exemple: Pentru selecia dat prin Ex. Tab.11.15, amplitudinea statistic este
A 82,9 80,3 2, 6 , iar pentru selecia dat prin Ex. Tab.11.16, aceasta este
A 84,3 80, 3 4 mm.
xi
ti 1 ti
2
(valoarea din mijloc a
1 r t t
i 1 i x ni
n i 1
2
(11.11')
De multe ori, este mai avantajos, a folosi drept dispersie statistic, mrimea
numit dispersie de selecie modificat (variana):
k
2
1
s2
xi x ni
n 1 i 1
(11.12)
t t
xi i 1 i
2
pentru datele negrupate , iar pentru cele grupate xi se nlocuiete cu
(valoarea din mijloc a intervalului [ti 1 , ti ) , iar numrul intervalelor (pentru care se
efectueaz sumarea) este r dat de (11.5).
s
2
v
x
Coeficientul de variaie este:
s s2
(11.13)
(11.14)
(11.15)
s
x
1
reprezentativ). Cu ct depete 3 cu att intensitatea variaiei crete i
colectivitatea este eterogen, iar media tinde s fie o mrime nereprezentativ.
n 10 piese, s-au obinut urmtoarele rezultate: 2,31; 2,28; 2,29; 2,28; 2,32; 2,28;
2,32; 2,29; 2,31; 2,32. S se valoarea medie, dispersia, variana, abaterea medie
ptratic, precum i coeficientul de variaie.
Rezolvare: Distribuia eantionului este astfel:
xi
2,28
2,29
2,31
Ex. Tab.11.17
2,32
ni
Ex. Tab.11.18
xi
ni
xi ni
xi x
x x
2,28
2,29
2,31
2,32
Total ( )
3
2
2
3
n 10
6,84
4,58
4,62
6,96
23
-0,02
-0,01
0,01
0,02
-
4 104
1 104
1 104
4 104
-
x x
i
ni
12 10 4
2 104
2 104
12 104
28 104
23
2, 30
10
Mai nti se calculeaz media statistic
mm., cu formula (11.9)
din primele 3 coloane ale tabelului, apoi se continu calculele pentru completarea
celorlalte coloane ale acestui tabel. Rezult conform (11.11) dispersia statistic (de
x
selecie) empiric:
1
28 10
4 2,8 10
6
10
, iar conform (11.12) dispersia de
1
s 2 28 10
4 3,11 10
6
9
selecie modificat (variana):
. Atunci abaterea medie
2
2
3
medie ptratic de selecie modificat este, conform (11.14): s s 5,578 10 .
1,374 103
x
,
s
2, 425 103
x
.
ni
25
40
35
30
10
xi '
xi 1 xi
2 . Elementele de calcul se
Ex. Tab.11.20
xi 1 , xi
ni
xi '
xi 'ni
xi ' x
176 178
178 180
180 182
182 184
184 186
186 188
x ' x
20
177
354
-4,75
22,5625
451,25
25
179
4475
-2,75
7,5625
189,0625
40
181
7240
0,75
0,5625
22,5
35
183
6405
1,25
1,5625
54,6875
30
185
5550
3,25
10,5625
316,875
10
187
1870
5,25
27,5625
275,625
Total
160
29080
1310
x ' x
ni
1
1310 8,1875
160
. Atunci abaterea medie
30,2
30,3
30,5
30,6
ni
10
Ex. Tab.11.21
30,7
2
total rezult
f
i 1
x x
k
i 1
f i
i 1
), frecvenele relative
k
), produsele xi fi (totalul
x x
x x ,
valorile i
x f
i
i 1
, precum i produsele
x x
fi
ni
n (n
= valoarea medie),
f i
. La final totalul
(dispersia de selecie).
Ex. Tab.11.22
xi
ni
fi
xi fi
xi x
x x
30,2
30,3
30,5
30,6
30,7
1
4
10
7
2
0,04166
0,16667
0,41667
0,29167
0,08333
1,25813
5,03344
12,70844
8,92511
2,55823
-0,3
-0,2
0
0,1
0,2
0,09
0,04
0
0,01
0,04
0,00375
0,00667
0
0,00292
0,00333
Total
n 24
x ; 30,5
; 0, 01667
x x
i
f i
ti 1 ti
2
cu
(valoarea din mijloc a intervalului [ti 1 , ti ) , iar numrul intervalelor
(pentru care se efectueaz sumarea) este r dat de (11.5). Abaterea medie absolut
liniar este deci media aritmetic a valorilor absolute a abaterilor de la media
colectivitii.
xi 1 , xi
ni
xi '
xi 'ni
xi ' x
xi ' x
xi ' x ni
176 178
178 180
180 182
182 184
184 186
186 188
20
177
354
-4,75
4,75
95,00
25
179
4475
-2,75
2,75
68,75
40
181
7240
0,75
0,75
30,00
35
183
6405
1,25
1,25
43,75
30
185
5550
3,25
3,25
97,50
10
187
1870
5,25
5,25
52,50
Total
160
29080
385,50
385,5
2, 41
160
milioane lei.
considerat i
i 1
.
xi
ti 1 ti
2
(valoarea din mijloc a
m 1
m x
Observaie: Evident 0
i 1
.
Momentul statistic (de selecie) empiric centrat de ordin l se definete prin:
l
1 k
l ni xi x
n i 1
,
(11.18)
i 1
Observaii: 1. Evident 0 1 , 1 0 i 2 .
2. Momentele centrate sunt invariante la o translaie a valorilor reparti iei
statistice.
Exemple: 1. S se calculeze momentele centrate de ordinele 2, 3 i 4 pentru
selecia cu datele ordonate n Ex. Tab.11.15.
Rezolvare:
xi
80,3
81,1
81,3
81,4
81,6
81,9
82,2
82,5
82,8
xi ni
xi x
x x
1
2
3
4
3
2
4
1
4
80,3
162,2
243,9
325,6
244,8
163,8
328,8
82,5
331,2
-1,54
-0,74
-0,54
-0,44
-0,24
0,06
0,36
0,66
0,96
2,3716
0,5476
0,2916
0,1936
0,0576
0,0036
0,1296
0,4356
0,9216
x x
i
ni
2,3716
1,0952
0,8748
0,7744
0,1728
0,0072
0,5184
0,4356
3,6864
82,9
Total ( )
1
n 25
82,9
2046
1,06
-
1,1236
-
1,1236
11, 06
2
x 81,84
0, 4424
x x
x x
-3,652264
-0,405224
-0,157464
-0,085184
-0,013824
0,000216
0,046656
0,287496
0,884736
1,191016
-
ni
-3,652264
-0,810448
-0,472392
-0,340736
-0,041472
0,000432
0,186624
0,287496
3,538944
1,191016
0,112804
x x
x x
5,624487
0,299866
0,085030
0,037481
0,003318
0,000013
0,016796
0,189747
0,849346
1,262477
-
3 0,004512
ni
5,624487
0,599732
0,255090
0,149924
0,009954
0,000026
0,067184
0,189747
3,397384
1,262477
11,556005
4 0, 462240
xi 1 , xi
80,3;80, 7
80, 7;81,1
81,1;81,5
81,5;81,9
81,9;82,3
82,3;82,7
82, 7;83,1
ni
fi
xi 'f i
80,5
0,08
6,440
xi ' x
-1,636
80,9
10
0,10
8,090
-1,236
81,3
14
0,14
11,382
-0,836
81,7
12
0,12
9,804
-0,436
82,1
14
0,14
11,494
-0,036
82,5
13
0,13
10,725
0,364
82,9
0,08
6,632
0,764
83,1;83,5
83,5;83,9
83,9;84,3
Total ( )
x ' x
83,3
0,07
5,831
1,164
83,7
0.09
7,533
1,564
84,1
0,05
4,205
1,964
n 100
x ' x
i
f i
2,676496
0,214112
1,527696
0,152769
0,698896
0,097845
0,190096
0,022811
0,001296
0,000181
0,132496
0,017224
0,583696
0,046696
1,354896
0,094843
2,446096
0,220149
3,857296
0,192865
2
1, 059495
x ' x
x ' x
4,378747
1,888232
0,584277
0,082882
0,000047
0,048228
0,445944
1,577099
3,825684
7,575729
-
x 82,136
Continuare Ex. Tab. 11.25
f i
x ' x
x ' x
f i
-0,350300
7,163631
0,573090
-0,188823
2,333855
0,233386
-0,081799
0,488456
0.068384
-0,009946
0,036136
0,004336
-0,000006
0,000002
0,0000003
0,006270
0,035676
0,110397
0,344311
0,378786
3 0, 241996
0,017555
0,340701
1,835743
5,983386
14,878732
-
0,002282
0,027256
0.128502
0,538505
0,743936
4 2,319677
(11.19)
x x
Dac as 0 atunci se spune c repartiia este simetric (vezi i me
).
Exemplu: 1. Pentru repartiia cu datele date n Ex. Tab.11.15, prelucrate n Ex.
(11.20)
(11.20')
2,361778 3
Tab. 11.24: 4 0, 462240 i 0, 665131 rezult coeficienii 2
sau
4 2,319677
1, 029318
rezult coeficienii
2 2, 066474 3
sau
Se cere:
a) distribuia empiric de selecie pentru caracteristica X ,
b) media de selecie, momentul centrat de selecie de ordinul al doilea
(dispersia) i variana pentru caracteristica X ,
c) funcia de repartiie de selecie pentru X .
Rezolvare: a) Se observ c datele de selecie pentru caracteristica X au numai
n = 6 valori distincte, deci distribuia empiric de selecie pentru X este
1 2 3 4 5 6
X
4 6 4 3 1 2 .
b) Media de selecie pentru aceast caracteristic este:
1 20
1
57
x
xk
( 4 1 6 2 4 3 3 4 1 5 2 6)
2,85
20 k 1
20
20
.
Valoarea momentului centrat de selecie de ordinul doi pentru caracteristica X
este:
1 20
1 20
( x k x) 2
( x k 2,85) 2
20 k 1
20 k 1
,
Pentru simplificarea calculelor, se poate folosi formula de translaie:
1 n
2 ( X ) ( xk a) 2 ( x a) 2
n k 1
,
2 (X )
unde a este o constant real convenabil aleas. Anume, dac pentru caracteristica X
se alege a = 3, atunci
1 20
2(X )
( xk 3) 2 (2,85 3) 2
20 k 1
1
(4 2 2 6 12 4 0 2 3 12 1 2 2 2 3 2 ) 0,15 2
20
1
s s 2 X 2, 45 1,5652
0, daca x 1,
4
, daca 1 x 2,
20
10
, daca 2 x 3,
20
14
F 20 ( x)
, daca 3 x 4,
20
17
20 , daca 4 x 5,
18 , daca 5 x 6,
20
1, daca x 6,
3. Se consider un eantion de 20 de clieni, care intr ntr-un magazin
alimentar, pentru cercetarea cheltuielilor lunare Y n mii lei, ale clienilor pentru
procurarea de bunuri alimentare. S-au obinut urmtoarele date de selecie:
Y: 89, 90, 101, 88, 85, 77, 102, 100, 86, 97, 76, 121, 113, 110, 96, 92, 108,
112, 103, 109.
Se cer:
d) distribuia empiric de selecie pentru caracteristica Y,
e) media de selecie, momentul centrat de selecie de ordinul al doilea
(dispersia) i dispersia modificat de selecie (variana) pentru
caracteristica Y,
f) funcia de repartiie de selecie pentru Y.
Rezolvare:. a) Se observ c toate datele de selecie sunt distincte. Aadar,
distribuia empiric de selecie a lui Y este un tablou n care pe o linie sunt trecute
toate aceste valori (eventual ordonate cresctor), iar pe linia a doua se trec frecvenele
acestor valori, care sunt toate egale cu 1. Se face o grupare a datelor de selecie
corespunztoare caracteristicii Y. Anume, prima clas cuprinde cheltuielile lunare de
la 80-89 mii lei, etc. Dup efectuarea acestei grupri, distribuia empiric de selecie a
lui Y devine (pe prima linie se scriu mijloacele intervalelor):
75 85 95 105 115 125
Y
6
3
1 .
2 4 4
b) Media aritmetic pentru aceast caracteristic este:
1 20
1
y
y k 1955 97,75
20 k 1
20
mii lei.
Dac se folosesc datele grupate pentru caracteristica Y se obine:
'
1
1
( 2 75 4 85 4 95 6 105 3 115 1 125)
1970 98,5
20
20
mii lei y .
Valoarea momentului centrat de selecie de ordinul doi pentru aceast
caracteristic (folosind datele negrupate) este:
' 2
1 20
1 20
2 (Y )
(
y
y
)
( y k 98,5) 2
k
20 k 1
20 k 1
.
Pentru simplificarea calculelor, se poate folosi formula
1 n
2 ( X ) ( xk a) 2 ( x a) 2
n k 1
,
unde a este o constant real convenabil aleas. Anume, dac pentru caracteristica Y
se consider a = 105, se obine astfel:
1 20
2 (Y )
( y k 105) 2 (98,5 105) 2
20 k 1
1
(2 30 2 4 20 2 4 10 2 6 0 2 3 10 2 1 20 2 ) 6,5 2
20
1
s Y s 2 Y 192,105 13,86
0, daca y 75,
2
, daca 75 y 85,
20
6
, daca 85 y 95,
20
10
F 20 ( y )
, daca 95 y 105,
20
16
20 , daca 105 y 115,
1, daca y 125,
Probleme propuse
1. Fie caracteristica X, care are distribuia empiric de selecie
39,25 39,50 39,75 40,00 40,25 40,50
4
2
4
2
1
2
Se cere:
a) media de selecie, momentul centrat de selecie de ordinul doi i variana;
b) funcia de repartiie de selecie.
Rspunsuri.
a)
0 ,daca x 39 ,50,
2
,daca 39 ,25 x 39 ,50 ,
15
6 ,daca 39 ,50 x 39 ,75
15
8
,daca 39 ,75 x 40 ,00 ,
F15 ( x) 15
12
15 ,daca 40 ,00 x 40 ,25,
14
,daca 40 ,25 x 40 ,50,
15
1,daca x 40 ,50
b)
2
c) 4,37 ( 2, 090454 ), s 4,520690 ( s 2,126191 ), as 1, 297259 0
deci seria este pozitiv asimetric (de dreapta), 3 355,525 , 4 11685, 0911 ,
M 0 x 3 xme x
. Aici M
3,353
2
c) 0,950574 ( 0,974974 ), s 1, 000604 ( s 1, 000302 ), 3 0, 253435
4 1.907481 , as 0, 273456 0 deci seria este pozitiv asimetric (de dreapta),
x 3, 2908 ,
xi 1 , xi
ni
x 3, 2956 ,
3,26
3,27
3,28
3,29
3,30
3,31
3,32
3,33
3,34
6,31359 10 4 .
1, 66272 104 .
3,32;3,34
5