Sunteți pe pagina 1din 36

Capitolul 11.

Statistic matematic
1. Teoria seleciei
1. 1. Populaii statistice
Statistica matematic se definete ca fiind tiina care se ocup cu colectarea,
prezentarea, clasificarea, analiza i interpretarea cantitativ a datelor furnizate de
experien, prin aplicarea teoriei probabilitilor. Rolul statisticii matematice este de
determina informaii ct mai precise asupra repartiiei fenomenului aleator de mas
cercetat, n scopul obinerii unor previziuni asupra desfurrii viitoare a acestuia.
Populaia statistic sau colectivitatea statistic este o mulime finit sau infinit
C de elemente cercetat din punct de vedere a uneia sau mai multor proprieti
(caracteristici statistice). Un element al acestei populaii (individ din colectivitate:
persoan, obiect, fapt, fenomen, etc.) se numete unitate statistic, iar numrul
acestor uniti (indivizii acestei colectiviti), dac este finit, se va numi volumul
populaiei (colectivitii).
O colectivitate este omogen dac este constituit din elemente care sunt
susceptibile de a avea sau de a nu avea caracteristica studiat, cu o aceeai pondere.
nelese ca proprietate comun a tuturor unitilor statistice, caracteristicile
statistice pot fi:
- caracteristici cantitative sau variabile, dac pot fi msurate (cuantificate printr-un
numr),
- caracteristici calitative sau atribute, dac nu pot fi cuantificate printr-un numr
(msurate), ci prin aprecieri de tipul bun, foarte bun, mult, puin.
Valoarea numeric a unei caracteristici cantitative, care se variaz (n general)
aleator de la o unitate statistic la alta, constituie o variabil statistic X (ce ia
pentru fiecare unitate statistic o valoare numeric). Variaia nivelului unei
caracteristici de la o unitate la alta d caracteristicilor statistice caracterul de variabile
aleatoare.
Statistica matematic dispune de metode de organizare i prelucrare a
nregistrrilor datelor experimentale avnd ca scop s ncadreze fenomenul studiat n
una din clasele de fenomene care presupun o anumit lege teoretic i s determine
cel mai bine parametrii acestei legi. Aadar, problema central a statisticii matematice
este stabilirea legii de probabilitate pe care o urmeaz caracteristica (variabila
aleatoare) X . Din punct de vedere al teoriei probabilitilor, unei caracteristici a unei
colectiviti C i se asociaz o variabil aleatoare teoretic, ale crei valori

caracteristici numerice se vor numi caracteristici teoretice (media teoretic, dispersia


teoretic, .a.m.d.).
Variabilele sau caracteristicile statistice se clasific dup felul variaiei n:
a) caracteristici de tip discret cele care nu pot lua dect anumite valori n cadrul
unui anumit interval de valori (ex.: numrul copiilor dintr-o familie, numrul de
becuri care se ard dup 1000 de ore de ntrebuinare);
b) caracteristici de tip continuu cele care pot lua orice valoare n cadrul unui
anumit interval de valori (ex.: rezistena la rupere a unui fir de mtase, timpii de
defectare a unui numr fixat de piese).
Cercetarea unitilor din populaia C se poate efectua printr-o observare total
sau parial.
Cercetarea (observarea) total (care se face de exemplu sub form de
recensmnt) este o operaie complex, care de cele mai multe ori privete mai multe
caracteristici ale unitilor, pentru a realiza o analiz multilateral. Practic, o cercetare
total se recomand atunci cnd volumul populaiei C nu este prea mare, pentru a
evita cheltuieli ce pot depi avantajele concluziilor trase.
Cercetarea (observarea) parial (selectiv) se efectueaz asupra unei submulimi
(subpopulaii) S C . Submulimea S a populaiei statistice (colectivitii) cercetate
C se numete selecie (eantion sau sondaj), numrul indivizilor ce intr n selecie se
numete volumul seleciei (eantionului sau sondajului). Un eantion format din cel
mult 30 de uniti statistice poart denumirea de eantion mic, altfel eantionul este
considerat ca fiind unul mare.
De exemplu, dac este solicitat opinia unei popula ii ntr-o problem oarecare
este dificil s fie consultat ntreaga populaie i se recurge la extragerea unui
eantion (operaie de sondaj).
n cazul cnd operaia de selecie (sondaj) se efectueaz dintr-o populaie
omogen, ea se numete operaie de selecie (sondaj) simpl.
n cazul cnd populaia C nu este omogen din punct de vedere al caracteristicii
(proprietii) cercetate, dar poate fi mprit n subpopulaii Ci, fiecare n parte
omogen, ca nite straturi ale populaiei C, se va efectua aa numita operaie de
selecie (sondaj) stratificat. De exemplu, dac un anumit tip de piese sunt produse
ntr-o secie de producie, dar de diferite strunguri, se recomand ca selec ia s se
efectueze pentru fiecare strung n parte.
Un eantion ale crui uniti au fost alese la ntmplare se numete eantion
reprezentativ (aleator). Extragerea unui eantion reprezentativ se realizeaz astfel
nct elementele s aib anse egale de a fi extrase. n multe situa ii se folosesc
numere aleatoare. Astfel, dac pentru o list a populaiei iniiale de volum N : x1, x2, .
. . , xN , se aleg n numere aleatoare (dintr-un tabel de asemenea numere): k1, k2, . . . ,

x , x ,..., xkn
kn ntre 1 i N , atunci un eantion aleator de volum n este: k1 k2
. De exemplu,
dac din 10000 de piese se aleg 100 n vederea controlului de calitate, se spune c
volumul colectivitii este N 10000 , iar volumul eantionului este n 100 .

Prin sondaj, se obine un ir de valori ale variabilei aleatoare statistice X.


O operaie de selecie se numete repetat sau sondaj cu revenire (nonexhaustiv), dac dup examinarea individului (unitii de sondaj), acesta este
reintrodus n colectivitate (acesta putnd s apar din nou n procesul de construcie al
eantionului S), n caz contrar, adic dac individul (unitatea de sondaj) examinat nu
se reintroduce n colectivitate, vom spune c operaie de selecie este nerepetat sau
sondaj fr revenire (exhaustiv).
Efectuarea sondajului fr revenire are ca schem probabilistic urna bilei
nerevenite). Aplicarea seleciei nerepetate nu are sens dect n cazul cnd volumul
populaiei C este finit, iar valorile de selecie astfel obinute sunt dependente.
Dac volumul colectivitii C este mult mai mare dect volumul seleciei,
deosebirea ntre cele dou feluri de selecie este foarte mic i atunci selecia
nerepetat poate fi considerat ca fiind selecie repetat. In cele ce urmeaz, se vor
considera numai selecii repetate.
Efectuarea sondajului cu revenire (seleciei repetate) are ca schem probabilistic
urna lui Bernoulli (urna bilei revenite). Sondajele astfel efectuate sunt echiprobabile,
iar valorile de selecie astfel obinute sunt independente.
Valorile eantionului aleator de volum n : x1 , x 2 ,..., xn , dac nu sunt toate diferite
ntre ele se ordoneaz i dup o renotare, se trec valorile distincte obinute
menionnd pentru fiecare valoare numrul de ori n care s-a obinut valoarea
respectiv. Se numesc date de selecie relative la caracteristica X , valorile distincte
obinute pentru caracteristica X privind indivizii care intr n selecie. Fie c n urma
unei selecii de volum n , efectuat dintr-o colectivitate, la indivizii creia se
urmrete caracteristica X, s-au obinut rezultatele distincte (datele de selecie) x1 , x 2
,..., xk , unde k n . n general aceste date se ordoneaz (de obicei cresctor) adic se
presupune c x1 x2 ... xk (se mai numesc serie statistic (unidimensional)).
Observaii: 1. Deoarece aceste valori difer n general de la o selecie la alta, iar
seleciile sunt alegeri ntmpltoare, datele de selecie x1 , x 2 ,..., xk se pot considera
i ca valori ale unor variabile aleatoare, respectiv X 1 , X 2 ,..., X k , care se vor numi
variabile de selecie.
2. Dac selecia este repetat, atunci variabilele de selecie X 1 , X 2 ,..., X k sunt
variabile aleatoare independente i urmeaz fiecare aceeai lege de probabilitate cu
variabila aleatoare X , adic sunt identic repartizate cu X.

x , i 1, k
Frecvena absolut a unei valori i
a unei caracteristici este numrul ni
care reprezint numrul de uniti statistice ale populaiei statistice care corespund
valorii xi a variabilei statistice X.
n cazul variabilelor discrete rezultatele sunt prezentate sub forma unui tablou
(tabel statistic) de forma:
(11.1)
X
n

x1
n1

x2
n2

...
...

xk
nk

n ni

i 1
unde volumul seleciei
.
Frecvena absolut cumulat cresctor (ascendent) este suma frecvenelor
j

absolute corespunztoare valorilor mai mici sau egale cu valoarea xj :

n
i 1

, jk.

xi , i 1, k a unei caracteristici este


n
f i i , i 1, k
n
raportul dintre frecvena absolut i volumul seleciei, adic
. Suma
Frecvena relativ (ponderea) a unei valori

fi 1
frecvenelor relative este egal cu 1: i 1
.
Frecvena relativ cumulat cresctor (ascendent) este suma frecvenelor
j

relative corespunztoare valorilor mai mici sau egale cu valoarea xj :


jk.

f
i 1

1 j
ni
n i 1 ,

Tabloul de forma

x1 x2 ... xk

f1 f 2 ... f k

X :

(11.2)
f
x
unde i este frecvena relativ apariiei valorii i , se va numi distribuia empiric de
selecie (tablou de repartiie statistic) a caracteristicii X .
Observaii : 1. Uneori, n locul frecvenei relative fi , se folosete numrul de
k

i 100

100

f
i
i
i
i

1
procente corespunztoare valorii , definit prin
. Evident,
.
2. Distribuia (repartiia) empiric a unei caracteristici variaz de la o selec ie la
alta.

1. 2. Reprezentarea grafic a datelor statistice


O reprezentare grafic a datelor statistice este sub forma poligonului
frecvenelor absolute sau relative. Acesta se obine ntr-un reper xOy, unind punctele

x ,n
x,f
de coordonate i i sau i i , i 1, k , prin segmente de dreapt. El sugereaz
forma reprezentarea grafic a repartiiei probabilistice (teoretice) a caracteristicii.
Altfel, datele statistice se mai pot reprezenta sub forma unor bare verticale
(coloane). Se unesc punctele de pe axa Ox :

xi , 0

prin segmente perpendiculare pe

xi , ni sau xi , f i , i 1, k . i aceste
aceast ax, cu punctele de coordonate
segmente (bare, batoane), de o lime mai mult sau mai puin pronunat, sugereaz
forma grafic a repartiiei probabilistice (teoretice) a caracteristicii (variabilei
aleatoare).
Exemplu: Ca rezultat a unui sondaj de s-au obinut numerele:
3, 2, 1, 3, 5, 3, 2 (7 numere). S se scrie tablourile frecvenelor absolute i a
celor relative, apoi s se reprezinte grafic poligoanele acestor frecvene i tot acestea
prin bare verticale (coloane).
Rezolvare: Valorile distincte a acestui sondaj (de volum n 7 ) se scriu n
ordine cresctoare: x1 3 (cu frecvena absolut n1 3 ), x2 1 (cu frecvena
absolut n2 1 ), x3 2 (cu frecvena absolut n3 2 ), x4 5 (cu frecvena
absolut n4 1 ). Suma acestor frecvene absolute este egal cu volumul sondajului:
n1 n2 n3 n4 7 . Frecvenele relative sunt cele de mai sus, mpr ite la n 7 :
n
n1 3
n
1
2
n
1
, f 2 2 , f3 3 , f 4 4
n 7
n 7
n 7
n 7 . Suma acestor frecvene relative
este evident, egal cu 1: f1 f 2 f3 f 4 1 . Tablourile acestor frecvene sunt:
Ex. Tab. 11.1
Valorile
-3
-1
+2
+5
Frecvenele
absolute
3
1
2
1
f1

Ex. Tab.11.2

Valorile
Frecvenele
relative

-3
3
7

-1
1
7

+2.
2
7

+5
1
7

Poligonul frecvenelor absolute este:

Fig.11.1
iar cel al frecvenelor relative (se deosebete de primul doar prin mrimea unit ii
(scalei de reprezentare) pe axa ordonatelor Oy ) este:

Fig.11.1'
Graficul cu bare verticale (coloane) corespunztoare frecvenelor absolute este:

Fig.11.2
iar cele ale frecvenelor relative:

Fig.11.2'
Dac n locul frecvenei relative f i , se folosete numrul de procente
k

i 100
corespunztoare valorii xi , definit prin i 100 f i (unde i 1
), pentru
reprezentarea grafic a datelor statistice se folosete deseori diagrama circular de
structur n forma unui disc circular mprit n sectoare proporionale cu
procentajele.

Exemplu: Distribuia pe grupe de vrst a unui eantion de indivizi dintr-o


localitate, observai la un moment dat, se prezint astfel:

Grupa de vrst
Efectivul
Frecv. relativ

Tnr
17
17%

Adult
61
61%

Ex. Tab.11.3
n vrst
22
22%

Structura pe grupe de vrst pentru eantionul observat se reprezint grafic


prin urmtoarea diagram de structur circular:

Fig.11.3

Dac X este variabil de tip continuu, aceasta se transform ntr-o variabil


discret n scopul prelucrrii mai uoare a datelor, n felul urmtor: se face o grupare
a datelor de selecie n clase (clasificare statistic) prin mprirea intervalului ( a, b)
, unde X ia valori, n subintervalele date prin
a t0 t1 t2 L tk b.
n acest caz datele se grupeaz ntr-un tablou de forma:
X
n

[t0,t1)
n1

[t1,t2)
n2

(11.3)
[tk-1,tk)
nk

...
...

unde ni este numrul valorilor variabilei statistice aflate n intervalul [ti-1 , ti) i se
k

numete frecvena absolut. La fel

n ni
i 1

este volumul seleciei.

ni
, i 1, k
n
Frecvena relativ corespunztoare ntervalului [ti-1 , ti) este
i
reprezint numrul valorilor variabilei statistice aflate n intervalul [ti-1 , ti) mprit la
volumul seleciei.
Analog se introduc i celelalte noiuni de frecven absolut cumulat, frecven
relativ cumulat.
fi

Distribuia empiric de selecie a variabilei statistice continue X va fi de aceeai


form ca i n cazul discret:
x x ... xk
X : 1 2

f1 f 2 ... f k
t t
xi i 1 i ,
x
2
unde, i este valoarea central a intervalului (
mijlocul intervalului), iar
f i este frecvena datelor de selecie din intervalul (clasa) [ti 1 , ti ).

O reprezentare grafic a datelor statistice, n cazul datelor grupate pe


subintervale, este sub forma diagrame cu linii (histogram).. Histograma (diagrama
liniar) se construiete sub forma unor dreptunghiuri lipite, cu baza pe axa Ox,
limea lor fiind egal la baz cu mrimea intervalului de variaie respectiv. nl imea
dreptunghiului va fi egal sau proporional cu frecvena corespunztoare fiecrui
interval de variaie. Pentru reprezentarea grafic, unitile de msur pe axele de
coordonate nu trebuie s fie neaprat egale.

Histograma arat forma de repartiie, densitatea de reparti ie a frecven elor i


gradul de asimetrie.
Din histograma frecvenelor se poate obine poligonul frecvenelor.
Exemplu: S se construiasc histograma distribuiei date prin urmtorul tabel
al frecvenelor absolute:
Ex. Tab.11.4
Intervale
[-8,-3)
[-3,2)
[2,7)
[7,12)
[12.17]
Frecv. abs.
3
8
15
6
2
Rezolvare: Sunt 34 date de selecie, deci frecvenele relative sunt: 3/34, 8/34,
15/34, 6/34, 2/34. Histograma este format din 5 dreptunghiuri lipite, cu bazele
constituite din cele 5 intervale (n acest caz, egale), iar nl imile propor ionale cu
frecvenele.

Fig.11.4
Din histograma frecvenelor se obine poligonul frecvenelor unind mijloacele
segmentelor ce mrginesc superior dreptunghiurile histogramei.
Observaie: De multe ori este necesar o grupare a datelor de selecie chiar
pentru cazul cnd caracteristica X este de tip discret. De exemplu,
dac selecia x1 , x 2 ,..., x n este de volum mare i se obine n urma msurrii unor
mrimi fizice, tehnice, economice de care depinde evoluia unor procese sau
fenomene.
Se procedeaz astfel:
m min xi
M max xi
i
i
- se noteaz cu
i
(11.4)
- se divide intervalul [m, M] ntr-un numr de r de subintervale de aceeai lungime.
Pentru determinarea numrului (ntreg) de subintervale egale de grupare se
recomand a fi folosit formula lui H. A. Sturges:

lg n
r 1 log 2 n 1 1 3,322 lg n
lg 2

(11.5)
Se numete pasul de histogram numrul

M m
r

(11.6)

Intervalele de grupare sunt astfel


I1 = [m, m + h) , I2 = [m + h, m + 2h) , . . . , Ir = [m + (r 1)h, M]
(11.7)
- Se noteaz cu n1 numrul acelor valori xi care sunt situate n intervalul I1, cu n2
numrul acelor valori xi care sunt situate n intervalul I2, . . . , cu nr numrul acelor
valori xi care sunt situate n intervalul Ir.
Histograma asociat seleciei x1, x2, . . . , xn este reuniunea dreptunghiurilor Dk =
Ik [0, nk] (produs cartezian), pentru 1 k r.
Deci datele seleciei x1, x2, . . . , xn se grupeaz n r grupe i exist posibilitatea de
vizualizare (reprezentare grafic): se alege un sistem ortogonal de axe xOy, cu
intervalul [m, M] plasat pe axa Ox (cu originea O , eventual n punctul m). Pe
intervalul I1 se construiete dreptunghiul de nlime n1 i baza de lungime h, pe
intervalul I2 se construiete dreptunghiul de nlime n2 i baza de lungime h, etc.
Exemplu: n urma unui control a dimensiunii diametrului a 200 de bile de
rulmeni s-au obinut urmtoarele rezultate (n mm.):
6,34 ; 6,21 ; 6,36 ; 6,48 ; 6,39 ; 6,45 ; 6,27 ; 6,50 ; 6,44 ; 6,60 ; 6,34 ; 6,56 ; 6,38 ;
6,54 ; 6,26 ; 6,62 ; 6,41 ; 6,46 ; 6,40 ; 6,48 ; 6,50 ; 6,28 ; 6,39 ; 6,56 ; 6,35 ; 6,44 ;
6,54 ; 6,37 ; 6,60 ; 6,38 ; 6,51 ; 6,29 ; 6,58 ; 6,36 ; 6,45 ; 6,54 ; 6,33 ; 6,49 ; 6,41 ;
6,46 ; 6,32 ; 6,56 ; 6,36 ; 6,51 ; 6,13 ; 6,41 ; 6,54 ; 6,31 ; 6,39 ; 6,57 ; 6,34 ; 6,60 ;
6,37 ; 6,46 ; 6,24 ; 6,45 ; 6,43 ; 6,40 ; 6,48; 6,42 ; 6,52 ; 6,41 ; 6,49 ; 6,30 ; 6,28 ; 6,51
6,35 ; 6,40 ; 6,48 ; 6,27 ; 6,36 ; 6,43 ; 6,50 ; 6,29 ; 6,46 ; 6,37 ; 6,47 ; 6,29 ; 6,45 ;
6,30 ; 6,47 ; 6,23 ; 6,52 ; 6,37 ; 6,53 ; 6,33 ; 6,39 ; 6,57 ; 6,38 ; 6,44 ; 6,58 ; 6,35 ;
6,41 ; 6,46 ; 6,22 ; 6,45 ; 6,34 ; 6,42 ; 6,50 ; 6,43 ; 6,31 ; 6,51 ; 6,38 ; 6,54 ; 6,23 ;
6,55 ; 6,41 ; 6,53 ; 6,28 ; 6,47 ; 6,39 ; 6,42 ; 6,45 ; 6,40 ; 6,56 ; 6,44 ; 6,33 ; 6,48 ;
6,43 ; 6,52 ; 6,50 ; 6,58 ; 6,20 ; 6,34 ; 6,47 ; 6,60 ; 6,37 ; 6,49 ; 6,36 ; 6,53 ; 6,38 ;
6,54 ; 6,15 ; 6,61 ; 6,46; 6,27 ; 6,59 ; 6,45 ; 6,51 ; 6,43 ; 6,46 ; 6,53 ; 6,40 ; 6,30 ; 6,52
6,35 ; 6,59 ; 6,32 ; 6,47 ; 6,55 ; 6,34 ; 6,43 ; 6,57 ; 6,22 ; 6,42 ; 6,58 ; 6,34 ; 6,49 ;
6,68 ; 6,30 ; 6,44 ; 6,64 ; 6,29 ; 6,53 ; 6,36 ; 6,59 ; 6,38 ; 6,40 ; 6,63 ; 6,67 ; 6,35 ;
6,44 ; 6,55 ; 6,39 ; 6,43 ; 6,65 ; 6,28 ; 6,42 ; 6,57 ; 6,44; 6,47 ; 6,42 ; 6,52 ; 6,31 ; 6,37
6,55 ; 6,66 ; 6,25 ; 6,43 ; 6,59 ; 6,40; 6,61 ; 6,41 ; 6,47 ; 6,20 ; 6,35 ; 6,45 ; 6,49 ; 6,32
6,53 ; 6,42 .
S se grupeze pe intervale egale aceste date de selec ie i apoi s se construiasc
histograma asociat.
m min xi 6,13
M max xi 6, 69
i
i
Rezolvare:
, iar
Pentru determinarea numrului (ntreg) de subintervale de grupare se folosete
formula lui H. A. Sturges (11.5):

r 1 3,322 lg 200 1 3,322 2,301 1 7, 644 8


M m 6, 69 6,13

0, 07
r
8
Pasul de histogram este
i atunci intervalele
de grupare sunt: I1 = [6,13; 6,20), I2 = [6,20; 6,27), I3 = [6,27; 6,34), I4 = [6,34;
6,41), I5 = [6,41; 6,48), I6 = [6,48; 6,55), I7 = [6,55; 6,62), I8 = [6,62; 6,69].
h

Se numr datele cuprinse n fiecare interval i se alctuie te urmtorul tabel


al frecvenelor absolute:

Intervalu
l
Frecven
a

I1

I2

I3

I4

I5

I6

Ex. Tab.11.5
I7
I8

24

43

51

37

26

Histograma:

Fig.11.5
Observaie: Se poate alege scara la care se figureaz histograma, astfel nct
suma ariilor dreptunghiurilor histogramei s fie egal cu 1. Histograma astfel scalat
se poate suprapune peste graficul unei densiti de probabilitate n vederea intuirii
acesteia.
Pentru datele de selecie x1 , x 2 ,..., xn grupate n subintervale [ti-1 , ti), i 1, k ,
unde ni este numrul valorilor variabilei statistice aflate n intervalul [ti-1 , ti),

frecvena absolut cumulat cresctor i

este suma frecvenelor absolute


i

t t
xi i 1 i i n j
j 1
2
corespunztoare valorilor mai mici sau egale cu valoarea
:
,
i k , iar frecvena relativ cumulat cresctor i este suma frecvenelor relative

corespunztoare valorilor mai mici sau egale cu valoarea

xi

ti 1 ti
2

1 i
n j
n j 1 , i k . Atunci o reprezentare grafic a acestor date i frecvene
j 1
cumulate este sub forma ogivei sau poligonului frecvenelor cumulate. Acesta se

i f j

xi , i , i 1, k prin
obine ntr-un reper xOy, unind punctele de coordonate
segmente de dreapt. El sugereaz forma reprezentarea grafic a funciei de reparti ie
probabilistic (teoretic) a caracteristicii.
Exemplu: Pentru distribuia cu date grupate din exemplul precedent

Intervalu
l
Frecven
a

I1

I2

I3

I4

I5

I6

Ex.Tab.11.6
I7
I8

24

43

51

37

26

unde : I1 = [6,13; 6,20), I2 = [6,20; 6,27), I3 = [6,27; 6,34), I4 = [6,34; 6,41), I5 =


[6,41; 6,48), I6 = [6,48; 6,55), I7 = [6,55; 6,62), I8 = [6,62; 6,69], se consider
mijloacele segmentelor i frecvenele cumulate, scrise n urmtorul tabel:
Ex. Tab.11.7
xi
6,165 6,235
6,305 6,375
6,445
6,515
6,585 6,655
Frecven
e
2
11
35
78
129
166
192
200
absolute
cumulate
Frecven
11/20
e relative 1/100 0
7/40 39/100 129/20 83/100 24/25
1
cumulate
0
Graficul ogivei (poligonului frecvenelor cumulate) este:

Fig.11.6

Se numete funcie de repartiie empiric asociat unei caracteristici


(variabile aleatoare) X , dup extragerea unei selecii de volum n: (x1, x2, . . . , xn),

funcia Fn : ,

Fn ( x)

numarul _ valorilor _ x j x
n

kx
n

(11.8)
(kx este deci numrul de observaii n care au aprut valori ale variabilei aleatoare
(caracteristicii) X, mai mici dect x dat)
Exemplu: Funcia de repartiie empiric pentru distribuia de selecie
1 2 3 4
X :

35 29 36 9
(deci de volum n 100 ) este dat prin:
daca x 1,
0,
0,35, daca 1 x 2,

F100
( x ) 0,55, daca 2 x 3,
0,91, daca 3 x 4,

daca x 4.
1,
Reprezentarea grafic a acestei funcii este:

Fig.11.7

Teorema fundamental a statisticii matematice (Glivenko): Funcia de


repartiie empiric asociat unei caracteristici X i unei selecii de volum n converge
(n probabilitate) ctre o funcie F ( x) , care este funcia teoretic de repartiie
(distribuie) corespunztoare legii de probabilitate caracterizat de variabila aleatoare
X.
Mai precis: Fie o populatie statistic i X variabila aleatoare ataat ei cu funcia
de repartitie
construiete

F ( x) p X x
ca

mai

. Pentru o selecie de volum n: (x1, x2, . . . , xn) se

sus

funcia

de

repartiie

empiric

Fn

Atunci

0 : p F ( x) Fn 0

.
Zn

Demonstraia folosete inegalitatea lui Cebev pentru variabila

x x

1 n
Yi
n i 1 , unde Yi este
Y1 , Y2 ,..., Yn

variabila aleatoare ce ia valoarea 1 dac i


i 0 n caz contrar. Variabilele
independente (seleciile sunt independente) i au distribuia simpl Bernoulli.

sunt

Observaie: Cu ct n este mai mare, cu att Fn ( x) aproximeaz mai corect pe

F ( x) .

1. 3. Caracteristici statistice ale datelor experimentale


n
Dat funcia real h : , se numete funcie de selecie sau statistic,
variabila aleatoare Z n h X 1 , X 2 , , X n , X 1 , X 2 ,..., X n fiind variabilele de

selecie, iar valoarea numeric z n h x1 , x 2 , , x n o numim valoarea funciei de

selecie, x1 , x 2 ,..., x n fiind datele de selecie.


Dac pentru variabilele discrete rezultatele sunt prezentate sub forma unui
tablou de forma (11.1), atunci media (aritmetic) de selecie (sperana matematic)
este:

1 k
ni xi
n i 1
,
(11.9)
unde ni reprezint frecvena absolut de apariie a valorii xi a variabilei n selecia
x

considerat i

n
i 1

Observaie: Dac n selecia de volum n, valorile xi apar o singur dat (cu


frecvena absolut ni = 1), atunci media de selecie este media aritmetic simpl:
1 k
x xi
n i 1
(spre deosebire de formula (11.9) care este media aritmetic ponderat: valorile xi cu
ponderile ni ).
t t
xi i 1 i
2
n cazul datelor grupate xi se nlocuiete cu
(valoarea din mijloc a
intervalului [ti 1 , ti ) deci:
t t
1 r
ni i 1 i
n i 1
2 ,
unde r este numrul intervalelor, dat de (11.5).
x

(11.9')

Proprieti: 1. Media aritmetic este cuprins ntre cea mai mic i cea mai
mare valoare a repartiiei statistice: xmin x xmax .
2. Au loc relaiile: x a x a i ax ax , a (translaia i scalarea
mediei de selecie).
Exemple: 1. Valoarea lucrrilor efectuate de o echip de muncitori la un punct
de lucru, pe parcursul a 7 zile se prezint astfel (n mii de lei): 200, 250, 500, 750,
1000, 1250, 1500. S se calculeze valoarea medie zilnic a lucrrilor efectuate de
aceast echip.
Rezolvare: n cazul de fa este o medie aritmetic simpl:
x

200 250 500 750 1000 1250 1500 5550

792,85
7
7
mii lei.

2. S se calculeze media de selecie a distribu iei date ca exemplu n


tabelul 11.1:
Valorile
-3
-1
+2
+5
Frecvenele
absolute
3
1
2
1

Rezolvare: Calculul mediei dup formula (11.9) se efectueaz mai uor,


completnd tabelul urmtor:
Ex. Tab.11.8
xi
ni
xi ni
-3
3
-9
-1
1
-1
2
2
4
5
1
5
7
-1
Total ( )

Media aritmetic de selecie este:

1
0,143
7

3. Distribuia dup volumul vnzrilor zilnice (milioane lei) a unit ilor


comerciale dintr-un jude, n anul trecut, se prezint astfel:

Volumul vnzrilor (intervale)


Numrul unitilor comerciale

0-10
50

Ex. Tab.11.9
20-30
30-40
10
5

10-20
20

S se calculeze nivelul mediu al vnzrilor zilnice.


Rezolvare: Elementele de calcul se sistematizeaz ntr-un tabel cuprinznd
intervalele

xi 1 , xi , frecvenele absolute

ni , mijloacele intervalelor xi '


k

produsele xi 'ni . n josul tabelului se scriu totalurile

x ,x
Intervalele i 1 i
0-10
10-20
20-30
30-40
Total

ni n
i 1

xi 1 xi
2
i

x 'n
i 1

. Astfel:

ni

xi '

Ex. Tab.11.10
xi 'ni

50
20
10
5
85

5
15
25
35
-

250
300
250
175
975

Media aritmetic este

975
11, 47
85
milioane lei.

4. Distribuia unui eantion de firme de anumit profil, dup profitul net, n mii
lei, n anul trecut, este:
Ex. Tab.11.11
Profit net
0-2
2-4
4-6
6-8
8-10
Numr firme
40
50
90
15
5
S se determine valoarea medie a profitului net anual.
Rezolvare: Calculele se pot sistematiza ntr-un tabel cuprinznd intervalele
k

xi 1 , xi ,
fi

frecvenele absolute ni (n total se scrie

ni
n (n total rezult

f
i 1

xi 'f i . n final totalul

Profit net
0-2
2-4
4-6
6-8
8-10
Total

x 'f
i 1

ni
40
50
90
15
5
n 200

n
i 1

), mijloacele intervalelor

), frecvenele relative

xi '

xi 1 xi
2
i produsele

(valoarea medie).

fi
0,200
0,250
0,450
0,075
0,025
1

xi '
1
3
5
7
9
-

Ex. Tab.11.12
xi 'f i
0,200
0,750
2,250
0,525
0,225
3,950

Deci valoarea medie a profitului net anual a firmelor de acest profil este de 3,95
mii de lei.
5. Pentru timpul de deplasare zilnic la serviciu s-au nregistrat urmtoarele
date, pentru un eantion de 200 de persoane:
Ex. Tab.11.13
Timpul
de
deplasare
0-30
30-60
60-90
90-120
120-150
150 i
zilnic (min.)
peste
Numr
de
25
50
60
45
15
5
persoane

S se calculeze media acestui timp.


Rezolvare: Dearece cifrele sunt destul de mari, calculul se poate simplifica,
folosind proprietile de translaie i scalarea a mediei de selecie. Astfel n tabelul de
xi '

xi 1 xi
2
cu o valoare

calcul se transleaz valorile pentru mijloacele intervalelor


central (aici xi ' a xi ' 75 ), apoi se scaleaz aceste valori pentru o simplificare a
xi ' a xi ' 75

30 ); n fine irul frecvenelor se simplific prin c.m.m.d.c. (aici


lor (aici k

ni ni

c 5 ). Se calculeaz media simplificat din sumele tabelului, apoi prin metoda


mersului invers se deduce media de selecie cerut.

xi 1 , xi

ni

xi '

xi ' a

0-30
30-60
60-90
90-120
120-150
150+
Total

25
50
60
45
15
5
200

15
45
75
105
135
165
-

-60
-30
0
30
60
90
-

xi ' a
k
-2
-1
0
1
2
3
-

ni
c
5
10
12
9
3
1
40

Ex. Tab.11.14
xi ' a ni

k
c
-10
-10
0
9
6
3
-2

2
2
x x simplif . k a 30 75 73,5
40
40
Astfel
minute.
Pentru datele negrupate (variabil discret) moda seleciei sau dominanta este
valoarea observat xi care are frecvena ni maxim.
Pentru datele grupate moda este orice valoare din clasa cu cel mai mare numr
de observaii. Deci moda seleciei este din intervalul modal Ik , ce corespunde
dreptunghiului cel mai nalt al histogramei (pentru care frecvena corespunztoare nk
este maxim). Pentru precizare, moda este aleas egal cu valoarea M o , care mparte
x simplif .

intervalul modal Ik n raportul

nk nk 1 : nk nk 1 .

Mai exact, dac intervalul

I k xk 1 , xk

, iar nk 1 i nk 1 sunt frecvenele (mai mici) corespunztoare

intervalelor I k 1 , respectiv I k 1

M o xk 1 nk nk 1

I
x

M
nk nk 1 .
k
k
o
(adiacente lui ):

Exemple: 1. Pentru distribuia de selecie dat ca exemplu n tabelul 11.1,


moda (dominanta) este valoarea -3 (care apare de 3 ori).
2. Pentru distribuia de selecie dat ca exemplu n tabelul 11.4, intervalul
modal este

2, 7 ,

caruia i este atribuit frecvena absolut 15. Mai precis, M o

M o 2 15 8
31

Mo
1,9375
7

M
15

6
16
o
satisface
, de unde
.

Dac mai multe valori (subgrupei) sunt la fel de nalte i detaate de celelalte,
se spune c selecia este plurimodal.
Exemple: 1. Selecia de 25 de piese, msurate n mm. are 10 variante
distincte de lungime, cu urmtoarele frecvene:
Ex. Tab.11.15
xi
80,3 81,1 81,3 81,4 81,6 81,9 82,2 82,5 82,8 82,9
1
2
3
4
3
2
4
1
4
1
ni
Frecvena maxim nregistrat este 4, ntlnit la trei variante. Deci seria de
variante distincte ale caracteristicii observate este o selecie trimodal (cu trei
dominante).
2. Selecia de 100 de piese, msurate n mm. grupate n 10 intervale de
lungime are urmtoarele frecvene:
Ex. Tab.11.16
80,3- 80,7- 81,1- 81,5- 81,9- 82,3- 82,7- 83,1- 83,5- 83,9 x , x 80,7 81,1 81,5 81,9 82,3 82,7 83,1 83,5 83,9 84,3
i 1

ni

10

14

12

14

13

Frecvena maxim nregistrat este 14, ntlnit la dou intervale (grupe). Deci
selecia dat este bimodal (cu dou dominante).

Mediana unei selecii este valoarea xme care mparte irul ordonat de date n
dou pri egale: numrul de valori xi xme este egal cu numrul de valori xi xme .

Mai exact, dac irul are 2k + 1 uniti, atunci mediana coincide cu unitatea de ordin
k + 1, dac irul are 2k uniti, mediana este media aritmetic a unitilor de ordin k i
k+1; dac exist mai multe asemenea valori pentru xme , atunci ele formeaz un
interval i mediana este prin definiie mijlocul acestui interval.
Exemple: 1. Pentru irul impar de date: 2,5; 3,7; 1,4; 0,2; 5,4; 8,9; 4,2 irul
ordonat este 0,2; 1,4; 2,5; 3,7; 4,2; 5,4; 8,9. Deci 2k + 1 = 7, de unde k = 3 i unitatea
de ordin k +1 = 4 este 3,7 care este mediana.
2. Pentru irul par de date: 10; 40; 20; 15; 22; 35 irul ordonat cresctor este 10;
15; 20; 22; 35; 40. Deci cei doi termeni centrali ai seriei sunt 20 i 22, iar media
aritmetic a lor este 21, care este mediana xme .
Observaie : Datorit semnificaiei lor, media, moda, mediana constituie
parametrii tendinei centrale.
Amplitudinea statistic este diferena dintre cea mai mare valoare M xmax i
cea mai mic valoare m xmin a repartiiei statistice:

A M m xmax xmin

(11.10)
n cazul variabilelor aleatoare continue, amplitudinea este diferen a dintre
limita superioar a ultimului interval i limita inferioar a primului.
Exemple: Pentru selecia dat prin Ex. Tab.11.15, amplitudinea statistic este
A 82,9 80,3 2, 6 , iar pentru selecia dat prin Ex. Tab.11.16, aceasta este
A 84,3 80, 3 4 mm.

Dispersia statistic (de selecie) empiric (nemodificat) se definete prin:


2
2
1 k
xi x ni
n i 1
(11.11)

pentru datele negrupate (variabile discrete), unde ni reprezint frecvena absolut de


k

apariie a valorii xi a variabilei n selecia considerat,


i x este media
aritmetic de selecie. Dispersia este deci media aritmetic a ptratelor abaterilor de la
media colectivitii.
i 1

xi

ti 1 ti
2
(valoarea din mijloc a

n cazul datelor grupate xi se nlocuiete cu


intervalului [ti 1 , ti ) , iar numrul intervalelor (pentru care se efectueaz sumarea) este
2

1 r t t
i 1 i x ni
n i 1
2

r dat de (11.5), deci:

(11.11')

De multe ori, este mai avantajos, a folosi drept dispersie statistic, mrimea
numit dispersie de selecie modificat (variana):
k
2
1
s2
xi x ni
n 1 i 1
(11.12)
t t
xi i 1 i
2
pentru datele negrupate , iar pentru cele grupate xi se nlocuiete cu

(valoarea din mijloc a intervalului [ti 1 , ti ) , iar numrul intervalelor (pentru care se
efectueaz sumarea) este r dat de (11.5).

Observaie: Dispersiile astfel definite caracterizeaz mprtierea valorilor


repartiiei statistice n jurul mediei. Dac
de altele foarte putin, dac

s
2

este mic atunci datele difer unele

este mare, datele difer foarte mult.

Abaterea medie ptratic de selecie (nemodificat) este:


Abaterea medie ptratic de selecie modificat este:

v
x
Coeficientul de variaie este:

s s2

(11.13)
(11.14)
(11.15)

s
x

respectiv coeficientul de variaie modificat :


(11.15')
Observaie : Coeficientul de variaie exprim intensitatea variaiei i se definete
1
3 se consider c intensitatea variaiei este
n domeniul numerelor pozitive. Dac
redus i selecia de valori pozitive se consider omogen (n consecin media este
v

1
reprezentativ). Cu ct depete 3 cu att intensitatea variaiei crete i
colectivitatea este eterogen, iar media tinde s fie o mrime nereprezentativ.

Exemple: 1. La controlul dimensiunii (lungimea n mm.) unui eantion de

n 10 piese, s-au obinut urmtoarele rezultate: 2,31; 2,28; 2,29; 2,28; 2,32; 2,28;
2,32; 2,29; 2,31; 2,32. S se valoarea medie, dispersia, variana, abaterea medie
ptratic, precum i coeficientul de variaie.
Rezolvare: Distribuia eantionului este astfel:
xi

2,28

2,29

2,31

Ex. Tab.11.17
2,32

ni

Elementele de calcul se sistematizeaz n urmtorul tabel:

Ex. Tab.11.18
xi

ni

xi ni

xi x

x x

2,28
2,29
2,31
2,32
Total ( )

3
2
2
3
n 10

6,84
4,58
4,62
6,96
23

-0,02
-0,01
0,01
0,02
-

4 104
1 104
1 104
4 104
-

x x
i

ni

12 10 4
2 104
2 104
12 104
28 104

23
2, 30
10
Mai nti se calculeaz media statistic
mm., cu formula (11.9)
din primele 3 coloane ale tabelului, apoi se continu calculele pentru completarea
celorlalte coloane ale acestui tabel. Rezult conform (11.11) dispersia statistic (de
x

selecie) empiric:

1
28 10
4 2,8 10
6
10
, iar conform (11.12) dispersia de

1
s 2 28 10
4 3,11 10
6
9
selecie modificat (variana):
. Atunci abaterea medie
2

ptratic de selecie este, conform (11.13):

3,162 10 3 , iar abaterea

2
3
medie ptratic de selecie modificat este, conform (11.14): s s 5,578 10 .

n sfrit, conform (11.15) coeficientul de variaie este:


respectiv, conform (11.15') coeficientul de variaie modificat

1,374 103
x
,

s
2, 425 103
x
.

2. Distribuia unui eantion de firme dup cifra de afaceri lunar, X, n


milioane de lei, n anul trecut, este:
Ex. Tab.11.19
xi 1 , xi 176-178 178-180 180-182 182-184 184-186 186-188
20

ni

25

40

35

30

10

S se calculeze valoarea medie de selecie, dispersia statistic empiric


(nemodificat), abaterea medie ptratic de selecie, precum i coeficientul de
variaie.

Rezolvare: Mijloacele intervalelor vor fi


sistematizeaz n urmtorul tabel:

xi '

xi 1 xi
2 . Elementele de calcul se

Ex. Tab.11.20

xi 1 , xi

ni

xi '

xi 'ni

xi ' x

176 178
178 180
180 182
182 184
184 186
186 188

x ' x

20

177

354

-4,75

22,5625

451,25

25

179

4475

-2,75

7,5625

189,0625

40

181

7240

0,75

0,5625

22,5

35

183

6405

1,25

1,5625

54,6875

30

185

5550

3,25

10,5625

316,875

10

187

1870

5,25

27,5625

275,625

Total

160

29080

1310

x ' x

ni

Din datele primelor coloane ale tabelului, cu formula (11.9'), se calculeaz


29080
181, 75
160
media statistic
milioane lei, apoi se continu calculele pentru
celelalte coloane ale acestui tabel. Rezult conform (11.11') dispersia statistic (de
x

selecie) empiric (nemodificat):

1
1310 8,1875
160
. Atunci abaterea medie

8,1875 2,8614 milioane lei, iar,

ptratic de selecie este, conform (11.13):

15, 744 103


x
.

n fine, conform (11.15), coeficientul de variaie este:


3. Din producia unui strung ce prelucreaz piese cilindrice metalice, s-au
extras la ntmplare n = 24 uniti, crora li s-au msurat nlimile. S-au obinut
urmtoarele date:
xi

30,2

30,3

30,5

30,6

ni

10

Ex. Tab.11.21
30,7
2

S se calculeze media i dispersia de selecie (nemodificat) a nlimii


cilindrilor prelucrai.
Rezolvare: Calculele se pot sistematiza ntr-un tabel cuprinznd valorile xi ,
k

frecvenele absolute ni (n total se scrie


k

total rezult

f
i 1

x x
k

i 1

f i

i 1

), frecvenele relative
k

), produsele xi fi (totalul

x x

x x ,
valorile i

x f
i

i 1

, precum i produsele

x x

fi

ni
n (n

= valoarea medie),

f i

. La final totalul

(dispersia de selecie).
Ex. Tab.11.22

xi

ni

fi

xi fi

xi x

x x

30,2
30,3
30,5
30,6
30,7

1
4
10
7
2

0,04166
0,16667
0,41667
0,29167
0,08333

1,25813
5,03344
12,70844
8,92511
2,55823

-0,3
-0,2
0
0,1
0,2

0,09
0,04
0
0,01
0,04

0,00375
0,00667
0
0,00292
0,00333

Total

n 24

x ; 30,5

; 0, 01667

x x
i

f i

Abaterea medie absolut liniar statistic (de selec ie, nemodificat) se


definete prin:
1 k
l xi x ni
n i 1
(11.16)
pentru datele negrupate (variabile discrete) , iar pentru cele grupate xi se nlocuiete
xi

ti 1 ti
2

cu
(valoarea din mijloc a intervalului [ti 1 , ti ) , iar numrul intervalelor
(pentru care se efectueaz sumarea) este r dat de (11.5). Abaterea medie absolut
liniar este deci media aritmetic a valorilor absolute a abaterilor de la media
colectivitii.

Exemplu: S se calculeze abaterea medie absolut liniar de selecie


(nemodificat) pentru distribuia eantionului de firme din exemplul precedent ( Ex.
Tab.11.17).
Rezolvare: Calculul se sistematizeaz n urmtorul tabel (foarte asemntor
Ex. Tab.11.18):
Ex. Tab.11.23

xi 1 , xi

ni

xi '

xi 'ni

xi ' x

xi ' x

xi ' x ni

176 178
178 180
180 182
182 184
184 186
186 188

20

177

354

-4,75

4,75

95,00

25

179

4475

-2,75

2,75

68,75

40

181

7240

0,75

0,75

30,00

35

183

6405

1,25

1,25

43,75

30

185

5550

3,25

3,25

97,50

10

187

1870

5,25

5,25

52,50

Total

160

29080

385,50

Atunci, conform (11.16), abaterea medie absolut liniar de selecie


(nemodificat) este

385,5
2, 41
160
milioane lei.

Momentul statistic (de selecie) empiric iniial de ordin l se definete prin:


1 k
ml ni xi l
n i 1
,
(11.17)

unde ni reprezint frecvena absolut de apariie a valorii xi a variabilei n selecia


k

considerat i

i 1

.
xi

ti 1 ti
2
(valoarea din mijloc a

n cazul datelor grupate xi se nlocuiete cu


intervalului [ti 1 , ti ) , iar r este numrul intervalelor, dat de (11.5).

m 1
m x
Observaie: Evident 0
i 1
.
Momentul statistic (de selecie) empiric centrat de ordin l se definete prin:
l
1 k
l ni xi x
n i 1
,
(11.18)

unde ni reprezint frecvena absolut de apariie a valorii xi a variabilei n selecia


k

i x este media aritmetic de selecie.


t t
xi i 1 i
2
n cazul datelor grupate xi se nlocuiete cu
(valoarea din mijloc a
intervalului [ti 1 , ti ) , iar r este numrul intervalelor, dat de (11.5).
considerat ,

i 1

Observaii: 1. Evident 0 1 , 1 0 i 2 .
2. Momentele centrate sunt invariante la o translaie a valorilor reparti iei
statistice.
Exemple: 1. S se calculeze momentele centrate de ordinele 2, 3 i 4 pentru
selecia cu datele ordonate n Ex. Tab.11.15.

Rezolvare:
xi
80,3
81,1
81,3
81,4
81,6
81,9
82,2
82,5
82,8

Ex. Tab. 11.24


ni

xi ni

xi x

x x

1
2
3
4
3
2
4
1
4

80,3
162,2
243,9
325,6
244,8
163,8
328,8
82,5
331,2

-1,54
-0,74
-0,54
-0,44
-0,24
0,06
0,36
0,66
0,96

2,3716
0,5476
0,2916
0,1936
0,0576
0,0036
0,1296
0,4356
0,9216

x x
i

ni

2,3716
1,0952
0,8748
0,7744
0,1728
0,0072
0,5184
0,4356
3,6864

82,9
Total ( )

1
n 25

82,9
2046

1,06
-

1,1236
-

1,1236
11, 06
2

x 81,84

0, 4424

continuare Ex. Tab. 11.24

x x

x x

-3,652264
-0,405224
-0,157464
-0,085184
-0,013824
0,000216
0,046656
0,287496
0,884736
1,191016
-

ni

-3,652264
-0,810448
-0,472392
-0,340736
-0,041472
0,000432
0,186624
0,287496
3,538944
1,191016
0,112804

x x

x x

5,624487
0,299866
0,085030
0,037481
0,003318
0,000013
0,016796
0,189747
0,849346
1,262477
-

3 0,004512

ni

5,624487
0,599732
0,255090
0,149924
0,009954
0,000026
0,067184
0,189747
3,397384
1,262477
11,556005
4 0, 462240

Observaie: 2 0, 4424 0, 665131


2. S se calculeze momentele centrate de ordinele 2, 3 i 4 pentru selec ia cu
datele grupate din Ex. Tab.11.16.
Rezolvare:

xi 1 , xi

80,3;80, 7
80, 7;81,1
81,1;81,5
81,5;81,9
81,9;82,3
82,3;82,7
82, 7;83,1

Ex. Tab. 11.25


xi '

ni

fi

xi 'f i

80,5

0,08

6,440

xi ' x
-1,636

80,9

10

0,10

8,090

-1,236

81,3

14

0,14

11,382

-0,836

81,7

12

0,12

9,804

-0,436

82,1

14

0,14

11,494

-0,036

82,5

13

0,13

10,725

0,364

82,9

0,08

6,632

0,764

83,1;83,5
83,5;83,9
83,9;84,3
Total ( )

x ' x

83,3

0,07

5,831

1,164

83,7

0.09

7,533

1,564

84,1

0,05

4,205

1,964

n 100

x ' x
i

f i

2,676496

0,214112

1,527696

0,152769

0,698896

0,097845

0,190096

0,022811

0,001296

0,000181

0,132496
0,017224
0,583696
0,046696
1,354896
0,094843
2,446096
0,220149
3,857296
0,192865
2
1, 059495

x ' x

x ' x

4,378747
1,888232
0,584277
0,082882
0,000047
0,048228
0,445944
1,577099
3,825684
7,575729
-

x 82,136
Continuare Ex. Tab. 11.25

f i

x ' x

x ' x

f i

-0,350300

7,163631

0,573090

-0,188823

2,333855

0,233386

-0,081799

0,488456

0.068384

-0,009946

0,036136

0,004336

-0,000006

0,000002

0,0000003

0,006270
0,035676
0,110397
0,344311
0,378786
3 0, 241996

0,017555
0,340701
1,835743
5,983386
14,878732
-

0,002282
0,027256
0.128502
0,538505
0,743936
4 2,319677

Asimetria (skewness) poligonului frecvenelor este caracterizat de coeficientul


statistic de asimetrie, definit prin:
as

(11.19)

Dac as 0 , majoritatea valorilor repartiiei statistice se afl la dreapta mediei


aritmetice x i atunci se spune c repartiia are asimetrie pozitiv sau de dreapta.
Dac as 0 , majoritatea valorilor repartiiei statistice se afl la stnga mediei
aritmetice x i atunci se spune c repartiia are asimetrie negativ sau de stnga.

x x
Dac as 0 atunci se spune c repartiia este simetric (vezi i me
).
Exemplu: 1. Pentru repartiia cu datele date n Ex. Tab.11.15, prelucrate n Ex.

0, 004512 i 0, 665131 rezult as 0.015334 0 , deci are


Tab. 11.24: 3
asimetrie de stnga (negativ).

2. Pentru repartiia cu datele date n Ex. Tab.11.16, prelucrate n Ex.


2

Tab. 11.25: 3 0, 241996 i 1, 059495 (de unde 1, 029318 ) rezult

as 0, 221901 0 , deci are asimetrie de dreapta (pozitiv).


Boltirea sau aplatizarea (kurtosis) poligonului frecvenelor este caracterizat de
coeficientul statistic de boltire (Pearson), definit prin:

(11.20)

sau prin coeficientul statistic de exces (Fischer), definit prin:

(11.20')

3 2 0 , poligonul frecvenelor are un aspect ascuit i se spune


Dac 2
c repartiia este leptokurtic.
Dac, 2 3 2 0 , poligonul frecvenelor are un aspect turtit i se spune c
repartiia este platikurtic.
Dac

2 3 2 0 atunci se spune c repartiia este mezokurtic.

Observaie : Datorit semnificaiei lor, dispersia, dispersia modificat,


asimetria, coeficienii de boltire i de exces constituie parametrii variabilitii.
Exemplu: 1. Pentru repartiia cu datele date n Ex. Tab.11.15, prelucrate n Ex.

2,361778 3
Tab. 11.24: 4 0, 462240 i 0, 665131 rezult coeficienii 2
sau

2 0, 638222 0 , deci repartiia este platikurtic.


2. Pentru repartiia cu datele date n Ex. Tab.11.16, prelucrate n Ex. Tab. 11.25:

4 2,319677

1, 029318

rezult coeficienii

2 2, 066474 3

sau

2 0,933526 0 , deci i aceast repartiie este platikurtic.


Probleme rezolvate:
1. Se consider un eantion de 20 de clieni, care intr ntr-un magazin
alimentar, pentru a cerceta frecvena X cu care clienii fac apel la serviciile
magazinului de-a lungul unei sptmni. S-au obinut urmtoarele date de selecie
X: 1, 2, 1, 4, 3, 2, 5, 6, 1, 2, 3, 2, 3, 4, 6, 2, 4, 3, 1, 2;

Se cere:
a) distribuia empiric de selecie pentru caracteristica X ,
b) media de selecie, momentul centrat de selecie de ordinul al doilea
(dispersia) i variana pentru caracteristica X ,
c) funcia de repartiie de selecie pentru X .
Rezolvare: a) Se observ c datele de selecie pentru caracteristica X au numai
n = 6 valori distincte, deci distribuia empiric de selecie pentru X este
1 2 3 4 5 6

X
4 6 4 3 1 2 .
b) Media de selecie pentru aceast caracteristic este:
1 20
1
57
x
xk
( 4 1 6 2 4 3 3 4 1 5 2 6)
2,85

20 k 1
20
20
.
Valoarea momentului centrat de selecie de ordinul doi pentru caracteristica X
este:
1 20
1 20
( x k x) 2
( x k 2,85) 2

20 k 1
20 k 1
,
Pentru simplificarea calculelor, se poate folosi formula de translaie:
1 n
2 ( X ) ( xk a) 2 ( x a) 2
n k 1
,

2 (X )

unde a este o constant real convenabil aleas. Anume, dac pentru caracteristica X
se alege a = 3, atunci
1 20
2(X )
( xk 3) 2 (2,85 3) 2

20 k 1
1

(4 2 2 6 12 4 0 2 3 12 1 2 2 2 3 2 ) 0,15 2
20
1

47 0,0225 2,35 0,0225 2,3275


20
.
Aceast valoare este egal cu dispersia (nemodificat) de selecie
2

2 ( X ) 2,3275 . Atunci abaterea medie ptratic (nemodificat) 1, 5256 .


Valoarea dispersiei modificate de selecie (varianei) pentru caracteristica X se
calculeaz imediat, din momentul centrat de selecie de ordinul doi, anume
2
1 20
20
20 2,3275
s 2 ( X ) xi x
2 ( X )
2, 45
19 i 1
19
19
,

s s 2 X 2, 45 1,5652

Astfel se poate obine


.
c) Funcia de repartiie de selecie pentru caracteristica X este:

0, daca x 1,
4

, daca 1 x 2,
20
10
, daca 2 x 3,

20
14
F 20 ( x)
, daca 3 x 4,
20

17
20 , daca 4 x 5,

18 , daca 5 x 6,
20

1, daca x 6,
3. Se consider un eantion de 20 de clieni, care intr ntr-un magazin
alimentar, pentru cercetarea cheltuielilor lunare Y n mii lei, ale clienilor pentru
procurarea de bunuri alimentare. S-au obinut urmtoarele date de selecie:
Y: 89, 90, 101, 88, 85, 77, 102, 100, 86, 97, 76, 121, 113, 110, 96, 92, 108,
112, 103, 109.
Se cer:
d) distribuia empiric de selecie pentru caracteristica Y,
e) media de selecie, momentul centrat de selecie de ordinul al doilea
(dispersia) i dispersia modificat de selecie (variana) pentru
caracteristica Y,
f) funcia de repartiie de selecie pentru Y.
Rezolvare:. a) Se observ c toate datele de selecie sunt distincte. Aadar,
distribuia empiric de selecie a lui Y este un tablou n care pe o linie sunt trecute
toate aceste valori (eventual ordonate cresctor), iar pe linia a doua se trec frecvenele
acestor valori, care sunt toate egale cu 1. Se face o grupare a datelor de selecie
corespunztoare caracteristicii Y. Anume, prima clas cuprinde cheltuielile lunare de
la 80-89 mii lei, etc. Dup efectuarea acestei grupri, distribuia empiric de selecie a
lui Y devine (pe prima linie se scriu mijloacele intervalelor):
75 85 95 105 115 125

Y
6
3
1 .
2 4 4
b) Media aritmetic pentru aceast caracteristic este:
1 20
1
y
y k 1955 97,75

20 k 1
20
mii lei.
Dac se folosesc datele grupate pentru caracteristica Y se obine:

'

1
1
( 2 75 4 85 4 95 6 105 3 115 1 125)
1970 98,5
20
20

mii lei y .
Valoarea momentului centrat de selecie de ordinul doi pentru aceast
caracteristic (folosind datele negrupate) este:
' 2
1 20
1 20
2 (Y )
(
y

y
)

( y k 98,5) 2

k
20 k 1
20 k 1
.
Pentru simplificarea calculelor, se poate folosi formula
1 n
2 ( X ) ( xk a) 2 ( x a) 2
n k 1
,
unde a este o constant real convenabil aleas. Anume, dac pentru caracteristica Y
se consider a = 105, se obine astfel:
1 20
2 (Y )
( y k 105) 2 (98,5 105) 2
20 k 1
1

(2 30 2 4 20 2 4 10 2 6 0 2 3 10 2 1 20 2 ) 6,5 2
20
1

4500 42,25 225 42,25 182,5


20
.
Se observ c 2 (Y ) s-a calculat cu datele de selecie primare (negrupate), ceea ce
conduce la o valoare puin diferit de valoarea ce s-ar obine cnd se lucreaz cu
datele de selecie grupate.
Aceast valoare este egal cu dispersia (nemodificat) de selecie
2

2 (Y ) 182,5 . Atunci abaterea medie ptratic (nemodificat) 13,5093 .


Valoarea varianei (dispersiei modificate de selecie) pentru caracteristica Y se
calculeaz imediat, dac se cunoate momentul centrat de selecie de ordinul doi,
anume:
2
1 20
20
20 182,5
2
s (Y ) yi y
2 (Y )
192,105
19 i 1
19
19
.

s Y s 2 Y 192,105 13,86

Astfel se poate obine


mii lei.
c) Funcia de repartiie de selecie pentru caracteristica Y este:

0, daca y 75,
2

, daca 75 y 85,
20
6
, daca 85 y 95,

20
10
F 20 ( y )
, daca 95 y 105,
20

16
20 , daca 105 y 115,

19 , daca 115 y 125,


20

1, daca y 125,

Probleme propuse
1. Fie caracteristica X, care are distribuia empiric de selecie
39,25 39,50 39,75 40,00 40,25 40,50

4
2
4
2
1
2
Se cere:
a) media de selecie, momentul centrat de selecie de ordinul doi i variana;
b) funcia de repartiie de selecie.

Rspunsuri.

a)

x 39,8, 2 0,135, , s 2 0,145

0 ,daca x 39 ,50,

2
,daca 39 ,25 x 39 ,50 ,

15
6 ,daca 39 ,50 x 39 ,75
15
8
,daca 39 ,75 x 40 ,00 ,

F15 ( x) 15
12
15 ,daca 40 ,00 x 40 ,25,
14
,daca 40 ,25 x 40 ,50,

15
1,daca x 40 ,50

b)

2. S se studieze urmtoarea serie statistic:


10,0; 6,6; 9,0; 11,0; 12,0; 11,0; 14,0; 7,2; 8,9; 9,9; 9,0; 8,3; 11,0; 8,1; 7,2;
8,8; 11,0; 8,8; 8,0; 9,1; 9,4; 7,8; 8,2; 8,4; 12,0; 7,0; 9,2; 7,0; 16,0; 8,1.
a) S se determine repartiia variabilei de selecie, s se reprezinte grafic
poligonul frecvenelor i histograma.
b) S se determine parametrii tendinei centrale: media, moda, mediana.
c) S se determine parametrii variabilit ii: dispersia, dispersia modificat,
asimetria, boltirea i excesul.
Rspunsuri: b) x 9, 4 , moda M o 11,0 , mediana xme 8,95 .
2

2
c) 4,37 ( 2, 090454 ), s 4,520690 ( s 2,126191 ), as 1, 297259 0
deci seria este pozitiv asimetric (de dreapta), 3 355,525 , 4 11685, 0911 ,

20,396140 3 sau cel de exces: 2 17,396140 0 ,


coeficientul de boltire: 2
deci aceast repartiie este leptokurtic.
3. S se studieze urmtoarea serie statistic:
4,25; 4,19; 4,82; 2,25; 5,12; 3,83; 2,44; 3,21; 3,48; 3,74; 2,46; 4,42; 3,45; 3,47; 4,05;
5,52; 2,21; 2,59; 2,22; 3,00.
a) S se determine repartiia variabilei de selecie, s se reprezinte grafic
poligonul frecvenelor i histograma.
b) S se determine valoarea medie i mediana.
c) S se determine dispersia, variana, momentele centrate de ordinele 3 i 4,
coeficienii de asimetrie, de boltire i de exces.
Rspunsuri: a) Seria are 20 de valori distincte, deci egal (uniform) repartizate.
b) x 3,536 , mediana xme 3, 475 .
Observaie : Deoarece seria statistic are valori distincte cu aceeai frecven,
moda (dominanta) M0 nu este unic determinat. Pentru precizare se poate lua astfel
nct

M 0 x 3 xme x

. Aici M

3,353

2
c) 0,950574 ( 0,974974 ), s 1, 000604 ( s 1, 000302 ), 3 0, 253435
4 1.907481 , as 0, 273456 0 deci seria este pozitiv asimetric (de dreapta),

2,111 3 sau cel de exces: 2 0,889 0 , deci aceast


coeficientul de boltire: 2
repartiie este platikurtic (evident !).

4. La controlul diametrului (n mm.) unui eantion de n 25 piese, s-au obinut


urmtoarele dimensiuni : 3,24; 3,28; 3,29; 3,28; 3,32; 3,26; 3,32; 3,29; 3,31; 3,32;
3,25; 3,27; 3,30; 3,34; 3,33; 3,26; 3,27; 3,31; 3,30; 3,28; 3,29; 3,31; 3,30; 3,27; 3,28.
S se calculeze valoarea medie i dispersia acestei distribuii. Apoi s se grupeze pe 5
intervale egale aceste date de selecie i s se recalculeze valoarea medie i dispersia.
Rspunsuri:
3,24 3,25
xi
1
1
ni

x 3, 2908 ,

xi 1 , xi
ni

x 3, 2956 ,

3,26

3,27

3,28

3,29

3,30

3,31

3,32

3,33

3,34

6,31359 10 4 .

3, 24;3, 26 3, 26;3, 28 3, 28;3,30 3,30;3,32


2
2

1, 66272 104 .

3,32;3,34
5

S-ar putea să vă placă și