Sunteți pe pagina 1din 36

Capitolul 11.

Statistic matematic

1. Teoria seleciei

1. 1. Populaii statistice

Statistica matematic se definete ca fiind tiina care se ocup cu colectarea,


prezentarea, clasificarea, analiza i interpretarea cantitativ a datelor furnizate de
experien, prin aplicarea teoriei probabilitilor. Rolul statisticii matematice este de
determina informaii ct mai precise asupra repartiiei fenomenului aleator de mas
cercetat, n scopul obinerii unor previziuni asupra desfurrii viitoare a acestuia.
Populaia statistic sau colectivitatea statistic este o mulime finit sau infinit
C de elemente cercetat din punct de vedere a uneia sau mai multor proprieti
(caracteristici statistice). Un element al acestei populaii (individ din colectivitate:
persoan, obiect, fapt, fenomen, etc.) se numete unitate statistic, iar numrul
acestor uniti (indivizii acestei colectiviti), dac este finit, se va numi volumul
populaiei (colectivitii).
O colectivitate este omogen dac este constituit din elemente care sunt
susceptibile de a avea sau de a nu avea caracteristica studiat, cu o aceeai pondere.

nelese ca proprietate comun a tuturor unitilor statistice, caracteristicile


statistice pot fi:
- caracteristici cantitative sau variabile, dac pot fi msurate (cuantificate printr-un
numr),
- caracteristici calitative sau atribute, dac nu pot fi cuantificate printr-un numr
(msurate), ci prin aprecieri de tipul bun, foarte bun, mult, puin.
Valoarea numeric a unei caracteristici cantitative, care se variaz (n general)
aleator de la o unitate statistic la alta, constituie o variabil statistic X (ce ia
pentru fiecare unitate statistic o valoare numeric). Variaia nivelului unei
caracteristici de la o unitate la alta d caracteristicilor statistice caracterul de variabile
aleatoare.

Statistica matematic dispune de metode de organizare i prelucrare a


nregistrrilor datelor experimentale avnd ca scop s ncadreze fenomenul studiat n
una din clasele de fenomene care presupun o anumit lege teoretic i s determine
cel mai bine parametrii acestei legi. Aadar, problema central a statisticii matematice
este stabilirea legii de probabilitate pe care o urmeaz caracteristica (variabila
aleatoare) X . Din punct de vedere al teoriei probabilitilor, unei caracteristici a unei
colectiviti C i se asociaz o variabil aleatoare teoretic, ale crei valori
caracteristici numerice se vor numi caracteristici teoretice (media teoretic, dispersia
teoretic, .a.m.d.).

Variabilele sau caracteristicile statistice se clasific dup felul variaiei n:


a) caracteristici de tip discret cele care nu pot lua dect anumite valori n cadrul
unui anumit interval de valori (ex.: numrul copiilor dintr-o familie, numrul de
becuri care se ard dup 1000 de ore de ntrebuinare);
b) caracteristici de tip continuu cele care pot lua orice valoare n cadrul unui
anumit interval de valori (ex.: rezistena la rupere a unui fir de mtase, timpii de
defectare a unui numr fixat de piese).

Cercetarea unitilor din populaia C se poate efectua printr-o observare total


sau parial.
Cercetarea (observarea) total (care se face de exemplu sub form de
recensmnt) este o operaie complex, care de cele mai multe ori privete mai multe
caracteristici ale unitilor, pentru a realiza o analiz multilateral. Practic, o cercetare
total se recomand atunci cnd volumul populaiei C nu este prea mare, pentru a
evita cheltuieli ce pot depi avantajele concluziilor trase.
Cercetarea (observarea) parial (selectiv) se efectueaz asupra unei submulimi
(subpopulaii) S C . Submulimea S a populaiei statistice (colectivitii) cercetate
C se numete selecie (eantion sau sondaj), numrul indivizilor ce intr n selecie se
numete volumul seleciei (eantionului sau sondajului). Un eantion format din cel
mult 30 de uniti statistice poart denumirea de eantion mic, altfel eantionul este
considerat ca fiind unul mare.
De exemplu, dac este solicitat opinia unei popula ii ntr-o problem oarecare
este dificil s fie consultat ntreaga populaie i se recurge la extragerea unui
eantion (operaie de sondaj).
n cazul cnd operaia de selecie (sondaj) se efectueaz dintr-o populaie
omogen, ea se numete operaie de selecie (sondaj) simpl.
n cazul cnd populaia C nu este omogen din punct de vedere al caracteristicii
(proprietii) cercetate, dar poate fi mprit n subpopulaii Ci, fiecare n parte
omogen, ca nite straturi ale populaiei C, se va efectua aa numita operaie de
selecie (sondaj) stratificat. De exemplu, dac un anumit tip de piese sunt produse
ntr-o secie de producie, dar de diferite strunguri, se recomand ca selec ia s se
efectueze pentru fiecare strung n parte.
Un eantion ale crui uniti au fost alese la ntmplare se numete eantion
reprezentativ (aleator). Extragerea unui eantion reprezentativ se realizeaz astfel
nct elementele s aib anse egale de a fi extrase. n multe situa ii se folosesc
numere aleatoare. Astfel, dac pentru o list a populaiei iniiale de volum N : x1, x2, .
. . , xN , se aleg n numere aleatoare (dintr-un tabel de asemenea numere): k1, k2, . . . ,
x , x ,..., xkn
kn ntre 1 i N , atunci un eantion aleator de volum n este: k1 k2 . De exemplu,
dac din 10000 de piese se aleg 100 n vederea controlului de calitate, se spune c
volumul colectivitii este N 10000 , iar volumul eantionului este n 100 .
Prin sondaj, se obine un ir de valori ale variabilei aleatoare statistice X.
O operaie de selecie se numete repetat sau sondaj cu revenire (non-
exhaustiv), dac dup examinarea individului (unitii de sondaj), acesta este
reintrodus n colectivitate (acesta putnd s apar din nou n procesul de construcie al
eantionului S), n caz contrar, adic dac individul (unitatea de sondaj) examinat nu
se reintroduce n colectivitate, vom spune c operaie de selecie este nerepetat sau
sondaj fr revenire (exhaustiv).
Efectuarea sondajului fr revenire are ca schem probabilistic urna bilei
nerevenite). Aplicarea seleciei nerepetate nu are sens dect n cazul cnd volumul
populaiei C este finit, iar valorile de selecie astfel obinute sunt dependente.
Dac volumul colectivitii C este mult mai mare dect volumul seleciei,
deosebirea ntre cele dou feluri de selecie este foarte mic i atunci selecia
nerepetat poate fi considerat ca fiind selecie repetat. In cele ce urmeaz, se vor
considera numai selecii repetate.
Efectuarea sondajului cu revenire (seleciei repetate) are ca schem probabilistic
urna lui Bernoulli (urna bilei revenite). Sondajele astfel efectuate sunt echiprobabile,
iar valorile de selecie astfel obinute sunt independente.

Valorile eantionului aleator de volum n : x1 , x 2 ,..., xn , dac nu sunt toate diferite


ntre ele se ordoneaz i dup o renotare, se trec valorile distincte obinute
menionnd pentru fiecare valoare numrul de ori n care s-a obinut valoarea
respectiv. Se numesc date de selecie relative la caracteristica X , valorile distincte
obinute pentru caracteristica X privind indivizii care intr n selecie. Fie c n urma
unei selecii de volum n , efectuat dintr-o colectivitate, la indivizii creia se
urmrete caracteristica X, s-au obinut rezultatele distincte (datele de selecie) x1 , x 2
,..., xk , unde k n . n general aceste date se ordoneaz (de obicei cresctor) adic se
presupune c x1 x2 ... xk (se mai numesc serie statistic (unidimensional)).
Observaii: 1. Deoarece aceste valori difer n general de la o selecie la alta, iar
seleciile sunt alegeri ntmpltoare, datele de selecie x1 , x 2 ,..., xk se pot considera
i ca valori ale unor variabile aleatoare, respectiv X 1 , X 2 ,..., X k , care se vor numi
variabile de selecie.
2. Dac selecia este repetat, atunci variabilele de selecie X 1 , X 2 ,..., X k sunt
variabile aleatoare independente i urmeaz fiecare aceeai lege de probabilitate cu
variabila aleatoare X , adic sunt identic repartizate cu X.
x , i 1, k
Frecvena absolut a unei valori i a unei caracteristici este numrul ni
care reprezint numrul de uniti statistice ale populaiei statistice care corespund
valorii xi a variabilei statistice X.
n cazul variabilelor discrete rezultatele sunt prezentate sub forma unui tablou
(tabel statistic) de forma:

(11.1)
X x1 x2 ... xk
n n1 n2 ... nk

k
n ni
unde volumul seleciei i 1 .
Frecvena absolut cumulat cresctor (ascendent) este suma frecvenelor
j

n i
absolute corespunztoare valorilor mai mici sau egale cu valoarea xj : i 1 , jk.
xi , i 1, k a unei caracteristici este
Frecvena relativ (ponderea) a unei valori
n
f i i , i 1, k
raportul dintre frecvena absolut i volumul seleciei, adic n . Suma
k

fi 1
frecvenelor relative este egal cu 1: i 1 .
Frecvena relativ cumulat cresctor (ascendent) este suma frecvenelor
j
1 j
f i ni
n i 1 ,
relative corespunztoare valorilor mai mici sau egale cu valoarea xj : i 1

jk.
Tabloul de forma
x1 x2 ... xk
X :
f1 f 2 ... f k (11.2)
f x
unde i este frecvena relativ apariiei valorii i , se va numi distribuia empiric de
selecie (tablou de repartiie statistic) a caracteristicii X .

Observaii : 1. Uneori, n locul frecvenei relative fi , se folosete numrul de


k

x 100 f i 100
procente corespunztoare valorii , definit prin
i i i . Evident, i 1 .
2. Distribuia (repartiia) empiric a unei caracteristici variaz de la o selec ie la
alta.
1. 2. Reprezentarea grafic a datelor statistice

O reprezentare grafic a datelor statistice este sub forma poligonului


frecvenelor absolute sau relative. Acesta se obine ntr-un reper xOy, unind punctele
x ,n x,f
de coordonate i i sau i i , i 1, k , prin segmente de dreapt. El sugereaz
forma reprezentarea grafic a repartiiei probabilistice (teoretice) a caracteristicii.
Altfel, datele statistice se mai pot reprezenta sub forma unor bare verticale

(coloane). Se unesc punctele de pe axa Ox :


xi , 0 prin segmente perpendiculare pe

aceast ax, cu punctele de coordonate


xi , ni sau xi , fi , i 1, k . i aceste
segmente (bare, batoane), de o lime mai mult sau mai puin pronunat, sugereaz
forma grafic a repartiiei probabilistice (teoretice) a caracteristicii (variabilei
aleatoare).

Exemplu: Ca rezultat a unui sondaj de s-au obinut numerele:


3, 2, 1, 3, 5, 3, 2 (7 numere). S se scrie tablourile frecvenelor absolute i a
celor relative, apoi s se reprezinte grafic poligoanele acestor frecvene i tot acestea
prin bare verticale (coloane).
Rezolvare: Valorile distincte a acestui sondaj (de volum n 7 ) se scriu n
ordine cresctoare: x1 3 (cu frecvena absolut n1 3 ), x2 1 (cu frecvena
absolut n2 1 ), x3 2 (cu frecvena absolut n3 2 ), x4 5 (cu frecvena
absolut n4 1 ). Suma acestor frecvene absolute este egal cu volumul sondajului:
n1 n2 n3 n4 7 . Frecvenele relative sunt cele de mai sus, mpr ite la n 7 :

n1 3 n 1 n 2 n 1
f1 , f 2 2 , f3 3 , f 4 4
n 7 n 7 n 7 n 7 . Suma acestor frecvene relative

este evident, egal cu 1: f1 f 2 f3 f 4 1 . Tablourile acestor frecvene sunt:


Ex. Tab. 11.1
Valorile -3 -1 +2 +5
Frecvenele
absolute 3 1 2 1

Ex. Tab.11.2
Valorile -3 -1 +2. +5
Frecvenele 3 1 2 1
relative 7 7 7 7

Poligonul frecvenelor absolute este:

Fig.11.1
iar cel al frecvenelor relative (se deosebete de primul doar prin mrimea unit ii
(scalei de reprezentare) pe axa ordonatelor Oy ) este:

Fig.11.1'

Graficul cu bare verticale (coloane) corespunztoare frecvenelor absolute este:

Fig.11.2

iar cele ale frecvenelor relative:


Fig.11.2'
Dac n locul frecvenei relative f i , se folosete numrul de procente
k

i 100
corespunztoare valorii xi , definit prin i 100 f i (unde i 1 ), pentru
reprezentarea grafic a datelor statistice se folosete deseori diagrama circular de
structur n forma unui disc circular mprit n sectoare proporionale cu
procentajele.

Exemplu: Distribuia pe grupe de vrst a unui eantion de indivizi dintr-o


localitate, observai la un moment dat, se prezint astfel:

Ex. Tab.11.3
Grupa de vrst Tnr Adult n vrst
Efectivul 17 61 22
Frecv. relativ 17% 61% 22%

Structura pe grupe de vrst pentru eantionul observat se reprezint grafic


prin urmtoarea diagram de structur circular:

Fig.11.3
Dac X este variabil de tip continuu, aceasta se transform ntr-o variabil
discret n scopul prelucrrii mai uoare a datelor, n felul urmtor: se face o grupare
a datelor de selecie n clase (clasificare statistic) prin mprirea intervalului ( a, b)
, unde X ia valori, n subintervalele date prin
a t0 t1 t2 L tk b.

n acest caz datele se grupeaz ntr-un tablou de forma:


(11.3)
X [t0,t1) [t1,t2) ... [tk-1,tk)
n n1 n2 ... nk

unde ni este numrul valorilor variabilei statistice aflate n intervalul [ti-1 , ti) i se
k
n ni
numete frecvena absolut. La fel i 1 este volumul seleciei.
ni
fi , i 1, k
Frecvena relativ corespunztoare ntervalului [ti-1 , ti) este n i
reprezint numrul valorilor variabilei statistice aflate n intervalul [ti-1 , ti) mprit la
volumul seleciei.
Analog se introduc i celelalte noiuni de frecven absolut cumulat, frecven
relativ cumulat.

Distribuia empiric de selecie a variabilei statistice continue X va fi de aceeai


form ca i n cazul discret:
x x ... xk
X : 1 2
f1 f 2 ... f k
t t
x xi i 1 i ,
unde, i este valoarea central a intervalului ( 2 mijlocul intervalului), iar
f i este frecvena datelor de selecie din intervalul (clasa) [ti 1 , ti ).

O reprezentare grafic a datelor statistice, n cazul datelor grupate pe


subintervale, este sub forma diagrame cu linii (histogram). Histograma (diagrama
liniar) se construiete sub forma unor dreptunghiuri lipite, cu baza pe axa Ox,
limea lor fiind egal la baz cu mrimea intervalului de variaie respectiv. nl imea
dreptunghiului va fi egal sau proporional cu frecvena corespunztoare fiecrui
interval de variaie. Pentru reprezentarea grafic, unitile de msur pe axele de
coordonate nu trebuie s fie neaprat egale.
Histograma arat forma de repartiie, densitatea de reparti ie a frecven elor i
gradul de asimetrie.
Din histograma frecvenelor se poate obine poligonul frecvenelor.

Exemplu: S se construiasc histograma distribuiei date prin urmtorul tabel


al frecvenelor absolute:
Ex. Tab.11.4
Intervale [-8,-3) [-3,2) [2,7) [7,12) [12.17]
Frecv. abs. 3 8 15 6 2
Rezolvare: Sunt 34 date de selecie, deci frecvenele relative sunt: 3/34, 8/34,
15/34, 6/34, 2/34. Histograma este format din 5 dreptunghiuri lipite, cu bazele
constituite din cele 5 intervale (n acest caz, egale), iar nl imile propor ionale cu
frecvenele.

Fig.11.4
Din histograma frecvenelor se obine poligonul frecvenelor unind mijloacele
segmentelor ce mrginesc superior dreptunghiurile histogramei.

Observaie: De multe ori este necesar o grupare a datelor de selecie chiar


pentru cazul cnd caracteristica X este de tip discret. De exemplu,
dac selecia x1 , x 2 ,..., x n este de volum mare i se obine n urma msurrii unor
mrimi fizice, tehnice, economice de care depinde evoluia unor procese sau
fenomene.
Se procedeaz astfel:
m min xi M max xi
- se noteaz cu i i i (11.4)
- se divide intervalul [m, M] ntr-un numr de r de subintervale de aceeai lungime.
Pentru determinarea numrului (ntreg) de subintervale egale de grupare se
recomand a fi folosit formula lui H. A. Sturges:
lg n
r 1 log 2 n 1 1 3,322 lg n
lg 2 (11.5)
Se numete pasul de histogram numrul
M m
h
r (11.6)
Intervalele de grupare sunt astfel
I1 = [m, m + h) , I2 = [m + h, m + 2h) , . . . , Ir = [m + (r 1)h, M] (11.7)
- Se noteaz cu n1 numrul acelor valori xi care sunt situate n intervalul I1, cu n2
numrul acelor valori xi care sunt situate n intervalul I2, . . . , cu nr numrul acelor
valori xi care sunt situate n intervalul Ir.

Histograma asociat seleciei x1, x2, . . . , xn este reuniunea dreptunghiurilor Dk =


Ik [0, nk] (produs cartezian), pentru 1 k r.
Deci datele seleciei x1, x2, . . . , xn se grupeaz n r grupe i exist posibilitatea de
vizualizare (reprezentare grafic): se alege un sistem ortogonal de axe xOy, cu
intervalul [m, M] plasat pe axa Ox (cu originea O , eventual n punctul m). Pe
intervalul I1 se construiete dreptunghiul de nlime n1 i baza de lungime h, pe
intervalul I2 se construiete dreptunghiul de nlime n2 i baza de lungime h, etc.

Exemplu: n urma unui control a dimensiunii diametrului a 200 de bile de


rulmeni s-au obinut urmtoarele rezultate (n mm.):
6,34 ; 6,21 ; 6,36 ; 6,48 ; 6,39 ; 6,45 ; 6,27 ; 6,50 ; 6,44 ; 6,60 ; 6,34 ; 6,56 ; 6,38 ;
6,54 ; 6,26 ; 6,62 ; 6,41 ; 6,46 ; 6,40 ; 6,48 ; 6,50 ; 6,28 ; 6,39 ; 6,56 ; 6,35 ; 6,44 ;
6,54 ; 6,37 ; 6,60 ; 6,38 ; 6,51 ; 6,29 ; 6,58 ; 6,36 ; 6,45 ; 6,54 ; 6,33 ; 6,49 ; 6,41 ;
6,46 ; 6,32 ; 6,56 ; 6,36 ; 6,51 ; 6,13 ; 6,41 ; 6,54 ; 6,31 ; 6,39 ; 6,57 ; 6,34 ; 6,60 ;
6,37 ; 6,46 ; 6,24 ; 6,45 ; 6,43 ; 6,40 ; 6,48; 6,42 ; 6,52 ; 6,41 ; 6,49 ; 6,30 ; 6,28 ; 6,51
6,35 ; 6,40 ; 6,48 ; 6,27 ; 6,36 ; 6,43 ; 6,50 ; 6,29 ; 6,46 ; 6,37 ; 6,47 ; 6,29 ; 6,45 ;
6,30 ; 6,47 ; 6,23 ; 6,52 ; 6,37 ; 6,53 ; 6,33 ; 6,39 ; 6,57 ; 6,38 ; 6,44 ; 6,58 ; 6,35 ;
6,41 ; 6,46 ; 6,22 ; 6,45 ; 6,34 ; 6,42 ; 6,50 ; 6,43 ; 6,31 ; 6,51 ; 6,38 ; 6,54 ; 6,23 ;
6,55 ; 6,41 ; 6,53 ; 6,28 ; 6,47 ; 6,39 ; 6,42 ; 6,45 ; 6,40 ; 6,56 ; 6,44 ; 6,33 ; 6,48 ;
6,43 ; 6,52 ; 6,50 ; 6,58 ; 6,20 ; 6,34 ; 6,47 ; 6,60 ; 6,37 ; 6,49 ; 6,36 ; 6,53 ; 6,38 ;
6,54 ; 6,15 ; 6,61 ; 6,46; 6,27 ; 6,59 ; 6,45 ; 6,51 ; 6,43 ; 6,46 ; 6,53 ; 6,40 ; 6,30 ; 6,52
6,35 ; 6,59 ; 6,32 ; 6,47 ; 6,55 ; 6,34 ; 6,43 ; 6,57 ; 6,22 ; 6,42 ; 6,58 ; 6,34 ; 6,49 ;
6,68 ; 6,30 ; 6,44 ; 6,64 ; 6,29 ; 6,53 ; 6,36 ; 6,59 ; 6,38 ; 6,40 ; 6,63 ; 6,67 ; 6,35 ;
6,44 ; 6,55 ; 6,39 ; 6,43 ; 6,65 ; 6,28 ; 6,42 ; 6,57 ; 6,44; 6,47 ; 6,42 ; 6,52 ; 6,31 ; 6,37
6,55 ; 6,66 ; 6,25 ; 6,43 ; 6,59 ; 6,40; 6,61 ; 6,41 ; 6,47 ; 6,20 ; 6,35 ; 6,45 ; 6,49 ; 6,32
6,53 ; 6,42 .
S se grupeze pe intervale egale aceste date de selec ie i apoi s se construiasc
histograma asociat.

m min xi 6,13 M max xi 6, 69


Rezolvare: i , iar i

Pentru determinarea numrului (ntreg) de subintervale de grupare se folosete


formula lui H. A. Sturges (11.5):
r 1 3,322 lg 200 1 3,322 2,301 1 7, 644 8
M m 6, 69 6,13
h 0, 07
Pasul de histogram este r 8 i atunci intervalele
de grupare sunt: I1 = [6,13; 6,20), I2 = [6,20; 6,27), I3 = [6,27; 6,34), I4 = [6,34;
6,41), I5 = [6,41; 6,48), I6 = [6,48; 6,55), I7 = [6,55; 6,62), I8 = [6,62; 6,69].

Se numr datele cuprinse n fiecare interval i se alctuie te urmtorul tabel


al frecvenelor absolute:

Ex. Tab.11.5
Intervalu I1 I2 I3 I4 I5 I6 I7 I8
l
Frecven 2 9 24 43 51 37 26 8
a

Histograma:

Fig.11.5

Observaie: Se poate alege scara la care se figureaz histograma, astfel nct


suma ariilor dreptunghiurilor histogramei s fie egal cu 1. Histograma astfel scalat
se poate suprapune peste graficul unei densiti de probabilitate n vederea intuirii
acesteia.

Pentru datele de selecie x1 , x 2 ,..., xn grupate n subintervale [ti-1 , ti), i 1, k ,


unde ni este numrul valorilor variabilei statistice aflate n intervalul [ti-1 , ti),
frecvena absolut cumulat cresctor i este suma frecvenelor absolute
i
t t
xi i 1 i i n j
corespunztoare valorilor mai mici sau egale cu valoarea 2 : j 1
,
i k , iar frecvena relativ cumulat cresctor i este suma frecvenelor relative
ti 1 ti
xi
corespunztoare valorilor mai mici sau egale cu valoarea 2 :
i
1 i
i f j n j
j 1 n j 1 , i k . Atunci o reprezentare grafic a acestor date i frecvene
cumulate este sub forma ogivei sau poligonului frecvenelor cumulate. Acesta se

obine ntr-un reper xOy, unind punctele de coordonate


xi , i , i 1, k prin
segmente de dreapt. El sugereaz forma reprezentarea grafic a funciei de reparti ie
probabilistic (teoretic) a caracteristicii.

Exemplu: Pentru distribuia cu date grupate din exemplul precedent

Ex.Tab.11.6
Intervalu I1 I2 I3 I4 I5 I6 I7 I8
l
Frecven 2 9 24 43 51 37 26 8
a

unde : I1 = [6,13; 6,20), I2 = [6,20; 6,27), I3 = [6,27; 6,34), I4 = [6,34; 6,41), I5 =


[6,41; 6,48), I6 = [6,48; 6,55), I7 = [6,55; 6,62), I8 = [6,62; 6,69], se consider
mijloacele segmentelor i frecvenele cumulate, scrise n urmtorul tabel:
Ex. Tab.11.7
xi 6,165 6,235 6,305 6,375 6,445 6,515 6,585 6,655
Frecven
e 2 11 35 78 129 166 192 200
absolute
cumulate
Frecven 11/20
e relative 1/100 0 7/40 39/100 129/20 83/100 24/25 1
cumulate 0

Graficul ogivei (poligonului frecvenelor cumulate) este:


Fig.11.6

Se numete funcie de repartiie empiric asociat unei caracteristici


(variabile aleatoare) X , dup extragerea unei selecii de volum n: (x1, x2, . . . , xn),

funcia Fn : ,
numarul _ valorilor _ x j x kx
Fn ( x)
n n (11.8)
(kx este deci numrul de observaii n care au aprut valori ale variabilei aleatoare
(caracteristicii) X, mai mici dect x dat).
Observaie: Funcia empiric de repartiie este analogul funciei de repartiie
a unei variabile aleatoare discrete finite.

Exemplu: Funcia de repartiie empiric pentru distribuia de selecie

1 2 3 4
X :
35 29 36 9
(deci de volum n 100 ) este dat prin:
0, daca x 1,
0,35, daca 1 x 2,


F100 ( x ) 0,55, daca 2 x 3,
0,91, daca 3 x 4,

1, daca x 4.
Reprezentarea grafic a acestei funcii este:
Fig.11.7

Teorema fundamental a statisticii matematice (Glivenko): Funcia de


repartiie empiric asociat unei caracteristici X i unei selecii de volum n converge
(n probabilitate) ctre o funcie F ( x) , care este funcia teoretic de repartiie
(distribuie) corespunztoare legii de probabilitate caracterizat de variabila aleatoare
X.
Mai precis: Fie o populatie statistic i X variabila aleatoare ataat ei cu funcia
F ( x) p X x
de repartitie . Pentru o selecie de volum n: (x1, x2, . . . , xn) se
Fn
construiete ca mai sus funcia de repartiie empiric . Atunci


n
0 : p F ( x) Fn 0
.
1 n
Zn Yi
n i 1 , unde Yi este
Demonstraia folosete inegalitatea lui Cebev pentru variabila
x x Y1 , Y2 ,..., Yn
variabila aleatoare ce ia valoarea 1 dac i i 0 n caz contrar. Variabilele sunt
independente (seleciile sunt independente) i au distribuia simpl Bernoulli.


Observaie: Cu ct n este mai mare, cu att Fn ( x) aproximeaz mai corect pe
F ( x) .
1. 3. Caracteristici statistice ale datelor experimentale

Dat funcia real h : , se numete funcie de selecie sau statistic,


n

variabila aleatoare Z n h X 1 , X 2 , , X n , unde X 1 , X 2 ,..., X n sunt variabilele de


selecie. Valoarea numeric z n h x1 , x 2 , , x n se numete valoarea funciei de
selecie, unde x1 , x 2 ,..., x n sunt datele de selecie. Valoarea funciei de selecie
(statisticii) devine cunoscut atunci cnd variabilele de selecie sunt nlocuite prin
valorile de selecie.

Dac pentru variabilele discrete rezultatele sunt prezentate sub forma unui
tablou de forma (11.1), atunci media (aritmetic) de selecie (sperana matematic)
este:
1 k
ni xi
x
n i 1 , (11.9)
unde ni reprezint frecvena absolut de apariie a valorii xi a variabilei n selecia
k

n i n
considerat i i 1 .

Observaie: Dac n selecia de volum n, valorile xi apar o singur dat (cu


frecvena absolut ni = 1), atunci media de selecie este media aritmetic simpl:
1 k
x xi
n i 1
(spre deosebire de formula (11.9) care este media aritmetic ponderat: valorile xi cu
ponderile ni ).
t t
xi i 1 i
n cazul datelor grupate xi se nlocuiete cu 2 (valoarea din mijloc a
intervalului [ti 1 , ti ) deci:
1 r t t
ni i 1 i
x
n i 1 2 , (11.9')
unde r este numrul intervalelor, dat de (11.5).

Proprieti: 1. Media aritmetic este cuprins ntre cea mai mic i cea mai

mare valoare a repartiiei statistice: xmin x xmax .


2. Au loc relaiile: x a x a i ax ax , a (translaia i scalarea
mediei de selecie).

Exemple: 1. Valoarea lucrrilor efectuate de o echip de muncitori la un punct


de lucru, pe parcursul a 7 zile se prezint astfel (n mii de lei): 200, 250, 500, 750,
1000, 1250, 1500. S se calculeze valoarea medie zilnic a lucrrilor efectuate de
aceast echip.
Rezolvare: n cazul de fa este o medie aritmetic simpl:
200 250 500 750 1000 1250 1500 5550
x 792,85
7 7 mii lei.

2. S se calculeze media de selecie a distribu iei date ca exemplu n


tabelul 11.1:
Valorile -3 -1 +2 +5
Frecvenele
absolute 3 1 2 1
Rezolvare: Calculul mediei dup formula (11.9) se efectueaz mai uor,
completnd tabelul urmtor: Ex. Tab.11.8
xi ni xi ni
-3 3 -9
-1 1 -1
2 2 4
5 1 5
Total ( ) 7 -1

1
x 0,143
Media aritmetic de selecie este: 7

3. Distribuia dup volumul vnzrilor zilnice (milioane lei) a unit ilor


comerciale dintr-un jude, n anul trecut, se prezint astfel:

Ex. Tab.11.9
Volumul vnzrilor (intervale) 0-10 10-20 20-30 30-40
Numrul unitilor comerciale 50 20 10 5

S se calculeze nivelul mediu al vnzrilor zilnice.

Rezolvare: Elementele de calcul se sistematizeaz ntr-un tabel cuprinznd


xi 1 xi
xi 1 , xi , frecvenele absolute ni , mijloacele intervalelor xi ' 2
intervalele i
k k

ni n x 'n
produsele xi 'ni . n josul tabelului se scriu totalurile
i i
i 1 i i 1 . Astfel:
Ex. Tab.11.10
x ,x
Intervalele i 1 i
ni xi ' xi 'ni
0-10 50 5 250
10-20 20 15 300
20-30 10 25 250
30-40 5 35 175
Total 85 - 975
975
x 11, 47
Media aritmetic este 85 milioane lei.

4. Distribuia unui eantion de firme de anumit profil, dup profitul net, n mii
lei, n anul trecut, este:
Ex. Tab.11.11
Profit net 0-2 2-4 4-6 6-8 8-10
Numr firme 40 50 90 15 5

S se determine valoarea medie a profitului net anual.

Rezolvare: Calculele se pot sistematiza ntr-un tabel cuprinznd intervalele


k

xi 1 , xi , n i n
frecvenele absolute ni (n total se scrie i 1 ), frecvenele relative
k
ni xi 1 xi
fi
n (n total rezult
f i 1 xi '
2
i 1 ), mijloacele intervalelor i produsele
k

xi 'f i . n final totalul x 'f i i x


i 1 (valoarea medie).
Ex. Tab.11.12
Profit net ni fi xi ' xi 'f i
0-2 40 0,200 1 0,200
2-4 50 0,250 3 0,750
4-6 90 0,450 5 2,250
6-8 15 0,075 7 0,525
8-10 5 0,025 9 0,225
Total n 200 1 - 3,950
Deci valoarea medie a profitului net anual a firmelor de acest profil este de 3,95
mii de lei.
5. Pentru timpul de deplasare zilnic la serviciu s-au nregistrat urmtoarele
date, pentru un eantion de 200 de persoane:
Ex. Tab.11.13
Timpul de
deplasare 0-30 30-60 60-90 90-120 120-150 150 i
zilnic (min.) peste
Numr de 25 50 60 45 15 5
persoane

S se calculeze media acestui timp.

Rezolvare: Dearece cifrele sunt destul de mari, calculul se poate simplifica,


folosind proprietile de translaie i scalarea a mediei de selecie. Astfel n tabelul de
xi 1 xi
xi '
calcul se transleaz valorile pentru mijloacele intervalelor 2 cu o valoare
central (aici xi ' a xi ' 75 ), apoi se scaleaz aceste valori pentru o simplificare a
xi ' a xi ' 75

lor (aici k 30 ); n fine irul frecvenelor se simplific prin c.m.m.d.c. (aici
ni ni

c 5 ). Se calculeaz media simplificat din sumele tabelului, apoi prin metoda
mersului invers se deduce media de selecie cerut.

Ex. Tab.11.14
xi 1 , xi ni xi ' xi ' a xi ' a ni xi ' a ni

k c k c
0-30 25 15 -60 -2 5 -10
30-60 50 45 -30 -1 10 -10
60-90 60 75 0 0 12 0
90-120 45 105 30 1 9 9
120-150 15 135 60 2 3 6
150+ 5 165 90 3 1 3
Total 200 - - - 40 -2

2 2
x simplif .
x x simplif . k a 30 75 73,5
Astfel 40 40 minute.
Pentru datele negrupate (variabil discret) moda seleciei sau dominanta este
valoarea observat xi care are frecvena ni maxim.
Pentru datele grupate moda este orice valoare din clasa cu cel mai mare numr
de observaii. Deci moda seleciei este din intervalul modal Ik , ce corespunde
dreptunghiului cel mai nalt al histogramei (pentru care frecvena corespunztoare nk
este maxim). Pentru precizare, moda este aleas egal cu valoarea M o , care mparte

intervalul modal Ik n raportul


nk nk 1 : nk nk 1 . Mai exact, dac intervalul
I k xk 1 , xk
, iar nk 1 i nk 1 sunt frecvenele (mai mici) corespunztoare
M o xk 1 nk nk 1

intervalelor I k 1 , respectiv I k 1 I
(adiacente lui ):
k xk M o nk nk 1 .

Exemple: 1. Pentru distribuia de selecie dat ca exemplu n tabelul 11.1,


moda (dominanta) este valoarea -3 (care apare de 3 ori).
2. Pentru distribuia de selecie dat ca exemplu n tabelul 11.4, intervalul

modal este
2, 7 , caruia i este atribuit frecvena absolut 15. Mai precis, M o
M o 2 15 8 31
Mo 1,9375
satisface 7 M o 15 6 , de unde 16 .

Dac mai multe valori (subgrupei) sunt la fel de nalte i detaate de celelalte,
se spune c selecia este plurimodal.

Exemple: 1. Selecia de 25 de piese, msurate n mm. are 10 variante


distincte de lungime, cu urmtoarele frecvene:
Ex. Tab.11.15
xi 80,3 81,1 81,3 81,4 81,6 81,9 82,2 82,5 82,8 82,9
ni 1 2 3 4 3 2 4 1 4 1

Frecvena maxim nregistrat este 4, ntlnit la trei variante. Deci seria de


variante distincte ale caracteristicii observate este o selecie trimodal (cu trei
dominante).
2. Selecia de 100 de piese, msurate n mm. grupate n 10 intervale de
lungime are urmtoarele frecvene:
Ex. Tab.11.16
80,3- 80,7- 81,1- 81,5- 81,9- 82,3- 82,7- 83,1- 83,5- 83,9-
xi 1 , xi 80,7 81,1 81,5 81,9 82,3 82,7 83,1 83,5 83,9 84,3
ni 8 10 14 12 14 13 8 7 9 5

Frecvena maxim nregistrat este 14, ntlnit la dou intervale (grupe). Deci
selecia dat este bimodal (cu dou dominante).

Mediana unei selecii este valoarea xme care mparte irul ordonat de date n
dou pri egale: numrul de valori xi xme este egal cu numrul de valori xi xme .
Mai exact, dac irul are 2k + 1 uniti, atunci mediana coincide cu unitatea de ordin
k + 1, dac irul are 2k uniti, mediana este media aritmetic a unitilor de ordin k i
k+1; dac exist mai multe asemenea valori pentru xme , atunci ele formeaz un
interval i mediana este prin definiie mijlocul acestui interval.
Exemple: 1. Pentru irul impar de date: 2,5; 3,7; 1,4; 0,2; 5,4; 8,9; 4,2 irul
ordonat este 0,2; 1,4; 2,5; 3,7; 4,2; 5,4; 8,9. Deci 2k + 1 = 7, de unde k = 3 i unitatea
de ordin k +1 = 4 este 3,7 care este mediana.
2. Pentru irul par de date: 10; 40; 20; 15; 22; 35 irul ordonat cresctor este 10;
15; 20; 22; 35; 40. Deci cei doi termeni centrali ai seriei sunt 20 i 22, iar media
aritmetic a lor este 21, care este mediana xme .

Observaie : Datorit semnificaiei lor, media, moda, mediana constituie


parametrii tendinei centrale.

Amplitudinea statistic este diferena dintre cea mai mare valoare M xmax i
cea mai mic valoare m xmin a repartiiei statistice:
A M m xmax xmin (11.10)
n cazul variabilelor aleatoare continue, amplitudinea este diferen a dintre
limita superioar a ultimului interval i limita inferioar a primului.

Exemplu: Pentru selecia dat prin Ex. Tab.11.15, amplitudinea statistic este
A 82,9 80,3 2, 6 , iar pentru selecia dat prin Ex. Tab.11.16, aceasta este

A 84,3 80,3 4 mm.

Dispersia statistic (de selecie) empiric (nemodificat) se definete prin:


1 k

2
xi x ni
2

n i 1 (11.11)
pentru datele negrupate (variabile discrete), unde ni reprezint frecvena absolut de
k

n i n
apariie a valorii xi a variabilei n selecia considerat, i 1 i x este media
aritmetic de selecie. Dispersia este deci media aritmetic a ptratelor abaterilor de la
media colectivitii.
t t
xi i 1 i
n cazul datelor grupate xi se nlocuiete cu 2 (valoarea din mijloc a
intervalului [ti 1 , ti ) , iar numrul intervalelor (pentru care se efectueaz sumarea) este
2
1 r ti 1 ti
2 x ni
2

r dat de (11.5), deci: n i 1 (11.11')
De multe ori, este mai avantajos, a folosi drept dispersie statistic, mrimea
numit dispersie de selecie modificat (variana):


k
1 2
s2 xi x ni
n 1 i 1 (11.12)
t t
xi i 1 i
pentru datele negrupate , iar pentru cele grupate xi se nlocuiete cu 2

(valoarea din mijloc a intervalului [ti 1 , ti ) , iar numrul intervalelor (pentru care se
efectueaz sumarea) este r dat de (11.5).

Observaie: Dispersiile astfel definite caracterizeaz mprtierea valorilor

s
2
2
repartiiei statistice n jurul mediei. Dac este mic atunci datele difer unele

s
2
2
de altele foarte putin, dac este mare, datele difer foarte mult.

2
Abaterea medie ptratic de selecie (nemodificat) este: (11.13)

Abaterea medie ptratic de selecie modificat este: s s2 (11.14)



v
Coeficientul de variaie este: x (11.15)
s
v
respectiv coeficientul de variaie modificat : x
(11.15')
Observaie : Coeficientul de variaie exprim intensitatea variaiei i se definete
1
v
n domeniul numerelor pozitive. Dac 3 se consider c intensitatea variaiei este
redus i selecia de valori pozitive se consider omogen (n consecin media este
1
reprezentativ). Cu ct depete 3 cu att intensitatea variaiei crete i
colectivitatea este eterogen, iar media tinde s fie o mrime nereprezentativ.

Exemple: 1. La controlul dimensiunii (lungimea n mm.) unui eantion de


n 10 piese, s-au obinut urmtoarele rezultate: 2,31; 2,28; 2,29; 2,28; 2,32; 2,28;
2,32; 2,29; 2,31; 2,32. S se valoarea medie, dispersia, variana, abaterea medie
ptratic, precum i coeficientul de variaie.

Rezolvare: Distribuia eantionului este astfel:


Ex. Tab.11.17
xi 2,28 2,29 2,31 2,32
ni 3 2 2 3

Elementele de calcul se sistematizeaz n urmtorul tabel:

Ex. Tab.11.18
xi ni
x x x x
2 2
xi ni xi x ni
i i

2,28 3 6,84 -0,02 4 104 12 104


2,29 2 4,58 -0,01 1 104 2 104
2,31 2 4,62 0,01 1 104 2 104
2,32 3 6,96 0,02 4 104 12 10 4
Total ( ) n 10 23 - - 28 104

23
2,30x
Mai nti se calculeaz media statistic 10 mm., cu formula (11.9)
din primele 3 coloane ale tabelului, apoi se continu calculele pentru completarea
celorlalte coloane ale acestui tabel. Rezult conform (11.11) dispersia statistic (de
2 1
4 2,8 10
28 10 6
selecie) empiric: 10 , iar conform (11.12) dispersia de
1
4 3,11 10
s 2 28 10 6
selecie modificat (variana): 9 . Atunci abaterea medie
2
ptratic de selecie este, conform (11.13): 3,162 10 3 , iar abaterea
3
medie ptratic de selecie modificat este, conform (11.14): s s 5,578 10 .
2


v 1,374 10 3
n sfrit, conform (11.15) coeficientul de variaie este: x ,
s
v 2, 425 103
respectiv, conform (11.15') coeficientul de variaie modificat x .

2. Distribuia unui eantion de firme dup cifra de afaceri lunar, X, n


milioane de lei, n anul trecut, este:
Ex. Tab.11.19
xi 1 , xi 176-178 178-180 180-182 182-184 184-186 186-188
ni 20 25 40 35 30 10
S se calculeze valoarea medie de selecie, dispersia statistic empiric
(nemodificat), abaterea medie ptratic de selecie, precum i coeficientul de
variaie.

xi 1 xi
xi '
Rezolvare: Mijloacele intervalelor vor fi 2 . Elementele de calcul se
sistematizeaz n urmtorul tabel:

Ex. Tab.11.20
xi 1 , xi ni xi ' xi 'ni xi ' x x ' x
i
2
x ' x
i
2
ni
176 178 20 177 354 -4,75 22,5625 451,25
178 180 25 179 4475 -2,75 7,5625 189,0625
180 182 40 181 7240 0,75 0,5625 22,5
182 184 35 183 6405 1,25 1,5625 54,6875
184 186 30 185 5550 3,25 10,5625 316,875
186 188 10 187 1870 5,25 27,5625 275,625
Total 160 - 29080 - - 1310

Din datele primelor coloane ale tabelului, cu formula (11.9'), se calculeaz


29080
x 181, 75
media statistic 160 milioane lei, apoi se continu calculele pentru
celelalte coloane ale acestui tabel. Rezult conform (11.11') dispersia statistic (de
2 1
1310 8,1875
selecie) empiric (nemodificat): 160 . Atunci abaterea medie

ptratic de selecie este, conform (11.13): 8,1875 2,8614 milioane lei, iar,


v 15, 744 103
n fine, conform (11.15), coeficientul de variaie este: x .
3. Din producia unui strung ce prelucreaz piese cilindrice metalice, s-au
extras la ntmplare n = 24 uniti, crora li s-au msurat nlimile. S-au obinut
urmtoarele date:
Ex. Tab.11.21
xi 30,2 30,3 30,5 30,6 30,7
ni 1 4 10 7 2

S se calculeze media i dispersia de selecie (nemodificat) a nlimii


cilindrilor prelucrai.

Rezolvare: Calculele se pot sistematiza ntr-un tabel cuprinznd valorile xi ,


k
ni
n i n fi
frecvenele absolute ni (n total se scrie i 1 ), frecvenele relative n (n
k k

fi 1 x f x
), produsele xi fi (totalul
i i
total rezult i 1 i 1 = valoarea medie),

x x x x
2 2
xi x , i i f i
valorile , precum i produsele . La final totalul

x x
k 2 2
i f i
i 1 (dispersia de selecie).
Ex. Tab.11.22
xi fi
x x x x
2 2
xi ni fi xi x f i
i i

30,2 1 0,04166 1,25813 -0,3 0,09 0,00375


30,3 4 0,16667 5,03344 -0,2 0,04 0,00667
30,5 10 0,41667 12,70844 0 0 0
30,6 7 0,29167 8,92511 0,1 0,01 0,00292
30,7 2 0,08333 2,55823 0,2 0,04 0,00333

Total n 24 1 x ; 30,5 - - 2
; 0, 01667

Abaterea medie absolut liniar statistic (de selec ie, nemodificat) se


definete prin:
1 k
l xi x ni
n i 1 (11.16)
pentru datele negrupate (variabile discrete) , iar pentru cele grupate xi se nlocuiete
ti 1 ti
xi
cu (valoarea din mijloc a intervalului [ti 1 , ti ) , iar numrul intervalelor
2
(pentru care se efectueaz sumarea) este r dat de (11.5). Abaterea medie absolut
liniar este deci media aritmetic a valorilor absolute a abaterilor de la media
colectivitii.
Exemplu: S se calculeze abaterea medie absolut liniar de selecie
(nemodificat) pentru distribuia eantionului de firme din exemplul precedent ( Ex.
Tab.11.17).

Rezolvare: Calculul se sistematizeaz n urmtorul tabel (foarte asemntor


Ex. Tab.11.18):

Ex. Tab.11.23
xi 1 , xi ni xi ' xi 'ni xi ' x xi ' x xi ' x ni
176 178 20 177 354 -4,75 4,75 95,00
178 180 25 179 4475 -2,75 2,75 68,75
180 182 40 181 7240 0,75 0,75 30,00
182 184 35 183 6405 1,25 1,25 43,75
184 186 30 185 5550 3,25 3,25 97,50
186 188 10 187 1870 5,25 5,25 52,50
Total 160 - 29080 385,50

Atunci, conform (11.16), abaterea medie absolut liniar de selecie


385,5
l 2, 41
(nemodificat) este 160 milioane lei.

Momentul statistic (de selecie) empiric iniial de ordin l se definete prin:


1 k
ml ni xi l
n i 1 , (11.17)
unde ni reprezint frecvena absolut de apariie a valorii xi a variabilei n selecia
k

n i n
considerat i i 1 .
ti 1 ti
xi
n cazul datelor grupate xi se nlocuiete cu 2 (valoarea din mijloc a
intervalului [ti 1 , ti ) , iar r este numrul intervalelor, dat de (11.5).
m 1 m x
Observaie: Evident 0 i 1 .
Momentul statistic (de selecie) empiric centrat de ordin l se definete prin:
1 k

l
l ni xi x
n i 1 , (11.18)
unde ni reprezint frecvena absolut de apariie a valorii xi a variabilei n selecia
k

n i n
considerat , i 1 i x este media aritmetic de selecie.
t t
xi i 1 i
n cazul datelor grupate xi se nlocuiete cu 2 (valoarea din mijloc a
intervalului [ti 1 , ti ) , iar r este numrul intervalelor, dat de (11.5).
2
1 , 1 0 i 2 .
Observaii: 1. Evident 0
2. Momentele centrate sunt invariante la o translaie a valorilor reparti iei
statistice.

Exemple: 1. S se calculeze momentele centrate de ordinele 2, 3 i 4 pentru


selecia cu datele ordonate n Ex. Tab.11.15.

Rezolvare: Ex. Tab. 11.24


xi ni
x x x x
2 2
xi ni xi x ni
i i

80,3 1 80,3 -1,54 2,3716 2,3716


81,1 2 162,2 -0,74 0,5476 1,0952
81,3 3 243,9 -0,54 0,2916 0,8748
81,4 4 325,6 -0,44 0,1936 0,7744
81,6 3 244,8 -0,24 0,0576 0,1728
81,9 2 163,8 0,06 0,0036 0,0072
82,2 4 328,8 0,36 0,1296 0,5184
82,5 1 82,5 0,66 0,4356 0,4356
82,8 4 331,2 0,96 0,9216 3,6864
82,9 1 82,9 1,06 1,1236 1,1236
Total ( ) n 25 2046 - - 11, 06
2
x 81,84 0, 4424

continuare Ex. Tab. 11.24

x x x x x x x x
3 3 4 4
i i ni i i ni
-3,652264 -3,652264 5,624487 5,624487
-0,405224 -0,810448 0,299866 0,599732
-0,157464 -0,472392 0,085030 0,255090
-0,085184 -0,340736 0,037481 0,149924
-0,013824 -0,041472 0,003318 0,009954
0,000216 0,000432 0,000013 0,000026
0,046656 0,186624 0,016796 0,067184
0,287496 0,287496 0,189747 0,189747
0,884736 3,538944 0,849346 3,397384
1,191016 1,191016 1,262477 1,262477
- 0,112804 - 11,556005
3 0,004512 4 0, 462240

Observaie: 2 0, 4424 0, 665131

2. S se calculeze momentele centrate de ordinele 2, 3 i 4 pentru selec ia cu


datele grupate din Ex. Tab.11.16.

Rezolvare: Ex. Tab. 11.25


xi 1 , xi xi ' ni fi xi 'f i xi ' x
80,3;80, 7 80,5 8 0,08 6,440 -1,636
80, 7;81,1 80,9 10 0,10 8,090 -1,236
81,1;81,5 81,3 14 0,14 11,382 -0,836
81,5;81,9 81,7 12 0,12 9,804 -0,436
81,9;82,3 82,1 14 0,14 11,494 -0,036
82,3;82,7 82,5 13 0,13 10,725 0,364
82, 7;83,1 82,9 8 0,08 6,632 0,764
83,1;83,5 83,3 7 0,07 5,831 1,164
83,5;83,9 83,7 9 0.09 7,533 1,564
83,9;84,3 84,1 5 0,05 4,205 1,964
Total ( ) - n 100 1 x 82,136 -
Continuare Ex. Tab. 11.25

x ' x x ' x x ' x x ' x x ' x x ' x


2 2 3 3 4 4
i i f i i i f i i i f i
2,676496 0,214112 - -0,350300 7,163631 0,573090
4,378747
1,527696 0,152769 - -0,188823 2,333855 0,233386
1,888232
0,698896 0,097845 - -0,081799 0,488456 0.068384
0,584277
0,190096 0,022811 - -0,009946 0,036136 0,004336
0,082882
0,001296 0,000181 - -0,000006 0,000002 0,0000003
0,000047
0,132496 0,017224 0,048228 0,006270 0,017555 0,002282
0,583696 0,046696 0,445944 0,035676 0,340701 0,027256
1,354896 0,094843 1,577099 0,110397 1,835743 0.128502
2,446096 0,220149 3,825684 0,344311 5,983386 0,538505
3,857296 0,192865 7,575729 0,378786 14,878732 0,743936
- 2
1, 059495 - 3 0, 241996 - 4 2,319677

Asimetria (skewness) poligonului frecvenelor este caracterizat de coeficientul


statistic de asimetrie, definit prin:
3
as 3
(11.19)
Dac as 0 , majoritatea valorilor repartiiei statistice se afl la dreapta mediei
aritmetice x i atunci se spune c repartiia are asimetrie pozitiv sau de dreapta.
Dac as 0 , majoritatea valorilor repartiiei statistice se afl la stnga mediei
aritmetice x i atunci se spune c repartiia are asimetrie negativ sau de stnga.
x x ).
Dac as 0 atunci se spune c repartiia este simetric (vezi i me

Exemple: 1. Pentru repartiia cu datele date n Ex. Tab.11.15, prelucrate n Ex.

Tab. 11.24: 3
0, 004512 i 0, 665131 rezult as 0.015334 0 , deci are
asimetrie de stnga (negativ).
2. Pentru repartiia cu datele date n Ex. Tab.11.16, prelucrate n Ex.
2
Tab. 11.25:
3 0, 241996 i 1, 059495 (de unde 1, 029318 ) rezult

as 0, 221901 0 , deci are asimetrie de dreapta (pozitiv).

Boltirea sau aplatizarea (kurtosis) poligonului frecvenelor este caracterizat de


coeficientul statistic de boltire (Pearson), definit prin:
4
2 4
(11.20)
sau prin coeficientul statistic de exces (Fischer), definit prin:
4
2 4
3
(11.20')

Dac 2
3 2 0 , poligonul frecvenelor are un aspect ascuit i se spune
c repartiia este leptokurtic.

Dac, 2
3 2 0 , poligonul frecvenelor are un aspect turtit i se spune c
repartiia este platikurtic.

Dac 2 3 2 0 atunci se spune c repartiia este mezokurtic.

Observaie: Datorit semnificaiei lor, amplitudinea statistic, dispersia,


dispersia modificat, asimetria, coeficienii de boltire i de exces constituie
parametrii variabilitii.

Exemple: 1. Pentru repartiia cu datele date n Ex. Tab.11.15, prelucrate n Ex.


2,361778 3
Tab. 11.24: 4 0, 462240 i 0, 665131 rezult coeficienii 2

sau
2 0, 638222 0 , deci repartiia este platikurtic.
2. Pentru repartiia cu datele date n Ex. Tab.11.16, prelucrate n Ex. Tab. 11.25:
4 2,319677 i 1, 029318 rezult coeficienii 2 2, 066474 3 sau
2 0,933526 0 , deci i aceast repartiie este platikurtic.

Probleme rezolvate:

1. Se consider un eantion de 20 de clieni, care intr ntr-un magazin


alimentar, pentru a cerceta frecvena X cu care clienii fac apel la serviciile
magazinului de-a lungul unei sptmni. S-au obinut urmtoarele date de selecie
X: 1, 2, 1, 4, 3, 2, 5, 6, 1, 2, 3, 2, 3, 4, 6, 2, 4, 3, 1, 2;
Se cere:
a) distribuia empiric de selecie pentru caracteristica X ,
b) media de selecie, momentul centrat de selecie de ordinul al doilea
(dispersia) i variana pentru caracteristica X ,
c) funcia de repartiie de selecie pentru X .

Rezolvare: a) Se observ c datele de selecie pentru caracteristica X au numai


n = 6 valori distincte, deci distribuia empiric de selecie pentru X este
1 2 3 4 5 6
X
4 6 4 3 1 2 .
b) Media de selecie pentru aceast caracteristic este:
1 20 1 57
x
20 k 1
xk
20
( 4 1 6 2 4 3 3 4 1 5 2 6)
20
2,85
.
Valoarea momentului centrat de selecie de ordinul doi pentru caracteristica X
este:
1 20 1 20
2 (X ) k
20 k 1
( x x ) 2
( xk 2,85) 2
20 k 1 ,
Pentru simplificarea calculelor, se poate folosi formula de translaie:
1 n
2 ( X ) ( xk a) 2 ( x a) 2
n k 1 ,
unde a este o constant real convenabil aleas. Anume, dac pentru caracteristica X
se alege a = 3, atunci
1 20
2(X )
20 k 1
( xk 3) 2 (2,85 3) 2

1
(4 2 2 6 12 4 0 2 3 12 1 2 2 2 3 2 ) 0,15 2
20
1
47 0,0225 2,35 0,0225 2,3275
20 .
Aceast valoare este egal cu dispersia (nemodificat) de selecie
2
2 ( X ) 2,3275 . Atunci abaterea medie ptratic (nemodificat) 1, 5256 .

Valoarea dispersiei modificate de selecie (varianei) pentru caracteristica X se


calculeaz imediat, din momentul centrat de selecie de ordinul doi, anume
20 2,3275
1 20

20
2
s 2 ( X ) xi x 2 ( X ) 2, 45
19 i 1 19 19 ,
s s 2 X 2, 45 1,5652
Astfel se poate obine .
c) Funcia de repartiie de selecie pentru caracteristica X este:
0, daca x 1,
4
, daca 1 x 2,
20
10
, daca 2 x 3,
20
14
F 20 ( x) , daca 3 x 4,
20
17
20 , daca 4 x 5,

18 , daca 5 x 6,
20

1, daca x 6,

3. Se consider un eantion de 20 de clieni, care intr ntr-un magazin


alimentar, pentru cercetarea cheltuielilor lunare Y n mii lei, ale clienilor pentru
procurarea de bunuri alimentare. S-au obinut urmtoarele date de selecie:
Y: 89, 90, 101, 88, 85, 77, 102, 100, 86, 97, 76, 121, 113, 110, 96, 92, 108,
112, 103, 109.
Se cer:
d) distribuia empiric de selecie pentru caracteristica Y,
e) media de selecie, momentul centrat de selecie de ordinul al doilea
(dispersia) i dispersia modificat de selecie (variana) pentru
caracteristica Y,
f) funcia de repartiie de selecie pentru Y.

Rezolvare:. a) Se observ c toate datele de selecie sunt distincte. Aadar,


distribuia empiric de selecie a lui Y este un tablou n care pe o linie sunt trecute
toate aceste valori (eventual ordonate cresctor), iar pe linia a doua se trec frecvenele
acestor valori, care sunt toate egale cu 1. Se face o grupare a datelor de selecie
corespunztoare caracteristicii Y. Anume, prima clas cuprinde cheltuielile lunare de
la 80-89 mii lei, etc. Dup efectuarea acestei grupri, distribuia empiric de selecie a
lui Y devine (pe prima linie se scriu mijloacele intervalelor):
75 85 95 105 115 125
Y
2 4 4 6 3 1 .
b) Media aritmetic pentru aceast caracteristic este:
1 20 1
y
20 k 1
y k 1955 97,75
20 mii lei.
Dac se folosesc datele grupate pentru caracteristica Y se obine:
' 1 1
y ( 2 75 4 85 4 95 6 105 3 115 1 125) 1970 98,5
20 20
mii lei y .
Valoarea momentului centrat de selecie de ordinul doi pentru aceast
caracteristic (folosind datele negrupate) este:
1 20 1 20

' 2
2 (Y ) ( y k y ) ( y k 98,5) 2
20 k 1 20 k 1 .
Pentru simplificarea calculelor, se poate folosi formula
1 n
2 ( X ) ( xk a) 2 ( x a) 2
n k 1 ,
unde a este o constant real convenabil aleas. Anume, dac pentru caracteristica Y
se consider a = 105, se obine astfel:
1 20
2 (Y ) ( y k 105) 2 (98,5 105) 2
20 k 1
1
(2 30 2 4 20 2 4 10 2 6 0 2 3 10 2 1 20 2 ) 6,5 2
20
1
4500 42,25 225 42,25 182,5
20 .
Se observ c 2 (Y ) s-a calculat cu datele de selecie primare (negrupate), ceea ce
conduce la o valoare puin diferit de valoarea ce s-ar obine cnd se lucreaz cu
datele de selecie grupate.
Aceast valoare este egal cu dispersia (nemodificat) de selecie
2
2 (Y ) 182,5 . Atunci abaterea medie ptratic (nemodificat) 13,5093 .
Valoarea varianei (dispersiei modificate de selecie) pentru caracteristica Y se
calculeaz imediat, dac se cunoate momentul centrat de selecie de ordinul doi,
anume:
20 182,5
1 20
20
2
s (Y ) yi y
2
2 (Y ) 192,105
19 i 1 19 19 .
s Y s 2 Y 192,105 13,86
Astfel se poate obine mii lei.
c) Funcia de repartiie de selecie pentru caracteristica Y este:
0, daca y 75,
2
, daca 75 y 85,
20
6
, daca 85 y 95,
20
10
F 20 ( y ) , daca 95 y 105,
20
16
20 , daca 105 y 115,

19 , daca 115 y 125,
20

1, daca y 125,

Probleme propuse

1. Fie caracteristica X, care are distribuia empiric de selecie

39,25 39,50 39,75 40,00 40,25 40,50


X
2 4 2 4 2 1
Se cere:
a) media de selecie, momentul centrat de selecie de ordinul doi i variana;
b) funcia de repartiie de selecie.

2
x 39,8, 2 0,135, , s 2 0,145
Rspunsuri. a)
0 ,daca x 39 ,50,
2
,daca 39 ,25 x 39 ,50 ,
15
6 ,daca 39 ,50 x 39 ,75
15
8
,daca 39 ,75 x 40 ,00 ,
F15 ( x) 15
12
15 ,daca 40 ,00 x 40 ,25,
14
,daca 40 ,25 x 40 ,50,
15
1,daca x 40 ,50

b)
2. S se studieze urmtoarea serie statistic:
10,0; 6,6; 9,0; 11,0; 12,0; 11,0; 14,0; 7,2; 8,9; 9,9; 9,0; 8,3; 11,0; 8,1; 7,2;
8,8; 11,0; 8,8; 8,0; 9,1; 9,4; 7,8; 8,2; 8,4; 12,0; 7,0; 9,2; 7,0; 16,0; 8,1.
a) S se determine repartiia variabilei de selecie, s se reprezinte grafic
poligonul frecvenelor i histograma.
b) S se determine parametrii tendinei centrale: media, moda, mediana.
c) S se determine parametrii variabilit ii: dispersia, dispersia modificat,
asimetria, boltirea i excesul.

Rspunsuri: b) x 9, 4 , moda M o 11,0 , mediana xme 8,95 .


2
c) 4,37 ( 2, 090454 ), s 4,520690 ( s 2,126191 ), as 1, 297259 0
2

deci seria este pozitiv asimetric (de dreapta), 3 355,525 , 4 11685, 0911 ,

coeficientul de boltire: 2
20,396140 3 sau cel de exces: 2 17,396140 0 ,
deci aceast repartiie este leptokurtic.

3. S se studieze urmtoarea serie statistic:


4,25; 4,19; 4,82; 2,25; 5,12; 3,83; 2,44; 3,21; 3,48; 3,74; 2,46; 4,42; 3,45; 3,47; 4,05;
5,52; 2,21; 2,59; 2,22; 3,00.
a) S se determine repartiia variabilei de selecie, s se reprezinte grafic
poligonul frecvenelor i histograma.
b) S se determine valoarea medie i mediana.
c) S se determine dispersia, variana, momentele centrate de ordinele 3 i 4,
coeficienii de asimetrie, de boltire i de exces.

Rspunsuri: a) Seria are 20 de valori distincte, deci egal (uniform) repartizate.


b) x 3,536 , mediana xme 3, 475 .
Observaie : Deoarece seria statistic are valori distincte cu aceeai frecven,
moda (dominanta) M0 nu este unic determinat. Pentru precizare se poate lua astfel

nct

M 0 x 3 xme x . Aici M 0 3,353
2
c) 0,950574 ( 0,974974 ), s 1, 000604 ( s 1, 000302 ), 3 0, 253435
2

4 1.907481 , as 0, 273456 0 deci seria este pozitiv asimetric (de dreapta),

coeficientul de boltire: 2
2,111 3 sau cel de exces: 2 0,889 0 , deci aceast
repartiie este platikurtic (evident !).
4. La controlul diametrului (n mm.) unui eantion de n 25 piese, s-au obinut
urmtoarele dimensiuni : 3,24; 3,28; 3,29; 3,28; 3,32; 3,26; 3,32; 3,29; 3,31; 3,32;
3,25; 3,27; 3,30; 3,34; 3,33; 3,26; 3,27; 3,31; 3,30; 3,28; 3,29; 3,31; 3,30; 3,27; 3,28.
S se calculeze valoarea medie i dispersia acestei distribuii. Apoi s se grupeze pe 5
intervale egale aceste date de selecie i s se recalculeze valoarea medie i dispersia.

Rspunsuri:
xi 3,24 3,25 3,26 3,27 3,28 3,29 3,30 3,31 3,32 3,33 3,34
ni 1 1 2 3 4 3 3 3 3 1 1

2
x 3, 2908 , 6,31359 10 4 .

xi 1 , xi 3, 24;3, 26 3, 26;3, 28 3, 28;3,30 3,30;3,32 3,32;3,34


ni 2 5 7 6 5

2
x 3, 2956 , 1, 66272 104 .

S-ar putea să vă placă și