Sunteți pe pagina 1din 16

ELEMENTE DE STATISTIC MATEMATIC

1. Introducere
Statistica este disciplina care se ocup de culegerea, nregistrarea, gruparea,
analiza i interpretarea datelor referitoare la un anumit fenomen, precum i cu
formularea unor previziuni privind comportarea viitoare a acestuia.
Activitatea de culegere i nregistrare a datelor referitoare la un fenomen face
obiectul statisticii descriptive sau statisticii formale.
Activitatea de grupare, de analiz i de interpretare a datelor, precum i
formularea unor previziuni privind comportarea viitoare a unui fenomen reprezint
obiectul statisticii matematice.

2. Elemente de limbaj n statistic. Date statistice


Definiii:
Mulimea pe care se realizeaz un studiu statistic se numete populaie
statistic.

Elementele componente ale unei populaii statistice se numesc uniti statistice


sau indivizi.

Numrul total de uniti statistice se numete efectivul total al populaiei


statistice.

O parte a populaiei statistice aleas special pentru a fi studiat se numete


eantion.

Proprietatea sau indicatorul n funcie de care se cerceteaz o populaie statistic


se numete caracteristic sau variabil statistic.

Exemplu:
S presupunem studiul privind nlimile unui grup de elevi. n acest caz:
-populaia statistic o constituie mulimea elevilor grupului;
- uniti statistice (indivizii) sunt elevii grupului;
-efectivul total al populaiei este numrul tuturor elevilor;
- caracteristic sau variabil statistic este nal imea;

O caracteristic se numete caracteristic calitativ dac nu poate fi msurat


(valoarea ei nu se exprim numeric).
Exemplu: starea civil, calificativul, profesia.

O caracteristic se numete cantitativ dac se poate exprima numeric.


Exemplu: media general, salariul, nl imea.

O caracteristic cantitativ se numete discontinu sau discret dac nu poate


lua dect valori numerice izolate.

O caracteristic cantitativ care poate lua orice valoare dintr-un interval de


lungime finit sau infinit se numete caracteristic cantitativ continu.

Intervalele n care o caracteristic ia valori se numesc grupe sau clase de


valori.
Exemplu: nlimea este o caracteristic cantitativ continu.

3. Culegerea, nregistrarea i clasificarea datelor statistice


Se consider studiul efectuat asupra unui grup de elevi dup naltime (exprimat
n centimetri). Rezultatele msuratorii sunt ordonate crescator, consemnnd c i elevi
au o anumit nlime.

Tabelul
1

Cm

Nr. elevi

Cm

Nr. elevi

Cm

Nr. elevi

Cm

Nr. elevi

Cm

Nr. elevi

155

164

168

174

182

160

165

170

175

183

161

166

172

178

162

167

173

180

Observaii:

Cu ajutorul acestor clasificri a datelor se pot obine mai uor nite concluzii
privind particularitile acestui grup:
- nalimea cea mai mic (155cm);
- naltimea cea mai mare (183cm);
- numrul de indivizi care ntrunesc aceeai caracteristic;
- care este nalimea dominat (167cm i 170cm) i altele.

Rezultatele analizei statistice pot fi obinute uneori mai rapid dac se practic o alt
grupare a datelor statistice, i anume n clase de valori.
Tabelul
2

Clase de valori (n cm)

Nr. elevi

[155, 160)

[160, 165)

[165, 170)

[170, 175)

[175, 180)

[180, 185)

Observaii:

Cu ajutorul acestui tabel de date se pot ob ine cu uurin a diferite informa ii


despre grupul de studiu, ca de exemplu:
- sunt 30 de elevi;
- cei mai muli elevi au nalimea n clasa de valori [165, 170) i [170, 175),
urmnd cei cu nalimea n clasa de valori [160, 165) etc.;
- 3 elevi au nlimea n clasa de valori [175, 180) i reprezinta 10% din efectivul
populaiei statistice;
- exist 26 elevi cu nlimea sub 170 cm etc.

Valoarea absolut a diferenei extremitilor unei clase de valori se numete


amplitudinea clasei. Amplitudinea se stabilete de cel care realizeaz studiul.
O clas de valori este n general un interval semideschis [a, b), excepie
fcnd eventual ultima clas care poate fi luat de forma [c, d].

4. Serii statistice. Frecvene


S considerm o populaie statistic cu efectivul total N i notm cu X
caracteristica sau variabila statistic cu valorile x1, x2, ..., xp, iar cu ni numrul de uniti
statistice corespunztoare valorii xi a variabilei statistice,
Mulimea tuturor perechilor (xi, ni) ,

, formeaz o serie statistic cu o

singur variabil.
Numrul ni de uniti statistice corespunztoare valorii xi a caracteristicii sau a
unei clase de valori a caracteristicii se numete frecvena absolut a valorii xi,
respectiv frecvena absolut a clasei de valori considerate.
Rezult c n1 + n2 + ... + np = N.
Modul de prezentare a unei serii statistice cu o variabil statistic este sub forma
unui tabel orizontal sau vertical, care cuprinde valorile variabilei statistice sau clasele de
valori i frecvenele absolute corespunztoare:
Valorile caracteristice
Frecvena absolut

x1 x2 ... xp
n1 n2 ... np

Sau:
Clase de valori
Frecvena absolut

[x1, x2) ... [xp1, xp)


n1 ...
np

Se spune c aceste tabele definesc distribuia sau repartiia statistic a variabilei


statistice.
Aadar, tabelele 1 si 2 reprezint distribu ia statistic a nl imii unui grup de
elevi.
n studiul unei serii statistice sunt interesante concluziile ob inute prin cumularea
frecvenelor absolute ale valorilor variabilei.
Astfel, raportndu-ne la tabelul 2, se poate spune c n grup sunt cel mult 16
elevi cu nlimea mai mic dect 170 cm, sau exist 6 elevi cu nl imea mai mare sau
egal cu 175 cm.

n general, putem defini urmtoarele tipuri de frecvene absolute:


Frecvena absolut cumulat cresctoare a valorii xi a variabilei
statistice este suma tuturor frecvenelor absolute ale valorilor variabilei
care apar pn la xi, inclusiv.
Se noteaz:
i

N i nk , 1 i p
k 1

Frecvena absolut cumulat descresctoare a valorii xi a variabilei


statistice este suma tuturor frecvenelor absolute ale valorilor variabilei
care apar de la xi, inclusiv.
Se noteaz:
p

N' i nk , 1 i p
k i

Analog se definesc frecvenele absolute cumulate ale claselor de


valori ale variabilelor.

Exemple:
Pentru seria statistic dat n tabelul 1 avem:0
N3 = 1 + 2 = 3 (3 elevi au nlimea mai mic sau egal cu 160).
N11 = 2 + 1 + 1 + 2 + 1 + 1 +1 +1 = 10 (10 de elevi au nl imea de cel pu in 172 cm).
Pentru seria statistic dat n tanelul 2 avem:
N3 = 1 + 7 + 8 = 16 (16 elevi au nlimea mai mica dect 170).
N5 = 3 + 3 = 6 (6 elevi au nlimea de cel puin 175).

Raportul dintre frecvena absolut a unei valori xi sau a unei clase de


valori a variabilei statistice i efectivul total al populaiei se numete
frecvena relativ a valorii xi, respectiv frecvena relativ a clasei de
valori.
Se noteaz:
n
fi i , 1 i p
N
Exemplu:
-

Pentru seria statistic dat n tanelul 2 avem:


frecvena relativ a clasei de valori [165, 170) este f3 = 8/30 = 26,(6) %, ceea
ce arat c 26,(6)% din efectivul grupului sunt elevi cu nlimea n intervalul
[165, 170).

Observaii:
1. 0 f1 1,

1ip

2. f1 + f2 + ... + fp = 1
3. Frecvena relativ se poate exprima ca raport procentual.
Se numete frecven relativ cumulat cresctoare a valorii xi a
variabilei statistice, suma tuturor frecvenelor relative ale valorilor care
apar pn la xi, inclusiv.
Se noteaz:
i

Fi f k , 1 i p
k 1

Se numete frecven relativ cumulat descresctoare a valorii xi a


variabilei statistice, suma tuturor frecvenelor relative ale valorilor care
apar de la xi, inclusiv.
Se noteaz:

F' i f k , 1 i p
k i

Analog se definesc frecvenele relative cumulate ale claselor de valori.

Observaii:

(Legtura dintre frecvenele cumulate i frecven ele absolute

cumulate).
1. Fi = f1 + f2 + ... + fi

2. Fi = fi + fi+1 + ... + fp =
Exemplu:
Raportndu-ne la Tabelul 2, toate tipurile de frecven e studiate sunt
reprezentate n urmatorul tabel:
Tabelul
3

Frecvena .
Frecvena
.absolut . absolut ...
nlimea .....(ni)
cumulat
.....(xi)
cresctoare
.....(Ni)

Frecvena
Frecvena
absolut ..
Frecvena .. relativ
.
cumulat
.....relativ
.cumulat
descresc- ......(fi)
cresctoare
toare (Ni)
......(Fi)

[155,160)

30

[160,165)

29

[165,170)

16

22

[170,175)

24

14

[175,180)

27

[180,185)

30

Frecvena
relativ
..
.cumulat
descresctoare (Fi)

=3,(3)%

=3,(3)%

=100%

=23,(3)%

=26,(6)%

=96,(6)%

=26,(6)%

=53,(3)%

=73,(3)%

=26,(6)%

=80%

=46,(6)%

=10%

=90%

=20%

=10%

=100%

=10%

Interpretarea datelor din linia a V-a este:


- 3 elevi din cei 30 au nlimea cuprinsa intre 175cm si 180cm;
- 27 elevi din cei 30 au nlimea sub 180cm;
- 6 elevi din cei 30 au nlimea pese 175cm;
- 10% din efectivul total au nlimea cuprinsa intre 175cm si 180cm;
- 90% din efectivul total au nlimea sub 180cm;
- 20% sin efectivul total au nlimea peste 175cm;

4.Reprezentarea grafic a datelor statistice


Culegerea, nregistrarea i gruparea datelor statistice legate de studiul
statistic al unui fenomen sunt urmate de analiza, interpretarea i formularea unor
previziuni privind comportarea viitoare a acestuia.
O modalitate de realizare a analizei si interpretarii datelor statistice o costituie
reprezentarea grafic a acesotra, reprezentare care permite vizualizarea datelor
statistice n scopul formrii unei imagini intuitive i imediate asupra fenomenului studiat.
Graficul unei serii statistice se numete diagram structural.

a. Reprezentarea grafic folosind diagrama circular


Cercul de structur sau diagrama circular este un cerc a crui arie reprezint
efectivul total al populaiei statistice (100%). Valorile variabile se reprezint prin
sectoare de cerc ale cror arii sunt proportionale cu frecven ele relative ale valorilor
variabilei. Cu ajutorul regulii de trei simpl se determin msura unghiului la centru
corespunztor fiecrei frecvene.
Exemplu:
Se consider datele din Tabelelul 3. Cu ajutorul regulii de trei simpl se ob ine
urmtoarea coresponden ntre frecvena relativ f i i msura unghiului la centru
corespunztor:
fi
no

3,(3)%
12o

23,(3)%
84o

26,(6)%
96o

26,(6)%
96o

10%
36o

10%
36o

Diagrama circular asociat acestei serii statistice cu variabil calitativ:

b. Reprezentarea grafic folosind dreptunghiul de structur


Pentru desenarea dreptunghiului de structur se consider un reper cartezian
n plan. Axa verical va fi axa frecvenelor relative f i ale valorilor xi ale variabilei
statistice.
Cu baza pe axa vertical se deseneaz un dreptunghi cu nlimea de 100 de
uniti. Se divizeaz dreptunghiul pe linii orizontale obtinnd dreptunghiuri cu ariile
proporionale cu frecvenele fi.

Exemplu:
Pentru seria statistic cu variabil calitativ din tabelul 3 se obine dreptunghiul
de structur urmtor:

c. Reprezentarea grafica prin batoane


Diagrama structural cu ajutoarul batoanelor se obine astfel:
se alege un reper cartezian n plan
pe axa orizontal se reprezint valorile xi ale variabilei statistice;
pe axa vertical se reprezint frecvenele absolute n i sau frecvenele
relative fi coresunztoare valorilor xi, 1 i p;
segmentul cu extremitile n punctele cu coordonatele (x i, 0), (xi, ni),
respectiv (xi, fi) reprezint batonul corespunztor valorii xi.
Exemplu:
Pentru seria statistic reprezentat n tabelul 2, se consider urmtoarea figur:

Observaie:

Alegerea unitii de msur pe fiecare ax se face astfel nct concluziile


s se obin ct mai uor.

d. Reprezentarea grafica prin coloane sau benzi

Acest tip de reprezentare grafic folosete dreptunghiuri cu limi egale i


lungimile proporionale cu frecvenele absolute sau cu frecvenele relative ale valorilor
variabilei statisticei.
Dac dreptunghiurile sunt asezate vertical, reprezentarea grafic se numete
diagram prin coloane, iar dac sunt aezate orizontal reprezentarea grafic se
numete diagram prin benzi.

Exemplu:
Pentru seria statistic reprezentat n tabelul 2, se consider urmtoarea figur:

Reprezentare grafic prin benzi:

Reprezenare grafic prin coloane:

e. Poligonul frecventelor
O modalitate de vizualizare a datelor unei serii statistice este poligonul
frecvenelor care permite reprezentarea grafic sub forma unei curbe.
Fie seria statistic (xi, ni) cu variabil cantitativ discret. Pentru a construi
poligonul frecvenelor absolute se unesc printr-o linie poligonal punctele de
coordonate (xi, ni). Dac se unesc punctele de coordonate (x i, fi) se obine poligonul
frecvenelor relative.
Exemplu:
Pentru seria statistic reprezentat n tabelul 2, se consider urmtoarea figur:

f. Histograma
Se consider o serie statistic cu variabil cantitativ continu i clasele de valori
de amplitudini egale: distribuia unui grup de elevi dup nlimea exprimat in
centimetri:
Pentru a reprezenta grafic datele statistice ale acestei serii statistice se
procedeaz astfel:
- se alege un sistem cartezian de coordonate;
- pe axa orizontal se iau segmente de lungimi egale cu amplitudinea claselor de
valori;
- se construiesc pe aceste segmente dreptunghiuri cu nlimea proporional cu
frecvenele absolute sau frecvenele relative corespunztoare claselor de valori.
Graficul seriei statistice cu variabil cantitativ continu se numete histogram.

Exemple:
Considerndu-se datele statistice din Tabelul 2, este dat urmtorul tabel:

Tabelul
4

nlimea

Numr de tineri

Ni

Ni

[155,160)

30

[160,165)

29

[165,170)

16

22

[170,175)

24

14

[175,180)

27

[180,185)

30

Histograma seriei din Tabelul 4 este dat n figura urmtoare:

Linia poligonal determinat de centrele claselor de valori luate pe bazele


superioare ale dreptunghiurilor histogramei formeaz poligonul frecvenelor absolute
ale valorilor variabilei statistice. Astfel, poligonul frecvenelor absolute pentru seria
statistic din Tabelul 4 este dat n figura:

De asemenea, analiza unei serii statistice cu variabil cantitativ continu, pe


cale grafic se poate face folosind poligonul frecvenelor absolute cumulate.

Poligonul frecvenelor absolute cumulate cresctoare se obine unind


succesiv, printr-o linie poligonal, punctele de coordonate (x i+1, Ni), unde xi+1 este
extremitatea dreapt a unei clase de valori [x i, xi+1), iar Ni este frecvena absolut
cumulat cresctoare a clasei respective. La aceste puncte se adaug i punctul
(m, 0) unde m este limita inferioar a primei clase de valori.

Poligonul frecvenelor absolute cumulate descresctoare se obine unind


sccesiv, printr-o linie poligonal, punctele de coordonate (x i, Ni), unde xi este
extremitatea stng a unei clase de valori [x i, xi+1), iar Ni este frecvena absolut
cumulat descresctoare corespunztoare clasei, la care se adaug punctul (M,
0) unde M este limita superioar a ultimei clase.

5. Interpretarea datelor statistice prin parametri de poziie


Analiza i interpretarea datelor statistice legate de un studiu statistic s-a realizat
pn la acest moment cu ajutorul frecvenelor i a graficelor statistice. Cu ajutorul
acestor caracteristici se poate observa cu uurin variabilitatea mrimilor care se obin
ca rezultat al unor msurtori.
Pentru o serie statistic este interesant de gsit acea mrime care survine cel
mai des , acea mrime este cea mai reprezentativ pentru toat seria.
O astefle de mrime se numete indicator sau parametru de poziie deoarece
arat poziia elementelor principale ale seriei n cadrul acesteia.
Reprezentativitatea unor astfel de mrimi este dat de gradul de concentrare a
datelor statistice n jurul lor.

a. Valoarea medie a unei serii statistice

Fie seria statistic (xi, ni), 1 i p asociat unui studiu statistic asupra unei
populaii statistice din efectivul total N, cu variabil cantitativ discret X.
Definiie:
Se numete valoare medie sau media variabilei statistice X, media
aritmetic a tuturor valorilor variabilei statistice calculat pentru toate
unitile populaiei statistice.
Se noteaz:
X=

... .

(1)

Exemplu:
S calculm media variabilei statistice a seriei statistice dat in Tabelul 1.
Avem x =
=

= 150,2(3).

Dac variabila statistic X este cantitativ de tip continuu, atunci n locul


valorilor xi din formula (1) se vor lua mediile aritmetice ale extremitilor claselor
de valori (valorile centrale ale claselor de valori).

Observaii:
o

Valoarea medie a variabilei statistice este un parametru de poziie global


care indic tendina central a valorilor ei.
Diferena xi x reprezint abaterea de la medie a valorii xi. Suma
abaterilor de la medie a valorilor variabile este zero.
Valoarea medie x se poate calcula i cu ajutorul frecvenelor relative f i.

b. Mediana seriei statistice ordonata


Fie seria statistic (xi, ni), ordonat (xk xk+1, k1) i N efectivul total al populaiei
statistice.
Mediana unei serii statistice ordonate este valoarea Me care mparte irul
ordonat al valorilor variabile n dou pri, fiecare parte coninnd acelai numr de
valori.

Mediana unei serii statistice cu variabil cantitativ discret se obine


astfel:
-se aaz cele N valori ale variabilei n ordine cresctoare sau descresctoare;
-daca N este numar impar, atunci
-daca N este par N=2k, atunci

;
.

Exemplu:
Fie irul luat cresctor din tabelul 2: 1, 3, 3, 7, 8, 8, atunci Me =5.

Observaie:

Clasa de valori din seria frecvenelor absloute cumulate creia i


corespunde cel puin jumtate din efectivul total al populaiei se numete
clas median.

Mediana unei serii statistice cu variabil cantitativ de tip continuu se


calculaeaza cu formula:

Unde: L=limita inferioar a clasei mediane;


CM =cota medianei;
Ni-1 =frecvena absolut cumulat cresctoare pn la clasa median;
ni =frecvena absolut corespunztoare clasei mediane;
k=amplitudinea clasei mediane: xi+1 - xi .

Mediana seriei statistice este un indicator al poziionrii valorilor x i ale


acesteia. Aceasta este util n realiyarea ierarhizrii valorilor.

c. Modulul unei serii statistice


n multe activiti economico-sociale prezint interes acele aspecte care survin
cel mai frecvent n derularea lor.
De exemplu, compararea numrului de apeluri telefonice pe intervale mici de
timp d posibilitatea determinrii perioadei din zi cnd o central telefonic este cel mai
mult solicitat i, n conseciin, d posibilitatea determinrii capacitii optime a
centralei.
Astfel de probleme se rezolv folosind parametrul statistic de poziie numit
modul sau dominant.
Definiie:
Modulul sau dominanta unei serii statistice (xi, ni), 1 i p, reprezint
valoarea unei clase de valori a variabilei care corespunde celui mai mare efectiv i se
noteaz Mo.
Aadar, modulul sau dominanta este parametrul ce evideniaz valoarea
variabilei care apare cel mai frecvent n mulimea datelor.
Exemplu:
- Pentru seria statistic din Tabelul 1, Mo =170.

S considerm o serie statistic cu variabila cantitativ de tip continuu.


Dac modulul este o clas de valori (clasa modal), aceasta poate fi
nlocuit cu valoarea ei central.
n acest caz avem:

- Pentru seria statistic din Tabelul 2 , Mo =177,5 .


Pentru determinarea unei valori mai exacte a modulului unei serii statistice cu
date grupate n clase de valori, s considerm o secven a diagramei structurale a
acesteia care s conin i valorile din clasa modal [1, L).

Notm:
1 = diferena dintre frecvena clasei modale i aceea a clasei anterioare ei.
2 = diferena dintre frecvena clasei modale i aceea a clasei urmtoare.
K = amplitudinea clasei modale, k =L l.

d. Dispersia. Abaterea medie ptratic


S considerm urmtoarele seturi de date:
{1, 2, 3, 4, 5} i {2,40; 2,50; 2,60; 2,80; 5}
Se constat c ambele iruri de date au valoarea medie egal cu 3, sunt
distincte, iar datele primului ir sunt raspndite n raport cu media fa de cele a setului
al doilea.
Pentru a msura gradul de mprtiere a datelor unei serii statistice fa de
medie se folosesc urmtorii parametrii de poziie: dispersia i abaterea medie
ptratic.
Definiie:
Fiind dat seria statistic (xi, ni), 1 i p, dispersia valorilor x1, x2, ..., xp este
media aritmetic ponderat a ptratelor abatarilor de la medie ale valorilor variabilei.
n cazul datelor grupate n clase de valori, se consider abaterile centrelor
claselor de valori de la medie.
Definiie:
Fiind dat seria statistic (x i, ni), 1 i p, se numete abatere medie
ptratic a valorilor variabilei numrul =
, unde s2 este dispersia
seriei.
Abaterea medie ptratic d posibilitatea caracterizrii dispersiei valorilor
variabilei statistice. Astfel, o serie care este puin dispersat, adic prezint valori ce
sunt strns grupate n jurul valorii medii, conduce la o abatere medie ptratic mic.

Raportul dintre abaterea medie ptratic i valoarea medie a unei serii


statistice se numete coeficient de variaie.

Se noteaza:
Acest indicator d posibilitatea aprecierii gradului de omogenitate a unei serii
statistice. Un coeficient de variaie sub 15% indic o omogenitate bun a reparti iei unui
fenomen i c valoarea medie este reprezentativ.