Sunteți pe pagina 1din 12

Elemente de Statistica

Statistica este disciplina care se ocupa cu culegerea,inregistrarea,gruparea,analiza


si interpretarea datelor
referitoare la un anumit fenomen precum si cu formularea unor previziuni privind
comportarea viitoare a acestuia.
Activitatea de culegere si inregistrare a datelor referitoare la un fenomen face
obiectul statisticii descriptive sau statisticii formale.
Activitatea de grupare,de analiza si de interpretare a datelor precum si formularea
unor previziuni priviind comportarea viitoare a unui fenomen reprezinta obiectul
statisticii matematice.

Elemente de limbaj in statistica.Date Statistice

Definitii
1Multimea pe care se realizeaza un studiu statistic se numeste populatie
statistica.
2Elementele componente ale unei poulatii statistice se numesc unitati statistice
sau indivizi.
3Numarul total de unitati statistice se numeste efectivul total al populatiei
statistice.
4O parte a populatiei statistice aleasa special pentru a fi studiata se numeste
esantion.
5Proprietatea sau indicatorul in functie de care se cerceteaza o populatie
statistica se numeste caracteristica sau variabila statistica.
O caracteristica se numeste caracteristica calitativa daca nu poate fi
masurata(valoarea ei nu se exprima numeric).
Ex: media generala,calificativul,profesia
O caracteristica cantitativa se numeste discontinua sau discreta daca nu poate lua
decat valori numerice izolate.
O caracteristica cantitativa care poate lua orice valoare dintr-un interval de
lungime finita sau infinita se numeste caracteristica cantitativa continua.
Intervalel in care o caracteristica ia valori se numesc grupe sau clase de valori.
Ex: a)Nota la teza.media generala sunt caracteristici cantitative discrete.
b)Inaltimea este o caracteristica in functie de care poate fi studiat un grup.
Culegerea,Inregistararea si Clasificarea Datelor
Statistice

Sa consideram studiul efectuat asupra unui grup de sportivi dupa inaltime


(exprimata in centimetri).
Rezultatele masuratorii sunt inregistrate in ordinea in care a decurs masuratoare si
sunt asezate in urmatorul tabel:
165 168 177 195 172 198 196 190 201 168
172 168 168 196 173 199 182 195 196 196
185 205 184 192 178 165 174 182 177 172
196 192 188 195 175 192 175 184 192 170
184 205 190 200 188 176 184 174 188 170
170 180 184 199 192 184 170 175 184 188

165 168 177 195 172 198 196 190 201 168
172 168 168 196 173 199 182 195 196 196
185 205 184 192 178 165 174 182 177 172
196 192 188 195 175 192 175 184 192 170
184 205 190 200 188 176 184 174 188 170
170 180 184 199 192 184 170 175 184 188

Sub aceasta forma datele inregistrate sunt greu de analizat.De aceea este
necesara o alta grupare sau clasificare a datelor.De exemplu,sa asezam aceaste
date in ordinea crescatoare a inaltimi sportivilor consemnand cati sportivi au o
anumit inaltime.Se obtine urmatorul tabel:
cm Nr. cm Nr. cm Nr. cm Nr. cm Nr.
sporti sport sporti sport sportivi
vi ivi vi ivi

165 2 174 1 180 1 190 2 19 2


9
168 4 175 3 182 2 192 5 20 1
0
170 4 176 1 184 7 195 3 20 1
1
172 3 177 2 185 1 196 5 20 2
5
173 1 178 2 188 4 198 1 - -
Cu ajutorul acestei clasificari a datelor se pot obtine niste concluzii mai rapide
privind particularitatile acestui grup.
Rezultatele analizei statistice pot fi obtinute uneori mai usor daca se practica o alta
grupare a datelor statistice.
De exemplu se poate face o grupare a valorilor caracteristicii studiate in clase de
valori:
Clase de Nr.
valori Sportivi
[165,170) 6
[170,175) 6
[175,180) 8
[180,185) 10
[185,190) 5
[190,195) 7
[195,200) 11
[200,205) 4

Cu ajutorul acestui tabel de date se pot obtine cu usurinta diferite informatii


despre grupul de studiu,ca de exemplu:
-sunt 60 de sportivi
-cei mai multi sportivi au inaltimea in clasa de valori [195,200),urmand cei cu
inaltimea in clasa de valori [180,185) etc.
-9 sportivi au inaltimea in clasa de valori [170,175)si reprezinta 15% din efectivul
populatiei statistice;
-exista 45 de sportivi cu inaltimea sub 95 cm etc.
Valoarea absoluta a diferentei extremitatilor unei clase de valori se numeste
amplitudinea clasei.

Serii Statistice.Frecvente

1Multimea tututor perechilor (xi,ni),1≤ i ≤ p formeaza o serie statistica cu o


singura variabila.
2Numarul ni de unitati statistice corespunzatoare valorii xi a caracteristicii sau
a unei clase de valori se numeste frecventa absoluta a valorii xi,respectiv
frecventa absoluta a clasei de valori considerate.
Rezulta ca
Modul de prezentare a unei serii statistice cu o variabila statistica este sub forma
unui tabel orizontal sau vertical care cuprinde valorile variabilei statistice sau
clasele de valori si frecvntele absolute corespunzatoare:
Valorile x1 x2.....xp
caracteristice
Frecventa n1 n2 ....np
absoluta
Clase de valori [x1,x2)...[xp-1,xp)
Frecventa n1.....................np
absoluta

Se spune ca aceste tabele definesc distributia sau repartitia statistica a variabilei


statistice.
Frecventa absoluta cumulata crescatoare a valorii x a variabilei statistice este
suma tutuoro frecventelor absolute ale valorilor variabilei care apar pana la xi
inclusiv.

Se noteaza

Frecventa absoluta cumulata descrescatoare a valorii xi a variabilei statisticei


este suma tuturor frecventelor absolute ale valorilor variabilei care apar la xi
inclusiv.

Se noteaza

Raportul dintre frecventa absoluta a unei valori xi sau a unei clase de valori
statistice si efectivul total al populatiei se numeste frecventa relativa a clasei de
valori.

Se noteaza

Se numeste frecventa relativa cumulata crescatoare a valorii xi a variabilei


statistice , suma tuturor frecventelor relative a valorilor care apar pana la xi
inclusiv.

Se noteaza

Se numeste frecventa relativa cumulata descrescatoare a valorii xi a variabilei


statistice , suma tuturor frecventelor relative ale vlorilor care apar la xi inclusiv.

Se noteaza
Analog se definesc frecventele relative cumulate ale claselor de valori.

Reprezentarea Grafica a Datelor Statistice

O modalitatea de realizare a analizei si interpretarii datelor statistice o constituie


reprezentarea grafica a acestora ,reprezentare care permite vizualizarea datelor
statistice in scopul formarii unei imagini intuitive si imediate asupra fenomenului
studiat.
1Graficul unei serii statistice se numeste diagrama structurala.

1.Reprezentarea grafica folosind diagrama circulara


Cercul de structura sau diagrama circulara este un cerc a carui arie reprezinta
efectivul total al populatiei statistice (100%).Valorile variabilei se reprezinta prin
sectoare de cerc ale caror arii sunt proportionale cu frecventele relative ale
valorilor variabilei.Cu ajutorul regultii de trei simpla se determina masura unghiului
la centru corespunzator fiecarei frecvente.
Ex: Structura veniturilor banesti (in lei) din bugetul personal al unui student pe o
luna se afla in urmatorul tabel de date:
Venituri Bursa de Donatii Activitati Vanzari
studiu suplimentare de
bunuri
Frecventa 2 400 000 1 200 000 2 100 000 300 000
absoluta
Frecventa 40% 20% 35% 6%
relativa
Cu regula de trei simpla se obtine urmatoarea corespondenta intre frecventa
relativa fi si masura unghiului la centru corespunzator:
fi 40% 20% 35% 5%
n° 144° 72° 126° 18°
Diagrama circulara asociata serii statistice cu variabila calitativa este redata de fi.
2.Reprezentarea grafica folosind dreptunghiul de
structura

Pentru desenarea dreptunghiului de structura se considera un reper cartezian in


plan.Axa verticala va fi axa frecventelor relative fi ale valorilor xi ale variabilei
statistice.
Cu baza pe axa verticala se deseneaza un dreptunghi cu inaltimea de 100 de
unitati.Se divizeaza dreptunghiul pe linii orizontale obtinand dreptunghiuri cu ariile
proportionale cu frecventele fi.

Ex: Pentru seria statistica cu variabila calitativa din tabelul anterior se obtine
dreptunghiul de structura din figura urmatoare :

3.Reprezentarea grafica prin batoane

Diagrama structurala cu ajutoarul batoanelor se obtine astfel:


2se alege un reper cartezian in plan
3pe axa orizontala se reprezinta valorile xi ale variabilei statistice
4pe axa verticala se reprezinta frecventele absolute ni sau frecventele relative
fi corespunzatoare valorilor xi 1≤ i≤ p
5segmentul cu extremitatile in punctele cu coordonatele (xi,0), (xi, ni) respectiv
(xi, fi) reprezinta batonul corespunzator valorii xi.
Ex; Se considera seria statistica reprezentand distributia unui esantion de 120 de
tineri in functie de numarul de carti imprumutate de la bibleoteca intr-un semestru.
Numar 0 1 2 3 4 5 6 7 8
carti
Numar 2 8 10 18 20 25 22 5 10
elevi

4.Reprezentarea grafica prin coloane sau benzi

Acest tip de reprezentare grafica foloseste dreptunghiuri cu latimi egale si


lungimile proportionale cu frecventele absolute sau cu frecventele relative ale
valorilor variabilei statisticei.
Daca dreptunghiurile sunt asezate vertical,reprezentarea grafica se numeste
diagrama prin coloane, iar daca sunt asezate orizontal reprezentarea grafica se
numeste diagrama prin benzi.
Ex: Repartitia numarului de ore de emisie de radio (mii ore program) in perioada
1998-2003 este:

Anii 199 199 20 20 200 200


8 9 00 01 2 3
Numar 52 58 64 60 70 75
ore
5.Poligonul frecventelor
O modalitate de vizualizare a datelot unei seriistatistice este poligonul frecventelor
care permite reprezentarea grafica sub forma unei curbe.Fie seria statistica
cu telor absolute se unesc printr-o linie poligonala de coordonate ,
.Daca se unesc punctele de coordonate se obtine poligonul
frecventelor relative.

6.Histograma
Se considera o serie statistica cu variabila cantitativa continua si clasele de valori
de amplitudini egale:distributia unui grup de tineri dupa inaltimea exprimata in
centimetri:

Inaltime Numar tineri Frecventa absoluta Frecventa absoluta


cumulata cumulata
crescatoare descrescatoare
[155, 160) 5 5 63
[160, 165) 12 17 58
[165, 170) 15 32 46
[170, 175) 20 52 31
[175, 180) 8 60 11
[180, 185) 3 63 3

Interpretarea Datelor Statistice Prin Parametri


de Pozitie

Analiza si interpretarea datelor statistice legate de un studiu statistic s-a


realizat pana la acest moment cu ajutorul frecventelor si a graficelor statistice.
Pentru o serie statistica este interesant de gasit acea marime care survine cel
mai des , acea marime este cea mai reprezentativa pentru toata seria.
O astefle de marime se numeste indicator sau parametru de pozitie deoarece
arata pozitia elementelor principale ale seriei in cadrul acesteia.
Reprezentivitatea unor astfel de marimi este data de gradul de concentrare a
datelor statistice in jurul lor.

1.Valoarea medie a unei serii statistice


Fie seris statistica asociata unui studiu statistic asupra unei
populatii statistixce din efectivul N, cu variabila cantitativa.
Se numeste valoare medie sau media variabilei statistice X , media aritmetica a
tuturor valorilor variabilei statistice calculata pentru toate unitatile populatiei
statistice.

Se noteaza

2.Mediana seriei statistice


ordonata

Mediana unei serii statistice ordonate este valoarea Me care imparte sirul ordonat
al valorilor variabile in doua parti,fiecare parte continand acelasi numar de valori.
*Mediana unei serii statistice cu variabila cantitativa discreta se obtine astfel:
-se aseaza cele N valori ale variabilei in ordine crescatoare sau descrescatoare
-daca N este numar impar, atunci

-daca N este par N=2k, atunci

Clasa de valori in seria frecventelor absloute cumulate careia ii corespunde cel putin
jumateate din efectivul total al populatiei se numeste clasa mediana.
Mediana unei serii statistice cu variabila cantitativa de tip continuu se calculaeaza
cu formula

Unde: L=limita inferioara a clasei mediane


CM=cota medianei
Ni-1=frecventa absoluta cumulata crescatoare pana la clasa mediana
ni=frecventa absoluta corespunzatoare clasei mediane
k=amplitudinea clasei mediane

3.Modulul unei serii statistice

In multe activitati economico-sociale prezinta interes acele aspecte care survin


cel mai frecvent in derularea lor.
De exemplu compararea numarului de apeluri telefonice pe intervale mici de timp
da posibilitatea determinarii perioadei din zi cand o centrala telefonica este cel mai
mult solicitata si, in conseciinta , da posibilitatea determinarii capacitatii optime a
centralei.
Astfel de probleme se rezolva folosind parametru statistic de pozitie numit
modul sau dominanta.
Definitie!
Modulul sau dominanta unei serii reprezinta valoarea unei
clase de valori a variabilei care corespunde celui mai mare efectiv si se noteaza Mo.

*Pentru determinarea unei valori mai exacte a modulului unei serii statistice cu date
grupate in clase de valori , vom face o analiza pe o secventa a diagramei structurale
a acesteia care sa contina si valorile din clasa modala [1, L).
Fie cazul seriei statistice in care clasa de valori anterioare clasei modale are
frecventa mai mica decat frecventa clasei de valori care urmeaza clasei modale.
Notam: ∆ 1=diferenta dintre frecventa clasei modale si cea a clasei anterioare ei.
∆ 2=diferenta dintre frecventa clasei modale si cea a clasei urmatoare.
K=amplitudinea clasei modale k=L-1
Se obtine :

4.Dispersia.Abaterea medie patratica

Sa consideram urmatoarele seturi de date: {1,2,3,4,5} si {2,40;2,50 ;2,60 ;


2,80 ;5}
Se constata ca ambele siruri de date au valoarea medie egala cu 3 , sunt
distincte , iar datele primului sir sunt raspandite in raport cu media fata de cele a
setului al doilea.
Pentru a masura gradul de impartasire a datelor unei serii statistice fata de
medie se folosesc urmatorii parametri de pozitie: dispersia si abaterea medie
patratica.
Definitie!
*Fiind data seria statistica dispersia valorilor
este media aritmetica ponderata a patratelor abatarilor de la medie ale valorilor
variabilei.

Se noteaza

In cazul datelor grupate in clase de valori , se considera abaterile centrelor claselor


de valori de la medie.
Definitie!
*Fiind data seria statistica se numeste abatere
medie patratica a valorilor variabilei numarul unde este dispersia serie.
Se noteaza

Abaterea medie patratica da posibilitatea caracterizarii dispersiei valorilor


variabilei statistice.Astfel, o serie care este putin dispersata , adica prezinta valori
ce sunt strans grupate in jurul valorii medii, conduce la o medie patratica mica
Definitie!
Raportul dintre abaterea medie patratica si valoarea medie a unei serii
statistice se numeste coeficient de variatie