Sunteți pe pagina 1din 9

Elemente de bază ale statisticii: frecvenţe, procente, rapoarte.

Reprezentarea grafică a elementelor


statistice de bază: histograme, diagrame şi grafice.

Statistică – definiţii de bază

Statistica – reprezintă un set de metode şi tehnici matematice de organizare şi prelucrare a datelor,


folosite cu scopul de a răspunde la anumite întrebări şi de a testa anumite ipoteze (Gheorgiu, Stan,
2003, p.5)
Alte definiţii:
1. Statistica – ştiinţa care se ocupă de prelucrarea şi analizarea unui anumit tip de informaţii,
cele provenite dintr-o pluralitate de manifestări ale entităţilor studiate şi care nu sunt
atribuite unei singure cauze, sau nu se manifestă de o manieră uniformă, aşa încât să poată fi
descrise prin relaţii simple funcţionale ( Rotariu ( coord.), 1999, p.19)
2. Statistica – ştiinţa ce face parte din cadrul disciplinelor care studiază fenomenele într-o
viziune sistematică, la nivel micro, mezo şi macroeconomic şi în consecinţă ea ţine seamă de
dinamismul structurilor existente şi de factorii care acţionează variabil în timp şi spaţiu.(Biji
(coord), 1999,p.9)
3. Statistică – ştiinţă care culege, sintetizează, descrie şi interpretează date referitoare la
fenomene generale ( DEX -1998)
4. Gottfried Achenwall (1719 – 1772)
5. STATISTICĂ – provine de la “status” ( traducere din Latină – “stare”)
Date (din perspectivă statistică) – informaţii numerice ce reprezintă anumite caracteristici
Exemple : 1,80 m, 75 Kg, 100 ani
Procesarea datelor statistice – procesarea informaţiilor numerice în scopul interpretării
caracteristicilor
Variabilă – orice tip trăsătură asociată unei date ce se poate modifica de la caz la caz
Exemple: înălţimea, greutatea, vârsta
Populaţia statistică – un grup inclusiv ce conţine toate cazurile de care este interesat
cercetătorul în demersul său
Exemplu : 1.Locuitorii României, 2.Studenţii SNSPA, 3. Studenţii din anul 1 ai Facultăţii de
Management etc.
Eşantion- submulţime strictă a unei populaţii statistice
1. Locutorii Judeţului Braşov, 2. Studenţii FCRP, 3. Studenţii din Grupa 2, anul 1, Facultatea
de Management
Observaţii:
1. Eşantionul este întotdeauna inclus în populaţia statistică!
2. Populaţia statistică şi eşantionul trebuie să fie însoţite întotdeauna de o imagine numerică a
mărimii acestora!
3. Eşantionul şi populaţia statistică trebuie selectate riguros, în conformitate cu obiectivele
cercetării ştiinţifice!
Tipuri de statistică:
I. Statistică descriptivă – se ocupă cu clasificarea şi analiza datelor, în general pentru o unică
variabilă prestabilită
Exemple: Media notelor dintr-o clasă, media de vârstă a cetăţenilor României, salariul
mediu pe economie etc.
II. Statistică inferenţială – se ocupă cu extrapolarea observaţiilor înregistrate la nivelul unui
eşantion, către nivelul întregii populaţii din care a fost extras acel eşantion
Exemple: Intenţia de vot a unei populaţii, evoluţia speranţei de viaţă etc.
Tipuri de statistică :
I. Statistică parametrică – analizează caracteristicile cantitative a unei populaţii/ eşantion
Exemplu: Numărul de voturi exprimate, evoluţia cursului leu/euro
II. Statistică nonparametrică – analizează caracteristicile calitative a unei populaţii/
eşantion
Exemplu: statistica celor mai inteligenţi studenţi, statistica celor mai trişti/fericiţi europeni
I. Frecvenţe – numărul de cazuri/date identice ce se repetă în cadrul unei variabile
Exemple: studenţi admişi la examen – 230
studenţi respinşi la examen – 50
Frecvenţe absolute – numărul total de cazuri/date identice dintr-o distribuţie statistică
Exemple (caz anterior ): f1 = 230
f2 = 50
Raport – Numărul de cazuri (frecvenţe) dintr-o categorie exprimat în raport cu numărul de cazuri
dintr-o altă categorie investigată
De exemplu raportul între două categorii (i şi j).
Dacă fi – studenţii admişi , respectiv fj – studenţii respinşi, atunci
fi 230
Raport = = 4,60
fj 50

=
2. Frecvenţe relative – numărul de frecvenţe identice asociate unei variabile raportat la numărul
total de cazuri dintr-o distribuţie statistică

Exemplul anterior 230 50


f1 = = 0,83(83 %) f2 = = 0,17 (17 %)
280 280
Frecvenţe cumulate – numărul de frecvenţe ce se regăsesc la un moment dat însumate (cumulat) la un
nivel de observare statistică
Studenţi (ani) Frecvenţa Frecvenţa Frecenţa Frecvenţa
absolută relativă absolută relativă
cumulată cumulată

18 -19 150 53,58% 150 53,58%


20 -21 100 35,72,% 250 89,30%
22 – 23 20 7,15% 270 96,45%
24 -25 10 3,58% 280 100%
Total 280 100%

Pentru a putea fi analizate, datele statistice trebuie grupate!


Gruparea datelor statistice trebuie să îndeplinească patru criterii:
1. Completitudine – realizarea grupării se realizează utilizând toate datele statistice de sondaj
2. Omogenitatea grupelor şi subgrupelor – grupele în care sunt incluse variabilele trebuie să fie
relativ omogene în ceea ce priveşte distribuirea frecvenţelor
3. Unicitatea includerii datelor – frecvenţele statistice sunt cuprinse în mod unic într-o singură
clasă
4. Continuitatea variaţiei grupelor – nu sunt acceptate clase care să conţină frecvenţe nule
Histogramele – reprezentări grafice ale valorilor frecvenţelor absolute în cadrul unei distribuţii
statistice. Sunt utilizate cu precădere atunci când se doreşte evidenţierea în valori absolute a unei
realităţi statistice.
Diagramele circulare – reprezentări grafice ale valorilor frecvenţelor relative în cadrul unei distribuţii
statistice. Sunt utilizate cu precădere atunci când se doreşte evidenţierea procentuală a unei realităţi
statistice.
Diagramele cu linii - Forme de reprezentare grafică utilizate cu precădere atunci când se doreşte
studierea “trendului” unui fenomen
Exemplu – categoriile de vârste ale studenţilor participanţi la examen
Diagrame de tip “radar” - Categorie de grafice care permit aşezarea valorilor diferite în cadrul
aceleiaşi reprezentări
Exemplu – categoriile de vârste ale studenţilor participanţi la examen
Modalităţi de abordare a datelor statistice.

Tabelele şi seriile statistice.

Distribuţiile statistice simetrice.


Niveluri de măsură statistice:
1. Nivel nominal
2. Nivel ordinal
3. Nivel de interval
4. Nivel de raport
La nivel nominal – clasificarea cazurilor se realizează în raport cu o categorie prestabilită a unei
variabile.
Abordarea nominală are un caracter pur de constatare, fără a ne putea permite putea compararea
cazurilor între ele!
Exemplu de variabile:
1. Culoarea ochilor – albaştri, verzi, căprui, negri
2. Sex – masculin, feminin
Prin constatare (observaţie statistică) se poate conchide asupra tipului de culoare a ochilor unui
subiect, sau a categoriei de sex în care se încadrează un subiect!
La nivel ordinal – pe lângă clasificare ( întâlnită la nivelul nominal), cazurile statistice pot fi
comparate între ele pe baza unei scale de apreciere

Exemplu: variabila – grad de mulţumire


Categorii ale acestei variabile : Foarte mulţumit, mulţumit, destul de mulţumit, nemulţumit şi foarte
nemulţumit

Dacă un subiect a participat la testare, atunci el aparţine cu siguranţă unei categorii a variabilei
menţionate.
La nivel de interval – Pe lângă operaţiunile de clasificare ( nivel nominal) şi ordonare ( nivel ordinal),
apare relaţia de echidistanţă între două cazuri consecutive ale unor clase succesive (identice ca
mărime).
Exemplu: variabila – vârsta subiecţilor participanţi la sondaj
Clasa vârstelor : 18 -20 ani – 4 persoane
21- 23 ani – 5 persoane
24 -26 ani – 3 persoane
La nivel de raport – Pe lângă relaţiile de clasificare, ordonare, situare a cazurilor în clase de mărimi
egale, apare şi relaţia de comparare a cazurilor situate în clase diferite ( raportate la o valoare de
0 a unei axe).
Exemplu: variabila – salariu
Angajaţi cu 0 -3 ani vechime – 1.000 lei
4 – 7 ani vechime – 1.500 lei
8- 11 ani vechime – 2.000 lei
Un angajat cu 10 ani vechime câştigă dublu în raport cu un angajat cu 2 ani vechime.
În aproape orice tip de analiză statistică ( în afara statisticilor elementare), înainte ca datele statistice
să fie analizate, acestea trebuie să fie mai întâi ordonate!

Exemplu : La o testare a cunoştinţelor de specialitate în domeniul Managementului Proiectelor, un


număr de 20 de studenţi au obţinut următoarele note:
7, 8, 9,7, 9, 9, 8, 10, 6, 10, 7, 8, 9, 6, 10, 9, 8, 7, 9, 10
Datele statistice ordonate au următoarea structură:

Scorul Frecv
6
Avem prezentat în cadrul tabelului de mai sus o serie simplă de frecvenţe, ordonate în sens crescător
după valoarea scorului înregistrat.

Gruparea seriilor statistice ordonate în clase de intervale


Gruparea datelor statistice în cadrul claselor de intervale se realizează numai utilizând metode de
modelare matematică!
Formula lui Sturges ( de aproximare a lungimii intervalului de clasă).

Unde:

7
i = lungimea recomandată a intervalului de grupare statistic
Xmax = cel mai mare scor al seriei statistice
Xmin = cel mai mic scor al seriei statistice
Atunci când scorurile statistice sunt dispuse în clase de intervale trebuie ţinut cont de următoarele

8
reguli:
1. Intervalul de clasă are o valoare întreagă
2. Lungimea claselor trebuie fie egală
3. Clasele trebuie să includă toate scorurile statistice aferente sondajului
4. Fiecare clasă trebuie să conţină cel puţin un scor statistic

Transformarea datelor statistice ordonate în intervale


In urma introducerii scorurilor deja ordonate in clasele de interval, rezultă următoarea situaţie

9
centralizată
Interval Lim ite reale Cen tre d e interv alFrecvenţe absolute Frecvenţe
de clasă cum ulate
6-7 5,5 – 7,5 6,5 6 6
8-9 7,5 - 9,5 8,5 10 16
10 -11 9 ,5 – 11,5 10,5 4 20

10
De reţinut!
1. Intervalele de clasă sunt aproximări statistice ale realităţii
2. Trebuie construite limitele reale ale claselor, pentru a putea include toate scorurile statistice în
sondaj

Media aritmetică
Media aritmetică – reprezintă principalul indicator statistic de definire a unei colectivităţi statistice.

Media aritmetică - caracterizează evoluţia medie a scorurilor statistice a unei colectivităţi


n

∑x
La nivel de măsură ordinal,media se calculează:
i – indice de indexare al scorului statistic i
n – numărul total de scoruri
X= i =1
n
Atunci când se doreşte calculul mediei aritmetice la nivel de interval sau raport, nu mai pot intra în
calcul scorurile individuale înregistrate, ci se introduc în formula de calcul “centrele de interval”
aferente limitelor reale ale claselor. n

i – indice de indexare al scorului statistic ∑fx i i


n – numărul total de scoruri
fi – frecvenţa aferentă fiecărei clase de interval X= i =1
n
În cazul nostru X= 8.30

Mediana

Indicatorul statistic ce defineşte “mijlocul” unei distribuţii statistice de date


1. Pentru distribuţiile de statistice ce includ un număr par de scoruri, mediana se calculează prin
intermediul celor 2 termeni din mijlocul şirului de date ( formula de identificare termen
-N/2).
1. Pentru distribuţiile de statistice ce includ un număr impar de scoruri, mediana este
indicatorul de la mijlocul şirului de date statistice ( formula de identificare termen (N+1)/2)
În cazul exemplului nostru Md = (8 +9/2) = 8,5

Modulul

Indicatorul statistic ce defineşte numărul cel mai mare de apariţie a unui scor (frecvenţa) în cadrul
unei distribuţii statistice de date.
În cazul exemplului nostru Mo = 9 ( scorul care apare de cele mai multe ori în distribuţia statistică,
la nivel ordinal)
Distribuţii statistice simetrice

Cea mai cunoscută distribuţie statistică simetrică de scoruri – distribuţia de tip Gauss
În cadrul unei distribuţii statistice Gauss – media, mediana şi modulul coincid ca valoare şi poziţie
în cadrul distribuţiei statistice de date.
Curba Gauss – este asimilată cu o curbă de probabilitate statistică!

Prelucrarea statistică a datelor


Indicatorii tendinţei centrale: media, mediana şi modulul distribuţiei statistice.
Tendinţa centrală a datelor statistice

Tendinţa centrală - Reprezintă fenomenul de organizare a datelor statistice în jurul “valorii centrale”
(reprezentate prin media, mediana şi modulul) ale unei distribuţii experimentale.

Cu cât datele statistice se apropie mai mult în mod uniform de valoarea centrală a distribuţiei, putem
afirma că acea colectivitate statistică are un grad ridicat de omogenitate.

Colectivitate statistică omogenă


Colectivitate omogenă - Scorurile statistice se organizează în mod uniform în jurul valorii centrale a
distribuţiei statistice (reprezentate aici prin media colectivităţii)

Colectivitate statistică eterogenă


Colectivitate neomogenă - Scorurile statistice se organizează în mod neuniform (sau chiar aleatoriu)
în jurul valorii centrale a distribuţiei statistice (reprezentate aici prin media colectivităţii)
Media statistică (1)

I. Media aritmetică ( numită şi “simplă”)

Media - Reprezintă indicatorul ce caracterizează printr-o singură valoare întreaga serie statistică
investigată.
Media aritmetică - caracterizează evoluţia medie a scorurilor statistice a unei colectivităţi

1. Pentru seriile de date statistice “simple”, negrupate în clase (pentru date la nivel nominal
sau ordinal)
n

∑x i
X = i =1
n statistic
i – indice de indexare al scorului
n – numărul total de scoruri

2. Pentru seriile de date statistice grupate în clase


Atunci când se doreşte calculul mediei aritmetice la nivel de interval sau raport, se utilizează
calculul unei astfel de tip de medii

i – indice de indexare al scorului statistic

j – numărul de clase distincte


n – numărul total de scoruri
fi – frecvenţa aferentă fiecărei clase de interval
Xi – valoarea centrului de interval

II. Media aritmetică ponderată


Este utilă atunci când dorim să aflăm media unei colectivităţi formate din mai multe entităţi
distincte, fiecare dintre aceste entităţi fiind caracterizate printr-o valoare medie.

i – indice de indexare al scorului statistic

j – numărul de clase distincte


n – numărul total de scoruri
ni– numărul de indivizi din fiecare clasă
Xi – media fiecărei clase

Exemplu: Un grup de 100 de studenţi au participat la o testare vizând cunoştinţele generale în


domeniul managementului, înregistrând următoarele rezultate:
Un număr de 50 dintre aceştia au obţinut media 8,50, in timp ce 30 dintre ei au avut media de 8, iar 20
dintre aceştia au obţinut 7,50
II: Mediana (1)
Indicatorul statistic ce defineşte “mijlocul” unei distribuţii statistice de date

1. Pentru distribuţiile de statistice simple ( fără a avea date incluse în clase) ce includ un număr
par de scoruri, mediana se calculează prin intermediul celor 2 termeni din mijlocul şirului
de date ( formula de identificare termen -N/2).

1. Pentru distribuţiile de statistice simple ( fără a avea date incluse în clase) ce includ un număr
impar de scoruri, mediana este indicatorul de la mijlocul şirului de date statistice ( formula
de identificare termen (N+1)/2)

Exemplu : La o testare a cunoştinţelor de specialitate în domeniul Managementului Proiectelor, un


număr de 20 de studenţi au obţinut următoarele note:
7, 8, 9,7, 9, 9, 8, 10, 6, 10, 7, 8, 9, 6, 10, 9, 8, 7, 9, 10

Ordonarea datelor statistice:


6, 6, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9,10,10, 10, 10

Cota medianei: N/2 = 10 ( al zecelea termen al distribuţiei)

Valoarea medianei: Md = (8 +9)/2 = 8,5

Concluzie: termenul de la mijlocul distribuţiei statistice ordonate are valoarea asociată 8,5

Pentru calculul medianei la nivel de interval sau raport utilizăm formula corespunzătoare acestui
indicator pentru valorile statistice incluse în clase.

Unde:
Liminf= limita inferioară reală a intervalului ce cuprinde mediana
n/2 = cota medianei ( unde n reprezintă numărul total de scoruri)
i = mărimea intervalului de clasă
fi = frecvenţa absolută a intervalului ce conţine mediana
fci = frecvenţa cumulată până la nivelul intervalului ce conţine mediana
Aplicând formula de grupare a datelor statistice în clase ( a lui Sturges) obţinem următoarea situaţie
(pentru exemplul precedent):
Interval Limite reale Centre de interval Frecvenţe absolute Frecvenţe
de clasă cumulate
6-7 5,5 – 7,5 6,5 6 6
8-9 7,5 - 9,5 8,5 10 16
10 -11 9,5 – 11,5 10,5 4 20
În acest caz:
1. Cota medianei = n/2 = 20/2 =10 (al zecelea caz)
2. Identificarea intervalului: cazul 10 se află în intervalul 8-9 cu limite reale 7,5 – 9,5
3. Se identifică limita reală inferioară a intervalului – în cazul nostru are valoarea 7,5
4. Numărul de frecvenţe cumulate până la acel nivel – 6 (corespunzătoare clasei 6-7)

În aceste condiţii, formula de calcul devine:

 n / 2 − fci 
Md = Liminf +  i = 7,5 +  20 / 2 − 6 2 = 8,3
fi   10 
 
Deoarece în cadrul seriei de date simple (negrupate în clase de valori) mediana calculată anterior avea
valoarea 8,50, iar în cazul de faţă valoarea nouă înregistrată prin calcul este de 8,30, opinăm că
diferenţa de 0,20 înregistrată se datorează aprecierilor statistice aproximative.

Modulul
Indicatorul statistic ce defineşte numărul cel mai mare de apariţie a unui scor (frecvenţe) în cadrul
unei distribuţii statistice de date.

În cazul exemplului nostru (în seriile simple de date negrupate) Mo = 9 ( scorul care apare de cele
mai multe ori în distribuţia statistică, la nivel ordinal, în speţă valoarea 9 apare de 6 ori

Pentru a putea calcula modulul unei distribuţii statistice de date cu valorile grupate în clase, se
utilizează următoarea formulă:

Unde:
Liminf= limita inferioară reală a intervalului ce cuprinde modulul
i = mărimea intervalului de clasă
= diferenţa între frecvenţa intervalului modal şi cea a celui precedent
= diferenţa între frecvenţa intervalului modal şi cea a celui următor

În această nouă situaţie (pentru datele grupate în clase), modulul distribuţiei statistice are forma:

 ∆1   10 − 6 
Mo = Liminf +  i = 7,5 +  2 = 8,3
∆ + ∆  ( 10 − 6 ) + ( 10 − 4 ) 
 1 2   
Percentilele
Sunt indicatori ai tendinţei centrale ce furnizează informaţii despre poziţia unui scor individual în
raport cu acest tip de indicatori.

Percentile – împart în principiu un şir ordonat de valori/o distribuţie statistică de valori grupate în clase
în 100 de părţi egale

Subdiviziuni:
Cuartilele – împart un şir ordonat de valori/o distribuţie statistică de valori grupate în 4 părţi egale

Decilele – împart şir ordonat de valori/o distribuţie statistică de valori grupate în zece părţi egale
Pentru şirul ordonat de valori din exemplul anterior:

6, 6, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9,10,10, 10, 10
Exemple:
Decila 1: Cota N/10 =20/10=2 (al doilea termen al şirului)
Valoarea Decila 1 = 6
Decila 3: Cota 3N/4 =3 x 20/10=6 (al şaselea termen)
Valoarea Decila 3 = 7

Cuartila 1: Cota N/4 =20/4=5 (al cincilea termen)


Valoarea Cuartila 1 = 7

Pentru seriile de date statistice introduse in clase se va aplica formula:

 cot aPe − fci 


Pe = Liminf +  i
fi 
Unde:  
Liminf= limita inferioară reală a intervalului ce cuprinde percentila
Cota Pe = cota percentilei
i = mărimea intervalului de clasă
fi = frecvenţa absolută a intervalului ce conţine percentila
fci = frecvenţa cumulată până la nivelul intervalului ce conţine percentila

Exemplu de calcul - pentru datele grupate în clase de valori

Cuartila 1 – cota N/4 – 20/4 =5 (al cincilea element)

Elementul al cincilea intra in clasa ( 6-7) cu limita inferioară a intervalului de 5,5.

În aceste condiţii formula pentru prima cuartilă devine:

 cot aPe − fci  5−0


Pe = Liminf 
+ i = 5,5 +  2 = 7,1
fi  
   6i 
Valoarea cuartilei 1 pentru datele negrupate era în cazul anterior de 7

S-ar putea să vă placă și