Sunteți pe pagina 1din 15

Statistic aplicat

Tipuri de date i scale de msurare. Rezumarea tabelar i grafic a datelor statistice

Tipuri de date:

Putem ntlni:

Seturi de date univariate se refer la o singur variabil statistic; avem o singur


informaie pentru fiecare unitate statistic; exemplu: n 2007, n Romnia, avem
urmtoarele informaii despre muzee, n funcie de tipul acestora: tiinele naturii 44,
istoria tehnicii i tiinei 21, istorie 117, etnografie 115, istoria culturii 152, art
149, mixte 70;
Seturi de date bivariate se refer la dou variabile statistice; avem 2 informaii pentru
fiecare unitate statistic; exemplu: salariul i vechimea, salariul i studiile, salariul i
economiile;
Seturi de date multivariate se refer la 3 sau mai multe variabile statistice; avem deci
mai multe informaii pentru fiecare unitate statistic; exemplu: salariul, vechimea,
studiile, domeniul de activitate, localizarea geografic;

Caracteristica statistic = trstura, proprietatea, nsuirea comun tuturor unitilor unei


colectiviti i care variaz, ca nivel, variant sau valoare, de la o unitate a colectivitii la alta.
Se mai numete i variabil statistic sau variabil aleatoare.

Caracteristicile statistice se pot clasifica dup mai multe criterii:

n funcie de modul de exprimare:


Calitatative/ categoriale/ nominale exprimate prin cuvinte; exemplu: rspunsurile da/ nu
la un chestionar, culoarea ochilor, preferina pentru o anumit revist, etc.
Cantitative/ numerice exprimate prin cifre; exemplu: nlimea, vrsta, greutatea,
profitul, salariul, etc.
n funcie de numrul variabilelor de rspuns pe care le pot lua:
Alternative (binare sau dihotomice) pot lua doar 2 variante de rspuns; exemplu:
adevrat/ fals, da/ nu, genul (masculin/ feminin), stagiul militar (efectuat/ neefectuat),
starea civil (cstorit/ necstorit);
Nealternative cele care pot lua mai multe valori de rsspuns; exemplu: profesie, salariu,
cifr de afaceri, localitate de domiciliu;
Observaie: o caracteristic nealternativ se poate transforma n una alternativ printr-un
proces de dihotomizare; exemplu: salariu de pn la 4000 lei/ de peste 4000 lei; localitate
de domiciliu Bucureti/ alt localitate, etc.
n funcie de natura variaiei caracteristicilor numerice:
Continue sunt reprezentate de valori ce nu pot fi cuantificate cu exactitate (aparin unui
interval); exemplu: greutatea, timpul, volumul, distana, etc.
Discrete sunt reprezentate de valori ce pot fi cuantificate cu exactitate; exemplu:
numrul rspunsurilor corecte la test, numrul studenilor din sal, numrul notelor de 10
din catalog, numrul lunilor n care firma nregistreaz profit, etc.
n funcie de coninutul caracteristicii:
De timp; exemplu: anul naterii, anul nfiinrii firmei, luna nregistrrii celui mai mare
profit;
De spaiu; exemplu: localitatea de domiciliu;
De atribuire variabila reprezint un atribut altul dect locul i timpul; exemplu:
ncasrile, profitul;
n funcie de modul de obinere i caracterizare a fenomenului:
Primare obinute dup etapa culegerii datelor statistice;
Derivate obinute n procesul prelucrrii variabilelor primare.

Scale de msurare:

Scala nominal/ de clasificare/ a denumirilor:


Proprietate: identificare;
Sunt msurate variabilele nenumerice!
Numerele sunt atribuite observaiilor pentru a nu face doar judeci despre identiti sau
diferenieri de categorii;
Este mai degrab un mod de clasificare dect unul de aranjarea de-a lungul unei axe;
Numerele atribuite unor observaii servesc drept numele lor;
Se face o difereniere de specie dar nu i de grad;
Nu se pot face diferene ntre clase i nici nu se poate face o ordonare ntre categorii;
Exemplu: ocupaia, genul, statutul marital, tipul de asigurare, etc;
Chiar dac le sunt asociate numere, variabilele sunt tot categriale NU le prelucrm
aritmetic; exemplu: atribuim valorile: 1 actor, 2 numcitor, 3 inginer, 4 economist;
pentru 10 persoane chestionate avem valorile: 3, 1, 3, 4, 4, 2, 4, 3, 2, 2; media va fi 2,8
rezultat fr semnificaie!
Scala ordinal/ de ratinguri:
Proprietate: identificare + ordonare;
Sunt msurate variabilele nenumerice, dar care pot fi ordonate!
Unitile pot fi niruite una dup cealalt, realizndu-se astfel o ierarhizare a acestora;
Distana dintre numere nu este neaprat egal;
Numerele pe scala ordinal nu reprezint intervale egale pe scala de msurare;
Scala de intervale/ cardinal:
Proprietate: identificare + ordonare + intervalul ntre numere are un sens ( se poate
compara diferena dintre numere);
Prima scal cu adevrat numeric ce folosete uniti de msurare egale;
Este posibil interpretarea ordinii notrilor pe scal precum i diferenele dintre ele;
Intervalele de pe scal se presupun a fi egale!
Absena punctului zero absolut chiar dac unui punct de pe scal i se atribuie valoarea
zero, acest lucru nu reprezint absena absolut a caracteristicii msurate; exemplu: scala
Celsius sau Fahrenheit au valoarea 0 dar asta nu semnific absena complet a cldurii;
Nu pot fi fcute judeci comparative pentru compararea valorilor specifice msurate pe o
scal de interval;
Scala proporional/ de raport:
Proprietate: identificare + ordonare + intervalul ntre numere are un sens ( se poate
compara diferena dintre numere) + zero absolut;
Pot fi fcute judeci comparative pentru compararea valorilor specifice msurate pe o
scal de interval;
Exist un punct zero fix i absolut sugereaz absena total a caracteristicii sau nsuirii
care este studiat; exemplu: scala pentru greutate, lungime;
Scala de intensitate:
Folosit pentru msurarea i compararea opiniilor, a comportamentelor;
Exemplu: scala de opinie a lui Ilse Krasemann:
-10 0 +10

Maximum de intensitate contra Abinere Maximum de intensitate pentru


Scala de opinie:
Scal cvasimetric
Punctul 0 exprim inexistena opiniei;
Puncte pozitive i negative exprim i msoar intensitatea opiniei subiecilor
anchetai;
n marketing se numete scal de rating;
Sunt fixate de la 4 la 10 gradaii pentru a facilita ierarhizarea rspunsurilor;
Exemplu: pentru 5 trepte, gradaiile pot fi formulate astfel:
Coincide perfect
Coincide parial
Coincide ntr-o oarecare msur
Coincide mai puin
Nu coincide deloc

Scala nominal + scala ordinal variabile nenumerice, discrete.

Scala de interval + scala de raport variabile discrete sau continue.

Aplicaie: Spunei tipul scalei de msurare n fiecare caz n parte:

Structura turistic de primire: hotel, han, pensiune, altele nominal


Deinerea de autoturism n proprietate: da, nu nominal
Profesie: inginer, economist, medic, altele nominal
Studii: primare, gimnaziale, liceale, universitare ordinal
Categorii ale hotelurilor: *, **, ***, ****, ***** ordinal
Temperatura interval
Timpul (n calendar) interval
Greutatea raport
Vrsta (n ani sau zile) raport
Salariul (n lei, euro, etc.) raport
Rezumarea tabelar a datelor

Pentru aceast parte (exemplul 1 + teorie) se va studia prezentarea ppt a cursului 2.

Exemplul 2: Datele de mai jos arat numrul de studeni care particip la cercul de economie n
cadrul a 20 de ntlniri diferite organizate pe parcursul semestrului:

27, 27, 38, 24, 33, 23, 15, 33, 20, 28, 22, 29, 17, 21, 34, 25, 28, 30, 32, 34.

Pe baza acestor date nu ne putem forma o idee clar a valorilor. Dac, de exemplu, cineva
dorete s determine care este intervalul n care se situeaz cea mai mare pondere a valorilor doar
privindu-le i va fi destul de dificil s fac acest lucru.
n aceast situaie ar fi recomandat s rezumm aceste date. Pentru rezumarea datelor construim
urmtoarele distribuii:
distribuia de frecven

Clase Frecvena absolut


Cel puin 15, dar sub 20 2
Cel puin 20, dar sub 25 5
Cel puin 25, dar sub 30 6
Cel puin 30, dar sub 35 6
Cel puin 35, dar sub 40 1

27, 27, 38, 24, 33, 23, 15, 33, 20, 28, 22, 29, 17, 21, 34, 25, 28, 30, 32, 34.

De cele mai multe ori la cercul de economie particip ntre 25 i 30 sau ntre 30 i 35 de studeni
distribuia de frecven relativ

Clase Frecvena relativ


Cel puin 15, dar sub 20 2:20=0,10
Cel puin 20, dar sub 25 5:20=0,25
Cel puin 25, dar sub 30 6:20=0,30
Cel puin 30, dar sub 35 6:20=0,30
Cel puin 35, dar sub 40 1:20=0,05

n 30% de ntlniri ale cercului de economie particip ntre 25 i 30 de studeni sau ntre 30 i 35
de studeni.
distribuia de frecven cumulativ

Clase Frecvena cumulativ


Mai puin de 20 2
Mai puin de 25 7
Mai puin de 30 13
Mai puin de 35 19
Mai puin de 40 20

distribuia de frecven cumulativ relativ

Clase Frecvena cumulativ relativ


Mai puin de 20 2:20 = 0,10
Mai puin de 25 7:20 = 0,25
Mai puin de 30 13:20 = 0,65
Mai puin de 35 19:20 = 0,95
Mai puin de 40 20:20 = 1

Rezumarea grafic a datelor:


Pentru a realiza reprezentarea grafic a datelor folosind Excel 2007 procedm urmnd de fiecare
dat (aproximativ) urmtorii pai:
insert graph aleg graficul corespunztor se va deschide un chenar alb;
design select data n chart data range voi selecta numai valorile numerice pe care vreau s le
reprezint grafic;
design select data n dreapta la edit selectez capul tabelului (intervalele, cuvintele
corespunztoare fiecrei seciuni reprezentate grafic);
layout axis table pun nume pentru axele graficului;
layout chart title pun nume graficului realizat;
design chart layouts ajustez forma graficului.
Reprezentarea grafic a unei variabile discrete
Exemplul 1: Se consider urmtoarea distribuie a angajailor unei firme dup numrul de copii:

Numr copii Numr angajai Frecvene cumulative


0 5 5
1 17 22
2 31 53
3 20 73
4 11 84
5 4 88
6 1 89
Total 89
Diagrama de dispersie

35

30

25

20
Numar angajati 15
Numr angajai
10

0
0 1 2 3 4 5 6 Total

Numar copii

Diagrama circular
Face parte din diagramele de structur.
Pentru exemplul precedent, permite vizualizarea frecvenelor relative (exprimate %) a angajailor
cu 0, 1, 2, 3, 4, 5 i 6 copii.

5; 4% 6; 1% 0; 6%
4; 12% 1; 19%

3; 22%

2; 35%

Interpretare: 35% dintre angajaii firmei au 2 copii, 22% au 3 copii, 1% au 6 copii, etc.
Reprezentarea grafic a unei variabile continue
Exemplul 2: Se consider datele privind vrsta cadrelor didactice dintr-o facultate. Caracteristica
vrst poate fi considerat ca fiind o variabil continu.

Grupe cadre didactice Frecvena absolut Frecvena cumulativ Frecvena cumulativ


dup vrst (ani) (cresctor) (descresctor)
20 30 10 10 73
30 40 14 24 63
40 50 25 49 49
50 60 16 65 24
60 70 8 73 8
Total 73

Interpretare:
25 dintre angajai au vrsta cuprins ntre 40 i 50 de ani.
65 dintre angajai au mai puin de 60 de ani.
73 dintre angajai au vrsta mai mare de 20 de ani.
Histograma

30

25

20

15
numar cadre didactice 10

grupe de varsta

Poligonul de frecven
30

25

20

15
numar cadre didactice 10

grupe de varsta

Interpretare: numrul angajailor cu vrsta de pn la 40 50 de ani este n cretere, n timp ce


numrul angajailor cu vrsta mai mare de 40 50 de ani este n descretere. Conform graficului,
cei mai muli angajai ai companiei au vrsta n intervalul 40 50 ani.
Curba cumulativ a frecvenelor (ogiva)

80
70
60
50
40
numar cadre didactice 30
20
10
0

grupe de varsta

Interpretare :observm o cretere nu foarte abrupt a numrului angajailor cu vrsta de pn la


40 de ani, apoi o cretere brusc a numrului celor cu vrsta ntre 40 i 50 si din nou o cretere
lent a celor cu vrsta de peste 50 de ani.
Grafice ale variabilelor calitative
Exemplul 3: Se consider informaiile privind componena pe funcii didactice universitare a
unui eantion utilizat la realizarea unui sondaj statistic referitor la utilizarea depozitelor digitale
pentru producia tiinific a Universitii Transilvania din Braov, anul 2010.

Funcia Asistent Lector Profesor Confereniar Total


universitar
Numr cadre 82 82 57 49 270
didactice, f_i
Frecvene 30% 30% 22% 18% 100%
relative f_i*
Frecvene 30% 60% 82% 100% -
relatice
cumulative
f_i*_c

Graficul de tip coloan

90
80
82 82
70
60
50 57
numar persoane 40 49

30
20
10
0
Asistent Lector Profesor Confereniar

functii didactice

Interpretare : Numrul asistenilor i lectorilor este egal. n cadrul Universitii Transilvania din
Braov, n anul 2010 erau mai muli asisteni i lectori dect profesori, mai muli profesori dect
confereniari.
Graficul de tip pie (plcint)
Confereniar; 18%
Asistent; 30%

Profesor; 21%

Lector; 31%

Interpretare: procentul asistenilor i lectorilor din cadrul Universitii Transilvania din Braov
era egal cu 30% n anul 2010; procentul profesorilor era de 22%; procentul confereniarilor era
de 18%.
Grafice ale variabilelor cantitative
Modalitile de reprezentare grafic a datelor statistice sunt numeroase. Trebuie aleas forma
corspunztoare scopului pentru care se ntocmete graficul.

Diagrama n bare de structur


Exemplul 4: consumul a trei produse A, B, C, n judee limitrofe: X, Y, Z, este urmtoarea:

Jude/ Produs A B C Total consum


X 115 145 240 500
Y 216 240 344 800
Z 114 174 312 600

Jude/ Produs A (%) B (%) C (%) % pe jude


X 23 29 48 100
Y 27 30 43 100
Z 19 29 52 100
Z

Y
judete

0% 20% 40% 60% 80% 100%

ponderi (%)

Diagrama n form de bare

Y
judete

0 50 100 150 200 250 300 350 400

consum
100%
90%
80%
70%
60%
50%
ponderea (%)
40%
30%
20%
10%
0%
X Y Z

judete

Grafice cu coordonate logaritmice


Efectum logaritmarea valorilor i folosim acest tip de reprezentare grafic atunci cnd
amplitudinea caracteristicii analizate este foarte mare. Scara aritmetic este transformat n scar
logaritmic i se obine corespondena urmtoare:

Scara logaritmic Scara aritmetic


Log 1000 3
Log 100 2
Log 10 1
Log 1 0

Graficele care utilizeaz aceast coresponden a scrilor logaritmic i aritmetic se numesc


semi-logaritmice.
Exemplul 5: O companie deine urmtoarea cifr de afaceri (CA) ealonat pe luni i prezentat
n tabelul urmtor:

Luni ian feb mart apr mai iun iul aug sept
CA 25 53 130 280 500 1400 3000 7800 15000
Log 1,40 1,72 2,11 2,45 2,70 3,15 3,48 3,89 4,18
CA
16000
14000
12000
10000
8000
mil. lei
6000
4000
2000
0
ian feb mart apr mai iun iul aug sept

luni

4.5
4
3.5
3
2.5
log mil. lei 2
1.5
1
0.5
0
ian feb mart apr mai iun iul aug sept

luni

Grafice circulare
Pot fi sub form de figuri geometrice plane cercul sau a unor figuri n spaiu plcint (pie)
i colac (doughnut).
Exemplul 6: Folosim informaiile din exemplul 2 privind structura pe grupe de vrst a cadrelor
didactice.

Grupe cadre Frecvena Frecvena Sectorul


didactice dup absolut relativ circular
vrst (ani) =B2/73*100 =C2/100*360
20 30 10 13.70 49
30 40 14 19.18 69
40 50 25 34.25 123
50 60 16 21.92 79
60 70 8 10.96 39
Total 73 100.00

60 70; 11% 20 30; 14%

50 60; 22% 30 40; 19%

40 50; 34%

60 70; 11%20 30; 14%

50 60; 22%
30 40; 19%

40 50; 34%
60 70; 11% 20 30; 14%

50 60; 22%
30 40; 19%

40 50; 34%