Sunteți pe pagina 1din 67

Tipuri de date i scale de msurare

Rezumarea tabelar a datelor statistice


Rezumarea grafic a datelor statistice

univariate se refer la o singur


variabil statistic; avem o singur
informaie pentru fiecare unitate
statistic;
bivariate se refer la dou variabile
statistice; avem 2 informaii pentru
fiecare unitate statistic;
multivariate se refer la 3 sau mai multe
variabile statistice; avem deci mai multe
informaii pentru fiecare unitate statistic;

Reprezint trstura, proprietatea,


nsuirea comun tuturor unitilor unei
colectiviti i care variaz, ca nivel,
variant sau valoare, de la o unitate a
colectivitii la alta.
Se mai numete i variabil statistic
sau variabil aleatoare.

Caracteristici calitatative/ categoriale/


nominale

exprimate prin cuvinte;


exemplu: rspunsurile da/ nu la un chestionar,
culoarea ochilor, preferina pentru o anumit
revist, etc.

Caracteristici cantitative/ numerice

exprimate prin cifre;


exemplu: nlimea, vrsta, greutatea, profitul,
salariul, etc.

Caracteristici alternative (binare sau dihotomice)

Caracteristici nealternative

pot lua doar 2 variante de rspuns;


exemplu: adevrat/ fals, da/ nu, genul (masculin/ feminin), stagiul
militar (efectuat/ neefectuat), starea civil (cstorit/ necstorit);
cele care pot lua mai multe valori de rspuns;
exemplu: profesie, salariu, cifr de afaceri, localitate de domiciliu;

Observaie:

o caracteristic nealternativ se poate transforma n una


alternativ printr-un proces de dihotomizare;
exemplu: salariu de pn la 4000 lei/ de peste 4000 lei; localitate
de domiciliu Bucureti/ alt localitate, etc.

Caracteristici continue

sunt reprezentate de valori ce nu pot fi


cuantificate cu exactitate (aparin unui interval);
exemplu: greutatea, timpul, volumul, distana,
etc.

Caracteristici discrete

sunt reprezentate de valori ce pot fi cuantificate


cu exactitate;
exemplu: numrul rspunsurilor corecte la test,
numrul studenilor din sal, numrul notelor de
10 din catalog, numrul lunilor n care firma
nregistreaz profit, etc.

De timp;

De spaiu;

exemplu: anul naterii, anul nfiinrii firmei,


luna nregistrrii celui mai mare profit;
exemplu: localitatea de domiciliu;

De atribuire

variabila reprezint un atribut altul dect


locul i timpul;
exemplu: ncasrile, profitul;

Primare

obinute dup etapa culegerii datelor


statistice;

Derivate

obinute n procesul prelucrrii variabilelor


primare.

Sunt msurate variabilele nenumerice!


Se face o difereniere de specie dar nu i de grad;
Nu se pot face diferene ntre clase i nici nu se
poate face o ordonare ntre categorii;
Exemplu: ocupaia, genul, statutul marital, tipul de
asigurare, etc;
Chiar dac le sunt asociate numere, variabilele sunt
tot categriale NU le prelucrm aritmetic;

Exemplu: atribuim valorile: 1 actor, 2 numcitor, 3 inginer, 4


economist; pentru 10 persoane chestionate avem valorile: 3, 1, 3,
4, 4, 2, 4, 3, 2, 2; media va fi 2,8 rezultat fr semnificaie!

Proprietate: identificare;

Sunt msurate variabilele nenumerice, dar care pot


fi ordonate!
Unitile pot fi niruite una dup cealalt,
realizndu-se astfel o ierarhizare a acestora;
Exemplu: studiile
Distana dintre numere nu este neaprat egal;
Numerele pe scala ordinal nu reprezint intervale
egale pe scala de msurare;
Proprietate: identificare + ordonare;

Prima scal cu adevrat numeric ce folosete uniti de


msurare egale;
Este posibil interpretarea ordinii notrilor pe scal precum i
diferenele dintre ele;
Absena punctului zero absolut chiar dac unui punct de pe
scal i se atribuie valoarea zero, acest lucru nu reprezint
absena absolut a caracteristicii msurate;

exemplu: scala Celsius sau Fahrenheit au valoarea 0 dar asta nu semnific


absena complet a cldurii;

Nu pot fi fcute judeci comparative pentru compararea


valorilor specifice msurate pe o scal de interval;
Proprietate: identificare + ordonare + intervalul ntre numere
are un sens (se poate compara diferena dintre numere);

Pot fi fcute judeci comparative pentru compararea valorilor


specifice msurate pe o scal de interval;
Exist un punct zero fix i absolut sugereaz absena total a
caracteristicii sau nsuirii care este studiat;

exemplu: scala pentru greutate, lungime;

Proprietate: identificare + ordonare + intervalul ntre numere


are un sens (se poate compara diferena dintre numere) + zero
absolut;

Folosit pentru msurarea i compararea opiniilor, a


comportamentelor;
Exemplu: scala de opinie a lui Ilse Krasemann:

-10 = Maximum de intensitate contra


0 = Abinere
+10 = Maximum de intensitate pentru

Scal cvasimetric
Punctul 0 exprim inexistena opiniei;
Puncte pozitive i negative exprim i msoar intensitatea
opiniei subiecilor anchetai;
n marketing se numete scal de rating;
Sunt fixate de la 4 la 10 gradaii pentru a facilita ierarhizarea
rspunsurilor;
Exemplu: pentru 5 trepte, gradaiile pot fi formulate astfel:
Coincide perfect
Coincide parial
Coincide ntr-o oarecare msur
Coincide mai puin
Nu coincide deloc

Structura turistic de primire: hotel, han, pensiune, altele


Deinerea de autoturism n proprietate: da, nu
Profesie: inginer, economist, medic, altele
Studii: primare, gimnaziale, liceale, universitare
Categorii ale hotelurilor: *, **, ***, ****, *****
Temperatura
Timpul (n calendar)
Greutatea
Vrsta (n ani sau zile)
Salariul (n lei, euro, etc.)

Structura turistic de primire: hotel, han, pensiune, altele


nominal
Deinerea de autoturism n proprietate: da, nu nominal
Profesie: inginer, economist, medic, altele nominal
Studii: primare, gimnaziale, liceale, universitare ordinal
Categorii ale hotelurilor: *, **, ***, ****, ***** ordinal
Temperatura interval
Timpul (n calendar) interval
Greutatea raport
Vrsta (n ani sau zile) raport
Salariul (n lei, euro, etc.) raport

Datele referitoare la 80 de studeni


Volum mare de date
Incomoditate
Dac ne intereseaz ceva anume ? Ce
facem ?

Absolvent

Specializarea

Salariu iniial (lei)

Absolvent

Specializarea

Salariu iniial (lei)

Finane

1550

21

Management

1380

Management

1310

22

Marketing

1730

Management

1575

23

Management

1640

Marketing

1675

24

Contabilitate

2000

Contabilitate

1585

25

Marketing

1400

Marketing

1590

26

Management

1325

Management

1580

27

Contabilitate

1900

Contabilitate

1475

28

Marketing

1600

Management

1300

29

Contabilitate

1600

10

Finane

1650

30

Contabilitate

1555

11

Contabilitate

1565

31

Marketing

1700

12

Marketing

1320

32

Marketing

1380

13

Finane

1750

33

Management

1620

14

Contabilitate

1725

34

Contabilitate

1650

15

Marketing

1650

35

Contabilitate

2000

16

Management

1740

36

Finane

1455

17

Contabilitate

1650

37

Contabilitate

1625

18

Contabilitate

1875

38

Management

1340

19

Marketing

1620

39

Contabilitate

1530

20

Finane

1550

40

Finane

1410

Absolvent

Specializarea

Salariu iniial (lei)

Absolvent

Specializarea

Salariu iniial (lei)

41

Finane

1590

61

Management

1775

42

Contabilitate

1570

62

Finane

2025

43

Contabilitate

2015

63

Marketing

1450

44

Management

1620

64

Management

1425

45

Finane

1860

65

Management

1820

46

Marketing

1625

66

Management

1900

47

Management

2000

67

Contabilitate

1700

48

Marketing

1850

68

Management

1900

49

Finane

1640

69

Contabilitate

1475

50

Marketing

1900

70

Contabilitate

1850

51

Contabilitate

1450

71

Management

1500

52

Contabilitate

1815

72

Finane

1620

53

Marketing

1440

73

Management

1600

54

Management

1420

74

Finane

1580

55

Management

1550

75

Contabilitate

1705

56

Contabilitate

1550

76

Management

1780

57

Contabilitate

1660

77

Management

1400

58

Contabilitate

1760

78

Contabilitate

1550

59

Marketing

1550

79

Contabilitate

1390

60

Management

1650

80

Management

1600

Ci absolveni ai fiecrei specializri n


parte au fost chestionai?
Care este salariul cel mai mare?
Dar cel mai mic?
Crei specializri i aparine salariul
maxim/ salariul minim?
....

Una dintre cele mai utile metode de


rezumare a unei mulimi de date

Prezentare tabelar a unei mulimi de


date care arat frecvena de itemi din
fiecare dintre clasele diferite care au
fost luate n calcul

Salariul iniial (lei)

Numrul de absolveni

Cel puin 1300, dar sub 1400

Cel puin 1400, dar sub 1500

11

Cel puin 1500, dar sub 1600

17

Cel puin 1600, dar sub 1700

19

Cel puin 1700, dar sub 1800

10

Cel puin 1800, dar sub 1900

Cel puin 1900, dar sub 2000

Cel puin 2000, dar sub 2100

Total

80

Salariul iniial (lei)

Numrul de absolveni

Cel puin 1300, dar sub 1400

Cel puin 1400, dar sub 1500

Cel puin 1500, dar sub 1600

Cel puin 1600, dar sub 1700

Cel puin 1700, dar sub 1800

Cel puin 1800, dar sub 1900

Cel puin 1900, dar sub 2000

Cel puin 2000, dar sub 2100

Total

27

Salariul iniial (lei)

Numrul de absolveni

Cel puin 1300, dar sub 1700

55

Cel puin 1700, dar sub 2100

25

Total

80

Imagine neclar deoarece tabelul nu ofer


prea mult informaie

Specializarea absolvit

Frecvena

Contabilitate

27

Finane

12

Management

25

Marketing

16

Total

80

Nu exist reguli propriu-zise


Obiectivul este prezentarea datelor n form
tabelar astfel nct s conin ct mai
mult informaie i s nu dezinformeze
cititorul
Tabelul va fi imprit n mai multe clase
Dimensiunea claselor ar trebui s fie egal
Numrul claselor nu trebuie s fie nici prea
mare, nici prea mic

Ar fi ideal s avem ntre 5 i 20 de clase


Numrul total al claselor se calculeaz
folosind expresia: (cea mai mare valoare
cea mai mic valoare) / dimensiunea clasei
Fixm dimensiunea clasei 100
Valoare maxim 2025
Valoare minim 1300
(2025 - 1300) / 100 = 7,5
Considerm deci, 8 clase

Dup cum observm, n tabele avem


cel puin 1300 dar sub 1400, cel
puin 1400 dar sub 1500, ....
Avem deci intervalele [1300, 1400),
[1400, 1500), .....

Am determinat numrul i dimensiunea


claselor tabelului
Vom determina frecvena din fiecare
clas.
Vom pune cte o liniu vertical pentru
fiecare apariie i apoi le vom grupa
cte cinci, punndu-le n paranteze.
Tabelul 2.6

Salariul iniial (lei)

Liniue

Frecven

Cel puin 1300, dar sub 1400

(IIIII) III

Cel puin 1400, dar sub 1500

(IIIII) (IIIII) I

11

Cel puin 1500, dar sub 1600

(IIIII) (IIIII) (IIIII) II

17

Cel puin 1600, dar sub 1700

(IIIII) (IIIII) (IIIII) IIII

19

Cel puin 1700, dar sub 1800

(IIIII) (IIIII)

10

Cel puin 1800, dar sub 1900

(IIIII) I

Cel puin 1900, dar sub 2000

IIII

Cel puin 2000, dar sub 2100

(IIIII)

Total

80

8 absolveni au salariul iniial cuprins


ntre 1300 i 1400
Cei mai muli absolveni au un salariu
cuprins ntre 1600 i 1700

Distribuia de frecven discutat pn


acum a fost construit pe baza unor
date

Numerice sau cantitative (tabelele 2.2, 2.3,


2.4)
Calitative (tabelul 2.5)

Frecvena unei clase numrul total de


itemi din mulimea de date care aparin
clasei respective
Frecvena relativ a itemilor
fraciunea din totalul itemilor care
aparine unei anumite clase
Frecvena relativ a clasei = (Frecvena
clasei / n)

Salariul iniial (lei)

Frecvena

Frecvena relativ

Cel puin 1300, dar sub 1400

8/80 = 0,10000

Cel puin 1400, dar sub 1500

11

11/80 = 0,1375

Cel puin 1500, dar sub 1600

17

17/80 = 0,2125

Cel puin 1600, dar sub 1700

19

19/80 = 0,2375

Cel puin 1700, dar sub 1800

10

10/80 = 0,1250

Cel puin 1800, dar sub 1900

6/80 = 0,0750

Cel puin 1900, dar sub 2000

4/80 = 0,0500

Cel puin 2000, dar sub 2100

5/80 = 0,0625

Total

80

Specializarea

Frecvena

Frecvena relativ

Contabilitate

27

27/80 = 0,3375

Finane

12

12/80 = 0,1500

Management

25

25/80 = 0,3125

Marketing

16

16/80 = 0,2000

Total

80

0,0625 deci 6,25 % din cei 80 de


absolveni au salarii cuprinse ntre
2000 i 2100
0,3375 deci 33,75 % din cei 80
absolveni au studiat Contabilitatea

Ne referim la exemplul salariilor iniiale


ale absolvenilor facultii cu profil
economic
Au fost culese 80 de date, provenite de
la 80 de absolveni
Tabelul urmtor arat distribuia
cumulativ de frecven

Este una dintre variantele derivate din


distribuia de frecven
Este util uneori n procesul rezumrii unei
mulimi de date
cuprinde acelai numr de clase ca i
distribuia de frecven, doar c pentru
fiecare dintre aceste clase ea indic totalul
itemilor care sunt mai mici dect limita
superioar a clasei

Salariul iniial (lei)

Numrul de absolveni

Cel puin 1300, dar sub 1400

Cel puin 1400, dar sub 1500

11

Cel puin 1500, dar sub 1600

17

Cel puin 1600, dar sub 1700

19

Cel puin 1700, dar sub 1800

10

Cel puin 1800, dar sub 1900

Cel puin 1900, dar sub 2000

Cel puin 2000, dar sub 2100

Total

80

distribuia cumulativ de frecven

Salariul iniial (lei)

Frecvena absolut

Frecvena cumulativ

Mai mic de 1400

Mai mic de 1500

11

19

Mai mic de 1600

17

36

Mai mic de 1700

19

55

Mai mic de 1800

10

65

Mai mic de 1900

71

Mai mic de 2000

75

Mai mic de 2100

80

Clasele pentru distribuia cumulativ de


frecven nu au o limit inferioar,
Ele sunt deschise la valori orict de mici ale
itemilor
Dac avem informaii despre o distribuie de
frecven, putem calcula rapid distribuia
cumulativ de frecven prin simpla
nsumare a claselor de frecven

un numr de 55 dintre absolveni


ctig mai puin de 1700 lei
36 dintre acetia ctig mai puin de
1600 lei
19 ctig mai puin de 1500 lei
8 ctig mai puin de 1400 lei

dar nu fr s efectum o serie de calcule


suplimentare

distribuia cumulativ de frecven relativ


este cea care arat fraciunea itemilor a
cror valoare este mai mic dect limita
superioar menionat a clasei
poate fi obinut din distribuia de frecven
relativ n acelai mod n care distribuia
cumulativ de frecven se poate deduce din
distribuia de frecven

distribuia cumulativ de frecven


relativ poate fi obinut i prin
mprirea frecvenelor cumulative prin
numrul de itemi din mulimea de date.
Tabelul urmtor conine distribuia
cumulativ de frecven relativ pentru
salariile iniiale ale absolvenilor
facultii.

Salariul iniial (lei)

Frecvena cumulativ relativ

Mai mic de 1400

0,1000

Mai mic de 1500

0,2375

Mai mic de 1600

0,4500

Mai mic de 1700

0,6875

Mai mic de 1800

0,8125

Mai mic de 1900

0,8875

Mai mic de 2000

0,9375

Mai mic de 2100

1,0000

Frecvena, frecvena relativ, frecvena


cumulativ i distribuia cumulativ de
frecven relativ sunt proceduri tabelare de
rezumare a datelor
pot fi utilizate pentru creterea gradului de
nelegere a informaiilor coninute n
mulimea de date
Rezumarea grafic ofer adesea intuiii
suplimentare cu privire la natura mulimii de
date

histograma,
poligonul de frecven,
ogiva

Este cea mai obinuit form de reprezentare


grafic a distribuiei de frecven
Este construit prin plasarea claselor pe axa
orizontal i a frecvenelor pe axa vertical
Fiecare clas este reprezentat pe grafic ca
un dreptunghi care are baza n intervalul
corespunztor clasei i nlimea
corespunztoare frecvenei clasei respective

Salariul iniial (lei)

Numrul de absolveni

Cel puin 1300, dar sub 1400

Cel puin 1400, dar sub 1500

11

Cel puin 1500, dar sub 1600

17

Cel puin 1600, dar sub 1700

19

Cel puin 1700, dar sub 1800

10

Cel puin 1800, dar sub 1900

Cel puin 1900, dar sub 2000

Cel puin 2000, dar sub 2100

Total

80

salariile iniiale cu cea mai mare


frecven sunt repartizate n intervalul
1500 1700
frecvena salariilor descrete de o parte
i de alta a acestui nivel

este o alternativ la histogram, ca


manier de prezentare a distribuiei de
frecven n form grafic
valorile datelor sunt poziionate pe axa
orizontal i frecvenele pe axa
vertical

n loc s utilizm dreptunghiuri ca n cazul


histogramei, determinm punctul de mijloc al
clasei pe axa orizontal i reprezentm direct
punctul care corespunde acestui mijloc al
clasei i frecvenei clasei respective
Clasa de frecven zero este adugat de
fiecare dat n reprezentarea poligonului de
frecven de ambele pri ale acestuia
Poligonul de frecven este construit n final
prin unirea punctelor rezultate

Poligonul de frecven i histograma pe


care le-am reprezentat se bazeaz pe
distribuia de frecven
Le putem reprezenta pe baza
distribuiei frecvenei relative

Este reprezentarea grafic a unei


distribuii cumulative de frecven,
sau a unei distribuii cumulative de
frecven relativ
Valorile datelor sunt poziionate pe axa
orizontal i frecvenele cumulate pe
axa vertical

Un punct este reprezentat exact deasupra


fiecrei limite superioare a clasei, la
nlimea care corespunde frecvenei
cumulate pentru respectiva limit superioar
de clas.
Un punct suplimentar este apoi reprezentat
corespunztor limitei inferioare a primei
clase, la nlime zero deci pe axa
orizontal

Toate aceste puncte sunt unite printr-o


linie dreapt
Aceast linie dreapt permite
aproximarea frecvenei cumulative
ntre limitele claselor prin interpolare

frecvena cumulativ a salariilor iniiale pentru


suma de 1350 lei este de aproximativ 4

https://www.youtube.com/watch?v=jb
aXnT5CX18