Sunteți pe pagina 1din 10

Tipuri de variabile

Thorndike afirma ca "tot ceea ce exista se gaseste ntr-o anumita cantitate". McCall merge mai
departe afirmnd ca "tot ce se gaseste ntr-o anumita cantitate poate fi masurat".
Prin variabila se ntelege o anumita categorie care a fost cuantificata sau masurata. Cea mai
ntlnita clasificare a lor, mparte variabilele n patru tipuri: nominale (categoriale), ordinale, de
tip interval si de tip raport. Primele doua tipuri sunt calitative, ultimele doua cantitative
(numerice).
Scalele nominale reprezinta un prim mod de masurare a variabilelor. Presupune o categorizare a
variabilei fara a indica o anumita ordine ori cantitate. Variabila sex: masculin vs. feminin; Starea
civila: casatorit, divortat, vaduv, necasatorit; reprezinta exemple de scala nominala. Ele pot fi
notate cu cifre (0-feminin; 1-masculin) nsa acestea nu pot fi procesate n termeni de cantitate sau
ordine.
Scalele ordinale sunt tot calitative. n acest caz, numerele sunt ierarhii si exprima locul sau
ordinea ntr-un sir de date. Un exemplu banal este locul ocupat de cineva la o competitie anumita
(primul, al doilea, , ultimul). n acest caz, numerele pot fi comparate ntre ele n termeni de
"mai mult, mai putin sau egal". Trebuie nsa subliniata valoarea ordinala a numerelor. Daca un
subiect ocupa locul doi, nu putem spune ca el este la egala distanta ntre locul unu si locul trei.
Sa luam exemplul unui student care a obtinut 9,80 la examenul de admitere si a ocupat locul al
doilea. Locul unu ar fi ocupat de un alt student care a avut media de 9.85, n timp ce pe locul trei
s-a situat o persoana cu media 9.30. n cazul datelor ordinale, diferenta numerica n clasament nu
este necesar egala cu diferenta numerica exprimata n unitatea de masura utilizata n acel caz
(cinci sutimi, respectiv cincizeci de sutimi).
Cele doua tipuri de masuratori amintite pna acum presupun ntotdeauna utilizarea unor teste
statistice neparametrice.
Un al treilea tip de scala este de interval. Acest tip de masuratoare permite comparatia dintre
date. Diferenta dintre doua rezultate 4 si 2 este egala cu diferenta dintre 6 si 4. n cazul unui test
de inteligenta diferenta ntre 100 IQ si 50 IQ este egala cu diferenta dintre 100 IQ si 150 IQ.
Deficienta majora a acestei scale este ca valorile respective nu pot fi multiplicate sau divizate.
Astfel noi nu putem concluziona ca un subiect care a obtinut 150IQ este de 1,5 ori mai inteligent
dect un altul care a obtinut 100IQ si nici de 3 ori mai inteligent dect unul care a obtinut 50IQ.

Cele mai multe instrumente psihometrice sau educationale implicate n masurarea variabilelor
cognitive sau comportamentale se gasesc la aceste trei nivele (nominale, ordinale, de interval).
Un ultim tip de masuratori sunt scalele de raport. Acestea poseda toate calitatile unei scale de
interval si are n plus doua noi. Permite multiplicarea sau divizarea datelor (2 kg sunt jumatate
din 4kg si dublul unui kg). Acest tip de masurare indica de asemenea valoarea zero absolut, ce
arata lipsa totala a cantitatii masurate. Cele mai multe caracteristici fizice (greutate; naltime;
timp de reactie; nivelul adrenalinei) pot fi masurate astfel.
Ultimele doua tipuri de scale (de interval, respectiv de raport) sunt expresii cantitative ale
variabilelor care pot fi supuse analizei statisticii parametrice cu mici exceptii.
Pentru a aplica tehnicile de statistica parametrica n cazul variabilelor masurate prin scale
numerice (de interval sau de raport) trebuie sa vedem daca:

Variabilele implicate sunt distribuite normal n cazul esantionului selectat;

Dispersia variabilelor de interes n cadrul esantionului selectat trebuie sa fie


asemanatoare cu dispersia variabilei pentru ntreaga populatie care ndeplineste
caracteristicile esantionului.

n plus, unele metode parametrice necesita conditii suplimentare.


Daca conditiile sunt ndeplinite, este de preferat sa utilizam tehnicile parametrice (cantitative)
deoarece sunt mai solide. Aceasta nseamna cresterea sansei de a respinge o falsa ipoteza nula.

Organizarea datelor
Datele variabilelor pot fi prezentate fie simplu, fie grupat. Primul tip de organizare consta n
stabilirea frecventei de aparitie a fiecarei valori. Pentru aceasta este necesara o ierarhizare initiala
a valorilor n functie de marimea lor.
Sa presupunem ca au fost obtinute urmatoarele date ale variabilei studiate:
X = (7, 5, 7, 8, 4, 9, 8, 10, 5 3, 8, 10, 8, 7, 9, 6, 4, 7, 6, 1, 8, 6, 8, 7, 5, 7, 4, 7, 1, 9, 5, 8, 6, 7, 7).
n total sunt 35 de date strnse.
Pentru a organiza datele utiliznd o distributie simpla a frecventei sunt necesari urmatorii pasi:
2

1. Se cauta valorile extreme din sirul de date (valoarea cea mai mare si cea mai mica);
2. Se scriu toate valorile cuprinse ntre cele doua extreme ntr-o ordine descendenta pe o
coloana;
3. Se numara de cte ori apare fiecare valoare n sirul de date;
4. Se trece apoi n tabel, frecventa de aparitie a fiecarui numar.
n cazul de fata vom avea:

Valoarea X Frecventa f
1

10

2
N=35

Acest tip de grupare a datelor poate fi utilizata la fel de eficient si n cazul datelor de tip
categorial sau ordinal.
De exemplu, la ntrebarea unui psiholog preocupat de reclamele comerciale care sunt
caracteristicile produselor pe care clientii le pretuiesc cel mai mult s-au primit 20 de raspunsuri:
X = (calitatea, pretul, cantitatea, calitatea, pretul, calitatea, pretul, pretul, pretul, utilitatea,
calitatea, pretul, utilitatea, utilitatea, cantitatea, pretul, calitatea, calitatea,pretul, pretul).

Tabelul distributiei caracteristicilor produsului:

Caracteristica (x) Frecventa (f)


Cantitate

Calitate

Utilitate

Pret

9
N=20

Mult mai utilizata, este gruparea datelor pe intervale. Pentru aceasta vom tine cont de distributia
grupata a datelor, fiind necesara mpartirea valorilor n clase de intervale egale. Exista doua
metode principale de mpartire a datelor pe intervale.
Prima este propusa de Spatz (1997) are n vedere patru pasi de urmat:
1. Numarul de intervale trebuie sa fie ntre 10 si 20. Aceasta conditie are rolul de a
maximiza grafic conceptul de distributie normala a datelor. Un numar mai mic de clase
(intervale) conduce la o estompare grafica a distributiei normale a datelor. Un numar mai
mare de 20 de intervale ne apropie de distributia grafica simpla, eliminnd cstigul
realizat de gruparea datelor.
2. Stabilirea marimii intervalului (notat cu i). Trei sau cinci constitue marimea cel mai des
ntlnita a intervalelor. Daca un i de 5 produce mai mult de 20 de clase, atunci se trece la
o marime a intervalului superioara, de obicei 10 sau un multiplu de 10. Exista si cazuri n
care este nevoie de un interval i=2 pentru a pastra minimul de 10 intervale.
3. Primul interval ncepe cu o valoare multiplu de i ales. De exemplu, daca 22 este cel mai
mic rezultat, iar marimea intervalului este 3, atunci vom ncepe cu valoarea 21 deoarece
este multiplu de trei. O situatie diferita apare daca luam un i=5. n acest caz se
obisnuieste sa se utilizeze o valoare de start astfel nct mijlocul intervalului sa fie un
multiplu de 5. n cazul aminitit, n care 22 este cel mai mic rezultat, ar fi indicat sa se
porneasca de la 18 (intervalul ar fi 18-22), iar mijlocul sau 20 (multiplu de cinci).
4

4. Desi, se porneste de la valorile mici n stabilirea intervalelor, n tabel acestea sunt trecute
ntr-o ordine descrescatoare.

Vom ordona n continuare, rezultatele a 48 de subiecti.


X = (17, 12, 8, 5, 10, 12, 23, 21, 22, 11, 14, 20, 18, 17, 15, 14, 21, 7, 10, 14, 18, 23, 25, 18, 17,
16, 29, 14, 19, 6, 27, 15, 17, 19, 14, 16, 10, 24, 17, 19, 15, 16, 12, 4, 22, 31, 19, 18).
Vom parcurge urmatorii pasi:
1. Notam valorile extreme (4 si 31)
2. Calculam diferenta dintre cele doua valori = 27
3. Stabilim marimea intervalului astfel nct sa obtinem ntre 10 si 20 de intervale. Daca
mpartim 27 la 5 vom obtine 5,4 intervale, fapt de nedorit deoarece este prea departat de
numarul intervalelor dorite (10-20). Daca mpartim 27 la o alta marime (i=3) vom obtine
9 intervale. Deoarece patru (cea mai mica valoare) nu este multiplul lui trei va trebui sa
ncepem de la valoarea trei (chiar daca aceasta nu exista), ca urmare distanta dintre
valorile extreme se va mari cu o unitate si va deveni 28. mpartind din nou 28 la trei vom
obtine 9,33, o valoarea care ne lasa noua posibilitatea de a alege ntre o distributie cu 9
clase sau una cu 10.
4. Vom alege distributia cu 10 intervale, tinnd cont de recomandarea autorului acestui
algoritm, ca minumul intervalelor sa fie 10.
5. Sa ncepe de la capatul de jos al tabelului (de la valorile mai mici). n cazul de fata vom
porni de la trei, ca multiplu al marimii intervalului i=3) si vom scrie intervalele gasite. n
coloana a doua a tabelului vor fi trecute valorile centrale ale intervalelor. Toate intervalele
sunt egale n marime nsa pot diferi n ce priveste frecventa. Fiecare interval ncepe cu o
valoare divizibila cu marimea intervalului (i=3).
6. Se calculeaza frecventa de aparitie a tuturor valorilor cuprinse ntr-un interval si le trecem
n tabel n coloana trei.

Intervalul (I) Mijlocul clasei Frecventa (f)


30-32

31

27-29

28

24-26

25

21-23

22

18-20

19

15-17

16

11

12-14

13

9-11

10

6-8

3-5

O a doua posibilitate de a grupa datele pe intervale pleaca de la o formula matematica propusa de


Sturges:

Unde: i este lungimea recomandata a intervalului;


Xmax si Xmin sunt extremele valorilor sirului de date ordonate n ordine descrescatoare.
lg n este logaritm zecimal din numarul de date a sirului (volumul esantionului).
Dupa cum se observa n acest caz marimea intervalulelor nu depinde numai de amplitudine
(Xmax-Xmin), ci si de numarul de subiecti.
6

n cazul problemei date vom avea:


I = (31-4) / 1+3,322*lg 48 = 4,10
n aceasta situatie este recomandabila utilizarea unui interval cu o lungime de 4 sau 5 unitati (i =
4 sau 5). Se obisnuieste utilizarea intervalelor a caror lungime are o valoare impara pentru a
usura gasirea centrului intervalului. Ca urmare, utiliznd formula lui Sturges la aceleasi exemplu,
vom obtine n loc de zece intervale, doar sase, deoarce am ales un interval i=5. Mijlocul
intervalului este astfel ales nct sa pastreze propietatea de a fi multiplu al marimii intervalului
(n cazul dat multiplu de cinci). Distributia frecventelor datelor grupate n acest caz este:

Intervalul (i)

Mijlocul clasei Frecventa (f)

28-32

30

23-27

25

18-22

20

13

13-17

15

16

8-12

10

3-7

4
N= 48

Indiferent de modalitatea pe care o alegem pentru mpartirea datelor pe intervale, putem calcula
si frecventa cumulata.
Frecventa cumulata a unei clase este egala cu suma frecventelor din clasa respectiva si
frecventele din toate clasele cu valori inferioare. Astfel, pentru cazul de fata n cea de a doua
situatie vom avea:

Intervalul (i)

Mijlocul clasei f grupata f cumulata

28-32

30

48 (2+46)

23-27

25

46 (5+41)

18-22

20

13

41 (13+28)

13-17

15

16

28 (16+12)
7

8-12

10

12 (8+4)

3-7

Reprezentarea grafica a datelor


Desenele din statistica se numesc grafice. Acestea sunt modalitati imagistice de reprezentare a
datelor, fiind cu att mai sugestive si mai utile cu ct numarul de date colectate creste.
Exista mai multe tipuri de reprezentare grafica. Noi vom aborda urmatoarele forme grafice
adecvate statisticii descriptive: poligonul frecventelor, histogramele - pentru variabile cantitative
de tip interval ori rapoarte; histogramele si cercurile de tip "placinta" - pentru variabile calitative,
nominale.
Poligonul frecventelor
Este un grafic utilizat n cazul variabilelor cantitative. Un poligon al frecventelor presupune doua
axe (una orizontala Ox-abscisa, alta verticala Oy-ordonatata). Pe abscisa sunt trecute clasele
(intervalele) ori direct valorile sirului de date. Pe ordonata sunt trecute frecventele grupate sau
simple, corespunzatoare fiecarei clase (valori).
Utiliznd un sir de date prezentat anterior (n=48) care a fost mpartit n prealabil n 6 clase, vom
obtine urmatorul poligon al frecventelor ca reprezentare grafica a sirului de date.

Histogramele
Acest tip de grafic poate fi utilizat pentru variabile exprimate att cantitativ ct si calitativ.

Diferenta dintre cele doua tipuri de histograme consta n faptul ca pentru datele cantitative sunt
trecute pe ordonata frecventele grupate, n timp ce pentru datele calitative frecventele sunt
specificate paralel cu abscisa. Pe baza exemplelor date, vom construi doua histograme (una
pentru date cantitative sirul de date mpartit n 10 clase; cealalta pentru date calitative sirul de
date prezentat n cazul psihologului intersat de publicitate.

Graficul "placinta"
n cazul datelor calitative se utilizeaza frecvent un alt tip de reprezentare grafica sub forma unui
cerc "placinta" n engleza "pie".
Pentru exemplul dat n ce priveste caracteristicile produselor luate n considerare de catre
cumparatori vom avea:

10

S-ar putea să vă placă și