Sunteți pe pagina 1din 32

Variabile statistice

(clasificare, indicatori)

Definiii
caracteristic sau variabil statistic proprietate n functie de care se cerceteaza o populatie statistica i care, n general, poate fi msurat, cptnd valori diferite de la un individ la altul; valoare (stare, realizare) forma concret de manifestare a unei variabile statistice pentru un individ; scal totalitatea valorilor diferite ale unei caracteristici sau intervalul n care se conin acestea (domeniu de valori al variabilei); msurare procesul prin care se obin valorile variabilelor sau atribuirea de valori caracteristicilor indivizilor potrivit unor reguli; cercetare studiul variabilelor i a relaiilor dintre ele.

Clasificarea variabilelor dup modul de exprimare


variabile calitative variabile, valorile crora sunt exprimate prin cuvinte care desemneaz apartenena individului la una din categoriile scalei (exemple: sexul, calificativul, profesia, starea civil etc.). Variabilele calitative sunt de 2 tipuri: nominale i ordinare. variabile cantitative variabile, valorile crora se exprim numeric (exemple: vrsta, salariul, inaltimea etc.). Variabilele cantitative sunt de 2 tipuri: de interval i de raport.

Clasificarea variabilelor dup numrul de valori (sau a variantelor de rspuns)


dihotomice (binare, alternative) variabile calitative scala crora e compus din 2 valori antonime (da nu, prezent absent, aprins stins etc.). Noiunea de variabil binar provine de la codificarea valorilor acestora cu 0 i 1. Codificarea prin 0/1 permite utilizarea acestor variabile n proceduri dedicate nivelurilor mai nalte de msurare (ordinal, interval). nealternative (categoriale) celelalte variabile calitative, ce nu posed proprieti ale variabilelor dihotomice.

Clasificarea variabilelor dup modul de obinere

primare variabile obinute n etapa de culegere a datelor (exemplu: vrsta nregistrat n ani, notele primite la examenele din sesiune etc.); derivate (auxiliare) variabile obinute n urma procesului de prelucrare a variabilelor primare (exemplu: vrsta calculat pe grupe de vrst, nota medie la sesiune etc.).

Clasificarea variabilelor dup natura variaiei caracteristicii numerice

continue, care pot lua orice valoare din scala lor de variaie (exemple: nlime, greutate, cifr de afaceri etc.); discrete, care nu pot lua dect anumite valori pe scala lor de variaie, de regul numere ntregi (exemple: numrul de copii dintr-o familie, numrul de sate dintr-un raion etc.).

Variabile nominale
- variabile calitative care pot lua un numr finit de valori neordonate sau variabile, ce permit doar clasificarea observaiilor.
Observaie: n vederea prelucrrii, valorile variabilelor nominale se codific, de regul, cu numere ntregi. n acest caz nivelul de msurare (tipul variabilei) nu se modific prin utilizarea unei astfel de codificri.

Variabile ordinare
- variabile calitative ale cror valori sunt ordonate dar nu este definit (nu se poate defini) distana dintre oricare dou valori.
Observaie: la codificarea valorilor (ordonate) ale variabilelor ordinare se folosesc iruri ordonate de numere ntregi.

Variabile de interval
- variabile cantitative (numerice), utiliznd o valoare 0 convenional. La compararea valorilor gsim rspuns la ntrebri de tipul: Cu ct e mai mare? sau Cu ct e mai mic?
Observaie: valorile variabilelor numerice nu se codific: n calitate de cod se ia chiar valoarea variabilei.

Variabile de raport
- variabile cantitative (numerice), utiliznd o valoare 0 natural. La compararea valorilor gsim rspuns i la ntrebri de tipul: De cte ori e mai mare? sau De cte ori e mai mic?
Observaie: valoarea 0 indic inexistena variabilei.

Notri
n numrul indivizilor cercetai; X o caracteristic studiat; x1, x2,,xm valorile caracteristicii X; n1, n2,...,nm numrul de indivizi corespunztor valorilor caracteristicii (sau care posed valoarea respectiv a caracteristicii).

Frecvene definiii i calculare (I)


Se numete frecven absolut a unei valori xi a caracteristicii, numrul de uniti ale populaiei ni corespunztoare acestei valori. Se numete frecven relativ a unei valori xi a caracteristicii raportul dintre frecventa absolut ni a valorii xi i numrul total al indivizilor n. Frecvenele relative exprimate n procente se mai numesc frecvene procentuale. Ele se calculeaz dup formula:

ni f i = 100% n

Frecvene definiii i calculare (II)


Se numete frecven cumulat procentul de indivizi ce se gsesc pn la sau sub o treapt (valoare) a scalei. Ea se calculeaz dup formula:

n1 + n2 + n3 + ... + ni Fi = 100% = f1 + f 2 + f 3 + ... + f i n


Observaie: frecvenele cumulate au sens pentru variabilele ordinare i cele cantitative.

Distribuii de frecvene
Un tabel de forma:

X F

x1 f1

x2 f2

x3 f3

... ...

xm fm

poart denumirea de distribuie de frecvene.

Exerciiu: de construit distribuia de frecvene a culorilor bilelor observate

Distribuia de frecvene a culorilor bilelor

Culoare Frecvene absolute Frecvene relative (procentuale)

40% 20% 30% 10%

Reprezentarea grafic a distribuiilor de frecvene (I)


9 8 7 6 5 4 3 2 1 0 Albastr Roie Galben Neagr

Reprezentarea grafic a distribuiilor de frecvene (II)


Neagr 10%

Albastr 40%

Galben 30% Roie 20%

Indicatori ai variabilelor nominale


n calitate de indicator al tendinei centrale se utilizeaz modulul sau moda (Mo) categoria cu cea mai mare frecven. n calitate de indicator al mprtierii se utilizeaz Indicele variaiei calitative (IVC) raportul dintre variaia distribuiei observate i variaia distribuiei uniforme.

Determinarea indicatorilor pentru exemplul analizat


Modulul categoria A (bila albastr) Pentru determinarea IVC se iau distribuiile: - observat: { 8, 4, 6, 2 } i - uniform: { 5, 5, 5, 5 }. Atunci:
IVC = 8 (4 + 6 + 2) + 4 (6 + 2) + 6 2 100% 93.3% 5 (5 + 5 + 5) + 5 (5 + 5) + 5 5

Indicatori ai variabilelor ordinare


Tendina central: modulul (Mo); mediana (Me) valoarea din mijloc a irului ordonat (n cretere sau descretere) de valori ale caracteristicii. Indicator al mprtierii: indicele variaiei calitative (IVC). Forma distribuiei de frecvene: simetric (Mo=Me) sau asimetric (MoMe).

Exemplul 1

(n ce msur suntei mulumit de...?)


1 foarte nemulumit (3) 2 nemulumit (7) 3 indiferent (10) 4 mulumit (7) 5 foarte mulumit (3) Mo = indiferent Me = indiferent IVC = 63,3% Distribuia - simetric
10 8 6 4 2 0 f. nemult. nemult. indiferent f. mult. mult.

Exemplul 2

(n ce msur suntei mulumit de...?)


1 foarte nemulumit (3) 2 nemulumit (5) 3 indiferent (8) 4 mulumit (10) 5 foarte mulumit (4) Mo = mulumit Me = indiferent IVC = 63,3% Distribuia - asimetric
10 8 6 4 2 0 f. nemult. nemult. indiferent f. mult. mult.

Indicatori ai tendinei centrale pentru variabile cantitative


modulul (Mo) se calculeaz numai dup ce variabila se transform n una ordinar cu scal de intervale; mediana (Me) valoarea din mijloc a irului ordonat (numrul de valori impar) sau media aritmetic a celor dou valori din mijlocul irului ordonat (numrul de valori par); media (M) media aritmetic a irului de valori ale caracteristicii, calculat dup formula:

x1 + x2 + x3 + ... + xn 1 n M= = xi n n i =1

Indicatori ai mprtierii pentru variabile cantitative


Amplitudinea:

A = xmax xmin
( xi M ) 2
i =1 n

Dispersia (abaterea standard):

Calcularea indicatorilor n Excel


Modulul Mediana Media Amplitudinea Dispersia Frecvena =MODE(domeniu) =MEDIAN(domeniu) =AVERAGE(domeniu) =MAX(domeniu)-MIN(domeniu) =STDEV(domeniu) =FREQUENCY(domeniu,limite)

Notri: domeniu domeniul de celule n care se gasesc datele analizate; limite domeniu ce conine capetele intervalelor, n care se calculeaz frecvenele

Calcularea indicatorilor n SPSS (1)

Calcularea indicatorilor n SPSS (2)

Lista variabilelor transferate spre a fi prelucrate

Lista tuturor variabilelor din baza de date

Calcularea indicatorilor n SPSS (rezultate)

Exerciiu
Notele la examen a unei grupe de studeni sunt urmtoarele:
7, 5, 7, 8, 4, 6, 8, 2, 7, 1, 8, 10, 9, 7, 9, 6, 4, 2, 3, 7

S se determine frecvenele i indicatorii statistici ai acestei variabile.

Rspuns
Se aranjeaz irul n cretere: 1, 2, 2, 3, 4, 4, 5, 6, 6, 7 7, 7, 7, 7, 8, 8, 8, 9, 9, 10
Distribuia de frecvene:
Nota

ni

1 1

2 2

3 1

4 2

5 1

6 2

7 5

8 3

9 2

10 1

Mo=7; Me=7; M=6 =638

Indicatori ai variabilelor statistice (recapitulare)


Indicatori ai tendinei centrale
Modul
Nominale

Indicatori de dispersie
IVC Amplitudine Dispersie

Median

Medie

X X X X X X

X X X X

Ordinare

Numerice