Documente Academic
Documente Profesional
Documente Cultură
discrete continue
Cunoaşterea tipurilor de variabile este necesară atât în etapa de codificare a acestora,
cât şi în momentul prelucrării lor. Unele fenomene economice pot fi direct măsurabile cantitativ, în
timp ce altele necesită atribuirea unei valori unităţilor statistice ale unei colectivităţi observate
după o caracteristică. Diferenţierea valorilor se face prin intermediul scalei de măsurare.
Tipuri de scală:
- scala nominală – are o singură proprietate – identitatea – care exprimă apartenenţa
elementelor la o categorie. Presupune o categorizare a variabilei fără a indica o anumită ordine ori
cantitate. Variabilele sex: masculin vs. feminin; starea civila: căsătorit, divorţat, văduv, necăsătorit;
reprezintă exemple de scală nominala. Ele pot fi notate cu cifre (0-feminin; 1-masculin) însa
acestea nu pot fi procesate în termeni de cantitate sau ordine;
- scala ordinală – permite să se claseze elementele observate conform unei ordini,
preferinţe. Un exemplu este locul ocupat de cineva la o competiţie (primul, al doilea, …, ultimul).
În acest caz, numerele pot fi comparate între ele în termeni de "mai mult, mai puţin sau egal";
- scala de interval – pe lângă proprietăţile de identitate şi ordine, este caracterizată şi de
faptul că intervalul între numere are un sens, fapt ce permite să se compare diferenţele între
numere. Într-o astfel de scală, punctul 0 (zero) nu este dat în mod natural, adică este ales arbitrar.
Ex: temperatura 0 nu e lipsa temperaturii, e doar punctul de îngheţ al apei. Exemplul clasic îl
constituie măsurarea temperaturii în cele două sisteme, Celsius şi Fahrenheit, fiind posibilă
trecerea de la un sistem de măsurare la altul;
- scala raport – folosită tot pentru variabile cantitative, având ca şi caracteristică faptul că
posedă un 0 absolut care înseamnă lipsa caracteristicii sau proprietăţii respective. Ex: bani (venit),
masă (greutate), lungime, timp de reacţie, etc. De exemplu un venit de 0 lei înseamnă inexistenţa
unui venit;
- scala de intensitate – este frecvent folosită în cercetările de marketing pentru măsurarea şi
compararea opiniilor ( scala de opinie), a comportamentelor. Ex: întrebare de opinie: "Ce părere
aveţi despre un nou produs?" Variantele posibile sunt: "Foarte bună", "Bună", "Nici bună nici
proastă", "Proastă", "Foarte proastă". Scala de opinie ( scală de rating ) este o scală cvasimetrică.
Se caracterizează prin punctul 0 care exprimă inexistenţa opiniei şi un număr de puncte, în sens
pozitiv şi negativ pentru a măsura gradele de intensitate a opiniilor.
Observaţie: pentru a alege metoda statistică adecvată în fiecare caz, trebuie să ştim în primul rând
cum au fost obţinute datele (scala utilizată).
I.2. Codificarea şi introducerea datelor în SPSS
Etapa de pregătire a setului de date implică operaţia de codificare a acestora în foaia
de lucru Variable View şi de introducere a răspunsurilor în fereastra Data View.
A.2. Grafice – graficele adecvate variabilelor ale căror stări sunt exprimate prin
cuvinte sunt diagramele de structură. Din meniul Graphs se alege opţiunea Pie ( cerc de structură )
linia de studiu
maghiara
11.5%
88.5%
Ex: aveti restante acumulate din anii precedenti de
studiu
Frequency Percent Valid Cumulative Interpretare: la această întrebare au
Percent Percent răspuns doar 173 de persoane, din care
Valid nu 128 73.6 74.0 74.0
da 45 25.9 26.0 100.0
128 nu au restanţe din anii precedenţi,
Total 173 99.4 100.0 ceea ce reprezintă 73,6% din totalul
Missin System 1 .6 celor chestionaţi.
g
Total 174 100.0
aveti restante acumulate din anii precedenti de studiu
da
26.0%
nu
74.0%
Util în acest sens este şi graficul care redă structura eşantionului în raport cu
variabila luată în studiu
II.B. Analiza unei variabile ordinale
B.1. Tabele de frecvenţe
În meniul Analyze – Descriptive Statistics – Frequencies introducem o variabilă
ordinală, ex: media anului precedent:
media anului precedent
Frequency Percent Valid Cumulative Interpretare: cei mai mulţi studenţi (97) au
Percent Percent o medie cuprinsă în intervalul 7-9, ceea ce
Valid sub5 1 .6 .6 .6
5-7 16 9.2 9.3 9.9
reprezintă 55,7% din totalul celor care au
7-9 97 55.7 56.4 66.3 răspuns la această întrebare. Se observă că
9-10 58 33.3 33.7 100.0 66,3% din totalul repondenţilor au o medie
Total 172 98.9 100.0 anuală de cel mult 9 ( frecvenţe relative
Missing System 2 1.1 cumulate ).
Total 174 100.0
40
30
20
10
Percent
0
sub5 5-7 7-9 9-10
40
Test
Value = 0
t df Sig. (2- Mean 95% Confidence
tailed) Differe Interval of the
nce Difference
Lower Upper
333.047172 .000 22.01 21.88 22.14
III.1.2. Elaborarea intervalului de încredere a valorii medii în
ipoteza organizării unui sondaj aleator stratificat – în meniul Analyze – Compare
Means – One-way Anova introducem variabila cantitativă „vârsta”, dependentă de variabila factor
de grupare „specializarea”.
N Mean Std. Std. Error 95% Confidence Interval for Minimum Maximum
Deviation Mean
Lower Upper
Bound Bound
CIG 25 21.72 .46 9.17E-02 21.53 21.91 21 22
REI 18 21.89 .32 7.62E-02 21.73 22.05 21 22
FB 27 21.89 .75 .14 21.59 22.19 21 24
MK 24 22.29 .95 .19 21.89 22.69 21 26
MG 26 22.15 1.32 .26 21.62 22.69 21 28
IE 27 22.07 1.07 .21 21.65 22.50 20 24
SPE 12 22.17 .58 .17 21.80 22.53 21 23
ECTS 7 21.71 .49 .18 21.26 22.17 21 22
EA 7 22.14 .69 .26 21.50 22.78 21 23
Total 173 22.01 .87 6.61E-02 21.88 22.14 20 28
III.2. Teste de semnificaţie
III.2.1. Testarea semnificaţiei unei medii – face parte din grupa testelor
parametrice. Folosind şirul de comenzi Analyze – Compare Means – One Sample T Test
introducem variabila „vârsta” pentru care avem valoarea medie observată egală cu 22,01 ani;
dorim să verificăm dacă vârsta persoanelor din eşantionul observat diferă semnificativ de valoarea
25 de ani ( test value=25). Formulăm ipoteza nulă:
H 0 : X = 25 (vârsta medie nu diferă semnificativ de valoarea de 25 de ani)
H 1 : X ≠ 25
Interpretare: proporţia observată în eşantion pentru grupa 1 ( anul 4 ) este de 90%, proporţia
specificată fiind de 50%. Valoarea Sig <0,01, astfel că putem concluziona, cu o încredere de 99%,
că proporţia studenţilor din anul 4 diferă semnificativ de proporţia specificată.
III.3. Teste de concordanţă – fac parte din categoria testelor neparametrice.
III.3.1.Verificarea normalităţii unei distribuţii – modelarea statistică
cere verificarea ipotezei de normalitate a variabilelor. Astfel, este foarte important ca înaintea
inferenţei statistice să se verifice normalitatea distribuţiei populaţiei. Pe lângă vizualizarea
histogramei şi a valorilor coeficienţilor de asimetrie şi boltire, în SPSS există posibilitatea aplicării
testului Kolmogorov – Smirnov, astfel: Analyze – Nonparametric Test – One Sample Kolmogorov-
Smirnov Test:
varsta Formulăm ipoteza nulă H 0 : între cele 2 distribuţii,
N 173
Normal Mean 22.01
cea teoretică şi cea empirică nu există diferenţe
Parameters semnificative ( populaţia este normal distribuită în
Std. Deviation .87 raport cu variabila „vârsta “), cu alternativa că
Most Extreme Absolute .332 variabila nu urmează o lege normală.
Differences Interpretare: nivelul gradului de semnificaţie, Sig <
Positive .332
Negative -.292 0,05 conduce la respingerea ipotezei nule, distribuţia
Kolmogorov- 4.365
Smirnov Z studiată diferă semnificativ de forma distribuţiei
Asymp. Sig. (2- .000
tailed) normale.
III.3.2. Verificarea uniformităţii unei distribuţii – se utilizează testul neparametric χ 2 ,
care presupune următorul demers: Analyze – Nonparametric Tests – Chi Square Test.
30
20
10
daca ar fi a alegeti
Count
aceeasi
0 alta
CIG FB MG SPE EA
REI MK IE ECTS
ce specializare urmati?
H 0 : χ 2 = 0 ( nu există legătură )
H1: χ2 ≠ 0
Valoarea coeficientului de contingenţă este de 0,373, fiind semnificativ diferit de 0, deci legătura
dintre variabile este de intensitate medie.
IV.2. Cazul a două variabile ordinale
1. Tabele de repartiţie bidimensionale – şi în acest caz prezintă
importanţă repartiţia eşantionului în raport cu cele variabile atât sub forma frecvenţelor absolute,
cât şi relative. Această prezentare a datelor presupune următorii paşi: Analyze – Descriptive
Statistics – Crosstabs, în fereastra Cells alegând şi opţiunea Percentages. Cele două tipuri de
frecvenţe, absolute şi relative, se pot prezenta în acelaşi tabel de repartiţie.
2. Grafice – informaţii privind repartiţia eşantionului în raport cu două
variabile ordinale sunt disponibile şi din vizualizarea graficului adecvat – diagrama prin benzi.
Modul de obţinere a acestuia este: Graphs – Bar – Clustered.
70
60
50
40
sub5
20
5-7
10
7-9
Count
0 9-10
1 2 3 4 5 6 7 8
12
10
0
0 2 4 6 8 10 12 14 16 18 20
H1: X 1 ≠ X 2
0
1
2
3
4
5
6
7
sub5