Sunteți pe pagina 1din 24

I.

Crearea unei baze de date n SPSS


I.1. Clasificarea i descrierea variabilelor statistice
n analiza statistic a datelor o importan deosebit o constituie clasificarea
variabilelor dup modul de exprimare a strilor:
cantitative ( metrice )
calitative
discrete

continue

Cunoaterea tipurilor de variabile este necesar att n etapa de codificare a acestora,


ct i n momentul prelucrrii lor. Unele fenomene economice pot fi direct msurabile cantitativ, n
timp ce altele necesit atribuirea unei valori unitilor statistice ale unei colectiviti observate
dup o caracteristic. Diferenierea valorilor se face prin intermediul scalei de msurare.
Tipuri de scal:
- scala nominal are o singur proprietate identitatea care exprim apartenena
elementelor la o categorie. Presupune o categorizare a variabilei fr a indica o anumit ordine ori
cantitate. Variabilele sex: masculin vs. feminin; starea civila: cstorit, divorat, vduv, necstorit;
reprezint exemple de scal nominala. Ele pot fi notate cu cifre (0-feminin; 1-masculin) nsa
acestea nu pot fi procesate n termeni de cantitate sau ordine;
- scala ordinal permite s se claseze elementele observate conform unei ordini,
preferine. Un exemplu este locul ocupat de cineva la o competiie (primul, al doilea, , ultimul).
n acest caz, numerele pot fi comparate ntre ele n termeni de "mai mult, mai puin sau egal";
- scala de interval pe lng proprietile de identitate i ordine, este caracterizat i de
faptul c intervalul ntre numere are un sens, fapt ce permite s se compare diferenele ntre
numere. ntr-o astfel de scal, punctul 0 (zero) nu este dat n mod natural, adic este ales arbitrar.
Ex: temperatura 0 nu e lipsa temperaturii, e doar punctul de nghe al apei. Exemplul clasic l
constituie msurarea temperaturii n cele dou sisteme, Celsius i Fahrenheit, fiind posibil
trecerea de la un sistem de msurare la altul;
- scala raport folosit tot pentru variabile cantitative, avnd ca i caracteristic faptul c
posed un 0 absolut care nseamn lipsa caracteristicii sau proprietii respective. Ex: bani (venit),
mas (greutate), lungime, timp de reacie, etc. De exemplu un venit de 0 lei nseamn inexistena
unui venit;
- scala de intensitate este frecvent folosit n cercetrile de marketing pentru msurarea i
compararea opiniilor ( scala de opinie), a comportamentelor. Ex: ntrebare de opinie: "Ce prere
avei despre un nou produs?" Variantele posibile sunt: "Foarte bun", "Bun", "Nici bun nici
proast", "Proast", "Foarte proast". Scala de opinie ( scal de rating ) este o scal cvasimetric.
Se caracterizeaz prin punctul 0 care exprim inexistena opiniei i un numr de puncte, n sens
pozitiv i negativ pentru a msura gradele de intensitate a opiniilor.
Observaie: pentru a alege metoda statistic adecvat n fiecare caz, trebuie s tim n primul rnd
cum au fost obinute datele (scala utilizat).

I.2. Codificarea i introducerea datelor n SPSS


Etapa de pregtire a setului de date implic operaia de codificare a acestora n foaia
de lucru Variable View i de introducere a rspunsurilor n fereastra Data View.

Codificarea variabilelor presupune definirea atributelor acestora: numele variabile,


tipul, lungimea ( numrul de caractere ), numrul de zecimale, eticheta ( label ), codificarea strilor
( values ), valorile lips, modalitile de msurare a variabilelor.

1. Numele variabilei se editeaz n coloana Name, trebuind s fie unic i s


nu depeasc 8 caractere;
2. Tipul variabilei se definete n coloana Type dup cum variabila este
numeric ( Numeric, Comma, Dot ), caz n care se pot introduce numere ntregi i zecimale, sau
nenumeric ( String );
3. Eticheta variabilei este necesar datorit limitrii numelui variabilei la 8
caractere. Astfel n coloana Label se poate edita un nume folosind pn la 256 caractere. ( se
folosete ntrebarea din chestionar );

4. Valorile etichetei ( Value


Labels ) se definesc pentru
variabilele categoriale care
necesit codificarea strilor.
Ex:
strilor
variabilei
specializarea
li
s-au
atribuit coduri;

5. Alegerea sistemului de msurare: Scale, Ordinal, Nominal.


n definirea variabilelor n SPSS o importan deosebit o constituie clasificarea
ntrebrilor din chestionar, n: - ntrebri nchise
- ntrebri deschise
- ntrebri semi-deschise.

ntrebrile nchise necesit codificarea rspunsurilor. Codificarea variabilelor


presupune atribuirea de coduri numerice fiecrei variante, acordarea acestor coduri fiind pur
convenional. De ex. pentru ntrebarea Ce specializare urmai?, rspunsurile au fost codificate
cu valori numerice de la 1 la 9, fiind o variabil de tip numeric i ordinal.
Frecvente sunt variabilele alternative, care nu pot lua dect dou valori. Ex :
Intenionai s urmai cursurile unui masterat?, cu urmtoarele valori individuale pentru
caracteristica alternativ:
-- DA, exprimnd prezena caracteristicii i are asociat codul numeric 1 ;
-- NU, exprimnd absena caracteristicii i are asociat codul numeric 0 ;
n cazul ntrebrilor deschise definirea atributelor variabilei se face dup cum
rspunsul este exprimat prin cuvinte sau numeric. Ex. : Ce propuneri avei pentru conducerea
facultii? se va defini ca o variabil de tip String i nominal, rspunsurile fiind exprimate prin
cuvinte. n cel de-al doilea caz, vom defini variabila ca fiind de tip Numeric i Scale. Ex : Cte
ore de curs ai frecventat sptmna trecut ?
Codificarea ntrebrilor semi-deschise se caracterizeaz prin faptul c fiecare variant
de rspuns va deveni o variabil alternativ, cu excepia rspunsurilor libere care se trateaz
asemenea ntrebrilor deschise.
Introducerea datelor se face n celulele foii de lucru Data View, n care fiecare rnd
reprezint un subiect, iar fiecare coloan o variabil. Atributele unei variabile se pot citi selectnd
meniul Utilities Variables.

II. Descrierea datelor n raport cu o variabil


II.A. Analiza unei variabile nominale
A.1. Tabele de frecvene
Utiliznd din bara de comenzi urmtoarele opiuni Analyze Descriptive Statistics
Frequencies, se obine tabelul de frecvene corespunztor repartiiei eantionului n raport cu
variabila considerat. ( ex: linia de studiu ):

Frequency Percent
romana
maghiara

154
20
174

88.5
11.5
100.0

Valid

Cumulative

Percent
88.5
11.5
100.0

Percent
88.5
100.0

Total

Interpretare: Numrul celor care au rspuns la aceast


ntrebare este 174 persoane (volumul eantionului n =
174 ). Dintre acetia 154 sunt la linia romn, iar 20
aparin liniei maghiare ( Frequency = frecvene absolute ). Cea de a doua coloan prezint
frecvenele relative, exprimate n procente: 88,5% din totalul repondenilor aparin liniei romne
de studiu.
A.2. Grafice graficele adecvate variabilelor ale cror stri sunt exprimate prin
cuvinte sunt diagramele de structur. Din meniul Graphs se alege opiunea Pie ( cerc de structur )
linia de studiu
maghiara
11.5%

n cazul n care avem valori care


lipsesc ( Missing ) datorit non-rspunsurilor se
recomand excluderea acestora n momentul
realizrii graficului.
romana
88.5%

studiu

Ex: aveti restante acumulate din anii precedenti de

Frequency Percent
Valid nu
da
Total
System
Missing
Total

128
45
173
1

73.6
25.9
99.4
.6

174

100.0

Valid
Percent
74.0
26.0
100.0

Cumulative
Percent
74.0
100.0

Interpretare: la aceast ntrebare au


rspuns doar 173 de persoane, din care
128 nu au restane din anii precedeni,
ceea ce reprezint 73,6% din totalul
celor chestionai.

aveti restante acumulate din anii precedenti de studiu


da
26.0%

nu
74.0%

Util n acest sens este i graficul


variabila luat n studiu

care red structura eantionului n raport

cu

II.B. Analiza unei variabile ordinale


B.1. Tabele de frecvene
n meniul Analyze Descriptive Statistics Frequencies introducem o variabil
ordinal, ex: media anului precedent:
media anului precedent
Frequency
Valid

sub5
5-7
7-9
9-10
Total
Missing System
Total

1
16
97
58
172
2
174

Percent

Valid Cumulative
Percent
Percent
.6
.6
.6
9.2
9.3
9.9
55.7
56.4
66.3
33.3
33.7
100.0
98.9 100.0
1.1
100.0

Interpretare: cei mai muli studeni (97) au


o medie cuprins n intervalul 7-9, ceea ce
reprezint 55,7% din totalul celor care au
rspuns la aceast ntrebare. Se observ c
66,3% din totalul repondenilor au o medie
anual de cel mult 9 ( frecvene relative
cumulate ).

B.2. Parametrii repartiiei unidimensionale: valoare median (Me), modal


(Mo), valori quartile ( Q 1 ,Q 2 ,Q 3 ).
Comanda Analyze Descriptive Statistics
Frequencies Statistics ne conduce la
deschiderea unei ferestre n care selectm
parametrii dorii a se calcula referitor la
variabila studiat. n fereastra Charts
selectm i opiunea Bar Charts pentru a
realiza graficul.

Valid
Missing

172
2
3.00
3
3.00
3.00
4.00

Interpretare: innd cont de modul de codificare a variabilei


observm c jumtate dintre studenii chestionai au o medie
Median
situat pn n intervalul 7-9 iar ceilali 50% peste acest interval.
Mode
Cei mai muli au o medie a anilor precedeni aflat n intervalul 7Percentiles
25
9 ( Mo). Folosind valorile quartile, distribuia eantionului n
50
75
raport cu variabila media anilor se prezint astfel : 25% dintre
studeni au o medie situat pn la intervalul 7-9, 25% n
intervalul 7-9, 25% n intervalele 7-9 i 9-10, 25% n intervalul 9-10.
media anului precedent

B.3. Grafice n cazul variabilelor ordinale


graficele adecvate sunt diagramele de structur (Pie) i diagramele
prin benzi (Barchart).

60

50

40

30

Percent

20

10
0
sub5

5-7

media anului precedent

7-9

9-10

II.C. Analiza unei variabile cantitative


C.1. Tabele de frecvene
n meniul Analyze Descriptive Statistics Frequencies introducem o variabil
cantitativ, discret sau continu, ex: vrsta:
varsta
Frequency Percent
Valid

20
21
22
23
24
26
28
Total
Missing System
Total

3
32
108
26
2
1
1
173
1
174

1.7
18.4
62.1
14.9
1.1
.6
.6
99.4
.6
100.0

Valid Cumulative
Percent
Percent
1.7
1.7
18.5
20.2
62.4
82.7
15.0
97.7
1.2
98.8
.6
99.4
.6
100.0
100.0

Cea mai mare frecven o nregistreaz


studenii care au 22 de ani ( 108 ),
reprezentnd 62,1% din totalul celor
chestionai. De asemenea 97,7% din
totalul repondenilor au o vrst de cel
mult 23 de ani.

C.2. Parametrii repartiiei unidimensionale se obin accesnd comanda


Analyze Descriptive Statistics Frequencies Statistics i selectnd urmtorii parametrii:
valoarea medie (mean), mediana, modala, valorile quartile, abaterea medie ptratic (std.
deviation), variana, coeficientul de asimetrie (skewness), de boltire (kurtosis). n fereastra Charts
selectm i opiunea Histogram/With normal curve.
N
Valid
173
Interpretare: vrsta medie a studenilor n eantion este 22,01 ani
Missing
1
( mean ); jumtate din cei 173 de studeni au vrsta sub 22 de ani,
Mean
22.01
cealalt jumtate peste 22 de ani ( median ); cei mai muli
Median
22.00
studeni din eantion au 22 de ani ( mode ); cu 0,87 ani se abate n
Mode
22
medie vrsta fiecrui student de la vrsta medie de la nivelul
Std.
.87
Deviation
eantionului de 22,01 ani ( std. deviation );
Variance
.76
n ceea ce privete parametrii formei, se observ c seria este
Skewness
2.341
asimetric pozitiv, predominnd studenii tineri ( skewness>0 ); n
Std. Error
.185
ceea ce privete boltirea seriei, avem o serie leptocurtic, existnd
of
mai multe valori n jurul valorii medii dect n cazul distribuiei
Skewness
Kurtosis
14.635
normale.
Std. Error
.367
Ultimele trei rnduri ale tabelului prezint valorile
of Kurtosis
quartile,
valori
care mpart repartiia n patru pri egale. Pachetul
Percentiles
25
22.00
de programe SPSS permite i calculul valorilor decile.
50
22.00
75

22.00

C.3. Grafice n cazul variabilelor cantitative continue graficul relevant este


histograma. Construirea acestui grafic presupune urmtorul demers: Graphs Histogram,
selectnd i opiunea Display normal curve.

Histograma
permite
vizualizarea
distribuiei variabilei, fiind folosit pentru a
diagnostica cu uurin dac distribuia este
normal prin compararea histogramei
variabilei observate cu graficul curbei
Gauss. n acest sens este util i interpretarea
valorilor parametrilor formei. n cazul
variabilei vrsta se observ c aceasta nu
urmeaz o lege normal.

160
140
120
100
80
60
40
Std. Dev = .87

20

Mean = 22.0
N = 173.00

0
20.0

varsta

22.0

24.0

26.0

28.0

Dei coeficienii de asimetrie i


boltire exprim numeric n ce msur o
distribuie se abate de la normalitate, nu dau
posibilitatea interpretrii gradului de
semnificaie a deviaiei de la normalitate.

III.Analiza statistic a datelor n raport cu o variabil utiliznd inferena


statistic
III.1. Elaborarea intervalului de ncredere a valorii medii
III.1.1. Elaborarea intervalului de ncredere a valorii medii n
ipoteza organizrii unui sondaj aleator simplu cu ajutorul comenzii Analyze
Descriptive Statistics Explore introducem variabila studiat, avnd posibilitatea de a fixa nivelul
de ncredere dorit (95%).

Mean
95% Confidence
Interval for Mean
5% Trimmed
Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile
Range
Skewness
Kurtosis

Statistic Std. Error


22.01 6.61E-02
Lower 21.88
Bound
Upper 22.14
Bound
21.97
22.00
.756
.87
20
28
8
.00
2.341
14.635

.185
.367

Limita inferioar a intervalului


Limita superioar a intervalului
Interpretare: Putem afirma cu o probabilitate de 95%
c vrsta medie la nivelul populaiei cercetate este
ntre 21,88 i 22,14 ani. Sau, dac am efectua studiul
de 100 de ori ( 100 eantioane ), n 95 de eantioane
media va aparine intervalului, i numai n 5
eantioane valoarea acesteia ar depi limitele
intervalului.

Acelai rezultat se obine i activnd meniul Analyze


Compare Means One Sample T Test;

Test
Value = 0
t
df Sig. (2- Mean
tailed) Differe
nce
333.047172

.000 22.01

95% Confidence
Interval of the
Difference
Lower Upper
21.88 22.14

III.1.2. Elaborarea intervalului de ncredere a valorii medii n


ipoteza organizrii unui sondaj aleator stratificat n meniul Analyze Compare
Means One-way Anova introducem variabila cantitativ vrsta, dependent de variabila factor
de grupare specializarea.
n Options se bifeaz opiunea Descriptives.

Se obin intervale de ncredere pentru valorile


medii de la nivelul fiecrei grupe.

CIG
REI
FB
MK
MG
IE
SPE
ECTS
EA
Total

25
18
27
24
26
27
12
7
7
173

Mean

21.72
21.89
21.89
22.29
22.15
22.07
22.17
21.71
22.14
22.01

Std.
Std. Error 95% Confidence Interval for Minimum Maximum
Deviation
Mean

.46
.32
.75
.95
1.32
1.07
.58
.49
.69
.87

9.17E-02
7.62E-02
.14
.19
.26
.21
.17
.18
.26
6.61E-02

Lower
Bound
21.53
21.73
21.59
21.89
21.62
21.65
21.80
21.26
21.50
21.88

Upper
Bound
21.91
22.05
22.19
22.69
22.69
22.50
22.53
22.17
22.78
22.14

21
21
21
21
21
20
21
21
21
20

22
22
24
26
28
24
23
22
23
28

III.2. Teste de semnificaie


III.2.1. Testarea semnificaiei unei medii face parte din grupa testelor
parametrice. Folosind irul de comenzi Analyze Compare Means One Sample T Test
introducem variabila vrsta pentru care avem valoarea medie observat egal cu 22,01 ani;
dorim s verificm dac vrsta persoanelor din eantionul observat difer semnificativ de valoarea
25 de ani ( test value=25). Formulm ipoteza nul:
H 0 : X = 25 (vrsta medie nu difer semnificativ de valoarea de 25 de ani)
H 1 : X 25
Test Value = 25
t
df

Interpretare: valoarea nivelului de


semnificaie Sig = 0,000 <0,05
( confidence interval ), ceea ce
duce la respingerea ipotezei nule.
Exist o diferen semnificativ
Upper
ntre valoarea medie din eantion
-45.217
172
.000
-2.86
i cea specificat. Pentru c Sig <
0,01 putem afirma c intre
valoarea medie de la nivel de eantion i cea specificat exist diferene semnificative la un nivel
de ncredere de 99%.
Sig. (2tailed)

Mean
95%
Difference Confidenc
e Interval
of the
Difference
Lower
-2.99
-3.12

III.2.2. Testarea semnificaiei unei proporii din meniul Analyze


Nonparametric Tests Binomial testm ipoteze cu privire la o variabil cu distribuie binomial,
care poate lua doar dou valori, de exemplu anul de studiu ( anul 4 sau anul 5 ):
Dorim s verificm dac proporia uneia dintre cele dou grupe de studeni definite prin variabila
anul de studiu difer semnificativ de 0,50.
Astfel formulm ipotezele : H 0 : p = 50%
H 1 : p 50%

anul de Group 1
studiu Group 2
Total

Category

4
5

156
18
174

Observed Test Prop. Asymp. Sig.


Prop.
(2-tailed)
.90
.50
.000
.10
1.00

Interpretare: proporia observat n eantion pentru grupa 1 ( anul 4 ) este de 90%, proporia
specificat fiind de 50%. Valoarea Sig <0,01, astfel c putem concluziona, cu o ncredere de 99%,
c proporia studenilor din anul 4 difer semnificativ de proporia specificat.

III.3. Teste de concordan fac parte din categoria testelor neparametrice.


III.3.1.Verificarea normalitii unei distribuii modelarea statistic
cere verificarea ipotezei de normalitate a variabilelor. Astfel, este foarte important ca naintea
inferenei statistice s se verifice normalitatea distribuiei populaiei. Pe lng vizualizarea
histogramei i a valorilor coeficienilor de asimetrie i boltire, n SPSS exist posibilitatea aplicrii
testului Kolmogorov Smirnov, astfel: Analyze Nonparametric Test One Sample KolmogorovSmirnov Test:
N
Normal
Parameters
Most Extreme
Differences
KolmogorovSmirnov Z
Asymp. Sig. (2tailed)

Mean

varsta
173
22.01

Std. Deviation
Absolute

.87
.332

Positive
Negative

.332
-.292
4.365
.000

Formulm ipoteza nul H 0 : ntre cele 2 distribuii,


cea teoretic i cea empiric nu exist diferene
semnificative ( populaia este normal distribuit n
raport cu variabila vrsta ), cu alternativa c
variabila nu urmeaz o lege normal.
Interpretare: nivelul gradului de semnificaie, Sig <
0,05 conduce la respingerea ipotezei nule, distribuia
studiat difer semnificativ de forma distribuiei
normale.

III.3.2. Verificarea uniformitii unei distribuii se utilizeaz testul neparametric 2 ,


care presupune urmtorul demers: Analyze Nonparametric Tests Chi Square Test.

Formulm ipotezele referitoare la variabila


specializarea:
H 0 : distribuia este uniform
H 1 : distribuia nu este uniform
n
tabelul
urmtor
sunt
comparate
frecvenele
observate
cu
frecvenele teoretice, pe coloana Residual
fiind prezentate diferenele pentru fiecare stare
a variabilei. n acest exemplu se

CIG
REI
FB
MK
MG
IE
SPE
ECTS
EA
Total

Observed Expected
N
N
25
19.3
18
19.3
27
19.3
24
19.3
26
19.3
27
19.3
12
19.3
7
19.3
8
19.3
174

Residual

observ c sunt 24 de studeni la secia de marketing;


potrivit ipotezei de egalitate a proporiilor, n fiecare
5.7
secie ar trebui s fie 19,3 studeni. n coloana Residual
-1.3
7.7 se observ diferena fa de valorile teoretice: 4,7.

4.7
6.7
7.7
-7.3
-12.3
-11.3

ce specializare urmati?
28.552
8
.000

Interpretare:
valoarea
estimat a
2
statisticii este semnificativ la un nivel
de ncredere
de 99%, deoarece Sig <0,01, ceea ce
conduce la
respingerea ipotezei nule. Cele nou categorii de studeni nu au aceeai proporie; distribuia nu
este uniform.
Chi-Square
df
Asymp. Sig.

IV. Analiza statistic a datelor n raport cu dou variabile.


IV.1. Cazul a dou variabile nominale
1. Tabele de repartiie bidimensionale pentru a reda distribuia
eantionului n raport cu 2 variabile se procedeaz astfel: Analyze Descriptive Statistics
Crosstabs:

n fereastra Cells putem opta pentru opiunea


Counts Observed, caz n care ne va afia tabelul
bidimensional cu ajutorul frecvenelor absolute,
sau alegnd opiunea Percentages, vom obine
distribuia eantionului n raport cu cele 2
variabile cu ajutorul frecvenelor relative.

ce
specializare
urmati?

Total

CIG
REI
FB
MK
MG
IE
SPE
ECTS
EA

daca ar fi a alegeti din nou


pentru ce specializare ati
opta?
aceeasi
alta
22
3
13
4
23
1
22
2
15
10
22
5
9
3
5
2
2
6
133

Total

25
17
24
24
25
27
12
7
8

36

Interpretare: tabelul red distribuia


studenilor din eantion n raport cu cele
dou variabile, fiind construit cu ajutorul
frecvenelor absolute. Ultima coloan i
ultimul rnd din tabelul de frecvene
corespund repartiiilor marginale.
Ex: doar 2 din cei 24 de studeni
chestionai de la secia de marketing ar
alege alt specializare.

169
ce
specializare
urmati?

Aceeai distribuie a eantionului n raport cu cele


dou variabile poate fii redat i cu ajutorul
frecvenelor relative. Se observ c 21,3% din totalul
studenilor ar alege alt secie, un procent nsemnat
avnd cei de la secia management (5,9%).

CIG
REI
FB
MK

daca ar fi a alegeti din nou


pentru ce specializare ati
opta?
aceeasi
alta
13.0%
1.8%
7.7%
2.4%
13.6%
.6%
13.0%
1.2%
8.9%
5.9%

IE
SPE
ECTS
EA

13.0%
5.3%
3.0%
1.2%
78.7%

3.0%
1.8%
1.2%
3.6%
21.3%

2. Grafice adecvate n
acest caz sunt diagramele prin coloane.
30

20

10

C o un t

daca ar fi a alegeti
aceeasi
0

alta
FB
REI

MG
MK

SPE
IE

14.8%
10.1%
14.2%
14.2%
14.8%

Total

CIG

Total

EA
ECTS

ce specializare urmati?

3. Analiza asocierii dintre cele dou variabile presupune n prima


etap verificarea existenei legturii dintre cele dou variabile cu ajutorul testului 2 i apoi
interpretarea coeficientului de contingen pentru a analiza gradul de asociere dintre variabile. Din
meniul Analyze Descriptive Statistics Crosstabs se aleg cele dou variabile i n fereastra
Statistics se selecteaz parametrii dorii.

16.0%
7.1%
4.1%
4.7%
100.0%

Se formuleaz ipotezele referitoare la existena legturii:


H 0 : 2 = 0 ( nu exist legtur )
H1 : 2 0

Pearson ChiSquare
Likelihood Ratio
Linear-by-Linear
Association
N of Valid Cases

Value

df

27.369

Asymp. Sig.
(2-sided)
.001

25.686
10.197

8
1

.001
.001

169

Interpretare: putem afirma cu o probabilitate de


95% ( Sig.< 0,05 ) c ntre cele dou variabile
exist legtur.
Value
Nominal by
Nominal
N of Valid
Cases

Contingency
Coefficient

.373

Approx.
Sig.
.001

169

Valoarea coeficientului de contingen este de 0,373, fiind semnificativ diferit de 0, deci legtura
dintre variabile este de intensitate medie.

IV.2. Cazul a dou variabile ordinale


1. Tabele de repartiie bidimensionale i n acest caz prezint
importan repartiia eantionului n raport cu cele variabile att sub forma frecvenelor absolute,
ct i relative. Aceast prezentare a datelor presupune urmtorii pai: Analyze Descriptive
Statistics Crosstabs, n fereastra Cells alegnd i opiunea Percentages. Cele dou tipuri de
frecvene, absolute i relative, se pot prezenta n acelai tabel de repartiie.
2. Grafice informaii privind repartiia eantionului n raport cu dou
variabile ordinale sunt disponibile i din vizualizarea graficului adecvat diagrama prin benzi.
Modul de obinere a acestuia este: Graphs Bar Clustered.
70

60

50

40

media anului precede

30

sub5

20

Count

5-7
10

7-9

9-10
1

a cata optiune a f ost specializarea la care studiati

3. Analiza corelaiei se realizeaz cu ajutorul coeficientului lui


Kendall, astfel: Analyze Descriptive Statistics Crosstabs, selectnd n fereastra Statistics acest
coeficient.
Value
Ordinal by Kendall'
Ordinal
s tau-b
N of Valid
Cases

Asymp. Approx. Approx.


Std. Error
T
Sig.
-.252
.063
-3.765 .000
172

Valoarea coeficientului lui Kendall de - 0,252 indic


faptul c ntre media anului precedent i ordinea
repartizrii pe secii a studenilor exist o legtur
invers, de intensitate slab. Cu ct studenii au o medie
mai mare, cu att au ansa de a fi repartizai n secia pentru care i-au exprimat prima
preferin.Valoarea coeficientului este semnificativ diferit de 0 cu o probabilitate de 95% ( Sig.=
0,000 < 0,05 ).

IV.3. Cazul a dou variabile cantitative


1. Tabele de repartiie bidimensionale se parcurg aceleai etape ca i
mai sus;
2. Grafice pentru a reda repartiia eantionului folosim n acest caz
norul statistic. Demersul pentru construirea acestuia este: Graphs Scatter Simple. Construirea
norului statistic constituie prima etap n analiza legturii dintre dou variabile numerice. n
funcie de poziiile punctelor norului putem formula de asemenea ipoteze cu privire la forma
funciei care explic legtura dintre variabile.
cate ore de seminar ati frecventat sapt trecuta

14

12

10

2
0
0

10

12

14

16

18

20

cate ore de curs ati frecventat sapt trecuta

Se observ n distribuia punctelor o valoare extrem ( 18 ore curs ); se recomand ca valorile


extreme s fie nlturate naintea aplicrii testelor statistice pentru a nu influena calitatea
rezultatelor.
3. Analiza corelaiei presupune calculul coeficientului lui Pearson,
utiliznd meniul Analyze Correlate Bivariate.
Vom analiza legtura dintre numrul de ore
de curs i cele de seminar frecventate de
studeni ntr-o sptmn. Coeficientul lui
Pearson ne ofer informaii att despre
sensul legturii, ct i despre intensitatea
legturii.

cate ore de
curs ati
frecventat sapt
trecuta
cate ore de
seminar ati
frecventat sapt
trecuta

Pearson
Correlation
Sig. (2-tailed)
N
Pearson
Correlation
Sig. (2-tailed)
N

cate ore de curs cate ore de seminar


ati frecventat sapt ati frecventat sapt
trecuta
trecuta
1
.665
.
170
.665

.000
169
1

.000
169

.
170

Se obine matricea de corelaie, valorile fiind distribuite simetric fa de diagonala principal.


Valoarea coeficientului lui Pearson este de 0,665, ceea ce sugereaz c ntre variabile exist o
corelaie direct, de intensitate medie.
Valoarea acestui coeficient este semnificativ diferit de 0, ipoteza existenei legturii
fiind acceptat cu o probabilitate de 95% ( Sig.< 0,05 ).
Dac analizm din nou corelaia dintre cele dou variabile, dar dup indeprtarea
valorilor extreme din eantion, rezultatele vor fi mai concludente:
Correlations

cate ore de
seminar ati
frecventat sapt
trecuta
cate ore de
curs ati
frecventat sapt
trecuta

Pearson
Correlation
Sig. (2-tailed)
N
Pearson
Correlation
Sig. (2-tailed)
N

cate ore de
seminar ati
frecventat sapt
trecuta
1

cate ore de curs ati


frecventat sapt
trecuta

.
170
.721

.000
169
1

.000
169

.
170

.721

Se observ c intensitatea
legturii
dup
nlturarea
valorilor extreme se modific,
legtura dintre cele dou
variabile fiind mai bine pus n
eviden.

IV.4. Testarea egalitii a dou medii ( eantioane independente ) este un test


parametric care verific dac mediile a dou grupe sunt egale. n SPSS presupune urmtorul
demers: Analyze Compare Means
Independent Samples T Test.
De exemplu, dorim s testm dac, la nivelul
eantionului observat, numrul mediu de ore
de curs frecventate de studenii din anul 4
este diferit de numrul mediu de ore de curs
frecventate de studenii din anul 5.
Variabila de grupare va fi n acest caz anul
de studiu, n definirea grupelor innd cont
de codificrile fcute pentru strile acesteia (
1 anul 4, 2 anul 5 ).
Ipoteza privind egalitatea mediilor se formuleaz astfel:

cate ore de curs ati


frecventat sapt
trecuta

H0: X

= X

H1 : X

anul de
studiu
4
5

N
153
17

Mean

Std.
Std. Error
Deviation
Mean
5.29
3.377
.273
3.65
2.668
.647

Dorim s verificm dac numrul


mediu de ore de curs frecventate de
studenii din anul 4 ( 5,295 ),
difer semnificativ de 3,654
(numrul mediu de ore de curs

frecventate de studenii din anul 5 ).


Construcia testului pentru compararea mediilor a dou eantioane presupune testarea n
prealabil a egalitii varianelor la nivelul celor dou grupe. Statistica t se calculeaz diferit dup
cum dispersiile sunt egale sau nu la nivelul celor dou grupe. Ca urmare, formulm ipoteza nul i
alternativa referitoare la egalitatea dispersiilor:H 0 : 12 = 22 iar H 1 : 12 22
Levene's Test for Equality of
Variances
cate ore
de curs ati
frecventat
sapt
trecuta

Equal variances
assumed
Equal variances
not assumed

F
.706

Sig.
.402

t-test for Equality of Means


t
1.935

df
168

Sig. (2tailed)
.055

Mean
Difference
1.64

2.336

22.130

.029

1.64

Interpretare: probabilitatea de acceptare a ipotezei nule n cazul egalitii varianelor este


de 0,402 ( > 0,05 ), varianele la nivelul celor dou grupe sunt egale. Pentru a verifica egalitatea
mediilor folosim statistica t corespunztoare cazului n care dispersiile sunt egale. n acest caz,
testul t este egal cu 1,935, cu 168 grade de libertate i un nivel de semnificaie de 0,055 ( Sig.>
0,05 ), ceea ce arat c nu se poate trage concluzia c cele dou medii difer semnificativ.

IV.5. Testarea legturii dintre dou variabile dorim s verificm dac


modificarea variabilei dependente Y este rezultatul influenei variabilei explicative X. Pentru a

testa existena legturii procedm astfel: Analyze Compare Means One Way Anova. ANOVA
este un procedeu de analiz a unei variabile numerice sub influena unei variabile de grupare care
prezint mai multe stri.
De exemplu dorim s verificm dac
exist legtur ntre numrul de ore
de curs frecventate i media anual.

n meniul Options avem posibilitatea selectrii graficului pentru a formula ipoteze cu


privire la forma legturii dintre cele dou variabile.
Sum of
Squares
Between 114.321
Groups
Within 1773.298
Groups
Total
1887.619

df

Mean
Square
38.107

Sig.

Cu ct mediile grupelor au valori


mai diferite ntre ele, cu att
3
3.524
.016
variaia dintre grupe este mai
mare; cu ct variaia n cadrul
164
10.813
grupelor este mai mic, cu att
167
statistica F este mai mare (F =
media varianei dintre grupe
/media varianei din cadrul grupei ) i numrul orelor de curs frecventate variaz mai mult n raport
cu media anual.
Se formuleaz ipoteza nul H 0 : F = 0, adic dispersia dintre grupe este nul i deci grupele nu
sunt diferite ntre ele, adic media anual nu influeneaz numrul orelor de curs frecventate de
studeni. Deoarece probabilitatea de a grei cnd respingem ipoteza este 0,016< 0,05, rezult c
ipoteza nul se respinge, adic media influeneaz frecvena la cursuri,. n cadrul fiecrui interval
al mediei anului precedent, studenii sunt relativ omogeni din punct de vedere al frecventrii
cursurilor, media anului precedent fiind un criteriu semnificativ de segmentare.

Mean of cate ore de curs ati frecventat sapt trecuta


7

sub5
5-7

media anului precedent


7-9
9-10