Sunteți pe pagina 1din 50

Marian Popa

UNIVERSITATEA DIN BUCURETI


FACULTATEA DE PSIHOLOGIE I
TIINELE EDUCAIEI

DEPARTAMENTUL DE
NVMNT LA DISTAN

CURSUL

STATISTIC PSIHOLOGIC I PRELUCRAREA COMPUTERIZAT


A DATELOR

MODULUL 2

STATISTICI DESCRIPTIVE CU SPSS


TESTE STATISTICE PARAMETRICE

Titular curs:
Conf. univ. dr. Marian POPA
Email: popamarian@gmail.com

Universitatea din Bucureti


Editura CREDIS
2009

1
Copyright DEPARTAMENT ID 2009

Acest material este destinat uzulului studenilor Universitii


din Bucureti, forma de nvmnt la distan.
Coninutul cursului este proprietatea intelectual a
autorului/autorilor; designul, machetarea i transpunerea n
format electronic aparin Departamentului de nvmnt la
Distan al Universitii din Bucureti.

Universitatea din Bucureti


Editura CREDIS
Bd. Mihail Koglniceanu, Nr. 36-46, Corp C, Etaj I, Sector 5
Tel: (021) 315 80 95; (021) 311 09 37, 031 405 79 40, 0723 27 33 47
Fax: (021) 315 80 96
Email: credis@credis.ro
Http://www.credis.ro

Copyright DEPARTAMENT ID 2009

Marian Popa

Cuprins

Modulul2 ................................................................................................................................................ 3
Calculareaindicatorilorstatisticidescriptivi ....................................................................................... 3
ProceduraFrequencies.................................................................................................................... 3
ProceduraDescriptives.................................................................................................................... 5
ProceduraExplore ........................................................................................................................... 7
ProceduraExplorefactorial ......................................................................................................... 12
Testelet ............................................................................................................................................. 15
1.Testulz(t)pentrumediaunuisingureantion ......................................................................... 15
2.Testultpentrueantioaneindependente................................................................................. 17
3.Testultpentrudiferenadintremediileadoueantioanedependente(perechi)................. 20
Analizadevarianunifactorial....................................................................................................... 23
(OneWayANOVA)......................................................................................................................... 23
CoeficientuldecorelaieliniarPearson(r)...................................................................................... 30
Analizadeitemi ................................................................................................................................. 35

2
Copyright DEPARTAMENT ID 2009

Marian Popa

Modulul2
Calcularea indicatorilor statistici descriptivi
Reamintim faptul c statistica descriptiv are ca obiectiv analiza caracteristicilor variabilelor
sub aspectul tendinei centrale, mprtierii i formei distribuiei. Principalele componente ale
statisticii descriptive sunt:
reprezentarea ntregii distribuii, pe cale:
o numeric (analiza de frecvene)
o grafic (bar, histogram, box-plot, stem and leaf)
indicatorii tendinei centrale
o mod
o medie
o median
indicatorii mprtierii
o amplitudine
o abatere standard
indicatorii formei distribuiei
o indice de simetrie (skewness)
o indice de boltire (kurtosis)
SPSS ofer posibiliti variate de reprezentare i de calcul a acestor indicatori. n acest sens
exist, pe de o parte, proceduri specializate i, pe de alt parte, opiuni care pot fi accesate din
interiorul altor proceduri. Fie i acest aspect numai, ar trebui s sugereze c statistica descriptiv, n
ciuda caracterului ei elementar, este o component indispensabil a analizei statistice.
n ceea ce privete procedurile specializate, ele se lanseaz din meniul Statistics-Summarize
(sau Analyze-Descriptive statistics, pentru versiunile mai noi de SPSS), i sunt grupate n trei
proceduri: Frequencies, Descriptives i Explore (vezi imaginea de mai jos).
L Aceste proceduri ofer, fiecare, att prelucrri distincte, ct i identice. Alegerea uneia sau
alteia dintre proceduri depinde de necesitile de analiz sau de modul specific de afiare a
rezultatelor n Viewer.

Fiierul utilizat pentru exemplificri


(htpp://marianpopa.tripod.com/id2.html).

la

acest

capitol

este

descriptives.sav

Procedura Frequencies
Aceasta este singura procedur care permite analiza de frecvene. La apariia casetei
Frequencies, variabila pe care dorim s o supunem analizei se mut n lista de calcul Variable(s), prin

3
Copyright DEPARTAMENT ID 2009

Marian Popa
selectarea ei i acionarea butonului de transfer (). Pot fi incluse mai multe variabile simultan n
aceast list, rezultatele fiind afiate distinct, pentru fiecare n parte.
n cazul nostru, am ales variabila cantitativ nr_cor.

Se va observa pe caseta Frequencies marcarea implicit a opiunii pentru tabela de frecvene


(Display frequency tables), care este funcia specific a acestei proceduri. n plus, prin acionarea
butoanelor din partea de jos a casetei, se pot seta alte analize, astfel:
Butonul Statistics
Se aleg indicatorii statistici descriptivi
dorii

Butonul Chart
Se alege tipul de grafic
dorit

Butonul Format
Se aleg diverse moduri de
prezentare a rezultatelor

Rezultatele sunt afiate n SPSS Viewer n forma de mai jos

Tabelul
Statistics
indicatorilor statistici solicitai

cuprinde

lista

Tabelul frecvenelor simple prezint lista


cresctoare a valorilor distribuiei, frecvena
absolut, procentul, procentul valid (prin eliminarea valorilor lips i procentul cumulat).
n mod obinuit, tabela frecvenelor simple se solicit pentru variabile categoriale. Atunci
cnd avem o variabil cu foarte multe valori, tabela frecvenelor simple poate fi prea lung pentru a fi
util.

4
Copyright DEPARTAMENT ID 2009

Marian Popa

Iat cum se prezint rezultatul procedurii Frequencies pentru variabila gen:

Procedura Descriptives
Aceast procedur vizeaz doar indicatorii statistici descriptivi. La lansare - SatisticsDescriptives - se deschide caseta principal Descriptives.
Se trec variabilele vizate n lista Variable(s)
(dac dorim calcularea scorurilor z, se bifeaz
opiunea din stnga-jos a casetei )

Se aleg indicatorii dorii din Options

Prin bifarea opiunii Save standardized values as variables, programul va crea o variabil
standardizat z, pe care o va pune n baza de date, la sfritul listei de variabile.
Rezultatul analizei, din Viewer, se prezint astfel:

5
Copyright DEPARTAMENT ID 2009

Marian Popa

n tabelul Descriptives Statistic gsim: N (numrul valorilor i al valorilor valide); valoarea


minim i maxim a distribuiei, media; abaterea standard i valorile indicatorilor simetriei (skewness)
i boltirii (kurtosis). Pentru acetia din urm, alturi de valoarea calculat, avem i eroarea standard,
care ne d gradul de imprecizie (eroare) al celor doi indicatori n raport cu valorile lor reale, la nivelul
populaiei din care se presupune a fi fost extrase datele analizate.
Aa cum tim, n cazul unei distribuii normale valorile pentru skewness i kurtosis sunt egale
cu 0. Dar, chiar i n cazul unui eantion aleator, extras dintr-o populaie normal, este puin probabil
s obinem indici de simetrie i boltire egali cu 0, din cauza variaiei de eantionare. Ca urmare, este
util s tim dac eantionul valorilor analizate provine dintr-o populaie asimetric sau boltit
anormal. Sau, altfel spus, n cazul unui eantion, sunt skewness i kurtosis att de diferite de zero nct
trebuie s respingem ipoteza c valorile eantionului provin dintr-o distribuie normal? Pentru a
rspunde la aceast ntrebare poate fi utilizat eroarea standard a fiecruia dintre cei doi indici pentru
calcularea limitelor intervalului lor de ncredere. Dac n limitele unui interval de ncredere de 95% se
va afla i valoarea zero (caracteristic unei distribuii normale), atunci va trebui s acceptm ipoteza c
distribuia populaiei are simetrie sau boltire normal.
Limitele unui interval de ncredere de 95% pentru skewness se calculeaz la fel ca pentru
oricare indicator statistic::
95% CI =Skewness 1.96 * (eroarea standard a lui skewness)
Iar pentru kurtosis:
95% CI =Kurtosis 1.96 * (eroarea standard a lui kurtosis)
Astfel, pentru variabila nr_cor, analizat mai sus, limitele de ncredere pentru skewness sunt:
95% CI=-0.724 1.96 *0.277
De unde:
Lim. inf.=-0.905
Lim. sup.=+0.361
Deoarece n intervalul de ncredere intr i valoarea zero (caracteristic distribuiei normale)
acceptm c variabila nr_cor are o distribuie simetric.
n mod similar, limitele de ncredere pentru kurtosis sunt:
95% CI=-0.134 1.96 *0.548
De unde:
Lim. inf.=-0.134
Lim. sup.=+0.806
Concluzia este c i intervalul de ncredere pentru indicele de boltire include valoarea zero
(caracteristic unei curbe normale), fapt care permite acceptarea ipotezei c distribuia nu prezint o
boltire anormal.

n fine, dac ne uitm n Data Editor, la sfritul coloanelor cu


variabile, gsim noua variabil znr_cor, care conine valorile variabilei nr_cor
transformate n scoruri z. Aducem aminte faptul c prin transformarea n z a

6
Copyright DEPARTAMENT ID 2009

Marian Popa
valorilor unei variabile, acestea nu urmeaz forma curbei normale, ci exprim doar distana n abateri
standard fa de media distribuiei.

Procedura Explore
Procedura Explore este cea mai complex dintre toate procedurile statisticii descriptive i se
poate utiliza atunci cnd se dorete o analiz exhaustiv a variabilei (sau variabilelor). Vom utiliza
pentru exemplificare trei variabile (asim, normal i uniform) din fiierul descriptives.sav, ale cror
distribuii prezint particularitile sugerate de nume.
Caseta principal Explore

n zona Dependent List se includ variabilele de analizat (asim, uniform, normal).


n zona Factor List se includ eventualele variabile categoriale, n funcie de care se dorete
analiza variabilei analizate (vezi mai jos).
Label cases by, permite etichetarea cazurilor la afiare (rar utilizat).
Display, permite alegerea opiunilor de afiare a rezultatelor numerice (Statistics), grafice
(Plots) sau ambele categorii (Both).
Butonul Statistics deschide caseta pentru alegerea indicatorilor care vor fi calculai.

Opiunea implicit o reprezint Descriptives, care calculeaz toi indicatorii statistici


descriptivi de baz.
M-estimators, calculeaz estimri ale valorilor tendinei centrale la nivelul populaiei mai
robuti, innd cont de forma distribuiei.
Percentiles, calculeaz percentilele 5, 10, 25, 50, 75, 90 i 100.

Butonul Plots, permite alegerea reprezentrilor grafice dorite: am ales reprezentarea Boxplot
i reprezentarea Stem-and-leaf:

7
Copyright DEPARTAMENT ID 2009

Marian Popa

Una dintre opiunile importante ale acestei aceste este Normality plots with tests, care testeaz
normalitatea distribuiei (vezi discuia rezultatelor afiate n Viewer).

Butonul Options, permite setarea modului de tratare a valorilor lips

Rezultatele analizei Explore, definit mai sus, se prezint astfel:


Un tabel sintetic al variabilei, de unde aflm numrul valorilor i procentul lor, pentru cazurile
valide, pentru cele care lipsesc i pentru total. O privire atent pe acest tabel este necesar cu scopul de
a identifica eventuale probleme cu datele. n acest caz, toate variabilele au 75 de valori i nu exist
valori lips.

Tabelul Descriptives conine toi


indicatorii
statistici
descriptivi
cunoscui:
95% Confidence Interval for
mean ne d limita inferioar (Lower
Bound) i pe cea superioar (Upper
Bound) a intervalului de ncredere
pentru medie, calculate pe baza erorii
standard a acesteia, afiate pe ultima
coloan.
5% Trimmed Mean, este o
medie calculat fr participarea a 5%
dintre valorilor de la extremele
distribuiei, ceea ce are ca efect
eliminarea efectului eventualelor
valori extreme. Cu ct aceasta este
mai apropiat de media obinuit, cu
att se poate aprecia c distribuia nu
are valori extreme. Pe o distribuie

8
Copyright DEPARTAMENT ID 2009

Marian Popa
normal, media i 5% trim-media, sunt identice.
Se vor observa:
- distana relativ mare dintre medie i median n cazul distribuiei asimetrice, comparativ cu
celelalte dou.
- faptul c media 5% trim a distribuiei asimetrice se apropie mult de media aritmetic uzual.

Tabelul percentilelor afieaz valorile percentile. Percentilele de pe linia Tuckeys Hinges sunt
valorile care intr n calcularea nlimii casetei boxplot (abaterea interquartil).

Tabelul Tests of Normality cuprinde rezultatele testelor de normalitate. n esen, acestea


testeaz gradul de suprapunere dintre distribuia cumulativ a variabilei analizate i distribuia
cumulativ a unei variabile a crei distribuie urmeaz forma Gauss. Cele mai uzuale sunt testele
Kolmogorov-Smirnov (numit i statistica D) i Shapiro-Wilk (numit i statistica W). Desigur, dintre
ele se va lua n considerare numai unul singur. Tendina actual este de a se da un credit mai mare
testului Shapiro-Wilk, deoarece se apreciaz c dispune de o putere mai mare de a surprinde
normalitatea unei distribuii, atunci cnd aceasta este real (Shapiro, Wilk, & Chen, 1968), mai ales
dac numrul valorilor este mic. SPSS calculeaz testul Shapiro-Wilk numai pentru distribuii cu mai
puin de 50 de valori, n celelalte cazuri limitndu-se doar la Kolmogorov-Smirnov.
Att pentru testul Kolmogorv-Smirnov, ct i pentru testul Shapiro-Wilk, conteaz numai
valoarea lui p (Sig.), care se interpreteaz invers dect interpretrile cu care ne-am obinuit pentru p,
astfel:
- Dac p (Sig.) este mai mic sau egal cu 0.05, atunci se respinge ipoteza de normalitate a
distribuiei (distribuia variabilei se abate de la forma normal);
- Dac p (Sig.) este mai mare dect 0.05, atunci se accept ipoteza de normalitate a distribuiei
(distribuia )

n cazul nostru, observm c testul de normalitate are valori p (Sig.) mai mici de 0.05 pentru
variabilele asim i uniform, ceea ce ne confirm c cele dou variabile nu prezint o form normal. n
acelai timp, variabilei normal i corespunde un p=0.200 (mai mare de 0.05), ceea ce confirm forma
normal a distribuiei sale.
Principala problem care se pune n legtur cu interpretarea testelor de normalitate este legat
de faptul c, pe msur ce eantionul este mai mic, este din ce n ce mai dificil s fie apreciat corect
normalitatea distribuiei unei variabile. Nici chiar un test statistic nu ne poate oferi o concluzie
fundamentat, deoarece nu este suficient de sensibil pentru a distinge ntre o distribuie normal i una
ne-normal. Pentru mai puin de 5 valori, SPSS nici nu mai calculeaz testul de normalitate, chiar dac
este cerut. Pentru a avea suficient ncredere n rezultatul testelor de normalitate distribuia trebuie s

9
Copyright DEPARTAMENT ID 2009

Marian Popa
aib cel puin cteva zeci de valori. Rezult c interpretarea rezultatului la testele de normalitate
depinde simultan de valoarea lui p i de mrimea eantionului. n mod obinuit, aceast interpretare se
face dup urmtoarea gril:
Valoarea p
a testului de
normalitate
0.05
>0.05
>0.05

Mrimea eantionului
oricare
mare
(cel puin cteva zeci)
mic
(sub cteva zeci)

Interpretare
Forma distribuiei nu este normal.
Distribuia are o form normal.
Dei testul confirm forma normal a distribuiei, o
astfel de concluzie este riscant, dat fiind capacitatea
real testului de a surprinde acest lucru.

Utilitatea testului de normalitate a distribuiei se raporteaz la decizia de a utiliza teste


parametrice n cazul variabilelor cantitative, care, dup cum tim, sunt supuse acestei condiii. Att
testul K-S ct i Shapiro-Wilk sunt sensibile att la asimetrie ct i la boltire. n general, testele
statistice bazate pe scale de interval (raport) sunt mai robuste (mai sigure) dac distribuiile sunt
simetrice, dar existena unei boltiri nu reprezint o problem. Ca urmare, atunci cnd utilizm testul t
sau analiza de varian, existena boltirii este mai puin preocupant dect aceea a asimetriei. Din acest
motiv, dac testul de normalitate este semnificativ este recomandabil s verificm dac acest lucru se
datoreaz asimetriei, boltirii sau ambelor.
Reprezentrile Stem-and-leaf
Pentru distribuia asimetric
S observm c sunt menionate i
valori extreme, cele mai mari sau egale cu
145.

Pentru distribuia uniform

10
Copyright DEPARTAMENT ID 2009

Marian Popa
Pentru distribuia normal

Reprezentrile boxplot
Redm mai nti schema constructiv a unei reprezentri boxplot:

Pentru variabilele analizate, imaginile boxplot se prezint astfel:


160

30

14
38

140

12

20

10

120

10

8
100
0

6
80

-10

60

2
-20

40

20
N=

-30

-2
75

Asimetrica

N=

75

Uniforma

N=

75

Normala

Aa cum tim, caseta din mijlocul reprezentrii boxplot include 50% dintre valorile
distribuiei, liniile verticale fiind trasate la o lungime de 1.5xH, unde H este distana dintre limitele
casetei (abaterea interquartil, Q3-Q1). Punctele marcate n dincolo de limitele orizontale ale
reprezentrii marcheaz valorile marginale ale distribuiei (O=Outliers) i valorile extreme (E). n
cazul variabilei asim observm gruparea valorilor spre partea inferioar a distribuiei, cu o linie
superioar mai lung dect cea inferioar, i cu o valoare excesiv mult deasupra mustii
superioare. Variabila uniform prezint o caset central extins i linii verticale relativ apropiate ca
lungime, dar scurte, comparativ cu nlimea casetei. n fine, variabila normal prezint o form
simetric, cu o caset central de dimensiuni moderate i cu linii verticale sensibil egale.

11
Copyright DEPARTAMENT ID 2009

Marian Popa

Histogramele
Histogram

Histogram

30

Histogram

10

10

4
Std. Dev = 21,67
Mean = 70,5
N = 75,00

4
Std. Dev = 3,80

Mean = 6,9
N = 75,00

Frequency

10

Frequency

Frequency

20

Std. Dev = 11,67

Mean = 1,4

N = 75,00
Histogramele reprezint ntr-o
diferit
0,0 manier
2,0 4,0 6,0 8,0
10,0 12,0 ceea ce reprezint i graficele boxplot de mai
1,0 3,0 5,0 7,0 9,0 11,0
sus. Asimetrica
Recomandm analiza comparativ a histogramei i boxplot-ului fiecrei variabile.
0

,5
27
,5
22
,5
17
,5
12
5
7,
5
2,
,5
-2
,5
-7 5
2,
-1 5
7,
-1 5
2,
-2

0
0,
1 5 ,0
0
1 4 ,0
0
1 3 ,0
0
1 2 ,0
0
1 1 ,0
0
10
,0
90
,0
80
,0
70
,0
60 0
,
50
,0
40

Uniforma

Normala

Toate cele trei tipuri de reprezentri grafice (stem-and-leaf, boxplot i histogram) pot fi utile
n analiza distribuiilor, dar se va evita introducerea lor simultan ntr-un document de cercetare. De
asemenea, este de evitat introducerea acestor reprezentri pentru variabile singulare (descrise n mod
suficient cu valorile numerice ale indicatorilor statistici). De regul, graficele de acest gen sunt
introduse n lucrri pentru a prezenta imagini comparative ale variabilelor.
Graficele Normal Q-Q Plot
Graficul Normal plot compar scorul brut (pe axa Ox) cu scorul z ateptat al unei distribuii
care ar avea o form normal (pe axa Oy). Scorul z ateptat se gsete prin convertirea rangului
percentil al fiecrui scor n scor z, utiliznd tabelul probabilitilor de sub cuba normal. Acesta
reprezint o expresie grafic a normalitii. Dac valorile variabilei se distribuie normal, atunci
graficul scorurilor brute i ateptate va urma o linie dreapt pe diagonala axelor de coordonate. Dac
scorurile nu se distribuie normal, linia celor dou scoruri deviaz de la modelul rectiliniu. Privind
graficele celor trei tipuri de distribuii, observm c liniile punctate ale variabilelor asim i uniform se
abat de la linia dreapt, n timp ce pentru variabila normal linia punctat aproape se suprapune peste
linia teoretic. Graficele Normal Q-Q Plot nu fac dect s ilustreze grafic rezultatele testelor de
normalitate.
Normal Q-Q Plot of Uniforma

Normal Q-Q Plot of Normala


3

-1
-2
-3
20

40

60

80

100

120

140

160

Expected Normal

Expected Normal

Expected Normal

Normal Q-Q Plot of Asimetrica


3

-1
-2
-3
-10

10

Observed Value

0
-1
-2
-3
-30

-20

-10

10

20

30

20

Observed Value

Observed Value

Procedura Explore factorial


Aa cum am spus, n caseta
principal Explore, n zona Factor List, se
poate introduce o variabil categorial,
rezultatul fiind acela c variabila (sau
variabilele) din zona Dependent List vor fi

12
Copyright DEPARTAMENT ID 2009

Marian Popa
analizate separat pentru fiecare dintre categoriile variabilei Factor. Vom ilustra aceast opiune pentru
variabila nr_cor, n funcie de valorile variabilei cond_prez.

n
imaginea
alturat se poate vedea
coninutul
tabelului
Descriptives din Viewer
pentru
aceast
configuraie de analiz.

Iar mai jos, reprezentrile comparative boxplot, care fac mai expresive raporturile dintre
distribuiile analizate, prin raportarea simultan la acelai cadru de referin.

Utilizarea opiunii factoriale din procedura Explore este foarte util atunci cnd suntem
interesai s analizm descriptiv caracteristicile unei variabile cantitative n raport de categoriile
definite prin valorile unei variabile categoriale.

13
Copyright DEPARTAMENT ID 2009

Marian Popa
Valorile marginale (Outliers)
Tabelul Extreme Values listeaz cte cinci valori de la marginea distribuiei, fr ca acestea s
fie n mod necesar valori care ntrunesc condiiile definite n contextul procedurii boxplot pentru
valorile marginale sau extreme. Ca urmare, aceste valori vor fi analizate pentru a constata n ce msur
se abat grav de la tendina central a distribuiei.

14
Copyright DEPARTAMENT ID 2009

Marian Popa

Testele t
Testul t este n esen o procedur de testare a semnificaiei diferenei dintre dou medii. Ca
urmare, el este potrivit atunci cnd variabila dependent este msurat pe scal cantitativ (intervalraport). Distribuia teoretic de referin (distribuia de nul) este cea normal, pentru eantioane mai
mari de 30 de subieci, i distribuia t (Student), pentru eantioane mai mici de 30 de subieci. Chiar
dac formulele de calcul sunt diferite, forma de prezentare a rezultatelor i raionamentul decizional
sunt similare pentru ambele situaii.
Tipuri de teste t
1. Testul t pentru un eantion.
2. Testul t pentru eantioane independente
3. Testul t pentru eantioane dependente
Condiii de aplicare
Condiia teoretic de baz pentru testele t este normalitatea distribuiei de eantionare.
Rezultatul testului devine nesigur dac distribuia variabilei se abate de la forma normal, mai ales
dac volumul eantionului este mai mic de 40 de subieci (Gardner, 1975, Moore, 1995). n temeiul
teoremei limitei centrale, cu ct volumul eantionului este mai mare, cu att normalitatea distribuiei
de eantionare este mai sigur, iar impactul unei eventuale anormaliti a distribuiei asupra testului t,
mai mic.

1. Testul z (t) pentru media unui singur eantion


Utilizare
Testul z pentru un singur eantion este utilizat pentru se testa diferena dintre media unui
eantion fa de media cunoscut a populaiei din care face parte (de exemplu, n ce msur difer
nlimea femeilor diagnosticate cu depresie cronic de nlimea femeilor n general?). De asemenea,
acest test poate fi utilizat pentru a testa diferena unei medii fa de o constant oarecare, care prezint
interes pentru cercettor (de exemplu, media QI=117 a unui eantion de candidai respini, difer
semnificativ de media QI=125 a candidailor admii la un examen de selecie?). Utilizarea acestui test
statistic este condiionat de cunoaterea mediei populaiei. Dac populaia are o extindere mare, acest
lucru este dificil de realizat (n afara cazurilor n care exist studii speciale, cum sunt cele
antropometrice, de exemplu). Dintre variabilele psihologice ale cror medie pentru populaie este
cunoscut, este inteligena, exprimat n uniti QI (=100). Testul poate fi utilizat, ns, i atunci cnd
populaia are o extindere mai redus. De exemplu, dac a fost evaluat nivelul de satisfacie ntr-o
organizaie, se poate testa diferena dintre nivelul de satisfacie la nivelul unei secii fa de media
satisfaciei la nivelul ntregii organizaii (populaie). De asemenea, acest test poate fi utilizat pentru a
testa semnificaia diferenei dintre media eantionului i orice alt valoare care prezint interes pentru
cercettor.
Aranjarea datelor
Datele supuse testrii trebuie s fie incluse ntr-o variabil SPSS de tip numeric (vezi imaginea
de mai jos). n exemplul urmtor vom testa semnificaia diferenei dintre media unui eantion de cinci
valori QI n raport cu media populaiei (QI=100)1
1

Exemplul are un caracter didactic, motiv pentru care nu ne interesm de normalitatea distribuiei.

15
Copyright DEPARTAMENT ID 2009

Marian Popa

Procedura: Statistics-Compare Means-One Sample T Test

Variabila testat

Caseta principal
Variabila testat este trecut n lista Test
Variable(s)
n zona Test Value se nscrie media
populaiei, sau alt valoare de referin
(100 n cazul nostru)

Caseta Options permite alegerea


pragului de semnificaie.
Confidence Interval 95% este
echivalent cu p=0.05 i este
valoarea implicit pentru toate
testele statistice

Rezultate
Imaginea de mai jos prezint cele dou tabele din Viewer cu rezultatele procedurii:

Primul tabel include statistica descriptiv a variabilei testate (N, media, ab.std, eroarea
standard a mediei).
Al doilea tabel include rezultatele testului statistic, pe coloane, dup cum urmeaz:
o QI Numele variabilei (dac variabila este etichetat, este afiat eticheta);
o t 6.254 Valoarea calculat a testului t. Valoarea n sine nu se interpreteaz n nici
un fel, iar cnd se raporteaz sunt suficiente primele dou zecimale;
o df Gradele de libertate (degrees of freedom), calculate ca N-1. Acestea trebuiesc
raportate, dar acest lucru poate fi omis dac este menionat volumul eantionului,
o Sig. (2-tailed) Probabilitatea asociat valorii calculate a lui t (simbolizat n mod
uzual cu p). n acest caz, p=0.003 semnific faptul c pe distribuia teoretic t exist
o probabilitate de 0.003 (sau 3 la mie) de a se obine din ntmplare o valoare a lui t
egal sau mai mare de 6.254. Dac n situaia calculrii manuale comparam valoarea
calculat a lui t cu o valoare critic, corespunztoare pragului alfa (0,05), n condiiile
utilizrii SPSS se compar direct valoarea p=0,003 cu pragul alfa=0.05 pentru a se lua
decizia statistic. Atunci cnd p este mai mic sau cel mult egal cu alfa, ipoteza de nul
se respinge. Este evident c raportul dintre p i alfa trebuie s fie invers dect cel
dintre t calculat i t critic, dac avem n vedere c p este cu att mai mic cu ct t este
mai mare. Dac p este mai mare dect alfa, ipoteza de nul se accept. n cazul de fa,
p(0,003)<alfa(0,05), ceea ce permite respingerea ipotezei de nul.

16
Copyright DEPARTAMENT ID 2009

Marian Popa
o
o

Mean difference 22.60 este diferena dintre media eantionului i valoarea de


referin.
95% CI for the mean difference Reprezint limitele intervalului de ncredere pentru
diferena dintre media eantionului i valoarea de referin. n cazul nostru ea se
situeaz ntre o limit inferioar=12.57 i o limit superioar=32.63. Altfel spus,
exist 95% anse ca diferena adevrat dintre valoarea obinut pe eantion (estimare)
i valoarea de referin (media populaiei) s fie cuprins ntre 12.57 i 32.63.

Concluzia testului
Media eantionului de cercetare (m=122,6) difer semnificativ de media populaiei (=100),
(t=6.254, df=4, p=0.03).

2. Testul t pentru eantioane independente


Utilizare
Testul t pentru eantioane independente este utilizat pentru testarea diferenei dintre mediile
aceleiai variabile msurate pe dou grupuri, formate din subieci diferii (performana la un test de
reprezentare spaial difer ntre brbai i femei?; nivelul de extraversie este diferit ntre piloi i
controlorii de trafic aerian?).
Atunci cnd grupurile comparate fac parte din acelai eantion de cercetare, nefiind
selecionate independent unul de altul, este posibil ca variabila dependent s fie afectat de una sau
mai multe variabile mascate, fapt care poate influena rezultatul testului. De exemplu, atunci cnd
comparm performana la un test de reprezentare spaial pe un eantion format din piloi femei i
brbai, este posibil ca s obinem un rezultat semnificativ dac experiena de zbor a unui grup este
mai mare dect a celuilalt grup (dac acceptm c experiena de zbor poate avea un efect dezvoltare a
abilitii de reprezentare n spaiu ). ntr-un astfel de caz, diferena de performan la testul de
reprezentare spaial nu ar face dect s surprind diferena de experien de zbor.
Exemplu:
Testarea diferenei dintre media scorului la o scal de sociabilitate, aplicat unor copii crescui
n familie, pe de o parte, i unor copii crescui n instituii de ocrotire, pe de alt parte. n acest caz,
scorul la sociabilitate este variabila dependent, msurat pe scal cantitativ (interval/raport), iar
mediul de educare este variabila independent, exprimat pe scal nominal dihotomic
(familie/instituie de ocrotire)
Condiii
Teoretic, testul t poate fi utilizat pentru eantioane orict de mici dac distribuia de
eantionare pentru cele dou grupuri este normal i dac variana valorilor n cele dou grupuri nu
difer semnificativ. n ce privete condiia egalitii varianei, ea este testat cu un test specific. Unul
dintre acestea este testul Levene, iar n funcie de rezultatul su programul calculeaz testul t pe dou
ci, aa cum vom vedea mai jos.
Dac variabila dependent nu ntrunete condiiile pentru testul t, se poate apela la teste
neparametrice, astfel:

Testul z pentru proporii (compararea procentului de sociabili din cele dou grupuri)
Testul Mann-Whitney U, dac se transform valorile variabilei sociabilitate n valori de
rang

17
Copyright DEPARTAMENT ID 2009

Marian Popa

Aranjarea datelor
Tabela de date SPSS va conine variabila dependent, de tip numeric, i variabila
independent, de tip nominal, cu dou valori, n funcie de apartenena la un grup sau altul. Variabila
independent poate fi de tip string (codificnd cele dou grupuri cu valori de genul A i B) sau
de tip numeric (cu codificarea convenional 1 i 2). Din principiu, ns, recomandm cea de a doua
variant.

Procedura: Statistics-Compare means-Indpendent Samples T Test


n caseta principal se trece variabila dependent (soc) n lista Test Variable(s) (pot fi testate
mai multe variabile simultan), iar variabila independent (grup), n zona Grouping Variable. n acest
moment programul ataeaz variabilei dependente dou semne de ntrebare, sugernd introducerea
valorilor care definesc cele dou grupuri. Concomitent se activeaz butonul Define Groups a crui
acionare deschide caseta secundar Define Groups, unde se introduc valorile care definesc cele dou
grupuri comparate (ordinea lor nu este relevant). Dup acionarea butonului Continue, caseta
principal devine complet i se poate aciona OK pentru efectuarea testului.

Rezultate afiate n Viewer

18
Copyright DEPARTAMENT ID 2009

Marian Popa
n primul tabel (Group Statistics) avem statistica descriptiv a celor dou grupuri. Se va
observa c programul descrie grupurile prin intermediul etichetelor valorilor. Dac acestea nu ar fi fost
definite, n loc de institutie i familie ar fi aprut 1, respectiv, 2.
Al doilea tabel are dou linii:
Pe prima linie avem rezultatele testului t pentru situaia n care variana celor dou
grupuri comparate este egal. Egalitatea varianelor este testat cu testul Levene. Dac
probabilitatea asociat testului Levene este mai mare de p=0.05, atunci nseamn c
varianele sunt egale, iar rezultatul testului t se citete pe prima linie. n cazul nostru, avem
p=0.666, ceea ce nseamn c acceptm egalitatea varianelor i citim pe aceast linie
rezultatul: t=-2.42, df=12, p=0.045.
Pe a doua linie avem rezultatele testului t pentru situaia n care nu s-ar ntruni condiia
de omogenitate a varianei celor dou grupuri. Dac semnificaia testului Levene ar fi fost
mai mic sau egal cu 0.05, rezultatului testului t s-ar fi citit pe aceast linie.
Pentru exemplul nostru, rezultatul testului t permite acceptarea ipotezei cercetrii, conform
creia copiii crescui n mediu familial sunt mai sociabili dect cei crescui n mediu instituional
(m1=22.00, m2=17.71, t=-2.42, df=12, p=0.045).

19
Copyright DEPARTAMENT ID 2009

Marian Popa

3. Testul t pentru diferena dintre mediile a dou eantioane dependente


(perechi)
Utilizare
Testul t al diferenei mediilor a dou eantioane dependente permite evaluarea semnificaiei
variaiei unei anumite caracteristici, la aceeai subieci, n dou situaii diferite (de exemplu, nainte
i dup aciunea unei anumite condiii), ori n dou contexte diferite, indiferent de momentul
manifestrii acestora. Avantajul major al acestui model statistic este acela c surprinde variaia numit
intrasubiect, prin faptul c baza de calcul este diferena dintre dou valori msurate pentru fiecare
subiect n parte.
Exemplu:
Un grup de subieci efectueaz operaii aritmetice n condiii de linite i, ulterior, n condiii
de zgomot puternic. Ipoteza cercetrii este c n condiii de zgomot performana este mai redus.
Performana la test, msurat prin numrul de operaii corecte, este variabila dependent, msurat pe
o scal de raport. Contextul n care se desfoar experimentul (linite-zgomot), reprezint
variabila independent, msurat pe o scal nominal, categorial, dihotomic, ale crei valori
convenionale pot fi 1, respectiv 2.
Condiii
i n acest caz condiia de aplicare a testului t este normalitatea distribuiei de diferene dintre
mediile unui numr infinit de eantioane perechi (linite-zgomot). Din fericire, teorema limitei
centrale garanteaz normalizarea distribuiei de eantionare pe msur ce volumul eantioanelor crete.
n situaia n care condiia nu se ndeplinete, se pot utiliza teste neparametrice echivalente: testul
semnului (pentru date nominale) sau testul Wilcoxon (pentru date ordinale).
Aranjarea datelor
Vor fi create dou variabile distincte, ambele cantitative, msurate pe scal de tip I/R, care
primesc cte o valoare pentru fiecare subiect.

20
Copyright DEPARTAMENT ID 2009

Marian Popa
Procedura: Statistics-Compare Means-Paired Sample T Test...
Se selecteaz cu cte un clic de mouse, pe rnd,
fiecare dintre cele dou variabile. Astfel se
constituie perechea de variabile n zona Current
selection.

O dat constituit, perechea de variabile se trece


n lista Paired Variables cu butonul de transfer
(). Pot fi create mai multe perechi de variabile
i prelucrate simultan.

Caseta Options permite alegerea pragului de semnificaie, dac dorim schimbarea celui
implicit (p=0.05).
Rezultate
Rezultatele sunt prezentate n trei tabele, ca n imaginea de mai jos:

n tabelul Paired Samples Statistics sunt afiate mediile celor dou grupuri comparate
(Mean), numrul subiecilor din fiecare grup (N), abaterea standard pentru fiecare grup (Std.
Deviation) i eroarea standard a mediei fiecrui grup (Std. Error Mean).

Tabelul Paired Samples Correlations prezint corelaia dintre cele doua variabile:
r=0.74, p=0.013, N=10. Evaluarea corelaiei liniare dintre cele dou variabile este legitim n acest
context de date, dar ofer o informaie diferit de testul diferenei dintre medii i, n mod obinuit, este
ignorat n acest context. Alegerea testului de corelaie sau a testului t se decide n funcie de obiectivul
cercetrii. Dac ne intereseaz msura n care performan crete (sau scade) n funcie de condiia de
zgomot, atunci testul t este cel potrivit.

Tabelul Paired Samples Test prezint rezultatele testului t, astfel:


- Diferena dintre medii (Mean)=53
- Abaterea standard a diferenei (Std. Deviation)=33.02
- Intervalul de ncredere al diferenie (95% Confidence Interval of the Difference):
limita inferioar (Lower)=29.38, limita superioar (Upper)=76.62. Dat fiind
numrul foarte mic al subiecilor (N=10), este de neles de ce intervalul de
21
Copyright DEPARTAMENT ID 2009

Marian Popa

ncredere este att de mare, ceea ce nseamn c diferena real, la nivelul


populaiei, este estimat cu precizie sczut de ctre cercetarea noastr.
Valoarea calculat a testului t (t)=5.07
Gradele de libertate (df)=9 (N-1)
Probabilitatea p (Sig. 2-tailed)=0.001.

Concluzia cercetrii i raportarea rezultatelor


Avnd n vedere c p<0.05, se respinge ipoteza de nul.
Se accept ipoteza cercetrii, conform creia performan de calcul aritmetic, pe un eantion
de 10 subieci, este mai mic n condiii de zgomot (m=124) dect atunci cnd au fost testai n
condiii de linite (m=177), pentru t=5.07 i p=0.001. Limitele de ncredere ale diferenei de
performan n cele dou condiii sunt, totui, destul de largi, fapt care indic o precizie redus de
estimare, ceea ce presupune o ncredere redus c la repetarea aceleiai cercetri, pe un numr egal de
subieci, am obine acelai rezultat.

22
Copyright DEPARTAMENT ID 2009

Marian Popa

Analiza de varian unifactorial


(One Way ANOVA)
Utilizare
Analiza de varian este, n esen, o procedur de testare a diferenelor dintre medii, atunci
cnd acestea sunt mai mult de dou i sunt calculate pe grupuri formate din subieci diferii. Dac, de
exemplu, am evaluat nivelul de sociabilitate cu un scor numeric, pentru trei categorii de copii (crescui
n familie, crescui de bunici i crescui la orfelinat), analiza de varian ne permite:
- s decidem dac variaiile mediei la scorul de sociabilitate sunt semnificative (testul F);
- s facem comparaii multiple ntre media fiecrui grup de copii cu mediile celorlalte
grupuri cercetate (analiza post-hoc).
n contextul analizei de varian valorile variabilei dependente sunt exprimate pe scal
cantitativ (I/R), iar variabila independent este de tip categorial. Dat fiind faptul c grupurile
comparate sunt formate din subieci diferii, modelul de cercetare acoperit de analiza de varian este
denumit model intersubiect (between subjects).
Dac se utilizeaz ANOVA pentru a testa diferena dintre dou medii obinute pe grupuri
independente, rezultatul ei este echivalent cu al testului t pentru grupuri independente (dar este o
utilizare este neuzual).
Exemplu
Pornind de o serie de observaii din viaa cotidian, ne propunem s verificm ipoteza c
nivelul de conformism variaz n funcie de vrst, fiind mai sczut la tineri i mai ridicat la
persoanele mai n vrst. n acest scop, am selecionat un eantion de subieci (N=30) format din trei
categorii de vrst (1=sub 30 de ani; 2=31-40 ani; 3=41-50 ani), fiecare categorie fiind compus din
10 subieci. Atitudinea conformist a fost evaluat cu un chestionar specializat, iar rezultatul se
exprim printr-un scor numeric.
Putem observa c variabila independent (vrsta) dei se exprim pe o scal ordinal, (valorile
1, 2 i 3 desemneaz vrste ordonate cresctor), este de natur categorial. Variabila dependent
(scorul la conformism) este msurat pe scal de raport.
Condiii
Utilizarea procedurii ANOVA este supus urmtoarelor condiii prealabile:
1. Independena observaiilor (valorilor) pentru fiecare grup comparat. Cu alte cuvinte,
valorile msurate pe subiecii unui grup s nu fie n nici un fel influenate de valorile
msurate pe celelalte grupuri. O modalitate de influen ar putea fi, de exemplu, faptul
c subiecii sunt informai cu privire la ipoteza cercetrii, fapt care i-ar putea stimula pe
cei mai n vrst s intre n competiie cu cei mai tineri (dac percep conformismul
drept un aspect negativ).
2. Distribuie normal a valorilor fiecrui grup comparat. Analiza de varian este robust
dac distribuiile comparate sunt simetrice sau dac asimetriile sunt n aceeai direcie.
Verificarea normalitii se face cu testele de normalitate din procedura Explore (opiunea
Normality Plots with Tests...), ori prin calcularea limitelor de n credere pentru Skewness,
fapt care permite evaluarea normalitii simetriei, separat de cea a boltirii. Din fericire,
testul F este considerat remarcabil de robust n cazul nclcrii condiiei de normalitate.
ANOVA este mai vulnerabil n situaia cnd distribuia variabilei dependente este prea
aplatizat sau prea nalt (kurtosis0) dect n cazul asimetriei (skewness0). Cu ct
volumul grupurilor supuse comparaiei este mai mare, cu att aspectele legate de
normalitatea distribuiei au un efect mai mic asupra ANOVA.
3. Omogenitatea dispersiei la nivelul fiecrui grup. mprtierea valorilor variabilei
dependente n interiorul grupurilor definite prin valorile variabilei independente trebuie s

23
Copyright DEPARTAMENT ID 2009

Marian Popa
fie egal. Aceast condiie se numete omogenitatea varianei. nclcarea acestei condiii
nu invalideaz testul ANOVA, care este destul de robust i n acest caz. n orice caz, se
vor analiza cu atenie cazurile care prezint valori extreme, care au un efect important
asupra varianei. Egalitatea (omogenitatea varianei) poate fi testat cu testul Levene.
Aranjarea datelor
Datele obinute se introduc ntr-o tabel SPSS aa cum se vede n imaginea din anex. Se
definete o variabil independent (definit ca factor n contextul ANOVA) care conine codurile de
apartenen a cazurilor la fiecare dintre grupurile supuse analizei (n cazul nostru categoriile de vrst:
1, 2, 3), i o variabil dependent, care conine valorile scorului la conformism.
Se va reine faptul c procedura ANOVA nu suport variabila independent de tip string. n
imagine baza de date SPSS este ordonat cresctor dup variabila virsta, dar acest lucru nu este
necesar pentru procedura de calcul.
Pentru nceput verificm respectarea condiiei de normalitate a distribuiilor la nivelul
fiecruia dintre grupurile comparate. n acest scop efectum procedura Explore (din meniul StatisticsSummarize), introducnd variabila dependent (conf) n zona Dependent List, iar variabila
independent (virsta) n zona Factor List, cu bifarea opiunii Normality plots with tests n caseta Plots.

Rezultatul apare n tabelul de mai jos. Aa cum se observ, testul Shapiro-Wilk (recomandabil
pentru eantioane mai mici de 40 de subieci) are un p (Sig.) mai mare de 0.05 pentru fiecare dintre
cele trei grupuri, ceea ce susine concluzia de normalitate a distribuiilor.

Omogenitatea dispersiei la nivelul celor trei grupuri comparate se ilustreaz grafic prin
intermediul celor trei reprezentri box-plot.

24
Copyright DEPARTAMENT ID 2009

Marian Popa
60

CONFORM

50

40

30
N=

10

10

10

sub30 ani

31-40 ani

41-50 ani

VIRSTA

O concluzie cu privire la omogenitatea dispersiilor se fundamenteaz ns pe baza unui test


statistic specializat, testul Levene, care se programeaz n caseta Explore: Plots (Spread vs Level with
Levene Test:).

Sunt oferite mai multe opiuni de calcul pentru testul de omogenitate n funcie de diferite
modaliti de transformare preliminar a datelor.
- Opiunea Power estimation este util pentru situaia n care testul nu susine ipoteza
omogenitii, iar variabila independent necesit o transformare de normalizare.2
- Opiunea Transformed permite alegerea direct a unei modaliti de transformare a
valorilor variabilei independente, n scopul normalizrii lor.
- Ultima dintre opiuni este Untransformed, pe care o considerm o soluie recomandabil
n acest caz, avnd n vedere rezultatul testului de normalitate anterior.
Rezultatul este sintetizat n tabelul urmtor, care estimeaz omogenitatea distribuiilor n
interiorul celor trei grupuri comparate, pe baze unor criterii variate (media, mediana, mediana ajustat,
media 5% trim). Valoarea lui p (Sig.) mai mare de 0.05 susine concluzia c distribuiile sunt omogene
sub aspectul dispersiei.

Problematica normalizrii datelor nu face obiectul cursului de baz.

25
Copyright DEPARTAMENT ID 2009

Marian Popa

Deoarece ipoteza de nul pentru testul Levene este aceea c dispersiile sunt omogene,
dispersiile vor fi considerate neomogene dac valoarea lui p (Sig.) este mai mic sau egal cu 0.05. n
cazul nostru, valorile lui p pentru cele trei grupuri sunt mai mari dect 0.05 i, drept urmare,
concluzionm c dispersiile sunt omogene.
Dup ce am testat principalele condiii ale analizei de varian, putem trece la efectuarea
testului ANOVA unifactorial.
Procedura: Statistics-Compare Means-One-Way ANOVA...

Caseta principal One-Way ANOVA:


Variabila dependent de trece n lista Dependent
List (pot fi testate mai multe variabile simultan)
Variabila independent se trece n zona Factor.

Caseta Post Hoc Multiple Comparison:


Se aleg testele de analiz post-hoc, pentru testarea
diferenei dintre medii, luate dou cte dou.
Pentru c nu tim nc dac variana este
omogen, vom bifa cte un test pentru fiecare caz
(Bonferoni, pentru varian neomogen i
Tamhane T2, pentru varian omogen).

n caseta Options bifm Descriptives i, dac nu am efectuat testul de omogenitate ca mai sus,
l putem face aici, bifnd Homogeneity-of-variance i Means Plot.

Dup finalizarea setrilor se apas OK pe caseta principal i se analizeaz rezultatele.


Rezultate
Tabelul Descriptives prezint indicatorii descriptivi ai variabilei dependente pentru grupurile
analizate.

26
Copyright DEPARTAMENT ID 2009

Marian Popa

Tabelul Test of Homogeneity of Variance conine rezultatul testului Levene. O valoare


nesemnificativ a acestuia (cum este cazul nostru, p=0.455), conduce la concluzia c dispersiile n
interiorul celor trei grupuri sunt omogene), ceea ce confirm concluzia la care am ajuns prin procedura
Explore (evident, efectuarea testului de omogenitate a varianei n acest punct nu mai este necesar,
dac a fost fcut anterior).

Tabelul ANOVA conine rezultatului testului F a crui valoare este 8.201 pentru un prag
p=0.002.

Tabelul Post Hoc Tests Multiple Comparisons prezint comparaiile mediilor celor trei
grupuri, luate dou cte dou. Muli autori recomand utilizarea analizei post-hoc numai dac se
obine un nivel semnificativ pentru testul F, deoarece unele teste post-hoc nu anihileaz ntr-o manier
suficient cumulul de eroare de tip I. Pe de alt parte, logica celor mai multe dintre testele post-hoc nu
reclam existena unei semnificaii globale a testului F drept condiie de utilizare (testul Bonferoni este
unul dintre ele).

27
Copyright DEPARTAMENT ID 2009

Marian Popa

Avnd n vedere c testul Levene a confirmat omogenitatea varianei, se vor citi valorile pentru
testul Bonferoni (n caz contrar, s-ar fi citit cele pentru testul Tamhane). Valorile sunt uor de analizat.
n prima coloana avem definite grupurile analizate (etichetarea valorilor variabilei independente ajut
mult la inteligibilitatea tabelului). n coloana a patra (Sig.) se afl semnificaiile pentru diferena dintre
medii. Astfel, putem constata faptul c nivelul de conformism al subiecilor sub 30 de ani difer
semnificativ de nivelul de conformism al fiecreia din celelalte dou categorii de vrst (p=0.027
respectiv, p=0.002). n acelai timp, nu se contat o diferen semnificativ ntre categoria 31-40 ani i
41-50 de ani (p=0.814).
Aceasta concluzie este ilustrat de reprezentarea grafic a mediei timpului de reacie ale celor
trei grupuri.
50

CONFORMISM (media)

48

46

44

42

40
sub30 ani

31-40 ani

41-50 ani

VIRSTA

Aa cum se poate observa, nivelul de conformism crete progresiv de la o categorie de vrst


la alta, dar mai accentuat ntre 21-30 ani i 31-40 ani. Graficul singur, fr susinerea procedurii
ANOVA, nu ar fi permis concluzionarea unei diferene semnificative ntre cele trei grupuri.

Relaia dintre ANOVA unifactorial i testul t


Logica testului ANOVA se potrivete i pentru situaiile n care variabila independent
prezint dou valori i, ca urmare, aceast procedur se poate aplic i n acest din urm caz.
n practic ns, pentru testarea diferenei dintre mediile a dou grupuri independente se
utilizeaz testul t pentru eantioane independente. Unul dintre motivele principale pentru care
este recomandabil s procedm astfel este faptul c testul t este direcional (testeaz diferena
dintre medii n ambele sensuri, peste i sub zero), n timp ce ANOVA este nondirecional (ne
spune numai dac variaia mediilor este semnificativ, indiferent de semnul diferenei dintre
ele).

28
Copyright DEPARTAMENT ID 2009

Marian Popa
Datele cercetrii

29
Copyright DEPARTAMENT ID 2009

Marian Popa

Coeficientul de corelaie liniar Pearson (r)


Utilizare
Corelaia Pearson (r) evalueaz gradul de asociere dintre dou variabile msurate pe scal de
interval/raport. Aceasta se refer la intensitatea i sensul de variaie concomitent a valorilor unei
variabile n raport cu cealalt, dup un model de tip liniar. Dac valorile unei variabile urmeaz, n
sens direct, cresctor, sau invers, descresctor, valorile celeilalte variabile, atunci cele dou variabile
coreleaz ntre ele. Domeniul de variaie a coeficientului de corelaie Pearson (r) este ntre r=-1
(corelaie perfect negativ) i r=+1 (corelaie perfect pozitiv). Absena oricrei legturi (corelaii)
dintre variabile se traduce prin r=0.
Analiza de corelaie este o procedur care implic dou msurri pentru aceiai subieci,
situaie care corespunde aa numitului model de cercetare intrasubieci (within-subjects). Acelai
model se ntlnete ns i atunci cnd aplicm testul t pentru eantioane dependente, deoarece i n
acest caz avem dou msurri pentru fiecare subiect. S presupunem c msurm numrul erorilor
nainte i dup ingerarea unei anumite cantiti de alcool. n aceast situaie am putea, desigur, s
calculm i testul de corelaie Pearson, dar testul t pentru eantioane dependente ne-ar spune nu doar
dac exist o legtur ntre variabila dependent (numrul erorilor) i variabila independent (alcoolul
prezent/absent), ci i dac diferena dintre cele dou momente este una important sau nu. n
exemplul dat, cele dou msurri s-au efectuat cu acelai instrument, fapt care permite calcularea
diferenei dintre cele dou momente. Dar sunt i alte situaii de cercetare n care cercettorul este
interesat s probeze existena unei relaii ntre variabile diferite, msurate pentru aceiai subieci (de
exemplu, ntre anxietate i depresie, ntre timpul de reacie i numrul erorilor, ntre nlime i
atitudinea de agresivitate etc.). n aceste situaii fiecare variabil este msurat cu instrumente diferite
i se exprim prin uniti de msur diferite. Testul de corelaie este o metod care permite probarea
existenei unei asocieri ntre aceste de variabile, ca urmare a faptului c, principial, procedura de calcul
se bazeaz pe transformarea n valori z, libere de unitatea de msur.
Testul de corelaie implic dou variabile dar, adesea, ntr-o cercetare psihologic numrul
variabilelor supuse corelaiei este mai mare de dou. Acest fapt conduce la ceea ce se numete o
matrice de corelaii, care este un tabel ale crui celule cuprind corelaiile dintre perechile de variabile.
Exemplu: ntr-un studiu cu privire la preferina pentru risc se urmrete evidenierea asocierii
acesteia cu nivelul anxietii i cu agresivitatea. n acest scop, toate cele trei variabile au fost msurate
cu ajutorul unor scale special construite, iar rezultatele sunt exprimate n scoruri numerice (scal I/R).
Testul de corelaie ne va spune n ce msur exist o relaie (asociere) ntre preferina pentru risc, pe
de o parte, i celelalte dou caracteristici de personalitate, pe de alt parte. Dei variabila care face
obiectul cercetrii este preferina pentru risc, ea nu este considerat variabil dependent. n
contextul testului de corelaie nu exist variabile dependente i independente. Rezultatul testului pune
n eviden asocierea dintre ele, ceea ce corespunde unei situaii de dependen reciproc.
Condiii
Condiia principal pentru calcularea coeficientului de corelaie liniar Pearson este ca
variabilele implicate s fie msurate pe scal de interval/raport (alturi de existena unei forme a
distribuiei care nu se abate sever de la curba normal).
Testele neparametrice alternative, pentru cazul n care condiiile pentru utilizarea testului
Pearson nu se ndeplinesc, sunt: testul chi-ptrat (pentru date nominale) sau coeficienii de corelaie
Spearman sau Kendall (pentru date ordinale).
Aranjarea datelor
Se creeaz variabile distincte pentru fiecare caracteristic supus testrii.

30
Copyright DEPARTAMENT ID 2009

Marian Popa

Procedura: Statistics-Corelate-Bivariate
Variabilele supuse corelaiei vor fi trecute n lista Variables:
Testul implicit, din zona Correlation Coefficients, este Pearson, dar se poate bifa un altul
(Kendall sau Spearman), dac datele sunt neparametrice (ordinale).
Tipul implicit de testare a ipotezei este bilateral (Two-tailed), dar se poate alege unilateral
(dac exist o justificare solid).
Flag significant correlations, determin marcarea cu un asterisc a coeficienilor semnificativi
la p=0.05, i cu dou asteriscuri a celor semnificativi la p=0.01. Acest lucru este util atunci cnd
matricea de corelaie este mare, pentru a scoate n eviden valorile semnificative ale lui r.

Rezultate

Tabelul rezultatelor cuprinde matricea de corelaii a variabilelor analizate. El este redundant,


deoarece prezint aceleai corelaii de dou ori, odat deasupra diagonalei i, din nou, sub diagonala
tabelului. Corelaiile variabilelor cu ele nsele sunt perfecte i pozitive (r=1) i nu prezint, desigur,
nici un interes.
Fiecare celul include urmtoarele informaii:

31
Copyright DEPARTAMENT ID 2009

Marian Popa

valoarea lui r
nivelul p (probabilitatea cu care valoarea calculat a lui r apare pe distribuia de
nul)
numrul de subieci (N)
n cazul nostru, consemnm corelaii negative dar nesemnificative ntre anxietate i
agresivitate (r=-0.38, p=0.26), pe de o parte, i ntre anxietate i preferina pentru risc, pe de alt parte
(r=-0.40, p=0.24). n acelai timp, se constat o corelaie semnificativ (r=0.96, p<0.0005) ntre
agresivitate i preferina pentru risc. Precizm faptul c raportarea coeficienilor de corelaie se face cu
dou zecimale, chiar dac programele i calculeaz cu trei zecimale.
Dezavantajul acestui tip de tabel const n faptul c avem, de fapt, o dubl prezentare a
corelaiilor, deasupra diagonalei i sub diagonal. Pentru corelaii implicnd multe variabile tabelul se
va citi cu relativ dificultate.
S presupunem c suntem interesai doar de corelaiile dintre anxietate i agresivitate cu
variabila preferin pentru risc, nu i de corelaia dintre anxietate i agresivitate. n acest caz, n caseta
principala, Bivariate Correlations, prezentat mai sus, variabilele vor fi introduse astfel nct variabila
preferina pentru risc sa fie ultima din list. Apoi se apas butonul Paste, al crui efect este
deschiderea ferestrei Syntax, ca o fereastr distinct, n care se afl procedura de corelaie. Acolo, pe
linia /VARIABLES=anx agresiv risc, se insereaz cuvntul WITH ntre agresiv si risc, avnd grij s
existe spaiu att n stnga ct i n dreapta sa.

inserai WITH

Mai departe, se selecteaz ntreaga procedur (cu ajutorul mouse-ului) i se apas pe butonul
Run () de pe bara de comenzi a ferestrei
Rezultatul din Viewer va arta ca mai jos:

Este evident c aceast modalitate se poate aplica pentru orict variabile, dac avem grij s le
aezm separat n list i s includem clauza WITH ntre cele dou categorii de variabile. Nu pot fi
incluse mai multe clauze WITH n aceeai procedur.
Ulterior, putem reveni n fereastra Syntax pentru a o nchide (cu File-Close), salvnd sau nu
procedura astfel modificat.

32
Copyright DEPARTAMENT ID 2009

Marian Popa
Expresia grafica a corelaiei (Scatterplot)
Caracterul i intensitatea corelaiei dintre dou variabile se evideniaz extrem de sugestiv cu
ajutorul unei proceduri grafice specifice, numit scatterplot.
Aceasta se lanseaz din meniul principal Graphs-Scatter... care deschide urmtoarea caset de
dialog:

n cazul nostru, s presupunem c dorim reprezentarea grafic a corelaiei dintre agresivitate i


preferina pentru risc, singura semnificativ. n acest scop, selectm pe caseta Scatterplot opiunea
Simple i apsm Define.

Trecem variabila Agresivitate pe axa Y i variabila Preferina pentru risc pe axa Z (se poate la
fel de bine i invers). Se apas OK i se obine graficul din imaginea urmtoare, care sugereaz foarte
clar existena unei asocieri de tip liniar ntre cele dou variabile.

Reprezentarea grafic este surs de informaii cu privire la natura relaiei dintre variabile,
motiv pentru care este recomandabil utilizarea frecvent a acesteia. Mai mult, ea este necesar n

33
Copyright DEPARTAMENT ID 2009

Marian Popa
special atunci cnd valoarea corelaiei este redus, sau nesemnificativ, deoarece graficul poate scoate
n eviden o legtura de alt tip dect liniar.
L O corelaie r=0.92, ca cea obinut mai sus, ntre agresivitate i preferin pentru risc, este
improbabil s se ntlneasc ntr-un studiu real. De fapt, dac s-ar ntmpla s apar, ar
trebui s concluzionm mai degrab c cele dou variabile se confund, dect c sunt
distincte. Aceasta deoarece este firesc s existe corelaii ntre variabile psihologice, dar
este nefiresc ca relaia dintre ele s fie att de intens, fr a ne gndi c rezult dintr-o
eventual eroare de definire a lor sau, eventual, dintr-o eroare de msurare, prin utilizarea
unui instrument care nu face o distincie real ntre ele.

34
Copyright DEPARTAMENT ID 2009

Marian Popa

Analiza de itemi
Introducere n analiza de itemi
Msurarea caracteristicilor psihologice se bazeaz n mod obinuit pe teste, care sunt formate
din mai multe ntrebri sau sarcini (denumite generic itemi). Rspunsul subiecilor la fiecare item
sunt punctate, dup care se calculeaz rezultatul la testul respectiv, sub forma unui scor numeric. Pe
tot acest parcurs, conduita subiectului (subiectiv sau obiectiv) este fixat prin numere. Pentru ca
rezultatul final s fie unul adecvat, adic s exprime corect starea subiectului n raport cu caracteristica
psihologic msurat, este esenial s ne asigurm c aceste numere au caliti reale de msurare. n
caz contrar, riscm s facem evaluri lipsite de orice fundament. Analiza de itemi reprezint o colecie
de proceduri statistice care permit investigarea calitilor de msurare a testelor psihologice.
Principiile analizei de itemi se aplic att instrumentelor care msoar atribute ale
personalitii, ct i celor care vizeaz aspecte de performan (abiliti, aptitudini). Analiza de itemi se
prezint sub dou aspecte principale:
- calitativ, analiza de itemi se refer la modul n care sunt elaborai itemii (ntrebrile sau
sarcinile de lucru) i are n vedere aspecte de formulare lingvistic sau stilistic (de
exemplu, evitarea dublei negaii);
- cantitativ, analiza de itemi se refer la proprietile statistice ale rspunsurilor la itemi.
n cazul unui chestionar psihologic sau a unui test de performan, este posibil ca unii dintre
itemii care le compun s nu funcioneze aa cum ne-am dorit: pot crea confuzii, pot fi interpretai
greit, pot fi prea uori sau prea dificili, etc. Motivele care pot genera astfel de situaii sunt variate:
formulare confuz (de exemplu, prin utilizarea negaiei);
alte informaii care acompaniaz itemul (grafice, imagini, diagrame, etc.) pot fi neclare sau
greite;
nu exist un rspuns corect evident, situaie n care una dintre variantele greite (distractor)
este considerat corect;
exist itemi care se refer la un alt coninut (atribut) dect cel vizat de restul itemilor;
exist un efect discret de incompatibilitate al unor itemi n raport cu caracteristicile subiecilor
investigai (legat de sex, grup etnic, vrst, etc.)
Pn la un punct, aceste neajunsuri pot fi, fie prevenite, fie eliminate, mai ales cnd sunt
evidente, prin analiza calitativ, intuitiv. Precizia operaiei poate fi ns mult mbuntit dac se
apeleaz la un set de prelucrri statistice special destinate analizei de itemi. Aceste proceduri
contribuie la ameliorarea calitilor psihometrice ale unui instrument de evaluare psihologic, prin
identificarea itemilor improprii (greii sau redundani) care ar trebui eliminai sau modificai.. Toate
aceste proceduri sunt denumite generic analiza de itemi.
n funcie de obiectivele urmrite, procedurile clasice ale analizei de itemi, care sunt cele mai
frecvent utilizate, sunt urmtoarele:
1. evaluarea indicelui de dificultate a itemilor;
2. evaluarea capacitii de discriminare a itemilor.
3. evaluarea consistenei interne a instrumentului;
Premisa fundamental de la care pornete analiza clasic a testelor psihologice este aceea c
scorul testului este compus dintr-o valoare adevrat (care exprim corect atributul vizat) i o
cantitate de eroare (care vizeaz altceva). n cazul unui test bine fcut, eroarea se distribuie
normal pe ansamblul testului, nu este corelat cu scorul adevrat i are media egal cu zero.

1. Evaluarea dificultii itemilor


Multe dintre testele dezvoltate de psihologi vizeaz caracteristici psihice exprimate n termeni
de performan, n scopul clasificrii pentru selecie sau evalurii comparative (aptitudini i abiliti

35
Copyright DEPARTAMENT ID 2009

Marian Popa
diverse). n cazul acestui tip de scale, este de interes major evaluarea capacitii de discriminare a
fiecrui item.
Unul dintre indicatorii utilizai n acest scop este indicele de dificultate, care semnific
procentul de rspunsuri corecte al fiecrui item. Pentru testele de personalitate, conceptul de corect
sau greit se nlocuiete cu orientarea rspunsului spre semnificaia scalei sau mpotriva acesteia
(marcnd prezena sau absena trsturii vizate). Orice item la care se obin numai rspunsuri corecte,
sau la care nimeni nu rspunde corect, este lipsit de relevan deoarece nu produce nici o difereniere
ntre subieci. Dac presupunem existena unei relaii perfecte dintre abilitatea subiectului (cea
msurat prin test) i succesul la un item, atunci un indice de dificultate de 50% va diferenia ntre
subiecii care se plaseaz n prima jumtate a scalei i cei care se plaseaz n doua jumtate a scalei de
performan. n acelai timp, dac toi itemii unei scale ar avea un indice de dificultate de 50%, atunci,
prin aplicarea scalei, s-ar discrimina doar dou categorii de subieci, fapt care nu este de natur s
conduc la rezultate suficient de sensibile n evaluarea subiecilor. n general, se consider c o scal
este suficient de discriminativ atunci cnd este compus din itemi al cror indice de dificultate este
moderat (30%-40%).
ntr-un mod similar se pune problema i n cazul ntrebrilor la teste de personalitate, la care
rspunsurile sunt interpretate n funcie de orientarea lor spre o anumit trstur psihic, sau
mpotriva ei.
Atunci cnd itemii sunt selectai pe baza indicelui de dificultate, mai trebuie luai n
considerare doi factori suplimentari:
a. Dei un indice mediu de dificultate de 50% este suficient pentru a maximiza variana total a
scorului, aceast valoare trebuie s fie mai mare n cazul n care avem de a face cu
rspunsuri la un test cu alegeri multiple. Aceasta deoarece trebuie s lum n considerare
faptul c o parte a rspunsurilor corecte pot fi ghicite, date la ntmplare.
b. Dac dorim ca scala s fie discriminativ i spre extremele ei, atunci vor trebui inclui i
itemi al cror indice de dificultate s se afle n apropierea extremelor, adic mai mici sau
mai mari de 50%.
n general, este considerat recomandabil un indice de dificultate mediu pe scal cuprins ntre
30%-70% (sau, exprimat sub form zecimal, ntre 0.3 i 0.7)

Modul de calcul al indicelui de dificultate


Aa cum l-am descris mai sus, indicele de dificultate se calculeaz ca procent de rspunsuri
corecte pentru fiecare item. Pentru evaluarea dificultii itemilor cu SPSS se va utiliza procedura
Frequency din meniul Statistics. Mai jos avem imaginea analizei de frecvene pentru un item oarecare,
i_01, al unui test cu 22 de itemi, unde valoarea 0 nseamn rspuns greit iar valoarea 1, rspuns
corect3.
Indicele de dificultate se citete pe coloana Percent, dac variabila nu are valori lips, i pe
coloana Valid Percent, dac exist valori lips. n cazul nostru, indicele de dificultate al itemului 01
este de 81.8% (0.81) cazul nostru.

Se utilizeaz datele din fiierul didactic alfa_tema.sav

36
Copyright DEPARTAMENT ID 2009

Marian Popa
2. Evaluarea capacitii de discriminare a itemilor
Procentajul rspunsurilor corecte (indicele de dificultate) nu este o condiie suficient pentru a
judeca calitatea unui item. La fel de important este ca numrul rspunsurilor corecte s fie n legtur
cu nivelul abilitii (sau trsturii, dac este un test de personalitate) pe care intenionm s o msurm
cu acel instrument. Acest aspect este surprins de indicele de discriminare. Dac cei care rspund corect
(sau n spiritul trsturii, pentru un test de personalitate), la un anumit item, au un nivel ridicat al
abilitii (trsturii), n timp ce cei care rspund greit au nivel sczut, sau dac ambele grupuri au
acelai nivel al abilitii (trsturii), atunci este clar c itemul respectiv este, fie formulat greit, fie
msoar altceva dect se presupune c msoar.
Un item care dispune de capacitate de discriminare are un procentaj al rspunsurilor corecte
mai mare pentru subiecii care obin rezultate mai mari la nivelul ntregii scale (care msoar
abilitatea), i un procentaj mai mic pentru subiecii care obin o valoare mai mic pentru scala
respectiv. n absena unui criteriu extern de validare a rspunsului, scorul total, obinut prin
nsumarea rspunsurilor corecte, este utilizat drept criteriu de discriminare. Pentru calcularea indicelui
de discriminare se procedeaz n felul urmtor:
se calculeaz scorul total;
se formeaz dou grupuri distincte, fiecare reprezentnd un anumit procent din
subiecii evaluai, aflai la extremele distribuiei. Procentul selectat este arbitrar. Cu
ct este mai mic, cu att indicele de discriminare este mai mare dar, n acelai timp,
mai puin sigur. De aceea, se recomand un selectarea unui procent cuprins ntre 25%
i 33%, care reprezint un compromis rezonabil.
odat grupurile selecionate, se poate calcula un indice de discriminare, simbolizat cu
"D", dup urmtoarea formul:

D=

U
L

nU nL

unde:

U=numrul subiecilor din grupul superior (Upper group) care au rspuns corect la un
item
nU=numrul subiecilor din grupul superior
L=numrul subiecilor din grupul inferior (Lower group) care au rspuns corect la un
item
nL=numrul subiecilor din grupul inferior

Dac numrul subiecilor din cele dou grupuri extreme este egal, atunci D=(U-L)/n.
O valoare pozitiv va indica faptul c itemul discrimineaz corect, n concordan cu
constructul psihologic msurat. Cu ct mai mare este diferena, cu att mai mare este capacitatea
itemului de discriminare ntre subiecii buni i cei slabi sub aspectul acelui construct. Pe de alt
parte, o valoare negativ sugereaz o discriminare negativ ntre grupurile extreme, fapt care este o
dovad puternic a unei probleme n construcia acelui item. Ebel (1965) sugereaz eliminarea sau
revizuirea complet itemilor a cror indice de discriminare este mai mic de 0.20 i revizuirea itemilor
al cror indice este ntre 0.20 i 0.30. Un indice de discriminare bun se plaseaz ntre 0.30-0.39, iar
unul foarte bun, peste 0.40.
Dei uor de calculat i utilizat, indicele D sufer de un mare neajuns: prin compararea a doar
dou grupuri extreme, selectate arbitrar din ansamblul subiecilor testai, o parte din informaie este
ignorat, deoarece subiecii care fac parte din grupul de performan intermediar nu sunt luai n
considerare. Soluia acestei probleme ar putea fi aceea de a mpri ansamblul valorilor scalei n mai
multe subgrupuri, n funcie de numrul subiecilor i de fineea dorit a analizei. n acest fel, indicele
de dificultate al fiecrui item ar putea fi analizat prin raportare la fiecare subgrup valoric. n mod ideal,
indicele de dificultate (procentul rspunsurilor corecte) al unui item bine calibrat trebuie s fie mai

37
Copyright DEPARTAMENT ID 2009

Marian Popa
mic pentru subiecii din grupul valoric inferior i s creasc progresiv, pe msur ce este calculat
pentru grupurile cu performane mai mari la scorul global (Peladeau, 1995).

Modul de calcul al indicelui de discriminare cu SPSS


Programul SPSS nu dispune de o procedur specific pentru analiza de discriminare a itemilor.
Cu toate acestea, dispune de suficiente posibiliti pentru realizarea acestui tip de analiz. Vom
prezenta mai jos un exemplu pentru itemul i_01, al crui nivel de dificultate a fost calculat anterior. n
acest scop, am procedat astfel:
a) Calculm scorul global al scalei, compus din 22 de itemi, din care face parte itemul i_01,
utiliznd procedura Transform/Compute, aa cum se vede mai jos:

b) Analizm variabila "scor" astfel obinut cu procedurile Explore i Frequencies, din meniul
Statistics, fixnd arbitrar dou grupe extreme de performan, compuse fiecare din aproximativ 30%
dintre subiecii examinai cu respectivul instrument, astfel:
grupul inferior, valorile 7-13 (NL=7)
grupul superior, valorile 18-22 (NU=11)
scor

Valid

7,00
9,00
10,00
12,00
13,00
15,00
16,00
17,00
18,00
19,00
20,00
21,00
22,00
Total

Frequency
1
1
1
2
2
2
1
1
4
3
2
1
1
22

Percent
4,5
4,5
4,5
9,1
9,1
9,1
4,5
4,5
18,2
13,6
9,1
4,5
4,5
100,0

Valid Percent
4,5
4,5
4,5
9,1
9,1
9,1
4,5
4,5
18,2
13,6
9,1
4,5
4,5
100,0

Cumulative
Percent
4,5
9,1
13,6
22,7
31,8
40,9
45,5
50,0
68,2
81,8
90,9
95,5
100,0

c) Am creat o variabil nou, n care am definit apartenena subiecilor la grupurile definite


mai sus, pe care le-am codificat astfel, cu procedura Tranform/Recode/Into Different Variables:
"1", grupul inferior
"2", grupul median

38
Copyright DEPARTAMENT ID 2009

Marian Popa
"3", grupul superior

i apoi, dup acionarea butonului Old and New Values: declarm valorile aa cum se vede n
caseta de mai jos

n urma acestei operaii am obinut variabila "grup", ale crei valori, 1,2 sau 3, marcheaz
apartenena subiecilor la unul dintre cele trei grupe valorice.
d) Declarm mprirea fiierului cu date n trei categorii de subieci, cu procedura Data/Split
File, aa cum se vede n imaginea de mai jos.

39
Copyright DEPARTAMENT ID 2009

Marian Popa

Efectul acestei aciuni este acela c, orice prelucrare vom face cu SPSS n continuare, aceasta
va fi efectuat separat pentru fiecare din cele trei categorii separate prin valorile variabilei "grup".
e) n fine, acum se poate rula procedura Frequencies din meniul Statistics, pentru variabila
i_01. Datorit efectului de mprire a bazei de date prin comanda Split file, rezultatul va fi structurat
pentru fiecare subgrup valoric n parte, aa cum se vede n imaginea de mai jos:
i_01
grup
1,00

Valid

2,00
3,00

Valid
Valid

0
1
Total
1
0
1
Total

Frequency
3
4
7
4
1
10
11

Percent
42,9
57,1
100,0
100,0
9,1
90,9
100,0

Valid Percent
42,9
57,1
100,0
100,0
9,1
90,9
100,0

Cumulative
Percent
42,9
100,0
100,0
9,1
100,0

Tabelul din imagine prezint frecvena rspunsurilor corecte, citit pe coloana Percent (sau pe
coloana Valid Percent, dac exist valori lips). Aa cum se observ, indicele de dificultate pentru
grupul valoric inferior este mai mic (57.1%) dect pentru grupul superior (90.9%).
Aplicnd manual formula, obinem indicele de discriminare cutat:

D=

10 4
= +0.33
11 7

Rezultatul arat c itemul i_01 are un indice pozitiv de discriminare de 0.33 care, n
conformitate cu criteriile lui Ebel, indic o capacitate bun de discriminare. Chiar dac obinem i unii
indici de discriminare mai mici, dac dorim s avem o scal care are putere de discriminare i la
extremele sale, acetia pot fi pstrai.
Not: Se poate observa c se poate ajunge la o valoare similar, exprimat n procente, prin
simpla diferen a celor doi indici de dificultate "D=90.9-57.1=33.7)
Mai departe, ar trebui efectuat procedura Frequencies pentru toi cei 22 de itemi ai testului i
extragerea concluziilor care se impun.

3. Consistena intern (Cronbach alfa)


Avnd un instrument psihologic format din itemi diferii, o problem fundamental care se
pune este msura n care aceti itemi sunt unidimesionali, adic msoar aceeai realitate
psihologic. Numai dac aceast condiie este ndeplinit, se poate face suma lor, pentru construirea
unui scor unic (denumit n continuare scal). Dac avem n vedere un chestionar de personalitate
sau o scal de atitudine de tip Lickert, atunci ne ateptm c acest instrument este destinat msurrii
unui anumit aspect sau atribut psihic i, n mod ideal, numai aceluia. Cu alte cuvinte, ntrebrile unui
chestionar, la fel ca i cele ale unui test de performan, ar trebui s fie astfel formulate nct s se
refere la o singur realitate psihic, vizat prin obiectivul instrumentului. Dac aceast condiie este
ntrunit, atunci itemii ar trebui s aib o variabilitate comun, adic o anumit relaie unii cu alii, pe
de o parte, dar i o relaie cu scorul global al scalei, pe de alt parte. Aceast calitate a unui test se
numete consisten intern i este ntrunit atunci cnd fiecare dintre itemii care l compun este
relevant n raport cu dimensiunea psihic vizat de instrument. Corelaia dintre un anumit item i

40
Copyright DEPARTAMENT ID 2009

Marian Popa
scorul global, calculat fr acel item, poate fi considerat un indicator a relaiei mai sus amintite. O
alt faet a consistenei unui instrument psihologic este fiabilitatea sa, care poate fi exprimat prin
stabilitatea scorului global atunci cnd acelai instrument, sau o form alternativ a acestuia, este
aplicat acelorai subieci.
Fr a fi singura procedur statistic utilizabil n astfel de situaii, coeficientul Cronbach alfa
() este de departe cel mai cunoscut dintre toate, fiind utilizat ca un indicator al preciziei de msurare
a unui test, al consistenei interne i fidelitii unui instrument psihologic. El nu este un test statistic, ci
un indice sau coeficient care msoar caracteristica de consisten intern a unui instrument psihologic
compus din mai muli itemi, care sunt nsumai ntr-un scor unic. Formula de calcul se bazeaz pe
media coeficienilor de corelaie dintre itemi i numrul itemilor:

N rm
1 + ( N 1)* rm

unde:
N=numrul itemilor
rm=media coeficienilor de corelaie dintre itemi
Principalul motiv pentru care am introdus aici formula lui Cronbach este pentru a scoate n
eviden faptul c valoarea sa poate fi crescut pe dou ci:
- fie prin creterea similaritii dintre itemi, care conduce la coeficieni mai mari de
corelaie interitemi;
- fie prin creterea numrului de itemi.
Indicele Cronbach alfa este, de asemenea, un indicator al preciziei scalei i poate fi vzut prin
prisma valorii teoretice maxime pe care o poate lua o corelaie cu aceast scal. Altfel spus, corelaia
unei variabile msurate cu un test psihologic, cu o alt variabil psihologic, nu va putea fi niciodat
mai mare dect consistena intern a fiecreia dintre cele dou variabile investigate, dat de indicele
Cronbach alfa. Din acest motiv, atunci cnd studiem relaia dintre anumite variabile psihologice
trebuie s ne punem problema preciziei cu care acestea au fost msurate, deoarece mrimea
corelaiei posibile dintre ele este fixat de precizia msurrii fiecreia.
Valoarea Cronbach alfa tinde sa fie cu att mai mare cu ct numrul itemilor scalei este mai
mare. Ca urmare, putem fi tentai s utilizm chestionare cu un numr mai mare de ntrebri. Acest
lucru poate genera cel puin dou probleme pe care trebuie s le lum n considerare:
din motive practice, testele mai scurte sunt de dorit, date fiind reducerea costurilor de realizare
i a duratei de aplicare;
n cazul testelor mai lungi, pot exista ntrebri care, chiar dac au o corelaie pozitiv cu scala,
contribuie la reducerea indicelui Cronbach alfa sau au o contribuie minor la consistena
general a scalei.
n practic, autorul unui chestionar este interesat s reduc numrul itemilor fr a afecta
consistena intern a scalei. n acest scop, "valoarea lui alfa n cazul eliminrii itemului" (Alpha if item
deleted) este un indicator foarte util. Eliminnd succesiv itemii a cror prezen contribuie la reducerea
valorii Cronbach alfa, sau au o contribuie redus la acesta, se poate ajunge la un numr suficient de
mic de itemi n condiiile obinerii unei valori mai mari pentru Cronbach alfa.
Procedura de analiz a consistenei interne are un caracter recursiv, cu evaluri succesive ale
relaiilor dintre itemi, dintre itemi i scorul global, i cu operarea seleciei itemilor n funcie de relaia
lor cu acesta. Criteriul de baz pentru aceast operaie este valoarea indicelui Cronbach alfa, care are o
plaj de variaie ntre 0 i 1. O scal, pentru a fi considerat consistent, trebuie s ating o valoare a
indicelui Cronbach alfa ct mai aproape de 1, nivelul de 0.70 fiind acceptat, prin convenie, ca prag
minim. Oricum pentru un instrument consistent valoarea lui Cronbach alfa nu poate fi mai mic de
0.60, iar o valoare ct mai mare este ntotdeauna de dorit. Unii autori consider drept acceptabil o
valoare de 0.5 a indicelui Cronbach alfa n cazul scalelor cu un numr mic de itemi (10-15), n timp ce
pentru scalele mai mari de 50 de itemi reclam valori ale lui Cronbach alfa de cel puin de 0.80.
Facem precizarea c atunci cnd ne referim la scorul global al unei scale, avem n vedere
nsumarea rspunsurilor fiecrui item care contribuie la construcia acestuia. n cazul n care testul

41
Copyright DEPARTAMENT ID 2009

Marian Popa
respectiv este compus din mai multe scale (trsturi de personalitate, de exemplu), indicele Cronbach
alfa se calculeaz, desigur, n mod distinct pentru fiecare scal n parte. Acesta nu se calculeaz ns n
situaiile n care itemii unui instrument nu sunt utilizai pentru construcia unui scor global, ci sunt
analizai de sine stttor (de exemplu, in cazul ntrebrilor unui interviu).

Analiza de consisten intern cu SPSS


Procedura de analiz se lanseaz din meniul Statistics-Scale-Reliability Analysis..., care
deschide urmtoarea caset de dialog:

Variabilele4 care conin valorile itemilor de analizat vor fi trecute n lista Items.
Atenie, variabilele trebuie s conin valori care exprim semnificaia rspunsului n raport cu
scala global i nu rspunsul efectiv al subiectului. De exemplu, dac variantele de rspuns sunt
codificate cu 1, respectiv 2, pot exista ntrebri pentru care varianta 1 aduce un punct la scala iar
varianta 2 aduce zero puncte la scal. ntr-o asemenea situaie, pentru analiza de itemi valorile
codificate de rspuns vor fi transformate n valori corespunztoare (0 i 1). n acelai mod se va opera
i pentru itemii care au mai multe variante de rspuns, cum este cazul scalelor de tip Lickert. Codurile
convenionale ale variantelor de rspuns vor fi transformate n valori, n funcie de semnificaia
contribuiei lor la construirea scorului global.
n lista Model se poate alege unul dintre urmtoarele modele de analiz:
Alfa. Calculeaz Cronbach alfa care pentru date dihotomice este echivalent cu coeficientul
Kuder-Richardson 20 (KR20)
Split-half. Pentru corelaia dintre forme paralele, coeficientul de fidelitate Guttman,
coeficientul Spearman-Brown, coeficientul alfa pentru fiecare jumtate.
Modele Gutman. Coeficienii lambda, de la 1 la 6
Modele paralele i strict paralele. Testele pentru gradul de coresponden (goodness-offit), variana comun i alte caracteristici ale raporturilor dintre itemi.
Pentru analiza de consisten intern se alege modelul Alfa.

Se utilizeaz fiierul didactic saq_10_itemi.sav

42
Copyright DEPARTAMENT ID 2009

Marian Popa
n continuare, se fac setri de analiz prin deschiderea casetei Statistics:

n zona Descriptives se vor bifa opiunile:


o Item (analiza fiecrui item separat);
o Scale (analiza scorului global)
o Scale if item deleted (analiza scorului fr contribuia unui anumit item)
n zona Inter-item se va bifa Corelations, pentru a obine matricea de corelaii dintre itemi.
Summaries permite calcularea unor indicatori descriptivi pentru fiecare dintre itemii analizai
(media, variana, covariana, corelaii)

n practic, bifarea opiunilor marcate pe caseta din imaginea de mai sus ofer informaiile
cele mai importante pentru analiza itemilor unui test. Celelalte opiuni sunt explicitate n Help-ul
casetei i pot fi utilizate pentru o analiz mai rafinat a datelor.
n continuare, vom analiza un set de 10 itemi ipotetici, alei doar n scop didactic. Pentru o
scal real acest numr ar fi cu totul insuficient. Ca regul general, numrul itemilor din faza de
dezvoltare a unui astfel de instrument ar trebui s aib cel puin dublul numrului de itemi pe care l
preconizm la final. Acest lucru se impune deoarece analiza de itemi este un proces selectiv care are
drept scop alegerea itemilor adecvai pentru constituirea unei scale cu cel mai ridicat nivel de
consisten intern posibil.
Rularea procedurii, cu setrile de mai sus ne ofer mai multe categorii de informaii:
Un tabel cu indicatori descriptivi, media i abaterea standard a itemilor. Analiza valorilor
permite evidenierea tendinei centrale i a mprtierii rspunsurilor pentru fiecare item n parte:

43
Copyright DEPARTAMENT ID 2009

Marian Popa
Matricea corelaiilor dintre itemi.

Corelaiile itemilor ofer o imagine a gradului de asociere dintre acetia. Valorile sunt utile, pe
de o parte, pentru a sesiza itemii care tind s aib relaii negative cu ceilali, fiind un semn al unei
posibile probleme de construire respectivilor itemi. Din tabelul alturat rezult c itemii i_02 i i_03
tind s se asocieze negativ cu majoritatea celorlali itemi. Pe de alt parte, valori extrem de ridicate ale
unor corelaii, aproape de 1, ar putea sugera c itemii respectivi prezint un grad de similitudine care
nu justific utilizarea lor n aceeai scal (ar putea fi, de exemplu itemi formulai extrem de
asemntor).
Un set de indicatori statistici descriptivi la nivelul ntregii scale:

n fine, cea mai important dintre categoriile de informaii, tabelul relaiilor dintre itemi i
scorul global. Dou dintre coloanele tabelului au o importan particular: Corected Item-Total
Correlation (corelaia dintre item i scorul global) i Alpha if Item Deleted (valoarea lui Cronbach
alfa, dac respectivul item ar fi eliminat).

44
Copyright DEPARTAMENT ID 2009

Marian Popa

Dac privim coloana Corected Item-Total Correlation observm c doi dintre itemi (i_03 i
i_09) au corelaii negative cu scorul global. Cu alte cuvinte, ei nu aduc informaie util n raport cu
atributul msurat ci, dimpotriv, merg ntr-o alt direcie dect acesta. n primul rnd trebuie s
verificm dac valorile itemilor respectivi au fost corect codificate. Dac da, atunci singura soluie
posibil este eliminarea itemilor n cauz. Observm, de asemenea, c itemul i_02 are o corelaie
extrem de mic cu scorul global (0.015). Contribuia sa la scorul global este nerelevant. Cu alte
cuvinte, nici nu stric, dar nici nu ajut.
Pe ultima linie a imaginii gsim valoare lui Cronbach alfa, care este 0.4576, o valoare care este
modest n raport cu nivelul minim necesar (0.70), dar care poate fi crescut prin eliminarea itemilor
nepotrivii, n primul rnd a celor care coreleaz negativ cu scorul global.5
Urmtoarea faz este reluarea prelucrrii, cu eliminarea itemilor negativi. n general, nu este
recomandabil eliminarea mai multor itemi simultan, dar itemii negativi pot fi scoi fr reineri. Iat
care este rezultatul obinut dup reluarea analizei cu eliminarea itemilor 3 i 9:

Ca urmare a noii iteraii se observ c itemul i_02, care anterior avea o corelaie pozitiv, dar
extrem de mic, a dobndit o corelaie negativ cu scala. n consecin, va fi eliminat. n principiu,
chiar i itemii pozitivi, care au corelaii cu scala mai mici de 0.1, nu trebuie pstrai, pentru simplul
motiv c nu contribuie la constructul psihologic vizat, fiind doar consumatoare de timp n aplicarea
5
Dei programele statistice calculeaz Cronbach alfa cu patru zecimale, el se raporteaz n mod obinuit cu dou
zecimale.

45
Copyright DEPARTAMENT ID 2009

Marian Popa
instrumentului. De altfel, se i observ c prin eliminarea acestui singur item, valoarea lui Cronbach
alfa ar crete la 0.75.
Se face din nou prelucrarea fr itemul i_02 i se obine urmtoarea configuraie de rezultate:

Rezultatul arat o valoare Cronbach alfa de 0.75. n plus, dac privim coloana Alfa if Item
Deleted, vedem c prin eliminarea oricrui item nu am obine o valoare mai ridicat dect aceasta. n
acest moment analiza poate fi oprit, itemii selecionai putnd fi constituii ntr-un instrument de
msurare psihologic.
n concluzie, cu ocazia iteraiilor succesive se vor elimina, in ordine:
itemii care au o corelaie negativ cu scorul global
itemii cu corelaii mici, nerelevante
Cu ct avem mai muli itemi n aceast faz, cu att avem posibilitatea s pstrm itemi care
coreleaz mai intens cu scala i, deci, s atingem un nivel mai ridicat de consisten intern. Este de la
sine neles c, n cazul n care construim un instrument ale crui ntrebri se adreseaz unor scale
diferite, consistena intern se va evalua separat pentru setul de ntrebri corespunztor fiecrei scale.
O scal consistent intern ne ofer garania c itemii instrumentului nostru merg
mpreun, msoar acelai construct psihologic. Atenie, ns, acest lucru nu ne permite nc s
afirmm c msoar exact ceea ce n-am propus s msoare. Aceast problem va fi rezolvat ulterior,
prin studii de validare.

Evaluarea numrului de itemi necesari pentru o scal


n procesul de construcie al unei scale de msurare psihologic pot apare unele dificulti, pe
care statistica ne ajut s le surmontm. De exemplu, ne putem afla n situaia n care itemii elaborai
nu ating nivelul minim acceptabil de consisten intern i trebuie s adugm noi itemi. Ct de muli
itemi ar trebui s mai elaborm pentru a atinge un indice Cronbach alfa acceptabil? Numrul itemilor
necesari pentru a completa o scal care nu a atins valoarea acceptabil a indicelui Cronbach alfa, poate
fi estimat cu ajutorul formulei Spearman-Brown:

k=

k * (1 x )
x * (1 k )

unde:
x este valoarea curent a lui Cronbach alfa
k este nivelul dorit al lui Cronbach alfa

46
Copyright DEPARTAMENT ID 2009

Marian Popa
k este factorul de multiplicare a scalei pentru a se obine k
ntr-un mod similar, se poate estima valoarea lui Cronbach alfa (k) care ar fi atins pornind de
la un anumit nivel calculat al acestuia x i un anumit factor de multiplicare al numrului de itemi (k):

k =

k * x
1 + (( k 1) * x )

Exemplu:
Avem o scal cu 20 de itemi i x=0.50
Ci itemi ar trebui adugai pentru a atinge un nivel de 0.70?

k=

k * (1 x ) .70 * (1 .50)
= 2.33
=
x * (1 k ) .50 * (1 .70)

Deci, pentru a atinge un de 0.70 va trebui s avem o scal de 20*2.3347 itemi, ceea ce
nseamn c ne vor mai trebui 27 de itemi pe lng cei 20 deja existeni (estimare valabil pentru
situaia n care noii itemi ar avea aceeai corelaie inter-itemi cu cei deja existeni).
Pentru acelai caz, cu ct ar crete dac am aduga 30 de itemi:
k=(nr. itemi iniiali+nr. itemi noi)/nr. itemi noi=(20+30)/20=2.5

k =

k * x
2.5 * .50
=
= 0.71
1 + (( k 1) * x ) 1 + (( 2.5 1) * .50)

Desigur, se presupune c noii itemi adugai vor fi la fel de buni ca i cei deja utilizai. De
aceea este posibil ca rezultatul formulei s fie o estimare uor optimist, dar nu mai puin util.

Cteva reguli de baz pentru dezvoltarea itemilor


1. Itemii a cror corelaie cu scala (scorul global) este negativ, sunt eliminai (dup ce se
verific n prealabil dac au fost valorizai corect).
2. Itemii a cror corelaie cu scala (scorul global) este mai mic de 0.15, ar trebui probabil
revizuii, deoarece nu sunt ncrcai n suficient msur cu atributul vizat de test, sau de
subscala cruia i aparine. n orice caz, itemii cu corelaii sub 0.1 nu sunt utilizabili. n
principiu, un test este cu att mai bun cu ct itemii sunt mai omogeni.
3. n cazul itemilor cu variante de rspuns, variantele greite (distractori) care nu sunt alese
de nici un subiect, ar trebui reformulate sau eliminate, deoarece nu contribuie la
discriminarea ntre subiecii cu performan slab i cei cu performan bun. Faptul c
variantele greite nu sunt alese cu aceeai frecven nu reprezint, ns, o problem. De
asemenea, un item la care majoritatea rspunsurilor sunt greite nu trebuie n mod necesar
eliminat, dar o analiz atent a acestuia se impune.
4. Corectitudinea unui item la care frecvena de alegere a unei variante distractor este mai
mare dect a variantei corecte, trebuie analizat cu atenie, mai ales atunci cnd corelaia
cu scorul global este pozitiv.
5. Itemii la care se obin (aproape) numai rspunsuri corecte sunt inutili i ar trebui eliminai
sau nlocuii.

47
Copyright DEPARTAMENT ID 2009

Marian Popa
Utilizarea analizei de itemi
Coeficientul de consisten intern se calculeaz numai pentru instrumente compuse din itemi
care sunt utilizai prin construirea unui scor unic. Chestionarele compuse din ntrebri ale cror
rspunsuri sunt utilizate ca atare, fr nsumarea lor ntr-un scor unic, nu reclam analiz de
consisten intern.
Procedurile analizei de itemi sunt indispensabile pentru asigurarea calitii instrumentelor de
evaluare n psihologie. Situaiile n care este necesar utilizarea lor sunt urmtoarele:
n faza de construcie a unui test psihologic, fie de personalitate, fie de performan.
Analiza de itemi este, n acest caz, o condiie obligatorie pentru acceptarea acestuia ca
instrument de msur n psihologie.
La adaptarea unui test psihologic, prin traducerea dintr-o limb strin. ntr-o astfel de
situaie, chiar dac versiunea original beneficiaz de documentaia complet din punct de
vedere psihometric, traducerea itemilor poate aduce modificri substaniale care s
modifice comportamentul statistic al acestora n noul mediu cultural.
Atunci cnd se obine un test aflat n uz, dar despre care nu exist o documentaie
adecvat sub aspectul caracteristicilor psihometrice.
Atunci cnd se schimb destinaia (populaia) pe care este utilizat un test, chiar dac exist
o documentaie complet cu privire la caracteristicile psihometrice ale acestuia pentru
utilizarea anterioar.
Dup trecerea unei perioade ndelungate (de ordinul anilor) de la efectuarea analizei de
itemi, pentru evaluarea diminurii poteniale a caracteristicilor sale psihometrice. Acest
lucru se poate ntmpla, de exemplu, ca urmare a modificrii lente a unor caracteristici ale
populaiei pe care este aplicat.
Aa cum am vzut, atunci cnd corelaiile inter-itemi sunt ridicate acest lucru evideniaz
faptul c acetia msoar acelai construct psihologic, cu alte cuvinte, au o component
unidimensional. O valoare sczut a lui Cronbach alfa poate sugera ns faptul c itemii sunt
multidimensionali, adic se grupeaz pe dou sau mai multe dimensiuni, aa cum, de exemplu, itemii
chestionarului Cattell 16 PF se grupeaz pe un numr de 16 dimensiuni (factori) distinci. n situaii de
acest gen, coeficientul de consisten intern (), calculat pe toi itemii chestionarului, va avea o
valoare mic, dar calculat pe grupe de itemi, va avea o valoare mare. Problema este cum identificm
grupele de itemi atunci cnd nu tim dac acetia sunt sau nu multidimensionali? Soluia se afl n
aplicarea unei analize factoriale6 pe valorile itemilor, care ne va spune n ce msur acetia tind s se
grupeze, i care sunt itemii afereni fiecrui grup (dimensiune). n final, dac se accept gruparea
itemilor n conformitate cu rezultatele analizei factoriale, se va calcula coeficientul Cronbach alfa
pentru fiecare grup de itemi separat.
Exist i situaii n care analiza de itemi nu este adecvat. De exemplu, atunci cnd o scal
este utilizat pentru evaluarea cunotinelor cu privire la un anumit subiect sau tem educaional,
pentru alte scopuri dect cele de selecie sau discriminare, unele dintre tehnicile de analiza de itemi nu
sunt adecvate pentru selectarea itemilor. Acest lucru este adevrat deoarece ne aflm ntr-o situaie de
nvare i dorim s evalum performana elevilor ca urmare a unui proces de instruire, i nu ca
trstur inerent a fiecruia. Dac aplicm un test nainte de parcurgerea materiei respective vom
obine un procentaj foarte sczut de rspunsuri corecte i o corelaie item-total aproape de zero, fapt
care reflect necunoaterea de ctre elevi a materiei respective (rspunsuri greite, rspunsuri la
ntmplare, etc.). n acest caz soluia nu const n eliminarea sau refacerea itemilor, ci n instruirea
elevilor. Dac aplicm testul respectiv dup parcurgerea perioadei de instruire, vom obine procentaje
mari de rspunsuri corecte, ceea ce ar fi interpretabil drept redus capacitate discriminativ a itemilor.
n realitate, eliminarea acestor itemi ar fi de asemenea o eroare, deoarece am elimina tocmai itemii
care pun n eviden succesul nvrii, ceea ce este exact obiectivul msurrii.

Procedur statistic de grupare a variabilelor. Prezentarea ei face obiectul cursurilor avansate de statistic.

48
Copyright DEPARTAMENT ID 2009

Marian Popa
n astfel de situaii, utilizarea indicelui de consisten intern Cronbach alfa este inadecvat.
Cu toate acestea, analiza de itemi poate fi utilizat ca modalitate de identificare a itemilor greit
formulai, a celor nerelevani sau, pur i simplu, pentru a scoate n eviden erorile tipice pe care le fac
subiecii la anumite ntrebri.

49
Copyright DEPARTAMENT ID 2009

S-ar putea să vă placă și