Documente Academic
Documente Profesional
Documente Cultură
DEPARTAMENTUL DE
NVMNT LA DISTAN
CURSUL
MODULUL 2
Titular curs:
Conf. univ. dr. Marian POPA
Email: popamarian@gmail.com
1
Copyright DEPARTAMENT ID 2009
Marian Popa
Cuprins
Modulul2 ................................................................................................................................................ 3
Calculareaindicatorilorstatisticidescriptivi ....................................................................................... 3
ProceduraFrequencies.................................................................................................................... 3
ProceduraDescriptives.................................................................................................................... 5
ProceduraExplore ........................................................................................................................... 7
ProceduraExplorefactorial ......................................................................................................... 12
Testelet ............................................................................................................................................. 15
1.Testulz(t)pentrumediaunuisingureantion ......................................................................... 15
2.Testultpentrueantioaneindependente................................................................................. 17
3.Testultpentrudiferenadintremediileadoueantioanedependente(perechi)................. 20
Analizadevarianunifactorial....................................................................................................... 23
(OneWayANOVA)......................................................................................................................... 23
CoeficientuldecorelaieliniarPearson(r)...................................................................................... 30
Analizadeitemi ................................................................................................................................. 35
2
Copyright DEPARTAMENT ID 2009
Marian Popa
Modulul2
Calcularea indicatorilor statistici descriptivi
Reamintim faptul c statistica descriptiv are ca obiectiv analiza caracteristicilor variabilelor
sub aspectul tendinei centrale, mprtierii i formei distribuiei. Principalele componente ale
statisticii descriptive sunt:
reprezentarea ntregii distribuii, pe cale:
o numeric (analiza de frecvene)
o grafic (bar, histogram, box-plot, stem and leaf)
indicatorii tendinei centrale
o mod
o medie
o median
indicatorii mprtierii
o amplitudine
o abatere standard
indicatorii formei distribuiei
o indice de simetrie (skewness)
o indice de boltire (kurtosis)
SPSS ofer posibiliti variate de reprezentare i de calcul a acestor indicatori. n acest sens
exist, pe de o parte, proceduri specializate i, pe de alt parte, opiuni care pot fi accesate din
interiorul altor proceduri. Fie i acest aspect numai, ar trebui s sugereze c statistica descriptiv, n
ciuda caracterului ei elementar, este o component indispensabil a analizei statistice.
n ceea ce privete procedurile specializate, ele se lanseaz din meniul Statistics-Summarize
(sau Analyze-Descriptive statistics, pentru versiunile mai noi de SPSS), i sunt grupate n trei
proceduri: Frequencies, Descriptives i Explore (vezi imaginea de mai jos).
L Aceste proceduri ofer, fiecare, att prelucrri distincte, ct i identice. Alegerea uneia sau
alteia dintre proceduri depinde de necesitile de analiz sau de modul specific de afiare a
rezultatelor n Viewer.
la
acest
capitol
este
descriptives.sav
Procedura Frequencies
Aceasta este singura procedur care permite analiza de frecvene. La apariia casetei
Frequencies, variabila pe care dorim s o supunem analizei se mut n lista de calcul Variable(s), prin
3
Copyright DEPARTAMENT ID 2009
Marian Popa
selectarea ei i acionarea butonului de transfer (). Pot fi incluse mai multe variabile simultan n
aceast list, rezultatele fiind afiate distinct, pentru fiecare n parte.
n cazul nostru, am ales variabila cantitativ nr_cor.
Butonul Chart
Se alege tipul de grafic
dorit
Butonul Format
Se aleg diverse moduri de
prezentare a rezultatelor
Tabelul
Statistics
indicatorilor statistici solicitai
cuprinde
lista
4
Copyright DEPARTAMENT ID 2009
Marian Popa
Procedura Descriptives
Aceast procedur vizeaz doar indicatorii statistici descriptivi. La lansare - SatisticsDescriptives - se deschide caseta principal Descriptives.
Se trec variabilele vizate n lista Variable(s)
(dac dorim calcularea scorurilor z, se bifeaz
opiunea din stnga-jos a casetei )
Prin bifarea opiunii Save standardized values as variables, programul va crea o variabil
standardizat z, pe care o va pune n baza de date, la sfritul listei de variabile.
Rezultatul analizei, din Viewer, se prezint astfel:
5
Copyright DEPARTAMENT ID 2009
Marian Popa
6
Copyright DEPARTAMENT ID 2009
Marian Popa
valorilor unei variabile, acestea nu urmeaz forma curbei normale, ci exprim doar distana n abateri
standard fa de media distribuiei.
Procedura Explore
Procedura Explore este cea mai complex dintre toate procedurile statisticii descriptive i se
poate utiliza atunci cnd se dorete o analiz exhaustiv a variabilei (sau variabilelor). Vom utiliza
pentru exemplificare trei variabile (asim, normal i uniform) din fiierul descriptives.sav, ale cror
distribuii prezint particularitile sugerate de nume.
Caseta principal Explore
Butonul Plots, permite alegerea reprezentrilor grafice dorite: am ales reprezentarea Boxplot
i reprezentarea Stem-and-leaf:
7
Copyright DEPARTAMENT ID 2009
Marian Popa
Una dintre opiunile importante ale acestei aceste este Normality plots with tests, care testeaz
normalitatea distribuiei (vezi discuia rezultatelor afiate n Viewer).
8
Copyright DEPARTAMENT ID 2009
Marian Popa
normal, media i 5% trim-media, sunt identice.
Se vor observa:
- distana relativ mare dintre medie i median n cazul distribuiei asimetrice, comparativ cu
celelalte dou.
- faptul c media 5% trim a distribuiei asimetrice se apropie mult de media aritmetic uzual.
Tabelul percentilelor afieaz valorile percentile. Percentilele de pe linia Tuckeys Hinges sunt
valorile care intr n calcularea nlimii casetei boxplot (abaterea interquartil).
n cazul nostru, observm c testul de normalitate are valori p (Sig.) mai mici de 0.05 pentru
variabilele asim i uniform, ceea ce ne confirm c cele dou variabile nu prezint o form normal. n
acelai timp, variabilei normal i corespunde un p=0.200 (mai mare de 0.05), ceea ce confirm forma
normal a distribuiei sale.
Principala problem care se pune n legtur cu interpretarea testelor de normalitate este legat
de faptul c, pe msur ce eantionul este mai mic, este din ce n ce mai dificil s fie apreciat corect
normalitatea distribuiei unei variabile. Nici chiar un test statistic nu ne poate oferi o concluzie
fundamentat, deoarece nu este suficient de sensibil pentru a distinge ntre o distribuie normal i una
ne-normal. Pentru mai puin de 5 valori, SPSS nici nu mai calculeaz testul de normalitate, chiar dac
este cerut. Pentru a avea suficient ncredere n rezultatul testelor de normalitate distribuia trebuie s
9
Copyright DEPARTAMENT ID 2009
Marian Popa
aib cel puin cteva zeci de valori. Rezult c interpretarea rezultatului la testele de normalitate
depinde simultan de valoarea lui p i de mrimea eantionului. n mod obinuit, aceast interpretare se
face dup urmtoarea gril:
Valoarea p
a testului de
normalitate
0.05
>0.05
>0.05
Mrimea eantionului
oricare
mare
(cel puin cteva zeci)
mic
(sub cteva zeci)
Interpretare
Forma distribuiei nu este normal.
Distribuia are o form normal.
Dei testul confirm forma normal a distribuiei, o
astfel de concluzie este riscant, dat fiind capacitatea
real testului de a surprinde acest lucru.
10
Copyright DEPARTAMENT ID 2009
Marian Popa
Pentru distribuia normal
Reprezentrile boxplot
Redm mai nti schema constructiv a unei reprezentri boxplot:
30
14
38
140
12
20
10
120
10
8
100
0
6
80
-10
60
2
-20
40
20
N=
-30
-2
75
Asimetrica
N=
75
Uniforma
N=
75
Normala
Aa cum tim, caseta din mijlocul reprezentrii boxplot include 50% dintre valorile
distribuiei, liniile verticale fiind trasate la o lungime de 1.5xH, unde H este distana dintre limitele
casetei (abaterea interquartil, Q3-Q1). Punctele marcate n dincolo de limitele orizontale ale
reprezentrii marcheaz valorile marginale ale distribuiei (O=Outliers) i valorile extreme (E). n
cazul variabilei asim observm gruparea valorilor spre partea inferioar a distribuiei, cu o linie
superioar mai lung dect cea inferioar, i cu o valoare excesiv mult deasupra mustii
superioare. Variabila uniform prezint o caset central extins i linii verticale relativ apropiate ca
lungime, dar scurte, comparativ cu nlimea casetei. n fine, variabila normal prezint o form
simetric, cu o caset central de dimensiuni moderate i cu linii verticale sensibil egale.
11
Copyright DEPARTAMENT ID 2009
Marian Popa
Histogramele
Histogram
Histogram
30
Histogram
10
10
4
Std. Dev = 21,67
Mean = 70,5
N = 75,00
4
Std. Dev = 3,80
Mean = 6,9
N = 75,00
Frequency
10
Frequency
Frequency
20
Mean = 1,4
N = 75,00
Histogramele reprezint ntr-o
diferit
0,0 manier
2,0 4,0 6,0 8,0
10,0 12,0 ceea ce reprezint i graficele boxplot de mai
1,0 3,0 5,0 7,0 9,0 11,0
sus. Asimetrica
Recomandm analiza comparativ a histogramei i boxplot-ului fiecrei variabile.
0
,5
27
,5
22
,5
17
,5
12
5
7,
5
2,
,5
-2
,5
-7 5
2,
-1 5
7,
-1 5
2,
-2
0
0,
1 5 ,0
0
1 4 ,0
0
1 3 ,0
0
1 2 ,0
0
1 1 ,0
0
10
,0
90
,0
80
,0
70
,0
60 0
,
50
,0
40
Uniforma
Normala
Toate cele trei tipuri de reprezentri grafice (stem-and-leaf, boxplot i histogram) pot fi utile
n analiza distribuiilor, dar se va evita introducerea lor simultan ntr-un document de cercetare. De
asemenea, este de evitat introducerea acestor reprezentri pentru variabile singulare (descrise n mod
suficient cu valorile numerice ale indicatorilor statistici). De regul, graficele de acest gen sunt
introduse n lucrri pentru a prezenta imagini comparative ale variabilelor.
Graficele Normal Q-Q Plot
Graficul Normal plot compar scorul brut (pe axa Ox) cu scorul z ateptat al unei distribuii
care ar avea o form normal (pe axa Oy). Scorul z ateptat se gsete prin convertirea rangului
percentil al fiecrui scor n scor z, utiliznd tabelul probabilitilor de sub cuba normal. Acesta
reprezint o expresie grafic a normalitii. Dac valorile variabilei se distribuie normal, atunci
graficul scorurilor brute i ateptate va urma o linie dreapt pe diagonala axelor de coordonate. Dac
scorurile nu se distribuie normal, linia celor dou scoruri deviaz de la modelul rectiliniu. Privind
graficele celor trei tipuri de distribuii, observm c liniile punctate ale variabilelor asim i uniform se
abat de la linia dreapt, n timp ce pentru variabila normal linia punctat aproape se suprapune peste
linia teoretic. Graficele Normal Q-Q Plot nu fac dect s ilustreze grafic rezultatele testelor de
normalitate.
Normal Q-Q Plot of Uniforma
-1
-2
-3
20
40
60
80
100
120
140
160
Expected Normal
Expected Normal
Expected Normal
-1
-2
-3
-10
10
Observed Value
0
-1
-2
-3
-30
-20
-10
10
20
30
20
Observed Value
Observed Value
12
Copyright DEPARTAMENT ID 2009
Marian Popa
analizate separat pentru fiecare dintre categoriile variabilei Factor. Vom ilustra aceast opiune pentru
variabila nr_cor, n funcie de valorile variabilei cond_prez.
n
imaginea
alturat se poate vedea
coninutul
tabelului
Descriptives din Viewer
pentru
aceast
configuraie de analiz.
Iar mai jos, reprezentrile comparative boxplot, care fac mai expresive raporturile dintre
distribuiile analizate, prin raportarea simultan la acelai cadru de referin.
Utilizarea opiunii factoriale din procedura Explore este foarte util atunci cnd suntem
interesai s analizm descriptiv caracteristicile unei variabile cantitative n raport de categoriile
definite prin valorile unei variabile categoriale.
13
Copyright DEPARTAMENT ID 2009
Marian Popa
Valorile marginale (Outliers)
Tabelul Extreme Values listeaz cte cinci valori de la marginea distribuiei, fr ca acestea s
fie n mod necesar valori care ntrunesc condiiile definite n contextul procedurii boxplot pentru
valorile marginale sau extreme. Ca urmare, aceste valori vor fi analizate pentru a constata n ce msur
se abat grav de la tendina central a distribuiei.
14
Copyright DEPARTAMENT ID 2009
Marian Popa
Testele t
Testul t este n esen o procedur de testare a semnificaiei diferenei dintre dou medii. Ca
urmare, el este potrivit atunci cnd variabila dependent este msurat pe scal cantitativ (intervalraport). Distribuia teoretic de referin (distribuia de nul) este cea normal, pentru eantioane mai
mari de 30 de subieci, i distribuia t (Student), pentru eantioane mai mici de 30 de subieci. Chiar
dac formulele de calcul sunt diferite, forma de prezentare a rezultatelor i raionamentul decizional
sunt similare pentru ambele situaii.
Tipuri de teste t
1. Testul t pentru un eantion.
2. Testul t pentru eantioane independente
3. Testul t pentru eantioane dependente
Condiii de aplicare
Condiia teoretic de baz pentru testele t este normalitatea distribuiei de eantionare.
Rezultatul testului devine nesigur dac distribuia variabilei se abate de la forma normal, mai ales
dac volumul eantionului este mai mic de 40 de subieci (Gardner, 1975, Moore, 1995). n temeiul
teoremei limitei centrale, cu ct volumul eantionului este mai mare, cu att normalitatea distribuiei
de eantionare este mai sigur, iar impactul unei eventuale anormaliti a distribuiei asupra testului t,
mai mic.
Exemplul are un caracter didactic, motiv pentru care nu ne interesm de normalitatea distribuiei.
15
Copyright DEPARTAMENT ID 2009
Marian Popa
Variabila testat
Caseta principal
Variabila testat este trecut n lista Test
Variable(s)
n zona Test Value se nscrie media
populaiei, sau alt valoare de referin
(100 n cazul nostru)
Rezultate
Imaginea de mai jos prezint cele dou tabele din Viewer cu rezultatele procedurii:
Primul tabel include statistica descriptiv a variabilei testate (N, media, ab.std, eroarea
standard a mediei).
Al doilea tabel include rezultatele testului statistic, pe coloane, dup cum urmeaz:
o QI Numele variabilei (dac variabila este etichetat, este afiat eticheta);
o t 6.254 Valoarea calculat a testului t. Valoarea n sine nu se interpreteaz n nici
un fel, iar cnd se raporteaz sunt suficiente primele dou zecimale;
o df Gradele de libertate (degrees of freedom), calculate ca N-1. Acestea trebuiesc
raportate, dar acest lucru poate fi omis dac este menionat volumul eantionului,
o Sig. (2-tailed) Probabilitatea asociat valorii calculate a lui t (simbolizat n mod
uzual cu p). n acest caz, p=0.003 semnific faptul c pe distribuia teoretic t exist
o probabilitate de 0.003 (sau 3 la mie) de a se obine din ntmplare o valoare a lui t
egal sau mai mare de 6.254. Dac n situaia calculrii manuale comparam valoarea
calculat a lui t cu o valoare critic, corespunztoare pragului alfa (0,05), n condiiile
utilizrii SPSS se compar direct valoarea p=0,003 cu pragul alfa=0.05 pentru a se lua
decizia statistic. Atunci cnd p este mai mic sau cel mult egal cu alfa, ipoteza de nul
se respinge. Este evident c raportul dintre p i alfa trebuie s fie invers dect cel
dintre t calculat i t critic, dac avem n vedere c p este cu att mai mic cu ct t este
mai mare. Dac p este mai mare dect alfa, ipoteza de nul se accept. n cazul de fa,
p(0,003)<alfa(0,05), ceea ce permite respingerea ipotezei de nul.
16
Copyright DEPARTAMENT ID 2009
Marian Popa
o
o
Concluzia testului
Media eantionului de cercetare (m=122,6) difer semnificativ de media populaiei (=100),
(t=6.254, df=4, p=0.03).
Testul z pentru proporii (compararea procentului de sociabili din cele dou grupuri)
Testul Mann-Whitney U, dac se transform valorile variabilei sociabilitate n valori de
rang
17
Copyright DEPARTAMENT ID 2009
Marian Popa
Aranjarea datelor
Tabela de date SPSS va conine variabila dependent, de tip numeric, i variabila
independent, de tip nominal, cu dou valori, n funcie de apartenena la un grup sau altul. Variabila
independent poate fi de tip string (codificnd cele dou grupuri cu valori de genul A i B) sau
de tip numeric (cu codificarea convenional 1 i 2). Din principiu, ns, recomandm cea de a doua
variant.
18
Copyright DEPARTAMENT ID 2009
Marian Popa
n primul tabel (Group Statistics) avem statistica descriptiv a celor dou grupuri. Se va
observa c programul descrie grupurile prin intermediul etichetelor valorilor. Dac acestea nu ar fi fost
definite, n loc de institutie i familie ar fi aprut 1, respectiv, 2.
Al doilea tabel are dou linii:
Pe prima linie avem rezultatele testului t pentru situaia n care variana celor dou
grupuri comparate este egal. Egalitatea varianelor este testat cu testul Levene. Dac
probabilitatea asociat testului Levene este mai mare de p=0.05, atunci nseamn c
varianele sunt egale, iar rezultatul testului t se citete pe prima linie. n cazul nostru, avem
p=0.666, ceea ce nseamn c acceptm egalitatea varianelor i citim pe aceast linie
rezultatul: t=-2.42, df=12, p=0.045.
Pe a doua linie avem rezultatele testului t pentru situaia n care nu s-ar ntruni condiia
de omogenitate a varianei celor dou grupuri. Dac semnificaia testului Levene ar fi fost
mai mic sau egal cu 0.05, rezultatului testului t s-ar fi citit pe aceast linie.
Pentru exemplul nostru, rezultatul testului t permite acceptarea ipotezei cercetrii, conform
creia copiii crescui n mediu familial sunt mai sociabili dect cei crescui n mediu instituional
(m1=22.00, m2=17.71, t=-2.42, df=12, p=0.045).
19
Copyright DEPARTAMENT ID 2009
Marian Popa
20
Copyright DEPARTAMENT ID 2009
Marian Popa
Procedura: Statistics-Compare Means-Paired Sample T Test...
Se selecteaz cu cte un clic de mouse, pe rnd,
fiecare dintre cele dou variabile. Astfel se
constituie perechea de variabile n zona Current
selection.
Caseta Options permite alegerea pragului de semnificaie, dac dorim schimbarea celui
implicit (p=0.05).
Rezultate
Rezultatele sunt prezentate n trei tabele, ca n imaginea de mai jos:
n tabelul Paired Samples Statistics sunt afiate mediile celor dou grupuri comparate
(Mean), numrul subiecilor din fiecare grup (N), abaterea standard pentru fiecare grup (Std.
Deviation) i eroarea standard a mediei fiecrui grup (Std. Error Mean).
Tabelul Paired Samples Correlations prezint corelaia dintre cele doua variabile:
r=0.74, p=0.013, N=10. Evaluarea corelaiei liniare dintre cele dou variabile este legitim n acest
context de date, dar ofer o informaie diferit de testul diferenei dintre medii i, n mod obinuit, este
ignorat n acest context. Alegerea testului de corelaie sau a testului t se decide n funcie de obiectivul
cercetrii. Dac ne intereseaz msura n care performan crete (sau scade) n funcie de condiia de
zgomot, atunci testul t este cel potrivit.
Marian Popa
22
Copyright DEPARTAMENT ID 2009
Marian Popa
23
Copyright DEPARTAMENT ID 2009
Marian Popa
fie egal. Aceast condiie se numete omogenitatea varianei. nclcarea acestei condiii
nu invalideaz testul ANOVA, care este destul de robust i n acest caz. n orice caz, se
vor analiza cu atenie cazurile care prezint valori extreme, care au un efect important
asupra varianei. Egalitatea (omogenitatea varianei) poate fi testat cu testul Levene.
Aranjarea datelor
Datele obinute se introduc ntr-o tabel SPSS aa cum se vede n imaginea din anex. Se
definete o variabil independent (definit ca factor n contextul ANOVA) care conine codurile de
apartenen a cazurilor la fiecare dintre grupurile supuse analizei (n cazul nostru categoriile de vrst:
1, 2, 3), i o variabil dependent, care conine valorile scorului la conformism.
Se va reine faptul c procedura ANOVA nu suport variabila independent de tip string. n
imagine baza de date SPSS este ordonat cresctor dup variabila virsta, dar acest lucru nu este
necesar pentru procedura de calcul.
Pentru nceput verificm respectarea condiiei de normalitate a distribuiilor la nivelul
fiecruia dintre grupurile comparate. n acest scop efectum procedura Explore (din meniul StatisticsSummarize), introducnd variabila dependent (conf) n zona Dependent List, iar variabila
independent (virsta) n zona Factor List, cu bifarea opiunii Normality plots with tests n caseta Plots.
Rezultatul apare n tabelul de mai jos. Aa cum se observ, testul Shapiro-Wilk (recomandabil
pentru eantioane mai mici de 40 de subieci) are un p (Sig.) mai mare de 0.05 pentru fiecare dintre
cele trei grupuri, ceea ce susine concluzia de normalitate a distribuiilor.
Omogenitatea dispersiei la nivelul celor trei grupuri comparate se ilustreaz grafic prin
intermediul celor trei reprezentri box-plot.
24
Copyright DEPARTAMENT ID 2009
Marian Popa
60
CONFORM
50
40
30
N=
10
10
10
sub30 ani
31-40 ani
41-50 ani
VIRSTA
Sunt oferite mai multe opiuni de calcul pentru testul de omogenitate n funcie de diferite
modaliti de transformare preliminar a datelor.
- Opiunea Power estimation este util pentru situaia n care testul nu susine ipoteza
omogenitii, iar variabila independent necesit o transformare de normalizare.2
- Opiunea Transformed permite alegerea direct a unei modaliti de transformare a
valorilor variabilei independente, n scopul normalizrii lor.
- Ultima dintre opiuni este Untransformed, pe care o considerm o soluie recomandabil
n acest caz, avnd n vedere rezultatul testului de normalitate anterior.
Rezultatul este sintetizat n tabelul urmtor, care estimeaz omogenitatea distribuiilor n
interiorul celor trei grupuri comparate, pe baze unor criterii variate (media, mediana, mediana ajustat,
media 5% trim). Valoarea lui p (Sig.) mai mare de 0.05 susine concluzia c distribuiile sunt omogene
sub aspectul dispersiei.
25
Copyright DEPARTAMENT ID 2009
Marian Popa
Deoarece ipoteza de nul pentru testul Levene este aceea c dispersiile sunt omogene,
dispersiile vor fi considerate neomogene dac valoarea lui p (Sig.) este mai mic sau egal cu 0.05. n
cazul nostru, valorile lui p pentru cele trei grupuri sunt mai mari dect 0.05 i, drept urmare,
concluzionm c dispersiile sunt omogene.
Dup ce am testat principalele condiii ale analizei de varian, putem trece la efectuarea
testului ANOVA unifactorial.
Procedura: Statistics-Compare Means-One-Way ANOVA...
n caseta Options bifm Descriptives i, dac nu am efectuat testul de omogenitate ca mai sus,
l putem face aici, bifnd Homogeneity-of-variance i Means Plot.
26
Copyright DEPARTAMENT ID 2009
Marian Popa
Tabelul ANOVA conine rezultatului testului F a crui valoare este 8.201 pentru un prag
p=0.002.
Tabelul Post Hoc Tests Multiple Comparisons prezint comparaiile mediilor celor trei
grupuri, luate dou cte dou. Muli autori recomand utilizarea analizei post-hoc numai dac se
obine un nivel semnificativ pentru testul F, deoarece unele teste post-hoc nu anihileaz ntr-o manier
suficient cumulul de eroare de tip I. Pe de alt parte, logica celor mai multe dintre testele post-hoc nu
reclam existena unei semnificaii globale a testului F drept condiie de utilizare (testul Bonferoni este
unul dintre ele).
27
Copyright DEPARTAMENT ID 2009
Marian Popa
Avnd n vedere c testul Levene a confirmat omogenitatea varianei, se vor citi valorile pentru
testul Bonferoni (n caz contrar, s-ar fi citit cele pentru testul Tamhane). Valorile sunt uor de analizat.
n prima coloana avem definite grupurile analizate (etichetarea valorilor variabilei independente ajut
mult la inteligibilitatea tabelului). n coloana a patra (Sig.) se afl semnificaiile pentru diferena dintre
medii. Astfel, putem constata faptul c nivelul de conformism al subiecilor sub 30 de ani difer
semnificativ de nivelul de conformism al fiecreia din celelalte dou categorii de vrst (p=0.027
respectiv, p=0.002). n acelai timp, nu se contat o diferen semnificativ ntre categoria 31-40 ani i
41-50 de ani (p=0.814).
Aceasta concluzie este ilustrat de reprezentarea grafic a mediei timpului de reacie ale celor
trei grupuri.
50
CONFORMISM (media)
48
46
44
42
40
sub30 ani
31-40 ani
41-50 ani
VIRSTA
28
Copyright DEPARTAMENT ID 2009
Marian Popa
Datele cercetrii
29
Copyright DEPARTAMENT ID 2009
Marian Popa
30
Copyright DEPARTAMENT ID 2009
Marian Popa
Procedura: Statistics-Corelate-Bivariate
Variabilele supuse corelaiei vor fi trecute n lista Variables:
Testul implicit, din zona Correlation Coefficients, este Pearson, dar se poate bifa un altul
(Kendall sau Spearman), dac datele sunt neparametrice (ordinale).
Tipul implicit de testare a ipotezei este bilateral (Two-tailed), dar se poate alege unilateral
(dac exist o justificare solid).
Flag significant correlations, determin marcarea cu un asterisc a coeficienilor semnificativi
la p=0.05, i cu dou asteriscuri a celor semnificativi la p=0.01. Acest lucru este util atunci cnd
matricea de corelaie este mare, pentru a scoate n eviden valorile semnificative ale lui r.
Rezultate
31
Copyright DEPARTAMENT ID 2009
Marian Popa
valoarea lui r
nivelul p (probabilitatea cu care valoarea calculat a lui r apare pe distribuia de
nul)
numrul de subieci (N)
n cazul nostru, consemnm corelaii negative dar nesemnificative ntre anxietate i
agresivitate (r=-0.38, p=0.26), pe de o parte, i ntre anxietate i preferina pentru risc, pe de alt parte
(r=-0.40, p=0.24). n acelai timp, se constat o corelaie semnificativ (r=0.96, p<0.0005) ntre
agresivitate i preferina pentru risc. Precizm faptul c raportarea coeficienilor de corelaie se face cu
dou zecimale, chiar dac programele i calculeaz cu trei zecimale.
Dezavantajul acestui tip de tabel const n faptul c avem, de fapt, o dubl prezentare a
corelaiilor, deasupra diagonalei i sub diagonal. Pentru corelaii implicnd multe variabile tabelul se
va citi cu relativ dificultate.
S presupunem c suntem interesai doar de corelaiile dintre anxietate i agresivitate cu
variabila preferin pentru risc, nu i de corelaia dintre anxietate i agresivitate. n acest caz, n caseta
principala, Bivariate Correlations, prezentat mai sus, variabilele vor fi introduse astfel nct variabila
preferina pentru risc sa fie ultima din list. Apoi se apas butonul Paste, al crui efect este
deschiderea ferestrei Syntax, ca o fereastr distinct, n care se afl procedura de corelaie. Acolo, pe
linia /VARIABLES=anx agresiv risc, se insereaz cuvntul WITH ntre agresiv si risc, avnd grij s
existe spaiu att n stnga ct i n dreapta sa.
inserai WITH
Mai departe, se selecteaz ntreaga procedur (cu ajutorul mouse-ului) i se apas pe butonul
Run () de pe bara de comenzi a ferestrei
Rezultatul din Viewer va arta ca mai jos:
Este evident c aceast modalitate se poate aplica pentru orict variabile, dac avem grij s le
aezm separat n list i s includem clauza WITH ntre cele dou categorii de variabile. Nu pot fi
incluse mai multe clauze WITH n aceeai procedur.
Ulterior, putem reveni n fereastra Syntax pentru a o nchide (cu File-Close), salvnd sau nu
procedura astfel modificat.
32
Copyright DEPARTAMENT ID 2009
Marian Popa
Expresia grafica a corelaiei (Scatterplot)
Caracterul i intensitatea corelaiei dintre dou variabile se evideniaz extrem de sugestiv cu
ajutorul unei proceduri grafice specifice, numit scatterplot.
Aceasta se lanseaz din meniul principal Graphs-Scatter... care deschide urmtoarea caset de
dialog:
Trecem variabila Agresivitate pe axa Y i variabila Preferina pentru risc pe axa Z (se poate la
fel de bine i invers). Se apas OK i se obine graficul din imaginea urmtoare, care sugereaz foarte
clar existena unei asocieri de tip liniar ntre cele dou variabile.
Reprezentarea grafic este surs de informaii cu privire la natura relaiei dintre variabile,
motiv pentru care este recomandabil utilizarea frecvent a acesteia. Mai mult, ea este necesar n
33
Copyright DEPARTAMENT ID 2009
Marian Popa
special atunci cnd valoarea corelaiei este redus, sau nesemnificativ, deoarece graficul poate scoate
n eviden o legtura de alt tip dect liniar.
L O corelaie r=0.92, ca cea obinut mai sus, ntre agresivitate i preferin pentru risc, este
improbabil s se ntlneasc ntr-un studiu real. De fapt, dac s-ar ntmpla s apar, ar
trebui s concluzionm mai degrab c cele dou variabile se confund, dect c sunt
distincte. Aceasta deoarece este firesc s existe corelaii ntre variabile psihologice, dar
este nefiresc ca relaia dintre ele s fie att de intens, fr a ne gndi c rezult dintr-o
eventual eroare de definire a lor sau, eventual, dintr-o eroare de msurare, prin utilizarea
unui instrument care nu face o distincie real ntre ele.
34
Copyright DEPARTAMENT ID 2009
Marian Popa
Analiza de itemi
Introducere n analiza de itemi
Msurarea caracteristicilor psihologice se bazeaz n mod obinuit pe teste, care sunt formate
din mai multe ntrebri sau sarcini (denumite generic itemi). Rspunsul subiecilor la fiecare item
sunt punctate, dup care se calculeaz rezultatul la testul respectiv, sub forma unui scor numeric. Pe
tot acest parcurs, conduita subiectului (subiectiv sau obiectiv) este fixat prin numere. Pentru ca
rezultatul final s fie unul adecvat, adic s exprime corect starea subiectului n raport cu caracteristica
psihologic msurat, este esenial s ne asigurm c aceste numere au caliti reale de msurare. n
caz contrar, riscm s facem evaluri lipsite de orice fundament. Analiza de itemi reprezint o colecie
de proceduri statistice care permit investigarea calitilor de msurare a testelor psihologice.
Principiile analizei de itemi se aplic att instrumentelor care msoar atribute ale
personalitii, ct i celor care vizeaz aspecte de performan (abiliti, aptitudini). Analiza de itemi se
prezint sub dou aspecte principale:
- calitativ, analiza de itemi se refer la modul n care sunt elaborai itemii (ntrebrile sau
sarcinile de lucru) i are n vedere aspecte de formulare lingvistic sau stilistic (de
exemplu, evitarea dublei negaii);
- cantitativ, analiza de itemi se refer la proprietile statistice ale rspunsurilor la itemi.
n cazul unui chestionar psihologic sau a unui test de performan, este posibil ca unii dintre
itemii care le compun s nu funcioneze aa cum ne-am dorit: pot crea confuzii, pot fi interpretai
greit, pot fi prea uori sau prea dificili, etc. Motivele care pot genera astfel de situaii sunt variate:
formulare confuz (de exemplu, prin utilizarea negaiei);
alte informaii care acompaniaz itemul (grafice, imagini, diagrame, etc.) pot fi neclare sau
greite;
nu exist un rspuns corect evident, situaie n care una dintre variantele greite (distractor)
este considerat corect;
exist itemi care se refer la un alt coninut (atribut) dect cel vizat de restul itemilor;
exist un efect discret de incompatibilitate al unor itemi n raport cu caracteristicile subiecilor
investigai (legat de sex, grup etnic, vrst, etc.)
Pn la un punct, aceste neajunsuri pot fi, fie prevenite, fie eliminate, mai ales cnd sunt
evidente, prin analiza calitativ, intuitiv. Precizia operaiei poate fi ns mult mbuntit dac se
apeleaz la un set de prelucrri statistice special destinate analizei de itemi. Aceste proceduri
contribuie la ameliorarea calitilor psihometrice ale unui instrument de evaluare psihologic, prin
identificarea itemilor improprii (greii sau redundani) care ar trebui eliminai sau modificai.. Toate
aceste proceduri sunt denumite generic analiza de itemi.
n funcie de obiectivele urmrite, procedurile clasice ale analizei de itemi, care sunt cele mai
frecvent utilizate, sunt urmtoarele:
1. evaluarea indicelui de dificultate a itemilor;
2. evaluarea capacitii de discriminare a itemilor.
3. evaluarea consistenei interne a instrumentului;
Premisa fundamental de la care pornete analiza clasic a testelor psihologice este aceea c
scorul testului este compus dintr-o valoare adevrat (care exprim corect atributul vizat) i o
cantitate de eroare (care vizeaz altceva). n cazul unui test bine fcut, eroarea se distribuie
normal pe ansamblul testului, nu este corelat cu scorul adevrat i are media egal cu zero.
35
Copyright DEPARTAMENT ID 2009
Marian Popa
diverse). n cazul acestui tip de scale, este de interes major evaluarea capacitii de discriminare a
fiecrui item.
Unul dintre indicatorii utilizai n acest scop este indicele de dificultate, care semnific
procentul de rspunsuri corecte al fiecrui item. Pentru testele de personalitate, conceptul de corect
sau greit se nlocuiete cu orientarea rspunsului spre semnificaia scalei sau mpotriva acesteia
(marcnd prezena sau absena trsturii vizate). Orice item la care se obin numai rspunsuri corecte,
sau la care nimeni nu rspunde corect, este lipsit de relevan deoarece nu produce nici o difereniere
ntre subieci. Dac presupunem existena unei relaii perfecte dintre abilitatea subiectului (cea
msurat prin test) i succesul la un item, atunci un indice de dificultate de 50% va diferenia ntre
subiecii care se plaseaz n prima jumtate a scalei i cei care se plaseaz n doua jumtate a scalei de
performan. n acelai timp, dac toi itemii unei scale ar avea un indice de dificultate de 50%, atunci,
prin aplicarea scalei, s-ar discrimina doar dou categorii de subieci, fapt care nu este de natur s
conduc la rezultate suficient de sensibile n evaluarea subiecilor. n general, se consider c o scal
este suficient de discriminativ atunci cnd este compus din itemi al cror indice de dificultate este
moderat (30%-40%).
ntr-un mod similar se pune problema i n cazul ntrebrilor la teste de personalitate, la care
rspunsurile sunt interpretate n funcie de orientarea lor spre o anumit trstur psihic, sau
mpotriva ei.
Atunci cnd itemii sunt selectai pe baza indicelui de dificultate, mai trebuie luai n
considerare doi factori suplimentari:
a. Dei un indice mediu de dificultate de 50% este suficient pentru a maximiza variana total a
scorului, aceast valoare trebuie s fie mai mare n cazul n care avem de a face cu
rspunsuri la un test cu alegeri multiple. Aceasta deoarece trebuie s lum n considerare
faptul c o parte a rspunsurilor corecte pot fi ghicite, date la ntmplare.
b. Dac dorim ca scala s fie discriminativ i spre extremele ei, atunci vor trebui inclui i
itemi al cror indice de dificultate s se afle n apropierea extremelor, adic mai mici sau
mai mari de 50%.
n general, este considerat recomandabil un indice de dificultate mediu pe scal cuprins ntre
30%-70% (sau, exprimat sub form zecimal, ntre 0.3 i 0.7)
36
Copyright DEPARTAMENT ID 2009
Marian Popa
2. Evaluarea capacitii de discriminare a itemilor
Procentajul rspunsurilor corecte (indicele de dificultate) nu este o condiie suficient pentru a
judeca calitatea unui item. La fel de important este ca numrul rspunsurilor corecte s fie n legtur
cu nivelul abilitii (sau trsturii, dac este un test de personalitate) pe care intenionm s o msurm
cu acel instrument. Acest aspect este surprins de indicele de discriminare. Dac cei care rspund corect
(sau n spiritul trsturii, pentru un test de personalitate), la un anumit item, au un nivel ridicat al
abilitii (trsturii), n timp ce cei care rspund greit au nivel sczut, sau dac ambele grupuri au
acelai nivel al abilitii (trsturii), atunci este clar c itemul respectiv este, fie formulat greit, fie
msoar altceva dect se presupune c msoar.
Un item care dispune de capacitate de discriminare are un procentaj al rspunsurilor corecte
mai mare pentru subiecii care obin rezultate mai mari la nivelul ntregii scale (care msoar
abilitatea), i un procentaj mai mic pentru subiecii care obin o valoare mai mic pentru scala
respectiv. n absena unui criteriu extern de validare a rspunsului, scorul total, obinut prin
nsumarea rspunsurilor corecte, este utilizat drept criteriu de discriminare. Pentru calcularea indicelui
de discriminare se procedeaz n felul urmtor:
se calculeaz scorul total;
se formeaz dou grupuri distincte, fiecare reprezentnd un anumit procent din
subiecii evaluai, aflai la extremele distribuiei. Procentul selectat este arbitrar. Cu
ct este mai mic, cu att indicele de discriminare este mai mare dar, n acelai timp,
mai puin sigur. De aceea, se recomand un selectarea unui procent cuprins ntre 25%
i 33%, care reprezint un compromis rezonabil.
odat grupurile selecionate, se poate calcula un indice de discriminare, simbolizat cu
"D", dup urmtoarea formul:
D=
U
L
nU nL
unde:
U=numrul subiecilor din grupul superior (Upper group) care au rspuns corect la un
item
nU=numrul subiecilor din grupul superior
L=numrul subiecilor din grupul inferior (Lower group) care au rspuns corect la un
item
nL=numrul subiecilor din grupul inferior
Dac numrul subiecilor din cele dou grupuri extreme este egal, atunci D=(U-L)/n.
O valoare pozitiv va indica faptul c itemul discrimineaz corect, n concordan cu
constructul psihologic msurat. Cu ct mai mare este diferena, cu att mai mare este capacitatea
itemului de discriminare ntre subiecii buni i cei slabi sub aspectul acelui construct. Pe de alt
parte, o valoare negativ sugereaz o discriminare negativ ntre grupurile extreme, fapt care este o
dovad puternic a unei probleme n construcia acelui item. Ebel (1965) sugereaz eliminarea sau
revizuirea complet itemilor a cror indice de discriminare este mai mic de 0.20 i revizuirea itemilor
al cror indice este ntre 0.20 i 0.30. Un indice de discriminare bun se plaseaz ntre 0.30-0.39, iar
unul foarte bun, peste 0.40.
Dei uor de calculat i utilizat, indicele D sufer de un mare neajuns: prin compararea a doar
dou grupuri extreme, selectate arbitrar din ansamblul subiecilor testai, o parte din informaie este
ignorat, deoarece subiecii care fac parte din grupul de performan intermediar nu sunt luai n
considerare. Soluia acestei probleme ar putea fi aceea de a mpri ansamblul valorilor scalei n mai
multe subgrupuri, n funcie de numrul subiecilor i de fineea dorit a analizei. n acest fel, indicele
de dificultate al fiecrui item ar putea fi analizat prin raportare la fiecare subgrup valoric. n mod ideal,
indicele de dificultate (procentul rspunsurilor corecte) al unui item bine calibrat trebuie s fie mai
37
Copyright DEPARTAMENT ID 2009
Marian Popa
mic pentru subiecii din grupul valoric inferior i s creasc progresiv, pe msur ce este calculat
pentru grupurile cu performane mai mari la scorul global (Peladeau, 1995).
b) Analizm variabila "scor" astfel obinut cu procedurile Explore i Frequencies, din meniul
Statistics, fixnd arbitrar dou grupe extreme de performan, compuse fiecare din aproximativ 30%
dintre subiecii examinai cu respectivul instrument, astfel:
grupul inferior, valorile 7-13 (NL=7)
grupul superior, valorile 18-22 (NU=11)
scor
Valid
7,00
9,00
10,00
12,00
13,00
15,00
16,00
17,00
18,00
19,00
20,00
21,00
22,00
Total
Frequency
1
1
1
2
2
2
1
1
4
3
2
1
1
22
Percent
4,5
4,5
4,5
9,1
9,1
9,1
4,5
4,5
18,2
13,6
9,1
4,5
4,5
100,0
Valid Percent
4,5
4,5
4,5
9,1
9,1
9,1
4,5
4,5
18,2
13,6
9,1
4,5
4,5
100,0
Cumulative
Percent
4,5
9,1
13,6
22,7
31,8
40,9
45,5
50,0
68,2
81,8
90,9
95,5
100,0
38
Copyright DEPARTAMENT ID 2009
Marian Popa
"3", grupul superior
i apoi, dup acionarea butonului Old and New Values: declarm valorile aa cum se vede n
caseta de mai jos
n urma acestei operaii am obinut variabila "grup", ale crei valori, 1,2 sau 3, marcheaz
apartenena subiecilor la unul dintre cele trei grupe valorice.
d) Declarm mprirea fiierului cu date n trei categorii de subieci, cu procedura Data/Split
File, aa cum se vede n imaginea de mai jos.
39
Copyright DEPARTAMENT ID 2009
Marian Popa
Efectul acestei aciuni este acela c, orice prelucrare vom face cu SPSS n continuare, aceasta
va fi efectuat separat pentru fiecare din cele trei categorii separate prin valorile variabilei "grup".
e) n fine, acum se poate rula procedura Frequencies din meniul Statistics, pentru variabila
i_01. Datorit efectului de mprire a bazei de date prin comanda Split file, rezultatul va fi structurat
pentru fiecare subgrup valoric n parte, aa cum se vede n imaginea de mai jos:
i_01
grup
1,00
Valid
2,00
3,00
Valid
Valid
0
1
Total
1
0
1
Total
Frequency
3
4
7
4
1
10
11
Percent
42,9
57,1
100,0
100,0
9,1
90,9
100,0
Valid Percent
42,9
57,1
100,0
100,0
9,1
90,9
100,0
Cumulative
Percent
42,9
100,0
100,0
9,1
100,0
Tabelul din imagine prezint frecvena rspunsurilor corecte, citit pe coloana Percent (sau pe
coloana Valid Percent, dac exist valori lips). Aa cum se observ, indicele de dificultate pentru
grupul valoric inferior este mai mic (57.1%) dect pentru grupul superior (90.9%).
Aplicnd manual formula, obinem indicele de discriminare cutat:
D=
10 4
= +0.33
11 7
Rezultatul arat c itemul i_01 are un indice pozitiv de discriminare de 0.33 care, n
conformitate cu criteriile lui Ebel, indic o capacitate bun de discriminare. Chiar dac obinem i unii
indici de discriminare mai mici, dac dorim s avem o scal care are putere de discriminare i la
extremele sale, acetia pot fi pstrai.
Not: Se poate observa c se poate ajunge la o valoare similar, exprimat n procente, prin
simpla diferen a celor doi indici de dificultate "D=90.9-57.1=33.7)
Mai departe, ar trebui efectuat procedura Frequencies pentru toi cei 22 de itemi ai testului i
extragerea concluziilor care se impun.
40
Copyright DEPARTAMENT ID 2009
Marian Popa
scorul global, calculat fr acel item, poate fi considerat un indicator a relaiei mai sus amintite. O
alt faet a consistenei unui instrument psihologic este fiabilitatea sa, care poate fi exprimat prin
stabilitatea scorului global atunci cnd acelai instrument, sau o form alternativ a acestuia, este
aplicat acelorai subieci.
Fr a fi singura procedur statistic utilizabil n astfel de situaii, coeficientul Cronbach alfa
() este de departe cel mai cunoscut dintre toate, fiind utilizat ca un indicator al preciziei de msurare
a unui test, al consistenei interne i fidelitii unui instrument psihologic. El nu este un test statistic, ci
un indice sau coeficient care msoar caracteristica de consisten intern a unui instrument psihologic
compus din mai muli itemi, care sunt nsumai ntr-un scor unic. Formula de calcul se bazeaz pe
media coeficienilor de corelaie dintre itemi i numrul itemilor:
N rm
1 + ( N 1)* rm
unde:
N=numrul itemilor
rm=media coeficienilor de corelaie dintre itemi
Principalul motiv pentru care am introdus aici formula lui Cronbach este pentru a scoate n
eviden faptul c valoarea sa poate fi crescut pe dou ci:
- fie prin creterea similaritii dintre itemi, care conduce la coeficieni mai mari de
corelaie interitemi;
- fie prin creterea numrului de itemi.
Indicele Cronbach alfa este, de asemenea, un indicator al preciziei scalei i poate fi vzut prin
prisma valorii teoretice maxime pe care o poate lua o corelaie cu aceast scal. Altfel spus, corelaia
unei variabile msurate cu un test psihologic, cu o alt variabil psihologic, nu va putea fi niciodat
mai mare dect consistena intern a fiecreia dintre cele dou variabile investigate, dat de indicele
Cronbach alfa. Din acest motiv, atunci cnd studiem relaia dintre anumite variabile psihologice
trebuie s ne punem problema preciziei cu care acestea au fost msurate, deoarece mrimea
corelaiei posibile dintre ele este fixat de precizia msurrii fiecreia.
Valoarea Cronbach alfa tinde sa fie cu att mai mare cu ct numrul itemilor scalei este mai
mare. Ca urmare, putem fi tentai s utilizm chestionare cu un numr mai mare de ntrebri. Acest
lucru poate genera cel puin dou probleme pe care trebuie s le lum n considerare:
din motive practice, testele mai scurte sunt de dorit, date fiind reducerea costurilor de realizare
i a duratei de aplicare;
n cazul testelor mai lungi, pot exista ntrebri care, chiar dac au o corelaie pozitiv cu scala,
contribuie la reducerea indicelui Cronbach alfa sau au o contribuie minor la consistena
general a scalei.
n practic, autorul unui chestionar este interesat s reduc numrul itemilor fr a afecta
consistena intern a scalei. n acest scop, "valoarea lui alfa n cazul eliminrii itemului" (Alpha if item
deleted) este un indicator foarte util. Eliminnd succesiv itemii a cror prezen contribuie la reducerea
valorii Cronbach alfa, sau au o contribuie redus la acesta, se poate ajunge la un numr suficient de
mic de itemi n condiiile obinerii unei valori mai mari pentru Cronbach alfa.
Procedura de analiz a consistenei interne are un caracter recursiv, cu evaluri succesive ale
relaiilor dintre itemi, dintre itemi i scorul global, i cu operarea seleciei itemilor n funcie de relaia
lor cu acesta. Criteriul de baz pentru aceast operaie este valoarea indicelui Cronbach alfa, care are o
plaj de variaie ntre 0 i 1. O scal, pentru a fi considerat consistent, trebuie s ating o valoare a
indicelui Cronbach alfa ct mai aproape de 1, nivelul de 0.70 fiind acceptat, prin convenie, ca prag
minim. Oricum pentru un instrument consistent valoarea lui Cronbach alfa nu poate fi mai mic de
0.60, iar o valoare ct mai mare este ntotdeauna de dorit. Unii autori consider drept acceptabil o
valoare de 0.5 a indicelui Cronbach alfa n cazul scalelor cu un numr mic de itemi (10-15), n timp ce
pentru scalele mai mari de 50 de itemi reclam valori ale lui Cronbach alfa de cel puin de 0.80.
Facem precizarea c atunci cnd ne referim la scorul global al unei scale, avem n vedere
nsumarea rspunsurilor fiecrui item care contribuie la construcia acestuia. n cazul n care testul
41
Copyright DEPARTAMENT ID 2009
Marian Popa
respectiv este compus din mai multe scale (trsturi de personalitate, de exemplu), indicele Cronbach
alfa se calculeaz, desigur, n mod distinct pentru fiecare scal n parte. Acesta nu se calculeaz ns n
situaiile n care itemii unui instrument nu sunt utilizai pentru construcia unui scor global, ci sunt
analizai de sine stttor (de exemplu, in cazul ntrebrilor unui interviu).
Variabilele4 care conin valorile itemilor de analizat vor fi trecute n lista Items.
Atenie, variabilele trebuie s conin valori care exprim semnificaia rspunsului n raport cu
scala global i nu rspunsul efectiv al subiectului. De exemplu, dac variantele de rspuns sunt
codificate cu 1, respectiv 2, pot exista ntrebri pentru care varianta 1 aduce un punct la scala iar
varianta 2 aduce zero puncte la scal. ntr-o asemenea situaie, pentru analiza de itemi valorile
codificate de rspuns vor fi transformate n valori corespunztoare (0 i 1). n acelai mod se va opera
i pentru itemii care au mai multe variante de rspuns, cum este cazul scalelor de tip Lickert. Codurile
convenionale ale variantelor de rspuns vor fi transformate n valori, n funcie de semnificaia
contribuiei lor la construirea scorului global.
n lista Model se poate alege unul dintre urmtoarele modele de analiz:
Alfa. Calculeaz Cronbach alfa care pentru date dihotomice este echivalent cu coeficientul
Kuder-Richardson 20 (KR20)
Split-half. Pentru corelaia dintre forme paralele, coeficientul de fidelitate Guttman,
coeficientul Spearman-Brown, coeficientul alfa pentru fiecare jumtate.
Modele Gutman. Coeficienii lambda, de la 1 la 6
Modele paralele i strict paralele. Testele pentru gradul de coresponden (goodness-offit), variana comun i alte caracteristici ale raporturilor dintre itemi.
Pentru analiza de consisten intern se alege modelul Alfa.
42
Copyright DEPARTAMENT ID 2009
Marian Popa
n continuare, se fac setri de analiz prin deschiderea casetei Statistics:
n practic, bifarea opiunilor marcate pe caseta din imaginea de mai sus ofer informaiile
cele mai importante pentru analiza itemilor unui test. Celelalte opiuni sunt explicitate n Help-ul
casetei i pot fi utilizate pentru o analiz mai rafinat a datelor.
n continuare, vom analiza un set de 10 itemi ipotetici, alei doar n scop didactic. Pentru o
scal real acest numr ar fi cu totul insuficient. Ca regul general, numrul itemilor din faza de
dezvoltare a unui astfel de instrument ar trebui s aib cel puin dublul numrului de itemi pe care l
preconizm la final. Acest lucru se impune deoarece analiza de itemi este un proces selectiv care are
drept scop alegerea itemilor adecvai pentru constituirea unei scale cu cel mai ridicat nivel de
consisten intern posibil.
Rularea procedurii, cu setrile de mai sus ne ofer mai multe categorii de informaii:
Un tabel cu indicatori descriptivi, media i abaterea standard a itemilor. Analiza valorilor
permite evidenierea tendinei centrale i a mprtierii rspunsurilor pentru fiecare item n parte:
43
Copyright DEPARTAMENT ID 2009
Marian Popa
Matricea corelaiilor dintre itemi.
Corelaiile itemilor ofer o imagine a gradului de asociere dintre acetia. Valorile sunt utile, pe
de o parte, pentru a sesiza itemii care tind s aib relaii negative cu ceilali, fiind un semn al unei
posibile probleme de construire respectivilor itemi. Din tabelul alturat rezult c itemii i_02 i i_03
tind s se asocieze negativ cu majoritatea celorlali itemi. Pe de alt parte, valori extrem de ridicate ale
unor corelaii, aproape de 1, ar putea sugera c itemii respectivi prezint un grad de similitudine care
nu justific utilizarea lor n aceeai scal (ar putea fi, de exemplu itemi formulai extrem de
asemntor).
Un set de indicatori statistici descriptivi la nivelul ntregii scale:
n fine, cea mai important dintre categoriile de informaii, tabelul relaiilor dintre itemi i
scorul global. Dou dintre coloanele tabelului au o importan particular: Corected Item-Total
Correlation (corelaia dintre item i scorul global) i Alpha if Item Deleted (valoarea lui Cronbach
alfa, dac respectivul item ar fi eliminat).
44
Copyright DEPARTAMENT ID 2009
Marian Popa
Dac privim coloana Corected Item-Total Correlation observm c doi dintre itemi (i_03 i
i_09) au corelaii negative cu scorul global. Cu alte cuvinte, ei nu aduc informaie util n raport cu
atributul msurat ci, dimpotriv, merg ntr-o alt direcie dect acesta. n primul rnd trebuie s
verificm dac valorile itemilor respectivi au fost corect codificate. Dac da, atunci singura soluie
posibil este eliminarea itemilor n cauz. Observm, de asemenea, c itemul i_02 are o corelaie
extrem de mic cu scorul global (0.015). Contribuia sa la scorul global este nerelevant. Cu alte
cuvinte, nici nu stric, dar nici nu ajut.
Pe ultima linie a imaginii gsim valoare lui Cronbach alfa, care este 0.4576, o valoare care este
modest n raport cu nivelul minim necesar (0.70), dar care poate fi crescut prin eliminarea itemilor
nepotrivii, n primul rnd a celor care coreleaz negativ cu scorul global.5
Urmtoarea faz este reluarea prelucrrii, cu eliminarea itemilor negativi. n general, nu este
recomandabil eliminarea mai multor itemi simultan, dar itemii negativi pot fi scoi fr reineri. Iat
care este rezultatul obinut dup reluarea analizei cu eliminarea itemilor 3 i 9:
Ca urmare a noii iteraii se observ c itemul i_02, care anterior avea o corelaie pozitiv, dar
extrem de mic, a dobndit o corelaie negativ cu scala. n consecin, va fi eliminat. n principiu,
chiar i itemii pozitivi, care au corelaii cu scala mai mici de 0.1, nu trebuie pstrai, pentru simplul
motiv c nu contribuie la constructul psihologic vizat, fiind doar consumatoare de timp n aplicarea
5
Dei programele statistice calculeaz Cronbach alfa cu patru zecimale, el se raporteaz n mod obinuit cu dou
zecimale.
45
Copyright DEPARTAMENT ID 2009
Marian Popa
instrumentului. De altfel, se i observ c prin eliminarea acestui singur item, valoarea lui Cronbach
alfa ar crete la 0.75.
Se face din nou prelucrarea fr itemul i_02 i se obine urmtoarea configuraie de rezultate:
Rezultatul arat o valoare Cronbach alfa de 0.75. n plus, dac privim coloana Alfa if Item
Deleted, vedem c prin eliminarea oricrui item nu am obine o valoare mai ridicat dect aceasta. n
acest moment analiza poate fi oprit, itemii selecionai putnd fi constituii ntr-un instrument de
msurare psihologic.
n concluzie, cu ocazia iteraiilor succesive se vor elimina, in ordine:
itemii care au o corelaie negativ cu scorul global
itemii cu corelaii mici, nerelevante
Cu ct avem mai muli itemi n aceast faz, cu att avem posibilitatea s pstrm itemi care
coreleaz mai intens cu scala i, deci, s atingem un nivel mai ridicat de consisten intern. Este de la
sine neles c, n cazul n care construim un instrument ale crui ntrebri se adreseaz unor scale
diferite, consistena intern se va evalua separat pentru setul de ntrebri corespunztor fiecrei scale.
O scal consistent intern ne ofer garania c itemii instrumentului nostru merg
mpreun, msoar acelai construct psihologic. Atenie, ns, acest lucru nu ne permite nc s
afirmm c msoar exact ceea ce n-am propus s msoare. Aceast problem va fi rezolvat ulterior,
prin studii de validare.
k=
k * (1 x )
x * (1 k )
unde:
x este valoarea curent a lui Cronbach alfa
k este nivelul dorit al lui Cronbach alfa
46
Copyright DEPARTAMENT ID 2009
Marian Popa
k este factorul de multiplicare a scalei pentru a se obine k
ntr-un mod similar, se poate estima valoarea lui Cronbach alfa (k) care ar fi atins pornind de
la un anumit nivel calculat al acestuia x i un anumit factor de multiplicare al numrului de itemi (k):
k =
k * x
1 + (( k 1) * x )
Exemplu:
Avem o scal cu 20 de itemi i x=0.50
Ci itemi ar trebui adugai pentru a atinge un nivel de 0.70?
k=
k * (1 x ) .70 * (1 .50)
= 2.33
=
x * (1 k ) .50 * (1 .70)
Deci, pentru a atinge un de 0.70 va trebui s avem o scal de 20*2.3347 itemi, ceea ce
nseamn c ne vor mai trebui 27 de itemi pe lng cei 20 deja existeni (estimare valabil pentru
situaia n care noii itemi ar avea aceeai corelaie inter-itemi cu cei deja existeni).
Pentru acelai caz, cu ct ar crete dac am aduga 30 de itemi:
k=(nr. itemi iniiali+nr. itemi noi)/nr. itemi noi=(20+30)/20=2.5
k =
k * x
2.5 * .50
=
= 0.71
1 + (( k 1) * x ) 1 + (( 2.5 1) * .50)
Desigur, se presupune c noii itemi adugai vor fi la fel de buni ca i cei deja utilizai. De
aceea este posibil ca rezultatul formulei s fie o estimare uor optimist, dar nu mai puin util.
47
Copyright DEPARTAMENT ID 2009
Marian Popa
Utilizarea analizei de itemi
Coeficientul de consisten intern se calculeaz numai pentru instrumente compuse din itemi
care sunt utilizai prin construirea unui scor unic. Chestionarele compuse din ntrebri ale cror
rspunsuri sunt utilizate ca atare, fr nsumarea lor ntr-un scor unic, nu reclam analiz de
consisten intern.
Procedurile analizei de itemi sunt indispensabile pentru asigurarea calitii instrumentelor de
evaluare n psihologie. Situaiile n care este necesar utilizarea lor sunt urmtoarele:
n faza de construcie a unui test psihologic, fie de personalitate, fie de performan.
Analiza de itemi este, n acest caz, o condiie obligatorie pentru acceptarea acestuia ca
instrument de msur n psihologie.
La adaptarea unui test psihologic, prin traducerea dintr-o limb strin. ntr-o astfel de
situaie, chiar dac versiunea original beneficiaz de documentaia complet din punct de
vedere psihometric, traducerea itemilor poate aduce modificri substaniale care s
modifice comportamentul statistic al acestora n noul mediu cultural.
Atunci cnd se obine un test aflat n uz, dar despre care nu exist o documentaie
adecvat sub aspectul caracteristicilor psihometrice.
Atunci cnd se schimb destinaia (populaia) pe care este utilizat un test, chiar dac exist
o documentaie complet cu privire la caracteristicile psihometrice ale acestuia pentru
utilizarea anterioar.
Dup trecerea unei perioade ndelungate (de ordinul anilor) de la efectuarea analizei de
itemi, pentru evaluarea diminurii poteniale a caracteristicilor sale psihometrice. Acest
lucru se poate ntmpla, de exemplu, ca urmare a modificrii lente a unor caracteristici ale
populaiei pe care este aplicat.
Aa cum am vzut, atunci cnd corelaiile inter-itemi sunt ridicate acest lucru evideniaz
faptul c acetia msoar acelai construct psihologic, cu alte cuvinte, au o component
unidimensional. O valoare sczut a lui Cronbach alfa poate sugera ns faptul c itemii sunt
multidimensionali, adic se grupeaz pe dou sau mai multe dimensiuni, aa cum, de exemplu, itemii
chestionarului Cattell 16 PF se grupeaz pe un numr de 16 dimensiuni (factori) distinci. n situaii de
acest gen, coeficientul de consisten intern (), calculat pe toi itemii chestionarului, va avea o
valoare mic, dar calculat pe grupe de itemi, va avea o valoare mare. Problema este cum identificm
grupele de itemi atunci cnd nu tim dac acetia sunt sau nu multidimensionali? Soluia se afl n
aplicarea unei analize factoriale6 pe valorile itemilor, care ne va spune n ce msur acetia tind s se
grupeze, i care sunt itemii afereni fiecrui grup (dimensiune). n final, dac se accept gruparea
itemilor n conformitate cu rezultatele analizei factoriale, se va calcula coeficientul Cronbach alfa
pentru fiecare grup de itemi separat.
Exist i situaii n care analiza de itemi nu este adecvat. De exemplu, atunci cnd o scal
este utilizat pentru evaluarea cunotinelor cu privire la un anumit subiect sau tem educaional,
pentru alte scopuri dect cele de selecie sau discriminare, unele dintre tehnicile de analiza de itemi nu
sunt adecvate pentru selectarea itemilor. Acest lucru este adevrat deoarece ne aflm ntr-o situaie de
nvare i dorim s evalum performana elevilor ca urmare a unui proces de instruire, i nu ca
trstur inerent a fiecruia. Dac aplicm un test nainte de parcurgerea materiei respective vom
obine un procentaj foarte sczut de rspunsuri corecte i o corelaie item-total aproape de zero, fapt
care reflect necunoaterea de ctre elevi a materiei respective (rspunsuri greite, rspunsuri la
ntmplare, etc.). n acest caz soluia nu const n eliminarea sau refacerea itemilor, ci n instruirea
elevilor. Dac aplicm testul respectiv dup parcurgerea perioadei de instruire, vom obine procentaje
mari de rspunsuri corecte, ceea ce ar fi interpretabil drept redus capacitate discriminativ a itemilor.
n realitate, eliminarea acestor itemi ar fi de asemenea o eroare, deoarece am elimina tocmai itemii
care pun n eviden succesul nvrii, ceea ce este exact obiectivul msurrii.
Procedur statistic de grupare a variabilelor. Prezentarea ei face obiectul cursurilor avansate de statistic.
48
Copyright DEPARTAMENT ID 2009
Marian Popa
n astfel de situaii, utilizarea indicelui de consisten intern Cronbach alfa este inadecvat.
Cu toate acestea, analiza de itemi poate fi utilizat ca modalitate de identificare a itemilor greit
formulai, a celor nerelevani sau, pur i simplu, pentru a scoate n eviden erorile tipice pe care le fac
subiecii la anumite ntrebri.
49
Copyright DEPARTAMENT ID 2009