Sunteți pe pagina 1din 43

CAPITOLUL

CALITILE PSIHOMETRICE ALE TESTELOR) A.

CONCEPTE STATISTICE ESENIALE

Acest capitol se ocup cu concepte de general, standardele indic poziia H


baz menite s uureze rolul examinatorului candidat la un examen, la test nrudit
n interpretarea rezultatelor testului: performana altor persoane de aceeai vis
standardele testelor i coeficientul de clas social, sex .a.m.d.
fidelitate, validitatea, coeficienii de corelaie, Standardele sunt valori ale I
n cele mai multe cazuri, rezultatele la testele anumite caracteristici a repartiiei scorurto
psihologice sunt interpretate cu trimitere la eantion. Caracteristica urmrit poate fi: I
standardele testului care descriu performanta frecvena scorurilor mai mici sau mainito
realizat de eantionul de indivizi ales. n dect o valoare dat;
prima parte a temei analizm procesul de > valoarea care mparte irul scorii
standardizare al unui test pentru un grup ordonate n dou intervale care sunt ifl
standard, astfel nct cei care folosesc testul un raport fixat;
pot extrage sensuri din interpretrile testului media scorurilor.
individual. Din moment ce utilitatea unui Cel mai primar nivel de infornH
rezultat al testului este, de asemenea, oferit de un test psihologic este rezulte
determinat de consistena sau repetabilitatea neprelucrat, brut. De exemplu, n testai
rezultatelor testului, vom introduce aspectele personalitii, rezultatul brut sau cota bn _
eseniale ale teoriei coeficientului de fidelitate este, cel mai adesea, numrul ntrebrilor
i a msurrii acestuia n partea a doua care se rspunde pe o scal specific testa
acestui capitol urmnd ca n final s discutm n testarea abilitii, rezultatul brut cons
despre validitate. dintr-un numr de probleme Ia care I
Rezultatul iniial al testului este n mod rspunde corect, adesea cu puncte i
tipic un rezultat brut acesta fiind nefolositor bonificaie pentru performanele rpi
prin el nsui. Pentru ca rezultatele testului s Rezultatele brute luate izolat, sunt I
fie semnificative examinatorii trebuie s semnificaie. De exemplu, la ce folosete!
schimbe rezultatul iniial n nite forme ale ti c un subiect rezolv corect 12 din
rezultatului derivat bazate pe comparaia cu ntrebri la proba de gndire abstract?!
un grup standard sau normativ. nseamn c un candidat la un examen
Un grup de control const dintr-un rspuns la 19 din 33 ntrebri adevrat-B
eantion de subieci care sunt reprezentativi dintr-o coal?
pentru populaia pentru care testul este Este dificil chiar s te gndeti
instituit. S considerm un test de cuvinte asemenea ntrebri fr a recurge I
cunoscute proiectat pentru a fi folosit de comparaii de un fel sau altul. Noi vremi
candidaii la examenul de admitere la colegiu. tim ce au fcut alii la aceste teste, dat
Obiectivul esenial al standardizrii testului rezultatele observate sunt medii sau micii
este s determine distribuia rezultatelor comparaie cu un grup reprezentativ I
neprelucrate n grupul de control astfel nct persoane. n cazul testelor de cunotil
cel ce mbuntete testul poate publica suntem curioi dac ntrebrile au fost uoa
rezultatele derivate cunoscute ca criterii. n sau grele, mai ales privite n relaie cu vri

42
subiectului. De fapt, pare aproape un truism, S presupunem c pentru moment
c un rezultat brut devine semnificativ mai avem acces la un test de vocabular de nivel
ales n relaie cu regulile. nalt, adecvat pentru testarea cunotinelor
Cu ajutorul standardelor se determin verbale ale profesorilor de colegiu i a altor
modul n care se transform cotele brute ale categorii de profesori. Testul const din
testului n cote uor de interpretat, numite cote ntrebri cu alegere multipl a 30 de cuvinte
transformate. Acestea permit compararea diferite, precum - calm, linitit, mieros etc. O
rezultatelor ntre persoane diferite sau, pentru profesoar curioas ia testul i alege
aceeai persoan ntre teste diferite. alternativa corect pentru 17 din cele 30 de
Standardele trebuie s fie descrise detaliat n cuvinte. Ea ntreab cum este rezultatul ei n
manualul testului, indicnd: comparaie cu ceilali cu pregtire academic
similar. Cum ar trebui s rspundem la
compoziia populaiei pentru care au fost ntrebarea ei?
stabilite; O manier de rspuns la ntrebare
modul de formare a eantionului din poate fi: s-i dm o list cu rezultatele
aceast populaie; neprelucrate (brute) de la standardizarea
numrul persoanelor din eantion; preliminar a eantionului a celor 100 de
caracteristicile eantionului: sex, vrst, profesori reprezentativi de la universitatea ei.
statut socio-economic etc; Cu toate acestea, chiar cu aceast relativizare
gradul n care eantionul ales este a eantionului normativ lista rezultatelor la test
reprezentativ pentru populaia specificat; este supraevaluat.
natura i uniformitatea condiiilor n care a Cnd ne confruntm cu o colecie de
fost administrat testul; date, tendina general este de a realiza un
data testrii. cuprins, de a condensa i de a crea nite
tipare. De exemplu, n fixarea semnificaiei
rezultatului la testul de vocabular al
CONCEPTE STATiSTICE ESENIALE profesorului curios, cititorul poate calcula
rezultatul mediu pentru ntregul eantion sau
poate calcula poziia relativ a rezultatului
profesorului (17 corecte) printre cele 100 de
rezultate din tabel.

Tabel nr 1
6 10 16 16 17 14 19 14 16 15
17 17 19 20 20 22 17 24 14 25
13 20 11 20 21 11 20 16 18 12
13 7 20 27 21 7 15 18 18 25
20 27 28 13 21 17 12 18 12 15
9 24 25 9 17 17 9 19 24 15
20 21 22 12 21 12 19 19 23 16
8 12 12 17 13 19 13 11 16 16
7 19 14 17 19 14 18 15 15 15
14 14 17 18 18 22 11 15 13 9
interval. Suma frecvenelor pentru toate
intervalele va fi egal cu H numrul total al
Distribuiile de frecven rezultatelor din eantion; evident c mrimea
intervalelor depinde de numrul de intervale dorite.
Un mod foarte simplu i util de Este comun pentru distribuiile de frecven s
nsumare a datelor este s realizm o includ ntre 5 i 15 intervale de clas. n cazul
distribuie a frecvenelor (tabelul 2.). O tabelului 2. sunt 9 intervale de clas, fiecare de 3
distribuie de frecven este realizat de rezultate. Tabelul indic faptul c un profesor are
specificarea unui numr mic de intervale de punctajul de 4,5 sau 6; opt profesori puncteaz 7,8
obicei clase egale i apoi de calcularea a ct sau 9, .a.m.d.
de multe, rezultate se distribuie pe fiecare
43
O histogram prevede o reprezentare
grafic a informaiei despre eantion,
confirmat n distribuia de frecven. Axa
orizontal caracterizeaz rezultatele grupate
n intervale de clas, n timp ce axa vertical
nfieaz numrul de rezultate ce cad pe
fiecare interval de clas. ntr-o histogram,
nlimea unei coloane arat numrul
rezultatelor care se gsesc nuntrul acelui
interval. Vom reprezenta printr-o histogram
situaia noastr experimental, aferent
testului de vocabular. Figura 1

4-6 7-9 10-12 13-15 16-18 19-21 22-24 25-27 28-30

Poligonul frecvenelor este similar cu o


histogram, cu excepia c frecvena
intervalelor de clas este reprezentat prin
puncte singulare mai degrab dect prin
coloane. Punctele singulare sunt apoi unite de
linii drepte. Vom reprezenta printr-un astfel de
grafic situaia noastr experimental, aferent
testului de vocabular Figura 2
44
Determinarea "tendinei centrale"B "valorii
centrale"
zultai
Putem noi desemna un j
singular, reprezentativ pentru cele I rezultate
de vocabular n eantionul nosfl
Media aritmetic (m) este o asafl
msur a tendinei centrale. Media estel
valorilor, a datelor numerice, mpfl numrul
acestora;
m=Ix/N
unde I nseamn "sum defl
reprezint valorile sau rezultatele indiviB iar N
constituie efectivul grupei studiate. 1
Un alt indice prin care se deteJ mod
curent tendina central este med.J noteaz
cu "med", reprezint cel mai del rezultat,
cnd toate rezultatele aul calculate
(acea valoare care mpartB ordonat n dou
grupe egale ca numr). numrul rezultatelor
este egal, mediani cifra medie a mijlocului celor
dou rezultat fiecare caz mediana este punctul
care nfl distribuia astfel nct jumtate dintre
cazi situeaz deasupra, jumtate dedesubt.
Modul este pur i simplu cel'
frecvent rezultat care apare. Modul poafl
determinat prin simpla examinare a vala fr
a fi necesare operaii de calcul. Ca in; al
tendinei centrale modul este fa
aproximativ i se ia n considerare mai ale prima
analiz a datelor. n cazul distribui normale
modul, mediana i media coincid prezint valori
foarte apropiate.
Media aritmetic a rezultatelor list n
tabelul 1. este 16,8; mediana i modul si ambele
17. n acest exemplu cele msurtori
ale tendinei centrale | convergente. Cu
toate acestea, nu e
ntotdeauna aa. Media aritmetic este
sensibil la valori extreme i poate fi orientat
Dac rezultatele sunt strns distribuite
greit dac o distribuie are cteva rezultate
n jurul valorii centrale, a este mic. De fapt,
care de obicei sunt nalte sau joase. S
n cazul extrem unde toate rezultatele sunt
considerm un caz extrem n care nou identice, a este zero. Cnd un grup de
persoane ctig 10.000 lei i o a zecea rezultate devine mai larg, a devine mai mare.
persoan ctig 910.000 lei. Media De exemplu, n figura 3, distribuia "a"
aritmetic a acestui grup este de 100.000 lei, va avea cea mai larg abatere standard (a),
dar acest nivel nu este tipic numrului din distribuia "c" cea mai mic abatere standard.
jjrup. Mediana de 10.000 de lei este mult mai Modul de calculare al abaterii standard
reprezentativ. Bineneles, acesta este un este prezentat n tabelul nr.3 n acest exemplu
exemplu extrem dar el ilustreaz un punct artificial, numai 10 rezultate sunt utilizate spre
eneral. Dac o distribuie de rezultate este a face reprezentarea posibil. Prima coloan
asimetric, mediana este un index mai bun al reprezint cota brut desemnat prin litera
tendinei centrale, dect media aritmetic. mare X. Simbolul grec de la sfritul acestei
coloane (I) se pronun "sigma" i reprezint
Determinarea indicilor de dispersie "suma lui...". n felul acesta, nceputul, IX =
900 ar trebui citit ca: "suma lui X este egal cu
Dou sau mai multe distribuii ale 900". n final, n partea de jos a acestei prime
rezultatelor testului pot avea aceeai medie coloane, valoarea mediei este artat; m =
ritmetic, totui ele difer mult n ceea ce 900/10 sau 90.00.
privete dispersia. Pentru a descrie gradul A doua coloan reprezint din
dispersiei, avem nevoie de un index statistic rezultatele abaterii, desemnate prin litera x.
care exprim variabilitatea rezultatelor din Aceste rezultate reflect ct deviaz fiecare
j distribuie. rezultat de la media aritmetic, reprezentnd
Cei mai des folosit indicator statistic al eticheta rezultatelor abaterii. Rezultatele
variabilitii ntr-un grup de rezultate este abaterii sunt socotite prin scderea mediei
abaterea standard (se noteaz cu a sau s). aritmetice din rezultatele brute, adic x = X -
Dintr-un punct de vedere conceptual, cititorul m. Partea de jos a acestei coloane trebuie
trebuie s tie c abaterea standard reflect citit: (Ix=0) "Suma rezultatelor abaterii este
gradul dispersiei ntr-un grup de rezultate. egal cu zero. Suma rezultatelor abaterii este
2
Dispersia sau varianta se noteaz cu "o i se ntotdeauna egal cu zero, pentru c deviaiile
calculeaz conform formulei:
2 2
pozitive i negative se echilibreaz exact".
a =Z(x-m) N-1 Cea de-a treia coloan const din
2
unde, (x -m ) r eprezin t abater ea rezultatele abaterii derivate la ptrat,
fiecrei valori de la media calculat; desemnate prin x2. Fiecare dintre aceste
N este efectivul grupei de msurri. nscrieri constau dintr-un rezultat deviat
Abaterea standard sau abaterea tip nu nmulit cu el nsui. n partea de jos a
este altceva dect rdcina ptrat din coloanei a 3-a este nscrierea Zx2=310, care
valoarea dispersiei. trebuie citit: "Suma lui x (rezultatul deviaiei
I aptrat) este eg a I cu 310".
Cota brut Rezultatele abaterii
2
X X=X-m x 45
99 +9 81
94 +4 16
93 +3 9
93 +3 9
92 +2 4
89 -1 1
89 -1 1
88 _2 4
86 -4 16
77 -13 169
Ix=900 Zx=0 1x^=310
M=90.00
absciselor; n vecintatea punctului maxim
convexitatea curbei este spre exterior, iar ii
punctele de abscis+, - convexitatea curbei sf
schimb; modificarea parametrului producei
translaie a curbei fr modificarea formei:
modificarea lui duce la o ascuire a cura
cnd se micoreaz, i la o aplatizare a i
cnd crete.
O alt baz pentru a prefera J
distribuie normal a rezultatelor testului estJ
aceea c aceast se ridic n mod_spontan if
natur (de fapt, investigaii recente au fost ati
de impresionate de omiprezena distribuia
normale nct ele consider curba normal ca
pe o lege a naturii). Cu siguran c nu exista
nici o lege a naturii cu privire la forma pe caii
distribuiile frecvenei trebuie s le ia. Este-i
Poligonul frecvenelor prezentat n adevrat c multe caracteristici umanei
figura 2 este foarte neregulat, - o gselni importante - fizice i mentale - produc I
tipic cu date adevrate bazate pe eantioane aproximaie apropiat de curba normal, cnd
de mrimi mici -. Ce se va ntmpla cu forma msurtorile pentru eantioane largi il
poligonului de frecven dac noi cretem eterogene sunt aplicate.
numrului eantionul normativ i de
O distribuie normal aproximativ e
asemenea, cnd cretem numrul intervalelor
gsit, de asemenea, cu numeroase teste]
de clas prin reducerea mrimii lor ?
mentale, chiar i pentru teste constituite fr a
E posibil ca, adugnd noi subieci la
se fi fcut referin la proprietile distribuiei
eantionul nostru, distribuia rezultatelor s fie
normale. Wechsler (1944) alegea itemi pentru
tot mai mult apropiat de o curb n form de
clopot ascuit, simetric, definit matematic i Scala original a inteligenei Wechsler -l
numit: "distribuia normal". Bellevue lrgit pe baza varietii tipurilor dej
itemi, neacordnd atenie distribuiei
Psihologii prefer o distribuie normal
rezultatelor. De fapt, el considera c:
a rezultatelor testului, chiar dac multe alte
msurtorile mentale trebuie s se distribuie;
distribuii sunt teoretic posibile. De exemplu, o
dup curba normal pentru a fi "greite". Cndf
distribuie rectangular a rezultatelor testului -
se manifest distribuia scalelor coeficienilor!
un numr egal de ieiri n fiecare interval de
de inteligen (Ql) pe testul lui, apare'
clas - este posibil. ntr-adevr multe
predictibilitatea distribuiei aproape normale
persoane s-ar putea s prefere o distribuie
(figura 4.) (dup Williams & Wilkins).
rectangular a rezultatelor testului ca o
premis egalitar c diferenele individuale
astfel sunt mai puin pronunate.
De ce, totui prefer psihologii o
distribuie normal a rezultatelor tabelului,
chiar i n punctul de selectare a itemilor
testului? Exist cteva motive:
Un motiv este caracteristica curbei
normale matematice, care constituie baza
pentru cteva tipuri de investigaii statistice. Un
alt motiv pentru a prefera distribuia normale
este precizia ei matematic. Din moment ce
distribuia normal este definit cu precizie n
termeni matematici, este posibil s calculm cu
mare acuratee aria sub diferite regiuni ale curbei.
Astfel, o proprietate a acestei curbe este
aceea c, este simetric fa de medie iar
ramurile sale tind asimptotic la axa
Caracterul oblic al curbei se refer la
46 simetria sau asimetria unei distribuii de
frecven. Dac rezultatele testului sunt
milarizate la partea de jos a scalei, distribuia
totul astfel nct caracterul asimetric s fie
i spune c este denaturat pozitiv. n cazul minim sau inexistent.
rttyus, cnd rezultatele testului sunt polarizate
iularteade sus al scalei, distribuia se spune
Funcii de repartiie i clase procentuale
oi este denaturat negativ (figura 5).
n testarea psihologic, distribuia
O funcie de repartiie exprim
fenaturat semnific de obicei faptul c
procentajul de persoane din eantionul
jitorul testului a inclus de asemenea, civa
standard care au marcat un rezultat brut
raemi uori sau civa itemi mai dificili. De
specific. De exemplu, la testul de vocabular
templu, cnd rezultatele n eantionul
nfiat n tabelul 1, 94 % din eantion se
afendard sunt polarizate la captul de jos
situeaz sub rezultatul brut de 25. n felul
tfenaturare pozitiv), testul conine probabil
acesta, un rezultat brut al unei clase de 25 ar
iiva itemi uori, pentru a face discriminri
corespunde la o funcie de repartiie de 94,
Iciente la acest pol al scalei. Dac avem o
notat cu P 94 . Funcii nalte de repartiie
inaturare negativ, testul conine probabil
(procentaje nalte) indic rezultate nalte. n
Iiva itemi cu un anume grad de dificultate
cazul extrem, un candidat la un examen care
Intru a face disciminri reale la acest capt
[scalei.
a obinut un rezultat brut care a depit
fiecare rezultat n eantionul standard va primi
o funcie (un procentaj) de repartiie de 100
sau P100.
Studenii sunt atenionai s nu
confunde funciile de repartiie cu procentul
corect. S ne amintim c funcia de repartiie
arat numai modul cum un examinator se
raporteaz la eantionul standard, nu
transmite procentajul ntrebrilor rspunse
corect. De presupus c la un test dificil, un
rezultat brut de 50 procente corecte s-ar putea
traduce printr-o funcie de repartiie de 90, 95
sau chiar 100. Dimpotriv, la un test uor un
rezultat brut de 95 procente corecte se poate
traduce printr-o funcie de repartiie de 5, 10
sau 20. Funciile de repartiie pot fi de
asemenea, scrise ca iruri ntr-un grup de 100
de subieci reprezentativi, cu 1 fiind cel mai
sczut ir i 100 cele mai nalte. De notat c
irurile funciei de repartiie sunt reversul
complet al procedurilor de rang obinute. O
treapt de procentaj (TP) de 1 este la
Cnd cercetarea iniial arat c un nceputul eantionului, n timp ce o treapt de
istrument produce rezultate denaturate n procentaj (TP) de 99 este aproape de sfrit.
antionul standard, creatorii de teste, n mod pic O funcie de repartiie de 50 (P50)
restructureaz testul la nivelul itemului. ea mai corespunde medianei sau mijlocului
corect soluie este de a aduga emi sau a rezultatului brut. O funcie de repartiie de 25
modifica itemii existeni n aa fel ict testul s (P25) adesea este desemnat prin Q., sau
aib mai muli itemi uori ^ntru a reduce prima cuartil pentru c un sfert din rezultate
denaturarea pozitiv) sau li muli itemi se situeaz sub acest punct. ntr-o asemenea
dificili (pentru a reduce ,301|naturarea manier, o funcie de repartiie de 75 (P75), se
negativ). Dac este prea trziu entru a revedea refer la Q3 sau a treia cuartil pentru c trei
instrumentul, se poate folosi l transformare sferturi din rezultate se situeaz sub acest
statistic pentru a ajuta roducerea unei punct. Aproape orice fel de rezultat de test
distribuii de rezultate l-iormale" (vezi figura poate fi raportat ca o funcie de repartiie,
anterioar). Cu toate df:cestea, strategia chiar i atunci cnd alte transformri sunt
preferat este s revedem in scopul testrii. Astfel, un Ql de 130
corespunde unui procent de 98, ceea ce
nseamn c rezultatul nu este peste medie
47
dar, mult mai precis, depete 98 % din Cotele standard z, note T i alte cote
eantionul standard. Rezultatele funciilor de standardizate T
repartiie au un neajuns major: ele
distorsioneaz scala de msurare, mai ales la Aceste cote transformate servesc li
extreme. indicarea poziiei unei persoane fa de i
Un exemplu specific va servi spre anumit populaie. O cot standard foloseti
clarificarea acestui punct. S considerm un abaterea standard a ntregii distribuii dJ
exemplu ipotetic n care 4 persoane obin rezultate brute ca unitate fundamental ds
urmtoarele procentaje la un test: 50, 59, 90 msur. Cota standard z arat cu cte unitj
i 99. (s ne amintim c aici vorbim de de abatere standard se distaneaz cota brut!
procentaj nu de procentul corect). Primele 2 la test a unui subiect de media cotelor brutei
persoane difer prin 9 puncte de procentaj (50 populaia cu care se face comparaia (Albi
vs 59) i la fel urmtoarele persoane (90 vs 1997). De exemplu, un rezultat brut care este
99). Observatorul necalificat ar putea exact cu o deviaie standard deasupra media
presupune, n mod fals, c primele dou se transform ntr-o cot standard z de +1.O0;
persoane difer prin aceeai cantitate de un rezultat brut care este exact cu o jumtate
puncteca ultimele dou persoane. O privire de deviaie standard sub medie se transformi
asupra figurii 6 relev eroarea ntr-o cot standard de -0.50. n felul acest)
un rezultat standard nu exprim numai
mrimea abaterii de la medie, ci i direcia dt
pornire (pozitiv sau negativ).
Calcularea cotei standard z a uni
candidat la un examen este simpl. Scdem
media aritmetic a grupului normativ di
rezultatul brut al candidailor la examen i apa
mprim aceast diferen la deviaii
standard a grupului normativ. Tabelul I
ilustreaz calculul cotei z pentru 3 subieci lij
un test ipotetic.
Formula de calcul a cotelor z esfr
urmtoarea:
Figura 6 z=(x-m)/a
acestei presupuneri. Diferena dintre valoarea unde, z este cota z corespunztoar
liniar a rezultatelor neprelucrate ntre scorului la testul x;
procentajele de 90 i 99 este mai mare ntre m, o sunt media i abaterea standard
procentajele de 59 i 59. pentru cotele brute la test n eantionul folos
la etalonare.

Tabel 4

Media, rri=50 ; abaterea standard a = 8


z=(x-m)/ a
subiectul A: x=35 z=(35-50)/8= -1.88
subiectul B: x=50 z=(50-50)/8= 0
subiectul C: x=70 z=(70-50)/8= +2.50

Cotele standard z se folosesc pentru a n timp ce ultimele dou rezultate difer prin
compara performanele unui individ la dou 10 puncte de cotele brute - dublul diferenei
sau mai multe teste, dac mediile i dispersiile primei perechi. Cnd cotele brute s
scorurilor acestora au fost calculate pe baza convertesc n cote standard, rezultatele finale
aceluiai eantion de persoane. sunt de +0.50, +1.00, +2.00 i +3.00. Cititorul
U n e xe m p l u va s e r vi s p r e a va observa c primele dou rezultate difer
demonstra. S considerm patru cote brute prin 0.50 cote standard, n timp ce ultimele
de 55, 60, 70 i 80 la un test cu media 50 i dou rezultate difer prin 1.00 cote standard-
cu abaterea standard de 10. Primele dou dublul diferenei primei perechi. n felul
rezultate difer prin 5 puncte de cotele brute, acesta, cotele standard z ntotdeauna retij
48
irimea relativ a diferenelor gsite n rezultatului testului n aceeai form, puteam
rezultatele originale brute. compara gndirea spaial i rezultatele de
Distribuiile de cote standard posed vocabular prin convertirea fiecruia la cote
iroprieti matematice importante care nu standard. Cota standard a gndirii spaiale
exist n distribuiile de cote brute. Cnd pentru elevul nostru este (125-100)/15 sau
fiecare dintre cotele brute dintr-o distribuie +1.67 n timp ce cota standard a vocabularului
int transformate ntr-o cot standard colecia su este de (110-90) /20 sau +1.00.
-ezultat a cotelor standard ntotdeauna are o comparativ cu eantioanele normative, elevul
ledie egal cu zero i o variaie de 1.00; din are o aptitudine mai mare pentru gndirea
moment ce abaterea standard este rdcina spaial dect pentru vocabular.
ptrat a variaiei, abaterea standard a cotelor Dar, este indicat a fi prudeni atunci
standard (VToO) este n mod necesar 1.00. cnd comparm cotele standard de la
Un motiv de a transforma cotele brute distribuii diferite; dac distribuiile nu au
m cote standard este acela de a prezenta aceeai form, comparaiile cotelor standard
rezultatele la teste n raport cu o scar pot fi foarte neltoare. Vom ilustra acest
;omun. Dac dou distribuii ale rezultatelor punct n figura 7, care nfieaz dou
testului au aceiai form, putem face distribuii: una deosebit de oblic cu rezultatul
comparaii directe pe cote brute prin mediei artimetice de 30 (a =10) i alta cu
transformarea lor n rezultate standard. S distribuie normal cu rezultatul mediei
presupunem de exemplu, c un elev obine aritmetice de 60 (cr= 8); avem un rezultat de
125 puncte la un test de gndire spaial unde 40 la primul test i o cot brut de 68 la testul
eantionul normativ are media aritmetic de al doilea ambele traduse n cote standard
100 puncte (cu abaterea standard de 15 identice de +1.00; o cot standard de 1.00 la
puncte); s presupunem, n plus, c el obine primul test depete 92% din eantionul
110 puncte la un test de vocabular unde normativ, n timp ce cota standard echivalent
eantionul normativ are media aritmetic de la cel de-al doilea test depete numai cu 84
90 puncte (cu abaterea standard de 20 % din eantionul normativ. Cnd dou
puncte). n care domeniu are el aptitudinea distribuii de rezultate la test nu au aceeai
mai mare, gndire spaial sau vocabular ? form, cotele standard echivalente nu au
Dac eantioanele normative pentru poziii comparabile nuntrul eantionului
ambele teste produceau distribuii ale normativ respectiv.

Muli psihologi i educatori apreciaz Ca rspuns la aceste neliniti, specialitii n


proprietile psihometrice ale cotelor standard teste au elaborat un numr de variaii la cotele
dar sunt privite cu reticen fraciile zecimale standard care, toate se refer la cotele
i semnele pozitive/negative (ex. z = - 2,32). standardizate.
49
Dintr-un punct de vedere conceptual, Transformarea cotelor z n cote standardiza
cotele standardizate sunt identice cu cotele se face prin formula:
standard z (ambele feluri de rezultate conin z'=M+z S unde, z' est e ci
exact aceeai informaie). Forma distribuiei transformat a cotei standard; m, a si
rezultatelor nu este afectat i un "complot" n media i abaterea standard pentru coti
relaia dintre cotele standard i cele standardizate obinute prin transformare;!
standardizate constituie ntotdeauna o linie mod obinuit valorile z' se rotunjesc la numi
dreapt. Cu toate acestea cotele ntregi.
standardizate sunt exprimate ntotdeauna ca Cotele standardizate au acelea
un ntreg de numere pozitive (nu prin fracii proprieti ca i cotele standard z, singur,
zecimale pozitive sau negative). Cotele diferen ntre ele fiind valoarea mediei il
standardizate elimin fraciile i semnele abaterii standard. n tabelul urmtor sul
negative (-) prin producerea valorilor, altele prezentate valorile m i o pentru divers
dect zero pentru medie i 1.00 pentru transformri ale cotelor standard (N,C,
abaterea standard a rezultatelor transformate. etc. reprezint scala).
Un cunoscut rezultat standardizat este

nota T, care are o medie de 50 i o deviaie


standard de 10. Scalele notei T sunt comune
n mod special cu testele de personalitate. De Rangurile centile, decile i cuartile I
exemplu, la MMPI, fiecare scal clinic este
convertit la o matrice comun unde 50 este Rangul cenii arat cte persoane s-J
rezultatul mediu i 10 este abaterea standard afla n urma unui anumit subiect, dac aceste
pentru eantion normativ. ar face parte dintr-un grup de 100 de indivizi
Pentru a transforma cotele brute n nota T, De exemplu dac 85% din cei testai obii
folosim formula urmtoare : T=10(x-m)/a + 50 scoruri mai mici dect 60 i 15% realizeazi
Termenul (x - m) / a este, bineneles, scoruri mai mari, atunci 60 va avea rangul
echivalent cu cota standard z, aa c putem cenii de 85.
rescrie formula pentru notaT ca pe simpl Paii algoritmului de determinare i
transformare a lui y : T = 10 z + 50. rangurilor centile sunt urmtorii (Albi
Pentru orice distribuie de cote brute, M.,1997):
notele T corespondente vor avea o medie > se ordoneaz cresctor cotele brute alei
aritmetic de 50. n plus, pentru cele mai testului (x) i se noteaz pentru fiecare
multe distribuii marea majoritate a notelor T se valoare numrul de persoane care au
vor repartiza ntre valori de 20 i 80 (nu este realizat scorul respectiv(N);
neobinuit s observi note T foarte ridicate - > se traseaz poligonul frecvenelor!
chiar mai mari de 90 - la, inventare de cumulate;
personalitate precum MMPI). Cotele > pentru a determina rangul cenii
standard pot fi croite s produc orice medie corespunztor unui scor dat x , se citete
aritmetic i abatere standard. Cu toate de pe grafic ordonata punctului care aret
acestea, pentru a elimina rezultatele negative abscisa x (obinuit rangul cenii se!
standardizate, media aritmetic din rotunjete la cel mai apropiat ntreg);
preselecie ar trebui s fie de cel puin cinci ori > pentru a determina scorul care!
tot aa de larg (mare) ca i abaterea corespunde unui rang cenii dat y se1
standard. n practic creatorii de test se bizuie pe citete de pe grafic abscisa punctului carel
cteva valori preferate pentru mediile i are ordonata y.
abaterile standard ale cotelor standardizate Normele unui test pot fi prezentate sub
(de ex. pentru WAIS-R media de m=100, a = 15; forma unui tabel care s conin centile, adic
MMPI scala depresiei, paranoia m=50, a=10). valorile scorurilor care au rangurile centile
egale cu 1, 2, ..100, sau sub forma graficului
poligonului frecvenelor.
50 Unii autori recomand ca n tabelul de
norme s se treac pentru fiecare cot brut a |
testului, n locul rangului cenii , "banda
centil" care corespunde intervalului de
ncredere al scorului real. Pentru aceasta,
dup trasarea poligonului frecven elor
cumulate se procedeaz astfel:
> se determin intervalul de ncredere al
scorului real, (x,y);
> se citesc de pe grafic ordonatele
corespunztoare absciselor x i x,
respectiv y i y;
> n tabelul de norme, n dreptul cotei brute
xse noteaz banda centil (x, y).
Normele centile prezint deficiene n
cazul cnd scorurile testului sunt repartizate
aproximativ normal sau cnd exist valori de
scoruri care apar cu frecvene foarte mari.
Atunci cnd repartiia scorurilor testului este
uniform, deci fiecare cot brut apare cu
aceeai frecven, unor intervale egale ca
lungime pentru cotele brute le corespund
intervale de lungimi egale pentru rangurile
centile.
Folosirea rangurilor centile i gsete
justificarea atunci cnd testul are un numr de
scoruri posibile, n caz contrar este de preferat
rangul decil sau cuartil care se obine prin
mprirea arie cuprinse ntre axa absciselor i
curba de repartiie a scorurilor la 10 pentru
decile i la 4 pentru cuartile. Se pot obine i
clasele scrii normalizate prin transformri de
arie cnd difer doar curba de repartiie
utilizat care de ceasta dat este normal.

51
B. SURSE DE EROARE N EVALUAREA
PSIHOLOGIC
eroarea de msurare i fidelitatea
coeficientul de fidelitate
coeficientul de corelaie
observaii asupra metodelor utilizate pentru estimare
fidelitii

Termenul eroare cuprinde n el tot


ceea ce scade precizia testului. Eroarea este cunotine i deprinderi care pot influeJ
rezultatul aciunii unor factori care modul de rezolvare a testului n caua
influeneaz msurarea ntr-un asemenea existena unor patternuri de rspuf
mod nct nu pot fi nici recunoscui, nici stabile, cunoaterea de ctre subiect
nelei; eroarea afecteaz scorurile obinute rspunsului la anumii itemi;
de ctre subiect la test ct i interpretarea factori care acioneaz diferit de la
acestor scoruri. Existena erorii dar nu i situaie de testare la alta i care I
mrimea ei este pus n eviden atunci cnd influen asupra modului de rezolvare!
rezultatele testului sunt folosite pentru a face ctre subiect a mai multor teste psiholoj
predicii asupra comportamentului i cnd se administrate n situaia respectiv, j
constat, c numai o parte din predicii se numai a testului n cauz: starea fizic]
adeveresc. psihic general, experiena anterioara!
Eroarea de msurare reprezint domeniul testrii psihologice, acceptai
diferena dintre scorul observat i scorul real, necesitii testrii, condiiile fizice n cal
ea putnd avea valoare pozitiv sau negativ. are loc administrarea, comportament
e=X-T, aceast eroare poate fi examinatorului;
considerat drept o valoare a variabilei factori care acioneaz diferit de la]
aleatoare E definit prin relaia:
situaie de testare la alta i care 1
E=X-T
influen asupra modului de rezolvare I
Pe de alt parte scorul obinut este ctre subiect a testului n cauz, dar nul
determinat de numero i factori care
a altor teste care msoar aceea
acioneaz ca ageni perturbatori. Aceti
factori perturbatori ar putea fi grupai astfel caracteristic: nivelul de antrenare I
(Albu M., 1997 dup Anastasi, 1976; subiectului n rezolvarea unei sarci
E.L.Thomdike, dup Murphy i Davidshofer, asemntoare precum testul n cauz
1987; Jager, 1993): dispoziia momentan a subiectului pentn
caracteristici durabile ale persoanei, rezolvarea testului, fluctuaii ale memorii
independente de situaia de testare i care sau ateniei subiectului;
au influen asupra modului de rezolvare a factori cu aciune aleatoare, care
testelor psihologice n general, nu numai a afectecteaz administrarea testului
testului n cauz: abilitatea general de a cauz sau aprecierea performanelor li
nelege instruciunile testelor, deprinderi i test, i care ar putea sau nu s influenezi
ndemnri generale pentru rezolvarea rezultatele altor teste administrate j
testelor etc; aceeai situaie: factori de distragere sj
caracteristici durabile ale persoanei, ateniei subiectului, norocul la ghicirea
independente de situaia de testare i care rspunsului corect atunci cnd subiectul
au influen asupra modului de rezolvare a ghicete rspunsul la ntrebare, cotarea
testului respectiv, dar nu i a altor teste: greit a unor itemi conducnd la un scol
eronat;
52
factori legai de concepia testului n semnificativ n dezvoltarea testelor
cauz, independeni de subiect i de psihologice. Totui, dac psihometricienii
situaia de examinare: structura testului, folosesc procedee corecte de analiz,
compoziia i repartiia itemilor; impactul erorilor de msurare sistematice
Dei examinatorii asigur de obicei un poate fi mult redus. Fr nici o ndoial, erorile
mediu optim i standard de testare, multe sistematice de m surare servesc pentru a
surse de erori de msurare pot aprea n aminti c e foarte dificil, dac nu imposibil, s
circumstanele administrrii. urmreti o singur caracteristic izolat.
Condiiile generale de mediu care pot
influena acur ate ea m surrii sunt: Eroarea de msurare i fidelitatea
temperatura necorespunztoare, lumina
slab, zgomot puternic etc; nu e posibil s Probabil c v vei ntreab ce legtur
anticipezi calitile situaiei de testare care vor are eroarea de msurare cu fidelitatea. Cea
contribui la erorile de msurare. mai clar legtur este c eroarea de
Situaiile de evaluare sunt surse de msurare reduce fidelitatea sau repetabilitatea
tensiune i anxietate. Anxietatea fa de test rezultatului testului psihologic. De fapt, vom
este bine cunoscut i se tie c acest fel de arta c fidelitatea are o relaie statistic
anxietate crete pe m sur ce crete precis cu eroarea de msurare.
importana atribuit de subiect evalurii i Fidelitatea i eroarea de msurare
cadrului n care se face testarea. Lipsa de sunt, de fapt, doar feluri diferite de a exprima
interes, oboseala, starea de boal l pot acelai lucru: ct de consistent este un test
determ ina pe subiect s rspund la psihologic. Interdependena acestor dou
ntm plare. Gradul de concordan a concepte va deveni vizibil dac schiam
intereselor persoanelor examinate cu cele ale teoria clasic a msurrii.
examinatorului au influen asupra comportrii O supoziie principal a teoriei clasice
subiectului n timpul testrii, alturi de este aceea c erorile nesistematice de
motivaia persoanelor examinate care msurare acioneaz ca inf luene
influeneaz rspunsurile la test. ntmpltoare. Aceasta nu nseamn c
Sursele de eroare discutate anterior sursele de erori de msurare sunt misterioase
sunt denumite erori de m surare n fiecare caz. Putem prospecta pentru un
nesistematice, adic, efectele lor sunt examinat c scorul a reflectat o eroare de
imprevizibile i inconsistente. msur uor negativ cauzat de cineva care
Totui, exist i un alt tip de erori de a tuit pe hol n timp ce i se prezenta
m s urar e c a re c o ns t it u i e o v er i ta b i l ntrebarea cu nr.5; la fel pentru alt persoan
"fantom" pentru "mainile psihometrice". O se nregistreaz o eroare de msur pozitiv
eroare de msurare sistematic apare cnd, pentru c s-a uitat n oglinda din spatele
necunoscut pentru cei care testeaz, un test
examinatorului pentru a vedea rspunsul
msoar ceva diferit de c eea ce a fost
corect la itemul 9. Deci, eroarea de msurare
intenionat la construirea lui; s presupunem,
nu e neaprat un eveniment misterios n
de exemplu, c o scal de msurare a
fiecare caz.
introversiunii sociale cu totul involuntar
Totui, cnd examinm scorul testului
noteaz anxietatea n mod constant.
la grupuri de persoane, cauzele erorii de
n acest caz, ecuaia ce desemneaz
msurare sunt foarte complexe i variate. n
relaia ntre scorurile observate, scorurile
acest context, erorile de m surare
adevrate i sursele de erori de msur ar fi: X
nesistematice se comport ca variabile
= T + es + eu Unde:
aleatoare.
X = scorul obinut T
= scorul real
Pentru c sunt evenimente aleatoare,
e s = eroare sistematic datorat componentei
erorile de msurare sunt n mod egal posibil a
anxietii
fi pozitive sau negative, i, ca urmare, se vor
e u = efect colectiv al erorilor de m surare
echilibra aproape de zero la un grup mare de
nesistematic
subieci. Deci, o a doua supoziie este aceea
Dac prin definiie, prezena lor este
c cea mai mic eroare de msurare este
iniial nedetectat, erorile sistematice de zero. Teoria clasic afirm de asemenea c
msurare pot constitui o problem erorile de msurare nu sunt corelate cu
scorurile reale. Aceasta se face n sens
intuitiv: dac scorurile eronate ar fi relationate
53
cu alt scor, ar sugera c acestea sunt
sistematice i nu aleatoare, ceea ce ar viola Cnd variaia datorat erorilor de
supoziia esenial a teoriei clasice. n cele din msurare (a2e) este foarte mic, aproape de]
urm, se mai afirm c erorile de msurare nu
sunt corelate cu erorile la alte teste.
Putem nsuma principalele trsturi ale
zero, coeficientul de fidelitate (rxx) se apropie
teoriei clasice dup cum urmeaz (Gregory,
de 1. La captul extrem unde variaia datorat
1996):
erorilor de msur este foarte mare, valoarea
erorile de msurare sunt aleatoare; coeficientul scade aproape de 0. Pe scurt, un
media erorilor de msur este egal cu test complet nefiabil va prezenta un coeficient
zero; de fidelitate aproape de 0, n timp ce un test
scorurile reale i erorile de msur sunt complet fidel (fr erori de msurare) va
necorelate liniar; produce un coeficient de fidelitate aproape de
pentru orice valoare particular a 1. Deci, coeficientul de fidelitate este cuprins
scorurilor reale, media erorilor de msur ntre (0-1).
n populaia considerat este egal cu n concluzie, putem spune c un test
zero; este fidel atunci cnd este precis deci, lipsit de
dac avem dou instrumente de msur erori de msur sau atunci cnd orice
atunci coeficientul de corelaie liniar ntre persoan obine scoruri egale la test i la o
scorurile reale ale unui instrument i form paralel a acestuia; condiiile de
erorile de msur ale celuilalt este egal cu administrare fiind stabilite astfel nct erorile
zero; de msurare la cele dou teste pentru oricel
Pornind de la aceste supoziii, este persoan s fie independente.
posibil s se dezvolte o serie de implicaii Pn acum fidelitatea a fost concept
importante privind fidelitate i msurarea. De nu practic. Am artat c fidelitatea se refera
exemplu, tim c orice test administrat unui la consistena msurrii; c este diminuat
grup mare de persoane va arta o variabilitate pn la cota cnd erorile de msurare domin
a scorurilor obinute care poate fi exprimat scorurile obinute; i acest coeficient de
conform relaiei: fidelitate poate varia ntre 0 i 1. Dar cum este
calculat valoarea statistic a fidelitii ? Vom;
Relaia anterioar ne spune c aborda aceasta indirect, revznd coeficientul
dispersia scorului observat este egal cu de corelaie, care este un index numeric al
suma dispersiei scorului real i a dispersiei gradului de relaie liniar ntre dou seturi de
erorii. Implicaia clar a acestei relaii este c scoruri.
erorile de msurare contribuie la inconsistena
scorurilor obinute la test; rezultatele nu vor COEFICIENTUL DE CORELAIE
rmne stabile dac testul va fi din nou
administrat. Coeficientul de corelaie (r) exprim
gradul relaiei liniare ntre dou seturi d(
COEFICIENTUL DE FIDELITATE
Coeficientul de fidelitate (rXx) este
n vorbirea curent cuvntul "fidel" este calculat ca i raportul ntre variaia scorurilor
utilizat pentru a descrie constan a, reale i variaia total a scorurilor testului:
durabilitatea, exactitatea sau n cazul unui scoruri obinute de la aceeai persoan
instrument de msur, proprietatea acestuia Coeficienii de corelaie pot lua valori ntre -l
de a arta aceeai valoare cnd se repet i 1. Un coeficient de corelaie de +l
msurarea. "Standards for Educaional and semnific o relaie perfect liniar ntre doui
Psychological Tests" definesc fidelitatea ca seturi de scoruri.
fiind "gradul n care scorurile testului sunt De exemplu, cnd dou rezultate au
consistente sau repetabile, adic gradul n corelaie +1, ordonarea subiecilor est!
care ele nu sunt afectate de erorile de identic pentru ambele seturi de scoruri. Mal
msurare". n unele definiii prin fidelitate se departe, cnd sunt aranjate pe axe puncte!
nelege precizia msurrii realizate de un datelor individuale (fiecare reprezentnd t
instrument. pereche de scoruri de la un singur subiect) l
structureaz pe o linie perfect dreapli
ascendent. Un coeficient de corelaie de-1
semnific o relaie egai de puternic dar 1
54
coresponden invers: scorul cel mai mare Cnd dou variabile nu au nici o relaie
pentru o variabil corespunde scorului cel mai punctele iau o form nedefinit i coeficientul
mic pentru alta i invers. n cazul acesta de corelaie este aproape de zero (figura 8.d).
punctele datelor individuale se structureaz De exemplu, ntr-un eantion de aduli,
pe o linie dreapt ntre cele dou axe. corelaia ntre timpul de reacie i greutate
Corelaii de +1 i -1 sunt foarte rare n poate fi aproape de zero.
cercetarea psihologic i de obicei semnific Este important s nelegem c
un rezultat trivial. De exemplu, dac n dou coeficientul de corelaie este independent de
ocazii n succesiune rapid numrm numrul medie. De exemplu, o corelaie de + 1 poate fi
de litere de la numele a 100 de studeni, gsit ntre dou administrri ale aceluiai test
aceste dou seturi de scoruri vor avea o chiar cnd sunt diferene semnificative ale
corelaie de +1. mediei ntre pretest i post-test. Pe scurt
Corelaiile negative de obicei rezult corelaia perfect nu implic scoruri pre i
din modul n care una din dou variabile a fost post test identice pentru fiecare examinat.
msurat. De exemplu, scorurile de la un test
categorial (Retan & Wolfson) sunt raportate ca Calculul coeficientului de corelaie
erori, n timp ce rezultatele de la Matricele
Progresive Raven sunt raportate ca numr de Sunt cteva moduri de calcul a
itemi coreci. Persoanele care obin un scor coeficientului de corelaie. Vom discuta aici
ridicat la Testul categorial (erori multe) vor cel mai cunoscut coeficient de corelaie,
obine un scor mic la Matricele Progresive, inventat de KarI Pearson i numit coeficient de
deci, vom atepta o corelaie negativ corelaie Pearson. Deci, coeficientul de
substanial pentru scorurile de la aceste corelaie r al lui Pearson are n vedere nu doar
dou teste. clasarea fiecrui subiect pe prima i a doua
S considerm punctele din figura 8 c^ variabil, dar i deviaia sa peste sau sub
care pot descrie nlimea ipotetic i media grupului. Aceast procedur poate
greutatea unui grup de persoane. Dup cum prea intimidant dar tehnica este foarte
vei vedea, nlimea i greutatea sunt simpl i clar.
puternic dar nu perfect relaionate una cu alta. S considerm datele dinjabelul 5_.,
Persoanele nalte tind s cntreasc mai care descriu scorurile ipotetice a 10 subieci
mult, persoanele scunde mai examinai la un test de scriere i calcul
matematic. Cum putem obine un index de
corelaie ntre scorurile de scriere i cele de
matematic ?
Vom folosi ecuaia ce urmeaz pentru
simplitatea conceptual:

Abordarea se face prin calculul


elementelor individuale (N, IXY, O"X, aY) i apoi
introducerea lor n f ormul pentru
determinarea valorilor lui r.
Fiecare subiect are un scor brut pentru
scriere (pe coloana X) i un scor brut pentru
aritmetic (pe coloana Y). Primul pas este s
calculm suma scorurilor testelor pentru
ambele teste (a); mprim suma pentru
puin, dar sunt i cteva excepii. Dac fiecare test la numrul de subieci N, obinem
calculm coeficientul de corelaie ntre media scorului la fiecare test (b). Folosind
nlime i greutate vom obine o valoare de media, putem calcula deviaia scorului (x = X
aproximativ + 0,90, indicnd o relaie puternic - "X^ i y=Y-~Y) pentru fiecare subiect la
pozitiv ntre aceste msuri. ambele teste, dup cum se vede n coloanele
x i y (c). Ridicnd la ptrat fiecare valoare din
55
coloanele x i y obinem deviaii ptratice n coloana xy (g); aceste produse sunt nsumate
coloanele x2 i y2(d); avem nevoie de semnele (h); n final, elementele individuale sunt
deviaiilor ptratice (e) pentru a calcula introduse n formula pentru r Pearson (i).
deviaia standard a scorurilor X i Z (f); Cnd s-a terminat totul, r Pearson arat o
scorurile deviate n coloanele x i y sunt corelaie de .82 (j).
multiplicate pentru a obine produsul n

Subiec t X y A y 2 .vv

79 63 13 14 169 196 182


58 --14 -8 -5 64 25 40
49 42 -27 -7 729 49 175
83 66 17 17 2X9 289 2S9
44
55
29
40 -1.^ > -9
484
121 *" ^ m^ 40(>81 6V440
ir 99
72 59 6 10 36 100 60
92 71 26 22 676 484 572
87 44 21 -5 4-11 25 -105
41660 v; -25 -17 625 289 425
^J )- 0 0 3.634 gh 1,938 (Ji>-2,177
490
660 -
"TI = 66.0 F IK 49'
" N ~
p = 49.0

(Tu v =V^ /1T "0= 19.06


1,634 v = Vi, 938/16= 13.92
K
2,177 - on
,
Q)-^=(N) f<,) '<P
(10)(19.06)(13.92)
( coeficieni de fidelitate interevaluatori -se
Metode utilizate la evaluarea fidelitii
testelor calculeaz pentru teste al cror scor este
rezultatul aprecierii subiective fcute dej
Pentru un test n funcie de ceea ce evaluator (arat n ce msur prerile mai1
msoar i de condiiile n care a fost multor evaluatori concord ntre ele).
administrat se calculeaz unul sau mai muli
dintre urmtorii coeficieni, prin care se Metoda test-retest
aproximeaz valoarea coeficientului de
fidelitate: Metoda evalueaz gradul n care;
coeficieni de stabilitate - se calculeaz scorurile obinute la un test de acelai subiect
prin metoda test-retest, corelnd scorurile sunt constante de la o administrare la alta. Sf
obinute la test i la retest (arat ct de administreaz testul unui grup de persoane
stabile sunt scorurile n timp); apoi dup un interval de timp si
coeficieni de echivalen - rezult din administreaz testul acelorai indivizi l
metoda formelor paralele, prin corelarea aceleai condiii ca i prima dat. Ulterior si
scorurilor obinute la dou teste paralele, calculeaz coeficientul de corelaie liniari
administrate aproape n acelai timp (arat ntre scorurile observate n cele dou situai
ct de asemntoare sunt cele dou Coeficientul de corelaie calculat priiV
instrumente de msur); aceast metoda se numete coeficient dl
coeficienii consistenei interne - se stabilitate.
calculeaz n cadrul analizei consistenei Aplicarea metodei test-retest cere
interne, pe baza scorurilor obinute la un asigurarea condiiilor n aa fel nct pentn
test administrat o singur dat, coeficientul fiecare persoan erorile de msur la cel
Cronbach, Guttman, Kuder-Richardson dou testri s fie variabile independente.
(arat concordana diferitelor pri ale Valoarea coeficientului de corelai
testului); test-retest poate fi apropiat de 1 atunci cni
testul nu este potrivit lotului de subieci, fiii
56
i dificil sau prea uor (n asemenea situaii 1. necesitatea utilizrii a dou administrri
Ivor obine scoruri foarte mici sau foarte separate, ceea ce necesit timp i costuri
iri). n consecin interpretarea valorii ridicate;
ficientului de stabilitate a unui test trebuie 2. prezena oboselii sau a plictiselii
otit de analiza formei histogramelor persoanelor examinate, cu influene
urilor observate la test i la retest. asupra scorurilor la cel de-al doilea test;
mpreun cu valoarea coeficientului de 3. elaborarea mai multor forme paralele de
labilitate se vor comunica: lungimea test poate fi dificil i costisitoare.
intervalului de timp dintre test i retest; Pentru a se micora efectele care pot
condiiile n care sau efectuat testrile; apare asupra mrimii coeficientului de
vrsta subiecilor testai, deoarece s-a corelaie dintre scoruri, efecte datorate
constatat c aceasta are influen asupra schimbrii condiiilor de administrare a testelor
subiecilor testai (Schuerger, Zarrella, se procedeaz astfel (Albu, 1997 dup
Hotz, 1989). Aiken,1994):
O alt metod pentru calculul a) se mparte lotul de subieci n mod aleator
eficientului de stabilitate se aplic atunci n dou pri egale;
nd testul este utilizat pentru a lua decizii, b) la prima testare fiecare jumtate a lotului
orin plasarea subiecilor n una din categoriile de subieci primete un alt test;
dmis" sau "respins"; testul este stabil dac c) la a doua testare se inverseaz testele
la o administrare la alta nu se produc administrate, n aa fel nct fiecare
dificri ale clasificrii subiecilor. subiect s rspund la ambele teste;
d) se calculeaz coeficientului de corelaie
Metoda formelor paralele liniar dintre scorurile celor dou teste,
fr a se lua n considerare momentul
Aceast metod const n cnd au fost administrate testele.
dministrarea a dou teste care reprezint Metoda formelor paralele se utilizeaz
iStrumente de msur paralele, la momente i atunci cnd se dorete obinerea unei
barte apropiate unul de altul i determinarea colecii de teste paralele, de bun calitate(n
coeficientului de corelaie liniar ntre scorurile psihoterapie).
observate ale celor dou forme.
Valoarea calculat se numete Metoda njumtim (split-half)
coeficientului de echivalen.
Aceast metod este potrivit n cazul Aceast metod const n:
in care se urmrete msurarea unor administrarea testului unui lot de
caracteristici generale ale persoanelor persoane;
(asemenea caracteristici vor influena n mprirea testului n dou pri ct mai
acelai mod scorurile ambelor teste). O asemntoare ntre ele;
metod apropiat cu aceasta, care msoar calcularea coeficientului de corelaie ntre
caracteristicile generale i durabile ale scorurile observate la cele dou jumti.
persoanelor, const n administrarea celor determinarea coeficientului de fidelitate al
dou forme ale testului aceluiai grup de ntregului test aplicnd formula Spearman-
persoane la momente mai puin apropiate. Brown.
n acest caz coeficientului de corelaie Metoda njumtirii rezolv multe din
liniar al scorurilor observate la teste se problemele teoretice i practice inerente
numete coeficientului de stabilitate i metodei test-retest sau metodei formelor
echivalen. paralele.
Raportat la metoda test-retest, metoda Prin aceast metod nu este necesar
formelor paralele prezint unele avantaje; s se administreze dou teste diferite i nici
astfel, cele dou forme fiind diferite rezultatele de dou ori acelai test, dar apare dificultatea
la cel de-al doilea test nu mai sunt influenate care const n construirea jumtilor care s
de memorarea rspunsurilor date la primul fie msurtori paralele.
test, nici de aflarea rspunsurilor la ntrebrile Nu este recomandat simpla mprire
unde nu s-a tiut rspunsul. a testului la mijloc deoarece aceast
Din inconvenientele acestei metode procedur va mri sau micora valoarea
amintim urmtoarele: coeficientului de fidelitate (datorit unor factori
precum oboseala care va influena scorurile la
57
cea de-a doua jumtate). O cale acceptabil consum mult timp i sunt mai scumpe dect
de a mpri testul este de a stabili la cele scurte. Deci, nu ntotdeauna este posibil
ntmplare anumite aspecte dintr-o jumtate i rentabil creterea fidelitii prin adugare
sau alta a testului. O alt cale utilizat este de de itemi paraleli.
a adopta metoda par-impar: itemii unei
jumti vor ocupa locurile cu numr de ordine Metoda analizei consistenei interne
par, iar ceilali locurile cu numr de ordine
impar. Totui, se obinuiete s se plaseze Ne oprim acum la cteva moduri de
itemii n ordinea cresctoare a dificultii lor. estimare a fidelitii unui test individual fr|
Metoda nu se recomand a se aplica dezvoltarea unor forme paralele i fr
atunci cnd testul se administreaz cu limit administrarea testului de dou ori la aceiai
de timp, ntruct fiecare persoan care nu 58 subieci. Aceast metod utilizeaz pentru
reuete s rspund la ultimii doi itemi va estimarea fidelitii unui test dispersiile i
avea scorul zero la acetia i, deci, scorurile covarianele scorurilor observate ale itemilor.
la itemii pari i cei impari vor fi mai puternic Metoda necesit o singur administrare iar pe
corelate dect sunt n realitate. baza scorurilor observate ale itemilor se
calculeaz unul din urmtorii coeficieni;
Formula Spearman-Brown coeficientul a al lui Cronbach;
Folosirea formulei Spearman-Brown coeficientul A al lui Guttman;
pentru a estima coeficientul de fidelitate al coeficientul p al lui Kuder-Richardson.
ntregului test, este o aplicaie specific a unei Acetia sunt numii coeficieni de,
formule mai generale, care permite celui care consisten intern1, i sunt utili pentru
aplic testul s estimeze fidelitatea unui test calculul fidelitii testelor care msoar o
care este mrit sau micorat cu un numr de caracteristic unidimensional
itemi (fidelitatea unui test este influenat i de
lungimea lui). Coeficientul alfa
Formula general Spearman-Brown Formula pentru coeficientul alfa este:
este:

2rhh
bB
1 + rhh

Din formula Spearman-Brown se


deduce c fidelitatea testului depinde
cresctor de numrul itemilor componeni. \N-\\ o"
Adugarea de itemi paraleli va avea drept N2 = numrul de itemi A,2 = variaia unui
consecin o mrire a consistenei interne a item Zo2 = suma variaiilor fiecrui item
testului; din aceast formul se poate afla de o2- variaia scorurilor totale ale testului ra
cte ori trebuie mrit sau micorat, prin itemi - variaz ntre 0 i 1
paraleli un test dat astfel nct valoarea
testului obinut s fie egal cu o valoare fixat. Estimarea Kuder- Richardson a fidelitii
Raportul dintre lungimea noului test i Formula lui
lungimea testului original se calculeaz cu Kuder-
formula: Richardson
este relevanta!
2rhh pentru cazurile
b speciale cnd
* 1 + rhh
fiecare iem este notat 0 sau 1 (adevrat sau
rSs= fidelitatea testului existent calculat dup
fals). Formula este:
metoda Spearman-Brown rhh= fidelitatea
dorit, egal cu fidelitatea testului a crui N = numrul de itemi ai testului
lungime este egal cu de n ori lungimea a2 = variaia scorurilor testului
testului existent. p = proporia celor examinai care au rezolvai
Practic este dificil s se construiasc fiecare item corect
itemi de test buni care s fie paraleli cu itemii
existeni n test. Pe de alt parte testele lungi
1
Pentru aprofundarea cunotinelor se recomand
analiza lucrrii: "Construirea i utilizarea testelor
psihologice", de M.Albu, Ed.Clusium, Cluj-Napoca,
1998
q = proporia de examinai care au rezolvat ceea ce nseamn c rezolvarea unuia va fi
fiecare item greit condiionat de rezolvarea altuia i nu vor
exista itemi care s se refere la acelai
aspect, astfel nct subiecii s rspund la ei
Coeficieni de fidelitate inter- n acelai mod.
evaluatori Este indicat ca procedura de
administrare a testului i a retestului sau a
Unele teste las examinatorului celor dou forme paralele ale testului s fie
aprecierea scorurilor, cum sunt testele identic i aceeai cu cea care se va utiliza n
proiective i testele de creativitate. Notarea practic.
poate fi un factor major pentru fidelitatea Care test va fi preferat dintr-o mulime
acestor instrumente, deci e necesar o de teste? Este indicat a se prefera testul care
fidelitate inter-evaluatori. Analiza fidelitii prezint o fidelitate mai mare., acceptnd
ntre evaluatori este o procedur foarte faptul c testul cel mai fidel este i cel mai
deschis. Un test este notat separat de doi scump sau mai dificil de administrat.
sau mai muli examinatori i scorurile pentru Este imposibil s se specifice un nivel
perechile de examinatori sunt apoi corelate minim care s fie impus coeficienilor de
(manualele testelor descriu experiena i fidelitate ai tuturor testelor, dar, n practica
antrenamentul cerut examinatorilor i apoi obinuit sunt utile urmtoarele recomandri:
prezint coeficientul de corelaie reprezentativ a) se vor cere nivele nalte de fidelitate
interscoruri). Fidelitatea ntre evaluatori testelor folosite pentru a se lua decizii
suplimenteaz fidelitatea estimrilor dar nu o importante asupra persoanelor, n selecia
nlocuiete; ar fi indicat s se foloseasc i profesional, i celor care mpart indivizii
testarea-retestarea sau alte tipuri de estimare n mai multe categorii pe baza unor
a fidelitii n notarea subiectiv a unor teste. diferene relativ mici ntre ei;
b) se vor accepta niveluri sczute de
OBSERVAII ASUPRA METODELOR fidelitate atunci cnd testele sunt utilizate
UTILIZATE PENTRU ESTIMAREA pentru a se lua decizii preliminare, i a
FIDELITII celor care mpart indivizii ntr-un numr
mic de categorii;
Alegerea metodei aplicate pentru c) dac un test servete la compararea
estimarea fidelitii trebuie s in seama de grupelor de persoane, coeficientul su de
ceea ce msoar testul, de scopul pentru care fidelitate poate fi cuprins ntre 0,6 i 0,7;
el va fi folosit i de condiiile concrete n care d) dac testul se folosete pentru
se poate face testarea. Experimentele compararea persoanelor coeficientul su
efectuate pentru determinarea valorii unui de fidelitate trebuie s fie mai mare de
coeficient de fidelitate nu cuprind ntreaga 0,85.
populaie cruia i este destinat testul ci doar n practic se ntlnesc coeficieni de fidelitate
un eantion din aceast populaie; n acest cuprini ntre 0,70 i 0,97,n funcie de ceea
sens este necesar ca eantionul s fie ct mai ce msoar testul.
voluminos, s fie reprezentativ pentru
populaia cruia i este destinat testul i
msurtorile realizate cu ajutorul testului s fie
independente ntre ele, adic msurtoarea
realizat asupra unui subiect s nu fie
influenat i nici s nu influeneze msurtorile
efectuate asupra altor persoane.
Atunci cnd calculul coeficientului de
fidelitate impune ca fiecare persoan s
rspund de dou ori la acelai test sau s
rspund la dou forme paralele ale aceluiai
test este indicat ca msurtorile efectuate
asupra aceleia i persoane s f ie
independente ntre ele. Dac se va calcula un
coeficient de consisten intern se va urmri
ca itemii testului s fie independeni ntre ei,
59
C.VALIDITATEA TESTELOR PSIHOLOGICE
validitate - definiie
validitatea relativ la coninutul su
validitatea relativ la criteriu
validitatea relativ la construct

Cum orice student la psihologie tie, "Dup ce un test este dat pentru uzulj
meritul unui test psihologic este determinant operaional, semnificaia interpretativ a
n primul rnd de coeficientul su de fidelitate rezultatelor sale poate continua n a fi rafinat,
i apoi de validitatea sa. n capitolul anterior mbogit prin acumularea gradual de,
am artat c gradul de fidelitate poate fi observaii clinice i prin proiecte speciale de
evaluat prin multe metode, evident diverse, cercetare. Validitatea testului e ceva viu; nul
variind de la metode de testare-retestare la este nensufleit i mblsmat atunci cndl
altele mult mai complexe de determinare a testul este transmis" (Anastasi, 1986).
consistenei interne. Totui, nelund n Un student a cutat s elaboreze o
considerare metoda folosit, aprecierea, n modalitate de msurare tip creion-hrtie al
mod invariabil, se reduce n ultim instan la timiditii. Studentul a parcurs paiil
o simpl statistic primar i anume corespunztori seleciei i a construirii unei,
coeficientul de fidelitate. n acest capitol este scale i apoi a ncercat s valideze
investigat o problem mai dificil i mai instrumentul su prin corelarea acestuia cui
complex a validitii i anume se face referire datele existente, cum ar fi cele 10 scale clinice
la ceea ce semnific scorul testului. de la MMPI. Din pcate, aceast nou scal
Validitatea unui test este gradul n de msurare numit "Indexul timiditii", s-a
care proba msoar ceea ce i-a propus s dovedit a avea o uimitor de mare legtur cu
msoare (ceea ce pretinde c msoar). Scala Depresiei MMPI (r=65) i nici o legtura
Psihometricenii tiu de mult timp c validitatea cu Scala Introversiei Sociale MMPI (r=08).
este trstura fundamental i cea mai Msurarea "timiditii" elaborat de acest
important a unui test. De fapt, validitatea student era aparent un index al inhibiiei
definete nelesul, semnificaia rezultatelor sociale i avea ca rezultat depresia. Este o
testului; gradul de fidelitate este de asemenea moral n aceast povestioar: trstura
foarte important, dar numai pn acolo unde msurat printr-un test dat este definit
oblig validitatea. n msura n care un test (descris, explicat) de cercetarea tiinific
este nesigur, nu prezint garanii, el nu poate ce valideaz testul, nu de ceea ce aplicatorul
fi valid. Putem exprima acest lucru dintr-o testului alege ca i instrument.
perspectiv alternativ: temeinicia, fidelitatea
este necesar dar nu este premergtoare VALIDITATEA - DEFINIIE
validitii.
Cei care proiecteaz testul au Vom ncepe cu o definiie a validitii
responsabilitatea de a demonstra c noile din lucrarea "Standards for educaional andl
instrumente servesc scopurile pentru care au psychological tests", 1985: "Un test este
fost proiectate. n orice caz, spre deosebire de valid n msura n care interferenele
fidelitatea testului, validitatea acestuia nu este deduse din el sunt potrivite, semnificative i
doar o simpl chestiune care este rezolvat folositoare".
uor n baza ctorva studii elementare, ci este Observai c scorul unui test luat cal
un proces n dezvoltare care ncepe cu atare nu prezint nici o semnificaie. Spre
construirea testului i continu cu dezvoltarea exemplu, cunoscnd c un subiect examinata
probei. obinut un scor ridicat la Scala Depresiei
MMPI nu este semnificativ; acest rezultai

60
devine valabil numai cnd examinatorul Concluziile trase dintr -un test valid sunt
deduce anumite trsturi comportamentale potrivite, semnificative i folositoare. Din acest
din el. Bazndu-se pe descoperirile existente, punct de vedere, este vizibil c practic orice
exam inatorul va putea concluziona c , studiu empiric care leag rezultatele unui test
"Scorul ridicat al depresiei sugereaz c cu alte descoperiri e o surs potenial de
examinatul are puin energie i are o viziune informaii despre validitate (Anastasi, 1986,
pesimist asupra vieii". Scala depresiei MMPI Messick, 1986)
are validitate psihometric n msura n care I
asemenea concluzii sunt potrivite, pline de VALIDITATEA RELATIV LA CONINUT
semnificaii i folositoare. SU
Din pcate, este rareori posibil s
rezumm validitatea unui test n termenii unei Validitatea relativ la coninutul su
singure inferene. Analiznd dac deduciile este determinat de gradul n care ntrebrile,
sunt potrivite, semnificative i folositoare, de sarcinile sau itemii testului sunt reprezentativi
obicei, se cer numeroase studii despre relaiile pentru universul comportamentului pe care
dintre performana testului i alte componente acel test a fost proiectat s l msoare
independent observate. ("Standards for educaional and psychological
Validitatea reflect o judecat tests", 1985).
evolutiv, bazat pe cercetare legat de ct Teoretic validitatea coninutului nu e
de bine un test msoar trstura pentru care nimic mai mult dect o problem de alegere
era proiectat s o msoare. (Bausell, 1986). Itemii unui test pot fi vzui ca
Deci, validitatea testelor nu este modele extrase dintr-o mulime de itemi
ancorat numai n rezultatele statistice poteniali care definesc ceea ce cercettorul
corecte, ci este caracterizat de o continu vrea ntr-adevr s msoare. Dac modelul
variaie de la "slab" la "acceptabil" i la (itemi specifici din test) este reprezentativ
"puternic". n funcie de obiectivele testrii se pentru mulime (toi itemii posibili), atunci
poate vorbi despre 3 tipuri de validitate: testul dobndete validitate n coninut.
^Validitate de coninut - content validity; Pentru analizarea acestui tip de
2)Validitate relativ la criteriu - criterion- validitate trebuie luat n considerare nu numai
related validity; 3) Validitate conceptual - coninutul itemilor testului ci i procesul utilizat
construct validity. de subiect pentru a ajunge la formularea
rspunsului (Silva, 1993).
Vom aborda aceast clasificare n cazul testelor de cunotine este
tripartit pe scurt, dar mai nti cteva adeseori posibil c specificm dinainte
atenionri. Folosirea acestor etichete nu universul relevant de comportamente. De ex.,
implic faptul c o procedur specific de n timp ce se desfoar un test avnd drept
validare este cea mai bun pentru folosirea
domeniu de coninut cunotinele de
unui test sau altuia:
ortografie, format din itemi cu alegere multipl,
examinatorul poate identifica aproape toate
"0 validare ideal include mai multe tipuri de
cuvintele posibile pe care elevii din clasa a
"indicaii", care sunt rspndite n toate cele
treia ar trebui s le tie. Validitatea
trei categorii tradiionale, mai multe surse de
coninutului unui astfel de test la clasa a lll-a
indicaii fiind mai bune dect puine. Oriict,
va fi asigurat, n parte dac cuvintele de la
calitatea indicaiei este de o importan
niveluri variate de dificultate ar fi alese la
fundamental i o singur linie de indicaie
ntmplare din aceast list preexistent.
sigur este preferat unor numeroase rnduri
Astfel, cnd evalum validitatea,
de calitate ndoielnic. Judecata profesional
specificarea rspunsului este de asemenea o
trebuie s ghideze deciziile cu privire la
parte important a definirii universului
formele de indicaii care sunt cele mai bune i
important de comportri, ntruct n testul
mai potrivite n scopurile intenionate ale anterior de ortografie putem verifica dac
testului i a altor alternative ale testrii" subiectul recunoate cuvintele scrise corect
("Standards for educaional and psychological din punct de vedere ortografic (itemii fiind cu
teste", 1985). alegere multipl), dar nu i dac acesta scrie
Putem rezuma aceste lucruri, corect dup dictare. Deci nu este suficient s
accentund faptul c validitatea este un se spun c testul evalueaz cunotinele de
concept unitar determinat de msura n care ortografie.
un test msoar cea ce pretinde s msoare.

61
E mult mai greu s asiguri validitatea proiecteaz testul afirm c "un grup de
coninutului cnd testul msoar o trstur experi au analizat atent specificrile din
definit insuficient, neclar. n aceste cazuri, domeniu i au fost de prere c ntrebrile
cnd trstura msurat este mai puin clar testului au validitate n coninut".
nici un proiectant de teste nu-i va propune s Exemplul urmtor va descrie un model
construiasc universul precis al potenialilor de evaluare a itemilor pentru determinarea
itemi ai testului. n schimb, ceea ce de obicei validitii coninutului unor ntrebri ale
trece ca validitate relativ la coninut este testului.
opinia chibzuit a specialitilor. n fapt cel ce

Figura 9
Examinator: Data

V rugm citii cu atenie specificrile din domeniu pentru acest test. Apoi, v rugm s identificai
ct mai bine credei c reflect fiecare item specificrile din domeniu. Analizai un item n parte n
baza legturii dintre coninutul su i coninutul definit de specificaiile din domeniu. Folosii scala
notat cu 4 puncte de mai jos:
1 2 3 4
nerelevant oarecum relevant destul de relevant foarte relevant

Determinarea cantitativ a validitii


coninutului
A B

Lavoche (1975), Martuza (1977) i alii


au analizat metodele statistice pentru C D
determinarea validitii relative la coninutul
unui test. Aceste metode i tehnici de analiz
tind s se perfecioneze ele nefiind acceptate
nc de o amre parte dintre specialiti; totui, Figura 10
aceste abordri pot servi drept model pentru Celula D este unica celul care reflect
un punct de vedere plin de bun sim asupra acordul dintre cei 2 evaluatori. Celelalte celule
unui acord interexaminatori ca baz pentru arat un dezacord -celulele B i C- sau
validitatea coninutului. acordul c un item nu aparine testului -C i
Cnd doi experi apreciaz itemii .A- (am reprodus rezultate ipotetice pentru un
individuali ai testului dup scala n 4 test de 100 itemi, redate n figura. 11).
dimensiuni propus n figura 9, notarea Validitatea relativ a coninutului poate
fiecrui specialist pentru fiecare item poate fi fi derivat din urmtoarea formul:
dihotomizat n: relevana slab (notarea 1 Valid. Coninut = D/(A+B+C+D)
sau 2) sau n relevan puternic (3 sau 4). De exemplu, n testul nostru de 100 de
Pentru fiecare item, notrile comune ale celor secvene, amndoi evaluatori au fost de acord
doi analiti pot fi incluse ntr-un acord ntre c 87 itemi sunt puternic relevani (CD.),
evaluatori, dou cte dou la fel ca n astfel c coeficientul pentru validitatea
figura. 10.( Acordul ntre evaluatori n condiiile coninutului ar fi 87/(4+4+5+87) sau 0,87.
estimrii validitii) De exemplu, dac Dac sunt mai mult de 2 evaluatori, procedura
amndoi evaluatorii au notat un item cu de calcul poate fi completat cu toate
puternic relevant, rspunsul va fi plasat n combinrile perechi ale evaluatorilor i notat
celula D. Dac primul evaluator crede c un media. Se impune observaia c un
item este foarte relevant, dar cel de-al doilea asemenea coeficient nu stabilete singur
evaluator l noteaz cu uor relevant, itemul validitatea unui test.
va fi plasat n celula B. Abordarea validitii relativ la coninut
prezentat aici servete bine ca un mecanism
util proiectanilor de teste pentru a elimina
62
acei itemi care nu se refer la comportamente utilizeaz testul pot s nu fie satisfcui i s
cuprinse n domeniul de coninut, iar pentru se ndoiasc de valoarea sa psihologic.
itemii rmai se identific zonele domeniului Totui, validitatea de aspect nu trebuie
de coninut pe care le msoar fiind indicat ca confundat cu validitatea obiectiv, care este
la aceast operaie s participe ct mai muli determinat de relaia dintre scorul, rezultatele
experi. Un test poate avea un coeficient mare testului i celelalte surse de informa ie. De
al variabilitii coninutului i totui poate fi fapt, un test poate poseda o foarte puternic
insuficient sub alte aspecte. Determinarea v alidit at e a as pect ului - it em ii pot ap rea
cantitativ a validitii coninutului nu se foarte relevani pentru ceea ce se pretinde c
substituie doar seleciei atente a itemilor, se se msoar - totui d rezultate
realizeaz n final compararea structurii nesemnificative fr utilitate predictiv.
testului cu structura domeniului de coninut.
Se verific dac sunt acoperite toate zonele Validitatea testului relativ la un crit eriu
domeniului de coninut i dac itemii sunt
prezentai proporional cu m rimea i Validit at ea relat iv la c rit eriu e
importana zonelor. demonstrat atunci cnd un test se arat a fi
util n estimarea performanei unui subiect
4 itemi 5 itemi examinat pe o dimensiune oarecare; n acest
context variabila interesului principal este
msura rezultat, numit criteriu. Rezultatul
4 itemi 87 itemi este folositor numai c t se dovedete a fi o
baz pentru predicia corect, precis a unui
criteriu. Spre exemplu, examenul de intrare la
liceu care este destul de precis n a face o
Figura 11 predicie asupra mediei ulterioare a
examinailor, va avea validitate relativ la
criteriu. Pentru fiecare dintre criteriile utilizate
Face vadiiity = Validitate de aspect la v al i da re es t e n e c e s ar c a n m a nu al u l
testului s se explice motivele alegerii sale i
Aprecierea general privind validitatea s i se fac o descriere amnunit
estului relativ la coninutul su este destul ("Standards for educaional and psychological
subiectiv. Operaiile cuprinse sub tests" din 1985).
denumirea de "validarea testului relativ la Exist dou strategii utilizate n mod
coninutul su" nu reprezint o validare n obinuit pentru aprecierea validitii relative la
sensul definiiei date de "Standards for criteriu a testelor: validarea concurent i
educaional and psychological tests" din 1985; validarea predictiv.
ele realizeaz doar analiza testului n privina validarea conc urent se aplic ndeosebi
claritii, a reprezentativitii i a relevanei pent ru t es t ele ut iliz at e la ob inere a unor
oninutului su. licene sau diplome care msoar cunotinele
s au dep rinde rile p ers oanelo r s au pent ru
Vom vorbi foarte pe scurt despre t e s t e l e c a r e s e rv e s c l a s t a b i l i r e a u n u i
validitatea de aspect care nu este nici pe diagnostic clinic. Acest tip de validitate se
departe o form a validitii. Totui conceptul cerceteaz atunci cnd se dorete s se
este ntlnit n testare i de aceea se impune cunoasc n ce msur scorurile testului
o explicare pe scurt a acestuia. est im eaz pozi iile ocupat e n prez ent de
Un test prezint validitate de aspect ctre subiec i la un criteriu relevant. De
dac pare valid pentru cei ce l folosesc, exemplu pentru un test de depresie validitatea
examinatorii i n special pentru cei examinai. concurent ofer informaii despre gradul de
Validitatea de aspect este o problem cu coinciden dintre concluziile desprinse din
caracter acceptabil din punct de vedere social interpretarea scorurilor testului i prerile
i nu o form tehnic de validitate din aceiai psihologilor clinicieni relative la aceti indivizi.
categorie cu validitatea relativ la coninut, la validarea predictiv se aplic atunci cnd
criteriu i la construct. (Nevo, 1985). scorurile testului sunt folosite pentru a prezice
Dintr-un punct de vedere al relaiilor valorile pe care o anumit variabil le va avea
publice, este foarte important ca testele s ntr-un viitor mai mult sau mai puin apropiat.
aib validitate de aspect, altfel cei care Asemenea teste se utilizeaz de obicei pentru
63
admiterea la licee sau la selecia profesional. media notelor pentru un eantiol
estimare
Validitatea predictiv se cerceteaz folosind reprezentativ de elevi. Coeficientul de
regresie i
loturi neselecionate, iar atunci cnd testul va corelaie rezultat este numit coeficientul de
fi utilizat pentru a face predicii este necesar validitate.
ca alturi de coeficientul de validitate al Limita maxim teoretic a e derivatei
testului s se determine i ecuaia de coeficientului de validitate este constrns de n
regresie. Cnd testele utilizate In scopuri gradul de fidelitate al testului i a criteriului corelaie
predictive, e necesar s desfurm o ecuaie este abai
de regresie. O ecuaie de regresie descrie cea xy Indic-'. E
mai potrivit cale pentru a estima criteriul unui ntrebare
test. Nu vom discuta abordrile satistice Coeficientul de validitate este prezis u
privind dreapta corespunztoare, menionnd ntotdeauna mai mic sau egal dect rdcina rezultatei?
totui c ea minimizeaz suma deviaiilor ptrat a coeficientului de fidelitate al testului Pr* a
ptrate de la linie (Ghiselli, Campbell & nmulit cu coeficientul de fidelitate al vaiori
Zedeck, 1981). Pentru scopuri curente, e mai criteriului. Cu alte cuvinte, n msura n care
important s nelegem natura i funcia fidelitatea testului sau a criteriului (sau a exist ar
ecuaiei de regresie. ambelor) e mic, coeficientul de validitate este) de pentru o
Valoarea criteriului = f (scor la test) asemenea redus. test s se
Aceasta permite s se estimeze I+btO+0,9
rezultatul pe care l va obine fiecare Coeficientul de validitate i eroareal
validitate
persoan, cunoscnd scorul su la test. De standard a estimrii eroarea st
exemplu dac relaia dintre media de iar predic
absolvire a facultii F i media obinut la Huli a mas precis
admiterea ia facuitate A poate fi scris sub impus condiia ca Ce
forma: un test s fie unei predi
F = 0,3+0,9 A, utilizat n practic doar dac are un coeficient de rspundern
atunci este de ateptat ca persoana validitate mai mare dect 0,45. Aceast cerin nelege d
care a fost admis cu media 9 s termine este ns greu de realizat. Un test bun rareori unei predic
facultatea cu F = 0,3+0,9x9 = 8,4 poate da , cu un criteriu important, un coeficient de valoare
Fiecare din aceste dou perspective de corelaie mai mare de 0,5. n experiena trebuie s i
se utilizeaz n diferite situaii de testare, care obinuit, valoarea coeficientului de validitate al teoriei deci
vor fi discutate n cele ce urmeaz. n orice testelor utilizate pentru a face predicii este
caz, nainte s a n alizm validitatea cuprins ntre 0 i 0,60, n majoritatea cazurilor Teoria
concurent i validitatea predictiv, s situndu-se n partea inferioar a intervalului. rezult
examinm o ntrebare mult mai important: Relaia dintre scorul testului i msurile
Care sunt caracteristicile unui bun criteriu ? criteriului pot fi estimate n feluri diferite. Poate cea Sus
Alegerea criteriului este circumscris n mai popular abordare e s calculm corelaia accentueaz
parte, de ingeniozitatea celui ce face testul. liniar dintre test i criteriu (rxy). Corelaia psihologic
Totui, criteriile trebuie s fie mult mai mult rezultat e cunoscut ca i coeficient de msurarea
dect imaginative; trebuie s fie sigure, validitate. Cu ct coeficientul.de validitate are personaiuk
demne de ncredere, potrivite i s nu fie valoare mai mare, cu att mai precis este testul angajeze, f
influenate de testul nsui. Criteriul nsui n a prezice criteriul. n cazul ipotetic cnd ie s a< t
trebuie s fie sigur dac este un index rxy=100, testul va avea validitate perfect i considerai
folositor a ceea ce testul msoar. Dac ne permite predicie fr greeal. Bineneles, un nainte de
amintim sensul conceptului de "fidelitate" - asemenea test nu exist i coeficientul de care pacien
consistena rezultatelor - necesitatea validitate e de obicei ia un nivel sczut sau mediu Reia
msurrii unui criteriu fidel este evident; n al corelaiei i rareori depesc valoarea de 0.08. a deciziei
cele din urm, nefiabil nseamn nepredictibil. Dar ct de ridicat trebuie s fie coeficientul de contextul st
Un criteriu care nu e fidel va fi impredictibil, validitate ? Nu e un rspuns general variabil la aceste stuc
fr a lua n considerare meritele testului. aceast ntrebare. Putem totui aborda pentru a c
S lum cazul n care rezultatele la ntrebarea indirect, investignd relaia dintre reueasc s
examenul de intrare la liceu sunt folosite coeficientul de validitate i eroarea standard de criteriu, as
p ent ru a p re zi ce me di a u lte ri o a r a estimare. examinai c
rezultatelor (criteriul). Validitatea examenului Eroarea standard de estimare ~ le nre
de admitere poate fi studiat prin calcularea reprezint marginea superioar a erorii de itere, ar
corelaiei (rxy) dintre rezultatele examenului i ; raiune
64
rxy eprin
estimare a valorilor criteriului coeficientul
ecuaia de
de selecia sau cei ce angajeaz personal cer ca
regresie liniar. Eroarea standard de estimare ay cei ce sunt nscrii s obin un scor minim la
un examen de admitere sau de angajare -
studii anterioare referitoare la validitate pot fi
citate pentru a arta c acei candidai care au
In aceast formul, obinut rezultate sub o anumit limit au
corelaie liniar dintre test i criteriu, iar ntmpinat mari greuti ca elevi sau angajai.
este abaterea standard a valorilor criteriului. Testele psihologice joac un rol major
Indicele ESesl ajut ia gsirea rspunsului la o n luarea unor astfel de decizii. Intr-o instituie
ntrebare important. "Ct de precis poate fi un comitet - sau o singur persoan - ia un
prezis un criteriu de performan dup numr de decizii comparabile bazate pe
rezultatele iestului ?" rezultatele unuia sau mai multor teste de
Presupunnd c repartiia de frecvene a selecie. Pentru a prezenta conceptele cheie
valorilor criteriului urmeaz ecuaia de aie teoriei deciziei, s simplificm mai nti i
r
r8g es:e a criteriului c fa de test t: c = a + bt, s presupunem c e vorba doar de un singur
;
.; anse de 95% ca valoarea criteriului test.
pentru o persoan care a obinut scorul tO ia Chiar dac rezultatele obinute la teste
test s se arie n intervalul: ( a+btO-1,96 ESes;, sunt varietate este posibil s identificm un
B+btQ+0,96 ESest). Cu ct coeficientul de scor "admis/respins" care divide eationul n
validitate ai testului este mai mare cu att cei ce se presupune c vor avea succes i cei
eroarea standard de estimare este mai mic, care nu vor face fa, aceasta, n funcie de
iar predicia realizat cu ajutorul testului este criteriul ce ne intereseaz. S presupunem c
mai precis. persoanele de care spunem c vor avea
Ce nseamn un standard acceptabil a succes suni selectate pentru angajare sau
unei predicii corecte ? Nu este simplu s admitere. n acest caz, proporia persoanelor
rspundem la aceast ntrebare. Cum se va n grupul prezis cu succes reprezint ceea ce
nelege din cele ce urmeaz, standardele se numete proporia seleciei - selection
unei predicii corecte sunt, n parte, judeci ratio. Proporia seleciei poate varia ntre 0 i
de valoare. S examinm de ce este aa, 1.0, depinznd de proporia persoanelor care
' lie s introducem noiunile elementare ale
sunt foarte sigure de a avea succes, luat
teoriei deciziei.
fiind n considerare msura criteriului.
Dac rezultatele unui test de selecie
Teoria deciziei aplicat n estimarea
permit simpla dihotomie n cei ce sunt prezii
rezultatului fa testele psihologice
c vor avea succes i cei care nu vor avea
succes, atunci rezultatul ulterior dup
Susintorii teoriei deciziei
msurarea criteriului va putea fi de asemenea
accentueaz faptul c scopul testului
mprit n dou categorii: "au avut succes" i
psihologic nu este msurarea ca atare, ci
"nu au avut succes". Din acest punct de
msurarea n scopul lurii deciziei: directorul
vedere fiecare studiu despre validitatea
personalului dorete s tie pe cine s
predictiv produce o matrice ca n figura 12:
angajeze, funcionarul trebuie s aleag pe
cine s admit, s tie ce criminali sunt
Figura 12
considerai periculoi n cazul unor eliberri
nainte de termen iar psihiatrul trebuie s tie Predicia corect Falii pozitivi
care pacieni necesit internare.
Relaia dintre test i procesul de luare
a deciziei este ce! mai bine observat n
contextul studiilor despre validare. Multe din
aceste studii utilizeaz rezultatele testelor
pentru a determina cine este posibil s
Falii negativi Predicia corect
reueasc sau s nu reueasc, n funcie de
criteriu, astfe! nct, n viitor, subiecii
examinai care au obinut rezultate mici ia
testele predictive pot fi elimina i de ia
Idmitere, angajare sau alte privilegii. Aceasta
este raiunea prin care cei ce realizeaz

65
procentul falilor pozitivi (studeni admii care
Anumite combinaii de rezultate ulterior nu au reuit) se nal brusc. Cum se
prezise sau actuale sunt mult mai probabile calculeaz costul falilor pozitivi? Costul
dect altele. Dac un test are validitate financiar poate fi estimat - de ex, consilierii i
predictiv bun, majoritatea persoanelor dedic un anumit timp (contra cost) consiliind
anticipate s aib succes vor avea succes i aceti studeni. Dar nici o singur scal de
majoritatea persoanelor ateptate s nu aib utilitate nu poate cuprinde diversele
reuit vor fi sub ateptri. consecine cum ar fi trebuina pentru remedii
Acestea sunt exemple de predicii corective (care cer bani), creterea cinismului
corecte i servesc la susinerea validitii unui facultii (o problem de moral) dar i
instrument de selecie. Rezultatele din aceste speranele mrite ale studenilor indui n
dou celule, se spune despre ele c sunt eroare (a cror descurajare va afecta opinia
atinse pentru c testul a fcut o predicie public (percepia public / din universitate i
corect. chiar rezerva statului). Noiunile pure statistice
Dar nici un test de selecie nu este un despre teoria deciziei simplific influenele
prezictor perfect, aa c alte dou tipuri de complexe care determin "utilitatea" n lumea
rezultate pot apare. Unele persoane ce sunt real.
presupuse c vor avea succes vor fi sub
ateptri -> pozitivi fali. Alte persoane care Tabelele Taylor-Russell
sunt ateptate s nu aib succes, dac li se
ofer o ans, pot reui ->fali negativi. Falii n cadrul teoriei deciziei, trebuie s
pozitivi i falii negativi sunt cunoscui ca descriem tabelele speciale publicate de Taylor
eecuri, pentru c n ambele cazuri testul a i Russeli (1939), care permit unui utilizator de
fcut o predicie greit. In final, proporia teste s determine proporia ateptat a
succeselor este proporia cazurilor n care aplicanilor ce vor avea succes, selectai cu
testul a prezis corect succesul sau insuccesul, ajutorul testului. Din motive evidente, aceste
ceea ce nsemn c proporia succeselor = ghiduri sunt numite tabelele lui Taylor-Russell.
succes/(succese+eecuri). Pentru a folosi aceste tabele, cel care
Falii pozitivi i negativi nu pot fi evitai testeaz trebuie s specifice: 1) validitatea
n realitate cnd folosim teste de selecie. predictiv a testului 2) proporia seleciei i 3)
Singurul mod de a elimina astfel de erori de raportul de baz al apiicanilor cu succes. 0
selecie ar fi s construim un test perfect, un schimbare a oricror din aceti factori va
instrument care s aib coeficientul de altera corectitudinea seleciei aceluiai test.
validitate de 1.00, semnificnd o corelaie Validitatea predictiv a unui test e de
perfect cu msura criteriului. Un test perfect obicei cunoscut din alte studii anterioare i
este teoretic posibil, dar nu s-a gsit nc unul const n rxy, corelaia dintre test i criteriu.
n realitate. Totui, e important s proiectm Proporia seleciei este procentul aplicanilor
teste de selecie cu validitate predictiv mare, ce sunt selectai (de observat, pentru c sunt
ca s minimizm erorile de decizie (chiar anticipai ca avnd succes). Proporia de baz
dac e posibil s proiectm un test cu -the base rate- este proporia aplicaniior cu
validitate aproape perfect, costul produciei succes care sunt selectai prin metode
unui astfel de instrument ar fi uimitor; conform curente, fr vreun nou test (n cazuri
teoriei deciziei, costul testrii trebuie evaluat extreme, proporia de baz e proporia
cnd apreciem utilitatea unui test de selecie). aplicanilor cu succes care vor fi alei la
Aplicarea teoriei deciziei este un ntmplare fr vreo procedur de selecie
proces complex i complicat n primul rnd din special). Cnd aceste trei aspecte sunt
cauza dificultilor de a gsi o scal de utilitate cunoscute, tabelele Tayior i Russe! sunt
pentru fiecare rezultat. S lum n considerare consultate pentru a stabili proporiile
situaia grea a celui care face selecia la succeselor ateptate prin aplicarea testului. n
admitere ntr-o universitate mare. Dac acest mod, utilizatorul testului poate
raportul seleciei este foarte strict, majoritatea determina msura n care folosind un nou test
studenilor admii vor avea succes. Dar unii va mbunti selecia proporiei de baz
studeni neadmii ar fi putut avea succes, de obinute prin metodele deja existente.
asemenea i ajutorul lor financiar pentru Poate c un exemplu va clarifica
universitate (taxe colare) este astfel pierdut. modul de aplicare al tabelelor Taylor-Russell.
Totui, dac selecia este prea blnd, atunci
66
f Sursa:Gregory,1996
proporia seleciei este foarte strict, de ex.
Presupunem c proporia de baz .05 adic doar 5% din aplicanii sunt acceptai
pentru aplicanii cu succes e de .60, adic i astfel selectai. Lund n considerare astfel
60% din aplicanii acceptai prin metode de presupuneri, proporia anticipat a
curent folosite s-au dovedit a reui. succeselor prin folosirea testului este de .75,
Presupunem de asemenea, c proporia respectiv o mbuntire cu 15% peste
seleciei este .50, adic de 50% din aplicani proporia de baz de .60.
sunt selectai. S presupunem apoi c un nou
test are un coeficient de validitate de .40, Validitatea testului relativ ia construcii!
ceea ce specific corelaia dintre rezultatele msurat de acesta
testului i criteriu. Avnd In vedere toate
aceste presupuneri, tabelele Taylor - Russeli Ultimul tip de validitate discutat aici
furnizeaz proporiile anticipate ale succeselor este validitatea de construct i probabil i cea
prin folosirea noului test. Proporia ateptat a mai discutat. Un construct este teoretic, o
succeselor este n acest caz de .73, o calitate abstract sau o trstur teoretic prin
substanial mbuntire fa de proporia de care indivizii difer (Messick, 1989). Ex.:
baz de .60 pentru selecie cu succes. abilitatea de a fi lider, ostilitate controlat,
S lum cazul unui test cu validitate de depresia, inteligena. Observm c aceste
k .20, ceea ce nu este prea mult, deoarece constructe sunt deduse din comportament,
pentru majoritatea testelor coeficientul de dar reprezint mai mult dect nsui
validitate este mult mai mare. Presupunem o comportamentul. Un test destinat s msoare
proporie a seleciei cu succes de .60, ceea ce un construct trebuie s estimeze existena
este norma! pentru multe forme de unei caracteristici fundamentale dar ascunse.
selecie a mult, personalului; mai
presupunem ca
67
Validitatea relativ ia construct se testului, pentru a deduce posibilele
aplic n cazul testelor care msoar consecine negative ale utilizrii testului,
constructe psihologice cum sunt chestionarele pe un termen scurt i pe perioade mai
de personalitate. Ea face ape! ia diferite teorii ndelungate.
psihologice pentru a verifica, n primul rnd
dac se refer ia constructui pe care trebuie Vom analiza aceste aspecte aie validitii de
s l msoare i apoi dac scorurile obinute construct n cele ce urmeaz.
de subieci ia test reflect corect mrimea Dac un test msoar un singur
acestui construct ia persoanele respective. construct, atunci itemii componeni trebuie s
Dei validarea de construct a unui test fie omogeni (n majoritatea cazurilor
este un proces lung si complex, procedurile omogenitatea testului se constat n timpul
diverse sunt destinate s rspund la o procesului de proiectare). Scopul proiectrii
singur ntrebare: bazndu-se pe nelegerea testului este s selectm itemii care formeaz
teoretic curent despre constructui pe care o scal omogen.
testul dorete s-l msoare, vom putea Cea mai folosit metod pentru a face
determina natura relaiilor cu ajutorul criteriilor acest lucru este s corelm fiecare potenial
pe care ie prezice teoria ? item cu scorul i s selectm acel itemi care
Cum este posibil ca cel care prezint grad de corelaie mai mare cu scorul
proiecteaz testul s determine dac noul total.
instrument posed validitate de construct ? O procedur asemntoare este s
Cum am menionat anterior nu exist o corelm subtestele cu scorul total n primele I
singur procedur care s fie suficient pentru faze ale procesului de proiectare. Astfel,
realizarea acestei dificile sarcini. Validitatea aceste scale care nu au un grad minim de
relativ la construct impune analizarea tetului corelaie cu scorul total ai testului pot fi
din mai multe puncte de vedere i prin metode revizuite nainte ca instrumentul s fie dat
diferite. Un algoritm posibil al validrii relative pentru utilizare. Omogenitatea e o prim
ia construct, valabil pentru toate msurtorile treapt important n a certifica validitatea de
psihologice i educaionale, inclusiv pentru construct a unui test, dar ca singur dovad
evalurile performanei, const n urmtorii nu e suficient.
pai (Gregory, 1996): Multe constructe pot prezenta i
" se cerceteaz ct de relevant i schimbri regulate n funcie de vrst,
reprezentativ este coninutul testului ncepnd cu copilria mic pn la maturitate I
pentru constructui care trebuie msurat, i i chiar i dup aceea. S lum spre exemplu J
dac itemii testului sau prile sale constructui referitor la cunotinele de
prezint omogenitate i msoar un singur vocabular. E cunoscut nc de ia nceputul
construct; secolului cnd au luat natere testele de
analizarea consecvenei rspunsurilor la inteligen c vocabularul unui copil se
itemii testului; dezvolt mult de ia copilria mic ia copilria j
se urmrete dac structura scorului la mare. Studii recente demonstreaz c
test reflect structura domeniului vocabularul continu s se dezvolte, chiar I
constructului msurat - adesea n acest dac ntr-un ritm mai ncet, ia vrsta matur
scop se utilizeaz metoda analizei (Gregory, 1990). Pentru orice test de
factoriale; vocabular, o dovad important pentru
o se estimeaz n ce msur concluziile validitatea de construct este c rezultatele
desprinse pn la acest pas a! algoritmului celor mai n vrst sunt mai bune dect ale
de validare pot fi generalizate, adic pot fi celor tineri, presupunnd c factorii de |
extinse asupra altor populaii sau altor educaie i sntate sunt meninui constani.
ocazii de examinare cu ajutorul testului; Un mod de a susine validitatea unui j
se cerceteaz relaiile dintre scorurile nou instrument este s artm c, n medie,
testului i diverse alte msurtori persoane din diferite medii i cu anumite
psihologice sau observaii non-evaluative trsturi obin rezultate ia test ce corespund!
asupra comportamentului, aceast cu teroiile. Persoanele de ia care se ateapt!
verificare este denumit validare s obin rezultate mari ia testele ce msoar!
convergent i discriminant; un anumit construct vor obine scoruri mari, iar
se analizeaz interpretrile propuse pentru persoanele cu un nivel sczut n ceea ce
scorurile testului i sursele de invaliditate a
68
Bvee construcii! respectiv vor obine Fiecare din cei 1b itemi e punctat cu 1 dac
Kultate mici. este aleas trstura legat de interesu!
CrandaS! (1931) a elaborat o scal a sociai, dac nu se puncteaz 0. Rezultatul
r
Hreseicr sociale (inspirndu-se de a Aif ed total pe scala Interesului Social (IS) poate
Her Crandall (1984) a definit interesu! social varia de ia 0 la 15. Tabelul 5 prezint
u n " " om- P de alii". Pentru rezultatele medii pe scala
msura acest construct, e! a nscocit un interesului
HnpSu instrument constnd n 15 itemi cu soci pentru 13 grupuri cie
f alegere obligatorie forced - choice items. subieci. Vei al iobserva c indivizii care
Pentru fiecare item, una din cele dou etaleaz interese sociale (ex. clugriele)
prnative include o trstur apropiat de obin rezultatele cele mai mari pe scal, iar
Biceptu! adlerian a! interesului sociai (ex. rezultatele cele mai mici Se obin presupusele
util, de mare ajutor), n timp ce cealalt persoane egocentrice (ce ex. modelele),
alegere const ntr- precum i cei cu comportament antisocial
o trstur minte), (criminalii). Aceste aspecte sunt compatibile
nonsocial dar s aleaq "trstura oe cu teoriile noastre i susin validitatea de
ia fel de atractiv (ex.: ager la construct a acestui interesant instrument.
libii
estimeaz ca avnd valoare mai mare

O alt etap a validrii relative la


construct e s artm c scorurile testelor se
schimb n direcii corespunztoare crescnd Un test are validitate convergent dac
reaciile la intervenii planificate sau nu. De msoar ceea ce evalueaz i alte teste sau
r L
ex., o ~- 'e unor persoane n vrst la o variabile care se refer la acelai construc,
baterie de teste de orientare n spaiu ar trebui adic ntre scorurile sale i rezultatele
s creasc dup ce subiecii vor primii respectivelor msurtori exist o relaie
informaii i se vor antrena n mod special funcional monoton - liniar sau nu. De
pentru a-i mbuntii deprinderile de exemplu, dou teste proiectate s msoare
orientare n spaiu. Mai precis, dac bateria de diferite tipuri de inteligen ar trebui s
teste posed validitate de construct, putem mpart n mod egal factorul generai de
preciza c rezultatele orientrii n spaiu vor inteligen pentru a realiza o corelaie
crete de la nivelul celei dinaintea testrii la puternic atunci cnd sunt administrate
cel de cup testare. mpreun la un grup heterogen de subieci.
De fapt, orice nou test de inteligen
d a c n u se co rel e a z ct d e c t cu
msurtorile existente va fi destul de suspect,

60

u posed "trsturi multiple-metode multiple" (multitraia


convergent. p multimethod matrix) i evalueaz dou sal
e fondui mai multe caracteristici prin dou sai 1 mi
c nver Un multe metode. Tabelul 3 furnizeaz uri ex.
test are validitate disc dac ipotetic a! acestei abordri. n acest exemplu!
evalueaz altceva dect diverse teste sau trei trsturi sau constructe (A, B i C) sunt
variabile despre care se tie c se refer Sa msurate prin trei metode (1, 2 i 3). De ex.,
constructe ce nu au legtur cu constructui A, B i C pot fi interes social, creativitate i;
msurat de test. Spre exemplu, interesul dominan. Metodele 1, 2 i 3 pot fi un
social i inteligena nu sunt nrudite teoretic, inventar despre sine, test de creativitate i un
iar testele acestor constructe ar trebui s se test proiectiv. At va reprezenta un inventai]
coreleze ntr-o mic msur. despre sine a interesului social, B2 un mod de
ntr-o lucrare clasic, des citat, dar notare a creativitii, iar C3 o trstur
rareori ntrecut, Campbell i Fiske (1959) au dominant derivat din testul proectiv amd.
propus un proiect sistematic experimentai
pentru confirmarea simultan a validitii
convergente i discriminante a unui test
psihologic. Proiectul lor e numit matricea

pozitive, aa cum sunt i n tabelul nostru.


In acest exemplu se observ c fiecare
din cele 3 constructe sunt msurate prin 3
metode. Cnd fiecare din aceste 3 teste sunt
administrate de 2 ori ia acest grup de subieci
iar rezultatele la toate predicilie de teste sunt
corelate, se obine o matrice "trsturi
multiple-metode multiple". Aceast matrice
constituie o surs bogat de informaie despre
fidelitate, validitate convergent l divergent.
Vaioriie notate pe diagonala principal sunt
coeficieni de fidelitate ai testelor obinui prin
metoda formelor paralele. De exemplu
metode pentru
de fidelitate sunt .93
pentru constructui A, .94 pentru constructui B,
.84 pentru constructui C. Valorile de pe
diagonalele celorlalte csue sunt coeficieni
de corelaie ntre msurtorile realizate de
cele trei metode pentru aceleai constructe i
servesc ia verificarea
Aceste corelaii validitii convergente.
ar trebui sa tie puternice
Celelalte valori din tabel se calcula pe lng coeficientul de corelaie
coeficienii de corelaie reprezint dintre test i coeficientul de corelaie dini
constructe msurate prin aceeai diferitaj
1r,ica metod constructeie msurate. ntruct coeficienii da
diferitele trsturi msurate prin metodj fidelitate iau valori subunitare, corelaia
diferite. Aceste coreiaii ar trebui s fie cele trsturilor este, n valoare absolut, mai
mai mici din matrice dar, ntratt nct s mare dect valoarea absolut a coeficieni
susin dovada validitii discriminatorii. de corelaie ai scorurilor observate. Dac sfl
n exemplul prezentat validitatea obine un coeficientul de corelaie mare ntre
convergent i discriminant a metodelor 1,2, dou trsturi care teoretic nu au nimic n
3, a fost uor de dedus, dar n practic ap; comun, atunci validitatea discriminant i
situaii complexe greu de interpretat. Pentr testului este necorespunztoare.
aprecierea validitii discriminante este indicai a
70
mai Validarea convergent a unui test este 1. existena dovezilor privitoare la validitatea
necesar dar nu i suficient pentru a dovedi relativ la construct (ex.'.validitatea
c testul msoar ceea ce dorete. Analiza convergent i discriminant potrivit);
factoriala sau analiza de clusteri efectuat 2. o analiz a consecinelor valorice a
asupra itemilor din testele cu aceeai interpretrii testului;
denumire poate ajuta la explicarea corelaiilor 3. dovezi ale utilitii testului n anumite
dintre scorurile testelor. aplicaii;
4. aprecieri, incluznd efectele secundare,
Analiza factoriala rezultate n urma folosirii testului.
Aceste patru baze pot fi combinate
Analiza factoriala e o tehnic statistic dou cte dou, obinndu-se o matrice care
special care e folosit pentru investigarea evideniaz bazele analizei testului raportat la
validitii de construct . Vom discuta despre interpretare i a utilizrii acestuia (figura 4).
analiza factoriala mai n amnunt la tema Un test valid rspunde bine la toate faetele
"Evaluarea aptitudinilor". Aici vom prezenta pe validitii testului.
scurt astfel nct cititorul s poat aprecia rolul Aceast concepie privitoare la
analizei factoriale n studiul validitii de validitatea testului este controversat, muli
construct. Scopul analizei factoriale este s teoreticieni prefernd perspectiva
identifice numrul minim al determinanilor tradiionalist. Trebuie s fim totui de acord
(factorilor) necesari pentru a lua n c: msurarea psihologic nu este un proces
considerare intercorelaiile n cadrul unei neutru, ea este o tiin aplicat care are loc
baterii de teste. inta n analiza factoriala este ntr-un context politic i social.
s gsim un set de dimensiuni, anumii factori,
care pot fi luai n considerare pentru mulimea
observat a interrelaiilor dintre testele
individuale. O abordare particular n analiza
factoriala este s administrm o baterie de
teste ctorva sute de subieci, apoi s
calculm matricea corelailor pe baza
rezultatelor testului pe toate perechile posibile
de teste. De exemplu, dac 15 teste au fost
administrate unui eantion de pacieni de la
psihiatrie i neurologie, primul pas n analiza
factoriala este s calculm corelaiile dintre
scoruri pe toate cele 105 perechi posibile de
teste (formula general pentru numrul
perechilor n cadrul a N teste este N(N-1)/2.
Astfel dac avem 15 teste, vor exista
15 x 14 : 2 sau 105 posibile perechi de teste
individuale). Din nefericire, se ntmpl des ca
acea cantitate de informaii pe care o gsim
ntr-o matrice de corelaie s fie pur i simplu
prea complex pentru ca ochiul neajutorat al
omului s o analizeze efectiv; din fericire,
ajutorul computerului n analiza factoriala este
major.
Un test este valid dac msoar
trstura ce i-a propus s o msoare.
Recent, mai muli psihometricieni au
introdus o definiie mai larg, funcionalist a
validitii care susine c un test este valid
dac servete scopului pentru care este folosit
(Messicke, 1980). Messick este de prere c
noua concepie, mai larg asupra validitii se
susine pe patru baze. Acesta sunt:

71
BIBLIOGRAFIE

Aiken L, "Psychological Testing Assessment", Allyn & Bacon, Massachusetts, 1994


Aibu M., "Construirea i utilizarea testelor psihologice", Ed. Clussium, Cluj-Napoca, 1998
Albu M., Pitariu H. "Psihologia personalului-msurarea i interpretarea diferenelor individuale", Ed
Presa Universitar Clujan, Cluj-Napoca, 1996
Anastasi A., "Psychological testing", New york, Macmilan, 1955
Clocotici V., Stan A., "Statistic aplicat n psihologie", Ed. Polirom, lai, 2000
Feldman R.S., "Understanding psychology", McGraw Hill Publishing Company, new york, 1990
Fraisse P, "Trite de psychologie experimentale", P.U.F., Paris, 1975
Gregory R., "Psychological testing. History, priniples, applications", Allyn&Bacon, Illinois, 1996
McGuigan F., "Experimental psychology", Prentice-Hall, New Jersey, 1968
Miclea M, "Psihologie cognitiv", Casa de editur Gloria SRL, Cluj-Napoca, 1994
Minulescu M., "Chestionarele de personalitate n evaluarea psihologic", Garell publishing House,
Bucureti, 1996
Pitariu H., "Managementul resurselor umane. Msurarea performanelor profesionale", Ed. ALL,
Bucureti, 1994
Parot Fr., Richelle M./'Introducere n psihologie", Ed. Humanitas, Bucureti, 1995
Radu I, (coord.), "Metodologie psihologic i analiza datelor", Ed.Sincron, Cluj-Napoca, 1993
Radu I (coord.), "Introducere n psihologia contemporan", Ed.Sincron, Cluj-Napoca, 1991
Roea Al., "Metodologie i tehnici experimentale n psihologie", Ed. tiinific, Bucureti, 1971
Roea AL, "Tratat de psihologie experimental", Ed. Academiei, Bucureti, 1963
Roea M., "Metode de psihodiagnostic", Ed.Didactic i Pedagogic, Bucureti, 1972
chiopu U., "Dicionar de psihologie", Ed.Babei, Bucureti, 1997
Zoorgo B.(coord.), "Probleme fundamentale ale psihologiei", Ed.Academiei, Bucureti, 1980

72
CAPITOLUL 5

CONSTRUIREA TESTELOR PSIHOLOGICE


Metode de construire a testelor
Definiia testului
Crearea bncii de itemi
Construirea unei variante a testului i administrarea acestei
variante
Analiza rezultatelor testrii
Revizuirea itemilor
Elaborarea manualului testului. Traducerea i adaptarea

n general, construirea unui test se caut cauza pentru a vedea dac este
psihologic sau a unei scale dintr-un test se legat de item, de eantionul de subieci sau
desfoar n mai muli pai, nesecvenial, cu de modul de administrare al itemilor. Analiza
reveniri repetate pn la realizarea calitilor cauzelor poate scoate la iveal deficiene ale
dorite (fidelitate, validitate, putere de unor itemi care n urma analizei statistice a
discriminare, dificultate). rezultatelor preau a fi bine construii (de ex.
Algoritmul general al construirii unui test este rspunsul greit la un item deoarece alt item
urmtorul: conine informaii eronate care l-au derutat pe
subiect). Itemii fr greeli se introduc n
1. Definirea testului partea a doua a analizei de itemi, unde se
2. Crearea bncii de itemi aplic procedeele specifice metodei alese
3. Construirea unei variante a testului pentru construirea testului. Din itemii fr
4. Administrarea testului deficiene se construiete un test care este din
5. Analiza rezultatelor testrii: cnd testul nou verificat din punctul de vedere al fidelitii,
este necorespunztor, are loc depistarea validitii, dificultii, puterii de discriminare, iar
erorilor i revizuirea itemilor (repetarea dac aceste caracteristici sunt considerate ca
ciclului), dac testul este corespunztor se acceptabile acesta se administreaz din nou
trece nc la o verificare suplimentar unui eantion de persoane similar primului.
dup care se trece la ultima faz (Albu M.1998). Dac se menin calitile
6. Elaborarea normelor i a manualului testului la verificarea suplimentar se
testului stabilesc normele testului i regulile de
Coninutul tuturor pailor algoritmului interpretare a scorurilor. Publicarea testului
este determinat de direciile stabilite la primul reprezint pasul final.
pas, n special de scopul teoretic i practic
cruia trebuie s-i serveasc elaborarea Dup Gregory (1996) etapele parcurse
testului. In funcie de aceasta se formuleaz n elaborarea unui test sunt:
itemii, se alege metoda de construire a 1. Definirea testului
testului i se alctuiete o prim variant a 2. Alegerea scalei de msurare ce va fi
ascestuia. O dat ce versiunea preliminar a utilizat
testului este gata, examinatorul l 3. Construirea itemilor
administreaz la un eantion de subieci, 4. Analiza de itemi
analizndu-se rspunsurile obinute la fiecare 5. Revizuirea testului
item; se identific itemii necorespunztori i 6. Publicarea testului
73
Aceste etape pot fi concentrate (d) Calculul corelaiilor dintre scorurile la itemi
deoarece definirea testului implic i alegerea i scoruriletotale pentru toi itemii din lotul
scalei de msurare pe care dorim s o preliminar;
utilizm, construirea itemilor este de fapt o (e) Utilizarea coeficienilor de corelaie astfel
etap preliminar n procesul analizei de obinui pentru criteriu pentru selecia
itemi, iar revizuirea testului se face n funcie final a itemilor care prezint cele mai
de rezultatele obinute n etapa analizei de nalte corelaii ntre scorurile proprii i
itemi. scorurile totale.
Un principal avantaj al acestei metode
METODELE DE CONSTRUIRE A TESTELOR este validitatea de coninut ridicat, iar ca
sunt mprite n trei categorii: dezavantaj ar fi faptul c omogenitatea i
coninutul itemilor depinde de abilitatea
A. Metode deductive autorului probei.
B. Metode inductive
C. Metode empirice Din aceast categorie fac parte: Metoda
intervalelor aparent egale, metod care a
A. Metode deductive, denumite i fost propus de LLThurstone pentru
raionale sunt bazate pe simul comun, n construirea scalelor de evaluare a atitudinilor
cadrul lor construirea i selectarea itemilor se (Gregory, 1996). L.L.Thurstone propune o
bazeaz pe prerile unor persoane, experi metoda pentru construirea scalelor de
sau nu. Mai nti sunt alese constructele ce evaluare a atitudinilor. Pentru a ilustra
vor fi msurate de teste, apoi sunt elaborai aceast metod vom nsuma paii implicai n
itemii. construirea scalei de atitudini pentru membrii
Metodele raionale sunt folosite i unei comuniti religioase;
pentru crearea chestionarelor de 1. Se ncepe prin formarea unei colecii, ct
personalitate, punnd autorul n postura mai bogate de itemi dihotomici, care se
creatorului care decide ce itemi trebuie inclui refer toi la atitudinea fa de un acelai
i ce coninuturi sunt relevante pentru a obiect. La fiecare item se poate rspunde
traduce trstura ntr-un comportament, doar prin rspunsuri de "adevrat" sau
decizie care antreneaz n special experiena "fals"(n cazul nostru se colecteaz
sa de via, cunoaterea psihologiei umane. rspunsurile viznd atitudinile pozitive sau
Hase & Goldberg clasific abordrile negative fa de biseric).
raionale n funcie de dou criterii: S Criteriul 2. Apoi, 10 din aceste rspunsuri trebuie s
privind selectarea coninutului itemilor, releve gradul de favorabilitate-
divizeaz strategiile intuitive n abordri n nefavorabilitate fa de atitudine. Experii
care selecia itemilor se bazeaz pe (cei ce evalueaz trebuie s fie calificai,
nelegerea strict intuitiv a trsturi, i n cazul nostru preoii, ei trebuie s ignore
abordri n care selecia este ghidat de o propriile tendine i s priveasc cele 11
teorie asupra personalitii i categorii echidistant) analizeaz fiecare
comportamentului uman; S Criteriul item apreciind ct de favorabil este
privind instana care selecioneaz atitudinea studiat la persoanele care
itemii, ntre situaia n care autorul rspund cu "adevrat", acordnd o cot I
chestionarului este cel care selecteaz cuprins ntre 1 (extrem de nefavorabil)
itemii i n care selecia se face de un grup de i 11 (extrem defavorabil).
persoane judectori. 3. Dup ce experii au completat procesul de
Astfel un posibil demers intuitiv n evaluare, se determin deviaia standard
construirea unui chestionar de personalitate pentru fiecare item (ex.10 experi au |
cuprinde urmtorii pai: acordat 9,2 puncte pentru primul item cal
(a) Selecia intuitiv a coninuturilor itemilor i favorabil, ceea ce denot o deviaie dei
a lotului iniial de itemi; 1,1 de la un expert la altul).
(b) Administrarea lotului iniial de itemi unui 4. Deoarece abaterea standard a itemilor
grup de subieci; reflect ambiguitate, itemii cu abatere
(c) Calcularea scorurilor totale la aceast standard mare sunt exclui. De obicei 20-1
scal preliminar; 30 de itemi sunt alei, pentru a acoperii
toate dimensiunile. Se presupune ci

74
diferenele ntre itemi pe scala finala
cea mai mare valoare posibil a coeficientului mare, eterogen de itemi, se compar
de fidelitate; fiecare item este comparat cu scorurile acestora cu criteriile i se rein cei
ntregul test i este posibil ca un item care au comportarea pe care trebuie s o aib
necorespunztor s determine eliminarea unui ntregul test. Metodele acestei categorii sunt:
item bun. Metoda criteriului extern sau strategia'
Metoda teoretic (Aiken, 1994), criteriului extern. Etapele principale ale
grupeaz itemii pe baza unui algoritm al strategiei sunt:
analizei de clusteri i reine itemii unei clase (a) Elaborarea unei colecii iniiale de itemi dej
omogene. obicei pe baze raionale sau reunind itemii
Pentru acest algoritm la fiecare pas se din diferite chestionare
construiete pe mulimea de itemi o partiie; n (b) Administrarea acestui lot iniial de itemi
cadrul fiecrei partiii clasa care se refer la unui grup de subieci care difer ntre ei
constructul msurat de test trebuie identificat doar la nivelul trsturii evaluate
prin analiza coninutului itemilor. Se formeaz (c) Determinarea pentru fiecare lot a
testul din itemii clasei respective i se frecvenei rspunsurilor i a semnificaiei
calculeaz coeficientul de fidelitate. Deci, la statistice a acestor diferene
fiecare pas al algoritmului exist cte un test. (d) Itemii care difereniaz semnificativ celei
Dintre acestea se alege cel cu o fidelitate mai dou loturi sunt selectai pentru scala
bun i care este compus dintr-un numr preliminar
suficient de mare de subieci pentru a se face (e) Aplicarea acestei scale din nou loturilor
diferena ntre ei. iniiale
Metoda analizei criteriului intern sau (f) Validarea scalei pe noi loturi, dac
metoda analizei factoriale rspunsurile obinute sunt satisfctoarei
Aceast metod pune accent pe anliza pentru a identifica i ndeprta itemii cu ol
criteriului intern, pe tehnici statistice care capacitate slab de discriminare
permit ca odat cu identificarea unui factor (g) Validarea din nou a acestei ultime scale
care apare ca dimensiune responsabil de Avantajul acestei metode ghidat dej
variaia comportamentului, s construim i o criterii exerne de judecii caliatative a
scal pentru a defini psihologic i a evalua psihologului este faptul c depete
respetivul focar. abilitatea intuitiv a unui singur om il
Paii n stategia analizei factoriale reprezint o consecin a comportamentului
pornesc de la: unui numr mare de persoane fa dej
(a) Construirea pe baze a priori a unui lot mic coninutul itemilor (ex. construirea scalei dej
de itemi, itemi ce par a fi strns legai de socializare a CPI). Aceast metod prezint
factorul vizat importan atunci cnd se pune problema
(b) Itemii sunt administrai apoi unui numr utilitii predictive, deci, pentru construirea
mare de subieci, care n paralel sunt unui chestionar de tip vocaional.
testai i cu alte instrumente care s-au
dovedit semnificative n raport cu 1. DEFINIREA TESTULUI
dimensiunea vizat
(c) Se realizeaz intercorelarea itemilor, Dup luarea deciziei de construire a
matricea rezultat fiind analizat factorial unui test se precizeaz n detaliu:
(d) Se determina corelaia fiecrui item cu v Funcia pe care o va ndeplini;
factorul sau factorii rezultai S Populaia cruia i este destinat;
(e) Vor fi selectai pentru scala final acei V Condiiile de administrare: cnd, unde, cat,
itemi care au cea mai mare ncrctur cum;
factorial s Modul de interpretare a rezultatelor (prifl
n aceast metod pot intervenii raportarea la obiective fixate apriori sau
distorsiuni datorate metodei analizei factoriale. prin raportarea la norme);
Avantajul principal al acestei scale este s Motivele care au impus crearea lui.
puritatea factorial i omogenitatea. Alte aspecte care se decid n aceast
prim etapa sunt:
C. Metodele externe sau empirice, Natura scalei de msurare ce va fi utilizat!
sunt cele care stabilesc o legtur ntre (nominal, ordinal, sau de interval);
scorurile testului ce va fi construit i diversele Tipul itemilor ce vor fi inclui n test;
criterii externe. Se pornete de la o colecie Modul de ordonare al itemilor;
76
Lungimea testului; arat c scala poate msura toate entitile
1
Modul cum va fi administrat testul (cu sau crora le este destinat, i c este mutai
fr limit de timp). exclusiv demonstreaz c fiecare entitate
Atunci cnd un test trebuie s msoare primete n urma msurrii o singur valoare.
un construct este indicat definirea Principalele tipuri de scale utilizate n
constructului ce urmeaz a fi msurat, atunci msurarea psihologic sunt:
cnd testul este utilizat n selecia
profesional trebuie s se precizeze corect Scala nominal. Este cunoscut i sub
performana persoanelor ntr-o anumit denumirea de scal calitativ, categorial sau
munc, iar n cazul testelor de cunotiine de clasificare. Este cel mai simplu tip de scal
definirea testului const n descrierea i presupune doar diferenierea calitativ a
domeniului de coninut. obiectelor i fenomenelor msurate.
Natura scalei de msurare ce va fi Un exemplu este scala nominal utilizat n
utilizat stabilirea tipurilor temperamentale, cum
Datele obinute prin diferite forme de rezult din clasificarea realizat de Galenus i
investigare psihologic sunt sub form Hypocrat:
numeric sau sunt aduse datorit unor -coleric,
operaii de codare ntr-o form numeric, deci -sangvinic;
sunt prezentate ntr-o form cuantificat. -flegmatic;
Cuantificarea datelor rezultate dintr-o -melancolic,
cercetare are la baz un porces de msurare.
Prin msurare vom nelege procesul de Scala ordinal. Acestea sunt scalele
determinare a diferitelor valori ale unei cunoscute i sub numele de scale de ordine,
variabile. Msurarea a fost definit ca scale de rang sau scale ierarhice. O scal
"atribuirea unor numere la aspecte lae ordinal permite ordonarea observaiiloe,
obiectelor sau evenimentelor potrivit unei persoanelor, situaiilor de la mic la mare, de la
reguli; definiia afirm c msurarea simplu la complex, de la puin la mult etc. n
reprezint orice set considerat de reguli cazul scalelor ordinale se poate stabili ierarhia
pentru asocierea de numere la fenomene. n a "n " gradaii ale variabilei, dar nu se
psihologie posibilitatea msurrii directe este precizeaz valoare diferenei dintre gradaii,
destul de limitat. Atribuirea numerelor n Un exemplu de scal ordianl este ierarhia
cercetrile psihologice poate fi invocat n; nevoilor umane n concepia lui Abraham
Timpul necesar pentru invocarea unei Maslow, scala stabilit de el cuprinznd:
sarcini; 1. nevoi fiziologice;
Cuantificarea unor aseriuni; 2. nevoi de securitate;
Indicaii dobndite despre frecvena unui 3. nevoi sociale, de apartenen la grup;
fenomen de un anumit fel; 4. nevoia de stim , de a fi apreciat de
Reacia corect la un stimul de un anumit ceilali;
qen ' 5. nevoia de autorealizare.
Msurarea este posibil doar dac
avem la dispoziie instrumente de msurare Scala de intervale. Aceasta are o
adecvate i este indicat ca aceste scale de complexitate mai mare dect scala ordinal,
msur s fie acceptate pentru a putea oferit de proprietatea c are sens luarea n
nesni comunicarea ntre specialiti i considerare a distenelor dintre categoriile
scalei
beneficiarii competenei lor. - Scala de intervale ofer pe lng
O scal de 'msur trebuie s fie ordinea categoriilor i distana dintre categorii.
Prin
consistent, corect, exhaustiv i mutual aceast proprietate datele experimentale
exclusiv. Scala are consisten intern dac obinute pe o asemenea scal, date de
produce rezultate aproape identice atunci interval, suport prelucrri statistice mai
cnd este folosit n mod repetat pentru comlexe.
acelai obiect sau fenomen i este corect ^n exemplu de astfel de scal l
dac produce informaia pe care o ateptm reprezint prezentarea rezultatelor de la testul
de
de la ea. Proprietatea exhaustiv a scalei asociere i disociere manual DMI.

' Smith Stevens, "Measurement", Aldine Publishing


Company, Chicago, 1974
77
Scala de raport sau scala de proporii (sau ntrebare este dat de modul n care autorul i- j
scal de interval cu origine raional). Aceast a definit noul instrument,
scal de msur posed ca note distinctive Gradul de dificultate al itemului trebuie
existena unei origini naturale i precizarea s permit o difereniere semnificativ a
clar a semnificaiei unitii de msur, ceea subiecilor la ambele extreme. Cele mai >
ce face posibil compararea raporturilor dintre folositoare teste sunt acelea care includ o
gradaiile scalei. serie gradat de itemi cu o dificultate foarte
Distribuiile obinute cu ajutorul scalelor pot fi sczut i o alt serie de itemi de dificultate
vizualiazate cu ajutorul unor reprezentri ridicat. Efectul de plafonare (ceiling effect)
grafice specifice. Utilizarea unor asemenea apare atunci cnd un numr mare de subieci
reprezentri mboete transmiterea obin scoruri perfecte. Problema acestui tip de
informaiilorobinute ca urmare a unor efect este c distincia ntre subiecii cu
prelucrri de date. Reprezentrile grafice cele scoruri mari nu este posibil. Efectul de podea
mai des utilizate sunt histogramele; se (floor efect) se observ atunci cnd un numr
ntlnesc frecvent n cercetarea psihologic mare de subieci examinai au obinut scoruri
diferite tipuri de forme ale unei distribuii, foarte apropiate de extremitile scalei. De
respectiv: distribuii simetrice sau normale, exemplu testul WAIS-R prezint un asemenea
distribuii asimentrice sau distribuii n form efect deoarece itemii si nu pot face distincia
de i. ntre nivelurile moderat, sever, profund al
Pe lng posibilitatea de a reprezenta ntrzierii mintale.
datele unei cercetri sub form de tabele i Construcia itemilor se va face conform
reprezentri grafice, prelucrarea statistic metodelor de construcie a testelor
utilizeaz i metoda exprimrii sintetice a psihologice prezentate anterior,
ansamblului de date utiliznd i anumite Itemii care se introduc n banca dej
valori numerice: media, abaterea standard, itemi pot proveni din mai multe surse, anume: j
frecvena etc; n acest scop exist 1) Pot fi formulai de psihologi pe baza unei [
numeroase lucrri de specialitate care pot fi teorii;
consultate.2 2) Sunt elaborai de specialitii n domeniul I
unde va fi aplicat testul;
2. CREAREA BNCII DE ITEMI 3) Sunt creai de diverse persoane, ca
ilustrri ale comportamentelor pe care
Elaborarea itemilor unui test este un acetia le consider caracteristice pentru
proces dificil, care necesit un grad ridicat de un anumit construct
creativitate din partea autorului. Acesta va 4) Sunt extrai din teste existente (procedeu
trebui s dea rspunsuri la ntrebri de tipul: care este utilizat deoarece se constat c
Cum trebuie s fie coninutul itemului? itemii au legturi cu alte variabile conforme
Ce grad de dificultate trebuie s aib teoriei care st la baza constructului, se
itemul? ncadreaz n domeniul de coninut al
Ci itemi ar trebui construii iniial? testului, coreleaz semnificativ cu variabila
etc, . criteriu etc.)
Este de ateptat ca nu toi itemii iniiali
: ~ ----------------------------- stabilii s aduc o contribuie major la I
Clocotici, V. "Statistic aplicat n psihologic", Ed.PoIirom la i . r x' x
h
2000 ' ' ' elaborarea instrumentului motiv pentru care
Pitariu, II. "Psihologia personalului", Ed. Presa Universitar Clujan, Se reCOITinad Ca numrul itemilor Care VOT fi I
ciuj-Napoca, i996 introdu i n banc s f ie c u 20% m ai m are!
Radu, I Metodologic psihologic i analiza datelor", Ed.Sincron, . , . . , . .
ciuj-Napoca, I993 dect lungimea testului.
78
nainte de introducerea itemilor n -s te oferi voluntar pentru 5 ore la o cas de
banc se stabilete modul n care acetia vor copii etc.
I fi cotai. Dei aceast tehnic a alegerii forate are
Atunci cnd vorbim despre metoda numeroase proprieti psihometrice, creatorii
prin care atributele psihologice sunt evaluate, de teste de personalitate nu se grbesc s o
I autorul testului se confrunt cu o multitudine pun n practic.
I de posibiliti. Aici voi prezenta sumar cteva
din avantajele i dezavantajele celor mai 3. CONSTRUIREA UNEI VARIANTE A
utilizate formaturi. TESTULUI l ADMINISTRAREA ACESTEI
Astfel pentru testele de inteligen de VARIANTE
grup i pentru cele de evaluare performantei
se recomand utilizarea itemului cu variante Selectarea itemilor din banca de itemi,
multiple de rspuns; acest format permite o itemi care vor fi introdui n prima variant a
scorare mai rapid i mai bun. testului, vor avea implicaii att asupra
Recomandri pentru construirea timpului de rezolvare al testului i a calitilor
itemilor cu variante multiple de rspuns: psihometrice ale acestuia,
-alege cuvinte clare; Timpul de rezolvare al testului depinde
-evit formatul frazelor complexe i greu de vrsta subiecilor, deprinderea acestora de
inteligibile; a citi, lungimea i dificultatea itemilor i de
-include toat informaia necesar pentru modul de formulare a rspunsurilor,
selecionarea unui rspuns; Selectarea itemilor din banca de itemi
-folosii ct mai rar expresii de genul "nici una se va face fie aleator, fie urmrind o tabel de
din variantele de mai sus" sau "toate specificaii sau se aleg itemii n funcie de
variantele de ami sus"; valorile dificultilor lor care trebuie repartizate
minimizai folosirea negaiilor; ct mai uniform
-evitai indiciile ce nu sunt necesare pentru In final se vor aranja itemii att n
alegerea unui rspuns corect. cadrul testului ct i n pagin, se vor elabora
Tipuri de itemi n testele psihologice instruciunile de administrare dup care se va
Itemi cu rspunsuri nchise - solicit administra unui lot de subieci.
selectarea unuia sau a mai multor Administrarea testului se va face n
rspunsuri dintr-o list de rspunsuri aceleai condiii n care va fi utilizat i n
propuse: itemi dihotomici, itemi cu practic.
rspunsuri la alegere (alegere multipl),
itemi de tip asociere; 4. ANALIZA REZULTATELOR
Itemi cu rspunsuri deschise - pretind TESTRII
formularea unui rspuns folosind
vocabularul propriu: itemi cu formulri Se face o analiz atent a modului n
lacunare, itemi cu rspunsuri scurte, itemi care a decurs testarea, urmrindu-se dac
tip eseu; instruciunile au fost complete, dac timpul de
Testele de personalitate folosesc lucru a fost suficient; apoi se prelucreaz
adesea ntrebri cu rspunsuri de tipul A/F rspunsurile obinute de la subieci i se
sau DA/NU. Majoritatea examinaiilor afirmnd ncearc construirea unui test pe baza celui
c este mai simplu s rspund prin A sau F experimental. Paii acestei etape sunt:
la ntrebri de tipul: 1) Analiza de itemi;
mi place s citesc Prosport? A F 2) Eliminarea itemilor necorespunztori;
O serie de critici aduse acestui tip de 3) Selectarea celor mai corespunztori itemi
format afirm c rspunsurile reflect mai mult din cei rmai;
dezirabilitatea social dect trstura de 4) Analizarea caracteristicilor psihometrice
personalitate (Edwards, 1961). ale testului obinut.
Un alt tip de format este cel al alegerii
forate, unde sarcina examinatului este s Scopul unei analize de itemi este de a
aleag din mai multe opiuni egale din punctul determina care itemi sunt buni (corespunztori
de vedere al dezirabilitii. testului nostru), care itemi trebuie reevaluai i
Ce ai prefera s faci mai mult: care sunt itemii la care se renun. Pentru
-s curei un litru de vopsea vrsat pe podea fiecare item se efectueaz una sau mai multe
din urmtoarele prelucrri: indicele de
dificultate al itemului, indicele de fidelitate al Un mod simplu de a determina dacl
itemului, indicele de validitate, indicele de un item coreleaz cu restul itemilor testuluiI
discriminare al itemului i curba este de a corela scorurile itemului cu scorulI
caracteristicilor itemului. total al testului, utiliznd formula de calcul al
Indicele de dificultate al itemului coeficientului de corelaie biserial (r, Pearsonj.l
Cea mai obinuit definire a dificultii n general cu ct este mai nalt valoarea!
unui item este frecvena relativ a persoanelor coeficientului de corelaie dintre item i scortiB
care au rezolvat corect itemul din totalul celor total cu att itemul este mai util din punctul del
crora li s-a administrat testul. Astfel definit se vedere al consistenei interne,
noteaz cu "p". Indicele de dificultate Indicele de validitate al itemului
reprezint scorul mediu care s-ar obine la Este important ca un test s posede
item dac s-ar nota un punct pentru fiecare validitate concurent i predictiv ct mail
rspuns corect i 0 n cazul rspunsului greit nalt. n acesta situaie o ntrebare domin
sau omis. Pentru fiecare item individual "i" construcia testului: ct de bine fiecare iteml
indicele de dificultate este p h care variaz de preliminar contribuie la predicia exact a
la 0 la 0.1. Un item cu nivelul de dificultate .2 criteriului?
este mai greu dect unul cu dificultatea .7. Se spune c un item este valid dacell
Indicele de dificultate este un poate fi folosit la evaluarea caracteristicii
instrument util pentru identificarea itemilor msurate de variabila criteriu,
care trebuie transformai sau ndeprtai. S Pentru estimarea validitii se
presupunem c indicele de dificultate al unui calculeaz coeficientul de corelaie ntrel
item ar fi aproape de 0, aceasta nsemnnd scorurile itemului i valorile variabilei criteriu
c aproape nimeni nu a rspuns corect. Din (atunci cnd este msurat printr-un coeficient!
pcate acest item este din punct de vedere de corelaie liniar validitatea itemului arat
psihometric necorespunztor, deoarece nu ct de puternic este legtura liniar ntrel
contribuie la msurarea variabilei vizate de scorurile itemului i valorile variabilei criteriu),!
test, el urmnd a fi rescris sau eliminat din Presupunnd c variabila criteriu estel
test. Acelai lucru se poate spune si despre continu, tipul coeficientului de corelaie
un item cu indicele de dificultate 1.0 unde toi utilizat va depinde de tipul itemului, respectivi
subiecii au rspuns corect. de numrul scorurilor posibile ale itemului. ini
n general itemii al cror indicele de cazul itemilor dihotomici, crora li se acorda
dificultate ia valori n intervalul 0.3 - 0.7 permit un punct dac sunt rezolvai corect i zerol
o difereniere bun ntre subieci (Gregory, puncte dac sunt rezolvai greit saul
1996). nerezolvai, validitatea poate fi msurat cui
Pentru itemii cu alegere multipl i cei ajutorul coeficientului de corelaie punct-l
dihotomici care au un singur rspuns corect biserial.
se recomand s se pstreze n test itemii al Indicele de discriminare
cror indicele de dificultate este apropiat de Noiunea de putere de discriminare al
valoarea 0.5+g/2, unde g reprezint unui item vine s o completeze pe cea del
probabilitatea de a ghici rspunsul corect. n validitate a itemului. n general se apreciaz
general dificultatea itemului poate fi calculat c un item are putere de discriminare dacii
cu formula (1.0+g)/2. Deci pentru un item cu 4 examinaii cu valori mari la variabila criteriu aii
rspunsuri la alegere, g=.25 i indicele de anse mai mari s rezolve itemul dect cel
dificultate ar fi (1.0+25)12=6.3. care au valori sczute.
Atunci cnd testul este folosit pentru O posibilitate de evaluare a puterii del
selecia persoanelor care vor face parte dintr- discriminare a unui item o constituie "metoda
un grup extrem se va face testul cu itemii care grupelor contrastante" aplicabil atunci cnA
au indicele de dificultate ami mei ca 0.3 i mai testul a fost administrat unui numr mare del
mare ca 0.7. persoane. Conform acestei metode un ind\m
Indicele de fidelitate al itemului de difereniere este un index statistic ce indicai
Autorii testului doresc un instrument cu ct de eficient difereniaz un item ntre el
un nivel ridicat al consistenei interne n care subiecii care obin valori superioare saul
itemii sunt omogeni, deci indicele de fidelitate inferioare la variabila criteriu,
servete la aprecierea contribuiei pe care i-o Indicele de discriminare pentru un iteml
aduce itemul la stabilirea unei bune se calculeaz conform formulei (GregorjI
consistente interne a testului. 1996):
80
D=(U-L)/N, unde U-numrul de persoane din efectueze o validare suplimentar (cross-
ppa (superioar)bun care au rspuns validation). Prin acesta se verific folosind
Icorect ecuaia de regresie a scorurilor testului fa de
I L-numrul de persoane din grupa (inferioar) un criteriu, dac testul prezice criteriul ntr-un
I slab care au rspuns corect eantion nou de subieci la fel de bine ca n
I N-numrul total de examinai eantionul original.
S ilustrm modul de calcul i folosirea In revizia testului feed-backul din
lui D cu un exemplu ipotetic. Presupunem c partea celor examinai este o surs
autorul a construit o versiune preliminar a valorificabil de informaie. Opinia
unui test de performan care este bazat pe examinailor se poate obine prin aplicarea
ntrebri cu alegere multipl. Acest test este unui chestionar de opinie n care este evaluat
administrat unui numr de 400 d elevi. Dup comportamnetul examinatorului, condiiile de
calcularea scorului total pentru fiecare subiect testare, claritatea instruciunilor, percepia
se identific: 25% elevi ce au obinut scoruri asupra testului, claritatea textului itemilor,
mari, 25% scoruri mici din ntregul eantion, utilitatea testului.
deci N=100. Apoi pentru fiecare item autorul
testului determin numrul de elevi din zona 6. ELABORAREA MANUALULUI TESTULUI.
superioar i din cea inferioar care au TRADUCEREA l ADAPTAREA
rspuns corect. De exemplu dac la primul
item 49 de elevi din partea superioar au Materialul testului trebuie s fie
rspuns corect i 23 din partea inferioar accesibil celui care l uitileaz. Sarcina
atunci vom avea: D=(49-23)/100=0.26 autorului testului este de a elabora un manual
Indicele de discriminare variaz de la - uor de utilizat n care examinatorul s
1 la +1. Cu ct Indicele de discriminare este gseac toate datele despre analiza de itemi,
mai ridicat cu att itemul reuete mai bine s despre modul de interpretare al scorurilor
diferenieze ntre cei buni i cei slabi. ob'inute de subieci la test, fidelitate, validitate,
Valoarea Indicele de discriminare este standardizare etc,
dependet de p. Atunci cnd toi examinaii Manualul trebuie s stipuleze cnd
rezolv corect itemul p=1 sau cnd nimeni nu este recomandat a se folosi testul, s ofere
rspunde corect p=0 itemul nu difemiaz precauii specifice pentru situaia n care nu
ntre cei buni i cei slabi. Cel mai mare este recomandat, citeze studii reprezentative
potenial pentru a fi buni discriminatori l au privind folosirile specifice i generale ale
itemii al cror indice de dificultate este testului, identific calitile speciale necesare
apropiat de 0.5. Ori de cte ori se obine o pentru administrarea i interpretarea testului,
valoare negativ a Indicele de discriminare la delimiteaz relaiile cantitative ntre scorurile
un item cu alegere multipl este necesar s testului i criterii, specific modul de elaborare
se revad rspunsurile propuse. a modelelor de rspuns etc.
Pentru adminxitrarea testului unui grup
5. REVIZUIREA ITEMILOR cultural nou nu este suficient numai
traducerea itemilor i a instruciunilor. Este n
Scopul analizei itemilor discutat primul rnd necesar adaptarea testului
anterior este de a identifica itemii deoarece populaia cruia l-a fost destinat
necorespunztori din testul preliminar, acetia testul i noua populaie prezint deoasebiri n
putnd fi rescrii, eliminai sau nlocuii. ceea ce privete constructul msurat de test,
Urmtorul pas n elaborarea testului este ca obinuina persoanelor cu situaia de testare,
aceast variant astfel obinut s fie rspunsurile date la unii itemi din test care nu
verificat suplimentar, repetnd astfel pot fi potrivii noii populaii,
procedurile analizei de itemi asupra unui n anul 1993 s-a format un comitet
eantion de persoane care prezint aceleai internaional International Test Comision
caracteristici cu lotul iniial. Dac rezultatele compui din speialiti din diverse domenii ale
obinute n urma acestei verificri psihologiei, care n 1996 au redactat un set de
suplimentare nu sunt satisfctoare pentru reguli pentru traducerea testelor.
examinator acesta poate recomanda o nou
examinare.
n literatura de specialitate se
recomand cad dup alctuirea testului s se
81
BIBLIOGRAFIE

Aiken L, "Psychological Testing Assessment", Allyn & Bacon, Massachusetts, 1994


Aibu M., "Construirea i utilizarea testelor psihologice", Ed. Clussium, Cluj-Napoca, 1998
Albu M., Pitariu H. "Psihologia personalului-msurarea i interpretarea diferenelor individuale", Ed.I
Presa Universitar Clujan, Cluj-Napoca, 1996
Anastasi A., "Psychological testing", New york, Macmilan, 1955
Bontil C, Teste psihologice, Institutul de Expertiz i Recuperare a capacitii de munc,
Bucureti, 1969
Clocotici V., Stan A., "Statistic aplicat n psihologie", Ed. Polirom, lai, 2000
Feldman R.S., "Understanding psychology", McGraw Hill Publishing Company, new york, 1990
Fraisse P, "Trite de psychologie experimentale", P.U.F., Paris, 1975
Gregory R., "Psychological testing. History, priniples, applications", Allyn&Bacon, Illinois, 1996
"ndrumtor Psihodiagnostic", voi. 1-4, Catedra de Psihologie Universitatea Babe-Boylai, 1976
Kaplan, M., Saccuzzo, P. D., Psychological Testing. Principles, Applications and Issues (third
edition), Brooks/Cole Publishing Company, Pacific Grove, California, 1993.
McGuigan F., "Experimental psychology", Prentice-Hall, New Jersey, 1968
Miclea M, "Psihologie cognitiv", Casa de editur Gloria SRL, Cluj-Napoca, 1994
Minulescu M., "Chestionarele de personalitate n evaluarea psihologic", Garell publishing House,!
Bucureti, 1996
Pitariu H., "Managementul resurselor umane. Msurarea performanelor profesionale", Ed. ALLB
Bucureti, 1994
Parot Fr., Richelle M.,"Introducere n psihologie", Ed. Humanitas, Bucureti, 1995
Radu I, (coord.), "Metodologie psihologic i analiza datelor", Ed.Sincron, Cluj-Napoca, 1993
Radu I (coord.), "Introducere n psihologia contemporan", Ed.Sincron, Cluj-Napoca, 1991
Roea AL, "Metodologie i tehnici experimentale n psihologie", Ed. tiinific, Bucureti, 1971
Roea Al., "Tratat de psihologie experimental", Ed. Academiei, Bucureti, 1963
Roea M., "Metode de psihodiagnostic", Ed.Didactic i Pedagogic, Bucureti, 1972
Smith Stevens, "Measurement", Aldine Publishing Company, Chicago, 1974
chiopu U., Introducere n psihodiagnostic, Centrul de multiplicare a Univ.Bucureti, 1985
chiopu U., "Dicionar de psihologie", Ed.Babei, Bucureti, 1997
Zoorgo B.(coord.), "Probleme fundamentale ale psihologiei", Ed.Academiei, Bucureti, 1980
Wechsler, D., Manual for the Wechsler Preschool and Primary Scale of Intelligence, New York:
Psychological Corporation, 1967.
Wechsler, D., Wechsler Preschool and Primary Scale of Intelligence - revised, San Antonio: The I
Psychological Corporation, 1989

82