Sunteți pe pagina 1din 47

Note de curs

Instrumentul de investigaie din domeniul psihologiei este un


auxiliar metodologic creat de specialiti pentru a servi culegerii de date
produse sistematic, n vederea realizrii de cercetri tiinifice i n
activitile psihodiagnostice din practica profesional. Pentru
exemplificare, amintim testul psihologic, chestionarul de personalitate, ,
ghidul sistematizat de observaie sau de interviu. Deoarece activitatea
psihologului este una complex, utilizarea acestor instrumente de
investigaie este integrat unui ansamblu de proceduri i metode menit
s sprijine activitatea psihodiagnostic. Referinele acestui curs se fac
prioritar la testul psihologic, cel mai bine teoretizat i verificat dintre
aceste instrumente. Acesta beneficiaz de cea mai mare atenie din
parteda psihologilor i nepsihologilor care, la rndul lor, se mpart n
admiratori i detractori, cunosctori i diletani.
n privina definiiei testului psihologic nu exist unanimitate de
formulri. Definiiile specialitilor se aseamn n multe privine, dar nu
se identific, accentul fiind pus pe aspecte diferite.
Cele mai cunoscute definiii sunt murmtoarele :
Asociaia internaional de psihotehnic: o prob
definit, care implic sarcini de ndeplinit, identic pentru toi
subiecii examinai, cu o tehnic precis de apreciere a
succesului sau eecului sau de notare numeric a
reuitei.(H.Piron, 2001);
Maurice Reuchlin: Prob, utilizat mai ales n psihologia
diferenial, care permite de a descrie comportamentul unui
subiect ntr-o situaie definit cu precizie(consemnele
testului) prin referin la comportamentul unui grup definit de
subieci plasai ntr-o aceiai situaie(Grand dictionnaire de
la psychologie,1992)
Arthur S. Reber: n modul cel mai general, cteva proceduri
folosite pentru a msura un factor sau a evalua cteva
aptitudini (Arthur S. Reber, 1985);
Susana Urbina: Un test psihologic este o procedur
sistematic de obinere a eantioanelor de comportament,
relevante pentru funcionarea cognitiv sau afectiv i de
scorare i evaluare a acestor eantioane conform
standardelor(Susana Urbina, 2009).
Lienert, Gustav : denumire pentru un procedeu tiinific de
rutin pentru cercetarea uneia sau mai multor caracteristici de
personalitate delimitabile empiric cu scopul unor posibil
aseriuni cantitative despre gradul relativ al reliefrii
caracteristicii individuale(Gustav Lienert, 1961)
Ursula chiopu: prob, instrument de diagnosticare de
caracteristici psihice(Ursula chipu, 1997)
Walter Kristof: un procedeu bine definit pentru prelevarea
unui eantion de comportament cu scopul diferenierii ntre
diferii subieci n urma rezultatului obinut( Walther Kristof,
1983)
Arlette i Roger Muchhielli: prob semnificativ(validat i
etalonat) pentru a evalua(prin raportare la rezultatele
obinute de alii), ceea ce un subiect este capabil ntr-o situaie
dat , sau caracteristicile personalitii sale( Arlette i Roger
Mucchielli, 1969)
Denumirea de test n epoca modern este dat de binecunoscutul
psiholog america James McKeen Cattell n anul 1890, sub denumirea
de mental test. Aceast sintagm apare ntr-un articol privind
msurarea n psychologie. Prin traducere din limba englez to test are
semnificaia de a examina, a pune la prob. Exist i alte surse de
informaie referitoare la originea cuvntului test. Conform acestora,
cuvntul este derivat franceza veche, test sau tt desemnnd
creuzetul utilizat de ctre alchimiti pentru a face verificarea calitii
aurului(Helmuth Benesch, 1995).
Experiena psihodiagnostic i parcurgerea unor lucrri teoretice
eseniale din domeniu de ctre autorul acestei lucrri indic drept
necesare o serie de precizri n privina testului psihologic. Acestea
sunt :
Noiunea de test nu este specific domeniului psihologiei.
Ea este folosit n numeroase alte discipline tiinifice. Sensul
noiunii de test este multiplu, chiar n interiorul domeniului
psihologiei(procedeu pentru cercetarea unei caracteristici a
personalitii, procesul realizrii cercetrii, totalitatea
materialelor necesare pentru realizare, fiecare cercetare care
are caracteristica de prob prin sondaj, anumite procedee de
verificare matematic-statistic, scurte lucrri scrise
neplanificate n coala(Lienert/Raatz,1998,p.1).
Testul psihologic este un intrument standardizat, adic se
prezint identic pentru toi subiecii supui examinrii ;modul
fizic de prezentare este identic, este admnistrat ntr-un mod
identic, este corectat dup reguli identice i este exploatat
informational dup proceduri identice. Absena caracteristicii
numit standardizare pentru un instrument de investigaie
duce la atitudini de reinere n vederea acordrii denumirii de
test.
Testul psihologic evideniaz un comportament relevant
diagnostic, adic un comportament exprimat in forma sa
deplin i semnificativ. De exemplu, aplicarea unui test de
atenie concentrat duce la evidenierea maximei capacitate
de concentrare a ateniei subiectului . Dac nu ar fi aa,
nseamn c activitatea de concentra a subiectului nu este
relevant, nu evideniaz particularitatea lui ntr-un ansamblu
de subieci examinai cu aceeai prob. Relevana presupune
c caracteristica respectiv prezint interes deosebit pentru
cercetare i psihodiagnostic. Comportamentul care este
evideniat n cadrul efecturii unui test nu este relevant n
momentul cnd nu exprima potenialul maximal al subiectului,
la testele de randament, i cnd nu exprim o reacie tipic,
la chestionarele de personalitate.
n redarea rezultatului la un test psihologic trebuie folosim
termenii teoriei care st la baza contruciei testului.
Nerespectarea acestei exigene duce la diluarea consistenei
informaionale a testului i la confuzii interpretative.
Semnificaia cantitativ a unui rezultat este asigurat prin
raportare la rezultatele unui grup normativ, adic la un grup
avnd caracteristici similare subiectului examinat(vrst, nivel
de studii, sex, zon rezidenial, etc)
Prile componente ale unui test psihologic.
Se divid n pri materiale i de realizare.
1. Cele materiale sunt constituite din :
a. Manualul testului(descrierea testului i a destinaiei sale
psihodiagnostice, etapele construciei i fundamentele
tiinifice, indicaii privind aplicare i interpretarea
rezultatului, normele sau etaloanele) ;
b. Materialul testului(caietul testului, foile de rspuns,
materiale de transformat i prelucrat ;
c. Auxiliare de interpretare, foi de rspunsuri, folii cu orificii,
abloane de control, aparate de msur ;
2. Prile componente de realizare se prezint din punct de
vedere cronologic :
a. Indicaiile testului instruiete conductorul exeminrii
despre condiiile, realizarea i evaluarea testului i
subiecii despre ceea ce se pretinde de la ei pentru a
realiza testul ;
b. Realizarea testului poate s fie constituit dintr-o reacie
motric(exemplu tapping), o percepie senzorial(aa
cum este conceput tahistoscopul), o activitate fizic sau
mintal de rutin(exemplu iruri de perle, calcule la testul
lui Emil Kraepelin), rezolvarea unei probleme concrete
sau abstracte(remontarea dispozitivului Winkeltrieb,
remontarea pompei Schulz, mutarea turnului din Hanoi),
rezolvarea unor sarcini de gndire) sau luarea unei poziii
ntr- ntrebarea privind comportamentul trirea sau
dispoziia.
c. Evaluarea testului se poate realiza intuitiv, schematic sau
automatic i const n aceea c rezultatul efecturii
testrii este exprimat n una sau mai multe valori de
apreciere.
Criteriile de valabilitate ale unui test
Se pot distinge ntr criterii generale de valabilitate i criterii secundare
de valabilitate. Un test, pentru a putea considerat valabil, trebuie s
ndeplineasc trei criterii principale :
S fie obiectiv ;
S fie fidel ;
S fie valid ;
Criteriile secundare pe care trebuie s le ndeplineasc sunt
urmtoarele :
S fie normat ;
S fie economic ;
S fie comparabil
S fie util
n legtir cu ultimul aspect, se pot distinge urmtoarele funcii sau
utiliti ale unui test psihologic
a. Auxiliar n serviciul unei diagnoze transversale(de profil) :
Indicarea locului unui subiect n interiorul unei grupe de
subieci comparabili referitor la un anumit performan
(randament) sau la o anumit caracteristic a personalitii.
Stabilirea de deosebiri n privina reliefrii performanei sau
caracteristicii de personalitate ntre diveri indivizi sau ntre
diverse grupe ;
Luarea deciziei despre ndeplinirea sau nendeplinirea unei
condiii despre existena sau inexistena unei caracteristici
cerute sau despre gradul reliefrii caracteristicii(selecie)
Stabilirea unei combinaii de caracteristici individuale(profile
de randament sau de personalitate).
b. Ca auxiliar(mijloc) n serviciul diagnozei longitudinale.
Stabilirea transformrii unei caracteristici n injteriorul unei
perioade definite de timp(profil de desfurare) la subieci i la
grupe de subieci, n special grupe de vrst.
c. Ca auxiliar al unei cercetri
In serviciul cercetrii personalitii : stabilirea local a
raportului caracteristicilor(ansamblu de caracteristici), tipuri
de personalitate, analiz de tip) i stabilirea global a
raportului caracteristicilor(analiz de cluster, analiz
factorial)
In serviciul cercetrii psihologice generale. Stabilirea
transformrii caracteristicii n condiii de variaie planificat la
subieci(serii de ncercri) i grupuri de subieci(planuri de
cercetare).
Clasificarea testelor psihologice dup coninut
R.Brickenkamp
1. Teste de randament(Teste de dezvoltare;Teste de inteligen;
Teste generale de randament;Teste colare;Teste pentru
examinara funciilor generale i teste de aptitudini)
2. Teste psihometrice de personalitate(teste de structur a
personalitii, teste de dispoziie i interese, teste clinice;
3. Procedee de examinare a personalitii(procedee de interpetare a
formelor)(procedee verbal-tematice, procedee grafice i de
structurare
Gustav Lienert
1. Teste de inteligen(teste de inteligen general, teste speciale
de inteligen sau teste de nzestrare);
2. Teste de randament(teste de randament motric, teste de
randament senzorial, teste de randament psihic);
3. Teste de personalitate(teste de caracteristici, teste de interese,
teste de dispoziii, teste de caracter, teste de tip
Itemi i sarcini
n calitate de ansamblu de solicitri, testele psihologice au o serie
de componente elementare : itemi i sarcini. Noiunea de sarcin
este mai cuprinztoare, mai frecvent ntlnit n teoaria testului, dect
cea de item. n cazul constituirii unui nou test se alege corespunztor
un anumit tip de sarcin, operaie n cursul creia se trec n revist
referinele. Grupul de referine cuprinde :
Inelegere uoar
Realizare facil ;
Timp scurt de rezolvare ;
Material puin, respectiv folosirea unei cantiti reduse de
hrtie,
Uoar evaluare ;
Frecven redus a rezolvrilor ntmpltoare ;
Gradul de complexitate a sarcinii ;
Dependena de randamentul memoriei
Administrarea unui test psihologic presupune etalarea clar a
modului de stimulare i constituirea unui anumit dispozitiv de rspuns
la sarcin, fiecare prezentnd avantaje i dezavantaje . Acestea sunt :
Dispozitiv de rspuns corect - fals ;
Dispozitiv de rspuns de completare ;
Dispozitiv de rspuns cu alegere multipl ;
Dispozitiv de rspuns de ordonare a rspunsurilor ;
Dispozutiv de rspuns de reordonare a rspunsurilor.
Scorarea ansamblului are la baz scorarea acestor componente
elementare. Tratarea acestor dou noiuni, item i sarcin, ca avnd o
semnificaie identic este o greeal des ntlnit. Spre deosebire de
sarcin, care este o solicitare scorat specific(de regul cu o unitate),
mai ales n testele de rapiditate, itemul este o component elementar
care conine o solicitare scorat i care posed autonomie
informaional. Din analiza unui item se pot stabili aceiai indicatori
cantitativi ca i din analiza rezultatului global al unui test(medie,
varian, etc..). Dispozitivul de rspuns al unui item este de tipul
multiple choice Un capitol important din teoria psihometric este
consacrat analizei de itemi. O repercusiune imediat a nregistrrii
rezultatelor itemilor este analiza de itemi prin intermediul aa-numitei
matrice itemi-subieci, dispozitiv de analiz construit de ctre Louis
William Stern, inventatorul coeficientului de inteligen. Matricea poate
cuprinde rezultate sub form dihotomic(doar 0 i 1) sau sub form
polihotomic(de obicei valori ntre 0 i cel mai frecvent 9)
Forma dihotomic a rezultatelor itemului se prezint astfel :
Subieci Itemi
1 2 3 4 5 6 7 Total
1 1 0 1 0 1 1 1 5
2 0 1 1 0 0 0 0 2
3 0 1 1 0 0 1 1 4
4 1 0 1 0 1 1 1 5
5 1 0 1 0 1 0 0 3
6 0 0 1 1 0 0 0 2
7 1 1 1 0 0 0 1 4
8 1 0 0 0 1 1 0 3
9 0 0 1 0 1 0 1 3
10 1 1 1 0 1 1 1 6
f
i
6 4 9 1 6 5 7
p
i
0,6 0,4 0,9 0,1 0,6 0,5 0,7
q
i
0,4 0,6 0,1 0,9 0,4 0,5 0,3
Matricea prezentat mai sus constituie un exemplu didactic, cu 10 subieci i 7
itemi, n care s-a operat o simplificare. Un test cu doar 7 itemi nu poate funciona n
practica psihodiagnostic sau pentru alte scopuri, din simplul motiv c ca testul va
avea o capacitate de discriminare foarte mic. Teoreticieni reputati din domeniul
construciei instrumentelor de investigaie indic faptul c un test trebuie s
conin cel puin 20 de itemi pentru a putea funciona. Valorile 1 i 0 din interiorul
matricii pot reprezenta rspunsuri corecte(1) i false(0) la un test de randament
motric, sau, la un chestionar de personalitate, cuantificarea rspunsurilor care pun
n eviden trstura investigat(1) sau nu o pun(0). Presupunem c valorile 0 i 1
din matrive reprezint rspunsurile unor subieci la itemii unui test de randament
cognitiv. Rubrica din coloana intitulat Total conine scorul global la un test,
obinut prin adiia valorilor pe linie(scorurile obinute de un subiect care a efectuat
testul la toi itemii testului). Notaiile din extremitatea stng a ultimelor trei
coloane au urmtoarea semnificaie :
f
i
= suma scorurilor celor 10 subieci la un anumit item ;
p
i
= indicele de dificultate a unui anumit item i, totodat, media
scorurilor obinute de cei 10 subieci la un anumit item. Formula de
calcul este urmtoarea :
N
f
p
i
i

, n care N reprezint numrul subiecilor.
Indicele de dificultate oscilez ntre 0 i 1, valoarea 0 semnificnd faptul
c itemul este foarte uor(sau subiecii foarte slabi), valoarea 1
semnificnd faptul c itemul este foarte uori(sau subiecii supradotai).
n construcia testelor psihologic exist practica de a elimina itemii care
au valori ntre 0 -0,20 i ntre 0, 80 1) dup o examinare preliminar. La
chestionarele de personalitate, acest indice poate fi numit indice de
proeminen, nu indice de dificultate ;
q
i =
1 p
i
. Indic gradul de ineficacitate a grupului de subieci la un
anumit item.
Itemii pot avea i valori polihotomice, aa cum arat matricea urmtoare :
Subiecti
Itemi
I1 I2 I3 I4 I5 Total
1 3 1 3 7 1 15
2 4 2 4 6 4 20
3 5 1 5 3 7 21
4 2 3 6 6 3 20
5 1 6 1 5 6 19
6 4 2 7 4 6 23
7 5 2 2 7 4 20
8 7 2 3 6 7 25
9 1 1 5 5 5 17
10 2 3 6 4 3 18
11 4 4 4 5 4 21
f
i
38 27 48 58 50
p
i
0,49 0,35 0,62 0,75 0,65
q
i
0,51 0,65 0,38 0,25 0,35
M
i
3,45 2.45 4,36 5,27 4,54
La scala polihotomic exemplificat, scorurile itemilor variaz ntre 1 i 7. Sunt
scoruri practicate prioritar la dispozitivele de rspuns scalate Likert n cadrul
chestionarelor de atitudini. Nu sunt excluse nici la testele de randament cognitiv. n
cazul matricilor prezentnd itemi polihotomici, exist un indice de dificultate i o
medie a itemului, cei doi indicatori nu se mai identific valoric. Indicele de
dificultate are formula
max
f
f
p
i
i

n care f
max
valoarea maximal a f
i
n cazul n care
toi subiecii ar rspunde maximal. Dac toi subiecii ar rspunde maximal, atunci
s-ar obine prin nsumarea pe vertical valoarea 77. Media se obine prin divizarea
valorii f
i
la 11, adic numrul subiecilor.
Spre deosebire de itemi , sarcinile nu au autonomie informaional, ntlnindu-
se mai ales la testele de rapiditate.
Exemplu de sarcini : testul Bourdon-Amfimov.
tponpconptdklotmntrsosfocdfofdt
Ansamblul de litere nu formeaz cuvinte i nici nu se repet dup o anumit
regul. Subiectului i se cere s bareze literele o i c n mod individual i s nu
bareze celelalte litere. La ncheierea celor 10 minute acordate pentru efectuarea
testului, se ncercuiete ultima liter parcurs Se nregistreaz literele corect
barate, cele incorect barate(bararea unui q, de exemplu),cele omise(literele c i o
care nu au fost barate n poriunea parcurs n 10 minute(durata de efectuare a
testului) i cele care nu au fost parcurse. Rspunsurile se nregistreaz dup
urmtoarea schem :
Dup corectare verificarea foilor de control aflarea rspunsurilor
corecte(c), a celor false(f), a rspunsurilor evitate, omise (nu tiu, n
dispozitivul de rspuns da-nu) i a sarcinilor care nu au fost prelucrate.
Categorii :
C corecte;
F false:
O omise;
U neprelucrate.
Exemplu, candidatul i:
C
i
= numrul rspunsurilor sale corecte;
F
i
= numrul rspunsurilor sale false;
O
i
= numrul rspunsurilor omise;
U
i
= numrul rspunsurilor sale neprelucrate;
n = numrul tuturor sarcinilor.
La cele n sarcini ale unui test ia natere relaia:
C
i
+ F
i
+ O
i
+ U
i
= n
Relaia este valabil i pentru toi N subieci ai eantionului de analiz, astfel
rezult o ecuaie sum: C
i
+ F
i
+ O
i
+ U
i
= n*N sau (C
i
+ F
i
+ O
i
+
U
i
) = n*N
Ecuaiile sunt importante practic, deoarece ele fac posibil controlul
numrrii rezultatelor. Construim un exemplu fictiv pentru un numr de 183
de subieci:
Subieci Numrul sarcinii Sum
n = 1201 2.16 17. C F O+U n
C.A. C C F A 83 14 23 120
T.P C F O F.. 102 12 6 120
N.P. C O C U. 99 7 14 120
N
C
143 156 136 160 19360
N
F
34 12 30 12 1208
N
O
+N
U
6 15 17 11 1392
N*n = 21960
Aflarea valorii brute simple.
a. Fiecare candidat pentru un rspuns (corect) C obine 1 punct. Valoarea
brut X
i
a unui subiect este definit astfel: X
i =
C
i
;
b. Valoarea brut este aflat diferit prin luarea n consideraie a numrului
de rspunsuri false, la fiecare greeal fiind calculat un punct minus:
X
i
= C
i
- F
i
. Frecvent se sustrage o fraciune sau un multiplu de
rspunsuri greite. Fraciunea, respectiv multiplul, poate s fie stabilit
empiric sau prin definiie. Definiia valorii brute, reajustat prin erori,
este urmtoarea: X
i
= C
i
k*F
i
. k poate contribui prin 0,66 sau
0,33 sau 0,20.
c. Cnd o sarcin este foarte inegal ponderat n semnificaia sa pentru
test, poate fi evaluat cu dou, trei sau mai multe puncte, dac ea
este corect, i cu 0 puncte, dac ea este fals. Ponderea(greutatea) G
j
atribuit pentru o sarcin j se introduce firesc n calcularea valorii brute
ponderate X. Astfel : X = G
1
+G
2
+ G
n
sau

j
j
G X
Aflarea valorii brute cu o corectur ocazional(accidental)
Deoarece la sarcinile corect-fals i la sarcinile cu alegere multipl un
rspuns corect poate s apar prin ntmplare, sunt avantajai necritic
examinaii i dezavantajai critic examinaii. Cnd se accept c rspunsurile
greite sunt introduse prin ntmplare , rezult o corectur:
1
1


m
F
R X
i i
n care
m este numrul posibilitilor de rspuns.
Exemplu: Un subiect obime, la un test cu alegere multipl cu 4 alegeri, 62
de rspunsuri corecte i 12 rspunsuri greite. Corectura de corijare a ntmplrii
este :
58
1 4
12
62

X
La dispozitivul de rspuns la test de tipul corect - fals
exist doar o alternativ pentru rspunsurile corecte, adic X
i
= C
i
- F
i
Indicaii:
a. Cnd un test cuprinde un mare numr de sarcini, abia se poate face
deosebirea, dac se lucreaz cu sau fr corectur de ntmplare.
b. La sarcinile cu alegere multipl se recomand o corectur de
ntmplare atunci cnd avem 4 sau mai puin de 4 posibiliti de
alegere., ns numai condiia ca testul s conin relativ puine sarcini.
n afara sarcinilor cu alegere multipl i sarcinilor corect-fals, la testele
standardizate, este aplicat rar o corectur de ntmplare.
Stabilirea rezultatului brut prin corectur de eroare ntmpltoare.
Pentru fiecare test, cum se petrec lucrurile la testele de calcul cu timp
determinat, n care rezult att evaluare pentru cantitate ct i pentru calitate,
este de dorit de a exprima randamentul la test ntr-un singur scor, cantitatea
i calitatea fiind considerate mpreun ntr-o msur corespunztoare.
Cuprinderea celor dou criterii laolalt este permis doar atunci cnd aceste se
influeneaz reciproc, atunci cnd o ridicare a cantitii de randament duce la
scdere a calitii randamentului. Aceasta ar fi nemotivat, cnd o corectur
stabilit prin definiie sau o corectur de eroare prin ntmplare ne st la
ndemn, deoarece nu este acceptat ipoteza c toate erorile ar exista prin
ntmplare.
O corectur semnificativ a randamentului cantitativ pe baza diferitelor
caliti abia poate fi realizat n fapt, dac analiza sarcinilor testului a fost
realizat deja printr-un criteriu exterior, procedura cantitativ trebuie s fie ns
anticipat. Se precizeaz, ca de obicei, rspunsurile corecte i greite de la
fiecare subiect coreleaz fiecare din aceste scoruri cu valoarea criteriului i la
fel valorile corecte i cele false. Cu aceti trei coeficieni poate s se procedeze
la acceptarea unei distribuii normale trivariate dup ecuaia de corelaie
multipl. Thurstone a elaborat o formul, i anume formula pentru determinarea
ponderii erorii G
F
. n aceast formul, semnificaia simbolurilor utilizate este
urmtoarea:
S
R
= abaterea standard a scorurilor R;
S
F
= abaterea standard a scorurilor F;
r
RF
= corelaia ntre scorurile F i R;
r
RC
= corelaia ntre scorul R i scorul criteriului;
r
FC
= corelaia ntre scorurile F i scorurile criteriului.
RC RF FC F
FC RF RC r
F
r r r S
r r r S
G

( *
) ( *
Cu aceast pondere a erorii G
F
trebuie s fie multiplicat scorul erorilor F
nainte de a permite s fie adugat algebric la scorurile R.
X
i
= C
i
+ G
F
*F
i
Deoarece ponderea G
F
are practic de cele mai multe ori un semn negativ, se
rezum operaia de calcul pentru aflarea valorilor empirice corijate la o
scdere..
Exemplu
Un test de calcul are o mprtiere a scorurilor C de s
C
= 20 i o mprtiere
a valorilor de eroare de s
F
= 4. Corelaia ntre rspunsurile F i C cuprinde r
CF
=
0,1. n calitate de criteriu al randamentului la birou servete numrul de acte
ordonate i ndeplinite corect pe or. Ia natere o puternic corelaie ntre
succesul la birou i randamentul la calcul de r
CK
= 0,7 i, pe de alt parte-ceea
ce era de ateptat-o corelaie relativ mic ntre insuccesul la birou i calitatea
randamentului de calcul de r
FK
= - 0,2
De aici rezult, dup formula anterioar, o pondere a erorii de:
[ ]
87 , 1
7 , 0 1 , 0 * 1 , 0 * ) 2 , 0 ( * 4
) 2 , 0 ( 1 , 0 * 7 , 0 ( * 20

F
G
Atunci cnd dorim ca succesul muncii la birou s fie calculat, pe ct posibil,
printr-un singur scor , trebuie s aplicm formula dat anterior la un subiect RU
care a obinut 102 calcule corecte i 12 false. Valoarea corijat se prin nlocuirea
valorilor n formul:
X
RU
= 102 +(-1,87*12) = 80.
ntr-un mod simplificat, pentru a obine valoarea brut ajustat se scade
dublul erorilor din numrul de rezolvri corecte.
La testele pure de rapiditate, care trebuie evaluate separat dup
cantitate i calitate pot s fie anexate numrul sarcinilor n general prelucrate ca
valoare brut pentru cantitatea randamentului la test i calitatea s fie definit
ca procent de erori.
Harald Gulliksen consider c n construcia testelor, analizarea i interpretarea
rezultatelor, exist cinci tipuri majore de probleme:
1. Conceperea i selecia itemilor testului;
2. Alocarea unui scor fiecrei persoane;
3. Determinarea acurateii (fidelitatea sau erorile de msurare) scorurilor
testului;
4. determinarea valorii predictive a scorurilor testului(validitatea sau
eroarea de estimare)
5. Compararea rezultatelor cu acelea obinute utiliznd alte teste au alte
grupe de subieci. n realizarea acestor comparaii este necesar de a
considera efectul lungimii testului i eterogenitii grupului asupra
variatelor msurii ale acurateii i valorii predictive a scorurilor testului.
Clasificarea testelor psihologice din punct de vedere al formei
Din punct de vedere formal sau al aspectelor metodice, testele psihologice cunosc
mai multe criterii clasificare:
a. Dup gradul de standardizare i cuantificare s-a realizat diviziunea n teste
psihometrice(evaluarea se produce sub form numeric, exist norme sau
etaloane) i nepsihometrice);
b. Diviziunea testelor n teste formale i teste informale are la baz nivelul
eforturilor de dezvoltare psihometric pentru procedeul de construcie. Se
prefer denumirile de procedee de analiz i ajutoare(anexe) ale analizei
c. n funcie de indicaiile referitoare la regimul temporal prestabilit se realizeaz
diviziunea ntre teste de nivel (power Tests) i teste de rapiditate( speed
Tests). Testele de nivel sunt fr limit de timp, cu sarcini dificile, n timp ce
testele de rapiditate au o limit temporal strict prestabilit i sarcini uoare,
monotone. Se vorbete i de teste mixte, care au limite generoase de timp i
sarcini de nivel mediu.
d. Din punctul de vedere al suportului material al prezentrii stimulrii (sau
medium-ul testului) distingem ntre teste creion-hrtie i teste de aciune
sau manipulare(teste de prelucrare a materialelor), teste aparative, teste-
imagini La testul creion-hrtie, solicitarea are drept suport material ca o
simpl foaie imprimat sau un caiet cu mai multe foi, rspunsul subiectului
fiind nregistrat pe o foaie de rspuns. Aceast separare a foii de rspuns este
justificat de exigena de economicitate prezentat anterior de noi. n forma
clasic de corectare, pe foaia de rspuns se aplic un ablon care are
deschideri n dreptul variantelor corecte. n variantele moderne, rspunsurile
date de ctre subiect sunt nregistrate i prelucrate electronic, activitate care
se desfoar foarte rapid. n zilele noastre asistm la computerizarea
variantelor creion - hrtie. Menionm c nu exista identitate ntre forma
creion hrtie i cea computerizat. La testele aparative, solicitarea se prezint
cu ajutorul unui dispozitiv mecanic sau electronic, prezentnd stimulii,
nregistrnd rspunsurile corecte, greite sau omise, realiznd normarea
scorului obinut(la formele computerizate). n marea lor majoritate, testele
aparative sunt individuale i necesit costuri financiare mai mari
e. Dac lum drept criteriu de separaie numrul subiecilor examinai
concomitent, distingem ntre teste individuale i teste colective. Testul
individual se aplic unei singure persoane, n timp ce testul colectiv la mai
multe persoane odat. Avantajul aplicrii individuale const n faptul c se
poate realiza o bun observare a comportamentului subiectului n timpul
probei, dezavantajul constnd n consumul de timp raportat la persoana
examinat. Avantajul aplicrii testelor colective const n eficacitate mare de
examinare, ns nu tim dac aceasta este un avantaj aa de mare cunoscnd
faptul slabei posibiliti de observare a comportamentului examinailor. n
marea lor majoritate, testele creion-hrtie sunt teste colective. Modernizarea
intervenit prin computerizare a dus uneori la transformarea unor teste
individuale n teste colective.
f. Dup numrul dimensiunilor cuprinse n test realizm clasificarea n teste
unidimensionale i multidimensionale, varianta de exprimare fiind teste
singulare i baterii de teste. mprirea n teste singulare, i baterii de
probe nu trebuie confundat cu cea anterioar(individuale i colective),
deoarece se refer la un alt aspect. Testul singular este acel test care este
folosit n mod exclusiv sau izolat de alte teste ntr-o examinare, de exemplu
testul Rorschach. n alte cazuri se folosesc baterii de teste, adic un ansamblu
de teste. Din exploatarea informaional a unui test singular sau elementar
rezult un singurscor, pe cnd sistemele de teste obin mai mult de unul.
Scorurile pot s aib autonomie sau s fie cumulate ntr-un punctaj global.
Sistemele de teste sunt divizate n profiluri de teste i baterii de teste.
Profilurile de test sunt prezentri grafice ale rezultatelor mai multor teste.
Denumirea a fost creat n anul 1926 de ctre Grigory Ivanovich Rossolimo
. n sensul extins al cuvntului, profilul de test semnific o combinaie de mai
multe teste individuale n care fiecare test singular conserv(pstreaz)
autonomia. Alegerea testelor elementare pentru un profil este dictat de
nevoile practice. Pentru rezultatele unui singur subiect, profilul aptitudinal
poate arta n felul urmtor:
Scoruri standardizate(interquintile)
Nr.crt. Denumite test Scor brut I II III IV V
1 Bordon Amfimov 433 *
2 Kraepelin 179 *
3 AD P 84 *
4 MPR 55 *
5 Discuri Wather 142 *
Figura 3.1 Profil aptitudinal
Figura 3.2. Profil de personalitate la CPI
Exemplu: pentru descrierea ngust a unei structuri de personalitate
individuale putem ntocmi un aa-numit profil de personalitate, pentru
descrierea structurii inteligenei, un profil de inteligen, pentru descrierea
unei aptitudini profesionale un profil aptitudinal. Se vorbete n acest sens de
o combinaie ad-hoc de teste singulare despre care se crede c sunt create
pentru un scop special, i nu create arbitrar. Pentru un profil de test nu sunt
fixate exigene prea mari de natur metodologic. n consecin, se ateapt
ca fiecare test s fie ntr-o oarecare msur fidel i s coreleze relativ sczut
cu celelalte, s dovedeasc, independent unul de altul, o suficient validitate
logic sau empiric. Informaiile dobndite din profilul total duc la o
accentuat lrgire a domeniului validitii. Interpretarea unui profil nu trebuie
s plece doar de la testele individuale, ci trebuie s fac posibil o viziune
cuprinztoare. Bateriile de teste sunt combinaii de mai multe teste
individuale n care testele individuale i pierd autonomia lor, i apar n
serviciul unui scop general, i anume acela de a cuprinde, pe ct posibil de
exact, o caracteristic a personalitii definit printr-un criteriu de validitate.
Numele de baterie de teste i gsete analogia, pe de o parte, n
electrotehnic, unde mai multe elemente galvanice sunt cuplate unul lng
altul n interiorul bateriei, pe de alt parte, n tehnica rzboiului, unde mai
multe piese de artilerie contribuie laolalt pentru atingerea unui el de lupt.
n ambele cazuri, se ridic n esen problema efectivitii, numrul de voli,
respectiv puterea de foc. Alegerea testului individual pentru o baterie trebuie
s fie ghidat dup domeniul su de validitate, adic toate testele reunite ntr-
o baterie trebuie s cuprind o aceiai caracteristic a personalitii, chiar
dac, dup mprejurri, din puncte de vedere diferite Rmne deschis
problema dac domeniul caracteristicii este strict circumscris(de exemplu,
capacitatea de concentrare la diferite activiti) sau dac este mai
vast(capacitatea de randament intelectual general). Exigenele statistice fa
de testele individuale care compun o baterie de teste fac raportare la fidelitate
i nu, cu s-ar putea crede), la validitate, care este o chestiune primar a unui
test.
g. Dac lum drept criteriu de clasificare gradul subiectivitii la evaluarea i
interpretarea testelor, distingem ntre teste obiective i subiective. Dac
lum n consideraie deformarea sistematic a rezultatului testului prin
simulare, disimulare, tendina de conformism social, realizm tot o asemenea
distincie
h. Dup gradul de dependen de nivelul de nelegere a limbii i aptitudinea de
exprimare verbal distingem ntre teste verbale i neverbale.
i. Dup gradul structurrii n evaluare, deosebim ntre teste nalt
structurate(fiecare are numai o rezolvare corect posibil, rezultat obiectiv
evaluabil, sunt stabilite norme ) i slab structurate(necesit categorizarea
rspunsurilor, diferene uoare ntre evaluatori);
j. n funcie de libertatea posibilitii de rspuns, testele se divid n teste cu
dispozitiv de rspuns deschis (liber, creativ) i teste cu dispozitiv de
rspuns fixat(selectiv,impus). La testele din prima categorie, subiectul are
libertatea de a exprima rspunsul, pe cnd la cele din a doua are posibilitatea
de a alege un fel de rspuns prestabilit.
k. Lee Joseph Cronbach propune o clasificare a testelor n funcie de felul
comportamentului provocat n teste de comportament maximal i teste
de comportament specific. Din prima categorie fac parte testele de
aptitudini, din a doua teste de personalitate.
Analiza de itemi
Am prezentat anterior noiunea de item pe care am deosebit-o de cea de
sarcin, n cadrul unui test. Itemul este deci o component informaional
elementar, bazal a unui test. Teste se construiesc prin asamblarea unui numr de
itemi i scorul global al unui test reprezint suma simpl sau ponderat a
rezultatelor itemilor. Pentru a putea fi nit item, o component a unui test trebuie s
aib un dispozitiv de rspuns cu alegere multipl i independen informaional,
adic din analiza rezultatelor s poat rezulta indicatori statistici similari
rezultatului global(indicatori de dificultate, indicatori de nivel, indicatori de
mprtiere, coeficieni de corelaie, coeficieni de validitate). Teoria testului dispune
de reguli dup care un item servete pentru un anumit scop diagnostic i despre
modul de construcie al itemilor i despre asamblarea lor ntr-un ntreg Cunoscutul
teoretician american al testului psihologic Paul Horst face urmtoarea
afirmaie:Procedurile de alegere a itemilor la construcia de teste psihologice sunt
numite analize de itemi(Horst,1971). Autorul american mai adaug precizarea c
aceast noiune este de cele mai multe ori utilizat imprecis, deoarece felul
analizelor realizate nu este suficient de clar specificat. Exist diferite feluri de
analize de itemi care depind de scopurile speciale cu care construim un anumit test.
Din ansamblurile de itemi(populaiile de itemi) care sunt constituite anterior
construciei testelor sunt selecionai itemi care vor forma unul sau mai multe
grupuri de itemi. Distribuiile rezultatelor, corelaiile i indicatorii care rezult din
analiza acestor grupuri de itemi trebuie s satisfac anumite condiii. Cele mai
frecvente analize de itemi sunt urmtoarele:
Analiza dificultii;
Analiza omogenitii;
Analiza specificitii;
Analiza validitii, analiza asimetriei i excesului
Analiza dificultii. Este analiza cea mai simpl, cea mai rspndit i cea
mai logic. Se practic la testele de randament cognitiv, n special. Din aceast
analiz rezult cota parte procentual sau sub form de proporie a acelor examinai
ai unui eantion care au rezolvat corect acest item. Am indicat n spaiul anterior
modul de calcul pentu itemii exprimai dihotomic i polihotomic. Avnd la dispoziie
rezultatele despre indicii de dificultate ai unui test dihotomic sau polihotomic, putem
stabili variana itemului care este un indicator grosier al capacitii de discriminare a
unui item. Din tabelul anterior al matricii itemi- subieci(forma dihotomic), prelum
ultimele trei linii, la care adaugm o linie ce conine valorile varianei:
f
i
6 4 9 1 6 5 7
p
i
0,6 0,4 0,9 0,1 0,6 0,5 0,7
q
i
0,4 0,6 0,1 0,9 0,4 0,5 0,3
s
2
i
0,24 0,24 0,09 0,09 0,24 0,25 0,21
Formula de calcul pentru varian este urmtoarea: i i i
q p s
2
. Dac unul din
termenii acestei nmuliri este egal cu 0, atunci i produsul este egal cu 0. Deci, un
item la care rspund corect toi subiecii sau la care rspund incorect toi subiecii
este nul din punctul de vedere al discriminrii, valoarea produsului fiind 0.
Capacitatea maxim de discriminare a unui item o avem n situaia n care un
item este rezolvat corect de jumtate din subiect i rezolvat incorect de cealalt
jumtate. Oscilaia valoric a varianei unui item este n intervalul 0 - 0,25. Diferite
ipostaze ale varianei unui item le prezentm n figura urmtoare.

Evolutia variantei itemului dihotomic
Analiza distractorilor. Prin analiza distractorilor se intenioneaz de a determina
la fiecare item plauzibilitatea distractorilor. n urma acestei analize se poate ti care
distractori sunt puini plauzibili i care sunt foarte aproape de rspunsul corect.
Evidenierea pluazibilitii distractorilor se poate face prin analiza frecvenei alegerii
lor. Prezentm forma cea mai comun prin care sunt nregistrate rezultatele unui
subiect. Sunt nregistrate rspunsurile corecte(notate cu 1) i rspunsurile
incorecte(notate cu 0)
Itemi
Sub

1 2 3 4 5 6 7 8 X
1
1 1 0 1 0 1 1 1
6
2
1 0 0 1 0 1 1 0
4
3
0 0 1 0 1 0 0 0
2
4
0 1 0 0 1 1 0 1
4
5
1 0 0 1 0 0 1 1
4
6
1 0 0 1 1 1 1 1
6
7
0 0 0 1 0 1 1 0
3
8
0 1 1 1 0 1 1 1
6
9
1 0 0 0 0 1 0 0
2
10
0 1 0 0 0 1 1 1
4
f
i
5 4 2 6 3 8 7 6 41
p
i
0,5 0,4 0,2 0,6 0,3 0,2 0,7 0.6
q
i
0,5 0,6 0,8 0,4 0,7 0,8 0,3 0,6
Matrice itemi-subieci, pentru un tip de sarcin cu 6 alegeri multiple .
Forma original se prezentare
Aceast matrice se poate exprima i sub forma evidenierii fiecrui distractor ales
ntr-un dispozitiv de rspuns de tip multiple choice cu 6 alegeri.
Itemi
Sub

1 2 3 4 5 6 7 8 X
1 4 2
4
6
2
5 4 2 6
2 4
1 5
6
3
5 4
1
4
3
1 5
3
1
1
1 5 3
2
4
5
2
6 4
1 5
2
2 4
5 4
4 1
6
5 4
4 2 4
6 4
3 4
6 1 5 4 2 6
7
5 6 2
6
4
5 4
4
3
8
3
2 3 6
1
5 4 2 6
9 4
1 5 5 6
5
1 6
2
10
6
2
2 2 5
5
4
2 4
f
i
5 4 2 6 3 8 7 6 41
p
i
0,5 0,4 0,2 0,6 0,3 0,2 0,7 0.6
q
i
0,5 0,6 0,8 0,4 0,7 0,8 0,3 0,6
Form de prezentare cu evidenierea distractorului ales
(rspunsul corect este ntrit)
Aceast form de prezentare prezint avantajul c ofer informaii pentru
reconfigurarea itemului, n cazul n care acesta se dovedete a fi deficitar n privina
satisfacerii criteriilor de apreciere pentru a fi introdus ntr-un test. Un distractor care
nu este ales de nici un subiect, sau este ales de foarte puini subieci, poate fi
considerat inutil i, n consecin, trebuie s fie eliminat din test sau revizuit.
Spunem despre un asemenea item c este neverosimil, atunci cnd nu intr n
atenia subiectului cruia i este administrat proba. Invers, dac un distractor este
ales de o proporie apreciabil de subieci, atunci spunem despre item c este
verosimil sau atractiv. n cazul destul de rar al preferrii de o proporie de subieci
mai mare chiar dect varianta de rspuns corect, atunci spunem despre item c
este supra-atractiv
S presupunem c am examinat cu un test de randament cognitiv cu dispozitiv
de rspuns de tip multiple choice un numr de 354 de subieci i distribuia
rspunsurilor pentru fiecare din cele 6 variante de rspuns ale itemului 25, de
exemplu, dintre care una corect(numerotat cu 4) i 5(variantele de rspuns
1,2,3,5,6) distractori ar fi urmtoarea:
Varianta de rspuns 1 2 3 4 5 6
Frecvena 0 0 0 354 0 0
Inspectnd vizual o astfel de distribuie a variantelor de rspuns, putem s
oferim dou ipoteze: or subiecii sunt geniali (dei tim c nu se nasc genii pe
strad, nici la ua cafenelei), or distractorii sun foarte puini verosimili. Situaia
existente la ceilali itemi ne poate ajuta s identificm cauza. n cazul n care
distractorii sunt foarte puini verosimili, subiectul va descoperi foarte uor rspunsul
corect. Dac situaia s-ar prezenta n felul urmtor, alta ar fi aprecierea noastr
privind adecvarea itemului:
Varianta de rspuns 1 2 3 4 5 6
Frecvena 19 14 35 214 40 32
Exist procedee de a detecta itemii neverosimili sau valabilitatea dispozitivului
de rspuns. Unul din procedee este de a examina frecvena alegerilor variantelor de
rspuns. Redm situaia din tabelul anterior, exprimat n procente:
Varianta de rspuns 1 2 3 4 5 6
Frecvena 5,34% 3,96% 9,89% 60% 11,29% 9,03%
In ultimul tabel, rspunsul corect a fost ales de 60% dintre respondeni, pe cnd
distractorii n ansamblu au fost alei n procent de 40%
Kevin Murphy i Charles Davidshofer consider c un item perfect dintr-un
test are dou caracteristici:
1. Subiecii care cunosc rspunsul corect la solicitarea cognitiv vor alege
mereu rspunsul corect;
2. Subiecii care nu cunosc rspunsul corect vor alege ntmpltor ntre
rspunsurile posibile. Astfel de oameni pot ghici rspunsul corect i
fiecare rspuns incorect este egal n preferine.
(Murphy&Davidshofer,2001.p.194))
La itemul exemplificat anterior, 60% dintre subieci au rspuns corect i 40 %
incorect. Dac considerm itemul perfect conform aprecierii autorilor americani, ar
trebui ca procentul de 40% s fie divizat egal l
a toi cei 5 distractori, Deci, situaia ideal ar trebui s arata n felul urmtor:
Varianta de rspuns 1 2 3 4 5 6
Frecvena 8% 8% 8% 60% 8% 8%
Exprimat n valori absolute. Distribuia s-ar prezenta astfel:
Varianta de rspuns 1 2 3 4 5 6
Frecvena 28 28 28 214 28 28
Rezultatele acestea sunt obinute prin mprirea sumei rspunsurilor incorecte, sub
form de frecvene absolute sau relative, la numrul de distractori. Dac am realiza
un test
2
, am obine urmtorul tabel.
Distractor f
o
ft f
o
-f
t
(f
0
-f
t
)
2
(f
0
-f
t
)
2
/ft
1 19 28 -9 81 2,89
2 14 28 -14 196 7
3 35 28 7 49 1,75
5 40 28 12 144 5.14
6 32 28 4 16 0,57

2
= 17,35
Interpretnd valoarea lui
2
pentru 4 grade de libertate, rezult o respingere a
ipotezei de nul(p<0,01).
n situaia n care numrul de persoane care aleg un distractor excede semnificativ
numrul ateptat, exist dou explicaii:
1. Este posibil ca alegerea s reflecte cunoaterea parial
2. O posibilitate mai ngrijortoare este c itemul este construit pe baza unui
simplu iretlic.
Dac mai mult de unul din distractori este extrem de popular printre subiecii care
au o bun cunoatere a domeniului cuprins de item i dac identificarea rspunsului
corect depinde de cteva puncte obscure sau subtile, itemul nu este probabil s fie
o msur valid a domeniului de coninut. n asemenea situaii, itemii extrem de
dificili sau subtili sunt dezirabili, ca i cum elul este de a msura diferenele
individuale printre subieci la captul superior al distribuiei scorurilor (exemplu
competitorii pentru bursele unei universiti). n cele mai multe situaii, aceste tipuri
de item cu distractori extrem de populari este probabil s influeneze calitatea
global a unui test. Pentru cele mai multe teste, prezena itemilor cu distractori
extrem de populari este probabil de a reduce fidelitatea i validitatea unui test.
Anumii distractori sunt extrem de nepopulari. Numrul subiecilor care aleg
actual acest rspuns este considerabil mai mic dect numrul care se ateapt prin
ans. Prezena unui distractor extrem de nepopular sau neplauzibil afecteaz un
numr important de caracteristici ale itemului. Cel mai clar efect al unui distractor
nepopular este c el scade dificultatea itemului. Dac o persoan nu cunoate
absolut nimic despre domeniul care este testat, probabilitatea de a alege rspunsul
corect la un item cu patru alegeri posibile este una din patru.
Criterii de apreciere a itemilor
Dany Laveault i Jacques Grgoire compar analiza de itemi cu repetiia
unei orchestre, unde fiecare instrument component trebuie s funcioneze n
armonie cu toate celelalte. De asemenea, fiecare item intervine ntr-un anumit
moment impus de compozitor i stabilit de dirijor(Laveault, Grgoire, 1997, p.223).
n analiza de itemi trebuie s identificm itemii care nu acioneaz n armonie
cu toi ceilali sau care nu respect un anumit ritm. Scopul constructorului de test
este de a verifica faptul c mesajul furnizat este clar, armonios i precis. Analiza de
itemi ajut constructorul testelor de a alege cei mai buni itemi plecnd de la un
ansamblu incipient mai mare dect necesar.
Analiza de itemi poate lua mai multe forme, funcie de obiectivele
constructorului testului i, de asemenea, de metoda de pregtire a testului. Analiza
de itemi corespunde, mai nti, la un proces de selecie, n forma final fiind reinui
cei mai buni. n edumetrie, funcia de evaluare decide modul de desfurare a
analizei de itemi. n cadrul unui examen final, administrat n vederea unei evaluri
sumative, analiza de itemi va fi puternic diferit de aceea a unui instrument de
msur criterial, administrat n vederea unei evaluri diagnostice sau a unei evaluri
formative. Itemul care este considerat perfect n cadrul unei evaluri formative,
poate s nu posede caracteristicile dorite pentru o bun evaluare sumativ.
Am amintit anterior tipurile de analize care se pot face care pot susine
valabilitatea unui item. Aceste tipuri de analize se concretizeaz ntr-o serie de
indicatori cantitativi. Dintre indicatorii care pot ajute s selecionm itemii n funcie
de obiectivele de evaluare a unui test, sunt de menionat urmtorii:
Indicele de dificultate;
Indicele d discriminare;
Indicele de fidelitate;
Indicele de validitate
Aceti indici trebuie s fie interpretai n funcie de contextul n care
instrumentul din care trebuie s fac parte este folosit. Dificultatea itemului depinde
de grup(puternic sau slab) i de ateptrile fa de grup. Interpretarea dificultii
depinde de rspunsurile pe care le dm la urmtoarele ntrebri:
Itemul msoar un obiectiv esenial, intermediar sau o aptitudine
complex?
Este vorba de un grup puternic sau de un grup slab?
Indicele de dificultatea itemului.
n cazul testelor de randament, n care problema este pus n form
dihotomic , este important sistemul de scorare (adic s decidem dac la itemi
putem obine un punct sau nici un punct(dup sistemul totul sau nimic), sau
polihotomic(subiectul poate primi puncte pe o scal gradat de la 1 la k).
Procedura de calculare este de a mpri suma rezultatelor obinute de subieci la un
item la numrul total de subieci. Mediile nu permit de a calcula dificultatea relativ
a fiecrui item. Dac dorim s comparm dificultatea relativ a mai multor itemi,
trebuie s reducem mediile lor la o scal comparabil. Poate fi complicat de a
analiza rezultatele la un test ai crui itemi sunt notai pe scale diferite.
Interpretarea indicelui de dificultate poate fi influenat de doi factori:
1. numrul de rspunsuri omise;
2. probabilitatea de reuit a itemului prin pura ntmplare.
n situaia n care un mare numr de persoane nu a putut s rspund la un item,
din cauza limitrii timpului de administrare, indicele de dificultate nu reflect
veritabila dificultate a itemului. n astfel de situaii, indicele de dificultate msoar
dou aspecte: dificultatea itemului i rapiditatea respondentului
Este posibil de a corija indicele de dificultate prin efectul hazardului, de fiecare
dat cnd se poate admite o asemenea ipotez. Formula de corecie a indicelui de
dificultate prin hazard este urmtoarea:
Corecia nu este necesar pentru a compara indicii de dificultate. Dac formatul
ntrebrilor variaz(m=2,3,4,5) va fi necesar de a efectua corecia pentru a putea
compara dificultatea itemilor plecnd de la o baz comun.
Subiec
t
Item cu 2
alegeri
Item cu 4
alegeri
Item cu 6
alegeri
Item cu 8
alegeri
1 0 0 0 0
2 1 1 1 1
3 0 0 0 0
4 1 1 1 1
5 1 1 1 1
6 1 1 1 1
7 0 0 0 0
8 1 1 1 1
1
]
1


1
1
'
M
p
p p
Legend n aceast formul, semnificaia simbolurilor este urmtoarea:
p

repezint indicele de dificultate corijat;


p reprezint indicele de dificultate de plecare ;
M numrul de alegeri dde rspunsuri pentru acel item
9 1 1 1 1
10 1 1 1 1
p 0,7 0,7 0,7 0,7
p

0,4 0,6 0,64 0,66


p-p 0,3 0,1 0,06 0,04
Observm faptul c itemii care posed dispozitiv de rspuns cu numr mai
mare de alegeri sufer o corecie mai uoar n comparaie cu itemii cu numr mic
de alegeri. Corecia rspunsului indic un item mai dificili dect dificultatea de
plecare.
Chiar dac corecia prin efectul hazardului prezint o anumit utilitate, nu este
bine ca ea s fie aplicat n mod sistematic. Raiunile pentru care se recomand de
a nu se face aceast corecie sunt:
Este foarte puin plauzibil ca un subiect s rspund cu adevrat la
ntmplare. El dispune totdeauna de o cunoatere parial care-i permite
de a elimina alegerea rspunsurilor. O ntrebare cu 7 rspunsuri se poate
reduce la 4 sau trei rspunsuri,
Corecia nu schimb locul ocupat de subieci ntr-un clasament
Discriminarea itemului
n momentul n care dorim s difereniem scorurile subiecilor, capacitatea de
discriminare a unui item devine foarte important. Ca atare, va trebui s departajm
subiecii care are au un scor bun de subiecii care au un scor slab. Un item de bun
calitate este cel care va fi rezolvat corect de subiecii care au reuit o bun
performan la ansamblul testului. n caz contrar, itemul nu va fi apreciat din
punctul de vedere al capacitii de discriminare. Itemul cu o bun capacitate de
discriminare va avea o bun corelaie cu scorul total al testului. Discriminarea nu
are importan n toate situaiile. n cazul pedagogiei avem frecvent obiectivul ca
subiectul s stpneasc un obiectiv de nvare ntr-o proporie covritoare
nainte(90% i chiar peste) nainte de a trece la obiectivul urmtor. Deoarece
intenia este ca toi elevii s ating acest obiectiv, discriminarea pierde din
Legend n aceast formul, semnificaia simbolurilor este urmtoarea:
p

repezint indicele de dificultate corijat;


p reprezint indicele de dificultate de plecare ;
M numrul de alegeri dde rspunsuri pentru acel item
importan. Formatorul simte nevoia s discrimineze ntre cei ce stpnesc
obiectivul formrii de cei care nu-l stpnesc. Itemii care vor ajuta cel mai mult
formatorul sunt cei care au fost influenai de actul de nvare. Aceti itemi trebuie
s fie reuii de ctre o mare proporie de subieci dup nvare, n consecin
distribuia rezultatelor va fi o asimetrie negativ. Subiecii care rateaz astfel de
itemi sunt cei care vor avea nevoie de explicaii complementare sau a unei nvri
corective. Evaluarea formativ are nevoie accentuat de acest gen de discriminare.
Variana itemului i variana testului n ansamblu sunt indicatori ai capacitii
de discriminare. Am amintit tratat ntr-un curs anterior variana itemului i evoluia
acesteia n funcie de evoluia indicelui de dificultate. Ne propunem s urmrim
relaia dintre introducerea de noi itemi i variana de ansamblu a testului.
I1 I1 I2 I2 I3 I3 X X I4 I4 X+4 I5 I5 X+I5 X+I5 I6 I6 X+6 X+6
1 1 1 1 1 1 3 3 1 1 4 1 1 4 4 0 0 3 3
0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 1 1 1 1
1 1 1 1 1 1 3 3 1 1 4 1 1 4 4 0 0 3 3
0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 1 1 1 1
1 1 1 1 1 1 3 3 1 1 4 1 1 4 4 0 0 3 3
0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 1 1 1 1
1 1 1 1 1 1 3 3 1 1 4 1 1 4 4 0 0 3 3
0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 1 1 1 1
1 1 1 1 1 1 3 3 1 1 4 1 1 4 4 0 0 3 3
0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 1 1 1 1
1 1 1 1 1 1 3 3 1 1 4 1 1 4 4 0 0 3 3
s s
2 2
= 2,24 = 2,24 s
2
= 2,2 s s
2 2
= 3,9 = 3,9 s s
2 2
= 0,99 = 0,99
Presupunem ca avem situaia simplificat ( pur ilustrativ, deoarece n practic
nu ne ntlnim cu o astfel de situaie) a unui test cu trei itemi. Aceti itemi sunt
notai cu I1, I2 i I3.rezultatul global la test fiind notat cu X. Variana testului este n
acest caz egal cu 2,24, aa cum se arat n partea de jos a tabelului. La acest prim
ansamblu de adaug itemul I4, care, aa cum se observ, este un item foarte uor.
Calcularea varianei scorului testului(X+I4) d valoarea 2,2. Deci o valoare mai
mic dect cea de plecare. Concluzia este urmtoarea: adugarea unui item nu
mrete capacitatea de discriminare a testului.
Presupunem c la situaia de plecare adugm itemul notat cu I5, care este un
item omogen, adic un item care o structur a rspunsurilor identic cu cea a celor
trei itemi din situaia de plecare. Variana scorului testului(X+I5) este, n acest caz,
egal cu 3,9. Concluzia: adugarea unui item eterogen la un test mrete
capacitatea de discriminare a acestuia.
n continuare, la situaia de plecare adugm itemul I6, care este un item
eterogen, adic un item cu o distribuia a rspunsurilor diferit total de a celorlali
itemi. Variana tesului este egal, n acest ultim caz, cu 0,99. Concluzia: Adugarea
unui item eterogen la un test micoreaz capacitatea de discriminare a testului.
Este important de a stabili repere pentru aprecierea maximului de discriminare
care poate rezulta n urma examinrii unei anumite structuri de rspuns dintr-un
ansamblu de itemi. Se distinge ntre trei feluri de varian: varian observat,
varian maximal accesibil i maximal. Ne referim la variana rezultatului global
Tipuri de variane
Observat Maximal
accesibil
maximal
I 1 I 2 I 3 X I 1 I2 I 3 X I 1 I 2 I 3 X
1 1 1 3 1 1 1 3 1 1 1 3
0 0 0 0 1 1 1 3 1 1 1 3
1 1 0 2 1 1 1 3 1 1 1 3
1 0 1 2 1 1 1 3 1 1 1 3
1 0 1 2 1 0 1 2 1 1 1 3
0 0 1 1 1 0 1 2 0 0 0 0
1 0 1 2 0 0 1 1 0 0 0 0
1 1 1 3 0 0 0 0 0 0 0 0
0 1 0 1 0 0 0 0 0 0 0 0
0 0 1 1 0 0 0 0 0 0 0 0
s
2
=0,47 s
2 =
1,01 s
2
=1,84
Variana observat este variana calculat din rspunsurile reale care le d un
anumit subiect. Observm c aceast varian are valoarea de 0,47. Variana
maximal accesibil este un reper pentru devenirea valorii varianei n cazul n care
rspunsurile corecte ale subiecilor examinai s-ar alinia ct de mult se poate.
Valoarea acestei variane se ridic la valoarea 1,o1. Observarea rubricilor varianei
observate ne arat faptul c avem de-a face cu o situaie virtual n cazul existenei
a trei itemi: situaia n care subiecii rspund rspund rezolva identic jumtate din
itemi i nu rezolv cealalt jumtate. Valoarea acesteia este de 1,84. Pentru situaia
examinrii cu trei itemi, nu se poate obine o varian mai mare.
n continuare, vom prezenta trei tipuri de indici de discriminare:
Indicele de deiscriminare D
Coeficientul de corelaie biserial(r
bis
) i coeficientul de corelaie
punct-biseial;
Indicele de sensibiilitate a nvrii S
Indicele de discriminare D sau indicele lui Findley.
Acest indice, care a fost pun n circulaie de ctre W.G.Findley, este o
diferen care se stabilete intre indicele de dificultate a unui item pentru
grupul performant(p
+
) i indicele de dificultate pentru indicele de dificultate
pentru grupul numit slab(p
-
).
Cu ct D este mai mare, cu att itemul
discrimineaz mai bine ntre subiecii care au un
scor nalt i cei care au nun scor sczut. n anul 1939, T.L.Kelley propune ca
grupul puternic s fie constituit din primele 27% din rezultate, i grupul slab
din ultimele 27% din rezultate. De exemplu, ntr-un grup de 42 de subeci,
procentul de 27% reprezint n valoare absolut 11,34 (11 repondeni) i
ultimii 27% la fel. Deci 11 subieci aparin grupului puternic i tot atia
grupului slab. Un exemplu imaginat:
R I1 I2 I3 I4 I5 I6 I7 I8 I9 I1
0
I1
1
I1
2
I1
3
I1
4
X
1 1 0 1 0 0 1 1 0 1 1 1 0 1 1 67
2 1 1 1 1 0 1 0 0 0 1 0 0 0 0 63
3 0 1 0 0 1 1 1 0 1 1 1 1 0 0 60
4 0 0 0 0 1 1 0 1 0 1 1 1 1 1 57
5 1 0 1 0 0 1 1 1 1 1 1 1 1 1 56
6 1 1 1 1 0 1 1 0 1 1 1 1 1 1 54
7 0 1 1 1 0 0 1 0 1 1 1 0 1 0 53
8 1 1 1 1 1 1 0 0 1 1 1 1 0 0 52
9 1 1 1 0 1 1 0 1 1 1 1 1 1 1 50
1 1 1 0 1 1 1 1 0 1 1 1 0 1 1 49
D = (p
+)
(p
-
)
0
1
1
0 0 1 1 0 0 1 1 0 1 0 1 1 1 47
p
+
.
64
.
64
.
73
.
54
.
46
.
82
.
64
.
36
.
73
1.
0
.
82
.
64
.
73
.
64
.................. ............ ........... ......... ......... ...... ......... ........
.......... ....... ......... ...... .....
3
2
0 0 1 0 1 1 1 0 0 0 1 1 1 1 29
3
3
0 0 0 0 1 0 0 0 0 0 0 0 1 1 28
3
4
1 0 0 1 1 0 0 1 0 0 0 0 1 0 27
3
5
1 0 0 1 0 0 1 1 0 0 0 0 0 0 25
3
6
0 1 1 0 0 0 1 0 1 0 0 1 0 0 23
3
7
0 1 1 0 0 1 1 0 1 1 0 1 0 1 21
3
8
0 0 0 0 1 1 0 0 1 0 1 0 1 0 20
3
9
1 0 0 1 1 1 1 0 0 1 0 0 0 1 18
4
0
1 0 0 1 0 0 1 1 1 1 1 1 1 0 16
4
1
0 1 1 0 1 0 0 1 1 0 0 0 0 0 14
4
2
0 0 0 0 1 0 1 0 1 1 0 0 1 0 12
p
-
.
36
.
27
.
36
.
36
.
64
.
36
.
64
.
36
.
54
.
36
.
27
.
36
.
54
.
36
Prin R desemnm rangul subiecilor n funcie de rezultatul global.
Pentru a calcula indicii de discriminare(D) i a putea opera o selecie a
itemilor n funcie de discriminare avem nevoie de dou rubrici: rubrica D,
care rezult diferena p
+
- p
-
i rubrica p, indicele de dificultate pe ansamblul
testului care este imaginat:
Ite
m
I1 I2 I3 I4 I5 I6 I7 I8 I9 I1
0
I1
1
I1
2
I1
3
I14
D .
28
.
37
,
37
,
18
-.18 ,
46
.0 0 ,
19
.
64
.
55
.
26
.
19
.26
p ,
65
.
74
.
59
,
15
0,1
9
.
79
,
19
.
48
,
57
.
62
.
55
.
35
.
60
,18
Pentru indicele de dificultate lum n considerare urmtoarele repere:
0 - 0,20 : itemi rspini(prea dificili);
0,21 0,80: itemi admii;
0,81 1,00; itemi respini(prea uori)
Pentru indicele de discriminare D, R.L.Ebel a propus urmtoarele valori-
reper:
0,40 i peste : itemi care discrimineaz foarte bine;
0,30 0,39: itemi care discrimineaz bine;
0,20 - 0,29: itemi care discrimineaz puini;
0,10 019 :itemi de limit, propui pentru ameliorare;
Mai puin de 0,10; itemi fr utilitate real
Vom considera itemii care nu corespund n privina discriminrii, acei
itemi care au sub valoarea 0,20. Indicii de discriminare capt valori ntre 1
i +1.
n continuare, prezentm un tabel care ncadreaz itemii n criteirile de
apreciere ale celor doi indicatori.
Indicele de dificultate p
0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00
1,00
I
n
d
i
c
e
l
e

d
e

d
i
s
c
r
i
m
i
n
a
r
e

D 0,90
0,80
0,70 10
0,60 11
0,50 6
0,40 3 2
0,30 12 1
0,20 4, 14 9,13
0,10
0 7 8
-0,10
-0,20 5
-0,30
-0,40
-0,50
-0,60
-0,70
-0,80
-0,90
-1,00
Din acest tabel se pot detecta 3 categorii de itemi:
1. Itemi admii(care corespund la ambele criterii culoarea verde):1,2,3,6 ,
10,11,12;
2. Itemi propui pentru revizuire(care corespund doar la un criteriu-culoarea
albastr):8,9,13,14.;
3. Itemi respini(care nu corespund la nici un criteriu- culoarea roie): 4,5,7;
Indicele de discriminare exprimat prin calcularea coeficientului de corelaie
biserial punct biserial presupune date despre rezultatele obinute de ctre
respondeni la un anumit item i datele rezultatului global al testului.
Semnificaia coeficientului de discriminare
Coeficientul de discriminare, obinut prin corelarea unui item dihotomic i un
rezultat total care se prezint sub form continu, are urmtoarele formule:
q p
s
X X
r
x
q p
pbis

sau
q
p
s
X X
r
x
p
pbis

Semnificaia simbolurilor din formul este urmtoarea:


r
pbis =
coeficientul de corelaie punct biserial;


p
X
media acelor rezultate globale la care subiectul a rezolvat corect
sarcina;


q
X
media acelor rezultate globale la care subiectul nu a rezolvat
corect sarcina;
X media rezultatelor globale la pentru ntregul lot de subieci;
s
x
= abaterea standard a tuturor rezultatelor globale;
p = indicele de eficacitate a itemului;
q = indicele de ineficacitate a itemului
Coeficientul de discriminare a unui item i este egal corelaiei ntre
punctajul la item, de cele mai multe ori exprimat prin 0 i 1, i valorile brute
ale ale rezultatului global la test al celor N examinai din eantion.
Un coeficient nalt de discriminare indic faptul c itemul corespunztor
difereniaz clar subiecii n buni i slabi , prin aceea c examinaii buni
rezolv corect itemul i examinaii slabii dau un rspuns fals, de cele mai
multe ori, la item.
Un coeficient de discriminare egal cu 0 exprima faptul c rspunsurile corecte
la itemi sunt distribuite n mod egal ntre subiecii cu performan crescut i
cei cu performan sczut.
Un coeficient de discriminare negativ indic faptul c itemii cu rspuns
incorect aparin subiecilor buni i cei cu rspuns corect subiecilor slabi( o
cauz ar fi c subiectul nu a neles sarcina respectiv.pentru calcularea
coeficientului de duscriminare exist mai multe metode )
Exemplu: S presupunem c aven la dispoziie datele rezultatelor a 12 subieci la un
item i i rezultatul global X (la un test de randament cognitiv).
Subiect Item i X(rezultat global la test)
1 1 63
2 0 47
3 1 76
4 0 55
5 1 79
6 1 68
7 0 51
8 1 62
9 0 48
10 1 59
11 0 44
12 0 43
P 0,5 X 57,91
Q 0,5 s
x
=12,1
83 , 67
6
59 62 68 79 76 63

+ + + + +

p
X
48
6
43 44 48 51 55 47

+ + + + +

q
X
82 , 0 5 , 0 5 , 0
1 , 12
48 83 , 67

pbis
r
Observm cu uurin, n tabelul cuprinznd rezultatele de la item i rezultatul
global, c rezultatul 1 la item corespunde la cele mai mari valori ale rezultatului global. n
condiiile n care indicele de eficien a itemului nu se schimb, dar rezultatele 1 la item
corespund celor mai slabe rezultate globale, situaia coeficientului de corelaie se
schimb radical. Ilustrm o asemenea situaie:
Subiect Item i X(rezultat global la test)
1 1 47
2 0 63
3 1 55
4 0 76
5 1 43
6 1 51
7 0 68
8 1 48
9 0 62
10 1 44
11 0 59
12 0 79
p 0,5 X 57,91
q 0,5 s
x
=12,1
82 , 0 5 , 0 5 , 0
1 , 12
83 , 67 48

pbis
r
Valoarea + 0,82 indic o valoare nalt a coeficientului de corelaie i
,n consecin, itemul este unul omogen, adic un item care trage n aceeai
direcie cu testul. Valoarea 0,82 indic un item eterogen, adic un item care nu
contribuie la capacitatea de discriminare a rezultatului global al testului.
Cealalt formul d un rezultate echivalent(varianta primului tabel):
82 , 0 1
1 , 12
92 , 9
5 , 0
5 , 0
1 , 12
91 , 57 83 , 67

q
p
s
X X
r
x
p
pbis
Corelaia punct biserial se aplic n situaia n care itemulul nu este dihotomic, ci
dihotomizat. Formula n acest caz devine:
y p
s
X X
r
x
q p
pbis

sau
y
p
s
X X
r
x
p
pbis

Valoarea y este densitatea de repartiie corespondent valorii unui anumit p.


Exemplu:
Valoarea p Valoarea densitate de repartiie Y
0,99 0,0267
0,84 0,2433
0,73 0,3306
0,61 0,3837
0,5 0,3989
0,42 0,3909
S presupunem c am avea urmtoarea situaie, cu valori dihotomizate ale itemului
Subiect Itemi(valoarea iniial Dihotomizare(i<6 =0; i6 = 1) X
1 3 0 123
2 5 0 134
3 6 1 145
4 7 1 112
5 11 1 138
6 4 0 109
7 10 1 144
8 7 1 132
9 5 0 128
10 8 1 140
11 8 1 102
12 2 0 139
p 0,58
83 , 128 X
q 0,42
Pentru efectuarea calculelor mai avem nevoie de urmtoarelor valori: p
X
=130,71 i
s
x
= 14,37( valoarea abaterii standard a ntregii distribuii)
Urmeaz:
157 , 0
3989 , 0
58 , 0
37 , 14
83 , 128 71 , 130

y
p
s
X X
r
x
p
pbis
Valoarea coeficientului de corelaie este slab.
Frederic M. Lord i Melvin R. Novick au demonstrat superioritatea cu 20%
a coeficientului de corelaie biserial fa de coeficientul de corelaie punct-biserial.
Urmtoarea ecuaie permite de a transforma un coeficient de corelaie punct-
biserial n unul biserial.
pbis bis
r
Y
q p
r

D. Magnuson a demonstrat c un coeficient de corelaie biserial poate fi, n


cazul valorilor extreme, pn la de patru ori superior coeficientului de corelaie
punct biserial. Aceasta se datoreaz faptului c slaba varian a itemilor afecteaz
mult valoarea maxim pe care o poate lua corelaia punct biserial, care este un
echivalent algebric a r-ului lui Karl Pearson.
Indicele de sensibilitate a nvrii
R.C.Cox i J.S.Vargas au propus indicele de sensibilitate la nvare pentru a
determina care itemi sunt cei mai afectai de nvare. Indicele rezult din diferena
dintre indicele de dificultate (sau de eficacitate) nainte de nvare(p
ante
) i dup
nvare(p
post
). Formula este:
S = p
post
- p
ante
Cu ct S este mai ridicat, cu att efectul de nvare este mai mare. Dac un item
este reuit la pre-test de 34% din elevi i la post-test de 92%, atunci indicele de
sensibilitate la nvare este: S = 0,92 0,34 =0,58 Rezultatul poate fi interpretat ca
o bun discriminare a itemului ntre elevii care nu reueau itemul nainte de nvare
i elevii care-l reuesc dup. Valoarea negativ sau valoarea 0 poate fi interpretat
n dou feluri:
1. Itemul nu convine, deoarece el nu se poart asupra nvrii;
2. Itemul nu are nici un efect asupra nvrii elevilor.
Discriminarea la un prag acceptat
R.L.Brenan a propus un indice similar celui a lui Findley pentru calculul
discriminrii itemului la un prag de stpnire(de dobndire, de nsuire) a unui
obiectiv didactic. Indicele B este un echivalent al indicelui D, cu deosebirea c
grupurile puternice i grupurile slabe sunt nlocuite cu cele care au atins sau nu un
prag de stpnire a testului ntreg. Indicele B poate fi calculat n felul urmtor:

n care P
M
reprezint indicele de dificultate a itemului pentru cei care au atins
un prag de stpnire a testului ntreg i P
NM
reprezint indicele de dificultate a
itemului pentru cei care nu l-au atins. B poate s varieze de la -1 la +1. Un indice
negativ ne transmite faptul c itemul nu discrimineaz n aceiai direcie ca ali
itemi ai testului. Un indice pozitiv indic faptul c proporia de elevi n grupul
stpnit a reuit mai bine itemul dect n grupul nestpnit.
n tabelul care urmeaz oferim un exemplu de calcul pentru indicele B.
Un profesor decide c un elev trebuie s reueasc 77% din itemii unui acelai
domeniu pentru a demonstra c el stpnete un anumit obiectiv. Elevul care
obine 77% i mai mult din test va fi considerat ca aparinnd grupului stpnit pe
cnd ali elevi(mai puin de 77%) vor face parte din grupul nestpnit
Test
Nestapnit Stpnit
Item Reuit a = 6 b =10
Euat c = 8 d = 3
77 , 0
3 10
10

d b
b
P
M

43 , 0
14
6
8 6
6

+

c a
a
P
NM

B = P
M
-
P
NM
B = P
M
- P
NM
= 0,77 - 0,43 = 0,34
S-a obinut un grad de stpnire pozitiv, ceea ce presupune c itemul are
capacitatea de a diferenia.
Procedura de stabilire a fidelitii prin evidenierea consistenei
interne se bazeaz pe formulele Kuder-Richardson 20 i lui Cronbach. n
anul 1937, G.F Kuder i M.V. Richrsdson au dezvoltat un sistem de ecuaii
pentru determinarea coeficientului d fidelitate(K-R 2, K-R 8, K-R 14, K-R 20 i
K-R 21). Pentru a specifica utilizarea acestora, menionm c teoria clasic a
testulelor psihologice strict paralele indic urmtoarele postulate:
Itemii testului msoar un factor sau o trstur i numai una;
Coeficienii de corelaiile inter-itemi sunt egali;
Itemii au varian egale;
Itemii sunt de dificultate identic
Utilizarea lor este indicat n urmtoarele situaii:
Nici un postulat nu este verificat(K-R 2);
Doar postulatul 1 este verificat(K-R 8);
Primele dou postulate sunt verificate(K-R 14);
Primele trei postulate sunt verificate( K-R 20);
Toate cele patru postulate sunt verificate(K-R 21)
Utilizat frecvent este K-R 20. Aceasta se aplic pentru itemi al cror
rezultat este exprimat dihotom;

,
_



X
i i
s
q p
k
k
R K 1
1
20
Legend:
p
i
este propria celor care au rspuns corect a item;
q
i
este proporia celor care au rspuns incorect la item;
k este numrul de itemi;
s
X
este abatarea standard a rezultatului global la test.
Oferim un exemplu pentru aplicarea acestei formule:
:
Rezultatul este urmtorul:
Formula pentru stabilirea coeficientului de fidelitate este echivalentul
ecuaiei K-R 20, fiind folosit pentru cazul n cazul n care rezultatul itemilor
este exprimat sub form polihotomic.

,
_


X
i
s
s
k
k
2
1
1

Formula de calcul a varianei itemilor este specific pentru valori


polihotomice
Estimarea fidelitii folosind metodele de consisten intern este
indicat numai pentru testele omogene, adic testele care msoar numai
o trstur sau o caracteristic. n cazul n care testele sunt eterogene,
msoar mai mult dect o trstur sau o caracteristic, estimrile
consistenei interne sunt foarte sczute. Nu este practic s calculm o
estimare general a consistenei interne pentru a determina consistena
intern a unui test eterogen. N.Schmitt subliniaz faptul c nu trebuiesc
confundate conceptele de consisten intern i omogenitate.
Coeficientul alfa descrie extinderea relaionrii dintre itemii unui test sau a
unei subscale. Omogenitatea se refer la faptul c ntrebrile msoar
aceiai trstur sau dimensiune. Este posibil ca un test s conin ntrebri
puternic interrelaionate, chiar dac ele msoar doi factori. n consecin,
( ) 29 , 1 1 1 , 1
81 , 1
35 , 2
1
9
10
1
1
20
2

,
_

,
_



X
s
q p
N
N
KR
coeficientul alfa ridicat nu este o dovad c un test msoar numai o
abilitate, trstur sau o dimensiune.
Formula coeficientului alfa necesit un numr mare de respondeni
pentru a putea estima consistena intern. n caz c numrul respondenilor
este mic, se nesocotesc prezumiile care stau la baza formulei, astfel nct
coeficientul alfa supraestimeaz sau subestimeaz fidelitatea populaiei.
Pentru procedura de stabilire a fidelitii prin folosirea unui test paralel
are ca dificultate faptul gsirii unui test paralel. n mediul constructorilor de
teste exist tendina de a creea forme paralele ale aceluiai test.
Chestionarul de personalitate 16 PF(care are drept autor pe R.B.Cattell) are
mai multe forme, dintre care amintim A,B,C i D . Fiecare chestionar este
compus din itemi diferii, care au aceiai destinaie psihodiagnostic. Dac
prima dat s-a aplicat forma A, retestarea se face cu forma B, Coeficientul de
corelaia obinut se mai numete i coeficient de echivalen i are o valoare
mai mic dect cel de stabilitate. Formele paralele ale testelor psihologice se
mai numesc i forme alternative. Cel mai mare risc n folosirea formelor
alternative este ca acestea s nu fie echivalente. Formele alternative sunt
mult mai uor de creat pentru caracteristicile bine definite, precum abilitatea
matematic, dect pentru trsturile de personalitate, aa cum este stima
de sine.
Strategia aleas pentru a determina fideltatea depinde de testul n sine
i e condiiile n care utilizatorul de teste intenioneaz s administreze
proba.
Fidelitatea bateriilor de teste
Profiluri de teste. Dup unul din criteriile formale de clasificare a
testelor, acestea se pot grupa n teste singulare, simple, elementare i
baterii de teste. Din exploatarea informaional a unui test elementar rezult
un singur punctaj, pe cnd sistemele de teste obin mai mult de unul.
Punctajele pot s aib autonomie sau s fie adunate ntr-un punctaj global.
Sistemele de teste sunt divizate n profilurile de teste i baterii de teste.
Profilurile de test sunt prezentri grafice ale rezultatelor mai multor
teste. Denumirea a fost creat n anul 1926 de ctre Rossolimo. n sensul
extins al cuvntului, profilul de test semnific o combinaie de mai multe
teste individuale care fiecare test singular conserv(pstreaz) autonomia.
Alegerea testelor elementare pentru un profil este dictat de nevoile
practice. Exemplu, pentru descrierea ngust a unei structuri de
personalitate individuale presupune un aa-numi profil de personalitate,
pentru descrierea structurii inteligenei, un profil de inteligen, pentru
descrierea unei aptitudini profesionale un profil profesional Se vorbete n
acest sens de o combinaie ad-hoc de teste singulare despre care se crede
c sunt create pentru un scop special i nu create arbitrar. Pentru un profil
de test nu sunt fixate exigene prea mari de natur metodologic.
Exemplu: Profil aptitudinal
n continuare prezentm un profil de personalitate(CPI)
n consecin, se ateapt ca fiecare test s fie ntr-o oarecare msur
fidel i s coreleze relativ sczut cu celelalte, s dovedeasc, independent
unul de altul, o suficient validitate logic sau empiric. Informaiile
dobndite din profilul total duc la o accentuat lrgire a domeniului
validitii. Interpretarea unui profil nu trebuie s plece doar de la testele
individuale, ci trebuie s fac posibil o viziune cuprinztoare.
Bateriile de teste sunt combinaii de mai multe teste individuale, n care
testele individuale i pierd autonomia lor i apar n serviciul unui scop
general, i anume acela de a cuprinde, pe ct posibil de exact, o
caracteristic a personalitii definit printr-un criteriu de validitate. Numele
de baterie de teste i gsete analogia, pe de o parte, n electrotehnic,
unde mai multe elemente galvanice sunt cuplate unul lng altul n
interiorul bateriei, pe de alt parte, n tehnica rzboiului, unde mai multe
tunuri contribuie pentru atingerea unui el de lupt. n ambele cazuri, se
ridic n esen problema efectivitii, numrul de voli, puterea de foc.
Criterii de valabilitate.
Alegerea testului individual pentru o baterie trebuie s fie ghidat dup
domeniul su de validitate, adic toate testele reunite ntr-o baterie trebuie
s cuprind o aceiai caracteristic a personalitii, chiar dac, dup
mprejurri, din puncte de vedere diferite Rmne deschis problema dac
domeniul caracteristicii este strict circumscris(de exemplu, capacitatea de
concentrare la diferite activiti) sau dac este mai vast(capacitatea de
randament intelectual general). Exigenele statistice fa de testele
individuale care compun o baterie de teste fac raportare la fidelitate i nu, cu
s-ar putea crede), la validitate, care este o chestiune primar a unui test. Au
fost dezvoltate procedee statistice n serviciul testului psihologic, cu ajutorul
crora , dintr-o serie de teste individuale, trebuie s alegem pe acela care
contribuie cel mai bine pentru cuprinderea unor caracteristici cercetate de
personalitate(care posed validitate logic)
Fidelitatea bateriilor de teste. Este vorba de baterii omogene de
teste. Estimarea se realizeaz prin intermediul formulei Spearman-
Brown(aceeai ponderare a sub-testelor). Formula este urmtoarea:
k= numrul de teste componente.
Exemplu pentru fidelitatea bateriilor omogene. Baterie de teste
care const din 4 subteste cu fidelitatea de 0,90, 0,86, 0,92, i 0,82. Dup ce
valorile se convertesc n valori standard z, se obine:
Formula pentru fidelitatea bateriilor eterogene. Se folosete cu luarea
n consideraie a intercorelaiilor dintre teste Formula este urmtoarea:
Se ia n consideraie exemplul anterior la care se dau
intercorelaiile ntre teste:
tt
tt
tt
r k
r k
bat r
) 1 ( 1
) *
+

38 , 1
4
51 , 5
4
16 , 1 59 , 1 29 , 1 47 , 1
'

+ + +
z
97 , 0
88 , 0 ) 1 4 ( 1
88 , 0 4
) (
+

bat r
tt


t s
st
t
tt
tt
r k
r k
bat r

2
1 ) (
Matricea corelaiilor interteste este urmtoarea
Testul 1 2 3 4
1 0,90 0,6 0,8 0,5
2 0,86 0,7 0,4
3 0,92 0,7
4 0,82
Cursul nr. 8 CII(constructia instrumentelor de investigatie)
Calculul fidelitii prin luarea n considerare a ponderii
testelor n baterie.
Formula de calcul este:
7 , 3 7 , 0 4 , 0 7 , 0 5 , 0 8 , 0 6 , 0
1
+ + + + +

s
st
r
96 , 0
7 , 3 2 4
5 , 3 4
1 ) (
+

bat r
tt


+


t t s
st t s t
t t
tt t t
tt
r G G G
r G G
batG r

2
1
2
2 2
Simbolurile Gs i Gt semnific n acest caz factorii de
ponderare ai subtestelor s si t
Date din exemplul anterior:Se presupun urmtorii factori de ponderare pentru
sub-testele individuale: G
1
= 3, G
2
= 7, G
3
= 4 i G
4
= 6. Se calculeaz valorile
necesare pentru formula:
Din cauza faptului c testele fidele 1 i 3 au fast valorizate sczut i testele
mai puin fidele 2 i 4 mult, a sczut fidelitatea global a bateriei de la 0,96 la
0,94.
Consideraii suplimentare despre testele paralele
S.S. Willks a dezvoltat pentru testele paralele i seriile de teste o metod de
verificare a echivalenei care se sprijin pe cele mai importante statistici de test.
n general, ca simbol de echivalen este utilizat litera L
Willks pretinde pentru k teste paralele, egalitatea mediilor, a varianelor i a
covarianelor. Mrimea de verificare derivat din Lmvc pentru eantioane mari
este (-N*lnL
mvc
) i este este distribuit dup
2
,

cu k(k+3)/2 grade de libertate,
variind de la 0 la 1. Dac M(media), v (variana) i c(covariana) pentru toate
formele paralele sunt egale, rezult L
mvc
=1 i (-N*lnL
mvc
) = 0. Statistica de
echivalen L pentru k teste paralele arat n felul urmtor:
110 6 4 7 3
2 2 2 2 2
+ + +

t
t
G

+ + +
t
tt t
r G 5 , 94 ) 82 , 0 6 ( ) 92 , 0 4 ( ) 86 , 0 7 ( ) 90 , 0 3 (
2 2 2 2 2
4 , 84 ) 7 , 0 6 4 ( ) 4 , 0 6 7 (
) 7 , 0 4 7 ( ) 5 , 0 6 3 ( ) 8 , 0 4 3 ( ) 6 . 0 7 3 (
+ +
+ + +
st
t s
t s
r G G

94 , 0
4 , 84 2 110
5 , 94 110
1
+

batG r
tt
[ ] [ ]
1
2 2
) 1 ( ) 1 ( 1 (

+ +
k mvc
v r s r k s
D
L
Pentru cazul cel mai simplu i mai practic cu dou teste paralele, formula
este urmtoarea:
Pentru trei teste paralele, formula este urmtoarea:
Semnificaii ale simbolurilor utilizate
D= determinantul n matricea varian covarian:
s
1
2
c
12
c
13
c
1k

c
21
s
2
2
c
23
c
2k

c
31
c
32
s
3
2
.. c
3k

.. .. . ..
c
k1
c
k1
c
k3
. s
k
2

s
j
2
= variana testului j;
c
je =
covariana

testelor j i e;
c
jc
= r
je*
s
j*
s
e

Pentru dou teste paralele determinantul se calculeaz prin formula:
Semnificaiile simbolurilor i modul de calcul sunt urmtoarele:

2
2 1 12
2
2
2
1
12
2
2
2
1
2
12
2
2
2
1
) (
2
1
) 1 (
2
) 1 (
2
) 1 (
X X r
s s
r
s s
r s s
L
mvc
+
1
]
1

+
+
+

2 2 2 2
2
23
2
13
2
12 23 13 12
2
3
2
2
2
1
) ( ) 2 1 (
) 2 1 (
v r s s r s
r r r r r r s s s
L
mvc
+ +
+

) 1 (
2
12
2
2
2
1 1 2 21 2 1 12
2
2
2
1 21 12
2
2
2
1
r s s s s r s s r s s c c s s D
paralele teste de numarul k
Concluzia
Valorii de echivalen obinut L
mvc
i este aplicat un logaritm natural i acesta
este nmulit cu valoarea negativ a lui N. Valoarea obinut este cutat n
tabelele
2
(chi ptrat). Valoare semnificativ a lui chi ptrat respinge ipoteza
echivalenei testelor paralele
Exemplu:
Acceptm faptul c dou forme paralele ale unui test au mediile de 70 i 72.
Variana primului test este de 200 i a celui de+al doilea de 210. Corelaia ntre
ambele forme este de 0,9 i N = 90 Stabilirea echivalenei se face n felul urmtor:
paralele testelor a medie var
2
2
ianta
k
s
s
j
j


paralele stelor atiilor te intercorel
) 1 (
2
1
2
media
s k k
c
r
j


estelor mediilor t var
1
) (
2
ianta
k
X X
v
j


testelor mediilor media
k
X
X
j


3 ) 3 (
2
k
df ln
2
+ k L N
mvc

9106 , 0
) 72 70 (
2
1
) 9 , 0 1 (
2
210 200
) 9 , 0 1 (
2
210 200
) 9 , 0 1 ( 210 200
2
2

1
]
1

+
+
+
+

mvc
L
0937 , 0 9106 , 0 ln
2 3 ) 3 2 (
2
2
df 4 , 8 ) 0937 , 0 ( 90 (
2
+
% 5 p
Ipoteza dup care cele dou forme de test sunt echivalente are mai puin de
5% verosimilitate. De aceea, o vom respinge i putem s considerm cele dou
forme neechivalente
Exemplu cu trei teste
Dac dorim s tim dac dificultatea diferit a testelor sau diferena ntre
variane a cauzat ne-echivalena, atunci putem aplica testul t sau testul F sau s
inserm datele n formulele anterioare. Se accept faptul c pentru un test sunt trei
forme paralele, care ar fi fost realizate pe un eantion de 130 de subieci
Media
Abaterea
standard
Intercorelaii
Rezultatul:
Recomandri APA
(American Psychological Association)
Principii generale
n materie de fidelitate, manualul probei va furniza informaii permind
lectorului de a aprecia dac rezultatele(la test) merit ncrederea pe care
o cer utilizrile indicate. Manualul va semnala n mod egal absena
oricrei informaii necesare care nu fost culeas. (Esenial).
Comentariu: manualul ofer informaii despre patru tipuri de fidelitate:
test - retest, par-impar, forme parale i intercorelaii ntre pri. El indic
n mod egal eroarea standard de msur i limitele de ncredere pentru
abaterea Q.I.- ului. Alte manuale menioneaz c fidelitile enumerate
rezult din analizele interne bazat pe o singur aplicare a testului.
Corelaiile ntre formele paralele i test - retest nu au fost calculate.
Manualul probei va furniza, n msura posibilului, o analiz cantitativ a
ansamblului variaiilor n urmtoarele componente principale: fluctuaiile
sau contradiciile n rspunsurile subiectului; inconsistena sau
eterogenitatea coninutului probei(de exemplu n itemi, ntrebri i
situaii); variaiile n administrarea testului; variaii ntre corectori sau
ntre unitile dispozitivului(aparat); n fine, erorile mecanice de
notare(foarte de dorit). (Comentariu: n general, analiza dorit va fi
8 , 27
1
X 3 , 28
2
X 9 , 27
3
X
9 , 9
1
s 1 , 10
2
s
4 , 10
3
s
93 , 0
12
r 92 , 0
13
r 90 , 0
23
r
21 , 1
2
) 046 , 0 91 , 0 7 , 102 7 , 102 ( ) 83 , 1 1 ( 7 , 102
)
2
90 , 0
2
92 , 0
2
93 , 0 90 , 0 92 , 0 93 , 0 2 1 (
2
4 , 10
2
1 , 10
2
9 , 9

+ +
+

x mvc
L
realizabil numai dac rezultatele sunt exprimate n termeni cantitativi,
diferii de categorii sau termeni non-parametrici, i dac planul de
culegere de informaii a datelor include controalele necesare. n cazul
probelor colective de cunotine, principalele surse de eroare pe care el
convine obinuit de a le evalua nglobeaz:
inconsistena sau eterogenitatea coninutului(admind faptul c n
materie de coninut o prob psihologic trebuie s prezinte acelai grad
de eterogenitate pe care materia considerat sau pe care funciile
necesare bunei utilizri a cunotinelor le impun);
variaiile n nsi aplicarea probei;
fluctuaiile rspunsului subiectului n funcie de timp, adic de
instabilitate. Datele vor fi culese dup un plan permind de a evalua cei
trei factori. La subiecii testelor proiective, fluctuaiile sau incoerena n
rspunsurile subiecilor constituie n mod obinuit principala surs de
eroare aleatorie de evaluat);
Manualul va furniza cel puin o evaluare de fidelitate sau de erori de
msur, chiar dac obiectivul probei vizeaz unic predicia
empiric(foarte de dorit). Comentariu: O astfel de informaie ajut
practicianul de a nelege proba, permindu-se astfel de a aplica i de a
interpreta mai inteligent, cum el nu o va face fr aceast informaie. n
anumite cazuri, de exemplu, cnd este vorba de a evalua efectul posibil
al lungirii probelor(testelor), informaiile relative la fidelitate sunt
indispensabile; de asemenea, manualul trebuie s le furnizeze
utilizatorului).
Normele relative la fidelitate cuprind fiecare rezultat de ansamblu,
fiecare rezultat parial sau fiecare combinaie de rezultate(precum suma
,diferena sau coeficientul) recomandate de ctre manualul de
prob(explicit sau implict) ntr-un alt scop dect o simpl ncercare pilot.
Esenial
n cazul instrumentelor utiliznd un profil n interiorul cruia diferenele
ntre rezultate(puncte) prezint o fidelitate puin ridicat, manualul va
pune explicit practicianul n gard contra unei interpretri fortuite a
diferenelor ntre rezultate. n caz contrar, cu titlu de eventualitate, se
cere o verificare prin alte mijloace. Esenial.
Manualul va meniona valoarea minimal de obicei necesar pentru ca o
diferen ntre dou rezultate s fie statistic semnificativ(foarte de
dorit).
n capitolul consacrat fidelitii i erorilor de msur,
manualul va descrie de o manier suficient de precis
procedurile i eantioanele utilizate, permind astfel
practicianului de a determina pn la ce punct faptele culese
se aplic persoanelor i problemelor de care el se ocup.
ESENIAL Comentariu: ntr-un grup, gradul de maturitate, variaiile
interindividuale i atitudinile fa de prob reprezint condiii normale de
utilizare a probei. Fidelitatea unui test destinat seleciei angajailor, de
exemplu, va fi calculat plecnd de la rezultatele unei populaii de
candidai de diverse posturi, mai degrab dect plecnd de la rezultatele
obinute de ctre studeni i muncitori deja angajai.)

S-ar putea să vă placă și