Sunteți pe pagina 1din 4

1

Cursul 6
CONDIII TIINIFICE N CONSTRUCIA I UTILIZAREA
TESTELOR PSIHOLOGICE
La finalul acestui curs vei fi capabili:
- S enunai principalele exigene tiinifice ale testelor psihologice;
- S recunoatei caracteristicile psihometrice ale instrumentelor psihodiagnostice;
- S facei distinciile necesare ntre principalele tipuri de validitate;
- S apreciai importana criteriului n psihodiagnoz
Nu orice '' test'' este un test (H. Pitariu, 1982). Un test presupune anumite caracteristici,
ndeplinirea unor cerine acceptate de comunitatea tiinific. Ele sunt precizate n Standardele
pentru testele educaionale i psihologice, document adoptat de APA n 1954, reactualizat n 1966
i 1974 care are o larg recunoatere internaional.
1. Standardizarea: stimulilor, instructajului, modului de cotare a rspunsurilor (trebuie s se
elimine subiectivitatea examinatorului i s creasc acordul ntre examinatori.
2. Etalonarea : sunt de preferat etaloanele locale (A. Anastasi, 1976). Etaloanele sau tabelele de
norme sunt baremuri realizate prin procedee statistice speciale cu ajutorul crora scorurile brute,
obinute prin administrarea testelor psihologice, sunt transformate n note standard care in cont
de tendinele centrale ale eantionului care a stat la baza realizrii testului.
3. Testele trebuie s fie revizuite periodic. Dup cca. 15 ani ele trebuie revizuite sau utilizate cu
pruden.
4. Manualul testului trebuie s indice, ediia, natura i profunzimea reviziilor, schimbrile
etaloanelor, nivelul de calificare solicitat n administrarea i interpretarea testelor.
5. Testele psihologice nu pot fi utilizate adecvat n afara contextului psihologiei tiinifice (Pentru
detalii consultai Anastasi, A. Psychological testing 1976; cartea a fost pus la dispoziia
studenilor de la cursul de zi)
5. Calitile psihometrice (metrologice) ale testelor psihologice.
A. Validitatea = n sens larg indic dac proba msoar ceea ce i propune, i ct de adecvat
realizeaz acest lucru. Pn la validare orice prob (test) rmne o simpl ipotez. Validitatea se
exprim n indici de corelaie ntre rezultatele la test i valorile criteriului, indici obinui prin
prelucrarea scorurilor la test i la criteriu pe un anumit eantion. Testul va fi valid pentru populaia
din care s-a extras n mod aleator acest eantion. Validarea poate fi verificat prin refacerea
studiului de validitate pe un eantion diferit, extras din aceeai populaie.
Functie de distana care separ momentul msurrii performanelor la criteriu de momentul
testrii psihologice distingem validitatea concurent (nici o distan) i validitatea predictiv
(interval de cel puin cteva luni pan la un an sau mai mult).
Probele validate concurent ne spun ceva despre situaia prezent a performanei
profesionale, n timp ce validitatea predictiv justific utilizarea lor ca predictori ai viitoarelor
performane n coal, munc, sport, etc (Blum i Naylor (1968). Anastasi (1976, 1979)
accentueaz faptul c este greit s substituim validitii predictive validitatea concurent,
deoarece o validitate concurent nalt nu garanteaz o validitate predictiv pe msur. Astfel,
utilizarea unui test validat pe un lot de salariai nu poate avea valoare predictiv n selecia unor
candidai noi care pot fi foarte diferii fa de primii (Anastasi,1979). Utilizarea unui test, pe o alt
populaie dect aceea pe care s-a realizat validarea, produce o restrngere a validitii pe care o
contracaram prin contravalidare (cross - validation). Pe de alt parte, astazi nu mai este agreat
ideea unei predicii pe termen lung ( Radu,1993), datorit dinamicii caracterului dinamic, n
continu schimbare al diferitelor activiti umane n beneficiul crorara se realizeaz testarea
psihologic.

Ambele tipuri de validiti rezult din confruntarea predictorului cu criteriu (criterionrelated validity), i se exprim, aa cum am mai spus, n indici de corelaie. Aceste valori trebuie
s fie semnificative la praguri de probabilitate de cel puin .05 (Smith,1971). Validitatea predictiv
poate fi exprimat i n graficele de previziune (Radu,1993), care indic proporia de succes /
insucces, funcie de scorurile la test.
Validitatea de criteriu nregistreaz o mare variabiliate care este imputat criteriului de
ctre Ghiselli, faptului c eantioanele pe care se intreprind studiile de validitate sunt prea mici, de
ctre Schmidt i Hunter, diferenelor dintre aceleai posturi sau meserii n organizaii diferite, de
ctre Albright, Smith si Glennon sau schimbrilor care au loc n structura meseriilor.
Toate acestea sugereaz limitele validitii de criteriu precum i motivaia cercetatorilor de
a fundamenta noile tipuri de validiti, validitatea sintetic, validitatea de coninut si validitatea de
construcie.
Validitatea sintetic este definit ca fiind rezultatul analizei sistematice a elementelor
activitii, al determinrii validitilor testelor pentru aceste elemente i al combinrii acestor
validiti ntr-un ntreg (Anastasi , 1976). Validitatea sintetic i-a gsit aplicarea n situaiile n care
companiile dispun de puini salariai ocupai n aceeai meserie, iar validitatea unor teste nu poate
fi generalizat datorit specificitii elementelor meseriei n cauz. Astfel Guion, citat de Anastasi
(1976), procedeaz la analiza detaliat a celor 48 de posturi specifice unei meserii din cadrul unei
firme, posturi care, totui, se deosebeau apreciabil din punctul de vedere al sarcinilor, i
detaeaza apte elemente comune Fiecare salariat a fost evaluat pe baza elementelor specifice
postului su. Aceste evaluri au constituit criteriul i au fost confruntate cu scorurile angajailor la
fiecare test dintr-o baterie ipotetic. A rezultat o baterie separat pentru fiecare post, lund dou
dintre teste pentru fiecare element de munc al postului respectiv.
Validitatea de construcie (sau conceptual) exprim gradul n care un test concord cu
teoria subiacent, sau mai exact spus, faptul dac testul masoar constructul teoretic corelat.
Anastasi propune urmtoarele metode de control ale validitii de construcie: corelarea,
moderat cu un alt test; identificarea validitii factoriale, respectiv stabilirea saturaiei testului n
factorii identificai; controlul consistenei interne prin tehnica njumtirii sau prin eliminarea
itemilor care nu departajeaz suficient subiecii din lotul celor buni de aceia din lotul celor slabi;
controlul validitii divergente, respectiv, verificarea existenei unei corelaii ,obligatoriu
nesemnificative, cu alte teste cu care testul n cauz nu trebuie s coreleze (Anastasi , 1976).
Validitatea de coninut indic gradul n care itemii testului sunt n adevar un eantion de
comportament , respectiv masura n care testul acoper ansamblul de sarcini, condiii sau procese
mintale care privesc domeniul condensat de acesta (Radu,1993).
Validitatea de coninut
se realizeaz prin analiza de itemi.
Problema criteriului
Validarea instrumentelor de psihodiagnoz nu poate fi realizat n afara criteriului. Criteriul este
piatra unghiular a utilizrii testelor psihologice. Dei importana sa n psihologia aplicat este
major, n acest curs nu putem dect schia problematica ampl, creat n jurul su, urmnd ca
acesta s fie abordat mai pe larg n cursul de psihologia muncii, arie n care, de altfel aceast
problematic s-a diversificat.
Criteriul, ntr-o prim aproximaie reprezint, o expresie sintetic a realitii
psihocomportamentale investigate cu mijloacele de psihodiagnoz. El este, pe de alt parte,
expresia principiului fundamental al psihodiagnozei, anume c realitatea psihic, activitatea
uman primeaz n raport cu instrumentele destinate investigrii ei. Nu testul valideaz realitatea
ci dimpotriv el este valid doar n msura n care surprinde aceast realitate.
n domeniul profesiilor, criteriul este expresia valorii profersionale (a measure of goodness, Blum
i Naylor,1968).
Mc. Cormick l definete ca pe o variabil dependent, Leplat si Cuny ca pe o
variabil care permite evaluarea unui fenomen (Pitariu,1983) iar Guion mpinge operaionalizarea
mai departe definind criteriul ca pe ceva despre care se pot face predicii (Blum si Naylor,1968).
Dup A. Anastasi ''criteriul reprezint o msuratoare direct i independent a ceea ce testul i
propune s msoare'' (Anastasi, 1976, p140).

Observm c termenul desemneaz att faptul real al performanei ct i instrumentul care


o msoar.
Analiza atent a acestor definiii, dincolo de constatarea eclectic potrivit creia criteriul este ceea
ce afirm fiecare definitie, reliefeaz pluralitatea formelor de abordare a acestuia, i deopotriv
faptul c orice sistem de evaluare a reuitei (colare, profesionale, etc.) este un criteriu potenial
(Pitariu, 93). Este ns necesar ca standardul selectat s aib o sensibilitate suficient pentru a
discrimina indivizii. (Blum si Naylor,1968).
Dup Bellows, un criteriu bine ales trebuie s fie: valid, realist, reprezentativ,constant de la
o situatie la alta, i predictibil. La aceast list Blum i Naylor(1968) mai adaug urmtoarele
cerine: s nu fie scump, s fie uor de nteles, msurabil, relevant, necontaminat, discriminativ.
B) Fidelitatea exprim stabilitatea n timp a rezultatelor sub aspectul: constanei rezultatelor,
cnd aceei subieci au fost examinai de persoane diferite; constana rezultatelor n timp;
caracterul adecvat al tuturor probelor care constituie testul n ansamblu; omogenitatea probelor.
De asemenea fidelitatea ne arat dac diferenele individuale obinute cu ajutorul testelor sunt
rezultatul diferenelor reale sau dac sunt efectul unor factori exteriori trsturii msurate, adic al
unor factori variabili.
Stabilitatea n timp: metoda examinrii - reexaminrii (la copii, interval nu prea lung cci intervine
facorul dezvoltare. La copii de 7 ani fidelitatea la Stanford- Binet a fost de .90 dup 4 ani, .74
dup 11 ani i .68 dup 11 ani. Pentru aduli testele de inteligen au o sczut valoare predictiv.
Najunsurile metodei testrii - retestrii sunt corectate prin aplicarea la aceeai subieci a dou
forme echivalente ale testului.
Stabilitatea la examinatori diferii: intervin particularitile psihice ale examinatorului. La testul
Goodenough corelaiile ntre rezultatele obinute de trei examinatori au fost: .87, .90, .92. Efectele
sunt mai evidente n testele de personalitate. Examinatorul este mai sensibil la acele tulburri la
care el este mai vulnerabil. Trei examinatori care au adoptat experimental atitudini diferite la
Rorscach au obinut variaii n tipurile de rspuns. O nou metod de administrare i de
interpretare a testului Rorscach elaborat de J. Exner (1992) relev o constan interevaluatori
mult mai mare.
Chiar la testele de inteligen, examinatori diferii pot obine pe acelai lot diferene de de 30-40
de puncte QI.
Intervine gradul de experien al examinatorului.
Omogenitatea testului se pune n eviden prin procedeul divizrii (terbuie obinute jumti ale
testului cu valoare egal sub aspect psihometric); prin procedeul gruprilor itemilor pari i impari.
Consitena se stabilete prin corelarea fiecrui subtest (parte component cu celelate). Aceasta
exprim gradul de omogenitate al testului.
Fidelitatea formelor echivalente se stabilete n cazul probelor paralele. Numrul de itemi,
dificultatea, condiiile de administrare i interpretare trebuie s fie egale.
Fidelitatea depinde att de calitile testului dar i de natura trsturii msurate. testele de
personalitate au o fidelitate mai mic.
Gradul de fideliate acceptat variaz cu scopul n care este utilizat testul respectiv:
- .94 pentru clasificri dup rang individual
- .75 cnd rezultatele unui test sunt verificate prin alte teste sau prin observaii.
n concluzie, fidelitatea unui test exprim consistena rezultatelor n cele trei situaii evocate mai
nainte. Constana, echivalena i omogenitatea notelor (cotelor) la test reprezint diferite forme
ale consistenei i exprim eroarea de msurare.
- Aceleai exigene ca la validitate n publicarea testului.
C) Sensibilitatea semnific fineea discriminativ, adic numrul de clase realizate de note ntr-un
grup de subieci. Sensibilitatea difer la un test de dedezvoltare fa de un test de aptitudini. n
cazul testelor de dezvoltare diferenele ntre mediile a dou vrste consecutive sunt mai mari
dect n interiorul grupelor respective. Claparede consider c o prob este caracteristic unei
vrste dac este reuit de 75% dintre sub. normali i nu este reuit de 75% dintre sub. cu un an

mai mici. Invers, n cazul testelor de aptitudini, diferenele dintre indiviziii de aceeai vrst
depesc pe cele dintre dou vrste succesive.
ntrebri pentru autoevaluare
-Care sunt criteriile care deosebesc un test psihologic de o colecie de sarcini ?
- Explicai importana problemei criteriului pentru psihodiagnostic, n general i pentru teste n
special.