Sunteți pe pagina 1din 107

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

UNIVERSITATEA DIN BUCURETI


FACULTATEA DE PSIHOLOGIE I
TIINELE EDUCAIEI

DEPARTAMENTUL DE
NVMNT LA DISTAN

BAZELE TEORETICE ALE EVALUARII


PSIHOLOGICE
ANUL II

Prof. univ. dr. NICOLAE MITROFAN

Universitatea din Bucureti


Editura CREDIS
2008

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Acest material este destinat uzulului studenilor Universitii


din Bucureti, forma de nvmnt la distan.
Coninutul cursului este proprietatea intelectual a
autorului/autorilor; designul, machetarea i transpunerea n
format electronic aparin Departamentului de nvmnt la
Distan al Universitii din Bucureti.

Universitatea din Bucureti


Editura CREDIS
Bd. Mihail Koglniceanu, Nr. 36-46, Corp C, Etaj I, Sector 5
Tel: (021) 315 80 95; (021) 311 09 37, 031 405 79 40, 0723 27 33 47
Fax: (021) 315 80 96
Email: credis@credis.ro
Http://www.credis.ro

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Module:
Modulul 1 Situaia psihodiagnosticului n lume i n ara noastr
Modulul 2 Testul psihologic ca mijloc de evaluare
Modulul 3 - Caracteristicile psihometrice ale testului psihologic
Modulul 4 - Analiza itemului
Modulul 5 Etalonarea i standardizarea testelor
Modulul 1 Situaia psihodiagnosticului n lume i n ara noastr
Unitatea de nvare 1: Precizri prealabile privind evaluarea psihologic
Unitatea de nvare 2: Contribuii la dezvoltarea psihodiagnosticului n
secolul XX
Unitatea de nvare 3: Tendine i direcii de dezvoltare a
psihodiagnosticului la nceputul mileniului III.
Unitatea de nvare 4. Situaia psihodiagnosticului din Romnia
n perioada actual
Modulul II Testul psihologic ca mijloc de evaluare
Unitatea de nvare 1: Testul psihologic
Unitatea de nvare 2: Clasificarea testelor psihologice
Unitatea de nvare 3: Testul psihologic i Codul deontologic
Modulul III Caracteristici psihometrice ale testului psihologic
Unitatea de nvare 1: Ce sunt caracteristicile psihometrice ?
Unitatea de nvare 2: Fidelitatea testului
Unitatea de nvare 3: Validitatea testului
Unitatea de nvare 4: Testul psihologic i selecia profesional
Modulul IV Analiza itemului

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Unitatea de nvare 1: Ce este analiza itemului ?


Unitatea de nvare 2: Gradul de dificultate al itemului
Unitatea de nvare 3: Capacitatea de discriminare a itemului
Modulul V Etalonarea i standardizarea testelor
Unitatea de nvare 1: Definirea conceptelor i etapele construirii testului
Unitatea de nvare 2: Modele de scale utilizate n etalonare i standardizare

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

MODULUL I

SITUATIA PSIHODIAGNOSTICULUI N LUME


SI N ARA NOASTR

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Bazele teoretice ale evalurii psihologice


Module:
Modulul 1 Situaia psihodiagnosticului n lume i n ara noastr
Modulul 2 Testul psihologic ca mijloc de evaluare
Modulul 3 - Caracteristicile psihometrice ale testului psihologic
Modulul 4 - Analiza itemului
Modulul 5 Etalonarea i standardizarea testelor
Modulul 1 Situaia psihodiagnosticului n lume i n ara noastr
Unitatea de nvare 1: Precizri prealabile privind evaluarea psihologic
Unitatea de nvare 2: Contribuii la dezvoltarea psihodiagnosticului n
secolul XX
Unitatea de nvare 3: Tendine i direcii de dezvoltare a psihodiagnosticului la
nceputul mileniului III.
Unitatea de nvare 4. Situaia psihodiagnosticului din Romnia n perioada
actual
Modulul II Testul psihologic ca mijloc de evaluare
Unitatea de nvare 1: Testul psihologic
Unitatea de nvare 2: Clasificarea testelor psihologice
Unitatea de nvare 3: Testul psihologic i Codul deontologic
Modulul III Caracteristici psihometrice ale testului psihologic
Unitatea de nvare 1: Ce sunt caracteristicile psihometrice ?
Unitatea de nvare 2: Fidelitatea testului
Unitatea de nvare 3: Validitatea testului

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Unitatea de nvare 4: Testul psihologic i selecia profesional


Modulul IV Analiza itemului
Unitatea de nvare 1: Teoria rspunsului la item
Unitatea de nvare 2: Gradul de dificultate al itemului
Unitatea de nvare 3: Capacitatea de discriminare a itemului
Modulul V Etalonarea i standardizarea testelor
Unitatea de nvare 1: Definirea conceptelor
Unitatea de nvare 2: Etapele etalonrii i standardizrii testului psihologic
Unitatea de nvare 3: Modele de scale utilizate n etalonare i standardizare

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Cteva precizri prealabile....


Iat, aadar, o nou disciplin cu care vei face cunotin nc de la nceputul anului II. Ea are un
titlu tentant, desigur....evaluarea psihologic a individului uman....deci, vom putea s msurm pe cineva i
s aflm cum st n legtur cu diferite componente ale personalitii. Vom ti ct este de inteligent, ct
este de creativ, ct este de emotiv, ct este de sociabil, ct este de echilibrat, ce fel de temperament are, ce
trsturi caracteriale are, ct de dezvoltate i sunt anumite aptitudini etc.,etc. Putem s ne pronunm asupra
cuiva n legtur cu coeficientul de inteligen (QI), coeficientul de dezvoltare (QD), coeficientul de
creativitate (QKre), coeficientul emoional (QE), coeficientul de personalitate (QP) etc. Pi, nu este
formidabil s avem asemenea posibiliti noi psihologii ? Evident c da i pentru a face diverse evaluri
putem apela la mai multe metode i mijloace, ns noi ne vom concentra , mai ales, asupra testelor
psihologice. Nu exist sector al activitii umane n care s nu fie necesar realizarea evalurii psihologice
cu ajutorul testelor. Acestea sunt extrem de multe (unii autori apreciaz c ar fi vorba de zeci de mii n
lume), ns ele pot fi grupate n diferite categorii, n funcie, n special de obiectivul urmrit n evaluare.
Exist ns i anumite pericole...dar nu dorim s speriem pe nimeni nc de la nceput. Un pericol ar fi cel
legat de utilizarea necorespunztoare a testului. Ar fi ca i cum am folosi un cntar defect pentru a stabili
greutatea cuiva. Fiind defect, ntr-o zi ar arta o anumit greutate, n alt zi, o greutate total diferit.
Revenind n domeniul psihologiei, folosind, de exemplu, n mod greit un test de inteligen, s-ar putea ca,
la o prim testare, subiectul s apar ca fiind genial i, la o alt testare, el s apar ca fiind deficient
intelectual. Un alt pericol ar fi cel al, zicem noi, delegrii de rspundere, adic psihologul confer putere
absolut testului, el neavnd niciun fel de implicare n analizarea i, mai ales, interpretarea rezultatelor. De
aceea, un mare psiholog, pe nume L. Szondi, a prevenit pe toi psihologii, din toate domeniile aplicative,
spunndu-le: face mai mult un psiholog fr teste, dect mai multe teste fr psiholog. Poate c nu
nelegei exact ce a vrut s spun acest autor celebru, dar eu v rog mult s-i reinei spusele, deoarece,
dac vei practica psihologia, va trebui, cu siguran, s vi le amintii mereu. Revenind la pericole, exit i
multe altele, dar nu dorim s le expunem pe toate nc de pe acum. Ele vor reiei dup ce vei parcurge
toate modulele i, mai ales, dup ce v vei ntlni direct cu diferite categorii de teste. Am mai avea, ns o
mare rugminte. S nu dai uitrii ce ai nvat n anul I, mai ales la statistica aplicat n psihologie. tim,
tim foarte bine c cei care vin spre domeniul psihologiei nu s-au manifestat prea pozitiv fa de
matematic i, n general, fa de tiinele exacte. Din nefericire ns pentru ei, la psihologie, nc din anul I
apare....statistica iar desprirea de ea este considerat de unii ca fiind pentru totdeauna. Evaluarea
psihologic, psihodiagnosticul, mai ales, presupune cunoaterea i utilizarea unor elemente de statistic, aa
c, rugm nc o dat s cutai sursele de informare i s v reactualizai cunotinele privind statistica
aplicat n psihologie. i dac ne-am neles pn aici, v propunem s ne apropiem de modulele pe care le
oferim, ncepnd, desigur, cu MODULUL I. V dorim mult succes !!!

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Modulul 1 Situaia psihodiagnosticului n lume i n ara noastr

Unitatea de nvare nr. 1


Precizri prealabile privind evaluarea psihologic
Cuprins:
1.1. Delimitri conceptuale
1.2. De cnd a nceput, de fapt, evaluarea psihologic ?
1.3. Cine este considerat printele psihodiagnosticului ?

Obiective:
La sfritul acestei uniti de nvare studenii vor fi
capabili s:
defineasc corect noiunea de evaluare psihologic
s diferenieze evaluarea psihologic tiinific de
cea empiric
cunoasc ce criterii utilizm pentru a stabili marile
perioade de evoluie a evalurii psihologice
cunoasc unele dintre cele mai vechi preocupri
privind evaluarea psihologic
cunoasc
cine
este
considerat
printele
psihodiagnosticului

1.1. Delimitri conceptuale


Exist, ntr-adevr, mai multe concepte care sunt folosite pentru a evidenia
posibilitatea de msurare i cunoatere a diferitelor aspecte i componente ale
vieii psihice. Am putea enumera cteva: evaluarea psihologic,
psihodiagnoza, msurarea psihologic, testarea psihologic. n literatura
anglo-saxon, pe care noi, la aceast disciplin, ne bazm n cea mai mare
msur, sunt frecvent utilizai termenii: psychological testing (testarea
psihologic), psychological assessment (msurare psihologic) i, mult mai
rar, psychological evaluation (evaluare psihologic). Desigur, nu sunt
diferene foarte mari ntre nelesurile i sensurile acestor concepte. Ceea ce

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

este comun pentru toate este faptul c actionm asupra individului


(subiectului) cu anumite metode, mijloace, instrumente n vederea obinerii
unor informaii privind diferite aspecte i componente ale psihismului.
Psihodiagnoza este aciunea de aplicare a testelor, care, la rndul lor, au
obiective foarte precise. Avem nevoie s cunoatem nivelul de dezvoltare
intelectual, aplicm teste de inteligen, avem nevoie s cunoatem nivelul
de dezvoltare a capacitilor mnezice, aplicm teste de memorie .a.m.d.
Deci, noiunile de testare psihologic i de psihodiagnostic au cam acelai
neles. Msurarea psihologic nseamn ceva mai mult dect testarea
psihologic, deoarece ea se poate face folosind nu numai testele psihologice,
ci i alte modaliti de msurare, cum este cazul diferitelor scale de msurare
a opiniilor, atitudinilor etc. Evaluarea psihologic, cel puin dup prerea
noastr, implic aciunile de testare i de msurare dar nu se rezum numai la
acestea, ci, n mod obligatoriu, ea necesit aciunile de interpretare a
rezultatelor, de integrare a lor ntr-un set de informaii care s descrie
ct mai corect i ct mai exact situaia subiectului. Deci, dei nu n
exclusivitate, testarea i msurarea psihologic se centreaz mai mult asupra
aspectelor de ordin cantitativ, n timp ce evaluarea psihologic se centreaz
mai mult asupra aspectelor de ordin calitativ. n general, evaluarea
psihologic se finalizeaz cu un Raport n cadrul cruia regsim incluse
rezultatele examinrii sau msurrii psihologice (de exemplu, coeficientul de
inteligen - QI = 125) dar i: a) judeci apreciative privind starea subiectului
(normal, anormal, deficitar etc.); b) conturarea unor cauze care au dus la
apariia acelei stri; c) formularea unor recomandri privind aciunile ce se
impun n legtur cu subiectul (aciuni educaional-recuperative,
psihoterapeutice etc.). Aadar, dintre toate noiunile luate n discuie,
evaluarea psihologic pare a avea sfera cea mai mare, dei, trebuie s
recunoatem c, n literatura de specialitate, nu exist un consens referitor la
utilizarea acestui concept. De altfel, nici noi, n cadrul acestei discipline, nu
vom utiliza predominant noiunea de evaluare psihologic, deoarece interesul
central al nostru va fi orientat ctre locul i rolul pe care l ocup testele
psihologice n activitatea psihologului.
S vedem acum ce diferene exist ntre alte dou noiuni pe care le
ntlnim frecvent: psihodiagnostician i psihotehnician. Lucrurile nu sunt
foarte complicate, important este s le nelegem bine. Psihodiagnosticianul
este persoana abilitat s aplice testele i s elaboreze Raportul final de
evaluare. Deci, psihodiagnosticianul este cel care face, de fapt, evaluare
psihologic. El are, obligatoriu, pregtire academic (n cadrul
departamentelor de psihologie), la care se adaug o ndelungat activitate
practic. Sunt unele teste extrem de complexe, care necesit mult timp pentru
formare, ceea ce nseamn c nu este suficient doar activitatea de
familiarizare din timpul anilor de studenie. Este cazul, dup cum o s vedei,
a unor teste de personalitate, a unor teste de inteligen, a unor teste
proiective. Psihotehnicianul este cel care nva s aplice bine i corect
anumite teste i, bineneles, este vorba tot despre testele complexe.
Rezultatele obinute le nainteaz specialistului, psihodiagnosticianului,

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

abinndu-se de la orice fel de prelucrare i, mai ales, interpretare. n


practic, psihotehnicianul poate fi i o persoan care nu are pregtire n
domeniul psihologiei, dar care a nvat s aplice un test sau mai multe teste
respectnd strict cerinele din cadrul manualelor acestor instrumente
psihodiagnostice.
S mai spunem cteva cuvinte i n legtur cu noiunea de testare. Ea
a cptat n ultimul timp o extindere foarte mare, fiind ntlnit n multe
domenii, cu nelesul de verificare. De exemplu, n domeniul tehnic, vorbim
de aciunea de testare a unor materiale, a unor motoare, a unor mijloace de
transport etc. n domeniul medical-farmaceutic, vorbim de testarea unor
medicamente, a unor substane, a unor instrumente etc. n domeniul
aeronautic i cosmic vorbim de testarea unor aeronave, a unor rachete. Nu n
ultimul rnd, n domeniul militar, se vorbete despre testarea unor arme noi, a
unor noi mijloace de comunicare, de simulare etc. n domeniul psihologiei,
aciunea de testare nu se rezum doar la cea de verificare, ci ea are un neles
destul de diferit, dup cum, de altfel, am spus mai sus. De aceea, este bine ca
s fie folosite permanent sintagmele test psihologic i testare psihologic,
tocmai pentru a pstra specificul acestora i a le feri de unele confuzii sau
limitri. Trebuie, de asemenea, s facem o difereniere clar a ceea ce
nseamn evaluare psihologic empiric i evaluare psihologic tiinific.
Cea empiric este de tip impresiv, ochiometric dup cum spun unii, adic
se bazeaz pe rezultatele cunoaterii nemijlocite, directe, apelnd la simuri.
Subiectul X este ceea ce vd c este sau ceea ce face. Multi printi spun, cu
convingere, c i cunosc foarte bine proprii copii, cadrele didactice, de
asemenea, vor afirma, cu trie, c i cunosc bine elevii cu care lucreaz. i
nu au dreptate ? Ar fi nedrept din partea noastr s folosim un Nu
categoric. Problema este c un asemenea mod de a cunoate i de a evalua
prezint multe riscuri, deoarece, frecvent, intervine subiectivismul
evaluatorului, adic, n actul evalurii intervin factori ce in de psihologia i
de personalitatea acestuia. De regul, prinii au o imagine mult mai pozitiv
despre copiii lor dect sunt acetia n realitate. n cazul lor, factorul principal
care intervine ine de afectivitatea manifestat fa de copii (i nu trebuie s
fie, neaprat, criticai pentru aceasta). Evaluarea psihologic tiinific are,
nainte de toate, un caracter obiectiv, deoarece ea se bazeaz pe utilizarea
unor mijloace tiinifice, cum este cazul testelor psihologice. Informaia
recoltat cu ajutorul lor trebuie s aib prioritate n cunoaterea i evaluarea
psihologic a subiectului. Numai cunoscnd adevrata realitate psihologic
putem s ne pronunm asupra faptului dac aceasta este echilibrat, normal
sau, dimpotriv, ea necesit intervenii de tip educaional, recuperator sau
psihoterapeutic.
Tem de reflecie/autoevaluare:
Enumerai mai multe consecine posibile ale utilizrii exclusive de ctre cadrul didactic a
evalurii psihologice empirice.
1.2. De cnd a nceput, de fapt, evaluarea psihologic ?
Este greu de precizat exact, ns ea a nceput, sigur, cu foarte muli ani nainte

Copyright DEPARTAMENT ID 2008

10

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

de apariia psihologiei ca tiin. Evalurile psihologice erau fcute mai ales n


scopuri juridice, adic de a determina dac cel nvinuit spune sau nu adevrul
referitor la o anumit fapt. Mijloacele folosite (s zicem, pe post de teste)
erau rudimentare i, uneori, extrem de dure i de agresive. Putem meniona
cteva: - cel nvinuit trebuia s ating foarte repede cu limba un obiect nroit
n foc. Dac rmneau urme, acestea constituiau dovada c respectivul este
adevratul vinovat; - acuzatul trebuia s nghit foarte repede o anumit
cantitate de orez fiert i dac reuea, era absolvit de vinovie; - mai muli
suspeci erau pusi in linie i lsai mai mult timp s priveasc un acelai obiect
i cel care se nroea cel mai mult la fa era considerat vinovat. Mai muli
autori (Gregory, 1996; Stan, A., 2002) arat c unele forme rudimentare ale
testrii psihologice le putem regsi n serviciile publice ale Chinei antice nc
din anul 2200 .e.n. Funcionarii erau supui, la fiecare trei ani, unei forme de
examinare, urmrindu-se gradul de potrivire al acestora cu cerinele postului
pe care l ocupau. Pe msur ce trecea timpul se producea i o mbuntire a
modului de examinare, astfel c, ncepnd cu anul 202 .e.n., pe timpul dinastiei
Han a fost introdus un examen scris la mai multe materii i anume: legislaie
civil, probleme militare, agricultura, fiscalitatea i geografia. Avnd n vedere
vremurile la care se face trimitere, trebuie s apreciem, totui, ingeniozitatea
celor care au creat un fel de sistem de selecie n trepte: a) examinarea
preliminar, sarcina subiecilor fiind aceea de a compune un poem n baza unei
teme oferite, fiind obligai s stea o zi i o noapte ntr-o camer relativ mic.
Procentele de reuit se nscriau ntre 1 i 7; b) cei reuii n prima etap
treceau la o nou faz, numit district de examinare; aici gradul de examinare
i evaluare a candidailor era mult mai dificil, acetia fiind supui, timp de 3
zile i 3 nopi, la 3 sesiuni separate. i aici, procentul de reuit era destul de
mic i anume, ntre 1 i 10; c) a treia i ultima faz avea loc la Pekin. 3% dintre
candidai reueau s depeasc i aceast faz, primind titlul de mandarin,
ceea ce nsemna c avea dreptul s fie ales pentru poziia de nalt funcionar
public. Ce urmrea, de fapt, acest sistem de selecie profesional, dei
aceast sintagm nu era folosit n acele vremuri ? In primul rnd, depistarea
unor capaciti sau a unor aptitudini necesare pentru ocuparea unui post de
funcionar public. Era vorba, mai ales, despre frumuseea scrisului i claritatea
exprimrii, condiii de baz pentru a asigura o bun comunicare. Deci, pe baza
acestor nsuiri se putea face predicii privind eficiena n exercitarea funciilor
publice.
Problema formelor de examinare i evaluare psihologic utilizate
nainte ca psihologia s devin tiin a preocupat pe mai muli autori. Astfel,
putem aminti exemplele oferite de ctre profesorul german Hofstter, P., 1971
(apud Stan, A., 2002): a) n riturile de iniiere ale societilor primitive erau
folosite anumite probe prin intermediul crora se stabilea dac cei investigai,
n special tinerii, erau n posesia unor capaciti necesare pentru asumarea
responsabilitilor specifice adulilor, cum ar fi: curajul, stpnirea de sine,
calitile raionamentului; b) n scrierile lui Platon, dedicate statului, se
regsesc precizri privind modul n care erau recrutai rzboinicii n

Copyright DEPARTAMENT ID 2008

11

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

comunitatea ideal, acetia trebuind s dovedeasc, mai ales, autodisciplin,


curaj, incoruptibilitate.
Dei aceste prime forme de evaluare psihologic sunt departe de
cerinele de ordin tiinific de care trebuie s in seama cei care se ocup de
selecia profesional n zilele noastre, trebuie s apreciem faptul c ele i-au
dovedit utilitatea n acele vremuri i, pe de alt parte, au influenat pe cei care,
ulterior, s-au ocupat n mod serios de problema mijloacelor folosite. Dup cum
vom vedea mai trziu, testul psihologic nu este echivalent cu punerea la
ncercare a subiectului. n baza rezultatelor obinute se fac predicii n legtur
cu comportamentul subiectului.
Tem de reflecie/autoevaluare:
Care ar fi consecinele dac i astzi s-ar utiliza n activitatea de evaluare psihologic numai
proba punerii la ncercare a subiectului ?

1.3. Cine este considerat printele psihodiagnosticului ?


Dei foarte muli psihodiagnosticieni l consider pe A. Binet printele
psihometriei, n special datorit faptului c el a construit, n 1905, mpreun
cu T. Simon, prima scal metric a inteligenei, n mai toate manualele i
tratatele privind testarea psihologic anul de natere al psihodiagnozei este
considerat a fi 1890. n acel an, James McKeen Cattell a publicat, n revista
Mind, articolul Mental Tests and Measurements. Ar nsemna, normal, c
acest autor ar fi printele testelor i, respectiv, al psihometriei.
Dar asemenea preocupri privind paternitatea unor termeni nu prea i
au rostul, deoarece psihometria are o istorie mult mai complex, nainte de
sfritul secolului al XIX-lea i nceputul secolului XX muli autori avnd, prin
activitatea intens desfurat, o parte de contribuie la crearea acestui domeniu
extrem de important, dar i foarte controversat al tiinei psihologice. I-am
putea aminti, n acest sens, pe Fr. Galton, Ernst Weber, Gustav Fechner,
Herman Helmholtz .a. Desigur, nu-l putem uita pe Wilhelm Wundt, cel care a
nfiinat primul laborator de psihologie experimental, la Leipzig, n 1879. El a
folosit, de altfel, pentru prima dat termenul de psihometrie, publicnd
articolul Psychometrics Experiments n revista Brain.
James McKeen Cattell a fost studentul lui W. Wundt la Leipzig,
ocupndu-se n cadrul tezei sale de doctorat, de diferenele individuale privind
timpul de reacie. Dup terminarea tezei a predat la Bryn Mawr i la
Universitatea din Pennsylvania, ntorcndu-se apoi n Europa pentru a preda la
Universitatea din Cambridge. Aici l-a ntlnit pe Fr. Galton, ntlnire ce-l va
marca pentru toat perioada de dup ntoarcerea sa n SUA, mai nti, la
Universitatea din Pennsylvania i, apoi, la Universitatea Columbia. Meritele
sale sunt multiple: pe lng faptul c a pus bazele mai multor publicaii, cum ar
fi Psychological Review, Science, American Men of Science, James McKeen
Cattell a fundat i celebra The Psychological Corporation. Printre studenii
nscrii la docotorat sub conducerea sa exist i cteva nume celebre astzi:
E.L. Thorndike (1898), care a avut mari contribuii la dezvoltarea teoriilor

Copyright DEPARTAMENT ID 2008

12

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

nvrii i, totodat, la dezvoltarea psihologiei educaionale; R.S. Woodworth


(1899), care a publicat n 1938 unul dintre cele mai cunoscute i mai influente
tratate de Psihologie experimental ; E.K.Strong (1911), autorul testului
Vocational Interest Blank, rmas n uz i astzi, dup ce a fost revizuit.
Un alt doctorand al su, dei din nefericire mai puin cunoscut, a fost
Clark Wissler (1901), cel care, dup unii autori (Gregory, 1996), a avut o
influen covritoare asupra istoriei timpurii a testrii psihologice. El a reuit
s coreleze scorurile la un test mintal aplicat unui numr de peste 300 de
studeni de la Columbia University i Barnard College cu rezultatele lor
academice. Intenia lui era aceea de a demonstra c rezultatele la test pot fi
folosite pentru prognozarea performanei academice, ns cercetrile efectuate
nu au confirmat ateptrile sale. Odata cu publicarea, n 1901, a unor
asemenea rezultate descurajatoare, psihologii experimentali au renunat la
utilizarea timpului de reacie (RT) i a discriminrii senzoriale ca instrumente
de msur a inteligenei. Dup cum o s vedei i la alte discipline, timpul de
reacie este un indicator al manifestrilor temperamentale i nu al inteligenei.
Printre studenii lui W. Wundt s-au numrat i alte nume sonore ale
psihologiei universale i anume: Charles Spearman, Victor Henri, Emil
Kraepelin, E.B. Titchener, G. Stanley Hall, Lightner Witmer. Spearman este
creditat ca fiind cel ce a creat conceptul psihometric de fidelitate a testului (test
reliability). Francezul Victor Henri a colaborat cu A. Binet, sugernd modul n
care pot fi utilizate testele mintale pentru a msura procesele mintale nalte. E.
Kraepelin, de formaie psihiatru, a fost primul experimentator al tehnicii
asocierii verbale n calitate de test formal. Leightner Witmer, dup ce i-a luat
doctoratul la Leipzig, rentors n SUA, a devenit succesorul lui James McKeen
Cattell la postul de director al Laboratorului de psihologie din cadrul
Universitii Pennsylvania. n 1897 el a nfiinat prima clinic psihologic din
America, tot la Universitatea din Pennsylvania, iar n 1907 a scos revista
Psychological clinic, n cadrul creia a publicat articolul Clinical
Psychology. n felul acesta el a devenit printele psihologiei clinice, dei
este puin cunoscut n aceast calitate (McReynolds, 1987).
n afar de psihologi, cei care au contribuit foarte mult, chiar dac nu
direct, la crearea psihometriei sunt filosofii. Este vorba de o serie de lucrri
aprute n secolele XVII, XVIII i XIX, care cuprind idei ce vor influena
foarte mult cercetrile i formulrile din domeniul tiinelor comportamentale
(Gregory, 1996). Astfel, filosoful i matematicianul Rn Descartes s-a ocupat
mult de problema modului n care sunt relaionate procesele mentale i
procesele fizice. John Locke, n lucrarea An Essay Concerning Human
Understanding, i expune punctul de vedere conform cruia cunotinele
provin din experien, idee pe care o regsim i n lucrrile altor empirici
britanici: A treatise Concerning the Principles of Human Knowledge (George
Berkeley); A treatise on Human Nature (David Hume); Observations on Man,
his Frame, his Duty and his Expectations (David Hartley). Christian von Wolff
a publicat dou lucrri, Psychologica empirica (1732) i Psychologica
rationalis (1734), prin intermediul crora lanseaz termenul psihologie. De

Copyright DEPARTAMENT ID 2008

13

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

asemenea, dup unii autori (Cohen et al., 1996), el este primul care concepe
psihometria ca tiin.
Indiferent ns de disputele privind paternitatea unei noiuni sau a
alteia, putem afirma c, n perioada ultimelor dou secole ale mileniului II, s-a
produs, n domeniul psihologiei, un salt extraordinar prin promovarea
metodelor cantitative n tiina psihologic. Deci, fenomenele psihice, prin
excelen subiective, pot fi msurate i evaluate matematic. S-a rspuns n felul
acesta uneia dintre cele mai serioase acuze datorit creia psihologiei nu i s-a
acceptat mult timp statutul de tiin. Nu tim, astzi, ct de mult au neles
acest lucru contemporanii perioadei la care facem referire, ns noi, la mai bine
de un secol de atunci, nu putem s nu ne exprimm recunotina fa de toi cei
care au contribuit la realizarea acestei construcii extrem de importante
pentru evoluia ulterioar a psihologiei: psihometria.
Tem de reflecie/autoevaluare:
De ce este dificil s susinem faptul c exist un singur printe al psihometriei sau a
psihodiagnosticului ?

ntrebri de autoevaluare
1. Ce nelegem prin termenul de psihodiagnoz ?
2. Ce nelegem prin termenul de evaluare psihologic ?
3. Care sunt noiunile, ce se refer la evaluarea psihologic , vehiculate mai frecvent n
literatura de specialitate ?
4. Prin ce se deosebete un psihodiagnostician de un psihotehnician ?
5. De ce psihologul trebuie s promoveze n mod consecvent evaluarea psihologic
tiinific ?
6. Care sunt cele mai vechi forme ale testrii psihologice ?
7. Ce putem reproa celor care utilizau asemenea forme ?
8. Cui putem acorda paternitatea conceptului de psihometrie ?
9. Care sunt meritele principale ale lui A. Binet privind dezvoltarea psihometriei ?
10. Care sunt meritele principale ale lui James McKeen Cattell privind dezvoltarea
psihometriei ?
11. Care sunt contribuiile lui W. Wundt i ale doctoranzilor si la dezvoltarea
psihodiagnosticului ?
12. Cu ce au contribuit i unii filosofi la dezvoltarea psihometriei ?
13. Ai putea s precizai care este locul i rolul testelor n selecia profesional ?
BIBLIOGRAFIE MINIMAL
ALBU, M. (2000). Metode i instrumente de evaluare n psihologie, Cluj-Napoca: Argonaut.
MITROFAN, N. (2001), Psihometria i direciile ei de dezvoltare la nceput de mileniu. n ZLATE
M. (coord.), Psihologia la rspntia mileniilor. Iai: Polirom.
SCHIOPU, U. (2003), Introducere n psihodiagnostic. Bucureti: Editura Pro-Humanitas.
STAN, A. (2002). Testul psihologic.Evoluie, construcii, aplicaii. Iai: Polirom.
GREGORY, R.J. (1996). Psychological testing. History, Principles, and Applications. Needham

Copyright DEPARTAMENT ID 2008

14

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Heights: Allyn & Bacon.


COHEN, R.J. et al. (1996). Psychological Testing and Assessment. An Introduction to Tests and
Measurement. Mayfield Publishing Company, Mountain View, ed. a 3-a.

Copyright DEPARTAMENT ID 2008

15

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Unitatea de nvare nr. 2


Contribuii la dezvoltarea psihodiagnosticului n secolul XX
Cuprins:
2. 1. Testele de inteligen
2. 2. Testele de personalitate
2.3. Testele de aptitudini
2.4. Testele de achiziii
2.5. Modele de testare clinic

Obiective:
La sfritul acestei uniti de nvare studenii vor fi
capabili s:
cunoasc principalele contribuii privind testele
de inteligen
cunoasc principalele contribuii privind testele
de personalitate
cunoasc principalele contribuii privind testele
de aptitudini
cunoasc principalele contribuii privind testele
de achiziii
cunoasc principalele contribuii privind testele
folosite n clinic
evalueze critic toate contribuiile privind
psihodiagnoza de pn la sfritul sec. XX.
2.1. Testele de inteligen
Printre primele teste care au aprut la nceputul secolului XX au fost testele de inteligen. Dup ce A. Binet i colaboratorul su, T. Simon, au creat
prima scal metric a inteligenei, ce cuprindea 30 de itemi, destinat
identificrii copiilor colari retardai mintal din Paris, s-a produs o intensificare
fr precedent a interesului practicienilor pentru aceste instrumente. Ele vor fi
aplicate n coli, nchisori, tribunale pentru copii etc. Testul lui Binet a fost
supus unor multiple revizuiri i traduceri, att n Europa, ct i, mai ales, n
America. Revizuirea fcut de L. Terman, n 1916, confer acestui test
denumirea de Stanford-Binet Intelligence Scale (Scala de inteligen StanfordBinet). Testul lui Binet a fost un test individual, ns odat cu declanarea
primului rzboi mondial a aprut cerina creerii unor teste care s poat fi
aplicate pe grupuri mai mari de subieci i ntr-un timp mai scurt. Aa au aprut
testele de grup pentru abilitile umane (the Army Alpha i the Army Betha),
create de un colectiv de psihologi avndu-l n frunte pe Roberet Yerkes, care
deinea i funcia de preedinte al Asociaiei Psihologilor Americani.

Copyright DEPARTAMENT ID 2008

16

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Odat cu apariia testelor de grup, a crescut interesul i pentru alte


categorii de teste, cum ar fi testele de aptitudini, testele de achiziii, testele de
interese, testele de personalitate, dei distincia dintre ele nu era ntotdeauna
uor de fcut.
Cu puin nainte de declanarea celui de-al doilea rzboi mondial, mai
exact n 1939, David Wechsler a publicat prima versiune a Scalelor de
inteligen Wechsler, i anume, The Wechsler-Bellevue Intelligence Scale (WB), moment de cotitur n psihometrie, deoarece aducea unele nouti n ceea
ce privete testarea inteligenei. Astfel, printre altele, spre deosebire de testul
Stanford-Binet, care permitea calcularea doar a unui scor QI, acest nou
instrument psihodiagnostic fcea posibil calcularea mai multor scoruri i,
totodat, stabilirea profilului individual ca urmare a combinrii abilitilor. Ca
o noutate absolut apare posibilitatea calculrii QI performan.
Cele dou mari baterii de inteligen au fost supuse unor revizuiri
repetate, fiecare dintre ele avnd ca obiectiv de baz mbuntirea
caracteristicilor lor psihometrice. Ele s-au impus, n practica psihodiagnostic,
ca cele mai de valoare teste, gradul de ncredere acordat rezultatelor obinute cu
ajutorul lor fiind maximal. De altfel, ele au fost preluate, traduse i
standardizate n foarte multe ri, inclusiv n ri din Europa.
Tem de reflecie/autoevaluare:
Care sunt asemnrile i care sunt deosebirile dintre cele dou mari baterii de inteligen:
Stanford-Binet i Wechsler-Bellevue ?
2.2. Testele de personalitate
Dup al doilea rzboi mondial ncep s prolifereze testele de
personalitate, care i propun s msoare diferite trsturi considerate a fi
dispoziii relativ de durat care difereniaz un individ de altul (Kaplan i
Saccuzzo, 1993). De altfel, primul test de personalitate a fost elaborat n
timpul primului rzboi mondial, purtnd numele de Woodworth Personal
Data Sheet (Gregory, 1996). Fiind publicat n form final dup rzboi, acest
test devine reprezentativ pentru categoria de teste structurate de grup gen
creion-hrtie. Aceste teste erau prevzute cu rspunsuri de tip
Adevrat/Fals sau cu rspunsuri multiple la alegere, ceea ce fcea ca ele s
poat fi aplicate pe grupuri mari de subieci. Interesul pentru asemenea tipuri
de teste a sczut mult pn n anii 30 40, pentru ca, dup cel de-al doilea
rzboi mondial, s creasc din nou.
n 1921, n Europa, mai exact n Elveia, Herman Rorschach a
publicat testul ce-i poart numele, Testul Rorschach, deschiznd astfel calea
pentru o nou categorie de teste i anume, testele proiective. Testul a fost
introdus n America de ctre David Levy mult mai trziu, fiind primit cu
mult circumspecie. Abia dup ce un student al lui Levy, Sam Beck i-a
investigat tiinific proprietile i a comunicat rezultatele n cadrul tezei sale
de doctorat, s-a produs o cretere rapid a intersului pentru acest test i, apoi,
pentru testele proiective. Una dintre dovezi o constituie dezvoltarea, n 1953,
de ctre Henry Murray i Christina Morgan a testului numit the Tematic
Apperception Test (TAT), mult mai structurat dect testul Rorschach. n

Copyright DEPARTAMENT ID 2008

17

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

1928, A.F. Payne a propus tehnica completrii frazei, care consta, n


principiu, n a oferi subiectului un nceput de fraz (o rdcin), de
exemplu: Sunt foarte preocupat cnd, acesta vnd sarcina de a completa
fraza respectiv.
O alt contribuie remarcabil legat de categoria testelor proiective a
avut-o F.L. Goodenough, care a ncercat s determine nu numai nivelul
intelectual, ci i interesele i trsturile de personalitate ale copiilor pe baza
analizei desenelor acestora. Dar o variant mult mai bine structurat i
standardizat a testelor de desen a aprut n anul 1948, sub denumirea
Testul House-Tree-Person i legat de numele lui J. Buck.
n Europa testarea proiectiv era dominat de Testul Szondi, elaborate
de L. Szondi, psihiatru elveian de origine maghiar. Referitor la coninutul
testului, acesta consta din 48 de fotografii ale unor pacieni psihiatri,
mprite n 6 seturi cuprinznd urmtoarele 8 tipuri: homosexual, epileptic,
sadic, isteric, catatonic, paranoic, maniac i depresiv. In concepia autorului
tulburrile psihiatrice majore sunt cauzate de gene recesive. Un alt autor, S.
Deri a adus acest test in SUA ns a renunat la explicaiile lui Szondi. Dup
opinia lui alegerea fotografiilor s-ar datora identificrii incontiente a
subiectului cu caracteristicile pacienilor fotografiai.
Un moment crucial n evoluia testelor de personalitate l reprezint
dezvoltarea, n anul 1943, a Inventarului Multifazic de Personalitate
Minnesota (Minnesota Multiphasic Personality Inventory MMPI). Spre
deosebire de testele de personalitate structurate, de genul testului
Woodworth, autorii testului MMPI au argumentat c nelesul rspunsurilor
la test poate fi determinat prin cercetri empirice. Dup aproape o jumtate de
secol de utilizare, MMPI va aprea ntr-o nou versiune, respective, MMPI-2
(Butcher, 1989, 1990). n toat aceast perioad el s-a impus ca unul dintre
cele mai utilizate teste de personalitate, n legtur cu el fiind elaborate multe
mii de lucrri.
Un alt test de personalitate celebru, care a fost dezvoltat n acelai
context al rspunderii pentru cercetarea empiric, a aprut n 1957, sub
denumirea California Psychological Inventory (CPI). Deoarece variantele
originale ale testelor MMPI i CPI se confruntau cu unele probleme
psihometrice semnificative, revizuirea lor pentru MMPI, n 1986, iar pentru
CPI, n 1987 a fcut ca aceste probleme s fie nlturate, testele cptnd o
larg utilizare nu numai n SUA, ci n mai multe ri ale lumii. Tot cam n
aceeai perioad cu MMPI a aprut i testul 16 PF Cattell (the Sixteen
Personality Factor), dezvoltat de ctre R.B. Cattell i care rmne de.a lungul
timpului un bun exemplu de test de personalitate bine strucuturat i care este
bazat pe metoda analizei factoriale.
O alt categorie de teste a fost creat pentru orientarea i consilierea
persoanelor. Amintim, mai nti, Inventarul de interese, care i avea originea
n studiul lui R.L. Thorndike (1912), efectuat pe un lot de 100 de studeni. n
perioada 1919-1920 Yoakum a dezvoltat o baz de 1000 de itemi privind
interesele din copilrie i pn la maturitatea timpurie (Dubois, 1970). O
mare parte din aceti itemi au fost ncorporai n Carnegie Interest Inventory,

Copyright DEPARTAMENT ID 2008

18

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

test care a fost supus, de ctre K.M. Cowdery, timp de doi ani, respectiv,
1926-1927, la mai multe mbuntiri, cum ar fi, de exemplu: creterea
numrului de itemi, compararea rspunsurilor a 3 grupe-criteriu (medici,
ingineri i juriti) cu grupe de control cuprinznd neprofesioniti.
Edward K. Strong a revizuit testul lui Cowdery i timp de 36 de ani s-a
ocupat de un nou instrument destinat a msura interesele, cunoscut sub
numele Strong Vocational Interest Blank (SVIB). Acesta va deveni unul
dintre cele mai utilizate teste din toate timpurile, dei, a avut, mai mereu, un
serios competitor testul ce purta denumirea de Kuder Preference Record,
creat n anul 1934. Ceea ce era specific pentru acest test era faptul c el
compara mai mult puterea relativ a intereselor la nivel individual dect
rspunsurile individuale cu rspunsurile variatelor grupe profesionale. Deci,
era un test ipsativ iar cele mai recente revizuiri ale acestui instrument
psihodiagnostic include variantele Kuder Survey i Kuder Occupational
Interest Survey (Zytowski, 1985).
Teme de reflecie/autoevaluare:
1. Care este primul test de personalitate construit n timpul primului rzboi mondial ?
Prin ce se caracterizeaz el ?
2. Care sunt cele mai importante teste proiective construite n prima jumtate a
secolului XX ?
3. Prin ce se deosebete testul 16PF Cattell de testele MMPI i CPI ?
4. Care sunt testele de interese mai cunoscute ? Prin ce se caracterizeaz ele ?

2.3. Testele de aptitudini


Dezvoltarea testelor de aptitudini a rmas oarecum n urma celei a testelor de
inteligen, dei ele sunt instrumente de msur a abilitilor mult mai specifice
i mai delimitate. i aceasta mai ales din dou motive: unul statistic i
altul social (Gregory, J., 1996). Problema statistic inea de faptul c o nou
tehnic i anume, analiza factorial, era necesar frecvent pentru a stabili care
dintre aptitudini erau primare i, totodat, distincte una fa de alta. Analiza
factorial i-a permis lui L.L.Thurstone s concluzioneze c exist factori
specifici ai abilitilor mintale primare, cum ar fi: nelegerea verbal, abilitatea
numeric, abilitatea spaial, memoria asociativ, viteza perceptual,
raionamentul general. n concepia acestui autor, n structura aptitudinilor nu
exist un singur factor general, aa cum susinuse Spearman, ci mai muli,
respectiv, apte. n 1938 el construiete una dintre primele baterii de teste
pentru aptitudini multiple, intitulat The PrimaryMental Abilities Test (PMA).
Ulterior au fost dezvoltate alte baterii de aptitudini, care au fost aplicate anual
pe milioane de subieci din SUA.
Una dintre cele mai populare baterii de teste de aptitudini a fost realizat
de ctre Bennet, Seashore i Wesman (1982, 1984) sub denumirea The
Differential Aptitude Test (DAT). Prima versiune a aprut n anul 1947, fiind
dedicat, iniial, orientrii vocaionale a elevilor din clasele VIII-XII i, apoi,

Copyright DEPARTAMENT ID 2008

19

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

consilierii vocaionale a adulilor tineri i seleciei angajailor. Referitor la


coninut, aceast baterie cuprinde un numr de 8 teste independente, ceea ce
nseamn c, n funcie de scopurile diagnostice, bateria poate fi aplicat i
parial.
O aciune de mare amploare a fost iniiat, n 1930, de ctre
Departamentul muncii din SUA, constnd n crearea unor teste de aptitudini
necesare pentru prognozarea performanei n munc pentru 100 de ocupaii
specifice. Ulterior, mai exact n 1940, acest departament apeleaz la serviciile
unor profesioniti n msurare i psihologie industrial-organizaional pentru a
crea o baterie de teste pentru aptitudini multiple, capabil s msoare ocupaiile
studiate mai nainte. Aa a luat natere General Aptitude Test Battery (GATB),
prima baterie folosit pentru predicia performanei n munc. Referitor la
coninut, aceast baterie cuprinde 8 teste creion-hrtie i 4 teste-aparate. Cele
12 teste pot fi aplicate n 2 ore i i permit calcularea scorurilor la 9 factori.
Unul dintre cele mai folosite teste de aptitudini, tip creion-hrtie este
ASVAB (The Armed Services Vocational Aptitude Battery). Anual el este
aplicat pe un numr de peste 2 milioane persoane i cuprinde 10 subteste.
2.4. Testele de achiziii
Din aceast categorie fac parte dou grupe de teste i anume: a) teste
folosite pentru admiterea n instituiile de nvmnt; b) teste propriu-zis de
achiziii (achievement tests). Din prima grup fac parte multe teste, ele avndui originea n testele de inteligen The Army Alpha i The Army Betha, folosite
n timpul primului rzboi mondial i fiind destinate a msura inteligena
subiecilor. Unul dintre cele mai vechi este The College Entrance Examination
Board (CEEB). Dup introducerea mainii de scorare, n 1930, aceste teste au
evoluat ctre College Board Tests, n particular The Scholastic Aptitude test,
cunoscut n prezent sub numele de Scholastic Assessment Test. Funciile CEEB
au fost subsumate ulterior la Educational Tests Service (ETS), care s-a
preocupat de dezvoltarea, standardizarea i validarea unor teste folosite pentru
admitere, devenite apoi foarte cunoscute, precum: The Graduate Record
Examination, The Law School Admissions Test, Peace Corps Entrance Tests.
Testele de achiziie au ca o trstur comun faptul c ele urmresc
diagnosticarea, la nivel individual, a achiziiilor realizate de ctre cei inclui n
procesul de nvmnt, fie acestea cunotine din diferite domenii, fie
deprinderi i capaciti formate. Deci este vorba i de aspectul informaional
(achiziionarea de cunotine) i de aspectul formativ (capacitatea de a opera,
de a aciona). Toate acestea sunt teste standardizate, ceea ce nseamn c
rezultatele obinute de un elev, de exemplu, sunt raportate la rezultatele
obinute de ntreg lotul de subieci folosit pentru standardizare
Tem de reflecie/autoevaluare:
Care sunt elementele de asemnare i cele de diferen ntre testele de aptitudini i cele de
achiziie ?
2.5. Modele de testare clinic
Unii autori au ncercat s fac o evaluare a modului n care psihometria
s-a implicat i a contribuit la rezolvarea problemelor specifice unui anumit

Copyright DEPARTAMENT ID 2008

20

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

domeniu al psihologiei aplicate. Astfel, de exemplu, S.J. Korchin i D.


Schuldberg (1981) au identificat patru modele sau orientri privind testarea
psihologic n clinic. Ele reflect diferenele profunde privind concepia
despre natura uman, distresul psihologic i condiiile pentru schimbarea
terapeutic efectiv:
Primul model, de altfel i cel mai vechi este modelul psihometric i el
are ca element central msurarea pe baz de teste. Scopul l reprezint predicia
statistic a trsturilor i el reclam ca testele utilizate s fie valide i demne de
ncredere. Obiectivitatea itemilor testului trebuie abordat prin obiectivitatea
examinatorului.
Al doilea model poart denumirea de tradiia clinic. n acord cu acest
model evaluatorul clinic poate utiliza tehnici psihometrice, ns, spre deosebire
de modelul psihometric, al crui scop era descrierea trsturilor, el se
concentreaz asupra descrierii personalitii, incluznd arii multiple i niveluri
de funcionare. Evaluatorul clinic, acionnd n acord cu tradiia clinic, pune
mai mult accentul pe utilizarea raionamentului, inferenei i subiectivitii.
Al treilea model msurarea comportamentului difer mult de
modelele anterioare, att n concepie, ct i n practic. Evaluatorii
comportamentului ocolesc concepiile asupra personalitii privind dispoziiile
sau trsturile. Ei resping ideea conform creia personalitatea are legtur cu
ceea ce un individ este sau are i pun accentul mai mult pe ceea ce individul
face. De aceea, rolul testrii psihologice este minimizat. Criteriile psihometrice
sunt n mare msur incompatibile cu presupunerile comportamentale.
Al patrulea model l reprezint psihologia umanist, ai crei
reprezentani se manifest predominant negativ fa de msurare. C. Rogers
(1942) a avut o mare influen n aceast direcie, susinnd dezavantajele
utilizrii testelor. n concepia lui clientul i nu terapeutul trebuie s fie
diagnosticianul. Fcnd o sintez a mai multor puncte de vedere, A.
Sugarman (1978) evideniaz urmtoarele argumente pentru afirmaia c
msurarea psihologic nu este umanist: - msurarea este reducionist; msurarea este artificial; - msurarea nu acord atenie relaiei examinatorpacient; - msurarea judec pacientul; - msurarea este prea intelectual.

ntrebri de autoevaluare:
1. Care este contribuia lui A. Binet i a lui T. Simon la dezvoltarea psihodiagnozei ?
2. Ci itemi cuprinde prima scal metric a inteligenei ?
3. Care sunt primele teste de grup folosite pentru testarea abilitilor umane ?
4. Care este contribuia lui L. Terman privind dezvoltarea psihodiagnosticului ?
5. Dar a lui D. Wechsler ?
6. Care este cel mai vechi test de personalitate ?
7. Care sunt primele teste proiective create ?
8. Care sunt cele mai cunoscute i cel mai mult folosite chestionare de personalitate ?
9. Care este bateria de teste creat de L.L. Thurstone ?
10. Care este specificul testelor de achiziie ?
11. Care sunt diferenele de baz dintre cele 4 modele de testare clinic ?

Copyright DEPARTAMENT ID 2008

21

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

BIBLIOGRAFIE MINIMAL
GREGORY, R.J. (1996). Psychological Testing. History, Principles, and Applications. Alyyn &
Bacon, Needham Heights.
HORGHIDAN, V. (1998), Metode de psihodiagnostic. Bucureti: Editura didactic i pedagpogic.
MITROFAN, N. (2001), Psihometria i direciile ei de dezvoltare la nceput de mileniu. n M. Zlate
(coord.), Psihologia la rspntia mileniilor. Iai: Polirom.
SCHIOPU, U. (2003). Introducere n psihodiagnostic. Bucureti: Editura Pro-Humanitas.
LECTURI SUPLIMENTARE
ALBU, M. (2000). Metode i instrumente de evaluare n psihologie. Cluj-Napoca: Argonaut.
EYSENCK, H.J. (1998). Teste de inteligen. Bucureti: Queen.

Copyright DEPARTAMENT ID 2008

22

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Unitatea de nvare 3
Tendine i direcii de dezvoltare a psihodiagnosticului la
nceptul mileniului III
Cuprins:
3.1. Teoria testelor
3.2. Construcia i dezvoltarea unor noi teste
3.3. Computerizarea testelor
3.4. Predicii pentru viitorul apropiat

3.1.

Obiective:
La sfritul acestei uniti de nvare, studenii vor fi
capabili s:
cunoasc diferenele dintre teoria clasic i teoria
rspunsului la item
cunoasc noile direcii de construcie i dezvoltare
a unor teste
evalueze critic utilizarea computerului n testarea
psihologic
cunoasc principalele predicii pentru viitorul
apropiat

Teoria testelor
n planul teoriei,
modelul
clasic
psihometric este nlocuit de un model nou i anume, IRT (Teoria rspunsului
la item). Fcnd o sintez a mai multor puncte de vedere, M. Albu (1998)
ajunge la concluzia c aceast teorie are la baz urmtoarele postulate: 1.
Comportarea unui subiect la un item al unui test poate fi explicat (sau prezis)
cu ajutorul unui set de factori, numii trsturi, trsturi latente sau abiliti.
Orice construct inobservabil, presupus continuu, n privina cruia o teorie
psihologic afirm c persoanele se deosebesc ntre ele poate fi privit ca factor.
Fiecrui factor i se asociaz o variabil cu valori numerice cuprinse ntre - i
+ , continu, denumit variabil latent. 2. Se infereaz existena unui factor
numai dac se observ c rspusnurile la itemi prin care se dorete msurarea
constructurlui covariaz (variaz la fel). 3. Relaia dintre performna la item a
subiecilor i fiecare dintre trsturile care au legtur cu performana poate fi
descris prin cte o funcie cresctoare, denumit funcie caracteristic a
itemului sau curb caracterisitic a itemului. Aceast funcie arat cum
depinde probabilitatea de a rspunde corect (sau afirmativ) la item de nivelul
trsturii.
Cei care susin acest model caut s evidenieze i argumentele sau
raiunile privind importana lui i anume: 1. IRT poate compara teste alctuite
explicit din itemi diferii. n consecin, ea permite comparaii ntre diferite
ocazii pentru acelai subiect, n raport cu care memoria pentru rspunsurile
anterioare este o problem, chiar dac cele dou teste nu au itemi comuni.
Aceasta este numit msurarea liber a testului i este important pentru
testarea ajustat i pentru testarea adaptativ computerizat. 2. Subiecii cu

Copyright DEPARTAMENT ID 2008

23

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

acelai scor clasic pot s difere n ceea ce privete deprinderea msurat,


depinznd de presupunerile fcute de modelul IRT. 3. Estimarea clasic a
nivelului atributului (deprinderii) sau numrul corect la un test de abiliti nu
este legat linear de forma deprinderii. n consecin, scala numrului corect nu
este o scal de interval. 4. Estimrile clasice ale dificultii i discriminrii,
cum ar fi probabilitatea unui rspuns corect, valoarea p i corelaia scor la item
scor total (rit) nu sunt dependente una de alta aa cum sunt dependente de
abilitile subiectului. Astfel, de exemplu, un item a crui valoare p n populaia
general este 0,5 va avea o valoare mai sczut printre cei cu abiliti
inferioare, dar psihometria clasic nu poate s prezic magnitudinea
descreterii, ceea ce nu este cazul IRT.
O alt teorie ce s-a impus n atenia psihodiagnosticienilor este teoria
strilor i a trsturilor latente, care ncearc s dea rspuns la urmtoarele
ntrebri (Albu, M., 1998): - cum putem afla dac rspunsurile date de un
subiect la un chestionar care msoar o trstur de personalitate intervin sau
nu efectele situaiei de msurare ? ; - dac exist efecte ale situaiei, ce relaie
exist ntre scorul obinut la scal i trstura msurat ?; - ce relaie exist
ntre stri i trsturi ?
Dar ce este starea i ce este trstura ? Spre deosebire de disciplinele
tradiionale ale psihologiei, care aveau n atenie fie numai diferenele
interindividuale (cum este cazul psihologiei difereniale), fie diferenele
intraindividuale (cum este cazul psihologiei generale), teoria strilor i
trsturilor recunoate printre atributele psihologice existena att a
deosebirilor dintre indivizi, stabile n timp, ct i a schimbrilor
intraindividuale. Ea consider c fiecare atribut psihologic observat este afectat
ntr-un anumit grad de: - caracteristici ale individului; - caracteristici ale
situaiei i/sau influenelor care interacioneaz; - eroarea de msur. n
consecin, rezultatul msurrii unei variabile observate se descompune n: 1. o
component care nu depinde de situaie i/sau de efectele interaciunilor; 2. o
component care depinde de situaie i/sau de efectele interaciunilor; 3. o
eroare de msur. Prima component este denumit trstur, iar suma
primelor dou componente este denumit stare.
Existena acestor componente are implicaii extrem de importante asupra
modului n care se face evaluarea psihologic (Albu, M., 1998).n construirea
i utilizarea testelor este necesar s se cunoasc nu numai fidelitatea acestora,
ci i ct de mult msoar aceste caracteristici stabile ale persoanelor i ct de
mult sunt afectate ele de situaia n care se face msurarea. Cnd se urmrete
msurarea trsturilor, rezultatele msurrilor trebuie s fie afectate ct mai
puin de efectele specifice ocaziei de msurare. Cnd se evalueaz starea,
instrumentul utilizat trebuie s fie sensibil la influenele situaiei.
O alt tendin actual n psihodiagnostic i care se va accentua n anii
urmtori este trecerea de la evaluarea psihometric la evaluarea potenialului de
nvare (Havrneanu, C., 2000). Aceste dou sisteme de evaluare au fost
percepute antagonist, iar explicaia rezid n apariia unei noi paradigme care se
opune practicii tradiionale ndelung aplicate. Evaluarea potenialului de
nvare ofer posibilitatea construirii i exersrii unei sarcini, urmrindu-se

Copyright DEPARTAMENT ID 2008

24

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

evoluia subiecilor n rezolvarea ei. Aceast metod de evaluare, spre


deosebire de psihometrie, nu se bazeaz pe ceea ce subiecii au nvat nainte,
ci propune sarcini de nvare specifice pentru a se cunoate profitul pe care ei
pot s-l obin.
Pentru evaluarea cantitativ i calitativ a potenialului de nvare se
folosesc dou procedee: 1. Antrenamentul n timpul testului, procedeu care
const n corectarea i antrenarea subiectului imediat dup o soluie greit.
Dup aceast faz urmeaz evaluarea, n care se ofer subiectului un numr de
itemi pe care trebuie s-i rezolve fr asisten. Ceeea ce este important n
aceast procedur este faptul c subiectul poate s-i manifeste aptitudinea de a
stpni i aplica principiile nvate n timpul evalurii; 2. Procedeul pre-test
post-test, ce cuprinde trei faze: - faza pre-test, care const n obinerea unei
evaluri de baz a funciilor actuale i care este asemntoare testului
psihometric uzual; - faza nvrii, care const n a expune subiectului
condiiile ce favorizeaz reuita sarcinii propuse. n aceast faz i se dau
ajutoare ce-i permit s avanseze spre rezolvarea problemei, s nvee strategii
de utilizat pentru rezolvare sau s-i corecteze comportamentul indecvat fa de
problem; - faza post-test, care const n verificarea efectelor nvrii.
De fapt, cele dou tendine nu se exclud, ci, dimpotriv, ele sunt
complementare n examenul psihologic (Hvrneanu, C., 2000). Testele permit
evaluarea a ceea ce un subiect este capabil s fac n momentul administrrii
testului, iar evaluarea potenialului de nvare ne permite s estimm dac
subiectul este capabil s nvee.
Teme de reflecie/autoevaluare:
1. Ce aduce nou, n domeniul psihodiagnosticului, teoria rspunsului la item (IRT) ?
2. Ce aduce nou, n domeniul psihodiagnosticului, teoria strilor i trsturilor ?
3. n ce const evaluarea potenialului de nvare ?
3.2. Construcia i dezvoltarea unor noi teste
Sute de noi teste sunt publicate n fiecare an i rata proliferrii lor va
crete, pe de o parte, din nevoia de a rspunde unor cerine dinspre noi domenii
(de exemplu, psihologia ecologic, psihologia comportamentului, psihologia
clinic, psihologia familiei etc.), iar pe de alt parte, din nevoia de a nlocui
testele mai vechi.
Printre testele mai noi putem aminti: The Kaufman Assessment Battery
for Children (K-ABC), Minnesota Multiphasic Personality Inventory, varianta
2 (MMPI-2) pentru aduli i varianta pentru adolesceni (MMPI-A), Personality
Inventory for Children (PIC), Multidimensional Aptutude Battery (MAB) .a.
Privitor la personalitate au fost construite mai multe teste bazate pe modelul
celor 5 factori (BIG-FIVE). Dei diferii cercettori au folosit termeni diferii,
aceti factori sunt (Minulescu, M., 1996): NevrotismulNeuroticism;
ExtraversiuneaExtraversion; Deschiderea la experienOpenness to
Experience;
AgreabilitateaAgreeableness;
Contiinciozitatea

Conscientousness. Rearanjnd aceti factori se ajunge la un acronim simplu:


OCEAN (Gregory, R.J., 1996).

Copyright DEPARTAMENT ID 2008

25

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Plecnd de la acest model, P.T. Costa (1991) i R. McCrae (1989, 1992)


au construit dou teste de personalitate: 1. The revised NEO Personality
Inventory (NEO-PI-R), ce conine 240 de itemi. n afara celor 5 domenii
majore ale personalitii, inventarul msoar 6 trsturi specifice, numite faete,
n cadrul fiecrui domeniu; 2. The NEO Five-Factor inventory (NEO-FFI), ce
cuprinde 60 de itemi i care este, de fapt, o versiune prescurtat a celuilalt.
Oricum, noile teste i dovedesc superioritatea fie datorit unor caliti
psihometrice superioare, fie datorit faptului c sunt mult mai specifice i mult
mai potrivite pentru diferite probleme particulare. De asemenea, testele mai noi
se dosebesc fundamental de cele tradiionale, deoarece ele sunt bazate pe
concepte i teorii moderne din diferite ramuri ale psihologiei. Este suficient s
amintim, de exemplu, impactul produs asupra construirii testelor de inteligen
de teoria lui R. Sternberg (modelul triarhic) i de teoria lui H. Gradner (variante
multiple ale inteligenei).
De altfel, proliferarea testelor netradiionale este determinat de dou
tendine existente n testarea psihologic: 1. testele netradiionale reflect
creterea rspunsului tiinei psihologice la nevoile din ce n ce mai mari de
aplicare n practic (Haynes, S.N.,1991). Chiar i cei mai nverunai adversari
ai psihometriei pot s recunoasc faptul c noile teste constituie, nainte de
orice, un rspuns la obiecii i o ncercare de perfecionare i de cretere a
puterii (soundness) testului; 2. Se fac eforturi pentru a integra testele cu alte
aspecte ale psihologiei aplicate. De exemplu, muli psihologi, orientai n
special spre latura comportamental, au fost decepionai de relaia extrem de
slab dintre msurarea clinic, testele tradiionale i interveniile pe linia
tratamentului (Haynes, S.N., 1992). Cel mai de dorit ar fi nu testele ale cror
rezultate au o legtur direct cu tratamentul, ci acelea care pot fi utilizate
pentru msurarea eficacitii tratamentului.Un alt aspect al proliferrii
instrumentelor psihodiagnostice l constituie construirea unor teste din
categoria celor semistandardizate. Este vorba, de altfel, de ncercarea
psihologilor de a scoate psihodiagnosticul de sub controlul exclusiv al
experilor i de a oferi i altor utilizatori (cum este cazul prinilor, cadrelor
didactice, personalului medical, asistenilor sociali .a.) unele instrumente
psihodiagnostice care s-i ajute n activitatea lor. Aceste teste ar oferi
informaii cu caracter orientativ (Mitrofan, N., 1997), iar n cazul n care sunt
semnale c exist probleme mai serioase, trebuie s se apeleze la un
psihodiagnstician expert. i dac ne gndim c asemenea culegeri de teste
publicate poart pe coperi nume celebre, cum este cel al lui H.J. Eysenck
(1998), putem s nelegem mai uor utilitatea lor. Cu toate acestea, considerm
c sunt necesare serioase precauii, deoarece o asemenea intenie generoas
poate fi contrabalansat de multiple efecte negative asupra psihodiagnozei
autentice, tiinifice.
Teme de reflecie/autoevaluare:
1. Care sunt cele mai noi teste create ? Ce trsturi au ele fa de cele create mai demult ?
2. De ce trebuie s manifestm precauie fa de testele semistandardizate ?

Copyright DEPARTAMENT ID 2008

26

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

3.3. Computerizarea testelor


Desigur, un prim scop al utilizrii computerului n psihodiagnoz l
reprezint scurtarea timpului de aplicare, incluznd toate etapele i, mai ales,
scorarea i interpretarea rezultatelor. Unii autori ncearc s evidenieze i alte
avantaje. Astfel, C. Havarneanu (2000) delimiteaz urmtoarele criterii care
evideniaz avantajele utilizrii computerului n examinarea psihologic: 1.
Criteriul timp. Fa de probele clasice, cele computerizate aduc o condensare
temporal. Aceasta nu rezult din scurtarea timpului de solicitare, ci din modul
rapid de prelucrare, afiare i tiprire a rezultatelor. Timpul ctigat poate fi
alocat ntreinerii psihologice prelungite cu subiectul aflat n situaia de
examinare. Computerul nu se interpune ntre examinat i examinator, el oferind
posibilitatea prelungirii sensibile a contactului uman direct, att de necesar
realizrii unui psihodiagnostic competent; 2. Criteriul mobilitii. Fa de unele
probe de reactivitate senzorio-motorie utilizate, subiectul poate reaciona la
stimuli n micare bidimensional. Posibilitatea utilizrii unor stimuli
perturbatori are o gam mai larg de utilizare. Un avantaj cert este acela c
exist posibilitatea subiectului de a comunica interactiv cu computerul, care
posed largi distribuii ale posibilitilor de rspuns; 3. Criteriul
particularizrii i individualizrii examenului. n formele tradiionale de
examinare, operativitatea este sczut din cauza timpului practic limitat care se
poate aloca pentru a culege un numr mare de date i pentru a face comparaii
rapide ale acestora. n formele de examinare computerizat se pot efectua
comparaii rapide, se pot nuana rezultatele, iar interaciunea datelor poate fi
analizat n permanen; 4. Criteriul economic. O particularitate deloc
neglijabil n capacitatea de investigare a unui laborator const n posibilitatea
de dotare material. O prob de tip clasic presupune cheltuieli de achiziionare
superioare costului unui computer pe care pot fi stocate un numr nelimitat de
probe psihologice.
Un alt mod de utilizare l reprezint testarea computerizat adaptativ.
Diferitele seturi de ntrebri ale testului sunt administrate, cu ajutorul
calculatorului, la diferii indivizi n funcie de statutul fiecruia dintre ei fa
de trstura supus msurrii. n testarea abilitilor, de exemplu, computerul
adapteaz nivelul de dificultate a itemului n funcie de rspunsul subiectului.
Dac rspunsul este incorect, este oferit un item mai uor, iar dac este corect,
poate fi selectat un item mai dificil. Un alt exemplu: un computer poate avea o
banc de itemi pentru un test de achiziie, acetia prezentnd diferite niveluri de
dificultate. Computerul poate fi programat: 1. s nu prezinte un item crescut de
dificultate dac subiectul nu a rspuns corect la 2 itemi succesivi de un nivel de
dificultate inferior; 2. s termine testarea cnd subiectul nu rspunde corect la 5
itemi consecutivi de un anumit nivel de dificultate.
O alt direcie de utilizare a computerului este aceea n care el
genereaz sarcini ce nu pot fi prezentate prin metode tradiionale. Prin
intermediul calculatorului va fi posibil abordarea unei noi palete de abiliti ce
nu au figurat n obiectivele unor teste tradiionale.
n fiecare an sunt dezvoltate tot mai multe programe pentru scorarea
testelor i pentru producerea unor rapoarte scrise. M. Albu (1998) enumer, n

Copyright DEPARTAMENT ID 2008

27

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

lucrarea sa, mult mai multe utiliti prezente i, mai ales, viitoare ale
programelor folosite n domeniul testrii psihologice: a) pstrarea rezultatelor
testrii psihologice, n fiiere sau n baze de date; b) calculul scorurilor la teste;
asemenea programe sunt utile mai ales n cazul testelor compuse dintr-un
numr mare de itemi, repartizai pe mai multe scale. Exist i teste care nu pot
fi cotate dect cu ajutorul calculatorului (de exemplu, testul pentru capacitatea
de organizare CO92); c) administrarea testelor, urmat, desigur, de calculul
scorurilor; cu ajutorul calculatorului pot fi administrate teste prin care se
msoar variabile psihice sau fiziologice care nu ar putea fi investigate n cazul
administrrii de tip creion-hrtie (de exemplu, timpul de reacie, timpul de
decizie, timpul de rspuns la fiecare item al unui chestionar etc.); d)
identificarea protocoalelor invalide, n care rspunsurile subiectului nu sunt
conforme cu realitatea. Un procedeu utilizat n acest scop aplic teste statistice
asupra succesiunilor de rspunsuri date de subiect; e) verificarea unor ipoteze
referitoare la persoana examinat, pe baza comparrii, prin teste statistice, a
rezultatelor obinute de aceasta la examenul psihologic cu cele ale unui
eantion extras din populaia creia i aparine subiectul; f) intervievarea
subiectului; programele conin, alturi de ntrebrile posibile, i un algoritm de
constituire a interviului n timpul examenului psihologic, n funcie de
rspunsurile date de subiect. Interviurile administrate de calculator sunt
contraindicate ns n cazul copiilor, al adulilor cu un nivel intelectual sczut i
al celor cu simptome psihiatrice; g) interpretarea rezultatelor la un test
psihologic, care are la baz transpunerea ntr-un program a unui set de reguli
prespecificate, referitoare la un rspuns sau la un pattern de rspunsuri (un scor
la un test sau un profil psihologic), ce permite analiza, interpretarea i
evaluarea unor caliti ale persoanelor; h) redactarea raportului psihologic;
uneori sunt formulate predicii referitoare la subiect, fie pe baza unor metode
statistice (de exemplu, folosind regresia liniar), fie pe baza identificrii unor
legturi ntre scorurile la test i unele caracteristici non-test, cum sunt datele
biografice. Alteori, n urma comparrii profilului psihologic al subiectului cu
rezultatele obinute la aceleai teste de diverse grupuri de persoane (de
exemplu, grupuri care difer ntre ele prin profesie, prin performana n munc
sau prin diagnosticul psihiatric) se determin populaia din care face parte
persoana examinat; i) alegerea tratamentului (a terapiei, a programului de
instruire etc.) cel mai potrivit pentru subiect; acesta reprezint cel mai nalt
nivel de implicare a calculatorului n activitatea psihologului i este de ateptat
ca numrul programelor de acest tip s creasc; j) construirea unui test
psihologic.
Dup unii autori (Cohen, Swerdlik i Phillips, 1996), programele
pentru computer, destinate a facilita construcia, administrarea, scorarea i
interpretarea unor teste, cum ar fi cazul testelor de achiziie dezvoltate de
cadrele didactice, vor prolifera ntr-un mod impresionant. Asemenea programe,
avnd denumiri de genul Make a test, Create a test, The Grand
Inquisitor, The First National Item Bank and Criterion-References Scoring
System, evideniaz dou avantaje majore ale testrii psihologice
computerizate: 1. capacitatea de a stoca itemi n banca de itemi; 2.

Copyright DEPARTAMENT ID 2008

28

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

capacitatea de a individualiza testarea printr-o tehnic numit ramificarea


itemului
Tema de reflecie/autoevaluare:
S presupunem c cineva manifest reticen privind utilitatea calculatorului n
activitatea psihodiagnostic. Cu ce argumente l-ai putea convinge de contrariul ?
3.4. Predicii pentru viitorul apropiat
Rferitor la tendinele de dezvoltare n viitor ale psihometriei, unii autori
(Kaplan, R.M., Saccuzzo, D.P., 1993) au formulat o serie de predicii:
Predicia 1: perspectivele sunt promitoare. Acest optimism este
bazat pe rolul imens pe care l-a jucat testarea n dezvoltarea i recunoaterea
psihologiei n general i a psihologiei profesionale, n particular. Poate c
testele, aa cum sunt cunoscute ele astzi, vor fi retrase din scen, dar aceasta
nu nseamn c psihometria i va nchide porile, ci, dimpotriv, ea va nflori
n secolul urmtor;
Predicia 2: proliferarea unor teste noi i mbuntite va continua
cu i mai mare intensitate. Testele de inteligen, aa cum se prezint ele
astzi, sunt departe de a fi perfecte, cu toate revizuirile fcute. Prin urmare,
rolul dominant al bateriilor de teste Stanford-Binet i Wechsler nu este deloc
sigur pentru viitor. Chiar dac multiplele revizuiri efectuate pn acum au
condus la mbuntirea unor elemente de coninut i la unele caliti
psihometrice noi, aceste teste nu difer n esen de caracteristicile i de
concepia care a stat la baza construirii scalelor originale. Referitor la testele de
personalitate, se pare c varianta recent (MMPI-2) a Inventarului Multifazic
de Personalitate Minnesota va fi testul secolului XXI, iar n ceea ce privete
categoria testelor proiective, testul Rorschach i va ctiga un nou nivel de
acceptan i respectabilitate n secolul XXI.
Predicia 3:schimbri revoluionare tip perestroika n testarea
colar. Unii specialiti susin c, n secolul ce a nceput, se vor utiliza mai ales
testele de achiziie standardizate la nivel naional, n timp ce alii resping
aceast idee. De asemenea, se pare c, n anii urmtori, testele de performan
ar putea nlocui testele standardizate cu rspunsuri multiple la alegere. Testele
de performan reclam ca, n loc s ofere un rspuns verbal sau s completeze
o foaie de rspuns, subiectul s fac ceva. Astfel, elevilor li s-ar cere s scrie
eseuri, s ofere rspunsuri scrise la probleme specificate sau s rezolve
probleme de matematic.
Predicia 4: vor continua controversele, nenelegerile i
schimbrile. Se pare c dezacordul i controversa reprezint cea de-a doua
natur a psihologului. i nu este vorba numai de testarea psihologic, ci de
orice. Desigur, motivul principal al controverselor dintre psihometricieni este
legat de imperfeciunile instrumentelor psihodiagnostice; de aceea, schimbarea
va fi o caracteristic constant n acest domeniu al psihologiei aplicate

Copyright DEPARTAMENT ID 2008

29

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Tem de reflecie/autoevaluare:
Analizai aceste predicii i stabilii dac viitorul activitii psihodiagnostice
este de bun augur sau nu

ntrebri de autoevaluare:
1. Prin ce se caracterizeaz Teoria rspunsului la item (IRT) ?
2. Ce nseamn evaluarea potenialului de nvare ?
3. Care sunt cele mai importante teste mai nou construite ?
4. Ce avantaje prezint computerizarea testelor ?
5. Ce nseamn testarea computerizat adaptativ ?
6. Enumerai cteva programe pentru testarea computerizat.
7. Ce se ateapt n viitor privind activitatea psihodiagnostic ?
BIBLIOGRAFIE MINIMAL
ALBU, M. (1998), Construirea i utilizarea testelor psihologice. Cluj-Napoca: Clusium.
ALBU, M., Pitariu, H. (1993). Proiectarea testelor de cunotine i examenul asistat de
calculator. Cluj-Napoca: Casa crii de tiin.
HAVRNEANU, C. (2000). Cunoaterea psihologic a persoanei. Iai: Polirom.
KAPLAN, R.M., SACCUZZO, D.P. (1993). Psychological Testing. Principles, Applications,
and Issues. Pacific Grove: Brooks/Cole Publishing Company.
MINULESCU, M. (1996). Chestionarele de personalitate n evaluarea psihologic.
Bucureti: Garell Publishing House.

Copyright DEPARTAMENT ID 2008

30

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Unitatea de nvare nr. 4


Situaia psihodiagnosticului din Romnia n perioada actual
Cuprins:
Probleme mai vechi i mai noi cu care se confrunt psihodiagnosticienii
Legea 213/2004 i Colegiul Psihologilor din Romnia
S privim viitorul cu optimism

Obiective:
La sfritul acestei uniti de nvare, studenii vor fi capabili s:
cunoasc bine problemele cu care se confrunt psihologii ce
folosesc teste;
cunoasc cerinele legate de aplicarea i comercializarea testelor;
cunoasc prevederile Legii 213/2004 privitoare la Crearea
Colegiului Psihologilor din Romnia;
identifice corect locul i rolul Comisiei metodologice;
fie familiarizat cu realizrile romneti n domeniul
psihodiagnosticului.
4.1.
Probleme mai vechi i mai noi cu care se confrunt psihodiagnosticienii.
Trebuie, mai nti, s subliniem faptul c, i nainte de 1989, chiar dac
psihologia nu era apreciat de guvernanii de atunci, au existat preocupri ale
psihologilor romni pentru dezvoltarea psihodiagnosticului. Putem aminti, n
acest sens, nume precum: Gh. Zapan, U. Schiopu, P. Constantinescu, G.
Bontil, I.M.Nestor, M. Roca, T. Kulcsar, I. Holban, A. Cosmovici .a. Din
nefericire, mai ales dup 1977, aproape un sfert de secol pedepsele politice
aplicate tiinelor sociale, dar mai ales psihologiei, au afectat grav i
psihodiagnosticul.
n perioada postdecembrist ns, psihologia romneasc a fost repus, n
mare msur, n drepturile ei fireti. S-au renfiinat seciile de psihologie din
cadrul universitilor, Institutul de psihologie, au aprut noi lucrri de valoare,
reviste, s-au organizat manifestri tiinifice. A aprut, totodat, i nvmntul
privat, aa c anual avem muli absolveni n psihologie, care doresc s activeze
ca specialiti n coli, clinici, firme, bnci, armat, transporturi etc. n aproape
orice domeniu sunt i trebuie s fie utilizate instrumente psihodiagnostice. Dar
i pn la absolvire studenii folosesc teste pentru diferite lucrri, inclusiv
pentru lucrarea de licen, pentru disertaia de masterat. Nu mai vorbim de cei
care fac tot felul de investigaii, pe baz de teste, pentru elaborarea tezei de
doctorat. Dar cum se prezint testele folosite n practic n ara noastr ?
Am putea analiza situaia lor n funcie de mai multe aspecte: a) starea
echipamentului testelor; b) aplicarea testelor; c) comercializarea testelor.
Referitor la starea echipamentului testelor, trebuie s menionm faptul
c, n marea lor majoritate, testele se prezentau ntr-o situaie

Copyright DEPARTAMENT ID 2008

31

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

necorespunztoare. Cele mai multe dintre teste erau vechi i foarte vechi,
folosite i rsfolosite, multiplicate n fel i chip, ceea ce fcea ca multe pagini
ale testelor s cuprind, pe lng coninutul itemilor, tot felul de semne i de
pete, din cauza multiplicrii n condiii tehnice discutabile. Erau multe teste
incomplete, fr manual, fr nicio surs privind istoricul, caracteristicile
psihometrice, valoarea psihodiagnostic. i n ceea ce privete, s spunem,
partea auxiliar a testelor, cum ar fi partea material, foile de rspuns, grilele
etc., au existat mari probleme, n sensul c acestea ori nu au existat, ori erau
confecionate ntr-o manier extrem de discutabil. Desigur, ntre timp lucrurile
s-au mai mbuntit. Au fost create teste noi, respectndu-se riguros cerinele
de ordin tiinific, au fost reetalonate i restandardizate teste ce erau folosite n
practic, multe teste au fost computerizate etc.
Activitatea de aplicare a testelor este serios i sever reglementat n
rile n care grija pentru meninerea prestigiului tiinific al psihologului este
permanent. Exist coduri, standarde etc. care precizeaz foarte clar cine
utilizeaz testele psihologice, cum le aplic i cum sunt folosite rezultatele. La
noi n ar, n perioada de dup Revoluie, nu au existat asemenea preocupri
iar consecinele negative nu au ntrziat s apar. Multe teste puteau fi aplicate
de oricine, fr nicio restricie. Unii psihologi au publicat chiar cri n care au
inclus informaii complete privind aplicarea testelor, cum este cazul unor teste
proiective. Ei au nclcat flagrant unele prevederi ale codului deontologic. Din
nefericire, unele teste ajunseser n mna altor specialiti (ingineri, economiti,
secretari etc.), fiind vorba de unele teste serioase i pretenioase n ceea ce
privete aplicarea i interpretarea rezultatelor.
Comercializarea testelor ridic cel puin dou ntrebri de baz: 1. de
unde procur psihologul specialist testele de care are nevoie ? 2. cine se ocup
n ara noastr de comercializarea testelor ? Ideal ar fi cam aa: un for naional
asigur revizuirea testelor, le reetaloneaz i, prin intermediul unor firme, care
trebuie s respecte strict anumite reguli de distribuire, le ofer solicitanilor, dar
mai ales celor care satisfac cerinele de formare i de specializare. Pn la
crearea Colegiului Psihologilor din Romnia, nimic din ce am menionat nu a
existat n realitate, absolvenii de psihologie fiind obligai, dac nu i-au
procurat din timpul facultii ceva teste prin multiplicare-copiere, s gseasc o
cale strict personal pentru a ajunge la unii psihologi care folosesc teste. i
iari multiplicare, cu toate consecinele sale, teste incomplete, etaloane inutile
etc. n ultimul timp mai multe firme au preluat activitatea de comercializare a
testelor, ele trebuind s aib acreditarea din partea Comisiei metodologice a
Colegiului.
Tem de reflecie/autoevaluare:
Cu ce probleme s-au confruntat, i se mai confrunt nc, psihodiagnosticienii din
ara noastr ?
4.2. Legea nr. 213/2004 i Colegiul Psihologilor din Romnia
Desigur, necesitile apariiei acestei legi nu in numai de problemele
legate de instrumentele psihodiagnostice. Ea a aprut n 2004 sub denumirea
complet Legea nr. 213 din 27 mai 2004 privind exercitarea profesiei de

Copyright DEPARTAMENT ID 2008

32

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

psiholog cu drept de liber practic, nfiinarea, organizarea i funcionarea


Colegiului Psihologilor din Romnia. Aceast lege trebuie s fie cunoscut de
orice psiholog din Romnia, incluzndu-i i pe cei care se afl n proces de
formare (studenii, masteranzii). n baza ei s-a nfiinat Colegiul Psihologilor
din Romnia, iar n cadrul Colegiului funcioneaz 4 comisii aplicative,
respectiv: a) Comisia de psihologie clinic, consiliere psihologic i
psihoterapie; b) Comisia de psihologie a muncii, transporturilor i serviciilor;
c) Comisia de psihologie educaional, consiliere colar i vocaional; d)
Comisia de psihologie pentru aprare, ordine public i siguran naional. De
asemenea, mai funcioneaz Comisia metodologic i Comisia de deontologie
i disciplin. Mai legat de activitatea psihodiagnostic este Comisia
metodologic. Ea a elaborat deja Normele de avizare a metodelor i tehnicilor
de evaluare i asisten psihologic. Conform art.3 (1) Comisia Metodologic
a Colegiului Psihologilor din Romnia, prin normele de avizare prezente,
stabilete standardele de calitate i procedurile de avizare pentru metodele i
tehnicile de evaluare i asisten psihologic. Pe de alt parte, conform art. 3(2)
Comisiile aplicative din cadrul Colegiului Psihologilor din Romnia, prin
normele de avizare specifice, atest competenele profesionale ale psihologilor
de a utiliza metode i tehnici de evaluare i asisten psihologic. Toate
comisiile de specialitate vor avea n vedere competenele generale de utilizare a
testelor psihologice precizate n documentul de fa.
De o mare importan sunt precizrile referitoare la dreptul de utilizare
a testelor psihologice. Cei care folosesc testele trebuie s fie n posesia unor
competene bine precizate i acestea se obin prin procesul de formare
profesional, nsemnnd i anii de studiu i de practic din facultate, dar i
procesul de formare postuniversitar. Categoriile majore de competene vizeaz
urmtoarele aspecte etice n aplicarea testelor: a) adoptarea unei conduite
profesioniste, n acord cu normele deontologice ale psihologului i cu
respectarea legilor internaionale i naionale privind copyright-ul (legea
drepturilor de autor i a drepturilor conexe nr. 8/1996); b) utilizarea doar a
acestor teste pentru care au competena necesar; c) asumarea responsabilitii
pentru modul de utilizare a testelor; d) asigurarea securitii pentru testele
utilizate, astfel nct ele s nu-i piard calitile din cauza deconspirrii
publice a coninutului ori a mecanismelor de cotare; e) asigurarea
confidenialitii rezultatelor; f) acordul scris sau n form electronic de
includere a rezultatelor n baza de date a utilizatorului probei psihologice. De
asemenea, aceast comisie a elaborat o serie de norme referitoare i la modul
de comercializare a testelor. Iat, aadar, c sunt create condiii pentru ca, i n
ara noastr, activitatea psihodiagnostic s intre complet n normal.
Tem de reflecie/autoevaluare:
Facei o scurt analiz privind importana elaborrii Legii nr. 213/2004 pentru
psihologia romneasc.
4.3. S privim viitorul cu optimism.

Copyright DEPARTAMENT ID 2008

33

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Chiar dac n perioada postdecembrist au fost numeroase probleme cu


care s-a confruntat psihologia romneasc, n general, i psihodiagnosticienii,
n special, nc de la nceputul ei numeroi psihologi s-au angajat serios pe
direcia recldirii din temelii a acestei profesii. i rezultatele nu au ntrziat s
apar. Vom aminti n continuare cteva dintre cele mai importante realizri n
domeniul psihodiagnosticului:
a) apariia unor lucrri de mari proporii i de mare importan, n cadrul crora
regsim preocupri privind mbuntirea metodologiei utilizate n cercetrile
psihologice(de exemplu, Zlate, M., 2000; Radu, I., 1993; Neculau, A., 1996);
b) publicarea unor lucrri romneti, dup 1990, adresate bazelor teoretice ale
psihometriei (de exemplu: Minulescu, M., 1996 i 2004; Albu, M., Pitariu, H.,
1993; Albu, M., 1998 i 2000; Havrneanu, C., 2000; Stan, A., 2001;
Horghidan, V., 1997; Mitrofan, N., 1997; Mitrofan, N., Mitrofan, L., 2006;
Schiopu, U., 2003; Dumitracu, N., 2005 .a.);
c) stabilirea unor legturi cu specialiti din alte ri, fiind astfel posibil accesul
la lucrri i informaii de mare valoare din psihodiagnosticul mondial;
d) formarea unor specialiti n alte universiti din lume; noi nine am activat
n cadrul a dou universiti americane de prestigiu, cte 6 luni. Este vorba de
University of Southwestern Louisiana, unde am lucrat cu S. Hotard i
University of Texas at El Paso from El Paso, avnd privilegiul de a lucra
mpreun cu R. Whitworth;
e) etalonarea unor teste pe populaie romneasc. Am aminti aici cazul testului
american DENVER , care a fost etalonat n perioada 1993-1994, cu sprijinul
material i mai ales financiar al Societii SORZ din Olanda (director Pieter
G.J.M. Hermsen) i cu entuziasmul unor cadre didactice i studeni din mai
multe centre universitare. Coordonarea general a parinut centrului universitar
Bucureti (N. Mitrofan i G. Drilea), iar pentru celelalte centre universitare
coordonarea a fost asigurat de urmtoarele cadre didactice; A. Munteanu
(Timioara), C. Havrneanu (Iai), . Szamosckosy (Cluj-Napoca);
f) ptrunderea n Romnia a unor teste noi, moderne, care sunt folosite n
cadrul unor universiti n scop de familiarizare i de formare a psihologilor.
Este cazul testelorWAIS-III; WISC-III; WISC-IIIUK; WPPSI-R, MMPI-2;
MMPI-A; Scalele McCarthy pentru copii; Scalele de dezvoltare Bayley etc.;
g) formarea unor specialiti n cadrul programelor de masterat i doctorat.

ntrebri de autoevaluare:
1. De ce credei c psihologia nu era susinut ca tiin de ctre autoriti nainte de 1989 ?
2. Enumerai civa psihologi care s-au ocupat de problemele psihometriei nainte de 1989 ?
3. Cum se prezenta situaia testelor imediat dup 1990 ?
4. Cum se prezint situaia testelor n zilele noastre ?
5. n ce msur Colegiul Psihologilor sprijin dezvoltarea psihodiagnosticului ?
6. Ce atribuii are Comisia metodologic ?
7. Care sunt cele mai importante realizri n domeniul psihodiagnosticului ?
BIBLIOGRAFIE MINIMAL
MITROFAN, N. (2001), Psihometria i direciile ei de dezvoltare la nceput de mileniu. n
ZLATE, M., Psihologia la rspntia mileniilor. Iai: Polirom.
COLEGIUL PSIHOLOGILOR DIN ROMNIA (2005 i 2006), Acte normative.

Copyright DEPARTAMENT ID 2008

34

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Modulul II Testul psihologic ca mijloc de evaluare


Unitatea de nvare 1
Testul psihologic
Cuprins:
2.1. Cum definim testul psihologic ?
2.2. Echipamentul testului psihologic
2.3. Funciile psihodiagnozei
Obiective:
La sfritul acestei uniti de nvare studenii vor fi capabili s:
cunoasc mai multe definiii date testului psihologic
selecteze elementele comune din mai multe definiii
cunoasc ce nseamn echipamentul (Kit-ul) complet al
testului
cunoasc principalele funcii ale psihodiagnozei
2.1. Cum definim testul psihologic ?
Mai nti, facem precizarea c termenul de test este legat de cel de
diagnostic psihic, care, la rndul lui, provine de la cuvntul grecesc
diagnosticos, nsemnnd apt de a recunoate. Pn la un anumit punct,
diagnosticul psihic este similar cu diagnosticul medical, deoarece exist o
multitudine de caracteristici specifice.
Referitor la definiie, vom trece n revist mai multe definiii, oferite de
autori strini (limba englez i francez) i romni:
Cronbach (1966): Testul este o procedur sau o serie de probe,
construite n scopul stabilirii prezenei (sau absenei) unui aspect psihic, a
particularitilor de manifestare comportamental sau a gradului de dezvoltare
psihic .
Pierre Pichot: Testele sunt instrumente de lucru standardizate servind de
stimuli pentru un comportament, care, la rndul lui, poate fi evaluat prin
compararea statistic cu comportamentul altor subieci aflai n aceeai
situaie.
P. Olron: Testul este un instrument fundamental al psihologiei aplicate
ce se caracterizeaz prin posibilitatea de a examina numeroi indivizi n situaii
uniformizate.
A. Rey: Testele psihologice sunt procedee standardizate, construite
astfel nct s provoace la subiecii investigai reacii nregistrabile iar
materialul obinut prin intermediul acestor teste se estimeaz prin referin la
valorile etalon.
M. Roca (1972): Testul este o prob sau o serie de probe, construite n
scopul stabilirii prezenei (sau absenei) unui aspect psihic, a particularitilor
de manifestare comportamental sau a gradului de dezvoltare psihic.

Copyright DEPARTAMENT ID 2008

35

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Grand dictionnaire de la psychologie (1994): Testul este o prob,


utilizat cu precdere n psihologia diferenial, care permite descrierea
comportamentului unui subiect ntr-o situaie definit precis, prin raportare la
comportamentul unui grup precis de subieci, plasai n aceeai situaie
standard. Descrierile se fac de obicei sub form numeric.
A. Anastasi (1992): Testul este o msur obiectiv i standardizat a
unui eantion de comportament.
S analizm mai amnunit ultima definiie, n cadrul creia am
subliniat 3 concepte, considerate a fi concepte-cheie. Msur obiectiv
nseamn, n principal, dou aspecte: a) administrarea, cotarea i interpretarea
scorurilor sunt obiective n msura n care acestea sunt independente n raport
cu judecile subiective ale examinatorului: b) obiectivitatea testului reiese din
faptul c determinarea nivelului de dificultate al unui item ori a ntregului test
se bazeaz pe proceduri empirice, obiective i nu pe nivelul de apreciere (deci,
subiectivitate) a celui ce construiete un test. Al doilea concept, msur
standardizat, nseamn, de asemenea, mai multe aspecte: a) standardizarea
implic uniformitatea procedurii n administrarea, cotarea i evaluarea
rezultatelor. Pentru ca scorurile diferitelor persoane s fie comparabile,
condiiile de testare trebuie, n mod evident, s fie aceleai pentru toi. n
vederea asigurrii acestei uniformiti a condiiilor testrii, constructorul
testului are obligaia s ofere informaii i direcii detaliate pentru administrarea
fiecrui test nou. De altfel, formularea acestor direcii este o parte major a
standardizrii unui test nou, deoarece ele se refer la: - materialele folosite; instruciunile orale (instructajul); - demonstraiile preliminare; - modalitile de
rspuns la ntrebrile i neclaritile ridicate de ctre subieci; - orice alte detalii
privind situaia de testare; b) un alt pas important n standardizare este
stabilirea normelor, a etalonului, la care raportm, dup aplicarea testului,
rezultatele obinute de ctre subiect. Ceea ce obine concret la un test un subiect
constituie scorul brut (raw score) i el poate s exprime numrul corect de
itemi, timpul cerut pentru ndeplinirea unei sarcini, numrul erorilor sau alte
modaliti de msurare potrivite coninutului testului. Acest scor nu spune
nimic pn nu l raportm la norme sau la etalon. (Cuvntul norme este preluat
din limba englez i el este echivalent cuvntului etalon din limba romn). n
sfrit, conceptul eantion de comportament se refer la faptul c, n aciunea
de testare, vizm o anumit secven a comportamentului sau un anumit tip de
comportament, cum ar fi, de exemplu: comportament inteligent, comportament
creativ, comportament motric, comportament verbal etc.
S mai poposim puin i asupra altei definiii dat testului psihologic de
ctre Robert Gregory: Testul psihologic este o procedur standardizat
folosit pentru eantionarea comportamentului i descrierea lui cu ajutorul
categoriilor sau scorurilor. Plecnd de la aceast definiie, putem deduce
faptul c majoritatea testelor prezint urmtoarele caracteristici definitorii: a)
procedura de standardizare; b) eantionul de comportament; c) scoruri sau
categorii; d) norme sau standarde; e) predicia comportamentului netestat.
Procedura de standardizare este trstura esenial a testului psihologic.
Niciun examinator nu are voie s se abat de la setul de instruciuni i de

Copyright DEPARTAMENT ID 2008

36

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

precizrile privind modul de aplicare a testului existente n cadrul manualului.


Acestea reprezint o garanie privind faptul c procedurile de administrare se
aplic identic de ctre toi. Eantionul de comportament este de interes n
msura n care el permite examinatorului s fac inferene asupra domeniului
total al comportamentului. De exemplu, scopul unui test de vocabular, care
cuprinde un numr determinat de cuvinte este, de fapt, de a msura cunoaterea
general a vocabularului de ctre examinat. Pe de alt parte, un bun test trebuie
s aib capacitatea de a-i permite examinatorului s prognozeze alte
comportamente i nu pe cele reflectate de itemi. Dac, de exemplu, rspusnul
Da la ntrebarea Beau foarte mult ap ? se ntmpl s ajute la
prognozarea depresiei, atunci aceast ntrebare care pare a nu avea nicio
legtur devine un index util al depresiei. Aplicarea testelor se finalizeaz cu
derivarea de scoruri sau de categorii. ntru-ct se prezum c toi oamenii
posed trstura sau caracteristica ce urmeaz a fi msurat ntr-o anumit
cantitate, scopul testrii psihologice este de a estima tocmai aceast cantitate,
exprimat numeric. De asemenea, un test psihologic trebuie s posede norme
sau standarde. Rezultatele obinute de grupul de normare sau eantionul de
standardizare sunt grupate pe mai multe clase, stabilindu-se performana medie
i, totodat, ele servesc la indicarea frecvenei cu care diferite scoruri cu
valoare mai mare sau mai mic sunt obinute.
Teme de reflecie-autoevaluare:
1. Care sunt elementele de asemnare i cele de deosebire ce rezult n urma
analizrii multiplelor definiii date testului psihologic ?
2. De fapt, ce este testul psihologic ?

2.2. Echipamentul testului psihologic


Aa dup cum am precizat n Modulul I, din nefericire, mult timp testele
au fost folosite n practic n variante complet necorespunztoare: fie nu se
cunotea autorul testului, fie nu exista manual al testului, fie nu existau foi de
rspuns standard etc. Orice student care i ncepe studiile n domeniul
psihologiei trebuie s tie c fiecare test trebuie s aib un echipament (n
limba englez i se spune kit) complet. Ce nseamn asta? nainte de orice,
testul este oferit, ca orice marf, ntr-un fel de ambalaj (geant, serviet, traist,
cutie de carton etc.) pe care este nscris titlul testului. n interior regsim dou
categorii de componente, respectiv:
a) testul propriu-zis, adic proba sau sarcina pe care o are de rezolvat
subiectul, mpreun cu instructajul i, eventual, cu cteva exemple, pentru ca
subiectul s neleag mai bine ce are de fcut. Sarcinile pot fi foarte diverse, n
funcie de specificul testului: poate rspunde la unele ntrebri, poate efectua
anumite desene, poate opera cu cuvinte sau propoziii, poate construi ceva,
poate opera cu un material figural etc. De cele mai multe ori testul vizeaz
anumite aspecte comportamentale ale subiectului i, n funcie de rezultate,
ofer informaii asupra altor comportamente, considerate a fi comportamente

Copyright DEPARTAMENT ID 2008

37

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

netestate. Testul l poate ntreba pe subiect dac are prieteni sau nu, dac merge
la petreceri sau la ntlniri, dac-i place s stea mai mult singur etc.,
rspunsurile primite msurnd comportamentul introvert sau extrovert;
b) materiale auxiliare:
b1 manual i, eventual manual tehnic, n care se prezint, n mod obligatoriu,
urmtoarele:
- ce urmrete s msoare testul, dei intenia poate s apar din titlu;
- autorul sau autorii, reviziile efectuate, istoricul testului;
- cui se adreseaz (categoria socio-profesional, vrst, sex etc.);
- caracteristicile eantionului pe care a fost etalonat testul;
- valoarea coeficientului de fidelitate (inclusiv procedurile n baza crora s-a
calculat acest coeficient (forma test-retest, forma alternant, forma split-half
etc.);
- valoarea coeficientului de validitate (inclusiv procedurile n baza crora s-a
calculat acest coeficient; tipul de criteriu folosit);
- precizri privind timpul de rezolvare, precauii etc.;
- instruciuni privind cotarea rezultatelor (puncte, bonificri, penalizri etc.);
- norme sau etaloane, la care se raporteaz rspunsurile individuale.
b2 partea material a testului, cum este cazul a testelor-aparte, a testelor de
performan: - asamblri de obiecte; - aranjri de imagini; - construcii; cuburi
etc.;
b3 foi de rspuns, construite special, pentru a fi uor de cotat; ele poart
numele de foi standard;
b4 grila sau grilele de rspuns
Desigur, n cazul n care testul este computerizat el apare pe CD i multe
din componentele auxiliare ale testului sunt adaptate. Important este, ns,
faptul c pentru multe teste exist ambele forme i forma fizic, s-i spunem, i
forma electronic. Exist ns i teste care n-au cum s fie computerizate, cum
este cazul marilor baterii de inteligen (Bateria Stanford-Binet, Bateriile
Wechsler etc.), mai ales datorit subtestelor de performan ce presupun ca
subiectul s fac ceva (s construiasc, s identifice n imagini, s completeze
anumite lipsuri etc.).
Tem de reflecie/autoevaluare:
Dac dorim s cumprm un test ce msoar inteligena i constatm c vnztorul
(firma ce vinde teste) are 2 asemenea teste, pe care l preferm ? Deci, n baza a cror
criterii ?
2.3. Funciile psihodiagnozei
A aplica teste pe un subiect nu poate fi un simplu scop n sine. Chiar dac
o facem din curiozitate tot aflm ceva, deci tot ajungem la un rezultat, ceea
ce nseamn, de cele mai multe ori, un diagnostic. n practica
psihodiagnostic, ns, testele sunt folosite de ctre specialiti urmrindu-se
scopuri foarte precise. De aceea, autorii (U.Schiopu, 2003) vorbete de
existena mai multor funcii ale psihodiagnozei i anume:

Copyright DEPARTAMENT ID 2008

38

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

a) surprinderea ct mai corect i ct mai exact posibil a trsturilor i


caracteristicilor psihice individuale sau, dac avem n vedere un grup de
subieci, evidenierea variabilitii psihocomportamentale. Aplicnd un test de
inteligen pe un grup de elevi (de exemplu, o clas) putem s scoatem n
eviden diferenele dintre ei n ceea ce privete aceast aptitudine. Unii vor
rezulta a fi foarte inteligeni, alii, cu o inteligen de nivel mediu i alii, cu un
nivel de inteligen mai redus. i, tii care-i culmea ? Nu este obligatoriu ca
cei cu un nivel de inteligen ridicat s aib i cele mai bune rezultate colare
iar cei cu un nivel de inteligen sub medie s aib cele mai slabe performane
colare. Revenind la funcia de care ne ocupm, putem spune c acest tip de
psihodiagnostic este psihodiagnosticul diferenial;
b) evidenierea cauzei sau cauzelor care au condus la conturarea unei
realiti psihocomportamentale, mai ales n cazul unor destructurri,
dezorganizri ale sistemului psihic, luat n ansamblul su sau ale unor
subcomponente ale acestuia ( psihodiagnoz etiologic); un rol foarte important
l au, n aceast direcie, testele proiective, mai ales testele de desen, cele care
obin informaii despre subiect nu n manier direct, ci n una indirect, prin
ceea ce deseneaz sau prin ceea ce vede n anumite desene, poze, plane etc.
Dac un copil i deseneaz familia, punnd n centru pe tata, care apare
supradimensionat, el ne spune indirect despre faptul c tatl su este
hiperautoritar;
c) formularea unui prognostic, anticiparea evoluiei psihocomportamentale
n anumite situaii i contexte acionale i interacionale; de exemplu, se fac
testri pentru admiterea n diferite forme i nivele de nvmnt, se angajeaz
personal pentru diferite posturi de munc sau posturi de conducere etc. n baza
rezultatelor la teste, desigur dac acestea sunt bune, se ofer anumite garanii n
legtur cu integrarea optim ntr-o activitate viitoare. Dac admiterea la
facultate s-ar face pe baz de teste (de exemplu, teste de aptitudini), n baza
rezultatelor obinute, am putea anticipa c cei care au obinut scorurile cele mai
mari, vor obine i performanele colare cele mai mari;
d) sprijinirea sarcinilor pe linia consilierii colare i vocaionale; este
vorba despre aciunile iniiate n rndul tinerilor n vederea orientrii lor ctre
formele de colarizare i de pregtire profesional. Testele psihologice ajut la
depistarea capacitilor, aptitudinilor, trsturilor de personalitate ale tinerilor.
Toate la un loc constituie echipamentul psihologic individual i, n funcie de
acesta, tnrul este orientat ctre aceste profesii i, mai nti, ctre acele forme
de pregtire, n raport cu care tnrul posed capacitile sau nsuirile psihice
solicitate. Ca s dm un exemplu simplu, dac la un tnr constatm c sunt
bine dezvoltate aptitudinile de calcul matematic, l vom orienta ctre profesiile
ce solicit asemnea nsuiri psihice;
e) conturarea necesitilor privind acordarea asistenei psihologice n
forma consilierii psihologice i psihoterapiei. De multe ori, specialitii apeleaz
la diferite teste psihologice (forme obiective de msurare) pentru a preciza mai
bine condiia psihic a subiectului (poate fi vorba de anumite stri accentuate
de tensiune psihic, poate fi vorba de anumite tendine psihopatologice etc.).
Apoi, se precizeaz tipul de intervenie, cum ar fi tratamentul psihoterapeutic i

Copyright DEPARTAMENT ID 2008

39

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

chiar psihofarmacologic. La sfritul programului de terapie i asisten se pot


iari aplica teste psihologice pentru a se vedea dac s-au produs sau nu
modificri, evident, n sens pozitiv. De exemplu, se poate constata c subiectul
nu mai este la fel de depresiv sau la fel de anxios aa cum era la nceput;
f) evidenierea cazurilor de abatere de la etalonul privind dezvoltarea
normal psihointelectual i psihocomportamental. Specialitii n domeniul
psihologiei dezvoltrii au elaborat anumite etaloane privind dezvoltarea
psihic. De exemplu, pentru copiii mici, de o anumit vrst se tie cum trebuie
s se prezinte ei din punct de vedere psihologic: cte cuvinte pot s foloseasc,
ce tipuri de aciuni pot s fac, cum trebuie s se raporteze la cei din jur, cum
trebuie s rspund la anumii stimuli afectogeni etc. Unii copii pot s in
pasul cu cerinele etalonului, alii, ns, nu i aceasta din multiple motive: n-are
cine s se ocupe de ei, nu frecventeaz instituiile precolare, stare de sntate
precar, lipsuri materiale etc. Cu ajutorul testelor psihologice se poate stabili
dac copilul prezint anumite rmneri n urm pe linia dezvoltrii i ct de
grave sunt acestea. n funcie de rezultate se trece apoi la fundamentarea
tiinific a unor programe corectiv-recuperative.
g) evaluarea i validarea unor programe de nvare i formare
profesional i, pe de alt parte, n baza rezultatelor, fundamentarea unor noi
programe, realizarea unor corecii sau, dac este cazul, nlocuirea total a unor
programe;
h) formarea capacitilor de cunoatere i autocunoatere. Este
cunoscut faptul c atunci cnd se pune problema s facem evaluri referitoare
la propria noastr persoan sau n raport cu alte persoane, putem s greim din
cauza subiectivismului. Astfel, putem s ne supraapreciem sau s ne
subapreciem iar atunci cnd ne raportm la alt persoan, de asemenea, putem
s o supraapreciem sau s o subapreciem. Or, testele psihologice, n calitatea
lor de mijloace obiective de evaluare, ne ajut s surprindem realitatea aa cum
este ea. Folosind mai des testarea psihologic, ne putem atepta i la realizarea
unor corecii privind grilele de evaluare pe care le folosim n evaluarea altor
persoane sau pentru autoevaluare.
Tem de reflecie/autoevaluare:
Ce credei c trebuie fcut dac, n urma testrii psihologice, constatm c un copil
depete cu mult nivelul de dezvoltare psihic valabil pentru nivelul lui de vrst ?

ntrebri de autoevaluare:
1. De ce credei c exist mai multe definiii date testelor psihologice ?
2. Care sunt cele mai importante elemente de asemnare a multiplelor definiii
formulate ?
3. Ce nseamn msur obiectiv a unui eantion de comportament ?
4. Ce nseamn msur standardizat a unui eantion de comportament ?
5. n ce const echipamentul complet al unui test psihologic ?
6. La ce ne folosete manualul testului ?
7. n raport cu ce elemnte putem stabili valoarea testului psihologic ?
8. Care sunt principalele funcii ale psihodiagnozei ?
BIBLIOGRAFIE MINIMAL

Copyright DEPARTAMENT ID 2008

40

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

1. CLINCIU, AUREL, ION. 2005) Psihodiagnostic. Braov: Edit. Universitii din Braov.
2. ALBU, M (1998). Construirea i utilizarea testelor psihologice. Cluj-Napoca: Clusium.
3. SCHIOPU, U. (2003). Introducere n psihodiagnostic. Bucureti: Ed. Pro-Humanitas.
Unitatea de nvare 2
Clasificarea testelor psihologice
Cuprins:
2.1. Clasificarea realizat de U. Schiopu
2.2. Clasificarea realizat de H. Pitariu
2.3. Cum depim multiplele clasificri ?
Obiective:
La sfritul acestei uniti de nvare, studenii vor fi capabili s:
cunoasc criteriile de clasificare a testelor propuse de U. Schiopu;
cunoasc criteriile de clasificare a testelor propuse de H. Pitariu;
stabileasc n ce msur unele criterii de clasificare sunt exclusive
sau nu
diferenieze i alte criterii de clasificare a testelor psihologice
Clasificarea testelor realizat de U. Schiopu
Mai nti, trebuie s precizm faptul c exist un numr impresionant de
teste psihologice. Nimeni nu tie numrul lor exact, dar se vorbete de existena a
mii de teste. n unele ri, cum este cazul, mai ales, a SUA, psihodiagnosticul este
foarte bine dezvoltat i foarte bine reglementat. Sunt foarte multe studii efectuate
pentru a se urmri calitile psihometrice i n ce msur ele sunt utile n practic.
Avnd n vedere c exist extrem de multe teste, se ridic problema clasificrii
lor i, legat de aceasta, a criteriilor de clasificare. Desigur, mai muli autori au
ncercat s realizeze clasificri, ns noi ne vom referi la doi autori romni.
U. Schiopu (2003) reuete s diferenieze urmtoarele tipuri de clasificri:
a) clasificri ce se bazeaz pe sarcinile psihodiagnozei, adic pe structura
obiectivelor ce caracterizeaz testele unui sistem de diagnoz;
b) clasificri ce se bazeaz pe diferenele semnificative de strategie inclus n
structura de ansamblu a bateriei;
c) clasificri ce se bazeaz pe tipul de material administrat n teste i pe
caracteristicile acestuia;
d) clasificri ce se bazeaz pe diferene n ceea ce privete forma de administrare
a testelor;
e) clasificri ce se bazeaz pe caracteristicile tipurilor de rspunsuri solicitate;
f) clasificri ce se bazeaz pe tipurile de rspunsuri primite.
Clasificri n funcie de scopul urmrit. Putem diferenia:
- teste de cunotine sau teste pedagogice;
- teste de inteligen;
- teste de aptitudini;
- teste pentru msurarea unor abiliti senzorio-motorii;

Copyright DEPARTAMENT ID 2008

41

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

- teste de atenie;
- teste de memorie;
- teste de personalitate;
- teste de sociabilitate;
- teste de creativitate;
- teste pentru msurarea temperamentului;
- teste de interese;
Unele dintre aceste categorii de teste, la rndul lor, sunt profilate mai
precis, n funcie de obiectivul urmrit.
Ex. 1 - testele de inteligen pot fi:
- teste de inteligen general;
- teste de inteligen tehnic;
- teste de inteligen abstract;
- teste de inteligen social;
- teste de inteligen emoional;
- teste de inteligen kinestezic.
Ex. 2 testele de atenie pot fi teste care urmresc ca obiective:
- concentrarea ateniei;
- stabilitatea ateniei;
- mobilitatea ateniei;
- distributivitatea ateniei.
Ex. 3 testele de memorie pot fi:
- pentru memoria cifrelor, a figurilor;
- pentru memoria topografic
Ex. 4 testele de aptitudini pot fi:
- pentru aptitudini tehnice;
- pentru aptitudini numerice, matematice;
- pentru aptitudini artistice;
- pentru aptitudini verbale;
- pentru aptitudini pedagogice;
- pentru aptitudini organizatorice
Clasificri ce se bazeaz pe diferenele semnificative de strategie inclus
n structura de ansamblu a bateriei. Acest criteriu vizeaz, practic, nivelul de
corelaie dintre diferite teste. n aceast privin pot s existe urmtoarele
situaii:
a) ntre dou teste poate s nu existe niciun fel de legtur (deci, nivel de
corelaie = 0), ele urmrind s msoare n mod independent caracteristici
psihice total diferite;
b) ntre teste poate s existe o corelaie pozitiv, cu valoarea
coeficientului de corelaie ce tinde ctre valoarea + 1, atunci, mai ales, cnd
msoar aceeai nsuire psihic. Se poate da, ca exemplu, nivelul nalt de
corelaie dintre dou baterii de inteligen, cum ar fi cazul Bateriilor StanfordBinet i Wechsler;
c) ntre mai multe teste poate apare situaia intercorelrii unor factori,
cum ar fi cazul factorilor de grup; de exemplu: factorul verbal, factorul

Copyright DEPARTAMENT ID 2008

42

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

numeric, factorul spaial. Mai multe teste pot fi saturate diferit n ceea ce
privete fiecare dintre aceti factori.
Clasificri n funcie de materialele i caracteristicile materialelor
utilizate:
a) trebuie difereniate, mai nti, testele creion-hrtie, denumire
generic ce presupune rspunsul scris pe foi de rspuns, de testele- aparate, pe
de o parte (de exemplu, pompa Schultz, strungul Lahy etc.) i testele ce
folosesc diferite materiale, pe de alt parte (de exemplu, cuburile Kohs,
asamblarea de imagini etc.);
b) tot din perspectiva acestui criteriu, pot fi difereniate testele verbale i
testele nonverbale, prima categorie bazndu-se pe utilizarea limbajului i pe
comprehensiunea verbal. A doua categorie msoar o serie de capaciti
psihice care nu sunt condiionate de limbaj i ele pot fi aplicate celor ce
prezint unele handicapuri i celor care provin dintr-un mediu cultural modest
sau dintr-un mediu cultural strin;
Clasificri privind forma de administrare. n funcie de acest criteriu,
testele pot fi: individuale sau colective. Chiar dup denumire, cele individuale
se aplic exclusiv unui singur subiect; de exemplu, bateria de inteligen
Stanford-Binet, testul Bayley pentru copiii mici, testele proiective etc.). Ele
prezint marele avantaj c subiectul poate fi observat tot timpul ct i se aplic
testul. Testele colective se aplic pe grupuri mai mari sau mai mici de subieci.
Desigur ele se aplic i individual. Prezint avantajul c n timp scurt pot fi
testai muli subieci;
Clasificri n funcie de tipul de rspuns solicitat. n raport cu acest
criteriu testele pot fi grupate astfel:
a) teste cu rspuns la alegere; este cazul unor teste de personalitate, la care se
alege un rspuns din dou posibiliti, de tipul Da, Nu sau se folosesc scale
de rspuns, de tipul n foarte mare msur, n mare msur, n oarecare
msur, n mic msur, n foarte mic msur; de asemenea, este cazul
testelor de cunotine, la ai cror itemi exist mai multe rspunsuri la alegere,
printre care exist i rspunsul corect;
b) teste cu un singur rspuns bun, cum este cazul, mai ales, a testelor de
inteligen i a testelor de aptitudini. Subiectul ofer ca rspuns fie un numr,
fie un cuvnt, fie o figur sau o imagine etc. Rspunsul dat este corect sau nu;
c) teste cu rspuns liber, cum este cazul, mai ales, a testelor proiective, i mai
ales a celor pe baz de plane (de exemplu, testul Rorschach, Testul T.A.T), n
cadrul crora subiectul este lsat liber s ofere rspunsul. n cazul acestor teste,
ns, dificultile de cotare i de interpretare a rspunsurilor sunt mult mai mari,
necesitnd o mare specializare din partea practicienilor;
Clasificri n funcie de formele i tipurile de rezultate obinute. Plecnd
de la acest criteriu, putem diferenia dou categorii de teste: a) teste sintetice,
care, n urma aplicrii lor, ofer un rezultat global, de genul: QI coeficient de
inteligen; QD coeficient de dezvoltare; Q.Kre coeficient de creativitate;
Q.E. coeficient emoional; b) teste analitice, care, n urma aplicrii lor, permit
conturarea profilului psihologic. Este cazul, mai ales, a testelor de

Copyright DEPARTAMENT ID 2008

43

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

personalitate, chestionare sau inventare de personalitate, care conin mai multe


scale.

Teme de reflecie/autoevaluare:
1. Care sunt criteriile folosite de U. Schipou pentru clasificarea testelor ?
n ce msur putem considera c aceste criterii sunt suficiente ?
2.2. Clasificarea realizat de H. Pitariu (1993)
Aceast clasificare este fcut n funcie de elementele care dau testului
calitatea de prob standardizat: coninutul, administrarea i cotarea.
n funcie de coninut testele pot fi mprite n dou categorii:
1. dup sarcina i 2. dup modul de procesare
Dup sarcina cu care trebuie s se confrunte persoana examinat, testele
se pot mpri astfel:
a) teste verbale, care, la rndul lor, pot fi orale sau scrise (cele de tip creionhrtie);
b) teste nonverbale, care pot fi mprite n dou subcategorii: b1 cu
manipulare de aparate i piese; b2 administrate cu ajutorul calculatorului;
c) teste de performan (subiectului i se solicit s opereze la un aparat, s
completeze unele figuri lacunare sau s reproduc diferite imagini cu ajutorul
unor cuburi etc.).
Dup modul de procesare implicat (adic la ce i se cere persoanei s fac
pentru a da un rspuns), testele pot fi mprite n dou categorii:
a) teste intelective, care, la rndul lor, pot fi mprite n urmtoarele
subcategorii: a1 teste de performan; a2 teste de aptitudini; a3 teste de
cunotine; a4 teste situaionale;
b) teste nonintelective (chestionare/inventare de personalitate)
Criteriul administrarea testelor. Dup modul n care sunt administrate, ele
pot fi clasificate n termeni de eficacitate a examenului psihologic i n funcie
de unele exigene legate de timpul de examinare.
n funcie de eficacitate, testele pot fi mprite n dou grupe: a) teste
individuale; b) teste de grup sau colective;
n funcie de timp, testele pot fi grupate, de asemenea, n dou grupe,
respectiv: a) teste de vitez- cu limit de timp; b) teste de randament, care pot
fi: b1- cu limit de timp; b2 cu timp nelimitat.
Tot n raport cu criteriul administrare, putem mpri testele n dou grupe:
1. teste standardizate; 2. teste nestandardizate.
Criteriul cotarea testelor. Tehnica de cotare a unui test poate fi obiectiv
sau subiectiv. De aceea, testele pot fi clasificate n dou categorii: a) teste
obiective performana se apreciaz dup o procedur fix, impersonal, de
ctre un simplu operator sau cu ajutorul unei maini de cotare; b) teste
proiective (completare de fraze, pete de cerneal), cele care prezint n cotare o
doz mare de subiectivism.

Copyright DEPARTAMENT ID 2008

44

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Teme de reflecie/autoevaluare
1. Care sunt criteriile folosite de H. Pitariu pentru clasificarea testelor ?
2. n ce msur aceste criterii sunt suficiente pentru clasificarea testelor ?
Care sunt elementele de asemnare i de diferen dintre clasificarea realizat de U.
chiopu i cea realizat de H. Pitariu ?

Cum putem depi inconvenientul multiplelor clasificri ?


Clasificrile realizate nu trebuie s fie privite n mod exclusivist.
Interferenele pot fi considerate i n sens vertical. De exemplu, dac lum n
analiz un anumit test de inteligen i urmrim clasificarea fcut de U.
chiopu vom constata c l putem regsi n una din categoriile de la fiecare
criteriu. Astfel, n funcie de:
a) criteriul obiective el msoar inteligena general;
b) criteriul strategie testul are un caracter eterogen;
c) criteriul material administrat test verbal, de tip creion-hrtie;
d) forma de administrare se aplic individual;
e) rspunsuri solicitate un singur rspuns la fiecare item;
f) tipul de rezultate valoarea Q.I., care este un rezultat sintetic.
Mai trebuie s facem o precizare. n niciuna din clasificrile fcute nu
sunt luate n atenie testele care sunt oferite nu neaprat psihologilor specialiti,
ci nespecialitilor. De aceea, n funcie de gradul de standardizare, credem c
putem diferenia 3 categorii de teste:
a) teste standardizate, cele care pot fi aplicate numai de ctre psihologi;
b) teste semistandardizate, cele care sunt destinate altor categorii de beneficiari,
cum ar fi: cadrele didactice, prinii, personal medical, asisteni sociali etc.
c) teste nestandardizate, cele care se folosesc mai mult pentru ocuparea
timpului liber .
n finalul acestei discuii privind clasificarea testelor subliniem faptul c
activitatea de psihodiagnoz nu se reduce i nu trebuie s se reduc numai la
aplicarea unui test sau a unui grup de teste. Aplicarea efectiv a unor
instrumente psihodiagnostice este doar o etap n succesiunea de etape ale
activitii de psihodiagnoz care ncepe cu cunoaterea subiectului prin
intermediul observaiei conduitei, a anamnezei, a unei microanchete etc.

ntrebri de autoevaluare:
1. Ce criterii folosete U. Schiopu n clasificarea testelor psihologice ?
2. Cum sunt mprite testele n funcie de criteriul obiective urmrite ?
3. Ce criterii folosete H. Pitariu n clasificarea testelor psihologice ?
4. Dai un exemplu de test i ncercai s-l plasai n funcie de cerinele clasificrii
realizate de U. chiopu.
5. Dai un exemplu de test i ncercai s-l plasai n funcie de cerinele clasificrii
realizate de H. Pitariu.

Copyright DEPARTAMENT ID 2008

45

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

4. n ce msur utilizarea calculatorului n testarea psihologic afecteaz clasificarea


fcut de U. Schiopu ?
4. Care sunt elementele de asemnare i de diferen dintre cele dou clasificri ?
5. Cum pot fi depite limitele impuse de multiplele clasificri ?
6. Ce sunt i ce rol joac testele semistandardizate ?
7. Ce sunt i ce rol joac testele nestandardizate ?
BIBLIOGRAFIE MINIMAL
ALBU, M., PITARIU, H. (1993), Proiectarea testelor de cunotine i examenul asistat de calCulator. Cluj-Napoca: Casa crii de tiin.
CLINCIU, ION, AUREL (2005), Psihodiagnostic. Braov: Editura Universitii.
SCHIOPU, URSULA (2003), Introducere n psihodiagnostic. Editura Pro-Humanitas.
Unitatea de nvare 3
Testele psihologice i Codul deontologic
Cuprins:
3.1. Standarde pentru testarea psihologic
3.2. Psihologia ca profesie i Codul deontologic
Obiective:
La sfritul acestei uniti de nvare, studenii vor fi capabili s:
cunoasc preocuprile la nivel internaional privind crearea
standardelor pentru activitatea psihodiagnostic;
cunoasc cerinele privind calificrile psihologului care
aplic anumite categorii de teste;
interpreteze corect prevederile existente n cadrul Codului
deontologic;
cunoasc atribuiile Comisiei de deontologie din cadrul
Colegiului Psihologilor din Romnia.
3.1. Standarde pentru testarea psihologic
La nivel internaional au existat i exist n continuare preocupri privind
elaborarea unor standarde ct mai nalte pentru testarea psihologic. Asemenea
preocupri pot fi grupate n urmtoarele categorii:
1. Standarde nalte pentru constructorii i utilizatorii de teste. Trebuie, mai
nti, subliniat faptul c, aproape paralel cu publicarea primelor teste i, prin
urmare, cu naterea psihometriei, au aprut i primele preocupri privind protejarea
activitii psihodiagnostice. nc din 1895 American Psychological Association
(APA) a format primul su comitet ce urma s se ocupe de msurarea mintal i de
modul n care se aplic testele noi. Un alt comitet APA a fost nfiinat n 1906, cu
misiunea de a se ocupa de problemele de standardizare. n 1923 membrii APA
resping recomandrile fcute de un comitet privind monitorizarea modului de
utilizare a testelor de ctre nepsihologi. n 1954 APA public Technical
Recommendations for Psychological Tests and Diagnostic Tests, document care
stabilea standardele pentru testarea psihologic, precum i recomandrile tehnice.
n anul imediat urmtor, o alt organizaie profesional The National Educational

Copyright DEPARTAMENT ID 2008

46

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Association-, lucrnd n colaborare cu National Council on Measurement Used in


Education (cunoscut n prezent sub numele The National Council on
Measurement), a elaborat i publicat Technical Recommendations for Achievement
Tests.
De-a lungul anilor au aprut din ce n ce mai multe publicaii ale APA n
care regsim serioase preocupri privind asigurarea unui nalt nivel de
profesionalism n utilizarea testelor psihologice (Gregory, R.J., 1996). Iat unele
dintre cele mai importante:
- Standards for Educational and Psychological Tests and Manuals (1966);
- Automated Test Scoring and Interpretation Practices (1966);
- Standards for Educational and Psychological Tests (1974);
- Principles for the Validation and Use of Personnel Selection Procedures (1980);
- Speciality Guidelines for the Delivery of Services by Clinical Psychologists
(1981);
- Speciality Guidelines for the Delivery of Services by Industrial/Organizational
Psychologists (1981);
- Speciality Guidelines for the Delivery of Services by School Psychologists
(1981);
- Ethical Principles of Psychologists (1981, 1992);
- Standards for Educational and Psychological Testing (1985);
- Guidelines for Computers-Based Tests and Interpretations (1986);
- Standards for Educational and Psychological Testing (1993).
The National Association of School Psychologists (NASP) a adoptat, n
1984, Principles for Professsional Ethics, un ghid extrem de util pentru selecia,
utilizarea i interpretarea testelor psihologice. Acesta a fost revizuit i adoptat n
1992.
Asociaia Psihologilor Americani a manifestat ntotdeauna grij pentru ca
testele s fie aplicate la un nivel nalt tiinific, dar numai de ctre cei calificai
pentru aceasta. nc din 1950, un comitet al su pentru Ethical Standards for
Psychology a publicat un raport, intitulat Ethical Standards for the Distribution of
Psychological Tests and Diagnostic Aids. Printre altele, acest raport diferenia trei
niveluri de calificare pentru utilizarea testelor i anume:
- Nivelul A: teste care pot fi administrate, scorate i interpretate adecvat cu ajutorul
manualului i al unei orientri generale (de exemplu, teste de achiziie);
- Nivelul B: teste care reclam anumite cunotine tehnice privind construirea i
utilizarea testelor, precum i cunotine din alte domenii ale psihologiei, precum:
psihologia diferenial, statistica psihologic, psihologia personalului, psihologia
adaptrii, orientarea vocaional (de exemplu, teste de aptitudini, inventare de
adaptare aplicabile populaiei normale).
- Nivelul C: teste care solicit cunotine de nalt nivel privind testarea i din alte
domenii de suport, la care trebuie s se adauge supervizarea din partea unor
specialiti n aceste domenii (de exemplu, teste proiective, teste de inteligen
individuale).
Acest raport a fost integrat apoi n publicaia APAs Ethical Standards of
Psychologists (1953) i citat n Standards for Educational and Psychological Tests
and Manuals (1966).

Copyright DEPARTAMENT ID 2008

47

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

n Ethical Principles of Psychologists (1992) sunt fcute precizri i mai


clare privind calificrile utilizatorilor de teste. Astfel, Principiul A afirm c
psihologii ofer numai acele servicii i utilizeaz numai acele tehnici pentru care
sunt calificai prin educaie, formare sau experien. Standardul etic 2.02 adaug:
psihologii se abin de la utilizarea necorespunztoare a tehnicilor de msurare i,
totodat, iau msuri pentru a preveni ca alii s utilizeze defectuos informaia pe
care o ofer aceste tehnici.
Cu toate msurile luate s-a constatat c, n practic, se ntlnesc frecvente
abateri. De aceea, APA, mpreun cu The American Research Association, The
National Council on Measurement in Education i cu foarte multe edituri ce
publicau teste, a nfiinat The Joint Committee on Testing Practice (JCTP). Acesta
a adoptat, n 1988, The Code of Fair Testing Practices in Education, care descrie
obligaiile celor care construiesc teste, precum i ale celor ce le aplic, n patru arii:
a) dezvoltarea/selectarea testelor; b) interpretarea scorurilor; c) strdania pentru
corectitudine; d) informarea subiecilor.
2. Creterea obiectivitii n aplicarea i interpretarea testelor. Dei n
literatura psihodiagnostic apar lucrri favorabile testelor proiective, practicienii
tind tot mai mult s se orienteze ctre testele obiective i, n special ctre
chestionare i inventare de personalitate, avnd n frunte testul Minnesota
Multiphasic Personality Inventory, varianta revizuit MMPI-2. Un indicator al
acestei tendine l reprezint creterea numrului de referine favorabile acestui test
fa de alte teste proiective i , mai ales, fa de testul Rorschach, aa cum apare n
The Mental Measurement Yearbook i n alte surse (de exemplu, la Polyson,
Peterson i Marshall, 1986).
O alt tendin ctre creterea obiectivitii se manifest n continuarea
cercetrilor privind testarea psihologic. Dei exist mii de studii publicate n
legtur cu testul MMPI, respectiv, MMPI-2, interesul pentru investigare i
cercetare nu numai c nu nceteaz, ci, dimpotriv, se accentueaz de la un an la
altul i va crete cu siguran n viitor. n acest fel se prefigureaz o cretere
substanial a orientrii practicienilor ctre testele de personalitate, n detrimentul
unor teste proiective.
Tem de reflecie/autoevaluare:
Care ar fi consecinele absenei preocuprilor privind elaborarea unor standarde pentru
activitatea psihodiagnostic ?
3.2. Psihologia ca profesie i Codul deontologic.
Psihologia este o profesie foarte cutat, dovad fiind, nainte de orice,
numrul mare de candidai ce se prezint la examenul de admitere la facultile de
profil. Dup absolvire, psihologul poate lucra n diverse domenii, cum ar fi,
instituii colare, firme, instituii militare, organizaii guvernamentale sau
neguvernamentale, instituii medicale, n cadrul unor cabinete particulare etc. Mai
peste tot el apeleaz la testul psihologic pentru a evalua subiectul. Aceast aciune
de evaluare este de mare importan i ea ridic serioase probleme privind
responsabilitatea specialistului. n baza rezultatelor la teste se stabilesc diagnostice
i se iau decizii privind persoana subiectului. Dac acestea nu sunt corecte i

Copyright DEPARTAMENT ID 2008

48

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

concordante cu realitatea, cel care sufer este subiectul i nimeni nu are voie s se
joace cu soarta acestuia. n urma evalurii psihologice se poate determina dac
subiectul este apt sau nu pentru o anumit slujb, dac prezint un anumit nivel de
anormalitate psihic, dac este sau nu n posesia unor capaciti i aptitudini etc.
Dar n cazul n care diagnosticul este greit ce se ntmpl cu subiectul ? Haidei s
ne gndim ce se ntmpl cu un copil precolar care, n urma testrii psihologice,
este orientat ctre formele nvmntului special, dei, ulterior se poate constata c
acest copil prezint numai nite rmneri n urm pe linia dezvoltrii psihice, uor
recuperabile. Deci utilizarea testelor psihologice presupune mari rspunderi, de
ordin profesional, de ordin moral i chiar de ordin juridic.Aa se explic de ce au
existat i exist n continuare preocupri pentru elaborarea unor standarde i,
respectiv, a unor coduri deontologice.
n continuare noi vom face precizri mai ales n baza Codului deontologic
al Asociaiei Psihologilor Americani (APA), intitulat Ethical Principles of
Psychologists. (v. i Anastasi, A., 1996). i din acesta vom meniona n special
ceea ce ine de Tehnicile de msurare (Assessment Techiques). Vom lua n atenie
3 categorii de probleme:
a) legate de construcia i dezvoltarea testelor:
- cei care construiesc teste i le pun n circuit au obligaia de a evita graba i
superficialitatea lansndu-le n mod prematur pentru uzul general. Iar atunci cnd
un test este distribuit numai n scopuri de cercetare, aceast condiie trebuie
specificat foarte clar;
- manualul trebuie s ofere informaii ct mai complete i mai corecte asupra
testului, evitndu-se tendinele publicitare care s pun testul ntr-o lumin
favorabil;
- testele nu trebuie s fie publicate n ziare, magazine, cri populare, fie n scopuri
descriptive, fie n scop de autoevaluare;
- testarea prin pot sau telefonic este o practic contraindicat, deoarece, pe lng
alte riscuri, este contraindicat a se interpreta rezultatele la test n absena altor
informaii referitoare la subiectul examinat;
- cumprarea, procurarea testelor este accesibil n mod strict numai psihologilor
calificai. Fiecare catalog trebuie s cuprind, n mod obligatoriu, cerinele ce
trebuie ndeplinite de ctre solicitant sau cumprtor. De exemplu, un student care
are nevoie de un test particular pentru sarcini de nvare sau pentru cercetare
trebuie s prezinte o comand de cumprare contrasemnat de ctre profesorul lor,
care i asum responsabilitatea pentru corecta utilizare a testului.
b) legate de protecia subiectului; un factor deosebit de relevant l constituie
scopul urmrit de testarea psihologic, care poate fi: a) consilierea indivdual,
cunoaterea i autocunoaterea unor probleme i aspecte psihice individuale; b)
deciziile instituionale privind selecia i clasificarea subiecilor; c) cercetarea
psihologic. Este evident faptul c, n raport cu scopul urmrit, subiectul se
raporteaz diferit la testare i la examinator. Dac un subiect se prezint din proprie
iniiativ la un cabinet particular, solicitnd ajutor pentru anumite probleme psihice
cu care se confrunt, ei vor fi mult mai cooperani dect subiecii ce sunt solicitai
instituional s accepte aciunea de testare. Indiferent ns de scopul urmrit de
aciunea de testare, apare obligaia ca subiectul s fie informat (consimmntul

Copyright DEPARTAMENT ID 2008

49

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

informat) asupra: ce se urmrete prin aciunea de testare, tipul de informaii


solicitate, modul de utilizare a rezultatelor.
Consimmntul informat trebuie s fie obinut de la subiect personal sau
de la reprezentantul su legal, existnd i unele excepii i anume: - cnd testarea
fr consimmnt este reglementat de lege sau de unele dispoziii
guvernamentale (de exemplu, programe de testare la nivel naional); - cnd testarea
apare ca o component a activitii colare (de exemplu, testri n scop de evaluare
sau de validare a unor programe educaionale la nivel instituional colar; - cnd
consimmntul apare n mod implicit (de exemplu, testrile n vederea admiterii n
unele instituii educaionale sau angajrii de personal.
c) legate de confidenialitate; aici se pune ntrebarea cine are acces la
rezultatele obinute n urma aplicrii testelor. Evident, n primul rnd,
examinatorul, cel care a aplicat testul. Apoi subiectul are dreptul de a avea acces la
rapoartele testrii, dei, n cazul minorilor, i prinii au dreptul la asemenea
informaii. n cazul n care apar anumite conflicte ntre dreptul copilului de a fi
protejat i dreptul printelui de a avea acces la rezultatele testrii, mai ales n cazul
n care relaiile prini-copii pot fi principala cauz a unor probleme psihice cu care
se confrunt copilul. Desigur, dac este vorba despre un drept el trebuie respectat,
dar, n cazurile conflictuale foarte important este modul n care se face
comunicarea unor informaii n aa fel nct aceasta s nu se soldeze cu efecte
negative asupra copilului.
O alt problem legat de pstrarea confidenialitii este cea privind accesul
la rezultatele testrii psihologice a celei de-a treia persoan, alta dect examinatul
(sau printele minorului) i examinatorul. n acest caz se aplic principiul general,
conform cruia informaiile nu pot fi oferite celei de-a treia persoan fr
consimmntul informat al subiectului.
Aa dup cum am mai menionat, n cadrul Consiliului Psihologilor din
Romnia activeaz, pe lng Comisia metodologic i comisiile aplicative,
Comisia de deontologie. Aceasta a elaborat Codul deontologic al profesiei de
psiholog cu drept de liber practic i Codul de procedur disciplinar. Codul
deontologic cuprinde un set de principii, standarde etice generale, standarde
specifice i dispoziii finale. Legat de problematica testrii psihologice, ne
intereseaz, mai ales, standardele de competen, standardele cu privire la relaiile
umane, standardele de confidenialitate, standardele de nregistrare, prelucrare i
pstrare a datelor (din cadrul standardelor generale) i capitolul Evaluare i
diagnoz (din cadrul standardelor specifice). Ceea ce este foarte important legat
de coninutul acestui cod este precizarea i clarificarea unor noiuni i a unor
sintagme. Astfel, ca s dm cteva exemple: 1. datele de evaluare/diagnoz pot fi
scoruri brute i standardizate, rspunsurile subiectului la stimuli sau la ntrebrile la
test, notele, nregistrrile i consemnrile psihologului, declaraiile i
comportamentul clientului n timpul examinrii. Psihologii vor oferi datele
obinute, sub form de rezultate clientului i, dac este cazul, unor teri numai cu
consimmntul clientului, sau fr acordul acestuia n condiiile prevzute de lege;
2. materialele de evaluare/diagnoz cuprind manualul instrumentului,
instrumentul propriu-zis, protocoale, ntrebrile sau stimulii utilizai, alte fie sau
formulare necesare i nu includ datele de evaluare/diagnoz; 3. psihologii se vor

Copyright DEPARTAMENT ID 2008

50

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

asigura c n procesul de obinere a consimmntului informat urmtoarele puncte


au fost nelese: scopul i natura activitii; responsabilitile mutuale; beneficiile
i riscurile; alternativele; circumstanele unei ncetri a aciunii; opiunea de a
refuza sau de a se retrage n orice moment, fr a suferi vreun prejudiciu;
perioada de timp n care e valabil consimmntul; modul n care se poate retrage
consimmntul dac se dorete acest lucru; 4. psihologii vor informa persoanele
fr capacitate deplin de a-i da consimmntul i persoanele pentru care testarea
este cerut de reglementrile legislative, cu privire la natura i scopul serviciilor de
evaluare propuse, folosind un limbaj uor de neles pentru persoana care urmeaz
s fie evaluat; 5. psihologii care folosesc serviciile unui traductor vor cere
consimmntul clientului pentru a folosi serviciile acelui traductor, se vor asigura
c se va menine confidenialitatea rezultatelor, securitatea instrumentelor, inclusiv
a documentelor de evaluare/diagnoz.
Orice psiholog format sau aflat n procesul de formare trebuie s cunoasc
foarte bine coninutul celor dou coduri, ca, de altfel i celelalte acte normative
aprobate de Colegiul Psihologilor din Romnia.
Tem de reflecie/ autoevaluare
ncercai s listai ct mai multe consecine negative posibile ale nonexistenei i
nerespectrii prevederilor unui Cod deontologic.

ntrebri de autoevaluare:
1. Enumerai cteva tipuri de preocupri existente la nivel internaional privind
elaborarea de standarde pentru testarea psihologic,
2. Ce credei c nseamn standarde ?
3. De ce se face diferenierea ntre 3 nivele de calificare pentru obinerea dreptului de a
aplica anumite teste ?
4. Care este explicaia faptului c se prognozeaz o cretere a preferinei practicienilor
pentru testele obiective (n special, testele de personalitate), n detrimentul testelor
proiective ?
5. Enumerai cteva cerine etice privind construcia i dezvoltarea testelor.
6. Enumerai cteva cerine privind protecia subiectului, a celui examinat.
7. Ce tipuri de coduri a elaborat Comisia de deontologie i disciplin a Consiliului
Psihologilor din Romnia ?
BIBLIOGRAFIE MINIMAL
ANASTASI, ANA. (1996). Psychological Testing (7th.ed.). New York: Macmillan.
COLEGIUL PSIHOLOGILOR DIN ROMNIA (2006), Acte normative. Ediie adugit.
MITROFAN, NICOLAE (2001), Psihometria i direciile ei de dezvoltare la nceput de
mileniu. n M. Zlate (coord.), Psihologia la rspntia mileniilor. Iai: Polirom.
CLINCIU, ION, AUREL (2005), Psihodiagnostic. Braov: Editura Universitii.

Copyright DEPARTAMENT ID 2008

51

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Modulul III Caracteristicile psihometrice ale testelor


Unitatea de nvare 1
Ce sunt caracteristicile psihometrice ale testelor ?
Cuprins:
1.1. Precizri conceptuale
1.2. Fidelitatea i validitatea, caractersitci psihometrice de baz
1.3. Alte caracteristici psihometrice
Obiective:
La sfritul acestei uniti de nvare, studenii vor fi
capabili s:
cunoasc ce sunt caracteristicile psihometrice ale
testelor;
evalueze puterea diagnostic a testelor, plecnd de la
caracteristicile lor psihometrice;
cunoasc obligaiile constructorilor de teste privind
caracteristicile psihometrice.

1.1. Precizri conceptuale.


Testele psihologice pot fi asemnate, pn la un punct, cu alte instrumente de
msur, care pot fi evaluate n ceea ce privete calitatea i gradul lor de precizie. Marele
psiholog Alfred Binet ne avertiza pe noi psihologii s nu considerm testul ca pe un
simplu cntar, pe care dac te urci, afli imediat ce greutate ai.. Va trebui tot timpul s
inem minte acest avertisment. Dar pentru discuia noastr, putem s facem aceast
comparaie. Exist cntare de foarte mare precizie i de foarte bun calitate, exist cntare
de proast calitate i cu un grad de precizie ndoielnic. Aa i testele. Unele msoar cu
mare exactitate anumite capaciti i nsuiri psihice, altele, ns, nu sunt foarte precise,
nivelul de credibilitate acordat rezultatelor obinute fiind mai redus. Un test foarte bun i
foarte precis este un test sound, nsemnnd puternic, solid i prezint un foarte nalt grad
de credibilitate. Revenind la comparaia cu cntarul, acesta este fcut pentru a msura
greutatea cu el, deci nu poate fi folosit pentru a msura altceva, nlimea, de exemplu. i
dac este construit s msoare greutatea, atunci trebuie s-i fac foarte bine datoria.
Aa i cu testul psihologic. El este construit pentru a msura o anumit nsuire psihic i,
este de ateptat ca s o fac foarte bine. Rezultatele obinute trebuie s reflecte ct mai
bine realitatea. Fcnd toate combinaiile posibile, cel puin teoretic, putem ntlni
urmtoarele situaii: a) testul msoar ceea ce i-a propus s msoare i msoar foarte
bine (soundness la nivel maximal); b) testul nu msoar ceea ce i-a propus s msoare i
msoar prost ceea ce msoar de fapt; c) testul msoar ceea ce i-a propus s msoare,
dar msoar prost; d) testul nu msoar ceea ce i-a propus s msoare, dar msoar bine

Copyright DEPARTAMENT ID 2008

52

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

ceea ce msoar de fapt. Cea mai bun situaie este cea de tip a. Pentru a se menine n
aceast categorie, testul trebuie s rspund pozitiv la ntrebarea privind caracteristicile
sale psihometrice: Testul este fidel i valid?
Definiie: caracteristicile psihometrice sunt acele nsuiri ale testelor care asigur
un nalt grad de credibilitate rezultatelor obinute n urma utilizrii lor n activitatea
psihodiagnostic. Cele mai importante sunt fidelitatea i validitatea. i foarte important
este faptul c aceste nsuiri sunt msurabile i evaluabile. Dup cum o s vedem, ambele
caracteristici psihometrice pot fi msurate i exprimate n valori numerice: 0.50, 0.65 etc.
Pentru constructorii de teste apare obligaia de a include, n cadrul manualului,
informaii privind valoarea celor dou caracteristici psihometrice. i atunci este clar c, n
cazul n care avem de ales ntre dou teste care msoar acelai lucru (aceeai nsuire
psihic), dar care prezint valori diferite pentru cele dou caracteristici psihometrice, l
vom prefera pe cel care are valorile cele mai mari. Acesta este mult mai sigur n aciunea
de msurare psihologic. i, de aici, mai apare o obligaie pentru cei care construiesc teste
i anume, ei trebuie s acorde o mare atenie respectrii cerinelor privind cele dou
caracteristici psihometrice nc din fazele de nceput ale activitii de elaborare i de
construire a testelor. Realizai care sunt implicaiile a ce spunem asupra pieei
psihodiagnostice ? Fiind preferate testele care stau foarte bine la cerinele privind
fidelitatea i validitatea, cele care nu corespund vor iei imediat din competiie. i, ntradevr, n domeniul psihodiagnozei, mai ales a construirii de noi instrumente
psihodiagnostice, trebuie s existe o serioas competiie.
Tem de reflecie/autoevaluare:
ncercai s gsii ct mai multe exemple de situaii n care s-ar folosi teste
cu slabe caracteristici psihometrice i evideniai consecinele posibile.
1. 2. Fidelitatea i validitatea
Definiii: a) Fidelitatea nseamn gradul n care testul manifest constan n
msurare, adic dac el este capabil s ofere o aceeai informaie referitoare la subiectul
testat n cazul n care acesta este supus unei noi aciuni de testare folosind acelai test; b)
Validitatea se refer la capacitatea testului de a msura ntotdeauna ceea ce i-a propus s
msoare. Acum s explicm puin. n cazul fidelitii, dac un subiect a obinut, de
exemplu, ntr-o zi, n urma aplicrii unui test de inteligen, un Q.I. = 100 i, dup cteva
zile, n urma reaplicrii aceluiai test, ar obine un Q.I. = 70 ar nsemna c, n primul
moment el ar fi diagnosticat ca fiind normal, n ceea ce privete dezvoltarea
psihointelectual, iar n momentul 2, ar fi considerat a avea deficiene mentale. Cine ar
grei n acest caz ? Evident c testul folosit, care nu dovedete fidelitate. Realizai ce
consecine grave ar avea utilizarea unui asemenea test ? n limba englez se folosete
cuvntul reliability pentru a desemna fidelitatea testului, nsemnnd, mai ales, demn de
ncredere.
Pentru ambele caracteristici psihometrice se poate calcula valoarea unui coeficient,
de aceea, putem vorbi despre coeficientul de fidelitate (rtt) i coeficientul de validitate (rxy).
n cazul coeficientului de fidelitate, regsim dublat litera t, ceea ce nseamn c este
vorba de aplicarea n dou momente a aceluiai test (este vorba de un singur instrument),
iar n cazul coeficientului de validitate, avem dou litere, x i y, ceea ce nseamn c
sunt folosite dou instrumente de msur. Este vorba despre testul aplicat n momentul 1 i

Copyright DEPARTAMENT ID 2008

53

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

alt instrument de msurare folosit n momentul 2, care este, de regul, la mai mare distan
n timp folosit pentru a msura comportamentul anticipat n baza rezultatelor din
momentul 1.
Litera r nseamn coeficient de corelaie i, dei el poate fi calculat n mai multe
moduri, cea mai utilizat procedur este cea a lui Pearson (Pearson Product-Moment
Correlation Coefficient Coeficientul de corelaie moment-produs al lui Pearson). Se
folosete urmtoarea formul:
xy
rxy = ----------------N(SDx) (SDy)
n care: x = deviaia unei performane de la medie n proba x
y = deviaia peformanei (corespunztoare lui x) de la medie
n proba y
Revenind la conceptul de fidelitate, trebuie s menionm faptul c el a cunoscut
diverse accepiuni de-a lungul timpului. Astfel, ca s exemplificm, n Standardele APA
din anii 1954 i 1966, fidelitatea nsemna consistena sau stabilitatea (Fidelitatea se
refer la precizia consistena i stabilitatea msurrii realizate de test). n 1974,
fidelitatea era definit ca fiind gradul n care rezultatele testrii pot fi atribuite surselor
sistematice de varian. n Standardele de dup 1985, apare o nou schimbare n definirea
fidelitii, aceasta aprnd ca fiind gradul n care scorurile testului sunt consistente sau
repetabile, adic gradul n care ele sunt afectate de erorile de msur. Aadar, aa dup
cum precizeaz i prof. H. Pitariu, termenii de consisten i stabilitate continu s fie
utilizai, dar nu n sensul de consisten intern i stabilitate temporar a unui anumit
comportament, ci, mai degrab, ca reproductibilitate a rezultatelor cercetrii tiinifice.
Conceptul de fidelitate este utilizat pentru a acoperi mai multe aspecte ale
consistenei scorului (Anastasi, A., 1996). n primul rnd, fidelitatea indic msura n care
diferenele dintre subiecii testai, evideniate prin intermediul scorurilor obinute, se
datoreaz diferenelor reale (adevrate) privind nsuirea psihic msurat i msura n
care ele sunt atribuibile erorilor ansei. S explicm puin mai mult. n urma aplicrii
testului, se obine un anumit scor, numit scor brut (raw score), care poate fi exprimat
cifric. De exemplu, la un test de inteligen se obine scorul 120. n mod ideal, el ar trebui
s reflecte exact realitatea, ns niciodatr nu se ntmpl aa, deoarece, pe parcursul
activitii de testare pot interveni diveri factori care scap de sub controlul celui ce aplic
testul. De aceea, niciodat scorul brut nu coincide cu scorul real al subiectului. Nu
putem vorbi de utilizarea ecuaiei X = SR, X nsemnnd scorul brut iar SR, scorul real.
n realitate ntlnim situaia evideniat de urmtoarea ecuaie:
X = SR + E n care E = eroare
Plecnd de la aceast ecuaie, putem spune: cu ct eroarea este mai mic, cu att este
de ateptat mai mult ca scorul real s se apropie de scorul brut. Ce concluzie putem trage
de aici ? Trebuie luate toate msurile posibile pentru ca eroarea s fie ct mai mic. Orice
condiie, orice factor care este irelevant pentru scopul urmrit de un anumit test constituie
o surs pentru variana erorii. Astfel, cnd examinatorii ncearc s menin uniforme
condiiile testrii (respectnd ntocmai prevederile din cadrul manualului i controlnd

Copyright DEPARTAMENT ID 2008

54

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

factorii ambianei n care se face testarea), ei reduc variana erorii, ceea ce nseamn c fac
mult mai sigure scorurile obinute.
Apare, ns, o ntrebare: are examinatorul posibilitatea s controleze toi factorii care
pot interveni n timpul aciunii de testare, cptnd statutul de factor irelevant?
Rspunsul nu poate fi dect pozitiv, n practic existnd cel puin dou situaii: a) cnd
controlul asupra factorilor irelevani tinde ctre maximum, ceea ce nseamn c scorul real
se apropie pn la identitate de scorul brut; b) cnd controlul asupra factorilor irelevani
tinde ctre minimum, ceea ce nseamn c scorul real se ndeprteaz foarte mult de scorul
brut, eroarea n acest caz crescnd foarte mult.
Dar care sunt aceti factori irelevani care pot s intervin n aciunea de testare ? Unii
autori au ncercat s-i inventarieze. Astfel, de exemplu, fcnd o sintez a diferitelor
lucrri de specialitate, H. Pitariu ne ofer urmtorul tablou al surselor posibile de
variabilitate care pot afecta scorurile unui test.
I. Particulariti durabile i generale ale persoanei (cu influen asupra rezolvrii mai
multor teste:
A. Nivelul unor deprinderi care pot influena modul de a opera cu o serie de teste (de
exemplu, un rezolvitor de cuvinte ncruciate va fi avantajat n rezolvarea unor teste).
B. Deprinderile i tehnicile generale solicitate n testare (de exemplu, test de
excepie pentru profesioniti sau test pentru necunoscui).
C. Abilitatea general de a nelege instruciunile de lucru cu testele (de exemplu,
persoanele cu deficiene intelectuale vor nelege mai greu instruciunile de operare cu
testul, la fel cele neobinuite cu examinri prin teste).
II. Particulariti durabile dar specifice ale persoanei (cu influen numai asupra unui test
anume):
A. Specifice fa de testul luat ca ntreg
1. Nivelul individual de dezvoltare a abilitii msurate de acest test i care nu
influeneaz rezolvarea altor teste (de exemplu, o persoan dominant va obine scoruri
mari la scala de Dominan din cadrul testului CPI, dar nu i la scala de
Responsabilitate.
2. Cunotine i deprinderi specifice formei particulare a testului. De exemplu,
un programator va fi mai performant pe un test care solicit rezolvarea de scheme logice
lacunare; sau, un ceasornicar va avea rezultate mai bune la un test de dexteritate digital
care solicit operarea cu obiecte mici);
3. Pattern-uri de rspuns stabile (de exemplu, la un test cu rspunsuri
Adevrat/Fals, tendina de a alege opiunea Adevrat n toate situaiile de indecizie).
B. Specifice anumitor itemi ai testului:
1. ansa unei persoane n a cunoate rspunsul la un anumit fapt particular
cerut de un item (de exemplu, la un test de cunotine tehnice, un item poate solicita o
informaie pe care o cunosc doar subiecii care au citit o anumit lucrare).
2. Tipuri de itemi cu care diferii subieci sunt familiarizai inegal (de
exemplu, existena unor itemi cu rspuns la alegere i poate ncurca pe cei nefamiliarizai
cu stilul respectiv de lucru.
III. Particulariti temporare, dar generale ale persoanei (este vorba de existena unor
factori incidentali care pot afecta performanele n momentul n care este administrat testul
n cauz: a) sntatea; b) oboseala; c) motivaia; d) tensiunea emoional; e) nivelul prea

Copyright DEPARTAMENT ID 2008

55

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

elevat al testului; f) nelegerea mecanismelor testrii n cauz; g) condiiile de


administrare a testului, ca iluminat, cldur, umiditate, ventilaie etc.
IV. Particulariti temporare i specifice ale persoanei (cu influen numai asupra acestui
test):
A. Specifice fa de testul luat ca ntreg:
1. nelegerea sarcinii specifice cerute de testul n cauz (de exemplu, la un test
administrat de calculator, un subiect care nu a reinut modul de utilizare a tastaturii pentru
formularea rspunsului poate obine un scor care nu l caracterizeaz).
2. Mici trucuri sau tehnici neortodoxe de rezolvare a testului (de exemplu, la
un test de cunotine alctuit din itemi cu rspunsuri la alegere, care nu penalizeaz
rspunsurile greite, marcarea tuturor rspunsurilor propuse la fiecare ntrebare conduce la
obinerea unui scor nalt).
3. Nivelul de antrenare n rezolvarea unor sarcini specifice cerute de testul n
cauz (intervine mai ales n operarea cu teste psihomotoare; de exemplu, la un test de
vitez de reacie, administrat pe calculator, o persoan familiarizat cu tastatura
calculatorului respective este avantajat).
4.Setul sau dispoziia momentan pentru rezolvarea testului (de exemplu, o
persoan foarte ocupat n ziua testrii poate s i se par prea lung testul CPI, rspunznd,
n consecin, la ntmplare).
B. Specifice fa de unii itemi ai testului:
1. Fluctuaii i ideosincrazii ale memoriei umane (de exemplu, la un test de
cunotine de geografie, unui elev cruia nu-i place s opereze cu numere, nu-i va aminti
nlimile unor muni).
2. Fluctuaii neprevzute ale ateniei sau percepiei, suprapuse peste nivelul
general de performan caracteristic unei persoane (de exemplu, la un test administrat de
calculator, subiectul poate, din neatenie, s apese pe o tast greit i s nu observe acest
lucru).
V. Factori sistematici sau de noroc care afecteaz administrarea testului sau evaluarea
performanelor la test:
A. Condiiile de testare: utilizarea unui interval de timp fixat pentru testare, prezena
unor factori de distragere a ateniei, claritatea instruciei etc.
B. Efectul interaciunii personalitii, sexului sau rasei examinatorului cu persoana
examinat, aceasta stimulnd sau inhibnd performana.
C. Inconsecvena sau prtinirea n evaluarea performanelor
VI. Variaii neexplicate
A. Norocul n gsirea rspunsului corect, cnd subiectul l ghicete.
B. Distragerea momentan a ateniei
Teme de reflecie/autoevaluare:
1.Ce este fidelitatea i ce este validitatea unui test ?
2. Ce nseamn variana erorii i cui se datoreaz ea ?
1. 3. Alte caracteristici psihometrice ale testelor
Aa dup cum am menionat deja, n literatura anglo-saxon singurele caracteristici
psihometrice menionate sunt fidelitatea i validitatea. Unii autori, inclusiv autori romni (de
exemplu, U. Schiopu, 1974) vorbesc i de o alt caracteristic psihometric, respectiv,
fineea discriminativ.
Aceasta s-ar referi, pe de o parte, la capacitatea testului de a

Copyright DEPARTAMENT ID 2008

56

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

scoate n eviden diferenele interindividuale i, pe de alt parte, la capacitatea testului de a


msura exclusiv nsuirea psihic pentru care a fost construit. Ali autori vorbesc de
existena unui numr mare de asemenea caracteristici psihometrice. De exemplu, E.
Claparde ne ofer o adevrat list care cuprinde (desigur, el s-a referit, mai ales, la
calitile ideale pentru unele teste de aptitudini): 1. s fie interesante; 2. s fie obiective n
aplicaie; 3. s aib un instructaj clar; 4. s manifeste obiectivitate n apreciere (notare); 5. s
exclud hazardul; 6. s fie gradabile; 7. s fie etalonate; 8. s prezinte o bun dispersie; 9. s
fie univoce (adic s msoare un singur aspect odat); 10. s fie reprezentative; 11. s fie
inedite; 12. s nu fac apel la cunotine colare; 13. s fie constante; 14. s se aplice la toate
vrstele; 15. s permit s se alctuiasc forme echivalente; 16. s nu cear pe ct posibil
aparatur; 17. s nu msoare dect o singur variabil (cantitate, rapiditate sau calitate).
Tem de reflecie/ autoevaluare:
Citii cu atenie cele 17 caliti ale testelor i stabilii dac pot fi asimilate la
cele dou caracteristici psihometrice, respectiv, fidelitatea i validitatea.

ntrebri de autoevaluare:
1. Ce sunt caracteristicile psihometrice ale testelor ?
2. Ce obligaii au constructorii de teste n raport cu ele ?
3. Ce este fidelitatea testului ?
4. Ce este validitatea testului ?
5. Care sunt elementele de asemnare i de deosebire dintre fidelitate i validitate ?
6. Ce este scorul brut i ce este scorul real al subiectului ?
7. Ce este variana erorii n msurare?
8. Ce pericole prezint variana erorii ?
9. Ce trebuie fcut pentru reducerea varianei erorii ?
10. Enumerai ct mai muli factori irelevani ce pot interveni n aciunea de testare.
11. Ce trebuie fcut pentru ca s reducem ct mai mult din aciunea acestor factori irelevani ?
12. Ce putem spune despre controlul pe care trebuie s-l asigure cel ce aplic testul asupra factorilor
irelevani ?
BIBLIOGRAFIE MINIMAL
ALBU, MONICA, PITARIU, HORIA (1993), Proiectarea testelor de cunotine i examenul asistat de
calculator. Cluj-Napoca: Casa crii de tiin.
ANASTASI, ANNE (1996), Psychological Testing (7th edition). New-York: Mcmillan.
CLINCIU, ION, AUREL (2005), Psihodiagnostic. Braov: Editura Universitii Transilvania.
STAN, AUREL (2002), Testul psihologic. Evoluie, construcie, aplicaie. Iai: Polirom.
HORGHIDAN, VALENTINA (1998), Metode de psihodiagnostic. Bucureti: Editura didactic i
pedagogic.

Copyright DEPARTAMENT ID 2008

57

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Unitatea de nvare 2
Fidelitatea testului
Cuprins:
2.1. Proceduri de calculare a fidelitii testelor
2.2. Eroarea standard a msurrii

Obiective:
La sfritul acestei uniti de nvare, studenii vor fi
capabili s:
cunoasc tipurile de fidelitate
cunoasc procedurile de calcul a fidelitii
interpreteze exact ce nseamn eroarea standard a
msurrii
dea exemple din practic

2.1. Proceduri de calculare a fidelitii testelor


Mai nti, s le enumerm: a) fidelitatea test-retest; b) fidelitatea form alternant; c)
fidelitatea half-split; d) fidelitatea Kuder-Richardson; e) fidelitatea coeficient alpha; f)
fidelitatea privind personalitatea examinatorului. Dar de ce sunt aa de multe ? n primul
rand, din cauz c, aa cum am vzut la clasificarea testelor, acestea sunt foarte diferite (de
exemplu, un test de inteligen difer total de un chestionar de personalitate sau de un test
proiectiv). Desigur, nu este exclus situaia n care pot fi utilizate mai multe proceduri
pentru acelai test i atunci se pune problema calculrii fidelitii totale.
a) fidelitatea test-retest. Din punct de vedere strict tehnic, aceast modalitate
presupune aplicarea unui test, n momentul t1, pe un grup de subieci i apoi, reaplicarea
lui, pe acelai grup de subieci, n momentul t2. n continuare se calculeaz valoarea lui rtt,
adic a coeficientului de fidelitate, care arat la ce nivel coreleaz cele dou serii de
rezultate. Distana dintre cele dou momente poate fi mai mic, de ordinul zilelor sau
sptmnilor, sau poate fi mai mare, de ordinul lunilor sau chiar anilor. n urma multor
ani de cercetri s-a constatat c intervalele de timp mai scurte asigur o valoare mai mare a
fidelitii, n timp ce intervalele mari nu mai asigur aproape niciun fel de coresponden
ntre cele dou serii de rezultate. Oricum, aplicarea testului n cele dou momente
nseamn i aplicarea lui n condiii oarecum diferite. Pot interveni anumii factori
irelevani (v mai amintii de ei, desigur !!) care scap de sub controlul
experimentatorului, fcnd s creasc valoarea erorii n msurare. Aceti factori pot ine de
ambiana n care se face msurarea (pot exista diferene de temperatur, surse de distragere
a ateniei, diferene privind spaiul etc.) sau de persoana subiecilor (oboseal, experiene

Copyright DEPARTAMENT ID 2008

58

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

personale diferite, stri de dispoziie diferite etc). Deci, variana erorii corespunde
fluctuaiilor ntmpltoare ale performanei de la o testare la alta.
Cnd intervalul de timp este scurt sau foarte scurt (de ordinul zilelor, de exemplu) se
poate ntmpla ca subiecii s fie puternic influenai de ceea ce nseamn recunoaterea
principiului de construcie a testului. S lum, mai nti, cteva cazuri simple, pentru a
nelege mai bine:
Exemplul 1. Itemul testului apare n forma urmtoare:
A
R
P
duc
un
L
D
?
Sarcina subiectului este de a spune ce liter trebuie pus n locul semnului de
ntrebare. Voi ce prere avei ?
Exemplul 2. Itemul testului apare n forma urmtoare:
COCOLO
BALAMA
VIINE
PEPENE

mas
cobai
praline
oaie

Sarcina subiectului este de a stabili cu care dintre cuvintele scrise cu litere mici se
asociaz cuvintele scrise cu litere mari.
Exemplul 3. Itemul testului apare n forma urmtoare:
LONDRA este oraul n care se gssesc 6 teatre, 4 stadioane i 24 de cinematografe
MOSCOVA este oraul n care se gsesc 3 stadioane, 21 de cinematografe i 7
teatre
PARIS, capitala Franei, este oraul n care se gsesc 25 de cinematografe, 5 teatre
i 5 stadioane
Sarcina subiectului: cte teatre are oraul ROMA ?
Vom comenta acest ultim exemplu, lsndu-v bucuria de a descoperi singuri care
este rspunsul la primele dou cazuri. Principiul de construcie al itemului const n
asocierea dintre numrul de litere ce-l regsim n denumirea oraului i numrul de teatre.
LONDRA are 6 teatre, pentru c are ase litere, MOSCOVA are 7 teatre, pentru c are 7
litere i Paris are 5 teatre, pentru c are 5 litere. Deci, ROMA are 4 teatre, deoarece are 4
litere. Celelalte elemente din structura itemului (numrul de stadioane i de cinematografe)
sunt introduce pentru a face sarcina puin mai dificil pentru subiect.
Acum ne dm seama ct de mult ar fi ajutat subiectul, cunoscnd principiul de
construcie al testului, dac el ar trebui s fie reexaminat cu acelai instrument la un
interval de timp scurt.

Copyright DEPARTAMENT ID 2008

59

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Pe de alt parte, n cazul n care intervalul de timp este foarte mare, este greu de
ignorat impactul pe care l are asupra subiectului experiena lui personal (noi achiziii n
plan informaional-cognitiv, n plan comportamental etc.).
n practica psihodiagnostic s-au conturat deja un fel de reguli sau recomandri i
anume: - n general, pentru orice tip de persoan intervalul dintre cele dou momente de
testare (test-retest) nu trebuie s depeasc, dect foarte rar, 6 luni; - pentru copiii mici i
foarte mici, datorit schimbrilor accentuate ca urmare a dezvoltrii progresive, intervalul
dintre cele dou momente ale testrii poate i trebuie s fie mai scurt dect n cazul
adulilor.
Dei aceast procedur de calculare a fidelitii este foarte mult folosit, exist,
totui, recomandarea ca s se apeleze la ea, mai ales n cazul testelor care nu pot fi afectate
de repetiie. n asemenea categorie ar intra unele teste de discriminare senzorial i unele
teste psihomotorii (Anastasi, A., 1996).
b) fidelitatea form alternant. n mod practic se procedeaz n felul urmtor: se
aplic pe un grup de subieci un test i, apoi, dup un anumit interval de timp, care poate fi
mai scurt sau mai lung, se aplic, pe acelai grup, un alt test dar care este obligatoriu
echivalent cu primul. n final, se calculeaz valoarea coeficientului de fidelitate, respectiv,
rtt. n cazul n care forma alternant a testului se aplic imediat dup ce s-a aplicat prima
variant a lui, vorbim de fidelitate form alternant imediat iar, n cazul n care intervalul
de timp este mai mare, vorbim de fidelitate form alternant ntrziat. n primul caz, sursa
varianei erorii o constituie eantionarea coninutului i, n al doilea caz, sursa varianei
erorii o constituie eantionarea coninutului dar i eantionarea timpului.
n cadrul manualului testului trebuie s fie incluse, n mod obligatoriu, informaii
privind lungimea intervalului de timp dintre cele dou momente de administrare i, n
cazul n care acest interval este mai mare, informaii privind tipurile de experiene cu care
s-au confruntat subiecii.
Dar cea mai important problem pe care o ridic folosirea acestei proceduri se
refer la modul n care se asigur ca cele dou variante ale testului s fie identice, deci se
pune problema asemnrilor i deosebirilor. n practic este destul de dificil de realizat
acest lucru, dar nu este imposibil, dovad c exist asemenea cazuri. Principala deosebire
const n faptul c ele nu seamn atunci cnd sunt puse n faa subiecilor. Sunt alte
figuri, alte exerciii, alte ntrebri etc. Asemnrile ns sunt mai multe i ele se refer la: obiectivul urmrit n aciunea de msurare este acelai; - privitor la coninut, exist un
numr egal de itemi; - acelai tip de instructaj, acelai format al testului; - egalitate n ceea
ce privete nivelul de dificultate al itemilor
c) fidelitatea half-split, sau fidelitatea bazat pe divizarea testului n dou jumti.
Din punct de vedere tehnic, testul este mprit n dou, cele dou jumti devenind un fel
de teste independente, se aplic pe un grup de subieci i apoi se calculeaz valoarea
coeficientului de fidelitate (rtt). Dar cum realizm cele dou jumti? Vom oferi dou
modaliti: 1) mprirea pur i simplu a testului n dou pri, fiecare coninnd un numr
egal de itemi. De exemplu, dac testul ntreg are 100 de itemi, cele dou jumti vor avea
cte 50 de itemi. Se aplic testul pe grupul de subieci i, apoi, se calcueaz coeficientul de
corelaie (respectiv, coeficientul de fidelitate) dintre cele dou serii de rezultate. Sunt ns
unele teste pentru care aceast modalitate nu poate fi aplicat. Astfel, dac testul este
construit pe principiul introducerii itemilor de la uor la greu, atunci prima jumtate va fi
foarte uoar i cealalt jumtate va fi foarte grea. Sau, dac testul este foarte lung, are un

Copyright DEPARTAMENT ID 2008

60

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

numr mare de itemi, la aplicarea celei de-a doua jumti va interveni n mod sigur
oboseala;
2) o procedur mai adecvat presupune mprirea testului n dou jumti, plecnd de la
numrul de ordine al itemilor. n prima jumtate sunt reinui itemii cu so (2,4,6,8
.a.m.d.) i n a doua jumtate, itemii cu so (1,3,5,7 .a.m.d.). Astfel, sunt mai multe anse
ca cele dou jumti s fie echivalente. Desigur, o semenea procedur nu se poate aplica
n cazul n care mai muli itemi se refer la o aceeai problem, cum ar fi cazul unei
situaii problematice.
Dar indiferent de ce procedur folosim, valoarea coeficientului de corelaie vizeaz
fidelitatea doar a unei jumti de test, or, pe noi ne intereseaz fidelitatea pentru ntregul
test. O prim tentaie ar fi aceea de a dubla, pur i simplu, valoarea coeficientului de
fidelitate. Dac am proceda aa, am ajunge la rezultate stranii. Gndii-v, de exemplu,
dac valoarea lui rtt pentru jumtate de test ar fi 0,65, dublnd am ajunge la o valoare egal
cu 1,30. Poate avea coeficientul de corelaie o asemenea valoare ? V-am rugat s v
ntoarcei la ce ai studiat la Statistic.
n realitate se aplic formula lui Spearman-Brown (Anastasi, A., 1988, 1996):
2rhh
rtt = ------------n care: rtt = coeficientul de fidelitate
1 + rhh
rhh = corelaia privind jumtatea de test
S lum un exemplu: dac rhh = 0,50, aplicm formula i vom vedea care este valoarea
coeficientului de fidelitate pentru ntregul test:
2 x (0,50)
1
rtt = ------------- = ------ = 0,66
1 + (0,50)
1,5
Acum voi trebuie s facei cteva exerciii i s vedei ce se ntmpl cu valoarea
coeficientului de fidelitate, cnd crete sau scade valoarea coeficientului de fidelitate
pentru jumtate de test: 1. rhh = 0,30; rhh = 0,80; rhh = 0,99.
Efectul pe care creterea sau scderea numrului de itemi ai testului l are asupra valorii
coeficientului de fidelitate poate fi calculat cu ajutorul altei formule Spearman-Brown:
nrtt
rnn = -------------n care: rnn = coeficientul estimat
rtt = coeficientul de corelaie obinut
1 + (n-1) rtt
n = numrul ce exprim de cte ori
crete sau descrete dimensiunea testului
S lum un exemplu: dac dorim ca numrul itemilor unui test, al crui coeficient de
fidelitate are valoarea 0,50, s creasc de la 25 la 100, deci s creasc de 4 ori, aplicm
formula:
rnn

4 x (0,50)
= --------------------- =
1 + (3 x 0,50)

Copyright DEPARTAMENT ID 2008

2
--- = 0,80
2,5

61

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Deci, putem uor constata c, n cazul n care mrim dimensiunile unui test, valoarea
coeficientului de fidelitate crete. i, de aici, o concluzie foarte important pentru practic:
cu ct numrul itemilor unui test este mai mare, cu att nivelul de credibilitate acordat
informaiilor obinute cu ajutorul lui va crete. Am putea folosi o comparaie: dac am
asemna itemii cu ochii, cu ct sunt mai muli ochi cu att va fi vzut mai bine o
anumit realitate.
Pentru a vedea dac se confirm ceea ce spunem, ncercai s facei i voi unele
exerciii i anume: care este valoarea lui rnn dac: 1. dorim s micorm dimensiunile unui
test (rtt = 0,50) de 2 ori; 2. dorim s micorm dimensiunile unui test (rtt = 0,50) de 5 ori
i de 10 ori.
Se poate pune problema i aa: cunoatem valoarea actual a coeficientului de
fidelitate a unui test (care, normal, are un numr determinat de itemi) i dorim ca aceast
valoare s fie mbuntit, adic s ating o anumit valoare; avem nevoie s tim care va
trebui s fie numrul itemilor pentru testul modificat. n acest caz, aplicm formula
profeiei Spearman-Brown:
rttd (1 rtto)
N = -------------------- n care: rtto = coef. de fidelitate observat
rtto (1 rttd)
rttd = coef. de fidelitate dorit
N = de cte ori va crete numrul itemilor
S lum un exemplu: un test are 20 de itemi i rtto = 0,87; dac dorim ca rttd s aib
valoarea 0,95, pn la ce nivel trebuie s creasc numrul itemilor ? Aplicm formula:
0,95 (1 0,87)
N = ------------------- = 2,82 Apoi, 20 x 2,82 = 56,4, rotunjit, 56
0,87 (1 0,95)
Deci, pentru ca valoarea coeficientului de fidelitate s ating nivelul de 0,95, numrul
itemilor testului trebuie s ating nivelul de 56.
Dar de ce este important ca valoarea fidelitii testului s fie ct mai mare ? Desigur,
cazul ideal este ca valoarea lui rtt s fie egal cu +1,00. n realitate nu gsim asemenea
cazuri, valoarea lui rtt fiind mai aproape sau mai departe de aceast valoare ideal. Testele
existente n practic au valori diferite ale fidelitii, ridicndu-se problema seleciei lor n
funcie de ce obiective urmrim s atingem folosind rezultatele obinute. n acest sens, unii
autori fac urmtoarele recomandri (Kaplan, R., Saccuzzo, D., 1993): a) pentru cele mai
multe din scopurile de cercetare, valoarea acceptat a fidelitii testelor folosite este de
minimum 0,70; b) cnd testul este folosit pentru a lua o decizie important n legtur cu o
persoan, rtt trebuie s aib o valoare mai mare de 0,95; c) n alte scopuri de testare,
valoarea acceptat a fidelitii este de minimum 0,90.
d) fidelitatea Kuder-Richardson. Aceast procedur este aplicabil mai ales pentru
testele ale cror itemi sunt prevzui cu un sistem de rspuns de tip tot sau nimic. Este
vorba de variantele disjunctive, de genul: Da Nu, Adevrat-Fals etc. Ceea ce este
specific pentru aceast procedur este faptul c ea este bazat pe performana la fiecare
item. Formula care se aplic este urmtoarea:
n
SDt2 - pq
rtt = -------- x ------------------ , n care.

Copyright DEPARTAMENT ID 2008

62

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

SDt2

(n 1)

rtt = coeficientul de fidelitate al ntregului test


n = numrul de itemi ai testului
SDt = deviaia standard a scorurilor totale ale testului
pq = suma produselor persoanelor care reuesc i a celor
care nu reuesc la fiecare item
Din punct de vedere practic, se aplic un test pe un grup de subieci, apoi produsul pq
se calculeaz pentru fiecare item i apoi toate produsele sunt adunate, rezultnd pq. Se
calculeaz SDt, se ridic la ptrat i se completeaz datele cerute de formul.
S lum i noi un exemplu practic (Friedenberg, L., 1995): unui grup de studeni i s-a
aplicat un test ce cuprinde 6 ntrebri. Rspunsul corect a fost marcat cu litera D iar
rspunsul incorect, cu litera N. n rubrica scor total regsim numai numrul
rspunsurilor corecte.
ntrebare

A
B
C
D
E

D
D
D
N
N

D
N
N
D
D

D
N
N
N
N

D
D
D
N
N

N
N
N
N
D

D
D
N
N
D

0,6
0,4
0,24

0,6
0,4
0,24

0,2
0,8
0,16

0,6
0,4
0,24

0,2
0,8
0,16

0,6
0,4
0,24

p=
q =
pq =

Scor
total
5
3
2
1
3

(p)(q) = 1,28

( X = 2,8; SD2 = 1,76; SD = 1,3266; n = 6; n = 5) Aplicnd formula:


6 (1,76) 1,28
0,48
KR-20 = -- (----------------) = (1,2) ------ = (1,2)(0,2727) = 0,33
5
(1,76)
1,76
e) coeficientul alpha. n cazul altor teste, cum ar fi testele de personalitate, rspunsul
nu mai poate fi disjunctiv, de tipul Da Nu, ci subiectul trebuie s aleag dintre mai
multe rspunsuri. De exemplu, la un item de genul Obinuii s consumai buturi
alcoolice ?, subiectul trebuie s aleag din mai multe rspunsuri la alegere care sunt
prezentate pe o scal cu 3 trepte, cu 5 trepte. Astfel, la ntrebarea de mai sus, scala cu 3
trepte ar fi aa : niciodat uneori mereu, iar scala cu 5 trepte ar arta aa:
niciodat - foarte rar - uneori - foarte des - ntotdeauna
Fiecare variant primete un anumit punctaj; legat de exemplul de mai sus, dac
urmrim s vedem n ce msur subiectul este dependent de alcool, varianta de rspuns
ntotdeauna va primi punctaj maxim, respectiv, 5 puncte i, apoi, n ordine
descresctoare: foarte des 4 puncte; uneori 3 puncte; foarte rar 2 puncte;
niciodat 1 punct.

Copyright DEPARTAMENT ID 2008

63

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Pentru aceast categorie de instrumente psihodiagnostice formula generalizat i


propus de Cronbach (1951), Kaiser i Michael (1975), Novik i Lewis (1967) ajut la
calcularea coeficientului alpha, care este, dup cum am mai spus, coeficient de fidelitate.
Formula care se poate folosi este urmtoarea:
n
(SDi)2
rxx (sau ) = ------- ( 1 - -------- ) n care:
n1
SDx2
SDx2 = suma varianelor la scorurile ntregului test
(SDi)2 = suma varianelor la scorurile fiecrui item al testului
n = numrul de itemi ai testului
Item

Scor total

Sub. 1

19

Sub. 2

17

Sub. 3

13

Sub. 4

20

Sub. 5

15

Sub. 6

13

Deci, din punct de vedere practic, aceast procedur presupune gsirea varianei la
scorurile subiecilor pentru fiecare item, apoi se face suma, ajungndu-se la (SDi)2. S
lum i noi un exemplu practic (Friedenberg, L., 1995): unui grup de 6 elevi i s-a aplicat
un test, tip eseu, alctuit din 5 ntrebri. La fiecare dintre ntrebri scorul maxim era de 5
puncte.
SDi2 = .4722 .6667 .4722 .2222 .5833
( X = 16.1667; SD2 = 7.4722; SD = 2.7335; n = 5; N = 6)
Aplicm formula de mai sus:
5
.4722 + .6667 + 4722 + .2222 + .5833
= -- ( 1 - ----------------------------------------------) =
4
7.4722
2.4166
= (1.25) ( 1 - --------- ) = 1.25) (1 - .3234) = .84575 = .85
7.4722
f) fidelitatea legat de persoana celui care aplic testul. Din punct de vedere practic,
dup ce se aplic un test, mai muli examinatori sunt pui s coteze rezultatele. Apoi se
aplic procedurile uzuale de calculare a coeficientului de corelaie i ceea ce rezult este

Copyright DEPARTAMENT ID 2008

64

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

valoarea fidelitii examinatorului. Desigur, este vorba, mai ales, de acele teste care intr
n categoria testelor subiective (v mai amintii de clasificarea testelor n teste obiective i
teste subiective ?) i, mai exact este vorba de testele proiective, la care diferenele dintre
modul de cotare a acelorai rezultate de ctre mai muli examinatori pot fi destul de mari.
Iar dac, pentru un anumit test, se calculeaz valoarea acestui tip de coeficient de
fidelitate, acest gen de informaie trebuie s fie inclus n cadrul manualului testului.
Dup ce am trecut n revist mai multe forme ale fidelitii, s vedem, sintetic, care
sunt sursele specifice ale varianei erorii pentru ele (Anastasi, A.,1988, 1996).
Nr.
crt.
1
2
3
4
5
6

Tipul de coefficient de fidelitate

Surse pentru variana erorii

Fidelitate test-retest
Fidelitate form alternant (imediat)
Fidelitate form alternant (la un
interval de timp
Fidelitate half-split
Kuder-Richardson i Coeficientul
Alpha
Fidelitate legat de examinatori

- eantionarea timpului
- eantionarea coninutului
- eantionarea timpului i
coninutului
- eantionarea coninutului
eantionarea
coninutului
eterogenitatea coninutului
- diferenele dintre examinatori

a
i

Aa dup cum am mai precizat, valoarea coeficientului de fidelitate arat care este
procentul din variana scorurilor la test ce depinde de variana real legat de trstura
supus msurrii. De exemplu, dac rtt are valoarea 0,75, asta nseamn c 75% reprezint
variana real i 25%, variana erorii.
Tema de reflecie/autoevaluare
Vi s-au recomandat s facei cteva exerciii. Ce ai putut constata n
urma efecturii lor ?
2.2. Eroarea standard a msurrii.
Este o alt form de msurare a fidelitii, dar care este folosit pentru a interpreta
scorurile individuale. De aceea, mai este denumit i eroarea standard a scorului. Ca
formul de calcul este folosit urmtoarea:
n care: SDt = deviaia standard a scorurilor
SEM = SDt 1 rtt
testului
rtt = coeficientul de fidelitate
De exemplu, dac vom cunoate valoarea deviaiei standard, precum i a
coeficientului de fidelitate, putem calcula uor valoarea lui SEM. Astfel, dac SDt = 10 i
rtt = 0,80, valoarea lui SEM va fi 5. De regul, constructorul de test se ocup i de aceast
problem iar valoarea obinut a lui SEM este inclus n cadrul manualului. Pe noi ne
intereseaz mai mult s vedem ce reprezint aceast valoare i la ce ne folosete. Dup
cum am mai afirmat, scorul obinut de un subiect la un test (scor observat), cuprinde scorul
real (raw score) i eroarea. Un test este cu att mai valoros cu ct eroarea este mai mic.
Datorit erorii, n cazul n care reaplicm testul pe un subiect, scorul va varia, va fi mai
mare sau mai mic i ct de mult poate varia ne spune valoarea lui SEM.

Copyright DEPARTAMENT ID 2008

65

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

S lum un exemplu i mai concret din literatura de specialitate (Friedenberg, L.,


1995), cu ajutorul cruia s ilustrm i mai bine conceptual de SEM. Un subiect este testat
cu un test de inteligen de un numr mare de ori, prima dat el obinnd un QI = 120.
Testarea se va realiza, desigur, la anumite intervale de timp, ceea ce nseamn c vor
interveni, n mod sigur, o serie de factori irelevani (v mai amintii de ei ?), cum ar fi:
condiii de testare diferite, starea subiectului diferit, poate fi mai oboist, poate fi mai
necjit, fluctuaii ale capacitii de concentrare a ateniei etc. Deci, scorul poate fi mai
mare sau mai mic i, n consecin, dac am avea 100 de testri, ne vom atepta ca
jumtate dintre scoruri s fie mai mari i jumtate s fie mai mici. Apelnd la curba lui
Gauss (dac nu tii despre ce este vorba, revedei de urgen ce ai nvat la statsitic !!!),
vom fi pui n faa unei distribuii normale, avnd media = 120. SEM va reprezenta
deviaia standard a acestei distribuii ateptate. n consecin: 34% din scorurile subiectului
vor cdea ntre 120 i + 1 SEM (nsemnnd media i o deviaie standard) i alte 34% din
scoruri vor cdea ntre 120 i - 1 SEM (nsemnnd media i - o deviaie standard). Luate
mpreun, 68% din scorurile subiectului vor cdea n intervalul definit de 120 1 SEM.
Deci, noi putem fi siguri c, n caz de reaplicare a testului, 68% din scorurile subiectului
vor cdea n acest interval, numit interval de ncredere de 68%
Pentru a obine un interval de ncredere de 95%, trebuie s determinm numrul de
deviaii standard ce cuprind 95% din scorurile subiectului. Deci acest interval s-ar ntinde
ntre 120 i 2 SEM. Deci, revenind la exemplul de mai sus, intervalul va fi ntre 120 +
10 i 120 10, respectiv, ntre 130 i 110. Mai departe, pentru a obine un interval de
ncredere de 99%, trebuie s determinm numrul de deviaii standard ce curpind 99% din
scorurile subiectului. i acest interval s-ar ntinde ntre 120 i 3 SEM, respectiv, n cazul
concret, ntre 105 i 135.
Deci formula pentru construirea intervalului de confiden este urmtoarea:
X (scorul z) (SEM), n care:
X + (scorul z) (SEM) = limita superioar a intervalului
X - (scorul z) SEM = limita inferioar a intervalului
Teme de reflecie/autoevaluare:
1. Care este utilitatea practic a cunoaterii valorii fidelitii i valorii
erorii standard a msurrii (SEM) ?
2. Dai 3 exemple concrete de utilizare a erorii standard a msurrii.

ntrebri de autoevaluare:
1.
2.
3.
4.
5.
6.

Care sunt procedurile de calculare a fidelitii testelor ?


Care este specificul fidelitii test-retest ?
Ce se ntmpl cnd intervalul dintre cele dou testri este prea mic sau este prea mare ?
Care este specificul fidelitii form alternant ?
Ce reguli trebuie respectate pentru a realiza teste echivalente ?
Care este specificul fidelitii half-split ? Cum se procedeaz pentru a afla valoarea fidelitii pentru
ntregul test ?
7. Care este specificul fidelitii Kuder-Richardosn i Coeficientul Alpha ? Care este deosebirea dintre
ele ?
8. Care este specificul fidelitii legate de persoana examinatorului ?
9. Care sunt valorile fidelitii recomandate pentru anumite scopuri ale testrii ?

Copyright DEPARTAMENT ID 2008

66

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

10. Care sunt sursele varianei erorii pentru dintre procedurile de calcul a fidelitii ?
11. Ce reprezint eroarea standard a msurrii (SEM) ?
12. La ce ne ajut cunoaterea valorii lui SEM ?
13. Dai exemple privind utilizarea valorii lui SEM
BIBLIOGRAFIE MINIMAL
1. MINULESCU, M. (2003), Teorie i practic n psihodiagnoz. Bucureti: Editura
Fundaiei Romnia de mine.
2. STAN, A. (2002), Testul psihologic. Evoluie, construcie, aplicaii. Iai: Polirom.
3. CLINCIU, AUREL, ION (2005), Psihodiagnostic. Braov: Editura Universitii
Transilvania.
4. KAPLAN, M. ROBERT (2005), Psychological Testing. Principles, Applications,
And Issues. Wadsworth: Thompson.
5. FRIEDENBERG, L. (1995), Psychological Testing. Desigh, Analysis, and Use.
Allyn & Bacon.

Copyright DEPARTAMENT ID 2008

67

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Unitatea de nvare 3
Validitatea testului
Cuprins
1. Validitatea de coninut
2. Validitatea de criteriu
3. Validitatea de construct
Obiective:
La sfritul acestei uniti de nvare, studenii vor fi capabili
s:

cunoasc noiunea de validitate de coninut;


cunoasc noiunea de validitate de criteriu;
exemplifice ct mai multe categorii de criterii;
cunoasc noiunea de validitate de construct;
interpreteze valoarea coeficientului de validitate;
cunoasc procedurile de calculare a validitii

1. Validitatea de coninut.
Se refer mai ales la categoria testelor de achiziie. Spunem c un test are validitate de
coninut, dac el msoar ceea ce i-a propus s msoare i dac elementele sale de coninut
(itemii) sunt expresia unui eantion reprezentativ pentru un anumit univers de itemi sau univers
de sarcini. S ne explicm mai mult. S ne amintim de zilele cnd aveam de dat tez la o
anumit disciplin. Pentru aceasta trebuia s citim (si s retinem !!!) 50 de pagini. Un elev s-a
prezentat la tez cunoscnd 45 de pagini iar altul doar 5 pagini, respectiv, cele pe care nu le
citise primul. La tez s-au dat subiecte din cele 5 pagini. Primul elev nu a luat not de trecere iar
al doilea a luat o not mare. Dac aceast modalitate o asemnm cu un test de cunotine, este
clar c el nu are validitate de coninut. Subiectele au fost extrase la ntmplare iar norocul l-a
favorizat pe al doilea elev. Nota obinut de cei doi elevi nu reflect nivelul de achiziionare real
al celor doi elevi. Dac testul ar fi fost alctuit inndu-se seama i de cerinele validitii de
coninut, el ar fi trebuit s cuprind itemi referitor la ntreaga materie iar rspunsul dat de cei doi
elevi ar fi reflectat corect nivelul de achiziionare a cunotinelor.
Iat, aadar, c este extrem de important ca, atunci cnd construim un test de cunotine, s-i
asigurm validitatea de coninut. Aceasta nseamn mai multe aspecte. n primul rnd, cei care
fac o evaluare a programului educaional trebuie s fie experi n domeniu. Numai acetia au
competena de a analiza i de a evalua elementele de coninut, formulnd un anumit univers de
itemi. Acetia vor fi diferii n funcie de gradul de dificultate i, mai ales, n funcie de categoria
de care aparin. Unii se pot referi la cunotine factuale, alii se pot referi ca cunoaterea unor
principii, alii, la capacitatea de nelegere i de interpretare, alii, la capacitatea de evaluare etc.
Deci, mai ntotdeauna se pleac de la obiectivele urmrite de ctre programul educaional.
Acestea pot fi de natur informaional (elevul va cunoate, va ti....) i de natur operaional
(elevul va avea capacitatea de a face ceva....). n structura testului vom gsi itemi care vor
evalua achiziiile realizate pe cele dou direcii.

Copyright DEPARTAMENT ID 2008

68

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

In concluzie, n baza informaiilor recoltate de ctre experi privitoare la coninutul


programelor educaionale (cursuri, manuale, programe etc.) se contureaz specificaiile testului,
care trebuie s arate ariile de coninut sau subiectele ce trebuie s fie acoperite, obiectivele
instrucionale (educaionale) sau procesele ce urmeaz a fi testate, precum i importana relativ
a subiectelor i proceselor individuale. Pe aceast baz se stabilete numrul itemilor pentru
fiecare tip de subiect, precum i punctele acordate pentru rspuns corect (Anastasi, A., 1988,
1996).
Desigur, cei care construiesc noi teste de achiziie au obligaia de a include, n cadrul
manualului testului, informaii privind procedurile utilizate, ariile de coninut, tipurile de
achiziii (cunotine, deprinderi, capaciti) acoperite de test, categoriile de itemi i numrul de
itemi pentru fiecare.
Referitor la testele de achiziie am tot vorbit despre validitatea de coninut. Asta nu
nseamn c i alte tipuri de validitate nu pot fi folosite i nu sunt relevante pentru aceste teste.
Pe de alt parte, nu trebuie s se neleag faptul c validitatea de coninut este aplicabil numai
pentru testele de achiziie. Astfel, n practica psihodiagnostic, acest tip de validitate este
folosit n cazul testelor ocupaionale, care, la rndul lor, pot fi utilizate n activitatea de selecie
profesional.
i ar mai fi o problem legat de validitatea de coninut. n ce msur avem garania c
experii (deci mai multe persoane) procedeaz identic n analiza i evaluarea elementelor de
coninut ? De aceea, unii autori consider c este necesar s analizm calitatea judecii lor prin
raportare la anumite repere (Stan, A., 2002). Sintetic se pot rezuma trei repere: 1. Coerena
intern a judecilor stabilete persistena gradului de exigen a judectorului de-a lungul
efecturii actului apreciativ. Un judector nu poate emite aprecieri foarte exigente doar pentru o
parte din itemi, ci pentru ansamblul sarcinilor din testul supus analizei; 2. Variana judecilor:
ntre judecile emise de diferii experi nu trebuie s existe o prea mare diferen; 3.
Concordana judecilor: ntre judecile emise de diferii experi nu trebuie s existe o prea
mare diferen; 3. Concordana judecilor se realizeaz n cazul n care acestea au tendina de a
ordona itemii n aceeai manier, dup gradul lor de congruen cu faetele supuse msurrii.
A. Stan menioneaz c mai muli autori au propus diferii indicatori de msurare a
validitii de coninut. Astfel, Lawshe a propus urmtoarea formul pentru calcularea unui
coeficient de validitate de coninut, CVR (iniialele, n limba englez, de la content validity
ratio):
N
Ne - -2
CVR = ------------formul n care:
N
-2
Ne = numrul evaluatorilor (experilor) care consider testul, respectiv itemul, ca fiind
reprezentativ; N = numrul total de evaluatori (experi)
Tem de reflecie/autoevaluare:
1. n ce msur rezultatele (performanele) obinute la un test de
cunotine sunt independente de influena variabilelor irelevante ?
2. Putei s explicai de ce validitatea de coninut este nepotrivit
pentru testele de personalitate i testele de aptitudini ?

Copyright DEPARTAMENT ID 2008

69

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

2. Validitatea de criteriu
Cnd am discutat despre funciile psihodiagnozei am artat c una dintre cele mai
importante este cea prognostic, adic n baza rezultatelor la test putem s facem predicii
privind conduita pe care o va adopta subiectul ntr-o activitate sau situaie viitoare.
Rezultatele obinute de ctre subiec la test poart numele de predictori iar rezultatele
(performanele) obinute n cadrul activitii (situaiei) n raport cu care s-au fcut prediciile
poart numele de criteriu. Deci, aici este vorba despre dou mijloace de msurare, respectiv,
testul, n baza cruia facem prediciile i criteriul, respectiv, mijlocul de msurare direct i
independent a ceea ce a anticipat sau a prognosticat testul. Deci testul poate s anticipe
corect conduita subiectului sau, dimpotriv, nu poate face acest lucru. Puterea lui de
anticipare sau de predicie depinde de validitatea sa de criteriu, exprimat de coeficientul de
validitate (rxy). Cu ct valoarea acestuia este mai mare, cu att devine mai sigur predicia
privind comportamentul viitor al subiectului. Desigur, un test poate fi validat printr-un
singur criteriu sau prin mai multe criterii.
Legat de intervalul de timp dintre cele dou momente de msurare (test i criteriu),
acesta poate fi mai mare sau, dimpotriv, mai mic, uneori att de mic nct msurarea
criteriului se poate face n acelai timp cu msurarea fcut cu ajutorul testului. n
consecin, putem diferenia dou forme de validitate, respectiv, validitate concurent i
validitate predictiv. n cazul validitii concurente, dei aplicm un anumit test cu care
msurm o anumit capacitate psihic (de exemplu, inteligena), rezultatele la criteriu le
avem deja la ndemn, cum este cazul rezultatelor colare. n asemenea situaii validitatea
concurent apare ca un substitut al validitii predictive, ea viznd n special statutul existent
al subiecilor. Avnd la ndemn informaiile privind rezultatele la test exist pericolul
influenrii celor care sunt implicai n evaluarea legat de criteriu. Acest fenomen este
cunoscut sub numele de contaminare a criteriului. De exmplu, un cadru didactic, dac ar
cunoate rezultatele la teste ar manifesta tendina (este real acest pericol !!!) de a evalua la
criteriu (cum este cazul unui test de cunotine) n funcie de aceste rezultate. De aici se
desprinde concluzia clar c este bine ca cei ce evalueaz la criteriu s nu aib acest la
rezultatele la teste.
Printre cele mai cunoscute criterii ce sunt utilizate n practica psihodiagnostic sunt
urmtoarele (Anastasi, A., 1988, 1996):
1) Achiziiile academice, evideniate prin note, medii, evidenieri speciale, rezultate la
concursuri, promovri, graduri, recompense, burse etc., sunt foarte frecvent folosite pentru
validarea testelor de inteligen. De aceea, mai muli autori au considerat aceste teste ca
fiind modaliti de msurare a aptitudinilor colare. De asemenea, achiziiile academice sunt
folosite i pentru validarea testelor de msurare a personalitii i a testelor pentru msurarea
aptitudinilor multiple;
2) Performana n cadrul unui domeniu de formare specializat este folosit n calitate de
criteriu pentru validarea unor teste folosite pentru msurarea aptitudinilor speciale. Pot fi
date ca exemple: - achiziiile finale n cadrul cursurilor de formare profesional special sunt
folosite pentru validarea testelor ce msoar aptitudinile tehnice; - performana n anumite
ramuri artistice pot fi folosite n vederea validrii testelor pentru msurarea aptitudinilor
artistice;
3) Performana muncii (job performance) apare n calitate de criteriu folosit pentru
validarea, n primul rnd, a testelor pentru aptitudini speciale. Totodat, ea este utilizat, dar

Copyright DEPARTAMENT ID 2008

70

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

n mai mic msur, pentru validarea testelor de inteligen general i a testelor de


personalitate;
4) Diagnoza psihiatric este folosit n calitate de criteriu pentru evidenierea validitii
testelor de personalitate, dac este bazat pe observarea prelungit i detaliat a cazului;
5) Corelaiile dintre un test nou i testele disponibile anterioare; de exemplu, validarea
testelor de grup folosind bateria Stanford-Binet;
6) Metoda grupurilor contrastante, ce implic un criteriu compozit. De exemplu, validitatea
unor teste de aptitudini muzicale sau a unor teste de aptitudini tehnice pot fi verificate prin
compararea scorurilor obinute de studenii admii n instituiile de art sau de inginerie cu
scorurile obinute de cei respini la examenele de selecie.
Tem de reflecie/autoevaluare:
Dac notele colare ridic multe probleme privind modul n care ele
reflect achiziiile reale ale elevilor, n ce msur pot fi acceptate ca o form de
validare a unor teste de inteligen ?
3. Validitatea de construct (construct-related validation).
Aceast form de validitate vizeaz msura n care un test are capacitatea de a msura
un anumit construct teoretic. Fiecare test i propune s msoare o anumit nsuire sau
trstur psihic, cum ar fi, de exemplu: aptitudine colar, apreciere spaial, inteligen,
comprehensiune verbal, fluen verbal, coordonare motorie, nevrozism, dominan,
anxietate, responsabilitate, intro-extroversie, timiditate etc. Fiecare dintre aceti termini
reprezint o abstracie i el reflect o anumit parte a comportamentului uman. Pentru a-l
putea msura este necesar s inventariem ct mai multe dintre actele comportamentale care
sunt observabile i msurabile. De exemplu, ce nseamn c un individ este introvertit ?
Alctuim o list de acte comportamentale, ceea ce nseamn c operaionalizm conceptual
de introversie, care va cuprinde: - nu-i place s vorbeasc prea mult cu alii; - nu are
prieteni; - stabilete greu relaii cu alte persoane; - nu rspunde dac nu este ntrebat; - nu-i
place s atrag atenia altora asupra lui; - i place s stea mai izolat; - i place s-i analizeze
propriile gnduri; nu dorete s mearg la petreceri etc.
Validarea de construct cuprinde mai multe etape, care sunt diferite de la un autor la
altul, dar care n final atinge acelai obiectiv. Astfel, Cronbach, 1979 (apud Stan, A., 2002)
ia n considerare 3 etape: 1. Lansarea ipotezei n privina constructului care elucideaz
comportamentul la test. Acesta este un act de reprezentare, care se bazeaz pe observarea
comportamentului la test i pe cercetarea logic a testului; 2. Deducia ipotezelor verificabile
din teoriile localizate n construct. Aceasta este o operaie pur logic; 3. Realizarea unei
cercetri empirice pentru verificarea acestor ipoteze.
Ali autori, respectiv, Guthke, Bttcher i Sprung, 1991 (apud Stan, A., 2002)
consider c demersul pentru validare este constituit din patru trepte i anume:
1. Colectarea din fundamentele teoriilor asupra obiectului diagnosticului (de exemplu,
anxietate, introversiune) a unei serii de aseriuni, cum a r fi: a) despre relaiile presupus
pozitive ale constructului implicat n test i alte constructe; b) despre neconcordanele
presupuse de relaia dintre constructele cercetate i alte constructe; c) despre relaia dintre
constructele cercetate i anumite variabile observate (moduri de comportament, produse ale
activitii etc.);

Copyright DEPARTAMENT ID 2008

71

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

2. Alegerea, mai ales pentru dezvoltarea unor teste, a acelora care apar adaptate pentru
constructele indicate la a i b;
3. Formularea unei serii de ipoteze care se refer la msurarea constructelor corespunztoare
(tipul a se refer la validitatea convergent, tipul b la cea discriminant, iar tipul c la
validarea criteriului;
4. Verificarea sau falsificarea, respectiv modificarea ipotezelor anterioare, pe baza cercetrii.
Printre modalitile de evideniere a validitii constructului menionm urmtoarele:
1. Diferenierea vrstei, criteriu folosit pentru validarea mai ales a testelor de inteligen. De
exemplu, n cazul bateriei Stanford-Binet, este folosit vrsta cronologic pentru a se
evidenia dac scorurile obinute arat o cretere progresiv odat cu creterea nvrst a
subiectului;
2. Corelaiile cu alte teste similare anterioare, care msoar acelai tip de comportament. Un
test nou de inteligen nou este declarat valid dac el coreleaz cu un alt test de inteligen a
crui validitate a fost deja verificat;
3. Analiza factorial, ce ne apare n calitate de tehnic statistic rafinat pentru analizarea
interrelaiilor datelor comportamentale. Scopul major al analizei factoriale este de a
simplifica descrierea comportamentului supus msurrii, reducnd numrul mare de
variabile luate n atenie la civa factori sau trsturi comune.
4. Analiza consistenei interne, folosit mai ales pentru categoria testelor de personalitate, n
raport cu care criteriul nu este altceva dect scorul total al testului nsui.
5. Matrice multi-trsturi - multi-metode (multi-trait - multimethod matrix).
Aceast ultim modalitate o vom detalia mai mult, pentru c ea este prezentat
practic n toate tratatele de psihodiagnostic (Anastasi, A., 1988, 1996) i pentru c este una
dintre cele mai utile. Este vorba despre un proiect experimental propus de ctre Campbell i
Fiske (1959). Ei difereniaz dou tipuri de validitate, respectiv, validitatea convergent i
validitatea discriminatorie. Validitatea convergent se refer la faptul c un test coreleaz la
nivel nalt cu alte variabile cu care teoretic trebuie s coreleze. De exemplu, rezultatele unui
elev la un test pentru msurarea aptitudinilor matematice coreleaz cu rezultatele sale
colare la matematic (validitate convergent). Pe de alt parte, este de ateptat ca
performanele la acelai test s nu coreleze cu rezultatele lui colare la literatur (validitate
discriminatorie).
Revenind la proiectul experimental propus de Campbell i Fiske, menionm c
procedura folosit solicit msurarea a dou sau mai multe trsturi prin dou sau mai multe
metode. Concret, n proiectul lor: - cele trei trsturi sunt trsturi de personalitate,
respectiv: A (dominana); B (sociabilitatea); C (motivaia achiziionrii); - cele trei metode
sunt: 1) inventar de personalitate; 2) test proiectiv; 3) clasificarea n perechi. Pot rezulta
urmtoarele combinaii posibile:
A1, A2, A3 = dominana la testele 1, 2, 3;
B1, B2, B3 = sociabilitatea la testele 1, 2, 3;
C1, C2, C3 = motivaia achiziionrii la testele 1, 2, 3.
Se alctuiete un table cu dubl intrare, n cadrul cruia regsim urmtoarele tipuri
de informaii:
- valoarea coeficienilor de fidelitate;
- valoarea coeficienilor de validitate, rezultai n urma corelrii scorurilor obinute pentru
aceeai trstur prin diferite metode;
- corelaiile dintre diferite trsturi msurate cu aceeai metod;

Copyright DEPARTAMENT ID 2008

72

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

- corelaiile dintre diferite trsturi msurate cu diferite metode.


n urma analizei datelor din table au rezultat urmtoarele concluzii:
a) pentru ca validitatea constructului s fie satisfctoare, valoarea coeficienilor de
validitate trebuie s fie mai mare dect valoarea corelaiilor dintre trsturile diferite msurate
cu metode diferite;
b) valoarea coeficienilor de validitate trebuie s fie mai mare dect valoarea corelaiilor
dintre trsturi diferite msurate cu aceeai metod.
i acum ntrebarea: ct de mare poate fi valoarea coeficientului de validitate ? Nu
exist un rspuns acceptat unanim de ctre autori. Desigur, ca o cerin general, cu ct
valoarea este mai mare cu att mai valid este testul respectiv. S nu uitm ns, c absolut
ntotdeauna valoarea coeficientului de validitate al unui test este mai mic dect valoarea
coeficientului de fidelitate al aceluiai test.
Unii autori (Anastasi, A., 1988, 1996) susin c valoarea coeficientului validitii
trebuie s fie destul de mare pentru a fi statistic semnificativ la un nivel acceptabil, cum ar
fi 0.01 sau 0.05. Ali autori, cum este cazul lui M. Smith (apud Stan, A., 2002), propun o
gradare a semnificaiilor unui indice de validitate:
a) peste 0,50 - excelent;
b) ntre 0,40 i 0,49 - bun;
c) ntre 0,30 i 0,39 - acceptabil;
d) sub 0,30 - slab.
A. Stan atenioneaz ns c un coeficient de validitate mai mare de 0,70 este
excepional i c el merit o examinare atent cnd este raportat.
Tem de reflecie/autoevaluare:
1. ncercai s operaionalizai constructele: timiditate i anxietate
2. De ce ntotdeauna valoarea coeficientului de validitate al unui test
este mai mic dect valoarea coeficientului de fidelitate ?

ntrebri de autoevaluare:
1. De ce validitatea de coninut nu este valabil pentru testele de personalitate i testele de aptitudini ?
2. n afar de testele de cunotine pentru ce categorii de teste mai este valabil validitatea de coninut ?
3. Ce cuprind specificaiile testului ?
4. La ce ne ajut formula lui Lawshe ?
5. Care este specificul validitii de criteriu ?
6. Care este deosebirea dintre predictori i criteriu ?
7. Prin ce se deosebete validitatea concurent de validitatea predictiv ?
8. n ce const fenomenul de contaminare a criteriului i cum poate fi el contracarat ?
9. Care sunt cele mai cunoscute criterii utilizate n practica psihodiagnostic ?
10. n ce const validitatea privitoare la construct ?
11. Care este poziia diferiilor autori privind etapele parcurse pentru evidenierea validitii de construct
?
12. Care sunt principalele modaliti de evideniere a validitii de construct ?
13. Prin ce se deosebete validitatea convergent de validitatea discriminatorie ?
14. n ce const i la ce folosete proiectul experimental propus de ctre Campbell i Fiske ?
15. Ce putem spune despre valoarea coeficientului de validitate ?

Copyright DEPARTAMENT ID 2008

73

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

16. De ce ntotdeauna valoarea coeficientului de validitate este mai mic dect valoarea coeficientului
de fidelitate ?
BIBLIOGRAFIE MINIMAL
1. ANASTASI, A. (1988, 1996). Psychological testing. New York: Macmillan.
2. COHEN, R.J., SWERDLIK, M.E. (2005). Psychological Testing and Assessment. An
Introduction to Tests and Assessment. McGraw-Hill
International Edition.
2. CLINCIU, A.I. (2005). Psihodiagnostic. Braov: Editura Universitii Transilvania.
3. MINULESCU, M. (2003). Teorie i practic n psihodiagnosz. Bucureti: Editura
Fundaiei Romnia de Mine.
4. STAN, A. (2002). Testul psihologic. Evoluie, construcie, aplicaie. Iai: Polirom.

Copyright DEPARTAMENT ID 2008

74

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Unitatea de nvare 4
Testul psihologic i selecia profesional
Cuprins:
1. Eroarea standard a estimrii
2. Criterii de selectare a testelor
3. Locul i rolul testului n selecia profesional
Obiective:
La sfritul acestei uniti de nvare, studenii vor fi capabili
s:

1.

cunoasc n ce const eroarea standard a estimrii;


poat s dea exemple opernd cu SEE;
identifice criteriile n baza crora selectm testele pentru a
le folosi n practic;
foloseasc tabelele Taylor-Russell;
determine capacitatea de selecie a unor teste.

Eroarea standard a estimrii (Standard Error of Estimation SEE).


Este foarte asemntoare cu eroarea standard a msurrii (SEM), numai c aceasta nu
mai are legtur cu fidelitatea, ci cu validitatea. SEM ajut la determinarea mrimii erorii ce
poate fi ateptat ca urmare a faptului c scorul unui subiect este rezultatul nonfidelitii
testului. La rndul ei, SEE ajut la determinarea erorii ce poate fi ateptat privitor la scorul
prognozat al subiectului la un criteriu, ca rezultat al validitii imperfecte a testului. Aa
dup cum deja cunoatem, n baza rezultatelor obinute la un test folosit pentru selectarea
subiecilor, anticipm poziia sau chiar scorul unui subiect la criteriu. n cazul n care testul
ar fi perfect valid, de cte ori am aplica testul am anticipa exact acelai scor la criteriu, ceea
ce n realitate este imposibil. Datorit valorii relativ reduse a validitii testului (v amintii
c valoarea coeficientului de validitate este ntotdeauna mai mic dect valoarea
coeficientului de fidelitate ?), poziia anticipat a subiectului la criteriu va oscila ntre
anumite limite, care pot fi precizate cu ajutorul lui SEE. Formula de calcul este urmtoarea:
SEE = SDy 1 rxy2
n care: SDy = deviaia standard la scorurile la criteriu;
rxy2 = ptratul coeficientului de validitate
S vedem ce se ntmpl n cazul n care valoarea coeficientului de validitate = 1.00,
adic testul ar fi perfect valid. nlocuim n formul i vom constata c valoarea lui SEE ar fi
zero, deci precizia anticiprii scorului subiectului la criteriu ar fi maxim. n cazul n care,
ns, coeficientul de validitate ar avea valoarea zero, nlocuind n formul, vom constata c
mrimea erorii standard a estimrii ar fi att ct este deviaia standard. Deci, predicia nu ar
mai avea nicio precizie, ea fiind total ntmpltoare. Inutil s mai spunem c valoarea
predictiv a testului ar fi practic nul.
Desigur, calcularea valorii lui SEE intr n obligaia constructorului testului iar
informaiile privind acest tip de eroare trebuie s fie incluse n manualul testului.

Copyright DEPARTAMENT ID 2008

75

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Cunosc\nd valoarea lui SEE noi putem s anticipm ntre ce limite se va ncadra
scorul subiectului prognozat la criteriu. S presupunem c scorul prognozat este 100. Dac
reaplicm testul de 100 de ori, scorul prognozat va oscila n jurul scorului egal cu 100,
respectiv, jumtate dintre ele vor fi mai mari i jumtate vor fi mai mici. Apelnd la curba
lui Gauss, vom fi pui n faa unei distribuii normale, avnd media = 100. SEE va
reprezenta deviaia standard a acestei distribuii. Drept urmare: 34% din scorurile subiectului
vor cdea ntre 100 i + 1 SEE (nsemnnd media i plus o deviaie standard) i alte 34%
din scoruri vor cdea ntre 100 i - 1 SEE (nsemnnd media i minus o deviaie standard).
Luate mpreun, 68% din scorurile subiectului vor cdea n intervalul definit de 100 1
SEE. Deci, dac valoarea lui SEE ar fi 10, noi putem fi siguri c, n caz de reaplicare a
testului n vederea anticiprii scorului la criteriu, acesta din urm va cdea n intervalul 90 i
110, la un nivel de ncredere de 68%. La un nivel de ncredere de 95%, scorul prognozat ar
cdea n intervalul 100 2 SEE, respectiv, pentru exemplul dat, n intervalul 80 i 120. La
un nivel de ncredere de 99%, scorul prognozat ar cdea n intervalul 100 3 SEE,
respectiv, pentru exemplul nostru, n intervalul 70 i 130.
Exact ca i n cazul erorii standard a msurrii, formula pentru construirea intervalului
de ncredere este urmtoarea:
X (scorul z) (SEE), n care:
X + (scorul z) (SEE) = limita superioar a intervalului
X - (scorul z) (SEE) = limita inferioar a intervalului.
Aa dup cum am precizat de mai multe ori, valoarea coeficientului de validitate al
testelor este relativ mic, ceea ce nseamn c, de regul, eroarea scorurilor prognozate este
considerabil. De aceea, n realitate, cele mai multe teste sunt folosite nu pentru a prevedea
exact scorul unui subiect la criteriu, ci mai mult pentru a determina dac el va depi un
standard minim al performanei sau o linie de demarcaie ntre succes-eec (Anastasi, A.,
1988, 1996).
Tem de reflecie/autoevaluare:
1. Ce este eroarea standard a estimrii (SEE)i care este relaia sa cu validitatea
testului ?
2. Dac valoarea lui SEE este 5 i scorul prognozat al subiectului n baza
rezultatelor la un test aplicat este 120, ntre ce limite se va ntinde scorul
prognozat, la un nivel de ncredere de 99%, n caz de reaplicare a testului ?
3. Criterii de selectare a testelor.
n practica psihgodiagnostic exist foarte multe teste, de aceea, se pune problema
selectrii lor, att n funcie de caracteristicile psihometrice, ct i n funcie de scopul
aciunii de msurare. Desigur, trebuie evitat pe ct posibil utilizarea unui singur test, mai
ales atunci cnd trebuie luat o decizie important pentru subiect. Unele teste sunt deja
foarte cunoscute, ele fiind aplicate de foarte muli psihologi. n unele ri, cum este cazul
S.U.A. s-au realizat chiar ierarhizri ale testelor n funcie de preferina manifestat de
practicieni. Teste precum MMPI, CPI, WAIS, WISC, WPPSI, Rorschach, TAT etc. s-au
impus mai demult n partea de nceput a acestor ierarhizri. Cu toate acestea, selectarea
testelor pe care trebuie s le aplice psihologul nu este o sarcin uoar, el trebuind s
dovedeasc mult flexibilitate i mult rspundere n acest sens.

Copyright DEPARTAMENT ID 2008

76

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Printre factorii care trebuie s fie luai n consideraie n selectarea testelor pot fi
inclui urmtorii:
- motivul pentru care subiectul a fost trimis la psiholog pentru msurarea i evaluarea
psihologic;
- vrsta subiectului;
- probleme prezentate de subiect de ordin snzorial (vz, auz) sau de ordin motor;
- perioada de timp disponibil pentru testare;
- disponibilitatea anumitor teste;
- abilitatea subiectului de a citi (pentru cazurile n care vom folosi teste de
personalitate sau anumite inventare de interese vocaionale);
- mediul socio-cultural din care provine subiectul.
n continuare vom prezenta cteva exemple (Bishop, E., 1992) de modul n care se
pot combina testele, inndu-se seam de scopul trimiterii spre examinare i de vrsta
subiecilor.
Exemplul 1: pentru un adult care este trimis pentru o examinare psihologic complet n
vederea stabilirii exacte a diagnosticului i planificrii tratamentului, fiind suspectat c are
probleme psihiatrice, cum ar fi, depresia sau anxietatea se poate folosi urmtoarea baterie de
teste. Testele sunt prezentate n ordinea aplicrii lor:
- Scala de inteligen pentru aduli a lui Wechsler (WAIS III);
- Inventarul multifazic de personalitate Minnesota (MMPI 2);
- Testul Bender Gestalt;
- Testul tematic de apercepie (TAT);
- Testul completrii de fraze (Incomplete Sentence Blank).
Acest grup de teste, att obiective, ct i proiective vor oferi informaii privind
abilitile cognitive i funcionarea personalitii.
Exemplul 2: pentru copiii ce urmeaz a fi evaluai pentru plasarea lor ntr-o instituie pentru
educaie special, se poate folosi urmtoarea baterie de teste:
- Scala de inteligen a lui Wechsler pentru copii (WISC-III);
- Testul pentru achiziii colare Woodcock-Johnson (Woodcock-Johnson Achievement Test
Revised);
- Testul Bender-Gestalt;
- Testul de dezvoltare a integrrii vizual-motorii (The Developmental Test of Visual-Motor
Integration);
- The Draw a Person (DAP) sau House-Tree-Person (HTP).
Deci aceast baterie vizeaz mai multe aspecte, respectiv, nivelul de dezvoltare
intelectual, nivelul i tipurile de achiziii colare, nivelul de funcionare cognitiv, nivelul
de funcionare a personalitii. Dac este necesar confirmarea unui diagnostic posibil
privind retardarea mental, trebuie s fie adugate alte instrumente de msurare a
comportamentului adaptativ, cum este cazul Scalelor Vineland pentru Comportamentul
Adaptativ (Vineland Adaptative Behavior Scales). Aceste scale sunt foarte necesare
deoarece diagnoza retardrii mentale presupune evidenierea unor ntrzieri semnificative
att n ceea ce privete funcionarea cognitiv, ct i n ceea ce privete comportamentul
adaptativ.
Exemplul 3. Dac un adolescent este evaluat pentru posibile servicii de reabilitare
vocaional, bateria folosit ar trebui s cuprind: teste pentru abiliti cognitive, teste de

Copyright DEPARTAMENT ID 2008

77

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

achiziii colare, teste pentru planificare i organizare, teste pentru interese vocaionale i
teste de personalitate. Concret, aceast baterie ar cuprinde:
- Scala de inteligen a lui Wechsler pentru aduli (WAIS-III);
- Wide Range Achievement Test- Revised;
- Strong Vocational Interst Blank;
- Incomplete Sentences Blank.
Exemplul 4. Pentru evaluarea unui copil mic i foarte mic, n vederea beneficierii de un
suport financiar datorit unor dizabiliti, se poate utiliza o baterie care s cuprind:
- Testele Bayley ale dezvoltrii copilului (Bayley Tests of Infant Development;
- Scalele Vineland pentru comportamentul adaptativ (The Vineland Adaptive behavior
Scales;
- Observarea interaciunii mam-copil.
O grij deosebit trebuie acordat selectrii testelor potrivite pentru evalurile
judiciare (forensic evaluations).
Exemplul 5. n cazul stabilirii custodiei pentru un copil, testele de evaluare sunt aplicate i
pe copii i pe prini, la care se adaug interviul clinic i observarea interaciunii printecopil. Ca teste pentru copii pot fi folosite urmtoarele:
- Testul Aperceptiv Robert pentru Copii (Roberts Apperception for Children);
- Testul vocabular n imagini Peabody (Peabody Picture Vocabulary Test- Revised);
- Desenul kinetic al familiei (Kinetic Family Drawing);
- Completare de propoziii (Incomplete Sentences Blank).
Pentru aduli se aplic testele:
- Inventarul multifazic de personalitate Minnesota (MMPI-2);
- Completare de propoziii (Incomplete Sentences Blank);
- Indexul stresului parental (Parenting Stress Index).
Teme de reflecie/autoevaluare:
1. De ce credei c este necesar, precum n exemplele de mai sus, s fie
incluse ntr-o baterie de testare mai multe teste ?
2. Care sunt cele mai importante criterii ce se iau n atenie n selectarea unor
teste folosite n aciunile de msurare psihologic ?
3. Locul i rolul testului n selecia profesional.
Testul este foarte frecvent folosit n aciunile de selecie profesional. n urma aplicrii
lui rezult dou categorii de subieci: a) cei care reuesc la test; b) cei care nu reuesc la test.
Primii mai sunt denumii subieci admii iar ceilali sunt denumii subieci respini. Cei care
organizeaz examenul de selecie trebuie s stabileasc linia de demarcaie (cut-off score)
dintre subiecii admii i cei respini. Aceast linie poate fi foarte apropiat de partea de
nceput a listei candidailor (de exemplu, dac se pot obine maximum de 100 de puncte la
test, vor fi declarai reuii numai cei ce obin peste 95 de puncte) sau, dimpotriv, poate fi
foarte mult ndeprtat de partea de nceput (n cadrul exemplului dat pot fi declarai admii
cei ce obin cel puin 25 de puncte). Este clar c, n primul caz, interesul organizatorului
examenului este de a face o selecie foarte sever, iar n al doilea caz, interesul este de a
accepta ct mai muli candidai.
Dac testul psihologic folosit pentru selecie ar fi un instrument perfect (coeficientul
de fidelitate = 1,00 i coeficientul de validitate = 1,00) atunci, n cadrul aciunii de selecie,
ar fi sigur departajai subiecii buni (admii) de cei slabi (respini). Deci nu ar exista nicio
greeal, n sensul c pot fi admii candidai slabi i respini candidai buni.

Copyright DEPARTAMENT ID 2008

78

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Cum ns, n realitate, testul psihologic nu este un instrument de msurare perfect


(niciodat valoarea coeficientului de fidelitate i a coeficientului de validitate nu este 1,00),
el poate grei, n sensul c, pe lng subiecii admii pe drept pot fi inclui i subieci
care ar trebui s fie respini. De asemenea, n categoria subiecilor respini pe drept, el
poate include i unii subieci, care ar trebui s fie, de fapt, admii.
Iat, aadar, c, n realitate, n urma examenului de selecie rezult nu doar dou
categorii, ci patru: admii, respini, fals admii, fals respini. Desigur, ultimile dou
categorii ridic probleme serioase n cazul n care procentul celor ce le aparin este mare.
Falii admii sunt cei care nu au capaciti i aptitudini pentru activitatea n raport cu care sa fcut selecia i meninerea lor n aciunile de formare (training) vor necesita costuri mari
inutile, deoarece ei oricum vor eua cnd vor fi evaluai la criteriu. Falii respini nseamn,
candidai buni pierdui, care, dac ar fi fost admii, ar fi reuit sigur cnd ar fi fost evaluai
la criteriu.
Cum ar trebui s procedeze organizatorul examenului pentru a reduce numarul
falilor pozitivi (cei admii pe nedrept) ? O msur simpl ar fi s ridice linia de demarcaie,
scorul de departajare (cut-off score) ct mai aproape de partea de nceput a listei
candidadailor. Cei care obin scoruri foarte mari este greu de presupus c ei vor aparine
grupului falilor pozitivi. i invers, dac organizatorul examenului de selecie nu dorete s-i
piard pe cei care au capacitile i aptitudinile msurate de test (s nu-i piard pe falii
negativi), poate cobor linia de demercaie (cut-off score) ct mai jos posibil.
Iat, aadar, c se pune problema n ce msur testul psihologic folosit n selecia
candidailor are capacitatea de a face o predicie corect. Mai nti, vorbim despre rata de
selecie a cestuia (hit rate), ce se refer la proporia cazurilor n care el anticip corect
succesul sau eecul. Pe de alt parte, avnd n vedere rezultatele la criteriu, se poate
determina rata de baz (base rate), care este proporia celor care reuesc i a celor care nu
reuesc la criteriu.
S lum i noi un exemplu concret (Kaplan, M.R., Saccuzzo, P. Dennis, 1993). Este
vorba despre un test cu 83% precizie predictiv i 80% precizie a detectrii.
Rezultate la testul psihologic
Afeciune neurologic
Normal
Total
Afeciune
A
B
neurologic
8
2
10
Actual

Normal
Total

C
15

D
75

90

23
77
100
Citind datele din tabel, rezult c, n urma testrii psihologice a 100 de subieci, a
rezultat c 23 au afeciune neurologic i c 77 dintre ei nu au o asemenea afeciune. Pe de
alt parte, tot din tabel reiese c, n urma efectrii diagnosticului medical, a reieit c 10
subieci au afeciune neurologic iar ceilali 90 sunt normali. Ce rezult de aici ?
n tabel exist dou tipuri de preziceri corecte: a) din 10 subieci cu afeciune
neurologic, testul detecteaz 8, ceea ce nseamn c rata de detecie este de 80%; b) testul
arat c 75 dintre subieci sunt normali, fiind n total acord cu rezultatul examenului
medical. Deci, din 100 de subieci, testul stabilete corect diagnosticul pentru 83 dintre ei.
Putem spune, n consecin, c acest instrument psihodiagnostic prezint un procent de 83%

Copyright DEPARTAMENT ID 2008

79

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

a acurateei sau preciziei predictive. Totodat, ns, exist i dou tipuri de eecuri n
predicie. Astfel, exist dou cazuri considerate, n baza testului, ca neavnd afeciune
neurologic, n realitate nefiind aa. De asemenea, conform datelor obinute la test, 15 cazuri
prezint o afeciune neurologic, situaie neconfirmat de examenul medical.
Aadar, din tabelul de mai sus reies urmtoarele tipuri de informaii:
- A i D = predicie corect a testului
- B = fals negativi
- C = fals pozitivi
- A/(A + B) = rata de detecie
- D/(C + D) = specificitate
- (A + D)/(A + B + C + D) = rata acurateei sau preciziei predictive
Concluzia principal este aceea c acest test este relativ bun n detectarea afeciunilor
neurologice, deoarece 10% din toi subiecii au asemenea afeciuni iar testul detecteaz 80%
din cazuri.
Pentru a cunoate ct de mult ne poate ajuta un test psihologic n aciunile de
selecie, Taylor i Russell au oferit o metod pentru evaluarea validitii n relaie cu
cantitatea de informaie cu care testul contribuie dincolo de rata de baz. Aceast metod a
msurrii valorii testelor este prezentat ntr-o serie de tabele, cunoscute sub numele de
tabele Taylor-Russell (Kaplan, M.R., Saccuzzo, P.D., 1993). Cel care dorete s utilizeze
aceste tabele trebuie s dispun de urmtoarele informaii:
1. Definirea succesului i precizarea ct mai clar a limtei de demarcaie ntre cele dou
categorii de subieci (admii-respini);
2. Determinarea ratei de baz, adic procentul persoanelor care vor reui n condiiile n
care nu se folosete niciun test;
3. Definirea ratei de selecie: procentul candidailor selectai sau admii;
4. Determinarea coeficientului de validitate. Acesta, de regul, vizeaz corelaia dintre
rezultatele la test i rezultatele la criteriu.
Tabelele Taylor-Russell ofer probabilitatea ca o persoan selectat pe baza scorului la
test s reueasc la criteriu. Exist cte un tabel diferit pentru fiecare rat de baz. Tabelul
care este cel mai cunoscut i care poate fi regsit apropate n toate tratatele de
psihodiagnostic este cel cu o rat de baz: 0,60.
Pentru a utiliza tabelul se ia n atenie irul ce cuprinde valorile validitii testului ce
urmeaz a fi utilizat pentru selecie. Apoi se gsete coloana asociat procentului celor ce
vor fi selectai. Numrul gsit la intersectarea irului i coloanei ne ofer o estimare a celor
ce vor reui n cazul n care vor fi selectai pe baz de test.
Iat un exemplu concret (Kaplan, M.R., Saccuzzo, P.D., 1993). S presupunem c
avem n calitate de criteriu notele (mediile) obinute de elevi dup terminarea unui an colar.
Avnd n vedere c limita de demarcaie (cutt-off score) este 5,00, 60% dintre ei sunt
declarai reuii. Deci rata de baz = 60%. Apoi, considerm c vom utiliza pentru selecia
elevilor un test de inteligen. Rata de selecie va fi 60%, deoarece avem numai attea locuri.
Valoarea coeficientului de corelaie dintre acest test i criteriu este deja cunoscut: 0,30.
Pentru a estima ci candidai vor reui dac ei sunt selectai n baza testului de inteligen
folosim tabelul Taylor-Russell. Vom gsi procentul de .66 sau 66%. Deci, diferena este
doar de 6% fa de selecia bazat pe ntmplare. Dac valoarea coeficientului de validitate
ar fi fost 0,50, atunci procentul ar fi fost de 73%, ceea ce nseamn o diferen de 13% fa
de selecia bazat pe ntmplare.

Copyright DEPARTAMENT ID 2008

80

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Tabelul Taylor-Russell pentru rata de baz = 60%


________________________________________________________________________
Rata de selecie
____________________________________________________________
Validitatea
0.5 0,10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 0.95
________________________________________________________________________
.00
.60
.60 .60
.60
.60 .60 .60
.60
.60
.60
.60
.05
.64
.63 .63
.62
.62 .62 .61
.61
.61
.60
.60
.10
.68
.67 .65
.64
.64 .63 .63
.62
.61
.61
.60
.15
.71
.70 .68
.67
.66 .65 .64
.63
.62
.61
.61
.20
.75
.73 .71
.69
.67 .66 .65
.64
.63
.62
.61
.25
.78
.76 .73
.71
.69 .68 .66
.65
.63
.62
.61
.30
.82
.79 .76
.73
.71 .69 .68
.66
.64
.62
.61
.35
.85
.82 .78
.75
.73 .71 .69
.67
.65
.63
.62
.40
.88
.85 .81
.78
.75 .73 .70
.68
.66
.63
.62
.45
.90
.87 .83
.80
.77 .74 .72
.69
.66
.64
.62
.50
.93
.90 .86
.82
.79 .76 .73
.70
.67
.64
.62
.55
.95
.92 .88
.84
.81 .78 .75
.71
.68
.64
.62
.60
.96
.94 .90
.87
.83 .80 .76
.73
.69
.65
.63
.65
.98
.96 .92
.89
.85 .82 .78
.74
.70
.65
.63
.70
.99
.97 .94
.91
.87 .84 .80
.75
.71
.66
.63
.75
.99
.99 .96
.93
.90 .86 .81
.77
.71
.66
.63
.80
1.00 .99 .98
.95
.92 .88 .83
.78
.72
.66
.63
.85
1.00 1.00 .99
.97
.95 .91 .86
.80
.73
.66
.63
.90
1.00 1.00 1.00
.99
.97 .94 .88
.82
.74
.67
.63
.95
1.00 1.00 1.00 1.00
.99 .97 .92
.84
.75
.67
.63
1.00
1.00 1.00 1.00 1.00 1.00 1.00 1.00
.86
.75
.67
.63
Dup cum am afirmat mai nainte, n urma examenului de selecie, este posibil ca unii
candidai, dei valoroi, s nu fie selectai. De aceea, se ridic problema existenei unei
modaliti de estimare a proporiei candidailor declarai admii care vor confirma la criteriu
i procentul celor care ar fi reuit la criteriu dac ar fi fost selectati.
De exemplu (Kaplan, M.R., Saccuzzo, P.D.), s presupunem c un ef de personal la
o companie dorete s selecteze 30 de subieci dintr-un numr de 100 de candidai. Se va
folosi un test cu validitatea = .70. Rata de baz este 60%. Utiliznd tabelul Taylor-Russell
pentru o rat de baz de 60%, vom gsi procentul de .91, ceea ce nseamn c 91% din
candidaii selectai vor reui la criteriu (91% x 30 = 27,3, deci, 27. Apoi, fcnd diferena
(30 27 = 3) rezult c 3 candidai nu vor reui la criteriu.
Dac eful de personal s-a hotrt s angajeze 30 de candidai din 100 prezentati la
concurs, nseamn c nu va angaja 70 dintre ei. Asta nu nseamn, ns, c toi cei respini,
adic toi cei 70 de candidai, dac ar fi fost angajai, ar fi euat la criteriu. Situaia este
reflectat de tabelul de mai jos.
Test
____________________________
Admii
Respini
Total

Copyright DEPARTAMENT ID 2008

81

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Succes

27

33

60

Criteriu
Eec
Total

3
37
40
____________________________
30
70
100

Ce se poate observa din acest tabel ? Din cei 60 de candidai care ar reui la criteriu
sunt selectai, cu ajutorul testului, doar 27, ceea ce nseamn c 33 de candidai, care ar reui
la criteriu, nu sunt selectai. Totui, din cei 40 de candidai, care ar eua la criteriu, 37 au fost
bine diagnosticai. n concluzie, 90% (27/30) dintre candidaii selectai cu ajutorul testului
vor reui la criteriu iar 47% (33/70) dintre cei respini ar fi reuit la criteriu. Procedura
poate fi declarat a fi bun, deoarece procentul celor ce vor reui dintre cei selectai este
mult mai mare.
Teme de reflecie/autoevaluare:
1. Analiznd tabelul Taylor-Russell, ce putem spune despre testele ce au validitatea
mai mare iar rata de selecie este mai mic ? Dar despre testele care au validitatea
mai mic iar rata de selecie este mai mare ?

Intrebri de autoevaluare:
1. Ce reprezint eroarea standard a estimrii (SEE) ?
2. Care este formula de calcul a erorii standard a estimrii ?
3. Ce asemnri i ce deosebiri sunt ntre eroarea standard a msurrii (SEM) i eroarea standard a
estimrii (SEE) ?
4. Cine se ocup de calcularea celor dou forme de erori ?
5. Dai cel puin 2 exemple concrete privind utilizarea valorii lui SEE.
6. Care sunt cele mai importante criterii folosite n selectarea testelor ?
7. Dai cteva exemple de modul n care se pot combina testele ntr-o baterie de teste.
8. De ce trebuie s includem mai multe teste n aciunile de msurare i evaluare psihologic ?
9. Cnd folosim teste psihologice pentru selecia de personal, cte categorii reale de candidai avem
?
10. Ce nseamn rata de detecie a testelor ?
11. Ce nseamn rata acurateei sau a preciziei predictive a testelor ?
12. Care sunt paii parcuri cnd folosim tabelele Taylor-Russell ?
BIBLIOGRAFIE
1. BISHOP, E. (1992). Selection of psychological tests for different purposes:
children, adolescents, and adults. 50th International Convention of ICP, Olanda.
2. COHEN, J.R., SEWRDLIK; E:M: (2005). Psychological Testing and Assessment.
An Introduction to Tests and Measurement. McGraw-Hill International Edition.
3. CLINCIU, A. (2005). Psihodiagnostic. Braov: Ed. Universitii Transilvania.
4. KAPLAN, M. R., SACCUZZO, P.D. (1993). Psychological Testing. Brooks/Cole
Publishing Company.
5. STAN, A. (2003). Testul psihologic. Evoluie, construcie, aplicaii. Iai: Polirom.

Copyright DEPARTAMENT ID 2008

82

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

MODULUL IV
ANALIZA ITEMULUI
Unitatea de nvare 1: Ce este analiza itemului ?
Cuprins:
1. Relaia itemului cu testul
2. Tipuri de analiz a itemului
Obiective
La sfritul acestei uniti de nvare, studenii vor fi
capabili s:
defineasc itemul ca element component al testului;
cunoasc relaia dintre itemi i testul luat ca ntreg;
cunoasc funciile ndeplinite de item n cadrul testului;
evalueze diferite tipuri de analize a itemului

1. Relaia itemului cu testul


Am vorbit destul de mult despre caracteristicile psihometrice ale testelor, respectiv,
despre fidelitate i validitate. Acum vom vedea n ce msur acestea depind de caracteristicile
elementelor componente ale testelor, mai exact ale itemilor. Testul cuprinde un anumit numr
de itemi i urmrete s msoare o anumit nsuire sau o anumit caracteristic psihic.
Obiectivul va fi atins, ns, dac fiecare dintre itemi va urmri i va avea puterea s msoare
aceeai nsuire sau caracteristic psihic.
Sunt i autori care nu folosesc noiunea de item (apud Stan, A., 2002). De exemplu,
David Magnusson, 1975, folosete noiunile de sarcini i analiz de sarcini n loc de itemi i
analiz de itemi. Gustav Lienert (1967) folosete, n cadrul tratatului su o singur dat
noiunea de item.
S presupunem c, n cadrul unui test care conine 25 de itemi, la 5 dintre ei nu
rspunde corect niciun subiect iar la ali 5 dintre ei, rspund corect toi subiecii. Este clar c
cei 10 itemi, dei sunt inclui n structura testului, sunt inutili, n sensul c ei nu contribuie cu
nimic la scoaterea n eviden a diferenelor interindividuale. i dac aceti itemi sunt
neputincioi, atunci lungimea testului (numrul real de itemi) este, n realitate, mai mic cu
10 itemi. i dac reducem lungimea testului (v mai aducei aminte ce se ntmpl ?) va
scdea automat valoarea fidelitii, ct i a validitii. n cazul exemplului nostru este bine ca
itemii foarte dificili i cei foarte uori s fie eliminai din structura testului.
Dar ce este, de fapt, un item ? Cum l putem defini ? n ce relaie se afl el cu testul luat
ca ntreg ? Vom oferi rspunsul la aceste ntrebri, ncepnd cu o definiie. i am preferat
definiia dat de M. Reuchlin, n lucrarea Grand dictionnaire de la psychologie (1992):

Copyright DEPARTAMENT ID 2008

83

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

itemul este un element al unui test, constituind o situaie particular i jucnd rolul unui
stimul la care subiectul nu poate da dect un rspuns dintre dou sau mai multe rspunsuri
teoretice prevzute de test. Ce reiese din aceast definiie ? n primul rnd, faptul c itemul
este o secven, o component a testului, un fel de mintest care are o anumit
individualitate. n al doilea rnd, faptul c itemul apare ca un stimul pentru subiect. n sfrit,
n al treilea rnd, faptul c subiectul ofer un rspuns, care poate fi corect sau nu.
Desigur, legat de formele de rspuns, lucrurile se prezint difereniat n funcie de
categoria testelor. De exemplu, la testele de performan, rspunsul la item poate fi corect
(subiectului i se acord 1 punct) sau incorect (subiectului nu i se acord niciun punct sau
subiectului i se acord 0 puncte). n cazul testelor de personalitate, dac se folosesc scale cu
mai multe variante de rspuns, subiectul poate obine un numr variabil de puncte, adic
obine attea puncte cte sunt acordate treptei de rspuns pe care a ales-o subiectul.
Pentru a fi considerat item o component a testului trebuie s aib individualitate
informaional pertinent, adic s contribuie distinct, clar i conturat, la scorul total al testului
(Stan, A., 2002). Un exemplu oferit de autor, care nu constituie item, este bararea unei litere,
O sau C, la testul de atenie Bourdon-Amfimov.
S-a pus i ntrebarea: ci itemi trebuie s aib un test ? Privind spre practic, putem
ntlni i teste cu mai puini itemi i teste cu foarte muli itemi, cum este cazul chestionarelor
i inventarelor de personalitate care au sute de itemi. Noi ne reamintim faptul c un test este de
ateptat s fie mai fidel i mai valid cu ct are mai muli itemi. Referitor la cel mai mic numr
de itemi pe care poate s-l aib un anumit test, Paul Kline, o autoritate n domeniul
psihodiagnosticului, susine c acesta nu poate fi mai mic de 10. Deci, niciun test i niciun
chestionar nu poate fi acceptat n calitate de instrument psihodiagnostic dac nu are cel puin
10 itemi.
Un alt aspect important este cel legat de modul n care se formuleaz itemii. Sarcina nu
este deloc uoar iar unii autori (DeVellis, 1991) a elaborat un fel de ghid ce cuprinde mai
multe recomandri din care Kaplan, K.R. i Saccuzzo, D. (2005) rein urmtoarele ase:
1. Definii clar ceea ce vrei s msurai. Pentru aceasta utilizai teoria substantivului n
calitate de ghid i ncercai s facei itemii att de specifici ct este posibil;
2. Creai o banc de itemi. Teoretic, toi itemii sunt alei ntmpltor dintr-un univers de
coninut al itemilor. n practic, totui, grija n selectarea i dezvoltarea itemilor este valabil.
Evitai itemii redundani. n fazele iniiale poate dorii s scriei 3 sau 4 variante pentru fiecare
item ce urmeaz a fi utilizat n structura noului test;
3. Evitai, pe ct posibil, itemii cu lungime mare, deoarece acetia sunt buni foarte rar;
4. Meninei nivelul de dificultate al lecturii i nelegerii ct mai potrivit pentru cei care vor
rspunde la test;
5. Evitai itemii cu un caracter echivoc, adic cei care conduc la dou sau mai multe idei n
acelai timp. De exemplu, s ne referim la un item care solicit respondentului s rspund cu
acord sau dezacord la afirmaia Votez democraii deoarece sprijin programe sociale.
Aici sunt, de fapt, dou afirmaii n raport cu care respondentul trebuie s-i exprime acordul:
Votez democraii i Eu sprijin programele sociale;
6. Combinai itemii formulai pozitiv i negativ. Uneori, respondenii dezvolt aa-numitul
set al rspunsului ncuviinat. Aceasta nseamn c respondenii vor tinde s rspund cu
sunt de acord la majoritatea itemilor. Or, pentru a evita o asemenea tendin, trebuie s
includei i itemi care sunt formulai n direcie opus. De exemplu, ntr-un test ce msoar

Copyright DEPARTAMENT ID 2008

84

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

depresia, regsim i itemi formulai pozitiv, de genul M-am simit deprimat dar i itemi
formulai n direcie opus, de genul M-am simit plin de speran privind viitorul.
Teme de reflecie/autoevaluare:
1. Care credei c sunt avantajele i dezavantajele n cazul n care
testul este foarte scurt i n cazul n care testul este foarte lung.
2. La ce categorii de instrumente psihodiagnostice se aplic cel mai
bine ghidul lui DeVellis ?

2. Tipuri de analiz de itemi


Pentru a nelege mai bine ce nseamn analiza itemului vom apela la o comparaie
extrem de util i de interesant oferit de D. Laveault i J. Gregoire, 1997 (apud Stan, A.,
2002). Aceti autori compar analiza itemilor cu repetiia unei orchestre n care instrumentele
trebuie s cnte armonios i s intervin ntr-un mod foarte precis. Totul trebuie s produc o
senzaie muzical aparte corespunznd inteniilor compozitorului i ale dirijorului.
Analiza itemului apare ca fiind necesar atunci cnd construim un test nou i atunci cnd
dorim s facem o nou revizie a unui test care a fost folosit o anumit perioad de timp dar
care d semne c unii itemi nu mai sunt valizi. Analiza itemului presupune o analiz
cantitativ, ct i una calitativ. Cea cantitativ presupune utilizarea unor procedee statistice
pentru calcularea unor indici, precum, de exemplu, indexul dificultii itemului i indexul
discriminrii itemului. Analiza calitativ vizeaz, pe de o parte, coninutul i, pe de alt parte,
formatul itemilor.
Criteriile folosite pentru a selecta itemii depind foarte mult de obiectivele urmrite de
ctre constructorul de test. De exemplu (Cohen, J.R., Swerdlik, E.M., 2005) un constructor de
teste poate considera ca fiind cei mai buni itemi cei care contribuie n mod optim la fidelitatea
intern a testului, n timp ce alt constructor de teste poate dori s proiecteze un nou test cu cea
mai mare valoare posibil a validitii referitoare la criteriu.
Printre mijloacele pe care le poate folosi pentru analiza itemului pot fi menionate
urmtoarele: a) un index al dificultii itemului; b) un index al discriminrii itemului; c) un
index al fidelitii itemului; d) un index al validitii itemului. Noi ne vom ocupa, n capitolele
urmtoare, mai ales de primele dou forme de index.
Analiza calitativ a itemului presupune utilizarea unor variate proceduri nonstatistice
(deoarece nu poate fi vorba despre o abordare numeric) de analiz, dup cum am mai afirmat
i mai sus, a coninutului i formatului. Trebuie gsit cea mai bun formulare a itemului. De
aceea trebuie iniiate cercetri n aceast direcie, n sensul c cei care rspund la un test nou
sunt rugai s rspund la unele ntrebri de genul celor prezentate n tabelul urmtor (Cohen,
J.R., Swerdlik, E.M., 2005):

_____________________________________________________________

Copyright DEPARTAMENT ID 2008

85

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Problema
Exemplu de ntrebare
_____________________________________________________________
Sensilibilitatea cultural
Ai simit c unii itemi au fost discriminatori
n raport cu anumite grupuri de subieci. Dac
da, de ce ?
Validitatea de faad
Pare testul c msoar ceea ce ateptai s
msoare ? Dac nu, ce este contrar ateptrilor ?
Aplicantul testului
V-a afectat n vreun fel conduita aplicantului
testului performanele dvs. ? Dac, da, cum ?
Mediul de aplicare
A afectat n vreun fel condiiile din sala de
testare performana dvs. la test ? Dac da,
cum ?
Corectitudinea testului
Credei c testul este corect n raport cu ceea
este considerat c msoar ? De ce sau de ce
nu ?
Limbajul testului
n raport cu care dintre instruciuni sau alte
aspecte scrise ale testului ai avut dificulti
de nelegere ?
Lungimea testului
Ce ai simit, referitor la lungimea testului, n
privina: a) timpul necesar pentru completare;
b) numrul de itemi ?
Ghicitul rspunsului
Ai ghicit la vreunul dintre itemii testului ?
Care credei c este procentul itemilor la care
ai ghicit ? Ai utilizat o strategie particular
pentru a ghici sau ai ghicit la ntmplare ?
Integritatea subiectului
Credei c s-a putut tria la acest test ? Dac
da, descriei metodele ce credei c au fost
utilizate.
Starea mental i fizic a
Cum ai descrie starea dvs. mental la ncepusubiectului
tul testrii ? Credei c aceast stare a afectat
n vreun fel rezultatele obinute ? Dac da,
cum ? Cum descriei starea dvs. fizic la nceputul testrii ? Credei c aceast stare a afectat n vreun fel rezultatele obinute ? Dac da,
cum ?
Starea mental i fizic a
Cum ai descrie starea dvs. mental pe parcursbiectului
sul testrii ? Credei c aceast stare a afectat
n vreun fel rezultatele obinute ? Dac da,
cum ? Cum ai descrie starea dvs. fizic pe
parcursul testrii ? Credei c aceast stare a
afectat n vreun fel rezultatele obinute ?
Dac da, cum ?
Impresia general a
Care este impresia dvs. general privind acest
subiectului
test ? Ce sugestii ai oferi constructorului de
tes pentru mbunire ?

Copyright DEPARTAMENT ID 2008

86

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Preferinele subiectului

Ai gsit vreuna din prile testului ca avnd


un efect educaional, distractiv sau n alt fel
recompensator ? Ce v-a plcut i ce nu v-a
plcut n mod special la acest test ? Ai gsit
vreuna din prile testului care s provoace
anxietate, condescenden sau s supere n
alt fel ? De ce ?
Pregtirea subiectului
Cum v-ai pregtit pentru acest test ? Dac ar
fi s sftuii pe alii cum s se pregteasc
pentru test, ce i-ai spune ?
_________________________________________________________________
ntrebrile pot fi prezentate fie n oral, fie n scris. n plus, n funcie de obiectivele
urmrite de utilizatorul de test, ntrebrile pot fi prevzute cu mai multe modaliti de rspuns,
cum ar fi, rspuns dihotomic, de tipul Adevrat-fals sau cu mai multe variante de rspuns.
De asemenea, pentru mai mult siguran este recomandabil ca s se asigure confidenialitatea
rspunsurilor subiecilor.
Teme de reflecie/autoevaluare
1. De ce este necesar analiza cantitativ a itemului?
2. De ce este necesar analiza cantitativ a itemului ?

ntrebri de autoevaluare:
1. Ce este, de fapt, itemul unui test ?
2. Ce forme alternative exist pentru itemi i analiza de itemi ?
3. Ce efecte poate avea scurtarea lungimii unui test ?
4. Ce efecte poate avea mrirea dimensiunii testului ?
5. Ci itemi poate avea un test?
6. De cine depinde numrul itemilor ?
7. Cum se poate construi un nou test ?
8. n ce const analiza cantitativ a itemilor ?
9. n ce const analiza calitativ a itemilor ?
10. Ce tipuri de index pot fi calculate ?
11. Cum se poate asigura feed-back-ul pentru constructorul de test referitor
la aspectele calitative ale noului test ?
12. De ce este bine ca, atunci cnd verificm aspectele calitative ale unui
test nou, s pstrm confidenialitatea rspunsurilor ?
BIBLIOGRAFIE:
1. COHEN, J.R., Swerdlik, E.M. (2005). Psychological Tesing and Assessment.An Introduction to Tests
and Measurement. McGraw-Hill International Edition.
2. CLINCIU, A. I. (2005). Psihodiagnostic. Braov: Ed. Universitii Tansilvania.
3. FRIEDENBERG, L. (1995). Psychological testing. Design, Analysis, and use. Allyn & Bacon.
4. KAPLAN, M.R., SACCUZZO, P.D. (2005). Psychological Testing. Principles, Applications, and
Issues. Thomson Wadsworth.
5. MINULESCU, M. (2003). Teorie i practic n psihodiagnoz. Testarea intelectului. Bucureti:
Editura Fundaiei Romnia de Mine.

Copyright DEPARTAMENT ID 2008

87

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

6. STAN, A. (2002). Testul psihologic.Evoluie, construcie, aplicaii. Iai: Polirom.

Copyright DEPARTAMENT ID 2008

88

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Unitatea de nvare nr. 2


Gradul de dificultate al itemului
Cuprins:
1. La ce se refer gradul de dificultate al itemului ?
2. Cum se calculeaz dificultatea itemului
Obiective:
La sfritul acestei uniti de nvare studenii vor fi
capabili s:
explice n ce const gradul de dificultate al unui
item;
cunoasc ce se ntmpl n cazul n care itemii sunt
foarte uori sau foarte dificili;
neleag de ce valoarea cea mai bun a nivelului de
dificultate este p = 0,50;
poat calcula nivelul de dificultate al unui item i,
respectiv, al unui test
1. La ce se refer gradul de dificultate al unui item ?
Trebuie s recunoatem c ntrebarea nu este prea dificil. Un rspuns l putem oferi
imediat, adic se pune problema ct de greu sau ct de uor este itemul pentru subieci. Da,
dar subiecii sunt destul de diferii n ceea ce privete nsuirea sau trstura psihic pe care
vrea s o msoare testul. i testul tocmai asta urmrete i anume, s scoat n eviden
diferenele interindividuale. Un item poate fi dificil datorit faptului c niciunul dintre
subiecii pe care se aplic nu l poate rezolva. Iat, de exemplu, dac ne-am adresa cu un test
unui grup de 100 de studeni la psihologie, din care face parte un item de genul: Ct fac
456.932 x 297465 ? n mod sigur nu va putea rspunde nimeni corect, ceea ce nseamn c
itemul este foarte dificil. n acest caz, p = 0, p nsemnnd procentul celor care rspund la
test. Dar dac, n cadrul testului, exist i un item de genul Ct fac 4 x 2 ? Evident c, n
acest caz, toi studenii vor rspunde correct, deoarece la o asemenea ntrebare rspund
corect i elevi din ciclul primar. Aici p = 100 i asta nseamn c toi subiecii rspund
correct. n ambele cazuri, itemii sunt nefolositori, deoarece ei nu ne ofer niciun fel de
informaie referitoare la deprinderile de calcul ale subiecilor.
S presupunem acum c, n caz de aplicare a testului, avem un item la care rspund
corect doar 10 subieci (caz n care p = 10). Acest item prezint un nivel nalt de dificultate.
i n cazul n care ar rspunde 90 de subieci, itemul ar avea un nivel redus de dificultate.
Dac avem n vedere mijlocul scalei, respectiv, p = 50, cu ct valoarea lui p va crete, cu att
nivelul de dificultate al itemului va scdea i, invers, cu ct valoarea lui p va fi mai mic, cu

Copyright DEPARTAMENT ID 2008

89

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

att nivelul de dificultate al itemului va crete. Deci, ar rezulta, chiar i la o analiz mai
superficial, c valoarea optim a nivelului de dificultate al unui item este 0.50.
Dar pot fi aduse dovezi mai serioase. Astfel, dac la un test aplicat pe 100 de subieci,
reuesc 50 dintre ei, nseamn c, firesc, ceilali 50 nu reuesc. n felul acesta, putem s
comparam pe fiecare subiect din grupul de 50, care au reuit la item, cu fiecare dintre cei
50 de subieci care nu au reuit la item. Avem, astfel, 50 x 50 sau 2500 comparaii perechi
sau bii ai informaiei difereniale (Anastasi, A., 1988). Oricare alt combinaie nu conduce
la o asemenea valoare. Pentru mai mult siguran verificai tabelul de mai jos:
__________________
0 x 100 = 0
10 x 90 = 900
20 x 80 = 1600
30 x 70 = 2100
40 x 60 = 2400
50 x 50 = 2500
60 x 40 = 2400
70 x 30 = 2100
80 x 20 = 1600
90 x 10 = 900
100 x
0 = 0
___________________
Tem de reflecie/autoevaluare
Alctuii un test care s cuprind mai muli itemi, fiecare
dintre ei avnd un nivel de dificultate diferit, dar, pe
ansamblu, nivelul de dificultate al testului s fie 0,50.

2. Cum se calculeaz dificultatea itemului.


Analiznd tabelul de mai sus, am putea trage o concluzie foarte simpl i anume, testul
cel mai bun este cel care este trecut de 50 % dintre subieci, adic fiecare dintre itemii si are
nivelul de dificultate, p = 50. A. Anastasi recomand, ns, ca s fie selectai itemii cu nivele
de dificultate diferite dar a cror medie a dificultii s fie 0,50. Totodat, aceast autoare
vorbete de utilitatea unor scale de interval pentru determinarea nivelului de dificultate al
unui item (Anastasi, A., 1988, 1996).
Dac presupunem o distribuie normal a unei trsturi psihice msurat de un anumit
item, nivelul de dificultate al itemului poate fi exprimat n funcie de o scal cu uniti de
interval egale prin referirea la o tabl a frecvenelor curbei normale. tim c aproximativ
34% din cazuri ntr-o distribuie normal cad ntre medie i distana de 1 n oricare direcie.
Dac, de exemplu, un item a fost trecut de 84% dintre subieci, nseamn c acest procent
cuprinde 50% din partea superioar a distribuiei i 34% din partea inferioar a acesteia.
Deci, n concluzie, acest item cade n 1 sub medie.

Copyright DEPARTAMENT ID 2008

90

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Un item trecut de 16% din cazuri va cdea n 1 deasupra mediei, pentru c, deasupra
acestui punct, exist 16% sin cazuri (50 34 = 16). Iar un item la care au reuit 50% din
cazuri, cade exact pe medie i ar avea, astfel, valoarea 0 pe aceast scal.
Deoarece dificultatea itemului exprimat n funcie de curba normal, ce presupune
deviaia standard ca distan, implic valori negative i zecimale, ele sunt convertite ntr-o
scal uor de mnuit i care este desemnat prin litera greceasc delta . Relaia dintre i
curba normal distanele (valori z) este urmtoarea:
= 13 + 4z
n aceast formul 13 i 4 sunt constante alese pentru a oferi o scal
care s elimine valorile negative i zecimalele.
Un item trecut de aproape 100% din subieci (99,87%), cznd n - 3, ar avea o valoare
a lui = 1 (aa cum reiese din formul: 13 + (4)(-3) = 1)
La cealalt extrem, un item care a fost trecut de mai puin de 1% din subieci (0,13%), ar
cdea n + 3 i ar avea valoarea lui = 25 (aa cum apare din formul: 13 + (4) (3) =
25). i, n sfrit, un item ce ar cdea pe medie va avea valoarea lui = 0 (aa cum reiese
din formul:
13 + (4) (0) = 25.
Se poate trage concluzia c este o scal n care, practic, toi itemii cad, n ceea ce
privete nivelul de dificultate, ntre valorile 1 i 25, cu o medie = 13.
Referitor la calcularea nivelului de dificultate al unui item mai este o problem extrem
de important. La un item se poate rspunde corect i din ntmplare sau, cum se mai spune
mai simplu, ghicind rspunsul. De exemplu, dac la un item se rspunde dihotomic, prin
Da sau Nu, Adevrat sau Fals, subiectul poate ghici 50 % din rspunsurile corecte.
Sau, dac la un item, exist 4 variante de rspuns, printre care i cel correct, subiectul poate
ghici rspunsul corect n procent de 25%.
Nivelul de dificultate optim al itemilor se afl la jumtatea diferenei dintre numrul
maxim de subieci ce rspund correct (100%) i nivelul reuitei bazat numai pe ans
(noroc). Astfel, nivelul optim de dificultate al unui item prevzut cu patru variante de
rspuns, printre care i cel corect este de aproximativ 0,625: Pentru a se ajunge la aceast
valoare, se parcurg urmtorii pai (Kaplan, M.R., Saccuzzo, P.D., 2005):
1. Gsii jumtate din diferena dintre 100% succes i performana pe baz de ans
100 - 0,25
0,75
--------------- = ----- = 0,375
2
2
2. Adugai aceast valoare probabilitii de a obine rspunsul corect pe
baz de ans
0,375 + 0,25 = 0,625
O metod mai simpl pentru obinerea aceluiai rezultat este de a aduga 1,00 la
probabilitatea de a reui pe baz de ans i apoi de a divide la 2. Astfel:
1,00 + 0,25
----------------- = 0,625

Tem de reflecie/autoevaluare:

Copyright DEPARTAMENT ID 2008

91

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Pentru un item exist dou variante de rspuns. Avnd n vedere


probabilitatea de a raspunde corect pe baz de ans, care ar trebui s fie
nivelul de dificultate al acestui item ?

ntrebri de autoevaluare:
1. Ce nseamn c un item este prea dificil ?
2. Ce i se poate imputa unui asemenea item ?
3. Ce nseamn c un item este prea uor ?
4. Ce i se poate imputa unui asemenea item ?
5. Cum se poate pune n eviden nivelul de dificultate al unui item ?
6. Care este valoarea optim a nivelului de dificultate al unui item ?
7. La ce se refer sintagma bii ai informaiei difereniale ?
8. Care este utilitatea unei scale de interval ?
9. Care sunt principalele valori ale unei scale de interval ?
10. Care sunt paii ce trebuie parcuri pentru a calcula exact nivelul de dificultate al unui item ?

BIBLIOGRAFIE:
1. ALBU, M. (1998). Construirea i utilizarea testelor psihologice. Cluj: Editura
Clusium.
2. ALBU, M., PITARIU, H. (1993). Proiectarea testelor de cunotine i examenul
asistat de calculator. Cluj-Napoca: Editura Casa crii de tiin.
3. COHEN, J.R., SWERDLIK, E.M. (2005). Psychological Testing and Assessment.
An Introduction to Tests and Measurement. McGraw-Hill International Edition.
4. CLINCIU, A.I. (2005). Psihodiagnostic. Braov: Ed. Universitii Transilvania
5. FRIEDENBERG, L. (1995). Psychological Testing. Design, Analzsis, and use. Allyn & Bacon.
6. KAPLAN, M.R., SACCUZZO, P.D. (2005). Psychological Testing. Principles, Applications, and
Issues. Thomson Wadsworth.
7. MINULESCU, M. (2003). Teorie i practic n psihodiagnoz. Testarea intelectului. Bucureti:
Editura Fundaiei Romnia de Mine.
8. STAN, A. (2002). Testul psihologic.Evoluie, consatrucie, aplicaii. Iai: Polirom.

Copyright DEPARTAMENT ID 2008

92

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Unitatea de nvare nr. 3


Capacitatea de discriminare a itemului
Cuprins:
1. Ce este analiza discriminrii itemului ?
2. Cum se calculeaz indexul de discriminare al itemului
Obiective:
La sfritul acestei uniti de nvare, studenii vor fi
capabili s:
cunoasc n ce const capacitatea de discriminare a
itemului;
neleag ce legturi exist cu nivelul de dificultate
al itemului;
cunoasc modalitile de calcul a indexului de
discriminare a itemului
poat exemplifica uor
1. Ce este analiza discriminrii itemului ?
Dac nivelul de dificultate al unui item arat ct de uor sau ct de dificil este un item,
nivelul de discriminare arat n ce msur subiecii, care obin rezultate bune la ntregul test,
reuesc i la acest item i, pe de alt parte, n ce msur subiecii, care obin rezultate slabe
la ntregul test, nu reuesc la acest item. Dup cum deja tii, fiecare test msoar o anumit
nsuire sau caracteristic psihic i fiecare item din structura sa trebuie s msoare acelai
lucru. Deci, la subiecii care obin scoruri mari la ntregul test, nseamn c la ei nivelul de
dezvoltare i de funcionalitate al acelei nsuiri sau capaciti psihice este foarte nalt. Iar la
subiecii care obin scoruri mici la ntregul test, acest nivel este sczut. Aceast difereniere
o vor realiza i itemii, deoarece fiecare dintre ei msoar acelai lucru precum testul luat n
ntregul su. Deci, pentru cei care au un nivel ridicat de dezvoltare i de funcionalitate al
unei nsuiri sau capaciti psihice scorurile la ntregul test vor fi mari i ei vor reui, n
general, i la itemii testului. Invers, la subiecii la care nivelul de dezvoltare i de
funcionalitate al aceleiai nsuiri sau capaciti psihice supuse msurrii este redus, vom
regri scoruri slabe la ntregul test i eecuri la itemii ce l alctuiesc. i, dac tot nu s-a
neles, s apelm la o comparaie, care, desigur, este contraindicat. Cntrim o persoan cu
un cntar mare i vedem c are 100 de kg. Apoi l cntrim cu mai multe cntare mici. Vom
constata c persoana respectiv va avea tot 100 de kg. Rugm o alt persoan s accepte s
fie cntrit i constatm c va avea 40 de kg. Apoi, folosind mai multe cntare mici, o s
vedem c persoana respectiv va avea tot 40 de kg. Deci i cntarul mare i cntarele mici
au capacitatea de a discrimina persoanele n funcie de greutate.
Revenind la test, n cazul n care un test este foarte bine construit, subiectul bun,
dotat, va avea un scor mare la test i va reui la toi itemii iar un subiect slab, nedotat, va
avea un scor foarte slab la test i nu va reui aproape la toi itemii. Testul, ns, aa dup
cum am spus de attea ori, prezint anumite imperfeciuni, care, se rsfrng, desigur, i
asupra unor itemi. De aceea, practic, nu ntlnim situaia n care toi subiecii buni s
rspund corect la toi itemii i subiecii slabi s nu rspund corect la niciun item. Pe de alt

Copyright DEPARTAMENT ID 2008

93

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

parte, nici subiecii buni i nici subiecii slabi nu au exact acelai nivel de dezvoltare al
nsuirii sau capacitii psihice supuse msurrii.
De aceea, testul trebuie s evidenieze ct mai exact posibil acest nivel de dezvoltare.
i atunci, subiecii, dei se afl ntr-un anumit registru de dezvoltare al nsuirii sau
capacitii psihice respective (nalt sau sczut), vor trebui s fie i ei difereniai sau, ca s
fim consecveni cu terminologia, discriminai. Aceasta nseamn c cei buni, dar nu
exceleni, vor mai grei la unii itemi i, pe de alt parte, cei slabi, dar nu extrem de slabi, vor
reui la unii itemi. Pot s apar i anumite paradoxuri. Cei foarte buni s nu reueasc la un
anumit item i cei slabi s reueasc la acesta. Putem nelege uor c, n asemenea cazuri,
este ceva n neregul cu itemii respectivi, ceea ce ne oblig la o reevaluare a acestora. Ei nu
pot s rmn aa cum sunt n structura testului, deoarece s-ar putea ca ei s msoare ceva ce
nu are legtur cu testul din care fac parte.
Tem de reflecie/autoevaluare:
Nivelul de dificultate optim al unui item este 0,50. Ce putem spune n
legtur cu capacitatea lui de discriminare?

2. Indexul de discriminare al itemului


n practic exist foarte multe proceduri ce pot fi folosite pentru calcularea indexului de
discriminare al itemului. Cea mai frecvent utilizat este cea care ia n atenie 3 grupe de
subieci, care, la rndul lor, alctuiesc numrul total al subiecilor ce rspund la un test (N):
a) grupul celor care au obinut rspunsuri bune la test; b) grupul celor care au obinut
rspunsuri mediocre la test; c) grupul celor care au obinut rezultate slabe la test. Primul
grup poate fi notat cu U (de la Upper), al doilea, cu M (de la Middle) i, al treilea, cu L (de
la Lower). Dup ali autori, ns, este suficient s lum n atenie numai grupul subiecilor
care au rspuns mai bine la test (U) i grupul subiecilor care au obinut rezultate slabe la test
(L). n acest caz se vorbete de metoda grupelor extreme (Friedenberg, L., 1995) i ea este
utilizat cel mai frecvent pe testele de abiliti, testele de personalitate, testele de interese i
testele de atitudini.
S lum, mai nti, un exemplu oferit de A. Anastasi (1988, 1996). n urma aplicrii
unui test unui grup de 60 de studeni, i mprim, n funcie de rezultate, n cele 3 grupuri,
fiecare cuprinznd cte 20 de studeni, respectiv, 33%. (Trebuie s menionm, n aceast
parantez c, dup ali autori, procentul subiecilor ce aparin grupelor U i L poate fi 25%
sau 27%. n aceast privin, n 1979, Allen, M.J. i Yen W.M., apud, Cohen, J.R., Swerdlik,
E.M., 2005, ne asigur c, pentru cele mai multe aplicaii, orice procentaj ntre 25 i 27 va
produce estimri similare). Apoi nregistrm rspunsurile corecte pentru fiecare item oferite
de ctre studenii ce aparin celor trei grupe. Se alctuiete un tabel n felul urmtor:
Item

1
2

15
20

9
20

7
16

Copyright DEPARTAMENT ID 2008

Dificultate
U+M+L
31
56*

94

Discriminare
U - L
8
4

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

3
4
5
6
7

19
10
11
16
5

18
11
13
14
0

9
16
11
9
0

46
37
35
39
5*

10
- 6*
0*
7
5

n acest tabel sunt prezentate rezultatele pentru numai 7 itemi din cadrul testului. Dup
cum se poate observa, nivelul de dificultate al itemului se afl nsumnd numrul subiecilor
din cele 3 grupe care rspund corect la toi itemii. Pe de alt parte, valoarea discriminativ a
fiecrui item poate fi aflat fcnd diferena dintre numrul subiecilor care rspund corect
n grupul U i numrul subiecilor care rspund corect n grupul L. Itemii ce prezint
probleme sunt cei care sunt prevzui cu stelu. Astfel, itemii 2 i 7 fac not discordant
fa de ceilali itemi, n sensul c itemul 2 este prea uor (56 de subieci rspund corect) iar
itemul 7 este prea greu (numai 5 subieci rspund corect).
n ultima coloan itemii 4 i 5 prezint probleme, n sensul c, dei satisfctori n
ceea ce privete nivelul de dificultate, itemul 4 prezint o valoare discriminativ negativ
iar itemul 5 prezint o valoare discriminativ egal cu zero. Aceti itemi nu pot s rmn
aa n structura testului existent sau nou construit, deoarece ei, practic, nu prezint niciun fel
de utilitate. Este clar c trebuie s fie supui unor serioase aciuni de analiz i evaluare sau,
pur i simplu, pot fi scoi definitiv din componena testului.
A. Anastasi arat c, n cazul n care numrul subiecilor care reuesc la fiecare item
din grupele U i L este exprimat n procente, indexul discriminrii poate fi calculat prin
diferena dintre cele dou procentaje, precum n tabelul urmtor:
Item
1
2
3
4
5
6
7

Procent reuit
U grup

Procent reuit
L grup

75
100
95
50
55
80
25

35
80
45
80
55
45
0

Indicele
discriminrii
U - L
40
20
50
- 30*
0*
35
25

Dup cum se poate observa din tabel, aceeai itemi prezint probleme, respectiv
itemii 4 i 5. Acetia trebuie s fie renalizai pentru a se vedea dac mai rmn n structura
testului. Deci i n cazul procentajului diferena dintre U i L constituie valoarea indexului
discriminrii pentru fiecare item. Acesta poate fi evideniat n mai multe forme, precum: UL, ULI, ULD, D sau d.
Analiznd datele din ambele tabele de mai sus, constatm c, n afar de itemii care
ridic probleme privind valoarea lor discriminativ, pentru ceilali itemi valorile sunt
diferite, de aceea apare ntrebarea care dintre ele este cea mai bun ? Referitor la metoda
utilizrii procentajelor, R.L. Ebel (apud Stan, A., 2002) a propus, n 1965, o scal de repere
pentru interpretarea valoric a indicelui de discriminare D:
___________________________________________________________

Copyright DEPARTAMENT ID 2008

95

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Interval valoric al lui D


Interpretarea discriminrii
___________________________________________________________
0,40 i mai mult
discriminare foarte bun
de la 0,30 la 0,39
discriminare bun
de la 0,20 la 0,29
discriminare slab
de la 0,10 la 0,19
discriminare de limit
sub 0,10
fr utilitate
___________________________________________________________
Atunci, ns, cnd se folosete metoda efecturii diferenei dintre numrul
rspunsurilor corecte oferite de subiecii ce aparin celor dou grupe, unii autori (Anastasi,
A., 1988, 1996) fac urmtoarele precizri: a) itemii cu valoare discriminativ sczut sunt
cei care au o valoare a diferenei de la 3 n jos (diferena dintre U i L) i asta cnd grupurile
comparate au aceeai dimensiune; b) cu ct grupurile sunt mai mari, ne ateptm ca s apar
diferene mai mari, datorate ansei legate de un item nediscriminativ.
Pentru a nelege i mai bine utilitatea calculrii valorii indexului discriminrii
itemului vom lua i un alt exemplu (Cohen, J.R., Sewrdlik, E.M., 2005). A fost aplicat un
test de cunotine pe un numr de 119 studeni. n urma rezultatelor obinute au fost alctuite
cele dou grupe, U i L, fiecare dintre ele cuprinznd 27%, respectiv, 32 de studeni. O
secven viznd primii 5 itemi este prezentat n tabelul de mai jos.
Item
U
L
UL
n
d = U - L/n
_____________________________________________________
1
20
16
4
32
0,13
2
30
10
20
32
0,63
3
32
0
32
32
1,00
4
20
20
0
32
0,00
5
0
32
-32
32
- 1.00
_____________________________________________________
n primul rnd trebuie menionat faptul c valoarea indicelui discriminprii testului se
ntinde ntre 1,00 i + 1,00. Valoarea de 1,00 indic faptul c toi subiecii ce aparin
grupului U nu reuesc la test i toi subiecii care aparin grupului L reuesc la test. Este o
situaie paradoxal ce solicit de urgen revizia sau eliminarea itemului din cadrul testului.
Valoarea de + 1,00 arat c toi subiecii ce aparin grupului U reuesc la test i toi subiecii
care aparin grupului U nu reuesc la test. Cnd o aceeai proporie a reuitei o regsim la
ambele grupe (U i L) valoarea discriminativ a testului este egal cu zero. n acest caz
itemul nu discrimineaz deloc ntre subieci, de aceea este inutil.
Din aceste exemple reiese clar faptul c exist o strns legtur ntre nivelul de
dificultate al itemului i capacitatea lui de discriminare. A. Anastasi (1988, 1996), ne ofer
un tabel care evideniaz relaia dintre nivelul de dificultate al itemului i valoarea maxim a
indexului discriminrii.
___________________________________________________
Procentul subiecilor
Valoarea maxim
ce reuesc la item
a lui D
____________________________________________________

Copyright DEPARTAMENT ID 2008

96

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

100
0
90
20
80
40
70
60
60
80
50
100
40
80
30
60
20
40
10
20
0
0
_____________________________________________________
Cum de apar asemenea valori ale lui D ? Cnd toi subiecii din grupul U reuesc la
item (50/50 = 100%) i toi subiecii din grupul L reuesc la acest item (0/50 = 0), atunci
valoarea lui D (U L) = 0. Cnd niciun subiect din grupul U (0/50 = 0) i niciun subiect din
grupul L (0/50 = L) nu reuete la un item, atunci valoarea lui D este tot 0. Cnd toi
subiecii din grupul U (50/50 = 100%) i niciun subiect din grupul L (0/50 = 0 %) atunci
valoarea lui D = 100. i aceasta este cea mai mare valoare a lui D. Dac reuesc la item 90
% din subieci, asta nseamn c au reuit toi din grupul U (50/50 = 100%) i 40 din grupul
L (40/50 = 80%). n consecin, valoarea lui D (U L) va fi 20. Dac reuesc la item 80%
din subieci, asta nseamn c toi subiecii din grupul U (50/50 = 100%) i numai 30 (30/50
= 60) din grupul L reuesc la item. Fcnd diferena vom constata c valoarea lui D = 40.
.a.m.d.
Teme de reflecie/autoevaluare:
1. Care este explicaia situaiei n care valoarea lui D (indicele de discriminare
al itemului) este negativ ?
2. De ce itemul al crui nivel de dificultate este 0,50 are cea mai mare valoare
a indicelui de discriminare ?

ntrebri de autoevaluare:
1. Ce este analiza discriminrii itemului ?
2. Ce proceduri de calculare a indexului discriminrii cunoatei ?
3. Care este procedura recomandat de A. Anastasi ?
4. n ce const metoda grupurilor extreme ?
5. Care este procentul subiecilor din grupurile U i L recomandat de autori ?
6. Ce trebuie fcut cu itemii ai cror valoare discriminativ este foarte sczut ?
7. Care sunt simbolurile recomandate pentru indexul discriminrii itemului ?
8. Care este opinia lui R.L. Ebel privind intervalul valoric al lui D ?
9. Dar a lui A. Anastasi ?
10. Explicai ce se ntmpl atunci cnd valoarea lui D este 1,00 i + 1,00
BIBLIOGRAFIE:

Copyright DEPARTAMENT ID 2008

97

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

1. ALBU, M. (1998). Construirea i utilizarea testelor psihologice. Cluj: Editura


Clusium.
2. ALBU, M., PITARIU, H. (1993). Proiectarea testelor de cunotine i
examenul asistat de calculator. Cluj-Napoca: Editura Casa crii de tiin.
3. COHEN, J.R., SWERDLIK, E.M. (2005). Psychological Testing and Assessment.
An Introduction to Tests and Measurement. McGraw-Hill International Edition.
4. CLINCIU, A.I. (2005). Psihodiagnostic. Braov: Ed. Universitii Transilvania
5. FRIEDENBERG, L. (1995). Psychological Testing. Design, Analysis, and use.
Allyn & Bacon.
6. KAPLAN, M.R., SACCUZZO, P.D. (2005). Psychological Testing. Principles,
Applications, and Issues. Thomson Wadsworth.
7. MINULESCU, M. (2003). Teorie i practic n psihodiagnoz. Testarea intelectului. Bucureti:
Editura Fundaiei Romnia de Mine.
9. STAN, A. (2002). Testul psihologic.Evoluie, consatrucie, aplicaii. Iai: Polirom.

Copyright DEPARTAMENT ID 2008

98

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

MODULUL V
ETALONAREA I STANDARDIZAREA TESTELOR
Unitatea de nvare nr. 1
Etapele etalonrii i standardizrii testelor
Cuprins:
1. Definirea conceptelor i etapele construirii testelor
2. Modele de scale utilizate n etalonare i standardizare

1.
conceptelor

Obiective:
La sfritul acestei uniti de nvare studenii vor fi
capabili s:
defineasc corect concepte precum: construcia testului,
etalonare, standardizare;
precizeze care sunt etapele parcurse n vederea etalonrii
unor noi teste;
difereneze ntre aciunea de etalonare i cea de reetalonare a testelor;
neleag bine ce nseamn
reprezentaivitatea
eantionului.

Definirea

De ce trebuie s fie
testele etalonate i
standardizate ? S presupunem c vom construi un nou test de inteligen pentru studenii
din Romnia i numai un singur student nu l includem n lot. Toate rezultatele obinute le
vom grupa n mai multe clase sau categorii, plecnd de la cele mai bune i ajungnd la cele
mai slabe. Desigur, vor exista muli studeni care vor obine acelai rezultat, de aceea trebuie
s lum n consideraie i frecvena rspunsurilor. Deci se face un fel de clasament, pe
primele locuri fiind rezultatele cele mai bune i, pe ultimile locuri, rezultatele cele mai slabe.
Singurului subiect care nu a fost inclus n lot i aplicm noul test de inteligen creat i, apoi,
rezultatul pe care l obine l raportm la clasamentul rezultatelor obinute de toi subiecii
inclui n lot. Vom vedea dac studentul respectiv se plaseaz pe o poziie mai spre vrful
clasamentului, mai spre mijloc sau mai spre baza acestuia. Deci comparm rezultatul
subiectului cu rezultatele ntregului lot.
Pornind de la acest exemplu, trebuie s deosebim ntre situaia n care un test deja
exist i cea n care se construiete un test nou. Pentru testul deja existent nu se pune
problema etalonrii lui, presupunnd c exist un etalon, ci, eventual, a reetalonrii lui, n
cazul n care etalonul nu mai corespunde. De asemenea, dac testul provine din alt ar,
dei el are un etalon (n limba englez se folosete termenul de norme norms - n loc de
etalon), trebuie s fie re-etalonat, trecnd, mai nti, prin faza traducerii i adaptrii. De aici
putem trage concluzia conform creia construirea unui test nou presupune automat i
etalonarea lui ns etalonarea nu presupune automat i construirea testului, deoarece acesta
poate exista deja (construit de alii) sau este luat din alt parte.

Copyright DEPARTAMENT ID 2008

99

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

O alt noiune care trebuie s o lum n atenie este cea de revizie a testelor. Mai nti,
s dm exemple. Bateria Stanford-Binet, care actualmente, este folosit sub denumirea de
Stanford-Binet Intelligence Scale (fifth edition) a trecut prin urmtoarele etape de revizuire:
1905 Scala de inteligen a lui A. Binet i T. Simon; 1908 prima revizie a Scalei de
inteligen Binet-Simon; 1911 a doua revizie a Scalei de inteligen Binet-Simon; 1916
apare versiunea Stanford-Binet Intelligence Scale, sub ngrijirea lui L. Terman; 1937
prima revizie a variantei lui Terman; 1960 a doua revizie; 1972 - a treia revizie; 1985 a
patra revizie (sub ndrumarea lui R.L. Thorndike, E. Hagen i J. Sattler); 2003 a cincea
revizie, sub ndrumarea lui G. Roid. Bateria WAIS III, respectiv, Scala de inteligen a lui
Wechsler pentru aduli a parcurs, de asemenea, mai multe etape de revizie. Prima variant a
aprut n anul 1939, sub denumirea Wechsler-Bellevue Intelligence Scale I. A doua a aprut
n 1942, sub denumirea de The Army Wechsler iar a treia, n 1946, sub denumirea Wechsler
Bellvue Intelligence Scale II. n 1955 apare, de fapt, prima variant a Scalei Wechsler de
inteligen pentru aduli (WAIS). Aceast variant este revizuit n 1981, devenind, WAIS R i, apoi, din nou, n 1997, variant care exist i n prezent, cunoscut sub denumirea
WAIS III (Scala de inteligen Wechsler pentru aduli III).
Revizia este o aciune foarte ampl, care poate dura mult timp (de exemplu, revizia
Bateriei Stanford-Binet, fourth edition, a durat ntre 6 i 8 ani) i ea presupune re-analizarea
i re-evaluarea testului din mai multe puncte de vedere: coninut, norme, direcii de
administrare i cotare etc. Prile testului care sunt mai sensibile la schimbare sunt cele ce
presupun folosirea limbajului. Un test preluat din America, de exemplu, trebuie tradus i
adaptat, deoarece acesta poate cuprinde informaii care nu sunt specifice i nu sunt
cunoscute de ctre populaia romneasc. Astfel, sunt unele aspecte legate de istorie, de
literatur, de obiceiuri, de tradiii, de preocupri etc. De exemplu, fotbalul american este un
sport foarte dur, foarte agresiv fa de fotbalul european. Deci, rspunsul pozitiv la
ntrebarea i place fotbalul ? nseamn cu totul altceva pentru un subiect romn dect
pentru un subiect american. Sau dac unii itemi presupun operarea cu sistemul de msurare
american, pentru subiecii romni trebuie neaprat s fie transpus n sistemul de msurare
folosit n Romnia.
La ntrebarea Cnd se impune revizuirea unui test ? putem apela la sugestiile
fcute de Asociaia Psihologilor Americani APA (1996, Standard 3.18): un test poate fi
meninut n forma actual atta timp ct este folositor i el trebuie s fie revizuit atunci
cnd apar schimbri semnificative n domeniul reprezentat sau cnd condiiile noi pentru
utilizare i interpretare fac testul s fie nepotrivit pentru ceea ce intenioneaz s msoare.
n opinia altor autori ns, testele trebuie s fie revizuite atunci cnd exist oricare din
urmtoarele condiii (Cohen, R.J., Swerdlik, E.M., 2005):
1. Materialele stimul par a fi demodate i subiecii nu se pot raporta la ele;
2. Coninutul verbal al testului, incluznd instruciunile pentru administrare i itemii
testului, conin un vocabular depit, care nu este imediat neles de ctre subieci;
3. ntruct cultura popular se schimb i cuvintele capt noi nelesuri, anumite cuvinte sau
expresii din coninutul itemilor sau din direciile de administrare pot fi percepute ca
nepotrivite sau chiar ofensatorii pentru un anumit grup particular, de aceea ele trebuie s fie
schimbate;
4. Normele testului nu mai sunt adecvate datorit schimbrilor n populaia subiecilor
poteniali;

Copyright DEPARTAMENT ID 2008

100

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

5. Normele testului nu mai sunt adecvate datorit schimbrilor pe linia abilitilor msurate
i datorit extinderii lor (n sus sau n jos) dac acest lucru devine necesar;
6. Fidelitatea sau validitatea testului, precum i eficacitatea itemilor individuali, pot fi
semnificativ mbuntite printr-o revizie.
7. Teoria ce a stat la baza testului original a fost mbuntit semnificativ i schimbrile
trebuie s fie reflectate n design-ul i coninutul testului.
Privitor la elaborarea i construirea unui test nou, trebuie s precizm faptul c este
obligatoriu s fie parcurse mai multe etape:
1. Analiza ct mai corect, ct mai clar a constructului, a nsuirii sau caracteristicii psihice
care urmeaz a fi testat cu instrumentul psihodiagnostic nou. Trebuie definit foarte clar
conceptul i, apoi, operaionalizat, adic descris din perspectiv comportamental, actele
comportamentale fiind evaluabile i msurabile. Trebuie rspuns, ct mai clar, la ntrebri de
genul: - ce nseamn a fi sau a nu fi inteligent ? ce nseamn a fi sau a nu fi anxios ? ce
nseamn a avea sa a nu avea memorie logic ? ce nseamn a fi sau a nu fi sociabil ?
Am mai vorbit despre asta, dac v mai amintii, la validitatea privitoare la construct.
2. Imaginarea modalitilor de simulare a situaiilor reale n raport cu care subiectul i
exteriorizeaz i i obiectiveaz capacitile, trsturile sale psihice. n aceast privin, un
rol foarte important l are imaginaia constructorului de test. El trebuie s dea dovad de
inventivitate i ingeniozitate. Uneori testele impresioneaz prin forma extrem de original a
itemilor, ns numai aceasta nu asigur automat i o bun fidelitate i validitate a testului. De
aceea, constructorul de test nu trebuie s acorde mai mare importan formei itemilor, n
detrimentul caracteristicilor psihometrice ale testelor.
Elaborarea testului presupune, de altfel, respectarea mai multor cerine i anume:
a) alegerea, selectarea materialului utilizat n cadrul testului (cuvinte, propoziii, numere,
figuri, expresii, cuburi, analogii, situaii problematice, ntrebri, evaluri, autoevaluri etc.);
b) formularea instructajului i a exemplelor pentru familiarizarea subiecilor cu principiul de
construcie al itemilor testului;
c) precizarea tipului de rspuns (un singur rspuns, mai multe rspunsuri la alegere, sarcin
de executat, rezolvarea problemei, exerciiu logic etc.;
d) elaborarea foii de rspuns, care trebuie s fie folosit numai n form original;
e) precizarea modului de cotare (puncte, procente, calificative), precum i a grilelor ce pot fi
folosite;
f) precizarea, dac este necesar, a timpului ct s dureze testarea, precum i a faptului dac
este vorba despre un test individual sau test colectiv;
3. Odat construit, testul nou se aplic n forma unei probe oarbe pe un eantion mai mic,
deoarece este o prim verificare a acestuia. Se acord atenie unor probleme precum: nivelul
de dificultate al itemilor, capacitatea lor de discriminare, dimensiunea testului, dac este
bine formulat i dac este suficient instructajul, reaciile subiectului la test etc.). n funcie de
rezultate, se fac modificrile necesare;
4. Etalonarea, etap ce vizeaz utilizarea unui ansamblu de procedee statistice pe baza crora
pot fi difereniai i clasificai subiecii inclui n eantionul folosit n funcie de rezultatele
lor obinute la un anumit test. n urma unor calcule statistice (trebuie s recunoatem c,
actualmente, acestea se pot realiza uor folosind calculatorul) rezultatele obinute de
membrii eantionului sunt grupate n forma unor norme sau etaloane, care, ulterior, sunt
folosite drept cadre de referin la care raportm rezultatele unui anumit subiect.

Copyright DEPARTAMENT ID 2008

101

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

n alegerea eantionului trebuie s respectm cteva cerine obligatorii, mai


importante fiind dou:
a) reprezentativitatea eantionului; un eantion este reprezentativ atunci cnd el reflect fidel
caracteristicile populaiei de referin. Fiecare membru al eantionului reprezint un subgrup
din populaia de referin. Procedeele de selectare a eantionului sunt mai multe, cum ar fi,
de exemplu, pasul statistic, alegerea la ntmplare etc. Deci eantionul este o fraciune din
populaia de referin. De exemplu, dac noi construim un test de inteligen pentru elevii de
liceu (populaia de referin), putem s-l aplicm n vederea elaborrii normelor (etalonului)
pe un grup mult mai restrns (eantionul), care ns trebuie s fie reprezentativ pentru toat
populaia de referin. Dac numrul real al elevilor de liceu este 1.000.000, eantionul
reprezentativ, stabilit n baza pasului statistic (1/1000), ar cuprinde 1000 de elevi. Este ca i
cum am realiza o coloan de 1.000.000 de elevi i apoi i selectm pe cei de pe poziiile 1,
1001, 2001, 3001, 4001 .a.m.d. Fiecare membru al eantionului reprezint cte 1000 de
elevi din populaia de referin;
b) eantionul trebuie s fie eterogen n ceea ce privete nsuirea sau caracteristica psihic
msurat i, pe de alt parte, s fie ct mai omogen posibil referitor la alte variabile, n afara
celei testate, cum ar fi: vrsta, sexul, pregtire socio-profesional, nivel socio-cultural etc.
Revenind la exemplul de mai sus, eantionul ar trebui s cuprind 500 de fete i 500 de
biei, cte 250 de elevi pentru fiecare an al ciclului liceal i, de asemenea, membrii
eantionului trebuie s provin din toate profilele liceelor din ar.

Teme de reflecie/ autoevaluare:


1. Care ar fi consecinele, n cazul n care eantionul ar cuprinde elevii
numai dintr-o anumit zon geografic a rii ?
2. Care ar fi consecinele, n cazul n care eantionul ar cuprinde elevi
numai de la un anumit profil liceal ?
2. Modele de scale folosite n etalonare i standardizare
Cotele brute (raw score) nu spun nimic n sine, cel mult ele pot fi raportate la media
grupului de referin. Notele la tez la un anumit obiect de nvmnt la o anumit clas
aparin practic, tuturor nivelelor, adic vor fi de la 4 (notele sub 4 nseamn acelai lucru,
adic tot czut) la 10. La fel se vor ntmpla lucrurile i la o alt clas, de la un liceu dintr-o
alt localitate. Vom putea spune c, n interiorul acestei clase, elevul Ionescu a obinut o
not mai mare dect elevul Popescu (primul a obinut 9 i al doilea, 7). n cealalt clas, va
fi, de asemenea, un elev, s-i spunem Albu, care va obine nota 9 i un alt elev, Vasiliu, care
va obine nota 7. Avnd n vedere notele obinute, elevul Ionescu este echivalent cu elevul
Albu i elevul Popescu este echivalent cu elevul Vasiliu. Referior la achiziiile realizate de
elevi respectivi nu este obligatoriu ca notele obinute s le reflecte n mod corect. n cazul n
care am avea un test de achiziie standardizat i l-am aplica pe elevii notri nu este exclus ca
s apar situaii care ni s-ar prea paradoxale, respectiv, elevii cu bote mai mici la teze s se
plaseze pe poziii mai bune n ceea ce privete rezultatele la testul standardizat dect elevii

Copyright DEPARTAMENT ID 2008

102

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

care au obinut note mari la tez. Pe de alt parte, dei notele la tez au fost identice pentru
doi elevi, n urma aplicrii testului standardizat s-ar putea s nu mai rmn niciun fel de
echivalen.
Din acest exemplu reiese clar necesitatea construirii unor teste care trebuie s efie
etalonate i standardizate. n procesul etalonrii, cotele brute sunt transformate n valori
numerice, acestea permind raportarea scorului individual al unui subiect, obinut n urma
aplicrii testului, la gruparea sau distribuirea rezultatelor obinute de eantion.
Etalonarea presupune, n principiu, dou operaii (Radu, I., 1991):
a) alctuirea sistemuluide norme sau a tabelului de norme pentru grupul de referin sau
eantionul de subieci (gruparea sau distribuirea n clase a cotelor brute);
b) alctuirea unui sistem de notare standard n care se convertesc cotele brute ale testului.
n practica psihodiagnostic ntlnim mai ales dou categorii de cote transformate,
respectiv:
a) cote exprimate, la rndul lor, n decile, centile i cuartile;
b) cote standardizate, cele care se bazeaz pe abaterea standard.
Prezentm, mai nti, prima categorie de cote transformate.
Sistemul decilajului presupune mprirea scorurilor sau a datelor brute n 10 grupe
sau clase, fiecare dintre ele cuprinznd 10% din efectivul total de subieci, exprimat, de
regul, prin litera N. Deci, dac numrul total al subiecilor inclui n eantion este de 1000,
o decil va cuprinde 10%, respectiv, 100 de subieci.
Sistemul centilajului, extrem de asemntor cu sistemul decilajului, presupune
mprirea n 100 de grupe sau clase, fiecare cuprinznd 1% din efectivul total al subiecilor
ce au fost inclui n eantion (N). Este de la sine neles c acest sistem se poate aplica n
cazul n care valoarea lui N este foarte mare.
Sistemul cuartilelor presupune mprirea n 4 clase sau 4 cuartile, fiecare din ele
cuprinznd 25% din N, deci din efectivul total al eantionului. Cele 4 cvartile sunt
urmtoarele (M = 50% din N):
a) cuartilul superior;
b) cuartilul mediu superior
c) cuartilul mediu inferior
d) cuartilul inferior
Folosirea tuturor celor 3 sisteme presupune parcurgerea unor etape asemntoare,
respectiv:
1. aplicarea testului pe ntreg eantionul (N);
2. ordonarea scorurilor sau rezultatelor, de la valoarea cea mai mare sau cea mai mic a
performanelor;
3. stabilirea frecvenelor, adic a numrului de subieci care obin aceeai performan (fa);
4. stabilirea frecvenelor cumulate sau nsumate (fc), nct fc = N.
Vom ncerca s exemplificm folosind rezultatele obinute la testul Raven Standard,
aplicat pe 448 de candidai de la un examen de admitere (Clinciu, A.I., 2005). Rezultatele
obinute sunt incluse, mai nti, n tabelul de mai jos:
x 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
fa 0 0 1 0 1 3 0 0 1 0 1 0 0 1 0 3 1
fc 0 0 1 1 2 5 5 5 6 6 7 7 7 8 8 11 12

Copyright DEPARTAMENT ID 2008

103

35
2
14

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

x
fa
fc

36
3
17

37
4
21

38
7
28

39
3
31

40
2
33

41
11
44

42
12
56

43
15
71

44
18
89

45
24
113

x
fa
fc

46
20
133

47
28
161

48
28
189

49
36
225

50
37
262

51
32
294

52
29
323

53
35
358

54
23
381

55
28
404

x
fa
fc

56
22
426

57
13
439

58
4
443

59
5
448

60
0
448

Vom proceda, n continuare, folosind rezultatele incluse n acest tabel, la alctuirea


etaloanelor n cuartile i decile (etalonul n centile, aa dup cum am mai precizat, este
foarte asemntor cu etalonul n decile.
Etalonul n cuartile. Fiecare cuartil cuprinde 25% din N. Deci primul cuartil (cel
inferior) are naintea sa 25% din subieci, adic 112 (448 x 25/100). Cutm pe irul
frecvenelor cumulate (fc) cea mai apropiat valoare de 112. Aceasta corespunde cotei brute
x = 45. n consecin, acest cuartil va cuprinde valorile lui x de la 0 la 45. Cuartilul 2
(mediu inferior) mparte pe din dou efectivul, deci are naintea sa 50% din efectivul
subiecilor (N), adic 224 (448 x 50/100). Valoarea cea mai apropiat de aceasta este 225 i
ea corespunde cotei brute = 49. Drept urmare, cuartilul 2 va cuprinde valorile lui x ntre 46
i 49. Cuartilul 3 (mediu superior) are naintea sa 75% din N, adic 336 (448 x 75/100).
Valoarea cea mai apropiat este 353 i ea corespunde cotei brute = 53. Deci cuartilul 3 va
cuprinde valorile lui x ntre 50 i 53 . n sfrit, prin diferen, cuartiul 4 x ntre 54 i 60.
Finalmente, etalonul n patru clase (sau cuartile) va arta n felul urmtor:
Cuartilul
Cuartilul 1
Cuartilul 2
Cuartilul 3
Cuartilul 4

Procente
Teoretice
Cumulate
25
25
25
50
25
75
25
100

Clase
0 - 45
46 - 49
50 - 53
54 - 60

Etalonul n decile. Vor fi folosite tot datele rezultate n urma aplicrii testului
Raven. Primul decil are 10 % din N naintea sa, deci, 44,8 (448 x 10/100). n urma
rotunjirii, se obine 45. Cutnd pe irul frecvenelor cumulate vom gsi valoarea cea mai
apropiat, care este 44 i care corespunde cotei brute, respectiv, valorii lui x = 41. Asta
nseamn c primul decil va cuprinde valori ale lui x ntre 0 i 41. Al doilea decil are 20%
din efectivul total al subiecilor (N) naintea sa, ceea ce nseamn 89,6 (448 x 20/100) i
rotunjit, 90. Urmrind pe irul frecvenelor cumulate, vom vedea c valoarea cea mai
apropiat este 89 i ei i corespunde o valoare a lui x = 44. deci, al doilea decil va cuprinde
valori ale lui x ntre 42 i 44. Aa se procedeaz i pentru celelalte decile iar, n final,
etalonul n decile va arta n felul urmtor:

Copyright DEPARTAMENT ID 2008

104

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Decilul
1
2
3
4
5
6
7
8
9
10

Clase
0 - 41
42 - 44
45 - 46
47 - 48
49
50
51 - 52
53
54 - 55
56 - 60

Procente
Teoretice
Cumulate
10
10
10
20
10
30
10
40
10
50
10
60
10
70
10
80
10
90
10
100

Al doilea sistem de cote transformate presupune cotele standardizate (Radu, I., 1991),
care nseamn tot mprirea n clase dar clase normalizate. Este vorba tot de un calcul
procentual, ns efectivul total al eantionului nu se mparte n clase sucesive egale (10%,
20% etc.), ci n clase care cuprind procente conturate plecnd de la frecvenele distribuiei
normale. Regula este ca numrul claselor s fie un numr impar: 5, 7, sau 9 clase, procentele
fiind, desigur, diferite de la un sistem la altul i anume:
a) pentru 5 clase: 6,7%; 24,2%; 38,2%; 24,2%; 6,7%;
b) pentru 7 clase: 4,8%; 11,1%; 21,2%; 25,8%; 21,2%; 11,1%; 4,8%;
c) pentru 9 clase: 4,0%; 6,6%; 12,1%; 17,5%; 19,6%; 17,5%; 12,1%; 6,6%; 4,0%.
n practic sistemul stanine este cel mai des folosit, de aceea l vom prezenta i noi
mai n detaliu. Vom face trimitere tot la rezultatele obinute n urma aplicrii testului Raven
(Clinciu, A., 2005).
Stanina 1 are sub ea 4% din efectiv, deci 17,92 (448 x 4/100), deci, rotunjit, 18.
Cutnd pe irul frecvenelor cumulate vom constata c valoarea cea mai apropiat este 17 i
acesteia i corespunde cota brut (valoarea lui x) = 36. Stanina 2 are naintea ei 10,6
procente din efectiv (4,0% + 6,6%), adic 47,468 (448 x 10,6), ceea ce nseamn, rotunjit,
47. Cutnd pe irul frecveelor cumulate, constatm c cea mai apropiat valoare este 44,
creia i corespunde cota brut = 41. Stanina 3 are naintea sa 22,7 procente din efectiv
(10,6 + 12,1), adic 101,696 (448 x 22,7/100) i, deci, rotunjit, 102. Cutnd pe irul
frecveelor cumulate, constatm c cea mai apropiat valoare este 113, creia i corespunde
cota brut = 45. .a.m.d. n final, etalonul va arta n felul urmtor:
Stanina
1
2
3
4
5
6
7
8
9

Copyright DEPARTAMENT ID 2008

Clase
0 - 36
37 - 41
42 - 45
46 - 48
49 - 50
51 - 53
54 - 55
56
57 - 70

Teoretice
4,0
6,6
12,1
17,5
19,6
17,5
12,1
6,6
4,0
105

Procente
Cumulate
4,0
10,6
22,7
40,2
59,8
77,3
89,4
96,0
100,0

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

NICOLAE MITROFAN

Teme de reflecie/autoevaluare:
1. Artai cum va arta etalonul, n cazul n care folosii o scal cu 5 trepte;
2. Artai cum va arta etalonul n cazul n care folosii o scal cu 7 trepte.
Pentru ambele ntrebri vei face apel tot la rezultatele obinute n urma
aplicrii testului Raven.

ntrebri de autoevaluare:
1. Ce nseamn revizia testelor ?
2. Prin cte revizii a trecut Bateria de inteligen Stanford-Binet ?
3. Prin cte revizii a trecut Bateria de inteligen WAIS ?
4. Cnd se impune revizia unui test ?
5. Care sunt etapele elaborrii i construirii unui test nou ?
6. Care sunt principalele cerine n elaborarea unui test nou ?
7. Ce nseamn reprezentativitatea eantionului ?
8. Cte categorii de cote transformate cunoatei ?
9. Care este diferena dintre sistemul decilelor i sistemul centilelor ?
10. Care este specificul sistemului cuartilelor ?
11. Care sunt principalele etape ce trebuie parcurse cnd folosim oricare dintre cele 3 sisteme ?
12. Ce nseamn cote standardizate ?
13. Care este specificul sistemului stanine ?
14. De ce etaloanele bazate pe cote standardizate au un numr impar de clase ?
15. Care este relaia dintre frecvena absolut i frecvena cumulat ?
BIBLIOGRAFIE:
1. ALBU, M. (1998). Construirea i utilizarea testelor psihologice. Cluj: Editura
Clusium.
2. ALBU, M., PITARIU, H. (1993). Proiectarea testelor de cunotine i
examenul asistat de calculator. Cluj-Napoca: Editura Casa crii de tiin.
3. COHEN, J.R., SWERDLIK, E.M. (2005). Psychological Testing and Assessment.
An Introduction to Tests and Measurement. McGraw-Hill International Edition.
4. CLINCIU, A.I. (2005). Psihodiagnostic. Braov: Ed. Universitii Transilvania
5. FRIEDENBERG, L. (1995). Psychological Testing. Design, Analysis, and use.
Allyn & Bacon.
6. KAPLAN, M.R., SACCUZZO, P.D. (2005). Psychological Testing. Principles,
Applications, and Issues. Thomson Wadsworth.
7. MINULESCU, M. (2003). Teorie i practic n psihodiagnoz. Testarea intelectului. Bucureti:
Editura Fundaiei Romnia de Mine.
8. RADU, I. (coord.) (1991). Metodologie psihologic de analiz a datelor. Cluj-Napoca: Editura
Sincron.
10. STAN, A. (2002). Testul psihologic.Evoluie, consatrucie, aplicaii. Iai: Polirom.

Copyright DEPARTAMENT ID 2008

106

S-ar putea să vă placă și