Psihodiagnostic Curs Idd

Universitatea Babe-Bolyai
PSIHODIAGNOSTIC
Sem I
Anca Dobrean
I. Informatii generale
Date de identificare ale cursului :
Numele cursului : PSIHODIAGNOSTIC
Codul cursului : Psy 2093
Anul : II ; Semestrul I
Tipul cursului : Obligatoriu
Numr de credite : 6,5
Pagina web a cursului : www.psychology.ro
Date de contact ale titularului de curs:
Nume: Anca Dobrean
Birou: str. Republicii, nr. 37
Telefon:0264-434141
Fax: 0264-434141
E-mail: AncaDobrean@psychology.ro
Consultatii : miercuri: 12:00-14:00
Date de identificare curs si contact tutori:
Tutori :
Asistent de cercetare drd. Raluca Anton
Asistent de cercetare drd. Madalina Sucala
Adresa e-mail tutori: psihodiagnostictutor@psychology.ro
Conditionri si cunostinte prerechizite

nscrierea la acest curs este condiionat de parcurgerea i promovarea urmtoarelor discipline Psihologie
general I , Psihologie general II, Psihologie Experimental I i Psihologie Experimental II. Cunotinele
dobndite prin aprofundarea acestor discipline sporesc considerabil accesibilitatea temelor propuse n acest
curs. n totalitatea lor, aceste prerechizite vor fi foarte utile n rezolvarea sarcinilor de lucru i, respectiv n
promovarea examenului de evaluare final.
Descrierea cursului
Cursul de Psihodiagnostic face parte din pachetul de discipline fundamentale ale specializrii psihologie,
nivel licen, din cadrul Facultii de Psihologie i tiine ale Educaiei a Universitii Babe-Bolyai din
Cluj-Napoca. Cursul are ca obiectiv formarea cunotinelor de baz n ceea ce priveste psihodiagnosticul i
evaluarea psihologic, elemente eseniale n anatomia oricrui demers psihologic. Cursul abordeaz o serie
de modaliti i instrumente de evaluare psihologic, urmrind formarea cunotinelor i competenelor de
analiz a principalelor caliti psihometrice ale acestor instrumente (fidelitatea, validitatea, etalonarea)
precum i oferirea unor cunotine de baz privind construcia, aplicarea i interpretarea testelor psihologice.
Organizarea temelor n cadrul cursului
Cursul este structurat pe opt module de nvare, prezentate n continuare:
Conceptele de msurare, evaluare in psihologie, Evaluarea psihologic: indici statistici de msurare/evaluare,
Etalonarea testelor, Fidelitatea testului psihologic, Validitatea testului psihologic, Algoritmul construciei
unui test psihologic, Utilitatea diagnostic a unui test psihologic, Adaptarea instrumentelor pentru alte
culturi.
Nivelul de intelegere si, implicit, utilitatea informatiilor pe care le regsiti in fiecare modul vor fi optimizate
dac, n timpul parcurgerii suportului de curs, veti consulta sursele bibliografice recomandate. De asemenea,
rezolvarea sarcinilor de lucru presupune parcurgerea referinelor obligatorii, menionate la finalul fiecrui
modul.
Formatul si tipul activitilor implicate de curs
Parcurgerea celor opt module descrise va presupune att ntlniri fa n fa (consultatii), ct i
munc individual. Consultatiile, pentru care prezenta este facultativa, reprezinta un sprijin direct acordat
dumneavoastra din partea titularului si a tutorilor. Acestea vor presupune prezentarea teoretic a
informaiilor fiecrui modul. Pentru fiecare modul, dumneavoastra veti parcurge materialele bibliografice
obligatorii. Vor exista doua sarcini obligatorii, discutate i detaliate la fiecare dintre cele dou consultaii.
Grila de notare si enunul acestora vor fi specificate la aceste ntlniri. Modalitatea de notare si, respectiv,
ponderea acestor activitati obligatorii, n nota finala va sunt precizate n seciunea politica de evaluare i
notare.
Pe scurt, avnd n vedere particularitile nvmntului la distan dar i reglementrile interne ale
CFCID al UBB parcurgerea i promovarea acestei discipline presupune antrenarea studenilor n urmtoarele
tipuri de activiti:
a. consultaii pe parcursul semestrului vor fi organizate dou ntlniri de consultaii fa n fa;
prezena la aceste ntlniri este facultativ;
b. realizarea a dou sarcini de lucru obligatorii, anunate cu cel puin 30 de zile naintea datei de
depunere a acesteia, trimise tutorilor n conformitate cu calendarul disciplinei.
c.
Materiale bibliografice obligatorii
In suportul de curs, la finalul fiecarui modul sunt precizate referinele biblografice obligatorii.
Sursele bibliografice au fost astfel stabilte nct s ofere posibilitatea adncirii nivelului de analiz si,
implicit, comprehensiunea fiecrei teorii, facilitnd nelegerea i aprofundarea temelor de studiu abordate n
fiecare modul.
Acestea pot fi accesate la Biblioteca Centrala Universitara LUCIAN BLAGA, Cluj-Napoca.
Albu, M. (1998). Construirea i utilizarea testelor psihologice, Editura Clusium.

Albu, M. (2000). Metode i instrumente de evaluare n psihologie. Editura Argonaut.
Kaplan, R.M. i Saccuzzo, D.P. (2001) Psychological Testing, Principles, Applications and Issues,
Wadsworth Thomson Learning, Fifth Edition.
Stan, A. (2002). Testul psihologic. Evoluie construcie, aplicaii. Editura Polirom
Materiale si instrumente necesare
- retroproiector
- folii retroproiector
- staie sonorizare (pentru curs)
- laptop
- videoproiector
- materiale xeroxate pentru activiti seminar
Calendarul cursului
Sunt programate 2 ntlniri fa n fa (consultaii) cu toi studenii.
Pentru prima ntlnire se recomand lectura atent a primelor patru module; la cea de a doua se
discuta ultimele patru module si se realizeaza o secventa recapitulativa pentru pregatirea examenului final.
De asemenea in cadrul celor doua intalniri studenti au posibilitatea de solicita titularului si/sau
tutorilor sprijin pentru sarcinilor de lucru obligatorii. Pentru a valorifica maximal timpul alocat celor doua
intalniri se recomand parcurgerea obligatorie a cel putin a uneia dintre sursele bibliografice de referinta, pe
suportul de curs. La fiecare dintre aceste dou ntlniri vor fi prezentate detaliat sarcinile obligatorii i
termenul limit de predare a lor.
Politica de evaluare si notare
Evaluarea finala se va realiza pe baz unui examen gril desfasurat in sesiunea de la finele
semestrului III. Nota final se compune din: a. punctajul obtinut la acest examen n proporie de 70%
(7puncte) b. evaluarea sarcinilor obligatorii de pe parcurs 30% (3 puncte, adica 1.5 puncte/sarcin).
Instruciuni suplimentare privind modalitile de elaborare, redactare, dar i criteriile de notare ale
lucrrilor, v vor fi furnizate de ctre titularul de curs sau tutori n cadrul ntlnirilor fa n fa.
Pentru predarea sarcinilor se vor respecta cu strictee cerintele formatorilor. Sarcinile predate dupa
data afiata nu vor fi luate n considerare pentru notare.
Evaluarea acestor sarcini se va face imediat dup preluare, iar afiarea pe site a notelor acordate se
va realiza la cel mult 2 sptmni de la data depunerii/primirii lucrrii. Daca studentul considera ca
activitatea sa a fost subapreciata de catre evaluatori atunci poate solicita feedback suplimentar prin
contactarea titularului sau a tutorilor prin email.
Studenii care susin examene de mrire de not sau restante trebuie s prezinte toate sarcinile
aferente cursului.
Rezultatele finale vor fi puse la dispoziia studentilor prin afisaj electronic.
Elemente de deontologie academic
Studenii care susin examene de mrire de not sau restante trebuie s prezinte toate sarcinile
aferente cursului.
Fraudarea examenului sau a sarcinilor de lucru de pe parcursul semestrului se penalizeaz prin
exmatriculare.
Proiectele copiate, discuiile sau colaborrile n timpul examenelor se sancioneaz cu nota 1.
Nepredarea lucrrii scrise de ctre un student care se prezint la examen este sancionat cu nota 1.
Orice material elaborat de catre studenti pe parcursul activitilor va face dovada originalitatii.
Studentii ale cror lucrri se dovedesc a fi plagiate nu vor fi acceptati la examinarea finala.
Discuiile sau colaborrile n timpul examenelor se sancioneaz cu nota 1. Nepredarea lucrrii scrise
de ctre un student care se prezint la examen este sancionat cu nota 1.
Contestarea notei primite la examen se face n scris, la secretariatul facultii, n termen de 48 ore de
la afiarea rezultatelor. Nota final la disciplina respectiv este cea obinut n urma contestaiei.
Studenti cu nevoi speciale

Studentii afectati de dizabilitti motorii sau intelectuale pot contacta titularul cursului sau tutorii
pentru a li se acorda materialele de studiu necesare si suportul informational necesar. Titularul cursului si
echipa de tutori i exprima disponibilitatea, n limita constrangerilor tehnice si de timp, de a adapta
coninutul i metodelor de transmitere a informaiilor precum i modalitile de evaluare (examen oral,
examen on line etc) n funcie de tipul dizabilitii cursantului.
Adresa contact titular de curs : AncaDobrean @psychology.ro
Adresa contact tutori : psihodiagnostictutor@psychology.ro
Strategii de studiu recomandate

Pentru fiecare modul, studenilor li se recomand s citeasc notiele de la curs i capitolul aferent din
minim una din crile prezentate la bibliografie. Realizarea sarcinilor oligatorii va facilita intelegerea i
aprofundarea cunotinelor din aceste module. Lectura fiecrui modul i rezolvarea la timp a lucrrilor de
evaluare garanteaz nivele nalte de nelegere a coninutului tematic i totodat sporesc ansele promovrii
cu succes a acestei discipline
I. CONCEPTELE DE MSURAREA I EVALUARE N PSIHOLOGIE
Titlul i numrul modulului:

1. Conceptele de msurare, evaluare in psihologie.
Scopul i obiectivele: obiectivul esenial al acestui modul este s se poat face diferena
ntre conceptele de evaluare psihologic i testare psihologic. Acest modul este unul introductiv
care i ajut pe studeni s i fac o imagine iniial a ceea ce nseamn psihodisgnosticul.
Obiective de studiu:
Dup parcurgerea acestui capitol:

Vei fi familiarizai cu termenii de testare psihologic i evaluare psihologic
Vei putea oferi o serie de informaii legate de istoricul testului psihologic
Vei cunoate o serie de informaii specifice legate de testele psihologice (de ex. care sunt scalele
de msur, ce este un item, de cte tipuri sunt itemii, etc)
1.
2.
3.
4.
5.
6.
7.
8.
9.
Structura logic a modulului

Evaluare versus testare psihologic
Definiii ale testului psihologic
Testul ca instrument de msurare / evaluare
Testul vizeaz un eantion de comportament
Testul implic o procedur de standardizare
Testul ca rezultant a unei colecii de itemi
Scopul utilizrii testelor psihologice
Domenii ale utilizrii testelor psihologice
Clasificri ale testelor psihologice
Coninutul informaional detaliat
EVALUARE VERSUS TESTARE PSIHOLOGIC
Thorndike (1918) - Dac ceva exist, atunci exist ntr-o oarecare msur
McCall (1939) - Orice exist ntr-o oarecare msur poate fi evaluat
CE ESTE EVALUAREA PSIHOLOGICA?

Maloney & Ward (1976) definesc evaluarea psihologica ca fiind un proces de rezolvare de probleme care
vizeaz descoperirea manifestrilor realitatii. Acest proces implica un scop bine precizat, o serie de
instrumente de evaluare - printre care si testul - precum si o serie de variabile specifice situatiei.
Evaluare versus testare psihologica
Termenii de evaluare respectiv testare psihologica sunt doi temeni distincti. Evaluarea psihologica include
testarea psihologica. Testarea psihologica constituie procesul de administrare, cotare si interpretarea a
rezultatelor unui test psihologic. Ea are un camp mult mai ngust deoarece include doar testul psihologic ca
instrument de evaluare. A reduce evaluarea psihologica la testare este o practica nestiintifica. Predictiile pe
care le facem pe baza unui test iau in considerare doar o singura sursa si anume testul respectiv. Predictiile
pe care le facem pe baza unei evaluri psihologice in seama de o multitudine de surse de informaie
(incluznd bineinteles si testarea psihologica).
REPERE ISTORICE N EVOLUIA TESTRII PSIHOLOGICE
Tabelul 1. Repere istorice n evoluia testrii psihologice
2200 C
1877
1884
1890
1901
1905
1914
1916
1917
1920-1940
1920
1921
1927
1939
1942
1949
1967
Chinezii ncorporau militarii pe baza unor evaluri prealabile

Wilhem Wundt nfiineaz primul laborator de testare psihologic la Leipzig,
Germania
Francis Galton realizeaz prima baterie de teste
James McKeen Cattell utilizeaz pentru prima dat termenul de "mental test",
evalund aptitudinile intelectuale pe baza unor probe ce vizau timpul de reacie i
capacitatea de discriminare senzorial
Clark Wissler susine c indicii obinui de Cattell nu coreleaz cu notele olare
Scala Metrica a Inteligentei - primul test de inteligen elaborat de Binet-Simon
Stern introduce termenul de coeficient de inteligen
(IQ) = vrsta mintal/vrsta cronologic
Lewis Terman reia scalele Binet-Simon, publicnd Scalele Stanford-Binet. Acestea
vor fi revizuite treptat n anii 1937, 1960, 1986
Robert Yerkes realizeaz testele pentru ncorporarea n armata american n timpul
Primului Rzboi Mondial: Army Alpha i Army Beta
Dezvoltarea major a testelor de personalitate
Testul Rorchach
Este fondat Psychological Corporation (Cattell, Thorndike, Woodworth)
Este elaborat primul chestionar ce viza orientarea profesional
Wechsler Bellevue Intelligence Scale elaboarat de David Wechsler. Va fi revzut
ulterior i mbuntit n anii 1955 (WAIS) i 1981 (WAIS-R)
Minesota Multiphasic Personality Inventory (MMPI)
Weschler Intelligence Scale for Children (WISC). Va fi revzut i mbuntit n anii
1974 (WISC-R) i 1990 (WISC-III)
Wechsler Primary and Prescholl Intelligence Scale (WPPSI)
I.2. DEFINIII ALE TESTULUI PSIHOLOGIC

Testul reprezint alturi de alte instrumente ale metodei experimentale o surs de informaii extrem de util
n evaluarea comportamentului uman.
Literatura de specialitate indic diferite definiii ale testului psihologic:
Testul psihologic const dintr-o prob, mai frecvent dintr-o serie de probe, construite n scopul
stabilirii prezenei (sau absenei) unui aspect psihic, a particularitilor de comportare sau a gradului
de dezvoltare psihic (Roca, 1972);
Un test psihologic este o procedur standardizat prin care se formeaz un eantion de
comportamente care va fi descris prin categorii sau scoruri. n plus, multe teste au norme sau
standarde care fac posibil utilizarea rezultatelor la predicia altor comportamente, mai importante
(Gregory, 1992);
Testul reprezint o msur obiectiv i standardizat a unui eantion de comportament (A. Anastasi,
1976).
instrument de evaluare;
vizeaz un eantion de comportament;
implic o procedur standard privind administrarea, cotarea i interpretarea rezultatelor.
I.3. TESTUL CA INSTRUMENT DE MSURARE/EVALUARE

A msura nseamn a atribui numere obiectelor sau fenomenelor potrivit unor reguli determinate
(Stevens, 1951). Aceste reguli stabilesc o coresponden ntre proprietile numerelor i proprietile
obiectelor/fenomenelor.
testele psihologice vizeaz atribute/trsturi specifice;

are ca instrumente scalele de msur.
scale nominale
I.3.1. SCALE DE MSUR
scale ordinale
Distingem 4 tipuri de scale de msur
scale de interval
(Stevens, 1946):
scale de raport / proporii
I.3.1.1. SCALELE NOMINALE

Definiie
Msurarea pe o scal nominal poate fi realizat ori de cte ori

caracteristica studiat permite mprirea n clase de elemente echivalente.
relaie de echivalen
Orice dou submulimi ale unei clase, nu
trebuie s se intersecteze
Exemple:
1. sexul (femei / brbai) - o clas de elevi cuprinde 31 elevi din care 14 biei i 17 fete;
2. categoriile socioprofesionale
Statistic, nu este posibil realizarea nici unei analize (X2, procente).

I.3.1.2. SCALELE ORDINALE
Definiie
Msurarea pe o scal ordinal realizeaz ierarhizarea claselor.
relaie de echivalen
relaie de ordine
Observaie:
Clasele sunt ordonate, dar distana dintre ele nu poate

fi estimat.
Exemple:
A>B>C
Aprecierile ca foarte bun, bun, slab
Statistic poate fi calculat mediana, centilele.

Grafic putem s ne referim la histograme.
I.3.1.2. SCALELE DE INTERVAL

Definiie
Msurarea pe o scal de interval presupune o unitate de msur comun i

constant.
relaie de echivalen
relaie de ordine
distana ntre clase (zero arbitrar)
Exemple:
1. IQ
2. Coeficient perceptiv.
Permite utilizarea celor mai numeroi indici statistici
(media, variana, coeficieni de corelaie).
I.3.1.4. SCALELE DE PROPORII

Definiie
Posed proprietile scalelor de interval, dar n plus au un punct zero nonarbitrar.
n psihologie msurarea nu se realizeaz pe scale de proporii.
Concluzii privind scalele de msur

Tabelul 2. Principalele caracteristici ale scalelor de msur
Prelucrri statistice
Scale
Relaii
Nominale
Ordinale
Echivalen
Echivalen
Ordine
Echivalen
De interval
Ordine
Existena unei uniti de msur
De proporii
Modul, frecvene
Mediana, centilele, coef. de
corelaie al lui Spearman
Media, variana, coeficientul de
corelaie Bravais-Pearson
I.4. TESTUL VIZEAZ UN EANTION DE COMPORTAMENT

Testul psihologic, la fel ca testele n alte tiine realizeaz observaii pe un eantion de
comportamente ale unui subiect. Dac un psiholog dorete s evalueze vocabularul unui copil sau
aptitudinile sale aritmetice sau coordonarea motric la un pilot va trebui s aleag din totalitatea
comportamentelor disponibile cteva reprezentative pentru ale include ntr-o prob psihologic.
I. 5. TESTUL IMPLIC O PROCEDUR DE STANDARDIZARE
Standardizarea = procesul de obiectivare i uniformitate a unui test raportat la:
modalitatea de aplicare/administrare;
modalitatea de cotare;
modalitatea de interpretare i raportare la norme/etaloane
I.6. TESTUL CA REZULTANT A UNEI COLECII DE ITEMI
I.6.1. CE ESTE UN ITEM ?
Item este un stimul specific care determin un anumit comportament ce poate fi cotat i evaluat independent.
I.6.2. TIPURI DE ITEMI

n funcie de tipul de rspus solicitat putem distinge ntre itemi de tip eseu i itemi cu rspunsuri date:
I. Itemi de tip "eseu" - subiectului i se cere s rspund liber la un item.
ex. Discutai implicaiile teoriei lui Piaget n practica educaional.
II. Itemi cu rspunsuri date care pot fi:

1. Itemi de tip "da-nu", "adevrat-fals"

ex. Bogota este capitala Columbiei?
sunt utilizai cel mai adesea n testele de cunotine;
uneori sunt utilizai i n testele de personalitate;
sunt considerai inadecvai n chestionarele de atitudini sau n cele ce evalueaz simptomele clinice (n
aceste domenii nu exist rspunsuri corecte sau greite);
avantaje: uor i rapid de administrat;
dezavantaje: subiectul are 50% anse de a ghici rspunsul.
2. Itemi cu rspunsuri la alegere

ex. Care este capitala Columbiei ?
A. La Paz
B. Bogota
C. Lima
D. Santiago
sunt utilizai n testele de cunotine;
avantaje: procentul de a ghici rspunsul scade;
3. Itemi cu rspunsuri pe scale de tip: "da-nu-nu tiu", "de acord-acord parial-dezacord",
"ntotdeauna-adesea-uneori-niciodat"
ex. Sunt o persoan anxioas n situaii de examen.
A. ntotdeauna
B. adesea
C. uneori
D. niciodat
4. Itemi cu rspunsuri ce trebuie alturate dup diferite criterii
ex. __ 1. primul test de inteligen

__ 2. test proiectiv de personalitate
__ 3. test de inteligen de grup
A. Raven
B. Binet-Simon
C. Rorschach
! Itemul este un stimul specific care determin un anumit comportament ce poate fi cotat i
evaluat independent
Tipuri de itemi:
I. Itemi de tip "eseu"
II.Itemi cu rspunsuri date: a. itemi de tip "da-nu", b. "adevrat-fals", itemi cu rspunsuri la
alegere, c. itemi cu rspunsuri pe scale de tip: "da-nu-nu tiu", "de acord-acord parial-dezacord",
d. Itemi cu rspunsuri ce trebuie alturate dup diferite criterii
I.7. SCOPUL UTILIZRII TESTELOR PSIHOLOGICE

1.
2.
3.
4.
5.
Selecie/clasificare.
Diagnostic i intervenie
Autocunoatere
Proiecte de evaluare a unor modificri intervenite n urma unor intervenii educative, psihoterapeutice.
Instrumente ale cercetrii tiinifice
I.8. DOMENII DE UTILIZARE A TESTELOR PSIHOLOGICE

Tabelul 3. Domenii de utilizare a testelor
Domeniu de aplicabilitate
Activitatea vizat spre evaluare
Psihologia clinic
- evaluarea inteligenei
- evaluarea psihopatologiei
Consilierea psihologic
- orientarea colar i profesional

- evaluarea aptitudinal
- evaluarea comportamentului relaional/social
Psihologia
industrial/organizaional
- evaluarea potenialului managerial

- evaluarea aptitudinilor cognitive i psihomotorii
Psihologia colar
- evaluarea maturitii colare

- evaluarea progresului n procesul instructiv-educativ
- evaluarea potenialului de nvare
- evaluarea copiilor cu cerine speciale
- evaluarea leziunilor cerebrale
Neuropsihologia
I.9. CLASIFICRI ALE TESTELOR PSIHOLOGICE

Testele psihologice pot fi clasificate n funcie de diferite criterii (Albu, 1999).
1. Clasificri n funcie de coninutul testului:
a). dup modul de executare a sarcinii de ctre subiect
teste orale;
teste scrise;
teste de performan :
teste cu manipulare de aparate i piese;
teste administrate de calculator.

b). dup utilizarea limbajului n rezolvarea sarcinii
teste verbale ;
teste nonverbale.
c). dup modul de procesare implicat:
teste de eficien
teste de aptitudini;
teste de dezvoltare intelectual;
teste de cunotine;
probe de lucru;
teste situaionale
teste de personalitate (nonintelective).
2. Clasificri n funcie de modul de administrare a testului:
a). dup numrul persoanelor care pot fi examinate simultan:
teste individuale;
teste de grup.
b). dup timpul de execuie
teste de vitez;
teste de randament:
cu limit de timp;
cu timp de lucru nelimitat.
3. Clasificri n funcie de modul de cotare a testului i de interpretare a scorului:
a). dup modul de stabilire a cotei la test:
teste obiective;
teste subiective.
b). dup modul n care se interpreteaz scorurile testelor
teste normative;
teste centrate pe criteriu;
teste idiografice;
teste ipsative.
1. Ce este un test psihologic?

2. Ce este evaluarea psihologic?
3. Ce sunt scalele de msurare i de cte tipuri sunt acestea?
4. Ce este un item?
5. Cum se clasific testele psihologice?
Sumar
Termenii de evaluare respectiv testare psihologica sunt doi temeni distinci. Evaluarea psihologica
include testarea psihologica. Testarea constituie procesul de administrare, cotare si interpretarea a
rezultatelor unui test psihologic. Testul psihologic reprezint, alturi de alte instrumente ale metodei
experimentale, o surs de informaii extrem de util n evaluarea comportamentului uman. n literatura de
specialitate gsim diferite definiii ale testului psihologic. Este important de reinut c acesta reprezint o
colecie de itemi care pot fi, fie de tip eseu, fie cu rspunsuri date.
Prin conceptul de msurare se nelege atribuirea de numere obiectelor sau fenomenelor potrivit unor
reguli determinate (Stevens, 1951). Aceste reguli stabilesc o coresponden ntre proprietile numerelor
i proprietile obiectelor / fenomenelor. Astfel, prin testul psihologic se vizeaz acele atribute / trsturi
specifice iar pentru a le msura se utilizeaz scalele de msur (scale nominale, ordinale, de interval, de
raport / proporii).
Bibliografie modul
Albu, M. (1998). Construirea i utilizarea testelor psihologice, Editura Clusium. p 13-20

Albu, M. (2000). Metode i instrumente de evaluare n psihologie. Editura Argonaut p 37-40
Wadsworth Thomson Learning, Fifth Edition. P 3-27
Stan, A. (2002). Testul psihologic. Evoluie construcie, aplicaii. Editura Polirom p 11-36
II. ETALONAREA TESTELOR
Titlul i numrul modulului

2. Etalonarea testelor.
Scopul i obiectivele: n cadrul acestui modul studenii vor acumula informaii cu privire la
modalitile de interpretare a rezultatelor obinute n urma aplicrii unui test psihologic.

Vei putea defini etalonul (norma sau standardele)

Vei cunoate paii de construcie a unui etalon
Vei cunoate scopurile etalonrii
Vei putea enumera metodele de normare
Scurt recapitulare a conceptelor prezentate anterior

Termenii de evaluare respectiv testare psihologica sunt doi temeni distinci. Evaluarea psihologica
include testarea psihologica. Testarea constituie procesul de administrare, cotare si interpretarea a
rezultatelor unui test psihologic. Testul psihologic reprezint, alturi de alte instrumente ale metodei
experimentale, o surs de informaii extrem de util n evaluarea comportamentului uman. n literatura de
specialitate gsim diferite definiii ale testului psihologic. Este important de reinut c acesta reprezint o
colecie de itemi care pot fi, fie de tip eseu, fie cu rspunsuri date.
Prin conceptul de msurare se nelege atribuirea de numere obiectelor sau fenomenelor potrivit unor
reguli determinate (Stevens, 1951). Aceste reguli stabilesc o coresponden ntre proprietile numerelor i
proprietile obiectelor / fenomenelor. Astfel, prin testul psihologic se vizeaz acele atribute / trsturi
specifice iar pentru a le msura se utilizeaz scalele de msur (scale nominale, ordinale, de interval, de
raport / proporii).
1.
2.
3.
4.

Definiia etalonului
Scopurile etalonului
Paii de construcie ai unui etalon
Metodele de etalonare
a. distribuia normal
b. scorurile standard
c. scorurile n clase normalizate
NORMELE TESTELOR
Cum interpretm rezultatul obinut de un subiect la un test?

n general, numrul de itemi rezolvai corect de subiect la un test este operaionalizat prin scor sau cot
brut. Aceast valoare ns nu are nici o semnificaie dac nu o comparm cu anumite norme, standarde
sau etaloane.
Etalonul (norma sau standardele) reprezint deci cadrul de referin al unui subiect cu populaia. Un scor brut
obinut la un test nu are nici o valoare deoarece pe baza lui nu putem ti unde se situeaz performana unui
subiect.
S lum un exemplu.
S presupunem c la un test de cunotine de matematic alctuit din 100 de itemi un subiect rezolv corect
30 de itemi. Scorul brut obinut de subiect la acest test este 30. Ce reprezint aceast valoare? Reprezint o
performan slab, medie sau bun la test? Pentru a putea rspunde la aceast ntrebare trebuie s comparm
aceast valoare cu un cadru de referin sau etalon. Acest etalon poate fi reprezentat de performana obinut
de ceilali subieci la test i astfel raportm subiectul la performana celorlali sau dimpotriv, cadrul de
referin l poate constitui o norm naional n care cadrul de referin l constituie ntreaga populaie din
care face parte.
Procesul de etalonare al unui test reprezint stabilirea unui cadru de referin, a unei scri care s permit
determinarea locului ocupat de rezultatele unui subiect fa de rezultatele unei populaii de referin, suficient
de numeroas, format din persoane comparabile cu cea examinat.
ETALONAREA
Etalonarea are astfel urmtoarele scopuri:
1. confer semnificai scorurilor i permite interpretarea acestora;
2. permite compararea direct a scorurilor. Astfel, un scor de 33 obinut de un subiect la un test poate
s nu aib aceeai semnificaie la un al doilea test.
Procesul de construcie a unui etalon respect urmtorii pai:
1.
2.
3.
4.
definirea populaiei sau a cadrului de referin pentru care se dorete construcia testului;
eantionarea;
administrarea testului la eantionul ales;
construcia cotelor sau a normelor testului.
1. Definirea populaiei constituie primul pas n construirea normelor. Acest proces cuprinde de fapt
circumscriera persoanelor pentru care este destinat testul. Astfel, aceast definire se face prin prezentarea
unor caracteristici care vor permite recunoaterea unei persoane ca aparinnd sau nu populaiei pentru
care a fost construit testul.
Exemplu.
a. Testul Bender Gestalt evalueaz funcia perceptiv motric ntre 5 i 10 ani. n aceast situaie tim c
orice persoan cu vrsta ntre 5 i 10 ani poate fi evaluat cu testul Bender pentru a se identifica nivelul
dezvoltrii funciei perceptiv motrice.
b. Testul de cunotine matematice X cuprinde toi copiii de liceu (14-18 ani) din judeul Cluj. Pentru ca
performana unui copil la acest test de cunotina matematice s poat fi raportat la etalon, copilul
respectiv trebuie s aib urmtoarele caracteristici: s aib vrsta cuprins ntre 14-18 ani i s urmeze un
liceu n judeul Cluj.
2. Deoarece testul nu poate fi aplicat la ntreaga populaie pentru care a fost construit se impune selecia din
cadrul populaiei (stabilite anterior) a unui grup sau eantion de normare. Eantionarea n psihologie se
constituie mult mai greu dect n alte domenii cum ar fi sociologia deoarece examinrile sunt costisitoare
dac se fac la domiciliul subiecilor.
!ATENIE! la eantionarea pe baz de cunotine, voluntariat, etc. deformri sistematice

n estimarea parametrilor !(eantionarea deconvenien duce la supraestimarea scorurilor)
Eantionul trebuie s fie reprezentativ pentru populaie. Astfel structura eantionului trebuie s respecte
structura populaiei. Variabilele care se vor lua n considerare n construirea eantionului in cont att de
caracteristicile populaiei (vezi definirea acesteia) ct i de caracteristicile constructului msurat de test.
Exemplu
Dac avem un test adaptat n Romnia care evalueaz inteligena la copiii precolari, populaia testului o
constituie copiii de vrsta 4 7 ani din Romnia. Acestea reprezint caracteristicile populaiei. n afara
acestor caracteristici trebuie s inem cont ns i de caracteristicile constructului. n acest caz, inteligena
depinde i de mediul din care fac parte copii, iar astfel pentru fiecare grupa de vrst construit vom avea ca
variabil mediul (ex. Rural sau urban).
Construirea eantionului se poate realiza prin mai multe tipuri de selecie. Cele mai des ntlnite selecii sunt
cele aleatoare i cele stratificate. n cazul seleciei aleatoare oricare membru al populaiei are anse egale de a
fi inclus n eantion. n cazul seleciei stratificate se face nti o mprire a populaiei n clase (n funcie de
variabilele relevante) i apoi pentru fiecare clas se trece la o selecie aleatoare.
Cnd poate fi considerat un eantion aleatoriu? dac fiecare subiect are o probabilitate aleatoare de
a fi selectat. Extragerea Loto este aleatoare? La primul nr da.
Programele statistice au opiuni de a genera numere aleatoare.

A etalona un test sau a norma un test sunt considerate activiti identice.
3. Deoarece rezultatele nu se pot culege de un singur examinator, la un singur moment n timp, este
important ca n timpul etalonrii administrarea s se realizeze standard, pstrnd aceleai condiii de
aplicare i cotare.
4. Dup ce s-a aplicat testul la ntregul eantion se obine o colecie de date pe baza crora se impune
construirea normelor testului.
Scopurile etalonrii sunt: 1. conferirea de semnificaii scorurilor i permiterea

interpretrii acestora i 2. perminterea comparrii directe a scorurilor
! Paii construciei nui etalon sunt: 1. definirea populaiei; 2. eantionarea;

3. administrarea testului , 4. construcia cotelor
METODE DE ETALONARE (NORMARE)

Orice persoan evaluat obine la un instrument de evaluare un rezultat observabil
a. la testele de aptitudini cognitive: rspunsuri corecte sau greite
b. la testele de personalitate: evidenierea unei trsturi investigate fa de coninutul aseriunii
unui item
Distribuia normal
Cu ct avem o colecie mai mare de date cu att acestea respect mai mult distribuia lui Gauss.
- proprietile curbei normale (figura 1): 68% este ntre + 1sigma, 95% este intre + 2sigma,
Beneficiul interpretrii rezultatelor pe baza distribuiei normale = simplific interpretarea scorurilor
individuale la un test. In cazul distribuiei normale media, mediana i modul au aceeai valoare
- cunoscnd c o persoana se gsete n intervalul + 1 sigma ne spune ca aproximativ 2 treimi din
populaie are acelai scor.
Figura 1. Proprietile distribuiei normale

Scorurile standard
- Transformrile liniare n scoruri standard, folosind media i abaterea standard a
distribuiilor
Un scor standard este un scor care a fost transformat dintr-o scal n alta, ultima
fiind una pe baza creia se pot face comparaii.
- cele mai cunoscute sunt scorurile z i T
Scorurile z
- scorul z are media 0 si abaterea standard 1
z = (X M)/
Exemplu
La un test de citire un subiect obine un scor brut de 24 (media=20, sigma=3), iar la matematic un scor brut
de 42, media = 60, sigma=10. Calculai scorul z pentru ambele performane. Interpretai valorile obinute.
Scorurile T
T = 50 + 10z
T este o scal a crei medie este 50 si sigma este 10;

Propus de McCall (1922, 1939) n cinstea profesorului sau Thorndike (T);
Cuprinde 5 sigma sub/peste medie;

Scorul care se gaseste la exact 5 sub medie va reprezentat un scor T de 0, media va fi 10, iar 5
sigma peste medie va fi 100;
Avantajul la scorurile T este ca nu avem o valoare negativa;
Utilizat de exemplu la testul Minesota Multiphasic Personalty Inventory (MMPI).
Scorurile n clase normalizate

5 clase: 7%, 24%, 38%, 24%, 7%
7 clase: 5, 11%, 21%, 26%, 21%, 11%, 5%,
9 clase (stanine): 4%, 7%, 12%, 17%, 20%, 17%, 12%, 7%, 4%,
Pai:
1. se aranjeaz scorurile de la cel mai mare la cel mai mic;
2. se stabilete frecventa pentru fiecare scor;
3. se stabilete frecventa cumulata;
4. se calculeaz procentul fiecrei clase;
5. se face corespondena scor + procent din distribuia de frecven cumulat;
Exemplu
S presupunem c un test a fost aplicat la 325 de subieci. Scorul maxim al testului este 42 iar scorul minim
este 2. Tabelul 1 prezint frecvena fiecrui scor, frecvena cumulat i stanina corespunztoare.
Scor
brut
42
41
40
39
38
37
36
35
34
33
32
31
30
29
28
27
26
25
24
23
Frecvena
fiecrui
scor
1
1
2
6
7
4
9
4
10
7
13
19
11
14
16
12
13
11
18
22
Frecven Stanine
cumulat
1
2
4
10
17
21
30
34
44
51
64
83
94
108
124
136
149
160
178
200
Stanina 9
Stanina 8
Stanina 7
Stanina 6
Stanina5
Scor
brut
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
-
Frecvena
fiecrui
scor
16
11
14
12
13
14
8
9
6
3
6
2
3
2
2
2
1
0
0
0
1
325
Frecven
cumulat
Stanine
216
227
241
253
266
280
288
297
303
306
312
314
317
319
321
323
324
324
324
324
325
Stanina 4
Cum obinem staninele pentru fiecare scor?

Calculul scorului care intr n stanina 9.
Se ia procentul corespunztor acestei stanine (4%) i se raporteaz la datele existente astfel:
Stanina 3
Stanina 2
Stanina 1
325....................100%
x.........................4%
x=13
Valoarea obinut reprezint frecvena cumulat a scorurilor din stanina 9. Observm n coloana frecvenelor
cumulate c aceast valoare nu exist, deci vom lua valoarea existent cea mai apropiat de 13. n coloana
frecvenelor cumulate avem valorile 10 i 17. Deoarece 10 este mai aproape de 13 vom lua aceast valoare
ca limit pentru stanina 9. Deci scorurile care intr n stanina 9 sunt cele cuprinse ntre 42 i 39 (este
corespunztor frecvenei cumulate 10).
Pentru a afla scorurile care intr n stanina 8 lum procentul din populaie din stanina 9 la care adugm
procentul corespunztor staninei 8 adic:
4% + 7% = 11%
Repetm apoi algoritmul utilizat n stabilirea scorurilor pentru stanina 9:
325....................100%
x.........................11%
x=35,75
Valoarea frecvenei cumulate cea mai apropiat de 35,75 este valoarea 34, valoarea creia i corespunde
scorul brut de 35. deci, n stanina 8 avem toate scorurile ntre 38 i 35.
Pentru stanina 7 calculul este urmtorul:
11%+12%=23%
325.................100%
x......................23%
x= 74,75
23% +17% = 40%
325.................100%
x......................40%
x=130
40% + 20% = 60%
325.................100%
x......................60%
x=195
60% + 17% = 77%
325.................100%
x......................77%
x=250,25
77% + 12% = 89%
325.................100%
x......................89%
x=289,25
89% + 7% = 96%
325.................100%
x......................96%
x=312
Dac performana subiectului se gsete n staninele 4, 5 sau 6 putem spune c performana sa la test este una
medie. O performana ncadrat n staninele 2 i 3 este un slab, iar o performan ncadrat n stanina 1 este
una foarte slab. De cealalt parte a medie, staninele 7 i 8 indic o performan bun la un test, iar stanina 9
reprezint o performan foarte bun.
Etaloanele n decile, quartile, centile, mpart distribuia n clase egale; decilele cuprind 10 clase (10% din
populaie n fiecare clas), quartilele cuprind 4 clase (25%), iar centilele 100.
Orice manual al unui test psihologic conine normele testului i trebuie s includ urmtoarele
aspecte:
1. indicii demografici ai populaiei pentru care a fost construit testul. Cei mai frecveni indicatori sunt:
vrsta, sexul, mediul din care fac parte subiecii, nivelul de colarizare Putem spune c aceti
indicatori definesc populaia pentru care este destinat testul. Astfel, un test care evalueaz inteligena
la copiii precolari (4-7 ani) nu poate fi aplicat la un copil de 9 ani deaorece nu avem un cadru de
referin la care s raportm performana obinut de acest copil.
2. numrul persoanelor pe care a fost etalonat testul i modul de eantionare ales. Aceast informaie
este uti pentru analiza semnificaiei etalonului. Ne intereseaz n acest caz dac etalonul testului are
la baz un numr suficient de mare de persoane dintr-o populaie pentru a-l putea considera
reprezentativ.
3. data construirii normelor. Aceast informaie este util deoarece ne ajut identificm dac
populaia pe care a fost etalonat testul mai posed caracteristicile populaiei din care face parte
subiectul testat. Este cunoscut faptul c unele constructe psihologice sau cunotine sunt dependente
de evoluie. De exemplu un test care evalua nivelul dezvoltrii vocabularului la o anumit populaie
n anii 1940-1950 nu mai are aceleai norme n prezent deoarece populaia a evoluat i astfel
normele trebuie mereu reactualizate.
1. Ce reprezint etalonul?
2. Care sunt scopurile etalonrii?
3. Care este procesul de construcie de construcie al unui etalon?
4. ce metode de msurare se utilizeaz?
Sumar
brut. Aceast valoare ns nu are nici o semnificaie dac nu o comparm cu anumite norme, standarde sau
etaloane. Etalonul (norma sau standardele) reprezint deci cadrul de referin al unui subiect cu populaia.
Un scor brut obinut la un test nu are nici o valoare deoarece pe baza lui nu putem ti unde se situeaz
performana unui subiect. Etalonarea confer semnificai scorurilor i permite interpretarea acestora i
permite compararea direct a scorurilor. Pe lng aceasta este foarte important ca procesul de construcie a
unui etalon s respecte o serie de pai. n cadrul metodelor de etalonare trebuie s inem cont de distribuie
(cu ct avem o colecie mai mare de date cu att acestea respect mai mult distribuia lui Gauss) i de o serie
de scoruri: standard sau in clase normalizate.
Sarcini i teme ce vor fi notate

1. La un test de performan de citire, un subiect are scorul brut de 24. Care este nivelul
nsuirii cunotinelor sale dac:
i. media la test este 30 i este 4?
ii. media la test este 30 i este 7?
iii. media la test este 40 i este 5?
2. Pentru fiecare din studiile urmtoare se va descrie procedura de eantionare. Citii fiecare descriere i
identificai tipul de eantionare folosit:
A. Un profesor de psihologie ataeaz un scurt chestionar care vizeaz obiceiurile de studiu al elevilor la
fiecare al patrulea test i distribuie aceste teste elevilor pe msur ce acetia intr n clas.
B. Cercettorul selecteaz aleatoriu jumtate din celulele unui penitenciar i intervieveaz toi indivizii din
celulele selectate.
C. Un administrator dintr-un cmin de studeni selecteaz aleatoriu cinci dormitoare din campus i din
studenii acestora selecteaz aleator 60% studeni de anul I i 40% studenii din anii mai mari pentru un
studiu viznd consumul de alcool.
Bibliografie modul
Albu, M. (2000). Metode i instrumente de evaluare n psihologie. Editura Argonaut. p 14-37, 6582
Wadsworth Thomson Learning, Fifth Edition. p 3-27
III. FIDELITATEA TESTULUI PSIHOLOGIC

3. Fidelitatea testului psihologic
Scopul i obiectivele: scopul acestui modul este de a i nva pe studeni ce reprezint fidelitatea
testului psihologic, de cte tipuri este aceasta, cum se calculeaz fidelitatea i modalitile de influenare a
fidelitii unui test. Aceste elemente sunt foarte importante pentru c fidelitatea reprezint absena relativ
dintr-o prob psihologic a erorilor de msurare. n psihologie acest lucru nu poate fi ntlnit; de aceea orice
test psihologic trebuie s estimeze valoarea acestor erori aleatoare de msur. Astfel, calculul fidelitii i
ajut pe studeni s indice msura n care scorurile obinute la test exprim de fapt valorile reale ale
constructului pe care testul l msoar.

Vei putea o definiie corect a fidelitii testului

Vei putea enumera tipurile de fidelitate
Vei tii s calculai fidelitatea unui test
Vei putea enumera modalitile de influenare a fidelitii unui test

brut. Aceast valoare ns nu are nici o semnificaie dac nu o comparm cu anumite norme, standarde sau
etaloane. Etalonul (norma sau standardele) reprezint deci cadrul de referin al unui subiect cu populaia. Un
scor brut obinut la un test nu are nici o valoare deoarece pe baza lui nu putem ti unde se situeaz
performana unui subiect. Etalonarea confer semnificai scorurilor i permite interpretarea acestora i
permite compararea direct a scorurilor. Pe lng aceasta este foarte important ca procesul de construcie a
unui etalon s respecte o serie de pai. n cadrul metodelor de etalonare trebuie s inem cont de distribuie
(cu ct avem o colecie mai mare de date cu att acestea respect mai mult distribuia lui Gauss) i de o serie
de scoruri: standard sau in clase normalizate.
1. Consistena intern
2. Stabilitatea n timp a rezultatelor
3. Metode de calcul a fidelitii interne
a. Metoda consistenei interne
b. Metoda test retest
c. Metoda formelor paralele
d. Metoda fidelitatea interevaluatori
FIDELITATEA TESTELOR
The meter (m) is the Si unit of length and is defined as the length of the path traveled by light in
vacuum during the time interval of 1/299 792 458 of a second. This replaces the two previous definitions of
the meter: the original adopted by CGPM in 1889 based on a platinum-iridium prototype bar, and a
definition adopted in 1960 based on a krypton86 radiation from an electrical discharge lamp. In each case,
the change in definition achieved not only an increase in accuracy, but also progress toward the goal of
using fundamental physical quantities as standards, in particular, the quantum mechanical characteristics of
atomic systems. - Taylor,1991.
Fidelitatea unui test psihologic se refer la dou aspecte:
1. consistena intern;
2. stabilitatea n timp a rezultatelor testrii.
Analiza fidelitii unui test pornete de la conceptul de eroare. Orice scor la un test psihologic este rezultatul
scorului real i al unei erori de msur:
Xobservat = Xreal + e
(e = eroarea de msur)
Fidelitatea reprezint absena relativ dintr-o prob psihologic a erorilor de msurare. Acest lucru
ns n psihologie nu poate fi ntlnit; de aceea orice test psihologic trebuie s estimeze valoarea acestor erori
aleatoare de msur. Calculul fidelitii indic msura n care scorurile obinute la test exprim de fapt
valorile reale ale constructului pe care testul l msoar.
Fidelitatea unui test poate fi calculat pe baza a patru metode:
1. metoda consistenei interne coeficieni de consistenta intern;
2. test retest coeficieni de stabilitate;
3. metoda formelor paralele coeficieni de echivalen;
4. metoda fidelitii interevaluatori coeficieni interevaluatori.
II.1.1. CONSISTENA INTERN
Consistena intern a unui test se refer la msura n care toi itemii testului msoar aceeai variabil.
Calculul coeficientului de consisten intern va consta n analiza corelaiei ce exista ntre fiecare item.
Pornind de la scorurile observate la un test, pentru analiza consistentei interne pot fi calculai urmtorii
coeficieni:
1. Cronbach pentru testele cu orice tip de itemi;
2. 3 Guttman;
3. 20 i 21 Kuder Richardson (dac itemii testului sunt binari).
Toi coeficienii prezentai se bazeaz pe un calcul de corelaie ntre itemii ce alctuiesc testul.
Un coeficient de consisten ridicat exprim faptul c toi itemii testului se refer la aceeai
variabil. n afara coeficienilor prezentai anterior, consistena intern a unui test poate fi calculat
i pe baza metodei njumtirii. Pe baza acestei metode testul este mprit n jumtate,
calculndu-se coeficientul de corelaie dintre cele dou pri. Dac acest coeficient este ridicat el ne
indic o bun fidelitate (consistena intern) a testului. O form particular a metodei njumtirii o
constituie metoda item cu item, n care testul este mprit n dou prin selectarea itemilor pari
respectiv a celor impari. Aceasta tehnic este util mai ales n cazul testelor n care itemii sunt
prezentai n ordinea crescnd a dificultii. Se calculeaz i acest caz coeficientul de consisten
intern ntre cele doua pri ale testului, valoarea lui reprezentnd valoarea coeficientului de
fidelitate.
II.1.2. STABILITATEA
Stabilitatea rezultatelor testrii ne indic n ce msur la aplicri diferite n timp un subiect obine
rezultate similare la un test psihologic. Calculul coeficientului de stabilitate se realizeaz astfel:
a) se administreaz testul la un grup de persoane;
b) dup un interval de timp se readministreaz testul;
c) se calculeaz un coeficient de corelaie ntre rezultatele la cele dou administrri.
O valoare mare a acestui coeficient indic o bun stabilitate n timp a rezultatelor. Se poate spune despre acel
instrument c este fidel deoarece relev aceleai valori ale unei variabile la msurtori diferite n timp.
Factori care influeneaz calculul fidelitii test-retest (stabilitii):

Intervalul de timp ntre test i retest. Dac timpul este prea scurt exist o mare probabilitate
ca subiecii s i reaminteasc rspunsurile date anterior; respectiv un timp prea lung ntre test i retest
poate determina maturizarea eantionului de subieci. Astfel dac aplicm un test de percepie la 4 ani i l
reaplicm la un interval de 6 luni exist o mare probabilitate s obinem rezultate diferite la cele dou
administrri ale testului deoarece n intervalul de 6 luni subiecii s-au maturizat. n acest caz retestul va
include n evaluare nivelul de maturizare al subiecilor. Datorit acestor argumente este destul de dificil de
stabilit cu exactitate un timp optim ntre test i retest.
ntotdeauna cnd se calculeaz acest coeficient trebuie precizat intervalul scurs ntre test i retest,
vrsta subiecilor precum i condiiile n care s-au administrat testele pentru a putea identifica eventualele
surse de eroare de msur.
Gradul de dificultate al itemilor. Dac itemii sunt fie prea uori fie prea dificili se vor obine
coeficieni de stabilitate ridicai deoarece itemii testului fie vor fi rezolvai de majoritatea subiecilor (n
primul caz) fie nu vor fi rezolvai nici la test nici la retest (al doilea caz).
Schimbri ale subiectului determinate de prima aplicare. Pot exista o serie de situaii n care se obin
performane diferite la retest deoarece subiectul fie a nvat s rspund la itemi dup prima administrare,
fie aceast prim administrare a determinat schimbri de atitudini fa de o anumit problem.
! Factori care influeneaz calculul fidelitii test - retest (stabilitii):

1. intervalul de timp ntre test i retest
2. gradul de dificultate al itemilor
3. schimbri ale subiectului determinate de prima aplicare
II.1.3. METODA FORMELOR PARALELE

Exist o serie de situaii practice care necesit aplicri repetate a unui test psihologic la un interval foarte
scurt de timp. n acest caz aplicarea aceluiai test este improprie deoarece s-a vzut anterior c la un interval
scurt de timp subiecii pot s i reaminteasc rspunsurile date anterior. n acest caz trebuie s se
construiasc forme echivalente sau paralele ale unui test. Dou teste sunt paralele dac pentru un subiect
erorile de msur la cele dou administrri sunt variabile aleatoare independente. n acest caz itemii celor
dou teste trebuie s fie logic izomorfi, adic s aib acelai nivel de dificultate.
Avantajul acestei metode este acela c nu mai permite reamintirea rspunsurilor i nici posibilitatea cutrii
rspunsurilor la ntrebrile la care nu s-a tiut rspunde.
Dezavantajele acestei metode sunt urmtoarele:
necesit consum de timp prin dou administrri;
subiecii se pot plictisi dac testrile sunt prea lungi;
este greu de realizat fiind dificil i costisitoare.
II.1.4. FIDELITATEA INTEREVALUATORI

Este necesar a fi calculat n cazul testelor care nu au o cotare obiectiv aa cum sunt testele proiective de
personalitate la care scorul este influenat i de interpretarea pe care o d persoana care face cotarea. Pentru a
verifica n ce msur scorul la test este influenat de modalitatea n care se face cotarea de diferite persoane
se va cere la diferii evaluatori s calculeze scorurile la test, iar apoi se va realiza un coeficient de corelaie
interevaluatori. Acest coeficient va exprim msura n care testul este independent de erori datorate
modalitii de cotare a rspunsurilor subiectului.
Coeficienii de fidelitate transformai n coeficieni de determinare (ptratul coeficientului de fidelitate)
relev proporia n care variana total a rezultatelor psihometrice se datoreaz varianei reale diferenelor
individuale reale sau din contr, varianei eroare, definit diferit, n funcie de metoda particular urmat
n stabilirea tipului de fidelitate (Kulcsar, 1980). n consecin, dei semnificaia diferiilor coeficieni de
fidelitate nu este aceeai, totui orice coeficient de fidelitate, ridicat la ptrat, poate fi interpretat n termeni
de procentaj al variantei randamentului la test. Astfel de exemplu, un coeficient de fidelitate de .80 nseamn
c .802=64% din variana total a rezultatelor psihometrice considerate se datoreaz varianei reale a
domeniului explorat, iar 36% varianei eroare, generat de unele din sursele multiple ale deosebirilor n
rezultatele psihometrice.
! Trebuie menionat faptul ca dei fidelitatea unui test este importanta, ea nu este suficient
pentru un test bun. Un test poate avea o bun consisten intern (toi itemii evalueaz aceeai variabil)
respectiv o bun stabilitate n timp, dar s msoare altceva dect i propune. Problema evalurii corecte a
ceea ce i propune s msoare un test constituie subiectul validitii testelor.
Interpretarea unui coeficient de fidelitate

Murphy & Davidshopher (1998) prezint urmtoarele repere n interpretarea coeficienilor de fidelitate
(tabelul 1):
Tabelul 1. Semnificaia coeficienilor de fidelitate

Valori
ale Tipul testului
coeficienilor
de
fidelitate
0.95
Testele de inteligen de grup
0.90
Testele de performan
0.85
0.80
Testele cu rspunsuri multiple
0.75
Scalele comportamentale
0.70
0.65
Unele msurtori proiective
0.60
0.55
0.50
Interpretare
Fidelitate mare
Fidelitate moderat
Fidelitate sczut
Scorul real i eroarea au efect egal
asupra scorurilor la test
Aa cum am precizat anterior orice rezultat (scorul observat) pe care o persoan l obine la un test este
alctuit din aptitudinea real (scor real) creia i se adaug eroarea de msur. Adic:
ntrebarea pe care este necesar s o analizm n acest caz ar fi urmtoarea: care este intervalul n care se
gsete scorul real. Altfel spus, dat fiind faptul c o persoan obine un anumit scor la un test, ne intereseaz
care este intervalul n care putem spune c se gsete scorul real la test. Acest interval este denumit interval
de ncredere i este definit ca probabilitatea ca scorul real al persoanei la un test s se gseasc ntre anumite
limite.
Calculul intervalului de ncredere (IC).

Intervalul de ncredere se obine astfel:
IC = Xobservat + z*SEm
SEm = SD*
(1 r )
SEm= eroarea standard de msur
SD= abaterea standard a scorurilor la test; r= coeficientul de fidelitate
S lum un exemplu.
Presupunem c la un test de inteligen o persoan a obinut un scor de 115. Coeficientul de fidelitate alpha
este de 0,98, iar abaterea standard a scorurilor la test este de 15. Cum aflm intervalul n care se gsete
scorul real al persoanei la test?
1. Calculm eroarea standard de msur
SEm = SD*
(1 r )
SEm = 15*
(1 0.98)
SEm = 15*
0.02
SEm = 2.12
2. Calculm intervalul de ncredere
IC = Xobservat + z*SEm
IC = 115 + z*2.12
Alegerea scorului z care va intra n calcul se face n funcie de precizia cu care dorim s lucrm. Dac
alegem s lucrm cu o probabilitate de 95% scorul z corespunztor este de 1.96 . Pentru o probabilitate de
90% scorul z corespunztor este de 1.65. n acest exemplu s vom lucra cu o precizie de 95%, deci z=1.96.
Astfel vom avea:
IC = 115 + 1.96*2.12
IC= 115 + 4.15
n acest caz putem spune cu o probabilitate de 95% c scorul real al persoanei se gsete n intervalul 110.85
119.15.
! DE REINUT:
intervalul de ncredere depinde de coeficientul de fidelitate al testului; dac avem un

coeficieni de fidelitate mici, atunci intervalul se mrete, deci eroarea este mai mare.
intervalul de ncredere depinde de abaterea standard a scorurilor la test.
1. La ce se refer fidelitatea unui test?

2. De la ce pornete analiza fidelitii unui test?
3. Ce este consistena intern a unui test?
4. Ce reprezint fidelitatea interevaluatori?
5. Care sunt factorii care influeneaz calculul fidelitii test retest?
6. Care sunt avantajele i dezavantajele metodei formelor paralele?
Sumar
Fidelitatea reprezint absena relativ dintr-o prob psihologic a erorilor de msurare. Acest lucru
ns n psihologie nu poate fi ntlnit; de aceea orice test psihologic trebuie s estimeze valoarea acestor
erori aleatoare de msur. Calculul fidelitii indic msura n care scorurile obinute la test exprim de
fapt valorile reale ale constructului pe care testul l msoar. Fidelitatea unui test psihologic se refer la
dou aspecte: 1. consistena intern i 2. stabilitatea n timp a rezultatelor testrii.
Fidelitatea unui test poate fi calculat pe baza a patru metode: 1. metoda consistenei interne, 2. test
retest, 3. metoda formelor paralele, 4. metoda fidelitii interevaluatori

Rezolvai urmtoarele probleme:
Testul A are abaterea standard 4, fidelitatea testului este 0.89
Testul B are abaterea standard 7, fidelitatea testului este 0.88
Considernd c toi ceilali parametri ai celor 2 teste sunt egali, pe care dintre teste l
considerai mai bun?
1.
Testul C are eroarea standard de msur 3,20 iar fidelitatea testului 0,76
Testul D are eroarea standard de msur 5,6 iar fidelitatea testului 0,62
Considernd c toi ceilali parametri ai celor 2 teste sunt egali, pe care dintre teste l considerai mai bun?
2.
3.
Calculai eroarea standard de msur pentru un scor observat de 15 i utilizai valoarea obinut
pentru a determina intervalul de ncredere al scorului real pentru 90 % respectiv 95%. Abaterea standard a
scorurilor la test este 8; Fidelitatea testului este 0,74. Calculai:
a. Eroarea standard de msur:______________
b. Intervalul de ncredere la 90%_________________________________
c. Explicai semnificaia acestui interval.
d. Intervalul de ncredere la 95%_________________________________
e. Explicai semnificaia acestui interval.
Bibliografie modul
Wadsworth Thomson Learning, Fifth Edition. p 27-63, 63-98
IV. VALIDITATEA TESTULUI PSIHOLOGIC

4. Validitatea testului psihologic
Scopul i obiectivele: obiectivul acestui modul este s le ofere studenilor o serie de informaii cu
privire la validitatea testelor psihologice i importana acesteia, adic faptul c e necesar s demonstrm c
testul msoar ceea ce i-a propus. Orice instrument de evaluare psihologic trebuie s satisfac cerinele
validitii.

Vei putea defini validitatea testelor psihologice
Vei putea enumera tipurile de validitate existente
Vei recunoate modalitile de influenare a validitii

Fidelitatea reprezint absena relativ dintr-o prob psihologic a erorilor de msurare. Acest lucru ns
n psihologie nu poate fi ntlnit; de aceea orice test psihologic trebuie s estimeze valoarea acestor erori
aleatoare de msur. Calculul fidelitii indic msura n care scorurile obinute la test exprim de fapt
valorile reale ale constructului pe care testul l msoar. Fidelitatea unui test psihologic se refer la dou
aspecte: 1. consistena intern i 2. stabilitatea n timp a rezultatelor testrii.
Fidelitatea unui test poate fi calculat pe baza a patru metode: 1. metoda consistenei interne, 2. test
retest, 3. metoda formelor paralele, 4. metoda fidelitii interevaluatori
1. Definiia validitii testului
2. Istoric al studiilor despre validitate
3. Forme ale validitii
a. validitate de criteriu
b. validitate de coninut
c. validitate de construct

VALIDITATEA TESTELOR
Definiia validitii
Evaluarea psihologic vizeaz o anumit realitate fie intern, fie extern. Numim domeniu de
evaluare orice realitate (intern sau extern) care este supus evalurii. n orice proces de evaluare
psihologic pornim de la definirea domeniului de evaluare i apoi propunem o serie de modaliti cantitative
prin care observm dac indivizii posed sau nu caracteristicile domeniului respectiv. Deoarece definirea
domeniului poate s fie mai mult sau mai puin corect ne punem ntrebarea dac aptitudinile /caracteristicile
msurate de test corespund domeniului de evaluare. Astfel, pentru ca testul s fie considerat o msur bun a
domeniului de evaluare este necesar s obinem o serie de informaii care s reflecte faptul c testul msoar
ceea ce i-a propus. Din aceste cerine decurge problema validitii unei msurtori.
Orice instrument de evaluare psihologic trebuie s satisfac cerinele validitii. Tradiional, definiia cea
mai des ntlnit a validitii este modalitatea n care un test msoar ceea ce i propune s msoare
(Anastasi, 1976). Validitatea se refer deci la relaia dintre scorul obinut la un test i un anumit criteriu sau o
performan extern. Acest criteriu poate s aparin oricrui domeniu; poate include selecia de personal,
reuita colar sau nosologia.
Istoric al studiilor despre validitate
Este cunoscut deja faptul c msurarea psihologic i deci implicit i validarea i au rdcinile demult n
timp. ntr-un articol care viza rolul testelor n selecia de personal, Guion (1976) realizeaz o trecere n
revist a principalelor aspecte de care se inea cont la vremea respectiv n analiza validitii unei msurtori
psihologice. Acestea sunt prezentate n tabelul 2:
Tabelul 2.2. Referiri la validitate
1.
2.
3.
4.
5.
6.
7.
8.
9.
Aspecte
Observaii
Scopul validrii* este acela de a prezice o esteimportant a se cunoate dac scorurile la
performan viitoare
un test sunt ntr-o modalitate mai mare sau mai
mic predictive pentru succesele ulterioare
(Bingham, 1937, p.216)
Predictorii i criteriile trebuie s fie
selectai pe baza analizei muncii.
Instrumentele
de
evaluare
trebuie Pentru a putea compara performanele unei
standardizate.
persoane la un test la diferite momente n timp,
testul trebuie s fie uniform (Freyd, 1923, p.232)
Testele trebuie validate empiric.
Un test nu are nici o semnificaie nainte ca
acesta s fie validat (Link, 1924)
Validarea este specific unei situaii.
Un singur test nu este suficient.
Hull (1928) susine c pentru a putea prezice cu
mare acuratee un anumit criteriu, trebuie utilizat
o baterie alctuit din 4, 5 sau mai multe teste
(Guion, 1976, p.783).
Este bine s se utilizeze doar un singur Freyd (1923) descrie procesele prin care este
criteriu.
selectat un criteriu
Metodele psihometrice sunt preferate Evaluatorul nu se va limita la un instrument
metodelor nepsihometrice.
anume de msur, dar cele pe care trebuie s le
utilizeze cel mai des sunt testele i chestionarele
(Freyd, 1923, p.231)
Un test trebuie s in cont de diferenele Performanele la un test trebuie analizate - acolo
individuale.
unde este cazul - diferit n funcie de sexe
(Freyd, 1923).
Analiza fcut de Guion (1976) ne ofer o imagine global a ceea ce nsemna la nceputul sec. xx
modaliti tradiionale de realizare a studiilor de validitate a unui instrument de evaluare psihologic.
O abordare mai recent i poate mai corect a validitii este formulat de APA1, AERA2, NCSEPT3
n 1974. Conform standardelor asociaiilor amintite Validitatea se refer la corectitudinea inferenelor
realizate pe baza unui test sau a altei forme de evaluare (p.25). Altfel spus, dar fiind un set de ntrebri la
care dorim s rspundem pe baza unei evaluri psihologice trebuie s ne verificm ct de corecte (sau valide)
sunt rspunsurile (sau informaiile) oferite de un test psihologic (Ghiselli & all, 1986).
Validitatea trebuie atribuit ntotdeauna inferenelor fcute pe baza performanelor la un test.
Validitatea nu este o caracteristic a testului psihologic ci este mai degrab o caracteristic a inferenelor care
*
Validarea este procesul prin care se obin informaii legate de validitatea unui test.
American Psychological Association

American Educational Research Association
3
National Council on Standards for Educational and Psychological Tests
2
rezult n urma utilizrii acestuia (unei forme de evaluare - chiar a observaiei). Altfel spus, validitatea
determin relaia dintre inferenele fcute pe baza performanelor la un test i realitate (este inclus aici orice
aspect care este supus evalurii). Dac analizm definiia dat de Nunnally (1978) validitii, i anume ct
de util tiinific este un instrument de msur observm c i n acest caz este vorba de inferene, sau
judeci realizate pe baza instrumentului respectiv.
Forme ale validitii.
Literatura de specialitate indic diferite tipuri de validitate psihologic. Ele trebuie nelese ca fiind
tehnici, modaliti prin care se ncearc optimizarea unui instrument de msur psihologic. Modalitatea cea
mai des ntlnit n literatura de specialitate (Anastasi, 1976; Cohen, et. all, 2000) de a concepe validitatea o
constituie urmtoarea taxonomie:
validitate de criteriu
validitate de coninut
validitate de construct.
n afara celor trei tipuri de validitate, normele APA analizeaz validitatea de aspect.
Validitatea de aspect este definit ca ceea ce un test pare s msoare, mai degrab dect ceea ce msoar
(APA, 1974). Exprim de fapt modul n care persoana evaluat percepe itemii testului; ea este important n
msura n care poate influena rspunsurile persoanei examinate la test. Dac persoana examinat apreciaz
c testul msoar ceea ce i propune s msoare de fapt, atunci putem spune c testul are o validitate de
aspect ridicat. Conform Standardelor de Evaluare APA (1974) validitatea de aspect nu constituie un criteriu
important pentru inferenele fcute pe baza unui test.
II.2.1.VALIDITATEA DE CRITERIU
CRITERIU
Nu de puine ori suntem confruntai cu ntrebri ca: n ce msur performana la un test de

inteligen este predictiv pentru reuita colar?, n ce msur rezultatul la un test de aptitudini prezice
performana n munc?, n ce msur performana la un test de memorie constituie un bun predictor
pentru declinul cognitiv la vrsta a treia?. Aceste ntrebri se adreseaz validitii de criteriu. Adesea
acest tip de validitate este ntlnit sub denumirea de validitate empiric (Lyman, 1998). Validitatea de
criteriu indic deci msura n care testul este un bun predictor pentru un eantion de comportamente viitoare.
n acest caz performana la un test trebuie raportat la o alt performan pe care o numim criteriu.
Criteriul este definit ca standardul la care este raportat performana la un test. Astfel criteriul poate
fi performana unui pilot care conduce un Boeing 767, numrul de zile petrecut ntr-un spital de
psihiatrie, notele obinute de un elev la disciplinele umane, performana la un alt test. Aa cum se poate
observa nu exist reguli stricte pentru ceea ce numim criteriu. Acesta poate fi un comportament specific sau
un grup de comportamente, o perioad de timp, un diagnostic psihiatric, indicele de absenteism, alcoolemia
din snge, etc. Dei la o prima vedere se poate spune c un criteriu poate constitui orice, acest lucru este
adevrat doar dac criteriul este relevant pentru domeniul de evaluare, dac este necontaminat, dac este
valid i fidel.
Un test psihologic este adecvat dac este relaionat cu un criteriu i deci poate fi considerat un bun
substitut al criteriului. n general numim testul ca fiind predictor pentru criteriul respectiv.
Caracteristicile unui criteriu.
Criteriul reprezint o msur direct i independent a ceea ce testul dorete s prezic. Astfel pentru un test
de aptitudini mecanice criteriul l poate constitui performana n munca de mecanic; pentru un test de
cunotine criteriul l pot constitui notele colare.
Criteriul trebuie s ndeplineasc cteva condiii (Corsini, 1994):
s fie relevant pentru activitatea sau caracteristica la care se refer; adic ordinea subiecilor la
test s coincid cu ordinea performanei la criteriu;
s fie fidel, adic s fie congruent cu evaluri diferite ale performanelor la care se refer,
evaluri realizate la momente diferite.
s fie practic, adic s nu coste mult;

s fie exprimat n aceleai uniti pentru toate persoanele. Dac de exemplu, valorile variabilei
criteriu sunt dependente de vrsta subiecilor atunci aceste valori trebuie transformate n cote
standard (de exemplu: z sau T);
Anastasi (1954) exemplific cteva criterii utilizate n analizarea validitii testelor care vizeaz constructe:
vrsta se folosete ca i criteriu n cazul constructelor ce vizeaz procese care cunosc o
maturizare (ex. inteligena, funciile perceptive, etc.). Nu este un criteriu bun pentru testele care
vizeaz aspecte invariabile n timp (ex. variabilele ce in de temperament).
performanele colare sunt un criteriu bun pentru testele de cunotine sau pentru testele care
evalueaz aptitudini colare.
performanele la diverse programe de instruire special (muzic, sport, etc.) sunt criterii
adecvate pentru testele de aptitudini speciale.
rezultatele altor teste se utilizeaz adesea ca i criteriu n construirea de noi teste. Astfel Scala
Metrica a inteligenei construit de Binet-Simon (1905) a folosit drept criteriu pentru teste
ulterioare construite n scopul evalurii inteligenei;
grupele contrastante - pentru un test de inteligen acestea ar fi constituite din copiii care
frecventeaz coala de mas, respectiv copiii integrai n coala ajuttoare.
Ca i scorurile la test, un criteriu trebuie s fie fidel (Cohen, 1999).
Dac ar fi posibil ntotdeauna s obinem direct scoruri la criteriu pentru un anumit individ nu am
mai avea nevoie de msura predictorului i de nici o aproximare a validitii de criteriu. Din pcate ns nu
putem obine imediat scorurile la un criteriu; ele pot fi obinute doar la anumite intervale n timp sau pot fi
adesea extrem de costisitoare pentru a fi obinute la cerere pentru orice individ.
S considerm un exemplu.
S-a pus nu de puine ori ntrebarea ce nseamn o performan bun ntr-o anumit organizaie.
Performana poate fi definit din mai multe puncte de vedere. Astfel, organizaia poate fi interesat de ct de
mult contribuie o persoan la creterea profitului, iar pentru persoana respectiv performana poate nsemna
msura n care simte c este apreciat. Avem n acest caz de-a face cu mai multe dimensiuni ale unui
criteriu. Aceste surse de informaii pot fi utilizate pentru a prezice fiecare dintre cele dou surse ale
criteriului iar validitatea acestora va fi determinat diferit. Dac un criteriu este adecvat este cel mai adesea
o judecat de valoare (Ghiselli et. all). Putem estima prin diferite modaliti fidelitatea unui criteriu
(stabilitatea acestuia n timp de ex.) ns formularea lui, respectiv coninutul acestuia constituie cel mai
adesea un raionament sau o judecat a celui care realizeaz evaluarea.
n exemplul anterior criteriul aparine viitorului i n momentul evalurii nu este disponibil, deci
avem nevoie de o serie de predictori pentru estimarea acestuia. S presupunem ns c avem de-a face cu un
criteriu care poate fi estimat acum (adic n momentul evalurii). ntrebarea pe care trebuie s ne-o punem
este urmtoarea: avem la dispoziie msurtori economice ale criteriului care pot fi folosite acum?. Un
exemplu de astfel de criteriu este msura n care o serie de indivizi prezint o form sau alta de tulburare
psihic. O analiz complet a acestei dimensiuni ar dura cteva zile i ar fi neeconomic. Dac n plus
sarcina psihologului este acela de a analiza un numr mare de persoane din prisma acestor criterii ar trebui
gsit o alt modalitate dect cea clinic, complet. Problema cu care ne confruntam acum este aceea de a
gsi o modalitate economic (rapid n timp i necostisitoare) care ar putea substitui examinarea clinic
complet care constituie criteriul.
Exist de multe ori evenimente care s-au petrecut n trecut i care deci nu mai pot fi evaluate n mod
direct. Care este n acest caz predictorul utilizat pentru evaluarea criteriului (evenimentul trecut)? De
exemplu, analiza de ctre medic a unei electrocardiograme (predictor) poate fi utilizat ca modalitate de a
decide dac pacientul respectiv a suferit sau nu un atac de cord (criteriu). Un alt exemplu care intr n aceast
categorie este rolul pe care l are un judector de a stabili dac un individ a comis o crim n trecut (criteriul)
pe baza prezentrii faptelor la proces (predictor).
nainte de a prezenta diferitele tipuri de validitate de criteriu trebuie reinut urmtoarea afirmaie. O
anumit variabil poate constitui un criteriu ntr-o anumit situaie respectiv predictor n alt situaie. Ceea ce
este astzi criteriu poate s nu mai fie mine.
APA (1974) difereniaz ntre dou tipuri de validitate de criteriu:
validitate predictiv.
validitate concurent
Validitatea predictiv.
Termenul de predicie poate fi utilizat fie n sens larg cnd se refer la predicia unui test pentru orice
situaie, sau n sens restrns cnd se refer la predicie ntr-un interval de timp. Validitatea predictiv vizeaz
cel de-al doilea sens.
Validitatea predictiv este definit ca acurateea cu care putem estima n ce msur o anumit
caracteristic sau aptitudine a unei persoane se va manifesta n viitor pe baza msurii n care persoana posed
o serie de caracteristici sau aptitudini curente (Ghiselli, et. all). De exemplu, la un examen de admitere la
facultate ne poate intereseaz n ce msur aptitudinile de care dispune acum o persoana sunt predictive
pentru performana academic. Pe baza notei la examenul de admitere (predictor) am putea face o predicie
asupra reuitei academice ulterioare (criteriu).
n practica clinic de exemplu, un test care ar reui s prezic tentativele viitoare de suicid ar constitui un
bun predictor pentru acest criteriu.
Ce este predicia?
Predicia este procesul de stabilire a unor expectaii despre viitor avnd la baza date / evenimente
curente de exemplu desprinderea unor date despre performana viitoare n munc pornind de la
caracteristicile actuale ale unei persoane.
n literatura de specialitate, datele actuale se numesc predictori, n timp ce variabilele care descriu
performana se numesc criteriu.
Principii ale prediciei.

Psihologia personalului, orientat pe selecie ofer 2 modele tiinifice ale prediciei: abordarea pe baz de
trsturi i abordarea pe baza generalizrii comportamentelor (Wernimont & Campbell, 1968).
Abordarea pe baz de trsturi (figura 1) pornete de la asumpia c exist un numr de relaii
bine precizate ntre trsturile unei persoane i activitile pe care persoana le desfoar, relaii exprimate n
forma legilor psihologice. Aceast abordare are la baz principiul deductiv nomologic (principiul DN) din
teoria tiinei (Stegmuller, 1974). Cnd pentru un grup de persoane o anumit lege psihologic stabilete c
exist o legtur ntre o caracteristic A a persoanei i un anumit tip de comportament E, putem realiza, pe
baza acestei legi, predicia c o persoan care posed caracteristica A va manifesta comportamentul E.
Principiul nu poate fi aplicat n aceast form simpl din mai multe motive. n primul rnd, relaia dintre
predictor i criteriu este mai degrab una probabilistic i nu determinist. Astfel, cunoscnd scorul unei
persoane la o variabil predictor, putem face doar o inferen despre scorul la criteriu; aceast inferen se
realizeaz cu o anumit probabilitate i nu cu certitudine. n al doilea rnd, trsturile i caracteristicile
comportamentale, nu pot fi msurate n mod direct, ci ele sunt msurate pe baza unor instrumente care au
caracteristici psihometrice specifice. n al treilea rnd legile dintre trsturi i comportamente trebuie
stabilite foarte clar, fr contradicii logice. Astfel de contradicii ar putea apare atunci cnd un test ar realiza
o predicie a unei performane bune a persoanei, iar un alt test ar prezice o performan slab.
Caracteristica A
Lege psihologic
Ipoteze pe baz de
observaie
Comportamentul E
Ipoteze pe baz de
observaie
Predicie
Caracteristica a observat
Comportamentul observat e
Figura 2.1. Predicia pe baza principiului deductiv-nomologic

Abordarea pe baza generalizrii comportamentului (figura 2) are la baz urmtoarea asumpie:
atunci cnd o persoan se comport de o manier E ntr-o anumit situaie G1 se poate concluziona c
persoana respectiv se va comporta de aceeai manier E ntr-o alt situaie Gi, situaie similar cu prima.
Avem de-a face n acest caz cu o generalizare a comportamentului observat ntr-un eantion de situaii la un
o alt situaie similar cu cele din eantionul ales. Pe baza acestei generalizri putem vorbi de principiul
eantionului de situaii. Figura 2 prezint grafic o reprezentare a acestui principiu.
Eantion de situaii
Reprezentativitate
Reprezentare
Eantion de sarcini
Univers de situaii
Reprezentare
Predicie
Univers de sarcini
Figura 2.2. Predicia pe baza principiului generalizrii comportamentului

Cele dou modele ale prediciei difer din punctul de vedere al bazei lor epistemologice. Abordarea
pe baza trsturilor relaioneaz o caracteristic durabil a unei persoane (ceva ce persoana are) cu activitatea
sa (ceva ce persoana face). Abordarea pe baza generalizrii comportamentului nu ia n considerare trstura,
ea relaioneaz comportamente (ce face o persoan cu altceva ce face). Aceast a doua abordare are la baz o
similaritate mai mare ntre predictor i criteriu, fapt ce poate determina o mai bun predicie. Acest argument
susine i faptul c instrumentele de tipul celor orientate pe coninut au o validitate predictiv mai mare dect
cele bazate pe trsturi (Schmitt&Noe, 1986). Similaritatea dintre cele dou abordri se refer la faptul c ele
au la baz asumpia c exist o stabilitate a comportamentului; n primul caz stabilitatea este dat de
trstur, iar n al doilea caz stabilitatea este dat de o constant comportamental (comportamentul nu se
schimb atta timp ct situaia nu se schimb).
Ce model de predicie este utilizat n testul de personalitate 16PF?
Validarea predictiv presupune existena unui interval de timp ntre test i verificarea criteriului.
Pentru un test care are ca scop predicia reuitei colare la scris-citit n clasa I testul va fi aplicat la intrarea n
clasa I, iar criteriul (performanele la scris-citit) va fi verificat fie dup un semestru, fie la sfritul clasei I.
Studiul de validare al unui test care vizeaz prognoza reuitei la citire n clasa I, trebuie s parcurg
urmtoarele etape (Kulcsar, 1980) (figura 1):
analiza psihologic a activitii de citire; indicarea premiselor psihologice ale reuitei la citire;
alegerea unui test sau a unor teste psihologice care exploreaz tocmai acele aspecte psihologice
care condiioneaz reuita la citire;
aplicarea testului sau a testelor psihologice destinate prediciei reuitei la citire;
msurarea criteriului, adic evaluarea gradului de nsuire a deprinderii de citire pe baza notelor
colare sau a unor probe de citire elaborate n acest scop;
analiza cantitativ i calitativ a rezultatelor la test i la criteriu; studierea legturii ntre cele
dou categorii de rezultate.
15 septembrie 1980
15 iunie 1981
Aplicarea testului sau a bateriei de teste predictive Msurarea criteriului (notele colare; aplicarea unor
(la intrarea n clasa I)
probe de citire)
TEST (15 sept. 1980)

Studierea legturii ntre reuita la
prin:
CITIRE (15 iunie 1981)

metoda grupelor reprezentative; intercorelarea celor dou categorii de rezultate
(coeficientul de validitate relev eroarea estimrii)
metoda grupelor extreme sau contrastante; se studiaz comparativ media i
dispersia rezultatelor la dou categorii de subieci semnificativ diferite sub
aspectul criteriului reuita la citire / nereuita la citire
Figura 2.3. Ilustrarea procesului de validare predictiv (Kulcsar, 1980).
Validarea concurent presupune obinerea scorurilor la criteriu aproximativ n acelai timp cu scorurile la
test. n cazul validitii concurente este vorba tot de o predicie, dar la aceasta se ajunge pe o cale puin
diferit fa de cea urmat n studierea validitii predictive (Cronbach, 1970).
Trebuie menionat faptul c distincia logic ntre validitatea predictiv i cea concurent (figura 2) nu se
bazeaz pe relaia temporal dintre test i criteriu ci mai ales pe obiectivele testrii. Astfel, n timp ce
validitatea concurent are ca scop rezolvarea unei probleme privind starea actual a subiectului, validarea
predictiv vizeaz evoluia sa n viitor. Diferena ntre cele dou tipuri de validitate poate fi sumarizat pe
baza urmtoarelor ntrebri: Este X anxios? (validare concurent) i Este posibil ca X s devin anxios?
(validare predictiv).
15 septembrie 1980
15 septembrie 1980
Testare psihologic
Msurarea criteriului
Studierea legturii ntre cele dou categorii de rezultate

Figura 2.4. Ilustrarea procesului de validare concurent (Kulcsar, 1980)
Dac rezultatele la predictor (test) sunt obinute simultan cu rezultatele la criteriu, msura relaiei
dintre predictor i criteriu o constituie validitatea concurent. Validitatea concurent exprim deci n ce
msur scorurile la test pot fi utilizate pentru a estima performana actual a unei persoane la un anumit
criteriu.
Analiza validitii de criteriu (fie ea predictiv sau concurent) se bazeaz pe dou tipuri de analize statistice:
coeficienii de validitate.
Coeficienii de validate
Validitatea de criteriu a unui test reprezint o modalitate cantitativ i obiectiv a relaiei dintre scorurile la
predictor i scorurile la criteriu. Astfel coeficienii de corelaie sunt o modalitate de a estima validitatea
predictiv. Cnd acetia sunt utilizai pentru a indica relaia dintre un predictor i un criteriu, ei sunt denumii
coeficieni de validitate.
! APA (1974) difereniaz ntre dou tipuri de validitate de criteriu:

- validitate predictiv (este definit ca acurateea cu care putem estima n ce msur o anumit
caracteristic sau aptitudine a unei persoane se va manifesta n viitor pe baza msurii n care persoana
posed o serie de caracteristici sau aptitudini curente (Ghiselli, et. all)
- validitate concurent (presupune obinerea scorurilor la criteriu aproximativ n acelai timp cu
scorurile la test. n cazul validitii concurente este vorba tot de o predicie, dar la aceasta se ajunge pe o
cale puin diferit fa de cea urmat n studierea validitii predictive (Cronbach, 1970)
II.2.2. VALIDITATEA DE CONINUT
CONINUT
Validitatea de coninut implic examinarea sistematic a coninutului testului pentru a se verifica dac testul
acoper un eantion reprezentativ din domeniul care se cere a fi evaluat prin test (Anastasi, 1976). Astfel
pentru a vorbi de o validitate de coninut ridicat trebuie ca itemii care alctuiesc testul s fie reprezentativi
pentru ceea ce testul dorete s msoare.
Analiza validitii de coninut a unui test trebuie s surprind:
1. Definirea i descrierea domeniului de coninut a testului. Aceast descriere trebuie s fie extrem de clar
i s includ toate faetele domeniul care se dorete a fi evaluat.
2. Analiza itemilor care sunt inclui n test. Vor trebui s fie eliminai acei itemi care nu evalueaz aspecte
ale domeniului de coninut identificat anterior. Aceast analiz se va face de ctre experi care pot s
aprecieze relevana fiecrui item pentru un domeniu dat. Validitatea de coninut nu depinde ns de
relevana aparent a coninutului itemilor ci de caracterul relevant al rspunsurilor subiectului la itemi
(Anastasi, 1976). Pentru a stabili validitatea de coninut a testului, orice analiz teoretic trebuie deci s
fie confirmat empiric (Kulcsar, 1980).
3. Compararea structurii testului cu domeniul de coninut. Astfel se va analiza dac itemii acoper toate
aspectele domeniului, respectiv dac ei sunt proporionali n test cu importana i mrimea fiecrui
aspect.
Deoarece acest tip de validare nu reclam metode i modele statistice, ea fcndu-se doar pe baza de
raionamente, o gsim n literatura de specialitate i sub denumirea de validare logic sau raional
(Thorndike, Hagen, 1961).
Validarea referitoare la coninut se impune a fi calculat n urmtoarele cazuri:

1. n cazul testelor de cunotine atunci cnd nu exista un criteriu extern adecvat pentru analiza validitii de
criteriu;
2. n cazul testelor utilizate la msurarea unui atribut ce nu poate fi exprimat printr-un construct (Murphy &
Davidshofer, 1991). De exemplu, se poate descrie cu uurina domeniul de coninut al unui test construit
pentru cunotine de aritmetic la elevii clasei I, dar este foarte dificil s gsim comportamente prin
care aceast caracteristic s poat fi observat.
3. n cazul testelor care evalueaz performana n munca n scopuri de selecie i clasificare a angajailor.
Acest tip de validare este adecvat cnd testul reprezint un eantion de comportamente din ceea ce
reprezint deprinderile i cunotinele specifice muncii respective.
CONSTRUCT
II.2.3. VALIDITATEA DE CONSTRUCT
Validitatea de construct reprezint msura n care se poate susine c testul msoar o variabil sau o
trstur specific. n termeni generali constructul este sinonim cu acela de concept (Kline, 1992) fiind
utilizat pentru a desemna o serie de fenomene ntr-un cadru tiinific. El este util atunci cnd poate fi
operaionalizat. Dac lum de exemplu conceptul de specie, el este extrem de util n investigare i
clasificare n tiinele naturii. Cu toate aceste nu exist o entitate distinct pe care putem s o etichetm
specie, ea nu poate fi deci studiat i observat direct. Este doar o categorie, creat n scopul nelegerii
diferitelor tipuri de organisme vii. Constructul este desprins dintr-o teorie psihologic care ofer cadrul menit
s fundamenteze analiza semnificaiei psihologice a rezultatelor la test. Vorbim de validitate relativ la
construct n cazul testelor de personalitate.
Pentru a putea fi utilizat i evaluat, un concept trebuie corect i precis operaionalizat. Aceast
operaionalizare impune descrierea constructului n termeni comportamentali concrei. Murphy &
Davidshofer (1991) identific urmtorii pai n operaionalizarea unui construct:
1. identificarea comportamentelor care au legtur cu constructul;
2. identificarea altor constructe, pentru fiecare decizndu-se dac au sau nu legtur cu constructul
msurat de test;
3. alctuirea pentru fiecare construct a unei liste de comportamente prin care acestea se exprim.
Pentru fiecare comportament, pe baza relaiilor dintre constructe se decide dac are sau nu
legtur cu constructul msurat de test.
Spunem despre un test c are validitate convergent dac evalueaz aceleai constructe ca i alte
teste, adic dac ntre scorurile sale i scorurile altor teste exist o relaie funcional. Un test are validitate
de discriminare dac evalueaz altceva dect alte teste despre care se tie c se refer la constructe ce nu au
legtur cu constructul msurat de test. Acest lucru nseamn c ntre scorurile la test i scorurile la alte teste
sau variabile nu exist o relaie funcional.
Campbell & Fiske (1959) propun ca i metod de verificare a validitii convergente i de
discriminare a unui test metoda bazat pe matricea trsturi multiple-metode multiple (tabelul 6). Pe baza
acestei metode sunt relevai coeficienii de corelaie ntre diferite msurtori ale acelorai constructe,
msurtori obinute prin teste diferite.
Metoda 1
Trsturi
Metoda 1
Metoda 2
Metoda 3
A1
Metoda 2
B1
C1
A2
Metoda 3
B2
C2
A3
B3
A1
(.89)
B1
.51
.(89)
C1
.38
.37
(.76)
A2
.57
.22
.09
(.93)
B2
.22
.57
.10
.68
(.94)
C2
.11
.11
.46
.59
.58
(.84)
A3
.56
.22
.11
.67
.42
.33
(.94)
B3
.23
.58
.12
.43
.66
.34
.67
(.92)
C3
.11
.11
.45
.34
.32
.58
.58
.60
Tabelul 2.6. (Campbell & Fiske, 1959). Matrice de tipul trsturi multiple-metode multiple
C3
(.85)
Tabelul de mai sus prezint toate corelaiile posibile ntre scorurile obinute cnd sunt evaluate trei
trsturi (A, B, C) prin trei metode / teste. Cele trei trsturi reprezint trsturi de personalitate cum ar fi:
(A) dominana, (B) sociabilitatea, (C) motivaia de realizare. Cele trei metode prin care se evalueaz aceste
caracteristici pot fi (1) un chestionar, (2) un test proiectiv, (3) scale de comportament. Astfel A1 indic
scorurile la dominan evaluate pe baza unui chestionar, A2 indic scorurile la dominan evaluate pe baza
unui test proiectiv, iar C3 indic scorurile pentru motivaia de realizare evaluat printr-o scal de
comportament. Tabelul include pe de o parte corelaiile ntre trsturi diferite evaluate pe baza aceleiai
metode (chenar ntreg) precum i corelaiile ntre trsturi diferite prin metode diferite (chenar ntrerupt).
Pentru verificarea validitii convergente n cazul constructului (A) avem urmtorii coeficieni:
.57 metoda 1 cu metoda 2
Validarea convergent a unui test este necesar, dar nu i suficient pentru a dovedi c testul
msoar ceea ce i-a propus; etichetele atribuite testelor reprezint trsturile sau caracteristicile pe care
testele ar trebui s le msoare. Corelaia mare ntre dou teste nseamn c testele msoar acelai lucru, ns
nu se poate spune c itemii cuprini n teste sunt reprezentativi pentru constructul pe care testele
intenioneaz s l msoare. Analiza factorial sau analiza de clusteri efectuat asupra itemilor din testele
care evalueaz aceleai constructe poate ajuta la explicarea corelaiilor dintre scorurile testelor (Albu, 1999)
1. Ce reprezint validitatea?
2. Ce reprezint validitatea de criteriu?
3. Ce reprezint validitatea de coninut?
4. C reprezint validitatea de aspect?
5. Care sunt caracteristicile unui criteriu?
6. Care sunt tipurile validitii de criteriu?
7. Ce trebuie s surprind analiza validitii de coninut?
Sumar
n orice proces de evaluare psihologic pornim de la definirea domeniului de evaluare i apoi
propunem o serie de modaliti cantitative prin care observm dac indivizii posed sau nu
caracteristicile domeniului respectiv. Deoarece definirea domeniului poate s fie mai mult sau mai
puin corect ne punem ntrebarea dac aptitudinile /caracteristicile msurate de test corespund
domeniului de evaluare. Astfel, pentru ca testul s fie considerat o msur bun a domeniului de
evaluare este necesar s obinem o serie de informaii care s reflecte faptul c testul msoar ceea
ce i-a propus. Din aceste cerine decurge problema validitii unei msurtori. Orice instrument de
evaluare psihologic trebuie s satisfac cerinele validitii. Exist diferite tipuri de validitate
psihologic. Aceste tipuri reprezint modaliti prin care se ncearc optimizarea unui instrument de
msurare psihologic. Modalitatea cea mai des ntlnit n literatura de specialitate (Anastasi, 1976;
Cohen, et. all, 2000) de a concepe validitatea o constituie urmtoarea taxonomie: 1. validitate de
criteriu, 2. validitate de coninut, 3. validitate de construct.
Bibliografie modul
V. ALGORITMUL CONSTRUCIEI UNUI TEST PSIHOLOGIC

5.Algoritmul construciei unui test psihologic
Scopul i obiectivele: n cadrul acestui modul obiectivul principal este ca studenii s nvee
modalitile cele mai bune de construcie de itemi astfel nct acetia s ofere imaginea acurat a
constructului de msurat.

Vei putea formula corect itemi

Vei realiza itemi utiliznd un format adecvat al opiunilor de rspuns
Vei realiza analiz de itemi
Vei putea calcula validitatea de construct
Vei putea realiza analiza factorial

n orice proces de evaluare psihologic pornim de la definirea domeniului de evaluare i apoi propunem
o serie de modaliti cantitative prin care observm dac indivizii posed sau nu caracteristicile domeniului
respectiv. Deoarece definirea domeniului poate s fie mai mult sau mai puin corect ne punem ntrebarea
dac aptitudinile /caracteristicile msurate de test corespund domeniului de evaluare. Astfel, pentru ca testul
s fie considerat o msur bun a domeniului de evaluare este necesar s obinem o serie de informaii care
s reflecte faptul c testul msoar ceea ce i-a propus. Din aceste cerine decurge problema validitii unei
msurtori. Orice instrument de evaluare psihologic trebuie s satisfac cerinele validitii. Exist diferite
tipuri de validitate psihologic. Aceste tipuri reprezint modaliti prin care se ncearc optimizarea unui
instrument de msurare psihologic. Modalitatea cea mai des ntlnit n literatura de specialitate (Anastasi,
1976; Cohen, et. all, 2000) de a concepe validitatea o constituie urmtoarea taxonomie: 1. validitate de
criteriu, 2. validitate de coninut, 3. validitate de construct.
1.
2.
3.
4.
5.

Formularea itemilor
Formatul opiunilor de rspuns
Analiza de itemi
Validitatea de construct
Analiza factorial
CONSTRUCIA I ANALIZA DE ITEMI

1. Construcia de itemi
Atunci cnd dorim s evalum ceva, prima ntrebare pe care ne-o formulm este ce anume dorim s
evalum, care este formatul pe care trebuie s-l aib itemii, astfel nct s ne ofere imagine acurat a
aspectului care ne intereseaz.
Formularea itemilor
Construirea de itemi este un proces pretenios, n continuare vom prezenta cteva aspecte orientative
legate de formularea lor:
1. Definii clar ceea ce avei de msurat, pentru a putea formula itemii ct mai specific posibil.
2. Generai o baz de itemi, evitai itemii redundani.
3. Evitai formularea unor itemi lungi, care ar putea fi greu nelei.
4. ncercai s formulai itemii ntr-un limbaj accesibil persoanelor evaluate cu acest instrument.
5. Evitai formularea unor itemi care surprind dou aspecte sau idei, de exemplu:
mi place s lucrez ntr-un mediu bine organizat, pentru c vreau s fiu cel
mai bun la locul de munc
Acest item are n vedere dou aspecte: mi place s lucrez ntr-un mediu bine organizat i vreau s
fiu cel mai bun la locul de munca, astfel n momentul n care persoana evaluat va alege o opiune de
rspuns, va fi imposibil de decelat la care din cele dou aspecte evaluate se refer.
6. ncercai s formulai itemi pozitivi i negativi n aceeai msur, pentru a evita biasarea care apare
n cazul formulrii itemilor pozitivi. Aceast biasare este determinat de tendina persoanei evaluate
de a fi de acord cu toi itemii testului.
Formatul opiunilor de rspuns
n funcie de constructul pe care dorim s-l evalum anumite formate devin mai mult sau mai
puin adecvate. Prezentm n continuare cele mai frecvent ntlnite forme ale itemilor.
a. Itemii dihotomici ofer dou alternative de rspuns (adevrat i fals), de obicei uneia dintre acestea i
se acord un punct la cotarea performanei persoanei evaluate. Itemii au forma unor afirmaii, iar sarcina
subiecilor este de a decide asupra valorii de adevra a acesteia.
Avantajele acestui tip de itemi sunt:
sunt uor de cotat;
sunt uor de construit (n construirea unui test de evaluare a cunotinelor profesorul poate
utiliza fragmente din suportul de curs pentru a formula itemii);
completarea lor nu necesit mult timp deoarece rspunsul nu trebuie scris;
necesit o evaluare n termeni absolui (alb sau negru);
Dezavantaje acestui tip de itemi sunt:
n cadrul testelor de cunotine acest tip de itemi pot ncuraja studenii s memoreze
materialul;
ansa de a ghici rspunsul corect este foarte mare, de 50%.
b. Itemi cu mai multe opiuni (polinomici) au un format similar celor dihotomici, atta doar c au
mai mult de dou alternative de rspuns. Se acord un punct numai unei opiuni de rspuns, iar celelalte
care nu sunt corecte poart denumirea de distractori. Itemii construii n scopul evalurii performanei
academice au de cele mai multe ori acest format.
Avantajele acestui tip de itemi sunt:
aceti itemii sunt uor de cotat;
sunt uor de construit;
completarea lor nu necesit mult timp deoarece rspunsul nu trebuie scris;
ansa de a ghici rspunsul corect este redus;
Dezavantajul cel mai mare al acestui tip de itemi se refer la construirea unor distractori buni,
procedeu care necesit mai mult timp. n cazul itemilor polinomici, probabilitatea de a ghici rspunsul
exist, dei este mai mic dect n cazul itemilor dihotomici (este de 25% n cazul a patru alternative, de
33.33% n cazul a trei alternative). Aceste lucru poate fi corectat prin utilizarea unei formule de ajustare a
scorului obinut de ctre fiecare persoan evaluat. Aceast formul se exprim astfel:
Scorul corect = R W/ n 1
R este numrul opiunilor corecte;
W este numrul opiunilor greite;
n este numrul opiunilor de rspuns ale itemilor.
Rspunsurile omise nu sunt incluse deoarece acestea nici nu cresc i nici nu duc la scderea
scorului final. De exemplu n cazul unui test de 100 de itemi, cu cte 4 opiuni de rspuns (din care una
singur este corect, celelalte trei sunt greite la fiecare item), dac vom completa aleator rspunsurile
corecte vom obine scorul de 25 (bine neles aceasta este o situaie ipotetic n realitate avem puine
anse s obinem tocmai 25 de puncte care este scorul mediu ateptat).
n acest caz, conform formulei anterioare, scorul corect este de:
25 - 75/4-1 = 25 25 = 0
Astfel, dup aplicarea coreciei scorul expectat este 0.
ntrebarea este n ce msur n cazul testelor de cunotine este recomandat ca studenii s ncerce
s ghiceasc rspunsul? n cazul n care nu se utilizeaz procedura de corecie rspunsul este clar,
ncercai s nimerii, dar nu i n cazul n care se utilizeaz procedura de corecie. Exist situaia n care
nu suntei siguri de rspunsul corect, dar tii sigur c dou din cele patru alternative de rspuns sunt
greite, n acest caz v sftuim s ncercai s ghicii. Formula de corecie are la baz asumpia c fiecare
din cele patru alternative de rspuns are aceeai probabilitate de a fi aleas, deci avei ansa de 1 la 4. n
cazul n care eliminai dou dintre alternative ansa dvs. crete la 1 la 2, ceea ce v ofer un avantaj
asupra procedurii de corecie.
c. Scale Likert prezint o form foarte popular, utilizat mai ales n cadrul testelor de
personalitate, n care persoana evaluat trebuie s-i exprime acordul sau dezacordul fa de a o afirmaie
(se numete scal Likert, pentru c a fost introdus de ctre Likert n 1932, n scopul evalurii
atitudinilor).
De exemplu la itemul: mi este fric de nlime.
Avem urmtoarele opiuni de rspuns:
1
acord total
acord
nici acord nici dezacord
dezacord
dezacord
total
Pentru a se evita alegerea unui rspuns neutru din partea celui evaluat (n cazul exemplului de mai
sus 3), se utilizeaz scale cu un numr par de opiuni de rspuns, de exemplu:
1
acord
puternic
acord
acord
dezacord
dezacord
dezacord
puternic
moderat
moderat
Acest tip de rspuns permite cotarea invers, scorul total este calculat prin nsumarea numerelor
corespunztoare rspunsurilor.
d. Scal categorial este similar cu scalele Likert, dar utilizeaz un numr mai mare de opiuni de
rspuns, de cele mai multe ori sunt utilizate scale cu 10 opiuni de rspuns. Pentru utilizarea lor adecvat este
foarte important ca punctele extreme ale scalei s fie clar definite i permanent reamintite celor care
realizeaz evaluarea.
Una dintre principalele probleme legate de acest tip de scal este numrul de categorii care poate fi
utilizat, care poate fi de 10 i 15 sau 66? S-au realizat cteva studii n acest sens, ele au artat c depinde
mult de scopul pe care l avem i de nivelul de expertiz al evaluatorului. De exemplu dac dorim s evalum
performana unor juctori de fotbal, o scal cu 7 nivele va fi suficient pentru ochiul unui nonexpert care nu
sesizeaz aspectele de finee, dar nu i n cazul unui expert, al unui antrenor care poate sesiza mai multe
diferene ntre juctori.
e. Q- sort este o metod utilizat cu precdere n evaluarea personalitii. Persoana evaluat va primi
o list de adjective pe care le va sorta n funcie de msura n care acestea l caracterizeaz.
!Cele mai frecvent ntlnite forme ale itemilor:

1.
2.
3.
4.
5.
itemi dihotomici
itemi polinomici
scale Likert
scale categoriale
Q - sort
2. Analiza de itemi
Care sunt criteriile pe baza crora putem spune c un item este bun?
Aa dup cum putem analiza un test din prisma fidelitii i validitii, la fel putem analiza
conform acestor criterii un item. Mai precis, un item bun discrimineaz ntre dou categorii
de subieci; putem spune de asemenea c un item este bun dac performana la item
coreleaz cu performana la test.
Care este procesul pe baza cruia putem analiza itemii? Dup ce am generat itemii, dup ce
acetia au fost aplicai unui eantion de subieci, ne intereseaz n ce msur ei pot fi considerai
itemi buni, respectiv la care dintre itemi ar trebui s renunm deoarece nu satisfac criteriile.
Totalitatea procedeelor statistice cunoscute sub denumirea de analiz de itemi servesc scopurilor
prezentate. Este important de menionat faptul c analiza de itemi cuprinde att procedee cantitative
ct i procedee calitative.
Analiza calitativ de itemi
Tehnicile de analiz calitativ a itemilor unui test constituie un procedeu des ntlnit n analiza
itemilor unui test. Tabelul 5 prezint o serie de aspecte ale analizei calitative de itemi pe care trebuie s le ia
n calcul o persoan care construiete un test.
Tabelul 2.3. Aspecte ale analizei calitative de itemi
Aspecte
ntrebri
Specificitatea cultural
Crezi c itemii testului sunt discriminativi pentru un grup anume de persoane?

De ce?
Validitatea de aspect
Testul msoar ceea ce crezi tu c msoar? Dac nu este aa ce anume din test
te ndreptete s susii acest lucru?

Examinatorul
Crezi c performana obinut la test a fost influenat de comportamentul

examinatorului? Dac da, care au fost acele comportamente care te-au
influenat?
Mediul de testare
Crezi c unele condiii ale mediului n care ai fost testat au influenat

performanele la test? Dac da, care au fost acelea?
Limbajul testului
Modalitatea de prezentare a instruciunilor sau alte aspecte verbale ale testului

au influenat performana la test?
Lungimea testului
Care este opinia ta n privina lungimii testului se vor discuta 2 aspecte:

timpul total i numrul itemilor
Rspunsurile aleatoare
Au fost itemi n test la care ai dat rspunsuri la ntmplare? Care este

procentajul de itemi la care ai rspuns la ntmplare? Ai folosit anumite
strategii specifice?
Corectitudinea testrii
Crezi c s-a putut tria la acest test? Dac da, care crezi c au fi sunt
modalitile de a tria?
Starea psihic/fizic a Cum ai descrie starea ta (psihic sau fizic) din timpul testului? Crezi ca
subiectului
n
timpul aceast stare ar putea influena n vre-un fel performana la test?
examinrii
Impresia general
Care este impresia ta general lsat de acest test? Care sunt sugestiile pe care
le-ai face pentru mbuntirea testului?
Preferine
Ce i-a plcut/displcut la acest test? Au existat pri ale testului pe care le-ai
resimit ca provocndu-i anxietate sau alte stri negative?
Pregtirea anterioar
Cum te-ai pregtit pentru acest test? Dac ar trebui s sftuieti pe cineva
privind modul n care ar trebui s se pregteasc pentru acest test ce i-ai
sugera?
Analiza cantitativ de itemi din perspectiva teoriei clasice

Atunci cnd ne referim la teoria clasic a testelor avem n vedere modelul de msurare prezentat n
cadrul modulului II. n acest subcapitol vom prezenta procedurile de analiz a itemilor bazate pe acest model
i pe asumpiile sale.
Procedurile statistice utilizate n analiza itemilor sunt nu de puine ori extrem de complexe, de aceea
scopul nostru este de a prezenta aici doar procedurile de baz. Vom prezenta n continuare modalitile
principale utilizate n analiza itemilor. Este important de reinut faptul c importana acestor procedee
depinde de funcia i obiectivele pe care autorul testului dorete s le atribuie testului.
Printre indicatorii care ar trebui luai n calcul n analiza de itemi se gsesc:
indicele de dificultate al itemului;
indicele de discriminare;
Indicele de dificultate al unui item
S presupunem c un item al unui test este rezolvat corect de toi subiecii. Putem spune c itemul
acesta este un item bun? Ce se ntmpl dac dimpotriv, nici un subiect nu rspunde corect la acest item. n
ambele cazuri putem considera c itemul respectiv nu este unul bun. Dac la un item toi subiecii rspund
corect nseamn c itemul este prea uor; dac dimpotriv, nici un subiect nu rspunde la un item atunci
putem spune c itemul este prea dificil. n ambele cazuri, se recomand rescrierea itemului sau eliminarea
din test.
Observaie. La unele teste de cunotine, primul item al testului este unul extrem de facil
(rspund deci majoritatea subiecilor). Acest lucru este indicat a se realiza fie pentru a
verifica dac subiectul a neles sarcina de lucru, fie pentru a-i forma o atitudine pozitiv
fa de test i astfel de a-i crete motivaia.
Indicele de dificultate al unui item (px) se obine calculnd proporia subiecilor care au rspuns
corect la item. Valoarea teoretic a indicelui de dificultate se gsete ntre 0 (dac nici un subiect nu a
rezolvat itemul corect) i 1 (dac toi subiecii au rspuns corect la un item).
Exemple.
1. Dac 50 din cei 100 de subieci la care a fost aplicat un test au rspuns la itemul 2 corect atunci
putem spune c indicele de dificultate al itemului 2 este 50/100 adic p2=0,5
2. Dac 75 din cei 100 de subieci la care a fost aplicat un test au rspuns la itemul 3 corect atunci
putem spune c indicele de dificultate al itemului 3 este 75/100 adic p3=0,75 i vom spune c itemul
3 este mai uor dect itemul 2.
Se poate observa c cu ct indicele de dificultate al itemului este mai mare cu att itemul este mai uor.
Deoarece p se refer la procentul celor care au rezolvat corect itemul, putem spune c cu ct este mai mare
valoarea indicelui cu att itemul este mai uor. Vorbim de indice de dificultate pentru testele de performan,
ns n cazul testelor de personalitate acest indice exprim procentul de subieci care a rspuns da la item,
sau n alte cazuri procentul de subieci care a agreeat itemul.
Un indice global de dificultate al itemilor unui test se poate calcula fcnd media indicilor fiecrui item.
Astfel se face suma tuturor indicilor de dificultate i rezultatul obinut se mparte la numrul itemilor
testului. Pentru o maxim discriminare, este important ca media indicilor de dificultate al unui test s fie 0.5,
deci indicii fiecrui item al testului s varieze ntre 0.3 i 0.8.
Ceea ce trebuie s lum n calcul cnd analizm indicele de dificultate al unui item este ansa ca
subiectul s dea rspunsul corect la ntmplare (adic de a ghici rspunsul). n acest caz indicele optim de
dificultate al unui item se gsete la mijlocul distanei dintre 1 i rata de rspuns la ntmplare care pentru un
item cu 2 rspunsurile este de 0,50. Mijlocul distanei dintre 1 i 0.50 este 0.75 deci indicele optim de
dificultate al acestui item este 0.75. n general acest indice optim se obine nsumnd valoarea ansei cu 1 i
apoi mprind valoarea obinut la 2, sau:
0,50+1,00=1,5
1,5/2=0,75
Pentru un item care are 5 variante de rspuns ansa de a rspunde corect este 1/5 adic 0,20. n acest
caz, indicele de dificultate optim se va obine astfel:
0,20+1,00=1,20
1,20/2=0,60
Indicele de discriminare al unui item
Indicele de discriminare al unui item (d) constituie o msur a ct de bine reuete un item s separe sau s
discrimineze subiecii care au obinut scoruri mari i cei care au obinut coruri mici la test. Mai precis, un
item este considerat discriminativ dac subiecii care au obinut o performan bun la test au rezolvat corect
itemul, respectiv dac cei care au obinut o performan sczut la test nu au rezolvat corect itemul. Dac
majoritatea subiecilor cu performan mare la test nu au rezolvat corect un item atunci nseamn c itemul
respectiv nu discrimineaz ntre categorii diferite de subieci. Similar, n cazul testelor de personalitate
subiecii care au un scor mare la o anumit trstur (evaluat de ntregul test) trebuie s aib un scor mare i
la un item care se presupune c evalueaz trstura respectiv.
Indicele de discriminare are n vedere performana eantionului la un item innd cont de
performana scorurilor din ultima treime sau din prima treime a distribuiei totale a scorurilor. Limita pn la
care putem considera prima/ultima arie a distribuiei scorurilor este valoarea de 27% din scoruri (Kelley,
1939). Indicele de discriminare al unui item este reprezentat de msura diferenei dintre proporia celor care
au rezolvat corect itemul i cei care nu au rezolvat corect itemul. Cu ct valoarea lui d este mai mare cu att
este mai mare numrul subiecilor buni care au rezolvat itemul. O valoare negativ pentru un d reprezint
o problem a itemului deoarece indic situaia n care cei care au avut o performan slab la test rezolv
corect itemul. n aceast situaie se cere revizuirea sau eliminarea itemului.
Exemplu.
S presupunem c un profesor administreaz un test la 119 persoane i selecteaz primele 27% i
ultimele 27% din performanele la test, selectnd 32 de teste n fiecare grup. n continuare n tabelul 3 sunt
prezentate valorile necesare calcului indicelui de discriminare pentru cei 5 itemi ai testului:
Tabelul 2.4. Indicele de discriminare pentru 5 itemi ipotetici ai unui test
Item
Superior (S)
Inferior (I)
S-I
d = (S-I)/n
20
16
32
0,43
30
10
20
32
0,63
32
32
32
1,00
20
20
32
0,00
32
-32
32
-1,00
Pentru itemul 1 se poate observa c 20 dintre subiecii care au obinut performane superioare la test
au rezolvat corect itemul, n timp ce 16 dintre cei care au obinut performane inferioare la test au rezolvat
corect itemul. Cu un indice de discriminare de 0.13, itemul 1 poate fi considerat un item bun deoarece mai
muli subieci dintre cei care au obinut o performan bun la test, au rspuns corect la item. Se poate
observa c cu ct este mai mare valoarea indicelui de discriminare cu att itemul separ mai bine categoriile
de subieci i este deci mai discriminativ. Valoarea cea mai mare pe care o poate avea un indice de
discriminare este +1 (toi subiecii care au obinut performana superioare la test au rezolvat corect itemul);
valoarea cea mai mic pe careo poate avea un indice de discriminare al unui item este 1 (nici unul dintre
subiecii care au obinut performane superioare la test nu au rezolvat corect itemul).
Analiza alternativelor de rspuns la itemi.
Calitatea fiecrei alternative de rspuns la itemii cu rspunsuri multiple poate fi analizat
comparnd-o cu performana obinut de subiecii care au avut performane superioare (primii 27%) i cei
care au obinut performane inferioare (ultimii 27%) la un test.
S analizm (tabelul 4) performana la 5 itemi ipotetici, test la care 32 de subieci au obinut
performane inferioare (I) i 32 de subieci au obinut performane superioare (S).
Tabelul 2.5. Rspunsurile la 5 itemi ai unui test (Rspunsul corect al fiecrui item este marcat cu caractere
ngroate)
a
24
10
13
12
Alternative
Item
1
32
22
15
15
14
13
16
Analiza itemilor.
Itemul 1 este un item bun mai multe persoane cu performan superioar la test l-au rezolvat corect.
Itemul 2 un numr mare de S au ales un distractor n locul rspunsului corect (rspunsul b). Acest item ar
trebui revzut.
Itemul 3 reprezint modalitatea optim de rspuns la un item; toii S au rspuns corect
Itemul 4 este mai dificil dect itemul 3 deoarece o proporie mai mic de S au rspusn corect la item, dar
discrimineaz mai bine (o proporie mai mic de I au rspuns cirect la item).
Itemul 5 este un item slab deoarece mai muli de I au rpsuns corect la item.
Analiza curbei caracteristice itemului
O modalitate de a afla noi informaii despre comportamentul itemilor este trasarea curbei caracteristice
itemului. Astfel, pentru un anumit item vom reprezenta pe axa X scorurile posibile la test, iar pe axa Y
proporia persoanelor care au rspuns corect la item (vezi figura 2.5).
1
0.5
0
0
10
15
20
25 30 35 40 45
Scorul total la test
50
55
60
65
Figura 2.5. Curba caracteristic a itemului

Scorul total reprezint nivelul de abilitate al persoanei evaluate, acest nivel nu poate fi msurat, doar
estimat pe baza acestui scor. Relaia dintre performana la unul dintre itemi i cea obinut la aplicarea
ntregului test ne ofer informaii legate de item.
Astfel figura de mai sus reprezint curba caracteristic a unui item relativ bun, observm cum curba
crete pe msur ce crete i scorul total la test, aceasta nseamn c itemul discrimineaz bine n cazul
tuturor nivelelor de performan.
S lum spre exemplu o persoan care are un scor mai mic de 20 puncte, conform curbei (Figura
2.6), aceasta va avea o probabilitate de aproape 40% de a rezolva corect acest item.
1
0.5
Figura 2.6. Curba caracteristic a itemului

n cazul n care scorul este mai mare, de 40 respectiv 65 de puncte, probabilitatea de a rspunde
corect este de 50 respectiv 100%.
Un item bun trebuie s prezinte un asemenea patern de comportament, adic pe msur ce crete
nivelul de abilitate a persoanelor testate s creasc i ansa de a fi rezolvat corect.
n figura 2.7 dorim s prezentm itemi care prezint un patern comportamental diferit de cel
1
prezentat anterior. V rugm s analizai curba trasat cu linie ntrerupt.
0.5
10
15
20
25 30 35 40 45
Scorul total la test
50
55
60
65
Figura 2.7. Curba caracteristic a 2 itemi

Observm c i dac nivelul de abilitate al persoanelor din eantionul nostru crete, probabilitatea de
a rspunde corect la acest item este aceeai, cu alte cuvinte itemul nu ne ofer nici o informaie despre
nivelul de abilitate al persoanei care l-a rezolvat (itemul trasat cu linie ntrerupt). Este posibil ca acest item
s msoare un alt aspect dect cel pe care l evalueaz ceilali itemi ai testului.
Spre deosebire de acesta, itemul trasat cu linie nentrerupt este rezolvat numai de persoanele care au
un scor brut de cel puin 25 de puncte, probabilitatea de a-l rezolva corect crete apoi treptat mpreun cu
nivelul de abilitate. Acest item este de dificultate medie, este puin probabil ca el s fie rezolvat corect de
persoanele cu scor mai mic de 25.
2. Analiza de itemi din perspectiva teoriei rspunsului la item (item response theory - IRT)
Teoria rspunsului la item propune un nou model de explicare i de analiz a itemului i a
comportamentului acestuia. Rasch (1960) a fost principalul promotor, care a propus primul model, dup care
acesta a fost dezvoltat i adaptat la diferite situaii de testare.
Aceste modele sunt unidimensionale, adecvate testelor care au ca scop evaluarea unei singure
trsturi latente sau multidimensionale, n cazul testelor care evalueaz mai multe dimensiuni. De asemenea
n funcie de rspunsul la item dihotomic sau cu mai mute opiuni avem mai multe tipuri de modele. n
continuare vom discuta despre modele unidimensionale dihotomice. n cazul modelelor IRT unidimensionale
diferenele dintre persoanele care alctuiesc eantionul pot fi explicate numai pe baza unei singure
dimensiuni.
Modelele IRT implic dou asumpii:
Curba caracteristic itemului (item characteristic curve - ICC) trebuie s aib o form specific
(acesta descrie modul n care modificrile la nivelul abilitii induc modificri la nivelul
probabilitii de apariie a rspunsului corect);
Trebuie ndeplinit condiia de independen local (aceasta nseamn c nu trebuie s avem

corelaie ntre itemi, n condiiile n care nivelul de abilitate al persoanelor evaluate este meninut
constant).
nainte a trece la prezentarea concret a unui model IRT, dorim s reamintim modelul care st la baza
teoriei clasice.
Acesta are urmtoarele asumpii:
Valoare expectat a erorii pentru fiacre persoan n parte este 0;

Eroarea nu covariaz cu alte variabile (aceste asumpii sunt importante pentru interpretarea erorii
standard de msurare).
Limitele care au fost reproate acestui model sunt urmtoarele:

1. sunt menionate dou variabile independente de care depinde scorul obinut de o persoan, i
anume scorul real i eroarea de msurare, dar acestea nu pot fi separate n mod real n
cadrului scorului obinut de ctre o persoan, astfel modelul este util n cadrul realizrii unor
estimri la nivel de populaie;
2. Din acest model sunt omise proprietile itemului care i ele au un impact asupra scorului
persoanei (dac de exemplu toi itemii sunt uori, atunci majoritatea persoanelor vor ave un
scor maxim);
Modelele IRT explic performana la test considernd doi sau mai muli parametrii: nivelul de
abilitate al persoanei evaluate, parametrul de dificultate al itemului, parametrul de discriminare,
probabilitatea de a ghici rspunsul corect, iat notaiile utilizate.
X is = rspunsul persoanei s la itemul i (care n cazul itemilor dihotomici poate fi 0 sau 1)
p(Xis=1) = probabilitatea ca persoana s s ofere un rspuns corect la itemul i
s = nivelul de abilitate al persoanei s
i = dificultatea itemului i
i = discriminarea itemului i
i = probabilitatea de a ghici rspunsul corect la itemul i
Vom explicita modelul de msurare utilizat de aceast abordare prin prezentarea modelului
uniparametric 1PL.
p(Xis=1) = 1/(1 + e (-( - i))
n cadrul acestuia probabilitatea de a rspunde un rspuns corect la un item i, depinde de nivelul de
abilitate al persoanei evaluate i de parametrul de dificultate al itemului. Acesta se numete model
uniparametric deoarece este considerat numai un singur parametru al itemului.
Dac analizm acest model la nivel grafic (vezi figura de mai jos, unde pe axa X este reprezentat
nivelul de abilitate al persoanei testate , iar pe axa Y probabilitatea de a oferi un rspuns corect la itemii a
cror curb este trasat), observm cum curbele caracteristice itemilor au acelai unghi de nclinare, ceea ce
difer este locaia lor de-a lungul nivelului de abilitate, practic aceast locaie este un indicator al dificultii
itemului. De exemplu itemul trasat cu linie ntrerupt (figura 2.8) este rezolvat de persoanele cu un nivel de
abilitate de 01 n proporie de aproximativ 55%, n timp ce aceleai persoane rezolv itemul trasat cu linia
punctat n proporie de 20%, deci acesta din urm este mai dificil dect primul.
0.5
0
-3
-2
-1
0
1
nivelul de abilitate
n cazul acestui model, parametrul de discriminare este meninut constant (egal cu 1).
n cadrul modelului biparametric 2PL, este considerat i parametrul de discriminare a itemului. n
figura 2.9 prezentm itemi care au acelai nivel de dificultate, dar care au o discriminare diferit.
p(Xis=1) = 1/(1 + e (- i ( - i))
0.5
0
-3
-2
-1
0
1
nivelul de abilitate i parametrii itemilor (dificultate, discriminare) pot lua valori ntre minus i plus infinit deoarece
sunt pe scal logit.
Discriminarea este reprezentat grafic prin gradul de nclinare a curbelor care descriu
comportamentul itemului. Un item cu o curb abrupt discrimineaz mai bine comparativ cu un item cu o
curb mai domoal. Acest lucru nseamn c o modificare mic la nivelul abilitii persoanelor testate va
duce la o modificare mare a probabilitii de a rspunde corect la item. Curba trasat cu linie nentrerupt
reprezint un item care are o discriminare perfect, deoarece nici o persoan cu un nivel de abilitate mai mic
de 0.25 nu va avea ansa de a rezolva acest item, n schimb persoanele cu o abilitate mai mare l vor rezolva.
Modelul tri-parametric 3PL, introduce i parametrul care permite estimarea ansei de a ghici
rspunsul corect la item.
p(Xis=1) = i + (1 - i)[1/(1 + e (- i ( - i))]
Probabilitatea de ghici rspunsul corect este vizibil n punctul n care curba caracteristic itemului
intersecteaz axa Y. Aceasta nseamn c i persoanele care au un nivel de abilitate sczut vor rezolva corect
itemul, ghicind rspunsul corect (Figura 2.10).
Utilizarea unui model 3PL devine necesar mai ales n situaia n care probabilitatea de a ghici
rspunsul corect este mare, de exemplu n cazul unui item cu 2 posibiliti de rspuns acesta este de 1 din 2,
spre deosebire de cea cu 6 opiuni, n care probabilitatea de a ghici rspunsul corect este semnificativ mai
mic, 1 din 6.
0.5
0
-3
-2
-1
0
1
Figura 2.10. Curba caracteristic itemului

Aceste modele reflect modul n care IRT a contribuit la perfecionarea procedurilor de
dezvoltare a instrumentelor de msurare, dar analiza atent a asumpiilor acestora ofer o nou
perspectiv asupra vechilor reguli de msurare, aa cum spunea Emreston i Reise (2000).
ANALIZA FACTORIAL
Una dintre metodele utilizate n validara de construct este analiza factorial. Analiza
factorial este definit ca un set de proceduri matematice utilizate pentru a identifica
dimensiunile care stau la baza uneui set de msurori empirice. Cel mai adesea este
utilizat pentru:
identificarea factorilor care stau la baza performanei la un test de aptitudini
identificarea unor dimensiuni ale personalitii
identificarea unor sindroame clinice
identificarea factorilor relaionai cu satisfacia n munc
n continuare vor fi discutate principalele concepte implicate n analiza factorial.
Concepte generale
Atributele interne pot fi gndite ca i constructe ipotetice. Ele nu sunt cu necesitate reale
sau concrete. Acestea sunt mai degrab constructe care aa cum vom vedea pot fi utilizate pentru a
nelege i a explica o serie de fenomene observate. Aceste constructe ipotetice nu trebuie vzute ca
o critic a abordrii factoriale. Utilizarea constructelor ipotetice constituie o practic obinuit n
multe domenii ale tiinei. De exemplu, fizicienii utilizeaz o serie de constructe (gravitate,
magnetism) pentru a explica o serie de fenomene. Aceste fore reprezint de fapt constructe
neobservabile, a cror existen a fost inferat pe baza fenomenelor observabile. Aceste constructe,
mpreun cu teoriile care le nsoesc pot explica o serie de fenomene observabile. ntr-o manier
asemntoare, analiza factorial postuleaz c exist atribute interne neobservabile care pot explica
variaia i covariaia dintre o serie de atribute de suprafa, adic acele atribute care pot fi
msurate i observate direct.
Un concept teoretic central al analizei factoriale l constituie deci relaia dintre atributele interne i
cele de suprafa. Principiul de baz este acela c atributele interne influeneaz sistematic atributele de
suprafa. Acest fapt implic ideea c atunci cnd avem o msur a unui atribut de suprafa, aceast msur
este, cel puin n parte, rezultatul influenei atributelor interne. De exemplu, scorul obinut de o persoan la
un test de adunare (atribut de suprafa) este influenat de aptitudinea numeric (atribut intern). Tradiional,
aceste relaii dintre atributele de suprafa i cele interne sunt considerate a fi lineare.
n continuare este util s distingem ntre 2 tipuri de atribute interne sau factori: factori comuni i
factori specifici. Factorul comun este definit ca un atribut intern care afecteaz /influeneaz mai mult de o
variabil de suprafa. De exemplu, dac factorul aptitudine numeric influeneaz mai mult dect o variabil
de suprafa (s presupunem c influeneaz att adunarea ct i nmulirea) atunci acesta factor este un
factor comun. Factorii specifici influeneaz doar o singur variabil de suprafa; astfel poate exista un
numr de factori specifici pentru fiecare variabil de suprafa. Prin schimbarea variabilelor de suprafa
factorul comun se poate transforma n factor specific dac se nltur toate variabilele de suprafa care l
alctuiesc, mai puin una; sau dimpotriv, dac lrgim bateria, un factor specific se poate transforma ntr-un
factor comun dac el influeneaz mai multe variabile de suprafa.
n afara celor 2 variabile interne (factorii comuni i specifici) care influeneaz variabilele de
suprafa, exist o a treia influen asupra acestora. Aceast a treia influen o constituie erorile de msur
asociate observrii atributelor de suprafa. Aceste erori sunt reprezentate n analiza factorial ca factori
adiionali, dei ele nu fac parte din cadrul atributelor interne; adic nu reprezint caracteristici neobservate
ale indivizilor. Mai degrab erorile de msur apar ca rezultat al influenelor datorate msurtorii atributelor
de suprafa. Se poate observa relaia direct ntre factorii de suprafa i erorile de msur; astfel, cu ct
fidelitatea msurtorilor este mai mare cu att erorile sunt mai mici. Deci, utilizarea unor teste mai puin
fidele va influena erorile de msur, dar nu n mod necesar factorii comuni sau specifici. De asemenea,
adugarea sau nlturarea unor variabile de suprafa va influena factorii comuni sau specifici, ns nu va
influena erorile de msur.
Factorii specifici i erorile de msur caracteristice unui set de observaii se pot combina rezultnd
factori unici. Un factor unic este alctuit dintr-un factor specific caracteristic unei singure variabile de
suprafa precum i din eroarea de msur asociat variabilei de suprafa respective. Factorul unic se va
modifica la orice modificare a factorului specific sau a erorii de msur.
Pornind de la aceste definiii ale factorilor, innd cont de faptul c factorii influeneaz atributele de
suprafa se poate nelege c factorii se combin pentru a putea explica un anumit nivel al trsturilor de
suprafa. Mai precis, orice nivel al atributelor de suprafa poate fi vzut ca o rezultant a factorilor
relevani. De exemplu, scorul unei persoane la un test de adunare poate fi vzut ca o rezultant a factorului
comun aptitudine numeric i a factorului specific asociat adunrii. De asemenea, eroarea de msur
contribuie la scorul obinut la testul de adunare. Generaliznd putem spune c diferenele individuale sau
variana atributelor de suprafa poate fi atribuit factorilor adiaceni acestor atribute. Astfel diferenele la
nivelul atributelor de suprafa sunt datorate diferenelor la nivelul factorilor ce influeneaz aceste atribute i
de asemenea diferenele sunt datorate i erorilor de msur.
Distincia realizat anterior ntre factorii comuni, specifici i eroarea de msur ne ajut s nelegem
modul n care factorii explic variana atributelor de suprafa. Este important de reinut faptul c variana
observat la nivelul atributelor de suprafa poate rezulta din trei surse. O parte din varian este datorat
influenei factorilor comuni aceasta poart numele de varian comun sau comunalitate. O alt parte din
variana atributelor de suprafa poate fi datorat factorului specific aceast varian este denumit varian
specific sau specificitate. Cea de-a treia surs de varian este datorat erorilor de msur i este denumit
variana erorii de msur. Variana specific este adesea combinat cu variana erorii de msur i formeaz
variana unic sau unicitatea. Altfel spus, variana observat la nivelul unui atribut de suprafa este datorat
n parte factorilor care influeneaz i alte atribute de suprafa i n parte factorilor care influeneaz doar
atributul respectiv.
Printr-o extensie a conceptelor putem spune c analiza factorial ine cont i de covariana dintre
variabilele de suprafa. Adesea se poate observa c variabilele de suprafa dintr-un domeniu specific tind
s coreleze ntr-o anumit msur una cu cealalt. Potrivit analizei factoriale aceast corelaie este datorat
influenei factorilor comuni. Deci, o corelaie ntre dou variabile de suprafa este datorat dependenei
celor dou variabile de unul sau mai muli factori comuni. De exemplu scorul la un test de adunare va tinde
s coreleze pozitiv cu scorul la un test de nmulire deoarece ambele variabile depind de acelai factor comun
aptitudinea numeric. Din contr ns, rezultatul la testul de adunare va corela mai puin cu rezultatul la un
test de citire deoarece cele dou variabile de suprafa sunt influenate de factori comuni diferii. Putem
spune c nivelul de intercorelaie dintre atributele de suprafa este rezultatul dependenei acestor atribute de
aceiai factori comuni.
Este extrem de important a se reine faptul c doar factorii comuni pot explica corelaia variabilelor
de suprafa; factorii unici nu determin astfel de corelaii. La fel, factorii specifici sau erorile de msur nu
pot determina corelaii ntre atributele de suprafa deoarece prin definiie ei influeneaz doar o singur
variabil de suprafa.
Pentru a sumariza aceste principii putem spune c ntr-un anumit domeniu exist un numr mic de
factori comuni care influeneaz un vast numr de atribute de suprafa. Variaia factorilor de suprafa este
datorat n parte variaiei factorilor comuni. Ceea ce rmne se datoreaz factorilor unici sau factorilor
specifici i erorilor de msur. Covariana variabilelor de suprafa este atribuit dependenei acestora de
aceiai factori comuni.
n continuare (figura 5) vor fi prezentate conceptele i principiile discutate anterior n forma propus
de Tucker (1940) pentru a ilustra teoria analizei factoriale. n cadrul diagramelor, ptratele reprezint
atributele de suprafa, iar cercurile reprezint atributele interne i ali factori. Sgeile unidirecionale
exprim o relaie liniar (printr-un proces cauzal), iar cele bidirecionale reprezint corelaii fr influen
cauzal.
Atribute de suprafa
Factori comuni
(atribute interne)
Factori specifici
(atribute interne)
Factori unici
Factori ERM
Figura 2.11. Relaia dintre atributele de suprafa i cei trei

tipuri de factori
! DE REINUT:
Teoria factorial este o teorie care explic dinamica i influenele care determin variaia
i covariaia atributelor de suprafa.
Obiectivele analizei factoriale

1. Identificarea factorilor adiaceni variabilelor de suprafa
Obiectivul primar ala analizei factoriale este acela de a determina umrul i natura factorilor comuni precum
i modul n care acetia influeneaz atributele de suprafa. Prin identificarea factorilor care explic un mare
numr de variabile se pot nelege mai bine datele de care dispunem.
De exemplu o companie aerian dorete s studieze aproximativ 50 de variabile pe care le consider
importante din puntul de vedere al consumatorului care trebuie s opteze pentru o companie (variabilele pot
fi: respectarea orelor de aterizare /decolare, flexibilitatea orarului, amabilitatea personalului de zbor,
facilitile oferite n timpul zborului, etc.). Dac pe baza analizei factoriale aceste 50 de variabile pot fi
explicate pe baza unor factori vom nelege mai bine variabilele fundamentale care stau la baza alegerii
fcute de consumator.
2. Screeningul variabilelor
O a doua utilizare a analizei factoriale se refer la analiza pe baz de screening a variabilelor care ulterior pot
fi incluse n investigaii statistice ca analiza de regresie. Deoarece analiza factorial identific grupe de
variabile care sunt corelate ntre ele putem opta la alegerea unei singura variabile din fiecare factor i
includerea acestei variabile ntr-o ecuaie de predicie.
3. Sumarizarea datelor
O alt aplicaie a analizei factoriale se refer la flexibilitatea de a extrage ci factori se dorete dintr-un set
iniial de variabile. Primii factori extrai dintr-un set de variabile explic cea mai mare parte din variana
acestora; cu fiecare extragere ulterioar se obine tot mai puin.
4. Selecia variabilelor
AF ne permite extragerea factorilor diferii dintr-un set de variabile. De exemplu dac se pune problema
selecie caracteristicilor definitorii ale unui automobil n vederea construciei unei reclame ne intereseaz s
pstrm un numr de variabile rezonabil pentru a putea construi reclama. Este important ns ca acest
variabile selectate s nu se refere la acelai factor, ele trebuind s nu coreleze ntre ele.
Lund n considerare aspectele prezentate privind validitatea unui test psihologic, se poate spune c
trebuie s avem ntotdeauna n vedere funcia i scopul pe care le va avea testul pentru a putea aprecia corect
tipurile de validitate. Exemplul (tabelul 7) urmtor ilustreaz modul n care putem privi validitatea unui test
de cunotine la matematic (Anastasi, 1976):
Tabelul 2.7. Tipuri de validitate a unui test de cunotine matematice. (Anastasi, 1976).
SCOPUL TESTRII
PROBLEMA STUDIAT
Evaluarea cunotinelor de Ct de mult a nva

matematic n ciclul primar
matematica predat?
TIPUL DE VALIDITATE
elevul
din Validitate de coninut
Anticipare a performanelor Care vor fi performanele elevului n Validitate predictiv

elevului n gimnaziu
gimnaziu la matematic?
Psihodiagnosticul dificultilor Care sunt dificultile specifice pe care le Validitate concurent
de nvare
ntmpin elevul n nvarea matematicii
Evaluarea gndirii logice
Prin ce
elevului?
se
caracterizeaz
gndirea Validitate de construct
! Obiectivele analizei factoriale sunt:

Identificarea factorilor adiaceni variabilelor de suprafa

Screeningul variabilelor
Sumarizarea datelor
Selecia variabilelor
1. Care sunt aspectele eseniale de care trebuie s inem cont cnd formulm
un item?
2. Ce sunt itemii dihotomici i care sunt avantajele i dezavantajele lor?
3. Ce sunt itemii polinomici i care sunt avantajele i dezavantajele lor?
4. Ce sunt scalele Likert?
5. Ce este o scal categorial?
6. Ce reprezint Q Sort?
7. Care este procesul pe baza cruia se realizeaz analiza factorial?
8. Ce reprezint analiza calitativ de itemi?
9. Ce reprezint analiza cantitativ de itemi?
10. Care sunt obiectivele analizei factoriale?
Sumar
Atunci cnd dorim s evalum ceva, prima ntrebare pe care ne-o formulm este ce anume
dorim s evalum, care este formatul pe care trebuie s-l aib itemii, astfel nct s ne ofere
imagine acurat a aspectului care ne intereseaz. Pentru a construi itemii trebuie s parcurgem un
proces pretenios n cazul cruia trebuie s urmm o serie de pai. Mai mult dect att, trebuie s
inem cont i de formatul opiunilor de rspuns. Astfel, n funcie de constructul pe care dorim
s-l evalum anumite formate devin mai mult sau mai puin adecvate. Pentru a putea spune
despre un item c este bun sau nu trebuie s inem cont de o serie de criterii pe care le
descoperim n urma unei analize a itemilor. Aa dup cum putem analiza un test din prisma
fidelitii i validitii, la fel putem analiza conform acestor criterii un item. Mai precis, un item
bun discrimineaz ntre dou categorii de subieci; putem spune de asemenea c un item este bun
dac performana la item coreleaz cu performana la test. Un element foarte important este
validitatea de construct care reprezint msura n care se poate susine c testul msoar o
variabil sau o trstur specific. Una dintre metodele utilizate n validara de construct este
analiza factorial. Analiza factorial este definit ca un set de proceduri matematice utilizate
pentru a identifica dimensiunile care stau la baza uneui set de msurori empirice.

1. Mai jos sunt prezentate descrierile ctorva studii de validare. Citii fiecare descriere i
identificai orice probleme poteniale care ar putea afecta rezultatele.
A. Un profesor de matematic de la un liceu, face un test pentru a identifica elevii supradotai la
matematic i aplic acest test la o sut de elevi din coal. Cei care vor obine cel mai mare punctaj la test
vor avea posibilitatea s se nscrie la facultate. La sfritul semestrului, profesorul face o corelaie ntre
scorul obinut la test i notele obinute de elevi la matematic. El nu a gsit nici o corelaie semnificativ
ntre aceste variabile.
B. Un psiholog industrial face un test pentru a selecta personal pentru un serviciu cleric la o
anumit corporaie i cere supraveghetorilor s noteze muncitorii prezeni pe o scal cu urmtoarele
categorii : peste medie, mediu, sub medie. Dup aceasta psihologul testeaz muncitorii din categoria
peste medie i sub medie i compar mediile celor dou grupuri. n urma analizei psihologul gsete o
diferen semnificativ n favoarea grupului peste medie.
2. Pentru fiecare din urmtoarele situaii indicai ce tip de studiu de validare ar fi cel mai
potrivit.
A. Un psiholog social dezvolt un inventar cu scopul de a identifica peroanele care lucreaz n
domeniul sntii care prezint sindromul de epuizare (burnout). Pentru a defini sindromul de
burnout se utilizeaz o varietate de comportamente cum ar fi: absenteismul, eec n a respecta
politica firmei, relaii reci cu colegii i efii etc.
B. Un psiholog al dezvoltrii specializat n problemele adolescenilor dorete s dezvolte un inventar
care s se adreseze elevilor din clasele IX X pentru a prezice cine va trece mai departe n clasele
XI-XII.
C. Un test de aptitudini non-verbale este dezvoltat pentru copiii precolari cu deficit de auz. Se
intenioneaz ca testul s fie o msur de screening pentru identificarea copiilor care ar putea avea
dificulti n nvarea cititului (ncadrai ntr-o clas cu copii normali).
Bibliografie modul
Stan, A. (2002). Testul psihologic. Evoluie construcie, aplicaii. Editura Polirom, P 202-242
VI. ASPECTE METODOLOGICE I CONCEPTUALE ALE CONSTRUCIEI TESTELOR

6. Aspecte metodologice i conceptuale ale construciei testelor psihologice
Scopul i obiectivele: obiectivul esenial al acestui modul este ca studenii s poat face diferena
ntre evalurile psihologice, acestea fiind diferite cel puin n cazul a trei aspecte.

Vei diferenia ntre tipurile de evaluare psihologic

Vei ti care este algoritmul de construcie al unui instrument de evaluare
Vei putea enumera tipurile de scale utilizate
Vei recunoate aspectele care in de coninutul manualului unui test
Atunci cnd dorim s evalum ceva, prima ntrebare pe care ne-o formulm este ce anume
dorim s evalum, care este formatul pe care trebuie s-l aib itemii, astfel nct s ne ofere imagine
acurat a aspectului care ne intereseaz. Pentru a construi itemii trebuie s parcurgem un proces
pretenios n cazul cruia trebuie s urmm o serie de pai. Mai mult dect att, trebuie s inem
cont i de formatul opiunilor de rspuns. Astfel, n funcie de constructul pe care dorim s-l
evalum anumite formate devin mai mult sau mai puin adecvate. Pentru a putea spune despre un
item c este bun sau nu trebuie s inem cont de o serie de criterii pe care le descoperim n urma
unei analize a itemilor. Aa dup cum putem analiza un test din prisma fidelitii i validitii, la fel
putem analiza conform acestor criterii un item. Mai precis, un item bun discrimineaz ntre dou
categorii de subieci; putem spune de asemenea c un item este bun dac performana la item
coreleaz cu performana la test. Un element foarte important este validitatea de construct care
reprezint msura n care se poate susine c testul msoar o variabil sau o trstur specific.
Una dintre metodele utilizate n validara de construct este analiza factorial. Analiza factorial este
definit ca un set de proceduri matematice utilizate pentru a identifica dimensiunile care stau la
baza uneui set de msurori empirice.

1. Aspectele care difereniaz evalurile psihologice
2. Algoritmul de construcie al unui instrument
3. Tipuri de scale
4. Coninutul manualului unui test
ASPECTE CONCEPTUALE I METODOLOGICE ALE CONSTRUCIEI

TESTELOR PSIHOLOGICE
Evalurile psihologice nu sunt echivalente. Ele difer n cel puin trei aspecte. n primul rnd
ele difer din punctul de vedere al ntrebrilor teoretice la care ncearc s rspund. n al doilea
rnd ele difer n privina structurii logice. Iar n al treilea rnd ele difer din perspectiva
informaiilor pe care ele le aduc, sau mai precis din perspectiva greutii inferenelor pe care aceste
le suport.
Algoritmul de construcie al unui instrument de evaluare ar trebui s respecte urmtorii pai
1. POSTULATE
Asumpii, valori, credine, metafore
2. CONSTRUCTE TEORETICE FORMALE

Constructe ipotetice, procese, relaii, predicii (e.g.
memorie implicit, anxietate, depresie)
3. REFERENTI
Msuri obiective sau reflecii ale constructelor (e.g.
anxietate: transpiraia palmelor, etc.)
4. METODE INSTRUMENTALE
Sarcini, tehnici, teste, instrumente proceduri
5. MODEL DE MSUR
atribuirea unei scale de msur fenomenelor
6. CULEGEREA DATELOR
7. ANALIZA DATELOR
metode statistice, modele matematice
8. INTERPRETRI I INFERENE
Inferena statistic, evaluare logic, analiza modelului
Figura 1. Componente ale unui model tiinific de construcie a unui intrument de evaluare (McFall & Townsend, 1998)
Scopul oricrei evaluri psihologice este acela de a clarifica (de a oferi informaii) o serie de
probleme, fie ele teoretice sau practice. Astfel putem spune c exist o relaie esenial ntre teorie i
evaluare: evaluarea trebuei astfel construit nct s rspund unor ntrebri teoretice.
Nivelul de plecare n construcia unui instrument de evaluare se gsete la nivelul
postulatelor care servete ca punct fundmental (Polya, 1957, Smith, 1984). Postulatele sunt simplu
tratate ca ceva ce este dat. O dat stipulate ns ele constrng tot procesul ulterior, intrun mod
adesea foarte subtil (Lakoff & Johnson, 1980).
Nivelul urmtor cuprinde constructele teoretice formale. Acest nivel trebuie s fie
congruent cu postulatele anterioare deoarece deriv logic din acestea. Cu toate acestea ns exist o
multitudine de teorii plauzibile care pot satisface postulatele nct cercettorii trebuie s ia n calcul
o serie de aspecte legate de validitatea teoriilor care adesea sunt n competiie. Este vorba deci de a
opta, pe baza unei analize de cele mai multe ori dificile, pentru o teorie innd cont de atuurile
acesteia n competiia cu altele. Personalitatea ca i construct glogal sau temperamentul ca i
construct mai specific pot fi abordate din perspectiva mai multor teorii. Opiunea pentru o teorie a
personalitii se face, n construcia unui instrument de evaluare, la acest nivel al
constructelorteoretice formale.
Procesul de validare al unui test ncepe la nivelul constructelor teoretice prin formularea
constructelor derivate dintr-o teorie, din cercetri anterioare sau din observaii sistematice ale unui
domeniu relevant de comportamente. Itemii testului vor fi mai trziu (la nivelul referenilor)
formulai, astfel nct s ating cerinele formulate la acest nivel.
La acest al doilea nivel pe care l-am putea denumi acela de conceptualizare al testului
trebuie s ne punem urmtoarele ntrebri:
Ce dorim s msoare testul? Aceast ntrebare este legat de modul n care este definit
constructul i de cum aceast definiie este diferit de altele care i propun s msoare acelai
construct.
Care este obiectivul testului? Cnd sau pentru ce scop va fi utilizat testul? Va fi analizat la
acest nivel n ce msur obiectivul testului este diferit de testele existente.
Este nevoie de construcia acestui test?
Cine va utiliza testul? Clinicienii, psih. educaional sau alte categorii.
Cui se adreseaz testul? Cine este populaia int. Aici se impune o analiz detaliat a
caracteristicilor populaiei (vrst, sex, mediu socioeconomic ce factori culturali pot influena
performana la test). Ce nivel de citire este necesar pentru aplicarea testului.
Cel de al treilea nivel, al referenilor, cuprinde msurtori observabile ale constructelor
formulate. Astfel, constructul de anxietate se poate exprima la nivelul referenilor prin msurtori
ale conductanei electrice a pielii, prin rata cardiac, etc.
Pentru ca datele de la nivelul anterior s poat fi culese avem nevoie de o serie de medode
instrumentale. Este vorba de generarea unor msurtori, care n cadrul testului adesea iau forma
itemilor.
Itemii (vezi modulul 1) unui test sunt:
n majoritatea cazurilor generai de psihologi pornind de la constructele formulate;
n cazul testelor de cunotine itemii sunt formulai de specialiti n domeniul respectiv;
Pot fi luai din testele existente.
n general, este generat un numr mai mare de itemi dect numrul final al itemilor testului,
crendu-se banca de itemi. Aiken (1994) recomand ca numrul itemilor de plecare s fie mai mare
cu 20% dect lungimea tesului.
Msurrile sunt realizate pe diferite tipuri de scale. Acest problematic a alegerii scalei sau
a formatului itemlor se ncadreaz la nivelul modelului de msurare. Nu exist un tip general
corect de scal de msurare.
Tipuri de scale.
Scala de tip Likert.
Este o scal sumativ (propus de Likert n 1932)
utilizat destul de des n psihologie mai ales n msurarea atitudinilor.
Este o scal ordinal (distana dintre 2i 3 nu este ntotdeauna egal cu distana dintre 4 i 5)
Format: niciodat
rareori cteodat
adesea ntotdeauna
Are 5 trepte
Dezavantaje: nu exist o interpretare identic pentru fiecare subiect aceea ce nseamn fiecare
categorie prezentat.
Scalele Guttman
Cnd se dorete ierarhizarea unor comportamente.
Se prezint comportamentele i cere ierarhizarea acestora prin atribuirea de numere (de la 1 la
X, pentru X comportamente)
Nivelul culegerii datelor se refer la obinerea unei variante a testului i aplicarea acesteia
pe populaia int. Se in cont n aceast faz de condiiile de standardizare.
Analiza datelor cuprinde n cadrul testului procesul de analiz a itemilor, analiza tipurilor
de validitate de criteriu precum i aprecierea fidelitii testului.
Dac rezultatele obinute sunt satisfctoare se trece la construirea manualului testului. Dac pe
baza rezultatelor obinute nu se pot face inferene valoroase atunci se recomand identificarea
erorilor i reluarea procedeului.
Manualul unui test trebuie s cuprind aspectele pe baza crora utilizatorul testului s poat analiza
valoarea testului, s poat utiliza testul i s poat interpreta rezultatele acestuia. Aceste aspecte se
refer la informaii legate de:
1. Datele de identificare ale testului

- autorul (autorii) testului
- editura care a publicat testul
- anul publicrii
- numele testului
2. Standardizarea testului
- pe cte persoane a fost etalonat testul
- care sunt caracteristicile demografice ale eantionului
- cum s-a fcut eantionarea
3. Fidelitatea testului
- care au fost metodele utilizate pentru estimarea fidelitii testului
- n ce msur valorile coeficienilor de fidelitate sunt sufiecte pentru scopul testului
4. Validitatea testului
- care au fost criteriile pe baza crora s-a validat testul
- n ce msur testul este satisfctor pentru ceea ce i propune s msoare
5. Modul de aplicare, cotare i interpretare a rezultatelor
- care sunt instruciunile de lucru
- care sunt criteriile de acordare a punctajului pentru rspunsurile subiecilor?
- n ce msur testul poate fi cotat electronic (acolo unde este cazul)
6. Consideraii practice
- ct timp dureaz aplicarea testului
care este nivelul de pregtire pe care trebuie s l aib cel care administreaz testul i cum se poate obine
aceast pregtire.
1. Care sunt paii algoritmului de construcie al unui instrument de

evaluare?
2. Care este scopul oricrei evaluri psihologice?
3. Ce ntrebri trebuie s ne punem la nivelul de conceptualizare al
testului?
4. La ce se refer nivelul de culegere al datelor?
Sumar
Evalurile psihologice nu sunt echivalente. Ele difer n cel puin trei aspecte. n primul
rnd ele difer din punctul de vedere al ntrebrilor teoretice la care ncearc s
rspund. n al doilea rnd ele difer n privina structurii logice. Iar n al treilea rnd ele
difer din perspectiva informaiilor pe care ele le aduc, sau mai precis din perspectiva
greutii inferenelor pe care aceste le suport. Pentru construcia unei scale trebuie s se
respecte un algoritm. Un element foarte important l reprezint manualul testului.
Bibliografie modul
Kaplan, R.M. i Saccuzzo, D.P. (2001) Psychological Testing, Principles,

Applications and Issues, Wadsworth Thomson Learning, Fifth Edition. p 529-563
III. Anexe
Bibliografia complet a cursului :
Obligatorie:
1. Suportul de curs, Psihodiagnostic
2. Capitolele aferente tematicii de mai sus din urmtoarele surse:
- Albu, M. (1998). Construirea i utilizarea testelor psihologice, Editura Clusium.
- Albu, M. (2000). Metode i instrumente de evaluare n psihologie. Editura Argonaut.
- Stan, A. (2002). Testul psihologic. Evoluie construcie, aplicaii. Editura Polirom.
- Haynes, S. N., Richard, D. & Kubany, E. S. (1995). Content validity in Psychological
Assessment: A functional approach to contcepts and methods. Psychological
Assessment,7,3, 238-247
- Messick, S. (1995). Validity of Psychological Assessment. Validation of Inferences
From Persons' Responses and Performances as Scientific Inquiry Into Score Meaning.
American Psychologist, September 1995 Vol. 50, No. 9, 741-749.
Facultativ:
- Anastasi, A. (1988). Psychological Testing. (6th ed). New York: Macmillan.
- Murphy,K & Davidshofer, C. O. (1994). Psychological testing: Priciples and applications
(3rd ed). Englewood Cliffs, NJ: Pretince Hall.
- www.rash.org
Increasing the Validity of Adapted Tests: Myths to be Avoided and Guidelines

for Improving Test Adaptation Practices1,2
Ronald K. Hambleton and Liane Patsula
University of Massachusetts at Amherst
Adapting or translating achievement, ability, and personality tests and questionnaires
prepared in one language and culture into other languages and cultures has had a long
history in educational and psychological testing though this fact is not well-known
among educational researchers and measurement specialists. At least five reasons can
be found in the literature for adapting tests:
1. very often adapting a test is considerably cheaper and faster than constructing
a new test in a second language,
2. when the purpose for the adapted test is cross-cultural or cross-national
assessment (such as with many credentialing exams), an adapted test is the
most effective way to produce an equivalent test in a second language,
3. there may be a lack of expertise for developing a new test in a second
language,
4. there is a sense of security that is associated with an adapted test more so than
a newly constructed test especially when the original test is well-known, and
5. fairness to examinees often results from the presence of multiple language
versions of a test (see Hambleton & Patsula, 1998).
Unfortunately, though the practice of adapting or (simply) translating tests can be
traced to the intelligence tests of the French psychologist Alfred Binet at the
beginning of this century, there is substantial evidence to suggest that improved
methods for adapting or translating tests from one language and culture to others are
needed, and that considerably more attention should be given to this important task
than it is typically given by researchers and/or test developers. Too often in practice
the test adaptation process seems to be viewed as a routine task that can be completed
by anyone who knows the relevant languages. One consequence is adapted tests in the
target languages of interest with only superficial equivalence to the tests in the source
language.
The purposes of this paper are two-fold: First, a set of myths or problems which need
to be discarded/overcome about the test adaptation process will be presented. These
myths are widespread and undermine effective test adaptation initiatives. Second,
steps for adapting tests will be offered along with a discussion of the importance of
each step in the test adaptation process.
Myths About Adapting Tests
There are a number of myths associated with adapting tests which appear in
measurement practice and should be discarded as quickly as possible:
Myth 1. The preferable strategy is always to adapt an existing test rather than
develop a new test for a second language group.
There are many good reasons for adapting a test, but there are reasons for not
proceeding with a test adaptation as well. Especially when cross-cultural comparisons
are not of interest, it may be substantially easier and more relevant to construct a new
test for a second language group. This avoids any complications with copyright,
insures that the format will be suitable, and any desired modifications in the definition
of the construct of interest can be made at the outset of the test development process.
Sometimes, too, it may be desirable not to adapt a test but rather to require all
examinees to take a test in a single language. For example, in the United States, there
has been interest in some states in making high school graduation tests available in
both English and Spanish. Technically this is possible, but the question of whether or
not to make two language versions of a test available depends on many factors
including the definition of the construct being measured. Is the language in which
performance is to be demonstrated a part of the construct definition or not? In the case
of reading, reading in the language of English is almost always part of the construct of
interest. Producing a Spanish equivalent version of a reading test in English makes
very little sense because inferences of English reading proficiency cannot be made
from a test administered in Spanish.
The situation with a mathematics test may be very different. The construct of interest
may be focused on computation skills, concepts, and problem-solving skills and here,
the purpose of the test is to look for a demonstration of the skills, and the language in
which the performance is assessed and demonstrated may be of little or no interest. Of
course, if the desired inference is mastery of mathematics skills when the test
questions are presented in English, then a Spanish version of the test would be
inappropriate in this situation too.
Myth 2. Anyone who knows the two languages can produce an acceptable
translation of a test.
This is one of the most troublesome myths because it results in unqualified persons
adapting tests. There is considerable evidence suggesting that test translators need to
be familiar with both source and target languages and the cultures, and they need to be
generally familiar with the construct being assessed, and the principles of good test
development practices. How, for example, can someone translate a high school
physics test from English into Spanish without some knowledge of the content?
Would a translator with little knowledge of test development principles be aware to
preserve the relevant features of the original test in an adapted test such as clearly
written item stems, a single correct or best answer, answer choices of approximately
the same length, etc.?
Myth 3. A well-translated test guarantees that the test scores will be valid in a
second language or culture for cross-language comparative purposes.
Van de Vijver and Poortinga (1997) make the point that not only should the meaning
of a test be consistent across persons within a language group and culture but, that
meaning, whatever it is, must be consistent across language groups and cultures. For
example, if a test is more speeded in a second language version because of the nature
of that language, then the two language versions of the test are not equally valid. We
have encountered just such a problem in some German test translations we are
currently working on. Quite simply, the German words are longer than English words
and take correspondingly longer to read. The result is a slightly more speeded German
version of the test. In this instance, the test may be equally valid in each language
group and culture, but still not be suitable for cross-cultural comparisons.
Many other examples could be introduced. For one, the non-equivalent familiarity of
students in different cultures with certain item formats, e.g., the multiple-choice
format, places examinees from this second cultural group at a serious disadvantage.
The translation could be excellent, but the scores from the two language versions are
not equally valid.
Myth 4. Constructs are universal, and therefore all tests can be translated into other
languages and cultures.
One of the best counter examples of this myth concerns intelligence tests. The
Western notion of intelligence places considerable emphasis on speed of response. In
some cultures, speed of response is of minor importance as a operating characteristic
for life, and members of these cultural groups often score lower on Westernized
intelligence tests because of a failure to perform quickly. But, it only in this limited
sense of the Western definition of the construct of intelligence that these cultural
groups appear of less intelligence. By another definition, perhaps one that devalues
speed of response and emphasizes other human attributes of intelligence (see
Sternberg and Gardner (1983) for broader definitions of intelligence which
incorporate, for example, social and artistic skills) the results would be opposite.
There is currently considerable interest in cross-cultural comparisons of quality of
life. It is interesting to discover that the construct associated with quality of life in this
country is often very different in other countries and this makes cross-cultural
comparisons very different. Televisions, portable telephones, personal computers, the
great outdoors, and college sports are of no importance and do not affect the quality of
life for persons in many other cultures. Cross-cultural comparisons of quality of life
are difficult to carry out because the construct may have very different meanings
across cultures.
Myth 5. Translators are capable of finding flaws in a test adaptation. Field testing
is not usually necessary.
This is another of the major myths about adapting tests. There are literally thousands
of examples of poorly adapted test items in the literature, and many of the items in
these tests were approved by translators. The fact is translators are not able to
anticipate all of the problems encountered by examinees taking a test in a second
language.
One of the best examples because it was discovered on an international comparative
study of reading achievement (and a study where the American students were about
the middle of 20 countries) is the following:
Determine whether these two words are similar or
different--
p
e
s
s
i
m
i
s
t
i
c
s
a
n
g
u
i
n
e
In the English version of the test item, only about 54% of the American students were
able to determine the correct response (a performance level slightly above chance)
which is that the two words have a different meaning. In a second language version,
the item was adapted as follows-p
e
s
s
i
m
i
s
t
i
c
o
p
t
i
m
i
s
t
i
c
In the foreign language version of the test item, almost 100% of the examinees
answered the item correctly. Clearly, a poor translation had made the test item
considerably easier. The reason given was that the word "sanguine" had no equivalent
word in the second language and therefore another word was chosen which too, had a
different meaning to pessimistic. Interestingly, this easier version of the test item was
used in the country which finished number one among the 20 countries. One wonders
what role this item and other improperly adapted test items played in the final
rankings of the 20 countries.
In summary, all of the myths can seriously compromise the validity of a test in a
second language or cultural group, or negatively influence the validity of adapted tests
for use in cross-language comparison studies. Fortunately, each myth is
straightforward to address in practice. What follows are steps for adapting tests which
should eliminate all of the myths and other shortcomings in test adaptation
methodology.
Steps for Adapting Tests
The International Test Commission (ITC) guidelines (Hambleton, 1994; van de Vijver
& Hambleton, 1996) provide an excellent framework to guide researchers in the test
adaptation process. Appendix A contains a copy of those guidelines. The following
steps for adapting a test from one culture and/or language for use in another are a
mixture of findings and recommendations from the ITC guidelines and many
empirical studies (e.g., Angoff & Cook, 1988, Prieto, 1992; Hambleton, 1994).
Geisinger's (1994) work in cross-cultural assessment was especially influential in our
thinking about the topic of steps for adapting tests. The steps are still evolving.
Through the application of the steps in different contexts new insights will be gained
and certain additions, deletions, and clarifications may be necessary.
Step 1 Ensure that construct equivalence exists in the language and cultural
groups of interest.
Assess whether construct equivalence exists between the cultures of interest and if it
does not, either consider "decentering" (that is, revising the definition of the construct
to be equally equivalent in each language and cultural group) or discontinue the
project. The publication by Harkness (1998) is especially helpful in the study of
construct equivalence.
Central questions are as follows: Does the particular construct that a researcher (e.g.,
the content domain for a credentialing exam) is interested in measuring exist in both
cultures? Does it make sense to compare these two cultures on this construct? Would
any cross-cultural comparison on this construct be meaningful? Does the construct
that is being measured mean the same thing in all cultures being compared?
Researchers familiar with both languages and cultures are in a strong position to make
judgments about construct equivalence between cultures. One can also judge whether
cross-cultural construct equivalence exists by interviewing or observing people from
the cultures of interest, researching the cultures of interest, asking others who know
about the cultures, or visiting people in the culture.
Suggestions:
1. Through discussions with psychologists and other knowledge
persons in each culture, determine if the construct exists, and if
the same definition applies equally well in both language and
cultural groups.
Step 2 Decide whether to adapt an existing test or develop a new test.
Consider the purpose of the adapted test, and the advantages and disadvantages of
adapting an existing test rather than developing a new test. It is clear too that some
tests will be more amenable to translation into certain languages than others
(Ahluwalia, 1990, p. 20). The more similar the target language and/or culture are to
the source language and/or culture, the easier will be the adaptation (thus, English to
Spanish adaptations may make more sense than English to Arabic or English to
Chinese adaptations). With tests intended for cross-cultural comparisons, test
adaptation (possibly with some decentering) may be the only option. But when crosscultural comparisons are not of interest, it may be easier to actually produce a new test
that meets the cultural parameters in the second language group, than to adapt an
already existing test which may have a number of shortcomings (e.g., a less than
satisfactory definition of the construct, inappropriate item formats, use of some
cultural specific content, etc.).
The standards with which to evaluate whether to adapt an existing test require some
level of expertise in measurement, some knowledge of the relevant literature of the
original test, and some knowledge of the language and culture to which the test is
being adapted.
Suggestions:
1. Consider the purpose of the adapted test, and carefully consider
the advantages and disadvantages of adapting a test versus
constructing a new test.
Step 3 Select well-qualified translators.
This is often one of the major shortcomings of a test adaptation project. Two points
can be made: First, in selecting translators, search for persons who are fluent in both
languages and who are very familiar with the cultures under study, and who have
some knowledge of test construction and the construct being measured. As knowledge
of test construction practices is not common among translators, this may be addressed
with some training prior to initiating the test adaptation process. Adding a
psychometrician to the mix may be desirable, too.
Second, some researchers have found that panels or committees of people translate
the test better than individuals. Committees produce pooled adaptations that are often
more accurate than translations from a single translator.
Suggestions:
1. Seek out translators with language proficiency, knowledge of

the relevant cultures, and some subject matter
knowledge/knowledge of the construct of interest.
2. Involve more than one translator in the process to provide a
mix of perspectives and to enable checking to be conducted.
Step 4 Translate and adapt the test.
One approach to increasing the likelihood of a valid test adaptation is to adopt one of
the two (or both) standard designs: forward- and back-translation. Forward translation
designs are the most technically sound because the focus of the review is on both the
source and target language versions of the test. Backward translation designs can also
be revealing of poor translations but without a focus on the target language version of
the test, problems in the adaptation can be missed. For example, with a hard-totranslate concept like "ice hockey" into Chinese, these English words may be used in
the adapted version. They are very easy to back translate, but they may be quite
meaningless in the target language version of the test.
Suggestions:
1. Use a forward translation design but a backward translation
design can be useful too, but not as the only design.
Step 5 Review the adapted version of the test and make necessary revisions.
In a forward translation design, another set of translators examine the adapted version
of the test for any errors that may lead to differences in meaning between the two
language versions. The group of translators' focus at this point would be on the quality
of the translation or adaptation of the test. As Geisinger (1994) suggests, this review
can be accomplished in a group meeting, individually, or by some combination of
individual and group work. Geisinger believes that the most effective strategy is to
first have the translators review the items and react in writing and then to have the
individuals share their comments with one another and to reconcile any differences in
opinion and make any changes in the original and/or adapted language versions as
necessary.
The National Institute for Testing and Evaluation in Israel is responsible for adapting
college admissions tests into five languages from the original Hebrew-language
version. One special feature in their process is that their translators work from the
translated version first and attempt to determine the validity of the questions: For
example, is the stem clear? Is there a single correct answer? Are there grammatical
clues that lead the test-wise candidate to the correct answer? After it is determined
that the test items can stand on their own merits, then the equivalence of the adapted
version and the original Hebrew version are compared. Translators look at several
features of the adapted items: accuracy of the translation as well as the clarity of the
sentences, the level of difficulty of the words, and the fluency of the translation.
With a backward translation design, translators would take the adapted version of the
test, back translate to the source language, and then judgments would be made about
the equivalence of the original and back-translated versions of the test. Where non-
equivalence is identified, changes in the adapted version of the test are considered.
The idea is that if the adaptation has been effective, the back-adapted version of the
test should look very much like the original. Of course, when the adaptation involves
format changes, time changes, and other changes, the target language version of the
test may be fine, but a back-translated test may not look at all like the original. In
general, back-translation designs seem like an excellent supplement to the forward
translation design, but they are not likely to be able to stand on their own. The
information they provide about the validity of the adapted test is limited.
Based on the comments of the reviewers, changes can be made in the original and/or
adapted version of the test, as necessary. Of course, if many changes are made, there
may be advantages to repeating step 4 and 5.
Suggestions:
1. Review and revision of the adapted test is absolutely necessary,
following the initial translation. In most cases, the adapted test
is too important to be dependent on the insights of a single
translator or group of translators.
Step 6 Conduct a small tryout of the adapted version of the test.
It is at this step that many studies seem to go wrong. Too many researchers and test
developers feel that judgmental review is sufficient evidence to establish the validity
of a test in a second language. But validity evidence for using a test in a second
language depends on stronger evidence than that the test seems to look acceptable to
translators and/or reviewers. Not only is empirical evidence needed to support the
validity of inferences from an adapted version of a test, but perhaps two or more
empirical studies are needed. A good example of what researchers might learn from a
tryout of test items in a second language and culture is clearly highlighted in the paper
by Allalouf and Sireci (1998).
Beginning with a small tryout of the adapted test seems to be prudent before investing
considerable resources in a more ambitious field test. Pilot test the instrument using a
small sample of individuals representative of the eventual target population and
compare the results to results obtained from a source sample. The pilot test should
consist of administering the test, as well as interviewing the individuals to obtain their
criticisms of the test itself, instructions, time limits, etc. These findings form the basis
for revising the test. One good suggestion from Ellis and Mead (1998) might be
carried out at this point. Ellis and Mead suggest that when there are disagreements
about the best adaptation of a test item, these variations might all be field tested, and
the results used to make the final decision about which adaptation is best.
Suggestions:
1. Conduct a pilot test to gain preliminary information about the
test, and revise accordingly.
Step 7 Carry out a more ambitious field test.
This is one of the most important steps in the total test adaptation process. Good
translators are often capable of identifying and fixing many shortcomings in adapted
tests. But many problems go unidentified until test items are field tested. For example,
in a recent study by Hambleton, Slater, and Yu (in press) in which National
Assessment of Educational Progress (NAEP) mathematics items were adapted into
Chinese, the NAEP test item went unidentified by the translators. A field test revealed
a major problem with the item which could not be identified by the translators
because it was a curriculum issue. Chinese students at the eighth grade were
unfamiliar with the concept of estimation.
Field test the adapted test using a larger sample of individuals representative of the
eventual target population and conduct preliminary statistical analyses, such as a
reliability analysis and a classical item analysis. In addition, check for construct
equivalence using factor analysis should be carried out.
Suggestions:
1. Design and carry out an ambitious field test to check out test
items (using classical or modern item analysis procedures), test
and subtest reliabilities, and the factor structure of the test
(factor analysis or structural equating modeling are popular for
this analysis). Compare findings to those obtained with the
source language version of the test.
Step 8 Choose a statistical design for connecting scores on the source and target
language versions of the test.
This step is necessary when cross-cultural comparisons are of interest, or the test
score norms or performance standards (i.e., the passing score on a credentialing exam)
with the source language version of the test are of interest with the target language
version of the test. At this step (which might be combined with step 7), a linking
design is needed to place the test scores from the different versions of the test on a
common scale. There are three popular linking designs:
1. bilingual group design,
2. matched monolingual group design, and
3. monolingual group design.
All three designs are popular, though the third design may be the easiest to implement
in practice (see, for example, Angoff & Cook, 1988). For a worked example based on
item response modeling of the data, studies by Angoff and Cook (1988) or Woodcock
and Munoz-Sandoval (1993) would be of special interest.
Suggestions:
1. Choose a linking design to equate scores from the source and
target language versions of the test. Item response modeling is
a standard way to proceed. Large samples are highly desirable
at this step to produce a stable linking of scores from one test to
the other.
Step 9 If cross-cultural comparisons are of interest, ensure equivalence of the

language versions of the test.
This step, too, may be combined with steps 7 and 8. We have highlighted this activity
as a step because of its central importance in the test adaptation process. Administer
the source version of the test to a large sample of the source population and perform
statistical analyses to determine whether or not the items function similarly in both the
adapted and source language versions of the test. This is accomplished through the
use of an item bias study (often called a "differential item functioning" or DIF study).
If there are items that function differently for each group, rewrite or retranslate,
readminister, and reanalyze those items to determine whether they function the same
for both groups. The Muniz, Hambleton, and Xing (1998) study highlights the fact
that even small samples (i.e., 50 candidates per group) can be useful in detecting
flaws in the translation/adaptation process.
Suggestions:
1. Conduct a DIF study using one or more of the standard
statistical procedures--Mantel-Haenszel statistic, logistic
regression, IRT-based area procedures, etc.
Step 10 Perform validation research as appropriate.
Regardless of the interest in cross-cultural comparisons of scores from the two
language versions of the test, and the related research generated by that concern, there
is also a need to ensure that the test scores of the newly adapted test are valid and
reliable. Step 1 involved judgmental strategies for collecting evidence of construct
equivalence, as there was no data available with which to conduct statistical analyses.
Now that the test has been administered, there are data available and so evidence of
construct-related validity can be compiled. This may be compiled from factor
analytic, experimental, or other correlational information (e.g., predictive or
concurrent validity studies). Again, this step may be combined with steps 7 to 9.
Suggestions:
1. Conduct empirical studies which address the equivalence of the
multilanguage versions of the test in the populations where the
test will be used. Evidence of construct equivalence as well as
the absence of method and item bias are important.
Step 11 Document the process and prepare a manual for the users of the adapted
test.
Document results obtained from steps 1 to 10 and prepare a manual for the users of
the adapted test. The manual should include specifics regarding the administration of
the test, as well as how to interpret the test scores. This is a very important step, yet
often overlooked.
Suggestions:
1. Document the full process of adapting a test. Everything from

the persons involved, and designs used, to the findings and the
nature of the changes which were made needs to be compiled
and placed in a technical manual for future reference.
Step 12 Train users.
Where possible, train the users of the test. Although documentation and a manual will
assist users of the adapted instrument, training will further assist them.
Suggestions:
1. Train test administrators to follow the directions and to answer
any questions appropriately which may arise. Especially when
cross-cultural comparisons are being made, or the norms for the
target language version of the test are being used, standardized
test administrations are essential across language groups.
Step 13 Ongoing monitoring of the adapted test.
Often cross-cultural studies are a "one-shot affair." But some tests are adapted for
ongoing use in a second language group. Popular intelligence, credentialing, aptitude,
and personality tests would be ones which are adapted and intended for ongoing use.
Researchers should remain vigilant to potential flaws in their adapted tests, and this
means that ongoing monitoring of adapted tests is needed. Re-investigation and reevaluation of the reliability and validity of test scores should be ongoing.
Suggestions:
1. Continue to monitor the evaluation of adapted tests and assess
their reliability and validity on a regular basis. The reliability
and validity of all tests can be expected to change over time due
to changes in curriculum, values, experiences, exposure to the
test, etc.
Conclusions
An increasing number of educational, credentialing, and psychological tests are being
adapted for use in other languages and cultures. At the same time, these adapted tests
will have limited value unless they are adapted with a high degree of concern for
issues of usability, reliability and validity. There is a rapidly emerging psychometric
literature on the topic of test adaptation methodology, and more advances can be
expected in the coming years as researchers respond to the expanding need for
adapted tests of high technical quality. Avoiding the five myths and following the 13
steps introduced in this paper for the test adaptation process should go a long way
toward improving current practices. In addition, the 13 steps provide a framework for
incorporating new methodology into the process as it is developed.
References
Ahluwalia, N. T. (1990). Comparability of translated

tests in occupational testing. CLEAR Exam Review, 1,
19-21.
Allalouf, A., & Sireci, S. G. (1998, April). Detecting
sources of DIF in translated verbal items. Paper
presented at the meeting of AERA, San Diego.
Angoff, W. H., & Cook, L. L. (1988). Equating the
scores of the Prueba de Aptitud Academica and the
Scholastic Aptitude Test (Report No. 88-2). New York,
NY: College Entrance Examination Board.
Ellis, B., & Mead, A. (1998, August). Measurement
equivalence of a 16PF Spanish translation: An IRT
differential item and test functioning analysis. Paper
presented at the 24th meeting of the International
Association of Applied Psychology, San Francisco.
Geisinger, K. F. (1994). Cross-cultural normative
assessment: Translation and adaptation issues
influencing the normative interpretation of assessment
instruments. Psychological Assessment, 6, 304-312.
Hambleton, R. K. (1994). Guidelines for adapting
educational and psychological tests: A progress report.
European Journal of Psychological Assessment, 10,
229-244.
Hambleton, R. K., & Patsula, L. (1998). Adapting tests
for use in multiple languages and cultures. Social
Indicators Research, 45, 153-171.
Hambleton, R. K., Slater, S. C., & Yu, J. (in press).
Field test of the ITC guidelines for adapting
psychological tests. European Journal of Psychological
Assessment.
Harkness, J. (Ed.). (1998), Cross-cultural equivalence.
Mannheim, Germany: ZUMA.
Muniz, J., Hambleton, R. K., & Xing, D. (1998). Small
sample studies to detect flaws in test translation. Paper
presented at the meeting of AERA, San Diego.
Prieto, A. J. (1992). A method for translation of
instruments to other languages. Adult Education
Quarterly, 43, 1-14.
Sternberg, R. L., & Gardner, M. K. (1983). Unities

in inductive reasoning.
Journal of Experimental
Psychology: General, 112, 80-116.
Van de Vijver, F. J. R., & Hambleton, R. K. (1996).
Translating tests: Some practical guidelines. European
Psychologist, 1, 89-99.
van de Vijver, F. J. R., & Poortinga, Y. H. (1997).
Towards an integrated analysis of bias in cross-cultural
assessment. European Journal of Psychological
Assessment, 13, 29-37.
Woodcock, R. W., & Munoz-Sandoval, A. F. (1993).
An IRT approach to cross-language test equating and
interpretation. European Journal of Psychological
Assessment, 9, 233-241.
Appendix A
ITC Test Adaptation Guidelines
Context
C.1 Effects of cultural differences which are not
relevant or important to the main purposes of the study
should be minimized to the extent possible.
C.2 The amount of overlap in the constructs in the
populations of interest should be assessed.
Test Development and Adaptation
D.1 Test developers/publishers should insure that the
adaptation process takes full account of linguistic and
cultural differences among the populations for whom
adapted versions of the instrument are intended.
D.2 Test developers/publishers should provide evidence
that the language use in the directions, rubrics, and
items themselves as well as in the handbook are
appropriate for all cultural and language populations for
whom the instrument is intended.
that the choice of testing techniques, item formats, test
conventions, and procedures are familiar to all intended
populations.

that item content and stimulus materials are familiar to
all intended populations.
D.5 Test developers/publishers should implement
systematic judgmental evidence, both linguistic and
psychological, to improve the accuracy of the
adaptation process and compile evidence on the
equivalence of all language versions.
D.6 Test developers/publishers should ensure that the
data collection design permits the use of appropriate
statistical techniques to establish item equivalence
between the different language versions of the
instrument.
D.7 Test developers/publishers should apply appropriate
statistical techniques to
1. establish the equivalence of the different
versions of the instrument, and
2. identify problematic components or aspects of
the instrument which may be inadequate to one
or more of the intended populations.
D.8 Test developers/publishers should provide
information on the evaluation of validity in all target
populations for whom the adapted versions are
intended.
D.9 Test developers/publishers should provide
statistical evidence of the equivalence of questions for
all intended populations.
D.10 Non-equivalent questions between versions
intended for different populations should not be used in
preparing a common scale or in comparing these
populations. However, they may be useful in enhancing
content validity of scores reported for each population
separately.
Administration
A.1 Test developers and administrators should try to
anticipate the types of problems that can be expected,
and take appropriate actions to remedy these problems
through the preparation of appropriate materials and
instructions.
A.2 Test administrators should be sensitive to a number

of factors related to the stimulus materials,
administration procedures, and response modes that can
moderate the validity of the inferences drawn from the
scores.
A.3 Those aspects of the environment that influence the
administration of an instrument should be made as
similar as possible across populations for whom the
instrument is intended.
A.4 Test administration instructions should be in the
source and target languages to minimize the influence
of unwanted sources of variation across populations.
A.5 The test manual should specify all aspects of the
instrument and its administration that require scrutiny in
the application of the test in a new cultural context.
A.6 The administrator should be unobtrusive and the
administrator-examinee interaction should be
minimized. Explicit rules that are described in the
manual for the test should be followed.
Documentation/Score Interpretations
I.1 When a test is adapted for use in another population,
documentation of the changes should be provided, along
with evidence of the equivalence.
I.2 Score differences among samples of populations
administered the test should not be taken at face value.
The researcher has the responsibility to substantiate the
differences with other empirical evidence.
I.3 Comparisons across populations can only be made at
the level of invariance that has been established for the
scale on which scores are reported.
I.4 The test developer should provide specific
information on the ways in which the socio-cultural and
ecological contexts of the populations might affect
performance on the test, and should suggest procedures
to account for these effects in the interpretation of
results.
August 1999, JATT, Volume1, No.1, 1-30.
Paper presented at the annual meeting of CLEAR, Denver, September, 1998.
Normele de avizare a metodelor i tehnicilor de

evaluare i asisten psihologic
(Colegiul Psihologilor din Romania, www.copsi.ro)
Capitolul 1 - Dispoziii generale
Art. 1 (1) - n temeiul Legii nr. 213/2004, art.33, lit. h, publicat n Monitorul Oficial
din 1.06.2004, Comitetul Director (CD) al Colegiului Psihologilor din Romnia
(CPR), prin Comisia Metodologic (CM) elaboreaz normele de avizare i avizeaz
metodele i tehnicile de evaluare i asisten psihologic utilizate n practic.
(2) - CD al CPR, prin CM reprezint autoritatea central abilitat pentru a analiza
valoarea metodelor i tehnicilor de evaluare i asisten psihologic i a emite avize
de utilizare a acestora.
Art. 2 (1) - Avizarea metodelor i tehnicilor de evaluare i asisten psihologic se
realizeaz pentru a asigura calitatea serviciilor psihologice oferite n Romnia.
(2) - Valoarea serviciilor psihologice este dependent de calitatea metodelor i
tehnicilor de evaluare i asisten psihologic existente precum i de cunotinele i
abilitile psihologului de a le alege i utiliza corect.
Art. 3 (1) - Comisia Metodologic a Colegiului Psihologilor din Romnia, prin
normele de avizare prezente, stabilete standardele de calitate i procedurile de
avizare pentru metodele i tehnicile de evaluare i asisten psihologic.
(2) - Comisiile aplicative din cadrul Colegiului Psihologilor din Romnia, prin
normele de avizare specifice, atest competenele profesionale ale psihologilor de a
utiliza metode i tehnici de evaluare i asisten psihologic. Toate comisiile de
specialitate vor avea n vedere competenele generale de utilizare a testelor
psihologice precizate n documentul de fa.
Art. 4 (1) - Metodele i tehnicile de evaluare i asisten psihologic ce au fost
avizate, sunt consemnate ntr-un Catalog al metodelor i tehnicilor utilizate n
Romnia.
(2) - Comitetul Director al Colegiului Psihologilor din Romnia are obligaia s
asigure publicarea i actualizarea acestui Catalog prin mijloace electronice, ori de cte
ori este necesar.
Art. 5 (1) - n cuprinsul prezentelor norme sunt utilizai anumii termeni de
specialitate care au un neles specific.
(2) - Metodele i tehnicile de evaluare psihologic: demersuri fundamentate tiinific
i efectuate n scopul cercetrii, investigrii unei persoane, grup de persoane sau
organizaii sub aspect psihologic;
(3) - Metodele i tehnicile de asisten psihologic: demersuri fundamentate tiinific,
efectuate n scopul declarat al ameliorrii sau optimizrii activitii psihice a unei
persoane, grup de persoane sau organizaii;
(4) Norme: set prescripii minime metodologice, explicit formulate,
adoptate i respectate n mod obligatoriu de ctre membri organizaiilor
profesionale ale psihologilor ce asigur coeren n formularea
investigaiilor i a concluziilor diagnostice;
(5) - Utilizatorul de metode i tehnici de evaluare sau de asisten psihologic:

orice persoan care are certificat competena profesional de a folosi aceste
instrumente;
(6) - Testele psihologice: probe sau dispozitive standardizate de extragere
a unei secvene relevante din comportamentul sau procesrile cognitivafective ale unei persoane sau grup, fundamentate pe un etalon sau un
reper pertinent i pe o interpretare responsabil din partea specialistului;
(7) - Utilizatorul de teste psihologice: persoana responsabil cu selecia,
administrarea, cotarea unui test, ori care ia decizii, n parte, pe baza rezultatelor la
test. n categoria utilizatorilor de teste intr i persoanele care realizeaz doar etapa de
administrare a unor teste complexe cum ar fi probele proiective;
(8) - Distribuirea pe pia: aciunea de a face disponibil contra cost sau gratuit un
produs sau un serviciu de natur psihologic n vederea utilizrii sale, n condiiile n
care acesta nu se regsete n Catalogul metodelor i tehnicilor de evaluare i asisten
psihologic avizate;
(9) - Solicitantul de aviz: persoane fizice sau juridice care introduc pe pia serviciul
sau produsul de natur psihologic, n condiiile n care acesta nu se regsete n
Catalogul metodelor i tehnicilor de evaluare i asisten psihologic. n aceast
categorie regsim: autorul, productorul, reprezentantul autorizat al acestuia,
importatorul ori utilizatorul.
Capitolul 2 - Avizarea metodelor i tehnicilor de evaluare psihologic
Seciunea 1 Documentele necesare pentru avizare

Art. 6 - n vederea obinerii avizului, solicitantul adreseaz CM din cadrul CPR o
cerere nsoit de o declaraie de conformitate i de un dosar tehnic.
Art. 7 - Cererea are un format tipizat i este prezentat n anexa I, iar declaraia de
conformitate se face pe proprie rspundere i este prezentat n Anexa II pentru a
evidenia c datele prezentate n documentaia tehnic corespund cu realitatea i c
metodele sau tehnicile respective nu sunt nocive pentru sntatea individului. CM
poate solicita suplimentar un certificat de calitate eliberat de firma productoare
conform legilor n vigoare, dup caz.
Art. 8 (1) - Dosarul va conine documentaia tehnic a metodei sau tehnicii
respective, trebuind s cuprind n mod explicit:
a) fundamentarea teoretic;
b) domeniul de aplicabilitate (ex. domeniul clinic, organizaional, colar, aprare etc.);
c) scopul metodei sau tehnicii (ex. diagnostic; predicie; monitorizare etc.);
d) descrierea detaliat a metodei sau a tehnicii, inclusiv a instruciunilor de utilizare,
cotare i interpretare;
e) prezentarea calitilor tehnice, psihometrice (validitate, fidelitate, etalonare);
f) competenele necesare pentru utilizare;

g) instituii i persoane care ofer stagii de formare, dup caz;
h) bibliografie;
i) alte informaii utile n aprecierea metodei.
(2) n cazul probelor psihologice standardizate utilizate n evaluarea psihologic,
informaiile din dosar trebuie s corespund standardelor de calitate menionate n
Anexa III.
(3) - n cazul n care datele cuprinse n dosarul tehnic nu sunt suficiente
pentru acordarea avizului, se pot cere probe, documente i clarificri
suplimentare prin consultarea Comisiilor aplicative, pe cheltuiala solicitantului.
Seciunea 2 Procedura de avizare
Art. 9 (1) - Studierea dosarului tehnic se face de ctre CM a CPR.
(2) - Fiecare metod supus avizrii va fi analizat independent de ctre doi membri ai
Comisiei Metodologice, ce vor fi alei prin tragere la sori dintre membrii disponibili.
(3) - n cazul probelor psihologice standardizate, evaluarea se va face pe baza ghidului
ce conine standardele de calitate ale testelor psihologice, precizate n anexa III.
Art. 10 (1) - n urma analizei, evaluatorii pot propune acordarea a trei tipuri de avize:
a) avizarea pe o perioad nedeterminat;
b) avizare temporar;
c) respingere a metodei sau tehnicii respective.
(2) - Evaluatorii vor ntocmi un referat prin care s justifice tipul de aviz dat i
recomandrile fcute pentru mbuntirea calitilor psihometrice ale probelor.
(3) - n cazul n care concluziile celor doi evaluatori difer, n ceea ce privete tipul de
aviz acordat, metoda sau tehnica va fi reevaluat de o a treia persoan din cadrul CM,
aleas prin tragere la sori de ctre Preedintele Comisiei, dar alta dect primele dou.
Art. 11 (1) - n cazul testelor psihologice, avizul pe o perioad nedeterminat i oblig
pe cei care distribuie pe pia produsele sau serviciile respective s le actualizeze
periodic la un interval de maximum 10 ani pe populaia autohton.
(2) - Dac reactualizarea conduce la modificri n punctele b i c din cadrul art.8,
alin.1 ori n coninutul probei, n modul de administrare a acesteia sau n modalitatea
de cotare i interpretare a rezultatelor este necesar o rennoire a avizului.
Art. 12 (1) - Metodele i tehnicile de evaluare psihologic pot primi un aviz temporar,
pe o durata de 24 luni, cu condiia punerii n practic de ctre persoanele responsabile
a recomandrilor membrilor CM.
(2) - Avizul temporar poate fi acordat, att probelor noi, aflate n perioad de
experimentare, dar utilizate n procesul de evaluare psihologic, ct i probelor care
necesit mbuntiri din perspectiva caracteristicilor tehnice.
(3) - La expirarea celor 24 de luni de utilizare a metodei sau tehnicii pe baza avizului
temporar, se reevalueaz situaia metodei sau tehnicii. Dac solicitantul nu satisface
normele de avizare definitiv a metodei sau tehnicii aflat n aceast situaie, CM prin
CD al CPR va retrage avizul temporar de utilizare a metodei.
Art. 13 (1) - Avizul primit din partea CD se rezum la aria de aplicabilitate

specificat n caracteristicile domeniului vizat, i nu poate fi extins spre alte domenii
de activitate fr o testare prealabil.
(2) - Excepie de la necesitatea obinerii avizului fac probele aflate n perioad de
experimentare, ale cror rezultate nu sunt luate n considerare n procesul de evaluare
psihologic.
Art. 14 (1) - Tipul de aviz primit poate fi contestat de ctre solicitant, printr-o cerere,
adresat n prim instan Preedintelui CD, n care s argumenteze motivele pentru
care consider c avizul este nejustificat.
(2) Dac argumentele prezentate sunt considerate viabile, Preedintele CM va
extrage aleator ali doi membri pentru reevaluarea metodei sau tehnicii respective, n
caz contrar cererea se respinge.
(3) - Decizia luat n urma re-evalurii este definitiv.
(4) - n cazul n care dosarul a fost respins, solicitantul poate cere o nou evaluare, pe
baza unei documentaii reactualizate, dup un an de zile de la data deciziei de
respingere a metodei i tehnicii respective.
Capitolul 3 - Dreptul de utilizare a testelor psihologice
Seciunea 1 Dobndirea i certificarea competenelor utilizatorilor

Art. 15 - Orice psiholog va trebui s dovedeasc o serie de competene pentru a putea
utiliza probe psihologice.
Art. 16 (1) - Competenele pot fi grupate n dou categorii: competene generale i
competene complementare, specifice domeniului de aplicaie.
(2) - Competenele generale includ cunotine i abiliti legate de activitatea de
testare psihologic, indiferent de aria de aplicabilitate.
(3) - Competenele complementare n utilizarea testelor psihologice includ cunotine
i abiliti dependente de aria n care i desfoar activitatea psihologul.
(4) Competenele complementare presupun dobndirea anterioar a celor generale.
Art. 17 (1) - Competenele generale dobndite trebuie s acopere sfera de competene
stabilite la nivel internaional de Comisia Internaional de Testare.
(2) - Categoriile majore de competene, vizeaz urmtoarele aspecte etice n aplicarea
testelor:
a) adoptarea unei conduite profesioniste, n acord cu normele deontologice ale
psihologului i cu respectarea legilor internaionale i naionale privind copyrightul (legea drepturilor de autor i a drepturilor conexe - nr. 8/1996);
b) utilizarea doar a acelor teste pentru care au competena necesar;
c) asumarea responsabilitii pentru modul de utilizare a testelor;
d) asigurarea securitii pentru testele utilizate, astfel nct ele s nu-i piard calitile
din cauza deconspirrii publice a coninutului ori a mecanismelor de cotare;
e) asigurarea confidenialitii rezultatelor;
f) acordul scris sau n form electronic de includere a rezultatelor n baza de date a
utilizatorului probei psihologice.
(3) - Categoriile majore de competene, vizeaz urmtoarele aspecte tehnice n

aplicarea testelor:
a) determinarea necesitii de a utiliza teste psihologice n funcie de contextul
evalurii psihologice i a calitilor psihometrice ale acestora;
b) asigurarea faptului c testarea psihologic nu va avea un impact discriminatoriu
pentru anumite categorii de persoane;
c) pregtirea adecvat a sesiunii de testare psihologic;
d) administrarea corect, n acord cu instruciunile din manual, a probelor;
e) cotarea corect a testelor administrate;
f) interpretarea adecvat a rezultatelor obinute;
g) comunicarea rezultatelor ntr-un mod concis i pe nelesul persoanelor care au
solicitat testarea i/sau au fost testate;
h) revizuirea calitilor psihometrice ale probelor utilizate;
Art. 18 (1) - Competenele generale n utilizarea testelor psihologice standardizate de
ctre absolvenii cu licen n psihologie sau asimilat sunt acoperite de urmtorul
pachet de cursuri:
a) Psihologia personalitii
b) Psihodiagnostic;
c) Introducere n teoriile msurrii i psihometrie;
d) Statistic psihologic i prelucrarea informatizat a datelor;
e) Metodologia cercetrii n psihologie.
(2) Competenele complementare se pot obine de ctre absolvenii cu licen n
psihologie sau asimilat prin programe universitare, masterale sau doctorale ori prin
cursuri formative de specializare n diverse metodologii recunoscute de CPR, conform
cerinelor Comisiilor aplicative.
Art. 19 - Persoanele, cu licen n psihologie sau asimilat, care nu au urmat aceste
cursuri le pot urma n regim de tax, prin cursuri organizate de ctre asociaii
profesionale recunoscute de CPR ori persoane juridice specializate acreditate de CPR;
Art. 20 (1)- Absolvenii cu licen n psihologie sau asimilat, dobndit dup intrarea
n vigoare ale acestor norme, vor certifica n faa comisiei aplicative de la care dorete
s obin atestatul de liber practic, dobndirea competenelor de utilizare a testelor.
Se pot prezenta copii dup documente care dovedesc parcurgerea cerinelor precizate
la art.18 alin.1 sau alin.2.
(2) Absolvenii cu licen n psihologie care obin titlul de Doctor n specializarea
Psihologie au competene generale de utilizare a testelor, nefiind nevoii s intre sub
incidena prevederilor art.18, alin.1.
Art. 21 (1) - Autorii sau productorii unor teste psihologice pot propune criterii
suplimentare cu scopul de a restriciona dreptul de utilizare a testelor pe care le
introduc pe pia, inclusiv o anumit experien de utilizare sub supervizare, cursuri
de formare.
(2) - Decizia de includere a acestor criterii suplimentare rmne un atribut exclusiv al
CM.
Seciunea 2 Reglementarea utilizrii testelor psihologice

Art. 22 (1) Distribuitorul de teste, solicitant de aviz este obligat s difuzeze testele
psihologice ctre utilizatori numai nsoite de un manual tehnic i de utilizare a probei
respective, indiferent de tipul de test: creion-hrtie, aparate, prob computerizat. n
caz contrar, probele respective nu vor primi aviz favorabil, fie el temporar sau pe o
perioad nedeterminat.
(2) Distribuitorul de teste, solicitant de aviz este obligat s pun la dispoziia
utilizatorului de teste care achiziioneaz un anumit produs, toate elementele necesare
pentru administrarea, cotarea i interpretarea rezultatelor de ctre utilizator.
(3) Psihologii cu drept de liber practic care utilizeaz teste psihologice nu le pot
utiliza n absena unui manual de utilizare i a informaiilor psihometrice menite s
mbunteasc interpretarea rezultatelor obinute, indiferent de forma de prezentare a
testului: creion-hrtie, aparate, probe computerizate.
(4) Psihologii cu drept de liber practic care folosesc metode sau tehnici avizate
fr a avea drept de licen asupra metodelor respective ncalc prevederile legale n
vigoare i sunt pasibili de sanciuni potrivit legii.
(5) Psihologii care achiziioneaz probe psihologice, dar le utilizeaz n alte condiii
dect cele prevzute prin licena cumprat de la distribuitor sau autor, ori le
nstrineaz unei tere persoane ncalc prevederile legale n vigoare privind legea
drepturilor de autor.
(6) Psihologii cu drept de liber practic care folosesc metode sau tehnici avizate
fr s dovedeasc competenele necesare utilizrii de probe psihologice, cele care nu
respect prevederile aliniatelor (4) i (5) ale prezentului articol sau cele care utilizeaz
n exclusivitate metode care nu sunt avizate de ctre CM al CPR, ncalc prevederile
codului deontologic i sunt pasibili de sanciuni conform prevederilor codului
deontologic adoptat de CPR.
(7) Prima abatere de se sancioneaz cu retragerea temporar a atestatului de liber
practic. Repetarea abaterii conduce la retragerea definitiv a atestatului de liber
practic.
Art.23 Cei care comercializeaz teste psihologice se supun reglementrilor i
dispoziiilor Consiliului Concurenei i Oficiului pentru Protecia Consumatorului din
Romnia.
Seciunea 3 Acreditarea cursurilor de specializare

Art. 24 (1) - Cursurile de formare a competenelor generale specificate trebuie avizate
de CD al CPR la propunerea CM.
(2) - CM al CPR va ntocmi i reactualiza anual o list a cursurilor acreditate pentru
dobndirea competenelor generale de utilizare a testelor psihologice, aceasta fiind
fcut public prin mijloace electronice.
Art. 25 (1) - Pentru a obine acreditarea cursurilor, persoanele sau instituiile
interesate de a organiza astfel de cursuri vor depune o cerere ctre CM a CPR, nsoit
de o documentaie tehnic ce include programa cursului / cursurilor respective, un CV
al trainerului/formatorului i resursele avute la dispoziie pentru a realiza ntr-o

manier profesionist aceste cursuri.
(2) - n cazul unui rspuns favorabil, se pltete anual o tax ctre CPR n valoare de
5% din veniturile brute obinute n urma derulrii cursurilor n anul respectiv.
(3) - Acreditarea primit din partea CPR, prin intermediul CM, are durata de doi ani
de zile, ea putnd fi rennoit.
(4) - Retragerea acreditrii poate fi fcut nainte de termenul de valabilitate al
acesteia atunci cnd CM constat c organizatorul cursurilor nu respect documentaia
tehnic specificat la obinerea acreditrii, dac nu se pltete taxa ctre CPR sau dac
survin probleme de natur deontologic sau penal legate de modul de desfurare a
cursurilor.
Art. 26 (1) - Persoanele care vor urma astfel de cursuri vor susine n final un examen
de cunotine, pe baza unei metodologii i a unei bibliografii specificate de ctre CM.
(2) - Participanii care vor promova acest examen vor putea primi un certificat de
absolvire a disciplinei sau disciplinelor evaluate.
Capitolul 4 - Avizarea tehnicilor i metodelor de asisten psihologic

Art. 27 - Psihologul cu drept de liber practic, poate apela la orice metod sau
tehnic de asisten psihologic pentru care i asum responsabilitatea, conform
normelor deontologice, c este benefic pentru client i pentru care certific
competena de a o utiliza.
Art. 28 (1) - Metodele i tehnicile de asisten psihologic sunt avizate implicit dac
sunt dobndite n urmtoarele condiii:
a) pe parcursul studiilor universitare, masterale sau doctorale;
b) prin intermediul unor training-uri sau altor cursuri de formare desfurate sub egida
CPR sau a altor asociaii profesionale ale psihologilor ori asimilate care au fost
acreditate de CPR;
c) prin experien sub supervizare, acolo unde este cazul.
(2) - Metodele i tehnicile de asisten psihologic pot fi avizate explicit de ctre CM,
la cererea unei Comisii aplicative a CPR.
Art. 29 (1) - n vederea obinerii avizului explicit, CM cere solicitantului, interesat de
promovarea unei anumite metode sau tehnici de asisten psihologic, un dosar tehnic
nsoit de o declaraie de conformitate.
(2) - Declaraia de conformitate este o declaraie pe proprie rspundere c datele
prezentate n documentaia tehnic sunt conforme cu realitatea i c metodele sau
tehnicile respective nu sunt nocive asupra individului sau organizaiei evaluate.
(3) - Dosarul tehnic trebuie s cuprind informaii despre:
a) fundamentarea teoretic;
b) domeniul de aplicabilitate (ex. domeniul clinic, organizaional, colar, aprare etc.);
c) scopul metodei sau tehnicii;
d) descrierea detaliat a metodei sau a tehnicii;
e) dovezi despre eficiena metodei;
f) limitele i contraindicaiile existente;
g) competenele necesare pentru utilizare;
h) instituii i persoane care ofer stagii de formare;

i) bibliografia aferent cu trimitere spre studii care susin valoarea metodei;
j) alte informaii utile n aprecierea metodei.
Art. 30 (1) - Metodele i tehnicile de asisten psihologic, care intr sub procedura
de avizare explicit pot primi aviz favorabil sau pot fi respinse.
(2) - n cazul primirii unui aviz nefavorabil, solicitantul poate cere o nou evaluare, pe
baza unei documentaii reactualizate, dup un an de zile de la data deciziei de
respingere a metodei i tehnicii respective.
Art. 31 (1) - CM se poate sesiza din oficiu cu privire la utilizarea de metode sau
tehnici de asisten psihologic neavizate
(2) - Procedura de avizare pentru situaiile prevzute la alin. (1) este cea prevzut n
prezentele norme.
Capitolul 5 - Dispoziii finale

Art. 32 Nivelul taxelor necesare acoperirii costurilor de avizare a metodelor i
tehnicilor de evaluare i asisten psihologic se aprob de Consiliul Colegiului, la
propunerea Comitetului director.
Art. 33 - Normele de avizare a metodelor i tehnicilor de evaluare i asisten
psihologic se aprob de ctre Convenia Naional a CPR i intr n vigoare la data
aprobrii.
Art. 34 - Normele de avizare a metodelor i tehnicilor de evaluare i asisten
psihologic se aduc la cunotina tuturor membrilor CPR, dup aprobare, prevederile
acestora devenind obligatorii pentru toi psihologii.
Art. 35 Normele prezente se completeaz cu prevederile Legii 213/2004 i cu
normele metodologice de aplicare a legii respective.
Art. 36 Normele prezente pot fi modificate i completate numai la propunerea CM
cu aprobarea CD al CPR.
ANEXA 1
Model cerere tip
Domnule Preedinte,
Subsemnatul ....
de profesie , CNP .
cu domiciliul in..
n calitate de .....
va rog sa avizati metoda/tehnica/testul .
pentru a putea fi utilizat(a) in.
In acest scop anexez dosarul tehnic
Data :
ANEXA 2
si declaratia de conformitate.
Semnatura:
DECLARATIE DE CONFORMITATE
Nr. ................
Noi, ..........................................................................,
(denumirea completa a persoanei juridice sau persoanei fizice autorizate)
...............................................................................,
(sediul)
cu Certificat de nregistrare/Autorizaie nr. .............../.................,
asiguram, garantam si declaram pe propria rspundere, conform prevederilor art.
5 din Hotrrea Guvernului nr. 1.022/2002 privind regimul produselor si
serviciilor care pot pune in pericol viata, sntatea, securitatea muncii si
protecia mediului, ca produsul/serviciul ......................................
................................................................................
(denumirea, tipul sau modelul, eventual numrul lotului, seriei i numrul de
exemplare)
la care se refera aceasta declaraie nu pune in pericol viaa, sntatea,
securitatea muncii, nu produce un impact negativ asupra mediului i este n
conformitate cu: ...............................................................
................................................................................
(titlul si/sau numrul i data publicrii documentului/documentelor
normativ/normative)
.................................
............................................
(locul si data emiterii)
(numele si prenumele in clar si stampila)
ANEXA 3
n curs de traducere i de dezbatere: The Revised Dutch Rating System for Test
Quality.
Glosar
A msura nseamn a atribui numere obiectelor sau fenomenelor potrivit unor reguli
determinate (Stevens, 1951).
Analiza factorial - un set de proceduri matematice utilizate pentru a identifica dimensiunile
care stau la baza uneui set de msurori empirice
Consistena intern a unui test - se refer la msura n care toi itemii testului msoar
aceeai variabil
Criteriul standardul la care este raportat performana la un test
Definirea populaiei - circumscriera persoanelor pentru care este destinat testul
Etalon - reprezint deci cadrul de referin al unui subiect cu populaia
Etalonarea unui test - reprezint stabilirea unui cadru de referin, a unei scri care s
permit determinarea locului ocupat de rezultatele unui subiect fa de rezultatele unei
populaii de referin, suficient de numeroas, format din persoane comparabile cu cea
examinat.
Etalonul (norma sau standardele) reprezint deci cadrul de referin al unui subiect cu
populaia
Evaluarea psihologica este un proces de rezolvare de probleme care vizeaz descoperirea
manifestrilor realitatii.
Fidelitatea - reprezint absena relativ dintr-o prob psihologic a erorilor de msurare.
Fidelitatea interevaluatori exprim msura n care testul este independent de erori datorate
modalitii de cotare a rspunsurilor subiectului
Item - stimul specific care determin un anumit comportament ce poate fi cotat i evaluat
independent.
Itemi cu mai multe opiuni (polinomici) au un format similar celor dihotomici, atta doar
c au mai mult de dou alternative de rspuns
Itemii dihotomici ofer dou alternative de rspuns (adevrat i fals), de obicei uneia dintre
acestea i se acord un punct la cotarea performanei persoanei evaluate
Metoda formelor paralele - dou teste sunt paralele dac pentru un subiect erorile de msur
la cele dou administrri sunt variabile aleatoare independente
Predicia - este procesul de stabilire a unor expectaii despre viitor avnd la baza date /
evenimente curente
Q- sort este o metod utilizat cu precdere n evaluarea personalitii. Persoana evaluat
va primi o list de adjective pe care le va sorta n funcie de msura n care acestea l
caracterizeaz
Scal categorial este similar cu scalele Likert, dar utilizeaz un numr mai mare de
opiuni de rspuns, de cele mai multe ori sunt utilizate scale cu 10 opiuni de rspuns
Scale Likert prezint o form foarte popular, utilizat mai ales n cadrul testelor de
personalitate, n care persoana evaluat trebuie s-i exprime acordul sau dezacordul fa de a
o afirmaie
Scor standard - este un scor care a fost transformat dintr-o scal n alta, ultima fiind una pe
baza creia se pot face comparaii.
Stabilitatea rezultatelor testrii - ne indic n ce msur la aplicri diferite n timp un
subiect obine rezultate similare la un test psihologic
Standardizarea - procesul de obiectivare i uniformitate a unui test
Testarea psihologica - constituie procesul de administrare, cotare si interpretarea a
rezultatelor unui test psihologic
Validarea procesul prin care se obin informaii legate de validitatea unui test
Validitate concurent (presupune obinerea scorurilor la criteriu aproximativ n acelai timp
cu scorurile la test. n cazul validitii concurente este vorba tot de o predicie, dar la aceasta
se ajunge pe o cale puin diferit fa de cea urmat n studierea validitii predictive
Validitate convergent - msura n care testul evalueaz aceleai constructe ca i alte teste
Validitate de discriminare msura n care testul evalueaz altceva dect alte teste despre
care se tie c se refer la constructe ce nu au legtur cu constructul msurat de test
Validitatea de aspect - ceea ce un test pare s msoare, mai degrab dect ceea ce msoar
Validitatea de aspect este definit ca ceea ce un test pare s msoare, mai degrab dect ceea
ce msoar
Validitatea de construct - reprezint msura n care se poate susine c testul msoar o
variabil sau o trstur specific
Validitatea de coninut - implic examinarea sistematic a coninutului testului pentru a se
verifica dac testul acoper un eantion reprezentativ din domeniul care se cere a fi evaluat
prin test
Validitatea de criteriu - indic msura n care testul este un bun predictor pentru un
eantion de comportamente viitoare
Validitatea predictiv - este definit ca acurateea cu care putem estima n ce msur o
anumit caracteristic sau aptitudine a unei persoane se va manifesta n viitor pe baza msurii
n care persoana posed o serie de caracteristici sau aptitudini curente
Scurt biografie a titularului de curs

Lector univ. dr. Anca DOBREAN este titular la Catedra de Psihologie Clinic i
Psihoterapie din cadrul Universitatii Babes Bolyai. Domeniile sale de competen includ:
psihodiagnostic, psihodiagnostic validat tiinific, patologia copilului i adolescentului.
Anca Dobrean participat in calitate de director, coordonator sau membru in 8
proiecte de cercetare naionale i internaionale, i a publicat ca autor sau coautor peste 30 de
studii stiintifice in reviste de specialitate, indexate ISI, recenzate in baze de date
internaionale i/sau recunoscute CNCSIS.

Psihodiagnostic Curs Idd

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Psihodiagnostic Curs Idd

Încărcat de

Drepturi de autor:

Formate disponibile

Universitatea Babe-Bolyai

Conditionri si cunostinte prerechizite

Albu, M. (1998). Construirea i utilizarea testelor psihologice, Editura Clusium.

Studenti cu nevoi speciale

Strategii de studiu recomandate

I. CONCEPTELE DE MSURAREA I EVALUARE N PSIHOLOGIE

Titlul i numrul modulului:

Dup parcurgerea acestui capitol:

Structura logic a modulului

CE ESTE EVALUAREA PSIHOLOGICA?

Chinezii ncorporau militarii pe baza unor evaluri prealabile

I.2. DEFINIII ALE TESTULUI PSIHOLOGIC

I.3. TESTUL CA INSTRUMENT DE MSURARE/EVALUARE

testele psihologice vizeaz atribute/trsturi specifice;

I.3.1. SCALE DE MSUR

Distingem 4 tipuri de scale de msur

scale de raport / proporii

I.3.1.1. SCALELE NOMINALE

Msurarea pe o scal nominal poate fi realizat ori de cte ori

Statistic, nu este posibil realizarea nici unei analize (X2, procente).

Msurarea pe o scal ordinal realizeaz ierarhizarea claselor.

Clasele sunt ordonate, dar distana dintre ele nu poate

Statistic poate fi calculat mediana, centilele.

I.3.1.2. SCALELE DE INTERVAL

Msurarea pe o scal de interval presupune o unitate de msur comun i

I.3.1.4. SCALELE DE PROPORII

Posed proprietile scalelor de interval, dar n plus au un punct zero nonarbitrar.

n psihologie msurarea nu se realizeaz pe scale de proporii.

Concluzii privind scalele de msur

I.4. TESTUL VIZEAZ UN EANTION DE COMPORTAMENT

I.6.2. TIPURI DE ITEMI

1. Itemi de tip "da-nu", "adevrat-fals"

2. Itemi cu rspunsuri la alegere

ex. __ 1. primul test de inteligen

I.7. SCOPUL UTILIZRII TESTELOR PSIHOLOGICE

I.8. DOMENII DE UTILIZARE A TESTELOR PSIHOLOGICE

- orientarea colar i profesional

- evaluarea potenialului managerial

- evaluarea maturitii colare

I.9. CLASIFICRI ALE TESTELOR PSIHOLOGICE

teste administrate de calculator.

1. Ce este un test psihologic?

Albu, M. (1998). Construirea i utilizarea testelor psihologice, Editura Clusium. p 13-20

II. ETALONAREA TESTELOR

Titlul i numrul modulului

Dup parcurgerea acestui capitol:

Vei putea defini etalonul (norma sau standardele)

Scurt recapitulare a conceptelor prezentate anterior

Structura logic a modulului

Cum interpretm rezultatul obinut de un subiect la un test?

!ATENIE! la eantionarea pe baz de cunotine, voluntariat, etc. deformri sistematice

Programele statistice au opiuni de a genera numere aleatoare.

Scopurile etalonrii sunt: 1. conferirea de semnificaii scorurilor i permiterea

! Paii construciei nui etalon sunt: 1. definirea populaiei; 2. eantionarea;

METODE DE ETALONARE (NORMARE)

Figura 1. Proprietile distribuiei normale

T este o scal a crei medie este 50 si sigma este 10;

Cuprinde 5 sigma sub/peste medie;

Scorurile n clase normalizate

Cum obinem staninele pentru fiecare scor?

Sarcini i teme ce vor fi notate

III. FIDELITATEA TESTULUI PSIHOLOGIC

Titlul i numrul modulului