Sunteți pe pagina 1din 176

UNIVERSITATEA TRANSILVANIA DIN BRAOV

FACULTATEA DE PSIHOLOGIE I TIINELE EDUCAIEI


CENTRUL PENTRU NVMNT LA DISTAN I NVMNT CU
FRECVEN REDUS

BAZE TEORETICE ALE


EVALURII PSIHOLOGICE

AUREL ION CLINCIU

BRAOV
2014

CUPRINS
Cuprins ............................................................................................................................................ 3
Bazele teoretice ale evalurii psihologice prezentare general ..............................................11
MODULUL 1. INTRODUCERE
Introducere ...................................................................................................................... 14
Competene ...................................................................................................................... 14
M1. Unitatea de nvare 1. Evaluarea psihologic, domeniu de vocaie al profesiunii de
psiholog ..................................................................................... 14
U1.1. Introducere ............................................................................................................ 13
U1.2. Competene ........................................................................................................... 14
U1.3. Psihodiagnoz, testare, evaluare............................................................................ 14
U1.4 Situaia termenului de psihodiagnostic n spaiul romnesc .................................. 16
U1.5. Marile domenii ale evalurii psihologice .............................................................. 17
U1.5.1. coala i domeniul educaional ................................................................ 17
U1.5.2. Domeniul sntii .................................................................................... 19
U1.5.3. Domeniul muncii ....................................................................................... 20
U1.5.4 Domeniul afacerilor i alte domenii de activitate ...................................... 20
U1.6. Probleme etice ale evalurii psihologice................................................................. 21
U1.7. Rezumat ................................................................................................................. 24
U1.8. Test de evaluare a cunotinelor ............................................................................. 25
M1. Unitatea de nvare 2. Testul psihologic, instrument de baz
al psihologiei aplicate ............................... 26
U2.1. Introducere ............................................................................................................. 26
U2.2. Competene ............................................................................................................ 26
U2.3. Scurt istoric al apariiei i dezvoltrii testelor ........................................................ 27
U2.4. Definirea testelor .................................................................................................... 28
U2.4.1. Eantionul de comportament ..................................................................... 29
U2.4.2. Standardizarea ........................................................................................... 30
U2.4.3. Fidelitatea .................................................................................................. 31
U2.4.3 Validitatea ................................................................................................... 31
U2.5. Administrarea testelor ............................................................................................ 32
U2.5.1. ndatoririle psihologului nainte de administrarea testelor ...................... 33
U2.5.2 Faza de administrare a testelor .................................................................. 34
U2.5.3. Faza post-test ............................................................................................. 35
U2.6. Examinatorul i variabilele situaionale ................................................................. 35
U2.7. Rezumat .................................................................................................................. 36
U2.8. Test de evaluare a cunotinelor ............................................................................. 37
3

MODULUL 2. DIFICULTATEA I SENSIBILITATEA TESTELOR


FIDELITATEA I VALIDITATEA TESTELOR
Introducere ...................................................................................................................... 38
Competene ...................................................................................................................... 38
M2. Unitatea de nvare 1. Dificultatea i sensibilitatea unui test psihologic ....................... 40
U1.1. Introducere ............................................................................................................. 40
U1.2. Competene ............................................................................................................ 40
U1.3. Dificultatea testelor ................................................................................................ 41
U1.4. Sensibilitatea testelor ............................................................................................. 41
U1.5. Construcia unui test psihologic ............................................................................. 45
U1.6. Rezumat .................................................................................................................. 47
U1.7. Test de autoevaluare a cunotinelor ...................................................................... 48
M2. Unitatea de nvare 2. Fidelitatea testelor ........................................................................ 49
U2.1. Introducere ............................................................................................................. 49
U2.2. Competene ............................................................................................................ 49
U2.3. Problematica general a fidelitii testelor ............................................................. 50
U2.4. Fidelitatea test-retest .............................................................................................. 51
U2.5. Coeficientul formelor paralele ............................................................................... 51
U2.6. Coeficientul de consisten intern ........................................................................ 52
U2.6.1. Metoda njumtirii (split-half) ............................................................... 52
U2.6.2. Metoda Kuder-Richardson ........................................................................ 53
U2.6.3. Coeficientul alfa al lui Cronbach .............................................................. 53
U2.6.4. Fidelitatea interscoreri ............................................................................. 54
U2.7. Condiii pentru determinarea fidelitii .................................................................. 55
U2.8. Rezumat .................................................................................................................. 56
U2.9. Test de autoevaluare a cunotinelor ...................................................................... 56
M2. Unitatea de nvare 3. Factori care afecteaz fidelitatea testelor ................................... 58
U3.1. Introducere ............................................................................................................. 58
U3.2. Competene ............................................................................................................ 58
U3.3. ntinderea diferenelor individuale ......................................................................... 59
U3.4. Lungimea testului ................................................................................................... 60
U3.5. Dificultatea testului ................................................................................................ 61
U3.6. Testele cu limit de timp ........................................................................................ 61
U3.7. Fidelitatea i erorile de msurare ........................................................................... 62
U3.7.1. Eroarea standard a msurrii .................................................................. 62
U3.7.2. Eroarea tip a estimrii .............................................................................. 64
U3.8. Interpretarea fidelitii ............................................................................................ 65
U3.9. Generalizabilitatea .................................................................................................. 65
U3.10. Analiza de varian i planul de optimizare ......................................................... 66
4

U3.11. Rezumat ................................................................................................................ 67


U3.12. Test de autoevaluare a cunotinelor .................................................................... 68
M2. Unitatea de nvare 4. Validitatea testelor ....................................................................... 69
U4.1. Introducere ............................................................................................................. 69
U4.2. Competene ............................................................................................................ 69
U4.3. Validitatea de faad ............................................................................................... 70
U4.4. Validitatea relativ la coninut ............................................................................... 71
U4.5. Validitatea relativ la criteriu ................................................................................. 71
U4.6. Validitatea relativ la construct .............................................................................. 73
U4.6.1. Validitatea convergent i divergent ....................................................... 75
U4.6.2. Matricile multitrstur-multimetod ....................................................... 76
U3.6.3. Studiul trsturilor latente......................................................................... 77
U4.7. Validitatea diferenial ........................................................................................... 79
U4.8. Teoria deciziei aplicat la testele psihologice,
asociat validitii predictive .................................................................................. 80
U4.9. Precauii legate de evaluarea coeficienilor de validitate predictiv ...................... 81
U4.10. Interpretarea coeficienilor de validitate .............................................................. 82
U4.11. Rezumat ................................................................................................................ 83
U4.12. Test de autoevaluare a cunotinelor .................................................................... 84

MODULUL 3. DEMERSURI APLICATIVE ALE TEORIEI TESTELOR PSIHOMETRICE


Introducere ..................................................................................................................... 85
Competene ..................................................................................................................... 86
M3. Unitatea de nvare 1. Analiza de itemi .... 87
U1.1. Introducere ............................................................................................................. 87
U1.2. Competene ............................................................................................................ 89
U1.3. Dificultatea itemilor ............................................................................................... 90
U1.4. Discriminabilitatea itemilor ................................................................................... 96
U1.5. Raportul dintre dificultatea i discriminabilitatea itemilor ................................... 97
U1.6. Indici corelaionali ai discriminabilitii itemilor .................................................. 99
U1.7. Rezumatul metodelor corelaionale .. 101
U1.8. Curba caracteristic a itemului ............................................................................. 101
U1.9. Test de autoevaluare a cunotinelor .................................................................... 103
M3. Unitatea de nvare 2. Normele i etalonarea testelor. Clasificarea testelor ............... 104
U2.1. Introducere ........................................................................................................... 104
U2.2. Competene .......................................................................................................... 104
U2.3. Eantionul normativ i normele testelor ............................................................... 105
U2.4. Etalonarea testelor ................................................................................................ 108
5

U2.4.1. Transformri de arie (neliniare) ............................................................. 108


U2.4.2. Transformrile liniare ............................................................................. 110
U2.4.3. Normalizarea scorurilor standard .......................................................... 111
U2.4.4. Stanine, stens i scale C .......................................................................... 113
U2.5. Exemple practice de construire a etaloanelor ....................................................... 114
U2.6. Clasificarea testelor .............................................................................................. 117
U2.6.1. Dup modul de administrare ................................................................... 117
U2.6.2. Dup timpul de execuie .......................................................................... 118
U2.6.3. Dup modul de executare a sarcinii de ctre subiect ............................. 119
U2.6.4. Dup modul de procesare implicat ......................................................... 119
U2.6.5. Dup constana coninutului de la o aplicare la alta .............................. 122
U2.6.6. Dup modul de cotare ............................................................................. 122
U2.6.7. Dup modul de interpretarea a scorurilor .............................................. 123
U2.6.8. Dup numrul variabilelor implicate ..................................................... 123
U2.6.9. Dup procesul psihic implicat ................................................................. 123
U2.7. Rezumat ................................................................................................................ 124
U2.8. Test de autoevaluare a cunotinelor .................................................................... 125
M3. Unitatea de nvare 3. Construcia i dezvoltarea scalelor psihologice ........................ 126
U3.1. Introducere ........................................................................................................... 126
U3.2. Competene .......................................................................................................... 126
U3.3. Paii de urmat n dezvoltarea scalelor .................................................................. 127
U3.3.1. Pasul nti ................................................................................................. 127
a. Recursul la o teorie valabil ................................................................. 127
b. Nivelul de specificitate al scalei ........................................................... 130
U3.3.2. Pasul al doilea .......................................................................................... 131
a. Lungimea i redundana setului iniial de itemi ................................... 131
b. Reguli de scriere a itemilor unei scale ................................................. 133
U3.3.3. Pasul al treilea .......................................................................................... 135
a. Scalele Likert ........................................................................................ 136
b. Scalele Thurstone .................................................................................. 137
c. Scalele Guttman .................................................................................... 138
d. Scala de distan social Bogardus ...................................................... 139
e. Numrul optim al categoriilor de rspuns ............................................ 140
U3.3.4. Pasul al patrulea ....................................................................................... 143
U3.3.5. Pasul al cincilea ....................................................................................... 144
U3.3.6. Pasul al aselea ........................................................................................ 145
a. Examinarea iniial a setului de itemi .................................................. 145
b. Corelaia item-scal ............................................................................. 146
c. Analiza factorial exploratorie ............................................................ 148
d. Scurt raport despre scal ...................................................................... 152
6

U3.4. Criterii de selecie pentru optimizarea lungimii scalei ......................................... 153


U3.5. Analize utile pentru determinarea fidelitii scalei .............................................. 154
U3.6. Rezumat ................................................................................................................ 156
U3.7. Evaluare: proiect aplicativ .................................................................................... 157
Lista de termeni .............................................................................................................. 157
M3. Unitatea de nvare 4. Raportul psihologic .................................................................... 160
U4.1. Introducere ........................................................................................................... 160
U4.2. Competene .......................................................................................................... 160
U4.3. Idei de baz pentru ntocmirea unui raport psihologic ......................................... 161
U4.4. Activiti propuse ................................................................................................. 162
U4.4.1. ntocmirea unui raport de examinare psihologic ...... 162
U4.4.5. Structura raportului psihologic ............................................................... 161
I. Datele factuale i de identificare a subiectului ..................................... 163
II. Scopul evalurii psihologice (ntrebarea de referin) ........ 164
III. Testele administrate i rezultatele obinute (note brute i standard).. 165
IV. Anamneza sau istoria personal a cazului ......................................... 165
V. Observaiile relevante din timpul examinrii ...................................... 166
VI Interpretarea rezultatelor .................................................................... 167
VII. Sumarizarea concluziilor .................................................................. 168
VIII. Recomandri .................................................................................... 169
U4.5. Rezumat ............................................................................................................... 169
U4.6.Test de evaluare a cunotinelor ............................................................................ 169
U4.7. Lecturi recomandate pentru acest curs ..... 170
Bibliografie .. 171
Anexa 1. Echivalenele rangurilor percentile n scoruri standard i standardizate . 174
Anexa 2. Echivalenele dintre diferite tipuri de scale normalizate .............................................. 175

Baze teoretice ale evalurii psihologice prezentare general a cursului


Introducere
Cursul de Baze teoretice ale evalurii psihologice este destinat studenilor din sistemul de
nvmnt la distan, de la specializarea Psihologie. El vizeaz cunoaterea temelor
majore i a problematicii actuale a testrii i evalurii psihologice, operarea cu noiunile de
baz ale acestei discipline ce fundamenteaz n mod direct latura aplicativ a profesiunii
de psiholog. Utilitatea sa este legat de familiarizarea cu problematica teoretic i practic
actual a psihodiagnosticului, cu modelele sale explicative i cu metodele de lucru cele
mai relevante, ceea ce va crea posibilitatea nelegerii i utilizrii instrumentelor
psihometrice avansate n context evaluativ. Prin toate acestea cursul contribuie la punerea
bazelor profesionalizrii n domeniul psihologic.
Obiectivele cursului
Dup ce vor parcurge acest curs studenii vor putea:
 s defineasc i s explice noiunile de baz din domeniul evalurii psihologice;
 s identifice genul proxim, dar i diferenele specifice dintre testarea i evaluarea
psihologic;
 s cunoasc etapele construciei unui test psihologic;
 s cunoasc i s aplice principalele reglementri de ordin etic n domeniul
utilizrii instrumentelor psihometrice;
 s cunoasc i s aplice practic cunotine teoretice la normarea i etalonarea
testelor;
 s cunoasc modul concret de pregtire a unei edine de testare psihologic
individual sau de grup;
 s indice care sunt ndatoririle psihologului naintea, n timpul i dup o edin de
testare/evaluare psihologic;
 s extrag elementele de specificitate ale cunoaterii i interveniei psihologice
prin fundamentarea cunoaterii despre nsuirile de baz ale testelor psihologice,
ca instrumente de cunoatere standardizate, stabile, fidele i valide;
 s determine practic aceste caracteristici de baz la nivel molar (testul
psihometric) i molecular (analiza de itemi);
 s aplice cunotinele dobndite la construirea unei scale psihometrice;
 s cunoasc i s aplice practic cunotinele dobndite la elaborarea unui raport
psihologic adecvat cerinelor de astzi ale profesiunii de psiholog.
Competene conferite
Parcurgerea cursului va conferi studentului capacitatea:
 de a analiza critic i de a corobora diverse surse de informaie pentru a rspunde la
sarcini de evaluare curente;
8

 de a organiza conceptele, datele i informaiile n sisteme de relaii pentru a


rspunde unor cerine specifice legate de construcia i utilizarea instrumentelor
psihometrice;
 de a utiliza datele adiionale rezultate din alte metode (convorbirea, interviul
clinic, anamneza i observaia dirijat) pentru a transforma edina de testare n
una de evaluare psihologic;
 de a dezvolta un repertoriu bogat de deprinderi practice de lucru i a utiliza surse
adiionale pentru a extrage informaia esenial necesar unei evaluri de calitate;
 de a forma i consolida capacitile de extrapolare i aplicare a cunotinelor
teoretice la situaii particulare de via sau la viitoarea activitate profesional;
 de a identifica instrumentele cele mai adecvate de diagnoz i de intervenie
destinate evalurii i optimizrii comportamentului clienilor investigai;
 de a colecta, pstra, transmite i utilize adecvat datele rezultate din evaluarea
psihologic.
Resurse i mijloace de lucru
Efortul de nelegere reclamat de parcurgerea acestei discipline este uurat prin
indicarea, la sfritul ntregului curs, a celor mai relevante referine bibliografice,
incluznd i lucrrile de specialitate cele mai importante aprute n Romnia
ultimelor decade. Orice alt lucrare tiinific disponibil (manual, curs, tratat,
articol), accesibil ca nivel de tratare i ca inut tiinific poate contribui
suplimentar la o nelegere mai deplin a problematicii studiate.
Complexitatea ridicat a cunotinelor i deprinderilor implicate n evaluarea
psihologic presupune o atitudine activ fa de materialul de nvat, cu o faz de
parcurgere lejer, de tip lectur, a unei uniti de curs, urmat de citirea sa analitic,
cu adnotri marginale i eventual rezumatul ideilor principale, cu reveniri periodice
prin repetiii de consolidare/meninere pentru materialele parcurse i cu rezolvarea
ct mai multora dintre exerciiile i temele propuse. n acelai timp, efectuarea
corect a tuturor aplicaiilor practice indicate n curs sau la sfrit de modul
contribuie n mod hotrtor la dezvoltarea competenelor menionate anterior.
Testarea psihologic este cu siguran unul dintre elementele cele mai definitorii ale
profesiunii de psiholog. Parcurgarea acestui curs poate fi considerat nu doar o
iniiere n acest domeniu, ci i o modalitate de formare practic a deprinderilor
bazale legate de etalonarea testelor, de scrierea raportului psihologic i de
parcurgerea tuturor pailor necesari construciei unei scale psihologice de calitate.
Totui, acest curs trebuie conceput doar ca o faz de iniiere dintr-un proces care
reclam stagii practice ulterioare de formare i utilizare a celor mai importante
instrumente psihometrice existente astzi pe piaa romneasc.
Cursul nu presupune softuri, mijloace fizice (instrumente) sau electronice speciale,
dar face apel la instrumente psihometrice consacrate.

Structura cursului
Cursul const din tre module, fiecare cu mai multe uniti de curs:
un modul introductiv, cu un caracter teoretic de ordin mai general, cuprinznd
dou uniti de curs ce trateaz despre specificul testrii i evalurii psihologice i
despre testul psihologic;
cel de al doilea modul este unul preponderent teoretic i cuprinde patru uniti de
curs, tratnd despre dificultatea i sensibilitatea testelor, dar i despre fidelitatea
i validitatea instrumentelor psihologice;
cel de al treilea modul trateaz exclusiv probleme practice ale evalurii
psihologice, cum ar fi analiza de itemi, construcia scalelor psihologice,
identificnd etapele i regulile de construcie ale unui raport psihologic de
calitate.
Aadar, ntregul curs const din 10 de uniti de nvare: dou pentru modulul
introductiv i cte patru pentru modulele urmtoare.
Pentru parcurgerea fiecrei uniti de nvare sunt necesare ntre 4 i 8 ore, fr a
socoti timpul necesar repetiiilor de consolidare sau efecturii cerinelor opionale
formulate n curs.
Patru uniti de curs (U2 din primul modul, U4 din al doilea i U2, U3 din cel de
al treilea modul) sunt considerate a fi uniti duble, ele necesitnd 6 8 ore de
studiu necesare citirii i aprofundrii cursurilor, dar i a efecturii unor dintre
cerinele practice necesare evalurii de parcurs.
Fiecare unitate de curs cuprinde exerciii i solicitri destinate fixrii i
aprofundrii informaiei prezentate, la aceasta contribuind i un scurt rezumat al
problematicii parcurse. n partea final unitatea de curs dispune i de un set de
sarcini destinate evalurii de parcurs care presupun parcurgerea prealabil i/sau
nvarea unitii respective.
Fiecare dintre cele trei module sunt evaluate printr-o tem de control care are un
caracter de sintez. Rezolvarea celor trei teme de control este obligatorie i
acestea vor fi predate la datele ce vor fi anunate la primele activitile tutoriale
sau cel mai trziu n ziua examenului scris. Fiecare tem conteaz ca 20% din
evaluarea final, restul de 40% fiind adus de examenul final.

Cerine preliminare
Bazele teoretice ale evalurii psihologice se afl ntr-o relaie de continuitate fireasc
cu cursul de Statistic, care ofer fundamentarea teoretic necesar nelegerii
construciei i utilizrii instrumentului su de baz care este testul psihometric. n
acelai timp, cunotinele de Psihologie general, Psihologia copilului i a
dezvoltrii, Psihologia educaional, Psihologia clinic, Psihologia organizaional i
a muncii sunt contributorii i beneficiarii majori ai evalurii i testrii psihologice.
10

Discipline deservite
Avnd un caracter de disciplin aplicativ, Bazele teoretice ale evalurii psihologice
este disciplina psihologic ce devine condiie necesar prealabil pentru parcurgerea
altor discipline nrudite: Metodologia cercetrii psihologice, Evaluarea aptitudinilor
i Evaluarea personalitii. n mod secundar, Psihologia social, educaional, a
muncii, clinic, organizaional i consilierea psihologic i gsesc un suport direct
n aceast disciplin.
Durata medie de studiu individual
Timpul mediu de studiu individual presupus de cele 10 de uniti de curs care
compun cele trei module, incluznd i exerciiile sau sarcinile prezente n fiecare
unitate de curs, este de 60 de ore. La acestea se adaug nc 20 de ore necesare
rezolvrii celor trei teme i aplicaii practice incluse n portofoliul de evaluare.
Evaluarea
Nota final la aceast disciplin va lua n consideraie urmtoarele elemente:
- nota la examenul teoretic din cele 10 uniti de curs ale celor trei module, care
confer 40% din nota final;
- trei teme i aplicaii practice n calitatea lor de evaluri de parcurs X 20% = 60%
din nota final.

11

MODULUL 1. INTRODUCERE
___________________________________________________________________

Cuprins
M1.1. Introducere ... 12
M1.2. Competene ........... 12
M1.1. Introducere
Modulul 1 are un caracter introductiv i de aceea el prezint conceptele i definiiile
principalelor constructe ce vor fi utilizate n modulele ulterioare.
Modulul 1 este alctuit din dou uniti de curs. Prima unitate de nvare dezvolt
ideea psihodiagnosticului ca domeniu de vocaie al profesiunii de psiholog i i
propune s opereze distinciile necesare ntre psihodiagnoz, testare i evaluare,
identificnd marile domenii ale evalurii psihologice, solidar cu conturarea
problematicii etice pe care aceasta o angajeaz.
Cea de a doua unitate de nvare furnizeaz o perspectiv nuanat asupra testului
psihologic, considerat instrument de baz al evalurii psihologice. Ea cuprinde un
scurt istoric, dup care este propus o definiie larg i nuanat a testului
psihometric, urmat de consideraii de ordin practic relative la administrarea testelor
i la ndatoririle psihologului n cele trei faze ale unei edine de testare/evaluare.
Ca pentru toate modulele care vor urma i acest prim modul poate fi (auto)evaluat
prin parcurgerea sarcinilor de lucru incluse n structura cursului (Do it), dar i prin
testul de autoevaluare prezentat la sfritul fiecreia dintre cele dou uniti de curs.
M1.2. Competene
Dup parcurgerea acestui modul, studenii vor fi capabili:
 s identifice specificul, obiectul i marile domenii ale evalurii psihologice;
 s efectueze distincia testare - evaluare psihologic;
 s identifice marile domenii ale psihodiagnosticului i s cunoasc principalele
probleme etice ale evalurii psihologice;
 s defineasc testul psihologic ]n acord cu standardele actuale n materie;
 s tie n ce const administrarea testelor i s precizeze care sunt ndatoririle
psihologului naintea, n timpul i dup edina de evaluare psihologic.
Durata medie de parcurgere a fiecreia din cele patru uniti de nvare, incluznd
rezolvarea sarcinilor propuse i a temelor de evaluare, este de 4 ore.

12

___________________________________________________________________
Modulul M1. Unitatea de nvare 1
EVALUAREA PSIHOLOGIC, DOMENIU DE VOCAIE
AL PROFESIUNII DE PSIHOLOG
___________________________________________________________________
Cuprins
U1.1. Introducere ............................................................................................................ 13
U1.2. Competene ........................................................................................................... 14
U1.3. Psihodiagnoz, testare, evaluare............................................................................ 14
U1.4 Situaia termenului de psihodiagnostic n spaiul romnesc .................................. 16
U1.5. Marile domenii ale evalurii psihologice .............................................................. 17
U1.5.1. coala i domeniul educaional ................................................................ 17
U1.5.2. Domeniul sntii .................................................................................... 19
U1.5.3. Domeniul muncii ....................................................................................... 20
U1.5.4 Domeniul afacerilor i alte domenii de activitate ...................................... 20
U1.6. Probleme etice ale evalurii psihologice................................................................. 21
U1.7. Rezumat ................................................................................................................. 24
U1.8. Test de evaluare a cunotinelor ............................................................................. 25
U.1.1. Introducere
O revist a literaturii privind principala activitate a profesiunii de psiholog
clinician scotea n eviden, acum dou decenii, un ntreg spectru de preocupri,
dintre care evaluarea psihologic i psihodiagnoza deineau cea mai mare pondere
(50%), urmate de psihoterapie (30%), de cercetarea tiinific (30%), de consiliere
(5%) i de terapia de mediu i socioterapie (5%) (vezi Ionescu, 1985, p. 51).
Plasarea n top a evalurii psihologice nu este specific numai domeniului clinic,
ci ntregului teritoriu al psihologiei aplicate, pentru c, prin instrumentele ei nalt
standardizate, ea ofer o cunoatere de adncime asupra fiinei umane, pe care se
pot fundamenta ulterior consilierea, psihoterapia sau ghidarea vocaional.
Afirmaia lui Perse (1972, p. 112), conform cruia, n domeniul clinic ... la ora
actual, examenul psihometric constituie partea cea mai important a interveniei
psihologului () metoda testelor fiind poate singura datorit creia specificitatea
i autonomia sa nu sunt contestate. i pstreaz valabilitatea i n celelalte arii ale
psihologiei aplicate, cu meniunea c termenul de testare trebuie nlocuit cu acela
mai cuprinztor de evaluare.
mprtim punctul de vedere al lui Kaplan i Saccuzzo (1993, p. iii) care i
exprim ... mhnirea pentru c prea muli studeni din colegii vd cursul de testare
psihologic ca plictisitor i nelegat de obiectivele lor sau de interesele lor pentru
13

carier. nsi evoluia psihologiei, prin ruperea din trunchiul disciplinelor


speculativ-filosofice spre cele practic-aplicative, este marcat de intrarea ei n
laborator n 1879, prin Wundt, i de supunerea sa la rigoarea tiinific a
experimentului. Aceast tendin a fost continuat de Galton, prin al su laborator
de antropometrie din 1884, sau de James McKeen Cattell care, n 1888, propunea
termenul de teste mintale, ce urmau s fie aplicate n laboratorul su de testare.
Recursul la experiment a fost indisolubil legat de apelul la cifr, la cuantificare i
msurare, care au fcut ca psihologia s i dezvolte instrumente precise de
investigaie, metode din ce n ce mai elaborate de analiz a datelor rezultate, ce au
conferit cunoaterii psihologice rigoare, exactitate i generalitate.
Pare deci cu totul surprinztor faptul c acest curs de testare i evaluare
psihologic, care pregtete studentul pentru ceea ce va fi partea fundamental a
profesiunii sale, s fie gsit plictisitor. Faptul s-ar putea explica eventual prin aceea
c acest domeniu de supraspecializare a devenit din ce n ce mai tehnic,
ncorpornd procedee de lucru i proceduri statistice sofisticate, care de multe ori
estompeaz frumuseea lui intrinsec. Acest impediment nu poate fi depit dect
prin faptul ca titularul de curs s fie el nsui un practician cu mult experien,
astfel nct printre rnduri s se simt freamtul problemelor vii, al implicrii
profunde i devotate ntr-o profesie care a devenit, prin toate acestea, o vocaie.
U1.2. Competene
Dup parcurgerea acestei uniti de curs studenii vor fi capabili:
 s identifice domeniul i specificul evalurii i al testrii psihologice;
 s fac distincia dintre evaluare i testare psihologic;
 s fac distincia dintre diagnosticul medical i cel psihologic (psihodiagnostic);
 s defineasc corect conceptul de evaluare psihologic;
 s defineasc conceptele corelative ale evalurii psihologice;
 s cunoasc i s defineasc standardele etice de ordin general n practica de
evaluare psihologic curent;
 s defineasc cele mai importante prevederi ale Codului deontologic al profesiei
de psiholog cu drept de liber practic aa cum sunt ele formulate de Legea
psihologului din 2004.

Durata medie de parcurgere a fiecreia din cele patru uniti de nvare, incluznd
rezolvarea sarcinilor propuse i a temelor de evaluare, este de 3-4 ore.
U1.3. Psihodiagnoz, testare i evaluare
Psihodiagnoza este un concept foarte puin sau deloc utilizat de coala de psihologie
anglo-saxon i aceasta probabil din cauza nedoritei apropieri a acestui termen de acela de
diagnostic, creat i consacrat de practica medical. n acest spaiu cultural a fost folosit extensiv
14

termenul de testare (testing), pentru a circumscrie teritoriul cunoaterii exacte i obiective, de tip
psihometric a persoanei, dei n ultimele decenii cel de evaluare (assessment) a ctigat tot mai
mult teren. Acest fapt are mai multe explicaii posibile:

Chiar dac din capul locului testele au fost destinate unor scopuri nu doar constatative sau
exclusiv tiinifice (de cunoatere), ci i-au propus s aduc o schimbare benefic n viaa
oamenilor, ele au generat o anumit aprehensiune, rezisten sau chiar o reacie advers.
Deoarece testele i itemii ce le compun au fost pstrai departe de ochiul public, ca de
altfel i procedurile de scorare, interpretare i utilizare a rezultatelor, ele au creat un val de
mister ce a generat team n rndul publicului larg, cu att mai mult cu ct utilizarea lor a
cunoscut o adevrat explozie ntre cele dou rzboaie mondiale.

Psihologii s-au vzut constrni de reglementrile legale din domeniu, de teama publicului
larg fa de teste i de consecinele acesteia s priveasc cu interes spre alte metode i
instrumente ale profesiunii lor (interviul, ancheta, studiul de caz etc.), testul rmnnd
instrumentul cel mai elaborat, n mna examinatorului cu o foarte nalt calificare, la care
acesta are acces dup stagii riguroase de pregtire, asistat, controlat i certificat de
specialiti recunoscui.

Evaluarea psihologic (assessment) a devenit termenul integrator, el fiind conceput ca o


rezolvare de probleme, deoarece fiecare variabil din natur este rezultatul combinrii unor
factori diferii, de unde necesitatea unor metode variate (printre care i testele), depinznd
de obiectivele, scopurile sau circumstanele n care se desfoar procesul evaluativ.

Testarea psihologic a devenit specific unor scopuri mai nguste i mai bine circumscrise,
n timp ce evaluarea este mai larg, prediciile i deciziile ei bazndu-se pe coroborarea
unei multitudini de surse adiacente.
Ca i obiective, testarea nu i propune s rspund la ntrebarea cum proceseaz persoana
o anumit informaie, fiind centrat pe produs (rezultatul la test), i nu pe proces (maniera
de a ajunge la acel rezultat).

Evaluarea (inclusiv cea formativ) ncearc s neleag o problem n cadrul ei ecologic


mai larg, de unde i spectrul mult mai extins de informaii utilizate: observaia naturalist,
vizita la domiciliu, ancheta, interviul sau simpla discuie cu prinii, profesorii i
reprezentanii autoritii. Ea nu dezavueaz procedurile standardizate, tipice testrii, dar,
fiind contient c acestea nu pot rspunde la toate ntrebrile, valorizeaz i informaiile
colaterale despre stilul de via, atmosfera familial, interaciunile din grup etc.

Relaia cu clientul este diferit n testare, unde poate s existe o legtur discontinu,
multiplu mediat sau chiar absent (n testarea de grup) sau o responsabilitate legal
minimal a examinatorului fa de cel examinat. n evaluarea psihologic relaia cum
clientul este una de fa-n-fa, cu responsabiliti explicite din partea examinatorului de a
desfura o activitate n folosul clientului su.

n practic, distincia nu este aa de tranant, aa cum arat Cohen, Swerdlik i Smith


(1992), termenii fiind deseori utilizai ca echivaleni i interanjabili, dei distincia dintre
ei trebuie pstrat.

15

Definiie
Autorii citai anterior definesc evaluarea psihologic (assessment) ca ... proces de strngere i de
integrare a datelor psihologice, corelate scopului de a face o evaluare psihologic, utiliznd
instrumente ca testele, interviul, studiul de caz, observaia comportamental i aparate special
destinate, mpreun cu procedee de msurare adecvate. (op. cit., p. 11).
U1.4. Situaia termenului de psihodiagnostic n spaiul romnesc
Deoarece n psihologia romneasc nu s-a impus nici termenul de testare, nici cel de
evaluare, pentru circumscrierea domeniului aplicativ termenul consacrat fiind cel de
psihodiagnostic, ca i n unele dintre rile francofone, vom face distincia dintre diagnosticul
medical i cel psihologic. Dup cum se tie, medicul identific o anumit boal, prin mijloace
clinice (observaie, anamnez, interviu clinic, examen somatic sau psihic etc.) i paraclinice
(analize de laborator, radiografie, echografie etc.) pentru a o introduce ntr-un cadru nosologic i a
formula un tratament. Schema consacrat de mai bine de un secol pentru multe din domeniile
medicinei este: diagnostic etiologic (viznd cauza bolii), patogenetic (mecanismele ei de
producere), diagnosticul pozitiv (raportarea semnelor la un sindrom) i diferenial (raportarea la
entiti apropiate din cadrul nosografic mai general). Toate acestea nu numai pentru a circumscrie
boala, ci pentru a stabili un prognostic i un tratament adecvat.
n psihologie, diagnosticul utilizeaz de asemenea o multitudine de mijloace, dintre care
doar unele standardizate: testul, interviul, studiul de caz, observaia comportamentului, tehnici
derivate din metoda experimental, ca reacia electrogalvanic, reflexul fotopupilar sau timpul de
reacie ori cel de laten. Sursele majore ale informaiilor sunt analiza comportamentelor, a
activitii i a produselor acestora, studiul expresiei i al conduitei verbale (chiopu, 1976). Marea
diferen n raport cu diagnosticul medical este aceea c n psihodiagnoz se are n vedere terenul
psihologic nealterat al omului de pe versantul normalitii (excepie fcnd munca psihologului
din clinica neuropsihiatric), pentru a face bilanul caracteristicilor sale psihice definitorii.
n viziunea Ursulei chiopu, psihodiagnoza este ... un act de analiz psihologic a unui
caz i, concomitent, o sintez logic ce permite organizarea contient a msurilor generale de
influenare a dezvoltrii personalitii cazului considerat (1976, p. 33). Elementul comun este
aadar succesiunea dintre latura constatativ (diagnostic) i cea prognostic-ameliorativ i
formativ (personalitatea optimal, selecia omului potrivit pentru locul potrivit, personalizarea
interveniei etc.). n acest sens psihodiagnoza este elementul de baz al psihologiei difereniale, pe
care a i fcut-o posibil.
Dei ocup un teritoriu extrem de important al psihologiei aplicate, din care s-a nscut i
pe care a dezvoltat-o continuu, psihodiagnoza nu se ntlnete definit ca atare n dicionarele de
psihologie, dup cum nici noiunile de testare i de evaluare, care o circumscriu, nu sunt definite.
Eventual ele rein accepiunea iniial a termenului propus de ctre Herman Rorschach, dup care
... psihodiagnosticul este o metod de explorare a personalitii, bazat pe interpretarea liber de
forme accidentale, cum ar fi petele de cerneal, ca n Dicionarul de psihologie Larousse, al lui
Sillamy (1996, p. 244), sau ca n Dicionarul de psihologie al lui Doron i Parot (1999, p. 624).
16

Niciunul dintre ele nu definete termenul de diagnostic psihologic, dat ca i titlu unei lucrri de
referin a lui Richard Meili (Manual psihodiagnostic, 1964), dar nici pe aceia de testare-evaluare,
n accepiunea american a termenilor utilizai de numeroi autori (Anastasi, Cronbach, Gregory,
Aiken, Kaplan i Saccuzzo etc.) pentru a-i numi lucrrile lor.
n Dicionarul encilcopedic de psihologie din 1997, coordonat de Ursula chiopu, reinem
definiia termenului care exprim chiar viziunea autoarei, dup care Diagnoza psihic se refer la
omul viu i concret i const dintr-o cunoatere complex a acestuia prin tehnici psihologice,
aplicate conform unei strategii, ce permit colectri de informaii organizate privind persoana dat.
(op. cit., p. 542). Termenul de psihodiagnostic este prezent i la Mariana Roca (Metode de
psihodiagnostic, 1974) i la ali autori clujeni care, n deceniul al optulea au editat un valoros
ndrumtor psihodiagnostic, n mai multe volume. Acesta a fost un foarte preios ghid pentru
psihologul practician, cci coninea nu numai elemente de natur teoretic despre exigenele
examinrilor psihologice, ci prezenta o diversitate de instrumente practice, adaptate i etalonate pe
populaie romneasc.
Lucrrile mai noi, din Romnia de dup revoluia din 1989, par a evita ns termenul de
psihodiagnostic, ele vorbind de Construirea i utilizarea testelor psihologice (Albu, 1998), despre
Cunoaterea psihologic a persoanei (Havrneanu, 2000), despre Evaluarea n actul educaional
terapeutic (Vlad, 1999) sau despre Testarea psihologic a copilului mic (Mitrofan, 1997). Doar
Valentina Horghidan mai conserv un concept care pare s devin inactual, cel de psihodiagnostic,
n lucrarea intitulat chiar Metode de psihodiagnostic (1997). n aceast lucrare autoarea include o
multitudine de metode, pe lng clasicele test i chestionar aprnd i observaia, convorbirea,
ancheta, experimentul, scalele de evaluare a abilitilor, metoda aprecierii obiective a
personalitii, fia de caracterizare psihopedagogic a elevului i chiar metodele sociometrice. Se
produce astfel o lrgire nepermis de mare a cadrului metodologic al acestei discipline ce tinde
astfel s-i subsumeze prin nglobare ntreaga metodologie a tiinei psihologice, cu deschidere
chiar i spre sociologie.
Opinm c termenul tradiional de psihodiagnostic poate fi totui pstrat, pentru c el
include i pe cel foarte tehnic i consacrat de testare (testing), destinat determinrilor cantitative,
dar i pe cel de evaluare (assessment), desemnat s completeze i s nuaneze diagnosticul cu
elemente calitative. Dar, pentru c testul psihologic rmne instrumentul su cel mai tehnic i cel
mai puternic, cu o evoluie neegalat de niciuna dintre celelalte metode, genernd o adevrat
tiin legat de construcia i aplicarea sa, credem c centrul de greutate al acestei discipline a
pihologiei aplicate, psihodiagnoza, trebuie s rmn testarea psihologic.
U1.5. Marile domenii ale evalurii psihologice
U1.5.1. coala i domeniul educaional
Prima arie n care s-a produs dezvoltarea i utilizarea testelor mentale a fost coala i
domeniul educaional, prin bateria publicat de Binet n 1905. La peste un secol de la lansarea
primei Scale metrice a inteligenei, coala rmne n continuare marele beneficiar al evalurii
psihologice.
17

Utilizarea evalurii psihologice pe terenul educaiei are funcii complexe:


Depistarea copiilor cu o dotare intelectual submedie (debilitate mintal, intelect de
limit), sau cu particulariti neuropsihiatrice distincte, pentru a li se crea condiii
favorabile de tratament psihopedagogic difereniat, prin includerea n coli speciale sau
prin integrarea lor n nvmntul de mas.

Depistarea supradotailor, pentru instituirea unei pedagogii a excelenei (curriculum


difereniat).

Diagnosticarea problemelor de nvare i a celor comportamentale, pentru a stabili


programe educaionale adecvate.

Selecia educaional prin teste standardizate la colegii sau universiti (nu ca o procedur
unic i exclusiv, ci n asociere cu alte metode, cum ar fi scrisorile de recomandare,
mediile din timpul anilor de studiu la anumite discipline colare, interesele elevului din
afara colii etc.).

Testele educaionale (docimologice sau de cunotine), pentru a verifica fie gradul de


atingere a obiectivelor preliminate, fie pentru a face un diagnostic local, regional sau
naional al nvmntului nsui ca sistem, fie pentru a detecta cunoaterea minim prin
posesia creia se poate face o certificare a educaiei primite ntr-un ciclu sau tip de coal.
Exemplu
Printre sarcinile consilerului colar este i aceea de a face orientarea i ghidarea
vocaional a elevilor, att la ciclul gimnazial, ct i la cel liceal. Pentru aceasta vei
utiliza un arsenal larg de metode i instrumente, care va transforma testarea elevilor
ntr-o form de evaluare complex:
teste, cel mai adesea de aptitudini, dintre care cele mai importante sunt cele de
aptitudini cognitive;
chestionare, pentru a determina structura intereselor de carier i cea a factorilor
de personalitate prezumai a avea legtur cu cariera aleas;
datele factuale, pentru a avea acces la variabile demografice importante;
discuiile cu cadrele didactice i studiul documentelor colare pentru a avea o
idee despre experiena de nvare acumulat de elevi;
interviul i focus-grupul;
discuiile individuale i cele de grup sau cu prinii i cu reprezentani ai
diferitelor profesii pentru informaii suplimentare sau pentru consilierea efectiv.

Prin intermediul psihodiagnosticului colar se poate asigura personalizarea nvmntului


i tratarea difereniat a elevilor, determinarea nevoilor de educaie, ghidarea vocaional i
orientarea n carier, selecia elevilor pentru programe speciale, determinarea potenialului de
nvare i promovarea metodelor de diagnostic formativ, controlul i autocontrolul procesului
educativ, surprinderea elementelor motivaional-afective legate de nvare, radiografierea
grupului de elevi i a dinamicii sale etc.

18

Credem c zona celei mai vaste i mai fructuoase ntlniri dintre tiina testelor
(psihometria) i tiina examinrii (docimologia, doxolgia sau docimastica) este cel al evalurii.
Chiar randamentul colar, ca raport dintre aptitudinile cognitive ale elevului i gradul de acoperire
a obiectivelor operaionale, exprimate prin calificative, note sau medii colare, este locul unde
testarea psihologic i evaluarea educaional se ntlnesc n modul cel mai fericit.
U1.5.2.Domeniul sntii
Domeniul sntii, n general, i cel al sntii mintale n special, presupune o fericit
sintez ntre funcia de psihometrician a psihologului clinician i cea de diagnostician, unde
contribuia lui rmne esenial i fundametal (Ionescu, 1985, p. 55), cu cea de psihoterapeut i
de cercettor. n echipa medic-psiholg, cel din urm pare a avea o ... situaie privilegiat n
cercetare, unde el nu face, asemenea medicului, un examen, nu acord o consultaie, ci ntreprinde
o investigaie, el desfoar o activitate de explorare, ceea ce i asigur un statut special n
cercetere. (idem, p. 59). Locul psihologului nu este numai n clinica de boli nervoase, deoarece
prezena sa n sntate duce la o reconsiderare a actului medical n ansamblul su prin repunerea
n drepturi a subiectivitii bolnavului. De aceea asistm la o extindere progresiv a ariei de
competen a acestui tip de specialist, i simultan a calitii prestaiei sale, motiv pentru care n
multe dintre rile vestice stagiile de formare pentru psihologul clinician sunt pe deplin
comparabile cu cele ale medicului, pentru a nu aduce n discuie i importana acordat pregtirii
psihologice a medicului nsui.
Psihologul clinician intervine diagnostic i terapeutic n:

aprecierea normalitii/anormalitii dezvoltrii neuropsihice a copilului i adolescentului


(clinica pediatric);

n investigarea dezordinilor de personalitate, a strilor reactiv-anxioase, a tentativelor de


suicid sau a strilor de criz;
n comportamentul deviant, asocial, antisocial sau delictual;

n diagnoza i tratamentul tulburrilor alimentare (anorexie, obezitate, bulimie);

n evaluarea dezordinilor neurologice sau psihiatrice, prin calculul indicelui de deteriorare,


ca i n recuperarea unor funcii mintale deteriorate parial sau total;

n diagnoza i recuperarea problemelor produse de involuie, sau de patologia asociat


mbtrnirii;

n expertizarea capacitii de munc sau a deficienelor de intelect pentru acordarea


certificatelor de persoan handicapat.
Dup modelul din exemplul anterior, inventariai gama instrumentelor i a
metodelor utilizabile pentru a atinge scopurile evalurii psihologice din
domeniul sntii.

Domeniul sntii este cel n care funcia diagnostic i cea prognostic sau recuperatorie
se ntlnesc plenar, fcnd din psiholog nu numai un om care aplic teste (de inteligen, memorie,
personalitate, aptitudini, valori, interese etc.), ci un specialist care acumuleaz o experien
19

preioas n prevenie i n terapie, oriunde intervine o disfuncie, sau acolo unde ea nc nici nu
exist, pentru a face posibil personalitatea optimal, integrat i adaptat.
n toate aceste domenii s-a conturat o zon de elecie a muncii psihologului, cea de
consiliere psihologic, a sfatului avizat, pentru o tot mai mare diversitate de situaii. Cum ar putea
fi acest copil mai puin conflictual n grup? Ce carier ar fi cea mai potrivit pentru persoana X?
Ce activiti i s-ar putea recomanda dup pensionare lui Y, pentru a se potrivi cu structura sa
cognitiv i cu interesele sale? Cum ar putea depi solicitrile prea stresante o personalitate de tip
A, pentru a preveni un infarct? Dar diabeticul sau hemofilicul ce anse au s coabiteze cu aceste
boli cronice? Sau ce risc exist pentru un cuplu care are un copil cu o boal genetic (sindrom
Down, de exemplu) de a avea un al doilea copil cu aceeai afeciune? (sfat genetic).
U1.5.3. Domeniul muncii
Domeniul muncii ofer un cmp de aciune imens psihodiagnozei i evalurii psihologice,
specialistul trebuind:

s evalueze fora de munc, pentru a face o selecie n domeniul profesiunilor;

s previn fluctuaia forei de munc i s limiteze accidentele de munc;

s avizeze periodic muncile i activitile cu risc crescut (lucrul la nlime, portul de arm,
serviciile de paz etc.);
s ofere criterii valide de promovare i s ajute la construirea carierei angajailor;

s identifice structura aptitudinal, cea a factorilor de personalitate i a intereselor pentru a


ajuta la reprofesionalizare, adic la reconversie profesional;

s asiste tehnic reciclarea i reprofilarea, ntr-o lume n care schimbarea devine condiia sa
permanent;

s contribuie la ameliorarea climatului de munc prin cunoaterea dinamicii grupurilor;

s se implice n adaptarea omului la main i a mainii la om (aspecte ce in de


ergonomie, destinat s amelioreze mijloacele puse la ndemna muncitorilor pentru a le
face compatibile cu caracteristicile lor fiziologice i psihologice).
Dup modelul din exemplul anterior, inventariai gama instrumentelor i a
metodelor utilizabile pentru a atinge scopurile evalurii psihologice din
domeniul muncii.

U1.5.3. Domeniul afacerilor i alte domenii de activitate


n lumea afacerilor testarea i evaluarea psihologic au o pondere n cretere accentuat,
deoarece de ele beneficiaz ntreg domeniul resurselor umane: selecia funcionarilor i a celorlali
angajai se bazeaz pe teste de aptitudini, achiziii, interese, motivaii, valori, care ajut nu doar la
angajare, ci i la promovare, transfer, creterea performanelor, satisfacia muncii sau selecia
pentru stagii de formare aprofundat. Studiul comportamentului consumatorului, marketingul i
vnzarea produselor, managementul, reclama etc., toate intr n aceast sfer a lumii afacerilor,
care are foarte multe suprapuneri cu cea a muncii, a educaiei i a sntii. De fapt, toate
domeniile activitilor umane, de la cele deja amintite, la transporturi, armat, poliie i pn la
20

creaie i art beneficiaz de ctigurile din zona diagnosticului i a evalurii psihologice. Nu


exist nici un domeniu al activitilor umane, nici un fel de manifestare a umanului care s nu
poat servi ca punct de plecare pentru diagnoza psihic. Remarcabil este faptul c n acest
domeniu experiena practic i cercetarea tiinific, ce duce la cristalizri teoretice, se presupun
permanent. Iat cuvintele generoase ale promotoarei psihodiagnosticului n Romnia, Ursula
chiopu: Prin diagnoza psihic se pune naturii umane o ntrebare, se caut un rspuns care devine
ntr-un fel valabil pentru mai ample probleme eseniale privind personalitatea uman. Actul
diagnozei psihice este doar momentul prim al unei activiti mai complexe, aceea de recuperare i
de recondiionare psihologic a capacitii umane i a dimensiunilor funcionale optime ale
personalitii umane. (1974, p. 45).
Aceasta nseamn c un bun specialist n evaluare psihologic nu iese ca atare de pe
bncile facultii, unde i se ofer doar cadrul general al pregtirii sale. El se formeaz n timp, prin
acumulare de experien practic divers (diagnostic, formativ i terapeutic), de cunoatere
teoretic pentru a putea pune ordine i extrage informaia relevant din datele culese. Un bun
psihodiagnostician are n spate ani de munc, fiiere cu mii de cazuri care i ofer baza de date
pentru construcia de bareme i etaloane aduse la zi, dispune de un arsenal de instrumente diverse,
ce dispun de cacteristici psihometrice ridicate, cu care poate s abordeze o gam larg de
probleme concrete. Formarea sa prin zeci de ore de practic pe lng un psiholog experimentat i
certificarea competenei sale sunt alte aplicaii practice importante ale evalurii psihologice.
1.6. Probleme etice ale evalurii psihologice
Discuiile n legtur cu responsabilitile sociale ale muncii psihologului au fost frecvent
reluate la majoritatea congreselor internaionale, fiind concretizate ntr-un cod deontologic al
Asociaiei Internaionale a Psihologilor, la care i Romnia a aderat. Trebuie s artm c perioada
de dezvoltare exploziv a testelor standardizate n America dintre cele dou rzboaie mondiale a
avut mai multe consecine practice, printre care i publicarea unei sinteze bibliografice, mereu
rembogit, numit Educational, Psychological and Personality Tests of 1933 and 1934, care va
fi de fapt prima ediie a ceea ce mai trziu se va numi Mental Measurements Yearbook (Buros,
1938), ce lista miile de teste aprute, sortndu-le tematic, dar i dup criterii de calitate sau
performane tehnice.
S ne reamintim...
Interesul pentru copiii supradotai s-a revigorat odat cu lansarea n spaiu de
ctre fosta Uniune Sovietic a primului satelit Sputnik (4 octombrie, 1957), cnd,
la un an, Congresul american a alocat sume importante pentru crearea de teste de
abiliti i de aptitudini n graba de a detecta studeni dotai i talentai
academic (Cohen, Swerdlik i Smith, 1992, p. 53).
Extinderea programelor de testare pe scar larg, combinat cu utilizarea
excesiv a testelor de aptitudini i de personalitate n toate domeniile, au
redeteptat ngrijorarea public legat de utilizarea i eficiena testelor
psihologice. Primele Recomandri tehnice pentru testele de achiziii au fost
publicate de Asociaia Psihologilor Americani (APA, datnd din 1895) n anul
21

1954, fiind precedate de Standardele etice ale psihologilor (1953) i urmate de


Standarde pentru testele educaionale i psihologice i manualele lor n 1966.
Acestea vor fi urmate de Principiile etice ale psihologilor (1981) i de o Caset
cu principiile psihologilor (1987) sau de un Cod al practicilor de testare n
educaie (1988). Recomandri speciale au fost fcute n legtur cu testarea
membrilor minoritilor culturale i lingvistice, a persoanelor cu dizabiliti, ca i
n legtur cu nou apruta ramur a administrrii, scorrii i interpretrii
computerizate a testelor.
Standardele din 1985 indic i cteva dintre drepturile celor testai.

Dreptul de a-i da consimmntul asupra testrii: cu ce instrumente sunt testai, cum vor fi
utilizate datele i cui vor fi remise informaiile despre rezultatele obinute.

Dreptul de a fi informat asupra rezultatelor: pentru a contrabalansa tendina ncetenit de


a da celui testat ct mai puine informaii despre performana sa (cu scopul de a nu produce
o cretere a anxietii sau de a nu genera o criz), s-a hotrt s se dea un feedback mai
consistent i mai realist subiectului, centrat nu numai pe rezultatele pozitive obinute de el,
ci i pe cele negative.

Dreptul la non-invazia vieii intime, private: exist o informaie privilegiat, protejat prin
lege, cum ar fi cea obinut din relaia avocat-client, medic-pacient, preot-credincios, sosoie i psiholog-client.

Dreptul la cea mai puin stigmatizant etichetare, care s nu lezeze demnitatea uman a
clientului.

Dreptul de pstrare a confidenialitii datelor: utilizatorul trebuie s-i ia toate precauiile


n depozitarea acestora n spaii ncuiate, n dulapuri de oel sau n computere parolate, care
s limiteze accesul doar la persoanele autorizate.
O parte dintre aspectele prezentate mai sus se regsesc stipulate i de legislaia altor ri n
care practica profesiei de psiholog a atins anumite standarde. Astfel, Societatea Francez de
Psihologie a creat un cod deontologic similar celui american, cu precizarea unor reguli de conduit
moral ce pot fi considerate de valoare universal. Redm doar cteva dintre ele, pentru o posibil
analiz comparativ, inclusiv cu legislaia romneasc.

Etica profesional stipuleaz c, n exercitarea profesiunii, psihologului i este interzis


orice act sau cuvnt care ar putea aduce atingere demnitii umane.

Secretul profesional, care trebuie pstrat n vorbe, n conversaie sau n depozitarea


documentelor n legtur cu tot ceea ce psihologul a vzut, a auzit sau a neles n cursul
practicii sale.

Respectul altuia: psihologul nu trebuie s se foloseasc de mijloace profesionale pentru ai asigura avantaje personale.
Informarea tiinific este un principiu care stipuleaz obligaia psihologului de a se
informa continuu asupra evoluiei cunotinelor din domeniul su i de a avea grij s
comunice tiina sa ct mai complet posibil, ntr-un spirit de exactitate i de adevr.

22

Autonomia tehnic oblig psihologul s rezilieze orice angajament pentru care nu se simte
apt prin tehnicile pe care le deine, el avnd n ntregime responsabilitatea alegerii
metodelor pe care le folosete.

Independena profesional, care nu neag munca de echip a psihologului, ci prevede doar


faptul c acesta nu trebuie s accepte condiii care ar putea s ating independena sa
profesional, adic s aplice corect principiile deontologiei profesionale.
S ne reamintim...
Consecin a legii 213/2004 care reglementeaz profesia de psiholog n Romnia,
a fost elaborat i un Cod deontologic al profesiei de psiholog cu drept de liber
practic care instituie regulile de conduit profesional ale practicianului sau
cercettorului din acest domeniu de activitate. Codul deontologic este destinat n
mod expres orientrii i reglrii doar a acelor activiti n care psihologii sunt
angajai profesional, i nu se refer la viaa particular a acestora, care poate fi
luat n discuie doar atunci cnd aceasta ar aduce prejudicii profesiei de psiholog.
Codul deontologic se sprijin pe urmtoarele principii fundamentale:
Respectarea drepturilor i demnitii oricrei persoane: prin activitatea lor
profesional psihologii respect tririle, experienele, valorile, opiunile
celorlali. Ei nu prejudiciaz imaginea public a clienilor lor i vor utiliza un
limbaj care indic respectul autentic al demnitii umane. Utilizarea informaiilor
obinute pe cale profesional nu se va face niciodat n detrimentul drepturilor
fundamentale ale omului, fie el beneficiar de servicii psihologice, participani la
cercetare, angajai sau studeni.
Principiul responsabilitii profesionale i sociale: psihologii vor ncuraja
starea de bine a clienilor lor i vor respecta dreptul acestora de a sista, fr nici o
justificare, participarea la serviciul furnizat sau la activitile de cercetare, n
calitate de subieci. Psihologii vor participa direct la dezvoltarea psihologiei ca
tiin, prin meninerea celor mai nalte standarde n materie, dar i la
dezvoltarea societii n general. Ei vor respecta legile i reglementrile societii
sau comunitii n care triesc i vor face tot posibilul pentru a fi impuse i
respectate standardele i principiile etice.
Principiul integritii profesionale: potrivit acestui principiu psihologul nu va
practica nici un fel de discriminare. El va promova acurateea, obiectivitatea i
onestitatea sau buna credin n raporturile cu clienii lor. De asemenea, el va
evita recompensele exagerate, conflictele de interese care i-ar reduce
imparialitatea sau care ar putea aduce atingeri profesiei sale sau imaginii
celorlali psihologi. El va fi deschis i va recunoater cu onestitate limitele
propriilor competene.

n mod foarte explicit, codul deontologic analizeaz cteva categorii de standarde etice
generale, cum ar fi cel al competenei, standardele cu privire la relaiile umane, standardele de
23

confidenialitate, standardele de conduit colegial, standardele de nregistrare, prelucrare i


pstrare a datelor, standardele relative la onorarii i taxe, ca i standardele pentru declaraii publice
i reclam.
O categorie special o constituie standardele specifice, care se refer n mod explicit la
educaie i formare profesional, la evaluare i diagnoz, la cercetarea tiinific i la valorificarea
rezultatelor acesteia. Astfel, pentru evaluare i diagnoz sunt formulate prevederi exprese despre
prezentarea caracteristicilor psihologice, condiiile de utilizare a testelor psihologice, obinerea
consimmntului pentru evaluare i diagnoz, construcia instrumentelor, interpretarea
rezultatelor, calificarea necesar pentru a dezvolta o testare/evaluare, responsabilitile legate de
administrarea instrumentelor i prezentarea rezultatelor pentru cei evaluai, ca i respectarea
dreptului de proprietate intelectual.
Codul deontologic furnizeaz indicaii la fel de detaliate pentru cercetarea tiinific i
valorificarea rezultatelor acesteia, n acord cu standardele internaionale existente relative la
obinerea acordului de a dezvolta o cercetare, obinerea consimmntului, utilizarea suporturilor
de nregistrare audio-video, evitarea unor categorii de subieci, utilizarea animalelor n cercetare,
plagiat, abuz de status, transmiterea i protejarea datelor, onestitatea tiinific i regulile de bun
conduit n cercetarea tiinific.
U1.7. Rezumat
 Testarea psihologic reprezint dimensiunea datorit creia specificitatea i
autonomia psihologului sunt de necontestat, indiferent de domeniul de activitate
n care se aplic testele.
 Termenului de psihodiagnostic, bine nrdcinat n psihologia romneasc i
francofon, i se substituie tot mai mult cel de evaluare psihologic.
 Evaluarea psihologic este un termen integrator mai generos, fiind conceput ca
o rezolvare de probleme ce include o mare varietate de metode adiionale.
 Aceasta deoarece evaluarea psihologic mut problema clientului n cadrul ei
ecologic, vizeaz o relaie de tip fa n fa i are n mod expres n vedere
beneficiul acestuia.
 n acest sens testarea psihologic rmne elementul cel mai tehnic al evalurii,
care poate fi efectuat doar de specialiti certificai n domeniu.
 Marile domenii de aplicare al evalurii psihologice sunt coala, domeniul
sntii (clinic), al muncii i ocupaiilor, al transporturilor, justiiei i armatei.
 Pentru ndeplinirea rolurilor sale, specialistul care face o evaluare psihologic
trebuie s se supun unor standarde i reglementri etice foarte stricte.
 Unele prevederi sunt de ordin mai general, fiind reglementate de un cadru legal
elaborat n fiecare din rile cu tradiie a testrii i evalurii psihologice.
 n Romnia acest cadru general este stipulat de Legea psihologului din 2004.
 n mod specific, Codul psihologului cu drept de liber practic instituie regulile
de conduit profesional ale psihologului cu drept de liber practic din
Romnia.
24

U1.8. Test de evaluare a cunotinelor


1. Invocai cinci motive pentru care termenul de testare a fost nlocuit treptat cu
cel de evaluare psihologic.
2. Analizai comparativ termenul de diagnostic din context medical i cel de
psihodiagnostic din contextul profesiunii de psiholog.
3. Ierarhizai componentele evalurii psihologice n contextul colar romnesc
contemporan, acordnd ponderi procentuale fiecrei categorii de atribuii.
Argumentai ierarhia propus.
4. Efectuai acelai demers n contextul psihologiei clinice sau a muncii (la
alegere).
5. Comentai trei dintre cele mai importante reglementri legale a profesiei de
psiholog, regsibile n majoritatea legislaiilor de resort.
6. Identificai n Legea psihologului din 2004 trei standarde specifice care s se
refere la formarea profesional, evaluarea i testarea psihologic.
7. Analizai comparativ standardele americane i franceze n materie de
testare/evaluare psihologic, indicnd suprapunerile dar i diferenele specifice.

25

___________________________________________________________________
Modulul M1. Unitatea de nvare 2
TESTUL PSIHOLOGIC, INSTRUMENTUL DE BAZ
AL PSIHOLOGIEI APLICATE
_________________________________________________________________
Cuprins
U2.1. Introducere ............................................................................................................ 26
U2.2. Competene ........................................................................................................... 26
U2.3. Scurt istoric al apariiei i dezvoltrii testelor ....................................................... 27
U2.4. Definirea testelor ................................................................................................... 28
U2.4.1. Eantionul de comportament .................................................................... 29
U2.4.2. Standardizarea .......................................................................................... 30
U2.4.3. Fidelitatea ................................................................................................. 31
U2.4.3 Validitatea .................................................................................................. 31
U2.5. Administrarea testelor ........................................................................................... 32
U2.5.1. ndatoririle psihologului nainte de administrarea testelor ..................... 33
U2.5.2 Faza de administrare a testelor ................................................................. 34
U2.5.3. Faza post-test ............................................................................................ 35
U2.6. Examinatorul i variabilele situaionale ................................................................. 35
U2.7. Rezumat ................................................................................................................. 36
U2.8. Test de evaluare a cunotinelor ............................................................................ 37
U2.1. Introducere
Nicio alt metod a psihologiei aplicate nu a avut o contribuie mai efectiv n
impunerea ei n aproape toate domeniile de activitate uman, dar i n declanarea
unor dispute care au culminat cu o puternic atitudine antitest, iniial n fosta
U.R.S.S., apoi n Statele Unite ale Americii (ara n care practica testelor a luat cea
mai mare amploare), dar i n rile de Jos, ulterior. Este de aceea ntemeiat
metafora Ursulei chiopu, care consider testul psihologic ... copilul scandalos al
psihologiei, ce mai tulbur i astzi spiritele (1976, p. 104).
U2.2. Competene
Dup parcurgerea acestei uniti de curs, studenii vor ti:
s descrie pe scurt apariia conceptului de test psihologic;
s defineasc testul psihologic ca msur standardizat a unui eantion de
comportament;
s identifice i s descrie trei dintre caracteristicile de baz ale testelor
psihologice, standardizarea, fidelitatea i validitatea;
s identifice i s defineasc corect ndatoririle psihologului naintea
26

administrrii, n timpul administrrii i dup administrarea unui test sau baterii


de teste;
s identifice variabilele situaionale care pot interveni ntr-o situaie de testare;
s defineasc i s proiecteze o edin de testare psihologic.
Durata medie de parcurgere a fiecreia din cele patru uniti de nvare,
incluznd rezolvarea sarcinilor propuse i a temelor de evaluare, este de 4 ore.

U2.3. Scurt istoric al apariiei i dezvoltrii testelor


Intuit de Francis Galton nc de la sfritul secolului al XIX-lea, care a ncercat fr succes
s dezvolte un test pentru a determina abilitile mintale prin msurarea unor caracteristici
perceptual-motrice, termenul de test a fost introdus n psihologie n 1890 de James McKeen
Cattell. Consacrarea metodei testelor vine ns prin Alfred Binet, care folosete Scara Metric a
Inteligenei (1905) pentru determinarea dezvoltrii intelectuale a copiilor, extinderea utilizrii
acesteia datorndu-se lui Munsterberg (determinarea aptitudinilor n vederea seleciei
profesionale).
La mai mult de un deceniu (1916) de la publicarea bateriei Binet, Louis Terman de la
Universitatea Stanford (SUA) a elaborat versiunea american a acestuia, cunoscut sub numele de
Scala Stanford-Binet. Chiar dup aceast dat Henry Goddard a realizat propria sa traducere a
scalei Binet. nc din 1912 Goddard dezvoltase o metod de determinare a defectivitii mintale
prin testarea imigranilor pentru selectarea acelora care urmau s fie deportai. Incluznd probe
care cereau familiarizarea cu scrisul, dar i cu cultura american, Goddard a descoperit (n 1917)
c peste 80% din imigrani erau defectivi mintal, furniznd i un clasament pe naiuni. Era o prim
utilizare greit a testelor, dar nu i ultima.
n timpul Primului Rzboi Mondial (1917 - 1918), o echip de psihologi, care l-a inclus i
pe Goddard, a dezvoltat dou baterii de teste pentru selecia primar i repartizarea pe arme a
recruilor: Army Alpha Test i Army Beta Test, pentru cei care aveau o bun, respectiv slab
posesie a limbii engleze. Aplicate n condiii de stres, improprii dup standardele de astzi (camere
aglomerate, instructaj greu audibil de ctre toi subiecii), rezultatele acestor teste l-au determinat
pe Robert Jerkes s concluzioneze c, pentru 47% dintre recrui, vrsta mintal nu depea 13 ani.
Statistici tiinifice, ntemeiate pe astfel de date reieite din testri n mas, au condus la apariia
Legii Imigraiei din SUA anilor 1924, care stabilea cote de imigraie pentru diferite naiuni,
dup rezultatele obinute la testele aplicate anterior altor imigrani. Rezultatele la teste ... au fost
de asemenea utilizate de unii pentru a argumenta segregarea negrilor i, n unele state, unii
oameni, dup scorul testelor de IQ, au primit eticheta de 'imbecil' i au putut fi sterilizai mpotriva
dorinei lor, sau chiar fr ca ei s tie (Bernstein, Roy, Srull i Wickens, 1988, p. 372).
Totui, toate aceste greeli i abuzuri de nceput ale psihometriei nu au putut opri evoluia
testului psihologic, a crui extindere progresiv a fcut ca rolul su s fie considerabil i n
cretere i astzi. Copil al altor metode, cum ar fi observaia i experimentul, ... testul a nsemnat
un progres enorm n metodologia cunoaterii structurii individuale i prin aceasta a condiionat
27

extinderea aplicaiilor psihologiei i consolidarea pe baz experimental a psihologiei difereniale


(Holban, 1973, p. 142). Aceasta deoarece testele au o valoare practic dovedit, generat mai ales
de precizia, obiectivitatea i relevana informaiilor obinute. Testele psihologice au un mare
randament, cci, n condiii de costuri materiale i de timp sczute, ofer o informaie care ar fi
greu de obinut prin alte metode. Astzi este tot mai evident c nu testele nsei trebuie
incriminate, deoarece la captul unei lungi evoluii au standarde foarte nalte relative la elaborare,
utilizare i interpretare, incomparabile cu oricare alt metod, ci modul lor de utilizare. Testele
sunt doar instrumentele perfecionate ale psihologiei aplicate, dar maniera lor de utilizare depinde
n principal de utilizator, i nu de caracteristicile lor intrinsece.
U2.4. Definirea testelor
Termenul de test este preluat din limba englez, unde to test nseamn a pune la prob,
a ncerca, chiar dac, pe filiera latin, cuvntul exista i n limba romn: testamentul este un
mod de probare a voinei cuiva n legtur cu destinaia bunurilor sale dup moarte. Mai mult,
termenul nu este specific psihologiei: medicina folosete tuberculina pentru a testa reacia
organismului la bacilul Koch, chimia are testul hrtiei de turnesol, fizica testul descompunerii
luminii i analiza spectrografic iar sociologia testeaz opinia public prin chestionare. n sens
larg, chiar o ipotez sau o teorie tiinific se valideaz prin testarea lor n realitate: o eclips de
soare a testat ipoteza curbrii razei de lumin n preajma corpurilor cereti cu mase mari, element
central al teoriei lui Einstein. Pe de alt parte, Freud sau cercettori din domeniul psihologiei
cognitive vorbesc de capacitatea unei persoane, respectiv a unei teorii, de a testa realitatea.
Pentru a surprinde specificul testelor i al testrii psihologice, vom prezenta cteva definiii,
aceasta deoarece nici n aceast arie a psihologiei nu s-a ajuns nc la un consens. Testul este deci:

Prob, instrument pentru diagnosticarea de caracteristici psihice (chiopu, Dicionar


enciclopedic de psihologie, 1997).
Prob utilizat mai ales n psihologia diferenial, care permite descrierea
comportamentului unui subiect ntr-o situaie precis definit (instructajul testului), prin
raportare la comportamentul unui grup de subieci plasai n aceeai situaie (Grand
dictionnaire de psychologie, 1994).
Msurare obiectiv a unui eantion de comportament (Anastasi, 1976).

Procedeu sistematizat de msurare a comportamentului unor persoane i de descriere a


acestuia cu ajutorul unor scri numerice sau a unui sistem de categorii (Cronbach, 1966).

Prob determinat, implicnd o sarcin de executat, identic pentru toi subiecii examinai.
Ea dispune de o tehnic precis pentru aprecierea succesului i pentru notarea numeric a
reuitei (Piron, 1963).
Situaie standardizat, servind drept stimul unui comportament. Acest comportament este
evaluat i comparat statistic cu al altor persoane plasate n aceeai situaie, ceea ce permite
clasarea subiectului, fie cantitativ, fie tipologic (Pichot, 1984).

Procedur standardizat prin care se formeaz un eantion de comportament care va fi


descris prin categorii sau scoruri. n plus, multe teste au norme care fac posibil utilizarea
rezultatelor n predicia altor comportamente, mai importante (Gregory, 1992).
28

Instrument al metodei experimentale, organizat sub forma unor probe standardizate din
punct de vedere al coninutului, al condiiilor de aplicare i al modalitii de apreciere a
rezultatelor, care este folosit n stabilirea unei anumite variabile (Holban, 1973).
S ne reamintim...
Din aceast multitudine de definiii elementele sintetice cele mai semnificative,
eseniale pentru nelegerea specificului unui test psihologic sunt:
este prob, procedur, procedeu sau instrument standardizat;

care servete drept stimul pentru producerea i msurarea unui eantion de


comportament;

care va fi apreciat prin raportarea i compararea cu o populaie de referin,


testat n condiii identice, n raport cu care s-a construit sistemul de apreciere
(barem, etalon, norme, categorii tipologice);

funcia lui fiind n acelai timp diagnostic (apreciaz starea de fapt), dar i
prognostic (anticipeaz categorii viitoare de comportamente mai importante
dect cele msurate efectiv);

pentru ndeplinirea acestor funcii ele trebuind s aib caliti psihometrice


specificate (fidelitate, validitate, sensibilitate sau for de discriminare).

U2.4.1. Eantionul de comportament


Ca i biochimistul, care ia un eantion de snge sau mostre de ap din locuri diferite pentru
a determina, prin analize, starea de potabilitate a apei, psihologul alege pentru testare eantioane
mici, dar cu atenie selecionate, din comportamentul unei persoane. Aceasta deoarece el trebuie
nu numai s diagnosticheze, ci mai ales s fac predicii valide. Cum investigarea
comportamentului n totalitatea sa este imposibil, cu att mai mult cu ct el se desfoar pe scara
timpului, avnd doar o constan relativ, psihometricianul trebuie s aleag eantioane de
comportament mai mici, dar strns i semnificativ legate de comportamentul anticipat. n test, cea
mai mic unitate de comportament ia forma itemului, care este constituit dintr-o situaie stimul
care solicit un rspuns ce poate fi evaluat separat de restul testului (Albu, 1998).
Nu este obligatoriu s existe o coresponden sau o similaritate foarte mare ntre
comportamentul prezis i itemii testului: n timp ce corespondena dintre proba de examen la
conducerea auto i conducerea efectiv este aproape deplin, un test proiectiv poate prezice, din
mrimea, forma, culoarea sau micarea invocate n rspunsurile la test, importante caracteristici
ale personalitii celui examinat. Testul nu este nici analitic, nici sintetic, ci analog cu situaia
real, n sensul c modeleaz coninutul psihologic al activitii reale, dar nu i forma exterioar a
acestuia, afirm Havrneanu (2000, p. 90). Aceasta ne ndreptete s afirmm c, dincolo de
deosebirile de form, trebuie s existe o identitate intern, de structur sau de coninut, ntre test i
sarcina real n raport cu care se face predicia, de unde rezult validitatea de construcie a testului.
Aa cum apreciaz Anastasi (1976, p. 25), de multe ori predicia se bazeaz pe diagnosticul
unui potenial sau al unei capaciti: Nici un test psihologic nu poate face mai mult dect s
msoare un comportament. Dac un asemenea comportament poate servi ca un indicator efectiv al
altui comportament, acesta poate fi determinat numai prin cercetare empiric.
29

U2.4.2. Standardizarea
Standardizarea este o condiie fundamental a testului psihologic, unde orice variaie a
condiiilor de aplicare produce o variaie a rezultatelor. Standardizarea se refer att la coninuul
testului (proba este identic cu sine nsi n ce privete nu numai coninutul itemilor, dar chiar i
forma lor de prezentare i foaia de rspuns), ct i la condiiile de aplicare (asemnarea pn la
identitate dintre condiiile n care s-a experimentat i cele n care se aplic proba) i n modul de
corectare, cotare i apreciere a probei de ctre autorul, respectiv utilizatorul testului. Fiind o
metod de baz a psihologiei difereniale, testul poate fi considerat variabila independent prin
care o nsuire psihic (variabila dependent) este observat prin examinarea persoanelor care sunt
testate (pstrarea constanei situaiei, elementul de variabilitate fiind persoanele).
Deoarece n psihologie pluri-determinarea face dificil izolarea fenomenelor, cerina
uniformitii i a identitii de procedur este mai stringent ca n alte domenii. Pentru a asigura
uniformitatea, autorul testului d indicaii precise i detaliate despre cum se administreaz i cum
se scoreaz rezultatele testului, indicaii ce vor fi respectate foarte strict, pentru c altminteri
rezultatele culese nu vor mai fi compatibile cu cele obinute pe eantionul standard (eantion de
etalonare sau normativ). Materialele folosite, modul lor de prezentare i de manevrare,
demonstraia prealabil, instructajul subiecilor, limitele de timp toate sunt specificate i
respectate ntocmai. Uniformitatea se refer i la rata vorbirii examinatorului, la tonul, inflexiunile
vocii sau expresia sa facial, care trebuie s rmn constante de la o aplicare la alta a aceleiai
probe.
Deoarece un test nu are indicatori predeterminai pentru aprecierea succesului sau a
eecului, un alt aspect al standardizrii se refer la norme, adic la stabilirea valorilor medii
(normale) ale performanelor, n funcie de care, plecnd de la scorurile brute (numrul de itemi
rezolvai corect, timpul, viteza, numrul de erori etc.) se stabilesc scorurile standard. Aceasta
presupune activitatea de etalonare, care se face pe loturi mari, reprezentative statistic, crora li se
determin media, mediana, abaterea standard, frecvenele brute i cumulate, n funcie de care se
stabilesc cotele standard. Performana oricrui individ nou examinat va fi raportat la acest cadru
de referin. Pentru ca acest lucru s fie posibil este obligatorie uniformitatea i identitatea
procedurilor de aplicare a testului, cu situaia de etalonare originar, pentru orice caz nou testat.
S ne reamintim...
n rezumat, standardizarea testelor presupune identitatea de procedur, de
aplicare/administrare i de cotare a unui test. n mod mai explicit standardizarea se
refer:
la coninut (proba va fi identic cu ea nsi);
la materiale i la modul de manipulare a acestora;
la instructaj i la aplicarea efectiv a probei;
la modul de corectare, cotare, scorare sau apreciere a probei;
la existena unor bareme sau norme prin care performana brut a subiectului
capt relevan statistic.

30

U2.4.3. Fidelitatea
Dac cineva i-ar determina greutatea citind pe cadranul unui cntar 80 de kg, iar pe al
altuia 92 de kg, la distan de cteva secunde, nu ar ti nici care este greutatea sa real, nici care
dintre cntare este cel bun (dac este vreunul). Cu att mai mult ne vom ndoi de indicaiile
cntarului respectiv cu ct, la dou msurtori succesive ale aceleiai persoane, el va indica valori
diferite. Un test, ca oricare alt dispozitiv de msurare, trebuie s fie fidel, adic egal cu sine nsui
(consistent), rezultatele unor msurtori repetate trebuind s fie cel puin stabile, dac nu identice.
Cu ct fidelitatea unui test este mai mare, cu att mai mare siguran avem c rezultatele lui sunt
reale, nefiind n mod semnificativ afectate de schimbri aleatoare, cum ar fi contextul, situaia de
testare, starea subiectului sau particularitile examinatorului. Utilizat n psihometrie, termenul de
fidelitate (reliability n englez) ntotdeauna nseamn consisten, afirm Anastasi (1972, p. 27).
S ne reamintim...
Exist cteva modaliti speciale de determinare a fidelitii. n principiu acestea
sunt toate metode corelaionale:
Procedura test retest (corelaia dintre rezultatele aplicrii aceluiai test, n
aceleai condiii, acelorai subieci, eventual de ctre acelai examinator, n
dou momente de timp diferite, la distan relativ scurt, pentru a nu aprea
modificri n structura parametrului investigat).
Calculul corelaiei dintre rezultatele unui test i forma sa paralel, alternativ
(n cazul n care ea exist), aplicat n condiii identice.
Tehnica njumtirii (split-half), prin care jumtatea par a unui test (itemii cu
numr par) este pus n corelaie cu jumtatea lui impar. Exist i alte metode
de njumtire.
Corelaia ntre modul n care psihologi diferii scoreaz acelai test, aplicat
acelorai persoane, n aceleai condiii (fidelitatea interscoreri).
U.2.4.4. Validitatea
Un test poate s fie fidel fr a fi ns i valid, nsuire care se refer la faptul c el msoar
efectiv ceea ce i-a propus. Nici un test nu are validitate sczut sau ridicat n mod absolut,
deoarece aceasta depinde de scopul i maniera n care testul este utilizat.
Exemplu
Galton a ncercat s determine ntr-o manier corect acuitatea perceptiv sau
sensibilitatea la durere, dar acestea s-au dovedit a nu fi determinri valide ale
inteligenei, aa cum el a presupus.
Spre deosebire de fidelitate, care se poate determina relativ uor, validitatea are nevoie de
acumulri graduale de informaie, rezultate din diferite tipuri de investigaii. Deoarece este un
proces progresiv, dependent de timp, este mai potrivit s se spun c un test se valideaz,
validitatea fiind acea determinare care permite s spunem n ce msur el i ndeplinete funciile
pentru care a fost proiectat, n raport cu diversele sale domenii de aplicaie. Prin validitate, testul
se testeaz pe sine, fcnd apel la diverse criterii externe, pentru a determina dac prediciile sale
au fost valabile i n ce msur, n funcie de care se va ti ce ncredere poate s i fie acordat.
31

S ne reamintim...
Ca i fidelitatea, validitatea este o corelaie, care se poate stabili n cteva feluri:
1. Msura n care un test acoper un domeniu, adic validitatea de coninut. Un
test de cunotine poate acoperi un mic sector al matematicii, sau unul mai larg,
caz n care el devine mai valid n raport cu acest domeniu.
2. Msura n care scorurile la un test sunt n acord cu teoria care susine trstura
sau constructul msurat, adic validitatea de construct.
3. Msura n care testul coreleaz cu un alt test independent, recunoscut ca un
bun instrument de msur al aceluiai domeniu (inteligen, memorie,
personalitate etc.), ceea ce reprezint validitatea relativ la criteriu. Cnd
scopul testului este predicia unui anumit comportament, criteriul va fi
msurarea viitoarei performane i corelarea ei cu testul iniial, n acest caz
vorbind de validitatea predictiv. Aceasta este o form fundamental de
validitate, pentru c de cele mai multe ori psihodiagnoza are n vedere
prognoza, adic anticiparea rezultatelor.
Unii detractori ai metodei testelor susin c cea mai bun predicie a rezultatelor
unei munci sau a unei activiti ar fi rezultatele obinute ntr-o perioad de timp n
chiar munca sau activitatea respectiv. Aceasta ar face inutil chiar activitatea de
selecie pe baz de teste, dar aceast modalitate nu este utilizabil practic din cauza
marilor cheltuieli de timp i bani presupuse de punerea ei n aplicare.
La aceste trei caracteristici care sunt standardizarea, fidelitatea i validitatea testelor, se
adug i sensibilitatea sau fora discriminativ, ct i condiia de etalonare, aspecte ce vor fi
tratate mai detaliat n capitolele urmtoare, ntruct de ele depind nelegerea i buna utilizare a
acestor puternice instrumente psihodiagnostice, care sunt testele psihologice.
U2.5. Administrarea testelor psihologice
Necesitatea de a avea stabilite proceduri detaliate sau doar orientative pentru administrarea
i scorarea testelor psihologice i educaionale a fost recunoscut de toate organizaiile care se
ocup cu testele. American Educational Research Association a stabilit 180 de standarde care
accentueaz asupra importanei uniformitii n administrarea i scorarea testelor. Procedurile de
testare depind fie de tipurile de teste (individuale sau de grup, cu i fr limit de timp, cognitive
sau de personalitate, psihologice sau educaionale etc.), fie de subiecii supui examinrii
(difereniai dup vrst, sex, cultur, grad de motivaie, nivel de anxietate etc.).
Formarea specialitilor care vor administra teste este una de durat, se face sub
supervizarea unui psiholog cu experien i presupune caliti personale, dublate de cunotine
detaliate despre instrumentele psihometrice utilizate. Cum variabilele situaionale pot avea o
pondere important n rezultatul final (variabile confundate), ele trebuie controlate ct mai
complet posibil.

32

U2.5.1. ndatoririle examinatorului nainte de administrarea testelor


Pentru a prentmpina efectul de surpriz (neindicat), testele psihologice vor fi programate
i anunate din timp. Se va evita plasarea edinei de testare dup mas, n timpul programului de
joac sau n concuren cu alte activiti mai interesante. n acord cu particularitile de vrst,
dac edina de testare ar putea depi o jumtate de or la grdini, o or n primul ciclu coalar
i o or i jumtate n cel de al doilea ciclu colar, atunci se vor organiza mai multe edine. n
cazul testelor educaionale elevii vor fi anunai din timp, pentru a se putea pregti fizic (odihn),
emoional i intelectual. Acolo unde este cazul, se va cere consimmntul scris, care este un acord
de principiu al examinatului sau al reprezentantului legal al acestuia c el consimte s fie
examinat. n rile avansate n materie, consimmnt informat este reglementat prin lege.
Tot ca o faz preparatoare este i pregtirea prealabil a examinatorului, care trebuie s fi
parcurs el nsui testul o dat, memornd la nuan i n detaliu instruciunile de aplicare, pentru a
nu avea nesiguran i ezitri n aplicarea acestuia. Pentru a crea o atmosfer informal, calm i
destins (important mai ales n examinrile individuale) psihologul trebuie s pregteasc i s
verifice cu minuiozitate materialele necesare, reducnd la minimum cutarea i organizarea lor
chiar n timpul edinei de testare. Dac vor fi folosite aparate, verificarea bunei lor funcionri i
calibrarea lor periodic devin obligatorii. n examinrile colective (de grup), fiecare caiet de test,
foaie de rspuns, creioane sau instrumente adiionale necesare trebuie atent verificate.
Familiarizarea cu procedurile de examinare presupune practica asistat de specialistul calificat,
care poate merge de la simpla observaie, pn la peste un an de instruire supervizat.
Asigurarea condiiilor satisfctoare de testare oblig psihologul s verifice condiiile de
ordin fizic (aezare, iluminare, ventilare, temperatur, nivelul zgomotului) i psihice, prin care
examenul s se desfoare confortabil. Anunul: Se testeaz! V rugm, nu deranjai! va descuraja
pe cei din exterior s inoportuneze, dei prezena unui supraveghetor la u, i chiar ncuierea ei pe
perioada sesiunii de testare, ar fi mai de dorit. Dac n cazul examenelor individuale (mai
costisitoare, dar i mai edificatoare) se pot controla mai uor variabilele externe, examinatorul
alegnd o camer linitit, potrivit scopului i lucrnd singur cu subiectul (chiar dac uneori
prezena printelui, a reprezentantului legal sau a poliistului se impune), n examinrile colective
precauiile vor fi mult mai mari, n special datorit larg rspnditei tendine de a tria sau de a fi
incorect, care poate vicia semnificativ rezultatele. Prezentm cteva msuri de siguran:
distribuirea de teste cu acelai coninut, dar aezate n forme diferite, prezena unui numr
suficient de supraveghetori atent instruii, care vor descuraja activ sau prin simpla lor prezen
tendina spre fraud. Acetia sunt cu att mai necesari cu ct grupul este mai mare, iar miza testrii
este mai ridicat, fiind de mare ajutor n distribuirea i colectarea materialelor, n secretizarea
foilor de rspuns (cnd se impune) i la supraveghere pentru prevenia oricrei situaii nedorite.
Detalii aparent nesemnificative cum ar fi forma pupitrului, tipul de foi de rspuns utilizate
(indicate a se folosi pentru subieci de peste 11 ani, pentru c ele ncetinesc considerabil viteza de
parcurgere a testului), prezena sau nu a ncurajrilor sau a comentariilor examinatorului, pot
afecta performana la un test i de aceea standardizarea procedurii de aplicare a acestuia trebuie s
mearg pn la cele mai mici nuane. Orice modificare a acesteia trebuie notat i luat n calcul la
interpretarea rezultatelor.
33

Ca psiholog nceptor n domeniul muncii i recrutrii de personal, ai fost


invitat s oraganizai o edin destinat seleciei de vnztori pentru o
companie din domeniul respectiv. Descriei pe o pagin toate elementele
necesare pregtirii atente a aceste edine de selecie, care se va desfura n
sala de conferine a unui hotel important.
U2.5.2. Faza de administrare a testelor
Examenul i testarea efectiv pune probleme specifice, una dintre cele mai importante fiind
stabilirea relaiei (raportului) examinatorsubiect (subieci). Examinatorul va trebui s declaneze
interesul, curiozitatea i cooperarea explicit a celui examinat. Testele de abiliti trebuie s aduc
subiectul n situaia de a da cea mai bun performan posibil a sa, pe cnd la testele de
personalitate i la chestionarele de opinii, atitudini i valori, obinerea sinceritii rspunsurilor
este elementul fundamental. La testele proiective, evocarea liber, fr cenzur i productivitatea
ridicat sunt factorii cei mai importani. Problemele motivrii, constana n lucru, evitarea
negativismului i a distragerii ateniei presupun tehnici de stabilire a contactului bine exersate.
Copiii (cu precdere cei mici) i btrnii, persoanele vulnerabile sau cele foarte ruinoase, timide,
din medii defavorizate sau aparinnd altor culturi ori etnii, creeaz probleme specifice. La acestea
se mai adaug delincvenii, recidivitii, deinuii, bolnavii psihic (n special psihopaii, dar i
anxioii, emotivii, depresivii, schizoizii i persoanele paranoiace), care pot dezvolta suspiciune,
indiferen, atitudini marcate de cinism, agresivitate sau nesinceritate.
S ne reamintim...
Dac la vrsta colar mic prezentarea testului ca un joc poate fi soluia optim, la
cea colar mare prghiile de motivare cele mai indicate sunt prezentarea testrii
ca pe o competiie cu sine i cu ceilali iar la liceeni stimularea nevoii de stim i
de prestigiu. De asemenea, familiarizarea prealabil cu sarcini asemntoare celor
din edina de testare ar putea fi folosit ca mijloc de reducere a tensiunii anxioase.
Examenarea adulilor pentru ocuparea unor posturi, selecia n anumite profesii sau
pentru cursuri de calificare reclam mult tact, pruden i experien din partea
psihologului.
n timpul desfurrii examenului psihologic, examinatorul va trebui s aib mult grij n
a urmri cu strictee procedurile standardizate de aplicare a testelor, neavnd voie s dea nici un
fel de indicaii, lmuriri suplimentare sau ajutoare, altele dect cele stipulate n mod expres de
manualul testului. Excepie fac edinele pentru determinarea potenialului de nvare (strategie
formativ definit i de Feuerstein n 1987), cnd se dau ajutoare n plus fa de cele prevzute,
dar i acestea ntr-o form standardizat, cuantificabil, pentru ca prin calculul diferenei fazei pretest i post-test s se determine n mod obiectiv acest potenial de nvare. Examinatorul trebuie
s rmn n alert, pentru a rezolva orice problem urgent care apare, s fie flexibil n atitudine,
cu sensibilitate i rbdare, mai ales pentru subiecii vulnerabili sau care au probleme (handicapai,
hiperkinetici, copii mici, timizi etc.).
34

Exemple
Aiken (1997) face cteva recomandri valabile pentru aceste categorii speciale:
 psihologul s asigure timp suficient celui examinat pentru a nelege i rspunde;
 s permit suficient antrenament la itemii simpli, pregtitori;
 s foloseasc perioade mai scurte de testare;
 s observe oboseala i anxietatea i s le ia n calcul;
 s sesizeze i s noteze deficienele perceptiv-motrice (defectele de auz, vz,
motrice, lateralizarea invers);
 s foloseasc generos ncurajarea i ntrirea pozitiv;
 s nu foreze subiectul s rspund cnd acesta nu mai dorete.
Toate recomandrile de mai sus nu trebuie s vin n conflict cu cerina de baz a
oricrei testri psihologice, care este standardizarea i uniformitatea de procedur.
n timpul testrii, mai ales la testele cu rspunsuri la alegere din mai multe posibiliti sau
variante, este posibil ca o parte dintre rspunsurile bune s poat fi efectiv ghicite, sau determinate
prin ceea ce Aiken (1997) numete deteptciunea n test (test wiseness). Prin aceasta se elimin
opiunile nepotrivite, prin semne adiionale scpate n formularea itemilor, ce permit judeci
comparative ntre opiuni. Exist tehnici speciale de ameliorare a performanelor la anumite teste,
nu prin pregtirea specific n domeniu, ci prin respectarea unor reguli.
U2.5.3. Faza post-test
Dup terminarea edinei de testare, examinatorul colecteaz i pune n siguran
materialele de testare i foile de rspuns. D mici bonusuri, recompense copiilor sau celor mai
anxioi sau vulnerabili. Uneori informeaz prinii sau persoana n cauz despre utilizarea ce va fi
dat rezultatelor testului. De asemenea el promite s furnizeze informaiile rezultate persoanei sau
ageniei care l-a angajat, indicnd timpul, locul sau maniera n care va face acest lucru. n caz de
examen colectiv, psihologul i ajutoarele sale colecteaz toate materialele utilizate n examen, se
asigur c nimic nu lipsete i abia dup aceea permite retragerea subiecilor, dup care el va pune
n ordine foile de rspuns i se va pregti s le scoreze.
V invitm la un exerciiu de imaginaie: anticipai consecinele posibile, n
plan practic, dar i etic, ale dispariiei unui caiet de test de inteligen larg
aplicat n evalurile colective pentru selecia de personal.
U2.6. Examinatorul i variabilele situaionale
Exist muli stimuli externi ambigui care trebuie luai n considerare sau controlai de ctre
examinator. Copiii precolari pun probleme speciale examinatorului, ca i btrnii, emotivii,
ruinoii, anxioii sau vulnerabilii. Vrsta, sexul, rasa, statusul social, economic i cultural,
experiena, antrenamentul, aparena exterioar a examinatorului sau a examinailor sunt de luat de
asemenea n calcul n ceea ce privete diferenele pe care examinatorul nsui le poate introduce.
Uneori chiar nivelul lui de expectaie poate genera profeia care se automplinete sau efectul
Rosenthal.
35

Situaia de examinare are i alte faete. Anne Anastasi arat c recruii abia ncorporai dau
rezultate mai slabe dac sunt examinai imediat dup ncorporare, fr s fi avut timp s se
acomodeze cu noul mediu. Uneori activitile imediat precedente i pun amprenta asupra
performanei la test. Feedback-ul pozitiv sau negativ dat de examinator pe parcursul desfurrii
testului poate ameliora sau diminua rezultatele finale. Chiar dac ponderea acestor factori nu este
foarte mare, ntr-un program de testare bine conceput examinatorul trebuie s fie foarte atent la ei
pentru a le minimiza influena.
Probleme suplimentare apar i atunci cnd o edin de testare este precedat de un
antrenament practicat cu teste similare. Deoarece practica testelor a luat o amploare extrem de
mare n toat lumea i deoarece multe decizii importante se bazeaz pe rezultatele obinute la
teste, edituri specializate sau firme de profil i ofer serviciile n antrenarea candidailor. ntr-o
manier similar cu a iluzionitilor care fac publice secretele confrailor, sau cu a informaticienilor
care introduc virui n programele calculatoarelor, psihologii au czut n propria curs, ceea ce i
oblig la precauii suplimentare ce fac din psihodiagnoz un domeniu tot mai tehnicizat.
Imaginai dou modaliti de a contrabalansa efectul antrenrii la teste de
performan prin parcurgerea unor sarcini de acest fel publicate de edituri sau
prin accesul la teste consacrate, favorizat de psihologi profesioniti.
U2.7. Rezumat
 Testul este considerat copilul scandalos al psihologiei, care mai tulbur i
astzi spiritele.
 Aceasta pentru c, nc de la nceput utilizrii sale, testul a creat posibilitatea
rezolvrii unor probleme practice, fiind instrumentul ce a generat apariia
psihologiei aplicative, educaionale i difereniale.
 Testul este un instrument economic i cu mare randament de utilizare.
 n acelai timp, testul a fcut posibile i utilizri inadecvate, ceea ce a avut drept
consecin apariia unor reglementri legale stricte privind utilizarea.
 Testul psihologic este o prob sau procedur standardizat ce servete drept
stimul pentru producerea unui eantion de comportament (Anastasi).
 Acesta va fi apreciat prin raportarea la un etalon sau tabel de norme, obinut pe
populaia de referin utilizat drept eantion normativ.
 Prima dintre cele trei nsuiri eseniale ale unui test psihometric este
standardizarea, adic uniformitatea de coninut, de aplicare i de interpretare.
 Fidelitatea unui test, determinat prin calculul corelaional, indic consistena
sa, adic stabilitatea sa n timp.
 Validitatea unui test este o caracteristic esenial mai greu de probat, dar
obligatorie pentru fiecare extindere a utilizrii testelor spre noi populaii sau
spre noi utilizri.
 n principiu, validitatea arat dac testul msoar efectiv ceea ce i-a propus s
msoare, pentru aceasta existnd mai multe tipuri de demersuri de validare.
36

U2.8. Test de evaluare a cunotinelor


1. Dai trei exemple de proast utilizare a testelor care au generat rezerve sau
nencredere legate de utilizarea acestora.
2. Furnizai trei contraexemple pentru a sublinia importana practic i teoretic a
testelor.
3. Argumentai n legtur cu cerina uniformitii i a identitii de prcedur dintre
testarea pe eantionul normativ i oricare alt aplicare particular a unui test.
4. Precizai semnificaia termenului de consisten n calitatea lui de atribut esenial
pentru fidelitatea testelor psihometrice.
5. Definii pe scurt cele trei tipuri de validitate.
6. Inventariai i analizai elementele necesare pregtirii atente a unei edine de
testare colectiv, organizat n scopul unei selecii pentru un curs de reconversie
profesional la sediul unei firme.
7. n calitatea dvs. de psiholog ntr-un penitenciar, indicai care ar putea fi
categoriile de persoane vulnerabile i precizai n ce va consta managementul
acestor cazuri speciale.
8. Cum poate fi prevenit apariia deteptciunii n test n edinele de testare
colectiv?
9. Inventariai cinci categorii de variabile situaionale care ar putea deveni
importante surse de distorsiune a rezultatelor obinute prin edine de testare
individual.

37

MODULUL 2. DIFICULTATEA I SENSIBILITATEA TESTELOR


FIDELITATEA I VALIDITATEA TESTELOR
___________________________________________________________________
Cuprins
M2.1. Introducere ... 38
M2.2. Competene ........... 38
M2.1. Introducere
Modulul 2 are un caracter general teoretic, el prezentnd caracteristicile cele mai
importante ale testelor psihologice, legate de dificultatea i sensibilitatea lor, de
problematica fidelitii i validitii lor. De asemenea, sunt prezentai factorii care
intervin n fidelitatea i validitatea testelor, ca i a modul de interpretare i control al
acestora.
Modulul 2 este alctuit din patru uniti de curs. Prima unitate de nvare precizeaz
n ce const dificultatea i sensibilitatea unui test i care este relaia dintre aceste
dou caracteristici complementare ale testului psihologic.
Cea de a doua i a treia unitate de curs dezvolt problematica fidelitii testelor
psihometrice, prezentnd principalele modaliti de determinare a acestei caliti
metrice a unui test, ca i factorii care afecteaz direct sau indirect fidelitatea.
Ultima unitate de curs este dedicat exclusiv validitii testelor, prin prezentarea a
trei modaliti de determinare a acesteia (relativ la coninut, la criteriu i la
construct), urmat de prezentarea modalitilor actuale avansate de determinare a
acesteia (validitatea diferenial i teoria deciziei aplicat la testele psihologice).
Suplimentar, sunt prezentate precauiile necesare evalurii fidelitii i modul de
interpretare practic a acesteia.
Ca pentru toate cele trei module, acest al doilea modul poate fi (auto)evaluat prin
parcurgerea sarcinilor de lucru incluse n structura cursului (Do it), prin testul de
autoevaluare prezentat la sfritul fiecreia dintre cele patru uniti de curs, ca i prin
testul de evaluare de la sfrit de modul.
M2.2. Competene
Dup parcurgerea acestui modul, studenii vor fi capabili:
 s defineasc i s analizeze dificultatea i sensibilitatea unui test, ca i relaiile
dintre cele dou caracteristici corelative;
 s defineasc i s opereze practic cu cele trei modaliti de determinare a
fidelitii prezentate n curs;
 s identifice factorii care intervin n problema determinrii fidelitii, indicnd
modul de operare al acestora i felul cum pot fi controlate de constructorul testului;
38

 s defineasc i s exemplifice n ce const validitatea unui test;


 s precizeze modul de determinare a validitii de coninut, de criteriu i de
construct a unui test;
 s indice i s opereze cu modalitile avansate ale determinrii validitii
(factorial i diferenial) i s interpreteze validitatea predictiv n termenii teoriei
deciziei;
 s cunoasc condiiile i precauiile legate de determinarea validitii i s tie
cum se interpreteaz principalii coeficieni de valditate.
Durata medie de parcurgere a fiecreia din cele patru uniti de nvare, incluznd
rezolvarea sarcinilor propuse i a temelor de evaluare, este de 4 ore.

39

___________________________________________________________________
Modulul M1. Unitatea de nvare 3
DIFICULTATEA I SENSIBILITATEA UNUI TEST PSIHOLOGIC
_________________________________________________________________
Cuprins
U1.1. Introducere ............................................................................................................. 40
U1.2. Competene ............................................................................................................ 40
U1.3. Dificultatea testelor ................................................................................................ 41
U1.4. Sensibilitatea testelor ............................................................................................. 41
U1.5. Construcia unui test psihologic ............................................................................. 45
U1.6. Rezumat .................................................................................................................. 47
U1.7. Test de autoevaluare a cunotinelor ...................................................................... 48
U1.1. Introducere
Aplicarea unui test psihologic sau educaional ridic o problem tehnic foarte
important i anume dac el este adecvat, ca i grad de dificultate, populaiei sau
grupului respectiv. Dac este prea uor, majoritatea scorurilor la test vor fi mari i
curba rezultat, n form de j, va fi asimetric spre dreapta; dac va fi prea greu,
curba n form de i va fi asimetric spre extrema stng. Se apreciaz c testul
este adecvat unei populaii doar n cazul n care repartiia scorurilor sale este
simetric, genernd o curb de tip gaussian.
Problema dificultii unui test se pune i n funcie de tipul acestuia. Dac el este
un test de aptitudini, capaciti, deprinderi sau cunotine, aceast problem este
mult mai relevant dect pentru testele de personalitate sau chestionarele de opinii,
atitudini, interese, valori, caz n care termenul de dificultate ar putea fi nlocuit cu
cel de accesibilitate.
U1.2. Competene
Dup parcurgerea acestei uniti cursanii vor fi capabili:
s pun n relaie forma distribuiei scorurilor unor probe psihologice cu
dificultatea testului;
s fac conexiunea dintre scopul testrii i nivelul de dificultate optim al unui
test sau baterii de teste;
s defineasc conceptual de sensibilitate a unui test i s l pun n legtur cu
forma distribuiei;
s identifice i s analizeze rolul lungimii testului, a manierei sale de scorare i a
tipului de norme utilizate n problema sensibilitii testelor;
s analizeze corelativ problema sensibilitii i dificultii unui test;
s prezinte etapele i specificul fiecrei etape din construcia unui test.
40

Durata medie de parcurgere a fiecreia din cele patru uniti de nvare,


incluznd rezolvarea sarcinilor propuse i a temelor de evaluare, este de 4 ore.

U1.3. Dificultatea unui test


Dificultatea testului depinde simultan de coninutul su, ca i de particularitile subiecilor
investigai, ceea ce face ca n construirea unui asemenea instrument s existe o faz iniial
(definirea testului, crearea bncii de itemi i construirea unei variante preliminare a acestuia), o
faz intermediar (administrarea testului, analiza rezultatelor obinute i, prin analiza de itemi,
depistarea erorilor, corectarea, reelaborarea, selectarea i ordonarea itemilor) i o faz final
constnd din creararea normelor, a etaloanelor i elaborarea manualului testului (vezi Albu, 1998,
p. 199).
Dac testele de aptitudini i de cunotine aplicate adulilor iau n considerare un proces
ncheiat, variabilitatea fiind dat mai ales de studii, profesie sau sex, cele mai multe teste de
inteligen, memorie, aptitudini speciale i cunotine, aplicate copiilor sau adolescenilor, au n
factorul vrst cea mai important surs de variabilitate. n acest sens, elementele de dificultate ale
testului trebuie s evolueze paralel cu vrsta (s aib indice genetic, dup expresia lui Claparde),
n cadrul fiecrei vrste el trebuind s aib o ct mai bun acoperire a spectrului domeniului
investigat. Aceasta trimite la puterea de discriminare a testului, adic la sensibilitatea lui.
Un test este uor sau greu n situaia cnd unitile lui, fiind foarte puternic corelate ntre
ele (test omogen), creeaz posibilitatea ca majoritatea itemilor s fie rezolvai ori corect, ori greit,
ceea ce va da curbe asimetrice spre dreapta sau spre stnga. Exist i posibilitatea ca populaia s
cuprind dou grupuri distincte, care vor produce scoruri polarizate dup o curb bimodal (cu
dou cocoae), ca n cazul testelor dihotomice: masculinitate-feminitate, extraversiuneintroversiune, stabilitate-instabilitate emoional. Multe teste de selecie profesional nu urmresc
ierarhizarea de finee a persoanelor, ci ruperea grupului n categorii extreme: apt-inapt, admisrespins, capabil-incapabil. Aici testele folosite vor fi mai mult centrate pe dificultate (mic, medie,
mare) i mai puin pe sensibilitate sau pe putere de discriminare. Aplicate la nceputul sau la
sfritul unui proces de formare, acelai test poate poate avea o curb iniial n form de i (cnd
deprinderea nc nu exist), n form de j (cnd n final aceasta s-a cristalizat pentru majoritatea
subiecilor), ntre care se interpune o repartiie normal, simetric, pentru perioada intermediar.
Trasai curbele de distribuie ale rezultatelor unui test de performan n faza
iniial, intermediar i final a formrii deprinderii msurate i explicai care
este elementul de legtur dintre forma curbei i faza n care este aplicat testul.
U1.4. Sensibilitatea unui test
Asemenea lentilelor, a cror calitate depinde n principal de puterea lor de separaie
(numrul de linii independente discriminate pe o suprafa de un centimetru ptrat), sau a
balanelor de finee, ca cele analitice, capabile s dea subdiviziuni din ce n ce mai fine i continue
pn la a cincea zecimal, caz n care se spune c sunt foarte sensibile, testele psihologice au
41

aceast caracteristic n funcie de numrul claselor de scor pe care le pot delimita n interiorul
unui grup. Cu ct numrul valorilor de scor este mai mare, cu att mai bine testul discrimineaz
(difereniaz) ntre indivizi.
n afara acestei accepiuni, Kline (1993) leag sensibilitatea unui test de capacitatea sa de a
produce scoruri diferite pentru subiecii care difer ntre ei n ce privete caracteristica msurat.
Deoarece sensibilitatea conjug caracteristicile testului cu cele ale populaiei msurate, vom
remarca faptul c testele mai lungi, cu itemi mai bine gradai ca dificultate sunt mai sensibile,
pentru c ele produc mai multe clase, i deci mai multe valori ale scorurilor posibile. Prin contrast,
testele scurte sau cu itemi foarte omogeni ca grad de dificultate, genereaz mai degrab categorii
de scor dihotomice, foarte contrastante, fiind puin discriminative. Depinznd de forma repartiiei
pe care o d scorurilor sale, testul cu curbe atipice (n i, j sau bimodal) sunt mai puin sensibile n
zonele de mare aglomerare a scorurilor i mai sensibile n rest. Curba lui Gauss este tot mai
discriminativ spre extreme, i tot mai puin sensibil pe poriunea sa central, unde aglomerarea
rezultatelor produce un numr mai mic de scoruri.
Exist o legtur foarte puternic ntre dificultatea unui test i sensibilitatea sa. La fel cum
n fotografie filmele foarte sensibile (care se impresioneaz la cantiti mici de lumin) pltesc un
pre n ceea ce privete calitatea imaginilor (mai puin nete, deoarece imaginea este tradus pe
pelicul prin grupuri mai mari de puncte), sau la fel ca n metrologie, unde balana analitic i
dovedete utilitatea pentru greutile mici, dar nu i pentru kilograme sau tone, testele psihologice
trebuie s stabileasc un raport optim ntre dificultate i sensibilitate.
Sensibilitatea presupune, pe de o parte, o ct mai bun acoperire a domeniului de coninut
al variabilei, pentru care testul trebuie s aib grade diferite ale dificultii, pe de alt parte discriminarea de finee la nivelul fiecrui palier de dificultate considerat. Pentru a exemplifica,
bateria de inteligen WISC este operaional de la 5-6 ani la 17-18 ani, pentru fiecare an
furnizndu-se etaloane din 4 n 4 luni. Dar, n timp ce anumite subteste ale bateriei (Informaii,
Comprehensiune) produc un larg evantai de scoruri, nct etaloanele nu au goluri, alte subteste
(Cifrele, Labirinturile), discrimineaz grosier pe anumite poriuni ale scalei, la anumite vrste, din
cauza numrului mic de itemi care le compun.
Subtestul Cuburilor, o foarte valid expresie a inteligenei concret-spaiale, compus din 10
pattern-uri ce pot da (n forma iniial) 55 de puncte de scor, are un prag nalt de intrare n prob la
vrstele mici (5-6 ani), unde nu distinge fin performana vizuo-spaial a celor cu coeficieni de
inteligen mai mici de 80, i un prag jos la vrste mari (peste 13 ani), unde nu mai distinge bine
supradotaii (IQ > 125/130). Pentru bateria WISC, combinarea optim a celor dou caracteristici
(dificultatea cu sensibilitatea) se face pentru vrstele de 11-13 ani, unde subtestele care o compun
au cea mai mare for discriminativ i deci cele mai bune caliti psihometrice (Zimmerman i
Woo-Sam, 1973). n mod similar, testul PM 38 (Matricile Progresive Standard ale lui Raven) are
un prag nalt de intrare n prob la 5-6 ani i unul jos dup vrsta de 14 ani, deci nu distinge bine
insuficiena ori supradotarea mintal, la vrstele mici, respectiv mari.

42

S ne reamintim...
Sensibilitatea testelor depinde de muli factori, dintre care amintim:

Numrul itemilor: progresiv cu creterea sa se creeaz posibilitatea creterii


numrului de clase de scor. Numrul maxim de clase de scor este chiar
numrul de itemi, atunci cnd ei nu sunt echivaleni sau intercorelai. Dac
lum exemplul testelor de inteligen, acestea ar trebui s msoare IQ-uri de la
40 la 160, avnd o lungime a amplitudinii scorurilor (cea care trebuie s
acopere ntreg spectrul de variaie) de 120 de uniti. Dac subtestul are 40 de
itemi, nseamn c cea mai fin rezoluie este de 3 uniti de IQ pentru un item;
dac am avea, ca la subtestul Cifre, 8 itemi pentru prezentarea direct i 7
pentru prezentarea invers, nseamn c 120/(8+7) = 8, deci fiecare item
acoper 8 uniti de IQ. Aceasta nseamn o discriminare grosier, cci orice
eroare de aplicare are consecine nsemnate asupra scorului la acest subtest. Pe
de alt parte, este aproape imposibil a genera un test cu sensibilitate maxim
(un punct de IQ s fie dat de cte un item separat), nu numai din cauza
extensiei amplitudinii mprtierii la 120 de uniti, dar i datorit numrului
de vrste distincte pe care testul trebuie s le acopere (de la 5 la 16 ani sunt 12
vrste successive ce trebuie evaluate). Aceasta ar da subteste neobinuit de
lungi i de greu aplicabile (nemaniabile). De aceea, teste de inteligen cu o
rezoluie de pn la 5 uniti de IQ pentru un item sunt nc acceptabile, dei
cele mai bune valori ale discriminrii sunt cele cuprinse ntre 2 i 3.

Maniera de scorare a testelor este alt modalitate important de cretere a


sensibilitii testelor. La subtestul Cuburilor din bateria WISC, se dau 4 puncte
pentru pattern-ul rezolvat corect i nc maximum 3 puncte drept bonificaie de
timp, rezultnd maximum 7 puncte per pattern corect rezolvat i 55 de puncte
n total. Deoarece rezolvrile parial corecte nu se iau n considerare, rezult c
o bun parte din variabilitatea scorurilor la aceast prob se pierde inutil.
mbuntirea sistemului de scorare, prin acordarea unui punct pentru fiecare
cub cu o culoare omogen (rou sau alb) pus n locul potrivit, i nc a unui
punct pentru feele bicolore (rou i alb) care respect nu numai locul, ci i
poziia relativ (nclinarea diagonalei), ar putea duce la dublarea ambitusului
scorurilor posibile i deci la dublarea forei discriminative a testului.
Adugarea a nc doi itemi (unul foarte uor, pentru intrarea n prob i unul
foarte greu, pentru a ridica pragul de ieire din prob), reconsiderarea timpului
de aplicare i al manierei de acordare a bonificaiilor de timp ar fi alte dou
surse posibile de mrire a sensibilitii testului. Trebuie fcut meniunea c
toate aceste modificri ale modului de scorare au ca efect reluarea de la zero a
problemelor de construcie, de etalonare, de determinare a validitii i
fidelitii probei, pentru c aceasta nseamn crearea unui test nou, ce trebuie
studiat ca atare.
43

Tipul de norme utilizate n etalonare este a treia caracteristic ce poate


contribui la ameliorarea semnificativ a sensibilitii unui test. Selecia tipului
de norme depinde de precizia dorit n utilizarea testului. Dac la normele
exprimate n centile se poate determina n principiu fiecare punct percentil (caz
foarte rar, pentru c testul ar trebui s fie foarte lung i eantionul foarte
extins), sau mcar punctele decile, la care se mai adaug percentilele 3, 5, 25,
75, 95 i 97, dezavantajul const n inegalitatea unitilor de msur (mai mici
pe poriunea central a seriei de variaie i mai lungi spre extremele acesteia).
n consecin, rezultatele unei baterii de teste etalonate n centile nu pot fi
adunate pentru a fi integrate ntr-un scor unic, prin determinarea mediei.
Cuartilele dau o mprire i mai grosier (4 clase), foarte larg, nepermind
discriminrile de finee. Testele moderne sunt etalonate n note z
(standardizate), sau n norme derivate din acestea, cum sunt notele C, T, Hull,
stanine, stens etc. Dintre acestea, pentru chestionarele de personalitate foarte
utilizate sunt notele T (cu media de 50 i abaterea standard de 10). Pentru
testele de inteligen foarte utilizate sunt scalele de IQ, ce au media de 100 i
abaterea standard de 15 sau 16. Ca regul general menionm c, cu ct o
scal va avea mai puine intervale (11, 10, 7, 5, 3), cu att mai mare va fi
pierderea de varian, consecina fiind scderea sensibilitii testului. Dac un
test de memoria cuvintelor este etalonat n stanine i stanina 5, la 10 ani,
corespunde scorurilor 48-52, nseamn c diferena de performan de 5 puncte
dintre subieci este practic anulat. Fie c scorul este 48, 49, 50, 51 sau este 52,
se obine aceeai stanin 5, sensibilitatea discriminrii avnd de suferit.
Aceasta nu nseamn ns c scalele cu mai puine intervale nu sunt foarte utile
n practic: multe baterii au subteste foarte diferite ca putere de discriminare i
atunci se alege o scal cu 9-10-11 trepte standardizate (stanine, stens sau note
C), care integreaz bine toate subtestele bateriei. n plus, unii psihologi s-au
acomodat mai bine cu proprietile matematice ale unui tip de scal i l prefer
n virtutea obinuinei. Esenialmente acordajul dintre scorurile la test i gradul
de extensie al scalei utilizate trebuie s ne conduc la alegerea unor scale foarte
discriminative, atunci cnd testul are mai muli itemi (peste 30-40) eterogeni,
nu din punctul de vedere al coninutului sau al performanei msurate, ci al
gradului de dificultate. Testele ce acoper mai multe vrste, difereniate ntre
ele prin performane ce au ambitusul amplitudinii mprtierii mare (ntre 40 i
160 la testele de inteligen) au nevoie de scale discriminative. Pentru scopuri
practice, dar i de cercetare, celelalte teste pot fi normate pe scale mai puin
extinse, chiar dac aceasta nseamn o scdere a puterii discriminative a
testului n cauz. Pentru subtestele bateriilor sale de inteligen Wechsler a
optat pentru o scal standardizat n 19 trepte, cu o abatere standard de 3, care
integreaz bine aceste subteste.

44

Exemplu
Cum dificultatea i sensibilitatea unui test depind de mrimea i de caracteristicile
lotului particular de subieci crora li se aplic testul, nseamn c este necesar s
se determin valorile tendinei centrale ale populaiei respective. Aceasta ofer o
imagine privitoare la gradul de suprapunere a lotului testat cu eantionul normativ,
prezentat de manualul testului. Cnd media grupului testat este semnificativ diferit
de cea a eantionului normativ din manual nseamn c testul este prea uor sau
prea greu, iar concluziile trase prin raportarea valorilor brute la etalon pot fi
distorsionate sau chiar greite. Dac abaterea standard indic o valoare mult
diferit (mai mic sau mai mare dect cea a lotului normativ), nseamn c lotul
testat este fie prea omogen, fie prea eterogen n raport cu eantionul normativ. n
prima situaie fora de discriminare a testului este mai sczut, n a doua mai
ridicat, dar n ambele situaii va trebui avut n vedere construcia unui etalon mai
adecvat populaiei respective.
Trebuie observat c nici un test nu poate fi att de sensibil nct totdeauna, dou persoane
deosebite n privina variabilei msurate de test s obin scoruri diferite, afirm Albu (1998, p.
189). Aceasta pentru c, n timp ce trsturile psihice sunt variabile continue, scorurile la test sunt
variabile discontinue i de aceea o coresponden biunivoc ntre variabila testat i scorul la test
este un fapt imposibil de realizat practic. Scorul la test fiind afectat de diverse tipuri de erori
(generate de testul nsui, de subiect, de examinator sau de situaia de examinare), este posibil ca
aceeai variabil, msurat la acelai individ, s aib mai multe valori de scor. ntruct
performana la un test se raporteaz la un numr de intervale mai mic dect numrul valorilor de
scor pe care el le poate nregistra, nseamn c indivizii plasai pe acelai interval de scor nu sunt
discriminai. Deci un test va fi cu att mai discriminativ cu ct va separa mai bine indivizii ce
prezint diferene mai mici n privina variabilei msurate.
U1.5. Construcia unui test psihologic
Analiza setului de itemi ai unui test se face nu numai n sensul determinrii puterii
discriminative a acestuia, ci i n contextul mai general al construirii unui test bun. Deoarece
construcia testelor a devenit n acelai timp o tiin i o art, ce implic o tradiie i experi n
domeniu, nu vom aborda aceast problem complex, prezentnd doar principiile generale care
stau la baza acestei activiti.
Aa cum se vede din figura 3.1 de mai jos, elaborarea unui test ncepe cu decizia
referitoare la ce fel de informaie dorim s obinem prin utilizarea sa. Itemii de genul adevrat-fals
vor fi utilizai doar cnd vrem s evalum judeci absolute, n rest fiind preferabili cei cu alegeri
multiple, care produc mai mult variabilitate a scorurilor. i n acest caz constructorul trebuie s ia
n calcul probabilitatea ca cineva s dea rspunsul din ntmplare (prin ans). Pentru scalele de
atitudini sau de opinii, cel mai popular este formatul dat de scala Likert: ntre acordul total i
dezacordul total se pot interpune 3 pn la 9 trepte, dintre care treapta intermediar reprezint
neutralitatea. Un alt format este scala n 10 puncte (metoda scalrii categoriilor) folosit n
45

ratingul unor comportamente, n care punctele de nceput i de sfrit sunt foarte clar definite.
Tehnica Q-Sort, folosit n studiul personalitii, cere unui subiect s fac evaluri asupra msurii
n care anumii itemi l descriu pe el sau pe altcineva (a se vedea capitolul ultim, despre crearea i
statisticile scalelor psihologice). Dup ce au fost creai i li s-a stabilit formatul, itemii vor fi
administrai unui grup pentru pilotarea formei iniiale a testului. Caracteristicile itemilor vor fi
apreciate printr-o evaluare sistematic a dificultii i forei lor de discriminare, prin determinarea
curbelor caracteristice ale acestora, prin studierea consistenei interne sau a validitii relative la
criteriu etc. Abia dup aceasta se face definitivarea formei finale a testului care va fi aplicat,
urmnd procedurile de standardizare stabilite (condiii de aplicare, instructaj, limite de timp i mod
de prelucrare a rezultatelor). Analiza tehnic a testului (fidelitate, validitate i etalonare) ncheie
un ciclu care se poate relua ori de cte ori constructorul dorete s-i perfecioneze sau s
reetaloneze testul, ori s-l mbunteasc din punctul de vedere al fidelitii sau al validitii prin
eliminarea sau adugarea de itemi.
Stabilirea scopului testului
STABILIREA SCOPULUI

Exprimarea scopului testului n termeni operaionali

EXPRIMAREA SCOPULUI N TERMENI OPERAIONALI

Definirea coninutului
abilitii msurate

A ABILITILOR

Definirea unei
trsturi

UNEI

Analiza muncii pentru


definirea comportamentelor,
trsturilor
i criteriilor
Def. Comportament

Revizuirea i redactarea
itemilor

Analiza itemilor (pretest)


Indicatori de dificultate i sensibilitate

Stabilirea formei finale a testului

Standardizarea procedurii de aplicare,


a instructajului, timpului i a modului de corectare

Analiza tehnic a testului


(fidelitate, validitate, etalonare)

Figura 3.1. Algoritmul de construire a unui test.

46

U1.6. Rezumat
 Analiza unui test se poate face la nivel molar (global) sau la nivel molecular
(analiza itemilor testului).
 La nivel global se are n vedere determinarea dificultii i sensibilitii unui test
care msoar aptitudini, capaciti, priceperi, deprinderi sau cunotine.
 Pentru chestionare (de interese, opinii, valori sau atitudini) problema dificultii
nu se pune, acestea trebuind s aib o larg accesibilitate.
 Dificultatea testului cupleaz caracteristicile sale intrinsece, care in de coninut,
cu cele extrinsece, care in de populaia i de scopul testrii.
 Dificultatea testului se determin prin tipul de curb care rezult din aplicarea sa
pe populaia int.
 Sensibilitatea unui test este sinonim cu puterea sa de discriminare i este
definit prin numrul claselor de scor pe care le poate produce n interiorul unei
distribuii de scoruri.
 Sensibilitatea unui test depinde de trei factori eseniali: de numrul itemilor, de
maniera de scorare a testului i de tipul de norme utilizat n etalonarea sa.
 Astfel, un test cu mai muli itemi gradai ca dificultate, poate produce mai multe
clase de scor, fiind deci mai sensibil.
 Maniera de scorare poate capta mai mult sau mai puin din variabilitatea
performanelor la test. Este de preferat s se utilizeze acea manier de scorare
care, fr a fi complicat, nu produce pierdere de variabilitate.
 Timpul de lucru i bonusurile de vitez, de precizie, de calitate sau alte elemente
pot furniza maniere de scorare mai mult sau mai puin discriminative.
 Opiunea pentru un anumit tip de scal poate fi foarte important: scalele cu
numr mic de trepte reduc din variabilitate, iar cele foarte discriminative
reclam un numr prea mare de itemi.
 Sunt preferabile scalele care realizeaz cel mai bun echilibru ntre aceste
constrngeri i cele care integreaz cel mai bine itemii unei baterii.
 Deoareace dificultatea i sensibilitatea testelor depinde de coninutul lor
intrinsec, conjugat cu caracteristicile populaiei int i cu scopul testrii, este de
dorit s se compare tendinele centrale ale acestei populaii cu valorile lotului
normativ publicate de manualul testului.
 Dei rezervat experilor, construcia unui test este o secven circular de faze
ale unui algoritm ce debuteaz cu identificarea constructului de msurat, cu
operaionalizarea sa, cu redactarea formei iniiale a testului i cu pilotarea sa,
pentru a continua cu analiza i selecia itemilor n funcie de calitile lor
psihometrice, cu stabilirea formatului final al testului i standardizarea sa, cu
publicarea manualului prin includerea datelor tehnice necesare (fidelitate i
validitate). Algoritmul este unul circular pentru c fazele anterioare sunt urmate
de reelaborarea testului pentru a integra informaiile reieite din utilizarea sa i
a-l aduce la zi n raport cu schimbrile ce au loc la nivelul populaiei.
47

U1.7. Test de evaluare a cunotinelor


1. Argumentai n legtur cu nivelul optim al dificultii pe care va trebui s o aib
un test de aptitudini utilizat pentru o selecie de tipul cinci candidai pe un post.
2. n urma aplicrii unui test de cunotine s-a obinut o distribuie bimodal (cu
dou cocoae). Cum interpretai aceast distribuie n termeni de dificultate a
testului?
3. Care este distribuia tipic pentru un test foarte dificil? Dar foarte uor?
4. Argumentai n privina legturii dintre dificultatea i sensibilitatea unui test de
inteligen lund n calcul factorul vrst.
5. Cnd este sensibilitatea unui test un lucru pozitiv i cnd unul negativ?
6. Care din cele trei modaliti de cretere a sensibilitii unui test, prezentate n
curs, este mai accesibil constructorului unui test de evaluare educaional i de ce?
7. Care sunt considerentele de care trebuie s in cont un constructor de teste
pentru a utiliza un anumit tip de norme? (Argumentai alegerea fcut).
8. n algoritmul construciei unui test psihologic, care sunt fazele de rutin i care
cele de creativitate ? (Argumentai alegerea fcut).
9. Argumentai n legturt cu rolul pe care l poate avea experiena n utilizarea
unui test n privina sensibilitii i dificultii acestuia.

48

___________________________________________________________________
Modulul M2. Unitatea de nvare 2
FIDELITATEA TESTELOR
_________________________________________________________________
Cuprins
U2.1. Introducere ............................................................................................................ 49
U2.2. Competene ........................................................................................................... 49
U2.3. Problematica general a fidelitii testelor ............................................................ 50
U2.4. Fidelitatea test-retest ............................................................................................. 51
U2.5. Coeficientul formelor paralele ............................................................................... 51
U2.6. Coeficientul de consisten intern ........................................................................ 52
U2.6.1. Metoda njumtirii (split-half) ............................................................... 52
U2.6.2. Metoda Kuder-Richardson ........................................................................ 53
U2.6.3. Coeficientul alfa al lui Cronbach .............................................................. 53
U2.6.4. Fidelitatea interscoreri ............................................................................. 54
U2.7. Condiii pentru determinarea fidelitii .................................................................. 55
U2.8. Rezumat .................................................................................................................. 56
U2.9. Test de autoevaluare a cunotinelor ...................................................................... 56
U2.1. Introducere
Testele sunt concepute ca instrumente de msur perfecionate, n consecin ele
trebuie s aib calitile psihometrice presupuse de acest fapt. Dac pentru
lungime, mas, volum, timp sau temperatur exist att instrumente perfecionate
de msur, ct i uniti metrice bine definite, inteligena, memoria, personalitatea,
motivaia, iubirea sau sntatea, agresivitatea, tolerana la frustrare sunt
caracteristici psihologice foarte complexe, ce nu pot fi vzute i atinse n sens fizic,
fiind deci greu cuantificabile.
U2.2. Competene
Dup parcurgerea acestei uniti cursanii vor fi capabili:
s defineasc eroarea standard de msurare (SEM) i s argumenteze n legtur
cu rolul ei n problema determinrii fidelitii testelor psihometrice;
s defineasc conceptual de fidelitate a testelor psihologice;
s indice modul de determinare a coeficientului de stabilitate al unui test;
s defineasc modul de determinare al coeficientului formelor paralele;
s indice modul de obinere a coeficientului de fidelitate prin metoda
njumtirii (split-half);
s analizeze adecvat formulele Kuder-Richardson i Cronbach n calitatea lor de
msuri consacrate ale consistenei interne a unui test;
49

s precizeze care este utilitatea practic a fidelitii interscoreri;


s identifice condiiile de baz ce trebuie luate n calcul la determinarea
fidelitii.
Durata medie de parcurgere a acestei uniti de nvare, incluznd rezolvarea
sarcinilor propuse i a temei de evaluare, este de 4 ore.

U2.3. Problematica general a fidelitii testelor


Cu toate problemele pe care msurarea le pune n psihologie, preocuparea pentru
acurateea instrumentelor utilizate n sens metric a generat standarde extrem de exigente i de
sofisticate. Plecnd de la Spearman (1904), Thorndike (1904), Thurstone (1936), Kuder i
Richardson (1937) i pn la Cronbach (1972, 1989) i Bentler (1990, 1991), a existat o linie de
evoluie continu n dezvoltarea unor teorii tot mai elaborate despre fidelitatea probelor
psihometrice.
S ne reamintim...
Teoria clasic asupra fidelitii testelor este construit n jurul erorii standard de
msurare care plec de la ideea c fiecare persoan testat ar avea un scor
adevrat, care ar fi obinut dac aceast eroare nu ar exista. Deci scorul observat
(O) este alctuit din scorul adevrat (A), la care se adaug eroarea de msurare (E):
O=A+E
O alt supoziie a teoriei clasice a testului este c aceast eroare este una aleatoare,
deci scorul adevrat va fi media unei distribuii n care dispersia reprezint erorile
aleatoare de msurare. Cum aceste distribuii pot avea dispersii mai largi sau mai
nguste, nseamn c i erorile de msurare vor fi mai mari sau mai mici. n felul
acesta teoria clasic a folosit abaterea standard a erorilor ca msur de baz a erorii
de msurare, numit i SEM1.
Fidelitatea unui set de scoruri este exprimat de un numr zecimal cuprins ntre 0,00 i
1,00, indicnd absena fidelitii, respectiv fidelitatea perfect. Deoarece nu poate fi determinat
direct, fidelitatea se estimeaz prin analiza efectelor variatelor condiii de administrare i a
coninutului testului asupra scorurilor finale. Ea va fi influenat doar de erorile nesistematice care
vor avea diferite efecte asupra celor examinai. Fiecare din multiplele metode de estimare a
fidelitii va lua n calcul diferitele condiii ce pot produce asemenea schimbri nesistematice n
scorul testului, ce vor afecta n consecin mrimea erorii de msurare. n funcie de condiiile
concrete n care a fost administrat testul i n funcie de ceea ce acesta msoar, se calculeaz unul
sau mai muli coeficieni de corelaie ca o aproximare a fidelitii testului.

SEM = Standard Error of Measurement, adic eroarea standard a msurtorii.


50

U2.4. Fidelitatea test-retest


Numit i coeficient de stabilitate, acesta este obinut prin corelarea scorurilor obinute de
un grup de persoane la o administrare a testului cu scorurile nregistrate la o administrare
ulterioar a acestuia, dup un interval de timp. Procedeul ncearc determinarea erorilor legate de
condiiile de aplicare. Cum testul aplicat este acelai, inconstana scorurilor nu poate fi imputat
itemilor si, ci diferenei dintre condiiile de aplicare, cu att mai mari cu ct intervalul dintre test
retest este mai lung (luni sau ani). Aceasta presupune ns c trstura msurat este ea nsi
stabil n timp, deci procedeul nu este adecvat pentru unele probe cum sunt tehnicile proiective de
exemplu, dar nici pentru chestionarele de motivaii, opinii, dispoziii afective sau sntate.
Deoarece pot interveni efectele practicii (unele abiliti se mbuntesc prin exerciiu) sau
ale nvrii (coninuturile testului pot fi memorate spre a fi rezolvate ulterior), se pune problema
alegerii atente a intervalului dintre cele dou examinri. Aceste efecte sunt mai accentuate pentru
intervalele scurte (de ore sau zile), dar un interval mai lung are dezavantajul de a produce
modificri n chiar structura aptitudinii prin efectul de cretere sau de maturare, foarte evident mai
ales la testele educaionale. Intervalul optim pentru retest pare a fi de cteva sptmni pn la o
lun. Acolo unde este posibil este recomandabil s se calculeze coeficieni de fidelitate pentru
intervale de timp diferite (de sptmni, luni sau ani), ceea ce va oferi o informaie mult mai
nuanat legat de stabilitatea temporal a constructului msurat.
Cum ai interpreta coeficienii de fidelitate de .94 la o sptmn, de .85 la un
an i de .78 la patru ani pentru o baterie de teste de inteligen?

U2.5. Coeficientul formelor parale


Memorarea testelor nu d o eroare sistematic, deoarece proporia itemilor pe care subiecii
i-i reamintesc dup o perioad de timp este diferit de la individ la individ, ceea ce are ca efect
descreterea corelaiei test-retest. Pentru depirea acestei surse nesistematice de eroare se poate
utiliza procedeul formelor paralele prin calcularea aa-numitului coeficient de echivalen, un alt
indicator al fidelitii. Pentru a msura acelai atribut, o form paralel a unui test trebuie s fie
construit n acelai mod ca i prima variant. Ele vor fi considerate forme paralele doar pentru c
utilizeaz itemi formulai diferit, dar procedeul de generare i selecie a itemilor destinai unui
anumit nivel de dificultate este acelai, cci ambele forme trebuie s msoare acelai construct, n
aceeai manier. Formele paralele pot fi aplicate chiar i n aceeai zi, caz n care singura surs de
diferen dintre scorurile la cele dou forme este eroarea aleatoare a diferenei dintre itemii
testului. O procedur mai rafinat utilizat este aceea de a aplica unei jumti din populaie forma
A a testului i celeilalte jumti forma paralel B, urmnd ca dup o perioad de timp aceluiai
eantion s i se aplice tot ambele forme, dar de data aceasta primei jumti forma B iar celei de a
doua jumti forma A. Coeficientul de corelaie ce rezult n urma acestui procedeu se numete
coeficient de stabilitate i echivalen, pentru c ia simultan n calcul, ca surse de eroare, att
itemii testului, ct i factorul timp.
51

Exemplu
Chestionarul de personalitate HSPQ al lui Cattell are dou forme paralele, A i B,
generate n acelai fel i msurnd aceleai constructe psihologice. Prin urmare este
posibil s calculm un coeficient de stabilitate i echivalen pentru cele dou forme,
utiliznd un interval de la dou sptmni pn la o lun ntre cele dou testri.
U2.6. Coeficienii de consisten intern
Din cauza costurilor de construcie ridicate, nu toate testele au forme echivalente, de aceea
se folosete o cale mai puin direct de determinare a fidelitii: cea a consistenei interne, ce
include metoda njumtirii (splithalf) a lui Spearman, formulele Kuder-Richardson i
coeficientul alfa ( ) al lui Cronbach, care nu trebuie considerai echivaleni cu coeficienii de
fidelitate obinui prin metoda testretest sau prin metoda formelor paralele.
U2.6.1. Metoda njumtirii (splithalf)
n englez, to split nseamn a despica, iar half, jumtate, de unde i numele metodei,
care poate fi tradus prin njumtire. ntr-un test omogen, toi itemii msoar (n diverse grade)
acelai construct, fiind deci posibil s fie construite dou jumti relativ echivalente pentru a le
pune ulterior n corelaie. Cele dou jumti pot fi obinute n diverse maniere, cum ar fi: prima
parte a testului i a doua sa parte, sau subteste ce ar rezulta din reunirea tuturor itemilor cu numr
par i cu numr impar (tehnica parimpar), sau oricare alt procedeu, chiar i aleator, de a genera
jumti. Problema tehnic spinoas este aceea c jumtile trebuie s fie echivalente, ceea ce n
primul exemplu nu se ntmpl: n cele mai multe teste de aptitudini, itemii dificili sunt plasai n a
doua parte a probei. Chiar i tehnica parimpar este aplicabil doar parial pentru c, dei n multe
teste itemii sunt aranjai n ordinea cresctoare a dificultii, sunt greu de gsit cte doi itemi
perfect echivaleni din acest punct de vedere, pentru a putea compune cele dou jumti. n plus,
n unele teste, anumii itemi sunt folosii pentru a-i introduce pe alii, adic nu sunt independeni
(sunt itemi legai).
Deci metoda splithalf presupune analiza de itemi i calculul mediei i a abaterii standard,
valori care trebuie s fie aproximativ egale pentru fiecare jumtate considerat, pentru a verifica
faptul c ele sunt echivalente. Cum corelaia dintre dou seturi de scoruri este mai mic pentru
seturile mai scurte, fidelitatea ce rezult pentru testul n ansamblul su, plecnd de la jumtile
sale, poate fi estimat prin corecia pe care formula de profeie propus Spearman i Brown:
2r
1+ r
De exemplu, dac corelaia dintre jumti este de r = 0,64, fidelitatea testului n ansamblul su va
fi R = 20,64/(1+0,64) = 0,78. Aceast formul are un efect substanial pentru corelaiile medii, dar
unul mai mic pentru cele extreme. O corecie mai nuanat va fi prezentat n cursul urmtor.

R=

Testul Matricilor Progresive Raven (PM 36) const din 5 serii a 12 probleme
de raionamet i logic (educia relatelor i a corelatelor), gradate ca nivel de
dificultate, fiind cel mai larg utilizat test de inteligen fluid din lume. Cum
credei c ar trebui procedat pentru a se obine dou jumti echivalente?
52

U2.6.2. Metoda Kuder-Richardson


Kuder i Richardson au dezvoltat n anul 1937 o metod de evaluare a fidelitii dintr-o
singur aplicare a unui test, ceea ce a nsemnat un mare progres, deoarece aceast metod nu mai
depindea de maniera arbitrar n care se fcea njumtirea testului. Scorarea separat a
jumtilor crea o alt problem, pe lng cea legat de dificultatea obinerii unor forme realmente
echivalente. Formula de mai jos se poate aplica doar testelor ai cror itemi sunt scorai dihotomic
(zero sau unu, adic fals sau adevrat):

KR20 = R =

2
N s pq

N 1
s2

unde KR sunt iniialele celor doi psihologi, R este fidelitatea estimat, N numrul de itemi ai
testului, s2 variana scorului la test n ansamblul su, p este proporia (calculat pentru fiecare item
n parte) n care un item este rezolvat corect, q este complementul acestei proporii, adic (1 p),
pq este suma produselor pq pentru fiecare item al testului. Studiind formula, vom vedea c partea
ei din dreapta comport o analiz din care rezult c pentru a avea o fidelitate mai mare ca zero,
variana testului trebuie s fie mai mare ca suma varianelor individuale ale fiecrui item (s2 >
pq). Acest lucru este posibil doar n cazul n care itemii, n calitatea lor de msur a aceluiai
construct, sunt intercorelai.
Pentru situaia cnd itemii celor dou jumti sunt aproximativ egali ca nivel de dificultate
(cazul echivalenei), cei doi autori au propus o alt formul, mai uor de calculat, dar care nu se
poate aplica jumtilor neechivalente, ntruct le va subevalua fidelitatea:

KR 21

N
=
1
N 1

x
x 1
N

s2

unde toate notaiile sunt aceleai ca n formula precedent, iar x reprezint media scorurilor totale
la test.
U2.6.3. Coeficientul alfa al lui Cronbach

Formula KR20 este o foarte valoroas procedur de estimare a consistenei interne a unui
test. Cu toate acestea, exist situaii n care ea nu este potrivit, iar acestea apar atunci cnd testul
nu a fost scorat n termeni de adevratfas, sau zerounu, deoarece formula se bazeaz pe
cunoaterea proporiei n care subiecii au rezolvat corect fiecare item. Unele chestionare de opinii,
atitudini sau valori sunt elaborate nu n termeni dihotomici, ci presupun o scar a gradului de
acorddezacord sau atracierespingere. n aceast situaie, Cronbach (1951) a elaborat o
procedur mai general de estimare a fidelitii, aa-numitul coeficient alfa, a crui formul este:
2
2
N s si
R = =

N 1
s2

53

Se observ o mare similitudine cu formula KR20 chiar i n notaii, termenul nou fiind si2 .
Termenul si2 nlocuiete n aceast formul pq i reprezint suma varianelor individuale ale
fiecrui item. Singura diferen const deci n maniera n care este exprimat variana.
Deoarece si2 exprim variana itemilor care nu sunt rezolvabili doar prin Da/Nu, coeficientul alfa
este considerat a fi soluia cea mai general pentru determinarea fidelitii pentru consistena
intern.
Analizai comparativ formulele Kuder-Richardson i Cronbach, preciznd care
sunt asemnrile i deosebirile lor de structur i de utilizare practic.

Kaplan i Saccuzzo (1993) sesizeaz foarte ntemeiat c toate msurile care evalueaz
consistena intern determin de fapt gradul n care fiecare item diferit msoar aceeai trstur
sau abilitate. Acest lucru presupune implicit c testul este omogen, n caz contrar acesta neavnd
consisten intern ridicat. Pentru testele neomogene, procedeul cel mai indicat este efectuarea
prealabil a unei analize factoriale, prin care se vor putea submpri itemii pe grupe omogene
(factori), subtestele ce rezult avnd fiecare o consisten intern ridicat, dar fiind relativ
independente unul n raport cu celelalte, ca n cazul subscalelor testului de prsonalitate 16 PF
Cattell. Aiken (1997) sesizeaz de asemenea c cele trei procedee de determinare a fidelitii
amintite anterior supraestimeaz valoarea acesteia pentru testele n care este implicat viteza
execuiei. n acest caz procedurile de apreciere a fidelitii trebuie modificate, recomandarea
fcut fiind aceea de a administra cele dou jumti ale testului n momente diferite, dar cu limit
de timp egal. Dup aceasta se calculeaz fidelitatea, operndu-se corecia ei prin formula
SpearmanBrown.
U2.6.4. Fidelitatea interscoreri
Majoritatea testelor de aptitudini, de performan i de personalitate au proceduri de
scorare standardizate, aa c nu va fi nici o problem n privina echivalenei scorurilor obinute de
ctre persoane diferite, devreme ce aceste proceduri de apreciere pot fi ncredinate mainilor
automate de scorare sau computerului. Tehnicile proiective, judecile evaluativapreciative,
evaluarea unor produse complexe ale activitii (desene, mostre de scris, obiecte manufacturate
etc.) sau ratingul personalitii include, prin natura lucrurilor, o doz crescut de subiectivitate. n
acest caz trebuie s se evalueze gradul de intervenie n apreciere al subiectivitii, determinnd
fidelitatea interscoreri sau interevaluatori prin calculul corelaiei dintre seturile de scoruri
acordate de evaluatori diferii, unui numr determinat de examinai. Se poate apela i la metoda
mai muli examinatori un singur examinat, sau mai muli examinatori mai muli
examinai, procedee care culeg coeficieni de fidelitate intraclas, sau de concordan (cum ar fi
coeficientul tau al lui Kendall, vezi Radu et al., 1991), pentru care exist programe speciale de
calculator.
54

Cinci tehnicieni de la o coal de tehnic dentar evalueaz pentru examenul de


finalizare a studiilor dou tipuri de produse ale absolvenilor: dini sculptai n
ipsos (prin eliminare de material) i dini modelai n cear (prin adugare de
material). Un psiholog aplic n paralel o baterie de teste de aptitudini vizuospaial-motrice pentru toi absolvenii. Ce tipuri de fidelitate pot fi determinate
pentru cele dou modaliti de evaluare folosite de cei cinci tehnicieni separat,
apoi combinat cu examenul psihologic? Argumentai rspunsul furnizat.
U2.7. Condiii pentru determinarea fidelitii
S ne reamintim...
Pentru ca estimarea fidelitii s fie ct mai precis, trebuie ndeplinite cteva
condiii (Traub, 1944, apud Albu, 1998):

Eantionul s fie ct mai mare, pentru a reduce eroarea standard a repartiiei,


care este invers proporional cu rdcina ptrat din numrul subiecilor ce
compun eantionul.
Eantionul s fie reprezentativ pentru populaia creia i este destinat testul,
avnd acelai grad de eterogenitate, deoarece omogenitatea diminueaz valoarea
fidelitii.
Msurtorile s fie independente ntre ele, astfel nct msurarea de la un
examinator s nu o influeneze pe a altuia, iar dac examenul este colectiv, s nu
se poat tria prin copiere. Independena msurtorilor cere ca persoanelor
supuse la testretest s nu li se dea informaii despre rezultatele examinrii
precedente, iar itemii s nu se condiioneze reciproc.
Toate aspectele de procedur n test i retest sau la formele paralele trebuie s fie
identice.
Creterea nivelului de fidelitate a unui test pn la limita dorit sau cerut de situaia de
utilizare concret este posibil prin creterea numrului de itemi (care trebuie s fie de acelai
format i s msoare aceeai trstur sau acelai construct). Decizia aceasta angajeaz un proces
lung i costisitor, pentru c testul nou generat trebuie reevaluat de la nceput i uneori se dovedete
a fi sub nivelul de fidelitate ateptat.
Ca o concluzie a acestor consideraii despre fidelitatea testelor, se relev faptul c aceasta
este mai bun pentru teste unidimensionale i cu numr mai mare de itemi, ct i pentru testele
cognitive i c ea angajeaz un studiu analitic al itemilor (analiza de itemi) pentru a determina cu
exactitate fora lor de discriminare. n multe situaii analiza factorial este metoda cea mai
eficient prin care se pot construi subteste omogene i unidimensionale. Fidelitatea este una din
fundamentrile de baz ale cercetrilor asupra comportamentului. Dac un test nu este fidel, nu va
fi posibil s demonstrm c el are vreun neles, afirm Kaplan i Saccuzzo (1993, p. 131).

55

Aadar, dei validitatea pare a fi o caracteristic psihometric mai important, din punct de
vedere tehnic studiul ei poate ncepe numai cu teste care i dovedesc o fidelitate minim
acceptabil, care depinde de scopul n care ele vor fi utilizate.
U2.8. Rezumat
 Teoria clasic asupra fidelitii testelor este construit n jurul erorii standard de
msurare (SEM).
 Fidelitatea este o corelaie, adic un numr zecimal cuprins ntre valorile de 1.
 Fidelitatea estimeaz doar erorile nesistematice pe care variatele condiii de
aplicare a unui test le poate avea asupra scorurilor la respectivul instrument.
 Consistena testului cu sine nsui, adic constana scorurilor sale pe scara
timpului este dat de coeficientul de stabilitate.
 Acesta se obine prin metoda test-retest, intervalele dintre cele dou faze
trebuind sa nu fie prea mici (pentru a nu aprea efectul de practic sau cel de
nvare) i nici prea mari (pentru a nu se produce modificri importante n
structura constructului msurat, prin efectul de cretere i maturare).
 Coeficientul de echivalen determin consistena a dou forme paralele ale
aceluiai test i poate fi determinat prin aplicarea lor simultan.
 Cnd aplicarea se face la un interval de timp i pe jumti nccruciate, se
obine un coeficient de echivalen i stabilitate.
 Consistena intern poate fi determinat prin metoda njumtirii: dac toi
itemii unui test msoar un acelai construct, trebuie s existe o echivalen ntre
prima i a doua sa parte sau ntre itemii cu so i cei fr so.
 Crearea celor dou jumti este singura problemm tehnic important a acestei
metode de determinare a fidelitii.
 Kuder i Richardson au propus o formul de determinare a fidelitii unui test
dintr-o singur aplicare a acestuia, exprimat prin formula KR20.
 Cronbach a generalizat aceast formul pentru a fi aplicabil i itemilor scorai
nedihotomic (cu mai mult de dou variante de rspuns), prin coeficientul alfa.
 Fidelitatea interscoreri este important doar acolo unde scorarea unui test
implic un grad de subiectivitate: teste proiective, judeci apreciative sau
evaluarea produselor unor activiti.
 Condiiile cele mai importante pentru determinarea fidelitii sunt legate de
mrimea suficient de mare a eantionului, de nivelul su (ridicat) de
reprezentativitate, de independena msurtorilor i de identitatea de procedur
ntre fazele de test i retest.
U2.9. Test de evaluare a cunotinelor
1. Artai de ce SEM este eroarea standard de msurare.
2. Precizai ce precauii trebuie luate pentru a evita efectul de nvare, efectul
practicii i cel de cretere i maturare n determinarea coeficientului de stabilitate al
unui test psihometric.
56

3. Care sunt avantajele i dejavantajele formelor paralele ale aceluiai test?


4. Indicai care sunt punctele comune i diferenele specifice dintre coeficientul de
echivalen i cel de stabilitate i echivalen.
5. Precizai care este specificul metodei split-half i care sunt procedeele curente de
njumtire a unui test.
6. Care este condiia de baz ca formula KR20 s de valori ct mai ridicate?
7. n ce const specificul formulei coeficientului alfa Cronbach prin comparaie cu
KR20?
8. O clas de elevi este evaluat prin observaie participativ, efectuat de o coleg,
prin metoda produselor activitilor de baz (citit, scris, socotit), efectuat de 5
experi, i printr-un test de inteligen general, aplicat, scorat i interpretat de un
psiholog. Precizai modul de determinare a fidelitii pentru fiecare dintre cele trei
modaliti de evaluare.
9. Argumentai n legtur cu condiia de baz pentru determinarea fidelitii este
aceea ca eantionul s fie suficient de extins numeric i ct mai reprezentativ pentru
populaia respectiv.
10. De ce testele unidimensionale i cele cognitive au i trebuie s aib o fidelitate
mai mare dect alte categorii de teste?

57

___________________________________________________________________
Modulul M2. Unitatea de nvare 3
FACTORI CARE AFECTEAZ FIDELITATEA TESTELOR
_________________________________________________________________
Cuprins

U3.1. Introducere ............................................................................................................. 58


U3.2. Competene ............................................................................................................ 58
U3.3. ntinderea diferenelor individuale ......................................................................... 59
U3.4. Lungimea testului ................................................................................................... 60
U3.5. Dificultatea testului ................................................................................................ 61
U3.6. Testele cu limit de timp ........................................................................................ 61
U3.7. Fidelitatea i erorile de msurare ........................................................................... 62
U3.7.1. Eroarea standard a msurrii .................................................................. 62
U3.7.2. Eroarea tip a estimrii .............................................................................. 64
U3.8. Interpretarea fidelitii ............................................................................................ 65
U3.9. Generalizabilitatea .................................................................................................. 65
U3.10. Analiza de varian i planul de optimizare ......................................................... 66
U3.11. Rezumat ................................................................................................................ 67
U3.12. Test de autoevaluare a cunotinelor .................................................................... 68
U3.1. Introducere
Dincolo de condiiile bazale necesare pentru determinare corect a fidelitii
testelor psihometrice au fost evideniate o mulime de factori adiionali care pot
interveni n aceast problem. Unii dintre aceti factori sunt extrinseci testului, alii
in efectiv de structura i lungimea acestuia. Asfel, fidelitatea unui test este n
strns legtur cu mrimea i gradul de reprezentativitate a eantionului, cu
ntinderea diferenelor individuale, cu lungimea i dificultatea testului cercetat.
Efectele acestor factori externi i interni se regsesc n erorile de msurare, cum
sunt eroarea standard a msurtorii i eroarea tip a estimrii. Cunoaterea ambelor
tipuri de erori este foarte util, fie prin faptul c ele fundamenteaz msurile de
cretere a fidelitii unui test, fie c fac posibil construirea intervalelor de
ncredere necesare interpretrii mai acurate a scorurilor testelor psihometrice.
U3.2. Competene
Dup parcurgerea acestei uniti cursanii vor ti:
s explice argumentat care este rolul diferenelor individuale n problema
fidelitii;

s manevreze adecvat formula de profeie a lui Spearman-Brown pentru a scurta


un test pera lung sau a crete fidelitatea unui test;
58

s explice importana practic a determinrii dificultii unui test n conexiune cu


problema fidelitii;
s explice modalitatea practic n care poate fi depit problema determinrii
fidelitii testelor cu limit de timp;
plecnd le la SEM, s determine i s interpreteze intervalele de ncredere ale
scorurilor unui test;
s explice care este eroarea tip a estimrii n determinarea intervalelor de
ncredere;
s explice legtura dintre fidelitatea unui test i acurateea prediciilor fcute de
acesta;
s interpreteze adecvat i nuanat fidelitatea unui test;
s definesc pe scurt conceptele de generalizabilitate, de univers al scorurilor, de
dispozitiv de msurtoare i de plan de optimizare
Durata medie de parcurgere a acestei uniti de nvare, incluznd rezolvarea
sarcinilor propuse n curs i a temelor de evaluare, este de 4-6 ore.

U.3.3. ntinderea diferenelor individuale


Deoarece estimarea fidelitii rezult din calculul corelaiei r Pearson, limitrile statistice
ale acestui coeficient de corelaie se repercuteaz i asupra coeficientului de fidelitate. Astfel, r
este calculat pentru variana total a testului ceea ce este o condiie necesar, dar nu i suficient
pentru determinarea fidelitii. Atunci cnd se produce o reducere sau o cretere a ambitusului
scorurilor individuale, variabilitatea de ansamblu a testului scade sau crete i ea. Prin aceasta,
corelaia dintre variabile i implicit fidelitatea testului scade sau crete n mod artificial,
diminund ansa de a determina cu acuratee aceast caracteristic a testului. Astfel, dac n faza
de studiu pilot se utilizeaz un eantion care are o varian mai mic dect populaia general,
fidelitatea testului va fi subestimat (va fi mai mic dect dac eantionul ar fi fost reprezentativ).
Exemple
Aplicarea testului pe o categorie populaional foarte omogen (clase de elit sau de
subdotai intelectual, clase vocaionale etc.) ar putea furniza o corelaie mai mic
dect cea existent la clasele normale, unde extremele (subdotai, supradotai
intelectual) sunt reprezentate normal.
Variana i implicit fidelitatea poate fi crescut n mod artificial prin folosirea de
eantioane cu grad mare de eterogenitate. Agregarea ntr-un eantion comun a unor
clase de elit (supradotai), normale i de integrare (subdotai) va accentua mrimea
corelaiei, ca i reunirea n acelai eantion a unor niveluri de pregtire colar aflate
la mare distan unele de altele.

59

Pentru situaia n care eantionul a fost prea omogen, diminund astfel variana total a
scorurilor la test, i deci fidelitatea sa, Magnuson a propus o formul de corecie:
1 x (1 rxx ' )
2

ruu =

u2

n care ruu este fidelitatea estimat pentru noul eantion, x este variana noului eantion iar u
este fidelitatea calculat ntre vechiul i noul eantion.
Pentru utilizatorul unui test precauiile legate de ntinderea diferenelor individuale sunt:

utilizarea tabelelor de norme, care aduc distribuiile la un numitor comun prin raportarea la
notele standardizate z, ca n cazul n care exist diferene foarte mari ale scorurilor brute ca
urmare a prezenei n eantion a unor niveluri de vrst foarte diferite;

studiul pilot al fidelitii pe propriul eantion de lucru pentru a ne asigura c populaia pe care
se aplic testul corespunde ca raport de omogenitate/eterogenitate populaiei pe care s-a
determinat fidelitatea raportat de autor n manualul testului.

U.3.4. Lungimea unui test


Teoria eantionajului demonstreaz faptul c, cu ct un eantion este mai mare, cu att mai
mult estimarea caracteristicilor populaiei din care acesta a fost extras este mai exact. n mod
similar, cu ct numrul de itemi ai unui test este mai mare, cu att mai bine este msurat
constructul sau domeniul investigat, i aceasta deoarece suma erorilor aleatorii tinde tot mai mult
spre zero. Relaia dintre fidelitatea i lungimea testului este exprimat de formula de profeie a lui
Spearman-Brown, care ne va arta cu ct crete precizia estimarii prin modificarea numrului
itemilor ntr-o anumit proporie K:
K rjj '
rxx ' =
1 + (K 1)rjj '
n care rxx' este fidelitatea expectat prin lungirea testului, iar rjj' este fidelitatea calculat pentru
testul iniial. Aceast formul poate fi utilizat n dou feluri:

Dac iniial testul avea 20 de itemi i dorim s-l aducem la 45 de itemi, K reprezint raportul
45/20 = 2,25. Plecnd de la fidelitate iniial de 0,83, fidelitatea expectat prin lungirea
testului va ajunge la: (2,250,83)/[1+(2,25-1)0,83] = 1,8675/(1+1,0375) = 1,8675/2,0375 =
0,92.

Invers, dac vrem s tim ci itemi trebuie s adugm pentru a atinge valoarea dorit a
fidelitii, de exemplu creterea de la 0,83 la 0,95 (pentru a putea ajunge n zona n care putem
lua decizii care privesc destinul unei persoane), maniera de lucru presupune mai nti izolarea
lui K, plecnd de la formula anterioar.
K=
n cazul analizat K=

rxx ' (1 r jj ' )

r jj ' (1 rxx ' )

0,95(1 0,83) 0,95 0,17 0,16 5


= 3,89
=
=
0,83(1 0,95) 0,83 0,05 0,04 5

Aceasta nseamn c, pentru a avea creterea de fidelitate expectat, testul trebuie mrit de
3,89 ori i deci de la 20 de itemi el va ajunge la 78 (203,89 = 77,8).
60

Utiliznd datele i formulele de mai sus, determinai ce plus de fidelitate aduce


mrirea de trei ori a unui test cu 30 de itemi. n pasul al doilea determinai care
este descreterea de fidelitate a unui test de 60 de itemi care se reduce la
jumtate. n final analizai ci itemi trebuie adugai pentru a ajunge de la
fidelitatea iniial de .90 la una de .95.
Formulele de mai sus pot fi folosite i n sensul scurtrii unui test prea lung (cu scderea
corespunztoare a fidelitii sale), dar fie ntr-o situaie, fie n alta, itemii trebuie s aib acelai
coninut i acelai grad de dificultate, fiind consisteni cu itemii de plecare. Acest fapt presupune
parcurgerea prealabil a fazei analizei de itemi, cci itemii foarte diferii ca nivel de dificultate sau
ca i coninut nu vor avea o bun corelaie cu cei deja existeni, scznd omogenitatea de
ansamblu a testului.
Formula de profeie a lui Spearman-Brown nu poate preciza care sunt caracteristicile
itemilor ce vor fi adugai n termeni de format i de coninut al acestora pentru a face s
creasc fidelitatea testului pn la o precizie antecalculat acceptabil. Dac n testele de aptitudini
itemii ce vor fi adugai vor fi definii n acelai fel ca i ceilali, pentru a fi corelai cu constructul
msurat, n testele educaionale ei vor viza aceleai obiective pedagogice ca i testul iniial. Acesta
nu este un lucru dificil, cci itemii paraleli se creeaz uor dac va fi folosit din start tehnica
specificrii domeniului. Principalul inconvenient al metodei este utilizarea unui demers empiric n
crearea setului de itemi. Fidelitatea poate fi mai bine ameliorat atunci cnd un test a fost construit
dup demersul criterial, n care ns caracteristicile itemilor trebuie s fie cunoscute n avans.
U3.5. Dificultatea testului
Corelaia dintre dou teste tinde s fie maxim doar atunci cnd distribuiile celor dou
variabile au acelai tip de asimetrie. Aa cum am artat n capitolul anterior, n procesul formrii
unei deprinderi aceasta poate avea o asimetrie pozitiv n faza iniial (testul este prea greu) i una
negativ n faza final (testul devine prea uor), trecnd printr-o faz intermediar unde exist
simetrie a distribuiei scorurilor. Asimetriile fiind n direcii opuse, cea mai mic fidelitate a
testului va fi corelarea dintre faza iniial i faza final, dup care corelarea dintre faza
intermediar i celelalte dou faze, iniial sau final. Schimbarea formei distribuiei poate fi
principala cauz a unei fidelitai mici, prin faptul c un test a devenit mai uor la o a doua aplicare,
dnd o curb asimetric negativ, ceea ce presupune contaminarea rezultatelor ca efect al practicii
i nvrii. n consecin, verificarea formei distribuiei scorurilor pentru cele dou aplicri devine
obligatorie.
U3.6. Testele cu limit de timp
Multe teste de cunostine sau de aptitudini conserv primatul gradrii dificultii itemilor,
de la cei mai uori la nceputul testului (pentru creterea ncrederii n sine), ctre cei mai dificili
spre sfritul acestuia (pentru a crete puterea diagnostic a instrumentului n zona vrstelor mari
ori a supradotrii). Dac testul are limit de timp, itemii dificili nici mcar nu vor fi abordai de
majoritatea subiecilor, fiind scorai cu zero i la prima aplicare, i la cea de a doua. Acest fapt va
61

crea o cretere artificial a corelaiei prin care se pune n eviden fidelitatea, deoarece vor intra n
corelaie multe perechi de rezultate identice (0 - 0).
Inflaia fidelitii poate crea imaginea distorsionat a unui test cu itemi ce vor aprea ca
mai omogeni dect sunt de fapt n realitate. De fapt, la testele de vitez nu toate formele de
determinare a fidelitii sunt afectate. n timp ce n cazul jumtii vii (split-half) aceasta va fi
afectat (itemii scorai zero se distribuie aproximativ egal n cele dou jumti ale testului,
crescnd artificial fidelitatea), consistena intern prin indicele alfa al lui Cronbach sau prin
metoda test-retest nu va fi afectat semnificativ n acest caz.
Pentru a determina totui i celelalte forme de fidelitate se dau testul i retestul cu limita de
timp convenit de autor, se marcheaz ultimul item (de aceea itemii trebuie pasai n ordine, i nu
pe srite) apoi se continu pn la capt testul, fr limit de timp. Scorurile din prima categorie
vor servi pentru determinarea mediilor, a abaterilor standard i a formei distribuiei, necesare
scopurilor avute n vedere (cercetare, crearea de etaloane), n timp ce scorurile brute obinute fr
limit de timp vor da o mai bun expresie a fidelitii prin metodele split-half i alfa Cronbach.
Exemple
La Testul Cuburilor, aplicabil de la 5 ani la vrsta adult, fiecare pattern are o limit
de timp, mai mic iniial i mai mare pentru modelele mai complexe. Limita de timp
nu poate fi modificat pentru c ar aprea un masiv efect de nvare. Mai mult,
proba se oprete automat dup trei eecuri consecutive. n aceast situaie este de
preferat determinarea fidelitii testului doar pentru vrstele mari, unde marea
majoritatea participanilor rezolv integral fiecare model, cea care face diferena
fiind rapiditatea execuiei.
U3.7. Fidelitatea i erorile de msurare
Deoarece fidelitatea nu exprim valoarea preciziei msurtorii n aceleai uniti ca i
scorul total la test (exprimat n note standard), uneori ea este mai greu de interpretat. Acesta este
motivul pentru care precizia msurtorii poate fi indicat i sub forma unei erori de interpretare a
scorului la test, care va fi cu att mai mic cu ct eroarea de msurare va fi i ea mai mic. Aceast
zon sau interval de ncredere poate fi determinat n dou maniere: a) se determin eroarea de
msurare (interval de ncredere nuntrul cruia se afl adevratul scor al unui subiect, pentru
niveluri de ncredere specificate); b) se determin eroare de estimare (nivelul de ncredere al
scorului observat dac subiectul ar fi retestat).
U3.7.1. Eroarea standard a msurtorii (SEM)
Conform teoriei clasice a testului, scorul adevrat al unui subiect se distribuie normal n
jurul unei valorii medii, dnd o distribuie pentru care se pot determina media i abaterea standard.
Abaterea standard a diferitelor distribuii rezultate pentru toi subiecii grupului n cauz se
numete SEM (e) adic Eroarea Standard a Msurtorii i se determin astfel:

SEM = e = x 1 rxx '


62

n care: rxx' este coeficientul de fidelitate iar x este abaterea standard de la care s-a plecat n
calculul coeficientului de fidelitate rxx'.
Exemplu

Pentru o fidelitate de 0,93 i o abatere standard de 12, e = 12 1 0,93 = 3,17 .


Plecnd de la premisa c eroarea de msurare este normal distribuit, 68% din
scoruri se vor situa ntre un interval de 1e n jurul scorului adevrat, 95% la
1,96e iar 99% la 2,58e. Nu ne rmne dect s definim aceste intervale.
Cum noi nu cunoatem adevratul scor al subiectului, este preferabil s construim
intervalul de ncredere n jurul a ceea ce deja cunoatem, adic nota observat x (obinut de
subiect) i eroarea standard a msurtorii:
x - zce x + zce
n care:
x = scorul observat;
zc = valoarea critic a lui z pentru p 0,05 (z = 1,96) sau p 0,01 (z = 2,58);
e = eroarea standard a msurtorii;
A = scorul adevrat.
Exemple
Scorul x al unui subiect la un test de inteligen este de 121, eroarea standard a
msurtorii este de 3,17 i vrem s construim intervalul de ncredere pentru p
0,05 i p 0,01. Pentru prima situaie avem 121 1,963,17 = 121 6,21. Deci
pentru un p 0,05, intervalul este [115; 127], adic sunt 95% anse ca scorul
adevrat al subiectului s cad ntre 115 i 127.
Pentru cea de a doua situaie avem: 121 2,583,17 = 121 8,18, deci pentru un
prag de ncredere p 0,01, intervalul definit este [113; 129], existnd 99% anse ca
scorul subiectului s cad ntre aceste limite.
Se observ de aici faptul c:
a. cu ct fidelitatea este mai mare, cu att mai mult limitele intervalelor de
ncredere pentru orice nivel de ncredere calculat sunt mai mici (mai strnse);
b. cu ct dorim s tim cu o precizie mai mare n ce zon vor cdea scorurile cuiva,
cu att mai larg va fi intervalul de ncredere rezultat, i reciproc.

Aceste intervale de ncredere fie sunt adesea neluate n seam de practicieni, fie sunt ru
interpretate. De fapt noi nu avem nicicum certitudinea c scorul adevrat al subiectului va cdea n
intervalul de ncredere determinat, cci exist doar o probabilitate de a fi aa. n al doilea rand i
aceasta pare a fi defieciena major a acestei metode intervalele de ncredere astfel determinate
se sprijin pe postulatul homoscedasticitii, adic pe prezumia c eroarea tip este aceeai pe toat
scara nivelurilor succesive ale performanei. n al treilea rnd, corelaia dintre scorul observat i
cel estimat nu este niciodat una perfect (Nunnally i Bernstein, 1994). n consecin, prezicerea
scorului adevrat plecnd de la cel observat produce fenomenul de regresie spre medie al
63

scorurilor adevrate. Lund n consideraie aceast problem, Glutting, McDermott i Stanley


(1987) au propus o modalitate de construcie a intervalului de ncredere mult mai riguroas, dup
formula:

= x + rxx ' ( x x )

n care este scorul adevrat estimat, x scorul observat, x media scorurilor observate, iar rxx' este
coeficientul de fidelitate. Eroarea tip a estimrii se va calcula i ea dup o formul modificat:

eu = ( x 1 rxx ' )rxx '


n care x este eroarea standard a distribuiei de la care s-a calculat rxx' iar rxx' este chiar coeficientul
de fidelitate calculat.

Exemple
Pentru exemplul anterior, n care un subiect obinea 121 la un test de inteligen cu
media 100 i cu abaterea standard de 15, testul avnd fidelitatea de 0,93,
determinarea scorului adevrat devine: 100 + 0,93(121 - 100) = 100 + 0,9321 = 100
+ 19,53 = 119,53, rotunjit 120. Calculul erorii standard a estimaiei este urmtoarea:
(151-0,93)0,93 = 150,260,93 = 3,69. Intervalul de ncredere pentru p = 0,05 este
egal cu 1,963,69 = 7,23 n jurul scorului adevrat estimat, adic 120 7. Acesta este
intervalul [113-127]. Pentru pragul de p 0,01, eroarea va fi 2,58 3,69 = 9,52, iar
intervalul va fi 120 9,52, adic [110-130]. Aa cum se observ n raport cu
scorul observat de 121 intervalul nu mai este unul simetric n jurul valorii obinute
de subiect: n prima situaie de la 121 113 = 8 puncte de scor, pentru limita
inferioar, i n a doua situaie sunt 127 121 = 6 puncte, pentru limita superioar.
Aceast asimetrie provine din centrarea intervalelor de ncredere diferite nu pe
scorul observat, ci pe cel estimat ca adevrat, ceea ce face din aceast procedur cea
mai riguroas metod de determinare a intervalelor de ncredere.
U3.7.2. Eroarea tip a estimrii
Eroarea tip a estimrii se regsete de fiecare dat cnd dorim s calculm intervalul de
ncredere al valorii prezise plecnd de la o ecuaie de regresie liniar. Acest tip de eroare se obine
extrgnd rdcina ptrat din variana rezidual, adic din acea varian a scorurilor care se
regsete la al doilea test atunci cnd se ine cont de primul test. Cum metoda de calcul i
interpretarea erorii de estimaie sunt mai laborioase, ele nu au fost incluse n capitolul de fa.
Menionm de asemenea faptul c n corelaia liniar pe care se bazeaz de fapt determinarea
fidelitii homoscedasticitatea este presupus ca o condiie implicit. Deoarece eroarea de
msurare este mai mic la cei care au preponderent reuite sau nereuite (extremele seriei de
variaie a performanelor), comparai cu cei de pe poriunea de mijloc, Keats i Lord au propus un
model fundamentat pe distribuia binominal, care permite estimarea erorii tip a msurtorii
indiferent de nivelul scorului subiecilor. Nici aceast procedur nu a fost inclus aici.

64

U3.8. Interpretarea fidelitii


Rspunsul la ntrebarea Ct de mare trebuie s fie fidelitatea unui test? depinde de
utilitatea practic care se d acestuia.
Fidelitate de 0,700,80 este suficient de bun atunci cnd testul este folosit n scopuri de
cercetare.
Se accept niveluri sczute ale fidelitii atunci cnd testele se utilizeaz pentru a lua
decizii preliminare i niveluri ridicate pentru decizii finale, sau cnd ele sunt folosite
pentru mprirea grupului n subgcategorii, pe baza unor diferene interidividuale mari.
Dac testul servete la compararea grupurilor de persoane ntre ele, coeficienii de fidelitate
de 0,600,70 sunt suficieni, dar cnd testul devine o baz de comparaie ntre persoane
individuale, fidelitatea lui trebuie s fie de la 0,85 n sus.
Cnd se iau decizii importante pe baz de teste, prin care se mpart persoanele n categorii,
n virtutea unor diferene mici (ca n selecia profesional), fidelitatea trebuie s fie de
peste 0,90.
Cnd decizia privete destinul unei persoane, fidelitatea testului trebuie s fie de cel puin
0,95.
Testele cognitive, i n special cele de inteligen, au de regul o fidelitate foarte mare
(peste 0,90), n timp ce chestionarele de personalitate rareori depesc 0,80. Aplicate colectiv,
chiar i testele cognitive furnizeaz coeficieni de fidelitate mai sczui (n jur de 0,80). Testele
cotate subiectiv, ce msoar aptitudini, i testele de cunotine (educaionale) rareori depesc
valori ale fidelitii de 0,80 (Traub, 1944). Testele cu alegere multipl, utilizate colectiv, sunt
considerate a avea o fidelitate bun cnd aceasta atinge 0,75.

U3.9. Generalizabilitatea
Potrivit paradigmei clasice relativ la fidelitate, O = A+E, prezentat n partea introductiv
a capitolului anterior, fidelitatea unui instrument psihometric este n funcie de ntinderea
spectrului diferenelor individuale, de lungimea testului nsui, de limita de timp acordat i de
dificultatea testului. Cu toate acestea condiiile de observare i de msurare sunt mult mai
complexe dect cele enumerate anterior, ceea ce a condus la conturarea unei noiuni noi i anume
cea de generalizabilitate. Aceasta presupune studiul fidelitii n familii de situaii similare, ceea
ce face ca scorul adevrat (A, din formula de mai sus) s fie nlocuit cu termenul de univers al
scorului ateptat de la un subiect, ntr-un anumit ansamblu de condiii de observare i de
msurare.
Teoria generalizabilitii a fost elaborat n 1963 de ctre Cronbach, Gleser i Rajaratnam
cu scopul de a reuni ntr-un concept unitar diferitele definiii ale fidelitii. Astfel, pentru a
cuantifica importana fiecrei surse de varian dintr-o situaie de msurare ei au folosit analiza de
varian. Scorul adevrat i lrgete nelesul pentru c ia n calcul toate observaiile posibile,
mpreun cu erorile aferente rezultate din fluctuaiile de eantionaj legate de momentele de
evaluare, de forma itemilor sau de ecuaia personal a fiecrui evaluator n parte. Din aceast
cauz generalizabilitatea este un concept mai cuprinztor dect cel de fidelitate, cci el descrie
situaia de msurare ntr-un cadru mai complex i mai apropiat de realitate. n esen,
65

generalizabilitatea indic msura n care un rezultat obinut se poate generaliza n anumite


condiii.
Noiunea de univers al scorului se numete astfel pentru c are n vedere fidelitatea
scorurilor ntr-un ntreg univers de condiii care alctuiesc sau definesc tot attea faete ale
planului de observaie. Iat definiia dat universului scorului de Cardinet i Turneur (1985):
Universul scorului unei persoane p, dat ideal, reprezint media scorurilor persoanei p calculat
pe toate observaiile admisibile. Ori observatorul utilizeaz scorul observat, sau o funcie a
scorului observat pentru a estima valoarea universului scorului. El generalizeaz astfel de la
eantion ctre populaia de ansamblu. (op. cit., p. 23).
O paralel cu fidelitatea se impune i pentru generalizabilitate. Dac n primul caz, cu ct
corelaia dintre scorul observat i cel adevrat este mai mare, i deci fidelitatea este mai bun, n
generalizabilitate aceasta este cu att mai mare cu ct scorul observat la un subiect este mai
asemntor cu cel pe care el l-ar fi obinut n ansamblul de condiii pentru care vrem s
generalizm. Cum universul scorului nu poate fi obinut direct, ceea ce ne rmne de fcut este
eantionarea sa. Aici problema cheie este cea legat de rezolvarea unei contradicii:
generalizabilitatea este cu att mai mare cu ct ine sub control mai multe faete ale dispozitivului
de msurare, ceea ce nseamn sporirea numrului de itemi (de teme) investigate, al numrului de
corectori i de grile de corecie, dispozitivul devenind astfel foarte costisitor. Ar trebui gsit deci
un echilibru ntre economicitatea i eficacitatea dispozitivului de msurare, ori pentru aceasta ar
trebui determinat ponderea fiecrei faete a examinrii, doar astfel putnd s le reunim ntr-un
model eficace.
Pentru a ine cont de multitudinea variaiilor ce se produc ntre diversele faete ale unui
dispozitiv de msurare, ca i de diversele interaciuni posibile dintre acestea, studiul
generalizabilitii presupune n mod expres utilizarea analizei de varian.

U3.10. Analiza de varian i planul de optimizare


Studiul generalizabilitii permite un control crescut al surselor de eroare dintr-un
dispozitiv de msurare (care poate fi i dispozitiv observaional). Dincolo de calculul unui indice
de fidelitate al unui univers al scorului, cercettorul poate determina n ce condiii sau situaii
dispozitivul su va prezenta caracteristicile cele mai bune ale msurtorii. n forma iniial a
teoriei generalizabilitii Cronbach, Gleser, Nanda i Rajaratnam (1971) s-au interesat doar de
stabilitatea scorurilor subiecilor.
n psihologie i pedagogie merit tot atta interes nu numai subiecii, ci i itemii testului,
cci se poate estima stabilitatea diferitelor modaliti de prezentare sau de evaluare a lor, ca i
diferitele coninuturi ce fac obiectul testului (msurtorii) respective. Cardinet i Tourneur (1985)
au definit un procedeu de calcul care permite s se in cont n dispozitivul de msurare respectiv
att de subieci, ct i de itemii utilizai. n consecin, ei au indicat cei patru pai ai procesului,
primii doi fiind o analiz de varian, faza a treia studiaz diferenierea iar faza a patra
optimizarea.
Mai jos facem o succint prezentare a acestei proceduri:

66

1. Plan de observaie: se procedeaz la alegerea faetelor i a numrului de niveluri ale fiecrei


faete, precizndu-se i inter-relaiile dintre ele.
2. Plan de estimare: se determin care faete reprezint un ansamblu de niveluri finite i care
dintre ele sunt eantionate aleator sau exhaustiv.
3. Plan de msurare: se identific ce faete sunt legate de planul de msurare (faete ale
diferenierii) i care sunt sursele de eroare ale msurrii (faetele de instrumentaie). Cu alte
cuvinte, abia acum variana calculat n faza a doua se atribuie fie varianei adevrate, fie varianei
erorii, permind calculul coeficientului de generalizabilitate i calculul marjei de eroare aplicabil
scorurilor observate.
4. Plan de optimizare: acesta permite modificarea oricruia din planurile precedente, ca i a
combinaiilor dintre ele, cu scopul de a maximiza generalizabilitatea observaiilor (msurtorilor).
Este faza n care cercettorul caut acel echilibru dintre precizia msurtorii i ntinderea
universului generalizrii: cu ct acesta este mai restrns, cu att este mai uor de obinut
msurtori adecvate ale acestui univers, fapt care este mai dificil n situaia invers.

U3.11. Rezumat
 Fiind exprimat printr-un coeficient de corelaie Pearson, fidelitatea are aceleai
limite ca i acesta.
 n principiu determinarea fidelitii trebuie s se fac pe un eantion care prezint
acelai raport omogenitate/eterogenitate ca i populaia indicat de autor.
 Extinderea sau restrngerea diferenelor individuale contribuie la accentuarea sau
la diminuarea eterogenitii i deci la inflaia sau deflaia coeficientului de
fidelitate.
 Lungimea unui test este elementul cel mai strns asociat cu fidelitatea unui test.
 Utiliznd adecvat formula de profeie a lui Spearman-Brown, un test poate fi
scurtat sau lungit dup anumite reguli, consecina fiind descreterea, respectiv
creterea fidelitii sale.
 Atunci cnd se adaug itemi noi unui test sau scale, acetia trebuie definii i
generai astfel nct s msoare acelai construct, pentru a fi compatibili cu itemii
preexisteni.
 Dificultatea itemilor presupune cercetarea formei distribuiei scorurilor pentru a
aduga sau elimina itemii care distorsioneaz repartizarea gaussian a scorurilor.
 n plus, cunoaterea distribuiei scorurilor este important n studiul fidelitii
pentru a corela forme paralele sau retesta distribuii de acelai tip.
 Determinarea fidelitii pentru testele cu limit de timp presupune o precauie
suplimentar: nu este indicat s rmn itemi nepasai la test sau retest pentru c
perechile scorate zero contribuie la o cretere inflaionist a fidelitii.
 Determinarea fidelitii este esenial pentru interpretarea rezultatelor la un test.
Astfel, coeficientul de corelaie care exprim fidelitatea intr n determinarea
erorii standard a msurtorii, element de baz pentru determinarea intervalelor de
ncredere ale scorurilor.
67

 Eroarea tip a estimrii este util cnd se dorete s se determine intervalul de


ncredere al valorii prezise plecnd de la o regresie liniar.
 Cunoaterea i interpretarea fidelitii este aspectul practic cel mai important al
acestui curs.
 innd cont de destinaia testului, acesta trebuie s aib o fidelitate minim de .70
pentru scopuri de cercetare, de .80 pentru grupuri, de .85 pentru comparaii ntre
persoane, de .90 pentru decizii luate pe baz de teste i de .95 pentru decizii ce
angajeaz destinul unor persoane;
 Elaborat n 1963, teoria generalizabilitii ia n calcul un adevrat univers al
scorurilor reieite dintr-un univers de condiii ce definesc tot attea faete ale
planului de observaie.
 Presupunnd un dispozitiv de cercetare extrem de complex, generalizabilitatea i
planul de optimizare rmn un fief al experilor n materie de psihometrie.
U3.12. Test de evaluare a cunotinelor
1. Explicai importana ambitusului diferenelor individuale n fluctuaiile i
distorsiunile fidelitii.
2. Artai care sunt cele dou precauii legate de luarea n calcul a diferenelor
individuale n determinarea fidelitii unui test.
3. Expliaci cele dou moduri alternative de utilizare a formulei de profeie a lui
Spearman-Brown n sensul creterii sau al descreterii fidelitii prin lungirea sau
scurtarea setului su de itemi.
4. Care sunt condiiile ce se impun noilor itemi ce vor fi adugai la un set de itemi
preexisteni pentru a crete fidelitatea unui test?
5. Precizai care sunt cele dou motive pentru care, nainte de determinarea unor
forme de fidelitate, trebuie determinat dificultatea unui test prin cercetarea
distribuiei scorurilor sale.
6. Cum poate fi manageriat corect problema determinrii fidelitii la testele cu
limit de timp?
7. Indicai cu un exemplu concret valoarea practic a determinrii erorii standard de
msurare (SEM) n generarea intervalelor de ncredere, preciznd modul de
interpretare a acestora.
8. Precizai care sunt avantajele suplimentare ale erorii tip a estimrii n problema
intervalelor de ncredere.
9. Indicai i argumentai care trebuie s fie fidelitatea minim pentru testele
utilizate: n examenul de admitere a studenilor la o facultate particular; n selecia
psihologic la o coal de poliie cu concuren mare; ntr-o edin de testare
individual n vederea orientrii n carier.
10. Explicai pe scurt n ce const conceptul de generalizabilitate, preciznd care
sunt avantajele i dejavantajele sale.

68

__________________________________________________________________
Modulul M2. Unitatea de nvare 4
VALIDITATEA TESTELOR
_________________________________________________________________
Cuprins
U4.1. Introducere ............................................................................................................. 69
U4.2. Competene ............................................................................................................ 69
U4.3. Validitatea de faad ............................................................................................... 70
U4.4. Validitatea relativ la coninut ............................................................................... 71
U4.5. Validitatea relativ la criteriu ................................................................................. 71
U4.6. Validitatea relativ la construct .............................................................................. 73
U4.6.1. Validitatea convergent i divergent ....................................................... 75
U4.6.2. Matricile multitrstur-multimetod ....................................................... 76
U3.6.3. Studiul trsturilor latente......................................................................... 77
U4.7. Validitatea diferenial ........................................................................................... 79
U4.8. Teoria deciziei aplicat la testele psihologice,
asociat validitii predictive .................................................................................. 80
U4.9. Precauii legate de evaluarea coeficienilor de validitate predictiv ...................... 81
U4.10. Interpretarea coeficienilor de validitate .............................................................. 82
U4.11. Rezumat ................................................................................................................ 83
U4.12. Test de autoevaluare a cunotinelor .................................................................... 84

U4.1. Introducere
Orice student la psihologie tie c meritele unui test psihologic ncep s fie
judecate prin fidelitate, dar sfresc prin aprecierea validitii sale. Aceasta i
datorit faptului c, n timp ce fidelitatea se judec simplu, prin sumarizarea unor
coeficieni de corelaie, validitatea presupune demersuri interpretative mai
complicate i de mai lung durat. nsui conceptul de validitate este unul evolutiv,
aflat n plin dezvoltare i ... de aceea strnete mult mai mult controvers dect
mai stabilul i mai bine aezatul su vr, fidelitatea (Cronbach, apud Gregory,
1996, p. 106). Spre deosebire de fidelitate, care este influenat numai de erorile de
msurare nesistematice, validitatea unui test este afectat att de erorile
nesistematice, ct i de cele sistematice (constante). Din aceast cauz, Un test
poate s fie fidel, fr a fi valid, dar nu poate fi valid fr s fie fidel, afirm
Aiken (1993, p. 94).
Accepiunea clasic a validitii se refer la gradul n care un test msoar ceea ce
i-a propus s msoare, ceea ce sugereaz c ar exista doar un singur tip de
validitate. Actualmente este unanim acceptat faptul c un test poate avea diferite
forme de validitate, dependente de scopurile specifice n care el a fost utilizat. De
69

aceea ni se pare de mare actualitate afirmaia lui chiopu (1974) potrivit creia un
test este bidimensional, axat pe doi factori, adic pe diagnoz i pe validarea ei,
concepui ca axele unui sistem de coordonate: n acest sistem axa X reprezint o
diagnoz cuantificabil (test comportamen), axa Y reprezint criteriul de
valabilitate al diagnozei. (p. 156).
n acest sens poate fi neleas sintagma c un test se valideaz continuu. Fcnd o
analogie cu justiia, unde opereaz prezumia de nevinovie (fr dovezi concrete,
cel trimis n instan este nevinovat), Psihologul trebuie s se supun unor reguli
specifice de probare, n stabilirea faptului c un anumit test are o nsemntate
special pentru un scop specific (Aiken, 1997, p. 133). Deci validitatea ar putea fi
definit mai corect ca o extindere progresiv, pe msur ce testul primete noi
utilizri, a cunoaterii noastre n legtur cu ceea ce msoar el de fapt.

U4.2. Competene
Dup parcurgerea acestei uniti cursanii vor fi capabili:
s defineasc termenul de validitate de faad, indicnd utilitatea sa practic;
s defineasc principalele tipuri de validitate: relativ la coninut, la criteriu i la
construct;
s indice modalitile concrete prin care se determin cele trei tipuri
fundamentale de validitate;
s indice secvena de pai prin care se determin validitatea relativ la construct.

Durata medie de parcurgere a acestei uniti de nvare, incluznd rezolvarea


sarcinilor propuse i a temelor de evaluare, este de 4 ore.

U4.3. Validitatea de faad


Aceasta este mai mult o aparen de validitate dect o form de validitate n sens strict,
deoarece ea indic ce pare a msura o prob, i nu ceea ce msoar ea efectiv. Uneori psihologii
raporteaz exact ceea ce observ, fr a interpreta sau generaliza, i atunci intervine tot validitatea
de faad. Chiar dac tehnic ea este slab definit (i de aceea uneori nici nu este analizat de muli
autori), validitatea de faad pare a avea o important funcie practic, deoarece motiveaz
subiecii s accepte mai uor un test nou, sau permite extensia utilizrii instrumentelor spre alte
zone dect cele care le-au consacrat.
Exemple
Adesea spunem c un test are validitate de faad dac itemii lui sunt relaionai
rezonabil cu scopurile percepute ale testului, afirm Kaplan i Saccuzzo (1993, p.
135). Uneori acest tip de validitate poate contribui la o mai bun valoare de pia
pentru un test.
70

U4.4. Validitatea relativ la coninut


Aa cum reprezentativitatea eantionului de populaie permite generalizri asupra
populaiei int pe care o reprezint, itemii testului prin maniera lor de construcie i de selecie
pot acoperi ntr-o mai mare sau mai mic msur domeniul sau universul trsturii sau al
aptitudinii msurate. n felul acesta rspunsurile la un eantion de itemi dintr-un test cu validitate
de coninut sunt reprezentative pentru rspunsurile pe care subiectul le-ar fi dat dac ntreg
universul trsturii ar fi fost msurat. Acest tip de validitate este decisiv n testele educaionale i
de achiziii, ridicnd probleme specifice evaluatorului. Se va genera deci o banc sau set de itemi
care s acopere bine ntregul domeniu investigat (cunotinele la un obiect colar, gradul de
elaborare a unor deprinderi, nivelul de cristalizare a unor atitudini), din care vor fi selecionai i
agregai ntr-un test doar un numr limitat de itemi, reprezentativi pentru ntregul domeniu.
Unele date de personalitate, obinute prin chestionare (de opinii, atitudini, interese,
motivaii sau valori), beneficiaz mai mult de acest tip de validitate dect celelalte. n testele de
achiziii itemii sunt creai innd cont simultan de obiectivele, finalitile procesului instructiv, dar
i de mecanismele proceselor cognitive la care se face apel n elaborarea rspunsului la itemi.
Aceasta presupune nc din start prezena experilor care vor judeca i hotr care itemi vor fi
inclui n test. De aceea putem spune c dintre formele fundamentale de validitate, cea de coninut
este singura care are o susinere mai degrab logic, dect statistic.
Exemplu
Pentru a da validitate de coninut unui test, constructorul se angajeaz ntr-un
proces de durat, ce presupune o foarte bun cunoatere a domeniului, raionament
logic, intuiie i perseveren, cci itemii trebuie continuu revizuii. Pentru a face
generalizri ntemeiate plecnd de la scorurile la test, constructorul trebuie s
cunoasc bine toi factorii care ar putea afecta performana subiecilor.
U4.5. Validitatea relativ la criteriu
n acord cu aceast faet a validitii, un test este valid relativ la criteriu dac pe baza lui
se pot lua decizii corecte sau se pot face predicii sau prognoze asupra persoanelor examinate. Un
test este valid dac poate nlocui variabila criteriu n virtutea unor corelaii mari ntre test i
aceasta, astfel nct cunoscnd scorul la test s deducem valoarea variabilei criteriu pentru
persoana examinat.
S ne reamintim...
Dup maniera n care sunt colectate datele la test i la criteriu distingem dou
situaii, care produc dou subcategorii ale validitii relative la criteriu:
Cnd scorurile la test i la criteriu se obin simultan, este vorba de validitate
concurent.
Cnd ntre obinerea scorurilor la test i cele la criteriu se interpune o perioad de
timp, vorbim de validitate predictiv.
71

Fiecare dintre aceste tipuri presupune strategii de validare diferite, care vor fi detaliat
analizate n capitolul urmtor. De exemplu, un test de anxietate are validitate concurent dac
scorurile la testul psihologic i gsesc confirmarea, n aceeai perioad de timp, prin diagnosticul
psihiatric. Atunci cnd criteriul se matureaz dup un timp (luni sau ani) i scorurile lui nu pot fi
determinate simultan cu cele de la test, folosim o a doua strategie de validare, cea predictiv. n
selecia profesional, de exemplu, se va calcula coeficientul de corelaie liniar dintre scorurile la
testul aplicat iniial i msuri (exprimate prin note sau calificative) ale performanelor obinute de
aceleai persoane n activitatea sau profesia pentru care au fost selecionate.
Deoarece o funcie fundamental a testului este aceea de a face diagnoza n scopul unei
prognoze (adic faptul de prezice), validitatea predictiv capt o importan special n acest
context. ntruct pentru a determina cu exactitate limitele prediciei msurile la test i cele la
criteriu intr n corelaie, acest fapt impune ca ambele categorii corelate s satisfac standarde
nalte de fidelitate i de validitate. Cu alte cuvinte, o msur criteriu este pertinent dac i ea este
fidel i valid. Acest fapt introduce problema validitii ntr-o relaie circular cu criteriul ales.
Aceasta nseamn c factorii de eroare care afecteaz criteriul vor fi controlai n aceeai manier
ca i predictorii (testele). Atunci cnd controlul lor nu d rezultatele scontate, se poate spori
fidelitatea criteriului, fie lund mai multe eantioane de msurtori ale acestuia (msuri mai dese),
fie adugnd noi tipuri de msuri, incluse ntr-un criteriu compozit, pentru a spori fidelitatea lui n
aceeai manier n care procedm cu un test cruia i adugm itemi suplimentari. O caracteristic
important a criteriului este absena contaminrii, adic necunoaterea rezultatelor la test de ctre
cel care evalueaz msurilecriteriu. Un psiholog va obine independent de diagnosticul medicului
psihiatru scorurile la testul su de anxietate, deci va face o analiz oarb. Prin efectul de halo,
indulgen, predicia pentru sine sau profeia care se automplinete, rezultatele prezise pot fi
produse ntr-o oarecare msur de predictorul nsui, caz n care comparaia nu mai este valid.

Exemple
Havrneanu (2000) apreciaz c cele mai bune msuricriteriu sunt cele care
prezint mai multe avantaje practice, care sunt mai simplu de folosit, mai
disponibile i mai puin costisitoare. Dintre acestea se pot enumera:
msurarea direct a produciei sau a randamentului muncii;
evalurile performanelor angajailor fcute de ctre efii lor sau de ctre
serviciile de personal ale ntreprinderilor.
Msuracriteriu poate aparine unui grup, n sensul c testul care reuete s clasifice
persoanele n grupuri bine precizate, sunt valide. Strategiile de validare predictiv cele mai
utilizate calculeaz fie un indice de eficacitate, fie scoruri de separare a categoriilor, indici de
separare a grupurilor sau indicele de utilitate (vezi Havrneanu, 2000, pp. 113-126). Dintre factorii
care afecteaz validitatea relativ la criteriu, Aiken (1997) indic diferenele de omogenitate ale
grupurilor (validitatea tinde s fie cu att mai mic cu ct grupurile sunt mai eterogene), lungimea
testului (testele mai lungi sunt mai valide) i contaminarea criteriului, de care am amintit deja.

72

Creterea validitii unui test, n calitatea lui de instrument diagnostic sau prognostic,
presupune costuri ce trebuie atent evaluate, cci uneori metode mai puin costisitoare (observaia,
interviul sau inventarul biografic) pot aduce plusul de informaie necesar n atingerea scopurilor
propuse.

U4.6. Validitatea relativ la construct


Multe dintre testele de personalitate msoar dimensiuni ale acesteia (anxietate, depresie,
nevrotism, motivaie, introversie-extraversie), mai slab definite iniial, dar din ce n ce mai bine
circumscrise, pe msur ce teoriile n domeniu au avansat. Conceptualizrile progresive ale
acestora (dar i ale inteligenei, memoriei, creativitii etc.) au dus la apariia de constructe tot mai
evoluate. Unele teste sunt construite plecnd de la date empirice (ca MMPI sau ca Inventarul de
Personalitate California al lui Gough), altele se origineaz n teorii anterior elaborate oricrei
cercetri empirice (Chestionarele de personalitate Cattell sau Indicatorul Tipologic MyersBriggs). Validitatea relativ la construct verific, pe de o parte, dac testul se refer realmente la
constructul pe care vrea s-l msoare, i apoi dac scorurile subiecilor testai reflect corect
mrimea acestui construct la persoanele n cauz.
Strategia determinrii acestui tip de validitate impune un algoritm (Albu, 1998:

Descrierea amnunit a domeniului constructului respectiv (adic a tuturor atributelor ce


au legtur cu acesta i specificarea relaiilor dintre ele), printr-o reea nomologic, pe care
un grup de experi o va evalua pentru a determina nivelul la care ea acoper constructul.
Apoi se realizeaz un model al rezolvrii testului, cu mecanismele teoretice implicate,
pentru a vedea legtura acestuia cu constructul, dar i cu rspunsurile posibile la test. Este
posibil s se constate o bun reprezentare a constructului n test, dar i diverse grade de
subreprezentare (mai ales cnd sarcinile sunt prea grele sau prea uoare).

Se analizeaz consecvena rspunsurilor la itemii testului, adic dac procesele implicate


n rezolvarea acestora acioneaz similar la toi itemii, pe parcursul ntregului test.

Se urmrete dac structura global a scorului la test reflect structura domeniului


constructului msurat. Pentru aceasta se apeleaz la analiza factorial (de unde i numele
de validare factorial), care determin cteva variabile latente numite factori, alctuii din
itemi ce dau scoruri care coreleaz ntre ele, ce acoper variana ntregului test. Se caut
semnificaia acestor variabile, reinndu-se cele care au o mai mare legtur cu constructul,
asigurndu-se o coresponden ntre importana avut n definirea constructului respectiv i
ponderea lor ca itemi n testul final.

Se extind generalizrile acestor prime etape, schimbnd fie populaiile examinate, fie
examinatorul sau contextele de examinare, pentru a vedea dac relaiile sesizate rmn
constante.

n final se caut stabilirea relaiilor dintre testul cercetat i alte tipuri de msurtori sau de
observaii. Testul poate avea o validitate convergent (ntre scorurile sale i alte tipuri de
teste ce msoar acelai construct exist o relaie liniar), sau discriminant (cnd scorurile
la teste nu coreleaz cu teste care se tie c nu msoar constructul respectiv).

73

Validitatea relativ la construct se mai numete i validitate conceptual, care este cu


siguran tipul de validitate care necesit cea mai mare cantitate de efort n vederea probrii ei
pentru un instrument psihometric. Dei se admite faptul c soarta unei tiine este dependent de
nivelul cuantificrilor sale, adic de capacitatea sa de a msura adecvat ceea ce intr n domeniul
obiectului su de studiu, i reciproca este valabil. Astfel, nu am putea spune nimic concret despre
variabile complexe ca inteligena, memoria, stilurile de evaluare sau cele cognitive dac nu am
avea i posibilitatea s le testm, adic s le supunem msurrii. Dar, pe de alt parte, msurarea
lor este departe de a fi posibil fr o cunoatere teoretic prealabil a acestor constructe.

Exemplu
Raportul dintre teorie i msurare este cel mai bine surprins prin conceptul de
validitate de construct care este chiar elementul cheie al operaionalizrii
variabilelor. A operaionaliza nseamn a aduce un construct teoretic n situaia de
putea fi surprins i evideniat prin msurare. n cazul n care operaionalizarea unei
teorii bune a fost fcut adecvat, printr-un instrument corect elaborat, capabil s o
surprind, atunci putem formula predicii sub forma ipotezelor ce rezult din teoria
respectiv. Dac ipotezele se verific, atunci i teoria, dar i operaionalizarea ei
sub forma instrumentului de msur respectiv sunt n regul.
Dac ipotezele nu se verific, sunt posibile dou explicaii alternative:
instrumentul este bun, dar deoarece teoria nu se verific, aceasta trebuie
schimbat;
teoria este una valabil, dar instrumentul nu o operaionalizeaz corespunztor i
atunci nu putem dovedi ce ne-am propus i deci trebuie schimbat chiar
instrumentul de msur.
De exemplu, cercetrile lui Witkin i ale colaboratorilor si au evideniat mai mult
difereniere i mai mult independen de cmp pentru genul masculin. Studiile
neuropsihologice actuale despre lateralizarea funciilor corticale i asimetria
emisferelor cerebrale indic de asemenea o specializare emisferic mai accentuat
pentru genul masculin, ca i un acces bicerebral la limb pentru genul feminin, de
unde superioritatea brbailor pentru sarcinile spaiale i a femeilor pentru cele
legate de limb i comunicare. Faptul c la un test spaial ca cel al Cuburile Kohs,
bieii obin performane superioare comparativ cu fetele, n timp ce acestea au
performane superioare la un test de inteligen verbal, este consistent cu teoriile
anterior menionate.
n alte situaii se ateapt ca itemii unui test s se organizeze ntr-o ordine progresiv, ceea
ce ar corespunde unei structuri ierarhice, rezultat din chiar dezvoltarea funciei sau abilitii
respective. De exemplu, dac vom operaionaliza teoria psihogenetic piagetian ntr-o scal de
itemi, aceasta va fi una ierarhic, pentru c orice stadiu l nglobeaz pe cel precedent, fcndu-l
posibil pe cel care urmeaz. Validitatea conceptual va fi serios pus la ndoial n cazul n care un
subiect paseaz itemii pentru stadiul operaiilor formale i nu-i trece pe cei din stadiul operaiilor
concrete, fapt care ar contrazice chiar ideea de dezvoltare stadial i ierarhic. n mod sporadic sar putea ntmpla s existe i itemi de acest fel, care vor constitui ns erori.
74

Se poate deci afirma c rezultatele la acest tip de test sunt reproductibile: pornind de la
scorul total la test, putem s prezicem care itemi vor fi pasai i care vor fi euai. Pentru aceasta
ns trebuie s tim ordinea de dificultate a itemilor, iar aceast ordine s fie aceeai la toi
subiecii. Cazurile (ct mai puine!) n care ierarhia itemilor este nclcat produc erori de
reproductibilitate, cci ele limiteaz posibilitatea prediciei corecte a itemilor care vor fi pasai i al
celor ce vor fi euai.

Exemplu
Guttman (1950) a propus ca rezultatele la un test s fie considerate ierarhice atunci
cnd mai puin de 10% din rezultate nu sunt reproductibile. El a propus o formul
de calcul pentru coeficientul de reproductibilitate:
Ne
CR = 1
N jNp
n care:
CR = coeficientul de reproductibilitate;
Ne = numrul erorilor de reproductibilitate (numrul de itemi care ncalc
ierarhia, adic furnizeaz rezultate n dezacord cu scorul total obinut i cu
ordinea de dificultate a ansamblului itemilor);
Nj = numrul de itemi;
Np = numrul de persoane (subieci).
Aceasta poate fi considerat o bun metod de validare conceptual pentru probele
piagetiene, condiia recomandat de Guttman fiind un CR de peste 0,90, deoarece
peste aceast valoare invariana ordinii de reuit se consider a fi bine
demonstrat.
Metode speciale de demonstare a validitii conceptuale a unui test o constituie metoda
corelaiilor simple, metoda multitrstur-multimetod i studiul trsturilor latente.

U4.6.1. Metode corelaionale simple


Aceste metode permit evidenierea faptului dac un test msoar acelai lucru cu un alt test
despre care se tie deja c este o msur valid a constructului respectiv. Acest tip de validitate se
numete validitate convergent. Cnd ns testul respectiv este pus n corelaie cu un alt test care
msoar o aptitudine complet diferit, aceast corelaie trebuie s fie foarte mic i atunci vom
pune n eviden validitatea divergent (sau discriminant). De exemplu, este cu totul de
ateptat ca un test de inteligen s coreleze puternic cu randamentul colar la 12 ani, aa cum
menioneaz i literatura de specialitate, cci cele dou variabile au multe lucruri n comun. Cnd
ns testul nostru coreleaz puternic cu motivaia, cu locus of control sau cu alte variabile
ndeprtate, apar mari suspiciuni n legtur cu ce msoar de fapt testul n cauz.

75

U4.6.2. Matricile multitrstur-multimetod2


Procedeul descris aici a fost pus la punct nc din 1959 de Campbell i Fiske, el fiind n
acelai timp i o metodologie important pentru nelegerea procesului de validare. Acest
procedur este un design ce ia simultan n considerare validitatea convergent i pe cea divergent
(discriminant). Se cheam multidimensional pentru c ia n evaluare dou sau mai multe
trasturi, evaluate prin dou sau mai multe metode.
n exemplul de mai jos (preluat din Gregory, 1996, p. 122), trei trsturi A, B i C
(Interesele, Creativitatea i Dominana) sunt msurate cu metodele 1, 2 i 3 (recte inventar
autoaplicat, evaluarea covrstnicilor i un test proiectiv). Deoarece fiecare dintre cele 3 trsturi
sunt msurate prin toate cele 3 metode, rezult de fapt 9 teste, exprimate prin coeficienii de
corelaie din triunghiurile cu linie continu de pe diagonala mare. Cnd fiecare dintre aceste teste
este administrat a doua oar aceluiai grup de subieci i scorurile fiecrei perechi de teste
rezultate prin test-retest sunt corelate, rezult o matrice multitrstur-multimetod, care devine o
surs extrem de bogat de informaii att despre fidelitatea, ct i despre validitatea convergent i
divergent testelor analizate.
Metoda

Trsturile

Metoda 1
A1 B1 C1

Metoda 2
A2 B2 C2

Metoda 1

A1
B1
C1

(.89)
.51 (.89)
.38 .37 (.76)

Metoda 2

A2
B2
C2

.57
.22
.11

.22
.57
.11

.09
.10
.46

(.93)
.68 (.94)
.59 .58 (.84)

Metoda 3

A3
B3
C3

.56
.23
.11

.22
.58
.11

.11
.12
.45

.67
.43
.34

.42
.66
.32

.33
.34
.58

Metoda 3
A3 B3 .C3

(.94)
.67 (.92)
.58 .60 (.85)

Note: - literele A, B i C se refer la trsturi iar cifrele 1, 2, i 3 subscrise se refer la metode.


- matricile const din coeficieni de corelaie.
Figura 6.1. Modul de raportare a validitii prin matricea multimetod-multitrstur.

Orientarea n tabelul de mai sus se face astfel:

coeficienii dintre paranteze de pe diagonala mare sunt coeficienii de fidelitate pentru


fiecare test n parte: cu ct este mai mare, cu att fidelitatea este mai bun, dei n realitate
ne mulumim cu r cuprini ntre 0,80 i 0,90;

Multitrait-Multimethod Matrix, n limba englez.


76

coeficienii boldai de pe cele trei diagonale mici reprezint dovezi ale validitii
convergente: aceeai trstur fiind msurat prin diferite metode, corelaia trebuie s fie
una pozitiv i puternic;

n triunghiurile cu linie continu sunt incluse corelaiile dintre diferitele trsturi msurate
cu aceeai metod: acestea trebuie s aib valori medii sau ridicate;

cele ase triunghiuri din linii punctate includ corelaiile dintre diferitele trsturi msurate
cu diferite metode; acestea trebuie s fie ct mai mici n fiecare triunghi, deoarece ele sunt
dovezi importante relative la validitatea discriminant (divergent).

Aceast metodologie este o contribuie important la nelegerea procesului de validare,


dar reclam un efort de cercetare uria. De aceea cei mai muli creatori de teste prefer s culeag
informaii separate, pe buci despre fidelitate i validitate, pe care s le reuneasc ulterior ntrun tabel compozit, n locul unei matrici care s le integreze din capul locului pe toate deodat.

U4.6.3. Studiul trsturilor latente


Ne ateptm ca itemii care msoar un acelai construct sau caracteristic s fie puternic
corelai ntre ei, ceea ce ar putea primi o reprezentare grafic de tip scatter, care evideniaz norul
de puncte dintre o abscis i o ordonat reprezentnd cele dou variabile intercorelate. Analiza
factorial este o tehnic special care permite s se mearg mult mai departe dect simpla
inspecie vizual a matricilor de intercorelaii sau a norului de puncte. Scopul metodei este acela
de a determina numrul minim de determinani numii factori (dar i trsturi latente) necesari
explicrii intercorelaiilor din matricile respective.
Demersul tipic al analizei factoriale const din a administra o baterie de teste ctorva sute
de subieci i apoi de a determina intercorelaiile dintre toate perechile posibile de teste, ceea ce va
produce matricea de intercorelaii. Deoarece fiecare test nu este o trstur independent (caz n
care intercorelaiile din matrice ar tinde spre zero) i deoarece mai multe teste msoar n diverse
grade o aceeai trstur, formnd clusteri (ciorchini), analiza factorial tinde s descopere un
numr mai mic de factori dect numrul testelor intercorelate i apoi s produc un tabel care s
indice ncrctura (saturaia) fiecrei variabile n factorul respectiv. Ca orice coeficient de
corelaie, aceasta poate varia ntre -1,00 i +1,00, trecnd prin 0. Rezultatul cel mai important al
analizei factoriale este un tabel cu factorii i saturaia fiecrei variabile n factorii respectivi, ceea
ce ajut la descrierea structurii factorial i la producerea de dovezi reieite din analiz despre
validitatea de construct a unei baterii de teste sau de variabile reunite.
S ne reamintim...
Analiza factorial se sprijin pe dou postulate de baz:
postulatul cauzalitii factoriale: variabilele observate sunt combinaii lineare de
variabile cauzale subiacente;
postulatul parcimoniei: dintre dou soluii factoriale trebuie aleas cea mai
simpl. Dei larg acceptat de majoritatea cercettorilor, nu este posibil de
demonstrat c acest postulat este bine fundamentat. n plus, nici nu este

77

ntotdeauna valabil faptul ca structura cea mai simpl s fie mai plauzibil dect
structura mai complex. Oricum, n funcie de tipul de analiz ales ajungem la
soluii factoriale diferite, iar soluia final pe care o alegem nu este una de natur
matematic, ci mai degrab de natur teoretic.
Prin crearea analizei factoriale, Charles Spearman (1907) a dezvoltat de fapt o metod
capabil s pun n eviden existena unui factor general al inteligenei, prezent n orice tip de
sarcin mintal (i de aceea numit i factor g), n combinaii diferite cu un factor specific numit s.
Procedeul dezvoltat de el, numit metoda componentelor principale, i-a permis s produc dovezi
n favoarea ipotezei sale, numit modelul bifactorial al inteligenei.
n 1928, Thurstone, un creator american de marc n domeniul analizei factoriale, a utilizat
aceeai metod ortogonal (dou axe aflate n unghi drept, adic independente ntre ele) dar cu un
mic amendament: n loc ca o ax s explice variana factorului major i cealalt variana rezidual
(variana rmas neexplicat de factorul major), el a propus rotirea celor dou axe ortogonale pn
la obinerea structurii celei mai simple, ameliornd astfel gradul de adaptare a datelor la structura
factorial. Metoda se mai numete i Varimax deoarece ea caut ca pe fiecare dintre cele dou axe
ortogonale variana explicat s fie una maximal. Aceasta face ca fiecare factor s explice un
grup de rezultate i doar att, cci prin aceast metod nu mai poate fi identificat factorul general,
ceea ce pune n discuie chiar modelul propus de Spearman pentru definirea inteligenei umane.
Din punct de vedere matematic ambele metode sunt valide, dar fiecare are propriile posibiliti i
limite: una ajut la identificarea factorului general, pe care cealalt l neag; cealalt ajut la mai
buna identificare, nelegere i numire a factorilor rezultai. De aceea utilizarea celor dou metode
este corelativ.
Analiza factorial permite doar verificarea faptului dac datele sunt consistente cu structura
factorial postulat. Cnd datele sunt compatibile cu mai multe structuri latente posibile, analiza
factorial nu ne poate ajuta s alegem una singur, aceast alegere fundamentndu-se pe baza unei
teorii prealabil elaborat. ntr-un demers de validare, analiza factorial va aduce deci informaiile
necesare, dar nu i suficiente lurii unei decizii.
Exemple
Analiza factorial pune nu numai probleme de interpretere, ci i cteva importante
probleme metodologice, rezumate mai jos.
 Mrimea eantionului: cu ct eantionul pe care se face analiza factorial este
mai mic, cu att mai mult coeficienii de corelaie din matrice pierd din
semnificaia statistic, soluiile factoriale obinute trebuind examinate cu mai
mult pruden. Dei nu poate fi indicat o mrime ideal, cercettorii au czut de
acord cu raportul de 5 la 1 ntre numrul subiecilor din eantion i numrul
variabilelor supuse factorizrii. Dar i acest lucru trebuie luat cu rezerv, pentru
c corelaiile mici (sub 0,30) pun n discuie nu mrimea eentionului, ci chiar
necesitatea desfurrii unei analize factoriale, dup cum corelaiile mai mari de
0,50 se pot desfura cu rezultate bune i pe eantioane mai mici dect cele ce ar
rezulta din raportul 5/1. Deci, nainte de a efectua o analiz factorial, obligatoriu
78

vom inspecta cu atenie matricea de intercorelaii a variabilelor factorizate.


 Normalitatea multivariat: aceasta semnific faptul c toate variabilele i toate
combinaiile lor se distribuie normal. Cum nu putem testa toate combinaiile de
variabile, ceea ce ne rmne de fcut este faptul de a aprecia normalitatea fiecrei
variabile n parte din coeficientul de asimetrie i de boltire (skewness i kurtosis).
 Liniaritatea: relaia dintre variabile trebuie s fie liniar, n caz de curbiliniaritate
rezultatele analizei factoriale fiind de pus la ndoial. Liniaritatea dintre variabile
se poate verifica prin scatter-ul cu norul de puncte pentru fiecare combinaie de
cte 2 variabile.

U4.7. Validitatea diferenial


Validitatea unui test este determinat pe ansamblul populaiei pe care el a fost aplicat.
Aceasta ar putea s nsemne faptul c validitatea astfel determinat este una valabil pentru toi
subiecii acestei populaii, postulat care afost tot mai mult pus la ndoial dup anii '70. n felul
acesta s-a ajuns la concluzia c validitatea unui test poate varia nuntrul aceleiai populaii prin
faptul c unii subieci pot aprine unor subgrupuri speciale. De exeemplu, validitatea determinat
pentru un test de lectur poate fi diferit pentru stngaci, ca subpopulaie a grupului total.
Validitatea pentru un test de matematic poate fi afectat n cazul unui grup special, care obine
performane sistematic mai sczute, nu din cauza capacitii de raionament mai sczut a
membrilor acestui subgrup, ci ca urmare a faptului c acetia au o tulburare specific de citit
(dislexie) i neleg cu mai mare dificultatea enunurile itemilor testului.
Aceste constatri conduc la lrgirea cadrului conceptual al validitii nu numai pentru
diferitele utilizri care se dau unui test, ci i pentru diferitele subgrupuri populaionale pe care se
aplic, n raport cu care testul este mai mult sau mai puin valid. Pentru acest tip de validitate
termenul care s-a ncetenit este acela de validitate diferenial iar populaiile care se abat de la
regula general se cheam c sunt biasate (distorsionate).
Studiul acestei forme de validitate este i el foarte complex i rmne ca orice alt form
de validitate un demers doar parial mplinit, adic neterminat. Pentru orice utilizare a unui test
pe un grup nou trebuie s se aduc dovezi c grupul nu este unul biasat. Dar, simpla constatare a
diferenei dintre dou grupuri nu nseman neaprat c unul dintre ele este biasat. Performanele
mai slabe la un test de vocabular ar putea avea ca explicaie i oportunitile de nvare diferite
pentru cele dou grupuri.
Exemplu
Testele ce ar putea pune n eviden diferenele dintre cele dou grupuri pot avea i
o utilitate social, pentru c pot pune n micare aciuni de remediere pentru a da
membrilor fiecrui grup anse egale. Ca pentru toat validitatea n general,
validitatea diferenial se determin tot prin trei procedee, care au i acelai nume:
validitatea de coninut, validitatea relativ la criteriu i validitatea relativ la
construct (sau conceptual). Pentru a nu ngusta prea mult problematica validitii
difereniale, nu vom intra n detalii cu prezentarea sa.

79

Predicia la test

U4.8. Teoria deciziei aplicat la testele psihologice, asociat validitii predictive


Muli psihologi susin c scopul testrii psihologice nu este msurarea n sine, ci msurarea
n serviciul lurii unei decizii optime. Astfel, managerul vrea s tie pe cine s angajeze,
examinatorul pe cine s admit, iar psihiatrul pe cine s interneze. Testele psihologice joac n
mod frecvent un rol important n aceste tipuri de decizii instituionale. Dei n luarea unei decizii
adesea sunt luate n considerare mai multe puncte de separaie a grupurilor, numite i puncte de
tietur (cutoff), pentru a simplica lucrurile vom pleca de la exemplul unui singur test. n realitate,
scorurile la un test se dispun pe ceea ce n statistic numim amplitudinea mprtierii (R = range).
Cu toate acestea este posibil s identificm punctul care desparte jumtatea creia i se prezice
succes de cea creia i se prezice nereuit. S presupunem de asemena c cei crora li s-a prezis
succes au fost i selectai sau angajai ntr-o oarecare proporie, ce poate varia de la 0 la 1, dup
numrul de persoane considerate a fi susceptibile s reueasc n funcie de criteriul de msur
adoptat. Dac procedm foarte reducionist, succesul poate fi mprit ntr-o variabil dihotomic
predicie succes versus predicie eec, n timp ce criteriul prin care se va determina succesul
ulterior poate fi mprit la rndul su n a reuit i a avut eec. Aadar, orice studiu de
validitate predictiv poate produce o matrice cu dou intrri de tipul celei de mai jos.
Performana la criteriu
A avut succes
A avut eec
Va avea succes

Predicie corect

Fali pozitivi

Va avea eec

Fali negativi

Predicie corect

Figura 7.2. Rezultatele posibile ale unui test de selecie utilizat pentru a preciza un criteriu-msur.

Dac un test a avut o bun validitate predictiv, atunci diagonala stnga-sus dreapta-jos
se maximizeaz: cele mai multe persoane crora li s-a prezis succes au i avut succes, iar cele mai
multe persoane crora li s-a prezis eec au i euat, deci ambele predicii s-au adeverit. Dar cum
nici un test de selecie nu este un predictor perfect, sunt posibile i celelalte dou situaii: s-a
prezis succes unor persoane care au euat (falii pozitivi), ori s-a prezis eec i acesta nu a avut loc
(falii negativi). Ambele categorii de fali (pozitivi i negativi) sunt considerate n egal msur
eecuri ale prediciei, deoarece ambele au fcut predicii inacurate. Se poate astfel calcula
urmtoarea proporie:
Rata de reuit = reuite / (reuite + eecuri)
n lumea real fals-pozitivii i fals-negativii sunt evitai, dar nu pn la eliminare, pentru c
aceasta ar presupune un test care are o corelaie perfect (r = +1,00) cu criteriul prezis. Cum acest
lucru nu este posibil, ceea ce rmne de fcut pentru a minimiza erorile de decizie este dezvoltarea
unor teste cu o mare valoare predictiv.

80

Exemple
n luarea deciziilor, adepii teoriei deciziei se sprijin pe dou asumpiuni:
1. Dezvoltarea unei scale de utilitate, astfel nct indicatori importani ai instituiei
s poat fi exprimai n profituri sau pierderi. De exemplu, dac dup un chestionar
de tipul EPI al lui Eysenck, prin care se poate determina i introversia/extraversia,
o companie poate identifica pierderile asociate cu vnztorul de maini introvert,
comparativ cu ctigurile aduse de vnztorul extravert. Astfel, falii pozitivi sunt
cei ce aduc pierderi instituiei (vnd mai puine maini dect ar fi necesar pentru
plata propriului salariu), ca i falii negativi (cei care, dac ar fi fost ncadrai, ar fi
contribuit la creterea profiturilor companiei). Acesta este un exemplu de
operaionalizare a testului i a seleciei pe o scal de utilitate.
2. n deciziile de selecie instituional strategia cea mai satisfctoare este aceea
de a maximiza ctigul scalei de utilitate i de a minimiza pierderile. Scala trebuie
s rspund la ntrebarea: La ce proporie de selecie se produce cel mai mare
ctig mediu al scalei?
Tabelele Taylor-Russell, publicate prima dat de aceti autori americani n 1939, permit
unui utilizator de teste s determine proporia expectat pentru aplicanii selectai, dac se
specific trei elemente: 1. validitatea predictiv a testului, 2. rata (proporia) seleciilor i 3.
proporia bazal pentru aplicanii de succes.
Ce sunt aceste elemente?
validitatea predictiv este determinat anterior prin studii i se exprim printr-o corelaie
de tipul rxy;

proporia selecionailor este cea rezultat din numrul de alei supra numrul de aplicani,
nmulit cu 100;

rata de baz este proporia celor ce ar fi fost selecionai prin metodele curente, fr
beneficiul adus de noul test. Cum acest lucru este mai greu de determinat, la extrem se
folosete pentru rata de baz proporia aplicanilor de succes, dac ei ar fi fost alei aleator.
Cunoaterea celor trei factori de mai sus face posibil utilizarea unor tabele special
construite prin care se determin cu ct mbuntete noul test selecia, comparativ cu metoda
anterioar. Pe lng faptul c leag testul psihologic de aspecte economice foarte pragmatice,
determinnd efectiv valoarea practic a unui test, tabelele Taylor-Russell evideniaz i aspecte
care intrig, cum ar fi creteri substaniale ale acurateei seleciei, chiar i la validiti foarte mici,
n anumite condiii.

U4.9. Precauii legate de evaluarea coeficienilor de validitate predictiv


Standards for Educational and Psychological Testing atrage atenia asupra ctorva
probleme importante i asupra precauiilor legate de interpretarea coeficienilor de validitate:
Cercetai schimbrile aprute n sensul cauzalitii test-criteriu: de regul presupunem
implicit c relaia dintre test i criteriu este nc n funciune atunci cnd aplicm noi testul. De
exemplu, testul s-a dovedit util n selecia de supraveghetori femini, ceea ce s-a soldat cu
81

succes ntr-o prim faz, cnd grupul era demixtat (numai femei), dar nu ia n consideraie
situaia actual n care grupul de munc este unul mixt.
Ce nseman criteriul ales? Coeficientul de validitate contra criteriului obinut poate s nu
nsemne nimic dac criteriul nu este el nsui fidel i valid. A corela un test cu un altul despre
care nu tim prea multe lucruri sub aspectul validitii nu ne ajut prea mult n determinarea
validitii convergente a primului test.
Luai ntotdeauna n consideraie populaia pe care s-a obinut o anume validitate: o
validitate ridicat pe o populaie de albi se pstreaz ea oare i pe o populaie de negri?
Asigurai-v c mrimea eantionului populaional este suficient i adecvat: cu ct este
mai mare grupul iniial pe care s-a studiat validitatea, cu att mai bun este validitatea
ncruciat.
Niciodat s nu confundai criteriul cu predictorul.
Verificai spectrul de valabilitate att pentru predictor, ct i pentru criteriu: deoarece corelaia
depinde de mrimea variabilitii, ea este subestimat sever atunci cnd predictorul sau criteriul
au un spectru de variabilitate foarte ngust.
Generalizai cu pruden o validitate gsit: cu alte cuvinte trebuie demonstrat c validitatea
descoperit ntr-un studiu nu este dependent de situaie.
Luai n calcul i validitatea diferenial: relaiile descoperite pentru o populaie demografic
s-ar putea s nu fie deloc aceleai pentru toate subgrupurile care o compun.

U4.10. Interpretarea coeficienilor de validitate


Pentru c strategiile de validare a unui test sunt att de diverse, nu exist o interpretare
uniform a acestora. n practic ntlnim destul de rar coeficieni mai mari de 0,60, cei mai muli
(considerai satisfctori sau chiar mari) oscilnd ntre 0,30 0,40. Un coeficient de validitate este
semnificativ statistic cnd ansele de a-l obine din ntmplare sunt sub 5 procente. Pentru a fi mai
specifici, vom arta c ptratul unui coeficient de validitate (coeficientul de determinare) indic
procentajul din variabilitatea criteriului pe care ateptm s o tim n avans prin cunoaterea
scorurilor la test.
Exemplu
La o corelaie de 0,60 dintre o baterie de teste i media colar general a unei
clase de elevi, vom ti c 0,60 2 = 0,36, adic 36% din variabilitatea mediei colare
depinde de inteligen, aa cum am msurat-o cu bateria noastr, restul depinznd
de alte cauze, printre care i de factorii de eroare.
Uneori o validitate de 0,30 ar putea nseamna economii de milioane de dolari n orientarea
i selecia profesional, alteori o validitate de 0,40 poate fi nesatisfctoare. Chiar dac chiopu
(1974) apreciaz c o validitate de peste 0,25 face ca testul s dea predicii superioare oricrei
sondri empirice, asociaiile profesionale ale psihologilor din America au furnizat (Standards for

82

Educational and Psychological Testing, 1985) o list de probleme ce pot aprea n interpretarea
coeficienilor de validitate. Redm mai jos cteva dintre acestea:

Validitatea nu se msoar, ci se deduce. Dei autorul testului trebuie s dea mai muli
coeficieni de validitate, indicnd procedura urmat, utilizarea lui pe alte grupuri, sau n
alte scopuri, necesit studii de validare suplimentare. Aceasta deoarece validitatea testului
depinde simultan de scopul testrii i de populaia creia i se administreaz. Toate aceste
determinri ale validitii care vin din studii ulterioare, desfurate n scopuri specifice i
pe alte eantioane de populaie, vor fi considerate doar dovezi ale unui anumit tip de
validitate.

Studierea validitii testelor angajeaz metode elaborate de analiz (analiza de itemi,


calculul corelaiei, analiza factorial, regresia simpl i multipl) care combinate, dau
strategii de validare mai bine definite. Utilizarea lor se face n funcie de scopul i de
exigenele beneficiarului.

Strategiile de validare se aplic odat cu construirea testului i se repet de cte ori este
nevoie pentru a obine un test bun ca lungime, mod de aplicare, for discriminativ,
uurin n administrare, cotare i interpretare, care alturi de fidelitate i validitate, dau o
imagine mai adecvat despre valoarea sa.
Utilizarea testului impune repetarea periodic a procesului de cercetare a validitii,
ntruct validarea unui test nu se ncheie niciodat, datele nou acumulate din diverse domenii
conducnd la ameliorarea i rafinarea sa, dar nu i la o soluie definitiv. Cu att mai mult se pune
problema relurii studiului validitii unui test atunci cnd i se schimb formatul (prin aplicarea pe
calculator, de exemplu), coninutul, instructajul sau modul de cotare.
U4.11. Rezumat
Valoarea unui test ncepe prin a se judeca plecnd de la fidelitatea sa dar sfrete
prin evaluarea validitii sale.
Validitea unui test un este niciodat pe deplin dovedit. Ea este un proces care un
se ncheie practic niciodat.
Cercetarea validitii este un proces continuu, ce se reia odat cu fiecare
modificarea testului i cu fiecare extensie a utilizrii sale spre noi aplicaii sau
populaii.
Validitatea de faad (ceea ce pare a msura un test) este cea mai slab definit
form de validitate.
Validitatea relativ la coninut indic gradul n care testul acoper domeniul
msurat, fiind definitorie mai ales pentru testele de achiziii i educaionale.
Validitatea relativ la criteriu este cea mai important form de validitate pentru
c exprim msura n care testul poate face predicii acurate.
Dup maniera n care se culeg datele de testare i de criteriu (simultan sau la
distan n timp) se pot identifica validitatea concurent i validitatea
predictiv.
83

Criteriul intr n relaie de circularitate cu testul i de aceea trebuie el nsui s fie


fidel i valid.
Validitatea relativ la construct (numit i conceptual) determin msura n
care o teorie se regsete reflectat ntr-un test. Determinarea ei cere cel mai mare
efort, n acest proces analiza factorial avnd un rol nsemnat.
Acest tip de validitate are legtur cu modul de operaionalizare a variabilelor
pentru a surprinde ct mai corect teoria subiacent.
Formele avansate de determinare a validitii conceptuale o constituie metodele
corelaionale simple, matricile multitrstur-multimetod i studiul trsturilor
latente.
O form special de validitate este cea diferenial.
Teoriea deciziei aplicat la testele psihologice determin aportul practic adus de
acestea n selecie, prin aprecierea gradului de acuratee a prediciei succesului i
eecului (tabelele Taylor-Russell).
Interpretarea validitii nu este uniform i const din aprecierea unui coeficient
de corelaie, totdeauna dependent de circumstanele n care el a fost obinut.

U4.12. Test de evaluare a cunotinelor


1. Indicai de ce, n pofida srciei sale, validitatea de faad se menine nc.
2. Indicai maniera n care se poate obine un criteriu fidel i valid n domeniul
psihologiei muncii.
3. Definii termenul de strategii de validare cu particularizare pe determinarea
validitii relativ la coninut i relativ la criteriu.
4. Argumentai n legtur cu faptul c validitatea relativ la construct se mai
numete i validitate conceptual.
5. Precizai n ce const, care sunt valoarea i limitele matricii multitrsturmultimetod n probarea validitii i fidelitii unui test.
6. Definii n ce const diferena dintre validitatea concurent i cea diferenial.
7. Precizai care este rolul analizei factoriale n probarea validitii de construct a
unui test psihologic.
8. Precizai care este rolul tabelelor Taylor-Russell n aprecierea validitii
predictive.
9. Indicai care sunt precauiile legate de probarea validitii predictive.
10. Explicitai sintagma Validitatea uni test nu se msoar, ci se deduce.
11. Analizai factorii de care trebuie s se in cont n evaluarea validitii unui test.
12. Efectuai o analiz comparativ a conceptelor de fidelitate i de validitate ale
unui test sau scale psihologice.

84

MODULUL 3.
DEMERSURI APLICATIVE ALE TEORIEI TESTELOR PSIHOMETRICE
___________________________________________________________________

Cuprins
M3.1. Introducere 85
M3.2. Competene ........... 85
M3.1. Introducere
Modulul 3 este alctuit din patru uniti distincte de curs, dedicate prezentrii unor
aspecte de ordin practic-aplicativ a problematicii legate de testul psihologic. Astfel,
prima unitate de curs a acestui modul transfer analiza caracteristicilor testului
psihologic de la nivelul molecular (unitatea de baz este testul nsui), la nivel molar
(este analizat itemul n calitatea sa de cea mai mic unitate a unui test, ce poate fi
abordat independent). Plecnd de la principiul c un test bun este alctuit din itemi
buni, sunt analizate dificultatea i discriminabilitatea itemilor, dar i raportul dintre
aceste dou categorii terminologice. Ulterior, sunt prezentai indicii corelaionali ai
capacitii de discriminare a unui test i curba caracteristic a itemului (CCI).
Cea de a doua unitate de curs este probabil cea mai important din toat lucrarea
deoarece, plecnd de la cteva consistente consideraii teoretice privitoare la normele
i etalonarea testelor, sunt prezentate o multitudine de metode de etalonare. Fiind un
capitol dublu ca i coninut, cea de a doua sa parte abordeaz problema clasificrii
testelor dup mai multe criterii, furniznd cteva exemple urmate de o aplicaie
practic.
Cel de al treilea capitol este unul extrem de relevant practic i se refer la construirea
scalelor psihologice. Este prezentat un demers complet, cu exemplificri concrete ale
celor ase pai ce sunt de regul urmai n procesul de construcie a unei scale. Sunt
furnizate criterii practice de selecie a itemilor n scal i sunt prezentate cele mai
utile analize statistice pentru determinarea fidelitii acesteia. Evaluarea acestui
capitol se face printr-un proiect aplicativ cu pondere nsemnat n nota final.
Ultimul capitol furnizeaz reeta de construcie a unui raport psihologic de calitate,
prin indicarea structurii acestuia, a funciilor fiecrei componente, a modului de
rezovare corect, a celor mai frecvente erori i a modului de prevenire a acestora.
Evaluarea acestui capitol este de asemenea de ordin practic, constnd din ntocmirea
unui raport psihologic pe date fictive.
M3.2. Competene
Dup parcurgerea acestui modul, studenii vor fi capabili:
85

 s analizeze calitatea unui test psihometric n conjuncie cu dificultatea i


discriminabilitatea itemilor care l compun;
 s analizeze relaia dintre caracteristicile amintite i s precizeze n ce const
curba cacarcteristic a itemilor;
 s defineasc i s utilizeze adecvat conceptele de eantion, norm i etalonare;
 s etaloneze un test psihologic prin transformri liniare i de arie;
 s selecteze minimum cinci criterii prin care s analizeze i s clasifice un test
psihologic;
 s indice paii urmai n construcia unei scale psihometrice;
 s construiasc o scal psihologic utiliznd datele semnificative pentru fiecare
dintre cei cinci pai indicai n curs;
 s foloseasc programul SPSS pentru a determina fidelitatea scalei obinute, dar i
pentru alte prelucrri necesare;
 urmnd paii indicai n curs, s construiasc un raport psihologic de calitate.

Durata medie de parcurgere a fiecreia din cele patru uniti de nvare, incluznd
rezolvarea sarcinilor propuse i a temelor de evaluare, este de 4 la 8 ore, primul fiind
un curs simplu iar ultimele dou unitai fiind de mrime dubl.

86

_________________________________________________________________
Modulul M3. Unitatea de nvare 1
ANALIZA DE ITEMI
Cuprins
U1.1. Introducere ............................................................................................................. 87
U1.2. Competene ............................................................................................................ 89
U1.3. Dificultatea itemilor ............................................................................................... 90
U1.4. Discriminabilitatea itemilor ................................................................................... 96
U1.5. Raportul dintre dificultatea i discriminabilitatea itemilor ................................... 97
U1.6. Indici corelaionali ai discriminabilitii itemilor .................................................. 99
U1.7. Rezumatul metodelor corelaionale .. 101
U1.8. Curba caracteristic a itemului ............................................................................. 101
U1.9. Test de autoevaluare a cunotinelor .................................................................... 103

U1.1. Introducere
ntr-o manier similar cu cea din fizic, n care interesul iniial pentru lumea
macroscopic s-a recentrat ulterior pe cea microscopic, atomic i subatomic, n
evaluarea psihologic aceast schimbare se manifest prin mutarea centrului de
greutate al analizei de pe testul psihologic ca unitate de baz, pe analiza de itemi,
adic pe cele mai mici uniti care compun un test i care pot fi analizate
independent. Fundamentarea msurrii n psihologie se face prin psihometrie iar
unitatea fundamental a acesteia a devenit itemul. Evoluia i rafinarea domeniului
testelor este astzi tot mai dependent de analiza de itemi, cci pentru a-i cita pe
Laveault i Grgoire (2002) analiza de itemi seamn cu repetiia unei
orchestre. ntr-o orchestr instrumentele trebuie s cnte ntr-o manier
armonioas. (p. 199)
O definiie mai larg a itemilor este aceea c acetia reprezint ... orice tip de
enun din alctuirea unui test obiectiv care urmeaz a fi cotat ca o valoare.
(Biceanu, 2004, p. 191) Elementul fundamental al acestei definiii este partea care
stipuleaz c itemul va fi cotat ca o valoare cifric, permind deci determinri
cantitative ale unor caracteristici ale sale. Acest lucru nu este specific doar testelor
obiective, ci oricrui tip de test, inclusiv celor educaionale. Merit subliniat i
precizarea lui Stan (2002, p. 259): itemul este componenta informaional a unui
test ... care se ntlnete la chestionarul de personalitate, la testele de cunotine
colare, la testele verbale i neverbale de inteligen. Nu trebuie deci confundate
noiunile de sarcin a testului cu cea de item al testului, deosebirea fundamental
fiind aceea c itemul are o autonomie informaional care permite efectuarea unor
prelucrri statistice proprii asupra rezultatelor sale, ceea ce permite evidenierea
altor indicatori (idem). Individualitatea sau autonomia funcional a unui item
este acea caracteristic a sa de a contribui la scorul total al testului i de a produce
87

rezultate care pot fi prelucrate independent sau pot fi intercorelate cu rezultatul


final la test. n consecin, cea mai bun definiie a itemului este cea potrivit creia
acesta reprezint cea mai mic unitate informaional a unui test care poate fi
analizat independent.
La modul foarte general, analiza de itemi a unui test sau chestionar are scopul de a
evalua fidelitatea i validitatea fiecrei uniti componente, pentru a surprinde n
termeni cantitativi ct de efectiv contribuie fiecare item la fidelitatea i validitatea
de ansamblu a testului sau chestionarului respectiv (Reber, 1985, p. 378).
n sens foarte strict, analiza de itemi nu se va confunda cu analiza itemului,
deoarece scopurile lor sunt distincte. Analiza de itemi vizeaz evidenierea
dificultii itemilor, a puterii lor discriminative, a calitilor psihometrice de tipul
fidelitii i validitii, dar i al altor caracteristici ca simetria i boltirea (excesul),
omogenitatea i specificitatea sa ori raportul item-distractor. Analiza itemului se
refer mai ales la procedurile corecte de prelucrare informaional, la procedurile
semantice de formulare sau de modificare a coninutului itemilor, la limita de timp
necesar rezolvrii sale, la ambiguitatea formulrii.
Analiza de itemi este greu de desfurat pentru testele de vitez sau pentru cele n
care factorul rapiditate intervine masiv, cum ar fi testele de atenie, testele de
performan cu limit de timp. Acest fapt apare deoarece o condiie a analizei de
itemi presupune parcurgerea integral a tuturor itemilor testului, de ctre toi
subiecii, fr de care indicele de dificultate nu poate fi determinat. Dei aceast
condiie nu este formulat explicit la testele de putere, n care factorul timp
conteaz, problema se poate rezolva dndu-se testul spre rezolvare n limita de
timp prevzut, cnd itemii se rezolv n ordine, se marcheaz ultimul item pasat la
expirarea timpului, dup care testul se continu pn la rezolvarea sa n ntregime
de ctre toi subiecii.
Dificultatea major a analizei de itemi este aceea c exist o legtur evident ntre
caracteristicile itemilor unui test i caracteristicile eantioanelor populaionale care
sunt msurate cu ajutorul acestuia. Noua direcie n psihometria modern aspir la
degajarea parametrilor testului de caracteristicile eantioanelor cercetate, dar
aceasta complic destul de mult datele problemei. n cazul n care analiza se face
plecnd de la un singur eantion, acesta ar trebui s aib ntr-o ct mai mare
msur caracteristica de a fi reprezentativ, pentru a putea extrapola caracteristicile
degajate de pe acest eantion pe alte grupuri sau subgrupuri populaionale pe care
urmeaz a fi aplicat.
Analiza de itemi este o operaie de neevitat n construcia unui test sau chestionar
bun, fie pentru a genera uniti de msur valide ale unui singur construct
(unidimensionalitatea scalei de msur), fie pentru a selecta itemii care au cele mai
bune combinaii dintre dificultate i for de discriminare, pe de o parte, i
omogenitate i specificitate, pe de alt parte. Aceasta este raiunea pentru care
analiza de itemi pleac de la un set iniial mai mare de itemi (cu pn la o treime
88

sau chiar dublu), din care vor rmne cei care corespund cel mai bine exigenelor
de construcie a unui test modern. Numrul minim recomandat de itemi care vor
rmne n urma acestei selecii este de 10, sub care nici o scal nu mai
discrimineaz suficient de nuanat ntre diverse subcategorii, fiecare item avnd o
pondere mult prea mare n scorul final. De regul, scalele unidimensionale rein
ntre 20 i 30 de itemi pentru a mpca criteriul economiei cu cel al sensibilitii i
al forei de discriminare a testului. Cu toate acestea, multe scale actuale au un
numr de itemi mai mic de 10, consecina fiind o consisten intern mnai sczut.
Elementul tehnic necesar pentru analiza caracteristicilor de dificultate i
discriminabilitate ale itemilor este matricea lui Stern (Stern, 1912), care plaseaz
pe fiecare coloan itemii ce vor fi supui analizei i pe fiecare linie cte un subiect,
ultimele linii i coloane fiind necesare sumarizrii rezultatelor i calculrii unor
indici. Analiza de pe coloan se numete ipsatizare (rezultatele tuturor subiecilor
la un anumit item), iar cea de pe linie obiectivare (rezultatele unui singur subiect la
toi itemii). mprirea scorului total pentru toi subiecii la numrul acestora d o
medie pe subiect, iar mprirea scorului total pentru fiecare item la numrul de
subieci d o medie a reuitelor. n concluzie, se poate determina o medie pentru
fiecare subiect, o medie pentru fiecare item i o medie pentru testul total.

U1.2. Competene
Dup parcurgerea acestei uniti cursanii vor fi capabili:
s defineasc conceptul de dificultate a itemului;
s analizeze importana practic a cunoaterii dificultii itemilor;
s identifica factorii care pot afecta indicele de dificultate a unui test;
s stabileasc relaiile dintre dificultatea itemilor i forma distribuiilor pe care
acetia le produc (simetria i boltirea);
s analizeze dificultatea itemului corelativ cu variana itemului;
s determine ct de dificili trebuie s fie itemii unui test;
s determine dificultatea optim a unui test, corelativ cu numrul variantelor de
rspuns utilizate;
s defineasc concepul de discriminabilitate i s determine practic aceast
caracteristic a itemului prin metoda grupurilor de contrast a lui Findley;
s analizeze raporturile dintre dificultatea i discriminabilitatea itemilor;
s utilizeze adecvat schema lui Ebel pentru selectarea itemilor unui test, simultan
dup dificultatea i puterea lor de discriminare;
s cunoasc principalele metode corelaionale pentru determinarea forei
discriminative a itemilor;
s defineasc CCI i modul ei de utilizare n raport cu tipul testului i scopul
testrii.

89

Durata medie de parcurgere a acestei uniti de nvare, incluznd rezolvarea


sarcinilor propuse i a temelor de evaluare, este de 5 ore.

U1.3. Dificultatea itemilor


n cazul itemilor dihotomici adic scorai cu 0 i 1 dificultatea unui item este dat de
proporia celor care au reuit rezolvarea sa. Indicele de dificultate poate lua valori cuprinse ntre 0
i 1, n prima situaie itemul fiind foarte greu (majoritatea, sau chiar toi subiecii nu l-au putut
rezolva), n a doua situaie el fiind foarte uor (majoritatea sau aproape toi subiecii l-au rezolvat).
Dac itemul a fost cotat pe o scal de mai multe puncte (polihotomic), indicele de dificultate se
determin dup formula:
p=

N n
n care x este suma scorurilor obinute fiecare subiect, N este numrul de subieci iar n este scorul
maxim.

Exemplu
Pentru a avea o imagine mai clar asupra dificultii itemului, prin comparaie cu un
alt indicator care este media itemului, dm tabelul de mai jos, n care sunt calculate
mediile i dificultile a trei itemi, scorai pe o scal de 5, 3 i 1 punct.
Subiect
1
2
3
4
5
6
7
8
9
10
11
12
Media (x/N)
Dificultatea p
Complement q (1-p)
Corecie p'

Item (/5)
4
5
1
3
4
2
2
0
5
1
3
3
33/12 = 2,75
2,75/5 = 0,55
1-0,55 = 0,45
0,44

Item (/3)
3
2
0
1
2
1
3
3
2
1
1
2
21/12 = 1,75
1,75/3 = 0,58
1-0,58 = 0,42
0,37

Item (/1)
1
0
0
1
1
1
0
1
1
1
0
1
8/12 = 0,67
0,67/1 = 0,67
1-0,67 = 0,33
0,34

Total (/9)
8
7
1
5
7
4
5
4
8
3
4
6
62/12 = 5,17
5,17/9 = 0,57
1-0,65 = 0,43
-

Aa cum se observ din exemplul de mai sus, media itemului nu permite comparaia
direct a itemilor, deoarece numai pentru scala dihotomic cei doi indici - media i
procentul de reuit - coincid. Pentru a fi direct comparabile, rezultatele trebuie
aduse la acelai tip de scal, prin mprirea mediei la valoarea maxim a fiecrei
scale i n felul acestea ele vor indica dificultatea itemilor ca i cnd toi itemii ar fi
scorai dihotomic.
90

n exemplul analizat valoarea medie a dificultii celor trei itemi este de 0,57, dar se
observ c itemul cel mai dificil este pe scala de 5 puncte (p = 0,55), apoi cel pe scala de 3 puncte
(p = 0,58), cel mai uor fiind cel de pe scala dihotomic (p = 0,67). Dificultatea medie a itemilor
sumarizai pe ultima coloan este de 0,57, valoare care poate fi considerat media itemilor
ntregului test, care se poate obine mprind media de 5,17 la 5+3+1 = 9. Aa cum reiese din
acest exemplu, itemul care se apropie ca proporie p de rezolvare de valoarea 1 este unul extrem
de uor, deoarece majoritatea sau chiar toi subiecii l rezolv, pe cnd itemul al crui p care se
apropie de 0 este unul extrem de dificil, fiind rezolvat de extrem de puini subieci, poate de
niciunul. Dificultatea medie a unui item este de 0,50. De regul, itemii aflai spre valori p extreme
0 i 1 se recomand s fie nlocuii, ei aducnd puine servicii psihometrice testului, pentru a se
reine prioritar itemii de dificultate medie (p = 0,40 0,60). n scopul de a da o gradaie mai fin
scalei, limitele de acceptabilitate ale dificultii itemilor se plaseaz de fapt ntre 0,20 i 0,80.

S ne reamintim...
Cunoaterea dificultii itemilor este important din mai multe motive:
permite eliminarea itemilor mult prea uori ori mult prea dificili;
permite selecia i organizarea itemilor pe scale ierarhice de dificultate, de la
uor la greu, acestea dnd gradaii cu att mai fine cu ct numrul itemilor este
mai mare i diferenele de dificultate dintre itemii progresivi sunt mai mici, p
acoperind ns spectrul de la 0,20 la 0,80, dar depindu-l dac faptul se impune;
permite crearea unor seturi mari de itemi, cunoaterea caracteristicilor privitoare
la dificultate i la indicele de discriminare, ca i curba caracteristic a fiecrui
item. Acest fapt creeaz posibilitatea asamblrii automate a seturilor de itemi ce
vor fi administrai n examenul adaptat computerizat;
st la baza crerii formelor paralele ale unor teste.

Exemplu
Decizia de a elimina un item dintr-un set de itemi ai unuui test se poate lua mai
uor sau mai greu, deoarece acelai item care la o categorie superioar de vrst
este prea uor, devine dificil sau foarte dificil la categorii de vrste mai mici.
Astfel, itemul capt valene diagnostice noi funcie de particularitile
eantionului pe care se face analiza de itemi. Mai mult, un item foarte uor, chiar
dac nu are caliti psihometrice ridicate, d ncredere n sine subiectului pentru c
l ajut s intre n examen cu o reuit, ridicndu-i motivaia pentru testare, pe cnd
un item foarte dificil poate discrimina spre extrema excepionalitii. Aadar,
pstrarea sau respingerea itemilor se face n funcie de utilitatea care se va da
testului respectiv.
Problema dificultii itemilor este important n mod special pentru testele de randament
sau pentru cele educaionale (de cunotine i de achiziii). La testele de personalitate indicele de
dificultate va fi nlocuit cu un indice de proeminen, capabil s evidenieze msura n care un
91

item reliefeaz sau nu un anumit comportament rezultat din operaionalizarea unei trsturi de
personalitate.
Dintre factorii care pot afecta indicele de dificultate al unui test, Laveault i Grgoire
amintesc numrul de rspunsuri omise ca urmare a existenei unei limite de timp i probabilitatea
reuitei prin ans (hazard). n prima situaie, din cauza presiunilor legate de timp, un mare numr
de persoane nu au putut rezolva rezolva un item amplasat de regul spre zona final a testului
(atunci cnd itemii au fost asamblai ierarhic), indicele de dificultate ne mai reflectnd acurat
dificultatea itemului respectiv: dac ar fi existat mai mult timp, cu siguran c acesta ar fi fost
rezolvat de mai muli subieci. n acest caz indicele de dificultate msoar de fapt dou lucruri
distincte, dificultatea itemului n cauz i rapiditatea respondentului, caracteristici care nu se
regsesc ntotdeauna reunite la acelai subiect.
Atunci cnd dificultatea se calculeaz pentru itemi la care alegerea rspunsului se face
dintre mai multe posibiliti trebuie s se in cont de probabilitatea alegerii rspunsului bun prin
ans sau hazard, care este cu att mai mare cu ct numrul variantelor de rspuns este mai mic.
Astfel, la o variant corect din 8, rspunsul bun prin ans are probabilitatea de 12 procente, la 1
din 6 de 17 procente, la 1 din 4 de 25 de procente i la 1 din 2 de 50 de procente. n scopul de a
corija indicele de dificultate, atunci cnd distractorii au anse apropiate de a fi alei, Laveault i
Grgoire propun urmtoarea formul de corecie:
1 p
p' = p
M 1
n care p este indicele de dificultate iniial, p' este cel corijat, iar M este numrul variantelor de
rspuns pentru itemul n cauz. Introducnd n formula de mai sus datele pentru primul item din
exemplul de la figura 8.1, p' = 0,55 - [(1 0,55)/(5 -1)], deci p' = 0,44. Pentru al doilea item, cotat
pe o scal de 3 posibiliti, p' devine 0,37, iar pentru itemul dihotomic corecia ajunge la 0,34.
Comparnd indicile de dificultate iniial cu cel corijat se desprinde uor faptul c corecia este cu
att mai puternic cu ct numrul variantelor de rspuns este mai mic. Se degaj de asemenea
concluzia c atunci cnd avem de comparat mai muli itemi care, dei provin din acelai test sau
chestionar, sunt exprimai pe scale diferite ca numr de variante de rspuns, aducerea lor la
formatul unic al unei scale dihotomice este o condiie necesar, dar nu i suficient. Pentru a avea
o baz de comparaie comun trebuie s se opereze corecia prin formula de mai sus.

Cteva caracteristici importante ale itemului se determin plecnd de la constatarea c


exist o legtur strns ntre dificultatea sa i simetria distribuiei sale. Astfel, itemii a cror
dificultate este n jurul mediei (p = 0,50) sunt simetrici, iar cei cu dificulti extreme sunt
asimetrici, dar n mod difereniat: cei cu dificultate foarte mare (p < 0,10) au o asimetrie puternic
pozitiv, pe cnd cei cu dificultate foarte mic (p > 0,90) au o asimetrie puternic negativ. De
aceea este mai grav situaia unui item uor, euat, dect a unuia greu, euat, pe care oricum l
rezolv puini subieci. Rezult concluzia c itemii uori sunt discriminativi pentru subiecii slabi
sau pentru vrstele mici, pe cnd itemii dificili sunt discriminativi pentru subiecii foarte dotai
i/sau pentru vrstele mai mari, la testele care evideniaz o ierarhie sau care evideniaz o cretere
a performanei paralel cu vrsta.
92

De aici i rolurile diferite alocate itemilor n funcie de dificultatea lor, cei mai utili fiind
cei de dificultate medie, care difereniaz subiecii ntre ei indiferent de scorul obinut, fiind utili i
pentru discriminarea subiecilor buni, i a celor slabi.
Un concept important, derivat din cele artate mai sus, este acela de varian a itemului,
care informeaz n legtur cu gradul de mprtiere a performanei la acel item n jurul unei
medii, fiind n acelai timp i un indicator mai grosier al puterii de discriminare a itemului. Pentru
itemii cu mai multe valori de rspuns (polihotomici), variana se determina prin metoda clasic,
dar pentru o scal dihotomic exist o formul mult mai simpl pentru a face aceast determinare:
s2 = pq
n care s2 este variana itemului, p este indicele de dificultate iar q complementul su (1 - p).
Pentru a avea o reprezentare mai clar asupra acestei probleme prezentm mai jos o situaie
ipotetic, constnd din 11 itemi propui spre rezolvare la 10 subieci.
Tabel 1.1. Evoluia varianei itemilor n funcie de indicele de dificultate p.
Itemi
Subieci
1
2
3
4
5
6
7
8
9
10
1
1
1
1
1
1
1
1
1
1
1
2
1
1
1
1
1
1
1
1
1
0
3
1
1
1
1
1
1
1
1
0
0
4
1
1
1
1
1
1
1
0
0
0
5
1
1
1
1
1
1
0
0
0
0
6
1
1
1
1
1
0
0
0
0
0
7
1
1
1
1
0
0
0
0
0
0
8
1
1
1
0
0
0
0
0
0
0
9
1
1
0
0
0
0
0
0
0
0
10
1
0
0
0
0
0
0
0
0
0
p
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
q
pq
pq

11
0
0
0
0
0
0
0
0
0
0
0,0

0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,00 0,09 0,16 0,21 0,24 0,25 0,24 0,21 0,16 0,09 0,00
0,00 + 0,09 + 0,16 + 0,21 + 0,24 + 0,25 + 0,24 + 0,21 + 0,16 + 0,09 + 0,00 =
1,65

Total
10
9
8
7
6
5
4
3
2
1

x = 5,50
= 2,87
2 = 8,25
x = 55
x2 = 385

Din tabelul de mai sus se poate observa faptul c cea mai mare varian o au itemii din
zona central a indicelui de dificultate (pentru p = 0,5 s2 = 0,25). Pe msur ce ne deprtm
simetric spre zonele extreme, variana itemilor descrete de asemenea simetric, de la 0,21 la 0,18,
apoi la 0,09 i 0. Acesta este un argument matematic suplimentar puternic pentru a selecta n test
itemii din zona central a dificultii, pentru c acetia au fora discriminativ cea mai mare, att
spre zona performanelor slabe, ct i spre zona celor bune. Itemii cu varian mic au funcii
speciale, fiind destinai fie discriminrii performanelor slabe (p > 0,90), fie celor bune (p < 0,10),
dar chiar i n cadrul acestor categorii speciale fora de discriminare a acestora este mai sczut
din cauza varianei lor mai mici. Pe de alt parte, din tabelul de mai sus se observ c variana

93

total a testului (2,872 = 8,25) nu este egal cu suma varianelor fiecrui item n parte (pq =
1,65).3
Pornind de la datele de mai sus pot fi calculai doi indicatori care regsesc la nivel de item
caracteristicile de ansamblu ale formei distribuiei testului, i anume simetria (skewness) i excesul
sau boltirea (kurtosis) itemului, dup formulele:
Simetria = 3 =

q p
, n care 3 este simetria itemului
pq

Boltirea (excesul) = 4 =

Subieci
p
q
pq
3
4

1
6 , ecuaie a crei valoare normal este 3.
pq

Tabel 1.2. Indicatori ai simetriei i boltirii pentru tabelul precedent.


Itemi
1
2
3
4
5
6
7
8
9
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,00
-

0,09
-2,67
5,11

0,18
-1,50
0,25

0,21
-0,87
-1,23

0,24
-0,41
-1,83

0,25
0
-2

0,24
0,41
-1,83

0,21
0,87
-1,23

0,16
1,50
0,25

10
0,1
0,9

11
0,0
1,0

0,09
2,67
5,11

0,00
-

Total
n = 10

x = 5,50
= 2,87
x = 55
x2= 385

Tabelul 1.2 de mai sus evideniaz foarte clar faptul c valorile lui p cuprinse ntre 0,70 i
0,30 dau distribuii relativ simetrice i c asimetria este cu att mai accentuat cu ct ne deprtm
mai mult spre extreme: pentru valori ale lui p > 0,80 asimetria este puternic pozitiv iar pentru p <
0,20 ea este puternic negativ. Acesta poate fi i motivul pentru care Guthke, Btcher i Spring
(1991, p. 230) fixeaz limitele inferioar i superioar pentru selecia itemilor testelor de
randament la p = 0, 20, respectiv p = 0,80.
Rspunsul la ntrebarea Ct de dificili trebuie s fie itemii unui test? depinde, pe de o
parte, de utilizarea testului, pe de alt parte de tipurile de rspunsuri sau de lungimea scalei. Aa
cum s-a artat i anterior, un test n care itemii se scoreaz adevrat-fals (sau 0 1) are o
probabilitate de 50% ca rspunsul s se dea prin ans (aleator), iar cnd variantele de rspuns sunt
4, aceast probabilitate este de 25%. Deci probabilitatea p i , care descrie dificultatea unui item, se
plaseaz ntre 0 i 1 (nici un subiect, respectiv toi subiecii l rezolv). n practic, dificultatea
optim a unui item se calculeaz n doi timpi:
1. Se calculeaz jumtatea diferenei dintre 100% succes i ansa de performan. Pentru un test
cu 4 posibiliti de rspuns, probabilitatea unui rspuns corect prin ans (ntmplare) este de
25%, deci:
1,00 0,25 0,75
=
= 0,375 .
2
2
3

n mod explicit, variana unui test este egal cu suma varianelor fiecrui item, la care se adaug dublul sumei
valorilor fiecrei covariane posibile n ansamblul itemilor componeni. Vezi Stan, 2002, p. 216).
94

2. Se adaug la valoarea gsit probabilitatea rspunsului prin ans:


0,375 + 0,25 = 0,625 (dificultatea optim).

Exemple
 Test cu dou variante de rspuns:
 Test cu patru variante de rspuns:
 Test cu ase variante de rspuns:
 Test cu opt variante de rspuns:
 Test cu zece variante de rspuns:

ps = 0,50 + (1 - 0,50)/2 = 0,750


ps = 0,25 + (1 - 0,25)/2 = 0,625
ps = 0,167 + (1- 0,167)/2 = 0,584
ps = 0,125 + (1 0,125)/2 = 0,563
ps = 0,10 + (1 -0,10)/2 = 0,550.

S ne reamintim...
Alegerea dificultii optime a itemilor unui test trebuie s rezolve aceast problem
complicat: cu ct itemii au mai puine variante de rspuns, cu att mai mare este
probabilitatea de a nimeri prin ans rspunsul corect, ceea ce oblig la creterea
dificultii optime la un nivel foarte ridicat, de 0,75. Dificultatea optim diminu
progresiv cu mrirea numrului de variante de rspuns spre 0,50, dar cu ct acestea
sunt mai multe, timpul de analiz pentru fiecare item crete (sunt mai multe
variante de rspuns care trebuie luate n considerare), ceea ce oblig la reducerea
numrului de itemi. Aceast reducere afecteaz simultan fidelitatea i validitatea
testului n ansamblul su, ajungndu-se astfel la alternative: variante mai multe de
rspuns versus mai muli itemi. Cel mai adesea dilema se rezolv alegnd ntre 4 i
8 variante de rspuns, aceasta fiind zona de echilibru ntre cele dou extreme.
Rezumat relativ la dificultatea itemilor
Pentru majoritatea testelor nu este deloc indicat s avem itemi de dificultate egal
(eventual cu dificultatea optim), pentru c se urmrete s avem itemi pentru o
varietate a nivelurilor de dificultate, astfel nct testul s aib o bun putere
discriminativ n ansamblul su. Pentru cele mai multe dintre teste itemii au o
dificultate ce acoper spectrul de la 0,20 la 0,80, pentru a maximiza astfel
diferenele dintre subieci.
n funcie de scopul testrii, pot fi concentrai itemi preponderent dificili (sub 0,20),
ca n cazul seleciei unor candidai pentru o facultate, post sau meserie foarte
pretenioas, sau itemi foarte uori (cazul seleciei indulgente).
Pe de alt parte, cunoaterea dificultii itemilor este fundamental n aranjarea
acestora n test ntr-o ordine ierarhic. Itemii foarte uori, de la nceputul testului,
ajut persoana s neleag ce se cere de la ea i, chiar dac acetia nu au valoare
psihometric probat, ei ajut la ridicarea moralului, inspirnd ncrederea n
resursele proprii. Itemii foarte dificili sunt destinai extremei drepte a scalei, deci
celor de vrste mari sau supradotailor, avnd utilitate pentru un numr mai mic de
cazuri, ce apar doar pe eantioane extinse ca volum.

95

U.1.4. Discriminabilitatea itemilor


Dei fora de discriminare a unui item poate fi evaluat grosier i dup variana sa, ntr-un
mod mult mai specific discriminarea itemului leag destinul su cu destinul de ansamblu al
testului din care el face parte. Astfel, se consider c un item este discriminativ atunci cnd exist
un bun paralelism ntre scorurile la test n ansamblul su i scorul la itemul n cauz. Aceasta
nseamn c scorurile mari la test se asociaz cu o rat de reuit ridicat pentru itemul respectiv,
dup cum scorurile sczute la test se asociaz cu un nivel sczut de reuit la acest item.
Exist mai multe metode de a studia dac destinul itemului este solidar cu cel al testului n
ansamblul su. Indicele de discriminare, pus n circulaie de W.G. Findley n 1956, se obine prin
metoda grupurilor de contrast sau a grupurilor extreme. Acesta este probabil i motivul pentru care
metoda s-a bucurat de o mare popularitate printre psihometricieni, dar este i motivul pentru care
ea este astzi privit critic, cci uurina analizei se sprijin pe faptul c las pe dinafar aproape
jumtate dintre subieci (46%). Metoda propune pentru comparaia itemilor unui test dou grupuri
aflate la extremele seriei de variaie a scorurilor, 27%4 din cei care au dat rspunsurile cele mai
bune la test fiind comparai cu ceilali 27% care au dat cele mai slabe rspunsuri, pentru a
determina pentru fiecare item n parte dac reuita se asociaz cu apartenena la grupul superior.
Dac vom nota cu ps indicele de dificultate pentru grupul superior i cu pi indicele de dificultate
pentru grupul inferior, formula indicelui de discriminare va fi: D = ps pi.
Exemplu Concret, indicele de discriminare se calculeaz astfel:
1. n funcie de scorurile obinute la test se determin grupul superior, grupul
inferior i cel neutru;
2. se caut apoi proporia n care subiecii din grupul superior i din cel inferior au
rspuns corect la fiecare item;
3. pentru fiecare item se scade proporia rspunsurilor corecte ale grupului slab din
proporia rspunsurilor corecte ale grupului bun, ceea ce d indicele de
discriminabilitate, a crui valoare poate varia ntre -1 i +1. Valoarea 0 semnific
egalitatea rezolvrii de ctre cele dou grupuri i deci absena discriminrii;
valorile pozitive indic preponderena rezolvrii itemului de ctre grupul superior,
iar cele negative de ctre grupul inferior i de aceea itemul respectiv trebuie
eliminat fr discuie, cci n acest caz destinul su nu este solidar cu al testului din
care el face parte.
S ne reamintim...
Se apreciaz c valorile lui D ntre:
0,00 - 0,10
indic absena discriminrii;
0,11 - 0,19
valoare de limit a discriminrii;
0,20 - 0,29
valoare sczut a discriminrii;
0,30 - 0,39
valoare bun a discriminrii;
0,40
item cu o foarte bun putere discriminativ.
4

Proporia respectiv a fost propus de Kelley n 1939.


96

Metoda analizat presupune cel puin 30 de subieci n grup, pentru a nu avea mai puin de
8 subieci n grupurile de contrast. Utilitatea i popularitatea indicelui D provine i din uurina cu
care el poate fi determinat manual, nelund n calcul dect ceva mai mult de jumtate dintre
subieci. Mai mult, n pofida acestui fapt, el d rezultate ntru totul comparabile cu metode de
lucru mai rafinate, cum ar fi cele corelaionale. De aceea metoda grupurilor de contrast poate fi
folosit mai ales pentru testele educaionale, cu condiia ca numrul itemilor i al subiecilor s fie
suficient de mare (peste 30) cci, n caz contrar, valoarea acestui indice este artificial umflat,
fiecare item acoperind o proporie prea mare din variana total. n testele educaionale indicele D
poate servi nu numai la selecia celor mai discriminativi itemi, pentru a construi o scal puternic,
ci i ca metod de analiz a distractorilor i a erorilor, pentru care indicele de discriminare trebuie
s aib o valoare negativ. Acesta poate fi informativ i n legtur cu faptul dac cheia
rspunsurilor este sau nu este eronat sau dac rspunsul ales de grupul superior nu este realmente
acceptabil.

U1.5. Raportul dintre dificultatea i discriminabilitatea itemului


Determinarea indicilor de dificultate i de discriminabilitate a itemului nu creeaz
probleme tehnice insurmontabile, deoarece acestea au un algoritm de lucru foarte clar. Exceptnd
problema eantionrii, aceti indici sunt dependeni n mare msur de populaiile din care au fost
obinui. Problema cu adevrat important i destul de complex este selecia itemilor celor mai
buni dintr-un test innd cont corelativ i simultan de ambele condiii (dificultate i
discriminabilitate). Aceasta deoarece att indicele D, ct i valorile corelaionale ce vor fi
prezentate ulterior, sunt influenate de dificultatea itemului, care devine astfel condiia bazal
pentru selecie, fiind de aceea pus pe abscis.
Situaia paradoxal a constructorului unui test de randament sau de cunotine este aceea c
el trebuie s opereze n zona de aciune a dou condiii care par reciproc exclusive: pe de o parte
selecia de itemi ce difereniaz bine ntre subieci (i aceasta presupune ca dificultatea lor s fie
centrat pe 0,50), iar pe de alt parte el nu ar renuna nici la itemii mai uori (deoarece favorizeaz
intrarea n prob i discrimineaz n zona performanelor slabe) i nici la cei mai grei
(discrimineaz supradotarea i excelena). n aceste situaii speciale itemii prea uori sau prea grei
trebuie judecai cu atenie din perspectiva rolului jucat de ei n raport cu scopul evalurii. Analiza
de itemi poate s ajute la punerea de ntrebri pertinente n legtur cu rolul jucat de fiecare item,
ca i asupra mijloacelor celor mai bune de a ameliora calitatea unui instrument de msur.,
apreciaz Laveault i Grgoire (2002, p. 216).
Metoda mai simpl a lui Findley a fost operaionalizat de Ebel, care a oferit o modalitate
practic de interpretare simultan a dificultii i forei de discriminare a itemilor, metod ce a
devenit extrem de popular datorit utilizrii sale extensive i ndelungate. Chiar dac las aproape
jumtate din cazuri n afara analizei, utilizarea ei actual este nc foarte mare, mai ales n
domeniul testelor educaionale. n favoarea sa pledeaz nu numai uurina aplicrii, ci i elegana
soluiilor difereniate pentru diversele combinaii ale dificultii i discriminabilitii itemilor.
Pentru a exemplifica toate acestea, furnizm mai jos un exemplu ipotetic care ne va ajuta s
nelegem modul n care opereaz selecia celor mai buni itemi dintr-o scal.
97

Tabel 1.3. Analiza capacitii de discriminare pentru 10 itemi ipotetici dup metoda lui Findley
Item
1
2
3
4
5
6
7
8
9
10
11
...
29
30
31
32
33
34
35
36
37
38
39

p
ps
pi
=(ps- pi)

1
1
1
1
0
1
1
1
1
1
1
0

2
1
1
0
0
1
1
1
1
0
0
0

3
1
1
1
0
1
1
1
1
0
1
1

4
0
1
1
0
0
1
0
0
1
1
1

5
1
0
1
1
1
1
1
1
1
1
1

6
0
0
0
0
0
1
0
0
0
0
0

7
1
1
1
1
1
1
1
0
1
1
1

8
0
1
0
0
0
1
0
0
0
1
0

9
1
0
1
1
1
0
1
1
1
1
1

10
0
0
1
1
1
1
1
0
1
0
0

1
0
0
1
0
1
0
0
1
1
1
15

1
0
0
0
1
1
1
0
0
0
1
11

1
0
0
1
0
0
1
0
1
0
1
14

1
1
0
1
1
1
0
0
1
0
1
12

0
1
0
0
1
0
0
0
0
0
1
12

1
1
1
1
1
1
1
1
1
1
1
12

0
1
1
1
0
1
1
1
1
1
1
19

0
1
1
0
1
0
1
1
1
0
1
10

0
1
0
0
0
0
0
1
0
0
0
11

0
1
0
1
0
1
0
0
1
0
0
10

0,8
0,8
0,5
0,3

0,1
0,5
0,5
0

0,2
0,8
0,5
0,3

0,4
0,5
0,6
0,1

0,5
0,9
0,3
0,6

0,5
0,1
1,0
-0,9

0,9
0,9
0,8
0,1

0,3
0,3
0,6
-0,3

0,4
0,8
0,1
0,7

0,6
0,5
0,4
0,1

Comentarii la exemplul analizat


 itemii 9 i 5 trebuie reinui, avnd caracteristici ideale: dificultate medie i
capacitate de discriminare foarte puternic;
 itemul 3 trebuie de asemenea reinut: el este la limit ca dificultate, dar
discrimineaz destul de bine;
 i itemul 1 trebuie reinut: dei este foarte uor, el se ncadreaz n zona p = 0,20
0,80 i discrimineaz bine;
 itemii 4, 10 i 7 sunt de revizuit: 4 i 10 au dificultate optim, dar din pcate
discrimineaz slab, iar itemul 7 este foarte uor i discrimineaz slab;
 itemul 2 este de eliminat, odat pentru c este extrem de dificil i n al doilea rnd
pentru c discrimineaz slab;
98

 itemul 8 va fi eliminat: dei de dificultate optim, el discrimineaz negativ;


 la itemul 6 eliminarea este cel mai imperios necesar: dei foarte bun ca
dificultate, are o foarte mare capacitate de discriminare, dar negativ, fiind cel mai
puternic n contratimp cu scorul general la test i deci cel mai contraproductiv. El
ar putea fi totui meninut doar prin scorare invers.
Tabel 1.4. Interpretarea capacitii de discriminare pentru cei 10 itemi anteriori dup schema lui Ebel

= capacitatea discriminativ a itemilor

p=dificultatea itemilor
Grup puternic
Grup slab
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-0,1
-0,2
-0,3
-0,4
-0,5
-0,6
-0,7
-0,8
-0,9
-1,0

Acceptarea
itemilor

9
5

1
4

0,1

0,2

Decizia

0,3

0,4

10
0,5

0,6

Revizia
itemilor

7
0,7

0,8

0,9

1,00

8
Respingerea
itemilor

U1.6. Indici corelaionali ai discriminrii itemilor


Ca i indicele de discriminare D al lui Findley, metodele corelaionale pot surprinde foarte
bine paralelismul dintre destinul itemului i cel al scorului total la test, n plus ele avnd i
avantajul de a face s participe la analiz toate datele, i nu doar o parte dintre ele. Mai mult,
pentru fiecare coeficient de corelaie se poate determina semnificaia sa statistic, ceea ce d mai
mult precizie i rigoare interpretrii sale. Dac procedurile computerizate nu creeaz nici o
problem pentru determinarea lui r al lui Pearson, rs (rho) al lui Spearman sau tau-b al lui Kendall,
alte proceduri corelaionale sunt mai laborioase i mai pretenioase. Acestea se refer la corelaiile
n care o variabil sau ambele sunt msurate pe scale non-numerice, discontinue (dihotomice sau
polihotomice). n acest caz nu numai procedura de calcul este mai complicat, dar chiar selecia

99

celei mai potrivite metode corelaionale trebuie fcut cu grij. Laveault i Grgoire (op. cit., p.
210) fac cteva recomandri sintetizate n tabelul de mai jos:
Scala de msur
Dihotomic
Dihotomizat
Continu

Dihotomic
(Fi)

Dihotomizat
bis
rtetrahoric

Continu
rpbis
rbis
r, rs (rho)

S ne reamintim...
O variabil este dihotomic prin natura ei dac nu are dect dou stri posibile,
cum ar fi masculin-feminin, ca apartenen de gen;
variabila este dihotomizat atunci cnd ea este adus la doar dou valori, dei
iniial mai multe variante erau posibile, cum ar fi cstorit-necstorit, ruralurban, introvert-extravert, admis-respins etc., dei pentru fiecare dintre acestea
exist i alte variante intermediare: pentru starea civil mai exist i variantele
separat, divorat sau vduv, pentru mediu i varianta preurban, pentru
extraversie/introversie i varianta ambivert etc.;
variabilele continue sunt cele de pe scalele de interval sau de raport, care pot
lua n principiu orice valoare pe toat ntinderea amplitudinii variabilei.
Pentru c metodele corelaionale constituie un capitol distinct al statisticii, redm
condensat trei dintre coeficienii de corelaie prezeni n diagrama de mai sus.
(1)

rpbis =

xp x
sx

pi
qi

unde x p este media variabilei x (scorul total la test) a subiecilor ce au reuit la itemul i;

x este media variabilei x (scorul total la test) a tuturor subiecilor;


sx este abaterea standard a scorului la test;

pi este proporia subiecilor care au rspuns corect la itemul i;


qi este proporia subiecilor care au rspuns greit la itemul i.

(2)

rpbis


xs xi p
=
Sx
q


unde xs i xi reprezint mediile grupului superior i inferior;

Sx este abaterea standard a ntregului grup;


p i q reprezint proporia reuitelor la item i complementul su.

(3)


xs xi p
rbis =
sx
q

unde xs este media grupului superior iar xi media ntregului grup;

sx este abaterea standard a ntregului grup;


100

y este este ordonata lui p transformat n note z; de fapt raportul

p
este furnizat de tabele
q

speciale.
pq
rpbis
Y
aceasta fiind ecuaia de transformare ntre cei doi coeficieni de corelaie, biserial i punct-biserial.

(4)

rbis =

U1.7. Rezumatul metodelor corelaionale


Aceast mare diversitate de mijloace corelaionale, adugate clasicului indice de
discriminare al lui Findley, ar putea deconcerta. Din fericire exist o foarte bun
suprapunere i concordan ntre rezultatele pe care ele le furnizeaz, exceptnd
valorile extreme ale dificultii itemilor, 0 i 1, unde apar cele mai mari diferene i
discordane. Pentru aceasta furnizm sfatul avizat al experilor Crocker i Algina5:
 toate metodele, corelaionale sau noncorelaionale, au o bun concordan n
zona medie a indicilor de dificultate; dei se poate utiliza foarte bine indicele D,
o metod corelaional are avantajul suplimentar al testelor de semnificaie care
arat mai precis pragul de ncredere al relaiei descoperite;
 cnd indicii de dificultate se situeaz spre extremele 0 i 1 trebuie folosit
corelaia biserial;
 acelai lucru este valabil i atunci cnd se suspecteaz c eantioanele pe care
va fi aplicat testul difer semnificativ de cel pe care acesta a fost aplicat iniial;
 cnd se ateapt acelai nivel al aptitudinii la viitorul eantion ca la cel iniial
este indicat corelaia punct-biserial;
 cnd itemul i variabila criteriu sunt dihotomizate, sau cotate n aceast
manier, trebuie utilizat coeficientul de corelaie tetrahoric, cu att mai mult cu
ct itemul sau criteriul iau valori mai extreme.

U1.8. Curba caracteristic a itemului (CCI)


Dac ntr-un spaiu cartezian pe abscis se pun scorurile progresiv cresctoare la test iar pe
ordonat probabilitatea la care examinaii rezolv fiecare item, se obine o reprezentare grafic ce
d o imagine intuitiv uor de interpretat n legtur cu calitile discriminative ale itemului
respectiv. Aceast reprezentare materializeaz mai puin sintetic, dar mai util, raportul dintre
performana la test i performana la item pentru c indic i zona pe care relaia este bun,
staionar sau rea. Aa cum o definete Gregory (1996, p. 142) CCI .. este de fapt o idealizare
matematic a relaiei dintre probabilitatea unui rspuns corect i msura n care trstura msurat
este deinut de respondent.

Apud Laveault i Grgoire, op. cit., p. 215.


101

Exemplu
Exist o diversitate de modele ale curbei caracteristice a itemului care se sprijin pe
diferite funcii matematice, cum ar fi teoria danezului George Rasch (1966),
considerat a fi oferit cel mai simplu i elegant model pentru CCI. Acesta se
sprijin pe dou presupuneri:
 itemii testului sunt unidimensionali, ei msurnd o singur trstur comun;
 itemii testului variaz uniform, pe un continuu al nivelului de dificultate.
Atunci cnd abilitatea de a rezolva un item este distribuit gaussian, CCI are binecunoscuta
form de S a ogivei lui Galton. Dei aceasta este preferat de majoritatea psihometricienilor,
pentru c permite deducii matematice despre trstura n cauz, selecia itemilor dup curbele lor
caracteristice depinde n mare msur de scopul testrii. De exemplu, atunci cnd se dorete
construirea unui test de selecie care s evidenieze clar un punct de tietur a scorurilor (cutoff)
sunt de preferat curbele cu prag abrupt (vezi ilustrrile de mai jos). Alteori scopul este urmrirea
validitii difereniale, caz n care itemii ce dau curbe net diferite dup gen, etnie sau cultur sunt
cei care vor fi eliminai sau revizuii, pentru a avea teste nesexiste ori teste corecte cultural.

Exemplu
Cel care i-a pus problema utilitii teoriei rspunsului la itemi, care st conceptual
n spatele curbei caracteristice a itemilor, a fost Nunnally6 (1978). El a fost cel care
i-a exprimat mirarea n legtur cu faptul c aceast teorie nu a fost adoptat mai
de timpuriu n serviciul construciei testelor psihologice, dar tot el este acela care a
dat rspunsul la aceast ntrebare, atunci cnd a descoperit c presupunerea
unidimensionalitii nu se verific pentru cele mai multe dintre testele analizate.
Conform lui Gregory, marea utilitate a curbei caracteristice a itemilor vine dinspre viitor,
adic dinspre testarea adaptat computerizat, n care fiecare subiect rspunde la un set
individualizat i unic de itemi, scorat pe o scal uniform i unidimensional. Fr CCI, acest tip
de examen adaptat computerizat nici nu ar putea fi imaginat. Dat fiind legtura dintre teoria
rspunsului la itemi i curba caracteristic a itemilor, rezervm acestei probleme un capitol
special. Mai jos oferim imaginea grafic a curbelor mai multor tipuri de itemi, cu meniunea c pe
abscis sunt trecute trei niveluri ale dificultii uor, mediu i greu , iar pe vertical de
asemenea trei niveluri ale probabilitii rspunsului la item mic, mijlociu i mare (sursa:
Gregory, 1996, p. 143).

Nunnally, J. C. (1978). Psychometric Theory (2nd ed.). New York: McGaw Hill.
102

U1.9. Test de evaluare a cunotinelor


1. Definii noiunea de item al unui test.
2. Indicai n ce const dificultatea analizei de itemi la testele de vitez i cum
poate ea fi surmontat practic.
3. Definii modul n care se lucreaz cu matricea lui Stern pentru a face analiza
dificultii itemilor.
4. Analizai motivele pentru care dificultatea itemilor este important n
construcia unui test psihologic.
5. Precizai care sunt factorii care pot afecta dificultatea unui test.
6. Definii conceptual de varian a itemului i modul su de utilizare n analiza
dificultii itemilor unui test.
7. Precizai care este dificultatea optim a unui test cu ase variante de rspuns.
8. Definii conceptual de indice de discriminare a itemului indicnd modul su de
determinare prin metoda grupurilor de contrast propus de Findley.
9. Artai care este utilizarea indicelui D n construcia unui test educaional.
10. Analizai care este raportul dintre dificultatea i discriminabilitatea itemilor
unui test i cum poate fi el analizat i utilizat practic.
11. Analizai situaiile n care metodele corelaionale sunt preferabile determinrii
lui D.
12. Precizai semnificaia termenului de curb caracteristic a itemului (CCI) i
modul su concret de utilizare n construcia unui test psihologic.

103

__________________________________________________________________
Modulul M3. Unitatea de nvare 2
NORMELE I ETALONAREA TESTELOR
CLASIFICAREA TESTELOR
__________________________________________________________________
Cuprins
U2.1. Introducere ........................................................................................................... 104
U2.2. Competene .......................................................................................................... 104
U2.3. Eantionul normativ i normele testelor ............................................................... 105
U2.4. Etalonarea testelor ................................................................................................ 108
U2.4.1. Transformri de arie (neliniare) ............................................................. 108
U2.4.2. Transformrile liniare ............................................................................. 110
U2.4.3. Normalizarea scorurilor standard .......................................................... 111
U2.4.4. Stanine, stens i scale C .......................................................................... 113
U2.5. Exemple practice de construire a etaloanelor ....................................................... 114
U2.6. Clasificarea testelor .............................................................................................. 117
U2.6.1. Dup modul de administrare ................................................................... 117
U2.6.2. Dup timpul de execuie .......................................................................... 118
U2.6.3. Dup modul de executare a sarcinii de ctre subiect ............................. 119
U2.6.4. Dup modul de procesare implicat ......................................................... 119
U2.6.5. Dup constana coninutului de la o aplicare la alta .............................. 122
U2.6.6. Dup modul de cotare ............................................................................. 122
U2.6.7. Dup modul de interpretarea a scorurilor .............................................. 123
U2.6.8. Dup numrul variabilelor implicate ..................................................... 123
U2.6.9. Dup procesul psihic implicat ................................................................. 123
U2.7. Rezumat ................................................................................................................ 124
U2.8. Test de autoevaluare a cunotinelor .................................................................... 125

U2.1. Introducere
Nici un test nu are norme pentru ntreaga specia uman! afirm Anne Anastasi
(1976, p. 90). Aceasta nseamn c rezultatele la orice test au limite de valabilitate,
generate de populaia pe care el a fost aplicat i n raport cu care s-a obinut
sistemul de referin reprezentat de normele sale (baremele sau etaloanele).
U2.2. Competene
Dup parcurgerea acestei uniti cursanii vor fi capabili:
s defineasc noiunea de eantion i s indice principalele caracteristici ale
eantionului normativ;
s indice importana reprezentativitii, volumului eantionului i a raportului
104

omogenitate-eterogenitate n construirea normelor i etalonarea testelor;


s opereze distincia etalon naional, etalon zonal, etalon local i etaloane pentru
grupuri speciale;
s defineasc n ce const activitatea de etalonare;
s defineasc specificul principalelor tipuri de etalonare prin transformri de arie
(neliniare), transformri liniare i prin normalizarea curbelor de distribuie;
plecnd de la o distribuie dat, s genereze un etalon prin transformri de arie
sau prin transformri liniare;
s opereze distincia cote standard i cote standardizate, preciznd care este
utilizarea practic a fiecrei categorii;
s furnizeze i s opereze cu trei criterii valide de clasificare a testelor
psihometrice;
s utilizeze cel puin trei criterii conjugate pentru a identifica i caracteriza un
test psihometric.

Durata medie de parcurgere a acestei uniti de nvare duble, incluznd


rezolvarea sarcinilor propuse i a temelor de evaluare, este de 8 ore.

U2.3. Eantionul normativ i normele testelor


S ne reamintim
n psihodiagnoz noiunea de eantion are o tripl accepiune:
se refer la elementele de comportament msurate de un test (definit de
Anastasi ca msur a unui eantion de comportament);
are n vedere poriuni din testul deja construit (itemul poate fi considerat cea
mai mic unitate sau eantion dintr-un test);
are un neles statistic, pentru c se refer la populaia pe care s-a aplicat testul
n forma lui final, n raport cu care se construiete etalonul (eantion
normativ).

Aceasta din urm este accepiunea pe care o vom da n aceast unitate de curs conceptului
de eantion, necesar din dou motive: aprecierea performanelor unui subiect nu se poate face
dect prin comparaie cu un grup de referin; cum aceast comparaie nu se poate face cu ntreaga
populaie, din ea se extrage un eantion reprezentativ, pe care se aplic i se etaloneaz testul. De
aici rezult c normele unui test nu au un neles absolut, universal sau permanent (Anastasi, 1974)
i c pentru a fi relevante ele trebuie raportate la eantionul construit pe populaia de referin,
...care confer valabilitate social-istoric testului sau bateriei de teste (chiopu, 1976, p. 151).
Aceasta este i raiunea pentru care un test trebuie revizuit periodic. Deoarece tabelul de norme
este relativ la populaia avut n vedere, ... nu se pot utiliza etaloane ntocmite n alte ri i n alte
condiii, tabelul de norme are o valoare local, cel mult naional (Radu, 1993, p. 381).
105

Cea mai important caracteristic a unui eantion este reprezentativitatea sa, care
presupune faptul c el va fi construit innd cont de toi factorii de variabilitate importani ce pot
produce diferene n scorurile testului: vrsta, apartenena de gen, mediul (ruralurban), la care se
pot aduga nivelul de instrucie, pregtirea profesional, statutul socio-economic i cultural,
apartenena etnic, distribuia geografic i orice alt caracteristic sau atribut pe care populaia de
ansamblu o are i care ar putea s genereze scoruri difereniate. Eantionarea este un capitol
important al Statisticii, care i-a pus la punct procedee bine definite de construcie a eantionului
pentru a crete reprezentativitatea acestuia: metoda cotelor, procedeul loteriei, al pasului, metoda
eantionrii stratificate, multifazice, a eantionului fix sau metoda panel.
Raportul omogenitate-eterogenitate este o alt nsuite imporatnt a eantionului, cci n
funcie de numrul i de ponderea atributelor sale, pot fi construite sub-eantioane populaionale
caracteristice. Acolo unde pot fi puse n eviden diferene legate de vrst, gen, mediu sau nivel
de instruire, se vor construi etaloane pentru categoriile amintite, n cadrul fiecrei categorii
celelalte elemente importante ce caracterizeaz populaia trebuind s se regseasc n proporii
egale sau apropiate.
n cazul n care se intenioneaz ca testul s aib o aplicabilitate foarte larg, naional,
atunci eantionul normativ va fi suficient de mare i de cuprinztor pentru a produce valori stabile
i reprezentative. Pentru aceasta, populaia va trebui definit n avans n termenii obiectivelor
testului, dup care, prin proceduri statistice specifice, va fi asamblat eantionul pe care va fi
aplicat testul. n rile n care exist populaii de mai multe tipuri (adic eterogenitate etnic) sau
diferene foarte mari n standardele de via sau de cultur, este de preferat s se aib n vedere
elabortarea de etaloane regionale sau locale, etaloanele naionale fiind indicate aici doar pentru
studiul opiniilor, atitudinilor sau al inteniilor de vot. Studierea erorii de eantionare (care trebuie
s fie ct mai mic) i a distribuiei scorurilor obinute (care trebuie s fie unimodal) sunt repere
statistice importante n construirea eantionului.
Mrimea (volumul) eantionului este foarte important: dac eantionul este prea mare
genereaz o cantitate de munc greu de acoperit, dar dac este prea mic el poate s lase pe dinafar
subgrupuri populaionale cu caracteristici importante, ceea ce va diminua reprezentativitatea sa.
Volumul eantionului genereaz exigena ca din fiecare clas sau categorie identificat s se
extrag cel puin 300 de persoane (Kline, 1993). Aceasta nseamn c, genernd un numr ridicat
de clase diferite, populaiile largi i eterogene se vor regsi n eantioane normative voluminoase,
abordabile cu costuri de resurse umane i materiale ridicate. n aceast situaie este preferabil
utilizarea de etaloane pentru populaii mai mici i mai omogene, pentru care se vor obine norme
zonale sau locale. Atunci cnd se pun n eviden diferene nsemnate ale mediilor i abaterilor
standard pentru diferite subgrupuri populaionale ale eantionului normativ este indicat
construirea unor etaloane difereniate, ce vor permite raportarea mai nuanat a fiecrui caz nou la
un sistem de referin mai adecvat. Aceste subgrupuri pot fi formate dup vrst, apartenen de
gen, clas colar, tip de curriculum, regiune geografic, mediu rural sau urban, nivel de instrucie,
nivel economic etc.
Normele locale, dezvoltate cel mai adesea de nii utilizatorii de teste, sunt avantajoase
pentru c definesc mult mai strict subgrupurile menionate anterior. Mai mult, pe msur ce testul
106

este utilizat, el furnizeaz continuu date pentru subgrupuri tot mai bine definite, de unde i
posibilitatea de a construi etaloane tot mai difereniate. La limit, se poate face spre exemplu
predicia rezultatelor la test ale unui elev n raport cu propriile sale rezultate anterioare. Msura
progresului unui subiect n timp, predicia succesului n achiziia colar sau a performanelor ntrun serviciu sau munc se bazeaz mult mai mult pe normele locale, dect pe cele larg
reprezentative naional. Baremele naionale sunt ns extrem de necesare pentru c ofer cel mai
larg i mai stabil sistem de referin, necesar pentru a valida, de exemplu, examenele naionale.
Deoarece costurile de obinere a unor astfel de etaloane sunt foarte ridicate i deoarece
practicianul are de rezolvat probleme de mai mic anvergur i mult mai specifice, etalonul local
este cel mai accesibil i mai util pentru c reproduce cel mai bine i cu cele mai mici costuri
caracteristicile populaiei testate. Etaloanele pentru grupuri speciale tezaurizeaz i valorific n
timp propria munc a psihologului atunci cnd acesta se ocup de categorii ocupaionale sau
populaionale speciale: electricieni, transportatori, pacieni cu sindrom Down, autiti etc.

S ne reamintim
Principalele caracteristicei ale unui eantion sunt legate de reprezentativitatea i
de volumul su, dar i de raportul omogenitate-eterogenitate.
Asamblarea unui eantion este o operaie laborioas, care revine de regul
constructorului testului.
Aceast operaie presupune luarea n considerare a principalelor surse de variaie
identificate la nivelul populaiei int.
Cele mai importante surse de variaie considerate sunt vrsta, apartenena de gen,
mediul sau zona geografic, la care se pot aduga nivelul de instrucie, profesia,
studiile parentale, nivelul socio-economic etc.
Utilizatorii testelor pot crea ei nii etaloane sau bareme pentru categorii
populaionale mai restrictiv definite, operaie prin care prediciile bazate pe un
test sau pe o baterie de teste devin mai acurate.
Aceste etaloane speciale capitalizeaz munca i experiena de durat a
practicianului.
Etaloanele i baremele trebuie actualizate (upgradate) pe msur ce
caracteristicile populaiei int se schimb.
Deorece nu exist bareme sau norme internaionale sau universale, pot fi
identificate doar etaloane naionale, zonale sau locale, la care se adaug i
categoria etaloanelor pentru grupuri speciale.
Activitatea de etalonare este una prin care cotele brute ale unei distribuii sunt
transformate n cote standard.
Aceast transformare poate fi una liniar sau una de arie.

107

U2.4. Etalonarea testelor


Pe drept cuvnt novicele i poate pune ntrebarea de ce nu sunt folosite scorurile brute ca
atare pentru a face comparaii ntre subieci, pentru a stabili categorii sau pentru a-i ierarhiza pe
acetia n funcie de performanele obinute. Cu alte cuvinte, de ce trebuie s apelm la cotele
(notele) standard cnd le avem la ndemn pe cele brute? n plus, prin operaia de transformare a
cotelor brute n cote standard, adic prin operaia de etalonare, nu se pierd informaii importante
cum ar fi cele referitoare la forma distribuiei originale sau la pstrarea poziiei i a distanelor
dintre performanele subiecilor?
Exemple
S ne imaginm cteva sarcini de comparaie direct a performanelor.
1. Comparm performana la matematic a unui elev de clasa a XI-a de la un
reputat liceu de matematic-informatic care obine media semestrial de 6,38, cu
aceeai medie de 6,38 a unui alt elev umanist de la un liceu mai slab. Rezultatele
par identice, dar comparaia direct este incorect pentru c matematica de la real
este mult mai dificil dect cea de la uman, iar profesorii de la liceul de specialitate
ar putea fi mult mai exigeni dect cei de la un liceu slab. Rezult de aici c
comparaia nu mai este posibil? Dac am avea informaii mai detaliate despre
poziia acestor performane n distribuia rezultatelor claselor din care fac parte cei
doi elevi i dac am ti care sunt mediile i abaterile standard ale acestor distribuii,
comparaia ar deveni posibil.
2. Un elev obine 6 la informatic, 7 la matematic, 9 la romn i 10 la istorie, de
unde am putea trage concluzia c el este bun la disciplinele umaniste i slab la cele
realiste. Concluzia este eronat pentru c prin compararea direct se face abstracie
de faptul c la informatic i matematic a obinut aceste note de la profesori foarte
de exigeni, pe cnd la romn i la istorie de la profesori care rareori dau note mai
mici de 8. Comparaia ar putea fi totui fcut dac am deine informaii mai
detaliate despre valorile tendinei centrale i forma distribuiilor pentru cele 4 note
comparate.
3. Cineva care are 70 de kilograme ca greutate i 163 de centimetri ca nlime se
ntreab dac este prea gras n raport cu statura sa. Dar cum se pot compara uniti
de msur att de diferite ca kilogramele i centimetrii? Statistica furnizeaz cheia
dilemei: dac am avea un sistem de comparaie n care s nu mai intervin unitile
de msur originale, problema ar putea fi rezolvat. Acest lucru este posibil prin
exprimarea nlimii i greutii n unitile unei distribuii standard cu media 0 i
abaterea standard 1, adic prin note z. Dac persoana n cauz ar ti c are -0,65 la
nlime i +1,25 la greutate ar putea trage concluzia ntemeiat c este deja
supraponderal.
4. Cineva a obinut la un test de memorie 17 puncte iar la altul de motricitate 25 de
puncte. Este el mai bun la ndemnare dect la memorie? Este imposibil de rspuns
corect dac nu deinem informaii adiionale legate de scorul minim i maxim la
108

cele dou teste i de poziia persoanei n cele dou distribuii. Dac am ti, de
exempu, c scorul maxim la testul de memorie a fost de 20, c performana medie a
fost de 10, iar abaterea standard de 3,5, am avea o idee mult mai clar despre
performana sa la acest test, care este una superioar: ea este deasupra mediei cu
dou abateri standard. Dac la testul de motricitate am ti c performana maxim a
fost de 50, cea medie de 30 i abaterea standard a fost de 5, vom ti c performana
sa a fost sub medie cu o abatere standard. Rspunsul devine acum foarte clar:
performana la memorie a fost mult peste medie, dar la motricitate a fost una slab.
Din exemplele de mai sus rezult clar c scorurile brute nu pot fi luate ca baz de
comparaie nici ale persoanelor ntre ele, nici ale aceleiai persoane la probe
diferite. Pentru a cpta un neles cotele brute trebuie transformate, adic trebuie
raportate la un sistem de referin mai precis, n care forma distribuiei i valorile
tendinei centrale devin reperele eseniale. Aceast operaie de transformare a
scorurilor brute n scoruri standard, cu proprieti matematice dinainte tiute,
definete activitatea de etalonare, la sfritul creia se obin tabelele de norme sau
etaloanele.
Aplicarea testului d scoruri sub forma cotelor brute, care sunt analizate i tratate statistic
pentru a obine cotele standard, adic normele fixate n etalon. n acest scop se folosesc dou tipuri
de transformri (Albu, 1998, p. 246):

transformri de arie (neliniare), prin care se modific repartiia cotelor brute, pentru a semna
cu o repartiie uniform, ca n cazul quartilelor, decilelor sau centilelor, sau cu una normal,
ca n cazul scalelor normalizate cu 5, 7, 9, 10, 11 sau 19 trepte;

transformri liniare, prin care se obin cotele standard z i cotele standardizate (pstrnd
nemodificat ordinea indivizilor n eantion, adic repartiia nemodificat a cotelor).
Dac n primul caz se modific unitatea divizionar a scalei pentru a se lua arii egale n
trane succesive (cte 10% n cazul decilelor, 25% n cazul quartilelor i 1% n al percentilelor), n
al doilea caz unitatea de scal este egal, cea care difer fiind aria poriunii de sub curb
corespunztoare unei uniti, aceasta n cadrul unei repartiii care a fost normalizat.
Pe lng cele dou tipuri de transformri unele etaloane folosesc vrstele echivalente,
vrstele mintale sau clasele echivalente pentru variabile care au o cretere continu n raport cu
vrsta (nlimea, greutatea, inteligena, vocabularul sau cunotinele la o materie colar).
Clasele echivalente, folosite mai ales pentru ciclul primar, n construirea testelor de
cunotine standardizate, exprim pentru fiecare clas i lun de coal, mediana cotelor brute la
test, ceea ce permite reperarea unui scor particular al unui elev: citire 4,5 (nivel de clasa a IV-a,
luna a cincea a anului colar), aritmetic 3,6, istorie 4 etc.
Vrstele echivalente dau fie vrste mintale, ca la testele de inteligen de tip Binet (unde
raportul vrst mintal/vrst cronologic, multiplicat cu 100, d coeficientul de inteligen), fie
vrste ale citirii sau socotitului, pentru testele de cunotine. Se pot calcula astfel coeficieni de
inteligen (IQ), de dezvoltare (QD, ca n bateriile Gesell) sau de educaie (QE).

109

U2.4.1. Transformri de arie (neliniare)


Percentilele (rangurile percentile) reprezint o transformare de arie care presupune o
mprire a suprafeei distribuiei n 100 de trane succesive de arii egale prin operaia de centilare.
O percentil7 exprim procentajul persoanelor din eantionul normativ care cad sub un anumit
scor. De exemplu, dac la testul PM38 Raven sub scorul de 41 cad 10% dintre persoane iar 90%
sunt deasupra acestui scor se poate spune c 41 reprezint percentilul 10, ceea ce n notarea
standard se scrie ca P10. La fel, scorul de 49, sub care cad 50% dintre persoanele eantionului
normativ este punctul percentil median, adic P50. A se nota deci c percentilele mai mari
reprezint scoruri mai mari. n cazul extrem n care o persoan obine cel mai mare scor din
eantionul normativ, scorul su devine percentilul 100, adic P100. Trebuie menionat c ar fi o
foarte grav eroare a se confunda percentilele cu procentaje de performan: percentilul 50 nu
nseamn c cineva a rezolvat 50% din sarcinile unui test, ci c a obinut un scor sub care pic
50% dintre subieci. Percentilele pot fi vzute i ca rangurile unei distribuii ale unui grup de 100
de subieci n care P1 reprezint cel mai slab scor, P25 scorul sub care cad 25% dintre subieci
(qurtilul 1, adic Q1), P50 mediana, P75 quartilul 3 (Q3), iar P100 cel mai bun scor al acestui grup.
Percentilele reprezint cea mai comun transformare a scorurilor brute i aceata pentru c
sunt uor de calculat i foarte intuitive, att pentru persoanele profane, ct i pentru specialitii n
domeniu. Mai mult, aproape orice tip de scoruri ale testelor pot fi transformate i n percentile,
chiar dac scopul final este un alt tip de transformare. De exemplu un IQ de 123 corespunde
punctului percentil 94 (P94), ceea ce nseamn c 94% dintre persoane cad sub acest coeficient de
inteligen i numai 6% au IQ-uri mai mari.
Se poate pune ntrebarea: dac acest tip de transformare este att de avantajos i de
popular, de ce totui el nu a devenit unul exclusiv? Impedimentul major al transformrii percentile
este acela c aceasta distorsioneaz scala de msur, mai puin pe poriunea central, dar din ce n
ce mai mult spre extremitile scalei8. Cu alte cuvinte, centilarea este o msurare tipic scalelor
ordinale, dar, neavnd o unitate de msur egal cu ea nsi pe toat lungimea scalei, mai multe
rezultate exprimate n percentile nu pot fi agregate ntr-un scor unic prin adunarea lor i efectuarea
mediei. Aadar, rangurile percentile nu sunt aditive. Figura 2.1 de mai jos indic clar acest efect de
distorsiune, mai mic pe zona central, dar tot mai nsemnat spre zonele extreme ale curbei
gaussiene. Figura de mai jos indic n mod elocvent diferena de mrime pentru 10 percentile
aflate pe centrul, respectiv periferia liniei de distribuie a scorurilor.
Pentru a facilita operaia de centilare, n SPSS exist mai multe faciliti. Dup ce se
parcurge secvena Descriptive StatisticsFrequenciesStatistics exist opiunile de a obine
cele trei puncte quartile (prin Quartiles), de a mpri distribuia n cte trane egale se dorete
(inclusiv n 100 de trane, adic n centile, prin Cut points for ... equal groups) i toate punctele
percentile (prin Percentile(s)). Cazuri particulare ale operaiei de centilare sunt operaiile de
identificare a celor 9 repere ce permit mprirea ariei de sub curb n 10 trane egale, prin
decilare, sau de identificare a celor 3 repere care sunt Q1, Q2 (mediana) i Q3 ce permit mprirea
7

Termenul de percentil este adesea substituit cu unul mai simplu, care este cel de centil, cu care este echivalent. O
exprimare mai corect, dar mai pretenioas, va folosi n loc de percentil termenii de punct percentil sau de rang
percentil.
8
A se vedea Anexa 2 de la sfritul lucrrii.
110

n 4 trane egale (quartile). Pentru fiecare dintre aceste operaii furnizm aplicaii n paginile care
urmeaz.

Figura 2.1. Rangurile percentile ntr-o distribuie normal.


U2.4.2. Transformrile liniare
A. Scorurile standard
Dei percentilele sunt cele mai utilizate, intuitive i populare transformri, scorurile
standard le reprezint pe acelea care au proprietile psihometrice cele mai bune. Un scor standard
se numete astfel pentru utilizeaz drept unitate de msur abaterea standard a distribuiei
originale de scoruri brute. El se exprim printr-un numr care poate fi ntreg sau zecimal, pozitiv
sau negativ i care reprezint distana unui scor de la medie, exprimat n abateri standard, adic
este o not (cot) z. Cotele standard z arat deci cu cte uniti dintr-o abatere standard se
distaneaz de la medie o cot brut a unui subiect la un test, comparativ cu media populaiei de
referin. Formula de calcul este:

xm
s
unde rezultatul este cota z corespunztoare scorului la testul x, iar m i s sunt media, respectiv
abaterea standard a populaiei pe care s-a fcut etalonarea. Spre deosebire de percentile, cotele
standard z au avantajul unitii egale pe toat lungimea scalei, exprimate n abateri standard (s),
ceea ce le face tipice pentru o scar de interval i de raport. Utilizarea lor nu distorsioneaz scala
de msur, conservnd nu numai ordinea subiecilor, dar i magnitudinea distanei relative dintre
acetia. Cu alte cuvinte, scorurile standard pstreaz neschimbat forma curbei de distribuie a
scorurilor, posednd n plus proprieti matematice care nu se regsesc la nivelul distribuiilor
brute. Astfel, cnd o distribuie de scoruri brute este transforat n scoruri standard z, colecia de
scoruri standard rezultat va avea ntotdeauna o medie de zero, o varian i o abatere standard de
1. n plus, aria de sub curb este distribuit gaussian astfel nct suprafeele de sub curb dintre
dou pucte ale liniei distribuiilor sunt dinainte tiute. Dar raiunea de baz pentru care sunt
transformate scorurile brute n scoruri standard este aceea c ele aduc la un format comun
rezultatele unor teste foarte diferite ca medii i ca abateri standard. Fiind msuri independente de o
unitate de msur (fiind adic msuri amodale) acestea fac posibil comparaia direct a nlimii
cu greutatea i a amndurora cu neuroticismul, de exemplu.
z=

111

Exerciiu
 ntr-o colecie de scoruri la un test cu media de 50 i abaterea standard de 7,
persoana A are scorul de 30, persoana B de 50 i persoana C de 65. Aplicnd
formula de calcul a notelor z determinai cotele standard pentru cei trei
subieci i comentai rezultatele obinute.
Cotele standard au i cteva dejavantaje care trebuie cunoscute de psihologul practician.
Dezavantajul minor este acela de a fi exprimate prin valori pozitive (pentru scorurile brute aflate
peste medie) i negative (pentru scorurile brute aflate sub medie), cea mai mare parte fiind
cuprinse n intervalul [3; +3]. Pentru muli psihologi utilizarea numerelor negative pare mai puin
atractiv. n plus, repartiia normal aglomereaz cea mai mare parte a populaiei de date pe
poriunea central (68% din cazuri sunt cuprinse n intervalul de plus i minus o abatere standard),
extremele fiind mai rarefiate. Dejavantajul major al cotelor z provine ns din faptul c, atunci
cnd sunt comparate dou distribuii standard care au forme diferite (asimetrii de sensuri diferite,
sau o distribuie normal i una asimetric), acest fapt poate duce la concluzii eronate. Cu alte
cuvinte, cazul ideal este acela al comparrii unor distribuii normale ca form, iar dac acest fapt
nu se ntmpl, asimetria trebuie s fie de acelai tip.

B. Scorurile standardizate
De la cursul de Statistic se tie c adunarea unei constante la o colecie de date modific
doar media acelei distribuii, dar relaiile de ordine i de mrime, abaterea standard i forma
distribuiei rmn neschimbate. Mai mult, prin nmulirea sau mprirea tuturor valorilor unei
distribuii cu o constant, acea distribuie se dilat sau comprim proporional cu constanta
respectiv, simultan cu abaterea standard. Prin urmare, utiliznd cele dou perechi de opereaii
aritmetice de baz este posibil ca o distribuie brut oarecare s fie transformat n una care are o
origine i o abatere standard convenabile. Prin aceasta se face o transformare liniar asupra
distribuiei originare sau asupra cotelor standard ale acesteia, ceea ce se obine fiind cotele
standardizate.
Rezolvarea practic a transformrii liniare asupra cotelor z i obinerea cotelor
standardizate se face dup formula:

z ' = M + sz
unde z ' este cota transformat a cotei standard z, iar M i s sunt media i abaterea standard pentru
cotele standardizate obinute prin transformare. Valorile z ' se rotunjesc la numere ntregi,
proprietile lor fiind aceleai cu ale cotelor standard z, exceptnd firete media i abaterea
standard, modificate prin transformare.
Dei mai maniabile, din punct de vedere conceptual scorurile standardizate sunt identice cu
cele standard, deoarece ambele conin exact acelai tip de informaie, iar forma distribuiilor
rezultate este identic: reprezentarea grafic a relaiei dintre cele dou distribuii este o linie
dreapt. Singura diferen notabil este aceea c scorurile standardizate sunt ntotdeauna numere
pozitive ntregi, acesta fiind faptul pentru care ele sunt preferate. Dar cel mai important lucru
relativ la distribuiile standardizate este acela c orice distribuie de scoruri brute poate fi
112

transformat pentru a fi reprezentat pe scara preferat de psiholog, cu valori predeterminate ale


mediei i abaterii standard. Prezentm mai jos cteva tipuri de transformri liniare i scorurile
standardizate rezultate.
Tabel 2.1. Tipuri se scale utilizate n evaluarea psihologic
N
C
L
T
H
Z

IQ

IQ

GRE

subscale

Media
AS

3
1

5
2

10
5

50
10

50
14

100
10

100
15

10
3

500
100

Trebuie precizat faptul c de foarte mare utilitate sunt dou tipuri de scale standardizate,
scorurile T (introduse de McCall n 1922) i scorurile H, introduse de Hull, ale cror formule de
complete de transformare a scorurilor brute n scoruri standard sunt urmtoarele:
T = 50 +

10
(x M )
s

respectiv:
14
(x M )
s
n cele dou formule de mai sus termenul (x + M)/s este echivalentul cotei z, aa c ele se
pot rescrie ca simple transformri de cote z astfel:
T = 50 + 10z i H = 50+ 14z .
H = 50 +

Acest fapt este n acord cu formula z ' = M + sz prezentat anterior.


Scorurile scalei T sunt extrem de frecvent utilizate pentru marile chestionare de
personalitate ca MMPI, CPI ori NEO PI-R. Familiarizarea psihologului cu acest tip de scal, care
include marea majoritatea a scorurilor ntre 30 i 80, este una obligatorie. Mai trebuie adugat
faptul c, dei scorurile standardizate pot fi astfel concepute pentru a produce orice tip de medie i
de abatere standard, practicienii tiu c, pentru a evita numerele negative, este dezirabil ca media
s fie de cinci ori mai mare dect abaterea standard.

U2.4.3. Normalizarea scorurilor standard


Psihologii prefer s lucreze cu distribuii normale pentru c acestea au proprieti
matematice remarcabile i pentru c permit comparaii directe ale scorurilor standardizate. Ce se
poate face n acest caz cu distribuiile asimetrice? Rspunsul este c aceste distribuii pot fi
normalizate pentru a se apropia ct mai mult de curba normal, cu toate avantajele ce decurg de
aici. Transformarea de arie a unei distribuii oarecare, prin operaiile de centilare i decilare,
presupune deja normalizarea curbelor rezultate. De aceea, producerea scorurilor standard
normalizate pleac n timpul nti de la identificarea punctelor percentile pentru toate valorile de
scor ale unei distribuii brute, pentru ca n timpul al doilea acestea s fie transformate n scorurile
standard echivalente. Procedeul descris este n fapt o transformare nonliniar, deoarece relaiile
matematice dintre distribuia de scoruri brute i de scoruri standard normalizate nu se mai
pstreaz. Acest fapt impune precauia ca normalizarea s se fac doar pe asimetrii moderate ale
113

distribuiilor i pe eantioane populaionale largi i reprezentative. Deoarece cel mai adesea aceste
asimetrii rezult dint-o gradare greit a dificultii itemilor, prea muli itemi dificili producnd
asimetrii pozitive, prea muli itemi uori o asimetrie negativ, soluie optim este aceea de
normalizare a distribuiei prin eliminarea itemilor inadecvai ca dificultate.

U2.4.4. Stanine, stens i scale C


Aceste tipuri de scale standardizate au o valoare istoric i de aceea sunt prezentate
separat. Staninele (standard-nine, adic o scal standardizat n nou trepte) a fost dezvoltat de
forele aeriene americane n timpul celui de Al Doilea Rzboi Mondial. Ele au cunoscut o mare
popularitate, deoarece, utiliznd o singur cifr (ntreag i poziziv!), sunt foarte maniabile. Prin
etalonarea n acest sistem rezult 9 clase ce pot fi grupate ntre ele cte 3, fiecare clas dispunnd
de cte 3 gradaii; cu excepia staninei 1 i 9, unitile de scal sunt echivalente ca mrime,
staninele fiind deci aditive. n 1951, Canfield a propus o variaiune pe aceeai tem, adic o scal
n 10 trepte (standard-ten = stens), cu 5 uniti dedesubtul i 5 deasupra mediei. n 1978, Guilford
i Fruchter au propus o scal n 11 trepte, numit scala C, clasa central fiind simetric n jurul
mediei, scala dispunnd de cte 5 trepte dedesubtul i deasupra acesteia. Pentru ambele scale nou
create media este de 5, cu o abatere standard de 2. Dei ele au fost concepute pentru a elimina un
neajuns al staninelor (extremitile distribuiei adic staninele 1 i 9 sunt prea lungi), cele dou
scale nu au provocat printre constructorii de teste un interes comparabil cu scala staninelor.
Trebuie menionat totui c 16 PF i HSPQ ale lui Cattell utilizeaz pentru etalonare aceste tipuri
de scale (mai ales notele C).
Exemple
Foarte utilizate n psihologia aplicat sunt quartilele, decilele i centilele. Dac
primele dau o mprire grosier, n numai patru clase, centilele dau o ierarhie de
finee a rangurilor, din procent n procent, dar aceasta nseamn teste lungi, cu
muli itemi de putere discriminativ variabil (ntre 0,30 i 0,70 cel mai adesea),
aplicate pe populaii foarte mari (de peste 100 de subieci). De aceea mai practice
sunt decilele: Fa de gradul de exactitate al msurii psihologice, mprirea n
decile ceea ce nseamn individualizarea a 10 trepte de reuit la o prob
reprezint adeseori limita maxim, afirm Radu et al. (1993, p. 376).
U2.5. Exemple practice de construire a etaloanelor
Vom ilustra operaia de construire a unui etalon n decile, adic decilarea, prin care
efectivul total se mparte n 10 clase, fiecare cuprinznd 10% din numrul total de subieci. Prin
analogie, centilarea nseamn 100 de clase, a 1% din efectiv fiecare. Primul decil este acel reper
sau valoare a variabilei care are naintea sa 10% din ansamblul datelor ordonate, al doilea decil
este elementul ce are nainte 20% din aceste date etc. Decilele sunt deci indicatori ai locului
(rangului) sau ai poziiei pe scara considerat. Pentru a determina cele 9 repere ce vor delimita
cele 10 decile, datele trebuie mai nti ordonate ierarhic. Pe prima linie vor fi trecute valorile
(cotele) brute ale variabilei test (x), pe a doua frecvenele absolute (fa) i pe a treia frecvenele
114

relative cumulate (fc). Iat rezultatele la testul Raven Standard (PM 38) aplicat pe 448 de
concureni la un examen de admitere, utilizate pentru exerciiile noastre de etalonare.
Tabel 2.2. Distribuia unor rezultate la Matricile Avansate Raven
x
fa
fc

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

11

12

14

17

21

28

31

33

x
fa
fc

41

42

43

44

45

46

50

51

55

56

11

12

15

18

24

20

28

28

36

37

32

29

35

23

23

22

13

44

56

71

89

113

133

161

189

225

262

294

323

358

381

404

426

439

443

448

448

47

48

49

52

53

54

57

58

59

60

N = 448; Media = 48,63; AS = 6,12; Mediana = 49,50.

d. Etalonul n quartile
Quartilul 1 (inferior) are naintea sa 25% dintre subieci, adic (44825)/100 = 112. Cutm
pe linia frecvenelor cumulate (fc) cea mai apropiat valoare de 112, care este 113, corespunznd
cotei brute de 45. Aadar qurtilul 1 are valorile de scor de la 0 la 45, care se i trec n tabel.
Quartilul 2 (mediana), mparte pe din dou efectivul, deci are naintea sa 50% din efectiv, adic
(44850)/100 sau 448/2 = 224. Valoarea cea mai apropiat de aceasta este 225, ceea ce corespunde
cotei brute de 49. Pentru qurtilul 2 se va ntabela deci 46 49. Quartilul 3 (superior) are naintea
sa 75% din efectiv, adic (44875)/100 = 336. Valoarea cea mai apropiat este 353, corespunznd
cotei brute de 53.
Finalmente, etalonul rezultat va arta astfel:
Tabel 2.3. Etalonul n patru clase (quartile)
Quartile

Procente
Teoretice
Cumulate
25
25

Q1

Clase
0 45

Q2

46 49

25

50

Q3

50 53

25

75

Q4

54 60

25

100

b. Etalonul n decile i percentile (centile)


Primul decil are 10% din efectiv naintea sa, deci (44810)/100 sau 448/10 = 44,80.
Rotunjind, se obine 45. Pe linia frecvenelor cumulate valoarea cea mai apropiat de aceasta este
44, corespunztoare cotei brute de 41, care devine reperul pentru primul decil. Al doilea decil are
20% din efectiv naintea sa, deci (44820)/100 = 89,60, rotunjit 90, care pe linia frecvenelor
cumulate are valoarea cea mai apropiat 89, corespunznd cotei brute de 44, care devine reperul
celui de al doilea decil. n mod corespunztor, reperele pentru celelalte decile sunt 46, 48, 49, 50,
52, 53 i 55, care se i ntabeleaz adecvat.
Finalmente etalonul n decile va arta astfel:
115

Tabel 2.3. Etalonul n zece clase (decile)


Decile
10
20
30
40
50
60
70
80
90
100

Clase
0 41
42 44
45 46
47 48
49
50
51 52
53
54 55
56 60

Teoretice
10
10
10
10
10
10
10
10
10
10

Procente
Cumulate
10
20
30
40
50
60
70
80
90
100

Pentru c etaloane n centile ntlnim rareori, cel mai adesea se calculeaz reperele pentru
punctele percentile 3, 5, 25, 75, 95 i 97, celelalte valori (10, 20, 30 etc.) fiind respectiv primul, al
doilea, al treilea decil etc. Modalitatea de calcul este similar: percentilul 3 are 3 procente din
efectiv naintea sa, deci (4483)/100 = 13,44 rotunjit la 13, care pe linia frecvenelor cumulate are
cea mai apropiat valoare 14, cu cota brut corespunztoare 35 (reperul pentru percentilul 3).
Similar, percentilul 97 este (44897)/100 = 434,56, rotunjit 435, care are ca reper scorul brut 57
.a.m.d.

c. Etaloane n clase normalizate


Acest tip de etalonare se realizeaz n clase cu efective conforme distribuiei normale, ceea
ce presupune c distribuia original va fi normalizat prin folosirea de clase ce au proporii
derivate din proporiile unei curbe gaussiene normale. Se pot folosi mai multe astfel de etaloane,
care pot avea 5, 7, 9, 10 sau 11 clase, cu urmtoarele distribuii procentuale:
Etalon n 5 clase: 6,7; 24,2; 38,2; 24,2; 6,7 (%)
Etalon n 7 clase: 4,8; 11,1; 21,2; 25,8; 21,2; 11,1; 4,8 (%)
Stanine = 9 clase: 4,0; 6,6; 12,1; 17,5; 19,6; 17,5; 12,1; 6,6; 4,0 (%)
Stens = 10 clase: 2,3; 4,4; 9,2; 14,9; 19,2; 19,2; 14,9; 9,2; 4,4; 2,3 (%)
Note C = 11 clase: 3,6; 4,5; 7,7; 11,6; 14,6; 16,0; 14,6; 11,6; 7,7; 4,5; 3,6 (%).
Aa cum am mai artat anterior, etalonarea n stanine a cunoscut o larg extindere dup cel
de Al Doilea Rzboi Mondial. Vom exemplifica construirea unui etalon de acest tip plecnd tot de
la datele anterioare. Stanina 1 are sub ea 4% din efectiv, deci (4484)/100 = 17,92, rotunjit 18, care
are pe linia frecvenelor cumulate valoarea cea mai apropiat 17, creia i corespunde cota brut de
36. Similar stanina 2 are naintea sa 4,0+6,6 = 10,0 procente din efectiv, adic (44810,6)/100 =
47,468 rotunjit la 47, care pe linia frecvenelor cumulate are cea mai apropiat valoare 41.

116

Etaloane de calitate se obin atunci cnd eantionul este reprezentativ i volumul su


depete 100 de subieci, selecionai dup criterii (de regul nu mai mult de 4) de vrst, sex,
mediu, profesie etc., pentru a fi n acelai timp omogene n raport cu criteriul i eterogene n
aceeai proporie cu populaia mai mare din care a fost extras, adic pentru a avea un grad ridicat
de reprezentativitate. Prezentm mai jos etalonul rezultat n stanine.
Tabel 2.4. Etalonul n nou clase normalizate (stanine)
Stanine
1
2
3
4
5
6
7
8
9

Procente:
Teoretice
4,0
6,6
12,1
17,5
19,6
17,5
12,1
6,6
4,0

Clase
0 36
37 41
42 45
46 48
49 50
51 53
54 55
56
57 60

Cumulate
4,0
10,6
22,7
40,2
59,8
77,3
89,4
96,0
100,0

n Anexa 1 de la sfritul acestei lucrri este inserat un tabel care face


conversia unor scoruri n percentile (transformri de arie), n note z (cote
standard), n uniti de IQ, n scoruri T i GRE (Graduated Record Exam)
(cote standardizate, cu medii i abateri standard trecute n capul de tabel).
Determinai valorile de scor corespunztoare celorlalte tipuri de scale,
incluzndu-le ntr-un tabel cu cinci coloane:
IQ 133, 84, 55, 75 i 106;
P11, P37, P54, P69, P85, P97;
cotele T 78, 21, 54, 66, 32;
cotele z 2.25, 0.55, -0.55, -1.34, 2.05;
cotele GRE 725, 564, 520, 43 i 477.

U2.6. Clasificarea testelor psihometrice


n binecunoscuta sa lucrare Psychological Testing, Anne Anastasi (1976) abordeaz testele
psihologice dup trei mari subdiviziuni:
1. teste de nivel intelectual general, n care include testele individuale, testele pentru populaii
speciale i testele de grup;
2. testele pentru abiliti separate, cu trei subdiviziuni majore: teste educaionale, ocupaionale i
clinice;
3. testele de personalitate, care includ inventarele autoaplicate, testele ce msoar interese,
atitudini, valori i tehnicile proiective.
117

Alte exemple de clasificri posibile ale testelor


Aiken (1997) trateaz evaluarea abilitilor (inteligena i abilitile speciale) i
a personalitii (interese, atitudini, valori; observaia, interviul i ratingul;
inventarele i tehnicile proiective).
Kaplan i Saccuzzo (1993) disting: tehnicile interviului, testele de abiliti
mintale, alte teste de abiliti individuale sau de grup, apoi testele pentru
alegerea carierei, testele de personalitate structurate, testele de personalitate
proiective, la care adaug procedurile de evaluare a comportamentului, de
msur a anxietii i a stresului, testarea strii de sntate i testele
computerizate.
Holban (1973) propune o clasificare ce cuprindea testele de randament, de
dezvoltare mintal, de aptitudini, de cunotine, de comportament, de alegere,
teste proiective, sociometrice, degajnd i alte criterii de clasificare.
Ursula chiopu (1976) propune ca mari categorii de tehnici psihodiagnostice
testele de dezvoltare, de inteligen, de aptitudini, de personalitate i de
examinare psihologic a sociabilitii.

Fiecare clasificare configureaz n alt mod domeniul psihodiagnozei, care uneori se


rezum la testare (testing), alteori i la evaluare (assessment), putnd include i toate metodele
clasice utilizate n vederea diagnozei (anamneza, metoda biografic, convorbirea, observaia,
ancheta, interviul, chestionarele sau metodele sociometrice). Dei se poate observa c multe dintre
clasificrile enunate mai sus se suprapun n bun msur, este necesar s fie identificate cteva
criterii clare de clasificare, care vor ajuta la mai buna circumscriere a domeniului testrii
psihologice i la nelegerea mai nuanat a diferena specific dintre tipurile de teste. Deoarece
este greu de ierarhizat ponderea fiecrui criteriu i deoarece graniele dintre ele sunt relative,
ordinea lor nu este neaprat cea care va fi adoptat n continuare.

U2.6.1 Clasificarea testelor dup modul de administrare:


Teste individuale i de grup
Testele individuale, foarte apropiate de metoda clinic, sunt mari consumatoare de timp, dar
ele permit stabilirea unui contact mai bun cu subiectul, ce va fi observat mai uor, informaia
dat de test putnd fi suplimentat semnificativ cu alte date care sporesc acurateea
diagnosticului.
Testele de grup (colective): n cazul lor examenul este mai strict standardizat (pentru a
controla toate elementele ce ar putea denatura rezultatul final, n special nenelegerea
instructajului i frauda), adun o mare cantitate de date ntr-un interval scurt (deci sunt foarte
economice), dar srcesc examenul de date importante privind motivaia, implicarea n prob,
oboseala, anxietatea, boala sau plictiseala. Sunt foarte indicate n examenele de selecie
primar, de cunoatere a opiniilor sau a atitudinilor. Pentru consiliere, ghidare vocaional,
orientare sau n clinic sunt de preferat abordrile individuale, datorit plusului lor de calitate.

118

U2.6.2. Clasificarea testelor dup timpul de execuie:


Teste de vitez i teste de randament
Testele de vitez pleac de la presupunerea c exist o corelaie ntre viteza de lucru i
dezvoltarea unei caracteristici (atenia, de exemplu). Sarcinile nu sunt organizate ierarhic,
avnd acelai grad de dificultate, dar testul are un numr foarte mare de itemi, pentru a nu
putea fi integral rezolvat de nici un subiect. Evident, primeaz aspectul cantitativ.

Testele de randament au itemii de dificulti diferite, aranjai ierarhic, timpul fiind suficient
de mare pentru a permite parcurgerea lor de ctre toi subiecii. Cota brut o reprezint
numrul de probleme corect rezolvate (primeaz deci aspectul calitativ al rezolvrii).
Cele mai multe teste combin aceste dou criterii, cum este subtestul Cuburilor WISC, unde
modelele de realizat sunt progresive ca dificultate (utilizeaz patternuri caroiate, apoi fr caroiaj,
modele de 2x2, apoi de 3x3 cuburi), iar punctele rezult din rezolvarea corect a modelului i din
bonificaiile de timp (de vitez, de fapt).

U2.6.3. Clasificarea testelor dup modul de executare a sarcinii de ctre subiect:


Teste orale, teste scrise (tip creion-hrtie) i teste de performan
Testele orale cer rspunsuri verbale (informaii, vocabular, completare de propoziii,
comprehensiune, asociere verbal etc.).
Testele scrise cer un rspuns scris (care poate fi i desenat), dat pe foaia de test sau de rspuns.
Proliferarea lor extraordinar, dat de comoditatea soluiei, tinde astzi s fie blocat de
extinderea examenului cu ajutorul calculatorului, care afieaz pe ecran problema, soluia fiind
indicat prin tast, mouse sau creion optic. Mai mult, calculatorul scaneaz foi de rspuns,
scoreaz, analizeaz rspunsul i furnizeaz o foaie de profil, avnd un rol esenial i n reetalonarea progresiv a testului.

Testele de performan presupun materiale, instrumente sau aparate, dispuse n condiiile


speciale de laborator, necesit o supraveghere atent i rareori permit examene colective.
n acest context, distincia teste verbalenonverbale, dei des utilizat, nu este operant,
pentru c este greu de specificat pn la ce nivel intervine sau nu factorul verbal. Testele la care
exist preponderent rspunsuri motorii, construite cel mai adesea pentru a fi free culture, adic
independente de limb, sunt destinate imigranilor, handicapailor cultural, hipoacuzicilor ori
minoritilor etnice, adic cei crora factorul verbal poate s le modifice negativ performana
final.
U2.6.4. Clasificarea testelor dup modul de procesare implicat:
Teste de eficien i teste de personalitate
Fiecare categorie are mai multe subdiviziuni:

Testele de eficien se refer la aptitudini generale (inteligen, memorie) i speciale, la


cunotine, la probele de lucru i la testele situaionale.

Testele de personalitate includ chestionarele autoaplicate, tehnicile proiective i testele


obiective de personalitate.

119

Dac testele de eficien ncearc s surprind performana maxim a unei persoane, cele de
personalitate vor s surprind performana ei tipic (Corsini, 1994), primele avnd itemi de genul
adevratfals, prin care se obine un scor numeric i o ierarhizare a indivizilor, n timp ce la a doua
categorie rspunsurile nu sunt dihotomice (bune/rele), deci nu permit o ierarhizare, ci o raportare
tipologic.

Teste de eficien sunt la rndul lor:

Testele de aptitudini: conformndu-se unui model evolutiv i ierarhic asupra inteligenei, sunt
teste de aptitudine general (inteligen), care msoar un potenial general, teste de aptitudini
speciale (muzic, mecanic, sport, arte etc.) i teste de aptitudini multiple, care cuprind ntr-o
singur baterie mai multe feluri de aptitudini, definite factorial, ce pot interveni n domenii
specifice (dexteritate, inteligen spaial, tehnic, manualitate etc.).

Testele de cunotine msoar nu un potenial (ca cele de inteligen), ci nivelul efectiv atins
n achiziia de informaii sau de deprinderi specifice unui domeniu (matematic, istorie,
informatic etc.). Pentru c cel mai bun predictor asupra a ceea ce poate nva cineva este
ceea ce el deja a nvat pn la un moment dat, testele de cunotine au n vedere n mod
expres experiena anterioar de nvare. De fapt, cea mai bun predicie este dat de folosirea
concomitent a testelor de aptitudini generale (inteligen) cu cele de cunotine, pentru c
combinarea lor este mai informativ (indic i ceea ce este potenial, dar i ceea ce este
dobndit prin nvare). Unele dintre testele de cunotine sunt de tip informativ (elaborate de
profesorii nii pentru a determina nivelul unei clase), sau standardizate (elaborate de
specialiti, destinate utilizrii pe scar larg, avnd un manual care indic strict condiiile de
standardizare n aplicare, cotare, raportare la norme elaborate pe eantioane reprezentative i
acoperind o mare varietate de coninuturi, ce le fac foarte recomandabile pentru evaluri
sumative).

Probele de lucru sunt extrem de indicative pentru evaluarea nivelului atins ntr-o profesie,
activitate, dependent de formarea unor deprinderi motrice, intelectuale sau rezultate dintr-o
experien. Unele dintre elementele implicate ntr-o munc devin foarte diagnostice pentru
rezultatele ce se vor obine ulterior n munca respectiv. naintea unui program de instruire,
deseori se face o astfel de evaluare care, cnd este bine conceput, are validitate predictiv i
face o mare economie de timp i bani, programele putnd dura luni sau ani.
Testele situaionle sunt echivalentele probelor de lucru n cazul profesiilor administrative
(Albu, 1998, p. 74), deosebirea major fiind c n testul situaional se regsete sarcina de
lucru n totalitatea ei, i nu numai anumite elemente. n afar de aceasta, ea nu cuprinde numai
deprinderi (skills) ci i variabile de personalitate i sociale (emoii, opinii, stil personal,
aptitudinea de lider, etc.). Scopul lor este adesea deghizat, ele fiind construite ca simulri ale
unor situaii reale, pe care cel n cauz trebuie s le rezolve. Tehnica in-basket (coul de
lucru) simuleaz condiiile de lucru ale unui manager, director de firm, care trebuie s
120

rspund la toate solicitrile cuprinse n co: telefoane, decizii, scrisori, directive, interviuri
etc. Capacitatea de conducere i stilul personal n lucrul cu oamenii se evideniaz astfel
printr-un test n care itemii sunt de aceeai natur i complexitate ca munca efectiv.
Evident c aceste teste se organizeaz dup faza interviurilor preliminare i dup examenele
psihologice cu teste clasice, prin care numrul candidailor cu anse de a fi selectai pentru
post se reduce drastic.

Teste de personalitate sunt clasificabile n trei categorii:

Chestionarele de personalitate. Acestea pot fi unifazice sau multifazice, dup cum msoar
una sau mai multe dimensiuni de personalitate (extraversie, anxietate, nevrotism, maturizare
emoional, fora Eului, masculinitate-feminitate, tendine patologice etc.) Dup coninut, ele
pot fi de adaptare, caz n care se numesc inventare de personalitate, indicative pentru
integrarea social a propriei conduite sau pentru starea de sntate. n afara acestora,
chestionarele pot msura interesele (foarte importante n orientarea profesional), atitudinile,
opiniile (fundamentale n anchetele sociologice), sau valorile. Uor de administrat i de cotat,
chestionarele de personalitate au o larg utilizare, cci se bazeaz pe supoziia (discutabil!)
potrivit creia cea mai bun cale de a afla ceva despre un individ este de a-l ntreba direct
(Hammond, 1995). Sunt multe dovezi c ntre sinele social i cel psihologic, ntre sinele real i
cel ideal pot exista distane mari sau conflicte (surse de inadaptare social) i, mai mult, dac
situaia de examinare are miz (angajare, selecie profesional), rspunsurile pot fi trucate
intenionat (rspunsuri de faad).

Tehnicile proiective nu sunt teste n sens strict, pentru c au un grad de standardizare i


etalonare redus i, n consecin, caliti psihometrice foarte discutabile, de unde i rezerva
multor psihometricieni fa de acestea. Ele urmresc sesizarea nu a ceea ce este comun tuturor
oamenilor (planul nomotetic), ci aspectele idiografice, adic ceea ce este profund individual i
specific unei singure persoane, fiind calea cea mai important pentru a ajunge la un diagnostic
diferenial. Cunoaterea acestor factori unici, numit diagnoza la nivel intim, de adncime,
structural, plaseaz aceste probe n afara posibilitilor de etalonare, de unde i numele de
tehnici i nu de teste proiective. Au o utilizare foarte frecvent n clinic (n psihiatrie cu
precdere), dar sunt foarte rspndite i n domeniul judiciar, n coal sau transporturi, acolo
unde se pune problema surprinderii unitii, integritii sau sntii mentale a persoanei. De
multe ori ele premerg psihoterapia sau i evalueaz rezultatele. Sarcina subiectului are caracter
foarte general i vag precizat, el trebuind s spun ce-i trece prin minte, uneori o poveste
despre o fotografie, imagine, desen, pat de cerneal, elementele inductoare fiind nite stimuli
nestructurai, vagi, ambigui. n construcia relatrii sale, subiectul va folosi materialul pe care
l are la dispoziie, stocat n fondul aperceptiv al memoriei sau n incontientul su, de unde i
numele de probe proiective. Pentru a le desemna se mai utilizeaz i ali termeni: teste
aperceptive (ca TAT, CAT, Symonds), teste nestructurate sau de dinamism. Dou sunt
problemele de fond ale acestor tehnici: subiectivitatea accentuat a interpretrii (validitate
concurent i ncruciat reduse) i timpul extrem de lung necesar formrii unui
121

psihodiagnostician bun, specializat n domeniu. Dac la acestea adugm timpul mare, cerut de
aplicare i interpretarea rezultatelor, faptul c sunt folosite doar scale nominale (raportarea
persoanei la o tipologie sau categorie) i faptul c msoar date ce au o mare fluctuaie de
moment (dependente de factori dispoziionali), vom nelege de ce entuziasmul iniial pentru
aceste tehnici s-a mai temperat, ele rmnnd ns, pentru unele zone, singurele instrumente
diagnostice dezirabile.

Testele obiective de personalitate sunt, ca i cele proiective, teste indirecte pentru c-i
deghizeaz scopul, dar sunt numite obiective pentru c folosesc stimuli structurai (activiti
simple, manipulabile experimental), din execuia crora se deduc aspecte relevante ale
personalitii, cu o mult mai mare concordan ntre evaluatori, comparativ cu cele proiective.
Modificarea vigilitii (arous-ului cortical) la introveri i extraveri este extrem de diferit,
primii avnd o descretere accentuat, ceilali o cretere progresiv, paralel cu concentraia de
cofein. Muli constructori de chestionare (inventare) de personalitate s-au lsat sedui de
ideea gsirii unor validri externe a acestora prin teste obiective, printre acetia numrndu-se
Eysenck sau Cattell.

U2.6.5.Clasificarea testelor dup constana coninutului de la o administrare la alta:


Teste cu coninut fix i teste cu coninut variabil
Dac cele cu coninut fix pot fi pot fi considerate teste n sensul clasic (toate persoanele
testate parcurg aceiai itemi, prezentai n aceeai form), cele cu coninut variabil contureaz un
mare domeniu (uria) al testelor adaptate, administrate, scorate i prelucrate computerizat. n acest
caz nu mai exist un test unic, ci o banc de itemi, ale cror caracteristici au fost determinate din
administrri anterioare (ansamblu larg de itemi calibrai ca discriminabilitate i dificultate, vezi
Havrneanu, 2000).
Testele adaptative computerizate sunt construite pe baza teoriei rspunsului la itemi,
selecia itemului administrat fiind n funcie de caracteristicile conjugate ale acestuia i ale
subiectului examinat, pentru a maximiza informaia despre el, n condiiile unei testri mai
eficiente i mai rapide. Algoritmul cuprinde o secven care ncepe cu un item de dificultate medie
care este administrat, se evalueaz rspunsul n raport cu variabila test apoi, funcie i de
rspunsurile anterioare ale subiectului, pentru itemii care vor urma se decide continuarea sau
stoparea testrii, dac s-a atins un nivel de ncredere specificat, sau timpul ori numrul de itemi de
administrat a fost epuizat. Dac la nceput testele adaptative computerizate msurau doar
aptitudini i cunotine (itemi omogeni relativ la construct), acum ele tind s se extind spre
msurarea de variabile necognitive (opinii, atitudini, valori sau interese).
U2.6.6. Clasificarea testelor dup modul de cotare
Exist teste obiective i subiective, distincie care deja s-a degajat prin compararea
tehnicilor proiective (cotare subiectiv) cu cele cognitive sau de cunotine (obiective).
Obiectivitatea n cotare este o important calitate psihometric a unui test, care presupune ca
sarcina s fie structurat i rspunsurile bune s fie alese dintr-un numr fix de rspunsuri
122

preformate. Ea se obine i cnd numrul itemilor este mare i scorul la test are o formul de calcul
clar specificat.

U2.6.7. Clasificarea testelor dup modul de interpretare a scorurilor


Teste normative, unde scorul individual i dezvluie semnificaia prin raportarea la etalonul
obinut pe un eantion reprezentativ statistic i omogen.

Teste centrate pe criteriu, unde se stabilete un anumit nivel acceptabil al performanei, n


funcie de care subiectul este admis sau respins. Acestea sunt utilizate fie n selecia primar
(apt/inapt pentru conducerea auto), fie n coal, n ciclul primar, cnd criteriul arat ct de
mult s-a apropiat elevul de obiectivul educaional scontat i mai puin de un anumit loc n
ierarhia clasei.

Teste idiografice, n care se construiete un instrument diagnostic doar pentru un singur


individ, sau scorul su la un chestionar devine criteriu de evaluare a unui program
psihoterapeutic, prin pre-test i post-test.

Teste ipsative, care cer subiectului s aloce o resurs personal limitat mai multor domenii,
urmrind compararea ntre domenii sau ntre scorurile obinute la mai multe din scalele
testului.

U2.6.8. Clasificarea testelor dup numrul variabilelor implicate


Teste analitice. Acestea s-au impus tot mai mult datorit dezvoltrii metodelor de analiz
factorial, care permit selecia de itemi omogeni n raport cu un construct. Ele au la baz
principiul din fizic al izolrii fenomenului de investigat, ceea ce este relativ dificil la nivelul
psihicului, cci el tinde, prin evoluia sa, spre o unificare progresiv prin largi sisteme de
integrare (Allport, 1937).
Teste sintetice. Ele pun persoana n condiiile de solicitare complex, permind iden-tificarea
unor parametri aptitudinali diferii, concomitent cu surprinderea (prin observaie), a unor
trsturi sau chiar factori mai generali de personalitate.

U2.6.9. Clasificarea testelor din punctul de vedere al procesului psihic investigat


Din acest punct de vedere i n prelungirea unei perspective atomist-facultaioniste n
psihologie, tot mai puin utilizat astzi, exist teste de atenie, de percepie, de memorie, de
inteligen, de creativitate, de personalitate etc. Este de ajuns s artm cum inteligena pune n
micare toate rezervele psihice n scopul adaptrii i cum personalitatea tinde spre integrri
succesive, spre a evidenia relativitatea acestui criteriu, care pstreaz o utilitate pur didactic.
Utiliznd 3-5 criterii de clasificare dintre cele prezentate n Synopsisul de mai jos
analizai i descriei urmtoarele teste: Draw a Man Test (testul Omuleului),
testul PM38 (Matrici Progressive Raven), Testul Edinburgh pentru determinarea
dominanei manuale, chestionarele de personalitate 16PF Cattell i CPI
(California), scalele de Depresie Beck, de Anxietate Burns i Locus of control
Rotter.
123

Tabel 2.5. Synopsis pentru clasificarea testelor psihometrice

Criteriu
Mod de administrare
Timp de execuie
Mod de executare a
sarcinii
Mod de procesare

Constan coninut
Mod de cotare
Mod de interpretare a
scorurilor
Numr de variabile
Proces psihic
investigat
Categorii majore de
teste (Anastasi)

Categorii de teste
Idividuale
De vitez
Orale

Scrise
(creion-hrtie)

De grup
De randament
De performan

De eficien
De personalitate
De aptitudini
Chestionare
De cunotine
Tehnici proiective
Probe de lucru
Teste obiective
Teste situaionale
Coninut fix
Coninut variabil
Obiective
Subiective
Normative
Centrate pe
Idiografice
Ipsative
criteriu
Analitice
Sintetice
Unifazice (chestionare)
Multifazice (chestionare)
De inteligen, de memorie, de atenie, de creativitate, de percepie, de
reprezentri spaiale, de temperament, de caracter etc.
De abiliti separate
De personalitate
De nivel intelectual
general

U2.7. Rezumat
 Deoarece scorurile brute ale unui test nu au nici o semnificaie prin ele nsele,
acestea trebuie raportate la scorurile unui grup de referin prin construirea unui
etalon sau barem.
 Etalonul convertete (transform) cotele brute n cote standard i permit
interpretarea unui scor n termenii poziiei ocupate de acesta ntr-o ierarhie.
 Deoarece nu au valibilitate universal i permanent, testele trebuie revizuite i
etalonate periodic.
 Etalonarea se face pe un eantion normativ, care trebuie s fie extins numeric,
reprezentativ pentru populaia int i cu un bun raport omogenitate-eterogenitate.
 Etaloanele pot fi naionale, zonale sau locale, la care se mai adaug etaloanele
destinate grupurilor speciale.
 Punctul de plecare n construirea unui etalon este distribuia scorurilor brute iar
sistemul de referin curba distribuiei gaussiene.
 Etalonarea se face fie prin transformri de arie (trane succesive de mrime egal
din distribuie), fie prin transformri liniare (uniti egale pe linia de distribuie a
scorurilor).
 Cele mai tipice transformri de arie sunt operaiile de centilare i decilare prin care
124















se determin punctele percentile i decilele.


Acestea exprim poziia unui scor (rangul) ntr-o ierarhie de scoruri.
Prin aceast metod se produce i normalizarea distribuiei.
Cele mai tipice transformri liniare sunt cotele standard i cele standardizate.
Dac primele se sprijin pe notele z (M=0, AS=1), cotele standardizate pleac de la
acestea, dar se raporteaz la o scal alctuit din numere pozitive ntregi, cu o
medie i o abatere standard predeterminate.
Cele mai utilizate i cunoscute scale normalizate sunt cele n 9, 10 i 11 clase
(stanine, stens i note C) i scala n 19 trepte.
Cele mai cunoscute scale standardizate sunt scalele T i Hull i scala n deviaii de
IQ (M=100, AS=15).
n transformrile liniare relaiile de ordine, distana dintre scoruri i forma
distribuiei obinute sunt similare cu distribuia originar a scorurilor brute.
Transformrile liniare presupun distribuii ct mai aproape de normalitate. Cnd
distribuiile largi sunt totui asimetrice, ele pot fi normalizate i apoi transformate
n scoruri standard, dar acestea nu mai conserv forma distribuiei originare.
Exist o multitudine de criterii de clasificare a testelor psihometrice.
n mare acestea pot fi abordate ca teste de aptitudini generale, aptitudini speciale i
de personalitate.
Cele mai importante criterii de clasificare a instrumentelor psihometrice se refer
la modul lor de administrare, la timpul de execuie, la modul de executare a sarcinii
i modul de procesare implicat, la constana coninutului de la o aplicare la alta, la
modul de cotare i de interpretare a scorurilor, la numrul de variabile implicate i
la procesul psihic investigat.
Cea mai larg dihotomie clasificatorie este aceea a testelor de eficien i de
personalitate, fiecare categorie avnd mai multe subdiviziuni.

U2.8. Test de evaluare a cunotinelor


1. Definii conceptele de norme, etalon i etalonare a unui test psihologic.
2. Indicai care este utilitatea normelor naionale, zonale i locale n testare.
3. Analizai importana reprezentativitii i a raportului omogenitate-eterogenitate a
unui eantion populaional destinat crerii etalonului unui test.
4. Precizai n ce const diferenele dintre transformrile de arie i cele de linie
(liniare) n activitatea de construcie a unui tabel de norme.
5. Analizai n ce const diferena cote (note) brute cote (note) standard, indicnd
de unde rezult utilitatea celor din urm.
6. Analizai n ce const diferena dintre cotele standard i cele standardizate.
7. Precizai i exemplificai n ce const clasele normalizate i care este legtura
acestora cu curba lui Gauss.
8. Ordonai ierarhic criteriile de clasificare a testelor argumentnd n legtur cu
ierarhia propus.
125

__________________________________________________________________
Modulul M3. Unitatea de nvare 3
CONSTRUCIA I DEZVOLTAREA SCALELOR PSIHOLOGICE
Cuprins
U3.1. Introducere .......................................................................................................... 126
U3.2. Competene ......................................................................................................... 126
U3.3. Paii de urmat n dezvoltarea scalelor ................................................................. 127
U3.3.1. Pasul nti ................................................................................................ 127
a. Recursul la o teorie valabil ................................................................ 127
b. Nivelul de specificitate al scalei ........................................................... 130
U3.3.2. Pasul al doilea .......................................................................................... 131
a. Lungimea i redundana setului iniial de itemi ................................... 131
b. Reguli de scriere a itemilor unei scale ................................................. 133
U3.3.3. Pasul al treilea .......................................................................................... 135
a. Scalele Likert ........................................................................................ 136
b. Scalele Thurstone .................................................................................. 137
c. Scalele Guttman .................................................................................... 138
d. Scala de distan social Bogardus ...................................................... 139
e. Numrul optim al categoriilor de rspuns ............................................ 140
U3.3.4. Pasul al patrulea ....................................................................................... 143
U3.3.5. Pasul al cincilea ....................................................................................... 144
U3.3.6. Pasul al aselea ........................................................................................ 145
a. Examinarea iniial a setului de itemi .................................................. 145
b. Corelaia item-scal ............................................................................. 146
c. Analiza factorial exploratorie ............................................................ 148
d. Scurt raport despre scal ...................................................................... 152
U3.4. Criterii de selecie pentru optimizarea lungimii scalei ......................................... 153
U3.5. Analize utile pentru determinarea fidelitii scalei .............................................. 154
U3.6. Rezumat ................................................................................................................ 156
U3.7. Evaluare: proiect aplicativ .................................................................................... 157
Lista de termeni .............................................................................................................. 157

U3.1. Introducere
O bun parte din activitatea practic a psihologului se sprijin pe diagnoza unor
aspecte cantitative ale aptitudinilor i dimensiunilor definitorii pentru personalitate.
n acest scop el utilizeaz instrumente ale cror caliti psihometrice trebuie
construite i evaluate n cunotin de cauz. n plus, pentru unele dimensiuni
psihologice, pedagogice sau sociologice specialistul trebuie s dezvolte singur
scale destinate msurrii constructelor respective. Mai mult, literatura domeniului
face adesea referiri la aceste caracteristici, considerndu-se implicit valabil c
126

psihologul este avizat n legtur cu aspectele tehnice implicate de construcia i


dezvoltarea scalelor psihologice.
Pe de alt parte, dei se recunoate tacit c statistica este printre cele mai
importante instrumente al profesiunii de psiholog, ea determin nc o reacie de
rezisten, sau chiar de respingere din partea novicilor, din cauza caracterului ei
abstract i formalizat, sau a evoluiei sale foarte rapide, prin care demersul
matematic a devenit tot mai sofisticat, parc anume rezervat unei elite capabile s
in pasul cu ceea ce s-a numit imperialismul metodologic al tiinei. Capitolul
pe care l deschidem demonstreaz cum o cunoatere psihologic abstract, de tip
statistico-matematic, devine extrem de util n contextul psihologic foarte concret
al construciei de scale. El ofer reperele pe care psihologul, pedagogul sau
sociologul trebuie s le aib n dezvoltarea scalelor destinate msurrii unor
constructe specifice domeniului de activitate propriu.

U3.2. Competene
Dup parcurgerea acestei uniti cursanii vor fi capabili:
s defineasc paii i etapele urmate n construcia scalelor psihologice;
s genereze setul iniial de itemi respectnd regulile de scriere a acestora;
s determine formatul scalei, selectnd tipul de scal de msur adecvat;
s administreze, s piloteze i s examineze performana iniial a itemilor;
s utilizeze analiza factorial exploratorie i alte analize statistice pentru selecia
itemilor formei finale a scalei;
s construiasc un chestionar pentru o variabil de personalitate indicat, cu
parcurgerea tuturor pailor i a etapelor prezentate n curs.

Durata medie de parcurgere a acestei uniti duble de nvare, incluznd


rezolvarea sarcinilor propuse i a temelor de evaluare, este de 8 ore.

U3.3. Paii de urmat n dezvoltarea scalelor


U3.3.1. Pasul nti:
Determinm cu claritate ceea ce dorim s msurm
a. Recursul la o teorie valabil
S ne reamintim...
Ne putem imagina efortul psihologului de a asambla un set semnificativ de mare
de itemi presupui a avea legtur cu constructul msurat, de a-l aplica unei
populaii destul de numeroase, de a introduce item cu item datele ntr-un program
de prelucrare statistic, de a desfura o analiz factorial exploratorie pentru a
determina care itemi bat n direcia constructului presupus a fi msurat i care n
127

alte direcii, de a-i selecta i reuni pe cei mai reprezentativi ntr-o scal uni- sau
multidimensional, de a determina gradul de consisten intern (de omogenitate)
al fiecrei subscale, stabilitatea ei n timp sau legtura cu constructul msurat prin
corelare cu alte scale presupuse a msura aceeai dimensiune. Un astfel de demers
tipic pentru dezvoltarea unei scale presupune un mare consum de energie i el
ar putea s nu fie rspltit cu rezultatele ateptate. Aceasta deoarece specialistul
trebuie s aib o cunoatere i o conceptualizare prealabil a domeniului care
urmeaz s fie investigat, fie din parcurgerea literaturii i a teoriilor n legtur cu
problema/ dimensiunea respectiv, fie dintr-o experien prealabil, fie i este
cazul cel mai fericit din amndou direciile. Prin aceasta dorim s afirmm c
aspectele tehnice care vor fi invocate n paginile care urmeaz nu trebuie
supraestimate n detrimentul nelegerii naturii reale a conceptului sau faptului
psihologic care urmeaz a fi msurat.
Recursul la teoriile cele mai consistente referitoare la acest construct este fundamental
pentru c aceasta ne ajut i ne ghideaz n selectarea elementelor sale eseniale, care vor fi
ulterior transformate n itemii scalei sau ai chestionarului. Multe dintre dimensiunile i
constructele care definesc aspecte psihice, comportamentale sau sociale sunt subtile, ambigue i
nu i gsesc o expresie direct sau deplin n experiena de practician. De aceea este foarte
important s ne facem o idee ct mai clar despre ceea ce urmeaz a fi msurat. n acest sens
teoria este de cel mai mare ajutor, pentru c ea ne ajut s dobndim o imagine consistent asupra
aspectului ce va fi abordat psihometric. Corobornd mai multe puncte de vedere teoretice despre o
problem se degaj elementele sale eseniale, dar i neclaritile sau ambiguitile, fapt care ajut
specialistul s decid dac este necesar o nou direcie de abordare i s construiasc o prim
schi a instrumentului de msur corespunztor.

Exemplu
S presupunem c suntem preocupai de o problem practic, cum ar fi cea a
tulburrilor de citit-scris, i observm c aceasta este mult mai frecvent la biei
dect la fete. Am remarcat de asemenea faptul c printre disgrafici i dislexici
proporia stngacilor este de cteva ori mai mare dect n restul populaiei, ceea ce
ne ndreptete s credem c aceste tulburri sunt asociate cu probleme de
lateralizare (manual i/sau cortical) a unor funcii importante. De aceea am dori
s crem un instrument care s fie utilizat n tulburrile instrumentale pentru a
diagnostica gradul de lateralizare manual.
Literatura domeniului dominanei manuale atrage atenia asupra ctorva elemente
importante:
 stngcia poate fi ereditar sau non-ereditar, adic produs prin alte mecanisme,
dect cel genetic, cum ar fi excesul de testosteron din primele luni de sarcin,
care inhib dezvoltarea emisferei stngi (cel mai adesea dominant n populaia
de baz) sau stngcia accidental, prin scoaterea din uz a minii dominante un
128












interval mai lung de 8 luni;


mecanismul asimetriei cerebrale are o transmitere genetic, gena LRRTM1 avnd
o mare contribuie la aceasta, ea fiind ns implicat i n producerea
schizofreniei;
se pare c exist o gen (rs dup expresia lui Annett, 19729) care controleaz
orientarea levogir sau dextrogir a unei persoane;
lateralizarea manual se asociaz strns cu lateralizarea cortical a limbajului i
cu dominana cerebral;
lateralizarea manual este impus i de presiunile socio-culturale enorme pentru
utilizarea minii drepte, presiuni evideniabile la aproape toate popoarele, din
toate timpurile, n unele culturi ea avnd i importante conotaii religioase;
rata stngacilor este aproximativ constant de-a lungul timpurilor (10% din
populaie), dei de-a lungul vieii unei singure persoane ea pare a fi ntr-o
descretere accentuat spre vrstele adulte, datorit mortalitii mai accentuate a
stngacilor, de unde i sperana de via mai redus a acestora;
bolile autoimune, alergiile, tulburrile de somn, depresiile i tentativele de suicid,
alturi de problemele de nvat, balbism i enurezis nocturn sunt mult mai
frecvente pentru stngaci;
problema lateralizrii nu se pune doar pentru utilizarea preferenial a unei mini,
ci i pentru picior, hemicorp sau pentru organele de sim cele mai performante
(ochi i urechi), putndu-se vorbi de o lateralizare omogen sau eterogen
(ncruciat);
problemele de citit-scris-vorbit apar mai frevent la anumite categorii de stngaci
(lateralizare ncruciat, nefamilial, patologic etc.);
s-a avansat ideea c modul de tratare cerebral a informaiei de ctre stngaci este
mai curnd integrat-holistic i nu analitic-discursiv ca la dreptaci, de unde i
plusul lor de intuiie i de creativitate;
stngacii se ntlnesc mult mai frecvent printre cei care urmeaz meserii vizuale,
i foarte rar n cele dependente de limb;
msurarea gradului de lateralizare cunoate cteva metode10 de tip chestionar, dar
pot fi gndite i metode bazate pe aciune i observare (Annett, 1972);
dincolo de stngcia sau de dreptcia tare, exist variantele lor mai moi, o
multitudine de probleme fiind asociate mai curnd cu lipsa unei lateralizri
ferme, dect cu stngcia n sine;
stngcia pare s aib efecte dezadaptative colar mult mai mari printre elevii de
gen masculin dect printre cei de gen feminin.

9
Annett, M. (1992). Spatial ability in subgroups of left- and right-handers. In British Journal of Psyuchology, 83, pp.
493-515.
10
Oldfield, 1971: Edinburgh Handedness Questionnaire; Annett, 1970: Laterality tests and interests.

129

Din toat aceast mas de informaii i din altele de acelai tip trebuie extras cea de
interes pentru scopurile scalei ce va fi construit. Operaionalizarea enormei mase de informaii
despre stngaci i stngcie nseamn traducerea acesteia ntr-o form care s poat fi msurat, n
cazul de fa sub forma itemilor unui chestionar sau a unor probe practice care vor compune itemii
unui test de lateralitate. Aa cum se observ, unele dintre informaiile de mai sus par a fi mai
importante dect altele, avnd rolul de a ghida ntregul demers de construcie a scalei. Mergnd de
exemplu pe modelul genetic al lui Annett vom putea determina opt categorii referitoare la
lateralitatea manual. Dac se are n vedere problema omogenitii/eterogenitii lateraliztii va
trebui s se generm i s se includ n scal itemi legai de preferina pentru membrele
inferioare, pentru ochi, ureche, hemicorp. Dac se ia n calcul dimensiunea ereditar a stngciei
vom include itemi legai de frecvena acestei particulariti printre rudele apropiate, iar dac avem
n vedere dimensiunea ei evolutiv pe scala vrstelor vom include itemi care s disting ntre
manifestrile timpurii i cele ulterioare ale stngciei.

b. Nivelul de specificitate al scalei


Din exemplul de mai sus se poate vedea c problema lateralizrii poate fi abordat ntr-un
cadru mai larg i mai general sau ntr-un cadru mai restrns i mai specific. Faptul de a fi mai
global (comprehensiv) poate fi un avantaj, dar preul pltit este o lungime mai mare a scalei i o
consisten intern mai sczut. Se tie ns c, cu ct nivelul de specificitate al scalei este mai
ridicat, itemii se coreleaz mai strns ntre ei i cu constructul sau variabila latent msurat.
Exemple
Dac chestionarul de lateralitate construit este unul antropologic, el va include
itemi care privesc atitudinea cultural fa de dextralitate, cum ar fi dac ai prefera
s fii operat de un chirurg dreptaci sau stngaci (Holder, 1992, Hand Preference
Questionnaire11); dac scala este destinat vrstei de peste 14 ani, ea poate fi una
care doar ntreab oamenii despre mna cu care scriu, deseneaz, taie, arunc, se
perie, mtur, deschid o cutie etc. (Edinburgh Handedness Inventory, EHI,
Oldfield, 197112); dac este destinat determinrii obiective a minii dominante, se
vor folosi itemi acionali, grupai ntr-o scal ca cea a lui Annett, unde se folosesc
n aciune efectiv cocoloae de hrtie, foarfece, chibrituri, periu de dini, ciocan
de jucrie etc. Copiii pot fi examinai i n clas, cerndu-li-se s se joace n
perechi pentru a exersa aciunile care vor fi observate, fapt ce va face posibil
completarea grilei de observaie sau a chestionarului acional de ctre observator.
ntr-o abordare de tip obiectiv noi13 am propus determinarea unui indice de
lateralitate prin dou probe de aciune, cronometrate: tapping (puncte btute rapid
pe o foaie de hrtie cu creionul, cu mna dreapt, apoi cu mna stng, cte 10
secunde pentru fiecare, singura constrngere fiind numrul de puncte) i trasaj
(linii verticale, drepte, apropiate, executate rapid, cte 6 secunde cu mna dreapt,
apoi cu cea stng, dup o execuie demonstrativ prealabil a examinatorului).
Gradele de specificitate i de obiectivitate cele mai ridicate sunt n ultimul
exemplu, deoarece probele sunt simple, clare, uor de testat, iar dispozitivul de
130

nregistrare este unul precis. Mai mult, se operaionalizeaz bine problema


lateralizrii pentru sarcinile motrice grosiere i pentru cele de finee, ambele sarcini
putnd fi agregate ntr-un concludent Indice motric.
De aceast cerin a specificitii scalei se leag i problema a ce includem n ea
pentru a fi msurat. n cazul de mai sus distincia este evident: itemii sunt de tip
autoraportare (primul exemplu), rezultai din observaie (al doilea exemplu) sau
rezultai din msurarea efectiv a unor comportamente induse (al treilea exemplu).
Dac am alctui o scal care amestec cele trei maniere de obinere a itemilor ar
rezulta probabil un instrument compozit, eterogen i deci mai puin maniabil.
Problema se refer ns nu numai la cum sunt produi itemii, ci i la coninutul lor. De
exemplu, dac concepem anxietatea ca pe un fenomen psihic (o team difuz, fr obiect) nu are
rost s amestecm elemente somatice ntr-o fenomenologie psiho-comportamental. Dar dac am
relevat conotaiile psihosomatice ale acesteia, putem concepe i operaionaliza anxietatea mult mai
nuanat, dintr-o component afectiv, una cognitiv i una somatic, aa cum a procedat Burns n
chestionarul su. Acesta i-a construit Inventarul de anxietate astfel nct indicele global obinut
s fie o expresie a sentimentelor anxioase, a gndurilor anxioase i a simptomelor anxioase de
ordin fiziologic. Aceast perspectiv asupra anxietii este mult mai nuanat i mai util ntr-o
cercetare despre stres dect una care ar evalua doar aspectele cognitive sau afective ale anxietii.
Pe de alt parte, ntr-un chestionar de scheme cognitive anxioase ar trebui respectat reeta
cognitivist de abordare, fiind eliminate referirile somatice la anxietate, n favoarea cogniiilor
patologice.

U3.3.2. Pasul al doilea:


Generarea unui set mare de itemi
a. Lungimea i redundana setului iniial de itemi
Pasul acesta presupune crearea efectiv a unui mare numr de itemi, posibili candidai la
forma final a scalei. Acetia trebuie s fie gndii astfel nct s fie efectiv n legtur cu
constructul latent msurat, dei dovezile n acest sens vor fi culese mai trziu. Scopul de ansamblu
al scalei va fi cel care ne ghideaz n procesul de generare al itemilor, care sunt proiectai fiecare
ca un mic test separat, corelat cu variabila latent msurat. Dac fiecare item este sensibil asociat
cu aceast variabil, prin agregarea unui numr mare de itemi se sper ca scala rezultat s fie o
expresie mult mai concludent a variabilei sau a constructului respectiv. Un test/scal bun() este
aa datorit celor mai mici uniti care l compun i care sunt itemii si.
S ne reamintim...
Universul itemilor care descriu un construct psihologic este foarte larg i deschis,
de aceea nu se pot stabili cu precizie graniele sale. Vom fi de acord ns c putem
asambla un numr mare de itemi, c acetia pot corela ridicat ntre ei la un nivel
ridicat, scala fiind una omogen, fr ca doar prin aceasta scala s fi prins esena
constructului respectiv. Fericire, sens existenial, satisfacie n munc, adaptare
131

colar sau la locul de munc, complian, identitate sexual, satisfacie marital


etc. sunt concepte vagi, care au nevoie de un cadru teoretic care s le clarifice, dar
i de o bun experien pentru a genera itemii care s le surprind esena.

O problem important a acestei faze de construcie a scalei este cea a redundanei:


trebuie ea evitat, trebuie admis, i pn la ce nivel? Teoreticienii admit c, atunci cnd vrem s
construim o scal, redundana nu este deloc un lucru ru, aceasta deoarece itemii redundani sunt
i intercorelai, prezena lor ducnd la creterea consistenei interne a scalei. Singura problem este
s avem o redundan bun, folositoare, care se refer la constructul msurat, i nu la aspecte
incidentale ale itemilor, cum ar fi acelea legate de detalii minore de formulare. Cnd exprimi
aceeai idee n dou moduri distinct diferite, redundana respectiv poate fi util, pentru c nu se
poate ti cu siguran care dintre formulri este mai diagnostic i mai bine acceptat de subieci.

Exemple
Nu am nici un fel de jen n a aborda persoane necunoscute i mi vine uor s
intru n vorb cu persoane necunoscute sunt enunuri foarte similare, deoarece au
n vedere dimensiunea inhibiiei, definitorie pentru fobia social. Diferenele nu
sunt ns pe sensul principal al enunurilor, ci pe conotaiile rezultate din modul de
exprimare al ideii: n prima situaie propoziia ncepe negativ, n a doua afirmativ;
n prima cuvntul jen are i conotaii etice (fr ruine), ceea ce nu este cazul n
ceade a doua; n prima formulare a aborda este mai pretenios dect mai familiarul
a intra n vorb. Nu tim ns care dintre cele dou formulri este cea mai bun i
de aceea le putem include n forma iniial a scalei, urmnd s amnm decizia
legat de selecia celui mai bun item pn la prelucrarea datelor rezultate din
aplicarea instrumentului.

Construii un exemplu similar cu cel analizat anterior, apoi analizai elementele


care fac diferena ntre enunurile formulate.

O regul spune c putem tolera o oarecare redundan n faza final de construcie a unei
scale, dei teoretic este permis mai mult redundan n faza iniial dect n cea final, pentru a
da ocazia constructorului scalei s-i manifeste preferinele i s selecteze forma mai bun a
itemilor redundani. Problema redundanei angajeaz direct o problem la fel de important, cea a
numrului de itemi care compun setul iniial. Se tie c un atribut fundamental al unei scale bune
este consistena intern ridicat, aceasta fiind dependent de dou lucruri: de gradul de corelare al
fiecrui item cu scorul final la constructul msurat i de numrul de itemi ai scalei. De aceea
putem afirma c, cu ct un set iniial de itemi este mai larg, cu att este mai bine, deoarece avem
de unde selecta. Trebuie tiut ns i faptul c un set iniial de itemi prea extins, dintre care muli
132

se repet, poate genera consumuri de timp suplimentare, sau chiar plictiseal, putnd compromite
sinceritatea i autenticitatea rspunsurilor. De aceea cercettorul poate elimina din start itemii
neclari, cu relevan sczut sau cu prea mult similaritate, pentru a rmne n final la un set iniial
rezonabil, pe care s-l aplice ntr-o singur edin, pentru a nu avea prea mult moarte
experimental.
Dei nu exist reguli fixe, paritatea dintre lotul iniial de itemi i cel final poate fi de de 4/1
sau 3/1 (30-40 de itemi iniiali pentru o scal de 10 itemi) sau, cel mai adesea de 2/1, atunci cnd
itemii sunt construii cu grij i cu o bun cunoatere a constructului msurat. Deoarece forma
iniial depinde de cea final, ct de lung trebuie s fie o scal pentru a avea caliti psihometrice
bune? Este un rspuns dificil de furnizat, deoarece fiecare item poate fi considerat ca o singur
scal i exist chiar scale alctuite dintr-un singur item.14 n mod obinuit, cu ct o scal are mai
muli itemi, cu att mai mult ea poate dispune de caliti psihometrice (fidelitate, validitate,
sensibilitate) mai bune; 50-60 de itemi pentru o scal unidimensional reprezint limita de sus, iar
10-20 de itemi limita de jos. Scalele sub 10 itemi pot fi utile instrumente de screening, dar nu
difereniaz dect grosier ntre subieci, pe cnd scalele lungi dau diferenieri de mai mare finee.

b. Reguli de scriere a itemilor unei scale


Dei procesul cel mai delicat, mai creativ i interesant din toat ciclicitatea descris aici,
scrierea itemilor nu este strict normat, lsnd loc masiv inspiraiei, creativitii i experienei n
domeniu. Scopul acestei etape este acela de a identifica o multitudine de maniere n care
constructul se leag de viaa real sau de comportament. Pentru aceasta recursul la instrumente
similare, la literatura (adnotat) a problemei pot fi foarte utile (itemi de import), dar la ce bun s
ncerci s compui o scal cnd deja exist altele similare? Motivul pentru care ncercm altceva
este pentru c sperm s o facem mai bine dect alii sau pentru c mergem pe o cale nou i
nebttorit. A scrie repede, la inspiraie i relaxnd spiritul critic poate fi modul de lucru cel mai
recomandat, dei nclin s cred c aceast faz este cu att mai productiv cu ct creativitatea i
spontaneitatea ei sunt mai bine pregtite prin faza de documentare teoretic (parcurgerea literaturii
aferente pentru a ne face o idee cuprinztoare i nuanat despre constructul n cauz) i prin faza
de incubaie/gestaie, cnd lsm informaia s dospeasc i s se decanteze.
Un creator avizat tie c nainte de a se aterne pe scris itemi el trebuie s aib o
reprezentarea complex i nuanat a constructului de msurat; c a notat determinrile eseniale
ale acestuia pe o foaie de hrtie, pe care le-a studiat ncercnd s le pun mental n legtur cu
tema scalei sale, pentru a-l orienta ca un ghid de start. De exemplu, fericirea conjugal depinde ea
doar de calitatea vieii sexuale a cuplului, sau i de implicarea soilor n responsabilitile casnice
(creterea copiilor, elaborarea bugetului i a modului de cheltuire a banilor, implicarea n
curenie), de calitatea comunicrii dintre soi, de gradul de independen reciproc acordat, de
valorile comune, de tolerana fa de profesia celuilalt, de acceptarea prietenilor partenerului, de
multitudinea de proiecte i interese comune, de jocurile comune, de aspectele hedonice i
nonhedonice ale relaiei etc.?

133

S ne reamintim...
Dei este foarte greu de fixat reguli precise dm mai jos cteva caracteristici ale
itemilor buni i ri, indicnd i cele mai frecvente erori care pot aprea n scrierea
acestora.
Dei nu este indicat s sacrificm nelesul itemilor n favoarea scurtimii lor se
recomand ca itemii s fie scuri i clari. Putem formula acelai item astfel: La
o petrecere rein cu uurin chipurile i numele musafirilor; mi trebuie destul
de mult timp i am adesea mari probleme n a memora de la prima ntlnire
numele sau chipurile invitailor la o petrecere mai mare. Al doilea enun este de
evitat pentru c este lung i neclar, pentru c introduce termenii destul de mult i
mai mare, care sunt vagi.
Nivelul de dificultate al citirii la care sunt scrii itemii este de asemenea
important. Iat doi itemi din Miller Marital Locus of Control: Adesea gsesc
comportamentul soului meu nepredictibil; Cnd suntem n conflict, soul meu
este acela care reconciliaz cel mai adesea situaia. Cuvintele nepredictibil i
reconciliaz in de un nivel mai ridicat de cultur, fiind pretenioase n raport cu
omul comun. Dei exist o mulime de metode de a determina vrsta lecturii, s-a
czut de acord c nivelul de lectur al omului care citete ziarul este
corespunztor clasei a asea (12 -13 ani). Multe chestionare de personalitate
(MMPI, CPI, NEO PI-R) presupun o vrst a lecturii tipic acestui nivel,
fenomen de care dac nu inem seama, reducem spectrul de utilizare al unui
instrument doar la anumite categorii de persoane. O propoziie de lungime medie
pentru clasa a asea are ntre 14 - 18 cuvinte i 24 de silabe; pentru clasa a aptea
ea are 18 cuvinte i 28 de silabe. Pentru majoritatea instrumentelor care aspir
spre o utilizare extensiv n populaie nivelul de lectur anticipat este ntre clasa
a cincea i a asea. Dificultatea citirii i nelegerii unui text provine nu numai
din lungimea sa, ci i din caracteristicile sintactice i semantice ale itemului.
Cele mai frecvente erori de evitat sunt negaia, dubla negaie i enunurile dublu
ncapsulate (cu dubl determinare). De exemplu formularea Nu-mi place s numi fac temele trebuie evitat, pentru c rspunsul solicit un efort de analiz
mare iar rezultatul final este nesigur. De fapt i negaia simpl creeaz probleme
de claritate: la itemul Nu-mi plac rromii rspunsul Nu poate s semnifice
simultan acordul (nu, nu-mi plac) sau dezacordul (nu sunt de acord cu propoziia
respectiv). Dubla determinare este mai greu de sesizat. M enerveaz la culme
invidia i dorina de rzbunare a oamenilor pune respondentul n dificultate
atunci cnd sursa enervrii sale este ori numai invidia, ori numai dorina de
rzbunare. Scorul pozitiv la acest item nu distinge dac prima, a doua sau ambele
determinri trebuie s fie prezente pentru a rspunde afirmativ la itemul
respectiv. Alt exemplu: Sprijin drepturile rromilor pentru c discriminarea este
un pcat pedepsit de Dumnezeu. Pot s sprijin drepturile rromilor pentru c
134

discriminarea este mpotriva valorilor democraiei, pe care eu le apr, i nu


pentru ea c este un pcat pedepsit de instana divin.
Trebuie evitate pe ct se poate erorile de formulare care produc ambiguitate.
Reprezentanii notri din guvern ar trebui s susin cu mai muli bani
cercetarea tiinific induce confuzie din cauza pronumelui notri: se refer la
noi ca popor, la noi ca grup de partid sau la noi, cei din sistemul de nvmnt?
Alteori confuzia pleac de la utilizarea formei adjectivale n locul substantivului:
Tratamentul diabetului trebuie s fie o prioritate a sistemului de sntate sun
mai bine i mai clar dect Tratamentul diabeticilor trebuie s fie o prioritate a
sistemului de sntate, pentru c un sistem de sntate se lupt cu boala la
modul cel mai general, i abia n secundar cu cei care i-au czut deja victim. La
aceste surse de ambiguitate se mai adaug i propoziiile cu dublu neles.
Guvernul N. a dat n primire corect gestiunea rii poate produce mult ilaritate
i confuzie printre respondeni din cauza sintagmei a da n primire care n jargon
nseamn a muri.
Propoziii cu coninut pozitiv i negativ prezente n aceeai scal constituie o
precauie necesar pentru a evita distorsionarea rspunsurilor subiectului prin
nevoia de conformism, de a fi de acord sau de a consimi. n chestionarul de
Stim de sine (RSE) al lui Rosenberg (1965) propoziia A vrea s am mai mult
respect pentru mine este urmat de Uneori m simt inutil, ambele afirmative
ca form, dar una cu coninut pozitiv, celalt negativ. Acest lucru oblig
respondentul s evalueze cu atenie fiecare item nainte de a da un rspuns, ceea
ce duce la evitarea tendinelor de contaminare pe care l-ar produce formularea
exclusiv pozitiv a itemilor. DeVellis i Callahan (1993)15 remarc faptul c
aceast precauiune de a introduce itemi cu polaritate invers, negativ, are un
pre, deoarece se poate produce o confuzie (mai ales n cazul chestionarelor
lungi) ntre gradul de acord al respondentului i coninutul itemului, fr a mai
ine cont de polaritatea negativ i de exprimarea triei atributului msurat.
Concluzia este aceea c itemii formulai n direcie opus au performane mai
slabe dect cei cu orientare direct i c dezavantajele includerii lor n scal
atrn mai greu dect presupusele beneficii. Soluia este, mai ales pentru
chestionarele mai lungi, ca numrul acestor itemi s fie mai mic dect cei
formulai pozitiv, dar s fie diseminai printre acetia.

U3.3.3. Pasul al treilea:


Determinarea tipului de format al msurtorii
Aceast chestiune are n vedere mai puin itemul i mai mult formatul tipului de scal pe
care subiectul va rspunde. Dei muli autori nu fac distincia ntre o scal i un index, aceasta
exist i trebuie luat n considerare. O scal difer de un index prin aceea c ntr-un index itemii
nu au nevoie s fie pui ntr-o anumit ordine, fiecare item avnd aceeai pondere i importan,
135

ceea ce permite nsumarea lor cu scoruri egale, rezultatul fiind chiar indexul. n sens foarte larg, o
scal este un set de numere ori de alte simboluri utilizate pentru a desemna caracteristici ale unei
variabile i care este utilizat pentru msurare. Numerele de pe un termometru sau cuvintele mic
mediu i mare de pe cutia de aer condiionat sunt scale. Vogt (1999, p. 256) distinge i un
neles mai special al cuvntului scal, care este ... un grup de msuri relaionate cu o variabil.
Itemii dintr-o scal sunt aranjai ntr-o anumit ordine a intensitii sau a importanei lor.16

a. Scalele Likert
Sunt cele mai larg utilizate n tiinele sociale pentru determinarea atitudinilor datorit
faptului c sunt uor de construit i tind s aib o mare fidelitate, ele fiind potrivite i pentru
construcute multidimensionale. Rspunsurile respondentului sunt gradate de la Puternic de acord,
De acord, Nici acord, nici dezacord, Dezacord, Dezacord puternic. Tipul de expresii verbale
pentru a msura intensitatea poate varia considerabil, subiecii putnd fi chestionai dac aprob n
totalitate, aprob parial, dezaprob uor, dezaprob n totalitate. Deoarece scalele Likert sunt
destinate opiniilor, atitudinilor i credinelor, apare o problem legat de alegerea rspunsurilor
potrivite pentru categoriile extreme, care nu trebuie s fie de genul ntotdeauna sau niciodat,
pentru c aceste situaii se ntlnesc destul de rar n viaa real. n consecin, ele vor fi alese ct
mai rar, pentru a nu contribui prin aceasta la descreterea variabilitii scorurilor pentru itemul
respectiv. De fapt, scalele Likert au o interesant caracteristic, rezultat din faptul c ele au dou
modaliti de a grada intensitatea constructului respectiv pentru populaia studiat. Una ine chiar
de modalitile de gradare a acordului/dezacordului din variantele de rspuns propuse, fapt de care
am vorbit deja; o a doua modalitate ine de tria/slbiciunea modului cum este exprimat itemul
nsui.
Exemplu
Opinia despre politicienii romni post-decembriti ar putea fi exprimat la trei
niveluri de trie (duritate):
1. Dezastrul moral i economic din Romnia post-revoluionar este integral opera
politicienilor incompeteni pe care i-am avut.
2. Neavnd o clas politic constituit n timp, liderii politici ai Romniei postrevoluionare au ntrziat reformarea economic i social a rii din cauza greelilor
provocate de lipsa lor de experien.
3. n pofida unor greeli cauzate de lipsa de experien, politicienii romni sunt pe cale
s construiasc o democraie real n Romnia post-revoluionar.

Cum tendina obinuit a majoritii oamenilor este aceea de nu fi din bun sim
prea ofensiv-agresivi, prima afirmaie ar putea discrimina doar printre cazurile
extreme, deoarece este una foarte tare. Ultima afirmaie, care este cea mai moale i
mai mpciuitorist, avnd un caracter mai agreabil, ar putea conveni majoritii
oamenilor, dar ar putea indica mai mult lipsa opiniei, dect prezena ei. Ori o
cercetare caut mai curnd ceea ce este i se manifest (prezena), dect ceea ce nu
este (absena).
136

Aadar, este o iluzie s credem c un item poate baleia ntreg spectrul unei opinii n uniti
de lungime egal. Avem doar posibilitatea ca, din combinarea triei/slbiciunii modului de
formulare a itemilor i din tipurile de gradaii de pe scala de rspuns folosit s centrm itemul
pentru zona populaional i pe problema care ne intereseaz. Itemul trebuie s rspund la
ntrebarea: Cum sunt dispui s rspund oamenii la diferitele intensiti sau trii ale
constructului msurat prin acest item?

Exemple
Prezentm mai jos dou exemple de itemi construii pe scala Likert.
Prin sistemul reformei de la Bologna, nvmntul romnesc s-a integrat bine n
nvmntul european.
1. Dezacord 2. Dezacord 3. Dezacord
4. Acord
5. Acord
6. Acord
puternic
moderat
uor
uor
moderat
puternic
Combaterea consumului de igri este o prioritate naional de vrf.
1. Complet
2. Mai curnd
3. Aa i aa
4. Mai curnd
adevrat
adevrat
neadevrat

5. Complet
neadevrat

b. Scalele Thurstone
Modalitate complex, rafinat i dificil de a construi itemii unei scale, iniiat de
Thurstone, acest tip de scal i-a pierdut mult din relevan n favoarea scalelor Likert. n principiu
elegana i dificultatea metodei vine din pre-calibrarea itemilor i asamblarea lor pentru a rspunde
la niveluri distincte de prezen n item a atributului sau a constructului msurat. De regul, n
acest tip de scal rspunsurile nu mai au o multitudine de nuane, deoarece gradarea intensitii
este pe vertical (mai muli itemi asamblai pe o aceeai coloan n funcie de mrimea progresiv
a atributului msurat), i nu pe orizontal (modaliti din ce n ce mai accentuate ale intensitii
sau frecvenei atributului la un singur item, tipic pentru scala Likert). Astfel, pentru aceeai idee se
genereaz mai muli itemi (care au formulri diferite) care s reprezinte intervale egale de-a lungul
unui continuum vertical, ceea ce confer scalei proprieti matematice remarcabile, pentru c se
preteaz la tratamente statistice tipice scalelor de interval. Nunaly (1978) susine c este
incomparabil mai uor s explici principul unei scale Thurstone dect s o construieti. A gsi
itemi care s rezoneze la intervale egale cu constructul msurat (ca un diapazon acordat pe o
anumit frecven) este destul de dificil. Acest deziderat exprimat de scalele Thurstone i-a gsit
totui o manier de rezolvare prin Teoria rspunsului la itemi, unde calibrarea acestora urmrete
totui un cu totul alt demers. Prezentm mai jos dou rspunsuri tipice pentru scala Thurstone.
Exemplul 1
1. Cnd un elev are dificulti de nvare, profesorii:
Adevrat
l insult
l critic sau ironizeaz
i ntrerup rspunsul
137

Fals

Nu au nici o reacie
i explic suplimentar
l ncurajeaz
Fac cu el pregtire dup ore

Exemplul 2
a. Faptul de a termina cu medie mare coala i de a prinde un liceu bun este tot ce-mi
doresc ca rsplat de la copilul meu.
Acord ........................ Dezacord ...........................
b. Pentru mine ca printe cea mai mare rsplat din partea copilului este s fie sntos i s
mearg la coal.
Acord ........................ Dezacord ..........................
c. Fericirea copilului meu nu are nimic de-a face cu ceea ce el dobndete prin educaia
colar.
Acord ........................ Dezacord ..........................

Modalitatea de gradare pe vertical i de construire a ierarhiei nu este o operaiune foarte


simpl. Metoda utilizat de Thurstone (1929) a fost cea a comparrii perechilor de rspunsuri,
deoarece ea presupune ca subiecii-observatori s judece de exemplu enunurile A, B, C luate cte
dou (A cu B, A cu C i B cu C), s evalueze din frecvena aprecierilor ordinea ierarhic a celor
trei enunuri, dup care s construiasc un indice pentru distana dintre ele, care va fi exprimat n
termeni de probabilitate prin raportarea la curba lui Gauss. Scala obinut n felul acesta va putea
fi verificat: pornind de la valorile ei trebuie s se poat face predicii asupra viitoarelor alegeri ale
indivizilor.17

c. Scalele Guttman
Acestea sunt un tip de scal creat de Louis Guttman. Original ea a fost destinat s fie
utilizat dup ce datele au fost colectate, pentru a vedea dac itemii dintr-un index pot fi aranjai
ntr-o scal n funcie de tria sau de puterea lor.
Exemplu
ntr-o cercetare despre avorturi itemii unui chestionar pot fi aranjai ierarhic ca
intensitate astfel:
Ai fi de acord ca femeia s fac avort dac:
1. Ea nu mai dorete s aib copii.
2. Este prea srac pentru a se putea ocupa n mod adecvat de copil.
3. Ftul are o boal genetic grav sau este malformat.
4. A nu face avort ar periclita viaa proprie a femeii.

Cine ar rspunde la aceast ntrebare ar face-o ntr-o manier scalar: persoanele


care au rspuns afirmativ la ntrebarea 4 ar fi rspuns afirmativ i la ntrebrile 1,
2, 3; cele care au rspuns la ntrebarea 3 ar fi rspuns i la ntrebrile 1 i 2, dar
nu obligatoriu i la 4, i aa mai departe. Dac scala nu ar fi de tip Guttman, nu
ar exista un astfel de pattern i rspunsul afirmativ la numrul 4 nu ar implica
rspunsurile afirmative i la celelalte 3 ntrebri.
138

Scalele Guttman sunt foarte utile i indicate pentru informaiile obiective sau n situaiile n
care este logic necesar ca, dac ai rspuns afirmativ la un anumit nivel dintr-o ierahie, aceasta
nseamn s faci acelai lucru i pentru nivelurile inferioare ale ierarhiei.

Exemplu
De exemplu, la ntrebarea dac fumai, variantele de rspuns pot fi organizate
ierarhic astfel: nu fumez deloc; fumez sub 10 igri pe zi; fumez sub 20 de igri pe
zi; fumez sub 30 de igri pe zi; fumez mai mult de 30 de igri pe zi. Variantele de
rspuns sunt aranjate astfel c nivelul la care este prezent atributul este indicat de
cel mai de sus item la care subiectul a dat un rspuns afirmativ, cei de sub el fiind
i ei implicit afirmativi (deoarece reprezint niveluri mai sczute ale atributului).
Deci aceast scal presupune o gradaie i decelarea punctului critic n care rspunsul
afirmativ devine negativ. Dac pentru informaiile obiective scala Guttman este foarte indicat,
pentru alte categorii de fenomene este mai dificil de ordonat rspunsurile ntr-o manier uniform
pentru toi indivizii, fapt care limiteaz utilizarea acestui tip de scal. Pentru situaiile n care
ordonarea itemilor este important, modelele bazate pe teoria rspunsului la itemi par a oferi
soluii mai adecvate.

Exemplu
Prezent mai jos doi dintre itemii scalei de depresie Beck (BDI), asamblai pe o
scal Guttman.
A. TRISTEE
1. Nu m simt trist.
2. M simt trist.
3. Sunt trist tot timpul i nu pot scpa de tristee.
4. Sunt att de trist i de nefericit nct nu mai pot suporta.
B. PESIMISM
1. Viitorul nu m descurajeaz.
2. M simt descurajat cnd m gndesc la viitor.
3. Simt c nu am ce atepta de la viitor.
4. Simt c viitorul este fr speran i nimic nu se mai poate ndrepta.

d. Scala de distan social Bogardus


Acest tip de scal a aprut n 1923, fiind destinat s msoare distana social, adic
distana care separ un grup de altul. De aici rezult posibilitatea de a da o expresie msurabil
raporturilor de discriminare social dintre grupurile etnice, naionale sau religioase. Scala
Bogardus poate fi considerat n acelai timp i o scal de proximitate deoarece indic cea mai
mic proximitate acceptabil pentru un individ fa de grupul luat n considerare. Individul este
chestionat dac ar fi dispus, de exemplu, s triasc n aceeai ar cu rromi; s triasc n aceeai
localitate cu acetia; s aib vecini rromi; s locuiasc n aceeai cas cu rromi; s aib prieteni de
etnie rrom; s aib rude rromi; s aib un copil care se cstorete cu o persoan de etnie rrom.
139

Populaiile pot fi comparate simultan trecnd pe vertical categoriile de proximitate iar pe


orizontal populaiile ce vor fi comparate: negri, latino, europeni, asiatici, sau turci, evrei,
polonezi, spanioli etc., pentru America. Sau romni, maghiari, sai, igani, ruteni etc. pentru
Romnia. Evident, distanele studiate sunt unele sociale i nu fizice, dar exprimarea n termeni
fizici a acestora este judicioas. Acest tip de scal permite compararea atitudinilor grupurilor fa
de alte grupuri deoarece enunurile despre obiectul social studiat pot s fie astfel clasate pentru a
indica fie proximitatea, fie distana. Scalele construite n acest fel dau rezultate n acelai timp
interesante i valide apreciaz Laurens i Moscovici (op. cit., p. 391).

e. Numrul optim al categoriilor de rspuns


Cei mai muli dintre itemii scalelor se prezint sub forma unui trunchi comun care este
enunul de baz al itemului, i o categorie de descriptori care s indice gradul de acord/dezacord al
respondentului cu enunul respectiv. Atenia noastr ce centreaz acum pe aceast a doua
categorie. Statistica ne nva c o caracteristic important a unui item sau set de itemi este
variabilitatea/variana sa. Teoria rspunsului la itemi determin tocmai relaia existent ntre
variabilitatea itemului i a scalei ca ntreg. Cu ct este mai mare aceast variabilitate cu att este
mai bine, deoarece variabilitatea itemilor contribuie la creterea variabilitii de ansamblu a
ntregii scale. Cu ct ea este mai mare, cu att se pot determina mai multe categorii de scor i deci
scala este mai discriminativ.
Variabilitatea unei scale depinde de doi factori: de numrul itemilor (cu ct mai muli
itemi, cu att mai mult variabilitate) i de numrul variantelor de rspuns pe care acetia le
prezint (cu ct mai multe, cu att mai mare este i variabilitatea itemului). De aici i interesul
pentru problema abordat n acest paragraf. Vom distinge deci existena unor itemi cu o manier
de scorare srac. Deoarece sunt necesare cel puin dou posibiliti de rspuns, acest mod de
operare poart numele de scorare binar. n msura n care exist posibilitatea de a avea o
multitudine de clase de scor, s zicem 100, cum se poate distinge fr fals precizie ntre nivelurile
de anxietate 66 i 67, de exemplu? Cu ct mai multe clasele de rspuns, cu att posibilitatea de a
diferenia realmente ntre valorile de scor apropiate descrete. n practic rareori se folosesc mai
mult de 7-11 clase de scor i foarte frecvent ntre 3 i 7.
Opiunea binar de scorare este frecvent utilizat, cci, dei au cea mai mic variabilitate a
scorurilor per item, scalele de acest tip se completeaz extrem de facil i rapid, lsnd deschis
posibilitatea de a introduce un numr mai mare de itemi pentru a crete variabilitatea de ansamblu
a scalei sau pentru a vedea cum noi categorii de fapte coroboreaz cu constructul msurat. Aceast
manier de scorare este tipic dar nu exclusiv! scalelor Thurstone i Guttman datorit
complexitii de construcie a itemului, care agreg pe vertical mai multe enunuri gradate
ierarhic. De asemenea, acest tip de itemi este numit i cu alegere forat18. Datorita uurinei cu
care se lucreaz, opiunea binar este extrem de util n completarea listelor de adjective prin care
se investigheaz trsturile de personalitate (modelele Big Five).
Dac la un pol sunt opiunile binare, la celallalt pol este numrul mare sau foarte mare de
clase de scor care pot aduce, cum am artat anterior, o fals precizie, adic o fals variabilitate.
Din statistic se tie c variabilitatea poate fi descompus ntr-o parte bun, numit i sistematic,
140

deoarece este strns legat de oscilaiile reale ale prezenei constructului msurat n item, i dintr-o
parte rea, numit eroare. Deoarece cretarea variabilitii pe scalele cu numr mare de variante de
rspuns se face n contul erorii, i nu al variabilitii sistematice, nu este indicat s avem prea
multe valori de scor. Numrul acestora este impus finalmente de abilitatea respondenilor de a
discrimina semnificativ ntre variantele de scor propuse pentru fiecare item. Aceast capacitate
depinde i de aranjarea n pagin a variantelor de rspuns asfel nct acestea s sugereze un
continuum.

Exemplu
Astfel secvena de mai jos sugereaz bine un continuu temporal, divizat n uniti
discrete de tipul frecvenei de apariie.
Aproape niciodat

Rareori

Din cnd n cnd

Deseori

Aproape mereu

O problem important este dac optm pentru un numr impar de categorii de rspuns,
ceea ce n principiu este bine, pentru c se creeaz o anumit simetrie n jurul unui punct zero
natural. Acest fapt ofer ns de multe ori indeciilor posibilitatea refugierii n rspunsul evaziv
din mijloc. Numrul par sau impar de opiuni este mai puin important dect modul cum sunt
aranjate variantele de rspuns astfel ca distanele dintre ele s fie aproximativ egale pentru a
exprima gradul de acord sau de dezacord. Aceasta pentru c datele vor fi codificate numeric prin
cifre (1, 2, 3, 4, 5 pentru cinci variante de rspuns, de la foarte puin sau deloc, la foarte mult sau
n ntregime, ori invers 7, 6, 5, 4, 3, 2, 1 pentru o scal care ncepe de exemplu cu totdeauna i se
termin cu niciodat). Se poate construi astfel un continuum divizat ntr-un numr de trepte (3-7
trepte), de la dezacordul total, la acordul deplin sau invers.
n legtur cu punctul de simetrie din mijloc, el poate avea semnificaii diferite. Astfel nici
acord, nici dezacord indic mai curnd o atitudine apatic, pe cnd la fel de mult acord i
dezacord sugereaz o atracie egal fa de ambele variante de rspuns. Deci, n cazul numrului
impar de variante de rspuns trebuie s controlm ca subiectul s nu selecteze varianta neutr doar
pentru a evita o alegere, oferind astfel un rspuns echivoc, cu o valoare discutabil. n majoritatea
situaiilor cercettorul ncearc s evite echivocul punctului central i s foreze o alegere clar,
dar trebuie spus c opiunea pentru variante pare/impare de rspuns este funcie de ntrebare, de
rspus i de scopul investigaiei. ntr-o cercetare cu dou variante extreme de rspuns (ce situaii
preferi: pe cele plicticoase?; pe cele primejdioase?) introducerea variantei de rspuns ntre cele
dou poate fi pe deplin justificat, subiecii neputnd alege ntotdeauna ntre situaii att de
tranant delimitate.
Ca tip de format al rspunsurilor amintim i diferenialul semantic al lui Osgood i
Tannenbaum (1955). Utilizat n studierea atitudinilor de grup, acest mod de scalare presupune
identificarea unui grup ce este studiat (s zicem avocai) i a unei liste de perechi de adjective.

Exemplu
Onest
Competent
Vorbre

__ __ __ __ __ __ __ __ __ Neonest
__ __ __ __ __ __ __ __ __ Incompetent
__ __ __ __ __ __ __ __ __ Taciturn
141

Liniuele (de regul 7 sau 9) reconstituie un continuu ntre polii definii de cele dou
adjective, subiectul marcnd cu un X punctul de pe acest continuu pe care el crede c se afl
membrii categoriei respective, dup care trece la ratingul urmtoarei perechi de adjective, pn la
epuizarea ntregii liste. Prin prelucrarea separat pe fiecare pereche de adjective se poate obine un
portret robot al grupului respectiv. Deoarece acest tip de scal are foarte multe din caracteristicile
necesare unor prelucrri matematice riguroase, finalmente itemii valoroi care au fost selectai pot
fi asamblai ntr-o scal omogen (de onestitate, de competen, de moralitate etc.).

Analogul vizual reprezint un format foarte similar cu cel precedent, cu o singur


diferen major: continuumul nu mai este segregat ntr-un numr discret de categorii de rspuns,
ci subiectul marcheaz efectiv un semn pe linia continu dintre cele dou adjective, exact n locul
unde crede c s-ar plasa opinia, credina sau experiena sa. Ceea ce se nregistreaz i se
prelucreaz este distana msurat fa de unul dintre poli (se pornete de regul de la cel care
nseamn absena).
Exemplu
Nici urm de fric _____________________________x_____________ Fric paralizant

Dei pare seductor, acest tip de scal are destul de multe dezavantaje. De multe ori
precizia sa este o fals precizie, marcarea punctului pe linie implicnd i o doz de hazard sau de
circumstanialitate. Un subiect va distinge cu greu ntre o fric de 6,7 cm de una de 6,5 cm. Mai
mult, asignarea valorilor scalei poate fi una idiosincratic, adic distanele marcate s aib
semnificaii diferite de la un subiect la altul sau la acelai subiect la perioade de timp diferite.
i totui, aceasta poate fi un tip de msurare foarte util atunci cnd cercetrile se fac pe
acelai subiect pentru a msura diferenele pe care tratamentul experimental le poate aduce n
tratarea fobiilor, n creterea nivelului de motivaie sau n alte direcii. Astfel, dac scala Likert
mparte un continuu ntr-un numr finit i mic de categorii, fiind foarte maniabil, dar mai puin
sensibil, scala analogului vizual poate fi sensibil la diferene mici: dac rspunsurile la postmanipulare se deprteaz semnificativ i n aceeai direcie n raport cu faza de pre-manipulare, se
pot detecta diferenele mici pe care le-a adus tratamentul experimental. Scala poate fi folosit i ca
una alctuit dintr-un singur item, caz n care nu se mai poate distinge cu claritate ntre
instabilitatea msurtorii i instabilitatea fenomenului msurat. Prin urmare, cea mai bun strategie
ar fi aceea de a dezvolta mai multe msurtorii de tipul analogului vizual pentru acelai fenomen,
de a le asambla ntr-o scal i de a-i determina consistena intern (stabilitatea).
O ultim problem este cea legat de cadrul temporal la care pot face sau nu referire
itemii unei scale. Prelund distincia pe care a fcut-o Cattell n legtur cu unele dispoziii de
personalitate care au un caracter situaional, n timp ce altele reprezint structuri stabile de
personalitate numite trsturi, Spielberger a dezvoltat scala STAI, n fapt o msur a anxietii ca
stare (conjunctural) i ca trstur de personalitate (stabil). Se tie de asemenea c multe
componente ale personalitii au mai mult sau mai puin stabilitate pe axa timpului:
142

fenomenologia afectiv de exemplu (emoie, anxietate, depresie) este mai fluctuant dect cea
cognitiv (inteligen, memorie).
O scal trebuie s fac referine i la dimensiunea temporal? Rspunsul este nuanat:
dac constructul msurat are o variabilitate temporal mare rspunsul este Da, dac el este stabil n
timp (cazul trsturilor de personalitate) rspunsul este Nu. Astfel, chestionarul de depresie Burns
se aplic periodic pacienilor depresivi pentru a monitoriza evoluia depresiei lor n timp. Multe
chestionare care urmresc aspecte fluctuante menioneaz n instructaj formule de tipul n ultima
lun, n ultima sptmn, n ultimele zile, n ultimul timp etc. Unele chestionare includ itemi
destinai detectrii modificrilor de dispoziie aprute recent (un eveniment stresant) sau pe
perioade mai lungi de timp (reforma post-revoluie, intrarea rii n NATO etc.). Chiar formatul de
rspuns al itemilor poate avea n vedere decuparea continuumului temporal n uniti mai mici
(uneori, din cnd n cnd, des, n ultimul timp etc.).
nainte de a supune judecii experilor forma preliminar a unei scale, constructorul
trebuie s aib n vedere dac include sau nu i scale de validare, care s diminueze sau s
controleze tendina respondenilor la dezirabilitate social sau la fraud.

Exemple
Sandra Bem (BSRI, 1976), a inclus o scal de dezirabilitate social ca tampon
ntre itemii care msoar masculinitatea i cei care msoar feminitatea. Eysenck
a inclus n EPI (Eysenck Personality Inventory) o scal de minciun, devenit
ulterior o scal de dezirabilitate social n EPQ (Eysenck Personality
Questionnaire).
n forma veche, dar i n cea revizuit a MMPI (Minnesota Multiphasic
Personality Inventory) Hathaway i McKinley au propus mai multe scale de
validare, care sunt primele ce vor fi evaluate de psiholog pentru a determina de
ct credit se poate bucura profilul unui respondent. Problema validrii se poate
rezolva fie construind scale anume destinate acestui scop, fie prelund unele deja
existente pentru a le insera n chestionar pe post de distractor i de mijloc de
control.

U3.3.4. Pasul al patrulea:


Revizia setului iniial de itemi de ctre experi
Avizul experilor este foarte necesar n legtur cu cteva probleme, sfatul lor scutindu-ne
de cheltuieli mari de resurse pentru obinerea de rezultate discutabile ca valoare.
S ne reamintim...
Expertiza specialitilor este necesar pentru a determina:
faptul dac definiia i operaionalizarea fenomenului sau a constructului ce va
fi msurat sunt bune sau n acord cu ceea ce i ei tiu despre acestea;
ct de relevani sunt itemii selecionai pentru a fi inclui n formatul iniial al
143

scalei, n raport cu constructul msurat;


claritatea, conciziunea i alte elemente legate de modul de formulare al
itemilor;
evidenierea fenomenelor sau a caracteristicilor importante asociate cu
constructul ce va fi msurat care nu s-au materializat n itemi corespunztori, setul
iniial trebuind deci augmentat cu noi itemi.

Prin revizuirea multitudinii de demersuri prin care vrem s surprindem constructul ce ne


intereseaz i prin examenul critic al itemilor destinai acestui scop experii ne pot ajuta la
maximizarea validitii de construct i de coninut a scalei. Trebuie ns precizat c cel care ia
deciziile finale este cel care construiete efectiv scala, i nu experii. Este posibil ca faza
pregtitoare pe care constructorul de scal a parcurs-o s-i fi dat un grad de cuprindere i de
nelegere a problemei mai bun dect al fiecrui expert n parte, aadar solicitarea lor de a fi
eliminai anumii itemi trebuie examinat cu atenie pentru a vedea dac ea are sau nu temei. n al
doilea rnd, cel mai adesea experii vor tinde s elimine itemii redundani, eliminnd astfel
posibilitatea constructorului de scal de a alege i de a pstra dintre cele dou formulri aparent
echivalente ale unor itemi, pe cea care se impune din analiza datelor rezultate din aplicarea
instrumentului.

U3.3.5. Pasul al cincilea:


Administrarea setului iniial de itemi
Prima aplicare a unui instrument nou creat se face pe un lot suficient de larg pentru a da
rezultate stabile referitoare la universul itemilor. Ct de mare i de reprezentativ trebuie s fie
aceste eantion este n continuare obiect de dezbatere printre specialiti. Pentru o scal
unidimensional, 250-300 de subieci sunt suficieni pentru a desfura o analiz factorial, urmat
de o analiz de itemi i de scal, tehnici care vor ghida procesul de selecie a itemilor ce
evideniaz cel mai bine constructul msurat. Eantionul iniial se va mri n funcie i de numrul
de subscale care vor fi extrase.
Dac eantionul este mic din punct de vedere numeric pot aprea erori prin ans sau
hazard, erori ce se vor repercuta asupra corelaiilor dintre itemi i scal, astfel c unii itemi, iniial
promitori, s fie descoperii la retestare a fi de fapt unii slabi. Mai mult, loturile mici au o
probabilitate mai mare de a elimina anumite categorii de indivizi crora li se adreseaz scala
respectiv. Pe de alt parte, dac n eantionul extras caracteristica msurat este slab distribuit,
valorile parametrilor obinui (media i abaterea standard n principal) sunt mai greu de extrapolat
la populaia general. Gradul de generalizabilitate al acestora este n cazul de fa unul redus.
De multe ori populaiile la care avem acces (elevi de liceu, studeni din campusuri etc.)
sunt destul de diferite n privina caracteristicii msurate fa de populaia int a scalei. Unele
diferene majore pot aprea din cauza conotaiilor particulare pe care anumite cuvinte sau expresii
le au ntr-o anumit categorie populaional, genernd sensuri care nu au fost avute n vedere
intenionat de ctre constructorul scalei sau care nu se regsesc ca atare i n populaia int mai
larg.
144

U3.3.6. Pasul al aselea: evaluarea itemilor din setul iniial


Operaiunile descrise la acest nivel sunt cele mai tehnice i constituie inima ntregului
proces de construcie al scalelor.
a. Examinarea iniial a performanei itemilor
Cea mai important calitate pe care o cutm n aceast faz la un item este corelaia sa
ridicat cu variabila latent pe care dorim s o evideniem prin constructul msurat. Dar, cum
aceast corelaie nu poate fi determinat (dac am ti valoarea ei nu ar mai avea rost s dezvoltm
o scal), noi putem face inferene n legtur cu aceasta plecnd de la corelaia dintre itemi i de la
corelaia acestora cu scorul final la scal. Ca principiu, cu ct corelaia dintre itemi este mai mare,
cu att mai mare este i fidelitatea itemilor; cu ct itemii sunt mai fideli, cu att mai mare este
fidelitatea ntregii scale.
S ne reamintim...
Prima calitate a unei scale este aceea de a fi omogen, adic una nalt intercorelat,
lucru care se poate pune n eviden prin matricea de intercorelaii. Un examen
atent al acesteia relev existena unor itemi care au corelaii negative cu
majoritatea celorlali itemi. Aceasta se poate ntmpla din mai multe cauze. De
exemplu, itemii cu coninut negativ care au fost scorai invers; itemii care, dei
scorai n acelai mod, msoar constructe diferite (dominan vs. supunere,
stabilitate emoional vs. emotivitate). n principiu, acetia ar putea fi reunii ntr-o
scal supraordonat unidimensional, dar cu doi poli (bipolar). Pentru aceast
categorie exist mai multe soluii. Prima ar fi aranjarea i numerotarea
descriptorilor invers n text, n funcie de coninutul itemilor, soluie care nu este
recomandabil, pentru c nu este comod pentru subiect. n timpul completrii,
regularitatea dispunerii itemilor n scal creeaz respondentului o anumit rutin
prin care administrarea acesteia devine mai facil. Inversarea distruge aceast
regularitate, oblignd respondentul la mai mult efort. A doua i cea mai practic
soluie este aceea de a construi separat grile de corecie pentru fiecare dintre
dimensiunile msurate de scal, prin care anumii itemi vor fi scorai direct iar alii
invers.
Pentru datele introduse n calculator n format de scal Likert, cea mai convenabil soluie
este scorarea invers a itemilor care ne intereseaz dup formula: Nou = (x+1) - vechi. De
exemplu, aplicnd formula de mai sus pentru o scal cu 7 trepte, 7 devine 1, 6 devine 2 etc., iar 1
devine 7. n SPSS exist i opiunea Recode into the same variable, prin care vechea variabil
este nlocuit cu cea rezultat dup scorarea invers. Avantajul este acela c se poate face
transformarea simultan, n bloc, a tuturor variabilelor de acelai format (cu acelai numr de
categorii de rspuns, definite n acelai fel).
Pentru c nu suntem ntotdeauna siguri dac rezultatul obinut prin scorare invers este mai
bun dect cel precedent, este bine s lucrm pe o copie a fiierului surs, copie numit de exemplu
Itemi inversai. Nu ntotdeauna inversarea scorrii, urmat de refacerea matricii de intercorelaii,
145

rezolv problema unui item. Este posibil ca el s fie corelat pozitiv cu unii dintre itemi i negativ
cu alii, deoarece el poate fi expresie a unui alt construct. n acest caz soluia potrivit este
eliminarea itemului respectiv, pentru a nu periclita omogenitatea de ansamblu a scalei.

b. Corelaia item-scal
n SPSS procedeul de lucru pentru acest tip de analiz este relativ simplu, deoarece se
urmeaz urmtoarea secven: AnalyseScaleReliabilityAlfaStatistics, de unde se
activeaz Item, Scale; Scale if item deleted (scala, dac itemul ar fi nlturat).

Figura U3.1. Ferestrele de dialog pentru Relyability Analysis i Statstics.

Dac dorim s obinem i o matrice de intercorelaii sau o matrice de covariane, n


dreapta-sus avem panoul Inter-Item, de unde selectm Correlations sau Covariances (vezi
imaginea de mai jos). Finalmente dm Continue pentru fereastra Reliability Analysis: Statistics
i apoi OK din fereastra Reliability Analysis, dup ce vom fi introdus n panoul de lucru din
dreapta-sus (Items:) toi itemii care vor fi supui analizei.
Rezultatele arat la fel ca n fragmentele de output prezentate mai jos.
R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)
Mean
Std Dev Cases
1. CEDA001
.1500
.3601
60.0
2. CEDA002
.1833
.3902
60.0
3. CEDA003
.1167
.3237
60.0
4. CEDA004
.3833
.4903
60.0
5. CEDA005
.1667
.3758
60.0
6. CEDA006
.5333
.5031
60.0
7. CEDA007
.3500
.4810
60.0
8. CEDA008
.3167
.4691
60.0
9. CEDA009
.4667
.5031
60.0
10. CEDA010
.1500
.3601
60.0

146

Item-total Statistics
Scale
Scale
Corrected
Mean
Variance
ItemAlfa
if Item
if Item
Total
if Item
Deleted
Deleted
Correlation Deleted
CEDA001
28.7500
133.4788
.2944
.8785
CEDA002
28.7167
133.4607
.2712
.8787
CEDA003
28.7833
135.0879
.1149
.8799
CEDA004
28.5167
133.4065
.2128
.8793
CEDA005
28.7333
133.1141
.3231
.8782
CEDA006
28.3667
136.6429
-.0713
.8825
CEDA007
28.5500
132.9975
.2550
.8788
CEDA008
28.5833
132.4845
.3105
.8782
CEDA009
28.4333
132.6226
.2746
.8786
CEDA010
28.7500
131.9534
.4804
.8770
................................................
Reliability Coefficients
N of Cases = 165
N of Items = 112
Alfa = .8800

Figura U3.2. Outputurile rezultate din comenzile prezentate mai sus.

Fiecare dintre fragmentele de output de mai sus trebuie examinate cu mare atenie. Primul
element investigat este variana itemilor, pentru c de aceasta depinde finalmente variabilitatea
ntregii scale. Dac toi indivizii investigai ar rspunde doar ntr-un singur fel la un item, variana
(variabilitatea) sa ar fi zero, el nefiind de nici un folos n surprinderea constructului de msurat.
Cum unii subieci rspund ntr-un fel, iar alii n altul, fiecare item are variabiliti mai mari sau
mai mici: cei mai dezirabili sunt cei cu variabilitate mare. n cazul de mai sus, itemii cu cea mai
mare variabilitate sunt n ordine 6, 9, 4, 7 i 8, care au o abatere standard n jur de 0,50.
Experiena statistic ne arat c este mai bine s nu examinm abaterea standard separat,
fcnd abstracie de medie. n principiu, cu ct aceasta este mai apropiat de centrul intervalului
de rspuns, cu att este mai bine, pentru c ea va face posibil mai mult variabilitate a itemului.
n condiiile n care la stnga au fost plasai descriptorii pentru dezacord i la dreapta pentru acord,
dac media este asimetric spre dreapta (negativ) nseamn c majoritatea respondenilor au inut
s fie de acord cu coninutul itemului respectiv, deci el a fost formulat moale; dac asimetria
este spre stnga (pozitiv) nseamn c majoritatea i-a exprimat dezacordul cu coninutul itemului
(formulare sa a fost cam tare).
n cazurile de asimetrie se tie de asemenea faptul c puterea discriminativ a itemului este
mai mare pe coada (creoda) curbei gaussiene i mai mic pe ramura sa mai scurt. Cum o
distribuie simetric (cu media pe centrul seriei de variaie) are dou cozi lungi, nseamn c
puterea discriminativ a unui item de acest fel este maxim, el putnd distinge la fel de bine n
ambele direcii. n cazul nostru, deoarece numrul itemilor destinai depistrii dezordinilor
alimentare a fost foarte mare 112 am folosit scorarea dihotomic, deci valoarea medie optim
147

ar trebui s cad la jumtatea intervalului 0 1, adic n jurul lui 0,50, ceea ce se ntmpl doar
pentru itemii 6 i 9.19 Verificarea simultan a mediei i abaterii standard este o condiie prealabil
obligatorie pentru o tentativ de selecie a itemilor care se bazeaz n principal pe corelaie. Din
aceast analiz reiese c, la prima vedere, itemii 7 i 9 au simultan cele mai bune variane i valori
medii.
Decizia final se ia ns dup ce se analizeaz atent datele din panoul Item-total Statistics
care are urmtoarea structur: primele dou coloane dau valorile medii i abaterile standard pentru
valorile totale ale scalei, n situaia n care itemul nu particip la scorul total. Pentru scalele cu
numr mare de itemi corecia adus la parametrii scalei prin absena unei singure valori de scor
este neglijabil, dar ea devine cu att mai important cu ct numrul itemilor scalei este mai mic,
fiind important de exemplu pentru scala de 10 itemi. Coloana Corrected Item-Total
Correlation este de maxim importan n luarea deciziei de selecie deoarece ea indic gradul de
asociere a fiecrui item cu scorul total, adic saturaia sa n variabila latent msurat. n cazul
nostru itemul 10 are o corelaie excelent cu scala (.48), n timp ce itemii 3, 4 i mai ales 6 au
corelaii slabe (itemul 6 chiar negativ) cu scorul total.
Dac scala noastr ar fi unidimensional (adic ar msura doar un singur construct i nu
mai multe) o valoare a corelaiei item-scal n jur de .30 ar fi suficient pentru includerea itemului
n scal, iar una de .40 aproape c ne foreaz s facem acest lucru. Aici este cazul s spunem c
nu ne vom concentra atenia doar pe numerele de cod ale itemilor, fapt care ne mpiedic s tim
care este coninutul lor. Cu foaia de test n mn, dup ce am identificat itemii cu formulri foarte
asemntoare (redundani), lum n cunotin de cauz decizia de a-i pstra pe cei cu calitile
psihometrice cele mai bune i de a-i elimina pe cei mai slabi.
Ultima coloan are de asemenea un rol important n luarea deciziei relative la selecia
itemilor deoarece ne indic ct ar fi fost coeficientul de consisten intern alfa dac itemul
analizat ar fi fost eliminat. Prin compararea cu scorul de referin al acestui coeficient (.88 pentru
toat scala iniial, adic foarte mare) putem vedea dac absena itemului amelioreaz valoarea lui
alfa (caz n care el trebuie eliminat) sau dimpotriv, o scade (semn c este unul util). n cazul
nostru itemul 6 este sigur unul condamnat, deoarece el d o corelaie uor negativ cu scala i nu
este consistent cu aceasta (absena lui din scal l mrete pe alfa).
i totui nu suntem nc n msur s lum decizia final pentru c nu am rspuns clar la
ntrebarea fundamental dac itemii testului msoar sau bat n direcia unei singure variabile
(scal unidimensional) sau a mai multora (scal multidimensional, neomogen). Supoziia
implicit pentru indicele de consisten intern alfa al lui Cronbach este aceea c toi itemii
msoar o singur variabil latent, fapt ce nu este dat prin definiie, ci trebuie atent verificat.

c. Analiza factorial exploratorie


n aceast faz a procesului de construcie analiza factorial exploratorie devine
obligatorie. Aa cum se va observa cnd se parcurge pn la capt cursul de Statistic avansat, o
analiz factorial este o tehnic pretenioas, pentru c are nevoie de un numr mare de subieci,
de ordinul sutelor, pentru a furniza o soluie stabil i bine adecvat datelor. Am solicitat din start
un numr cel puin mediu de subieci (250-300) pentru a efectua o analiz factorial corect
148

deoarece cnd este desfurat pe prea puine cazuri, ea poate s dea valori instabile, ce
compromit uneori iremediabil ntregul proces de construcie a scalei. S reinem deci c, n aceast
faz de construcie a scalei, determinarea prin analiz factorial a variabilei latente care st n
spatele unui set de itemi este un fapt crucial.
Mergnd mai departe cu exerciiul nostru prezentm secvena de lucru pentru a efectua
analiza factorial exploratorie: AnalyseDataReductionFactor, care produce deschiderea
urmtoarei fereastre de lucru, n care vom introduce (prima fereastr, panoul din dreapta-sus) toate
datele de analizat, adic toi itemii chestionarului nostru.

Figura U3.3. Ferestrele de dialog pentru lansarea analizei factoriale exploratorii.

Pentru un numr aa de mare de itemi nu vom efectua nici o rotaie (butonul din mijloc de
la figura din stnga de mai sus), dar de la Options putem s selectm Supress absolute values
less than: (suprimarea valorilor mai mici dect:) pentru a pune valoarea de .30 n ferestruica
respectiv, care are din setare valoarea .10, dar neactivat (vezi fereastra din dreapta-jos). n felul
acesta valorile ce indic saturaii mici i nesemnificative n factorii descoperii nu vor mai fi
afiai, fapt ce uureaz inspecia vizual, selecia i luarea deciziilor.
Trebuie precizat c metoda componentelor principale care este opiunea de baz a
programului este util mai ales pentru a vedea dac exist un factor general (cu o varian mai
mare de 50%) ce definete variabil latent, sau dac nu cumva exist mai muli factori de
magnitudine mai mic, ce acoper ntreaga varian a scorurilor scalei studiate. Vom putea vedea
deci dac avem de-a face cu o scal uni- sau multi-dimensional.
Atragem de asemenea atenia asupra faptului c dac o singur variabil inclus n panoul
de lucru are variana zero, analiza factorial nu mai poate fi efectuat. Deoarece acesta este i
cazul chestionarului nostru, identificm variabila sau variabilele cu varian zero prin Frequencies
ori Descriptives. n cazul nostru itemul 66 trebuie eliminat din analiz (i din scal deoarece,
avnd variana zero, el nu are nici o utilitate), dup care relum analiza factorial. Aceasta va
produce mai multe output-uri, din care dou sunt eseniale.

149

Figura U3.4. Unul dintre outputurile analizei factoriale


indicnd factorii selecionai i valorile lor eigen.

Outputul de mai sus indic faptul c itemii iniiali nu produc un singur factor general, ci
cteva zeci (fapt curent n construcia de scale cu numr mare de itemi), din care primul acoper
doar 13,36% din varian (deci este foarte departe de a fi un factor general), al doilea 8,21%, al
treilea 4,96% etc. Chiar i al aisprezecelea factor produce o valoare eigen peste 2 (2,08%), ceea
ce poate prea un adevrat comar statistic. Lucrurile nu stau ns chiar aa. Dac analizm cu
atenie outputul al doilea din figura 1.4, observm c acesta devine o adevrat gril de selecie
pentru factorii mai importani care vor fi reinui. Astfel, itemii vor fi alocai la acei factori pentru
care ei au cele mai mari corelaii (saturaii n factorul respectiv). Atunci cnd se poate, itemii cu
saturaii negative se aloc la factorul cu care coreleaz pozitiv mai semnificativ, pentru a nu
schimba maniera de scorare; la valori foarte apropiate ale saturaiilor, un item se aloc scalei mai
scurte pentru a o fortifica, deoarece tim c puterea unei scale depinde i de numrul itemilor care
o compun. Se observ c, dup ce ncep s fie alocai la primii trei factori, mai rmn foarte puini
itemi sau deloc pentru factorii urmtori, i aceast deoarece muli itemi i mpart variana ntre
mai muli factori (nu sunt foarte specifici). Alocnd itemii factorului pentru care ei au cea mai
mare saturaie, celorlali factori le rmn tot mai puini itemi, aceasta deoarece primii factori dau
corelaii mai mari cu itemii, avnd deci prioritate n selecia acestora. De fapt afiarea n tabel a
factorilor de la stnga la dreapta se face n ordinea magnitudii lor, dat de mrimea corelaiilor cu
itemii, dar i de numrul acestor corelaii. Itemii care nu se repartizeaz n primele 3-4 categorii
vor putea defini i ei nite factori de magnitudine mai redus, dar reunindu-i n scale i studiind
alfa pentru acestea vom observa c i consistena intern este din ce n ce mai mic pentru factorii
extrai ultimii.

150

Figura U3.5. Output al analizei factoriale indicnd factorii selecionai i valorile lor eigen.

Cum o scal trebuie s aib o consisten intern de peste .70 (aceasta fiind foarte bun
peste .80 i excelent peste .90) scalele mici neatingnd aceste valori trebuie n principiu
abandonate, pentru c ele sunt expresia unor construncte ce au o valoare ndoielnic. n cazul de
mai sus, itemii 5, 7, 8, 10, 13, 16, 17, 20, 21, 22 etc. vor fi alocai primei scale; itemii 3, 9, 19 etc.
celei de a doua, iar itemii 15, 24, 43 etc. celei de a treia. O atenie special impune itemul 3, care
poate fi distribuit i la factorul 2 i la 3 (decizia o lum ulterior, cnd evalum care dintre cele
dou subscale are mai mare nevoie de el) sau la itemul 22, care coreleaz semnificativ i cu
factorul 1 (pozitiv) i cu factorul 3 (negativ). n aceste situaii se observ ct de important este
mrimea lotului pentru luarea unei decizii corecte, bazat pe analiza factorial.
Hotrrea de a aloca itemii ntr-o scal sau alta poate fi irevocabil, chiar dac datele
ulterioare nu confirm deciziile noastre de acum. Prin mrirea semnificativ a numrului de
subieci, soluia factorial poate s aduc o mulime de diferene, ceea ce relanseaz practic ntreg
procesul de reconstrucie a scalei. Din aceast cauz vom cuta s lum decizii importante i
definitive doar dac eantionul pe care s-a efectuat analiza factorial este unul sufiucient de mare
i de reprezentativ. Finalmente, scala desemnnd factorul 1 arat ca n figura de mai jos.
R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)
Mean
Std Dev Cases
1. CEDA005
.2000
.4031
65.0
2. CEDA007
.3231
.4713
65.0
3. CEDA008
.3231
.4713
65.0
4. CEDA010
.1538
.3636
65.0
5. CEDA013
.4154
.4966
65.0
6. CEDA016
.5385
.5024
65.0
7. CEDA017
.4154
.4966
65.0
8. CEDA020
.1231
.3311
65.0
9. CEDA021
.4462
.5010
65.0
10. CEDA022
.3385
.4769
65.0
Statistics for
Mean Variance Std Dev N of Variables
SCALE
11.9846 86.4841 9.2997
50
151

Item-total Statistics
Scale
Scale
Corrected
Mean
Variance ItemAlfa
if Item
if Item
Total
if Item
Deleted Deleted Correlation Deleted
CEDA005
11.7846
84.0154
.3121
.9203
CEDA007
11.6615
83.3212
.3418
.9202
CEDA008
11.6615
83.4462
.3270
.9204
CEDA010
11.8308
83.3928
.4456
.9192
CEDA013
11.5692
81.3115
.5500
.9180
CEDA016
11.4462
82.5635
.4018
.9197
CEDA017
11.5692
81.7178
.5034
.9185
CEDA020
11.8615
83.4337
.4862
.9190
CEDA021
11.5385
83.8149
.3636
.9202
CEDA022
11.6462
83.1385
.3586
.9201
......................................................................................................................................................................
Reliability Coefficients
N of Cases = 165.0
N of Items = 50
..
Figura U3.6. Unul dintre outputurile analizei factoriale
indicnd factorii selecionai i valorile lor eigen.

d. Scurt raport despre scal


Se pare c scala 1 obinut de noi este una foarte bun deoarece la ea contribuie 50 de
itemi ce-i dau o consisten intern extrem de mare (alfa = 0,92). Fiecare item d corelaii de peste
0,30 cu scala, dar i mai mari. Scorul mediu la aceast scal este de 11,98, cu o abatere standard
de 9,30. Totui valorile medii ale itemilor nu sunt centrate majoritar pe valoarea mijlocie de scor
(0,50), ci sunt mai mici, fapt ce indic o asimetrie rezultat din cauza caracterului mai curnd
clinic al testului. Aceti itemi discrimineaz bine printre subiecii care au valori mai mari ale
scorurilor, dar mai slab pentru cei cu valori submedii. Scala urmeaz a fi verificat i validat
contra criteriul extern pe populaii clinice care prezint realmente dezordinile alimentare
diagnosticate.
Studiind itemii care l compun, primul factor a fost numit Stim de sine negativ legat de
aspectul fizic (50 de itemi), al doilea Propensiune anorexic (12 itemi) i al treilea Propensiune
bulimic (12 itemi). Deoarece cei trei factori sunt mediu-slab corelai ntre ei, scorurile lor
separate pot fi agregate ntr-un scor global, adic ntr-un Index al tulburrilor alimentare, definit
de preocuparea pentru aspectul fizic i pentru pierderea controlului asupra ingestiei de alimente.
Numrul relativ mic de subieci pe care s-a desfurat analiza factorial (N = 165) ridic totui
semne de ntrebare n legtur cu stabilitatea soluiilor gsite, care trebuie verificate i definitivate
pe populaii mai largi.

152

U3.4. Criterii de selecie a itemilor pentru optimizarea lungimii scalei


Pn n acest stadiu de dezvoltare al scalelor de tulburri alimentare cercettorul are un
numr bun de itemi (72), distribuii pe trei subscale n raport cu care acetia au o fidelitate destul
de ridicat. i totui, se observ diferene relativ nsemnate ntre acestea: prima are un alfa de .92,
a doua de doar de .70, iar a treia de .58. Alfa pentru toat scala este de .94. Se pare deci c scalele
2 i 3 nu sunt suficient de fidele, aceasta probabil i din cauza scurtimii lor. Se admite c scalele
scurte sunt bune, pentru c se completeaz uor i nu pun prea mare presiune pe subieci. Prin
opoziie, scalele mai lungi creeaz mai mult stres la completare, dar au caracteristici psihometrice
mai bune (consisten intern, alte forme de fidelitate i de validite, putere de discriminare mai
mari). Este deci de dorit gsirea unui echilibru ntre scurtimea scalei i calitile sale psihometrice.
Atunci cnd fidelitatea unei scale este prea mic, scurtimea ei nu este o calitate n sine.
Dac cercettorul nu poate asigura nici un neles unei scale scurte, nu s-a ctigat nimic prin
scurtimea ei. n cazul de fa exist o satisfacie legat de calitatea primei scale. Pentru cea de a
doua i de a treia ar putea rencepe travaliul de a genera itemi suplimentari, care s surprind mai
specific bulimia i anorexia i care vor trebui aplicai unor populaii clinice identificate a avea
aceste afeciuni.
S ne reamintim...
Pentru a clarifica criteriile dup care pstrm unii itemi n scal i-i eliminm pe
alii, furnizm n sintez cele mai importante repere orientative:
sunt preferabili itemii care au valori medii apropiate de valoarea central, au
varian mare, se coreleaz bine cu ceilali itemi i mai ales coreleaz la un
nivel ridicat (peste .30, sau chiar peste .40) cu scorul total la scal;
vor fi primii eliminai itemii care dau variana zero, corelaii slabe sau negative
cu scala (chiar dup scorarea invers);
itemii care coreleaz slab cu scala vor fi de asemenea printre primii eliminai;
vor fi eliminai i itemii a cror prezen n scal nu numai c nu amelioreaz
consistena sa intern, ci chiar o coboar;
itemii care coreleaz slab cu dimensiunea/dimensiunile latente msurate, dar
coreleaz bine cu ali factori secundari, vor fi i ei eliminai din scal, dar vor fi
analizai pentru a dezvolta eventual noi scale, dac ei par s sugereze existena
altor constructe valide;
dintre itemii foarte similari ca i formulare i coninut se pstreaz doar aceia
care dau cea mai bun corelaie cu scorul total la scal.

Nu putem omite o ntrebare legitim: ct de mic trebuie s fie pragul corelaiei item-scal
pentru a reine un item n scal? Rspunsul depinde i de inteniile autorului: dorete el o scal
scurt i relativ puternic, sau o scal mai lung, dar care d mai multe nuane, fiind mai stabil i
mai fidel? n primul caz pragul de selecie este mai ridicat (n principiu peste r = .40), n al doilea
ceva mai sczut (dar rareori sub r = .30).
153

Efectul eliminrii sau includerii unor itemi n scal trebuie i el bine tiut. Dac cunoatem
corelaia medie a scalei rezultate putem aplica o formul care ne ajut s anticipm care va fi
efectul adugrii sau eliminrii unui item. Aceast formul este:
N r
alpha =
1 + ( N 1) r
n care N este numrul de itemi i r corelaia medie inter-itemi. Putem astfel determina ce se
ntmpl dac la o scal cu corelaia iter-itemi de .30 adugm sau scoatem un item: alfa =
[10.30]/[1+9.30] = .81 pentru 10 itemi; alfa = [11.30]/[1+10.30] = .83 pentru 11 itemi; alfa =
[9.30]/[1+8.30] = .79 pentru 9 itemi. Vedem c diferena de doar doi itemi ridic consistena
intern de la .79 la. 83, ceea ce este important. n general, dac corelaia inter-itemi a unui item
este egal sau cu puin sub corelaia inter-itemi medie, pstrarea itemului n scal are un efect de
cretere a lui alfa; cnd aceast corelaie este mult sub medie, ea poate s duc la descreterea lui
alfa i deci itemul ru trebuie eliminat.
O soluie interesant pentru a verifica stabilitatea caracteristicilor unei scale este propus
de DeVellis (2003, pp. 99-100), ea constnd n splitarea lotului. Cnd lotul este unul suficient de
mare el poate fi mprit n jumti. Cnd lotul nu este suficient de mare, mprirea se poate face
n pri inegale, partea cea mai mare fiind rezervat pentru determinrile principale, pe cnd cea de
a doua pentru verificarea constanei rezultatelor gsite. Deci prima parte din lot folosete la
evaluarea i selecia itemilor, la construcia scalelor i la determinarea lui alfa pentru fiecare
subscal; cea de a doua parte este util pentru replicarea datelor i pentru a verifica dac ele se
regsesc pe un lot foarte similar. Avantajele acestei metode care oblig din start la abordarea
unui numr mare de subieci, de peste 500-600 de persoane sunt nsemnate. n primul rnd
mprirea se poate face aleatoriu, ceea ce asigur echivalena grupurilor, randomizarea genernd
dou eantioane echivalente. Dac acestea ar fi abordate n dou momente temporale diferite
exist probabilitatea ca factorul timp s aduc modificri (fie i discrete) la cel de al doilea grup,
sau ca el s difere prin alte caracteristici de primul grup. Apoi, un nou grup presupune expunerea
subiecilor la alt personal de cercetare, n alt perioad a anului, cu instrumente care pot diferi uor
de primele (forma iniial i forma definitiv a scalei), ceea ce poate introduce alte distorsiuni
nedorite. Dar cel mai nsemnat avantaj al splitrii grupului original este acela c la ambele
subgrupuri vom avea forma original a instrumentului, ceea ce permite revenirea la decizia
eliminrii unor itemi dac grupul de control indic necesitatea schimbrii acestei decizii. Dac
pentru primul grup, cel pe care s-a fcut selecia itemilor, exist posibilitatea ca factori de ans s
fie confundai cu covariaia itemilor, la al doilea unde itemii sunt deja selectai o asemenea
posibilitate nu mai exist. Finalmente, prin reunirea celor dou grupuri n unul singur se obin
caracteristici psihometrice mai sigure i mai aproape de realitate dect pentru fiecare grup luat
separat.

U3.5. Analize utile pentru determinarea fidelitii scalei


Ideea c prin coeficientul alfa al lui Cronbach se rezolv problema fidelitii unui test/scale
este una eronat deoarece n esen acesta indic doar msura n care itemii formeaz un set
omogen, bine sau satisfctor corelat cu scorul total la test. Alfa nu ne spune totui dac scala nou
154

creat surprinde sau nu cu adevrat estena constructului cutat, pentru aceasta trebuind
desfurate nenumrate studii de validare, pentru oricare nou extensie legat de utilizarea scalei.
Chiar fidelitatea presupune determinarea prin test-retest a stabilitii n timp a rezultatelor
obinute, corelaia dintre o form a testului i forma sa paralel etc. Cum fidelitatea este cea mai
important precondiie a validitii, trebuie spus c programul SPSS ofer alturi de alfa i
posibilitatea determinrii fidelitii prin metoda jumtirii (split-half).
Demersurile necesare acestui tip de analiz sunt foarte asemnroare cu cele presupuse de
determinarea lui alfa (AnalyseScaleReliabilitySplit-halfStatistics), doar c de la
Statistics acum se dezactiveaz Descriptives for (Item, Scale, Scale if item deleted), deja
determinate anterior.

Figura U3.7. Ferestrele de dialog pentru Split-half i Statistics.

Output-ul acestei serii de comenzi este un indicator al consistenei interne care ia n calcul
o jumtate a testului comparat cu cealalt, prin dou metode: cea a lui Spearman-Brown i cea a
lui Guttman. Echivalena jumtilor se stabilete i prin compararea coeficientului alfa pentru
fiecare jumtate n parte. Cele dou jumti comparate sunt luate de computer ca atare, dar dac
vrem s determinm split-half pentru numerele pare i cele impare, introducem n panoul de lucru
nti itemii pari, apoi pe cei pari, dm OK i vom obine analiza dorit.

Exemplu
R E L I A B I L I T Y A N A L Y S I S - S C A L E (S P L I T)
Reliability Coefficients
N of Cases = 165
N of Items = 112
Correlation between forms = .80
Equal-length Spearman-Brown = .89
Guttman Split-half = .89
Unequal-length Spearman-Brown = .89
56 Items in part 1
56 Items in part 2
Alfa for part 1 = .85
Alfa for part 2 = .87

Corelaiile obinute prin splitare sunt identice prin cele dou metode (.89) iar
valorile alfa pentru prima parte (.85) i pentru cea de a doua (.87) sunt extrem de
asemntoare, de unde deducem c exist o foarte bun consisten intern pentru
fiecare jumtate a testului.20

155

Procesul de construciei a unei scale nu se oprete aici. Destinul acesteia depinde doar parial de
calitile psihometrice identificarte preliminar i mai mult de utilitatea ei real, de posibilitatea
implicrii ei ntr-o multitudine de aplicaii practice sau de cercetri. Cel mai adesea validitatea este
cea care impune n timp o scal ce poate fi probat ntr-o multitudine de maniere.

Exemplu
Prezentm matricea de intercorelaii dintre cei trei factori rezultai pentru Scala de
tulburri alimentare i cele trei categorii de mecanisme de aprare decelate de
DSQ (The Defense Style Questionnaire) creat de Andrews, Singh i Bond.
FACTOR1 FACTOR2 FACTOR3 DSQ Mec.
mature
FACTOR1
FACTOR2
.38**
FACTOR3
.32**
.28**
DSQ Mec. mature
-.09
.16
.01
.23*
.10
.18
.19*
DSQ Mec. nevrotice
DSQ Mec. imature
.51**
.31**
.29**
.21*

DSQ Mec.
nevrotice

.53**

Not: ** Correlaia este semnificativ la pragul de 0,01 (bidirecional).


* Correlaia este semnificativ la pragul de 0,05 (bidirecional.

Din tabelul de mai sus rezult c factorul 1 se valideaz la un nivel foarte ridicat
prin corelare cu mecanismele de aprare imature (r = .53) i la un nivel mai sczut
cu cele nevrotice (r = .23). Aceasta atrage atenia asupra faptului c factorul 1 are
un coninut negativ i c ar trebui s se numeasc Stim de sine negativ legat de
aspectul fizic. Factorii 2 i 3 se valideaz i ei concurent cu mecanismele de
aprare imature, dar la niveluri mai sczute (r = .31, respectiv r = .29). Evident c
aceast prim confirmare are nevoie de o mulime de alte studii, dar aceasta
presupune ca instrumentul s fie publicat i lansat pentru a-i ndeplini rolurile
pentru care el a fost proiectat.

U3.6. Rezumat
 Construcia scalelor psihologice se sprijin pe un algoritm complex care poate fi
rezumat la urmtoarea secven: determinarea a ceea ce se dorete s se msoare
generarea setului iniial (mare) de itemi determinarea tipului de format al
msurtorii revizia setului iniial de itemi de ctre experi administrarea
setului iniial de itemi selecia itemilor pentru forma final a scalei
rafinarea ulterioar a scalei.
 n fazele preliminare de construcie recursul la teorie este esenial.
 n fazele finale recursul la procedee avansate de prelucrare este esenial.
 Partea cea mai creativ a crerii unei scale ine de identificarea unui construct
valid i de generarea setului iniial de itemi, dar valoarea scalei ine de
respectarea unor constrngeri de ordin tehnic: scrierea corect a itemilor, selecia
tipului de scal de msur care este adecvat, recursul la sfatul experilor etc.
156

U3.7. Evaluare
Proiect aplicativ:
Construirea unui chestionar pentru o trstur de personalitate
Deoarece o parte nsemnat din nota final depinde de acest proiect, cealalt
depinznd de activitatea de seminar i ultima de nota de la examenul final, indicm
mai jos paii care trebuie urmai pentru realizarea sa:
vei citi cu atenie lista de la sfritul paragrafului de fa i vei alege o
trstur de personalitate, de preferin una care v intereseaz personal;
vei efectua un studiu bibliografic detaliat pentru a putea identifica i defini
detaliat trstura/dimensiunea de personalitate aleas (aceasta este faza de
documentare);
folosind
metoda
intuitiv-raional
vei
operaionaliza
aceast
trstur/dimensiune aleas sub forma unui numr de itemi cuprins ntre 20 i
50. n construcia itemilor vei ine cont de toate precizrile din cursul de fa
legate de caracteristicile de form, lungime, coninut i cele semantice;
chestionarul astfel obinut va fi aplicat ntr-un studiu-pilot pe un numr de
minimum 30 de subieci. Dac optai pentru strategia grupurilor-criteriu
(metoda empiric), acestea vor avea minimum 20 de subieci fiecare;
utiliznd cunotinele de la cursul Bazele teoretice ale psihodiagnosticului vei
efectua analiza itemilor (grad de discriminare, curb caracteristic sau
semnificaia statistic a diferenei dintre grupurile de contrast) i vei reine n
forma intermediar redus a chestionarului itemii cu caracteristicile
psihometrice cele mai bune. Pentru aceast form a chestionarului vei urma
procedura descris n curs i vei face analiza consistenei interne a scalei (din
SPSS AnalyseScaleAlfa Cronbach i apoi Split-half);
vei redacta forma final a chestionarului;
opional, valoarea proiectului va fi considerat mai bun i va primi punctaj
superior dac vei corela produsul obinut de voi cu un instrument despre care se
tie c msoar acelai construct, pentru a proba validitatea concurent a
chestionarului vostru.
Not: datorit complexitii cerinei formulate v putei asocia cte doi sau trei
studeni pentru un singur proiect, caz n care numrul va crete cu cte 30 de cazuri
pentru fiecare. Nota la proiect va fi identic pentru ambii autori, dei ei i pot
mpri dup dorin atribuiile ntre faza de documentare i cea de
aplicare/prelucrare a datelor. n cazul asocierii a trei studeni ultimul aspect
(validarea concurent a chestionarului nou creat contra unui instrument deja
consacrat) devine obligatorie. Produsul finit (chestionarul mpreun cu o lucrare de
prezentare a fazelor proiectului, de 3-4 pagini maximum 2000 de cuvinte n
TNR 12, pe hartie A4) va fi nsoit de o dischet sau CD cu baza de date i
prelucrrile aferente. Data predrii proiectului este n ziua examenului.

157

List de termeni psihologici


Prezentm mai jos cteva concepte care descriu trsturi de personalitate sau alte domenii
sau teme de cercetare ce pot fi abordate prin secvena metodologic prezentat anterior:
Adaptare (colar, universitar, organizaional), agresivitate, asertivitate, atitudine fa de
(alcoolism, consum de droguri, risc, sexualitate, carier etc.), altruism/egoism, alimentare
(bulimie, anorexie, bulimi-anorexie), ambiie, androginitate, angoas/anxietate/fobie social,
aptitudini (didactic, social, de lider, empatic etc.), ataament (fa de valorile organizaiei, fa
de tradiie), aviditate (ca n chestionarul Gaston-Berger din tipologia franco-olandez), btrnee,
bioenergie/bioenergoterapie (atitudine fa de), bulimie, cafea, caren afectiv, carism,
chirologie, cinema, cleptomanie, comand, competiie, complexe (de inferioritate sau de
superioritate), comportament matern/patern, comportament proactiv, comunicativitate, conflict/
conflictualitate (toleran la), conformism/nonconformism, contagiune (afectiv i mental),
control (locus of), cooperare, copil/copilrie (atitudine fa), creativitate, culpabilitate, decizie
(uurin/dificultate), difereniere (a Eului, cognitiv), delincven (tendin la), dependen
(alcoolic, de droguri, emoional-afectiv), depresie, dezacord/acord conjugal, didactogenie,
dipsomanie, disforie, dispoziie spre (tutun, alcool, droguri, abuz sexual), drog, durere (cutarea
plcerii/evitarea durerii - Cloninger), educaie/ educabilitate, efort (rezisten la),
egocentrism/egoism, emotivitate, empatie, erotism/senzualitate, eec (toleran/intoleran,
conduit de eec), Eu ideal, expectaie (nivel de), extraversiune/introversiune, fabulaie (gndire
magic), familie (fericire/nefericire conjugal sau matrimonial), feminitate, fidelitate (relaional
i n csnicie), foamea de stimulare, fobii (sensibilitate la), fric, frigiditate, frustrare (toleran la),
furie, gndire (magic, negativ, depreciativ, autodevalorizatoare, creativ etc.), gelozie,
gregarism, grup (atitudine fa de), gust, hiperkinezie, homosexualitate/androginitate/sex-rol, idei
(de persecuie, prevalente, dominante) i scheme, identificare, imaginaie (reproductiv i
creatoare), imitaie, inadaptare la (mediu, coal, serviciu, csnicie), impulsivitate, inhibiie,
instabilitate (emoional-afectiv, caracterial), interese, introversie, intuiie, isteroidie, iubire,
izolare, joc (disponibilitate pentru), ncredere (n sine i n alii), labilitate, lateralitate cortical,
lene social, lider (aptitudine de), magie (gndire magic), manie, masochism, mecanisme de
aprare ale Eului, melancolie (dispoziie spre), minciun (scal de), mitomanie, mod (atitudine
fa de), moarte (atitudine fa de), motivaie (colar, profesional, de munc, creatoare etc.),
narcisism, nebunie (teama de), negativism/ncpnare, nervozitate, neutralitate (neimplicare),
nevroz (nevrozism, tendine nevrotice), nevroz de abandon, nevroz colar, obezitate, oboseal
(existenial), obsesii, onestitate, opinii (de orice fel), optimism, orgoliu, panic (atacuri de),
paranoia (tendine spre), parapsihologie (atitudine fa de), pasiune, pasiv-dependent
(personalitate), pedeaps (atitudine fa de), pensionare, perfecionism/introversie, personalitate
(isteric, astenic, fobic etc.), persuasiune/sugestibilitate, perversiune (atitudine fa de), placebo
(susceptibilitate la), pragmatism (la valori/atitudini fundamentale), prejudeci, prestigiu, prezen
social, privaiune (toleran la), pubertate/adolescen, rsunetul reprezentrilor, regresie, relaii
umane, relaxare, remucare, respingere, responsabilitate, reuit/succes (colar, profesional etc.),
reverie, revolt, rezisten, rezonan, ritualuri fobice, roluri, sadism, sntate mintal, schizoidie,
secundaritate, sensibilitate, sentiment, separare (nevroz de), sete (afectiv, de cunoatere), sfat
158

conjugal, simulare (comportament), suprasolicitare/burnout/brownout, sinucidere, sofrologie,


stngcie, stres (toleran la, mecanisme de coping cu), subiectivitate, succes, sugestibilitate,
surmenaj, oc, talent, tandree, temperament, tensiune, ticuri, timp (atitudine fa de, gestiune a),
toleran (la frustrare, social), trac, tutun, uitare, umor, valene, valori, vrst (atitudine fa de),
veleitarism, virilitate/masculinitate, vis, vocaie, voin, vorbire, zvon.

159

__________________________________________________________________
Modulul M3. Unitatea de nvare 4
RAPORTUL PSIHOLOGIC
__________________________________________________________________
Cuprins
U4.1. Introducere ........................................................................................................... 160
U4.2. Competene .......................................................................................................... 160
U4.3. Idei de baz pentru ntocmirea unui raport psihologic ......................................... 161
U4.4. Activiti propuse ................................................................................................. 162
U4.4.1. ntocmirea unui raport de examinare psihologic ...... 162
U4.4.5. Structura raportului psihologic ............................................................... 161
I. Datele factuale i de identificare a subiectului ..................................... 163
II. Scopul evalurii psihologice (ntrebarea de referin) ........ 164
III. Testele administrate i rezultatele obinute (note brute i standard).. 165
IV. Anamneza sau istoria personal a cazului ......................................... 165
V. Observaiile relevante din timpul examinrii ...................................... 166
VI Interpretarea rezultatelor .................................................................... 167
VII. Sumarizarea concluziilor .................................................................. 168
VIII. Recomandri .................................................................................... 169
U4.5. Rezumat ................................................................................................................ 169
U4.6.Test de evaluare a cunotinelor ............................................................................ 169
U4.7. Lecturi recomandate pentru acest curs ..... 170

U4.1. Introducere
Raportul psihologic este expresia condensat a activitii de testare/evaluare
psihologic a unei persoane (client, consumator de servicii etc.) de ctre un
psiholog calificat care rspunde cu instrumentele tiinei sale scopului pentru care
a fost desfurat investigaia, n termeni profesioniti, dar i accesibili celui care a
comandat-o.
U4.2. Competene
Dup parcurgerea acestei uniti cursanii vor fi capabili:
s cunoasc elementele de coninut ale celor opt capitole ce intr n structura
raportului psihologic;
s fac diferenele care se impun ntre fia psihologic (care sintetizeaz cifric
datele clientului) i raportul psihologic, care insist pe interpretarea narativ a
rezulzatelor;
pentru fiecare dintre cele opt capitole din structura raportului psihologic s
poat opera definirea, indica funciile, selecta elementele necesare realizrii
corecte i evitrii erorilor celor mai probabile;
160

s concretizeze toate informaiile dobndite n blancul unei foi de raport-tip,


printr-un exerciiu de portofoliu.

Durata medie de parcurgere a acestei uniti de nvare, incluznd rezolvarea


sarcinilor propuse i a temelor de evaluare, este de 4 ore.

S ne reamintim...
Materiale i suporturi necesare ntocmirii raportului psihologic
Hrtie i creioane; fi (blanc) de raport psihologic; cteva fie psihologice i unul
sau mai multe raporarte psihologice reale, rezultate din practica psihologic, de
model.
U4.3. Idei de baz pentru ntocmirea unui raport psihologic
S ne reamintim...
1. Raportul psihologic nu se confund cu Fia psihologic, deoarece prima ramne
la client, a doua la psiholog; prima traduce n termeni inteligibili informaia
prezent n fi, la care se adaug obligatoriu capitole de interpretare, sumarizare
(concluzii) i recomandri.
2. Raportul psihologic nu exclude partea tehnic de prezentare a datelor (notele
brute i notele standard ale testelor utilizate), dar important este traducerea
limbajului cifric ntr-o descriere narativ, ntr-un limbaj accesibil clientului.
3. Ca structur, raportul psihologic (sau de examinare psihologic) cuprinde datele
factuale - de identificare, scopul sau problema pentru care a fost solicitat testarea,
testele administrate i rezultatele obinute, exprimate sub form de note brute
(eventual) i note standard (obligatoriu), o anamnez sau datele biografice
relevante n raport cu scopul testrii, observaiile relevante reieite n timpul
desfurrii examenului psihologic, interpretarea rezutatelor (sumarizarea) i
recomandrile.
4. Dublarea laturii constatative cu cea formativ, cea diagnostic cu cea
prognostic i abordarea nomotetic cu cea idiografic (personalizarea examenului
psihologic) face diferena ntre un raport bun i unul slab, dei aici elementul
difereniator major este experiena capitalizat de psiholog, competena lui de
psihodiagnostician, ca i lrgimea repertoriului psihodiagnostic de care dispune i
care-i permite s abordeze o gam mai larg sau mai ngust de probleme.
Exemplu
Din cele de mai sus rezult c nu aspectul formal (standard) d valoarea unui
raport psihologic, ci:
 gradul de acoperire a scopului i a ateptrilor clientului;
161

 msura n care s-a operat cea mai potrivit selecie a testelor i a procedurilor
disponibile la un moment dat, n raport cu solicitarea clientului;
 faptul de a include datele cele mai pertinente reieite din observaie, care au o
mare valoare diagnostic, acestea fiind cele care transfer examinarea
psihologic din zona nomoteticului n zona idiograficului;
 faptul dac rezultatele sunt confirmate de timp (fidelitatea test-retest), de ali
evaluatori (fidelitatea interscoreri sau interspecialiti), de faptele anticipate
(validitatea relativ la criteriu) sau de viaa nsi, aflat dincolo de pereii
laboratorului (validitatea ecologic);
 faptul de a oferi altor specialiti (profesori, medici, sociologi etc.) puncte de
sprijin solide n deciziile sau n interveniile lor de specialitate;
 faptul de a ine pasul cu cele mai noi i avansate standarde din domeniu, furnizate
de rile cu mare tradiie n testarea psihologic.
U4.4. Activiti propuse
U4.4.1. ntocmirea unui raport de examinare psihologic
Raportul psihologic materializeaz i finalizeaz o investigaie psihologic de tipul testrii/
evalurii, adic un examen psihologic. Mrimea i gradul de elaborare al acestuia depind simultan
de scopul testrii/evalurii, de cerinele expres formulate de cel care a comandat-o, de exigena i
profesionalismul psihologului. Chiar i pentru testri foarte scurte trebuie s existe un raport, adic
ceva care traduce datele cantitative n date calitative cu sens, inteligibile pentru client.
U4.4.2. Structura raportului psihologic
Un raport de evaluare a funciilor intelectuale poate diferi semnificativ de unul care se
refer la structuri i funcii de personalitate. Astfel, testul CPI, cu multitudinea sa de scale
originare (18), la care se adaug cele suplimentare (cel puin tot attea) poate genera att efort n
sinteza i de intercorelare nct, mai nou, aceast sarcin a fost preluat de computer (care nu
poate suplini totui responsabilitatea psihologului, asumat prin semntur). Aceste rapoarte
computerizate au de regul o parte non-narativ - raportul scorurilor brute i standard, incluznd
testele de semnificaie statistic i intervalele de ncredere pentru scorurile de la test, i una
narativ. Raporturile descriptive merg cu un pas dincolo de raporturile de scoruri prin includerea
unei interpretri a rezultatelor scal cu scal."21 Lungimea raportului nu d ns i valoarea
acestuia: profilurile furnizate de softurile contemporane fiind excesiv de detaliate, clinicianul
trebuie s parcurg rapoarte de peste zece pagini pentru a putea extrage cteva caracteristici
definitorii pentru clientul su. Concluzia lui Gregory ni se pare una foarte valabil: "Un raport
descriptiv poate da o informaie nepreuit pe o jumtate de pagin."22
Dac exist totui diferene mari de format ntre raportul psihologic al funciilor
intelectuale i al profilului de personalitate, nseamn c ne vom opri asupra celui cu structura mai
simpl (funcii intelectuale), dei n practica curent psihologul poate construi profile

162

hipercomplexe (care include inteligena, memoria, motricitatea, atenia i personalitatea), atunci


cnd vrea s surprind integral sau multiaxial persoana.

S ne reamintim...
Structura raportului psihologic va trebui s cuprind:23
I. Date factuale i de identificare ale clientului.
II. ntrebarea de referin (scopul) evalurii psihologice.
III. Testele administrate, cu indicarea rezultatelor n note brute i note standard, ca
i a scorului final (IQ, Indice de Memorie, Indice de Motricitate).
IV. Datele de anamnez (pacieni clinici) sau istoria personal a cazului.
V. Observaiile relevante reieite pe parcursul examinrii.
VI. Interpretarea rezultatelor la teste prin raportarea datelor brute la etaloane,
raportarea unora la altele, a tuturor la o teorie, la un set de ipoteze sau la fapte).
VII. Sumarizarea concluziilor.
VIII. Recomandri.
Mai detaliat, aceast secven const din urmtoarele opt capitole ale raportului,
fiecare cu o scurt definiie, cu indicarea funciilor implicate, cu precizarea
modului de realizare corect i a erorilor cele mai frecvente, dar i a modului lor
de evitare. n final se propune un exerciiu imaginar pe un blanc anume elaborat.
Not: raportul psihologic se parafeaz, se dateaz i se semneaz, pentru c din
momentul emiterii lui devine un document oficial, cu consecine posibile asupra
clientului, el putnd fi invocat n instan sau n luarea unor decizii cu privire la
persoana n cauz. Spre deosebire de raportul psihologic computerizat, raportul
psihologic presupune deci asumarea responsabilitii prin semntur i paraf.
I. Datele factuale i de identificare a subiectului
Definire: sunt datele care descriu caracteristicile demografice principale pentru
identificarea subiectului i includerea sa ntr-o categorie, cum ar fi: data naterii i data examinrii,
ce permit determinarea vrstei (n ani i luni, cci la vrsta copilriei dinamica dezvoltrii este una
foarte rapid), mediul (rural/urban = R/U), sexul (Masculin/Feminin = M/F), studiile prinilor
copiilor examinai (generale, medii, superioare = G, M, S) sau ale celui n cauz, coala i clasa
sau facultatea (dac este cazul), ultima coal absolvit (dac este adult), mrimea i poziia sa n
fratrie, familia de apartenen (cstorit, divorat, vduv, concubinaj) sau cea proprie (stare
marital = cstorit/necstorit), ocupaie, vechime, calificare etc. Observm c pentru copii se
pune problema background-ului cultural-economic i educaional; cnd cel examinat este un adult,
aceste elemente se transfer de pe familie pe clientul nsui, de care ne mai putem interesa privitor
la starea locativ, indicele de aglomerare (numr de persoane pe numr de camere), venit (global
sau pe membru de familie). Toate acestea lungesc proporional durata edinei, de aceea trebuie s
gsim un echilibru rezonabil ntre lungimea datelor completate i relevana lor.
Funciile acestui capitol sunt urmtoarele:

163

- fixeaz datele cele mai relevante, care permit identificarea i raportarea clientului la o
clas;
- datele factuale sunt variabile "naturale" (uneori "etichet") n prelucrarea computerizat a
seturilor de date similare;
- din prelucrarea bazei de date acumulate n timp se pot extrage sub-eantioane mai mici,
pentru a genera bareme/etaloane mai fine sau pentru a desprinde regulariti tipice (prin
lucrri de cercetare tiinific).
Realizare corect
Dac este structurat sub forma unei fie cu o rubricatur adecvat, datele sunt uor de
strns, putnd avea o multitudine de utiliti (vezi funciile).

Deoarece raportul psihologic selecteaz doar datele (adevrate) din fia de test (mai
complet, mai tehnic i mai analitic), formularea din fi este diferit de cea din raport.
n primul caz, se completeaz datele n rubric, n al doilea li se d o structur narativ
sintetic.

De exemplu, datele de mai jos din fia psihologic, ce rmne la examinator:


Numele: Ionescu Mircea; Data naterii: 4. 01. 1975; Profesia: sudor; Sex: masculin (M) Data
examinrii: 21 05 2005; Vrsta: (n ani i luni): 46 de ani i 3 luni; Stare civil: cstorit, 3 copii,
ar putea arta astfel n raportul psihologic: Ionescu Mircea, de 46 ani i 3 luni, de profesie sudor,
cu studii medii (coala profesional plus liceul la seral), cstorit, tatl a 3 copii etc.
Erori probabile
lungirea nejustificat a numrului de date de identificare solicitate clientului;

contaminarea capitolului cu date rezultate din istoria personal, din observarea direct sau
din testarea efectiv a clientului.

II. Scopul evalurii psihologice (ntrebarea de referin)


Definire: aceast rubric trebuie s indice fr dubiu cine a cerut evaluarea psihologic i
cu ce scop.
Funcie: scopul ghideaz ntreaga evaluare psihologic ca numr i tip de teste
selecionate, ca profunzime a investigarii, bogie a concluziilor i nuanare a recomandrilor.
Dac persoana care cere evaluarea nu poate preciza clar scopul, este datoria psihologului s-l
reformuleze astfel nct el s devin unul explicit. Realizarea corect va sintetiza ntr-o manier
ct se poate de clar i concis de ce i pentru cine se face evaluarea psihologic.
Greeli de evitat

un scop ciorchine, amalgamnd o multitudine de elemente, dintre care unele reieite din
anamnez;

scopuri vagi sau prea generale (dorim o evaluare de ansamblu, ne intereseaz cum
gndete, copilul nu are stare etc.), care vor fi nlocuite cu scopuri specifice
(consecinele cognitive ale unei nateri hipoxice, hiperkinezie cu deficit de atenie, examen
n vederea orientrii i ghidrii vocaionale etc.).

164

III. Testele administrate i rezultatele obinute (note brute i note standard)


Descriere: pentru anumite categorii de teste pot exista foi de nregistrare / centralizare i
asociere a datelor pre-elaborate, n care se folosesc aceleai baterii de teste. De exemplu, pentru
orientarea colar i ghidarea vocaional bateria va cuprinde teste de aptitudini (generale i
speciale), teste de memorie, un test de personalitate (HSPQ) i teste de interese (Strong i/sau
Holland). n consecin i pe foaia de raport psihologic ele vor fi trecute ca atare, cu o coloan
pentru note brute i una pentru note standard, utile pentru a verifica informaia de specialitate cnd
raportul circul printre psihologi sau ali specialiti.
Funcie: este aceea de a avea un sistem de control extern al elementelor pe care se bazeaz
interpretrile calitative care urmeaz, pentru a vedea n ce msura testarea psihologic este
adecvat scopului su declarat.
Greeli de evitat: adugarea sau omiterea de teste care nu au fost efectiv utilizate.
IV. Anamneza sau istoria personal a cazului
Descriere: anamneza este dictat de scopul explicit formulat al testrii, investigaia
trecutului clientului trebuind s surprind elementele semnificative din viaa persoanei n raport cu
acest fapt. De exemplu, dac copilul are hiperkinezie cu deficit de atenie (ADHD), vom cuta n
istoria sa timpurie evenimente ce ar fi putut genera disfuncia cerebral minim, adic o hipoxie la
natere, un Rh negativ, o circular de cordon, o natere provocat sau dificil. Mai trziu ne vom
interesa de traumatisme craniocerebrale, de asfixii mecanice sau cu monoxid de carbon; vom
cerceta dac semnele ADHD sunt centrate mai mult pe atenie sau mai mult pe scderea
autocontrolului (impulsivitate), dac fenomenologia a diminuat odat cu vrsta, dac deficitul a
avut concomitene legate de funcia grafic (desen, scris, citit), ncercnd s distingem ntre un
temperament necontrolat, instabil (coleric) i sindromul amintit. Pot fi cercetate i antecedentele
heredo-colaterale, pentru a diferenia ntre aspectul dobndit i cel ereditar al tulburrii.
Funcie: comportamentul actual al subiectului are o istorie care poate fi reconstituit mai
larg sau mai nuanat, n funcie i de calitatea surselor de informaie disponibile. Realizare
corect: ca i n cazurile de informaii obinute prin spionaj, se pune problema calitii acestora,
care depinde de calitatea sursei, dar i de posibilitatea coroborrii surselor. Astfel, mamele dau
informaii mult mai detaliate i acurate dect taii, prinii dect bunicii, rudele dect persoanele
neutre etc. Cnd exist i o electroencefalogram, expertiza altor specialiti (date consemnate n
fia medical), diagnosticele sunt mai certe i cutarea este mult uurat. Specialitii atrag atenia
c trebuie nregistrate datele comportamentale observate i interpretarea dat acestora. De
exemplu, este preferabil s notm c elevul umbl n timpul orelor printre bnci dect c este
agitat i fr stare sau c este indisciplinat, nu are rbdare, tulbur clasa etc. Aceasta
deoarece persoane diferite atribuie semnificaii diferite, n contexte diferite, acelorai fapte de
conduit, urmnd a evita operaionalizrile incorecte, mai ales cnd este vorba de surse
nespecializate.
Greeli de evitat
Sondarea minuioas a trecutului unei persoane suprancarc rubrica respectiv cu o
multitudine de date irelevante n raport cu scopul investigaiei, dup cum una prea de la
165

deprtare omite chiar elemente dintre cele mai semnificative. Mai jos dm exemplu de elemente
semnificative din anamneza copiilor cu dificulti colare sau cu probleme de dezvoltare care pot
fi incluse n raportul psihologic.

Probleme antenatale, perinatale i postnatale importante (de exemplu disgravidie, natere


precipitat sau nainte de termen, natere pe uscat, cianoz la natere, Rh negativ,
prematuritate, imaturitate, circular de cordon, asfixie albastr sau alb etc.).

Boli importante ale micii copilrii.

Retarduri legate de vorbit, mers, control sfincterian (primul pas, primul cuvnt).

Tulburri ale senzorialitii (vz/auz) i gravitatea lor.

Lateralizare, dominan invers sau ncruciat.

Evoluia timpurie a limbajului, a comunicrii i socializrii.

Apetitul pentru joc.

Adaptabilitatea la colectivitate (cre, grdini) i uurina integrrii.

Evenimentele majore din viaa copilului sau a familiei sale (separaii, divoruri etc.).

Date de climat familial (relaii cu fraii, bunicii, rudele, prietenii).

Rezultatele colare actuale i evoluia lor n timp.


Este inutil s spunem c alt categorie de probleme (tumori, accidente neurologice,
devian sau delincven juvenil, tulburri instrumentale, deficiene caracteriale) au alte grile de
anamnez, care se structureaz prin acumularea de experien, dar i prin parcurgerea literaturii
de specialitate. Cu att mai mult examenul adultului sau investigaii mai speciale (avizarea pe
post, de exemplu) au alte tipuri de screening al istoriei personale. Este de asemenea foarte
important de spus c cea mai mare parte din datele consemnate rmn n fia de examinare (cea
care face sinteza datelor), n raport trecndu-se datele filtrate i cu adevrat concludente n raport
cu problema care face obiectul investigaiei.

V. Observaiile relevante din timpul examinrii


Descriere: este locul n care diagnosticul medical i cel psihologic se suprapun n bun
msur. i psihologul trebuie s dezvolte un ascuit sim clinic, mai ales n examinrile
individuale, care furnizeaz acea informaie suplimentar, nicicnd surprins de teste i care se
refer la:

Conduita general n timpul examenului.

Starea de mobilizare atenional i fluctuaiile ateniei datorate scderii motivaiei,


interesului sau epuizrii resurselor energetice.
Susinerea proceselor reglatorii i energetice (autocontrol, impulsivitate, declin energetic).

Stilul de abordare cognitiv, strategiile utilizate (mai ales la probele de performan).

Comentariile cu care se asociaz reuita/nereuita, tolerana la frustrare, reacia la eec,


susinerea mnezic, promptitudinea reaciilor.
Este evident c n orice testare a aptitudinilor (i a inteligenei n special) persoana se
manifest ca ntreg, lucru precizat i de Binet, Piaget sau Wechsler, care au cutat s deriveze
concluzii despre personalitatea subiectului din examenul inteligenei. Piaget a propus i realizat
166

standardizarea observaiilor n timpul aplicrii probelor sale cognitive. Psihologul obinuit tie c
dac a folosit cum trebuie observaia, el poate agrementa raportul su cu acele elemente decisive
ce fac diferena dintre examenul lipsit de suflet - computerizat - i cel efectuat de o fiin uman.
Rezolvarea corect: problema este aceea c din multitudinea datelor observate i
consemnate n fia de examen s selectm doar acele informaii concludente, ntr-o form
explicit. De exemplu, n loc s trecem c Ionel este inhibat, foarte dependent afectiv (concepte
vagi) putem utiliza formula Ionel a vrut s fie examinat doar n prezena prinilor si, pe care-i
solicita la cea mai mic neclaritate; la un moment dat el s-a ridicat de pe scaun i nu a mai vrut s
continue, refugiindu-se n spatele mamei, dei Ionel are deja apte ani i jumtate. A comentat c
coala nu este bun la nimic, poate doar s-i chinuie n zadar pe copii. A revenit n examen dup
insistene i rugmini, artndu-se foarte ngrijorat la tot ce ar fi putut nsemna eec sau nereuit.
La comunicarea rezultatelor a inut neaprat s fie de fa, cernd explicaii i ntrebnd dac ce a
fcut el este bine. La plecare nu i-a luat la revedere i tata a comentat c este foarte puin probabil
s mai vin din nou la examen, pentru c examinarea seamn prea mult cu coala.
Erori posibile
Contaminarea reciproc a datelor furnizate de observaie i a celor de anamnez.

Selectarea datelor de observaie care se potrivesc cu diagnosticul psihologic sau


psihiatric anterior formulate.

Contaminarea cu alte surse de informaii (de la nvatoare, profesori, medici, asisteni


sociali).

VI. Interpretarea rezultatelor


Definire: este cea mai complex i cea mai important parte a raportului psihologic
deoarece face sinteza datelor psihometrice cu cele de anamnez, de observaie i provenite din
surse colaterale, cu scopul a le da un sens inteligibil pentru prini, client, beneficiar, ntr-o
manier obiectiv, dar care nu lezeaz, informaia fiind explicit, utilizabil i n alte contexte.
Funcii
Valorizeaz datele obinute n vederea atingerii scopului examinrii.

D elemente clare beneficiarului imediat i celor ndeprtai (angajatorul, profesorul,


medicul, autoritatea local, poliia etc.).

Face ca datele s convearg spre o finalizare, spre o concluzie.


Realizarea corect nu se sprijin pe o reet. n psihologia dezvoltrii, de exemplu, aceast
etap face dovada experienei, competenei, adncimii i pluridisciplinaritii n pregtirea unui
psiholog. Dac prinii suspecteaz de retard mintal o fat mai lent, cu hidrocefalie n
antecedente, ei au nevoie de un sfat avizat, care le-ar putea motiva ngrijorarea sau adormi
vigilena. Problema este ce spui i ct spui pentru ca bunstarea clientului s fie servit, fr a
omite totui adevrul. Tendina ultimilor ani n America este aceea de a fi mai aproape de adevr,
chiar i pentru persoane cu probleme reale, care-i pot mobiliza mai bine resursele adaptative
pentru a nfrunta un deficit sau handicap.

167

Interpretarea trebuie s fie corect, complet i obiectiv. Trebuie s sublinieze minusurile,


dar i plusurile, dac se poate dup stabilirea de intercorelaii ntre toate datele sau dup
conturarea unei scheme explicative ordonatoare.
Erori de evitat
Suprasimplificarea: interpretarea de genul: rezultatul la testul cuburilor este peste medie,
deoarece subiectul a obinut nota standard 17. n fond, putem porni de la o privire de
ansamblu a rezultatelor, s vedem gradul lor de omogenitate/heterogenitate, dominantele
etc. De exemplu, cota standard 14 la cuburi poate s nsemne coordonare oculo-manual
foarte bun, susinut de un tempo de lucru alert (deoarece a primit bonificaii de timp
nsemnate), iar la testul Cod B - prob de nvare asociativ - subiectul a obinut de
asemenea un scor foarte ridicat, cota standard 16. Deoarece i testul Bender-Gestalt indic
o performan superioar, se poate concluziona c un factor major al inteligenei - cel
spaial - este supradezvoltat, avem deci de-a face aici cu premisele unei aptitudini ce
trebuie valorificat. Pe de alt parte, testul de vocabular, memoria verbal i memoria
ritmurilor se afl la un nivel mediocru, ceea ce sugereaz o puternic asimetrie ntre
factorul verbal i cel spaial, tipic stngciei. Aceasta ar putea explica eecurile elevului la
limbi, biologie i istorie. Blbiala de la 3 ani, instalarea tardiv a dominanei (dup 7 ani,
odat cu coala, dar cu tendine remanente spre ambidextrie) susin ipoteza unei organizri
corticale particulare, cu o dominan emisferic vag.

Interpretrile incorecte provenite din necunoaterea testelor (a instrumentelor


psihometrice), din insuficienta cunoatere a teoriei psihologice (de unde nevoia informrii /
formrii continue) sau din supradimensionarea unei singure informaii. De exemplu, un
tnr psiholog de la Laboratorul de snatate mintal ddea urmtoarea formulare: dac nu
exist alt contraopinie, pacientul X este suspect de schizofrenie, i aceasta dup un
singur test proiectiv, Testul Arborelui! Confuzii de acelai tip sunt i cele care
concluzioneaz n legatur cu excesul de energie al hiperkineticului (care nu debordeaz de
energie, cum se creden mod curent, ci doar d aceast impresie, din cauza consumului
haotic al rezervelor energetice disponibile).

Uneori psihologul se rezum doar la scopul testrii, ferindu-se s valorifice date valoroase
care-l depesc ca putere explicativ, alteori examenul nu ine deloc cont de scopul de
referin, mergnd pe acelai ablon, stereotip, indiferent de tipologia solicitrilor ntlnite.

VII. Sumarizarea concluziilor


Definire: n aceast seciune a raportului psihologic se rezum n unul-dou paragrafe
rezultatele de ansamblu ale ntregului examen.
Funcii
Aceea de a rspunde precis i concis la ntrebarea de referin care a declanat evaluarea
psihologic.
Aceea de a face legtura cu ultima secven a raportului, cea a propunerilor i
recomandrilor.
Greeli de evitat: prolixitatea i redundana.
168

VIII. Recomandri
Definire: sugestiile oferite sunt date n sensul potenrii calitilor insuficient puse n
valoare de ctre subiect i a optimizrii sau compensrii aspectelor deficitare.
Funcii: aceea de a depi planul constatativ i de a oferi soluii problemelor diagnosticate,
de a lrgi cadrul de referin prin implicarea altor specialiti (dac e cazul) i de a gsi soluii
problemelor pe care subiectul le are fr ca acestea s fi fost n mod expres obiectul investigaiei.
Greeli de evitat
Recomandrile s fie pertinente, la obiect i fezabile.

Ele s rezulte din datele de investigaie, s fie solid susinute de datele empirice, dar i de
teoria din domeniu.

S permit constatarea efectelor ameliorative dup o perioad de timp (prin retest).

U4.5. Rezumat
 Raportul psihologic condenseaz ntreaga activitate de evaluare psihologic.
 Scopul su de baz este acela de a traduce n termeni inteligibili pentru client
informaia reieit i de a rspunde ntrebrii de referin care a declanat
activitatea de evaluare.
 Structura raportului psihologic este urmtoarea: date factuale, scopul evalurii,
teste administrate i cote brute cote standard pentru fiecare, anamneza,
observaiile reieite, sumarizarea rezultatelor i recomandrile formulate.
 Un raport psihologic de bun calitate este acela care ine cont de ntrebarea de
referin, ajustnd dispozitivul de testare/evaluare pentru a rspunde ct mai
satisfctor la aceast ntrebare.
 n al doilea rnd, un raport bun integreaz o multitudine de alte surse de
informaii i metode n afara testelor psihometrice, cum ar fi anamneza,
observaia sau interviul dirijat.
 n plus, un raport psihologic bun traduce n termeni inteligibili pentru client
rezultatele investigaiei, formulnd concluzii i propuneri ameliorative.
U4.6. Test de evaluare a cunotinelor
1. Precizai care sunt asemnrile i deosebirile dintre fia psihologic i raportul
de evaluare psihologic.
2. Indicaii paii de baz i structura unui raport de evaluare psihologic.
3. Definii ce sunt datele factuale i care este rolul lor n structura unui raport de
evaluare psihologic.
4. Precizai ce este ntrebarea de referin i care sunt funciile ei de baz.
5. Indicai care sunt elementele definitorii pentru o bun anamnez i care este rolul
su n raportul psihologic.
6. Precizai felul n care metoda observaiei dirijate transform o edin de testare
n una de evaluare psihologic.
169

7. Precizai modul n care trebuie procedat pentru a realiza o bun interpretare a


rezultatelor.
8. Indicai funcia sumarizrii rezultatelor.
9. Imaginai o edin concret de evaluare psihologic, preciznd ce tip de
recomandri ai formula pentru clientul evaluat.

Exerciiu pentru portofoliul de evaluare


Respectnd paii i recomandrile corespunztoare realizai un Raport
psihologic pentru un caz imaginar, combinnd informaii rezultate din
observaie i anamnez.
U4.7. Lecturi recomandate pentru acest curs
Aiken, L.R. (1997). Psychological Testing and Assessment. 9th ed. Boston, London, Toronto,
Sydney, Tokyo, Singapore: Allyn and Bacon.
Albu, M. (1998). Construirea i utilizarea testelor psihologice. Cluj-Napoca: Editura
Clusium.
Anastasi, A. (1974). Psychological Testing. New York: Macmillan Publishing Co. Inc.
Clinciu, A.I. (2005). Psihodiagnostic. Braov: Editura Universitii Transilvania.
Gregory, R.J. (1996). Psychological Testing. History, Principles and Applications, second
edition. Boston, London, Toronto etc: Allyn and Bacon.
Stan, A. (2002). Testul psihologic. Evoluie, construcie, aplicaii. Iai: Editura Polirom.
Zrgo, B, (1976). Examinrile psihologice. n ndrumtor psihodiagnostic. Cluj-Napoca:
Reprografia Universitii Babe-Bolyai, pp. 1-16.

170

BIBLIOGRAFIE
1. Aiken, L.R. (1997). Psychological Testing and Assessment. 9th ed. Boston, London, Toronto,
Sydney, Tokyo, Singapore: Allyn and Bacon.
2. Albu, M. (1998). Construirea i utilizarea testelor psihologice. Cluj-Napoca: Editura
Clusium.
3. Allport, G.W. (1991). Structura i dezvoltarea personalitii. Bucureti: Editura Didactic i
Pedagogic.
4. Anastasi, A. (1974). Psychological Testing. New York: Macmillan Publishing Co.
5. Bban, A., Derevenco, P., Eysenck, S.B.G. (1990). Testul E.P.Q. n: Revista de psihologie, 1,
37-45.
6. Biceanu, L. (2004). Dicionar ilustrat de psihologie englez romn. Bucureti: Editura
tehnic.
7. Bontil, Gh. (1971). Aptitudinile i msurarea lor. Bucureti: Centrul de Documentare i
Publicaii al Ministerului Muncii.
8. Carroll, J.B. (1993). Human Cognitive Abilities. Cambridge: Cambridge University Press.
9. Constantin, T. (2004). Evaluarea psihologic a personalului. Iai: Editura Polirom.
10. Bogthy, Z. (1978). ndreptarul psihologului industrial. Bucureti: Editura tiinific i
Enciclopedic.
11. Cattell, R.B. (1957), Personality and Motivation. Structure and Measurement. New York:
World Book Co.
12. Cattell, R.B. (1960). Manuel pour l'application de l'Echelle d'Anxiet. Paris: Ed. C.P.A.
13. Cattell, R.B., Beloff, H. (1966). Manuel d'application du H.S.P.Q. Paris: Ed. C.P.A.
14. Clinciu, A.I. (2005). Psihodiagnostic. Braov: Editura Universitii Transilvania.
15. Clocotici, V., Stan, A. (2000). Statistic aplicat n psihologie. Iai: Editura Polirom.
16. Cohen, R.J., Swerdlik, M.E., Smith, D.K. (1992). Psychological Testing and Assessment. An
Introduction to Tests and Measurement. second ed. California: Mayfield Publishing Company,
Mountain View.
17. Cronbach, L.J. (1970). Essential of Psychological Testing. New York: Harper and Row.
18. Deri, S. (2000). Introducere n testul Szondi. Bucureti: Editura Paideia.
19. Durand, G. (1999). Aventurile Imaginii. Imaginaia simbolic. Imaginarul. Bucureti: Editura
Nemira.
20. Dworetzky, D.J., Davis, N.J. (1989). Human development. A life span approach. St Paul, New
York: West Publishing Company.
21. Enchescu, C. (1975). Expresia plastic a personalitii. Bucureti: Editura tiinific.
22. Enchescu, C. (1977). Psihologia activitii patoplastice. Bucureti: Editura tiinific i
Enciclopedic.
23. Eysenck, H.J. (1953). The Structure of Human Personality. New York: Viley.
24. Eysenck, H.J. (1975). The Measurement of Personality. London: Routledge & Kegan.
25. Eysenck, H.J, Eysenck, S.B.G. (1975). Manual of the Eysenck Personality Questionnaire.
London: University of London Press.
171

26. Eysenck, M.W., Keane, M.T. (1995). Cognitive Psychology. A student's handbook. 3rd edition,
Hove East Sussex, UK: Psychology Press Ltd.
27. Gardner, H. (1985). Frames of mind: The theory of multiple intelligences. New York: Basic
Books
28. Gregory, R.J. (1994). Psychological Testing. History, Principles and Applications, second
edition. Boston, London etc.: Alyn and Bacon.
29. Guilford, J.P. (1959). The Nature of Human Intelligence. New York: Mc Graw Hill Book
Company.
30. Harris, D.B. (1963). Children's drawings as measures of intellectual maturity. New York:
Harcourt, Brace & World.
31. Havrneanu, C. (2000). Cunoaterea psihologic a persoanei. Iai: Editura Polirom.
32. Holban, I (1970). Probleme de psihologia muncii. Bucureti: Editura tiinific.
33. Horghidan, V. (1992). Metode de psihodiagnostic. Bucureti: Editura Didactic i Pedagogic.
34. Kaplan, R.M., Saccuzzo, D.P. (1993). Psychological Testing. Principles, Applications and
Issues, 3th ed. Belmont, California: Brooks Cole Publishing Company, Inc.
35. Kline, P. (1995). La construction des tests. n: J.R., Beech, L., Harding Tests, mode d'emploi.
Guide de psychomtrie. Paris: Edition C.P.A.
36. Kulcsar (1976). Testul Raven i variantele sale. n: ndrumtor psidodiagnostic, vol. II, ClujNapoca: Reprografia Univeritii Babe Bolyai.
37. Laveault, D., Grgoire, J. (2002). Introduction aux thoriex des tests en Psychologie et en
sceeces de l'ducation. 2e edition. Bruxelles: ditions De Boeck Universit, p. 199.
38. Meeker, M.N. (1969). The Structure of Intellect. Its interpretations and uses. Columbus, Ohio:
Charles E. Merrill Company.
39. Meili, R. (1962). Manuel du diagnostique psychologique. Paris: P.U.F.
40. Minulescu, M. (1996). Chestionarele de personalitate n evaluarea psihologic. Bucureti:
Garell Publishing House.
41. Mitrofan, N. (1993). Testarea psihologic a copilului mic. Bucureti: Editura Press Mihaela.
42. Mitrofan, N., Mitrofan, L. (2005). Testarea psihologic. Inteligena i aptitudinile. Iai:
Editura Polirom.
43. Mitrofan, N. (2001). Psihometria i direciile ei de dezvoltare la nceput de mileniu. n M.
Zlate (coord.), Psihologia la rspntia mileniilor. Iai: Editura Polirom.
44. Nunnally, J.C. (1978). Psychometric Theory. (2nd Ed.). New York: McGaw Hill.
45. Parot, F., Richelle, M. (1995). Introducere n psihologie. Istoric i metode. Bucureti: Editura
Humanitas.
46. Perse, J. (1972). Collaboration du psychologie au dpistage et au diagnostique des maladies
mentales. n: Reuchlin, M. (red.) Trait de psychologie aplique. Paris, Press Univ. de France.
47. Piron, H. (coord.) (2001). Vocabular de psihologie. Bucureti: Editura Univers Enciclopedic.
48. Pitariu, H. (1983). Psihologia seleciei i orientrii profesionale. Cluj-Napoca: Editura Dacia.
49. Pitariu H. (1974). Testul Domino 48 (D 48); Testul Domino 70 (D 70). n: ndrumtor
psihodiagnostic, vol. II, Cluj-Napoca: Reprografia Universitii Babe Bolyai.
50. Popescu Neveanu, P. (1977). Psihologie general. Tipografia Universitii Bucureti.
172

51. Radu, I. (coord.) (1991). Metodologie psihologic de analiz a datelor. Cluj-Napoca: Editura
Sincron.
52. Reber, A.S. (1985). Dictionary of Psychology. London, New York etc.: Penguin Books.
53. Reuchlin, M. (1992). Introduction la recherche en psychologie. Paris: ditions Nathan.
54. Reuchlin, M. (2000). Psihologie general. Bucureti: Editura tiinific.
55. Ribault, C. (1965). Le dessin de la maison chez lenfant. n: Revue de Neuropsychiatrie
Infantile, 13, nr. 1-2.
56. Rorschach, H (2000). Manual de psihodiagnostic. Bucureti: Editura Trei.
57. Roca, M. (1972). Metode de psihodiagnostic. Bucureti: Editura Didactic i Pedagogic.
58. Rozorea, A., Sterian, M. (2000). Testul arborelui.Bucureti: Editura Paideia.
59. Stan, A. (2002). Testul psihologic. Evoluie, construcie, aplicaii. Iai: Editura Polirom.
60. Sternberg, R.J. (1985). Beyond IQ: A triarchic treory of human intelligence. New York:
Cambridge University Press.
61. Sternberg, R.J., ed. (1990). Handbook of human intelligence. Cambridge, New York etc.:
Cambridge University Press.
62. Sternberg, R.J. (1993). Intelligence is more than IQ: The practical size of intelligence. In
Jurnal of Cooperative Education, 28 (2), pp. 6-10.
63. Szamoskzi, t. (1997). Psihometria clasic i evaluarea formativ. n Cogniie, creier,
comportament, vol. 1, nr. 2, iunie, Cluj-Napoca.
64. chiopu, U. (1974). Introducere n psihodiagnostic. Bucureti: Tipografia Universitii.
65. chiopu, U. (coord.) (1997). Dicionar enciclopedic de psihologie. Bucureti: Editura Babel.
66. tefnescu-Goang, Fl. (1946). Msurarea inteligenei. Revizuirea, adaptarea i completarea
scrii de inteligen Binet-Simon. Cluj-Napoca: Editura Institutului de psihologie.
67. Witkin, H.A., Dyk, R.B., Faterson, H.F., Goodenough, D.R., Karp, S.A. (1962). Psychological
differentiation. Studies of development. NewYork, London: John Wiley and Sons, Inc.
68. Zazzo, R., Gilly, M., Verba-Rad, M. (1968). Nouvelle chelle mtrique de l'intelligence. Paris:
Librairie Armand, Colin.
69. Zimmerman I.L., Woo-Sam, J.M. (1973). Clinical Interpretation of the Wechsler Adult
Intelligence Scale. New York, San Francisco, London: Grune & Straton.
70. Zlate, M. (1999). Psihologia mecanismelor cognitive. Iai: Editura Polirom.
71. Zrgo, B, (1976). Examinrile psihologice. n ndrumtor psihodiagnostic. Cluj-Napoca:
Reprografia Universitii Babe-Bolyai, pp. 1-16.

173

Anexa 1
Echivalenele rangurilor percentile n scoruri standard i standardizate
Percentile
Media
AS
99
98
97
96
95
94
93
92
91
90
89
88
87
86
85
84
83
82
81
80
79
78
77
76
75
74
73
72
71
70
69
68
67
66
65
64
63
62
61
60
59
58
57
56
55
54
53
52
51
50

Cote
z
0.00
1.00
2.33
2.05
1.88
1.75
1.64
1.55
1.48
1.41
1.34
1.28
1.22
1.18
1.13
1.08
1.04
0.99
0.95
0.91
0.88
0.84
0.80
0.77
0.74
0.71
0.67
0.64
0.61
0.58
0.55
0.52
0.49
0.47
0.44
0.41
0.39
0.36
0.33
0.31
0.28
0.25
0.23
0.20
0.18
0.15
0.12
0.10
0.07
0.05
0.03
0.00

Deviaii
IQ
100
15
135
131
128
126
125
123
122
121
120
119
118
118
117
116
116
115
114
114
113
113
112
112
111
111
110
110
110
109
108
108
107
107
107
106
106
105
105
105
104
104
104
103
103
102
102
102
101
101
100
100

Scoruri
T
50
10
73
71
68
68
66
66
65
64
63
63
62
62
61
61
60
60
60
59
59
58
58
58
57
57
57
56
56
56
56
55
55
55
54
54
54
54
53
53
53
53
52
52
52
52
51
51
51
51
50
50

Scoruri
GRE
500
100
733
705
688
675
664
655
648
641
634
628
622
618
613
608
604
599
595
591
588
584
580
577
574
571
567
564
561
558
555
552
549
547
544
541
539
536
533
531
528
525
523
520
518
515
512
510
507
505
503
500

Percentile
Media
AS
50
49
48
47
46
45
44
43
42
41
40
39
38
37
36
35
34
33
32
31
30
29
28
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
174

Cote
z
0.00
1.00
0.00
-0.03
-0.05
-0.07
-0.10
-0.12
-0.15
-0.18
-0.20
-0.23
-0.25
-0.28
-0.31
-0.33
-0.36
-0.39
-0.41
-0.44
-0.47
-0.49
-0.52
-0.55
-0.58
-0.61
-0.64
-0.67
-0.71
-0.74
-0.77
-0.80
-0.84
-0.88
-0.91
-0.95
-0.99
-1.04
-1.08
-1.13
-1.18
-1.22
-1.28
-1.34
-1.41
-1.48
-1.55
-1.64
-1.75
-1.88
-2.05
-2.33

Deviaii
IQ
100
15
100
100
99
99
98
98
98
97
97
96
96
96
95
95
95
94
94
93
93
93
92
92
91
90
90
90
89
89
88
88
87
87
86
86
85
84
84
83
82
82
81
80
79
78
77
75
74
72
69
65

Scoruri
T
50
10
50
50
49
49
49
49
48
48
48
48
47
47
47
47
46
46
46
46
45
45
45
44
44
44
44
43
43
43
42
42
42
41
41
40
40
40
39
39
38
38
37
37
36
35
34
34
32
31
29
27

Scoruri
GRE
500
100
500
497
495
493
490
488
485
482
480
477
475
472
469
467
464
461
459
456
453
451
448
445
442
439
436
433
429
426
423
420
416
412
409
405
401
396
392
387
382
378
372
366
359
352
345
336
325
312
295
267

Anexa 2
Echivalenele dintre diferite tipuri de scale normalizate

175

176