Sunteți pe pagina 1din 96

UNIVERSITATEA DIN ORADEA

FACULTATEA DE TIINE SOCIO-UMANE


DEPARTAMENTUL DE PSIHOLOGIE

BAZELE TEORETICE ALE EVALURII PSIHOLOGICE


- SUPORT DE CURS

TITULAR DE DISCIPLIN
LECTOR DR. ROSANA STAN

CUPRINS

Capitolul I
EVOLUIA ISTORIC A EVALURII PSIHOLOGICE
1. Introducere
2. Evaluarea psihologic n antichitate
3. Antecedentele tiinifice ale evalurii psihologice
4. Constituirea i dezvoltarea evalurii psihologice
4.1. Contribuia lui Galton
4.2. Contribuia lui Cattel
4.3. Contribuia lui Binet
4.4. Contribuia altor autori
4.5. Repercusiunile celor dou rzboaie mondiale
4.6. Perioada de criz a evalurii psihologice

Capitolul II
CTEVA CLARIFICRI CONCEPTUALE
1. Evaluarea i msurarea n psihologie
2. Noiunea de psihodiagnoz
3. Test i testare psihologic

Capitolul III
METODE DE BAZ N EVALUAREA PSIHOLOGIC
1. Noiunea de metod n psihologie
2. Metode nepsihometrice
2.1. Observaia
2.2. Convorbirea
2.3. Ancheta be baz de interviu
2.4. Anamneza (Metoda biografic)
3. Metode psihometrice
3.1. Concepte fundamentale n msurarea psihologic
3.1.1. Variabile statistice
3.1.2. Scale de msura
3.1.3. Indici statistici de start
2

3.2. Chestionarul psihologic


3.3. Testul psihologic
3.2.1. Definiie
3.2.2. Caracteristici generale ale testului psihologic
3.2.3. Clasificarea testelor psihologice
3.2.4. Domenii de utilizare ale testelor psihologice
3.2.5. Surse de eroare n testarea psihologic
Capitolul IV
PRINCIPII PSIHOMETRICE ALE UTILIZRII TESTULUI PSIHOLOGIC
1. Standardizarea
2. Obiectivitatea
3. Fidelitatea
3.1. Definiie i noiuni de baz
3.2. Metode de calcul a coeficientului de fidelitate
3.2.1. Metoda analizei consistenei interne
3.2.2. Metoda test-retest
3.2.3. Metoda formelor paralele
3.2.4. Metoda analizei fidelitii interevaluatori
3. 3. Interpretarea unui coeficient de fidelitate
3. 4. Factorii care intervin n estimarea fidelitii
4. Validitatea
4.1. Definiie
4.2. Tipuri de analiz a validitii
4.2.1. Validitatea de construct
4.2.2. Validitatea de coninut
4.2.3. Validitatea de criteriu
4.3. Interpretarea coeficienilor de validitate, factori i precauii legate de aprecierea lor
5. Dificultatea i sensibilitatea unui test psihologic

Capitolul V
METODOLOGIA CONSTRUIRII TESTELOR PSIHOLOGICE

Capitolul VI
ETALONAREA UNEI PROBE PSIHOLOGICE
1. Definirea termenilor
3

2. Eantionarea
3. Metode de obinere a normelor unui test psihologic
3.1. Prin transformri n clase echivalente
3.2. Prin transformri n vrste echivalente
3.3. Prin transformri n norme de vrst mintal
3.4. Prin transformri n cote standard i cote standardizate
3.5. Prin transformri n ranguri centile, decile i cuartile
3.6. Prin transformri n clasele scalei normalizate

Capitolul VII
ASPECTE ETICE ALE EVALURII PSIHOLOGICE

Capitolul VIII
PSIHODIAGNOZA FORMATIV vs PSIHODIAGNOZA CLASIC

Capitolul I
EVOLUIA ISTORIC A EVALURII PSIHOLOGICE
1. Introducere
Starea actual a evalurii psihologice este, fr ndoial, un produs al evoluiei istorice a
disciplinei i al interaciunii sale cu dezvoltarea psihologiei nsei i cu alte tiine similare.
Astfel, nu se poate s abordm conceptul evalurii psihologice, fr s fi trecut nainte printr-o
analiz istoric. McReynolds (1986) justific aceast analiz istoric aducnd diverse
argumente; n primul rnd, o cunoatere a evoluiei istorice a evalurii ofer o informaie ampl
i o aplicare mai bun a strii actuale a evalurii psihologice; n al doilea rnd, trecutul este
important prin el nsui, deoarece face parte din motenirea omenirii; i, n al treilea rnd, face
posibil ca anumite aproximri sau directive folosite de strmoii notri, i uitate de atunci, s fie
redescoperite.
2. Evaluarea psihologic n antichitate
Analiznd istoria omenirii, McReynolds (1986) ncearc s evidenieze faptul c, nc din
cele mai vechi timpuri, n toate societile civilizate s-a utilizat un anumit procedeu de evaluare.
Astfel, ntr-o prim etap, care ar putea fi numit magic sau mitic, apare n multe culturi
ghicirea sau prezicerea viitorului, aici putnd fi inclus astrologia. Aceasta este considerat ca
fiind unul din primele antecedente ale evalurii psihologice. Astrologii consider c aa cum
astrele regleaz ritmicitatea ciclului zi-noapte, a mareelor, a recoltelor etc., ele determin i o
mare parte a comportamentului uman a se nelege caracterul uman. Cu alte cuvinte, indivizii
sunt deosebit de sensibili la influena astrelor, aceast influen fiind determinat de poziia
relativ a planetelor n momentul naterii. La prima vedere, se pare c exist condiiile necesare
pentru un proces de diagnosticare, avnd n vedere c exist un evaluator, un evaluat,
instrumente, o intenie pentru explicaie i pronostic i o teorie care s l susin. Cu toate
acestea, o analiz mai detaliat ne face s nelegem astrologia ca pe ceva suficient de diferit de
evaluarea psihologic pentru a putea fi considerat un antecedent. n primul rnd, astrologia este
o practic ce ar putea fi inclus n magie; n al doilea rnd, subiectul care face obiectul evalurii
nu este individul n sine, i nici mediul su imediat, ci doar o dat, o or i un loc de fapt se
poate face o prezicere fr prezena persoanei care se presupune c este evaluat; n al treilea
rnd, nu are nici un fel de utilitate social, avnd n vedere c se limiteaz s prezic destinul
determinat de astre; i n ultimul rnd, astrologia a avut o evoluie minim de la nceputurile sale
pn n prezent, fr a avea nici un fel de interaciune cu evoluia psihologiei, adic, psihologia
s-a dezvoltat ntr-un mod complet independent de astrologie. Acest lucru l demonstreaz faptul
c nici un astrolog nu i-a dezvoltat teoria ntr-att nct s ajung s o converteasc ntr-o
5

coal sau ntr-un curent psihologic. Astfel, nu exist aspecte din astrologie care s se fi
transformat att de mult nct s ajung s se converteasc ntr-un construct psihologic, deci
astrologia nu a fost un antecedent al actualei evaluri psihologice.
DuBois (1970) situeaz apariia evalurii psihologice n China antic, unde se realiza o
selecie a copiilor care n viitor puteau s exercite funcii n administraia public. Cei
selecionai erau supui unui program intens de nvare, la finalul cruia se evalua dac
acumulaser pregtirea necesar pentru a ocupa posturile care urmau s le fie atribuite. Astfel,
acesta pare a fi un antecedent clar al selectrii de personal.
Un alt antecedent asupra cruia sunt de acord de obicei autorii care au studiat evoluia
istoric a evalurii psihologice este fiziognomia (caracteristicile psihologice ale unui individ pot
fi evaluate prin trsturile sale fizice), care i are rdcinile n gndirea filosofic greac.
Potrivit lui Rubinstein (1981), istoria tiinei demonstreaz cum s-au format vechile idei ale
filosofilor greci, n procesul cognitiv practic al omului, cu acumularea de cunotine de la
naturiti, medici i filosofi. Aceste idei s-au dezvoltat n opoziie cu ideile mitologice privind
lumea n general i omul n particular. Aristotel consider c sufletul i corpul sunt indivizibile.
Astfel, fiecare dintre funciile organice i are propriul suflet, corpul fiind considerat un
organism compus din organe i instrumente ale sufletului. La Aristotel, psihicul se apropie de
fizic, ceea ce implic o baz biologic a caracterului. Ideile lui Aristotel i-au gsit continuitatea
la discipolul su, Teofrast. Acesta face o sistematizare a principiilor fiziognomiei, care duce la
crearea unor caractere diferite ce se stabilesc prin intermediul observrii comportamentului
evident al indivizilor. Se stabilete astfel o nozologie a caracterelor, n care sunt incluse diferite
adjective ce serveau la clasificarea indivizilor n funcie de obiceiurile lor. Ideea evalurii
caracteristicilor psihologice prin intermediul caracteristicilor somatice este prezent mai recent
n tipologiile lui Kretschmer i Sheldon. Tot n acest context, ntlnim i teoria lui Hipocrate
care promoveaz patru tipuri (sangvinic, flegmatic, coleric i melancolic) pornind de la patru
clase de stri de spirit.
Aceast concepie naturalist manifestat printr-o evaluare psihologic pornind de la
caracteristici somatice (proprie fiziognomiei i gndirii hipocratice) va fi ntrerupt n Evul
Mediu de filozofia teologic, ce i va avea exponentul maxim n conceperea nebuniei ca pe o
posedare diabolic. Cu scopul de a diferenia subiecii posedai de cei neposedai se public, n
1486, cartea Malleus Malleficarum (Ciocanul ereticilor). n partea a doua a acesteia sunt
descrise semnele care permit identificarea vrjitoarelor.
La grania dintre antecedentele filosofice i cele biologice se afl contribuia important
din aceast perioad la evaluarea psihologic, opera lui Juan Huarte din San Juan Examen de
ingenios para las ciencias, publicat n 1575 i tradus n englez, n 1698, cu titlul The tryal of
6

wits (McReynolds, 1986). n Spania s-a reeditat de cinci ori pn cnd a fost inclus, n 1581, n
catalogul crilor interzise din Lisabona, iar doi ani mai trziu n cel din Madrid (Buela-Casaly;
Sierra, 1997). n aceast oper se abordeaz pentru ntia oar evaluarea ntr-o form explicit.
Se consider c oamenii difer n ceea ce privete talentul lor i c aceste diferene trebuie
evaluate pentru a se obine o adaptare ntre abiliti, ocupaii diferite i tipuri de educaie. Astfel,
se consider c mediul influeneaz nvarea, astfel nct se recomand ca studiile s fie
realizate ntr-un ora diferit de cel natal, deoarece influena familiei i a prietenilor reprezint o
piedic pentru nvare (Prez-lvarez, 1991 apud. Buela-Casaly; Sierra, 1997). Este, prin
urmare, precursorul cel mai clar al selecionrii de personal. n cercurile universitare, evaluarea
apare n paralel cu crearea primelor universiti europene, unde se realizau n mod regulat
examene pentru obinerea titlurilor i a distinciilor (Anastasi, 1988).
n definitiv, probabil c antecedentul cel mai clar al evalurii psihologice este tendina
natural a omului de a-i evalua pe ceilali. Am putea indica o infinitate de antecedente posibile
ale evalurii psihologice; cu toate acestea, pentru a contextualiza principalele evenimente care
au dat natere actualelor instrumente de evaluare, nu trebuie s mergem mai departe de secolul
al XVIII-lea.

3. Antecedentele tiinifice ale evalurii psihologice


Importantele progrese tiinifice produse n secolul al XVIII-lea, i mai ales n secolul al
XIX-lea, vor face ca psihologia s se separe de speculaia filosofic i s se apropie de metoda
tiinific. Antecedentele tiinifice ale evalurii psihologice ar putea s se situeze n dezvoltarea
disciplinelor ca frenologia, matematica, psihofizica, psihiatria, psihologia educativ i
evoluionismul.
Frenologia apare la sfritul secolului al XVIII-lea i se bucur n curnd de o mare
popularitate. Creatorul acesteia, Gall (1758-1828), proporioneaz prima conceptualizare
sistematic a trsturilor, care se sprijin pe urmtoarele enunuri:
a. Facultile mentale sunt nnscute.
b. Creierul este organul minii.
c. Forma i dimensiunea creierului se pot cunoate n funcie de forma i msura craniului.
d. Mintea posed faculti separate, creierul este format din organe separate i fiecare facultate
mental se manifest prin intermediul unui organ cerebral diferit.

e. Dimensiunea fiecrui organ poate fi estimat n timpul vieii iar n cazul celorlalte condiii
egale, dimeniunea este o msur a capacitii organului.
f. Orice organ, dac este predominant activ, transmite corpului anumite atitudini i micri,
numite limbajul su natural.
Dei frenologia face deja parte din istorie, ea a ajutat la fixarea ideii conform creia
comportamentul i organismul nu sunt entiti independente, ci sunt strns legate ntre ele. Gall
practica un sistem de diagnostic bazat pe palparea craniului pentru a cunoate facultile
dominante ale fiecrui individ. Printre contribuiile pe care, portivit lui McReynolds (1986), le
aduce frenologia la evaluarea psihologic se remarc urmtoarele:
a. Se creeaz o taxonomie mental, n funcie de care se pot explica diferenele individuale.
b. Se pune accentul pe diferenele individuale.
c. Se promoveaz un aspect aplicat al psihologiei.
d. Se propune paradigma de evaluare, difereniind elementele incluse ntr-o sesiune de evaluare
(evaluator, subiect evaluat, profile...).
e. Se elaboreaz scale pentru evaluarea unor variabile de personalitate.
f. Se pune accentul pe obiectivitatea datelor.
Matematica a avut o influen n constituirea i dezvoltarea ulterioar a evalurii
psihologice. Prima contribuie este reprezentat de Quetelet, un matematician belgian, care
astzi e considerat a fi unul dintre fondatorii aplicrii statisticii la tiinele sociale (Silva, 1982).
Quetelet a studiat variabilele biologice i sociologice, observnd c ambele urmau o distribuire
gaussian, astfel c a dezvoltat norme i msuri de tendin central. Influena sa asupra
evalurii psihologice se concentreaz pe dou aspecte importante: acela de a fi unul dintre
autorii care s-au interesat n mod sistematic de diferenele individuale i faptul c metodele sale
au avut o mare influen asupra unor autori importani precum Galton, Pearson i Spearman.
Psihiatria a fost o alt disciplin care a contribuit n bun msur la dezvoltarea evalurii
psihologice. Efortul de a diferenia tulburrile mentale se traduce prin nevoia unor tehnici de
evaluare pentru a stabili diagnostice difereniale. Astfel, Pinel (1745-1826) introduce o scurt
clasificare a bolilor mentale, care fcea posibil un tratament mai difereniat. Pinel susine
valoarea anamnezei pentru diagnostic. ns, fr ndoial, contribuia sa cea mai important a
constituit-o schimbarea atitudinii n ceea ce privete bolnavii mintal, ajungnd s-i considere
drept bolnavi cu dreptul la tratament i libertate i nu drept subieci ce trebuie izolai i nchii,
8

cum erau considerai pn atunci. Ideile lui Pinel au ajuns n Italia, unde i-au gsit un mare
susintor n persoana lui Lombroso, care i-a concentrat opera asupra relaiei dintre aspectul
penal i cel psihiatric, punnd problema unei posibile scuze n delictele comise de bolnavii
mintal. Studiul legturii dintre delincven i boal l-a determinat s-i elaboreze celebra teorie
referitoare la delincvena nnscut. Conform acestei teorii, comportamentul delincvent poate
avea o origine degenerativ a organismului, datorat efectului unor factori precum sifilisul,
alcoolul, epilepsia, vrsta avansat a prinilor etc., care ar aciona n timpul dezvoltrii fetale
producnd o degenerare a centrilor nervoi superiori, care vor constitui ulterior cauza
comportamentului delincvent. Opera lui Pinel i atinge punctul culminant prin figura lui
Kraepelin (1856-1926), care a fost interesat de problematica clasificrii tulburrilor mintale,
considernd c pentru a putea face o bun evaluare i intervenie, e nevoie nti de o clasificare.
Probabil c cea mai important contribuie a sa a fost schimbarea de la o concepie simptomatic
a bolii la o concepie evolutiv, adic, manifestrile externe ale bolii sunt secundare n ceea ce
privete originea i evoluia acesteia. Aportul su la evaluarea psihologic se concentreaz n
mod concret asupra interesului su constant de a evalua n mod obiectiv comportamentul
pacienilor si. Astfel, el evalua funcii sau aptitudini precum memoria, atenia, capacitatea de
nvare, timpul de reacie, asocierile verbale etc. Paralel cu aceast etap crete interesul fa de
retardaii mintal, crendu-se n Europa i n America numeroase instituii pentru ngrijirea
acestora. Interesul pentru un tratament adecvat pentru retardaii mintal a scos n eviden nevoia
unor criterii de diagnosticare i de clasificare, care s permit diferenierea ntre subiecii
normali, bolnavii mintal i retardai. n acest context, trebuie s-l remarcm pe Esquirol (17721840), medic francez, care n 1838 a publicat o oper n dou volume, n care a dedicat peste
100 de pagini retardrii mintale. O alt contribuie important a lui Esquirol a fost concepia sa
privind retardarea mintal. Pentru acest autor, retardarea varia de la normalitate pn la
retardarea cea mai profund. Pentru aceasta a realizat mai multe ncercri de a evalua i clasifica
diferitele grade i tipuri de retardare mintal, ajungnd la concluzia c cel mai bun criteriu de a
evalua nivelul de deteriorare intelectual este utilizarea limbajului. Este important s se aib n
vedere c actualele criterii privind retardarea mintal sunt n mare parte lingvistice i c testele
de inteligen sunt, de obicei, destul de pline de coninuturi verbale (Anastasi, 1988). Psihofizica
poate fi considerat drept o disciplin precursoare a psihologiei tiinifice. Metodele imaginate
de Fechner permit relaionarea experienelor subiective cu msuri obiective. Astfel, consider c
experienele psihologice se pot verbaliza i, n consecin, se pot clasifica pe scale de intensitate
sau discriminare.
Psihofizica avea ca postulat iniial descoperirea unor legi generale pentru descrierea
relaiilor dintre minte i corp. Contribuia sa la evaluarea psihologic se poate observa n studiul
9

concret al fenomenelor psihice, fcndu-se legtura dintre experiena subiectiv i msurile


obiective, crearea unor noi metode de investigare a acestor elemente i sistematizarea teoretic a
acestora (Zabrodin, 1985, apud. Buela-Casaly; Sierra, 1997). Dei autori precum Fechner i
Weber erau mai interesai de legile generale dect de diferenele individuale, odat cu ei apare
situaia de examen psihologic; astfel, de exemplu, Fechner utilizeaz deja autoraportul
subiectului ca instrument de evaluare.
Psihologia educativ atinge punctul culminant odat cu modurile de abordare inovatoare
produse n ceea ce privete interesul crescnd fa de educaie, cu colarizarea obligatorie
ulterioar, aprnd astfel nevoia de aplicare a principiilor psihologice n coli i cererea unei
evaluri a randamentului academic. Acest interes pentru evaluarea n mediul colar i-a gsit
continuitatea la autori precum Throndike, Hall i Binet.
Evoluionismul marcheaz un eveniment important n istoria tiinelor umane. Legtura
dintre Darwin i Galton a favorizat i mai mult influena teoriilor evoluioniste n ncercarea de a
explica diferenele individuale i, n cele din urm, inteligena uman. Baza evoluionismului
const n a recunoate variabilitatea membrilor aceleiai specii, n care caracteristicile pot fi
motenite. Astfel, n natur se produce o selecie natural prin intermediul supravieuirii
membrilor celor mai puternici sau mai bine adaptai. La specia uman, capacitatea diferit de
adaptare se numete inteligen. Diferenele de inteligen erau perfect acceptate n societatea
secolului al XIX-lea. Astfel, darwinismul social ajuta la justificarea ordinii sociale fixe.
Antecendentele cele mai tiinifice ale evalurii psihologice i au rdcinile n primele
laboratoare de psihologie. n 1877 s-a produs prima ncercare de nfiinare a unui laborator de
psihofiziologie de ctre savanii britanici Venn i Ward. Cu toate acestea, Senatul din
Cambridge a respins aceast iniiativ, calificndu-i pe cei doi savani drept atei (Yakunin, 1985,
apud. Buela-Casaly; Sierra, 1997). Cu doi ani mai trziu, Wundt inaugura n Leipzig (1879)
primul laborator de psihologie, acest moment fiind considerat drept naterea psihologiei
tiinifice. Ideea lui Wundt de a apropia psihologia de fiziologie, n ciuda faptului c ntlnise o
opoziie clar n cercurile filosofice, a ctigat n curnd adepi. Cu toate acestea, aceast idee nu
era nou, deoarece Sechenov, un cunoscut savant rus, ncercase s interpreteze fenomenele
psihice dintr-un punct de vedere fiziologic. De fapt, cartea sa Reflejos del cerebro (Reflecii ale
creierului) a fost editat n 1863, adic, cu 11 ani nainte ca Wundt s publice Bazele psihologiei
fiziologice. ntr-un articol scris n 1873, Sechenov, plecnd de la tradiia materialist a
gnditorilor rui, susine teza referitoare la determinarea obiectiv a intelectului. Ideile lui
Sechenov au fost foarte bine primite n rndurile psihiatrilor i neurologilor rui, ceea ce a dus la
o restructurare a psihologiei din punct de vedere fiziologic. O dovad a acestui fapt o constituie
crearea primului laborator de psihologie din Rusia, nfiinat de Bejteriev, n 1886, n clinica de
10

bolnavi alienai i boli nervoase din oraul Kazan. Cu civa ani mai trziu, n 1891, se constituia
Societatea Rus de Psihologie Experimental (Yakunin, 1985, apud. Buela-Casaly; Sierra,
1997). De la crearea sa i pn la nceputul secolului al XX-lea, laboratorul lui Wundt a fost
considerat centrul psihologiei experimentale, fiind exemplul ce trebuia urmat n crearea de noi
laboratoare. Obiectul de studiu al noilor psihologi experimentali era acela de a ajunge s
abordeze descrieri generale ale comportamentului uman. Diferenele individuale nu numai c nu
interesau pe nimeni, ci ajungeau s fie considerate drept erori de msurare. n alegerea temelor
i n anumite metode utilizate se observa influena medicinei i a fiziologiei. Pelechano (1988,
apud. Buela-Casaly; Sierra, 1997), consider c tipul de psihologie experimental practicat de
Wundt i de adepii si presupunea n realitate o limitare a dezvoltrii evalurii psihologice.
Wundt nega importana psihologiei difereniale, nu autoriza utilizarea chestionarelor pentru
investigarea psihologic, nu accepta posibilitatea unei psihologii tiinifice n afara laboratorului
i nici studiile filogenetice i ontogenetice ale psihismului uman. Cu toate acestea, nu totul a fost
negativ, avnd n vedere c psihologia experimental a secolului al XIX-lea a ajutat la scoaterea
n eviden a importanei de a controla n mod riguros condiiile n care se fceau observaiile.
De exemplu, se controlau caracteristicile stimulului, contextul n care se prezenta acesta,
instruciunile pe care le primea subiectul etc. n definitiv, se ncerca evaluarea tuturor subiecilor
n aceleai condiii standardizate. Dup cum bine se tie, toate acestea au fost acceptate n
totalitate n procesul de construire i n aplicarea testelor (Anastasi, 1988).
4. Constituirea i dezvoltarea evalurii psihologice
Exist un anumit consens n ceea ce privete considerarea lui Galton, Cattell i Binet drept
autorii care au configurat evaluarea psihologic ca disciplin tiinific. n cele ce urmeaz se va
face referire la ei i se va face o trecere n revist a diferitelor evenimente care au presupus
dezvoltarea acestei discipline.
4.1. Contribuia lui Galton
Galton (1822-1911) este considerat printele psihometriei i al psihologiei difereniale. n
ciuda faptului c era un om multilateral n ceea ce privete interesele sale tiinifice, el a tiut si concentreze cercetrile asupra motenirii inteligenei umane. Considera c aceasta este
nnscut i, astfel, prin intermediul caracterului ereditar se putea obine o mbuntire a
indivizilor prin intermediul eugeniei. Laboratorul su antropometric din Muzeul Kensington din
Londra a devenit celebru n toat lumea. n anul 1884, cnd a avut loc i celebrarea unui congres
internaional de igien, nfiineaz un laborator antropometric i propune vizitatorilor s afle, n
schimbul a trei penny, msura ctorva trsturi fizice, ascuimea vizual i auditiv, timpul de
reacie, fora muscular i cteva funcii senzoriale. Cu aceste informaii a publicat primul tabel
11

de baremuri, n care i puteau compara rezultatele vizitatorii care aveau s treac prin laborator
(DuBois, 1970). Majoritatea instrumentelor care se utilizau n laboratorul su antropometric au
fost create de el nsui, iar unele nc se mai utilizeaz i n prezent, cum este cazul barei lui
Galton pentru discriminarea vizual a lungimii i seria greutilor gradate pentru msurarea
discriminrii chinestezice. A acordat o importan special discriminrii senzoriale, deoarece
considera c aceasta ajut la evaluarea capacitii intelectuale. Astfel, n numeroasele evaluri
realizate a descoperit c idioii prezint de obicei deficiene n capacitatea de discriminare a
temperaturii i a durerii (Anastasi, 1988).
Contribuiile cele mai relevante ale lui Galton ar putea fi rezumate n punctele urmtoare
(Pelechano, 1988, apud. Buela-Casaly; Sierra, 1997):
a. Interesul de a face o analiz cantitativ a caracteristicilor i diferenelor umane. Sub
acest aspect se observa o influen a matematicianului Quetelet, care n anul 1846 demonstrase
deja cum anumii indicatori antropometrici urmau o distribuie gaussian. Astfel, Galton susinea
c diferenele individuale se puteau explica n mod adecvat dac se concepeau sub form de
continuuri cantitative care urmau distribuia curbei lui Gauss.
b. Interesul pentru adunarea empiric i sistematic de informaii. Acesta se demonstreaz
prin munca sa neobosit din laboratorul antropometric din South Kensington Museum din
Londra, unde a reuit s adune date aparinnd unui numr de 9.377 de persoane, care erau
evaluate ntr-un numr considerabil de probe (timp de reacie, msurri fizice, rspunsuri la
scale de calificare...).
c. Aplicarea statisticii pentru interpretarea informaiilor. Pe lng utilizarea anumitor
msuri de tendin central, Galton a introdus indicele de corelare (de fapt, n anul 1888 a ajuns
s publice un articol despre Corelations and their measurement, chiefly from antropometric
data) care mai trziu avea s fie completat de Pearson, ducnd la apariia coeficientului de
corelare i pe baza cruia avea s se stabileasc modelul corelaional.
d. Interesul pentru studiul diferenelor individuale. Urmnd teoria evoluionist, Galton
nelegea diferenele individuale ca pe un rezultat al unor mecanisme i procese ereditare. Pentru
a demonstra acest lucru, a utilizat studiul arborilor genealogici i corelaionarea probelor
psihologice ntre prini i copii. Prin intermediul acestei metodologii a reuit s stabileasc
legea ntoarcerii la medie. Galton s-a vzut obligat s abordeze aceast lege pentru a putea
explica anumite date precum faptul c prinii foarte inteligeni tindeau s aib fii mai puin
inteligeni, n timp ce prinii mai puin inteligeni tindeau s aib fii mai inteligeni.

12

Gndirea lui Galton i un bun rezumat al operei sale pot fi gsite n cartea Motenire i
eugenie, n care se afl o compilaie de texte provenind din diverse opere ale sale.
4.2. Contribuia lui Cattell
James McKeen Cattell (1861-1934) a fost un psiholog american cu o educaie solid pe
care a primit-o n Europa. Teza lui de doctorat a tratat diferenele individuale n cadrul timpului
de reacie i a fost realizat n laboratorul lui Wundt (Leipzig). Ulterior, a lucrat cu Galton n
laboratorul antropometric din South Kensington Museum din Londra. n 1888 a fost numit
profesor de psihologie la Universitatea din Pennsylvania. Doi ani mai trziu public n revista
Mind un articol intitulat Mental tests and measurements, care marcheaz un eveniment
important n istoria evalurii psihologice, avnd n vedere c este pentru prima oar cnd se
utilizeaz termenul test n literatura psihologic (McReynolds, 1986), iar n el se descriau
testele care se aplicau anual la studenii universitari cu intenia de a evalua nivelul intelectual al
acestora. Ulterior s-a mutat la Universitatea din Columbia, unde a creat prima baterie de probe
de evaluare psihologic. n scurt timp, metodologia i procedeul de elaborare a testelor au
devenit foarte populare. n ultima decad a secolului al XIX-lea, testele se aplicau, n Statele
Unite, la toate tipurile de subieci (colari, studeni universitari, aduli...). Cu toate acestea,
traiectoria strlucit a lui Cattell se oprete, cel puin parial, n faa criticilor aduse de Wissler i
Sharp. Primul, care fusese discipolul lui Cattell, a prezentat un studiu detaliat n care analiza
rezultatele lui Cattell, demonstrnd validitatea redus atins de teste. Concret, a demonstrat c
coeficienii de corelare dintre testele psihologice i calificativele colare erau relativ redui. Pe
de alt parte, Sharp a demonstrat fidelitatea sczut i valoarea predictiv redus pe care o
deineau testele lui Cattell (Pelechano, 1988, apud. Buela-Casaly; Sierra, 1997).
4.3. Contribuia lui Binet
Binet (1857-1911) era liceniat n drept i doctor n tiine naturale i a intrat n psihologia
minii lui Ribot, marele iniiator al psihologiei experimentale din Frana. Ribot nelegea c
progresul psihologiei se afl n metodele experimentale (dei nu era cercettor), nu degeaba a
fost fondatorul primului laborator de psihologie de la Universitatea din Sorbona, n anul 1889. n
anul 1895, Binet nfiineaz LAnne Psychologique, prima revist francez de psihologie. n
aceast revist public un articol, La Psychologie individuelle, n care prezint bazele unei noi
abordri a evalurii inteligenei. Binet manifesta acelai interes ca i Galton pentru evaluarea
diferenelor individuale, ns respingea ideea c inteligena uman se poate evalua prin
intermediul proceselor senzorio-motorii. n articolul lor, Binet i Henri susin c inteligena
trebuie evaluat n funcie de preformanele subiecilor n diverse sarcini care implic o varietate
de procese mentale complexe (McReynolds, 1986). Binet i Henri au nceput s evalueze
13

procese ca memoria, atenia, imaginaia, nelegerea, sensibilitatea artistic i moral,


sugestibilitatea, puterea voinei i abilitatea motorie. Binet include ca i caracteristici ale
comportamentului inteligent alegerea i meninerea unei direcii precise, adaptarea pentru
atingerea unui scop i autocritica (Cronbach, 1990).
Marea ans a lui Binet sosete atunci cnd este numit de ctre Ministerul francez al
Educaiei membru n comisia care avea s se ocupe de cutarea unei soluii pentru copiii cu
deficiene, care intraser n coala public n urma punerii n vigoare a nvmntului
obligatoriu n Frana. Ca rspuns la aceast cerere, Binet, n colaborare cu Simon, elaboreaz o
scal care conine 30 de probleme cu grade de dificultate crescnde. Pentru a calcula nivelul de
dificultate, aceast scal s-a aplicat la 50 de copii normali, cu vrste cuprinse ntre 3 i 11 ani i
la civa retardai mintal. Coninutul itemilor acoperea o mare varietate de funcii, dei
predominau problemele legate de nelegere i judecat. Proba rezultant, care este cunoscut
sub denumirea de scala 1905, a fost considerat un instrument de evaluare provizorie (Anastasi,
1988). Dup cum semnaleaz Pichot (1994, apud. Buela-Casaly; Sierra, 1997) pentru prima
oar se ieise din epoca experienelor de laborator pentru a se intra n viaa concret. Binet i
Simon continu s lucreze la aceast scal, iar n 1908 prezint o a doua versiune la care se
adaptaser serii de itemi pentru grupe de vrst. Vrsta mintal se stabilea n funcie de vrsta
corespunztoare seriei celei mai ridicate obinut per total. Avnd n vedere c fiecare serie, care
corespunde cu o vrst mintal determinat const din cinci probleme, se aduga la vrsta de
baz (aceea a seriei realizate n totalitate corect) 1/5 ani pentru fiecare test realizat corect
aparinnd unor serii superioare. Vrsta mintal obinut era comparat cu vrsta cronologic,
vzndu-se astfel dac copilul urma o evoluie normal, ntrziat sau naintat. n 1911, se
prezint o a treia versiune a scalei, n care se mrise numrul de itemi la anumite niveluri i se
extinsese vrsta adult. Cu toate acestea, versiunea cea mai difuzat a fost realizat de Terman
de la Universitatea din Stanford, fiind cunoscut sub denumirea de Scala lui Stanford-Binet. La
aceasta se utilizeaz pentru prima oar termenul de coeficient de inteligen (CI), rezultat din
mprirea vrstei mintale la vrsta cronologic. Ulterior au aprut i alte versiuni, ns un
interes special l prezint versiunea realizat de Kuhlmann, n 1912 (Scala Kuhlmann-Binet),
care a extins scala n partea inferioar pn la vrsta de trei luni, fiind revizuit ulterior n 1937
i 1960. Terman efectueaz nc dou revizuiri i, n cele din urm, Thorndike o realizeaz pe
ultima de pn acum, n 1986 (Rogers, 1995).
Cu toate acestea, aceste scale nu erau lipsite de probleme. Astfel, n timp ce Galton avansa
msurarea unei inteligene nnscute sau biologice, Binet apr evaluarea unei inteligene de
origine social. n curnd micarea eugenic adopt ca instrument testul lui Binet i Simon,
identificnd inteligena nnscut cu cea social. Pelechano (1988, apud. Buela-Casaly; Sierra,
14

1997) semnaleaz faptul c logica utilizat de Binet n construirea i interpretarea scalei era
corect, ns vzut dintr-o perspectiv actual avea cteva probleme importante:
a. Nu s-a demonstrat c comportamentele aplicate ar fi fost reprezentative pentru ceea ce
se dorea evaluat (capacitatea intelectual).
b. Mostra utilizat pentru clasificarea punctuaiilor nu era reprezentativ pentru populaia
la care se aplica ulterior.
c. Utilizarea vrstei cronologice ca i criteriu variabil pentru msurarea vrstei mintale,
fcndu-se astfel s se neleag implicit c la fiecare dou luni se produce o schimbare n
capacitatea intelectual.
d. Modelul acumulativ conform cruia fiecare problem rezolvat este echivalent cu o
perioad de vrst mintal nu a fost demonstrat.
e. Presupunerea c distribuirea punctuaiilor este egal n fiecare grup de vrst nu este
corect.
f. Se presupune c toi copiii au o dezvoltare normativ, adic egal cu cea a grupului de
referin.
Pe de alt parte, tipul de probleme abordate se afla n strns legtur cu coninuturile
academice, astfel c scala prezicea foarte bine performana academic, care nu este aceeai cu
capacitatea intelectual.
n ciuda problemelor metodologice care se evideniaz n scalele lui Binet, acesta trebuie
considerat drept cel mai mare propulsor al evalurii psihologice. Activitatea sa a fost ntr-adevr
aceea a unui evaluator, iar influena lui a fost simit timp de mai multe decenii. O bun dovad
a acestui fapt a fost numrul mare de cercettori care s-au interesat de evaluarea inteligenei n
primele dou decenii ale secolului al XX-lea. Producia din acest domeniu era att abundent ct
i diversificat. De aceea, n 1921, directorii revistei Journal of Educational Psychology au
organizat un congres intitulat Inteligena i msurarea acesteia la care au invitat personaliti
distinse n materie (Terman, Thorndike, Peterson, Thurstone etc.) pentru a discuta despre natura
inteligenei (Sternberg, 1986). Rezultatul a fost decepionant; existau aproape tot attea concepii
de inteligen ct i experi care i ddeau cu prerea n legtur cu aceast tem. Confuzia era
att de mare nct Binet a ajuns s pronune celebra fraz inteligena este ceea ce msoar
testele. Cu toate acestea, congresul a servit la stabilirea unui anumit acord privind drumul ce
trebuia urmat n viitor pentru cercetarea inteligenei. De atunci au trecut mai mult de aptezeci

15

de ani i nc nu s-a ajuns la un acord unanim referitor la ceea ce este inteligena i la cum
trebuie evaluat (Eysenck, 1991).
4.4. Contribuii ale altor autori
Witmer, la fel ca i precursorul su Cattell, era interesat de studiul diferenelor individuale.
Cu toate acestea, interesul su principal se concentra asupra aplicaiei practice a cunotinelor
psihologice. n anul 1896, Witmer fondeaz prima clinic psihologic (de fapt, aceast dat este
considerat de obicei drept nceputul psihologiei clinice, dei nu trebuie s se interepreteze c
Witmer ar fi fost primul psiholog clinician) (Buela-Casaly; Sierra, 1997). Tipul de munc ce se
realizeaz n aceast clinic se regsete n primele numere ale revistei The Psychological
Clinic, fondat n 1906 i condus de Witmer. Majoritatea cazurilor care se tratau proveneau din
mediul colar. n primii ani, nu dispunea de proble specifice de evaluare, astfel c diagnosticul
su se baza n principal pe interviu. Ulterior, cnd apar testele, adopt unul din ele i creeaz
Witmer formboard i Witmer cylinders, care au fost utilizate timp de mai muli ani n clinica lui.
Se concentra asupra evalurii comportamentelor specifice ale subiecilor i viza tratamentul
acestor comportamente. De aceea, a fost considerat drept un predecesor al evalurii
comportamentale (McReynolds, 1986). Witmer a fost un autor cu influen limitat n evaluarea
psihologic. Cu toate acestea, marele lui merit a fost ncercarea de a aplica psihologia la
problemele care apar n viaa real. Pe de alt parte, clinica lui psihologic a servit ca model
pentru multe altele care s-au nfiinat mai trziu (Buela-Casaly; Sierra, 1997).
Spearman (1863-1945) reprezint un alt pas important n constituirea evalurii psihologice
pentru faptul de a fi aplicat metodele corelaionale n cercetarea inteligenei. n anul 1904 a
publicat un articol important intitulat General intelligence, objectively determined and
measured, unde se stabilesc bazele teoriei psihometrice. A fost primul autor interesat s caute o
explicaie pentru corelarea redus care se obinea ntre diferite teste de inteligen i s abordeze
nevoia de a utiliza probe paralele pentru evaluarea sa. Marea contribuie a lui Spearman nu a fost
numai una metodologic, el fiind, de asemenea, autorul primei mari teorii a inteligenei, numit
teoria celor doi factori (un factor general i anumii factori specifici). Conform teoriei respective,
capacitatea reprezentat n factorul general (factorul g) este legat de toate sarcinile intelectuale,
n timp ce capacitile reprezentate de factorii specifici sunt legate de sarcinile simple. Pentru a
explica natura factorului g, Spearman a propus dou teorii. n prima, se spunea c factorul g este
legat de nivelul de energie cerebral pe care o pot utiliza oamenii pentru a rezolva probleme
intelectuale; a doua consider c diferenele din factorul g se pot explica n funcie de diferenele
individuale din capacitatea oamenilor de a utiliza trei principii calitative de percepie:
acumularea experienei, deducia relaiilor i deducia corelrilor (Sternberg, 1986). n anii
16

treizeci, aceast schem bifactorial va fi nlocuit cu un model multifactorial reprezentat de


Thurstone.
n cele din urm, Freud (1856-1939) vine cu o abordare a diagnosticrii bazat pe tehnicile
de asociere i pe utilizarea simbolismului. n 1909, conferinele sale de la Clark University din
New York au favorizat difuzarea psihoanalizei n Statele Unite (Avila, 1992b, apud. BuelaCasaly; Sierra, 1997), ceea ce a dus la diagnosticul dinamic ce se va dezvolta ncepnd cu anii
treizeci cu ajutorul tehnicilor proiective.
4.5. Repercusiunile primului i celui de-al doilea rzboi mondial
Exist un anumit acord ntre autori n considerarea celor dou conflicte mondiale drept
fapte determinante pentru evoluia evalurii psihologice, ntre aceste dou momente istorice
ncadrndu-se ceea ce Silva (1982) numete epoca clasic a diagnosticului psihologic; astfel,
potrivit acestui autor, att linia psihometric ct i cea proiectiv i clinic a actualei evaluri
psihologice nc mai triesc din marile evenimente importante din aceast epoc: marile teste de
inteligen, primele chestionare de interese i primele teste proiective.
O dat cu nceperea primului rzboi mondial, industria generat n jurul rzboiului
afecteaz i psihologia, i mai concret evaluarea psihologic. Astfel, American Psychological
Association (APA) a numit un comitet care avea s se ocupe de studierea posibilului ajutor pe
care l-ar fi putut oferi psihologia. A aprut nevoia de a se seleciona peste un milion de soldai,
pentru care era esenial s se dispun de probe colective care s permit clasificarea soldailor n
funcie de nivelul lor intelectual i de aptitudinile lor de a oferi un anumit tip de serviciu. Avnd
n vedere c majoritatea testelor existente erau de aplicare individual, a fost necesar s se
recurg la toate tipurile de teste care se puteau aplica n mod colectiv. Arthur Otis a pus la
dispoziia Armatei o serie de teste pe care le elaborase, dar pe care nu apucase s le publice
(Buela-Casaly; Sierra, 1997). Era nevoie de probe de dificultate progresiv, cu rspunsuri scurte,
o corectare rapid i obiectiv, cu forme diferite (pentru a evita nvarea) i de aplicare
colectiv. Probele construite pentru evaluarea nivelului intelectual au fost cunoscute sub numele
de Army alpha test i Army beta test. Prima se aplica la populaia general (instruit) i consta
din urmtoarele subprobe: ndeplinirea ordinelor, probleme aritmetice, sinonime i antonime,
sim practic, analogii, informaii i gramatic. Fiecare subprob avea o dificultate crescnd i
trebuia s se rspund la ea ntr-un timp limitat. A doua prob era gndit pentru persoane
analfabete sau pentru persoane care nu vorbeau limba englez; astfel, n aceasta nu erau incluse
coninuturi verbale, ci consta din labirinturi, serii, cuburi, puzzle, construcii geometrice, cifresimbol i numere. Desigur, timpul de rspuns era, de asemenea, limitat. Pentru a evalua
simptomatologia neurotic s-a utilizat Woodworth personal data sheet, un inventar de
17

personalitate elaborat de Woodworth i care a ajuns s fie aplicat la peste un milion i jumtate
de persoane.
Influena acestui proces a avut o mare importan n dezvoltarea evalurii psihologice sub
diverse aspecte sintetizate n punctele urmtoare (Buela-Casaly; Sierra, 1997):
a. Primul, i poate cel mai important, a fost considerarea figurii psihologului drept un
profesionist calificat, ce poate rezolva problemele vieii reale.
b. Perfecionarea metodologiei de construire a testelor i formarea unei mari baze de date
(peste un milion i jumtate de subieci) din populaia general.
c. Tipul de evaluare realizat n armat s-a adaptat la domenii precum cel industrial
(selecia i evaluarea personalului) i cel clinic.
d. Consolidarea aplicrii testelor cu conotaia rezultant a psihologului care trece teste.
Evaluarea de tip clinic nu apare la ntmplare dup primul rzboi mondial. Pe de o parte,
instrumentele de evaluare clinic nu aveau nici o utilitate n sarcinile de selectare i plasare
cerute de armata american, ns ele devin necesare dup rzboi pentru reintroducerea
subiecilor n societate. Difuzarea tehnicilor proiective ncepe prin publicarea de ctre
Rorschach, n 1921, a lucrrii Psychodiagnostik, dei nu trebuie s uitm c Jung prezentase deja
n 1904 proba asocierii libere a cuvintelor (Buela-Casaly; Sierra, 1997).
Antecedentele testului lui Rorschach pot fi regsite n vechea idee greceasc, conform
creia interaciunea unei persoane cu o entitate ambigu faciliteaz informaii pentru cunoaterea
persoanei respective. n Renatere, Leonardo da Vinci i sftuia pe discipolii si s-i exerseze
imaginaia contemplnd formele sau figurile pe care le desena umezeala pe perei. ns fr
ndoial, antecedentul cel mai clar este tehnica numit klebsografie (dezvoltat de Klebs), care
const din aruncarea unor picturi de vopsea pe o bucat de hrtie, care apoi se ndoaie pe la
jumtate, interpretndu-se petele obinute. La sfritul secolului al XIX-lea, Binet ncepe s
utilizeze petele de vopsea pentru a studia capacitatea imaginaiei vizuale. Civa ani mai trziu,
Herman Rorschach utilizeaz aceast tehnic pentru diagnosticarea personalitii i tulburrilor
psihice. Din totalitatea de foi utilizate selecioneaz zece cu scopul de a-i publica metoda, ceea
ce nu a reuit dect cu doi ani mai trziu, graie medicaiei lui Morgenthaler, care n plus i-a
sugerat lui Rorschach s schimbe titlul original, Metoda i rezultatele unui experiment
diagnostic bazat pe perceperea i interpretarea formelor cauzale cu Psihodiagnostic. La
nceput, cartea a fost acceptat de puin lume. Criticile au fost puine i n general nefavorabile,
ceea ce i-a produs o decepie considerabil. Rorschach a murit fr s cunoasc popularitatea pe
care avea s o aib tehnica pe care o crease (Serrate, 1980, apud. Buela-Casaly; Sierra, 1997).
18

Civa ani mai trziu, Murray public n 1935 Testul de apercepie tematic (TAT) ca
alternativ la tehnica lui Rorschach. n paralel cu aceast dezvoltare de tehnici proiective
continu s se fac progrese n domeniul psihometric, manifestate printr-o rafinare a tehnicilor
factoriale. Astfel, Thrustone public n 1935 Vectors of the Mind, iar n 1938 Primary mental
abilities, unde inteligena capt o natur multivariabil (Rogers, 1995).
n 1939 se public lucrarea Wechsler-Bellevue intelligence scale, prima scal a lui
Wechsler pentru aduli, cu anumite diferene fa de aceea a lui Stanford-Binet: fiecare subtest
includea itemi pentru fiecare grup de vrst, punea mai puin accentul pe rapiditatea
rspunsului i coninea destul de multe componente nonverbale (Rogers, 1995). Alte publicaii
relevante din aceast perioad sunt Inventarul intereselor vocaionale al lui Strong (1927) i
Testul gestaltic al lui Bender (1938), (Buela-Casaly; Sierra, 1997).
Dup cum se ntmplase i n cazul primului rzboi mondial, al doilea rzboi mondial are,
de asemenea, drept consecin o dezvoltare semnificativ n construirea i aplicarea testelor.
Pentru selecionarea personalului militar, n Statele Unite s-a dezvoltat Army general
classification test (care cuprindea subprobe de lectur, vocabular, raionament artimetic, calcul
artimetic i relaii spaiale), o prob de aplicare colectiv din motive evidente i care a fost
aplicat la peste nou milioane de persoane, n timpul rzboiului. ntre timp, armata britanic
optase pentru utilizarea unor probe de inteligen general (care evaluau factorul g) cu
coninuturi neverbale. Dou dintre probele care s-au utilizat sunt n vigoare i n prezent:
Matricile progresive ale lui Raven i Testul jocului de domino al lui Anstey. n definitv, s-ar
putea spune c al doilea rzboi mondial a presupus aplicarea de teste cea mai numeroas care s-a
fcut pn n prezent. Se estimeaz c n 1944, n rile aliate, s-au aplicat n jur de aizeci de
milioane de teste la aproximativ douzeci de milioane de persoane (Pelechano, 1988, apud.
Buela-Casaly; Sierra, 1997).
La nceputul anilor patruzeci, Hathaway i Mckinley au prezentat Minnesota multiphasic
personality inventory (MMPI), construit conform modelului psihometric i care constituie una
dintre cele mai mari contribuii din domeniul evalurii personalitii i al evalurii clinice
(Goldstein i Hersen, 1990b, apud. Buela-Casaly; Sierra, 1997). Apogeul pe care l-a atins
aceast prob a fost enorm, continund i n prezent s fie unul dintre instrumentele cele mai
utilizate n practica clinic.
4.6. Perioada de criz a evalurii psihologice
La terminarea celui de-al doilea rzboi mondial, n Europa ncepe o perioad de
reconstrucie la toate nivelurile, ns cu o preferin n sectorul economic i n cel al muncii. n
acest context, psihologia rmne ntr-un plan secund n ateptarea unei mai bune situaii
economice, producndu-se astfel o cretere a emigrrii n Statele Unite care ncepuse de
19

dinainte de rzboi a unor importani psihologi europeni. Fr ndoial, aceasta a constituit o


cauz n plus care a contribuit la o dezvoltare major a psihologiei n Statele Unite ncepnd cu
perioada postbelic. La sfritul rzboiului, Statele Unite se confrunt cu o problem de
integrare a soldailor n viaa civil. Dezvoltata evaluare psihologic specializat pe
selecionarea unor mase mari nu mai era la fel de util. Acum era necesar o psihologie orientat
spre evaluarea individual i spre reabilitare (Buela-Casaly; Sierra, 1997).
Psihologia sovietic din timpul acestor ani nu numai c se consolidase, dar i i
desvrise criticile privitoare la teste. Unele dintre aceste critici se rezum la urmtoarele
puncte (Rubinstein, 1981):
a. Dac dou persoane rezolv sau nu acelai test, semnificaia psihologic a acestui fapt
nu este unic, avnd n vedere c acelai rezultat poate fi motivat de procese psihice diferite.
Astfel, faptul c un test a fost rezolvat sau nu, nu determin natura intern a actului psihic
corespondent.
b. Conform metodei testelor, evaluarea personalitii deriv numai din evaluarea statistic
a datelor externe obinute de individ ca rspuns la nite ntrebri determinate. Astfel, aceast
metod se bazeaz doar pe o abordare mecanic, ce pornete de la comportament i se orienteaz
spre personalitate. Se ncearc s se stabileasc evaluarea personalitii care se dezvolt numai
cu o prob, fr a se ine cont de dezvoltarea individului i de influena educaiei.
c. Eroarea se accentueaz dac se dorete stabilirea unui pronostic, pentru aceasta
pornindu-se de la presupunerea c nivelul care s-a calculat prin intermediul acestui test ntr-un
anumit grad de dzvoltare va caracteriza i n viitor persoana evaluat. Potrivit acestei idei, se
admite o predeterminare transcendent a oricrei evoluii ulterioare a unei fiine umane n
funcie de condiiile oferite i n mod contient sau incontient se neag posibilitatea de
transformare a omului: a adultului prin interaciunea social i a copilului prin intermediul
educaiei.
d. Atunci cnd se aplic acelai test standard la dou persoane cu o dezvoltare diferit i n
condiii diferite, iar n funcie de rezultatele acestuia, se dorete s se obin concluzii referitoare
la inteligena lor, se comite n mod evident o greeal, deoarece nu se ine seama de faptul c
rezultatele depind de condiiile de evoluie sau dezvoltare. Doi studeni sau doi muncitori pot s
rezolve testele n moduri diferite, deoarece unul dintre studeni este mai slab pregtit, iar unul
dintre muncitori mai puin versat dect ceilali. ns prin intermediul nvrii, ambii pot s-i
ntreac pe ceilali.

20

e. Faptul c anumite teste pot fi rezolvate de un procent de 75% dintre copii aparinnd
unui anumit interval de vrst i unui anumit mediu colar nu este un motiv pentru a-l considera
drept criteriu prin intermediul cruia se poate stabili inteligena sau dezvoltarea intelectual a
unor copii care au fost educai n condiii foarte diferite. O astfel de concluzie ar echivala cu a nu
considera c rezultatele testului depind de condiiile de evoluie a fiinei umane concrete.
f. Un alt inconvenient este faptul c se utilizeaz scale standard i c se ncearc
clasificarea indivizilor prin intermediul unor probe n care nu se ine cont de diferenele
individuale.
g. Trebuie scos n eviden i coninutul cazuist i adesea provocator al acestor probe, care,
n general, nu iau considerare pregtirea specific a subiectului n evaluare. Prin formularea unor
probleme care nu au legtur cu nvarea se consider, n mod greit, c se pot obine concluzii
referitoare la capacitatea de nvare a subiectului.
Toi aceti factori au contribuit la o criz pe care Maloney i Ward (1976, apud. BuelaCasaly; Sierra, 1997) au descris-o drept o perioad de pragmatism empiric exacerbat i cu
tendine spre formulele i prescripiile de evaluare sub form de cri de bucate. Aceti autori
vorbesc, de asemenea, despre abuzul i utilizarea fr distincie care s-a fcut n cazul testelor,
precum i despre interpretarea lor greit i/sau despre lipsa de cunoatere a semnificaiei
acestora.
Cu toate acestea, orice criz i are aspectele sale inovatoare i pozitive; astfel, n acest
context apar numeroase publicaii, considerate clasice n prezent, care fac referire la aspectele
psihometrice. n 1950, Gulliksen public The theory of mental test cu scopul de a sistematiza
procedurile de validare a testelor; n 1955 apare lucrarea lui Cronbach i Meehl Construct
validity in psychological tests; iar n 1958 se public prima ediie a lucrrii Psychological
testing, de Anastasi (Buela-Casaly; Sierra, 1997).
ntr-un efort de a mbunti calitatea instrumentelor evalurii psihologice, APA creeaz
un comitet condus de Cronbach responsabil s elaboreze raportul Technical recommendations
for psychological and diagnostic aids din 1954 n care se menioneaz necesitatea ca testele s
fie nsoite de un manual cu informaii despre interpretarea rezultatelor, validitate, fiabilitate,
administrare etc. (Rogers, 1955)
Criza extern a evalurii psihologice i atinge punctul culminant n micarea antiteste care
a avut loc n Statele Unite n anii cincizeci i, mai ales, n anii aizeci. Realitatea era c, n ciuda
faptului c primii psihometriti au utilizat testele cu intenia ca toi oamenii s aib anse egale
exclusiv n funcie de capacitatea lor, aceste proceduri de evaluare au favorizat pn la urm
clasele dominante i privilegiate. n curnd, aceast discuie a trecut din cercurile tiinifice n
21

viaa citadin. Astfel, se produc fapte remarcabile precum arderea protocoalelor ntr-o coal din
Texas, n 1959, interzicerea utilizrii probelor psihologice n statul California i n colile din
New York (Buela-Casaly; Sierra, 1997). Conform prerii lui Blanco (1986 b, apud. BuelaCasaly; Sierra, 1997), aceast revolt antiteste a fost rezultatul a patru factori diferii: limitrile
reale att tehnice (conceptuale, metodologice i instrumentale) ct i umane (lipsa de cunotine,
greeli sau erori), abuzurile comise ntr-o administraie nediscriminat i neadecvat de probe,
reaciile defensive ale societii n faa unor instrumente care i-ar putea viola intimitatea i, n
ultimul rnd, criticile derivate dintr-o prezentare nepotrivit a rezultatelor procesului de
diagnosticare; adic, nu tehnica nsi, ci utilizarea sa inadecvat poate duce la riscuri.

22

Capitolul II
CTEVA CLARIFICRI CONCEPTUALE
1. Evaluarea i msurarea n psihologie
Evaluarea psihologic este un proces care vizeaz descoperirea manifestrilor realitii,
avnd drept scop aprecierea individului n legtur cu una sau mai multe probleme specifice:
funciile intelectuale, aptitudinile speciale, comportamentul, diferite variabile emoionale i
sociale.
Dup Albu (2000), evaluarea reprezint operaiile de culegere de date despre una sau mai
multe caracteristici ale unui obiect i de prelucrare a acestora, avnd ca rezultat o descriere a
obiectului n termeni cantitativi i/sau calitativi.
Evaluarea se desfoar n doi pai: mai nti se culeg date despre obiectul care trebuie
evaluat, folosind un fundament sau o metod, apoi, pe baza acestor date se formuleaz
aprecierile comparnd valorile variabilelor pentru fiecare obiect cu cele ale altor obiecte sau cu
standardele fixate.
A msura (DEX, 1984) nseamna a determina cu instrumente sau cu aparate de msur,
cataloage, etc. valoarea unei mrimi.
n psihologie, a msura nseamn a atribui numere unor fenomene, potrivit unor reguli
determinate, astfel nct atributele persoanelor s fie corect reflectate prin proprietile
numerelor.
Msurarea n psihologie reprezint aadar primul pas n evaluarea psihologic, deci este
inclus n aceasta.
Msurarea n psihologie se realizeaz prin metode psihometrice care vor fi prezentate n
capitolul III (Metode de baz n evaluarea psihologic).
2. Noiunea de psihodiagnoz

Evaluarea n psihologie se numeste psihodiagnoz.


Albu (2000) definete psihodiagnoza ca ntreaga aciune de evaluare a unei persoane n
privina unor caracteristici psihice, a conduitelor i/sau a performanelor sale, fie pentru a le
identifica pe cele care i sunt specifice (sunt mai pronunate sau din contr, mai puin pronunate
dect restul, ori au alte valori dect cele obinuite n populaia din care face parte persoana), fie
pentru a descoperi cauzele care au fcut ca prin unele aspecte individul respectiv s se
deosebeasc de celelalte persoane.
23

Concluziile formulate la sfrsitul psihodiagnozei constituie psihodiagnosticul.


Scopul psihodiagnozei este stabilirea tiintific a caracteristicilor psihologice ale
persoanei. Aceast cunoatere are un caracter deductiv deoarece pentru a desprinde
caracteristicile psihologice ale persoanei (care sunt interne) se pornete de la conduitele i
aciunile acesteia (care sunt externe).
Izvoarele cunoaterii psihologice sunt datele brute, adic: reaciile fiziologice i vegetative,
reaciile verbale, numrul de rspunsuri corecte, timpul de reacie, etc.
Aceast cunoatere se realizeaz prin metode nepsihometrice i metode psihometrice.
Evaluarea psihologic are o valoare relativ dac se iau n considerare doar aspectele
cantitative ale performanelor obinute prin teste sau chestionare.
Deseori se pledeaz n favoarea testelor ca metode obiective de cunoatere dar acestea pot
fi eficiente doar dac se mbin cu miestria i competena specialistului.
Pentru a ajunge la un psihodiagnostic corect, specialistul apeleaz la mai multe surse de
informare pe care le interpreteaz corelativ. Dup Albu (2000), acestea ar fi: comportamentul
subiectului (cel mai adesea n timpul examenului psihologic), limbajul corpului, scorurile la
testele i chestionarele psihologice, anamneza (cunoaterea evenimentelor mai importante din
viaa unei persoane), interpretrile persoanei despre diferite situaii trite.
3. Test i testare psihologic
Testele sunt instrumente de msur n evaluarea psihologic i fac parte din metodele
psihometrice alturi de chestionare.
Testul este prob, procedur, procedeu sau instrument standardizat; itemii si servesc drept
stimul pentru producerea i msurarea unui eantion de comportament.
Scorul testului va fi apreciat prin raportarea i compararea cu o populaie de referin,
testat n condiii identice, n raport cu care s-a construit sistemul de apreciere (barem, etalon,
norme, categorii tipologice).
Funcia testului este n acelai timp diagnostic (apreciaz starea de fapt), dar i
prognostic (anticipeaz categorii de comportamente mai importante dect cele msurate
efectiv).
Pentru a fi cu adevrat util, testul psihologic trebuie s aib caliti psihometrice
specificate (fidelitate, validitate, sensibilitate sau for de discrimina.
Testarea psihologic este procesul de administrare, cotare i interpretare a rezultatelor unui
test psihologic. Ea reprezint doar o etap n evaluarea psihologic.

24

Capitolul III
METODE DE BAZ N EVALUAREA PSIHOLOGIC

1. Noiunea de metod n psihologie


Avndu-i originea n cuvntul grecesc methodos (cale, drum de urmat), metoda n
psihologie poate fi considerat drept calea pe care cercettorul o urmeaz n demersurile sale
tiinifice n vederea obinerii de date i a prelucrrii lor.
Zlate (2000) definete metoda ca fiind ... calea, itinerariul, structura de ordine sau
programul dup care se regleaz aciunile practice i intelectuale n vederea atingerii unui scop.
Deoarece o evaluare psihologic complex mbin mai multe metode pentru culegerea
informaiilor despre persoana evaluat, vor fi prezentate n continuare att metodele
psihometrice care folosesc ca instrumente chestionarul sau testul ct si metode nepsihometrice
cum sunt observaia sau interviul.

2. Metode nepsihometrice
2.1. Observaia
Cuvntul observaie provine din latinescul observare care nseamna a privi, a fi atent
la.
Zlate (2000) definete observaia ca urmrirea intenionat i nregistrarea exact,
sistematic, a diferitelor manifestri comportamentale ale subiectului ca i a contextului
situaional al comportamentului.
Observaia, dei are un caracter de non-invenie, nu se reduce la simpla lectur a
faptului brut, ci se prelungete ntr-un act de clasificare, de ncadrare a informaiei n anumite
concepte i de anticipare a unor relaii (Radu,I.i colab., 1993).
Din perspectiva evalurii psihologice, intereseaz observaia focalizat pe aspecte
specifice, n acest caz nregistrarea rezultatelor observaiei realizndu-se cu ajutorul unor grile
de observaie care i asigur un caracter sistematic.
Este util (atunci cnd este posibil) ca testarea psihologic s fie nsoit de observarea
atent a comportamentului subiectului n timpul testrii, iar interpretarea rezultatelor s se fac
corelativ cu cea a comportamentelor observate, prin gsirea de semnificaii. Un rol important l
are aici experiena proprie a observatorului.
25

2.2. Convorbirea
Comparativ cu metoda observaiei, convorbirea permite sondarea mai profund a vieii
interioare a subiectului. Informaiile pe care cercettorul urmrete s le obina sunt referitoare
la motive, aspiraii, triri afective, interese (Cosmovici, 1996). Cel care utilizeaz metoda
convorbirii n evaluarea psihologic trebuie s ctige ncrederea subiecilor i s asigure un
climat destins, de ncredere reciproc. Specific acestei metode este schimbarea locului i
rolurilor partenerilor (cel care a ntrebat poate s i rspund, cel care a rspuns poate s i
ntrebe) (Neveanu,P.;Zlate,M.;Creu,T., 1993).

2.3. Ancheta pe baz de interviu


Ancheta pe baz de interviu este foarte asemntoare cu metoda convorbirii, presupunnd
raporturi verbale ntre participani, n scopul obinerii unor informaii. De obicei interviul este
dinainte structurat, ntrebarile fiind deinute dinainte i n acest fel capt o amprent oarecum
oficial. Spre deosebire de metoda convorbirii, n ancheta pe baz de interviu fiecare participant
i pstreaz rolul de emitor sau de receptor.
2.4. Anamneza (Metod biografic)
Anamneza vizeaz cunoaterea istoriei personale a fiecrui individ, necesar n stabilirea
profilului personalitii sale i n explicarea comportamentului actual al persoanei.
Metoda se concentreaz asupra succesiunilor diferitelor evenimente din viaa individului, a
relaiilor dintre evenimentele-cauz i evenimentele-efect, dintre evenimentele-scop i
evenimentele- mijloc.
Pentru a ptrunde n esena vieii unui individ i a o explica, investigaia trebuie adncit
treptat, trecnd de la evenimentele externe, formale, superficiale, la cele interne, psihologice, de
coninut.

3. Metode psihometrice
3.1. Concepte fundamentale n msurarea psihologic
3.1.1. Variabile statistice
Analiza statistic a unei populaii se face pornind de la nsuirile ei. O nsusire care poate fi
urmrita la toate unitile statistice din populaia investigat se numete caracteristic statistic.
26

Valorile pe care le ia o caracteristic statistic se numesc modaliti. Modalitile statistice


sunt stabilite de cercettor n funcie de scopul investigaiei. De exemplu caracteristica statistic
vrst poate fi exprimat prin ani mplinii, intervale de vrsta, etc.
O caracteristic pentru care n populatie exist o singur modalitate se numete constant.
O caracteristic pentru care n populaia statistic exist cel puin dou modaliti se
numete variabil statistic.
Pentru ca o variabil s poat fi utilizat (de exemplu atunci cnd se dorete construirea
unui test pentru msurarea variabilei respective), ea trebuie definit operaional, adic trebuiesc
precizate toate activitile concrete pe care cercettorul le face pentru msurarea ei.
n psihologie nu se msoara persoanele, ci anumite caracteristici ale persoanei, care pot fi
constante (inteligenta) sau variabile (motivaia).
Atribuirea de numere (msurarea) este posibil doar printr-o cale indirect, utiliznd o
scal de msurare a comportamentelor.
3.1.2. Scale de msur
Din punct de vedere matematic, msurarea este funcia care atribuie fiecrui element din
mulimea de persoane/obiecte (numite mulime de definiie) un numr i numai unul (din
mulimea n care funcia ia valori) numit msura elementului, conform unei anumite reguli.
Fiecare sistem de reguli definete cte un tip de msurare sau cte un tip de scal. n
practica psihologic sunt utilizate patru tipuri de scale: nominale, ordinale, de interval i de
raport.

Scalele nominale
Msurarea pe o scal nominal poate fi realizat ori de cte ori caracteristica studiat
permite mprirea n clase de elemente echivalente. Specific ei este relaia de echivalen.
Oricare dou submulimi ale unei clase nu trebuie s se intersecteze.
Un exemplu ar fi variabilele referitoare la sexul persoanelor. O clas are 31 de elevi din
care 14 bieti i 17 fete.
Msura unui element este doar o etichet i servete pentru denumirea acestuia. Nu este
posibil realizarea unei analize statistice n afara modului i a frecvenelor.

Scalele ordinale
Msurarea pe o scal ordinal realizeaz ierarhizarea claselor. Aceste scale presupun o
relaie de echivalen i o relaie de ordine ntre elemente, dar dei clasele sunt ordonate, distana
dintre ele nu poate fi estimat.
27

De exemplu muncitorii unei secii sunt ierarhizai n funcie de randamentul lor, de la cel
mai eficient la cel mai puin eficient, far a se cunoaste distana exact dintre ei.

Statistic,

pot

fi calculate centilele i mediana sau coeficientul de corelaie al lui Spearman, iar grafic putem
realiza histograme.

Scalele de interval
Msurarea pe o scal de interval presupune o unitate de msura comun i constant.
Caracteristic scalelor de interval sunt: relaia de echivalen, relaia de ordine i cunoaterea
distanei dintre clase (deoarece se stabilete un punct 0 arbitrar).
De exemplu, msurarea inteligenei se realizeaz pe o scal de interval.
Msurarea pe o scal de interval permite utilizarea celor mai numeroi indici statistici
(medie, abatere standard, coeficieni de corelaie) precum i reprezentarea grafic prin
histograme i poligoane de frecven.
Scalele de raport (sau de proporii)
Posed proprietile scalelor de interval dar au un punct 0 nonarbitrar (adic se poate
aprecia n mod obiectiv cnd un element este lipsit de caracteristica studiat). n psihologie
msurarea nu se realizeaz pe scale de proporii deoarece nu exista puncte 0 nonarbitrare
(absena absolut a inteligenei, a capacitii perceptive, a motivaiei, etc.).

3.1.3. Indici statistici de start


n situaia tipic a testrii psihologice, ne intereseaz poziia unui individ n cadrul unui
grup mai larg. Interpretarea msurii unei cote depinde de cunoaterea poziiei relative a ei ntrun grup de referin. Acest lucru presupune strngerea prealabil de date asupra acestei
colectiviti i ntocmirea unui tabel de norme, adic a unui etalon (Radu,I.i colab., 1993).
Ordonarea i gruparea datelor
Datele brute obinute n urma unei testri n vederea construirii unui etalon sau a calculrii
indicilor de fidelitate sau de validitate, sunt transcrise informatic i devin fiier de date (baz de
date). Aceste date brute pot fi numrul de rspunsuri corecte la un test sau rspunsurile tuturor
subiecilor testai, la fiecare item.
Ca prim pas se urmrete modul de organizare al datelor, distribuia lor. Graficul de baz
este histograma care ia cel mai frecvent trei forme: distribuie simetric, distribuie asimetric i
distribuie n form de i sau j. Forma disribuiei ne ghideaz spre prelucrrile statistice pe care le
vom face n continuare. Pentru distribuie normal se calculeaz media, dispersia i abaterea
28

standard, pentru distribuie asimetric se determin mediana, iar pentru distribuiile n form de i
sau j se determin modul, respectiv frecvena.
Modelul curbei normale este important n testarea psihologic, el fiind utilizat descriptiv
pentru a localiza poziia scorurilor la testare sau inferenial, n domeniul fidelitii (pentru a
obine intervalele de ncredere necesare evalurii scorurilor obinute) i n domeniul validitii
(n determinarea intervalelor de ncredere pentru prediciile estimate pornind de la scorurile
obinute la test).
Atunci cnd testul este n faza de construcie, forma i distribuiei de scoruri obinute
stabilete dac este nevoie de ajustri.Dac un test de performan are o asimetrie negativ,
nseamn ca este prea uor i trebuiesc introdui itemi mai dificili pentru a aduce cea mai mare
parte a scorurilor ctre centrul distribuiei (Urbina, S., 2009).
Semnificaia mediei i a abaterii standard
Cu ajutorul programelor de prelucrare statistic se calculeaz tendina central a datelor
(media, mediana, modul). Dispersia (variaia) i abaterea standard indic organizarea interioar a
distribuiei, adic mprtierea datelor n jurul mediei, oferindu-ne informaii despre
variabilitatea grupului studiat.
n psihologie nu putem lucra pe ntreaga populaie ci doar pe un eantion reprezentativ
extras din acea populaie. Dar, extrapolnd indicii eantionului la populaie pentru a realiza o
estimare, comitem o anumit eroare a crei valoare trebuie s fie ct mai mic.
m reprezint media n populaie iar media n eantion. S-a stabilit ca 1.96s n raport
cu media acoper 95% din rezultate iar 5% cad n afara acestui interval (cte 2.5% de o parte i
de alta spre extremitile grupului), iar 99% din rezultate sunt cuprinse n intervalul m 2.58s n
timp ce 1% sunt exterioare acestui intreval.
Pentru a evalua eroarea ce o comitem cnd lum drept baz media eantionului m n locul
mediei adevrate a populatiei m (pe care nu o putem practic determina), se calculeaza eroarea
standard a mediei SEM (notat i cu E) cu formula

s
unde s este abaterea standard pentru
N

eantion iar N este numrul de cazuri din eantion.


Riscul de a grei atunci cnd facem o afirmaie se numete prag de semnificaie. Intervalul
( m +1.96E; m -1.96E) se numete interval de ncredere la pragul de semnificaie de 0.05, ceea
ce nseamn c riscul ca adevrata medie n populaie s cad n afara intervalului este de 5%,
iar intervalul ( m 2.58E; m + 2.58E) este interval de ncredere la p=0.01.

29

Cotele (scorurile) standard


Un scor standard este un scor care a fost transformat dintr-o scal n alta, ultima fiind una
pe baza creia se pot face comparaii. Cele mai cunoscute sunt scorurile z i T.
Scorul z are o distribuie etalon n care m=0 si s=1. Transformarea variabilei brute x se
face pe baza formulei: z=

xm
.
s

n tabelul legii normale reduse, trebuiesc reinute dou repere: pentru |z|=1.96 citim 0.05
iar pentru |z|=2.58 citim 0.01.
Scorurile T au o distribuie a crei medie este 50 iar abaterea standard este 10.
Scorul care se gaseste la 5s sub medie este un scor T=0 iar 5s peste medie va fi 100.
Avantajul la scorurile T este c nu au valori negative.
3.2. Chestionarul psihologic
Holban i colab.(1978) definesc chestionarul ca o investigaie n fondul intim al
individului pentru dezvluirea motivelor, opiniilor, atitudinilor, intereselor acestuia, incursiune
care se bazeaz pe o succesiune logic i psihologic de itemi adresai persoanei i ale cror
rspunsuri sunt consemnate n scris.
Se prezint astfel i o clasificare a chestionarelor n chestionare de opinii i atitudini,
chestionare de interese, chestionare motivaionale i la care pot fi adugate chestionarele de
personalitate (de exemplu Inventarele Minnesota).
Un chestionar este un ansamblu de ntrebri scrise sau de imagini alese i aranjate astfel
nct s serveasc obinerii de informaii despre o tem fixat, care au rolul de a determina din
partea celui care rspunde un comportament verbal sau non-verbal ce se nregistreaz n scris.
(Albu, 2000)
Construirea unui chestionar presupune o munc laborioas prin parcurgerea mai multor
etape:
-

stabilirea temei (obiectului) chestionarului

documentarea cu privire la obiectul respectiv

stabilirea ipotezelor

selectarea eantionului

aplicarea pilot a chestionarului pentru a vedea dac a fost bine elaborat

definitivarea chestionarului

administrarea chestionarului

recoltarea i analiza datelor obinute

stabilirea concluziilor avnd n vedere ipotezele formulate


30

Dup Albu (2000), elementele componente ale unui chestionar sunt consemnele (adic
instruciunile i informaiile date persoanelor care rspund la chestionar i care sunt prezentate
ntr-o manier identic tuturor subiecilor) i ntrebrile sau imaginile.
Dup tipurile ntrebrilor cuprinse n chestionar putem distinge: chestionare cu ntrebari
nchise (rspunsurile sunt furnizate dinainte, subiectul trebuind s aleag), chestionare cu
ntrebri deschise (subiectul are deplina libertate de a rspunde dar rspunsurile sunt dificil de
analizat din punct de vedere calitativ) i chestionare cu ntrebri mixte.

3.3. Testul psihologic


3.3.1. Definiie
n DEX (1984) prin test se nelege proba prin care se examineaz n psihologia
experimental unele aptitudini fizice i psihice ale unei persoane; materialul (fie, tablouri,
scheme) cu care se face aceasta prob.
Anastasi (1976) definea testul ca o msura obiectiv i standardizat a unui eantion de
comportament.
Cronbach (1970) spunea despre test c este un procedeu sisematic pentru observarea
comportamentului unei persoane i a crui descriere se face pe baza unei scale numerice sau a
unui sistem categorial.
O definiie complex a testului este dat de Aurel Stan (2002): procedeu standardizat de
investigaie psihodiagnostic punnd n eviden, prin diferite modaliti de stimulare a
subiecilor, comportamentele relevant psihodiagnostice, exploatabile informaional, pe baza
comparrii rezultatelor obinute cu cele aparinnd unor eantioane reprezentative de persoane
aflate ntr-o situaie de examinare identic i care folosete, n descrierea si explicarea
concluziilor, termeni tiinifici specifici teoriei pe care se bazeaz construcia sa

3.3.2. Caracteristicile testului psihologic


1. Este un instrument de evaluare a comportamentului, alturi de alte instrumente ale
metodei experimentale. El servete la msurarea unor atribute psihice sau/ i predicia unor
comportamente.
2. Este un instrument standardizat. Standardizarea se refer la modalitatea de
administrare, cotare i raportare la etalon. Standardizarea testului implic astfel un proces de
obiectivizare i uniformizare cu privire la aceste etape ale testrii psihologice.
3. Este alctuit dintr-o colecie de itemi sau stimuli specifici care genereaz o reacie
specific din partea subiecilor testai. (Stan, 2002)
31

4. Vizeaz un eantion de comportament. Dac un psiholog dorete s evalueze


vocabularul unui copil sau aptitudinile sale aritmetice, va trebui s i aleag din totalitatea
comportamentelor disponibile cteva reprezentative pentru a le include ntr-o prob psihologic.
5. Are ca scop evidenierea unor comportamente relevant diagnostice prin
compararea rezultatelor obinute cu cele reprezentnd eantioane reprezentative de persoane.
Testele psihologice sunt utilizate n general pentru a stabili un diagnostic psihologic,
pentru a face aprecieri i predicii referitoare la subieci i pentru a lua decizii asupra persoanelor
n cadrul unei evaluri psihologice.

3.3.3. Clasificarea testelor psihologice


Albu (2000) prezint o clasificare a testelor psihologice astfel:

dup modul de executare a sarcinii de ctre subiect:


o teste orale
o teste scrise (creion hrtie)
o teste de performan (cu manipulare de obiecte i piese sau teste administrate de
calculator)

dup gradul de utilizare a limbajului n rezolvarea sarcinii:


o teste verbale (teste de vocabular sau de rafinament verbal)
o teste non-verbale (de exemplu completarea unor figuri lacunare)

dup numrul de persoane care pot fi examinate simultan:


o teste individuale
o teste colective

dup timpul de execuie a sarcinii:


o teste cu limit de timp
o teste cu timp de lucru nelimitat

n funcie de comportamentele evaluate de itemii lor:


o teste cognitive:

teste de aptitudini

teste de succes educaional

o teste afective:

chestionare de personalitate

tehnici proiective

teste obiective de personalitate

dup modul de stabilire a cotei la test:


o teste obiective (cotarea rspunsurilor se face dup o regul prestabilit)
32

o teste subiective (folosite n psihologia clinic i care permit ca mai muli


evaluatori s coteze foarte diferit rspunsurile aceleiai persoane, testele
proiective fcnd parte din aceast categorie)

dup modul n care se interpreteaz scorurile testelor:


o teste normative (scorul individual se interpreteaz prin raportare la un etalon)
o teste centrate pe criteriu (n care de la nceput a fost stabilit nivelul acceptat de
performan, iar rezultatul este exprimat prin a reuit sau nu a reuit)
o teste idiografice (presupun completarea aceleiai forme a chestionrului n ocazii
diferite pentru a vedea evoluia n timp a scorului)
o teste ipsative (presupun interpretarea scorurilor pentru un subiect prin compararea
ntre ele sau prin compunerea scorurilor altor persoane. Un exemplu este testul de
interese profesionale n care subiectul trebuie s aleag afirmaia care i se
portivete cel mai mult i/ sau informaia care i se potrivete cel mai puin)
3.3.4. Funciile testelor psihologice
Orice test are o funcie diagnostic i una prognostic, valoarea lor depinznd de scopul

pentru care a fost creat instrumentul respectiv. Dar, aa cum apreciaz Anne Anastasi, de multe
ori predicia se bazeaz pe diagnosticul unui potenial sau al unei capaciti: nici un test
psihologic nu poate face mai mult dect s msoare un comportament. Dac un asemenea
comportament poate servi ca un indicator efectiv al altui comportament, acesta poate fi
determinat numai prin cercetare empiric a itemilor.
Psihodiagnoza ca activitate sistematic de evaluare psihologic are urmtoarele funcii:
1) Surprinderea corect a trsturilor si capacitilor psihice individuale si evidenierea
variabilitii psiho-comportamentale intra-grupal versus grup de referin
2) Evidenierea cauzelor care au condus spre o anume realitate prezent, n special n cazul
disfunciilor sau tulburrilor psihice
3) Prognoza evoluiei probabile a comportamentului persoanei n anumite condiii si situaii
contextuale, n funcie de repere
4) Evidenierea cazurilor de abatere n sens pozitiv sau negativ de la o norm(etalon) de
dezvoltare psiho-comportamental; se pune problema distinciei ntre normalitate si anormalitate
5) Evidenierea sau validarea(demonstrarea funcionalitii) programelor de nvare si formare
6) Formarea unor capaciti de cunoastere si autocunoastere
7) Sprijinirea unor decizii n consiliere si orientare vocaional (evidenierea de capaciti si
motivaie)

33

8) Sprijinul deciziilor de conduit n demersul din psihoterapie, asisten, consultan


psihologic
9) Verificarea unor ipoteze stiinifice, prin utilizarea testelor n cadrul experimentelor stiinifice

3.3.5. Domenii de utilizare a testelor psihologice


Dintre domeniile de aplicabilitate ale testelor psihologice pot fi amintite: psihologia
clinic, psihologia colar, consilierea psihologic, psihologia muncii sau neuropsihologia.
n psihologia clinic, cel mai adesea este vizat evaluarea psihopatologiei mai ales prin
probe proiective i chestionare de personalitate. Printre probele cele mai aplicate n psihologia
clinic se numr testele Roschach, Szondi, Lusher, TAT (Thematic Aperception Test),
chestionarul Eysenck, Schmiescheck, inventarul MMPI (Minnesota Multifazic Personality
Inventory). Evaluarea inteligenei este un alt aspect vizat n psihologia clinic. Psihologul
clinician intervine diagnostic i terapeutic n:

Aprecierea normalitii/ anormalitii dezvoltrii neuropsihice a copilului i adolescentului


(clinica pediatric).

n investigarea dezordinilor de personalitate, a strilor reactiv-anxioase, a tentativelor de suicid


sau a strilor de criz.

n comportamentul deviant, asocial, antisocial sau delictual.

n pervertirea instinctelor alimentare (anorexie, obezitate, bulimie).

n aprecierea dezordinilor neurologice sau psihiatrice, calculul indicelui de deteriorare, ca i n


recuperarea unor funcii mintale pierdute total sau parial.

n diagnoza i recuperarea problemelor aduse de involuie, sau de patologia asociat


mbtrnirii.

n expertizarea capacitii de munc sau a deficienelor de intelect pentru acordarea


certificatelor de persoan handicapat.
n psihologia colar, prin aplicarea testelor psihologice, este vizat evaluarea maturitii

colare, evaluarea progresului n procesul informativ educativ, evaluarea potenialului de nvare,


evaluarea copiilor cu cerine speciale. Prima arie n care s-a produs dezvoltarea i utilizarea testelor
mentale (pentru a respecta termenul propus de Cattell) a fost cmpul educaional, coala, prin
bateria creat i publicat de Binet i Simon n 1905. La aproape un secol de la lansarea primei
Scale metrice a inteligenei, coala rmne n continuare marele beneficiar al psihodiagnozei.
Utilizarea acesteia pe terenul educaiei are funcii complexe:

34

Depistarea copiilor cu o subdotare intelectual (debilitate mintal, intelect de limit), sau cu alte
caracteristici neuropsihiatrice, pentru a li se crea condiii favorabile de tratament
psihopedagogic difereniat, prin coli speciale sau prin integrare n nvmntul de mas.

Depistarea supradotailor, pentru instituirea unei pedagogii a excelenei (curriculum


difereniat).

Diagnosticarea problemelor de nvare i a celor comportamentale (de conduit), pentru a


stabili programe educaionale adecvate (educaia pe msur).

Selecia educaional prin teste standardizate la colegii sau universiti (nu ca o procedur
unic, ci n asociere cu altele, cum ar fi scrisorile de recomandare, mediile din timpul anilor de
studiu la anumite discipline colare, interesele elevului n afara colii etc.).

Testele educaionale (docimologice sau de cunotine), pentru a verifica fie gradul de atingere al
obiectivelor operaionale, fie pentru a face un diagnostic local, regional sau naional al
nvmntului nsui ca sistem, fie pentru a detecta cunoaterea minim prin posesia creia se
poate face o certificare a educaiei primite ntr-un ciclu sau tip de coal.
Prin intermediul psihodiagnosticului colar se poate asigura personalizarea nvmntului i

tratarea difereniat a elevilor, determinarea nevoilor de educaie, orientarea colar i profesional,


selecia elevilor pentru programe speciale, determinarea potenialului de nvare i promovarea
metodelor de diagnostic formativ, controlul i autocontrolul procesului educativ, surprinderea
elementelor motivaional-afective legate de nvare, radiografierea grupului i a dinamicii sale etc.
Credem c zona celei mai vaste i mai fructuoase ntlniri dintre tiina testelor (psihometria) i
tiina examinrii (docimologia, doxolgia sau docimastica) este cel al evalurii. Chiar randamentuil
colar, ca raport dintre aptitudinile, interesele elevului i gradul de acoperire al obiectivelor
operaionale, exprimate prin calificative, note sau medii colare, este locul unde testarea psihologic
i cea educaional se ntlnesc n modul cel mai fericit.
n consilierea psihologic se urmrete evaluarea aptitudinii, evaluarea comportamentului
social sau evidenierea intereselor n scopul orientrii colare i profesionale.
Cum ar putea fi acest copil mai puin conflictual n grup? Ce carier ar fi cea mai potrivit
pentru persoana X? Ce activiti i s-ar putea recomanda dup pensionare lui Y, pentru a se potrivi
cu structura sa cognitiv i cu interesele sale? Cum ar putea depi solicitrile prea stresante o
personalitate de tip A, pentru a preveni un infarct? Sunt doar cteva din ntrebrile la care poate
rspunde psihodiagnoza n domeniul consilierii.
n psihologia muncii, cu ajutorul testelor, psihologul urmrete:

s evalueze fora de munc, pentru a face o selecie n domeniul profesiunilor;

s previn fluctuaia forei de munc i accidentele de munc;

s avizeze periodic activitile cu risc (lucrul la nlime, portul de arm etc.);


35

s ofere criterii valide de promovare i s ajute la construirea carierei;

s identifice structura aptitudinal, cea a factorilor de personalitate i a intereselor pentru a


ajuta la reprofesionalizare i la reconversie profesional;

s asiste tehnic reciclarea i reprofilarea ntr-o lume n care schimbarea devine condiia sa
permanent;

s contribuie la ameliorarea climatului de munc prin cunoaterea dinamicii grupurilor.


n neuropsihologie, testele se folosesc pentru evaluarea leziunilor cerebrale.
3.3.6. Surse de eroare n testarea psihologic
Orice scor la un test psihologic este rezultatul unui scor real i al unei erori pe msur.

Msura n care scorurile la un test exprim de fapt valorile reale ale contextului msurat
presupune calcularea fidelitii testului respectiv, dar acest lucru va fi analizat la momentul
potrivit.
Situaia ideal, dar niciodat ntlnit n practic, este absena erorii. Cele mai frecvente
surse de erori n testarea psihologica ar putea fi sintetizate astfel:

caracteristici stabile ale persoanei (altele dect cele msurate):


o abilitatea general a nelegerii instruciunilor (dat de nivelul intelectual);
o deprinderi de rezolvare ale testelor;
o cunoaterea de ctre subiect a rspunsurilor la unii itemi;
o deprinderi specifice care pot influena modul de rezolvare a testului n cauz (de
exemplu deprinderea n jocurile sega sau pe calculator influeneaz performana
n testele de atenie);

caracteristicile situaiei n care are loc testarea:


o caracteristicile temporare ale persoanei: starea de sntate, oboseala, motivaia,
tensiunea emoional;
o condiiile fizice ale administrrii testului (de cldur, luminozitate, etc.);
o interaciunea dintre personalitatea examinatorului i cea a subiecilor;
o factori de distragere a ateniei (un zgomot neateptat, etc.) ;

caracteristici ale testului folosit:


o probabilitatea ghicirii rspunsurilor la itemii cu alegere multipl;
o modul de administrare al testului (pe calculator sau creion hrtie);
o greeli n formularea unor itemi (itemul este ambiguu, nu este neles de subieci
deoarece conine neologisme, nu este potrivit populaiei creia i este destinat,
etc.).

36

Capitolul IV
PRINCIPII PSIHOMETRICE ALE UTILIZRII TESTULUI PSIHOLOGIC

Pentru a decide alegerea unui anumit test pentru o situaie concret este necesar s se
evalueze adecvarea lui la obiectivele examenului psihologic, adic n ce msur testul este
relevant pentru diagnoza sau predicia comportamentului care constituie scopul specific al
examenului respectiv.
Exist o evaluare practic a testului i o evaluare tehnic.
Privind aspectele ce determin valoarea practic a testului putem enumera:

Utilitatea

Acceptabilitatea

Caracterul direct

Nonreactivitatea

Caracterul compatibil

Utilitatea se refer la avantajul practic pe care l putem obine din utilizarea unui anume
instrument (Gottman, Leiblum, 1974, apud Minulescu, M., 2003), msura n care instrumentul
ajut la rezolvarea unei probleme practice (realizarea interveniei), feedback privind eficiena
interveniei, selecie, promovare etc. Alte aspecte ale utilitii sunt: scopul testului, lungimea,
uurina n scorare, uurina n intrepretare.
Acceptabilitatea se refer la necesitatea ca instrumentul s fie potrivit pentru persoana
testat din punct de vedere cognitiv i afectiv (s nu fie prea intruziv sau ofensiv).
Caracterul direct se refer la capacitatea testului de a reflecta comportamenztul real,
gndurile sau sentimentele reale ale persoanei. Msurile indirecte necesit inferene, adic
posibiliti de eroare. Testele de performan sunt considerate directe, n timp ce tehnicile
proiective sunt considerate indirecte. Toate instrumentele se situeaz pe o dimensiune ce unete
aceste dou extreme. Atunci cnd se pune accent pe fidelitatea datelor, caracterul direct al
testului este decisiv.
Nonreactivitatea se refer la calitatea testului de a nu provoca o anumit reacie
subiectului, influennd astfel rspunsul. Aceast calitate are legtur i cu caracterul
nonintruziv al coninutului, i cu dezirabilitatea acestora.
Adecvarea general a instrumentului este criteriul final, adic msura n care acesta este
compatibil pentru o evaluare fr complicaii; instrumentele prea lungi sau prea complicate ca
scorare pot fi utile ca informaie dar nepractice datorit consumului de timp. Adecvarea se refer
i la aspectele tehnice: fidelitate, validitate, obiectivitate, standardizare i etalonare.

37

Aspectele utilizate n evaluarea tehnic a instrumentului de msur sunt:

Standardizarea

Obiectivitatea

Fidelitatea

Validitatea

Etalonarea

Sensibilitatea

Dificultatea

1. Standardizarea
Standardizarea este o condiie fundamental a testului psihologic, unde orice variaie a
condiiilor produce o variaie a rezultatelor.
Standardizarea se refer la dou aspecte:
1. interpretarea rezultatelor unui subiect prin raportare la un standard sau etalon, adic la
media performanelor obinute la acelai test i n aceleai condiii de administrare de un
eantion reprezentativ de subieci;
2. uniformizarea condiiilor n care are loc examenul psihologic, adic standardizarea
tehnicii de administrare, cotare i interpretare a rezultatelor;
Obiectivitatea se refer la msurarea fr ambiguitate a capacitilor persoanelor, deci
evaluatori diferii trebuie s obin aceleai rezultate la evaluarea unui subiect.
Obiectivitatea mai este numit i concordan interpersonal (Stan, 2002) i este un
aspect ce ine de standardizarea testelor psihologice.

2. Obiectivitatea
Se spune despre un test c este obiectiv dac permite s se msoare fr ambiguitate
capacitile unei persoane (Klausnitzer, 1992). n literatura de specialitate se menioneaz trei
condiii ale obiectivitii:
Rezultatele s nu depind de nivelul pregtirii subiectului n domeniul testrii psihologice
Fiecare rspuns la item s fie interpretat la fel de ctre mai muli experi
Scorul s nu fie influenat de personalitatea examinatorului, adic s aib cotare obiectiv

3. Fidelitatea
3.1. Definiie i noiuni de baz
Acest principiu psihometric se refer la precizia cu care un test msoar o caracteristic. Se
spune c un test este fidel dac atunci cnd se aplic de mai multe ori n aceleai condiii,
38

rezultatele sunt identice de fiecare dat. Fidelitatea absolut nseamn absena total a erorii de
msur, deci scorul obinut este egal cu scorul real. Dar acest lucru nu se ntmpl niciodat n
practic i atunci vorbim doar despre fidelitatea relativ a unui test.
Orice scor la un test psihologic este rezultatul dintre scorul real i eroarea de msur.
X=V+E
unde
X = scorul msurat (observat)
V = scorul real
E = eroarea de msur
Coeficientul de fidelitate reflect doar mrimea raportului dintre dispersia scorurilor
observate i dispersia erorilor de msur.
S2X = S2V + S2E
Coeficientul de fidelitate are expresia:
2

rxx=2 , i ia valori n intervalul [0,1]

Dac scorul msurat este egal cu scorul real (deci eroarea este 0), coeficientul de fidelitate
va avea valoarea 1.
Dar cum n practic acest lucru nu este posibil, pentru ca un test s fie considerat fidel
trebuie s aib un coeficient de fidelitate mai mare dect 0.70.
Fidelitatea i eroarea de msurare
Precizia msurtorii poate fi indicat i sub forma unei erori de interpretare a scorului la
test, care va fi cu att mai mic cu ct eroarea de msurare va fi i ea mai mic.
Eroarea standard de msurare (SEM), servete la determinarea intervalelor de ncredere
pentru scorurile reale ale subiecilor.SEM este o mrime statistic ce reprezint abaterea
standard a distibuiei ipotetice pe care am fi obinut-o dac unui subiect i s-ar fi aplicat acelai
test de un numr infinit de ori.
Valoarea ei este dat de formula:
Se = Sx 1
unde:
Se = eroarea standard de msur
Sx = abaterea standard a scorurilor la test
rxx = coeficientul de fidelitate
39

Cnd facem o apreciere tiinific, ne intereseaz care este intervalul n care se gsete
scorul real. Deoarece n activitatea practic nu putem obine scoruri multiple la acelai test
pentru un subiect i nici nu putem face o medie al lor pentru a obine o estimare a scorului real,
scorul disponibil poate fi plasat ntr-un interval creat pe baza valorii SEM. Acest interval se
numete interval de ncredere i este definit de probabilitatea ca scorul real al persoanei la un
test s se gseasc ntre anumite limite.
IC = X Z * Se
Scorul Z va fi ales n funcie de precizia cu care dorim s lucrm. Dac alegem s lucrm
cu o probabilitate de a rspunde corect de 95%, Z = 1.96; pentru o precizie de 99%, Z = 2.58.
Este de reinut c:

intervalul de ncredere depinde de coeficientul de fidelitate al testului; dac avem


coeficieni de fidelitate mici, intervalul se mrete, deci eroarea i eroarea standard a
msurrii este mai mare;

intervalul de ncredere depinde de abaterea standard a scorurilor la test.Cu ct


mprtierea datelor este mai mare, cu att i intervalul de ncredere se lrgete.

Ca exemplu:
S-a aplicat un test la un numr de subieci. Conform rezultatelor obinute, media scorurilor
la test (x) a avut valoarea egal cu 18, abaterea standard egal cu 5 iar coeficientul de fidelitate
egal cu 0.90. Ne intereseaz s aflm n ce limite s-ar afla adevratul parametru al populaiei,
tinnd cont de faptul c se decide la un nivel de ncredere de 95%.
Deci:
Z = 1.96
X = 18
Sx = 5
rxx = 0.90
Aplicnd formula:
Se = 5 1 0.9
Se = 1.58
IC = X E
IC = 18 3.10 deci [21.10; 14.90]
Deci putem afirma cu un risc de a grei egal cu 5% c media scorurilor la testul aplicat n
populaie se va gsi n intervalul [21.10; 14.90].

40

3. 2. Metode de calcul a coeficientului de fidelitate


Fidelitatea unui test psihologic se refer la dou aspecte: consistena intern i stabilitatea
n timp a rezultatelor testrii.
Consistena intern
O bun consisten intern a unui test presupune o corelaie ridicat ntre itemii testului
respectiv i exprim faptul c toate ntrebrile testului evalueaz aceeai trstur. Metoda care
evalueaz acest aspect poart denumirea de metod consistenei interne.
Stabilitatea n timp a rezultatelor testrii
Ne indic n ce msur, la aplicri diferite n timp, un subiect obine rezultate similare la
un test psihologic. Metoda care evalueaz acest aspect al fidelitii unui test se numete metoda
formelor paralele.
n afara acestor metode care sunt obligatorii pentru evaluarea fidelitii unui test, se mai
pot utiliza nc dou metode: metoda formelor (testelor) paralele i metoda fidelitii
interevaluatori.

3. 2. 1. Metoda analizei consistenei interne


Pot fi calculai urmtorii coeficieni:

alfa Cronbach () : pentru textele cu orice tip de itemi i calculeaz media tuturor
combinaiilor posibile ntre itemi.

Kuder Richardson 20 (K-R 20): este echivalent cu cel al lui Cronbach, ns se


utilizeaz atunci cnd ntrebrile testului au fost punctate n mod binar, adic cu 1 dac sa rspuns corect i cu 0 dac s-a rspuns greit.

Kuder Richardson 21 (K-R 21): este tot echivalent lui Cronbach i se utilizeaz n loc
de formula anterioar atunci cnd proporia de rspunsuri corecte nu variaza mult de la
un item la altul.
Aceste formule in cont de corelaia dintre performanele la toi itemii din cadrul unui test.

Mrimea acestor coeficieni depinde de numrul itemilor din test i de raportul dintre
variabilitatea performanelor persoanelor testate la itemii testului i dispersia total a scorurilor
testului. Valorile acestor coeficieni vor fi nalte pe msur ce numrul de itemi crete i pe
msur ce raportul dintre dispersia scorului unui item i dispersia total a scorurilor testului
descrete.
41

Atunci cnd se urmrete omogenitatea tuturor itemilor testului, mrimile coeficienilor KR i reprezint indicatori ai msurii n care acest obiectiv a fost atins.

calcularea corelaiei ntre dou jumti ale testului cu ajutorul formulei lui Pearson,
dup care se aplic coeficienii de corecie Guttman sau Spearman Brown. Ei se
folosesc deoarece rezultatele se refer la un test cu o lungime de dou ori mai mic dect
cea a testului original. njumtirea testului poate fi obinut pri mai multe modaliti.
Pot fi selectai itemii pari i itemii impari, itemii care formeaz prima jumtete i pe cei
care o formeaz a doua jumtate a testului, itemii de la extreme ctre mijloc, etc, condiia
este ca cele dou jumti s fie alctuite din itemi care sunt proporionali ca i
dificultate. Avnd n vedere c numrul de jumti posibile ale unui test este foarte mare
i este foarte greu ca dou jumti s fie exact egale, este indicat s se calculeze unul din
indicii de consisten intern prezentai anterior.

Kaplan i Saccuzzo (1993) sesizeaz foarte ntemeiat c toate msurile care evalueaz
consistena intern determin de fapt gradul n care fiecare item diferit msoar aceeai trstur
sau abilitate. Acest lucru presupune implicit c testul este omogen, n caz contrar acesta neavnd
consisten intern. Pentru testele neomogene, procedeul cel mai indicat este analiza factorial,
prin care se vor putea submpri itemii pe grupe omogene, subtestele ce rezult avnd fiecare o
consisten intern ridicat, dar fiind relativ independente unul n raport cu celelalte, ca n cazul
subscalelor testului de prsonalitate 16PF Cattell.
Aiken (1997) sesizeaz de asemenea c cele trei procedee de determinare a fidelitii
amintite anterior supraestimeaz valoarea acesteia pentru testele n care este implicat viteza. n
acest caz, procedurile de apreciere a fidelitii trebuie modificate, recomandarea fcut fiind
aceea de a administra cele dou jumti ale testului n momente diferite, dar cu limit de timp
egal, dup care se calculeaz fidelitatea fcndu-i-se corecia cu formula Spearman Brown.
3. 2. 2. Metoda test retest
Coeficienii de stabilitate obinui prin aceeai metod se calculeaz cnd testul msoar o
caracteristic durabil i exprim gradul n care scorurile aceluiai subiect la acelai test sunt
constante de la o aplicare la alta.
Metoda presupune dou aplicri identice ale aceluiai test cu un interval de timp
recomandat a fi cuprins ntre 3 i 6 luni.
Factori care influeneaz calculul fidelitii test-retest

42

Intervalul de timp ntre test i retest. Dac timpul este prea scurt exist o mare
probabilitate ca subiecii s i reaminteasc rspunsurile date anterior, respectiv un timp
prea lung ntre test i retest poate determina maturizarea eantionului de subieci. Astfel
dac aplicm un test de percepie la 4 ani i l reaplicm la un interval de 6 luni exist o
mare probabilitate s obinem rezultate diferite la cele dou administrri ale testului
deoarece n intervalul de 6 luni subiectii s-au maturizat. n acest caz, retestul va include
n evaluare nivelul de maturizare al subiecilor. Datorit acestor argumente este de multe
ori dificil de stabilit cu exactitate un timp optim ntre test i retest.
ntotdeauna cnd se calculeaz acest coeficient trebuie precizat intervalul scurs ntre test i

retest, vrst subiecilor precum i condiiile n care s-au administrat testele pentru a putea
identifica eventualele surse de eroare de msur.

Gradul de dificultate al itemilor. Dac itemii sunt fie prea uori, fie prea dificili, se vor
obine coeficieni de stabilitate ridicai deoarece itemii testului fie vor fi rezolvai de
majoritatea subiecilor (n primul caz) fie nu vor fi rezolvai nici la test, nici la retest (al
doilea caz).

Schimbri ale subiectului determinate de prima aplicare. Pot exista o serie de situaii n
care se obin performane diferite la retest deoarece subiectul fie a nvat s rspund la
itemi dup prima administrare, fie aceast prim administrare a determinat schimbri de
atitudini fa de o anumit problem.

3. 2. 3. Metoda formelor paralele


Exist o serie de situaii practice care necesit aplicri repetate ale unui test psihologic la
un interval foarte scurt de timp. n acest caz, aplicarea aceluiai test este improprie deoarece s-a
vzut anterior c la un interval scurt de timp subiecii pot s i reaminteasc rspunsurile date
anterior. n acest caz trebuie s se construiasc forme echivalente sau paralele ale unui test.
Dou teste sunt paralele dac pentru un subiect erorile de msur la cele dou administrri sunt
variabile aleatoare independente. n acest caz itemii celor dou teste trebuie sa fie logic
izomorfi, adic s aib acelai nivel de dificultate.
Avantajul acestei metode este acela c nu mai permite reamintirea rspunsurilor i nici
posibilitatea cutrii rspunsurilor la ntrebrile la care nu s-a tiut rspunde.
Dezavantajele acestei metode sunt urmtoarele:
-

necesit consum de timp prin dou administrri;

subiecii se pot plictisi dac testrile sunt prea lungi;


43

este greu de realizat fiind dificil i costisitoare.

3. 2. 4. Fidelitatea interevaluatori
Este necesar a fi ca1culat n cazul testelor care nu au o cotare obiectiv aa cum sunt
testele proiective de personalitate la care scorul este influenat i de interpretarea pe care o d
persoana care face cotarea. Pentru a verifica n ce msur scorul la test este influenat de
modalitatea n care se face cotarea de ctre diferite persoane se va cere la diferii evaluatori s
ca1culeze scorurile la test, iar apoi se va realiza un coeficient de corelaie interevaluatori. Acest
coeficient va exprima msura n care testul este independent de erori datorate modalitii de
cotare a rspunsurilor subiectului.
Coeficienii de fidelitate transformai n coeficieni de determinare (ptratul coeficientului
de fidelitate) relev proporia n care variana total a rezultatelor psihometrice se datoreaz
varianei "reale" - diferenelor individuale reale - sau din contr, varianei "eroare", definit
diferit, n funcie de metoda particular urmat n stabilirea tipului de fidelitate (Kulcsar, 1980).
n consecin, dei semnificaia diferiilor coeficieni de fidelitate nu este aceeai, totui orice
coeficient de fidelitate, ridicat la ptrat, poate fi interpretat n termeni de procentaj al varianei
randamentului la test. Astfel de exemplu, un coeficient de fidelitate de .80 nseamn c
.802=64% din variana total a rezultatelor psihometrice considerate se datoreaz varianei reale
a domeniului explorat, iar 36% varianei eroare, generat de unele din sursele multiple ale
deosebirilor n rezultatele psihometrice.

3. 3. Interpretarea unui coeficient de fidelitate


Rspunsul la ntrebarea ct de mare trebuie s fie fidelitatea unui test? depinde de
utilitatea care se d acestuia. O fidelitate de 0,70 0,80 este suficient de bun cnd testul este
folosit n scopuri de cercetare. Se accept niveluri sczute ale fidelitii atunci cnd testele se
utilizeaz pentru a lua decizii preliminare (i ridicate pentru decizii finale), sau cnd ele sunt
folosite pentru mprirea grupului n subcategorii, pe baza unor diferene interindividuale mari.
Dac testul servete la compararea grupurilor de persoane ntre ele, coeficienii de
fidelitate de 0,60 0,70 sunt suficieni, dar cnd testul devine o baz de comparaie ntre
persoane individuale, fidelitatea lui trebuie s fie de la 0,85 n sus.
Cnd se iau decizii importante pe baz de teste care mpart persoanele n categorii, n
virtutea unor diferene mici (ca n selecia profesional), fidelitatea acestora trebuie s fie de
peste 0,90.
Cnd decizia privete destinul unei persoane individuale, fidelitatea testului trebuie s fie
de cel puin 0,95.
44

Testele cognitive, i n special cele de inteligen, au o fidelitate foarte mare (peste 0,90),
n timp ce chestionarele de personalitate rareori depesc 0,80. Aplicate colectiv, chiar i testele
cognitive furnizeaz coeficieni de fidelitate mai sczui (circa 0,80). Testele cotate subiectiv, ce
msoar aptitudini i testele de cunotine (educaionale) rareori depesc valori ale fidelitii de
0,80 (Traub, 1944). Testele cu alegere multipl, utilizate colectiv, sunt considerate a avea o
fidelitate bun cnd aceasta atinge 0,75.
Murphy & Davidshopher (1998) prezinta urmtoarele repere n interpretarea coeficienilor
de fidelitate:
Valori ale coeficienilor
de fidelitate

Tipul testului

Interpretare

0.95
0.90

Teste de inteligen de grup

0.85

Teste de performan

Fidelitate mare

0.80
0.75

Teste cu rspunsuri multiple

0.70

Scalele comportamentale

Fidelitate moderat

0.65
0.60

Unele msurtori proiective

Fidelitate sczut

0.55
0.50

Scorul real i eroarea au efect


egal asupra scorurilor la test

Cnd avem de ales dintr-o mulime de teste avnd toate celelalte caracteristici egale, este
de preferat testul care are cea mai mare fidelitate. Nu este posibil s se specifice un nivel minim
care s fie impus coeficienilor de fidelitate ai tuturor testelor.
Fidelitatea chestionarelor de personalitate si a celor de interese tinde s fie mai mic dect
cea a testelor cognitive (de cunotine, de inteligen, de aptitudini speciale) (Aiken, 1994).
Testele cotate obiectiv care msoar aptitudini cognitive pot furniza, n loturi eterogene de
persoane, coeficieni de fidelitate mai mari dect 0.8. Testele cotate subiectiv care msoar
aptitudini, testele demcunotine i cele care evalueaz performane tipice (de exemplu,
chestionare de personalitate) au, adesea, coeficieni de fidelitate mai mici dect 0.80 (Traub,
1994).
Testele cu alegere multipl pot avea o fidelitate mai sczut.

45

3.4. Factorii care intervin n estimarea fidelitii


Studiile efectuate pentru determinarea valorii unui coeficient de fidelitate nu cuprind, n
general, ntreaga populaie de persoane creia i este destinat testul, ci doar un eantion din
aceast populaie. Din acest motiv, valoarea calculat este doar o aproximare (o estimare) a
coeficientului de fidelitate. Selecia unui alt lot va conduce la obinerea unei alte valori.
Pentru ca estimarea fidelitii s fie ct mai precis, trebuie ndeplinite cteva condiii
(Traub, 1944, apud Albu, 1998):
A. Eantionul s fie ct mai voluminos. Desi forma exact a repartiiei coeficienilor de
fidelitate calculai pentru diverse eantioane de acelai volum, extrase aleator din populaie, nu
este cunoscut, se obinuiete s se considere c abaterea standard a acestei repartiii (denumit
eroare standard) este invers proporional cu rdcina ptrat din volumul eantioanelor. Prin
urmare, pentru a micora de dou ori eroarea standard este necesar s se mreasc de patru ori
volumul eantionului.
B. Eantionul de subieci s fie reprezentativ pentru populaia creia i este destinat testul.
El trebuie s fie la fel de eterogen ca si aceast populaie, ntruct gradul de omogenitate al
eantionului are influen asupra mrimii coeficientului de fidelitate.
C. Msurtorile efectuate cu ajutorul testului s fie independente ntre ele. Msurtoarea
realizat asupra unui subiect s nu fie influenat si nici s nu influeneze msurtorile efectuate
asupra altor persoane.
Atunci cnd calculul coeficientului de fidelitate impune ca fiecare persoan s rspund de
dou ori la acelasi test sau s rspund la dou forme paralele ale testului foarte asemntoare
ntre ele, cerina de independen a msurtorilor se extinde, n sensul c msurtorile efectuate
asupra aceleiai persoane trebuie s fie independente ntre ele. Aceasta nseamn c nu li se va
oferi subiecilor posibilitatea de a revedea sau de a-si aminti rspunsurile date la prima
administrare a testului.
Dac se calculeaz un coeficient de consisten intern, se va urmri ca itemii testului s
fie independeni ntre ei. Prin urmare, rezolvarea unuia nu va fi condiionat de rezolvarea altuia
i nu vor exista itemi care s se refere la acelasi aspect, astfel nct subiecii s rspund la ei n
acelai mod (corect sau greit).
D. Procedura de administrare a testului si a retestului sau a celor dou forme paralele ale
testului s fie identic i, n acelai timp, s fie aceeai cu cea care se va utiliza n practic.
Astfel, de exemplu, dac se prevede ca testul s fie administrat cu limit de timp, n 40 de
minute, atunci acest interval de timp va fi respectat si la administrarea testului pentru estimarea
fidelitii.
46

Ca o concluzie a acestor consideraii despre fidelitatea testelor, se relev faptul c ea este


mai bun pentru teste unidimensionale i cu numr mai mare de itemi, ct i pentru testele
cognitive i c ea angajeaz un studiu analitic al itemilor (analiza de itemi) pentru a le determina
fora de discriminare. n multe situaii analiza factorial este metoda cea mai eficient prin care
se pot construi subteste omogene i unidimensionale.Fidelitatea este una din fundamentrile de
baz ale cercetrilor asupra comportamentului. Dac un test nu este fidel, nu va fi posibil s
demonstrm c el are vreun neles, spun Kaplan i Saccuzzo (op. cit., p.131). Deci, dei
validitatea pare a fi mai important, din punct de vedere tehnic studiul ei nu poate ncepe cu
teste care nu i dovedesc o fidelitate minim, acceptabil, care depinde de scopul n care acestea
vor fi utilizate.

4. Validitatea
4.1. Definiie
Validitatea este unul din conceptele cele mai importante n msurarea psihologic. O bun
validitate reflect faptul c aptitudinile sau caracteristicile psihologice msurate de text
corespund domeniului de evaluare, cu alte cuvinte testul msoar ceea ce i-a propus.
Anastasi (1976) preciza c validitatea unui test se refer la ct sunt de potrivite
interpretrile descriptive, explicative sau predictive care dedau scorurilor sale.
Conform APA, validitatea se refer la corectitudinea inferenelor realizate pe baza unui
test sau a unei forme de evaluare.
La analiza definiiilor, se observ c accentul cade pe ncrederea pe care o putem avea n
deduciile fcute pornind de la scoruri i lund n considerare ntreg procesul prin care s-au
obinut aceste scoruri.
Validarea este procesul prin care se obin informaii legate de validitatea unui test.
Validitatea este un concept general cu privire la puterea i corectitudinea inferenelor care
pot fi fcute pornind de la scorurile unui test i de aceea nu se poate afirma despre nici un test c
are, la modul abstract, o validitate ridicat sau sczut. Validitatea acestuia trebuie stabilit
n raport cu utilizarea particular a ceea ce s-a cerut n test.
Clasificarea scolastic n validitatea de construct, validitatea de coninut i validitatea de
criteriu creeaza unele confuzii i este mai bine s se foloseasc sintagma de tip analiz a
validitii propus de Lawshe (Landy, 1986)
n normele APA se vorbete despre validitatea de aspect. Ea nu constituie un criteriu
important pentru inferenele fcute pe baza unui test. Este definit ca ceea ce un test pare a
47

msura, mai degrab dect ceea ce msoar i este important doar msura n care influeneaz
rspunsurile la test n funcie de modul n care sunt percepui itemii.
4.2. Tipuri de analiz a validitii unui test psihologic

4.2.1. Validitatea de construct


Constructul este o idee construit de experi dintr-un domeniu particular al tiinei.
Exemple de constructe sunt: inteligena, locus of control (poziia controlului),
sociabilitate, maturitate colara, etc. Silva (1993) definea constructul ca o eticheta pentru o
grupare de comportamente care covariaza.
Fiecare construct psihologic are la baz o teorie (fiecare test psihologic pornete de la o
teorie) care permite descrierea i predicia comportamentelor n situaii specifice. Un construct
psihologic se caracterizeaz prin faptul c este o abstractizare a unor regulariti din natur care
nu sunt observabile direct dar pot fi conectate cu evenimente concrete i observabile. Multe
dintre testele de personalitate msoar dimensiuni ale acesteia (anxietate, depresie, nevrotism,
motivaie, introversie-extraversie), mai slab definite iniial i din ce n ce mai bine circumscrise
pe msur ce teoriile n domeniu au avansat. Conceptualizrile progresive ale acestora (dar i ale
inteligenei, memoriei, creativitii etc.) au dus la apariia de constructe tot mai evoluate.
Unele teste sunt construite plecnd de la date empirice (ca M.M.P.I. sau Inventarul de
Personalitate California al lui Gough), altele se origineaz n teorii anterior elaborate oricrei
cercetri empirice (Chestionarele de personalitate Cattell sau Indicatorul Tipologic MyersBriggs). Validitatea relativ la construct verific, pe de o parte, dac testul se refer realmente la
constructul pe care vrea s-l msoare, i apoi dac scorurile subiecilor testai reflect corect
mrimea acestui construct la persoanele n cauz. Strategia determinrii acestui tip de validitate
impune un algoritm (vezi Albu, 1998, pp. 165-166). De aceea, n teoria care st la baza testului
psihologic orice construct trebuie operaionalizat, adic descris prin comportamente concrete i
observabile i selecionat cu alte variabile fiziologice i psihologice cu care variaz.
De exemplu, ntr-un test care evalueaz aptitudinea verbal, conceptul de aptitudine
verbal este operaionalizabil prin urmtoarele comportamente sau aciuni care se gsesc n
itemii testului- definirea unui cuvant dat, gasirea de sinonime/antonime, identificarea expresiei
gresite, etc. Deoarece variabilele sunt construite pornind de la un ir de raionamente bazate pe
ipoteze i deducii, acest tip de validitate se mai numete i validitate ipotetic deductiv.
Validitatea relativ la construct este verificat i prin raportarea testului respectiv la alte
teste despre care se tie c evalueaz acelai construct sau constructe diferite. Verificarea
practic a acestui lucru necesit aplicarea metodelor statistice, dintre care metodele
48

corelaionale sunt cele mai importante. Poate fi precizat astfel validitatea convergent i
validitatea discriminativ.
Validitatea convergent este corelaia pozitiv a testului validat cu alte teste care msoar
aceleai concepte ca i testul n cauz.
Validitatea discriminativ este corelaia nul cu alte teste despre care se tie c msoar
alte constructe dect testul care se valideaz.
Validitatea convergent i discriminativ poate fi examinat n mod simultan prin metoda
bazat pe matricea multitrsturi multimetode (Multitrait-Multimethod Matrix) care conine
valorile coeficienilor de corelaie liniar ntre diverse msurri ale acelorai constructe obinute
prin intermediul a dou sau trei instrumente diferite. Procedeul descris aici a fost inventat nc
din 1959 de Campbell i Fiske i este o metodologie important pentru nelegerea procesului de
validare. Se numete multidimensional pentru c ia n evaluare dou sau mai multe trasturi
prin dou sau mai multe metode.

Metoda

Trsturile

Metoda 1
A1

Metoda 1

Metoda 2

Metoda 3

B1

C1

Metoda 2
A2

B2

C2

Metoda 3
A3

B3 .C3

A1

(.89)

B1

.51 (.89)

C1

.38

.37 (.76)

A2

.57

.22

.09

(.93)

B2

.22

.57

.10

.68 (.94)

C2

.11

.11

.46

.59

.58 (.84)

A3

.56

.22

.11

.67

.42

.33

(.94)

B3

.23

.58

.12

.43

.66

.34

.67

(.92)

C3

.11

.11

.45

.34

.32

.58

.58

.60 (.85)

n exemplul dat de Gregory n figura de mai sus, 3 trsturi A, B i C (Interesele,


Creativitatea i Dominana) sunt msurate cu metodele 1, 2 i 3 (inventar autoaplicat, evaluarea
covrstnicilor i un test proiectiv). Deoarece fiecare dintre cele 3 trsturi sunt msurate prin
toate cele 3 metode, rezult de fapt 9 teste, exprimate prin coeficienii de corelaie din
triunghiurile cu linie continu de pe diagonala mare. Cnd fiecare dintre aceste teste este
49

administrat a doua oar aceluiai grup de subieci i scorurile fiecrei perechi de teste rezultate
prin test-retest sunt corelate rezult matricea multitrstur multimetod care devine o surs
extrem de bogat de informaii, att pentru fidelitate ct i pentru validitatea convergent i
divergent. Aceast metodologie este o contribuie important la nelegerea procesului de
validare, dar reclam un efort de cercetare uria. De aceea cei mai muli creatori de teste prefer
s culeag informaii separate, pe buci despre fidelitate i validitate, pe care s le reuneasc
ulterior ntr-un tabel compozit, dect o matrice care s le integreze din capul locului pe toate
deodat simultan. (Clinciu, A.I., 2005).
Un alt procedeu utilizat pentru evaluarea validitii de construct este analiza factorial.
Aceast metod, numit validare factorial, se aplic n cazul testelor care msoar constructe
multidimensionale.
Prin analiza factorial se urmrete dac structura scorului la test reflect structura
domeniului constructului msurat. Pentru aceasta se formeaz grupuri de itemi care coreleaz
ntre ei, se calculeaz scorurile acestor grupuri de itemi (scoruri factoriale) i se presupune c
fiecare asemenea scor reprezint msura unei variabile.
Cnd ne propunem s realizm o analiz factorial, trebuie mai nti s distingem
atributele de suprafa i eroarea de msur. Atributele interne sunt constructe ipotetice utilizate
pentru a explica o serie de fenomene (de exemplu conceptul de ,,magnetism n fizic).
Existena lor este inferat pe baza fenomeneler observabile. Analiza factorial postuleaz c
exist factori interni neobservabili care explic variaia i covariaia dintre o serie de atribute de
suprafa. Atributele de suprafa sunt observabile i se pot msura direct.
Factorii interni pot fi specifici (cnd influeneaz doar o singur variabil de suprafa) i
comuni (cnd influeneaz mai multe variabile de suprafa).
Factorul eroare de msur asociat atributelor de suprafa constituie alt tip de influen
asupra acestora. Sursele specifice de eroare n msurarea psihologic au fost prezentate n
capitolul legat de fidelitatea msurrii.
Variaia observat la nivelul atributelor de suprafa rezult n parte influenei factorilor
comuni i specifici care adesea se combin cu variaia erorii de msur.
Prin analiza factorial se msoar i variaia variabilelor de suprafa. Aceast corelaie se
datoreaz influenei factorilor comuni.
Creatorul analizei factoriale, Charles Spearman (1907) a creat aceast metod capabil s
pun n eviden existena unui factor general al inteligenei, prezent n orice tip de sarcin
mintal (i de aceea numit i factor g), n combinaii diferite cu un factor specific numit s.
Procedeul dezvoltat de el, numit metoda componentelor principale, i-a permis s produc
dovezi n favoarea ipotezei sale, numit modelul bifactorial al inteligenei.
50

n 1928, Thurstone, a utilizat aceeai metod ortogonal (dou axe aflate n unghi drept,
adic independente ntre ele) dar cu un mic amendament: n loc ca o ax s explice variana
factorului major i cealalt variana rezidual (variana rmas neexplicat de factorul major) el
a propus rotirea celor dou axe ortogonale pn la obinerea structurii celei mai simple,
ameliornd astfel gradul de adaptare al datelor la structura factorial. Metoda se mai numete i
Varimax deoarece ea caut ca pe fiecare dintre cele dou axe ortogonale variana explicat s fie
una maximal. Aceasta face ca fiecare factor s explice un grup de rezultate i doar att, cci cu
aceast metod nu mai poate fi identificat factorul general, ceea ce pune n discuie modelul
propus de Spearman.
Din punct de vedere matematic ambele metode sunt valide, dar fiecare are propriile sale
limite: una ajut la identificarea factorului general pe care cealalt l neag, dar cealalt ajut la
mai buna identificare, nelegere i numire a factorilor rezultai. De aceea utilizarea lor este
corelativ. Analiza factorial permite doar verificarea faptului dac datele sunt consistente cu
structura factorial postulat. Cnd datele sunt compatibile cu mai multe structuri latente,
analiza factorial nu ne ajut s alegem una singur, aceast alegere fundamentndu-se pe baza
unei teorii. ntr-un demers de validare, analiza factorial ne va aduce deci informaiile necesare,
dar nu i suficiente lurii unei decizii.
Analiza factorial se sprijin pe dou postulate de baz:

postulatul cauzalitii factoriale: variabilele observate sunt combinaii lineare de variabile


cauzale subiacente;

postulatul parcimoniei: dintre dou soluii factoriale trebuie s o alegem pe cea mai simpl.
Dei larg acceptat de majoritatea cercettorilor, nu este posibil de demonstrat c acest
postulat este bine fundamentat i nici nu este valabil faptul c ntotdeauna structura cea mai
simpl s fie mai plauzibil dect cea mai complex.
Oricum, n funcie de tipul de analiz ales ajungem la soluii factoriale diferite, iar soluia

final pe care o alegem nu este una de natur matematic, ci de natur teoretic.


Raportul dintre teorie i msurare este cel mai bine surprins prin conceptul de validitate de
construct sau conceptual, care este chiar inima operaionalizrii variabilelor. A operaionaliza
nseamn de fapt a aduce un construct teoretic n situaia de putea fi surprins i evideniat prin
msurare. n cazul n care operaionalizarea unei teorii bune a fost fcut corect, printr-un
instrument corect, capabil s o surprind, atunci putem formula predicii sub forma ipotezelor ce
rezult din teoria respectiv. Dac ipotezele se verific, atunci i teoria i operaionalizarea ei
sub forma instrumentului de msur respectiv sunt n regul. Dac ns ipotezele nu se verific,
sunt posibile dou explicaii alternative:
-

instrumentul este bun, dar deoarece teoria nu se verific, aceasta trebuie schimbat;
51

teoria este una valabil, dar instrumentul nu o operaionalizeaz corespunztor i atunci nu


putem dovedi ce ne-am propus i deci trebuie schimbat chiar instrumentul de msur.
4.2.2. Validitatea de coninut
Pornind de la definiia dat de Anastasi (1968) testului psihologic ca fiind o msur

obiectiv i standardizat a unui eantion de comportament, trebuie fcut din start precizarea
c acest eantion de comportament trebuie s fie reprezentativ. Pentru a verifica acest lucru,
este necesar o analiz logic a coninutului testului psihologic pentru a determina dac acoper
un eantion reprezentativ de comportamente pe care testul n cauz trebuie s l msoare.
(Anastasi, 1976). Aa cum reprezentativitatea eantionului de populaie ales permite generalizri
asupra populaieiint pe care o reprezint, itemii testului, prin maniera lor de construcie i de
selecie, pot acoperi ntr-o mai mare sau mai mic msur domeniul sau universul trsturii sau
al aptitudinii msurate. n felul acesta rspunsurile la un eantion de itemi dintr-un test cu
validitate de coninut sunt reprezentative pentru rspunsurile pe care subiectul le-ar fi dat dac
ntreg universul trsturii ar fi fost msurat.
Analiza validitii de coninut vizeaz dou aspecte:
- un prim aspect care nu solicit metode statistice ci se bazeaz doar pe raionamente,
motiv pentru care validitatea de coninut se mai numete i validitate logic sau raional; acest
tip de validitate este decisiv n testele educaionale i de achiziii, ridicnd probleme specifice
evaluatorului. Se va genera deci o banc de itemi care s acopere bine ntregul domeniu
investigat (cunotinele la un obiect colar, gradul de elaborare al unor deprinderi, nivelul de
cristalizare al unor atitudini), din care vor fi selecionai i agregai ntr-un test doar un numr
limitat de itemi, reprezentativi pentru ntregul domeniu.
-

al doilea aspect se refer la analiza de itemi (calculul indicelui de dificultate i a indicelui


de discriminare) i implic cteva formule matematice.
Dup Gregory (1992), analiza validitii de coninut a unui test trebuie s cuprind:

1. Definirea i descrierea domeniului de coninut al testului. Se face n mod asemntor


definirii constructului, singura diferen const doar n gradul de abstractizare i de aceea
cele dou se confund. Definirea domeniului de coninut al unui test se face dup
definirea constructului, care are un grad mai mare de abstractizare, i presupune
enumerarea tuturor comportamentelor concrete care pot fi utilizate pentru a msura
caracteristica la care se refer testul.
2. Analiza itemilor testului pentru a se elimina itemii care nu se refer la domeniul de
coninut al testului. Se formeaz un grup de experi care trebuie s acorde o not ntre 1
52

i 4 pentru fiecare item dup ce au citit descrierea domeniului de coninut al testului.


Semnificaia notelor este: 1 = irelevant, 2 = puin relevant, 3 = destul de relevant, 4 =
foarte relevant. Vor fi reinui doar itemii pe care majoritatea experilor i-a notat cu nota
3 sau 4.
3. Compararea structurii testului cu domeniul de coninut pentru a decide dac itemii
acoper toate aspectele domeniului i dac sunt proporionali ca numr cu mrimea i
importana fiecrui aspect.
Reproducem (dup Suzana Urbina, 2009) o ilustrare a erorii de eantionare a coninutului
care rezult din construirea greit a testului. Autoarea propune cazul unui test educaional
destinat s evalueze tot materialul de nvat structurat n cinci capitol ale unui manual, test
elaborat de un cadru didactic pornind doar de la coninutul a trei capitole. Presupunnd c toi
studenii au studiat doar trei capitol din cinci (deci stapnesc 60 % din materialul pe care l
aveau de parcurs), scorurile lor reale ar trebui s aproximeze acest procent (deci notele obinute
la examen ar trebui s fie aproximativ aceleai). n realitate, consecinele eantionrii inadecvate
de ctre professor vor fi urmtoarele:
1. elevii care au studiat doar cele trei capitole din care a fost extras coninutul testului vor obine
aproape o not maxim (vor rspunde aproape 100% la toate nrebrile);
2. cei care s-au concentrat pe dou capitole dintre cele selectate de cadrul didactic i pe unul din
cele neselectate vor avea un procentaj de reuit de 67%
3. cei care au avut proasta inspiraie de a se concentra doar pe unul din cele trei capitol
selectate i pe cele dou dintre capitolele neincluse n test, vor avea un procent de reuit de
33%.
Discrepanele dintre scorurile obinute i nivelul real de stpnire a materialului reprezint
eroarea de eantionare a coninutului care va determina diferene foarte mari ntre notele
obinute de studeni.
Deoarece analizeaz doar itemii din punctul de vedere al reprezentativitii i relevanei
coninutului lor, validitatea relativ la coninut nu reprezint o validare n sensul definiiei date
de ,,corectitudinea inferenelor pe care le putem face pornind de la scorurile testului. Testul
poate doar s par valid dar de fapt s msoare altceva dect i propune.
Pentru a da validitate de coninut unui test, constructorul se angajeaz ntr-un proces de
durat, ce presupune o foarte bun cunoatere a domeniului, raionament logic, intuiie i
perseveren, cci itemii trebuie continuu revizuii. De aceea putem spune c dintre formele
53

fundamentale de validitate, cea de coninut este singura care are o susinere mai degrab logic
dect statistic.
Totui, al doilea aspect al validitii relative la coninut, analiza indicelui de dificultate i a
celui de discriminare a itemilor ne demonstreaz matematic dac un item este bun sau slab, dac
cunotinele subiectului au rmas la un nivel general sau dac au cobort pn la detalii unde
subiectul poate s aprecieze diferenele de nuan.

4.2.3. Validitatea de criteriu


Intrerpretarea valid a scorurilor unui test presupune ca semnificaia scorurilor s fie
utilizat n inferenele pragmatice necesare pentru a lua decizii cu privire la oameni (Urbina,
2009). O bun validitate relativ la criteriu arat c scorurile la test coreleaz cu diversele criterii
utilizate n luarea deciziilor.
Prin ,,criteriu se nelege o variabil pe care ncercm s o prevedem n general cu ajutorul
testelor. (Grand dictionnaire de la psychologie, 1994) (apud.Albu, 2000) iar validitatea relativ
la criteriu indic msura n care scorurile obinute la un test sunt un bun predictor pentru un
eantion de comportamente viitoare (performana colar, de exemplu).
Coeficientul de validitate relativ la criteriu este egal cu coeficientul de corelaie liniara
ntre scorurile testului i rezultatele unei msurtori independente considerat variabil criteriu.
De exemplu, referitor la relaiile constructului aptitudine verbal cu alte variabile, se pot
avea n vedere urmtoarele aspecte:
-

scorurile cresc o data cu vrsta

scorurile coreleaza pozitiv cu calificativele obinute la limba i literatura romn

scorurile sunt predictive ale succesului colar


Variabilele criteriu la care se face referire sunt: vrst, calificativ obinut,
maturitate colar.
Exist multe dimensiuni ale criteriilor care po pot fi utilizate n validarea scorurilor unui

test dar cele mai frecvente sunt (Urbina, 2009):


- indicatori ai performanei academice sau ai performanei ntr-o form de instruire
specializat (note, nivelul performanei sportive sau artistice, numar de premii sau olimpiade
ctigate, etc.)
- indicatori ai performanei n munc (evalurile realizate de superiori, colegi, clieni;
numrul de piese produse; nregistrarea vnzrilor; numrul de evenimente negative/accidente la
locul de munc, longevitatea pe post, etc.)
- apartenena la grupuri contrastante (bazate pe achiziii educative admis/respins, statut
ocupaional cu/fr loc de munc, diagnostic psihiatic manifestari clinice/non-clinice, etc.)
54

- evaluri ale comportamentului sau trsturilor de personalitate realizate de alte persoane


(colegi, rude, etc.) care au suficiente baze pentru a le oferi.
Lund n considerare varietatea de criterii prezentat mai sus, putem observa c n afar de
coeficientul de corelaie al lui Pearson, se poate folosi i corelaia rangurilor prin metoda lui
Spearman, n cazul unei evaluri prin ierarhizare sau corelaia biserial.
De asemenea, validitatea unui test mai poate fi analizat i prin metoda grupelor
contrastante. Grupele contrastante sunt dou grupe formate din subiecii cu performanele cele
mai bune i subiecii cu performanele cele mai slabe, avnd la baz un criteriu (calificativul la
limba romn, de exemplu). Se compar statistic mediile scorurilor obinute la test (n cazul
nostru, s presupunem un test pentru evaluarea aptitudinilor verbale) pentru subiecii din cele
dou grupe contrastante stabilite nainte. Dac diferena dintre medii este statistic semnificativ,
testul are valoare predictiv. Aceast metod se aplic mai ales cnd criteriul este o variabil
calitativ (nu se poate msura) sau atunci cnd criteriul este alctuit din mai multe variabile care
pot fi att cantitative ct i calitative (de exemplu, clasificarea facut ntr-o selecie profesional
n urma interviului, a rezultatelor la mai multe teste de aptitudini i a referinelor de la ultimul
loc de munc).
Au fost difereniate dou tipuri de validitate relativ la criteriu: validitatea predictiv i
validitatea concurent.
Validitatea predictiv se refer la precizia cu care putem estima (prezice) c o anumit
caracteristic sau aptitudine a unei persoane reflectat n scorurile unui test se va manifesta n
viitor. De exemplu, pe baza performanei la un test de aptitudini pentru admitere la coala de
oferi, s facem o predicie asupra comportamentului ca viitor ofer.
Validitatea predictiv presupune trecerea unui interval de timp ntre aplicarea testului i
msurarea criteriului.
Validarea concurent presupune obinerea scorurilor la criteriu n acelai timp cu scorurile
la test.
O problem care se ridic n legtur cu criteriul este aceea a fidelitii lui, a msurii n
care i el poate fi afectat de eroare n estimare. Msurarea criteriului trebuie s fie obiectiv i
standardizat.
Eroarea standard a estimrii (SEE)
Exist o anumit eroare pe care o comitem n estimrile criteriului utiliznd scorurile
obinute la test. Aceasta se numete eroarea standard a estimrii (SEE) i reprezint eroarea
prediciilor bazate pe corelaiile imperfecte. Modalitate de calcul este:
55

SEE = Sdy 1 rxy

n formul:
Sdy - abaterea standard a scorurilor obinute la criteriu;

2
xy

- ptratul valorii coeficientului de validitate;

Dac Y ar fi scorul subiectului, putem face predicia cu o probabilitate de a grei de 95%


(Z = 1.96) sau de 99% (Z = 2.58) c subiectul va atinge criteriul anticipat n viitor, acesta facnd
parte dintr-un iterval calculat pe baza formulei: Y Z * SEE
4.3. Interpretarea coeficienilor de validitate, factori i precauii legate de aprecierea lor:
Pentru c strategiile de validare ale unui test sunt att de diverse, nu exist o interpretare
uniform a acestora. Un coeficient de validitate este semnificativ statistic cnd ansele de a-l
obine din ntmplare sunt sub 5 procente.Atunci cnd validitatea este exprimat sub forma
unui coeficient de corelaie, proporia de varian comun pentru predictor i criteriu este deseori
exprimat prin ridicarea coeficientului de validitate la ptrat i obinerea unui coeficient de
determinare care exprim proporia de varian a scorului asociat cu variana criteriului. De
exemplu un coeficient de validitate predictiv de .87 indic faptul c scorurile obinute la un test
de dexteritate manual utilizate ca predictor pot explica aproximativ 75% (.87 * .87 = .76) din
variana criteriului rezultate obinute la linia de asamblare (Urbina, 2009).
Dintre factorii care influeneaz valoarea coeficienilor de validitate pot fi amintii:
-

Natura grupului care este testat


Testul este validat pe un eantion adic pe un grup semnificativ din populaia creia i

este destinat testul. Nivelul de educaie, vrsta, ocupaia, pot aciona ca i variabile ascunse,
modificnd relaia dintre criteriu i scorurile la test i se poate ntmpla ca un test s aib
validitate mai mare ntr-o populaie i mai mic n alta.
-

Contaminarea criteriului
Dac valorile variabilei criteriu sunt influenate de scorurile testului, se spune c a

avut loc o contaminare a criteriului. Acest lucru are ca efect creterea artificial a validitii
relative la criteriu.
Standards for Educational and Psychological Testing din SUA atrag atenia asupra
ctorva probleme importante i precauii legate de interpretarea coeficienilor de validitate:

56

1. Este necesar cercetarea schimbrilor aprute n sensul cauzalitii test-criteriu: de regul


presupunem implicit c relaia dintre test i criteriu este funcional atunci cnd aplicm testul,
dar criteriul nostru poate fi diferit.
2. Coeficientul de validitate contra criteriu obinut poate s nu nsemne nimic dac criteriul nu
este el nsui valid i fidel. A corela un test cu un altul despre care nu tim prea multe lucruri sub
aspectul validitii nu ne ajut prea mult n determinarea validitii convergente a primului test.
3. Se ia ntotdeauna n consideraie populaia pe care s-a obinut o anume validitate: o validitate
ridicat pe o populaie de o anumit etnie se pstreaz pe o populaie de etnie diferit?
4. Validitatea se generalizeaz cu pruden o validitate gsit: cu alte cuvinte, trebuie demonstrat
c validitatea descoperit ntr-un studiu nu este dependent de situaie.
Trebuie reinut c:
Validitatea nu se msoar, ci se deduce. Dei autorul testului trebuie s dea mai muli
coeficieni de validitate, indicnd procedura urmat, utilizarea lui pe alte grupuri sau n alte
scopuri necesit i alte studii de validare. Aceasta deoarece validitatea testului depinde simultan
de scopul testrii i de populaia creia i se administreaz. Toate aceste determinri ale validitii
care vin din studii ulterioare, desfurate n scopuri specifice i pe alte eantioane de populaie,
vor fi considerate doar dovezi ale unui anumit tip de validitate.
Studierea validitii testelor angajeaz metode elaborate de analiz (analiza de itemi,
calculul corelaiei, analiza factorial, regresia simpl i multipl) care combinate, dau strategii
de validare mai bine definite. Utilizarea lor se face n funcie de scopul i de exigenele
beneficiarului.
Strategiile de validare se aplic odat cu construirea testului i se repet de cte ori este
nevoie pentru a obine un test bun ca lungime, mod de aplicare, for discriminativ, uurin n
administrare, cotare i interpretare, care alturi de fidelitate i validitate, dau o imagine mai
adecvat despre valoarea sa.
Procedura de validare trebuie reluat periodic pe eantioane diferite de subieci.
Utilizatorul de teste psihologice trebuie s revalideze testul cumprat n funcie de scopul pentru
care l utilizeaz (de exemplu avizarea unor persoane pentru un anumit loc de munc).
Utilizarea testului impune procesul repetrii periodice a cercetrii validitii, ntruct
validarea unui test nu se ncheie niciodat, datele nou acumulate din diverse domenii conducnd
la ameliorarea i rafinarea ei, dar nu i la o soluie definitiv. Cu att mai mult se pune problema
relurii studiului validitii unui test cnd i se schimb formatul (prin aplicarea pe calculator, de
exemplu), coninutul, instructajul sau modul de cotare.
57

5. Dificultatea i sensibilitatea unui test psihologic


Aplicarea unui test psihologic sau educaional ridic o problem tehnic foarte important i
anume dac el este adecvat, ca i grad de dificultate, populaiei sau grupului respectiv. Dac este
prea uor, majoritatea scorurilor la test vor fi mari i curba rezultat, n form de j, va fi
asimetric spre dreapta; dac va fi prea greu, curba n form de i va fi asimetric la exterma
stng. Se apreciaz c testul este adecvat unei populaii doar n cazul n care repartiia scorurilor
sale este simetric, genernd o curb de tip gaussian.
Problema dificultii unui test se pune n funcie i de tipul acestuia. Dac el este un test de
aptitudini, capaciti, deprinderi sau cunotine, problema dificultii este mult mai relevant
dect pentru testele de personalitate sau chestionarele de opinii, atitudini, interese, valori, caz n
care termenul de dificultate ar putea fi nlocuit cu cel de accesibilitate.
Dificultatea testului depinde simultan de coninutul su i de particularitile subiecilor
investigai, ceea ce face ca n construirea unui test s existe o faz iniial (definirea testului,
crearea bncii de itemi i construirea unei variante preliminare a acestuia), o faz intermediar
(administrarea testului, analiza rezultatelor obinute i, prin analiza de itemi, depistarea erorilor,
corectarea, selectarea i ordonarea itemilor) i o faz final (elaborarea normelor, etaloanelor i
elaborarea manualului testului, vezi Albu, 1998, p.199).
Dac testele de aptitudini i de cunotine aplicate adulilor iau n considerare un proces
ncheiat, variabilitatea fiind dat mai ales de studii, profesie sau sex, cele mai multe teste de
inteligen, memorie, aptitudini speciale i cunotine, aplicate copiilor sau adolescenilor, au n
factorul vrst cea mai important surs de variabilitate. n acest sens, elementele de dificultate
ale testului trebuie s evolueze paralel cu vrsta (s aib indice genetic, dup expresia lui
Claparde), n cadrul fiecrei vrste el trebuind s aib o ct mai bun acoperire a spectrului
domeniului investigat. Aceasta trimite la puterea de discriminare a testului, adic la
sensibilitatea lui.
Un test este uor sau greu n situaia cnd unitile lui, fiind foarte puternic corelate ntre
ele (test omogen), creeaz posibilitatea ca majoritatea itemilor s fie rezolvai ori corect, ori
greit, ceea ce va da curbe asimetrice spre dreapta sau spre stnga. Exist i posibilitatea ca
populaia s cuprind dou grupuri distincte, care vor da scoruri polarizate dup o curb
bimodal (cu dou cocoae), ca n cazul testelor dihotomice: masculinitate-feminitate,
extraversiune-introversiune, stabilitate - instabilitate, admis - respins. Multe teste de selecie
profesional nu urmresc ierarhizarea de finee a persoanelor, ci ruperea grupului n categorii
extreme: apt-inapt, admis-respins, capabil-incapabil. Aici testele folosite vor fi mai mult centrate
pe dificultate (mic, medie, mare) i mai puin pe sensibilitate, for de discriminare. Aplicate la
58

nceputul sau la sfritul unui proces de formare, acelai test poate avea o curb iniial n form
de i (cnd deprinderea nc nu exist), o form de j (cnd n final ea s-a format pentru marea
majoritate a subiecilor), ntre care se interpune o repartiie normal, simetric, pentru perioada
intermediar (vezi Albu, op. cit., p.185).
Asemenea lentilelor, a cror calitate depinde n principal de puterea lor de separaie (numrul
de linii independente discriminate pe o suprafa de un centimetru ptrat), sau a balanelor de finee,
ca cele analitice, capabile s dea subdiviziuni din ce n ce mai fine i continue pn la a cincea
zecimal, caz n care se spune c sunt foarte sensibile, testele psihologice au aceast caracteristic
n funcie de numrul claselor pe care le pot delimita n interiorul unui grup. Cu ct numrul
valorilor de scor este mai mare, cu att ele discrimineaz (difereniaz) mai bine ntre indivizi. n
afara acestei accepiuni, Kline (1993) leag sensibilitatea unui test de capacitatea sa de a produce
scoruri diferite pentru subiecii care difer ntre ei n ce privete caracteristica msurat. Deoarece
sensibilitatea conjug caracteristicile testului cu cele ale populaiei msurate, vom remarca faptul c
testele mai lungi, cu itemi gradai ca dificultate (deci neomogeni) sunt mai sensibile, pentru c ele
produc mai multe clase, valori ale scorurilor. Prin contrast, testele scurte sau cu itemi foarte
omogeni genereaz mai degrab categorii dihotomice, foarte contrastante, deci sunt puin
discriminative.
Depinznd de forma repartiiei pe care o d scorurilor sale, testul cu curbe atipice (i, j sau
bimodal) sunt puin sensibile n zonele de mare aglomerare a scorurilor i sensibile n rest; curba
lui Gauss este tot mai discriminativ spre extreme, i mai puin sensibil pe poriunea central, unde
aglomerarea rezultatelor d un numr mai mic de scoruri.
Exist o legtur foarte puternic ntre dificultatea unui test i sensibilitatea sa. La fel cum n
fotografie filmele foarte sensibile (care se impresioneaz la cantiti mici de lumin) pltesc un pre
n ceea ce privete calitatea imaginilor (mai puin nete, deoarece imaginea este tradus pe pelicul
prin grupuri mai mari de puncte), sau la fel ca n metrologie, unde balana analitic i dovedete
utilitatea pentru greutile mici, iar nu pentru kilograme sau tone, testele psihologice trebuie s
stabileasc un raport corespunztor ntre dificultate i sensibilitate.
Sensibilitatea presupune, pe de o parte, o ct mai bun acoperire a domeniului de coninut al
variabilei, pentru care trebuie s aib grade diferite ale dificultii, pe de alt parte discriminarea de
finee la nivelul fiecrui palier de dificultate ales. Pentru a exemplifica, testele de inteligen WISC
sunt operaionale de la 5-6 ani la 14-16 ani, pentru fiecare an dndu-se etaloane din 4 n 4 luni. Dar
n timp ce anumite subteste ale bateriei (Informaii, Comprehensiune) dau un larg evantai de
scoruri, nct etaloanele nu au goluri, altele (Cifrele, Labirinturile), din cauza numrului mic de
itemi care le compun, discrimineaz foarte grosier pe anumite poriuni ale scalei, la anumite vrste.
Subtestul Cuburilor, o foarte valid msurtoare a inteligenei concret-spaiale, compus din 10
59

pattern-uri ce pot da (n forma iniial) 55 de puncte de scor, are un prag nalt de intrare n prob la
vrstele mici (5-6 ani), unde nu distinge fin coeficienii sub 80, i un prag jos la vrste mari (peste
13 ani), unde nu mai distinge supradotaii (QI > 125-130). Combinarea optim a celor dou
caracteristici (dificultatea cu sensibilitatea) se face, pentru bateria WISC, pentru vrstele de 10-12
ani, unde ea are cea mai mare for discriminativ i deci cele mai bune caliti psihometrice
(Zimmerman i Woo-Sam, 1973). n mod similar, testul PM 38 (Matricile Progresive Standard ale
lui Raven) are un prag nalt la 5-7 ani i jos dup 14 ani, deci nu distinge bine insuficiena i
supradotarea mintal la vrstele mici, respectiv mari.
Sensibilitatea testelor depinde de muli factori (care pot fi identificai i prin analiza de itemi),
dintre care amintim:

Numrul itemilor care, aa cum am artat, creeaz posibilitatea stabilirii numrului de clase de
scor, progresiv cu creterea lui. Numrul maxim de clase este chiar numrul de itemi, atunci
cnd ei nu sunt echivaleni sau intercorelai. Dac lum exemplul testelor de inteligen, acestea
ar trebui s msoare QI-uri de la 40 la 160, avnd o lungime a liniei de baz (cea care trebuie s
acopere ntreg spectrul de variaie) de 120 de uniti. Dac subtestul are 40 de itemi, nseamn
c cea mai fin rezoluie ar fi de 3 uniti de QI pentru un item; dac am avea, ca la subtestul
Cifre, 8 itemi n prezentarea direct i 7 n prezentarea invers, nseamn c 120 /(8+7) = 8,
adic fiecare item acoper 8 uniti de QI, ceea ce nseamn o discriminare mult mai grosier,
n care orice eroare de aplicare ar putea avea consecine nsemnate asupra scorului la subtest. Pe
de alt parte, a genera un test cu maxim sensibilitate (un punct de QI s fie dat de cte un item
separat), este aproape imposibil, nu numai din cauza lungimii liniei de baz de 120 de uniti,
dar i din cauza numrului de vrste distincte pe care testul le acoper (de la 5 la 16 ani sunt 12
vrste). Aceasta ar da subteste neobinuit de lungi i de greu aplicabile (nemaniabile). De aceea,
teste de inteligen cu o rezoluie de pn la 5 sunt nc acceptabile, dei cele mai bune valori ar
fi ntre 2 i 3.

Maniera de scorare a probelor este iari o modalitate important de cretere a sensibilitii


testelor. La testele Domino (D 48 i D 70), pentru fiecare problem (alctuit din desenele unor
piese de domino ce solicit stabilirea a dou valori) se acord doar un punct, performana
maxim fiind de 44 de puncte. Imaginnd un alt sistem de scorare, prin care s nu se piard
puncte i acordnd un punct dac un element din csua dubl este corect, nc unul pentru al
doilea, plus un bonus de un punct pentru simultaneitatea lor i orientarea corect pe vertical
(neinversare), se obin 44x3 = 132 de puncte de scor, cu care se baleiaz mult mai bine linia de
baz i vrstele succesive. Similar, la subtestul Cuburilor din bateria WISC, se dau 4 puncte
pentru pattern-ul rezolvat corect i nc maximum 3 drept bonificaie de timp, rezultnd
maximum 7 puncte pe item i 55 de puncte n total. Deoarece rezolvrile parial corecte nu se
60

iau n considerare, rezult c o bun parte din variabilitatea scorurilor se pierde inutil.
mbuntirea sistemului de scorare, prin acordarea unui punct pentru fiecare cub cu o culoare
omogen (rou sau alb), pus n locul potrivit, i nc un punct pentru feele bicolore (rou i alb)
care respect nu numai locul, ci i poziia relativ (nclinarea), ar putea duce la dublarea
ambitusului scorurilor posibile, deci la o for discriminativ dubl. Adugarea a nc doi itemi
(unul foarte uor, pentru intrarea n prob i unul foarte greu, pentru a ridica pragul de ieire din
prob), reconsiderarea timpului de aplicare i al manierei de acordare a bonificaiilor de timp ar
fi nc dou surse de mrire a sensibilitii testului, cu meniunea c toate aceste modificri
reiau de la zero problemele de validitate i de fidelitate ale probei, pentru c, de fapt, ele
nseamn crearea unui test nou, ce trebuie studiat ca atare.

Tipul de norme utilizate n etalonare este a treia caracteristic ce poate contribui la ameliorarea
semnificativ a sensibilitii unui test. Acestea depind de precizia dorit n utilizare. Dac la
normele exprimate n centile se poate determina fiecare punct percentil (caz foarte rar, pentru c
testul ar trebui s fie foarte lung i eantionul foarte extins), sau mcar punctele decile, la care
se mai adaug percentilele 3, 5, 25, 75, 95 i 97, dezavantajul const n inegalitatea unitilor de
msur (mai mici pe poriunea central a benzii i mai lungi spre extreme). n consecin,
rezultatele unei baterii de teste etalonate n centile nu pot fi adunate i integrate, prin medie,
ntr-un scor unic. Cvartilele dau o mprire i mai grosier (4 clase), foarte larg, nepermind
discriminrile de finee. Testele moderne sunt etalonate n note z (standardizate), T, Hull,
stanine, stens etc. Foarte utile sunt i notele T (cu media 50 i abaterea standard de 10) i scalele
de QI (cu media 100 i abaterea standard de 15). Ca o regul vom meniona c, cu ct o scal
are mai puine intervale (3, 5, 7, 9, 10, 11 etc.), cu att mai mult se produce o pierdere de
varian, deci de sensibilitate a scorurilor la test. Dac un test de memoria cuvintelor este
etalonat n stanine i clasa 5, la 10 ani are, s zicem, scorurile 48-52, nseamn c diferena de
performan de 5 puncte dintre subieci este practic anulat: fie c scorul este 48 sau este 52, se
obine aceeai stanin 5, deci sensibilitatea discriminrii are de suferit. Aceasta nu nseamn
ns c scalele cu mai puine intervale nu sunt foarte utile (i utilizate) n practic: multe baterii
au subteste foarte diferite ca putere de discriminare i atunci se alege o scal cu 9-11 trepte
standardizate (stanine i stens), care integreaz bine toate subtestele n baterie. Unii psihologi sau acomodat mai bine cu proprietile matematice ale unei scale i o prefer n virtutea
obinuinei. Esenialmente acordajul dintre scorurile la test i gradul de extensie al scalei
utilizate trebuie s ne conduc la alegerea de scale foarte discriminative cnd testul are mai
muli itemi (peste 40-50) eterogeni, nu din punctul de vedere al coninutului sau al performanei
msurate, ci al gradului de dificultate. Testele ce acoper multe vrste, difereniate ntre ele prin
performane ce au ambitusul liniei de baz mare (ntre 40 i 160 la testele de inteligen, sau
61

chiar mai mari) au nevoie de scale discriminative, celelalte putnd opera, pentru scopuri
practice i de cercetare cu scale mai puin extinse, chiar dac aceasta nseamn scderea puterii
discriminative a testului. Pentru testele sale, Wechsler a optat pentru scale standardizate de 19
trepte.
Cum dificultatea i sensibilitatea unui test depind de mrimea i caracteristicile lotului
particular de subieci la care aplicm testul, nseamn c obligatoriu trebuie s determinm valorile
tendinei centrale pentru a vedea gradul de suprapunere al acestuia cu lotul de eantionare indicat de
manualul testului. Cnd media grupului nostru este semnificativ diferit de cea a populaiei de
etalonare din manual, nseamn c testul este prea uor sau prea greu n raport cu aceasta i
concluziile trase, aplicnd etalonul standard, pot fi greite. Dac abaterea standard indic o valoare
mult diferit (mai mic sau mai mare), dect cea a lotului de etalonare, nseamn c lotul nostru este
fie prea omogen, fie prea eterogen n raport cu acesta. n prima situaie fora de discriminare a
testului descrete, n a doua ea crete, dar n ambele trebuie avut n vedere un alt etalon, mai
adecvat.
,,Trebuie observat c nici un test nu poate fi att de sensibil nct totdeauna, dou persoane
deosebite n privina variabilei msurate de test s obin scoruri diferite, afirm Monica Albu
(1998, p. 189). Aceasta pentru c, n timp ce trsturile psihice sunt variabile continue, scorurile la
test sunt variabile discontinue (discrete) i de aceea o coresponden biunivoc ntre variabil i
scorul la test este un fapt imposibil de realizat practic. Scorul fiind afectat de diverse erori (generate
de testul nsui, de subiect sau de situaia de examinare), este posibil ca aceeai variabil, msurat
la acelai individ, s aib mai multe valori de scor. ntruct performana la un test se raporteaz la
un numr de intervale mai mic dect numrul valorilor de scor pe care el le poate nregistra,
nseamn c indivizii plasai pe acelai interval de scor nu sunt discriminai. Deci un test va fi cu
att mai discriminativ cu ct va separa mai bine indivizii care au valori ale variabilei msurate de
test plasate n acea zon a axei sale n care exist un numr suficient de intervale de lungimi
mici(Albu, op. cit., p.190).
Dup Susana Urbina(2004) exist anumite situaii cnd nu este recomandabil utilizarea
testelor. Sunt multe motive i situaii n care utilizarea unui test psihologic nu este recomandabil,
lista care urmeaz prezint pe cele mai relevante dintre ele. Cu cteva excepii, testele psihologice
nu ar trebui utilizate de fiecare dat cnd una dintre circumstanele urmtoare apar:
1. Scopul testrii este necunoscut sau neclar pentru utilizator.
2. Utilizatorul nu este complet familiarizat cu toat documentaia testului si pregtit practic
n procedurile legate de test.
3. Utilizatorul nu cunoaste unde vor ajunge rezultatele testului, sau cum vor fi utilizate, sau
nu poate proteja folosirea lor.
62

4. Informaia care poate fi obinut prin testare este deja valabil, sau poate fi obinut mai
eficient prin intermediul altor surse.
5. Subiectul testrii nu este doritor sau capabil s coopereze pentru testare.
6. Subiectul testrii poate experimenta consecine neplcute datorit procesului de testare
n sine.
7. Condiiile de testare sunt inadecvate.
8. Materialele testului si formatul acestuia sunt nepotrivite pentru vrsta, sexul,
backgroundul
cultural sau lingvistic, disabilitilor, sau oricror alte condiii care pot invalida informaiile
oferite de test.
9. Normele testului sunt depite ca timp, inadecvate, sau inaplicabiel pentru subiect.
10. Documentaia asupra fidelitii i validitii scorurilor testului este inadecvat.

63

Capitolul V
METODOLOGIA CONSTRUIRII TESTELOR PSIHOLOGICE

Algoritmul general n construirea unui test sau chestionar psihologic este (Albu, 1998):

I Definirea testului
II Crearea bncii de itemi

III Construirea unei prime variante a testului


IV Administrarea testului unui eantion

V Analiza de itemi

Testul este corespunzator ?


Nu

I.

Da

Corectarea / Reformularea itemilor


VI. Verificarea suplimentar i
analiza caracteristicilor psihometrice
Testul este corespunzator?

Nu

Da

VII. Depistarea erorilor /


Reformularea itemilor
VII Elaborarea normelor i
redactarea manualelor

64

I.

Definirea testului

Exist o multitudine de teorii plauzibile, iar atunci cnd se opteaz pentru o teorie care st
la baza unui test, analiza acestor teorii aflate n competiie, este ntotdeauna foarte dificil. Este
de preferat ns s se aleag o teorie care a fost validat experimental. Aceasta deoarece procesul
de validare al unui test ncepe de la nivelul constructelor teoretice derivate din aceasta teorie.
Atunci cnd conceptualizam un test, trebuie s tim de la bun nceput ce dorim s msoare
testul, n ce scop va fi utilizat testul, de ce este nevoie de construcia acestui test, cine va utiliza
testul i care este populaia care va fi evaluat cu testul respectiv, ce tipuri de scale vom folosi,
cum vor fi ordonai itemii (dup gradul de dificultate sau aleator), ce lungime va avea testul i
cum va fi aplicat testul (cu sau far limit de timp).
Referitor la tipurile de scale, cele mai utilizate n psihologie sunt scalele ordinale i de
interval. ntre acestea se difereniaza scalele de tip Likert sau Guttman.
II.Crearea bncii de itemi
Se recomand ca numrul itemilor propui iniial s fie cu cel putin 20% mai mare dect
lungimea testului (Aiken, 1994, apud.Albu, 1998) dar pentru c itemii buni nu pot fi generai cu
atta uurin, este bine s se porneasc de la un numr mult mai mare de itemi (nc o dat
lungimea testului).
n majoritatea cazurilor itemii sunt propui de psihologi pornind de la constructele definite.
De asemenea ei mai pot fi preluai din testele existente sau pot fi formulai de specialiti din
domeniul n care va fi aplicat testul (de exemplu n cazul testelor de cunotinte sau pentru
domenii profesionale unde sunt necesare aptitudini speciale).
Dup ce itemii sunt aranjai ntr-o anumit ordine, se redacteaz instruciunile de
administrare care trebuie s fie clare i concise.
Autorul testului va utiliza grafica cea mai potrivit astfel nct rezolvarea testului sau a
chestionarului s nu ridice probleme din acest punct de vedere.

III.Construirea unei prime variante a testului


Autorul testului selecteaz din banca de itemi un numr de itemi care formeaz un test cu o
lungime egal cu cea dorit n forma final.
IV.Administrarea testului unui eantion
Se stabilesc condiiile de administrare (instruciuni, timp de rspuns) care se vor respecta i
dup punerea testului n circulaie (vor deveni standardizate).
65

n aceast etap, o atenie deosebit trebuie acordat eantionrii pentru c testul se va


adresa unei populaii ale crei caracteristici influeneaz sau determin rezultatele la test.
Eantionul trebuie s fie reprezentativ i suficient de mare pentru a controla ct mai mult
influena erorilor de eantionare.

V.Analiza de itemi
Pentru fiecare item n parte se calculeaz:
-

indicele de dificultate

indicele de discriminare

analiza rspunsurilor incorecte


Analiza dificultii unui item
Indicele de dificultate a unui item indic procentul subiecilor care au rspuns corect la

itemul n chestiune. Aceast definiie, care la nceput pare uor de neles, n practic se
complic n mod considerabil, dat fiind faptul c luarea unei decizii cu privire la grupul de
subieci de care se ine cont n momentul aflrii procentului se poate dovedi dificil. La
numrtor se pot lua n considerare numai subiecii care au rspuns corect la item, adic cei care
au ales opiunea numit cheie sau, dimpotriv, se poate ine cont i de cei care au comis
greeli, adic cei care au ales unul dintre elementele derutante. Numitorul comun poate face
referire la toi subiecii care au rspuns la test, fr a ine seama de ce au rspuns la itemul n
cauz sau se pot exclude din acest total de subieci aceia care au omis itemul i/sau care nu
au ajuns la item. Un item este considerat omis atunci cnd un subiect l-a lsat gol, ns a
rspuns la altele care sunt situate mai jos de el, n cadrul testului. Pe de alt parte, se consider
c nu s-a ajuns la un item atunci cnd un subiect l-a lsat gol i nu a rspuns la nici un alt item
aflat mai jos de acesta; ca urmare, se poate spune c subiecii evaluai care nu au rspuns la
itemurile la care nu au ajuns, nici mcar nu au ncercat s o fac.
Combinnd toate posibilitile comentate, diferitele formule care se utilizeaz pentru a afla
indicele de dificultate ar fi urmtoarele:
a. Procentul de rspunsuri corecte din totalul de subieci care particip la test:

n
100,
N

unde n este numrul de rspunsuri corecte, iar N este numrul de subieci.


b. Procentul de rspunsuri corecte excluznd subiecii care au omis itemul, adic pe cei
care nu au rspuns la el, ns au rspuns la altele situate mai jos de acesta:
66

n
100,
N O

unde O se refer la grupul de subieci care au omis testul.


c. Procentul de rspunsuri corecte excluznd subiecii care nu au ajuns la item, adic pe cei
care nu au rspuns la el i nu au rspuns nici la altele situate mai jos de acesta:

n
100,
N NA

unde NA este numrul de subieci care nu au ajuns la item.


d. Procentul de rspunsuri corecte, excluznd subiecii care au omis itemul i pe cei care
nu au ajuns la el:

n
100
N O NA

e. Procentul de rspunsuri corecte penaliznd greelile:

E
K 1 100,
N

unde A indic numrul de rspunsuri corecte, E numrul de greeli, K numrul de opiuni ale
itemului i N numrul de subieci.
f. Procentul de rspunsuri corecte penaliznd greelile i excluznd subiecii care au
omis itemul:

E
K 1 100
N O

g. Procentul de rspunsuri corecte penaliznd greelile i excluznd subiecii care nu au


ajuns la item:

E
K 1 100
P
N NA
A

h. Procentul de rspunsuri corecte penaliznd greelile i excluznd subiecii care au omis


itemul i pe cei care nu au ajuns la el:

67

E
K 1 100
P
N O NA
A

Referitor la valorile pe care trebuie s le aib indicii de dificultate ai itemilor care se


utilizeaz trebuie s spunem c, n principiu, din punct de vedere psihometric se recomand ca
acestea s fie n jur de 0.50, deoarece astfel variaia va fi mai mare. Atunci cnd punctajele sunt
binare (1,0), variaia este egal cu produsul dintre p i q (S2 = pq), p fiind procentul de cazuri
favorabile, rspunsuri corecte, iar q fiind egal cu 1 minus p (1-p); n ceea ce privete procentele:
Q = 100-P. Cea mai mare valoare pq se obine atunci cnd p este egal cu q (p=q), ceea ce se
ntmpl numai atunci cnd valoarea lui p i q este egal cu 0,50 (exprimat n proporii) sau 50
(exprimat n procente). Dac variaia este mai mare, coeficientul de fidelitate a testului va fi mai
mare, deoarece acest coeficient de fidelitate este corelaia testului cu el nsui. n principiu, dac
variaia este mai mare, i corelaia va fi mai mare. Pe de alt parte, o variaie mic indic faptul
c punctajele tuturor subiecilor se situeaz ntr-un mod foarte grupat fa de trstura evaluat.
Toi obin rezultate similare i, n consecin, va fi foarte dificil ca puterea de discriminare a
itemului sau a testului n chestiune s fie ridicat. O variaie mare nu garanteaz o putere de
discriminare ridicat, ns este foarte greu ca un item s aib capacitatea de a discrimina ntre
subieci care au o posesie redus sau ridicat a trsturii evaluate dac variabilitatea punctajelor
tuturor subiecilor este mic. Pe scurt, o variaie mare garanteaz un coeficient de fidelitate
ridicat i un indice de discriminare ridicat, ntr-o msur mai mare dect o variaie redus.
Totui, din motive de tip funcional poate fi interesant ca toi indicii de dificultate s fie
superiori sau inferiori valorii de 0.50. De exemplu, n anumite circumstane va fi mai bine s se
nceap testul cu itemi uori pentru ca subiectul s ctige ncredere i s poat avea un anumit
randament la proba respectiv n funcie de nivelul personal al trsturii evaluate. Astfel, la un
moment dat ar fi interesant s se fac discriminri ntre subieci cu un nivel sczut sau cu un
nivel ridicat al unei anumite trsturi, caz n care ar trebui s se utilizeze itemi uori sau itemi
dificili, cu o mare putere de discriminare la aceste niveluri. Ca urmare, se poate afirma c, dei
din punct de vedere statistic este de dorit ca toti itemii s aib un indice de dificultate apropiat de
50%, din punct de vedere funcional poate fi recomandabil s existe un anumit numr de itemi
uori i/sau un anumit numr de itemi dificili. Majoritatea manualelor recomand urmtoarea
distribuire n momentul aplicrii unei probe de randament sau de aptitudini la un numr
reprezentativ de persoane normale: 25% itemi uori, 25% itemi dificili i 50% itemi de
dificultate medie. Prin item uor se nelege acel item la care rspunde corect peste 75% din
populaie. Un item dificil ar fi acela la care rspunde corect cel puin 25% din populaie.

68

Cu ct indicele de dificultate al itemului este mai mare, cu att itemul este mai uor.
Valorile recomandate pentru indicele de dificultate sunt cuprinse n intervalul [0.25;0.75].
(Alvaro, 1993)
Atunci cnd se calculeaz indicele de dificultate al unui item, se ia n calcul i posibilitatea
ca subiectul s ghiceasca rspunsul. Mai nti se calculeaz indicele optim de dificultate i se
compar cu indicele de dificultate obinut la itemul n cauz. Se calculeaz mai nti rata de
rspuns la ntmplare mprind valoarea 1 la numrul de variante de rspuns pe care le are
itemul n cauz.
n cazul unui item cu 2 variante de rspuns, rata de rspuns la ntmplare este de 0.50 (1/2)
iar n cazul unui item cu cinci variante de rspuns, rata de rspuns la ntmplare este de 0.20
(1/5).
Indicele optim de dificultate se afl la mijlocul distanei dintre 1 i rata de rspuns la
ntmplare, deci n cazul itemului cu dou variante de rspuns este egal cu 0.75 (
cazul itemului cu cinci variante de rspuns este 0.60 (

1+0.2
2

1+0.5
2

) iar n

).

Rspunsul la ntrebarea ct de dificili trebuie s fie itemii unui test? depinde, pe de o parte,
de utilizarea testului, pe de alt parte de tipurile de rspunsuri sau de lungimea scalei. Aa cum am
mai artat i anterior, un test n care itemii se scoreaz adevrat - fals sau 0 - 1, d o probabilitate de
50% ca rspunsul s se dea prin ans (aleator), iar cnd variantele de rspuns sunt 4, aceast
probabilitate este de 25%. Deci probabilitatea p i , care descrie dificultatea unui item, se plaseaz
ntre 0 i 1 (nici un subiect, respectiv toi subiecii l rezolv).
Alegerea dificultii optime a unui test trebuie s rezolve aceast problem complicat: cu ct
itemii au mai puine variante de rspuns, cu att mai mare este probabilitatea de a nimeri prin ans
rspunsul corect, ceea ce oblig la creterea dificultii optime la un nivel foarte ridicat, de 0,75.
Aceasta coboar progresiv cu mrirea numrului de variante de rspuns spre 0,50, dar cu ct
acestea sunt mai multe, timpul de analiz pentru fiecare item crete (sunt mai multe variante de luat
n considerare) ceea ce oblig la reducerea din numrul de itemi. Aceast reducere afecteaz
simultan fidelitatea i validitatea testului n ansamblul su, ajungnd astfel la alternativa variante
mai multe de rspuns sau itemi mai muli. Dilema se rezolv alegnd ntre 4 i 8 variante de
rspuns, aceasta fiind o zon de echilibru ntre cele dou extreme.
n rezumat, precizm nc o dat c pentru majoritatea testelor nu este deloc indicat s avem
itemi de dificultate egal (eventual cu dificultatea optim), pentru c urmrim s avem itemi pentru
o varietate a nivelurilor de dificultate, astfel nct testul s aib o bun putere discriminativ n
ansamblul su. Pentru cele mai multe dintre teste itemii au o dificultate ce acoper spectrul de la
0,20 la 0,80, pentru a maximiza astfel diferenele dintre subieci. n funcie de scopul testrii, pot fi
concentrai itemi preponderent dificili (sub 0,20), ca n cazul seleciei unor candidai pentru o
69

facultate, post sau meserie foarte pretenioas sau itemi foarte uori (selecie indulgent). Pe de alt
parte, cunoaterea dificultii itemilor este fundamental n aranjarea lor n test ntr-o ordine
ierarhic. Itemii foarte uori de la nceputul testului ajut persoana s neleag ce se cere de la ea
i, chiar dac ei nu au valoare psihometric probat, ajut la ridicarea moralului, inspirnd
ncrederea n resursele proprii. Itemii foarte dificili sunt destinai extremei drepte a scalei, deci
supradotailor sau celor de vrste mari, avnd utilitate pentru un numr mai mic de cazuri, ce apar
doar pe eantioane extinse ca volum.
Analiza capacitii de discriminare a unui item
Indicele de discriminare al unui item se refer la capacitatea sa de a distinge ntre subiecii
care posed trstura evaluat de test n proporie ridicat i cei care o posed n proporie
redus. Astfel, ntr-un item cu o mare putere de discriminare, subiecii care posed n mare
msur trstura evaluat vor avea n mod sistematic punctaje mai mari dect cei care posed
aceast trstur ntr-o msur mai mic.
Procedura tradiional pentru stabilirea puterii de discriminare a unui item s-a bazat pe
diferenele dintre procentele de rspunsuri corecte din grupul mai bun i procentul de rspunsuri
corecte din grupul mai slab, din ntreg testul. Dup Kelley (apud.Stan A., 2002), grupul
puternic este alctuit din subiecii care au un scor total care-i plaseaz valoric n primii 27%
dintre subieci, iar grupul slab din subiecii care au cele mai slabe 27% scoruri din ansamblul
rezultatelor la test.
Ca exemplu, s presupunem c un test de cunotine a fost aplicat unui numr de 170 de
elevi. Mai nti se ordoneaz scorurile totale la test de la cel mai mare la cel mai mic.
Se calculeaz apoi ct reprezint primele 27% cele mai mari scoruri i ultimele 27% cele
mai mici scoruri. Cele dou valori trebuie s fie aproximativ apropiate. Ele sunt egale dac n
practic dou persoane nu obin acelai scor.
S presupunem c n cazul nostru n = 46(

170X27
100

).

S lum n calcul un item la care din primii 46 de subieci cu cele mai bune scoruri la
test, 36 au rspuns corect la item, iar din cei 46 de subieci cu cele mai mici scoruri la test. 12 au
rspuns corect.
Si
n
S = numrul de rspunsuri corecte n grupa bun
d=

i = numrul de rspunsuri corecte n grupa slab


n = numrul de scoruri n grupa bun egal cu numrul de scoruri n grupa slab

70

d1 =

3612
46

= 0.52

Ebel (Stan, 2002) a propus o scal pentru interpretarea indicelui de discriminare d:


>0.40 discriminare foarte bun
[0.30 ; 0.39] discriminare bun
[0.20 ; 0.29] discriminare slab
[0.10 ; 0.19] discriminare de limit
<0.10 fr utilitate
n prezent, indicii de discriminare cei mai utilizai sunt coeficienii de corelaie biserial i
punct-biserial, depinznd dac itemii se dihotomizeaz a posteriori sau au fost evaluai direct n
mod dihotomic. Corelaia biserial se utilizeaz cu itemi dihotomizai dup ce au fost evaluai
cu scale de interval sau ordinale. De exemplu, aceasta se ntmpl atunci cnd un profesor a
corectat o ntrebare cu punctaje de la 0 la 10 i o dat ce a notat rspunsurile tuturor elevilor la
aceast ntrebare decide s-i puncteze pe cei care se afl sub 5 cu 0, iar pe cei care se afl mai
sus de 5, cu 1. Corelaia biserial este considerat de asemenea un indice de omogenitate,
deoarece evalueaz corelaia dintre item i grupul de itemi care alctuiesc testul, presupunnd c
punctajele fiecrui item oscileaz ntr-un continuu care merge de la 0 la 1. Formula corelaiei
biseriale este urmtoarea:

rb

X pi X qi pi qi

, care echivaleaz cu:


St
y
rb

X pi X t pi
, unde
St
y

X pi este n cadrul testului media subiecilor care rspund corect la itemul i, X qi este n cadrul
testului media subiecilor care nu rspund corect la itemul i, S t este variaia punctajelor obinute
n test, pi este proporia de subieci care rspund corect la itemul i, qi este proporia de subieci
care nu rspund corect la itemul i (qi=1-pi), iar valoarea ordonatei care separ ntr-o distribuire
normal proporia subiecilor care rspund corect la itemul i (pi) de proporia celor care nu
rspund corect (qi) i X t este media testului, lund n considerare toi subiecii participani la
test.
Atunci cnd itemii au fost evaluai direct n mod dihotomic, adic sunt dihotomici n loc s
fie dihotomizai, se utilizeaz coeficientul de corelaie punct-biserial.

rbp

X pi X qi
pi qi , sau:
St
71

rbp

X pi X t pi

St
qi

n legtur cu valoarea de discriminare a unui item care este preferabil s se ating, ar


trebui s ne gndim, n principiu, c idealul este s fie ct mai mare; cu ct se apropie mai mult
de 1, care este valoarea maxim a unei corelaii, cu att mai bine, deoarece aceasta ar indica
faptul c itemul are o mare capacitate de discriminare ntre subiecii buni i cei slabi, n ceea ce
privete trstura evaluat. Cu toate acestea, innd cont de faptul c i coeficienii de corelaie
biseriali i biseriali punctuali pot fi considerai un indice de omogenitate i de faptul c dac toi
itemii au o corelaie foarte ridicat cu testul (format din totalitatea tuturor itemilor) se indic
faptul c toi itemii evalueaz acelai lucru, ceea ce ar fi n detrimentul validitii de coninut.
Este recomandabil ca indicii de discriminare obinui cu aceste corelaii s aib valori apropiate
de 0,50; un item cu un indice mai mic de 0,25 trebuie eliminat.

Curbele caracteristice itemilor sau teoria rspunsului la itemi


O reprezentare grafic a dificultii itemilor i a gradului n care discrimineaz poate fi
fcut printr-o curb caracteristic itemului (CCI). Aa cum se observ n figur, o astfel de
curb este un grafic n care aptitudinea msurat este reprezentat pe axa orizontal, n timp ce
probabilitatea rspunsului corect e reprezentat pe axa vertical. De remarcat este faptul c
msura n care un item discrimineaz ntre subiecii cu scoruri mari i cei cu scoruri mici este
dat de nclinaia curbei. Cu ct mai abrupt nclinaia, cu att mai mult discrimineaz itemul
respectiv. De asemenea, dac nclinaia este pozitiv, atunci mai muli subieci cu scoruri mari
rspund corect dect subieci cu scoruri mici, iar reciproca este i ea valabil. Itemul (a) nu poate
fi considerat un item bun; probabilitatea unui subiect de a rspunde corect - rspuns corect
nseamn ceea ce e stabilit de cel ce a construit testul - este mare pentru subieci cu aptitudini
sczute i mic pentru subiecii cu aptitudini crescute. Itemul (b) nu este nici el un item bun
deoarece curba ne spune c subiecii cu aptitudini moderate vor avea cea mai mare probabilitate
de a rspunde corect; subiecii cu aptitudini crescute, respectiv sczute vor avea probabilitate
mai mic de a rspunde corect. Itemul (c) este un item bun; observm c probabilitatea de a
rspunde corect crete odat cu aptitudinea subiectului. Ce putem zice despre itemul (d)? Curba
caracteristic itemului discrimineaz pentru un singur punct al continuumului aptitudinii,
probabilitatea de a rspunde corect este foarte mare pentru toi subiecii care se situeaz
deasupra acestui punct de pe axa aptitudinii. Un item ca (d) este foarte bun pentru un test, de
exemplu, pentru a selecta candidaii n funcie de un scor critic. Totui acest item nu e foarte bun

72

pentru a ne oferi informaii despre aptitudinile subiectului, la toate nivelurile acestei aptitudini cum ar putea fi cazul unui diagnostic sau test de aptitudini matematice.

Analiza rspunsurilor incorecte se face n cazul itemilor cu alegeri multiple pentru a


verifica dac distractorii (rspunsurile greite) i ndeplinesc rolul.
Dup Murphy i Davidshofer (1987), pentru fiecare distractor se calculeaz frecvena
observat (f0) i frecvena teoretic (ft) (toate rspunsurile greite ale unui item au aceiai
frecvent teoretic).
foi =

si ft = ( 1)

N = numrul de subieci care au rspuns la item (corect sau greit)


Nc = numrul de subieci care au rspuns corect
Ni = numrul de subieci care au ales distractorii
ntrebarea este bine construit dac pentru fiecare rspuns greit, frecvena observat este
aproximativ egal cu frecvena teoretic.
73

Variantele greite pe care le aleg foarte puine persoane trebuiesc nlocuite deoarece sunt
prea uor identificate ca fiind greite iar cele greite care sunt alese de prea multe persoane
impun verificarea formulrii itemului i a variantelor de rspuns deoarece pot conine o
formulare incorect.
Dup analiza de itemi se elimin itemii necorespunztori, se reformuleaz unii itemi, se
introduc itemi noi din banca de itemi (dac este cazul) i eventual se reia algoritmul de la
aplicarea primei variante.
VI.Verificarea suplimentar a testului i analiza caracteristicilor psihometrice
Dac testul are itemi corespunztori de la prima ncercare (ceea ce rareori este posibil), se
trece la verificarea suplimentar a testului, cu alte cuvinte se aplic testul ntr-un eantion nou de
subieci.
Se verific parametrii psihometrici ai unui item prin mai multe metode:
se calculeaz coeficienii de corelaie ai fiecrui item cu scorul total al testului i se

elimin itemii cu corelaie scazut;


se calculeaz indicele de discriminare pe baza metodei grupelor contrastante formate n

funcie de scorurile grupului la test;


se grupeaz itemii pe baza analizei de clusteri i se rein itemii unei clase omogene, care

se refer la constructul msurat de test;


se coreleaz itemii cu diversele variabile care au legtur (sau nu) cu constructul, pe baza

teoriei de la care s-a pornit n elaborarea testului.


Se verific apoi calitile psihometrice calculndu-se coeficienii de validitate i de
fidelitate. Dac acetia nu sunt acceptabili, se caut erorile i se reface testul.
VII.Elaborarea normelor i redactarea manualelor
n domeniul psihometriei, termenul de ,,norm se folosete n strns legtur cu cel de
etalon.
Etalonarea, sinonim cu normarea, nseamn ,,stabilirea, ntr-o prob psihologic, a unei
scale care permite a situa rezultatul obinut de un subiect prin raportare la rezultatele care au fost
obinute anterior ntr-o populaie de referin, suficient de numeroas i omogen de subieci
comparabili aceluia care a fost examinat. (Grand dictionnaire de la psychologie, 1992; apud
Stan, A., 2002)

74

Capitolul VI
ETALONAREA UNEI PROBE PSIHOLOGICE
1. Definirea termenilor
Conform DEX (1984), etalonul este o mrime acceptat oficial n tiin, [...] i care
servete ca unitate de baz ntr-un sistem de msurare. Este un model perfect al unei msuri tip,
confecionat cu mare precizie i acceptat oficial a servi ca baz de comparaie.
n psihologie, n urma aplicrii unui test se obin scoruri brute care nu spun nimic luate
separat. De exemplu, la un test de atenie distributiv, o cot brut egal cu 40 nu spune nimic
despre performana subiectului.
Etalonul (tabelul de norme) reprezint o convenien ntre utilizatorii de msuri i este deci
un cadru de referin. Etalonul este nivelul mediu al rezultatelor obinute de un grup de referin
(eantion reprezentativ).
Raportarea la etalon const n determinarea locului ocupat de rezultatele unui subiect fa
de rezultatele unei populaii de referin, suficient de numeroas, comparabil cu persoana
examinat.
Etalonarea este procesul prin care se ajunge la stabilirea cadrului de referin, a tabelului
de norme.
2. Eantionarea
Eantionarea reprezint selectarea unui grup reprezentativ de subieci din populaia creia
i este adresat testul pentru care urmeaz s se construiasc etalonul.
Eantionul trebuie s ndeplineasc dou condiii:
1. S fie suficient de mare
2. S fie reprezentativ, adic s fac posibil tragerea acelorai concluzii din analiza
grupului ca i din analiza populaiei, admind un risc tolerabil de eroare.
n psihologie, aceste dou condiii se ndeplinesc uneori cu greutate datorit posibilitilor
de selectare pe care psihologul le are la ndemn ( de cele mai multe ori prin intermediul unor
instituii - coal, spital, laborator psihologic, etc.), iar aceast situaie introduce de la nceput
distorsiuni.
Se practic tot mai mult testrile pltite pentru c n acest fel psihologul cercettor are o
deschidere mai mare din partea subiecilor care particip pe baz de voluntariat i care sunt mai
motivai s rspund cu interes la itemii testului.
Un aspect direct legat de volumul eantionului permite ca normele unui test s fie
considerate norme locale sau norme naionale.
75

Normele locale sunt foarte specifice. Ele sunt obinute doar la nivelul unui ora de
exemplu, n general din raiuni de ordin economic.
Normele naionale sunt obinute pe un numr foarte mare de subieci care acoper regional
toat suprafaa unei ri. Firmele specializate n construirea i comercializarea testelor
psihologice elaboreaz norme naionale.
Sunt prezentate mai frecvent patru tehnici de eantionare i anume: prin selecie aleatoare
simpl, prin selecie stratificat, eantionare multistadial si eantionare multifazic.
Eantionarea prin selecie aleatoare simpl se mai numete i metoda loteriei sau a
tragerii la sori.
Fiecare individ din populaie primete un numr iar apoi numerele sunt trase la sori (de
exemplu printr-un program de statistic) pn se obine un eantion de o mrime stabilit n
prealabil.
n eantionarea stratificat, populaia este mprit n clase, dup unul sau mai multe
criterii. Variabilele dup care se face mprirea trebuie s coreleze semnificativ cu scorurile
testului. Cel mai frecvent utilizate variabile sunt sexul, vrsta, nivelul educaional, clasa social,
mediul de provenien, rasa, etc.
Dup ce se face clasificarea populaiei n funcie de variabila aleas, fiecare clas din
populaie trebuie s fie reprezentat n eantion, proporional cu frecvena ei relativ.
De exemplu, se consider c la un chestionar de atitudini fa de coal rezultatele sunt
influenate de nivelul educaional i de mediul de provenien.
Variabila nivel educaional are trei modaliti:ciclul primar, ciclul gimnazial si ciclul
liceal, iar variabila mediu de provenien are dou modaliti:urban i rural.
Chestionarul se adreseaz elevilor colilor din judeul Bihor (deci eantionarea se face
pentru elaborarea unor norme locale). S considerm fictiv c populaia creia i se adreseaz
testul este format din 200.000 de persoane, repartizat n funcie de nivelul educaional i de
mediul de provenien conform tabelului:

Clasa

Frecvena

Frecvena relativ

Urban

45.000

0.15

Ciclu primar

Rural

21.000

0.07

Gimnaziu

Urban

73.000

0.24

Nivel de

Mediu de

colarizare

provenien

C1

Ciclu primar

C2
C3

76

C4

Gimnaziu

Rural

29.000

0.10

C5

Liceu

Urban

94.000

0.31

C6

Liceu

Rural

38.000

0.13

Kline (1993) (apud Albu, 1998) precizeaz c volumul eantionului se stabilete astfel
nct n fiecare clas s se extrag cel puin 300 de persoane. Se deduce de aici c numrul de
variabile ales n eantionarea stratificat nu trebuie s fie foarte mare pentru c altfel va fi
necesar selectarea unui eantion foarte numeros.
n exemplul dat, s considerm c ar fi suficient un eantion cu un volum minim
recomandat (1800 de persoane). Frecvena relativ din populaie se respect i n eantion, iar
numrul de subieci cuprini n fiecare clas din eantion se regsete n tabelul urmtor:

Clasa

Frecvena relativ

Frecvena

C1

0.15

270

C2

0.07

126

C3

0.24

432

C4

0.10

180

C5

0.31

558

C6

0.13

234

1.00

1800

Eantionarea multistadial se realizeaz prin selecia indirect a indivizilor care formeaz


eantionul prin intermediul seleciei grupurilor la care acetia aparin, iar n eantionarea
multifazic se alege iniial un eantion de dimensiuni mari pe care se realizeaz unele faze ale
cercetrii extensive, apoi , din acesta se selecteaz un eantion pentru realizarea altor faze cu
caracter mai intensiv.
Deoarece pe baza scorurilor eantionului estimm parametrii populaiei i avnd n vedere
c erorile de eantionare sunt inevitabile, trebuie calculat eroarea de estimare a parametrilor.
Ceea ce intereseaz de fapt este s calculm un interval de ncredere n jurul mediei eantionului
pentru a putea estima cu o anumit exactitate valoarea mediei populaiei.
77

Eroarea standard a mediei SM este dat de formula:

SM =
unde:

s2
N

s2 = variaia scorurilor eantionului


N = mrimea populaiei

Se decide apoi nivelul de precizie cu care vrem s lucrm, de 1.96 sau de 2.58 .
3. Metode de obinere a normelor unui test psihologic
Normele testului descriu performana realizat de indivizii din eantion i sunt de fapt
valori ale unei caracteristici n repartiia scorurilor, adic valori ale frecvenei mediei, medianei
sau rangului scorurilor.
Prin etalonare se fac de fapt transformri ale scorurilor brute, transformri care permit
compararea a dou persoane diferite, testate cu acelai test sau a aceleiai persoane, testat cu
teste diferite.
Cele mai utilizate transformri (care definesc i metodele de obinere a normelor unui test )
sunt:

Transformri n clase echivalente

Transformri n vrste echivalente

Transformri n norme de vrst mintal

Transformri n cote standard i cote standardizate

Transformri n ranguri centile, decile i cuartile

Transformri n clasele scalei normalizate

Transformri n clase echivalente


Clasele echivalente se refer la clasele din diverse niveluri colare. Tabelele de clase
echivalente conin pentru fiecare clas i lun de coal mediana cotelor brute la test.
n continuare, este redat un astfel de tabel pentru un test de aritmetic (dup Albu, 1998),
destinat elevilor din clasa a II-a, a III-a i a IV-a, cotele brute avnd valori ntre 0 i 100, iar
pentru cele dou luni de vacan se consider cotele nemodificate:

78

Clasa

Cota brut

Clasa

Cota brut

Clasa

Cota brut

2.0

15

3.0

25

4.0

55

2.1

15

3.1

27

4.1

58

2.2

16

3.2

28

4.2

62

2.3

17

3.3

30

4.3

64

2.4

17

3.4

32

4.4

66

2.5

18

3.5

36

4.5

67

2.6

19

3.6

39

4.6

68

2.7

20

3.7

44

4.7

69

2.8

22

3.8

47

4.8

69

2.9

23

3.9

51

4.9

70

Partea ntreag reprezint clasa, iar partea zecimal reprezint luna de coal. Interpretarea
este foarte simpl. Dac un copil, n prima lun din clasa a IV-a a obinut la testul de aritmetic
o cot brut egal cu 27, are clasa echivalent 3.1, deci este rmas n urm la aritmetic cu
aproape un an.

Transformri n vrste echivalente


Transformrile n vrste echivalente urmeaz acelai principiu ca i transformrile n clase
echivalente. La baza lor st principiul c pn la o vrst (colar sau cronologic), dezvoltarea
este o variabil continu. Aceste tipuri de transformri sunt potrivite doar pentru testele care se
adreseaz copiilor de nivel colar elementar.
Cotele transformate n niveluri de vrst indic pentru fiecare vrst cronologic exprimat
n ani i luni, mediana sau media cotelor brute la test.
Un exemplu de test n care se folosesc pentru construirea etaloanelor transformrile n
vrste echivalente, este proba Frostig pentru evaluarea dezvoltrii funciei perceptiv-motrice la
copiii de 4-11 ani.

79

Un dezavantaj al transformrilor n clase echivalente sau vrste echivalente este dat de


faptul la aceleai distane ntre clase corespund distane diferite ntre cotele brute ale testului,
deci aprecierile calitative cu privire la performanele subiecilor nu au aceeai semnificaie
pentru doi subieci care au obinut acelai scor, dar la vrste diferite.

Transformri n norme de vrst mintal


Conceptul de vrst mintal introdus prin intermediul scalelor Binet-Simon, reprezint
nivelul de vrst pentru care toate rspunsurile specifice sunt corecte. Vrsta mintal este vrsta
corespunztoare performanelor realizate de ctre copiii normali la anumite solicitri de natur
intelectual. Este determinat prin nivelul probelor reuite de un copil (Stan, 2002).
Un copil de 7 ani care a reuit s rezolve toi itemii pentru vrsta de 7 ani i nc 5 pentru
un nivel superior, va avea o vrst mintal avansat n funcie de reuita suplimentar. Dar, la fel
ca i n cazul transformrilor n clase echivalente sau n vrste echivalente, rezultatele subiecilor
(fie c sunt n avans, fie c sunt n ntrziere), nu au aceeai semnificaie la vrste diferite ( un an
de ntrziere la vrsta cronologic de 4 ani nu are aceeai semnificaie ca i un an de ntrziere la
vrsta cronologic de 11 ani). Explicaia se datoreaz faptului c dezvoltarea intelectual este
foarte rapid la vrstele mici dar i ncetinete ritmul o dat cu naintarea n vrst. Un an de
ntrziere n vrsta mintal la vrsta cronologic de 3-4 ani nseamn tot att de mult ca o
diferen de 3 ani de ntrziere la vrsta cronologic de 9-12 ani (Anastasi, 1954).
Transformri n cote standard i n cote standardizate
Cota standard z este o valoare care ne arat ct se distaneaz n uniti o cot brut de
media distribuiei respective.
Cota z este o variabil standardizat, cu ajutorul creia variabile diferite sunt aduse la un
numitor comun ( adic sunt exprimate n aceleai uniti), pentru a putea fi comparate.
Trecerea de la variabila brut x la variabila standardizat z se face prin formula:

xm

Unde:
m media n eantion
- abaterea standard n eantion

80

Reamintim c abaterea standard () ne arat distana la care se afl o cot n raport cu


media grupului de date. Formal, ntinderea variaiei datelor este de 6 uniti ( deci este
unitatea de msur pentru variaie).
Pentru utilizarea cotelor standard, condiia este ca datele brute s se distribuie aproximativ
dup o distribuie normal. Transformarea n cote standard i cote standardizate este o
transformare liniar, care schimb doar media i abaterea standard a rezultatelor, pstrnd
nemodificat repartiia cotelor, deci ordinea indivizilor n eantion.
Cotele standard i cotele standardizate indic poziia relativ a subiectului ntr-o populaie
i permit compararea performanelor unui individ la dou sau mai multe teste dac mediile i
dispersiile scorurilor acestora au fost calculate pe baza aceluiai eantion de persoane (Albu,
1998).
Astfel, dac la un test de matematic, un subiect obine scorul brut egal cu 31 ( media pe
eantion fiind egal cu 30, iar abaterea standard cu 2), iar la un test de citire obine un scor brut
egal cu 35 (media n acelai eantion fiind 32, iar abaterea standard 3), se poate aprecia c
elevul este mai bun la citire unde cota z = 1 dect la matematic unde z = 0.5.
Conform proprietilor distribuiei normale, 68.26 % din populaie se afl n intervalul
1; 95% din populaie n intervalul 1.96 , iar 99% din populaie n intervalul 2.58 .
Cunoscnd c o persoan se gsete n intervalul 1 , se poate spune c aproximativ dou
treimi din populaie are acelai scor. Dac un subiect are o cot standard z = 0.72, se poate
afirma c a obinut un rezultat obinuit, n timp ce o persoan cu o cot z = 3.6 are un scor
neobinuit de mare (mai puin de 0.13% din subiecii participani la etalonare au realizat un
asemenea scor) (Albu, 1998).
Uneori, utilizarea cotelor z prezint inconvenientul c acestea se exprim prin numere cu
semn i zecimale, fiind cuprinse n intervalul [ -3; +3].
Efectuarea unei transformri liniare asupra cotelor z duce la obinerea cotelor
standardizate.
Cotele standardizate au aceleai proprieti ca i cotele standard z, singura diferen fiind
valoarea mediei i a abaterii standard.
Cota standard z se transform n cot standardizat z cu ajutorul formulei:
z = M+z
unde
z = cota transformat a cotei standard z
M, = media i abaterea standard a cotelor standardizate
Cele mai cunoscute scale standardizate sunt:
81

1.scalele T (introduse de Mc Call n 1922), care au M = 50 i = 10,


2.scalele H (Hull) unde M= 50 i = 14 sau
3.scalele Z unde M=100 i = 10
SCALA
N

WP

QI

Media

10

10

50

100

100

50

Ab. sta.

10

10

15

14

Dac am dori s standardizm o cot standard z = 1.25 pe baza scalei T, am apela la


formula:
z = 50 + 10*(-1.25)
z = 50 12.5
z = 37.5
Transformri n ranguri centile, decile i cuartile
Transformarea n ranguri centile, decile i cuartile este o transformare neliniar sau
transformare de arie, care schimb repartiia cotelor brute, fcnd-o s semene cu repartiia
uniform.
Rangul centil se obine prin mprirea ansamblului de date ordonate n 100 de clase,
fiecare cuprinznd 1% din efectivul total. Dar n practic este suficient de cele mai multe ori
mprirea n decile sau cuartile.
Decilarea este operaia prin care mprim ansamblul de date n 10 clase, fiecare
cuprinznd 10% din efectivul total. Cuartilele se obin prin mprirea n 4 a ansamblului de
date. Se numete cuartil superior acea cot sau valoare care are naintea sa 25% din ansamblul
de cote brute i cuartil inferior reperul care are naintea sa 75% din totalul cotelor brute. Cele
patru cuartile se numesc: superior, median superior, median inferior i inferior.
Vom prezenta n continuare un exemplu fictiv de transformare n decile a scorurilor brute,
n urma aplicrii unui test de atenie concentrat unui eantion de 180 de subieci, n vederea
alctuirii etaloanelor pentru testul respectiv.

82

Cotele brute la test, simplu ordonate de la cea mai mare valoare la cea mai mic obinut,
sunt prezentate n tabelul Tabelul 1 (vom prezenta direct i frecvenele absolute fa precum i pe
cele cumulate fc pentru economie de timp):
Tabelul 1: Frecvene absolute i relative
x

287

286

285

284

283

282

281

280

279

278

277

276

275

274

273

272

271

270

fa

10

11

19

13

13

13

fc

12

17

27

30

41

48

67

80

88

101

114

121

124

269

268

267

266

265

264

263

262

261

260

259

258

257

256

255

254

253

252

251

10

134

142

149

151

157

161

165

168

171

171

171

172

173

173

173

173

174

174

175

250

249

248

176

178

180

Primul decil este dat de cota acelui obiect care are naintea lui 10% dintre subiecii
examinai, deci 180 : 10 = 18. Se caut cota celui de-al 18-lea subiect. ntruct nu se regsete n
tabel, alegem cota cea mai apropiat, deci cota celui de-al 17-lea subiect, egal cu 281.
Prima clas cuprinde toi subiecii avnd o cot mai mare sau egal cu 281. Se observ c
proporia de 10% nu este perfect respectat.
Pentru a stabili cea de-a doua clas, vom cuta frecvena cumulat cea mai apropiat de 2 x
18, deci frecvena 36. Aceasta este de 41 iar cota brut corespunztoare este 278. Cea de-a doua
clas cuprinde cotele 280, 279, 278.
Locul celui de-al doilea reper este 3 x 18, deci 54 ( frecvena cumulat cea mai apropiat
54, cota corespunztoare este 277).
A patra clas: 4 x 18 = 72 ( frecvena cumulat cea mai apropiat este 67, scorul
corespunztor este de 276)
A cincea clas: 5 x 18 = 90 (frecvena cumulat cea mai apropiat este 88, scorul
corespunztor este 275, 274)
A asea clas : 6 x 18 = 108, cotele corespunztoare 273, 272
A aptea clas: 7 x 18 = 126, cotele corespunztoare 271, 270
A opta clas: 8 x 18 = 144, cotele corespunztoare 269, 268
83

A noua clas: 9 x 18 = 162, cotele corespunztoare 267, 266, 265, 264


A zecea clas va cuprinde toate cotele 263.
Rezultatele pot fi reprezentate astfel:
COTE

DECILE

281

280

II

279
278
277

III

276

IV

275

274
273

VI

272
271

VII

270
269

VIII

268
267, 266, 265, 264

IX

263

Transformarea n decile determin o distorsionare a datelor brute cnd acestea se


ncadreaz ntr-o distribuie normal; decilele sunt mai apropiate ntre ele n jurul mediei i mai
spaiate la periferie, deci constituie o eroare nsumarea rangurilor sau a decilelor i determinarea
unei medii asupra lor ( Radu, 1993).
Aurel Stan (2002) propune o metod statistic prin testul 2 de ajustare, prin care putem
verifica dac distana dintre efectivele observate (pe care le-am obinut prin aproximare) i cele
teoretice ( care sunt ideale), este semnificativ.
Formula de calcul este:
84

( fo ft ) 2
ft

f0 desemneaz efectivele observate, adic numrul de scoruri brute pentru fiecare decil
ft sunt efectivele teoretice care sunt aceleai pentru fiecare decil i care se obin mprind N la
10 ( pentru c avem 10 trepte).
Pentru exemplul dat anterior, desfurarea procedurii 2 de ajustare pentru obinerea distanei
dintre efectivele teoretice necesare calculrii decilelor i cele observate practic, este redat n
tabelul urmtor:
Tabelul 2: desfurarea procedurii 2 de ajustare
f0

ft

f0- ft

(f0- ft)2

(f0- ft)2/ ft

17

18

-1

0.05

24

18

36

2.00

18

-11

12

6.72

19

18

0.05

21

18

0.50

26

18

64

3.55

10

18

-8

64

3.55

18

18

0.00

19

18

0.05

19

18

0.05
Total: 16.52

Unde:
T = 180 iar ft = 180 : 10
Pentru valoarea lui 2 = 16.52, p 0.10, ceea ce ne determin la suspendarea ipotezei.
Diferena dintre cele dou efective dat de valoarea lui 2 fiind nesemnificativ, ne arat c
efectivele observate pot fi utilizate pentru etalonare.
85

Transformri n clasele scalei normalizate


mprirea n clase normalizate presupune mprirea scorurilor brute nu n trane succesiv
egale ci n clase avnd efectivele conform frecvenei distribuiei normale. Este tot o transformare
neliniar care urmrete obinerea unei scale cu 5, 7 sau 9 trepte. Valorile exprimate procentual
pentru fiecare scal sunt:
-

pentru 5 clase: 6,7%; 24,2%; 38,2%; 24,2%; 6,7%

pentru 7 clase: 4,8%; 11,1%; 21,2%; 25,8%; 21,2%; 11,1%; 4,8%

pentru 9 clase: 4%; 6,6%; 12,1%; 17,5%; 19,6%; 17,5%; 12,1%; 6,6%; 4%

Dac considerm scara normalizat cu 5 clase, prima clas va conine primele 6.7% din
scorurile cele mai mici, a doua clas urmtoarele 24.2%, etc.
Prima clas va avea limita inferioar egal cu cel mai mic scor posibil, ultima clas va
avea limita superioar egal cu cel mai mare scor posibil.
Paii urmai pentru a realiza transformarea scorurilor n clase ale unei scale normalizate (
cu 5, 7 sau 9 trepte) sunt:
1. se aranjeaz scorurile de la cel mai mare la cel mai mic
2. se stabilete frecvena pentru fiecare scor
3. se stabilete frecvena cumulat
4. se calculeaz procentul fiecrei clase
5. se face corespondena scor procent din distribuia de frecven cumulat
S presupunem c un test a fost aplicat la 265 de persoane. Scorul maxim al testului este
40, iar scorul minim este 9. Tabelul urmtor prezint frecvena fiecrui scor i frecvena
cumulat.
Dorim s obinem etalonul testului prin transformarea n clasa normalizat cu 5 trepte.

Tabelul 3: frecvenele scorurilor i frecvena cumulat


Scor brut

Frecvena fiecrui scor

Frecvena cumulat

40

39

38

37

36

15
86

35

19

34

28

33

12

40

32

15

55

31

11

66

30

18

84

29

19

103

28

16

119

27

19

138

26

20

158

25

15

173

24

12

185

23

14

199

22

11

210

21

11

221

20

227

19

235

18

241

17

246

16

251

15

255

14

258

13

260

12

262

11

263

10

264

265

Pentru prima clas se calculeaz limita inferioar:


265

corespunde la 100%

corespunde la 6,7%
87

Cu regula de 3 simpl avem:


x= 6,7 * 265/ 100 = 17,75
Cutm n rndul frecvenelor cumulate (fc) frecvena cea mai apropiat de 17,75. Aceasta
este 19 i vom reine ca reper al scrii cota 35.
Pentru a localiza al doilea reper al scalei se calculeaz:
6,7 + 24,2 = 30,9 % i se aplic din nou regula de trei simpl:
x = 30,9 * 265/ 100 = 81,88
Valoarea cea mai apropiat din frecvenele cumulate este 84, cota brut corespunztoare
este 30. Cea de-a doua clas cuprinde cotele brute n intervalul [34;30].
Se calculeaz mai departe al treilea reper:
30,9 + 38,2 = 69,1
x= 69,1 * 265/100 = 183,
deci cea de a treia clas cuprinde cotele din intervalul [29 ; 24].
Cea de a patra clas va cuprinde cotele din intervalul [23; 17], iar a cincea clas va fi
format din scorurile mai mici sau egale cu 17.
Rezult urmtorul tabel de norme care ofer criteriile necesare pentru situarea unui individ
n raport cu grupul de etalonare:

Tabelul 4: Tabel de norme


Clasa

Cote

35

II

34-30

III

29-24

IV

23-17

17

Cnd facem interpretarea calitativ a rezultatelor unui test, performana subiectului trebuie
descris n termeni concrei. Putem eticheta clasele i astfel clasa I s reprezinte performan
88

foarte bun, clasa a II-a performan bun, clasa a III-a performan medie, clasa a IV-a
performan slab, iar clasa a V-a performan foarte sczut.
Nu se poate spune c unele tipuri de transformri sunt mai bune ca altele, specificul
testului, a trsturii msurate, impun alegerea celei mai bune metode de obinere a etaloanelor.
Pentru a fi cu adevrat utile, normele testului trebuie s fie descrise detaliat n manualul
testului, indicnd descrierea populaiei pentru care au fost construite, modul de formare a
eantionului, caracteristicile eantionului (numrul de persoane, indicii tendinei centrale i ai
dispersiei, reprezentativitatea criteriilor i dac acestea influeneaz rezultatele, erori posibile de
eantionare, etc.), condiiile n care a fost aplicat testul, data testrii.
Tabelul de norme este relativ la populaia avut n vedere, mai ales dac etalonul are o
valoare local. Cu att mai mult, nu se pot utiliza etaloane ntocmite n alte ri.
La anumite intervale de timp, testele trebuiesc re-etalonate. Programele statistice actuale
permit actualizarea continu a etaloanelor, o dat cu introducerea scorurilor subiecilor testai n
baza de date.

89

Capitolul VII
ASPECTE ETICE ALE EVALURII PSIHOLOGICE

n Romnia n anul 2004 a fost adoptat si a intrat n funciune legea care reglementeaz
profesia de psiholog, cu denumirea complet: Legea nr. 213 din 27 mai 2004, privind
exercitarea profesiei de psiholog cu drept de liber practic, nfiinarea, organizarea si
funcionarea Colegiului Psihologilor din Romnia. Aceast lege trebuie s fie cunoscut de
orice psiholog din Romnia, incluzndu-i si pe cei care se afl n proces de formare (studenii,
masteranzii). n baza ei s-a nfiinat Colegiul Psihologilor din Romnia, iar n cadrul Colegiului
funcioneaz patru comisii aplicative, si nc dou comisii, una metodologic si una
deontologic, respectiv:

Comisia de psihologie clinic, consiliere psihologic si psihoterapie;

Comisia de psihologie a muncii, transporturilor si serviciilor;

Comisia de psihologie educaional, consiliere scolar si vocaional;

Comisia de psihologie pentru aprare, ordine public si siguran naional.

Comisia metodologic

Comisia de deontologie si disciplin.

Comisia metodologic are atributiuni mai apropiate de activitatea psihodiagnostic este


elabornd deja Normele de avizare a metodelor si tehnicilor de evaluare si asisten
psihologic.
Conform art.3 (1) Comisia Metodologic a Colegiului Psihologilor din Romnia, prin
normele de avizare prezente, stabileste standardele de calitate si procedurile de avizare pentru
metodele si
tehnicile de evaluare si asisten psihologic. Pe de alt parte, conform art. 3(2) Comisiile
applicative din cadrul Colegiului Psihologilor din Romnia, prin normele de avizare specifice,
atest competenele profesionale ale psihologilor de a utiliza metode si tehnici de evaluare si
asisten psihologic. Toate comisiile de specialitate vor avea n vedere competenele generale
de utilizare a testelor psihologice precizate n documentul de fa.
De o mare importan sunt precizrile referitoare la dreptul de utilizare a testelor
psihologice. Cei care folosesc testele trebuie s fie n posesia unor competene bine precizate,
identice cu cele prezentate n Standardele APA pentru calificarea utilizatorilor de teste (2000),
care se obin prin procesul de formare profesional, nsemnnd si anii de studiu si de practic din
facultate, dar si procesul de formare postuniversitar.
Categoriile majore de competene vizeaz urmtoarele aspecte etice n aplicarea testelor:
90

- adoptarea unei conduite profesioniste, n acord cu normele deontologice ale psihologului si cu


respectarea legilor internaionale si naionale privind copyright-ul (legea drepturilor de autor si a
drepturilor conexe nr. 8/1996);
- utilizarea doar a acelor teste pentru care au competena necesar;
- asumarea responsabilitii pentru modul de utilizare a testelor;
- asigurarea securitii pentru testele utilizate, astfel nct ele s nu-si piard calitile din cauza
deconspirrii publice a coninutului ori a mecanismelor de cotare;
- asigurarea confidenialitii rezultatelor;
- acordul scris sau n form electronic de includere a rezultatelor n baza de date a utilizatorului
probei psihologice.
De asemenea, aceast comisie a elaborat o serie de norme referitoare si la modul de
comercializare a testelor.
Examenul psihologic i utilizarea testelor psihologice, dar i orice aciune pe plan
psihologic, au numeroase implicaii sociale i etice. Pentru aceasta multe ri i-au elaborat un
sistem juridic de protecie, totodat fiind redactate norme etice i standarde de utilizare a testelor
psihologice i practicare a psihologiei. Astfel de standarde au fost publicate i la noi n ar.
Atunci cnd discutam despre implicaiile sociale i etice ale utilizrii testelor psihologice,
referirea se face cu precdere la respectarea ctorva principii: calificarea examinatorului;
calitatea instrumentelor i procedurilor de msur ; protecia intimitii subiectului ;
confidenialitatea rezultatelor ; comunicarea rezultatelor testrii; respectarea drepturilor
minoritilor. (Anastasi,1976; Gregory, 1992; Murphy & Davidshofer, 1991).
Calificarea examinatorului
Una din cerinele fundamentale ale psihodiagnozei este ca testele s fie mnuite numai de
un personal calificat. Aceasta este una din msurile luate pentru a proteja subiecii de unele
abuzuri care pot fi comise cu ocazia examinrilor psihologice. Unele selecii de personal se fac
dup metode extrem de ,,originale: o discuie la un restaurant cu candidatul, maniera n care un
candidat deschide ua, felul n care candidatul privete spre cel care face selecia, utilizarea
datelor din horoscop, analiza scrisului ori a liniilor din palm etc. Lipsa de cunotine despre
testele psihologice, vulgarizarea lor, interpretrile eronate i iluzia c oricine posed un test l
poate i administra i interpreta a dus la multe nenelegeri cu privire la natura testelor i
utilitatea lor. Totodat, aceste false concepii despre teste i examenul psihologic au generat
numeroase critici i revolte antitest. Psihologii trebuie s-i apere i respecte profesia. Normele
interne de protejare sunt bine puse la punct, dar sunt cunoscute numai ntr-un cadru prea
restrns. Se impune o comunicare mai vie cu publicul larg, o educare a sa n ceea ce privete
investigarea tiinific a personalitii i investigarea pe care o fac persoanele neavenite care au
91

alte specializri dect aceea de psiholog. Insuficienta comunicare tiinific cu publicul a lsat
cmp liber de aciune ziaritilor, impostorilor i diletanilor s popularizeze un domeniu al
tiinei pentru care nu au nici o pregtire.
Soluia care adesea a fost propus i din ce n ce mai mult acceptat de numeroase state
este ca dreptul de profesare al psihologiei s fie acordat pe baza unor standarde de competenta, a
unor licene acordate de forurile legale de control a activitii psihologilor. Astfel, o companie
sau un subiect supus unui examen prin teste psihologice trebuie s poat controla competena
examinatorului.
Calitatea instrumentelor i procedurilor de msur
n general, distribuia testelor psihologice este restrns la persoanele care au cel puin un
master n psihologie sau cursuri echivalente ori focalizate pe o anumit problem de
psihodiagnoz. Cataloagele care prezint teste psihologice specific i nivelul de competenta
necesar cumprrii i utilizrii unui test psihologic. Pentru studenii care utilizeaz teste
psihologice, n multe ri se pretinde de ctre distribuitorii de teste semntura persoanei
responsabile de activitatea studentului respectiv. Un aspect important legat de utilizarea testelor
i procedurilor de testare psihologic se refer la calitatea intrinsec a acestora. n aceast idee,
un test nu este lansat pe pia fr ca anterior acesta s nu fi fost verificat. Se pretinde ca orice
test s fie deci nsoit de un manual de utilizare. Acest manual trebuie s conin: baza
conceptual a testului; datele psihometrice aferente construciei testului; norme i standarde de
interpretare; valoarea i limitele testului n cauz; studii de caz, anexe cu studii de validare,
studii critice etc.
Derularea i organizarea examenului psihologic sunt variabile care pot afecta
performanele subiecilor. Examenele psihologice improvizate n sli lipsite de mese, cu o
luminozitate improprie, glgioase etc. vor conduce la distorsionarea rezultatelor.
Protecia intimitii subiectului/ Confidenialitatea rezultatelor
Psihologul are obligaia s explice subiectului motivul examenului psihologic i s obin
acordul acestuia de a se supune la test. Acelai lucru privete i divulgarea rezultatelor testrii
psihologice. n mod obinuit, trebuie evitat afiarea rezultatelor examenului psihologic.
Formula recomandat este de a afia numai numele persoanelor selectate, fr alte date care ar
putea constitui o violare a intimitii. Cei nereuii la un examen de selecie nu trebuie amintii.
Acest lucru se impune mai ales cnd sunt utilizate teste de inteligen sau de personalitate,
etichetele nefiind indicate n aceste cazuri deoarece i-ar putea leza pe unii subieci. Discreia i

92

pstrarea anonimatului pacienilor/ clienilor sunt elemente care trebuie s caracterizeze


activitatea psihologului.
Confidenialitatea este o problem delicat. ntrebarea fundamental care se pune n acest
caz este cine are acces la datele examenului psihologic i ce date poate s ofere psihologul.
Rezultatele examenului psihologic (cele legate de problematica organizaional i nu la aceea
specific diagnozei clinice sau educaionale) se comunic n primul rnd subiectului. El are
dreptul s-i cunoasc rezultatele performanelor la testele de aptitudini i de cunotine. Cu el se
pot iniia i unele discuii pe marginea concluziilor la testele de personalitate. Tot el decide dac
rezultatele testrii se vor comunica mai departe sau nu.
Comunicarea rezultatelor testrii psihologice
Niciodat rezultatele unui examen psihologic nu pot fi transmise sub forma lor brut, ci
prelucrate i interpretate. Formula obinuit de prezentare a acestora este sub form de raport
psihologic. Datele coninute n raport trebuie nelese de ctre cel cruia i este acesta adresat.
Psihologul trebuie s fie foarte prevztor i atent la ceea ce comunic deoarece modul su de
exprimare poate da natere la confuzii, performanele la un test putnd influena viaa unui
individ.
Respectarea drepturilor minoritilor
Condiiile culturale specifice unei ri se extind i la domeniul psihologiei. Ele au
preocupat mult psihologii. Problematica discriminrii a fost una din punctele de atac vizavi de
aplicaiile psihologilor americani n armat n timpul primului rzboi mondial. Fiecare psiholog
tie c testele msoar diferite eantioane comportamentale, ori aceste comportamente sunt
determinate cultural. Aceasta este explicaia multor diferene n ceea ce privete performanele la
testele de atitudini, valori, motivaionale, de inteligen etc. O grij deosebit a psihologilor se
ndreapt spre transpunerea testelor dintr-o cultura n alta. Dac unui european i se dau probleme
legat de msurarea temperaturii n scala Fahrenheit i nu n Celsius, el va ntmpina mari
dificulti n rezolvare. Procedurile de adaptare privesc utilizarea unor tehnici ca analiza de
coninut, utilizarea grupurilor de experi sau retroversiunea. Alturi de aceste tehnici de lucru
calitative au fost dezvoltate i o serie de proceduri statistice mai mult sau mai puin sofisticate.
Dar problema cea mai acut se refer la interpretarea scorurilor de test. De pild, dac
psihologul observ c la un test de comprehensiune verbal un grup minoritar obine un scor mai
mic dect altul, este firesc s-i pun ntrebarea de ce s-a produs aceast diferen de
performan. n aceste cazuri, psihologul trebuie s opereze cu norme difereniate pe grupuri
minoritare.
93

Capitolul VIII
PSIHODIAGNOZA FORMATIV vs PSIHODIAGNOZA CLASIC

Deoarece este o tendina tot mai actual, mai ales n evaluarea aptitudinal, psihodiagnoza
formativ merit o abordare separat. Diagnosticul, n acest tip de abordare, este formative (nu
constatativ) pentru c poate ghida intervenia, n sensul evidenierii funciilor psihice si
operaiilor gndirii, deficitare si care necesit dezvoltare, pentru cresterea performanelor.
Diagnosticul pune accentul, nu att pe constatarea performanei si pe aceast baza a clasificrii
si a prediciei performanei viitoare, ct pe capacitatea persoanei de a se schimba, n urma unei
etape de nvare.
Astfel ceea ce se msoar este un potenial de nvare, nu un coeficient intelectual. n
evaluarea tradiional psihometric indivizii sunt comparai raportndu-se la normele specifice
vrstei, spre exemplu n ceea ce priveste inteligena academic. Aceasta se bazeaz pe
presupoziia c c ei au avut oportuniti egale de a nva anterior testrii. Principala inovaie pe
care evaluarea formativ o adduce n cmpul psihometriei este legat de semnificaia acordat
coeficientului de inteligen. Desi acesta reprezint o msur a performanei ntr-un anumit
moment, ntr-un anumit context, privind capacitatea de a profita si nva din experienele
trecute la care a fost expus un subiect, exist puine motive s asumm sau s acceptm c
performana la un test de inteligen furnizeaz o msur stabil si de ncredere a performanei
viitoare. Valorile mici ale coeficienilor de validitate de criteriu (predictiv) demonstreaz acest
lucru. Evaluarea formativ pune accentul pe capacitatea de schimbare a fiinei umane si
influena factorilor de mediu, chiar si n cazurile cnd exist afeciuni organice, limitnd astfel
influena factorilor genetici, generatori de discriminare social, din perspectiva autorilor acestei
abordri (Feuerstein, R., 1979).
Sursa dificultilor cognitive ale subiectului poate fi localizat ntr-una din cele trei faze
ale actului mental: inputul, elaborarea, outputul. Majoritatea pot fi determinate de ceea ce se
cheam deficit al medierii n nvare, n experiena de via a subiectului. Ca atare intervenia
de mbogire instrumental a subiectului trebuie s se bazeze pe medierea nvrii.
n timpul evalurii examinatorul poate susine procesul de rezolvare a problemelor prin trei
tipuri de intervenii de ajutor:
- Sunt utilizate sarcini a cror rezolvare nu depinde n mod necesar de achiziiile cognitive
anterioare;
-Sunt anihilate acele obstacole actuale, prezente, care duc la ineficiena funcionrii
cognitive;

94

-Este indus un nivel optim de funcionare mental, n funcie de natura sarcinii si de


capacitatea subiectului.
Interaciunea examinator- subiect nu este o simpl repetare, amplificare de informaii sau
reluare a unor modele habituale ale subiectului, ci vizeaz mbogirea repertoriului de
interaciuni. Conceptul teoretic de la care s-a pornit este acela de zon proxim a dezvoltrii,
concept introdus de doi psihologi rusi Luria si Vgotski. Zona proxim a dezvoltrii reprezint o
acea zon virtual n care o capacitate actual poate evolua. Principiul fundamental este
reducerea distanei dintre performan si competen, si crearea unor condiii si contexte ale
situaiei problematice care pot facilita si valorifica potenialele latente. n cadrul examenului au
loc mai multe secvene:
- Faza de aplicare iniial, n care se msoar capacitile rezolutive ale subiectului, fr a se
acorda ajutorul examinatorului, prin itemi din teste psihometrice tradiionale (ex. Raven)
- Faza de nvare n care dac subiectul a gresit rezolvarea la anumii itemi i se ofer ajutorul
pentru rezolvarea corect sau pentru rezolvarea celor nerezolvai, fiind orientat n asa fel nct s
descopere singur- nvare mediat
- Faza de evaluare a gradului de transferabilitate si de integrare n structurile cognitive,
operatorii ale subiectului, a cunostiinelor introduse n faza a doua. Sunt utilizai itemi ai unor
teste paralele.
- Se utilizeaz tipuri de probleme adaptate nivelului optim al eficienei funciilor mentale, n
funcie de vrst sau de tipul de deficien mental
- Se amelioreaz componentele metacognitive- cele care in de motivaie atenie, ce intervin n
funcionarea cognitiv.
Scorurile obinute n faza 1 si n faza 3 sunt utilizate la determinarea profitului cognitiv,
acesta fiind o masura mai valida a potenialului de nvare, si un predictor mai bun al
performanei viitoare.
Rezultatele se refer la patru aspecte:
1. Msurarea valid a competenelor cognitive ale subiectului
2. Determinarea dificultiilor funcionale majore care apar n timpul rezolvrii sarcinii
3. Compararea nivelului de dezvoltare cognitiv cu potenialul de nvare
4. Delimitarea condiiilor psiho-pedagogice susceptibile pentru activarea potenialelor
cognitive
Evaluarea dinamic, formativ presupune schimbri metodologice n urmtoarele patru
domenii:

95

1. n structura testelor- Instrumentele de testare trebuie s fie construite ntr-un mod care
s ofere examinatorului si examinatului sarcini ce pot fi utilizate ntr-un proces de nvare si
care pot permite examinatorului s evalueze efectul procesului de nvare asupra capacitii
individului de a face fa unor situaii noi.
2. n situaia de examinare - Trecerea de la un scop static la unul dinamic, implic o
schimbare n situaia de testare care va transforma examinatorul ntr-un profesor-observator si
examinatul ntr-un student-executant. Aceast transformare atrage dup sine o varietate de
schimbri n interaciunea obisnuit si stabilirea unui proces de comunicare n dublu sens.
3. n orientarea testelor - schimbarea de accent de la rezultate la procesul de obinere a
rezultatelor este o alt schimbare necesar pentru a trece de la o abordare static la una
dinamic.
4. Interpretarea rezultatelor - Vrfurile de performan ntre rezultatele obinute trebuie
utilizate ca o indicaie a potenialului examinatului.
Unul dintre cei mai importani reprezentani ai acestei orientri este Reuven Feuerstein.
Principala contribuie a noii direcii de dezvoltare poate fi rezumat prin accentul pus pe
evaluarea intelectului prin sarcini de nvare.

96