Sunteți pe pagina 1din 80

CONF. DR.

AUREL STAN

TEORIA I CONSTRUCIA INSTRUMENTELOR


DE INVESTIGAIE PSIHOLOGIC
CUPRINS
CONSIDERAII PRELIMINARE
I. INTRODUCERE N TEORIA TESTULUI PSIHOLOGIC
I.1. Teoria testului psihologic
I.2. Teoria clasic a testului psihologic
I.3. Criteriile de apreciere a unui test
I.4. Criterii secundare de apreciere a unui test psihologic.
II. ANALIZA DE ITEMI
II.1. Itemii ca elemente ale msurrii psihometrice
III. CONSTRUCIA TESTULUI PSIHOLOGIC
III.1. Consideraii preliminare
III.2. Teoria care st la baza construciei testului psihologic
III.3. Formularea unui bun item
III.4. Problema eantionajului
III.5. Normele i normarea n psihometrie

SCOPUL UNITII DE CURS:


Familiarizarea cursanilor cu problemele principale ale teoriei testului psihologic;
Informarea cursanilor asupra principalelor tipuri teste psihologice;
Informarea cursanilor asupra direciilor de evoluie a testelor psihologice;
Informarea cursanilor asupra specificului constructiv din domeniul testelor psihologice;
Informarea cursanilor asupra problemelor de interpretare a rezultatelor testelor psihologice;
Informarea cursanilor asupra limitelor interpretrii statistice a rezultatelor.
OBIECTIVE OPERAIONALE:
n urma studierii acestei uniti de curs, studenii trebuie s-i formeze urmtoarele deprinderi
intelectuale:
S opereze cu principalele concepte utilizate n teoria testelor psihologice;
S precizeze principalele etape n dezvoltarea testului psihologic;
S precizeze situaiile de aplicare a testelor psihologice;
S precizeze specificul principalelor tipuri de scale normative folosite n exploatarea rezultatelor
testelor psihologice;
S precizeze sensuri i non-sensuri n interpretarea rezultatelor testelor.
MODALITILE DE EVALUARE:
Se va realiza n cadrul unui examen scris la sfritul semestrului. Pentru examen se vor stabili
dou tipuri de subiecte: un tip referitor la teoria testului psihologic i un tip referitor la aplicarea n
practic a cunotinelor dobndite. n cadrul activitilor tutoriale se vor exersa subiectele cu caracter
practic i se va verifica realizarea exerciiilor de la sfritul capitolelor. Tipurile de subiecte pentru
examen vor fi egal ponderate pentru nota final obinut la examen.

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

CONSIDERAII PRELIMINARE
Cuvntul test este de origine englez i nseamn prob. Verbul to test nseamn a proba, a
supune unui examen. Acest termen nu este unul specific psihologic, adic nu se folosete doar n
examinarea psihologic sau doar n domeniul psihologic. El este utilizat ntr-o diversitate de discipline
tiinifice i de domenii practice. Majoritatea manualelor tiinifice au pregtite teste de cunotine Se
vorbete de testarea motoarelor, a anumitor dispozitive tehnice, a capacitii fizice de efort, a ipotezelor
tiinifice. Este cazul s prezentm semnificaia extins a acestui termen. n viziunea lui Gustav A. Lienert,
testul este:
Un procedeu de cercetare a unei caracteristici a personalitii;
Procedeu de realizare a unei cercetri;
Totalitatea rechizitelor necesare pentru realizarea cercetrii
Orice cercetare, n msura n care are caracterul de prob prin sondaj;
Anumite procedee de verificare statistic-matematice (de exemplu, testul chi ptrat, testul t a
lui Student)1.
Acest termen tiinific a fost folosit n psihologie de ctre James McKeen Cattell, profesor la
Universitatea din Pennsylvania, ulterior la Columbia, care a publicat n anul 1890 articolul Mental Tests
and Measurements n revista Mind. Dei a fost un nume tiinific prestigios i a avut realizri deosebite
n psihologie, testele sale au avut o rspndire limitat, datorit succesului slab n aplicarea practic. Cu
toate c a folosit pentru prima dat acest termen, James McKeen Cattell nu este unanim recunoscut ca
printe al metodei testului n cercetarea psihologic. O serie de autori occidentali au publicat probe
psihologic, fr s poarte numele de test, nainte de anul 1890, numele celebrului savant englez Francis
Galton fiind cel mai frecvent invocat drept argument. Se poate vorbi de o faz presistematic a testului
psihologic, n cadrul acesteia putnd fi evideniate ncercri de a crea diferite probe care s pun n
eviden mai ales debilitatea mintal, utilitatea acestora fiind reclamat de nevoia crerii unor
aezminte colare speciale, destinate copiilor care aveau probleme de retardare mintal. Evoluia vieii
social-economice fcea necesar inventarea unor instrumente de investigaie care s se refere la
caracteristicile vieii psihice, domeniile justiiei, industriei, activitii colare reclamnd cel mai frecvent
astfel de instrumente. Testul psihologic n forma sa modern nu este dect produsul final al unei lungi
perioade de cutri i ncercri.2
Satisfacerea exigenelor teoretice i practice fa de un instrument de investigaie psihologic
a fost reuit de Scala metric a inteligenei, creat de medicii francezi Alfred Binet i Thodor Simon n
anul 1905, cu perfecionri n anii 1908 i 1911. Recunoaterea scalei metrice a inteligenei, creat de
cei doi medici francezi, ca prototip al testului psihologic, se datoreaz intersectrii unor acumulri
tiinifice apreciabile cu nevoile instituionale, reflectate n comenzi adresate de ctre autoriti
guvernamentale franceze, fapt care a fcut ca testul s intre n viaa practic a societii. Ca atare,
1
2

Vezi Gustav A. Lienert, Testaufbau und Testanalyse, Verlag Julius Beltz, Weinheim und Berlin, 1967, pag. 7.
Vezi Aurel Stan Testul psihologic, Editura Polirom, Iai, 2002

AUREL STAN

paternitatea metodei testului psihologic este atribuit adesea lui Alfred Binet, personalitate strlucitoare
a vieii tiinifice din Frana la sfritul secolului XIX i nceputul secolului XX3. Prin perfecionarea
metodologiei de construcie i prin concepia realist privind menirea testului psihologic, Alfred Binet a
reuit s introduc testul n viaa instituiilor sociale i s-l fac util pentru un mare numr de oameni.
Practic, prin creaia lui Binet, testul psihologic a primit botezul social. Impresioneaz durabilitatea
temporal a acestui instrument de psihodiagnostic, nefiind scos din uz nici pn n zile noastre, este
adevrat prin intervenia unor adaptri fireti, cea mai cunoscut fiind forma Stanford-Binet. Spaiul
restrns al acestui curs nu ne permite s realizm o istorie a testului psihologic, parte a tratrii testului
psihologic care este considerat de noi ca fiind deosebit de interesant i instructiv. n aceast parte
de istorie gsim informaii care ne permit o imagine complet a unui efort tiinific i practic-aplicativ de
mare anvergur. Spaiul rezervat acestui curs nu permite dezvoltarea dimensiunii istorice a testului
psihologic. Putem sintetiza dezvoltarea testului psihologic prin conturarea a dou tendine:
Tendina extensiv de dezvoltare se caracterizeaz prin:
Extinderea ariei geografice de rspndire;
Mrirea amplitudinii vrstei de aplicare la cele dou limite, inferioar i superioar;
Diversificarea formelor i complexitii solicitrilor;
Creterea numrului domeniilor de aplicaie;
Diversificarea categoriilor de populaie care beneficiaz de examinarea psihologic prin
intermediul testelor.
Tendina intensiv are urmtoarele direcii:
Creterea obiectivitii n evaluare(o instrucie mai adecvat n evaluarea sarcinilor, punctarea
mai adecvat a variantelor de rspuns);
Perfecionarea teoriilor care stau la baza construciei testelor;
Intervenia statisticii n construcia i exploatarea informaional a testului;
Perfecionarea analizei itemilor;
Creterea exigenelor cu privire la calitatea msurrii.

Prin aceast afirmaie nu se ignor contribuia lui Thodore Simon, dar considerm c cel mai mare merit i revine lui Binet

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

I. INTRODUCERE N TEORIA TESTULUI PSIHOLOGIC


I.1. TEORIA TESTULUI PSIHOLOGIC
I.1.1. Precizri noionale.
n orice studiu tiinific exist obligaia precizrii termenilor utilizai, fapt care implic detaarea
denotaiilor de conotaii.
Noiunea de test nu este folosit exclusiv n psihologie, ci i n alte discipline tiinifice, n
consecin, testul este un termen nespecific psihologiei. Se vorbete de teste fizice, biologice, chimice
etc. De asemenea se vorbete de teste medicale. Nu n rare cazuri auzim de testarea motoarelor, a
instalaiilor i n teoriile tiinifice de testarea unor modele. Consultarea unor dicionare explicative
generale reputate, nespecializate n psihologie, indic diferenieri ale domeniilor de utilizare a testului4.
n sensul cel mai general cuvntul test nseamn procedeu de verificare care apeleaz, de
cele mai multe ori, la forma chestionarului. Este mai ales cazul probelor de verificare a cunotinelor din
diverse discipline tiinifice sau preocupri umane sistematizate.
I.1.2. Definiii ale testului psihologic
Definirea testului psihologic de ctre specialitii domeniului teoriei testelor difer mai puin n
privina terminologiei utilizate, ct mai ales prin amploarea sau ngustimea referinelor. Vom prezenta
cteva definiii de referin
Asociaia Internaional de Psihotehnic d testului urmtoarea definiie :Este o prob
definit, implicnd o sarcin de ndeplinit, identic pentru toi subiecii examinai, cu o tehnic precis
pentru aprecierea succesului i a eecului, sau pentru notaia numeric a reuitei. Sarcina poate s
comporte o punere n aplicare fie a cunotinelor achiziionate (teste pedagogice), fie a funciilor
senzorial-motrice sau mentale (teste psychologice)5. Se observ din aceast definiie excluderea
construciilor psihometrice destinate investigrii personalitii din rndul testelor. Astfel de puncte de
vedere nu sunt singulare.
Maurice Reuchlin d o definiie care surprinde aspecte eseniale ale testului psihologic:
"Prob, utilizat mai ales n psihologia diferenial, care permite de a descrie comportamentul unui
subiect ntr-o situaie definit cu precizie ("consemnul" testului) prin referin la comportamentul unui
grup definit de subieci plasai n aceeai situaie"6.
O definiie a testului psihologic de larg circulaie este dat de Pierre Pichot, folosind
denumirea original cu care a fost lansat testul: Se numete test mental o situaie experimental
standardizat servind de stimul la un comportament. Acest comportament este evaluat printr-o
4 Am consultat n aceast privin "Dicionarul explicativ al limbii romne", Editura Academiei, 1984, "Dictionnaire de la
langue francaise", Hachette, 1994, "Le petite Larousse", Larousse, Paris 1992, "Webster"s Enciclopedic Unabridget
Dictionnary of the English Language, Grammercy Books, New York, 1996, "Cambridge International Dictionary of English,
Cambridge University, Press, 1996
5 dup Lussato, Ariane Les tests des reecrutement, Presses Universitaires, de France, Paris, 1998, pag.7.
6 Vezi "Grand dictionnaire de la psychologie", Larousse, Paris, 1992, pag.782. Definiia din dicionar aparine lui Maurice
Reuchlin, membru al colectivului de autori care l-a elaborat.

AUREL STAN

comparaie statistic cu acela al altor indivizi plasai n aceiai situaie, permind astfel de a clasa
subiectul examinat, fie cantitativ, fie tipologic7.
Parcurgnd definiiile anterioare i analiznd deficienele acestora am elaborat urmtoarea
definiie pentru testul psihologic: "Procedeu standardizat de investigaie psihodiagnostic care pune n
eviden prin diferite modaliti de stimulare ale subiecilor comportamente relevant diagnostice,
exploatabile informaional pe baza comparrii rezultatelor obinute cu cele ale unor eantioane
reprezentative de persoane aflate ntr-o situaie de examinare identic i care folosete n descrierea i
explicarea concluziilor termeni tiinifici specifici teoriei care stau la baza construciei sale".
Din definiiile elaborate se pot detaa un ansamblu de trsturi de consens:
testul psihologic este un instrument standardizat de investigaie;
pentru aprecierea rezultatelor sale se face referin la rezultatele unui grup de referin;
diagnosticul realizat prin folosirea testului psihologic se refer la un larg domeniu de
comportamente considerate relevant diagnostice
I.1.3.Prile componente ale unui test psihologic
n calitate de procedeu standardizat de investigaie un test psihologic are o serie de
componente care n ansamblu asigur funcionalitatea sa:
a) Componenta static, material a testului, denumit uneori i partea de rechizite a testului, se
subdivide n:
1. Manualul testului, n care sunt prezentate: descrierea, geneza constructiv, fundamentele
tiinifice, indicaii privind punerea n aplicare i normele stabilite. Este sursa informaional
principal pentru aprecierea ncrederii pe care trebuie s o avem ntr-un anumit test. Manualul
trebuie s dea indicaii detaliate despre procedeele de evaluare i despre modul n care se
redacteaz concluziile aplicrii unui test. ntre exigenele ideale i realitatea practic exist o
anumit distan. Calitatea prezentrii poate lsa de dorit, n unele cazuri, prin omisiunea unor
factori care ar putea folosi utilizatorului i prin ascunderea, omiterea unor aspecte
dezavantajoase ale testului. L.J. Cronbach afirm c testele elaborate nainte de 1945 posedau
foarte rar manuale complete i nu erau conforme celor mai noi standarde din domeniul examinrii
prin intermediul testelor (elaborate de asociaii profesionale i internaionale)8. Producerea unui
bun manual este o chestiune cu att mai dificil, cu ct mai multe rezultate s-au cumulat despre
test. Manualul trebuie s fie redacta n aa fel, nct s fie foarte clar pentru profesioniti i s
duc la recunoaterea de ctre non-profesioniti a faptului c ei nu posed o calificare n
domeniu. Un important ajutor n redactarea manualelor l constituie recomandrile tehnicile
editate de asociaiile profesionale internaionale i naionale (cele mai cunoscute sunt cele editate
de Asociaia Psihologilor Americani (APA). Recomandrile tehnice ale asociaiilor profesionale
indic ce trebuie s conin un bun manual.
2. Materialul testului const din diferite tipuri de aparate pentru evidenierea stimulrilor, caietul
testului, foi de rspuns, materiale pentru prelucrare i pentru manipulare. Este partea care
asigur stimularea comportamentelor de rspuns.
vezi Pichot, Pierre Les tests mentaux, Presses Universitaires de France, Paris, 1994, pag. 5.
Cronbach, Lee, J., Validitt, n Psychologische Diagnostik (herausgegeben von Karl-Herman Wewetzer),
Wissenschaftliche Buchgeselschaft, Darmstadt, 1979, pag.159-162
7
8

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

3. Auxiliare de evaluare precum grilele de corectur, abloane, folii cu orificii, aparate de msur;
b) componenta dinamic, de realizare a, unui test se divizeaz metodologic i tehnologic, dup cum
urmeaz:
1. Consemnul testului instruiete persoana profesional calificat n aplicarea testelor n privina
condiiilor de realizare i evaluare a testelor i despre ceea ce le este pretins examinailor n
timpul examinrii prin intermediul unui test. Informaii de acest gen pot fi cuprinse uneori n
manualul testului.
2. Partea de realizare rezid ntr-o reacie motorie (exemplu, reacie senzorial-motorie sau verbal
la stimuli simpli sau compleci, tapping), ntr-o percepie senzorial (exemplu tahistoscop), ntr-o
activitate de rutin mental sau fizic (a nira perle, a calcula dup un algoritm, cum este cazul
la testul Kraepelin), n rezolvarea unei probleme concrete abstracte (a construi pompa Schulze, a
monta instalaia denumit Winkeltrieb a rezolva sarcina de gndire) sau n luarea n consideraie
asupra unei ntrebri privind comportamentul, tririle sau dispoziiile. Sarcinile din cadrul unui test
pot s aib un coninut simplu sau complex, dificultile lor putnd fi aproximativ egale sau foarte
inegale.
3. Evaluarea poate s se realizeze intuitiv, regulat, schematic sau automatic. Prin evaluare,
rezultatele realizrii testului sunt cunoscute prin intermediul unuia sau mai multor scoruri.
Componentele testului suport condensri informaionale odat cu procesul de computerizare
a testului psihologic. Practic, informaiile prii statistice sunt condensate pe o dischet care pot fi
ilustrate prin intermediul diferitelor tipuri de computere. Testele computerizate vor avea consacrat un
capitol aparte n lucrarea noastr.
I.1.4. Clasificarea testelor psihologice
Clasificarea este o operaie intelectual prin care obiectele dintr-o mulime dat sau un
univers sunt mprite n clase n funcie de asemnrile i deosebirile dintre ele. Referitor la puterea
informaional, menionm c o clasificare a testelor are fora informaional a cel mult unei scale
ordinale, dar, de cele mai multe ori a celor nominal,e n care pot opera grupri i rafinri. Compararea
obiectelor unui univers se face dintr-un anumit unghi de vedere, numit criteriu. Clasificarea poate fi
numit natural, dac ea descrie clasele aa cum exist n realitate, sau artificial, n cazul n care
clasele sunt formate dup anumite criterii convenionale funcie de utilitate. Clasificarea poate fi
teoretic, n care avem nu numai clase reale, ci i clase posibile, i empiric, n care avem doar clase
reale. Clasificarea poate fi fcut dup unul sau mai multe criterii. n funcie de natura obiectelor, ea
poate fi exact sau inexact. O clasificare exact presupune c pentru orice obiect din universul supus
clasificrii putem spune exact crei clase aparine. Pentru cazul testelor psihologice putem spune c
avem o clasificare artificial, empiric i inexact.
n mod tradiional, n clasificare se pornete de la tipul ideal de clasificare care are la baz
supoziii referitoare la satisfacerea terului exclus pentru orice obiect din universul supus clasificrii n
raport cu proprietile invocate, la faptul c o clasificare este complet, adic fiecare obiect din
universul de clasificare face parte din una din clasele indicate i la faptul c n ansamblu clasele se
exclud ntre ele, suma claselor identificndu-se cu universul. n realitate, aceste cerine nu sunt realizate
dect imperfect datorit faptului c n practica clasificrii suntem confruntai adesea cu mulimile vagi;
n unele cazuri cu mulimile infinite sau mulimi nedefinite. Universul testelor psihologice realizeaz
9

AUREL STAN

imperfect exigenele ideale ale clasificrii, deoarece se opereaz cu mulimi vagi (unele clasificri includ
i testele de personalitate subiective, altele nu), care nu sunt finite (clasificrile actuale cuprind mai
multe clase de testele dect cuprindeau cele de acum 50 de ani, deci numrul obiectelor universului de
clasificare este n cretere cu o rat imprevizibil).
Din analiza clasificrii testelor psihologice fcut de ctre diveri autori de specialitate putem
afirma c nu exist o unitate de preri, dar ntre majoritatea criteriilor de clasificare utilizate exist o
concordan apreciabil. n privina clasificrii testelor s-au pronunat personaliti de prim rang ale
psihologiei aplicate. Astfel, enumerm n aceast privin autori ca H.J. Eysenck (1953), M. Irle (1956),
G. Lienert (1969), L.J. Cronbach (1970), P. Horst (1971), R.L. Thorndike (1971), R. Meili i E.
Steingruber (1978), Anna Anastasi, Rolf Brickenkamp (1997), D. Laveault i J. Gregoire (1994)9. n
1973 D. Speck i R. Speck introduc dou grupe de criterii de clasificare, preluate de majoritatea celor ce
se ocup de clasificarea testelor. Autorii germani fac o diviziune utilitar-pragmatic a testelor, din
punctul de vedere al coninutului i din punctul de vedere al formei. Cea mai mare concordan n
sistemele de clasificare se afl n grupa celor ce adopt punctul de vedere formal. Aspectele clasificrii
formale sunt: caracteristicile construciei testului, materialele pe care le utilizeaz testul, felul realizrii
comportamentului revant diagnostic, felurile de reacie care sunt pretinse i modul de realizare a
evalurii. Cronbach, Eysenck, Michel, Lienert, Ingekamp i Irle fac referiri asupra criteriilor de clasificare
formale. Acest punct de vedere poate s fie important mai ales pentru practicieni, deoarece pentru
acetia este foarte important s tie dac un test poate fi aplicat individual sau n grup, dac face apel la
exprimarea verbal n efectuare, dac pretinde reacii motorii n rspuns. Clasificarea care adopt acest
punct de vedere are un dezavantaj clar prin faptul c nu face nici o referire la scopul unui procedeu de
examinare, deci nu se tie nimic despre ceea ce conine un test, despre ceea ce trebuie s msoare un
test. Este, de asemenea, dificil s ne exprimm clar n privina domeniile de aplicaie ale unui test.
Practic testele de inteligen se pot ncadra n oricare din clasificrile adoptnd punctul de vedere
formal. Cele mai importante criterii de clasificare ale grupei de clasificare formal sunt:
Dac lum n consideraie gradul de standardizare i cuantificare, testele se mpart n psihometrice
(evaluarea se produce numeric i prin norme) i nepsihometrice (care fac apel n elaborarea
concluziilor la virtuile clinice de exprimare). Acesta este un punct de vedere ntlnit n bibliografia
de specialitate nu este mprtit de autorul acestei lucrri (care a definit anterior testul ca un
procedeu de investigaie standardizat). Aceasta nu nseamn c putem ignora alte puncte de
vedere exprimate de autori cu experien n domeniul teoriei i practicii aplicrii testelor psihologice.
Diviziunea n teste standardizate (etalonate) i nestandardizate (informale) se ntlnete ntr-un
tratat al crei autor este Gustav A. Lienert10. Dup concepia autorul amintit testele informale sunt
destinate uzului personal al psihologilor i profesorilor, care i propun, de exemplu, s claseze
doar membrii unei singure clase colare cu care lucreaz frecvent. Rezultatele testelor
standardizate capt semnificaie cantitativ prin raportare la cele ale unui grup de referin, numit
i grup normativ.
n privina posibilitii de a examina simultan mai muli subieci distingem ntre teste individuale i
teste colective sau teste de grup. Testul individual are dezavantajul care const n alocarea unui
timp de aplicare crescut pentru un singur subiect, dar are avantajul c ofer posibilitatea de a
Anul care este trecut n parantez este cel al ntocmirii unor sisteme de clasificare de ctre autorii respectivi. Precizrile
sunt realizate n limita bibliografiei parcurse.
10 Lienert, Gustav.A., "Testaufbau und Testanalyse", Verlag Julius Beltz, Weinheim/Berlin, 1967, pag.21
9

10

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

observa mai bine reaciile particulare n timpul examinrii. Testul colectiv are ca principal avantaj
economia de timp a examinrii i ca dezavantaj observarea insuficient a subiectului. Clasele
rezultate din operarea cu acest criteriu de diviziune interfereaz cu cele rezultate din aplicarea altor
criterii de clasificare i sunt , de asemenea, interanjabile n interiorul aceluiai criteriu. Astfel,
majoritatea testelor colective sunt teste creion-hrtie i majoritatea testelor individuale sunt teste
aparative sau de prelucrare a materialelor. O tendin demn de luat n seam este aceea a
transformrii testelor individuale n teste colective, prin computerizare Astfel testele care presupun
evidenierea timpului de reacie, simplu sau complex, pot fi efectuate colectiv prin deservirea de
ctre acelai computer a mai multor instalaii de examinare.
Din punctul de vedere al medium-ului testului, care privete suportul informaional al testului, se
poate vorbi de teste creion-hrtie, teste de reacie verbal, teste de manipulare i prelucrare
materiale, teste imagini, teste care apar pe display-ul computerului, teste aparative. Clasele
constituite prin activarea acestui criteriu sunt ntr-o interanjabilitate accentuat, fapt care face ca
anumite clase s fie golite, aspirate de alte clase. Este cazul testelor creion-hrtie care sunt
transformate, ntr-o proporie apreciabil, n teste computerizate.
n funcie de utilizarea formei verbale de exprimare n producerea rspunsului la situaia
problematic pe care o cuprinde testul, deosebim ntre teste verbale (care depind, de cele mai
multe ori de nivelul de cultur al subiectului) i teste non-verbale (care nu depind de nivelul de
cultur, create special pentru a contracara influena acestuia); n decursul istoriei exploatrii
diagnostice a testelor psihologice s-a reproat deseori testelor c favorizeaz subiecii care provin
din straturi sociale cultivate. Forma non-verbal de exprimare este parial sau total, adic poate
aparine doar subiectului, cruia i se poate adresa pentru a nelege ce are de fcut, sau att
subiectului ct i examinatorului, mai ales n examinarea surdo-muilor. Pentru exprimarea
rspunsurilor acestei categorii de teste se poate folosi ntreaga gam a comunicrii paraverbale.
n funcie de numrul dimensiunilor cuprinse n destinaia psihodiagnostic a testului, deosebim
teste unidimensionale(exemplu MMQ aparinnd lui H.J. Eysenck, KLT, aparinnd lui H. Dker) i
teste multidimensionale (IST, aparinnd lui R. Amthauer i PIT, aparinnd lui E. Mittennecker)
Acest criteriu este exprimat i prin formularea de teste singulare (care posed o singur
component) i baterii de teste. Testele singulare11 nu se confund cu testele individuale cu care
pot doar interfera. Atributul de singular se refer la numrul componentelor testului, pe cnd cel
individual la faptul c se poate aplica unui singur individ. Testul singular poate fi aplicat individual
sau colectiv, iar testul individual poate fi unidimensional sau multidimensional. Exigenele n privina
realizrii unidimensionalitii unui instrument de investigaie psihodiagnostic sunt foarte ridicate,
deoarece faptul psihic este prin esena sa se afl n interdependen, i nu se realizeaz dect
imperfect.
Dac lum n consideraie gradul de structurare a configuraiei stimulilor care provoac
comportamentul analizat facem separare ntre teste nalt structurate i teste slab structurate.
Stimularea n cazul testelor slab structurate nu este dat sub forma unei solicitri ce presupune o
form de rspuns dihotomic sau polihotomic, ci sub o form care impune un efort de structurare
din partea subiectului.

Denumirea reprezint traducerea termenului german Einzeltest, ntlnit n Rolf Brickenkamp (hrsg.), "Handbuch
psychologischer und padagogischer Tests", Hogreffe, Verlag fur Psychologie, Gottingen, Bern, Toronto, Seattle, 1997,
pag.XV.

11

11

AUREL STAN

n funcie de felul comportamentului provocat sau comportamentului indus prin situaia de testare,
avem teste care cer un comportament maximal, care presupun mobilizarea subiectului pentru
atingerea unui nivel de randament ct mai nalt, i teste care provoac un comportament tipic, cum
este cazul testelor de personalitate, la care rspunsul cuprinde opiuni bazate pe sistemul moral valoric al examinatului sau pe gusturile, nclinaiile, preferinele acestuia. Rspunsurile ce provoac
un comportament tipic nu pot fi considerate bune sau rele, corecte sau incorecte.
n funcie de limita de timp pentru efectuarea testului, deosebim doar n cadrul testelor ce provoac
un comportament maximal teste de rapiditate (speed test) i teste de nivel (power test), ns n
majoritatea situaiilor practice avem de-a face cu o mixtur ntre cele dou clase. Testele de
rapiditate cuprind sarcini (itemi) de dificultate medie i uoar ntr-un asemenea numr nct nici un
subiect nu poate s rspund la toate ntr-un anumit timp prestabilit. Un exemplu pentru testele de
rapiditate este unul din cele mai vechi teste (din 1895), i anume testul Bourdon-Amfimov n care
se cere subiectului de bara literele O i C n cadrul unor rnduri de litere diverse care le conin pe
cele dou. Se pune accentul n aprecierea randamentului pe rapiditatea n rezolvarea sarcinilor.
Testele de nivel (numite n literatura de specialitate de limb englez power test sau level test)
cuprind sarcini care ridic continuu gradul de dificultate, nct ultimele sarcini abia sunt rezolvate,
cu toate c limita de timp este generos acordat.
O separare frecvent n spaiul cultural anglo-saxon i foarte redus n cel german este ntre
"aptitude tests" i "achievement tests", cele din urm urmrind diagnosticarea cunotinelor i
dexteritilor dobndite prin exerciiu i colarizare;
O serie de autori, dintre care enumerm pe P. Horst (1971), J.P. Guilford (1954), R.B. Cattell
(1962) i E. Todt (1968), deosebesc ntre teste normative i teste ipsative. n cadrul acestei
distincii referirea se face la dou feluri de msurare: normativ i ipsativ. Am mai amintit faptul
c, n cadrul opticii normative, aprecierea valoric a unui rezultat individual se face prin raportare la
rezultatele unui grup, numit grup de referin. n cadrul unui instrument de msur ipsativ, valorile
de punctaj pentru o anumit caracteristic supus msurrii nu sunt comparabile de la un subiect la
altul, ci ele au semnificaie numai n relaie cu un singur subiect. deci suntem n prezena unui
univers de apreciere strict personal;
Dac lum drept criteriu libertatea posibilitii de reacie avem teste cu dispozitiv de rspuns creativ
sau deschis i teste cu dispozitiv de rspuns legat sau nchis. La primul fel de dispozitiv de
rspuns, subiectul are libertatea producerii rspunsului, iar la al doilea trebuie s aleag dintr-o
serie de rspunsuri oferite;
O separare similar cu cea anterioar distinge ntre testele formale i cele informale. Testele
formale sunt testele n care forma de interpretare a rspunsului este strict condiionat de o
terminologie prestabilit . Testele informale sunt cele care las un anumit grad de libertate n
aceast privin. Revine, n aceast mprire dihotomic, problema standardizrii instrumentelor
de msur, deoarece standardizarea este o exigen i pentru partea de interpretare a
rspunsurilor;
Un criteriu formal de clasificare a testelor este cel referitor la interpretare. Astfel, se deosebete
ntre teste directe sau psihometrice i teste indirecte sau proiective. Cele proiective se mpart la
rndul lor n realiste (exemplu TAT) i simbolice (exemplu Rorschach). De asemenea, un criteriu

12

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

care posed clase care interfereaz cu cele ale altor criterii. O parte din clasificatorii testelor
psihologice utilizeaz denumirea de tehnici proiective, n loc de teste proiective;
Deosebirea ntre teste psihometrice clasice i teste probabiliste se face n funcie de structurile
sintactice i semantice ale modelului care se afl la baz construciei lor.
Punctul de vedere formal este util pentru practicieni, deoarece este important de a ti dac un
test poate fi aplicat n grup sau individual, dac are exigene speciale n privina nivelului verbal de
exprimare, dac cere sau nu reacii motorii n privina rspunsului. Dezavantajul principal al clasificrii
care adopt punctul de vedere formal const n faptul c acesta nu spune nimic despre scopul unui
procedeu de investigaie psihodiagnostic, adic despre coninutul unui anumit test. Specialistul care se
intereseaz de un test n scopul de a-l folosi, dorete n primul rnd s tie ce variabile sunt msurate i
dup aceea sub ce modaliti formale se realizeaz cel mai bine. S-a tratat n primul rnd criteriile
formale, deoarece n privina lor exist un mai mare acord ntre autorii de specialitate care au efectuat
clasificri.
Aspectele de coninut ale clasificrii, chiar cu dezacordurile care se manifest, sunt
indispensabile pentru orientarea practic a psihologului i psihopedagogului. Prin aspectele de coninut
s-ar putea nelege domeniile de aplicaie ale diverselor teste, dar, n acest caz, un test de inteligen sar putea plasa n aproape toate domeniile de aplicaie. Cel mai adesea, clasificarea de coninut a
testelor psihologice rspunde la ntrebarea: Ce caracteristic examineaz, de fapt, respectivul procedeu
de investigaie psihodiagnostic?
Dei este un teren mai diversificat, cmpul clasificrilor de coninut posed o clasificare larg
acceptat n teste de aptitudini (teste de inteligen i teste de randament), pe de o parte, i teste de
personalitate, pe de alt parte. Este adevrat c dihotomia aptitudine (respectiv capacitate) i
personalitate este destul de greu de acceptat. Practic noiunea de personalitate implic i aspecte de
randament sau de capacitate. Ca atare, R.B. Cattel i F. Wurburton subsumeaz sub genul proxim
"Teste de personalitate" procedee pentru cuprinderea att a aptitudinilor, ct i a aspectelor eseniale
dinamic motivaionale i modalitilor temperamentale. n privina coninutului noiunii "teste de
randament" exist un mai mare consens dect n cel al noiunii de "test de personalitate". De mare
rspndire sunt clasificrile din punctul de vedere al coninutului, aparinnd lui L.J. Cronbach,
A. Anastasi, M. Irle, R. Brickenkamp i G. Lienert. Redm aceste clasificri de coninut care au o mare
circulaie:
ANA ANASTASI (folosim i denumirile n limba englez, des uzitate n lucrrile de specialitate):
1. Test of general intellectual development (Teste de dezvoltare intelectual general)
2. Test of separate abilities (teste de aptitudini(capaciti) individuale)
2.1. Measuring multiple aptitude (msurarea aptitudinilor multiple)
2.2. Special aptitude test (teste de aptitudini speciale)
2.3. Educational tests (teste educaionale)
2.4. Occupational test (teste ocupaionale)
3. Personality tests (teste de personalitate)
3.1. Self-report inventories (inventare de autoraportare)
3.2. Measures of interests and atitudes (msurare a intereselor i atitudinilor)
3.3. Proiectives techniques (tehnici proiective)
3.4.Other techniques for personality assessement (alte tehnici pentru evaluarea personalitii)

13

AUREL STAN

CRONBACH
1. Tests of ability (tests of maximum performance) - teste de capacitate (teste de performane
maxime)
1.1. Measure of general mental ability (msurarea capacitilor mentale generale)
1.2. Measure of special abilities (msurarea capacitilor speciale)
1.3. Aptitude tests (teste de aptitudini)
1.4. Achievement tests
1.5. Proficiency tests (teste de expertiz)
2. Tests of typical performance (teste de aptitudini tipice)
2.1. Behavior observations (observaii comportamentale)
2.2. Self report devices (procedee de autoraportare)
Denumirile claselor sistemelor de clasificare sunt trecute n limba englez de majoritatea celor
ce opereaz cu clasificri, din cauza unor ambiguiti de traducere a termenilor utilizai. Prin "general
mental ability" se nelege (frecvent, dar nu exclusiv) capacitate general n care importante sunt
activitile de gndire i nvare. La testele pentru examinarea capacitilor speciale i nzestrrilor se
poate deosebi ntre teste care sunt direcionate pentru cuprinderea funciilor sau capacitilor psihice
elementare i bateriilor de teste, care n spaiul lingvistic anglo-saxon sunt desemnate ca "multiple
aptitude batteries" (care trebuie s serveasc examinrii unor capaciti empirice delimitabile una de
alta). De la L.L. Thurstone i Thelma G. Thurstone avem denumirea "Tests of Primary Mental Abilities".
La doi autori americani exist tendina, aflat n permanent progres n SUA, de a dezvolta baterii de
teste pentru capaciti multiple care sunt fondate, de cele mai multe ori, pe analiz factorial. O parte
din aceste teste sunt folosite ntr-un domeniu ngust (examinarea aptitudinii pentru anumite profesiuni,
teste de selecie colar etc.), altele ntr-un domeniu mai larg.
BRICKENKAMP
1. Teste de randament
1.1. Teste de dezvoltare
1.2. Teste de inteligen
1.3. Teste generale de randament
1.4. Teste colare
1.5. Teste pentru examinarea funciilor generale i teste de aptitudini
2. Teste psihometrice de personalitate
2.1. Teste de structur a personalitii
2.2. Teste de dispoziii i interese
2.3. Teste clinice
3. Procedee de desfurare a personalitii
3.1. Procedee de interpretare a formelor
3.2. Procedee verbal-tematice
3.3. Procedee grafice i de structurare
n 1956, M. Irle ntocmete o clasificare n 4 grupe, clasificare aflat n legtur cu standardele

14

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

americane12:
1. Teste de inteligen general.
2. Teste de capacitate/teste de nzestrare.
3. Teste de cunotine/teste de randament.
4. Teste de personalitate.
n 1961, Gustav Lienert ntocmete o clasificare de larg rspndire:
1. Teste de inteligen: a. teste de inteligen general
b. teste speciale de inteligen sau teste de nzestrare
2. Teste de randament: a. teste de randament motric
b. teste de randament senzorial
c. teste de randament psihic
3. Teste de personalitate:
a. teste de caracteristici
b. teste de interese
c. teste de dispoziii,
d. teste de caracter
e. teste de tip.
Acestea sunt principalele sisteme de clasificare, care, ns, nu epuizeaz spectrul acestui
domeniu. Punem punct aici ncercrilor de clasificare a testelor psihologice i sub ameninarea briciului
lui Ockham, denumire a unui principiu atribuit lui W. Ockham i destinat s combat distinciile inutile
sau multiplicarea inutil a entitilor n filosofia medieval, principiu care are formularea urmtoare:
Entia non sunt multiplicanda praeter necessitatem (entitile nu trebuiesc nmulite peste necesiti).
I.1.5 Clarificri necesare
n continuare, ncercm s facem succint o serie de clarificri pentru anumite clase i
subclase ale sistemelor de clasificare din punctul de vedere a coninutului, comune sau necomune
sistemelor amintite anterior. Vom observa i aici clase ale sistemelor de clasificare ce se intersecteaz
n coninut i clase care sunt acceptate doar parial ca fiind teste. O serie de subdiviziuni ale sistemului
de clasificare le considerm de la sine clarificare, cum ar fi, de exemplu, testele de randament, n
calitate de categorie de teste n care se pune accentul pe cantitatea de sarcini rezolvate corect.
Vom ncepe comentariile noastre cu testele numite de dezvoltare. Referirea este la acele
procedee de investigaie care trebuie s cuprind nivelul de dezvoltare a unui subiect. n 1964,
G. Reinert face distincia ntre teste de dezvoltare primare i teste de dezvoltare secundare. Cele
primare definesc cursul dezvoltrii i au ca obiectiv cuprinderea nivelului de dezvoltare a
comportamentului, pe cnd la cele secundare obiectivul propriu-zis st n afara sistemului de referin
de diagnoz a dezvoltrii. Astfel, testele generale de randament sunt normate pe un larg domeniu de
vrste i las s se recunoasc anumite tendine de dezvoltare general. Denumirea cea mai frecvent
folosit n legtur cu diagnosticare nivelului de dezvoltare este cea de scal sau scar de dezvoltare.
Este necesar s facem o serie de precizri n privina noiunii de scal, a asemnrilor i deosebirilor
dintre scal i test. Exist o tendin de a considera sinonimi termenii test i scal. Se folosete curent

Dup Michel, Lothar, "Allgemeine Grundlagen psychometrischer tests", n "Psychologische Diagnostik" (hrsg. Prof. dr.
R. Heiss), Verlag fur Psychologie, Dr. C. Hogreffe, Gottingen, 1964.

12

15

AUREL STAN

expresia scala Binet Simon sau testul Binet-Simon, scala Terman-Merill sau testul Terman-Merill.13. De
asemenea, exist tendina de a considera scala o grupare de itemi referitori la un acelai aspect, deci
de a considera termenul scala rezervat construciilor psihodiagnostice unidimensionale. n cazul
chestionarelor de personalitate aceast tendin este cea mai justificat. Dar exist i scale
multidimensionale. WISC-ul lui Wechsler este o scal pentru diagnosticarea inteligenei la copil
compus din mai multe componente psihodiagnostice difereniate. Instrumentul pe ansamblu poart
denumirea de scal, iar componentele sale sunt denumite teste sau subscale. n bibliografia consultat
am ntlnit expresia testele scalei Binet Simon. Iat, deci, cum o scal cuprinde mai multe teste. Cu
toate acestea, noiunea de scal nu este supraordonat celei de test.
Termenul de scal ca instrument de investigare psihodiagnostic este o form particular a
scalei de msur n general care i propune s pun n eviden ansamblul modalitilor sau valorilor
observabile ale unei variabile14. Prin scal de msurare psihologic se nelege un instrument de
msur utilizat n psihologia aplicat care servete la ordonarea progresiv a unor niveluri. Fora
informaional a scalelor este foarte difereniat.
n domeniul psihometric prin scal se nelege un test sau o baterie de teste care-i permite de
a clasa subiecii n diferite niveluri. Nota definitorie a unei scale considerm a fi capacitatea acesteia de
a diferenia cel puin ordinal subiecii, de a-i plasa n funcie de un gradient al su, n funcie de
rezultatul obinut. Obiectele evalurii pot fi niveluri de dezvoltare intelectual (unde opereaz predilect
cu noiunile de vrst mental i I.Q), niveluri de dezvoltare motric, ct i niveluri de dezvoltare a
personalitii. n psihologia diferenial scalele sunt n general probe constituite din itemi ordonai prin
dificultate cresctoare, permind de a exprima niveluri adesea exprimate prin dificultate cresctoare.
Cele mai cunoscute sunt: Scala Binet-Simon (dezvoltare a inteligenei), scala Alexander (inteligen
ptratic, non-verbal), scala Brunet-Lzine (dezvoltare psihomotorie a primei copilrii sau de
maturitate mental) scala Columbia (scala colectiv de nivel intelectual), scala Grace-Arthur (scal de
inteligen non-verbal), scala Taylor (anxietate manifest), etc.
Testele de aptitudini. La autorii englezi care ntocmesc clasificri ale testelor psihologice poate
lua natere o ambiguitate n interpretare n privina termenului abilities, care se traduce prin aptitudine,
dar i prin capacitate. Aceeai ambiguitate poate lua natere prin traducerea termenului german
Fahigkeitstest. Ca atare, facem nc o dat precizarea c aptitudinea este o caracteristic subiacent,
indirect observabil. Pe lng acest sens general, sunt de luat n seam trei conotaii:
n primul rnd trebuie evideniat concepia lui L.L. Thurstone (n lucrarea sa Primary Mental
Abilities, aprut n anul 1938) care consider aptitudinile drept caracteristici elementare
fundamentale. n acest sens, testele de aptitudini furnizeaz o serie de caracteristici analitice,
evideniate n aa-numitele profile psihologice, care se opun scalelor de inteligen de tipul BinetSimon care sunt exprimate n I.Q. sau vrst mental. Aceast concepie a fost susinut de o
serie de cercetri de analiz factorial, nc de la nceputul dezvoltrii acestui model de cercetare.
Cercetrile lui R.B. Cattell depesc opoziia pe care aceast concepie se fondeaz i propune o
structur de aptitudini umane n form de arbore care se pune n aplicare ntr-un cmp din ce n
ce mai ngust.
Ultima expresie este utilizat de Maurice Reuchlin n "Grand dictionnaire de la psychologie", Larousse, Paris, 1992,
pag.254, n seciunea din dicionar rezevat precizrii termenilor de scal i scal de msur.
14 Aspectul general al scalei de msur este tratat detaliat n lucrarea: Clocotici, Valentin, Stan, Aurel Statistic aplicat n
psihologie, Polirom, Iai, 2000
13

16

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

n al doilea rnd, aptitudinile pot fi considerate ca drept caracteristici cognitive responsabile de


achiziia i de tratamentul informaiei. Ele se difereniaz de aceea a caracteristicilor motivaionale
i temperamentale, asigurnd anumite scopuri i conferind un anumit stil de funcionare acestor
mecanisme cognitive. Aceast distincie se reflect n separarea probelor de aptitudini de probele
de personalitate. i aceast distincie sufer pe parcurs o anumit relativizare, printr-o
personalizare a teoriilor cognitive (sintagm aparinnd lui Maurice Huteau).
n al treilea rnd, aptitudinile pot fi definite prin caracterul lor constituional (determinat de ctre
factori genetici). H. Piron este considerat principalul reprezentant al acestei optici tiinifice. n
aceast abordare, testele de aptitudini se disting n special de testele de cunotine achiziionate,
rezultatele lor nedepinznd de nici o cunotin specific prealabil. Deci, n optica acestei
concepii., tendina a fost aceea de a de a construi, pe ct posibil, teste n care rezolvarea s nu
depind de nivelul de cultur a subiectului. Ultima distincie ne amintete de disputa cercettorilor
privind influena factorilor genetici i a celor ambientali n determinarea variabilitii interindividuale.
Radicalismul unei astfel de opoziii este serios diluat de teoriile care pun accentul pe interaciunea
celor dou tipuri de factori.
Consideraiile anterioare constituie o tratare minimal a problemei aptitudinilor umane.
Testele de inteligen sunt cele mai perfecionate realizri ale testelor de aptitudini. Este
necesar s amintim faptul c, deocamdat, nu exist o definiie unitar a inteligenei, consecin
fireasc a abordrilor teoretice din unghiuri diferite a unui proces psihic deosebit de complex. Revoluia
cognitiv din cercetarea psihologic introduce un nou aparat conceptual, noi optici de abordare a
fenomenelor de care trebuie s in seama i autorii unor astfel de teste, mult extins fa de ceea ce
neleg n mod obinuit unii autori de teste prin inteligen. De aceea, este foarte important de a acorda
o atenie deosebit precizrii termenilor utilizai n cadrul manualului testului.
Testele colare i propun drept obiectiv diagnosticarea capacitilor i aptitudinilor elevilor.
Denumirea de teste pedagogice considerm c ar fi mai potrivit pentru o parte din ele. Cuprind teste
de calcul i de lectur, teste de ortografie, teste speciale de aptitudini colare, teste de nvare colar.
O parte din ele nu au referin valoric normativ a rezultatelor, ci doar la clasa de elevi la care se
aplic.
O precizare necesar este cea n privina termenului de inventar de personalitate, considerat
sinonim cu cel de chestionar de personalitate, instrument de investigaie (constituit sunt form de
scal) referitor la ansamblul personalitii sau la diferite componente ale acesteia. Am amintit anterior
faptul, c o parte din autorii care au ntocmit clasificri ale testelor psihologice contest acestora
calitatea de teste, datorit naturii subiective a rspunsurilor obinute. Considerarea termenilor inventar
de personalitate i chestionar de personalitate, pe de o parte, sinonimi cu cel de test de personalitate,
pe de alt parte, este o forare de interpretare. n unele cazuri, pentru a stabili mai clar distincia, se
folosete sintagma teste obiective de personalitate, coninutul rspunsurilor transpunnd un stil al
personalitii, cu mare constan de manifestare, cum se ntmpl ,de exemplu, n testul miokinetic al
lui Mira y Lopez.
Ceea ce este denumit de obicei prin termenul de tehnici proiective n cmpul instrumentelor
de investigaie psihodiagnostic constituie categoria cea mai exclus de la titlul de test psihologic,
datorit dificultii deosebite de a asigura criteriile de validitate (mai ales validitatea) i datorit dozei
mare de subiectivitate n interpretare. Se poate discuta, pe bun dreptate, dac denumirea de test, luat
17

AUREL STAN

n sens riguros psihometric se aplic cu adevrat la astfel de probe, n care standardizarea i


etalonarea las adesea de dorit, n care sensibilitatea, fidelitatea i validitatea sunt dificil de estimat15.
Un repro frecvent, care dovedete o bun doz de ignoran n privina acestor probe, este acela c
fenomenul de proiecie se produce mai mult la examinator dect la candidat. Cele mai frecvente referiri
la metodele de investigaie proiective se fac prin intermediul creaiilor din domeniu realizate de H.
Rorschach, L. Szondi, M. Lscher, S. Rosenzweig, H. Murray. Denumirea de metod proiectiv
aparine lui L.K. Frank i a fost folosit pentru prima dat ntr-un articol din anul 1939 aprut n revista
tiinific american Journal of Psychology. Termenul a fost creat pentru a pune n evidenia rudenia
dintre trei probe psihologice: testul de asociaie a lui Carl Gustav Jung, elaborat n anul 1904, testul
petelor de cerneal a lui Herman Rorschach, elaborat n anul 1920, i Thematic Apperception Test,
elaborat de Henry Murray. Tehnicile proiective se disting clar de testele de aptitudini prin ambiguitatea
materialului prezentat subiectului i prin libertatea de rspuns care i este lsat acestuia. Baza lor
teoretic, n centrul creia st noiunea de proiecie, este asigurat, n special, de psihologia dinamic i
de psihanaliz. Termenul de proiecie are mai multe sensuri, dintre care amintim16:

Un prim sens denot o aciune fizic de aruncare, de lansare a unui proiectil.. Trecnd pe plan
psihic, Sigmund Freud consider n acest sens proiecia ca o aciune psihic specific strii de
paranoia, care const n expulzarea din incontient a unor sentimente blamabile pentru a le
atribui altuia;

Al doilea sens este unul matematic, care apare n secolul XVII odat cu apariia geometriei
proiective. Prin proiecie facem s corespund unui punct (sau unui ansamblu de puncte) din
spaiu un punct (sau un ansamblu de puncte) unei drepte sau unei suprafee. n acest sens,
proiecia poate fi oblic, ortogonal, cilindric, stereografic, ortogonal. Transpunnd n planul
nostru de interes tiinific, testele proiective aduc subiectul n situaia de a produce un protocol de
rspuns a crui structur corespunde structurii personalitii, caracteristicile fundamentale ale
acesteia regsindu-se n aceast situaie;

Originea celui de-al treilea sens se gsete ntr-un fenomen optic pus n eviden la sfritul
secolului al XIX-lea, prin care, plecnd de la un focar de raze sau radiaii, se trimite o proiecia
luminoas pe o suprafa. Astfel, proiecia fixeaz o imagine pe un ecran, aa cum se ntmpl n
cinematografie. Sensul este adoptat i popularizat de ctre scriitorii sfritului de secol XIX, i,
ulterior, n psihopatologie i n psihologie. Un test proiectiv, precum o raz X, traverseaz
interiorul personalitii, fixeaz imaginea nucleului secret al acestuia pe un revelator (trecerea sau
efectuarea testului) i permite astfel o lectur facil prin mrirea sau proiecia ngroat pe un
ecran (interpretarea protocolului). Ceea ce era ascuns este pus n lumin, latentul devine
manifest, interiorul este adus la suprafa, ceea ce este stabil n noi se dezvluie.
Tehnicile proiective au rmas n practica psihodiagnostic (n ciuda reprourilor fcute) un
domeniu rezervat specialitilor din domeniu clinic care un deosebit sim al nuanei n observaie i un
rafinament deosebit n interpretare.

15vezi

Anzieu, Didier., Chabert, Catherine Les mthodes projectives, Presses Universitaires de France, Paris,1997 (11e
dition corrige), pag 14
16 apud. op.cit. pag 16

18

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

I.2 TEORIA CLASIC A TESTULUI PSIHOLOGIC


I.2.1. Precizri Atributul de clasic nu are, n cazul teoriei testului, o semnificaie depreciativ,
de depit ,simplu, revolut sau conservator, ci una valorizatoare, de bine fundamentat, echilibrat,
durabil. Acest atribut este justificat de faptul c principiile sale au fost stabilite de ntemeietorii stilului
sistematic i organizat n cercetarea psihologic, adic de reprezentanii colii psihometrice engleze.
Prezena acestei coli n crearea suportului statistic al cercetrilor experimentale n psihologie este o
permanen.
Baza sistemul de axiome sintactice de baz, cu tot eafodajul de formule i prescripii
procedurale ce decurg din acesta, a fost creat de Ch. Spearman ntr-o serie de lucrri tiinifice
publicate ntre 1904 i 1907 i a rmas aa pn la nceputul deceniului 6 al secolului nostru, cnd H.
Gulliksen l prezint cuprinztor i-l dezvolt pe baza unor ipoteze formal logice. C.J. Kousropoulos
(1962, 1964) i M.R. Novick (1966) au putut s arate ceva mai trziu c modelul teoriei clasice a testului
psihologic poate fi explicat prin ipoteze mai puine i mai slabe, adic mai uor de ndeplinit. Critici
accentuate i fac apariia chiar n timpul cizelrii sintaxei modelului clasic i a evidenierii problematicii
relevanei sale pentru procesul de msurare psihologic care se reflect n modelul testului prin ipoteze
ptrunztoare i totodat falsificabile. Ca orice realizare omeneasc i testul psihometric construit pe
axiomele clasice este considerat perfectibil, cu att mai mult cu ct rezultatele din practic impun
mbuntirea. Nu trebuie s uitm c fiecare teorie este un model simplificat al realitii, care se
ajusteaz mai mult sau mai puin realitii pe care ncearc s o descrie. n multe cazuri din cercetarea
psihologic, exist o puternic tentaie de a adapta datele la modele n loc de a adapta modelele la
date.
Raiunea de apariie a teoriei clasice a testului psihologic este aceea de a oferi un cadru
conceptual n scopul de a aprecia valoarea rezultatelor de msur obinute prin intermediul acestui
instrument de msur. Marea majoritate a testelor psihologice i prezint rezultatul brut sub forma unor
scoruri compozite. Acestea sunt dobndite prin nsumarea valorilor numerice ale itemilor, adic a
componentelor informaionale elementare, bazale ale unui test. Intereseaz n mod special cunoaterea
modului n care variana scorului total a unui test este influenat de varianele diferiilor itemi. n funcie
de mrimea varianei scorurilor totale ale unui test se poate face diferenierea cantitativ valoric a
caracteristicilor persoanelor supuse examinrii psihologice. O varian egal cu 0 reprezint o
contraindicaie absolut pentru folosirea unui test. Teoria clasic a scorurilor nu trateaz dect precizia
valorii numerice. Chestiunile privitoare la calitatea i pertinena acestei valori sunt tratate separat prin
intermediul studiului validitii. De altfel, atunci cnd vorbim de teoria testului putem s facem distincia
clar n teorii structural-funcionale ale testelor psihologice i teorii cognitiv-semantice. Primele teorii se
refer la structura i modul de funcionare a unui test, nu neaprat psihologic i secundele la coninutul
i semnificaia psihologic ale denumirii trsturii psihice presupus a fi diagnosticat. Ceea ce este
cunoscut sub numele de teoria clasic a testului psihologic poate fi denumit o teorie funcional, adic
o teorie care ncearc s explice modul de funcionare a unui testul sub aspectul relevanei cantitativinformaionale.

19

AUREL STAN

I.2.2. Postulatele teoriei clasice a testului psihologic.


n semnificaia sa general postulatul este o propoziie prim, adic nederivat din alte
propoziii, care se prezint sub forma regulilor de definiie, axiomelor, metaxiomelor, schemelor de
definiie, regulilor de interpretare i regulilor de deducie. Avnd n vedere faptul c postulatele se refer
la sisteme, putem spune c postulatele sunt exigene ideale de funcionare a sistemelor. n cazul n care
o realizare empiric a unui sistem teoretic nu satisface postulatele care stau la baza funcionrii sale, se
practic procedura reformulrii postulatelor, care devin mai slabe, adic mai uor de satisfcut.
Aceast nmuiere a postulatelor pentru astfel de cazuri nu poate fi considerat o abdicare de la
spiritul tiinific.
Fiecare lucrare care se consacr teoriei clasice a testului psihologic ncepe prin a prezenta
postulatele de baz proprii acestei teorii. Diferite lucrri tiinifice consacrate postulatelor teoriei clasice
a testului psihologic le prezint ntr-un numr variabile, desigur n urma unei operaii de condensare a
acestora. Astfel, J. Guthke, H.R. Bttcher i L. Sprung prezint ntr-o lucrare consacrat
psihodiagnosticului o grupare de 5 postulate17 ale teoriei clasice a testului, L. Michel i W. Conrad
prezint un numr de 9 axiome18 iar W. Kristof un numr de 419. Redm parafrazat n continuare
postulatele teoriei clasice a scorurilor, aa cum au fost concentrate ntr-o lucrare recent20 asupra
teoriei testului:
Postulatul 1. Scorul observat al unei persoane supus examinrii prin intermediul unui test
psihologic (X), este compus din suma scorului adevrat (notat prin V, o constant) i o eroare de
msur asociat acestui scor (notat prin E, o variabil aleatorie)
X=V+E
Deci, X este de asemenea o variabil aleatorie. Eroarea E poate avea valoarea 0, valori
pozitive ct i valori negative, n aa fel nct dup un numr infinit de aplicri la aceeai persoan a
aceluiai test rezultatele se distribuie normal (distribuie n care media este egal cu 0 i abaterea
standard egal cu 1). Msurarea nu este nevoie s fie efectuat cu acelai test, ci i cu teste strict
paralele, adic teste care, aplicate pe aceeai subieci, dau distribuii cu aceeai medie i aceeai
varian (asupra noiunii de test paralel vom reveni la capitolul consacrat fidelitii. Folosind o
exemplificare fictiv, situaia reaplicrilor aceluiai test sau a unor teste strict paralele la acelai individ
s-ar prezenta astfel:
Test
1
2
3
4

X
60
45
53
59
.
62

V
55
55
55
55
.
55

E
5
-10
-2
4
7

Guthke; Bottcher; Sprung (hrsg.), Psychodiagnostik", Band I, Deutscher Verlag der Wissenschaften, Berlin 1991.,
pag.133
18 Michel, Lothar; Conrad, Wolfgang, "Theoretische Grundlagen psychometrischer Tests" n "Grundlagen psychologischer
Diagnostik", herausgegeben von Prof.Dr Karl-Josef Groffmann und Prod.Dr.Lothar Michel, Mannheim, Enzyklopedie der
Psychologie, Band I, Verlag fur Psychologie, Dr C.J.Hogreffe, Gottingen, Toronto, Zurich, 1982., pag.17-19.
19 Kristof, Walther Klassische Testtheorie und Testkonstruktion, n Feger, Hubert.,Bredenkamp, Jrgen, Messen und Testen,
Verlag fr Psychologie, Dr. C.J. Hogrefe, Gttingen, Toronto, Zrich,1983, pag. 545 - 547
20 vezi Laveault, D., Gregoire, J., "Introduction aux theories des tests en sciences humaines", De Boeck & Larcier .a. 1997,
Paris, Bruxelles, pag. 132-134.
17

20

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

Postulatul 2. Valoarea ateptat pentru scorul observat este scorul adevrat


( X ) = V

Aceast formul art c scorul adevrat obinut de un subiect este sperana matematic a
scorurilor observate. Precizia unui scor observat crete odat cu numrul de aplicri a testului.
Dac se aplic de multe ori acelai test la acelai subiect, media rezultatului va fi egal cu scorul
adevrat. Dispersia scorului observat X n jurul scorului adevrat V constituie eroarea de msur
pentru ansamblul acestor aplicri.
Postulatul 3. ntre eroarea de msur i scorul adevrat al unui subiect nu exist corelaie. (sau
exist o corelaie nul).
V = 0

Aceasta nseamn c eroarea ntmpltoare de msur nu va fi mai mare dac subiectul posed
un scor adevrat ridicat, sau mai slab, dac el posed un scor adevrat slab.
Postulatul 4. Erorile la dou teste diferite ( E1 i E 2 ) nu sunt corelate ntre ele

E E = 0
1 2

Postulatul 5. ntre eroarea de msur la un test i scorul adevrat la un alt test nu exist corelaie.
E 1V 2 = 0

Postulatul 6. Dou teste X i X' sunt paralele dac, i numai dac, scorurile lor adevrate i erorile
lor de msur sunt egale:
V=V'
E = E'

Din cauza postulatului 1 care stipuleaz c scorul observat este suma unui scor adevrat i a unui
scor de eroare aleatoare, decurge c dou teste paralele vor avea sensibil aceeai medie i
aceeai varian a scorurilor observate.
Postulatul 7. Un test este -echivalent (tau echivalent) cu un alt test, cnd scorurile lor adevrate
difer printr-o constant aditiv k.
V1 = V2 + k

Astfel dac 4 subieci obin notele 23, 45, 67, 55 la un test i 34, 56, 68, 66 la un alt test, constanta
k are valoarea 11. Testele paralele satisfac exigena de -echivalente pe cnd reciproca nu este
adevrat.
Putem rezuma uor ansamblul celor 7 postulate a teoriei clasice a testului prin aseriunea c
erorile aleatoare de msur trebuie s fie independente n orice circumstan. Ca atare,condiiile de
examinare trebuie s fie pregtite n aa fel, nct s nu existe corelaie ntre scorurile adevrate ale
unui subiect, eroarea de msur la un test i eroarea de msur la un alt test. Fr ndeplinirea unor
condiii minimale, scorurile observate devin dificil interpretabile. Teoria clasic a scorurilor ia n
consideraie o eroare strict ntmpltoare.
Pentru un grup de subieci examinai cu un acelai test situaia rezultatelor scorurilor se poate
prezenta n felul urmtor (date fictive):
Subiect
1 2 3
4
5
6
7
8
9 10 11 12 Medie Varian
Scor observat(X) 8 8 5
9
3
7
8
5 10 7
8
9
7,25
3,68
Scor adevrat(V) 9 9 5
8
5
8
6
5
8 7
8
9
7,25
2,35
Eroare(E)
-1 -1 0
1 -2 -1
2
0
2 0
0
0
0,00
1,33
Tabelul 1. Cuprinde rubrici exemplificative ale raporturilor dintre scorul adevrat i scorul observat
21

AUREL STAN

Din tabel se observ c scorul observat este format din suma scorului adevrat i a erorii:
X=V+E. n cazul unui scor compozit variana scorului total are urmtoarea formul:
S X2 = SV2 + S E2 + 2COVVE . Dac avem n vedere faptul c valoarea covarianei dintre V i E este
egal cu 0, atunci formula se transform n felul urmtor: S X2 = SV2 + S E2 . n cazul nostru concret 3,68 =
2,35 + 1,33.
Adiia unui mare numr de astfel de erori care apar n stnga i n dreapta mediei duc la un
rezultat nul. Dar exist i erori sistematice ale cror efect se manifest constant i, n acest caz,
rezultatul adiiei nu mai este nul. Preocuparea pentru astfel de erori nu mai intr n sfera teoriei clasice a
scorurilor, ci n cea a validrii rezultatelor (n cazul cnd o prob este prea uoar sau prea dificil apar
astfel de erori). n acest caz, ecuaia de la postulatul 1 se poate rescrie n felul urmtor:
X=V+ es + ea
Scorul observat este egal cu suma unui scor adevrat, a unei erori aleatoare i a unei erori
sistematice. Vom fi n faa unei astfel de situaii n cazul n cnd un examinator insist asupra unui
aspect foarte facil al disciplinei sale i, n consecin, toi examinaii vor lua note maxime Eroarea
aleatoare va fi cu totul i cu totul derizorie n comparaie cu cea sistematic. Noiunile de validitate i de
fidelitate se pot reprezenta n funcie de proporia varianei scorurilor observate imputabil varianei
pertinente ( 2v ) , varianei nepertinente ( 2vs ) sau varianei erorii ( 2ea ) . Un constructor de test are
drept scop maximizarea prii scorului adevrat, care este pertinent la ceea ce dorete s msoare, i
minimizarea erorii aleatoare de msur. Pentru a reui acest lucru este necesar ca variana scorului
adevrat s ocupe o mare proporie din variana scorului observat i ca variana erorii sistematice s fie
minimal.
n practica aplicrii testelor psihologice, erorile pot aprea din urmtoarele direcii (surse):
Din partea subiecilor care particip la examinare, prin lips de motivare n obinerea unui
randament bun, concentrare deficitar, stare precar a sntii, oboseal accentuat. Erorile
cauzate de factori de natur fiziologic sunt printre cele mai imprevizibile i mai individualizate.
Deloc neglijabil este sursa de eroare datorat lipsei de experiene a subiecilor n efectuarea unui
test. Postura de participant la testare este relativ nou pentru unii subiecii din ara noastr, fapt
care le poate produce diminuarea randamentului. Trebuie s inem cont i de existena
specialitilor care antreneaz o serie de subieci pentru situaia de testare psihologic. O specie
aparte de erori din aceast categorie este aceea realizat de subieci care fac parte dintr-un
subgrup i au o motivaie diferit de cea a ansamblului grupului care particip la testare, mai ales
la testele care pretind un randament maximal.
Din partea psihologilor care realizeaz testare psihologic (printr-o serie de omisiuni n
instruciunile de aplicare, prin limbajul utilizat, ambiguitatea enunurilor) i a operatorilor implicai n
examinarea psihologic prin explicaii insuficiente primite pentru corectarea probelor, prin erori de
codificare i de corectare a rspunsurilor, erori n colectarea datelor (variantele computerizate
anuleaz posibilitatea unor astfel de erori, n majoritatea cazurilor);
Din partea testului nsui. Din aceast categorie de erori fac partea cele datorate eantionajului
itemilor care pot duce la versiuni lipsite de identitate a unor teste ce se consider paralele,
imprecizii de funcionare i nregistrare n cazul unor teste aparative, limitei improprii de timp date
pentru efectuarea testului;
Din cartea ambianei n care se desfoar testarea psihologic, care poate fi total improprie
pentru o examinare.
22

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

Erorile datorate testului nsui sunt mai uor de prevenit, dar cele datorate subiecilor sunt
dificil de evitat. R.L. Thorndike s-a ocupat special de inventarierea acestor erori. Aceast influenare
diversificat a erorii face ca autorii care au contribuii de valoare n domeniul teoriei testului psihologic
s formalizeze sursa erorilor, realiznd o descompunere a varianei erorii (Lord i Nowick, Gulliksen,
Magnusson, Horst, Lienert, Bernier i Petrulewicz, Monica Albu i Horia Pitaru)21. Astfel H. Guliksen
descompune variana total pentru nu import ce test(n care introduce i varianele erorii) n:
S2X = variana total;
S2V = variana adevrat;
S2EM = variana de eroare datorat msurii;
S2VEQ = variana adevrat specific;
S2EA = variana de eroare datorat condiiilor de administrare a testului,
S2EH = variana erorii datorat hazardului n rspunsuri.
S2ES = variana erorii datorat subiectivitii n corecie.22
S2VF = variana datorat fluctuaiei n scorurile adevrate, de la o ocazie la alta.
David Magnusson, caut s stabileasc direciile din care s-ar putea afecta variana scorului
total n cazul unei a doua aplicri a testului. i expune urmtoarea ecuaie23:
s t2 = s T2 + s e2( m ) + s e2*adm ( + s e2( g ) + s e2( subj ) + sT2 ( f ) , n care

s t2 = variana total a testului;


sT2 = variana adevrat, care este tratat(considerat) ca atare
s e2(m ) = variana erorii care este atribuit efectelor amintirii.
s e2(adm ) = variana erorii care este atribuit diversitii modurilor de aplicare a testului
s e2( g ) = variana erorii care este atribuit efectului explicaiilor date pentru efectuarea probei
s e2(subj ) = variana erorii care este atribuit obiectivitii deficitare
sT2 ( fl ) = variana adevrat, care exprim fluctuaia valorilor adevrate

I.2.3. Teoria probabilist a testului psihologic


n primul rnd, trebuie s specificm ce semnificaie are o teorie probabilist i care este
semnificaia termenului probabilist. Teoria msurrii precizeaz clar c sensul procesului de msurare
se bazeaz pe un model i trebuie s se raporteze la postulatele modelului. ntr-o form foarte general
de clasificare, modelele de msurare se divid n deterministe i probabiliste. Un criteriu de clasificare
foarte rspndit se refer la numrul dimensiunilor (dincolo de nivelul nominal rezultatele sunt
dimensiuni), clasificarea rezultat distingnd ntre modele unidimensionale, care permit doar o
dimensiune rezultant, i multidimensionale, care permit de a obine msurri pe mai multe dimensiuni.
Unidimensionalitatea poate fi tratat ca un caz particular al multidimensionalitii. Teoria probabilist a
testului psihologic se bazeaz pe un model probabilist de msurare.
Lucrarea noastr face referine insignifiante la demonstraii matematice ale formulelor utilizate, avnd ca justificare
argumentul c este inutil s redemonstrm ceea ce a fost deja demonstrat. Cititorii care doresc s parcurg aceste
demonstraii, le recomandm lucrrile autorilor enumerai n paranteza noastr. Vom utiliza, n cazul exemplificrilor, doar
formulele finale ale unor astfel de demonstraii.
22 Dup Bernier, J.J.; Pietrulewicz, B., "La psychometrie", Gaetan Morin Editeur, Montreal, Paris, Casablanca, 1997, pag. 115
23 vezi Magnusson, David, "Testtheorie", Verlag Frank Deuticke Wien, 1969, pag.114.
21

23

AUREL STAN

Facem o exemplificare, pentru modelele deterministe, cu modelul creat de Leon Guttman,


numit modelul ierarhic al lui Guttman sau modelului scalogramei multidimensionale. Prezentm un
exemplu fictiv, cuprinznd rezultatele binare a 6 subieci (Si) la 5 itemi (Ij), la o prob de raionament
deductiv (0-rspuns incorect,. 1 - rspuns corect).

S1
S2
S3
S4
S5
S6

I1
0
0
0
1
0
0

ITEMI
I2
I3
I4
0
1
0
0
0
0
0
1
1
1
1
1
1
1
1
0
0
0

MATRICE CU DATE PERMUTATE


I5
1
0
1
1
1
1

SUBIECI

SUBIECI

MATRICE CU DATE OBSERVATE

S2
S6
S1
S3
S5
S4

I5
0
1
1
1
1
1

I3
0
0
1
1
1
1

ITEMI
I4
0
0
0
1
1
1

I2
0
0
0
0
1
1

I1
0
0
0
0
0
1

Tabelul 2. Cuprinde matricea cu date observate(stnga) i matricea cu date permutate dup exigenele
scale Guttman (dreapta)
La examinare se pornete de la premiza c subiecii au poteniale difereniate n privina
raionamentului deductiv i c itemii nu au toi aceiai dificultate. Cercettorii i propun n urma acestei
examinri de a ordona att itemii (dup dificultatea lor) ct i subiecii dup potenialul lor). Cerina este
de a ordona subiecii n raport cu itemii i invers, n aa fel nct al doilea subiect plasat pe vertical s
fie mai capabil dect primul, al treilea mai capabil dect al doilea, .a.m.d. ( i al doilea item pe
orizontal d fie mai dificil dect primul, al treilea mai dificil dect al doilea). Din matricea permutat se
observ clar c un subiect care rezolv corect un item trebuie s rezolve corect i itemii de dificultate
mai mic. Realizarea acestui obiectiv presupune enunarea unor reguli de coresponden ntre
rezultatele empirice i rezultatul vizat. Matricea permutat poate fi transpus geometric printr-un model
al lui van der Ven, care indic faptul c dac o persoan a rspuns corect la un item, punctul care
reprezint persoana pe o dreapt care traduce poziia persoanelor i a itemilor va fi la dreapta punctului
care reprezint acest item. n cazul n care punctul va fi situat la stnga unui item acest fapt semnific
faptul c nu a rezolvat corect itemul respectiv24.
I5
I3
I4
I2
I1

S2
S6
S1 S3
S5 S4
Figura 1. Reprezentarea ordinii dificultii itemilor i ordinii capacitii persoanelor
n exemplul nostru fictiv nu exist nici o derogare de la model i datele se conformeaz
regulilor anunate. Un coeficient de reproductibilitate ne poate indica faptul dac un instrument de
msur construit dup modelul Guttman satisface exigenele sale teoretice. Se admite o toleran de
5% pentru devierea de la model pentru a pretinde c un instrument de msur se revendic de la teoria
lui Guttman. Rezultatul se consider a fi nregistrat pe un acelai continuum latent. Exemplificarea a fost
fcut pe unul din cele mai simple i mai cunoscute modele (un model unidimensional, folosindu-se
date dihotomice). Modelele mai complexe cuprind mai multe matrici de date n care se folosesc diferite
24

Adaptare dup Dick, P.; Tournois, Jocelyne; Flieler, Andre; Kop, Jean-Luc La Psychometrie, PUF, Paris, 1994, p.140.

24

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

tipuri de date pentru diferite nivele de msur (nominal, ordinal etc.). Practic modelele sunt construite pe
baza unor ipoteze de structurare a datelor i ofer proceduri de testate a postulatelor lor.
Modelul lui Gutman este un model determinist i implic urmtoarea supoziie: dac subiectul
domin itemul (expresia a domina nseamn c rspunde adecvat dificultii pe care o presupune, deci
stpnete dificultatea respectiv), valoarea scalar a subiectului este superioar valorii scalare a
itemului (ne referim la scala van der Ven). n schimb, n optica probabilist supoziia susine c dac
subiectul domin itemul, este probabil ca valoarea sa de scal s fie superioar aceleia a itemului.
Dac se ntocmesc curbe caracteristice ale itemilor (un graf al relaiei dintre un continuum
laten pe care itemul este destinat de a-l msura i probabilitatea de a furniza un rspuns corect), optica
determinist indic o trecere brusc de la 0 la 1 n cazul n care competena crete (funcia este
discontinu), pe cnd cea probabilist indic o relaie monoton cresctoare). n cadrul opticii
probabiliste rezolvarea unui item mai greu i euarea unuia mai uor nu constituie o violare a modelului.
Trecerea de la optica determinist la cea probabilist nu nseamn pur i simplu tolerarea erorilor, ci
gestionarea lor, adic nregistrarea i estimarea influenei acestora. Un model probabilist emite ipoteze
asupra distribuiei erorilor pentru a le putea estima, operaiune care lipsete celor deterministe.
n opoziie cu modelul clasic al testului psihologic, modelul probabilistic se edific pe ipoteza
c trsturile psihice, n calitate de dimensiuni latente, nu pot s fie puse pe aceleai plan cu
comportamentul observabil. Autorii principali care s-au dedicat acestei teme sunt: G. Rasch (1960),
P.F. Lazarsfeld i N.W. Henry (1968), F.M. Lord i M.R. Novick (1968), J. Rost i H. Spada (1978),
R.K. Hambleton i H. Swaminathan (1993)25. Valoarea observat a testului ndeplinete n calitate de
msurare deviat funcia unui indicator privind starea parametrului "latent trit", n consecin valorile
testului indic parametrul caracterului probabilist. Dezvoltarea unui test cu ajutorul cruia trebuie s fie
stabilit fundamentul pozitiv rezidual pe un continuum latent al caracteristicii presupune o teorie
psihologic, care se raporteaz la o lege general care guverneaz raportul ntre comportamentul
manifest n test i o dimensiunea latent (i descrie procesul probabilistic care determin intervale de
ncredere ale parametrului care se cere estimat). Testul, n calitate de instrument de investigaie,
indiferent dac este psihologic sau nu, duce implicit la concluzii cu caracter probabilistic. Probabilismul
exprimrii este o form adecvat de exprimare pentru studiile viznd domenii de cercetare
caracterizate de complexitate i dinamism.
Una din carenele analizei clasice a itemului este dat de faptul c proprietile metrice ale
acestuia sunt relative. Aproape toi indicii pe care noi putem s-i calculm depind de eantionul de
subieci utilizai, aceasta mai ales n domeniul cercetrilor de psihologie colar, unde problema
relativitii valorii itemilor se pune cu acuitat, deoarece examinarea cu acelai test de achiziii colare (n
momente diferite ale procesului de nvmnt) duce la oscilaii serioase ale indicelui de dificultate.
Cercetrile noastre cu testul Matricea Progresiv Raven arat clare oscilaii ale indicilor de dificultate a
itemilor prin trecerea examinrilor de la mediul urban la mediul rural, de la studii generale la studii medii
i superioare. Crearea bncilor de itemi ntmpin, din acest motiv al oscilaiei indicelui de dificultate,
serioase dificulti i problema care se pune este aceea de a crea itemi care s nu depind de grupul de
subieci pe care s-a calculat dificultatea. Mai ales n domeniul educaiei se pune problema crerii unor
scale absolute independente de un anumit grup de referin. Desigur aceasta pare o utopie, dar, prin
perseverena unor cercettori, utopiile pot deveni realitate. Primele ncercri n vederea crerii unei
25

Cifra din parantez reprezint anul aparitiei lucrrii pe acest tem.

25

AUREL STAN

scale care s nu depinde de un grup de referin au fost fcute de Guttman la nceputul anilor 50, n
scopul de a msura atitudinile.
Modelul probabilist se sprijin pe postulatul dup care calitatea unui rspuns este determinat
prin trstura msurat, dificultatea itemului i discriminarea itemului. Deci probabilitatea de a reui la
un item este o funcie a caracteristicii a subiectului (trstura msurat) i a proprietilor metrice ale
itemului (dificultatea i discriminarea sa). Psihometricienii au iniiat diverse modele de relaii funcionale
ntre item i caracteristica msurat. Un element comun la aceste diverse modele este faptul c ele
mprtesc postulatul c totalitatea itemilor unui test msoar aceeai caracteristic psihologic, dar
c nivelul rspunsurilor la acest item poate fi afectat prin erori aleatoare. Obiectivul unor astfel de
modele este acela de a permite o estimare a proprietilor metrice ale itemilor invariani pe suprafaa
unei populaii i, pe de alt parte, o estimare de trsturi psihologice independente de itemii utilizai
pentru a msura. Prin denumirea de MRI (Modele de Rspuns la Itemi) sunt reprezentate majoritatea
modelelor probabiliste26.

I.3. CRITERIILE DE APRECIERE ALE UNUI TEST


I.3.1. Consideraii preliminare. Controverse
nainte ca datele obinute prin aplicarea unui test psihologic s poat fi folosite n activiti
diferenial psihodiagnostice este necesar s precizm dac acestea ndeplinesc anumite condiii, printre
care condiia de a fi semnificative i de a avea un sens. Trebuie s fim siguri c msurm cu precizie
(dac valoarea indicat de instrumentul nostru de msur este reproductibil la a doua aplicare a
testului la aceeai persoan) i c msurm trstura sau caracteristica precizat anterior folosirii
testului i nu alta. ndeplinirea condiiilor de valabilitate a unui test trebuie stabilit n mare parte empiric,
adic prin aplicri i reaplicri impuse de nevoi psihodiagnostice concrete.
n privina stabilirii numrului acestor condiii sau criterii, menionm c nu exist unanimitate
a punctelor de vedere, deosebirile referindu-se att la denumirile criteriilor, ordonarea i ierarhizarea lor.
Exist optici restrnse i optici extinse de abordare a problematicii criteriilor de apreciere a testului
psihologic. Prezentm, n continuare punctele de vedere ale unor autori de specialitate care au avut
preocupri n acest domeniu.
Serge Chamboulant, autor francez cu preocupri n domeniul psihologiei aplicate, indic
calitile necesare ale testului, ca si ale oricrei msuri, n contextul msurtorilor n general, indiferent
dac sunt fizice sau biometrice. Conform exigenelor exprimate de S. Chamboulant, un test trebuie s
prezinte o noutate pentru subiect (exigen nu uor de satisfcut, mai ales n rile n care experiena
testrii psihologice este curent), s fie interesant i rapid, obiectiv n aplicaie i corecie (deci,
independent de calitile examinatorului), gradabil i sensibil pentru a putea msura cele mai infime
diferene ntre indivizi, fidel, adic s dea ntotdeauna aceleai note sau unele foarte apropiate, i valid,
adic s ndeplineasc rolul su de prognostic pentru succesul ntr-o anumit activitate27.
Autorul englez David Bartram acord, ntr-un articol dintr-o cunoscut lucrare destinat
construcie testului psihologic, o atenie aproape exclusiv fidelitii i validitii, abia amintind de
Informai suplimentare se gsesc n lucrrile Aurel Stan Testul psihologic, Editura Polirom, Iai, 2002 i Monica Albu
Construirea i utilizarea testelor psihologice, Editura CLUSIUM.,1998 Cluj
27 vezi Chamboulant, Serge, "Manuel de Psychologie aplique", Payot, 1951, pag. 26.
26

26

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

existena altor criterii28.


Autorul german Jurgen Guthke consider c printre calitile testului psihologic figureaz
concordana interpersonal sau obiectivitatea, validitatea sau valabilitatea, fidelitatea sau precizia de
msurare, sensibilitatea i, n final, normativitatea29.
n binecunoscutul su tratat consacrat analizei i construciei testului psihologic Gustav
Lienert ntocmete o clasificare n care grupeaz criteriile de apreciere (Gutenkriterien) n principale i
secundare. Din cele principale fac parte obiectivitatea, fidelitatea (Reliabilitt) i validitatea, iar din cele
secundare normativitatea, comparativitatea, economicitatea i utilitatea30. Considerm c acest gen de
clasificare este pertinent pentru o cercetare sistematic a testului psihologic.
Ursula chiopu apreciaz un numr redus de caliti, i anume validitatea, omogenitatea sau
fidelitatea i sensibilitatea31. Identificarea omogenitii cu fidelitatea o apreciem ca o expresie a
confuziei dintre parte i ntreg sau a unei proceduri cu un ansamblu procedural.
Peter R. Hofstatter afirm c n faa testelor se ridic 3 exigene: a) de a diferenia subiecii
unii de alii; b)de a face aceast difereniere n mod precis i c) de a o face ntr-un mod relevant
diagnostic. Prima cerin desemneaz normativitatea sau standardizarea drept criteriu de apreciere, a
doua fidelitatea, iar a treia validitatea sau valena diagnostic. Punerea semnului de identitate ntre
normativitate i standardizare este, cu siguran, o forare n interpretarea acestor noiuni32. Aspectele
la care se refer standardizarea sunt mai diverse dect cele n care se opereaz cu norme.
Claude Duhamel este foarte succint n prezentarea calitilor testului, enumernd etalonarea,
sensibilitatea i validitatea n una din lucrrile relativ moderne de prezentare a testelor care se folosesc
n recrutarea personalului33.
Wilhelm Hehlmann consider c valoarea diagnostic a unui test depinde de standardizarea
sa, fidelitatea i validitatea sa34.
n una din lucrrile de referin din literatura de specialitate romneasc asupra metodelor de
psihodiagnostic, Mariana Roca descrie calitile testelor ca fiind standardizarea, etalonarea (care stau
la baza construciei testelor), fidelitatea, validitatea i sensibilitatea35.
ntr-o lucrare recent referitoare la testele de tip "screening", Nicolae Mitrofan prezint o serie
de caracteristici ale acestora ca etalonarea, economicitatea, fidelitatea, validitatea, utilitatea i
standardizarea. Autorul i sprijin afirmaiile pe autorii americani B.A. Wasik i J.S. Meisels din anul
1990. n cadrul prezentrii testelor pentru examinarea copilului mic se face referire mai ales la validitate
i fidelitate36.
Heiner Lagewie i Wolfram Ehlers consider "Gutenkriterien" obiectivitatea, fidelitatea i
validitatea37.
Bartram, David, "Fidelit et Validit", n Beech, John R., Harding, Leonora, "Tests, mode d'emploi. Guide de
psychometrie", ECPA, Paris, 1994.
29 Gurhke, Jurgen, "Testtheorie (Testmodelle)", n Guthke, Bottcher, Sprung, "Psychodiagnostik", VEB Deutscher Verlag der
Wissenschaften, Berlin,1990.
30 Lienert, Gustav, "Testaufbau und Testtheorie", Verlag Juliusz Beltz, Weinheim/Berlin, 1967, pag.12.
31 vezi "Dicionar de Psihologie" (coordonator Ursula chiopu), Editura Babel, Bucureti, 1997, pag.692.
32 Hofstatter, Peter R., "Psychologie" ,S. Fischer Verlag, Frankfurt am Main, 1972, pag, 292.
33 v. Duhamel,Cl.,"Le choix des tests de recrutement. Guide du professionel", Les Ed.des Organisation, Paris, 1992, p.34-37.
34 v. Hehlmann, Wilhelm, "Worterbuch der Psychologie", Alfred Kroner Verlag, Stuttgart, 1968, pag. 580-581.
35 vezi Roca, Mariana, "Metode de Psihodiagnostic", Editura Didactic i Pedagogic, Bucureti, 1970, pag 22-28.
36 vezi Mitrofan, Nicolae, "Testarea psihologic a copilului mic", Edit. Press Mihaela, Bucureti, 1997, pag.20-21.
37 vezi Lagewie, H., Ehlers, W., "Kanurs Moderne Psychologie", Droeme, Knaur, Munchen, Zurich, 1978, pag. 20-21.
28

27

AUREL STAN

O foarte interesant prezentare a calitilor testului psihologic o fac Lothar i Helga Sprung
ntr-o lucrare consacrat metodicii i metodologiei psihologice. Criteriile de apreciere care sunt atribuite
testului fac parte i din sistemul metodicii psihologice n general, fiind enumerate validitatea, fidelitatea,
concordana interpersonal sau obiectivitatea, normativitatea i utilitatea. Fiecare din aceste caliti
suport efectul unei pedanterii taxonomice rar ntlnite (innd seama de informaia pe care o avem la
dispoziie)38.
Monica Albu i Horia Pitariu introduc ntre calitile testelor (cu referire special la testele de
cunotine) pe lng validitate, fidelitate, obiectivitate, putere discriminativ, aplicabilitate i o serie de
denumiri rar ntlnite la ali autori, i anume:
caracterul reprezentativ al testului (cu referire la itemii alei pentru a compune un test);
pertinena testului (gradul de respectare a criteriilor stabilite pentru selectarea ntrebrilor n aa fel
nct acestea s se conformeze scopului instrumentului de msur);
specificitatea testului (calitate care se dobndete n situaia n care un subiect care nu dispune de
cunotine care fac obiectul verificrii va obine un scor egal cu cel pe care l-ar fi realizat dac ar fi
rspuns la ntmplare)39.
Un termen similar pentru fidelitate este cel de fiabilitate, termen folosit exclusiv n
argumentaie de Dany Laveault i Jacques Gregoire, i ocazional de J.J. Bernier i B. Pietrulewicz.
Sensul este, credem, o transpunere a celui din tehnic, adic probabilitate a bunei funcionri a unei
componente sau a unui aparat ntr-o perioada de timp. Urmrind desfurarea de proceduri
demonstrative i de argumentare teoretic a autorilor considerm c suntem n prezena unei extensii
semantice binevenite a ceea ce era denumit pn acum fidelitate40.
Nu am trecut n revist dect o parte din consideraiilor unor autori ( condiionai fiind de
bibliografia parcurs), care au avut viziuni simplificante sau foarte extinse, considernd, totui, c am
conturat ansamblul criteriilor de apreciere a testului psihologic.
Vom cuta s abordm fiecare noiune care este considerat de autorii de specialitate drept
criteriu de apreciere sau calitate a testului (nsumnd acel ansamblu de trsturi, care n subsidiar se
sprijin pe un set clar precizat de proceduri statistico-matematice), satisfacerea sau ndeplinirea
ansamblului format de acestea conferind identitate metodei testului. Variaiile numrului de caliti ale
testului n abordrile diverilor autori au dou cauze: 1) extinderea semnificaiei denumirii de calitate
sau criteriu de apreciere a testului asupra unor elemente contextuale i conjuncturale care influeneaz
accidental, sporadic valorile rezultate dintr-o examinare i 2) preocuparea superficial pentru criteriile de
apreciere a n lucrri care aveau n atenie alte aspecte ale testului.
Autorii de notorietate care s-au ocupat de precizarea coninutului i fundamentarea criteriilor
de apreciere a testelor psihologice au avut n vedere preponderent dou criterii de apreciere,
considerate a fi cele mai importante: fidelitatea i validitatea. Dac aceste dou caliti nu sunt
asigurate, nu are nici un rost s ne ocupm de modul de satisfacere a celorlalte (pentru care exist
anumite tehnici constructive de ameliorare). Nici un fel de clasificare a criteriilor de valabilitate a testului
vezi Sprung, L.; Sprung, H., "Grundlagen der Methodologie + Metodik der Psychologie", VEB, Deutscher Verlag der
Wissenschaft, Berlin, 1987, pag.147-210.
39 vezi Albu, Monica; Pitariu, Horia, "Proiectarea testelor de cunotine i examenul asistat pe calculator", Editura Casa Crii
de tiin, Cluj, 1993, pag. 102-103.
40 vezi op.cit., pag 140-200.
38

28

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

psihologic nu omite fidelitatea i validitatea. Considerm c obiectivitatea este omis pe nedrept dintre
cele mai importante criterii. Ca atare ncepem cu aceast calitate a testului psihologic.
I.3.2 Obiectivitatea sau concordana interpersonal a testului psihologic
Obiectivitatea sau concordana interpersonal este gradul n care rezultatele unui test
psihologic sunt independente de persoana examinatorului care exploateaz psihodiagnostic acest
instrument. Putem spune c un test este deplin obiectiv atunci cnd diveri examinatori obin aceleai
rezultate la aceiai subieci. Desigur, n aplicrile practice se obine foarte rar strict acelai rezultat.
Faptul de a aplica a doua oar acelai test influeneaz rezultatul, de aceea putem vorbi de oscilaii
nesemnificative ale rezultatelor la folosirea testului pentru examinarea aceleai persoane de ctre alt
examinator. Subiectivitate poate surveni n trei faze diferite ale derulrii a testrii psihologice, motiv
pentru care vorbim de tot attea feluri de obiectivitate: obiectivitatea de realizare, obiectivitatea de
evaluare i obiectivitatea de interpretare. n primul caz, modul de a administra testul al unui examinator
nu ar trebui sa duca la obinerea unor rezultate semnificativ diferite la aceeai grup de subieci fa de
cele obinute de un alt examinator. n mod firesc, condiiile de administrare a testului trebuie s fie ct
mai asemntoare, dac se poate chiar identice, iar consemnul stabilit n caietul testului trebuie s fie
respectat cu strictee.
Obiectivitatea de evaluare este mai greu de atins fa de cea de realizare, iar cea de
interpretare este mai greu de atins dect cea de evaluare.
Testele sunt difereniate n ceea ce privete dificultatea asigurrii obiectivitii sau
concordantei interpersonale. Asigurarea este mai simpl la testele creion-hrtie care posed, n cea mai
mare parte, reguli clare de dare a rspunsului corect, de corectare i de evaluare i mult mai grea la
testele proiective unde pregtirea psihologului pentru test este de durat i unde intervine un numr mai
mare de criterii de evaluare i de interpretare. Metoda statistic folosit pentru calcularea indicelui de
concordanta interpersonal este cea a corelaiilor simple i multiple.
I. 3. 3 Fidelitatea testului
Fidelitatea unui test este dat de precizia cu care un test msoar o anumit caracteristic,
indiferent de faptul dac respectiva caracteristic este cea pe care pretinde c o msoar (care indic
validitatea testului).Termenul englezesc utilizat pentru fidelitate este reliability, termen tiinific de larg
circulaie.
n spiritul concepiei teoriei clasice a testului se afirm c diferena dintre scorul observat sau
msurat al unui test i scorul su adevrat trebuie s fie ct mai mic.
Raportul dintre cele dou variane definesc practic fidelitatea unui test, ca atare fidelitatea
=

var ianta scorului " ade var at" sT2


= 2 . Minimumul i maximumul teoretic al acestei valori sunt
var iant scorului masurat
sX

0,00 i +1,00. Rezultatul acestui raport poart numele de coeficient de fidelitate.


Pentru a putea discuta problemele fidelitii trebuie s precizm noiunea de test paralel.
Testele paralele sunt definite ca serii de operaii msurnd aceeai trstur n acelai grad. Maurice
Reuchlin definete astfel paralelismul testelor: Testele paralele sunt probe care au itemi de aceeai

29

AUREL STAN

dificultate i aceeai natur41.


Dac testul este un ansamblu de itemi i avem un test, de exemplu, de 100 de itemi, conceput
pentru a msura aceeai trstur, i-l divizm n 2 teste de 50 de itemi, sau 4 teste de 25 de itemi, sau
10 teste de cte 10 itemi, atunci subansamblele respective de itemi se pot numi teste paralele dac
satisfac urmtoarele condiii:
toate aceste subansamble de itemi trebuie a aib aceiai medie i aceste medii trebuie s fie
egale cu mediile scorurilor "adevrate";
ele trebuie s aib aceeai varian i aceste variane trebuie s fie egale varianei scorurilor
"adevrate";
indicele de corelaia intre oricare pereche posibil de itemi trebuie s fie de aceeai valoare;
subansamblele de itemi trebuie s prezinte toate aceeai corelaie cu orice alt variabil care nu
face parte din respectivul ansamblu de itemi42.
Condiiile ideale ale teoriei testului clasic nu se mplinesc aproape niciodat n practic.
Formele strict paralele sunt constituite din teste n care mediile, varianele scorurilor observate
i varianele erorii sunt identice pentru fiecare form i n situaia n care subiectul are acelai scor
adevrat n toate formele. Pentru instrumentele psihologice clasice, aceste exigene sunt lipsite de
realism.
Se vorbete de forme paralele tau echivalente atunci cnd se admit diferene ntre varianele
de eroare la dou forme i ntre varianele scorurilor observate, pe cnd mediile la cele dou scoruri
adevrate sunt identice
Formele esenial tau echivalente admit diferene ntre variane i mediile scorurilor. Scorul
adevrat pe care-l obine un subiect ntr-o form f este egal cu scorul pe care-l obine ntr-o form g
plus o constant. Constanta se raporteaz la form, nu la subieci. Dac Vpf exprim scorul adevrat
pentru subiectul p la versiunea f i Vpg, scorul adevrat al subiectului p la versiunea g, atunci relaia
liniar ntre cele dou scoruri adevrate este exprimat prin ecuaia urmtoare:
Vpf = Vpg = Cfg
Ne aflm n faa unei forme congenerice a paralelitii, atunci cnd se consider c scorurile
adevrate ale celor dou versiuni sunt perfect corelate. Relaia liniar ntre scorurile adevrate ale
subiectului p pentru versiunile f i g se exprim n forma urmtoare:
Vpf = bfgX Vpg+Cfg,
n care constantele bfg i Cfg nu depind dect de forme, nu de subieci. Se aplic mai ales atunci cnd
numrul de itemi variaz de la o form la alta. Varianele scorurilor observate f i g nu difer numai din
cauza eterogenitii varianei de eroare (ca n versiunea tau-echivalent), ci i din cauza eterogenitii
scorurilor adevrate. Joreskog, n anul 1971, a artat c formele paralele i formele tau-echivalente pot
fi considerate ca nite cazuri particulare ale formelor congenerice.
Dac acceptm constituirea unei mulimi de teste paralele, plecnd de la eantioane de itemi
extrai la ntmplare dintr-o populaie important de itemi posibili, atunci media fiecrui eantion de
itemi astfel constituit, prezint variaii i abaterea standard a unor astfel de variaii va fi egal cu
abaterea standard a populaiei de itemi divizat prin rdcina ptrat a numrului de itemi a fiecrui
vezi "Grand dictionnaire de la psychologie", Larousse, Paris, 1992, pag.543.
vezi Bartram, David, "Fidelit et validit", n Beech, R., Harding, Leonora, "Tests, mode d'emploi. Guide de psychometrie",
ECPA, 1994, pag. 68.

41
42

30

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

eantion, adic prin eroarea standard de msur a mediei. Avnd n vedere faptul c fidelitatea se
pronun n primul rnd asupra preciziei msurrii, un rol important n teorie l joac eroarea standard
de msur.
Formula erorii standard de msur(SE) este urmtoarea:
SE= s x x (1 rxx ) ;
n care sX = eroarea standard a scorurilor variabilei X i r xx = indicele de fidelitate
Cnd se utilizeaz un scor observat sau failibil (vulnerabil la eroare), eroarea standard a
msurii d o indicaie asupra intervalului probabilist de ncredere n care se situeaz scorul "adevrat".
Fr aceast informaie asupra preciziei estimrii un scor este practic inutilizabil. Ca atare media,
variana i eroarea standard de msur sunt cei mai importani indici statistici n psihometrie.
Cuantificarea fidelitii unui test are ca raiune obinerea estimaiei erorii standard de msur.
Asociaia Psihologilor Americani a elaborat un document. (1985), intitulat "Standards for
Educational and Psychological Testing", n care recomand constructorilor de teste de a comunica
eroarea tip de msur pentru diferite nivele ale scorurilor.
Maniera cea mai cunoscut de a asigura corelaia ntre dou forme paralele ale unui test este
de administra aceluiai eantion de subieci, n dou reprize diferite, acelai test. Corelaia care rezult
din dou treceri succesive ale aceluiai test se numete indice de fidelitate test-retest. Acelai test la
dou treceri succesive constituie echivalentul a dou forme paralele, deoarece aceiai itemi sunt utilizai
n timpul celor dou treceri succesive. Practic se msoar stabilitatea temporal a aceluiai test, motiv
pentru care coeficientul de corelaie obinut se mai numete coeficient de stabilitate. Durata de timp
ntre cele dou aplicri trebuie s fie o durat semnificativ, de obicei de ordinul lunilor, deoarece
reaplicrile imediate ale unui test conin n rezultat mai multe influene favorizante. n acest caz este
vorba de rezultatele la acelai test in momente temporale diferite. Se constant n general ca acest
coeficient de stabilitate se diminueaz cu timpul i este indicat de a lua n seam timpul scurs de la
efectuarea ultimelor calcule asupra fidelitii prin acest procedeu. Dac perioada de timp scurs este de
ordinul anilor, atunci ne putem atepta ca un coeficient de stabilitate s scad de la 0,90 (o corelaie de
bun nivel) pn la 0,60.
R.B. Cattell vorbete de o fidelitate test-retest de scurt termen i una de lung termen, fiecare
din ele furniznd informaii diferite. Cea de scurt termen (dou sptmni i chiar mai puin) mai este
numit i coeficient de ncredere (dependability) i indic gradul de ncredere ce se poate acorda
instrumentului utilizat. n acest timp nu se poate vorbi ntr-adevr de schimbri semnificative ale
trsturii msurate. R.B. Cattell conserv termenul de stabilitate asupra coeficienilor test-retest care se
realizeaz pe un interval temporar important, el susinnd c prin extragerea coeficientului de stabilitate
din cel de ncredere se poate obine partea varianei care este datorat fluctuaiilor reale ale trsturii.
n cazul n care perioada de timp este scurt la procedeul test-retest, prima efectuare poate
influena rspunsurile la a doua efectuare, mai ales la teste de randament.
Se consider c la acest fel de fidelitate exist tendina de supraestimare, prin manifestarea
varianei reziduale specifice itemilor, care reprezint variana sistematic specific a acestora.
n mediul constructorilor de teste exist tendina de a crea forme paralele ale aceluiai test.
Chestionarul de personalitate 16 PF, creat de R.B. Cattell are pn n prezent 4 forme (A, B, C, D).
Fiecare prob este compus din itemi diferii, ns i propune acelai scop psihodiagnostic. Dac prima
dat s-a aplicat forma A, retestul se face cu forma B, corelaia dintre cele dou forme numindu-se
31

AUREL STAN

fidelitate a formelor paralele, iar coeficientul obinut coeficient de echivalen. Acest coeficient de
fidelitate are, de obicei, o valoare mai mic dect cel de stabilitate.
ns, de multe ori nu este posibil de a gsi nici un test paralele i nu avem la dispoziie
sptmni sau luni pentru a atepta aplicarea aceluiai test, stndu-ne la dispoziie doar posibilitatea
administrrii unei singure probe o singur dat. Itemii pot fi tratai ca aparinnd la dou teste paralele.
Astfel, un test de 100 de itemi poate fi mprit n dou pri de cte 50 de itemi fiecare. Coeficientul
obinut se aseamn cu cel de echivalen,. dar testul nu conine n acest caz dect jumtate din
cantitatea de itemi folosit la alte forme. n asemenea situaii avem la dispoziie posibilitatea unei
2 xrxx
corecii a coeficientului de corelaie, utiliznd formula Spearman-Brown. Astfel rxx ' =
n care
(1 + rxx )
rxx este corelaia ntre cele dou jumti ale testului, rxx estimarea fidelitii ansamblului testului.
Aceast metod de mprite n dou a testului, care mai poart numele de metoda split-half,
informeaz despre omogenitatea sau coerena itemilor. n cazul n care corelaiile ntre itemi sunt
ridicate ne putem atepta ca i cele ntre dou jumti ale testului s fie ridicate. Media sumei
corelaiilor tuturor variantelor de njumtire a testului este foarte apropiat de media tuturor corelaiilor
interitemi. Dac cineva corijeaz media corelaiilor interitemi cu formula Spearman-Brown se obine un
coeficient egal cu media corelaiilor corijate ntre toate perechile posibile de partaj prin njumtire.
Coeficientul obinut se numete coeficient de consisten intern.
Consistena intern =

k r
1 (k 1) * r

n care k = numr de itemi paraleli i r = media corelaiilor interitemi. Pentru a estima coerena intern
trebuie s scindm ansamblul intemilor ntr-un mare numr de fraciuni, pe care trebuie s le corelm
(sferturi, optimi, aisprezecimi de test).
Un mod simplificat de a exprima simplificat consistena intern este exprimat prin formula a
lui Cronbach. :

s i2
k

=
* 1 ( 2 )
(k 1)
s X
n care k = nr. de itemi,

2
i

suma varianei itemilor i S 2T = variana testului. Teoria clasic a testelor

strict paralele este conform cu urmtoarele supoziii (postulate):


itemii msoar un factor sau o trstur i numai una;
corelaiile interitemi sunt egale;
itemii au variane egale;
itemii sunt de dificultate identic.
Formula a lui Cronbach presupune ca cel puin 3 prime condiii s fie verificate. J.F. Kuder
i M.V. Richardson dezvolt un sistem de ecuaii pentru aprecierea fidelitii, care sunt uzitate i se
dovedesc mai practice n utilizare. Aceste ecuaii, n denumire prescurtat, sunt: K-R 2, K-R 8, K-R 14,
K-R 20 i K-R 21. Ecuaiile Kuder Richardson prezint dou forme: una n care se utilizeaz variana
itemilor i alta pentru itemii cu rspuns dihotomic. Utilizarea lor este indicat n urmtoarele situaii:
n cazul n care nici o supoziie nu este verificat (K-R 2),
n cazul n care doar supoziia 1 este verificat (K-R 8),
32

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

n cazul n care primele dou supoziii sunt verificate (K-R 14),


n cazul n care primele trei supoziii sunt verificate (K-R 20),
n cazul n care toate cele patru supoziii sunt verificate (K-R 21)43. Pe plan formal, coeficientul a
lui Cronbach este echivalentul ecuaiei K-R 20.
Forma simplificat a ecuaiei Kuder-Richardson 20 este urmtoarea:

rxx =

pi * qi
k
* 1

(k 1)
s X2

n care pi este indicele de dificultate al itemului i qi este egal cu 1-p, k este numrul de itemi, s2x este
variana rezultatului global al testului. n cazul n care una sau mai multe supoziiile prezentate anterior
nu sunt verificate, atunci coeficientul obinut subestimeaz consistena intern.
Dup trecerea n revist a diferitelor metode de calcul a coeficientului de fidelitate se poate
concluziona c nu exist o identitate valoric a rezultatului dac folosim metode diferite. Este de
presupus c surse diferite de eroare influeneaz difereniat fidelitatea unui test. Pot interveni situaii
specifice n privina explicaiilor date pentru efectuarea testului, modul de administrare al acestuia i
modul de corectare. Poate interveni chiar i lipsa de stabilitate a trsturii n sine. H.J. Eysenck insist
asupra cercetrii fidelitii subiectului n privina unei anumite capaciti, nu doar asupra fidelitii probei
psihologice.
I.3.4 Validitatea testului psihologic
Validitatea unui test este acea calitate a testului de a msura o caracteristic pe care pretinde
c o msoar. n spiritul teoriei clasice a testului psihologic, Gustav Lienert considera c validitatea unui
test d gradul de precizie cu care acest test msoar faptic acea caracteristic a personalitii sau acel
mod de comportament pe care el trebuie s-l msoare sau pretinde s-l msoare44. Un test este deplin
valid cnd rezultatele sale permit o concluzie nemijlocit i fr greeli asupra gradului de reliefare a
caracteristicii comportamentale cercetate.
Stabilirea validitii este principala sarcin a celor ce construiesc i vor s impun n practic
folosirea unui anumit test psihologic. Spre deosebire de validitate, validarea este un ansamblu de
proceduri cantitative i calitative care au drept finalitate asigurarea validitii.
n sens general, validitatea este o proprietate a unui model, a unui enun, a unui concept, a
unui indicator specific a unui test statistic de a corespunde intr-un mod apropiat destinaiei pentru care
au fost create.
Acest concept trimite la relaia care exist ntre teorie sau orice element teoretic (model,
ipoteza, concept, instrument, test) i realitatea empiric pe care teoria consider c o reprezint.
Noiunea de validitate are o legtur strns cu aceea de adevr. A spune despre un model ca este
valid nseamn a afirma c entitile pe care le utilizeaz (exemplu procese, reprezentri, motivaii,
stadii, complexe) au o anumit form de "realitate" i c enunurile pe care le conin sunt adevrate
(exemple de enunuri - nivelul de motivaie modific rapiditatea proceselor de percepie sau complexul
lui Oedip este un constitutiv al personalitii tuturor indivizilor). n teoria percepiei de vorbete despre
validitate ecologic. Termenul este creat de Egon Brunswik pentru a desemna gradul n care stimuli
distali i proximali covariaz. El s-a gndit la operaia de baz a percepiei, aceea de a nva s
Kline, Paul, "Fidelit et validit", n Beech, R., Harding, Leonora, "Tests, mode d'emploi. Guide de psychometrie", ECPA,
Paris, 1994, pag.82.
44 vezi Lienert, Gustav, "Testaufbau und Testanalyse", Verlag Julius Beltz, Weinheim und Berlin, 1967, pag. 255.
43

33

AUREL STAN

estimm adevratul stimul (distal = fizic) pe baza valorilor variabile ale stimulului proximal care excit
sistemele receptoare. Cu ct este mai mare validitatea ecologic a unui semn proximal pentru o
proprietate a unui stimul distal, cu att e mai probabil ca acesta s fie nvat i folosit. Termenul e
folosit n teoria percepiei directe a lui J.J. Gibson.
Autorul sau utilizatorul unui model, n funcie de cadrul epistemologic n care se situeaz, este
nevoit s respecte definiia termenilor teoretici i s fixeze n acelai timp condiiile pe care el pretinde
c trebuie s dispun un model valid.
Pentru testele psihologice condiiile standard de validitate sunt, n general, definite n termeni
de valoare predictiv, adic, prin intermediul unei valori de corelaie cu ceea ce ele sunt investite de a
diagnostica (inteligena, nivel de dezvoltare, trstura de personalitate, capacitate ntr-o sarcina sau
ntr-o profesiune).
Noiunea de validitate este central pentru psihologia tiinific, adic psihologia care caut
s-i fundamenteze afirmaiile (aseriunile) prin intervenia procedurilor experimentale, la care se
adaug un sistem statistic adecvat de verificare a rezultatelor. Nu este exagerat s se afirme c
psihologii se divizeaz n dou categorii:
1. cei care se preocup de validitatea (afirmaiilor), a teoriilor, a modelelor, a conceptelor i
instrumentelor pe care le folosesc;
2. cei care nu se preocup de acestea, ci se mulumesc cu aseriuni (afirmaii care nu sunt
demonstrate).
Noiunile teoretice sunt justificabile (fundamentate) printr-o procedur n care ele sunt
confruntate cu datele. Reguli metodologice riguroase fixeaz pe baze raionale etapele pe care trebuie
s le parcurg o validare sistematic. Elementele teoretice pot sa fie, in acest proces sunt sau respinse
ca nonvalide, sau ameliorate, sau acceptate ca provizoriu valide (pn la o confirmare mai ampl).
"American Psychological Association" i"American Educational Research Association" au
publicat mpreun n anul 1985 "Standard for Educational and Psychological Testing" n care se
pronun pentru integrarea diferitelor tipuri de validitate. n documentul amintit anterior, care constituie
un punct de referin pentru psihometricienii americani, se afirm c validitatea este "un concept unitar
care se refer nu la testul n sine, ci la inferenele fcute plecnd de la rezultatele acestuia"45. n
aceast perspectiv este incorect s se vorbeasc despre validitatea unui test n general, deci se
prefer a defini noiunea de validitate prin referina la intercorelarea care este realizat cu rezultatele
unui test (sau a unui indicator oarecare al acestuia).
n privina validitii exist 3 diviziuni fundamentale i o serie de diviziuni secundare: Facem
consideraii, n primul rnd, asupra celor fundamentale.
Validitatea de coninut. ntr-o viziune restrns asupra acestui gen de validitate,
caracteristic mai ales domeniului aptitudinal, nsui coninutul testului prezint criteriu optimal pentru
caracteristica personalitii care se cere reliefat. Un test de cunotine colare va fi valid n privina
coninutului dac sarcinile sale prezint alegeri reprezentative din materia de nvmnt. Cel mai
ilustrativ exemplu pentru acest tip de validitate este proba la maina de scris.
n viziune strict, estimarea validitii unui instrument de testare este ntemeiat pe o
examinare detaliat a coninuturilor itemilor testului. Evaluarea acestora este realizat analitic prin
analiza atent a fiecrui item n vederea stabilirii potrivirii cu testul i examinarea coeziunii globale a
Dup Laveault, Dany, Gregoire, Jacques, "Introduction aux theorie des tests en sciences humaine", De Boeck Universit, Paris,
Bruxelles, 1997, pag. 189-190.

45

34

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

itemilor testului. De exemplu, un test de abiliti matematice, pentru a avea un grad de validitate de
coninut respectabil ar trebui s formuleze itemii ntr-un mod foarte clar pentru ca subiectul s poat
nelege ceea ce e ntrebat. Mai mult, coninuturile ar trebui s fie astfel gndite nct toate aspectele
testate s fie reprezentate adecvat. Testul nu trebuie s fie suprancrcat cu itemi despre nmulire n
defavoarea itemilor despre adunare.
Stabilirea validitii de coninut este o operaie subiectiv i se bazeaz pe evalurile
experilior n ceea ce privete relevana materialelor utilizate. Este specific unei situaii i estimrile
fcute ntr-o anumit situaie circumstanial pot s nu se aplice i altor sitaii. Un test de aptitudini
aritmetice, construit i validat n privina coninutului pentru o coal tradiional, poate avea o validitate
de coninut foarte sczut dac este aplicat ntr-o coal ce folosete aa-numita matematic nou.
Validitatea de coninut, n viziune extins,. este conferit unui test, de regul, printr-un consiliu
de experi, cruia i se cere s se pronune n ce msur sarcinile sunt reprezentative pentru un concept
care constituie baza teoretic a testului. Itemilor li se cerceteaz toate faetele care converg spre
identitatea noional a anxietii, depresiei, introversiunii etc. Reproul de subiectivitate poate fi
contracarat prin crearea i respectarea unei metodologii foarte riguroase. Validitatea de coninut este
direcionat n majoritatea cazurilor spre coninutul itemilor care nu se confund n multe cazuri cu
coninutul testului. pentru evaluarea cruia se iau n consideraie i alte aspecte precum instruciunile
date, modalitile de rspuns i de cotare, limita de timp. Merit de precizat faptul c termenul de
concept psihodiagnostic desemneaz maniera generic de raportare a testului. Nici un test nu msoar
direct o trstur, ci ntr-un mod mediat, prin intermediul unui model al conceptului. Neglijarea acestei
precizri a dus la reificarea unor concepte n faza de nceput a testrii psihologice, cu consecine
nefaste pentru aceasta. Astfel, inteligena era considerat ca avnd o realitate aproape de substan,
care se localiza n creierul uman. Maurice Reuchlin spune n aceast privin: "Iluzia const n a crede
c, deoarece un cuvnt exist n limb, acestuia i corespunde n mod necesar, fr ambiguitate, un
obiect identificabil. Aceasta nseamn s uitm pluralitatea definiiilor posibile a fiecrui cuvnt a limbii,
faptul interpretrii diverse a cuvintelor care compun definiiile, i c limba nu are rolul de a furniza
procedee empirice permind de a ti n ce msur o anumit observaie corespunde unei anumite
definiii (ea furnizeaz un cod, nu o metod de codaj)"46.
Psihometricienii englezi utilizeaz termenul de "construct" pentru a desemna modelizarea unui
concept. Validitatea de construct se rezum la un set de proceduri evaluare a validitii unui instrument
de testare bazate pe determinarea gradului n care itemii testului cuprind trstura, constructul ipotetic
pe care pretind c l msoar. Astfel, dac se presupune c un test msoar inteligena, ne putem
ntreba:
Ce trsturi sau caliti caracterizeaz inteligena?
Itemii testului reflect ntr-adevr aceste constructe?
Studiile iniiale ale construirii unui test sunt de obicei legate de validitatea de construct. Este
de remarcat faptul c aceast validitate nu asigur o msurare cantitativ a validitii. Spre deosebire
de o validitate care depinde de msurtorile de corelaie, aici nu exist baze matematice pentru
determinarea validitii i spre deosebire de msurtorile care depind de structurile de comportament
cunoscute (de exemplu validitatea legat de criterii), estimarea validitii construciei este ntotdeauna n

46

Vezi Reuchlin, Maurice, "Introduction la recherche en psychologie", Editions Nathan, Paris, 1992, pag.51-52.

35

AUREL STAN

schimbare odat cu acumularea mai multor dovezi despre trsturile i calitile care fundamenteaz
constructul.
Orice aciune de validare debuteaz printr-o definiie precis a caracteristicii investigate de
test. Prezena unor elemente vagi n definiii mpiedic stabilirea corespunztoare a validitii. Asociaiile
profesionale se preocup intens de concizia i de unitatea de sens a termenilor utilizai. n domeniul
psihiatric i psihologic DSM-IV (Diagnostic and Statistical Manual of Mental Disorders), publicat de
Asociaia Psihiatric American47, furnizeaz standarde ale conciziei n terminologia utilizat.
Validitatea bazat pe un criteriu. Alt denumire pentru validitatea bazat pe un criteriu este
validitatea extern. Validitatea unui instrument de testare evaluat prin determinarea relaiei dintre
scorurile la test i un criteriu independent Validitatea simultan, convergent i validitatea predictiv
sunt dou feluri diferite ale acestei diviziuni a validitii. Dac un test pretinde c msoar o anumit
caracteristic psihic este firesc ca testul s coreleze cu un criteriu care msoar aceeai trstur sau
una foarte apropiat. Cnd avem posibilitatea s comparm imediat valorile testului cu cele ale unei
mrimi care are o validitate recunoscut, atunci suntem n prezena unei validiti concomitente sau
concurente. Validitatea concurent este un fel de validitate bazata pe criterii corelate n care relaia
dintre punctajul (scorul) testului i scorurile criterii se stabilete n acelai timp. Este denumit i
validitate convergent, simultan sau de statut. O modalitate de a evalua validitatea unui test de abiliti
de lucru la birou va fi s stabilim modul n care scorurile la test vor corela cu abilitile cunoscute ale
unui grup de lucrtori la birou ale cror performane au fost evaluate n condiii de munc reale. Un alt
exemplu: rezultatele subtestului de calcule aritmetice ale probei WISC pot fi imediat corelate cu
rezultatele obinute la disciplina respectiv de un elev.
n cazul n care performana cu care se compar rezultatele testului urmeaz s fie stabilit
ulterior examinrii, atunci validitatea este predictiv. Dar criteriu poate fi o realitate complex i atunci
va trebui s-l definim operaional, fapt care constituie una din cele mai importante etape practice n
precizarea validitii. Un criteriu deficitar definit poate duce la compromiterea validitii unui bun
instrument de msur. De asemenea, n joc intr o serie de factori care pot influena acest criteriu de
apreciere a testului. Acetia sunt:
fidelitatea predictorului i a criteriului. Criteriu este suficient de valid n msura in care este
fidel, deci reproductibil.Ca atare, trebuie de demonstrat c la repetare, acelai criteriu produce
rezultate relativ identice n corelaie;
mrimea eantionului de subieci;
tolerana fa de dispersia rezultatelor;
Modificrile operate n rndul acestor factori de influenare pot afecta serios indicele de
validitate. Dac un eantion are o valoare modest (sub 30), atunci afectarea validitii este de 25-30%.
Validitatea teoretic sau conceptual. Este tipul de validitate care pretinde un efort de un
rafinament deosebit, deoarece se refer la natura instrumentului de msur. n psihologie i n alte
discipline, nelegerea unui fenomen progreseaz n armonie cu capacitatea noastr de a-l msura.
Operaionalizarea variabilelor st n centrul ateniei n cazul validitii teoretice, ntreprindere tiinific
care presupune o mare cantitate de informaii. n cazul n care o ipotez nu se verific i instrumentul
de msur este bine operaionalizat, atunci teoria se cere schimbat sau ameliorat structural i
funcional. Semnalul de alarm asupra calitii teoriilor psihologice nu este o chestiune recent, el fiind o
47

S-a consultat ediia din anul 1994.

36

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

preocupare constant a unor epistemologi de marc. Unul dintre acetia, Karl Popper, fcea
urmtoarea remarc nc din anul 1934: "Pentru a putea clarifica aceast concepie (deductivist), este
necesar s clarificm opoziia dintre psihologia empiric a cunoaterii, care opereaz cu fapte empirice,
i logica cunoaterii, care nu se intereseaz dect de corelaii logice, cci prejudecile logice inductive
sunt legate de confundarea problemelor psihologice cu cele epistemologice, ceea ce, n treact fie
spus, are urmri neplcute nu numai pentru teoria cunoaterii, ci i pentru psihologie"48.
Dac teoria este valid i instrumentul de cercetare dovedete o operaionalizare deficitar,
atunci poate interveni schimbarea sau ameliorarea constructiv a instrumentului sau a procedurii de
validare.
Testul psihologic are o serie de validiti de importanta mai mic, dar care n anumite contexte
pot sa joace un rol important, n condiiile cnd se asigura realizarea lor. Ele constituie, n mare parte,
variante ale primelor trei sau proceduri simplificate determinate de contextul empiric49.
Validitatea"a priori" este o estimare preliminar i intuitiv a validitii de coninut a unui test.
Stabilete gradul in care itemii testului au o legtur intuitiv "a priori" cu acele comportamentele pe
care se presupune c le testeaz. Se mai numete "validitate de sim comun".
Validitatea congruenta este o metod de stabilire a validitii unui nou test prin corelarea
scorurilor obinute la acest test cu altele, a cror validitate a fost stabilit anterior. Un caz tipic este dat
de lumea testelor de inteligen, unde noile teste create sunt comparate cu testele recunoscute ca fiind
validate, cum sunt Stanford-Binet sau diferite forme de teste create de David Wechsler.
Validitate intern este o procedur intern de determinare a validitii unui test prin
cercetarea fiecrei componente i evaluarea gradului n care i ndeplinete rolul in cadrul testului.
Astfel se poate vorbi i de validitatea itemului, ca fiind gradul n care un singur item al unui test msoar
ceea ce a fost gndit s msoare.
Validitate reprezentativ (bazat pe un model) este o variant a validitii de coninut, bazata
pe evaluarea ponderii n care diferite caracteristici presupuse a susine i fundament ceea ce se
msoar sunt reprezentate n test. Este mai mult dect o procedur de control pentru a se evita
subiectivismul n cadrul testului, i are drept obiectiv prevenirea defavorizrii adevratei msurri.
Validitatea sintetic (syntethic validity)50 este validitatea unui instrument complex de testare
sau a unei ntregi baterii de teste, i este bazat pe relaia dintre un scor compozit, care presupune
reprezentarea diferiilor factori prezeni n test, i performana real. Termenul deriv din procedura
sintetizrii mai multor factori ntr-o singur valoare.
Validitate aparent (face validity) sau validitatea de faad este validitatea evaluata de
ctre subieci (care au n aceast situaie calitatea de "experi"), care apreciaz coninutul unui test
pentru a aprecia dac este potrivit, adecvat lor. Este o procedur destul de vag pentru validarea unui
test, aceasta i datorit subiectivitii inerente, fiind tipic doar fazelor incipiente de construcie a
testelor. Este de remarcat faptul c, n timp ce validitatea aparent pare, superficial vorbind, similar cu
Vezi Popper, Karl R., "Logica cercetrii", Editura tiinific i enciclopedic, Bucureti, 1981, pag.75.
Aceste validiti ocup spaii modeste n manuale sau lucrri de specialitate. Pentru inventarierea lor am consultat
urmtoarele dicionare: Heber, Arthur, "Dictionary of Psychology", Penguin Books, London, New York, 1985; "Grand
Dictionnaire de la Psychologie", Larousse, Paris, 1992; Hehlmann, Wilhelm, "Worterbuch der Psychologie", Alfred Kroner
Verlag, Stuttgart, 1968; chiopu, Ursula (coord), "Dicionar de Psihololgie", Editura Babel, Bucureti, 1997; Benesch,
Hellmuth, "Atlas de la Psychologie", Libraire Generale Francaise, Paris, 1995; Mucchielli, A. et R., "Lexique de la
Psychologie", Entreprise Moderne d'Edition, Editions Sociales Francaises, Paris, 1969.
50 n parantez este trecut forma sub care circul noiunea respectiv n terminologia englez de specialitate.
48
49

37

AUREL STAN

validitatea de coninut, procedurile sunt destul de diferite, ultima fiind o procedura sistematic, iar prima
fiind mai apropiat de validitatea "a priori".
Validitate de consens sau de prere general. Este realizat printr-o procedur informal
de evaluare a validitii bazat pe noiunea de prere general. Aceasta pornete de la aseriunea c o
afirmaie este cu att mai posibil s fie adevrat cu ct mai multe persoane sunt de acord n privina
adevrului acesteia sau cu ct mai multe persoane sunt de acord n privina unei percepii cu att e mai
posibil ca ea s fie adevrat. Termenul de validitate de consens este rar folosit n cercetarea ce
utilizeaz teste i msurtori. Este un termen tipic pentru psihologia social i se conformeaz
principiului conform cruia susinerea sistematic a unei anumite poziii i acord o mai mare
acceptabilitate din partea celorlali.

I. 4. CRITERII SECUNDARE DE APRECIERE A UNUI TEST PSIHOLOGIC


I.4.1. Normativitatea unui test
Acest criteriu presupune ca exigen pentru unui test de a oferi informaii care s poat servi
la ordonarea rezultatelor individuale ale testului n raport cu un sistem de referin i anume sistemul
normativ. La testele unidimensionale decurge normarea firesc din faptul existenei tendinei de a stabili
distribuia valorilor testului unei populaii de subieci, de a transforma aceast distribuie n una normal
i de a o nzestra cu anumii parametri ai distribuiei (de exemplu la scala coeficienilor de inteligen cu
o medie de 100 si o abatere standard de 15). Fiecare valoare brut a testului face parte dintr-un anumit
nivel valoric al testului care fixeaz univoc poziia unui subiect pe o scal.
Normarea poate s se realizeze pentru ntreaga populaie a unui areal (norme complete) sau
pentru populaia unui anumit grup social (norme de grup). Se pot fixa norme dup grupe de vrst, dup
sex, dup proveniena urban sau rural, dup nivelul de studii. De asemenea, se pot combina criteriile
de diviziune ale testelor n vederea realizrii de norme. Exemplu, pentru grupe de vrsta 25-35 ani,
studii generale, proveniena urban etc.
Un test poate s ndeplineasc o serie de criterii dar, dac nu este normat, nu posed nici o
utilitate diagnostic sau posed una foarte mic, cu toate c el apare indicat ca instrument de cercetare
(unde este vorba, de regula, numai de comparaii ntre grupe).
Procedeele de normare a rezultatelor obinute la teste de ctre grupele de referin le vom
trata ntr-un capitol ulterior, cel care face referin la aspectele constructive.
I.4.2. Standardizarea unui test
ntr-o serie de lucrri consacrate teoriei i construciei testului se prevede standardizarea ca o
cerin fundamental., deoarece nerespectarea acestei exigene ar duce la serioase pierderi de
informaii sistematice. Eantioanele de informaii, dobndite de regul din comportamentul observat al
examinatului, variaz n dependen de caracteristicile psihice ale examinatorului i de condiii
necontrolate care apar sistematic sau nesistematic.
n cazul ideal, standardizarea are n decursul procesului diagnostic rolul de invariant al
condiiilor de examinare i face posibili indicatori nedeformai ai caracteristicii psihice n cauz. n
practic stabilirea influenei sistematice asupra rezultatului testului este o realizare care se produce doar
condiionat.
38

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

Standardizarea procesul diagnostic prin intermediul testului are loc n mai multe faze:
provocarea stimulrii, nregistrarea rspunsului, evaluarea rezultatului i interpretarea acestuia. Aceast
fracionare a procesului de diagnosticare prin test este o exigen teoretic, dar n examinarea concret
fazele nu sunt separabile la fel de eficient la toate clasele de teste.
n faza de provocare a stimulrii pe baza configuraiei de itemi se constat variaii
nensemnate ale ordonrii experimentale, care pot s influeneze mai mult sau mai puin rezultatele
testului.
O serie de atenionri pot juca un rol benefic, i anume:
a se pstra doar instruciunile de cercetare proiectate pentru test;
a se utiliza materialele de cercetare recomandate pentru test, altfel rezultatele nu pot fi
comparate;
s fie create pentru toi participanii aceleai condiii, deoarece, pe lng materiale, sunt
relevante i indicaiile date subiecilor pentru situaia de testare;
condiiile i instruciunile nu au aceeai importan pentru toi candidaii, ci una diferenial
pentru fiecare condiie;
Un test trebuie s fie realizat la fel pentru toi candidaii, ntr-o ambian pe ct posibil
neperturbat;
Condiiile exterioare nu pot s fi identificate complet, deoarece ntr n calcul starea vremii,
raportul spaial, starea instrumentului de scris, mirosuri indezirabile. idiosincrasii perceptive. Atenia
pentru crearea unei situaii sterile n privina condiiilor de ambiant nu poate fi comparat cu cea din
medicin.
Mai greu de delimitat i normalizat sunt condiiile intraindividuale, proprii fiecrui subiect.
Tragerea unor concluzii psihodiagnostice din rezultatele unui test presupune c subiectul se gsea, n
momentul examenului, ntr-o dispoziie corporal i psihic normal.
Perturbrile momentane ale strii de sntate, efectele farmacologice de timp scurt sau lung,
tensiunile emoionale acute, grijile, gradul de nelinite, nesigurana, oscilaia dispoziiilor personale pot
s influeneze n mai mare sau mai mic msur cantitatea i calitatea rspunsurilor.
Atenie special trebuie acordat efectelor posibile care rezult din dispoziia personal,
ateptrile personale ale examinatului fa de cercetarea prin test i consecinele presupuse ale
acesteia
Cercetri empirice indic faptul c determinani speciali precum motivaia efecturii testului,
participarea eului, anxietatea fa de test. succesul sau insuccesul trit, caracterul stresului (presiunea
examenului i a timpului) pot s influeneze negativ considerabil fundamentul diagnosticului.
n sens mai larg strategiile de realizare, care variaz interindividual, nclinaii latente sau
ascunse la colaborare, minciuna, exagerarea i afirmaiile neconvingtoare, ca i stilul de reacie
general sau specific al candidatului fac parte din izvorul de perturbri intern psihice care pot s
provoace rezultate neregulate ale testului.
Provocarea comportamental ca situaie social, este prezent mai ales la examenul
individual. la care particip i un complex semnificativ de condiii marginale. Printre acestea sunt
caracteristicile ale randamentului la test, vrsta, sexul, statutul social, rudele, vestimentaia caracteristici
presupuse sau ateptate ale examinatorului, mecanisme de interreacie condiionate (prezena sau
absena examinatorului n spaiu de examinare, cunoaterea sau necunoaterea lui, intensitatea
39

AUREL STAN

observrii i a sprijinului, condiionri atmosferice, mimice, gestice sau verbale, ncurajarea sau
descurajarea, lauda sau mustrare). Anna Anastasi spunea n 1968 c semnificaia variabilelor
situaionale la examenul prin test are valoare diferenial n funcie de fiecare test.
nregistrarea rspunsurilor. n privina nregistrrii rspunsurilor la test se poate spune c
aceasta nu este niciodat deplin. Exist o diferena ntre nregistrarea rezultatelor i n observarea
liber a datelor. nregistrarea cunoate forme multiple i presupune protocalarea verbal a rspunsului,
depozitarea anumitor semnale prin ajutorarea de ctre mijloace tehnice-aparat fotografic, casetofon,
instalaii video, aparate de nregistrare numerice i verbale, terminale ale computerelor, etc.
nregistrarea standardizat a datelor trebuie realizat n msura n care aceasta nu se
produce automatizat. n acest caz se stabilesc reguli clare, n aa fel nct fiecare conductor de testare
s nregistreze aceeai cantitate de informaii.
Evaluarea rspunsurilor la test. Prelucrarea rezultatelor nregistrate de la teste, precizarea
frecvenei anumitor reacii-rspuns coerente se realizeaz parial cu diverse aparate de evaluat, mai
ales ntr-un test de aptitudini. Teste cu rspuns creativ fac imposibil lucrul cu mainile de evaluat. elul
evalurii datelor este obinerea unui extract din datele nregistrate, avnd ca rezultat unul sau mai muli
indicatori. Valorile brute se preteaz la transformri pe baza raportrii la datelor grupurilor de referin.
Evalurile sunt nsoite n unele cazuri de calcule vaste asupra sindroamelor i de prezentri grafice n
profile pentru a face materialul mai uor de neles. n evaluare se fac simite efectele de informare
precum i de halo, centrare, contrast i ancoraj.
Interpretarea rezultatelor. Calitatea consecinele diagnostice pentru interpretare constituie
obiectul de interes al obiectivitii. Dintr-un rezultat individual mai muli cercettori trebuie s trag
aceleai concluzii. n timpul examenului ns se produc o serie de interaciuni ntre conductorul de
examen i cel examinat. Cu ct regulile sunt mai puin formalizate, cu att mai mare este riscul efectelor
de interpretare explicat prin ecuaia personal a conductorului de examen. Imperfeciunile sunt doar
incomplet corijate. n faa exigenelor unei valorificri depline sunt obiecii mai mult sau mai puin
ndreptite, datorate caracterului de "realitate deficitar" al variaiei condiiilor controlate empiric.
Eantioane nereprezentative de subieci i metodele inadecvate de analiz a datelor i pun
amprenta asupra calitii interpretrii. n practic este posibil doar aproximativ de a estima condiiile
marginale care anormalizeaz situaiile de standardizare ale fazelor individuale ale procesului
diagnostic. Ele sunt stabilite segmentat, chiar la testele construite i verificate cu grij.
Pentru asigurarea unei bune interpretri sunt necesare, uneori, aplicri ale unor teste
preliminare suplimentare care s limiteze efectele deformatoare (pentru stabilirea motivaiei testului sau
scalele de minciuni).
I.4.3.Comparabilitatea unui test
Un test este comparabil dac:
Exista unul sau mai multe forme de teste paralele;
Sunt disponibile teste asemntoare n privina validitii.
Forma paralel a unui test permite comparaia testului cu sine nsui. Ea face posibil un
control intraindividual al fidelitii prin care se cerceteaz un anumit subiect cu o anumit form de test
i se compar rezultatele. Testele asemntoare sau egal valide, examineaz aceeai caracteristic a
personalitii sau una apropiat.
40

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

I.4.4.Economia unui test


Un test este economic atunci cnd:
cere un timp de realizare scurt;
are nevoie de puin material;
se aplica n mod simplu;
este realizabil ca test de grup;
este repede i comod evaluabil.
Un test este foarte economic dac ndeplinete toate sau cele mai importante din aceste
condiii El este foarte puin sau deloc economic, dac ndeplinete doar o parte sau nici una dintre
exigenele enumerate. Nu am ntlnit n bibliografie un indice numrabil de cunoatere pentru economia
unui test.
I.4.5. Utilitatea unui test
Un test este util dac el msoar o caracteristic a personalitii pentru a crei cercetare ia
natere o necesitate practic. Un test are o nalt utilitate, daca el nu poate fi reprezentat n funcia sa
printr-un alt test. El are o mic utilitate dac el examineaz o caracteristica a personalitii care ar putea
sa fie la fel de bine cercetat cu o serie de alte teste.
I. 4. 6. Relaiile reciproce ntre criteriile de apreciere a unui test psihologic
Aceste relaii reciproce au constituit un interes constant pentru psihometricieni De respectarea
acestora depinde posibilitatea utilizrii practice a unui test. Gustav Lienert51 indic urmtoarele raporturi
ntre criteriile unui test psihologic:
Fidelitatea test paralel sau retest poate s fie mai sczut dect consistena sa sau obiectivitatea
sa. Indicatorii de validitate pot s fie mai mici dect cei de fidelitate.
Un test cu o nalt validitate trebuie s posede in mod necesar i o nalt obiectivitate, consisten
sau ncredere. Constatarea unei nalte validiti ne scutete ntr-o anumit msur de
supraverificarea altor criteriilor de apreciere cunoscute.
Un test cu o fidelitate redus se recomand, n cel mai bun caz, pentru comparaia grupelor n
privina caracteristicii cercetate. Pentru acest scop, o fidelitate de 0,5 este suficient, nu ns i
pentru o difereniere individual.
Un test cu o validitate redus i cu o fidelitate nalt prezint o ncredere redus. Fr o prelucrare
de coninut nu exist pentru acest test nici o posibilitate de mbuntire. Se recomand pentru
diferenierea indivizilor, ns nu are nici o certitudine pe baza creia se produce aceasta
difereniere.
Un test cu o validitate redus i o fidelitate ngust este practic lipsit de valoare.
Coeficientul de validitate nu poate depi rdcina ptrat a coeficientului de precizie (este vorba
de indicele de precizie din procedura de stabilire a fidelitii). Astfel, validitatea este totdeauna
limitat prin fidelitatea unui test.

51

Vezi Lienert, Gustav, "Testaufbau und Testanalyse", Verlag Julius Beltz, Weinheim/Berlin, 1967, pag.19-20.

41

AUREL STAN

II. ANALIZA DE ITEMI

II.1. ITEMII CA ELEMENTE ALE MSURRII PSIHOMETRICE


Am amintit deja c procesul de msurare cu ajutorul testelor psihometrice se bazeaz pe
informaii elementare provenite din domeniul itemilor n primul rnd considerm c intereseaz definiia
itemului i precizarea faptului dac toate testele sunt compuse din itemi.
O definiie clar a itemului este dat de Maurice Reuchlin: Element al unui test, constituind o
situaie particular i jucnd rolul unui stimul la care subiectul nu poate da dect un rspuns dintre dou
sau mai multe rspunsuri teoretice prevzute de test52. Itemul este deci o component de stimulare a
unui test care beneficiaz de un dispozitiv de rspuns cu alegere multipl i care are menirea de a
contribui la evidenierea unei trsturi, unei caracteristici psihice, pe care dorim s o diagnosticm.
Cnd avem situaia unei singure variante de rspuns corecte, dintr-un numr de n oferite,
atunci celelalte n-1 variante se numesc distractori. Pentru a-i ndeplini rolul funcional ntr-un sistem de
rspuns cu mai multe variante, distractorul trebuie s prezinte verosimilitate (aceasta constituie o
direcie de cercetare distinct n domeniul psihodiagnosticului).
Numrul itemilor unui test este foarte variabil, dar limita inferioar nu scade sub cifra 10,
considerat de ctre Paul Kline ca valoare limit pentru ca un ansamblu de itemi s se poat numi
test53. Fiecare item posed un scor care adiionat cu cele ale celorlali itemi permite exploatarea
cantitativ a informaiilor furnizate de test. Scorul este punctajul acordat rspunsului exprimat de ctre
subiect. La probele de randament psihic, n special cognitiv, dac rspunsul subiectului la solicitarea
unui item este corect scorul va fi egal cu 1 i dac acesta este incorect scorul va fi egal cu 0. n cazul
aplicrii unui chestionar de personalitate, calitatea rspunsurilor nu se apreciaz prin termenii de corect
i incorect. n acest caz, valoarea 1 este obinut de un rspuns care pune n eviden caracteristica
investigat prin respectivul chestionar i valoarea 0 n situaia contrar. Itemii sunt caracteristici mai ales
pentru testele din domeniul cognitiv, din cel al personalitii i din cel al cunotinelor, teste care se
prezint n majoritatea cazurilor sub forma creion-hrtie. Pentru a fi considerat item o component a
testului trebuie s posede individualitate informaional pertinent, adic s aduc o contribuie distinct,
clar conturat la scorul total al testului. Bararea unei litere O sau C la testul Bourdon-Amfimov nu aduce
o informaie care posed individualitate, dei aceast operaiune se puncteaz.. Ca atare, un asemenea
rspuns nu constituie un item. La proba aparativ DM1 a lui Lahy, folosit intens n laboratoarele
psihologice din domeniul transporturilor pentru diagnosticare asocierii i disocierea manual, nu poate fi
vorba de itemi.
Noiunea de item nu este unanim preluat de ctre autorii care se ocup de teoria testului
psihologic. De exemplu, David Magnusson, un autor care nu i-a americanizat terminologia tiinific,
Vezi "Grand dictionnaire de la psychologie", Larousse, Paris, 1992. pag. 406
vezi Kline, Paul La construction des tests, n Beech, John R.; Harding, Leonora, "Tests-mode d'emploi", ECPA, Paris,
1994., pag.103

52
53

42

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

folosete noiunile de sarcini i analiz de sarcini n loc de itemi i analiz de itemi. 54, dei referirile sunt
clare a ceea ce se numete analiz de itemi. Gustav Lienert nu folosete pe parcursul tratatului su
asupra construciei testelor psihologice noiunea de item dect o singur dat, i atunci pentru a indica
o procedur similar de analiz a discriminrii ntlnit la A.F. Vukovich55.
Luat n sens general, analiza itemilor este o analiz detaliat a itemilor individuali ai unui test
sau ai unui chestionar cu scopul de a evalua validitatea i sigurana, gradul de ncredere acordat
fiecruia din itemi. n general disponibilitatea testului pentru aplicare practic.
Sub aspect general, asemenea analize pot fi direcionate pe coninut i form sau pot fi
realizate n mod cantitativ, observndu-se modul n care fiecare item contribuie la precizia msurrii i
validitatea generala a testului. n sensul cel mai restrns, analiza de itemi este folosit prioritar mai ales
pentru evaluarea modului efectiv n care fiecare item contribuie la validitatea general a testului.
Aceast analiz nu se poate realiza dect pentru testele la care subiecii sunt lsai s
parcurg toi itemii, deci este imposibil de realizat la aa-numitele teste de rapiditate (speed-test), adic
teste care au o limit de timp i sunt construite n aa fel nct foarte puini subieci s termine de
parcurs toate solicitrile n limita de timp fixat. Este adevrat c o serie de autori susin c la testele
realizate incomplet de ctre subieci se pot prevedea restul rspunsurilor neefectuate prin studierea
atent a modului n care subiectul a rspuns pn atunci. Considerm c o asemenea previziune ar
aduce un plus de relativism n privina concluziilor, relativism care nu lipsete n interpretare nici fr
aceast prognoz. n cazul cnd un mare numr de persoane nu au putut s rspund la item din lips
de timp indicele de dificultate nu este exprimat cu adevrat.
Analiza de itemi este diversificat, opiunea pentru o anumit categorie depinznd de scopul
special pe care l urmrim n construcia unui anumit test. Caracteristicile valorilor brute ale ntregului
test sau ale itemilor individuali nu sunt independente de caracteristicile eantioanelor care sunt
msurate cu ajutorul testului. Acest aspect al eantionrii l vom trata n capitolul referitor la construcia
testului. Un model teoretic ireproabil care s integreze perfect caracteristicile subiecilor n eantion i
caracteristicile variabilelor msurate nu este disponibil. Creatorii de teste construite pe baza teoriei
probabiliste a testului psihologic aspir la un model care s ofere parametri ai testului independent de
eantioanele cercetate i independent chiar testele utilizate. n aceast lucrare vom face aprecieri
prioritar referitoare la o metod de analiz pentru un singur eantion. Acest eantion trebuie s fie
reprezentativ i pentru alte grupe la care testul trebuie s fie aplicat mai trziu. Abordarea pragmatic a
metodei analizei de itemi o vom ncepe prin considerarea ctorva din scopurile sale cele mai
importante. Se pot distinge dou feluri de analize de itemi, aceea la care n urma prelucrrii rezultatelor
este extras un singur indice i aceea la care sunt extrai mai muli indici pentru selectarea i
recomandarea unui anumit item. Cele mai frecvente analize sunt efectuate pentru cazul n care exist
un anumit rspuns la item considerat corect.
Realizarea unor exigene abstracte, bazate pe o puternic formalizare cantitativ, este o
operaiune dificil i conduce, n cazul statisticilor neexhaustive, la o pierdere de informaii despre
configuraii posibile ale categoriilor de itemi din care poate s rezulte valoarea sumei. Pe de alt parte,
formalizarea i raportarea la modele este o procedur de neevitat, dar postulatele pot fi n unele cazuri
slbite. Astfel, modelul teoriei clasice a testului ofer fundamentul pentru dobndirea valorilor fidele
ale testului. Se poate concluziona c testele psihometrice se caracterizeaz prin aceea c multitudinea

54
55

Vezi Magnusson, David, "Testtheorie", Verlag Frank Deuticke Wien, 1969, pag.22-35
Lienert, Gustav.A., "Testaufbau und Testanalyse", Verlag Julius Beltz, Weinheim/Berlin, 1967, pag.93

43

AUREL STAN

de categorii de itemi posibile este ordonat i delimitat, fie pe calea avansrii unor categorii selective,
fie prin categorizri ulterioare dup prescripii standardizate. La categoriile de itemi care sunt ordonate
numerice, valorile numerice joase indic o reliefare sczut, iar cele mari una puternic a caracteristicii
pus n discuie. n majoritatea cazurilor sunt preferate structuri informaionale binare, cu categorii de
msurare 0 i 1, dar acest model nu este obligatoriu de urmat, existnd i alte posibiliti. Dac o
valoare a unui test trebuie s indice sub form de msur caracteristica pus n discuie, atunci putem
presupune c i valorile itemului indic relaii sistematice cu categoriile caracteristicii de msurat.
Prezentarea sistematic a metodelor analizei itemului i cu aceast a tehnicilor de selecie se
gsete n literatura standard despre construcia testului.
Unul din scopul analizei de itemi este de a selecta dintr-o colecie mai mare de itemi
(existent n faza preliminar a construciei unui test) una sau mai multe grupe de itemi, n aa fel nct
punctajele corespunztoare ale testelor s satisfac diverse condiii prestabilite n relaie cu distribuia i
anumite corelaii.. Ca tipuri de analize de itemi putem enumera analiza dificultii, a distractorilor, a
omogenitii, a specificitii, a validitii, a excesului i a asimetriei.
n construcia testelor psihologice se pleac de la un ansamblu de itemi mai numeros dect
cel care se consider necesar, deoarece pe parcursul perioadei de elaborare a testelor o serie de itemi
va fi eliminat, ca urmare a neconcordanei acesteia cu exigenele unor criterii de valabilitate.
Structura de colectare a datelor necesare constituirii scorului testului n ansamblu a fost creat
de William Stern n anul 1912, purtnd denumirea de matricea lui Stern. Exprimat n form generic,
ea se prezint n felul urmtor:
Item
Subiect
1
2
3
4

i
..
n
tj
n

X11

X12

X13

X14

X1i

..

X1n

i =1

1i

X21

X22

X23

X24

X2i

X2n

i =1

2i

X31

X32

X33

X34

X3i

X3n

i =1

3i

X41

X42

X43

X44

X4i

X4n

i =1

...

..

..

..

4i

.
n

Xj1

Xj2

Xj3

Xj4

Xji

..

Xjn

i =1

ji

..

..

..

..

..

..

..

X
i =1

Ni

XN1

XN2

XN3

XN4

..

XNi

XNn

X
i =1

fi

X j1
J =1

X j2
j =1

X j3
j =1

X j4
j =1

..

X ji
j =1

X jn
j =1

Ni

J =1 i =1

X ji

Tabelul 3. Cuprinde schema general a matricei subieci-itemi sau matricea Stern


Valorile din coloane cuprind rezultatele subiecilor la un anumit item, cele din linii rezultatele
unui anume subiect la totalitatea itemilor la care a rspuns. Cu fi am notat suma valorilor pozitive ale
44

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

itemului, adic a valorilor 1, care au semnificaia de rezolvare corect.


Analiza dificultii este cel mai simplu, cel mai rspndit tip de analiz care poate s se
realizeze la o serie de valori ale itemilor. Cu pi se noteaz obinuit indicele de dificultate a itemului, care
f
ne indic proporia subiecilor care au rezolvat corect itemul. Formula sa este urmtoarea pi = i , n
N
care fi reprezint suma valorilor obinute la un anumit item i N este numrul subiecilor care s-au
raportat la itemul respectiv. Dac aceast proporie are o valoare apropiat de 1,00 ne indic un item
uor, pe care l-au rezolvat majoritatea subiecilor, dac valoarea proporiei oscileaz n jurul valorii 0,50
ne indic un item de valoare mijlocie i dac are o valoare apropiat de 0 ne indic un item dificil sau
foarte dificil. Cnd itemul este prea dificil sau prea uor distribuia acestuia devine asimetric. Itemii care
sunt prea uori discrimineaz bine ntre subiecii slabi i itemii dificili printre subiecii buni. Dac un
subiect nu rezolv un item care a fost rezolvat de 95% din totalul subiecilor, lucrul acesta este mai grav
dect dac el ar fi realizat greeala la un item pe care l-ar fi rezolvat doar 20% din subiecii grupului de
referin. Itemii cu indice de dificultate sczut, deci itemii dificili (pi = 0,1) au o asimetrie pozitiv, itemii
cu dificultate medie (pi=0,5) sunt simetrici i itemii foarte uori (pi = 0,15) au o asimetrie negativ. Mai
ales n cadrul probelor de randament, se recomand ca itemii foarte dificili, care nu-i rezolv aproape
nici un subiect, i itemii foarte uori, pe care-i rezolv aproape toi subiecii s fie nlocuii. J.Guthke,
H.R. Bttcher i L. Sprung fixeaz limita inferioar de acceptare a unui item ntr-un test de randament la
0,20 i limita superioar la 0,8056. Pentru acelai fel de teste, ali autori indic proporii care oscileaz
uor n jurul valorilor indicate anterior. Aceste limite sunt racordate la logica teoriei clasice a testele
psihologice, n cea probabilist exist practica integrrii n teste a itemilor rezolvai corect de un numr
foarte mic sau foarte mare de subieci. n testele construite dup optica probabilist sunt admii itemi
care pot fi rezolvai, de exemplu, de numai de 0,01% din subieci sau nerezolvai doar de acest procent.
Fixarea unor limite de admitere la probele de personalitate devine mult mai problematic. Pentru aceste
probe numele de indice de dificultate este inadecvat, un nume mai adecvat ar fi cel de indice de
proeminen, deoarece prin el s-ar putea pune n eviden gradientul reliefrii unei anume segment
rezultate din operaionalizarea unei trsturi de personalitate, de exemplu, un comportament tipic
introvertit.
Opticii clasice de analiz a testului i se reproeaz relativitatea proprietilor metrice ale
itemului. Valoarea indicelui de dificultate calculat depinde particularitatea eantionului de subieci utilizat
n cercetarea privind verificarea calitilor testului. Astfel, dac subiecii sunt slabi, itemul va fi considerat
dificil. Din contr, dac subiecii posed un nivel de competen ridicat, itemul va fi considerat uor.
Deci, reprezentanii opticii probabiliste de construcie a testului reproeaz clasicilor c aprecierea
subiecilor depinde de itemi i aprecierea itemilor depinde de subieci.
Oferim n continuare un exemplu cu valori fictive, cuprinznd rezultatele unui test efectuat de
11 subieci la 10 itemi nregistrate ntr-o matrice a lui Stern.

56

Guthke; Bottcher; Sprung (hrsg.), Psychodiagnostik", Band I, Deutscher Verlag der Wissenschaften, Berlin 1991, p.230.

45

AUREL STAN

Nr.crt.
1
2
3
4
5
6
7
8
9
10
11
fi
pi
qi
si2

2
0,18
0,82
0,15

Subiect
A.B.
T.R.
M.V.
Z.D.
A.T.
N.F.
U.J.
L.E.
U.I.
D.R.
T.A.
7
0,64
0,36
0,23

ITEMI
1
2
3
4
5
6
7
8
9
1
1
0
1
1
1
1
1
0
0
1
0
1
0
1
0
1
0
0
0
1
1
1
1
0
0
1
0
1
0
0
0
1
1
1
0
0
0
1
1
0
1
1
1
1
0
1
1
1
1
1
1
1
0
0
0
1
1
1
1
0
0
0
0
1
0
0
0
1
0
0
0
0
1
0
1
0
0
1
0
0
0
0
0
1
0
1
0
1
0
1
1
1
0
0
0
1
0
1
Prelucrare elemenetar a datelor cu stabilirea unor indicatori
5
8
4
9
6
6
3
7
0,45
0,73
0,36
0,82
0,55
0,55
0,27
0,64
0,55
0,27
0,64
0,18
0,45
0,45
0,73
0,36
0,25
0,20
0,23
0,15
0,25
0,25
0,20
0,23

10
1
0
1
1
0
1
0
1
0
1
1

Total
8
4
6
5
6
8
4
3
3
4
6

Tabelul 4. Cuprinde o exemplificare pentru matricea Stern


n partea inferioar a tabelului s-au realizat n linie cteva rubrici sintetizatoare. Semnificaia
lor este urmtoarea:
fi suma rezultatelor la un anumit item;
pi proporia subiecilor care au rezolvat corect itemul sau, pentru chestionarul de personalitate,
proporia celor care prin rspunsul lor au pus n eviden trstura investigat;
qi proporia subiecilor care nu au rezolvat corect itemul sau, pentru chestionarul de
personalitate, proporia celor care prin rspunsul lor nu au pus n eviden trstura investigat
qi=1-pi ;
si2 variana itemului sau dispersia itemului care poate fi considerat un indicator grosier al
capacitii de discriminare a itemului. Formula varianei itemului este: s2i = pi*qi.
Itemului i poate fi calculat, de asemenea, i indicatorul de asimetrie, la fel cum se calculeaz
pentru rezultatele de ansamblu ale testului. Formula de calcul este urmtoarea:
q p
3 =
.
pq

3 , simbolul care reprezint indicatorul de asimetrie pentru un item. Celelalte simboluri din formul au
fost prezentate anterior.
Dac un item are p = 0,6 i q = 0,4 se obine urmtorul rezultat pentru coeficientul de
asimetrie:
0,4 - 0,6 0,2
3 =
=
= 0,29
0,69
4*6
Formula de calcul pentru asimetrie este specific itemilor cu exprimare valoric binar( 0 i 1).
Itemul analizat de noi are o asimetrie pozitiv, fiind cunoscut faptul c valoarea normal pentru
asimetrie este 0.
Asimetria este, deci, funcie a cotei parte a subiecilor care au rezolvat corect itemul sau care
au dat un rspuns punctat prin 1 n cazul unor chestionare de personalitate.
De asemenea, calculul excesului unui item cu exprimare numeric binar este o form
46

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

particular pentru calcularea excesului n general.


1
4 =
6
pq

4 , termenul necunoscut al acestei formule, reprezint indicele de exces sau indicele de kurtosis al
unui item cu exprimare binar a rezultatului. Aplicnd datele din exemplul anterior obinem:
1
1
4 =
6 =
6 =
0.6 * 0,4
0,24
4,16 6=-1,86
innd cont de faptul c valoarea normal a indicatorului de exces este 3,00, putem aprecia
c acest item are o distribuie platicurtic.
Prin indicele de dificultate se precizeaz ntr-o matrice a punctajelor itemilor vectorul mediei,
deoarece este foarte clar c pi se confund cu media distribuiei valorilor itemilor. Aceast identitate a
modului de calcul nu mai este valabil la matricile n care valorile itemilor nu mai sunt binare. Notaii
diferite pentru itemi survin la inventarelor de interese, n care intensitatea rspunsului este mai fin
difereniat, n marea majoritate a cazurilor nedepind valoarea 7, deci itemii primesc valori ntre 0 i 7,
subiecii putnd obine oricare dintre valorile 0 i 7. Notri diferite de forma binar se ntlnesc i la
probele de randament intelectual, i anume la WISC, prob la care unele scale de performan
puncteaz i reuita parial.
n cazul chestionarelor de interese sau de atitudini, cu ct cifra rspunsului la item este mai
mare, cu att subiectul consider c un anumit interes sau o anumit atitudine, de exemplu, este mai
intens O astfel de matrice se prezint astfel (date fictive):
Nr.crt
1.
2
3
4
5
6
7
8
9
10
11

Subiect
D.B.
L.T/
P.R.
M.D.
F.T.
O.P.
E.T.
D.P.
S.H.
Z.O.
C.I.

1
1
2
6
3
4
5
2
7
3
1
1

2
2
3
4
2
3
5
2
6
4
3
4

3
2
1
1
4
3
1
1
1
1
2
1

4
2
7
5
6
3
4
2
3
5
4
2

ITEMI
5
7
7
5
7
6
7
6
7
6
5
7

6
5
4
4
5
4
3
5
4
4
3
4

7
3
4
2
4
3
4
6
4
3
4
3

8
1
7
7
2
7
4
6
5
4
3
3

9
5
4
3
6
7
5
6
4
6
5
6

10
1
2
1
1
1
1
2
1
1
2
1

Total
29
41
38
40
41
39
38
42
37
32
32

Prelucrare elemenetar a datelor cu stabilirea unor indicatori


fi
35
38
18
43
70
45
40
49
57
14
409
pi 0,45 0,49 0,23 0,56 0,91 0,58 0,52 0,64 0,24 0,18
qi 0,55 0,51 0,77 0,44 0,09 0,42 0,48 0,36 0,76 0,82
X i 3,18 3,45 1,63 3,90 6,36 4,09 3,63 4,45 5,15 1,27
S2 4,36 1,67 1,05 2,89 0,65 0,49 1.05 4,42 1,36 0,21
Tabelul 5. Cuprinde date de exemplificare pentru matricea Stern. Cazul chestionarelor de atitudini cu
rspunsuri polihotomice
La aceast form polihotomic de exprimare a rezultatelor itemului, indicele de dificultate nu
se mai confund cu media itemului i variana itemului nu se mai obine prin formula expus anterior. n
acest caz, media nu permite de a aprecia dificultatea fiecrui item. Pentru calcularea indicelui de
47

AUREL STAN

dificultate se utilizeaz formula: pi =

fi
, n care pi este indicele de dificultate, fi este suma valorilor
f i max

obinute la un item de ctre ansamblul subiecilor (n cazul nostru 11 subieci), fi max este valoarea
maxim pe care ar fi putut-o obine ansamblul subiecilor, dac fiecare ar fi obinut nota maxim. n
exemplul nostru fi max este egal cu 77, valoare care rezult din nmulirea cifrei 7 (valoarea maxim pe
care o poate obine un subiect la un item) cu valoarea 11, care reprezint numrul total de subieci.
Valoarea pi = 0,45, indicele de dificultate al primului item se obine prin mprirea valorii 35 (fi) la 77 (fi
35
max). Astfel, pi =
= 0,45 . Media itemului, notat de noi cu X i se obine prin mprirea valorii fi
77
(suma valorilor unui item) la N (numrul total de subieci care au efectuat itemul. Astfel, pentru calculul
f
35
= 3,18
mediei primului item avem: X i = i =
N 11
n unele cazuri se calculeaz dificultatea medie itemilor unui test, notat mp. n cazul
k

4,80
= 0,48 , n care pi este indicele de dificultate a itemilor i k
10
k
numrul total de itemi, n cazul nostru k = 10. Aceast valoare este preferabil mediei testului pentru a
exprima tendina central din cadrul ansamblului itemilor, deoarece aceasta este influenat prin
sistemul de notare a rspunsurilor.
Valoarea indicelui de dificultate poate fi influenat de doi factori, i anumite de probabilitate
de reuit prin ntmplare i de numrul de itemi care sunt omii. Dei o serie de autori consider i
itemii omii n calculul dificultii itemului57, noi considerm c analiza de itemi nu poate fi efectuat
dect atunci cnd itemii sunt rezolvai n ntregime sau cnd subiecii omit foarte puine rspunsuri. n
cazul n care dispozitivul de rspuns este cu alegere multipl, pot interveni rezolvri prin hazard,
subiectul alegnd la ntmplare un anumit rspuns care poate fi cel corect.
n cazul rspunsurilor de tip da/nu cota de hazard poate s ating 50%, n cazul cnd trei
posibiliti de alegere, i doar una este corect, cota de hazard poate s ating 33%, iar cnd subiectul
are ase posibiliti de alegere, dintre care doar una este corect, cota de hazard poate s ating 16%.
Se consider util, n unele cazuri, calcularea unei corecii pentru a preveni deformarea
rezultatelor.
Redm n continuare un exemplu cu rezultate fictive pentru a exemplifica coreciile pentru
cazul alegerii dintre mai multe variante de rspuns:
exemplificat de noi mp =

57

1=1

Vezi Laveault, D., Gregoire, J., op. cit. pag 225

48

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

Subieci
1
2
3
4
5
6
7
8
9
10
Pi
Pi
diferena

Numr de rspunsuri la alegere


2
4
6
8
1
1
0
1
0
1
1
1
1
1
1
0
1
1
0
1
0
0
1
0
1
1
0
1
0
0
1
1
1
0
1
0
0
1
0
1
1
0
1
1
0,60 0,60 0,60 0,70
0,20 0,47 0,52 0,66
0,40 0,13 0,08 0,04

Tabelul 6. Cuprinde exemplificarea modului de corecie n


cazul rspunsurilor cu alegere multipl
Formula pentru corectarea indicelui de dificultate
n cazul rezolvrii prin efectul hazardului este urmtoarea:

1 pi 58
p'i=pi-

M 1
n aceast formul p'i reprezint indicele de
dificultate corectat; pi reprezint indicele de dificultate de
plecare; M reprezint numrul de alegeri la acel item.
Aceast corecie poate fi realizat doar n unele cazuri i
nu ntr-un mod sistematic, deoarece este puin plauzibil
situaia ca subiecii s efectueze la hazard itemii. Corecia operat nu schimb ordinea de clasare
subiecilor.
Vom face o serie de consideraii asupra varianei, noiune deosebit de important n analizele
statistice descriptive i infereniale. Pentru calculul varianei itemilor se utilizeaz, n exemplul care
urmeaz, formula de calcul anunat anterior59. i n cazul analizei de itemi variana este un indicator al
dimensiunii capacitii de discriminare, care de fapt este menirea general a acestui indicator statistic.
Dac un ir de valori ale unei variabile (rezultatele la un test sau la un item) prezint o valoare
constant pentru toate valorile, atunci valoarea varianei este egal cu 0 i , n consecin, nu avem
nimic de studiat la irul respectiv. n cercetrile psihologice i n cele care privesc testul psihologic
variana joac un rol deosebit, deoarece n quasitotalitatea cazurilor ne intereseaz de a opera
discriminri ntre subieci prin intermediul rezultatele acestora. Este, de aceea, interesant de a studia
raporturile dintre varianele itemilor i variana rezultatelor testului n ntregime. Vom apela la un
exemplu fictiv simplu, care prezint un numr redus de itemi i un numr redus de subieci.
Subieci
1
2
3
4
5
6
7
8
9
Media
Variana
Tabelul 7.

Item 1
Item 2
Item 3
Item 4 Scor X Item 5
Item 6
X+5
X+6
1
1
1
1
4
1
1
5
5
0
0
0
0
0
1
0
1
0
0
0
0
0
0
1
0
1
0
1
1
1
1
4
1
1
5
5
0
0
0
0
0
1
0
1
0
0
0
0
0
0
1
0
1
0
1
1
1
1
4
1
1
5
5
1
1
1
1
4
1
1
5
5
0
0
0
0
0
1
0
1
0
0,44
0,44
0,44
0,44
1,77
1
0,44
2,77
2,22
0,278
0,278
0,278
0,278
4,44
0,00
0,278
4,44
6,94
Cuprinde date ilustrative pentru evidenierea raporturilor dintre variana itemilor i variana
rezultatului global al testului.
n tabelul cu rezultate prezentat observm c itemii 1,2,3,4 sunt rezolvai de 4 subieci din
nou, aceeai de fiecare dat (subiecii 1,4,7,8 i rezolv i subiecii 2,3,5,6, i 9 nu i rezolv). Aceti
58
59

Dup Laveault, D. i Gregoire J., op. cit., pag. 226.


Am efectuat calculele cu ajutorul programului SPSS, care nu mparte la N, ci la N-1

49

AUREL STAN

itemi au aceeai medie i aceeai varian. Pot fi considerai omogeni, cel puin din punct de vedere
formal. Scorul X constituie scorul compozit al itemilor 1- 4. Liniile terminale inferioare ale tabelului conin
calculele mediilor i varianele scorurilor itemilor i a celui composit. Itemul 5 este reuit de toi subiecii.
Scorul compozit (X+5) are, firesc, o medie mai mare cu 1 fa de scorurile compozite X, dar o abatere
standard identic cu acestea (4,44). Itemul 6 are aceeai medie i aceeai varian ca fiecare din itemii
1-4. Scorul compozite X+6 este rezultat din adiia scorurilor compozite X i a scorurilor itemului 6. n
mod firesc media scorurilor compozite (X+6) este mai mare cu media scorurilor compozite X cu 0,44,
dar variana este aproape egal cu valoarea 2,50. Observm clar c variana scorului X este mult
superioar sumei varianelor scorurilor de la itemii 1 la 4 (0,278+0,278+0,278+0,278<4,44), De
asemenea observm c variana scorurilor (X+6) este mult mai mare dect suma varianei
scorurilor(4,44+0,278 < 6,94). Se observ clar faptul c adugarea unui item omogen mrete
capacitatea de discriminare a testului.
Pentru a evidenia efectul schimbrii structurii rspunsurilor subiecilor la itemi, oferim, n
continuare, un nou exemplu.
Subieci Item 1 Item 2 Item 3 Item 4 Scor X Item 5 Item 6 X+5
X+6
1
1
0
1
0
2
1
0
3
2
2
0
1
1
0
2
1
0
3
2
3
0
0
1
0
1
1
0
2
1
4
1
0
0
0
1
1
0
2
1
5
0
1
0
1
2
1
1
3
3
6
1
0
1
0
2
1
0
3
2
7
0
1
0
1
1
1
1
2
2
8
1
0
0
1
2
1
1
3
3
9
0
1
0
1
2
1
1
3
3
Media
0,44
0,44
0,44
0,44
1,766 1,000 0,444 2,666 2,111
Variana 0,278 0.278 0,278 0,278 0,250 0,000 0,278 0,250 0,611
Tabelul 8. Cuprinde date ilustrative pentru evidenierea raporturilor dintre variana itemilor i variana
rezultatului global al testului
Observm la acest tabel o situaie complet schimbat n privina varianei testului, n ciuda
faptului c itemii componeni au aceeai medie i aceeai varian. Explicaia acestei stri de fapt o
gsim n examenul atent al relaiei care exist ntre itemii constituind testele. Astfel, variana scorurilor
compozite X este mult mai mic dect fiecare din varianele itemilor testului (0,250<0,278). n tabelul
anterior itemii sunt euai sau reuii simultan. n ultimul tabel informaia furnizat prin itemi este mai
contradictorie, deoarece avem un ansamblu: format din itemi cu structuri (cu pattern-uri) eterogene. La
un item reuit nu avem o situaie similar la alt item, considernd n ansamblu situaia. La o bun parte
din cazuri, cnd un item este reuit, cellalt este euat i invers. La primul test itemii constituie structuri
omogene, iar la al doilea test ei constituie structuri eterogene. Pentru a explica oscilaiile de valoare ale
varianei totale fa de varianele itemilor vom constitui matricea varian covarian pentru itemi
binari. Dac variana este un indicator care se refer la o singur serie de valori, covariana este un
indicator care se obine prin prelucrarea a dou serii de valori i exprim cantitatea comun de variaie
a acestora. n cazul cnd avem la dispoziie valorile acelorai subieci la itemii i i j, atunci formula
covarianei este:
50

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

Covij = pij pi * pj
n care pi este indicele de dificultate a itemului i, pj este indicele de dificultate a itemului j i pij este
proporia subiecilor care au rezolvat concomitent itemul i i j.
Nr. crt.
1
2
3
4
5
6
7
8
9
10
11

Item i
Item j
Coinciden de rezolvare concomitent
1
0
1
1
+
0
1
1
1
+
0
0
1
1
+
1
0
1
1
+
0
0
0
1
1
1
+
fi = 7
fj = 7
fij = 5
pi = 0,63
pj = 0,63
pij= 0,45
Tabelul 9. Cuprinde ilustrarea etapelor de calcul pentru efectuarea calculului covarianei.
Pentru a uura observarea ansamblul combinaiilor de concomitene i neconcomitene ale
rezolvrilor corecte se ntocmete n analiza de itemi un aa-numit tabel al celor 4 cmpuri. Pentru cele
dou serii de date de mai sus, tabelul celor 4 cmpuri se prezint n felul urmtor.

Item
Rspuns corect
i
Rspuns incorect
Total
Tabelul 10. Tabelul celor 4 cmpuri.

Itemul j
Rspuns corect Rspuns incorect
a
5
b
2
d
2
c
2
7
4

Total
7
4
11

Respectnd denumirea de tabel al celor 4 cmpuri, redm coninutul acestora:


Cmpul a cuprinde numrul subiecilor care au rspuns corect att la itemul i ct i la itemul j (pattern 11);
Cmpul b cuprinde numrul subiecilor care au rspuns corect la itemul i i incorect la itemul j
(pattern 1-0);
Cmpul c cuprinde numrul subiecilor care au rspuns incorect la itemul i i corect la itemul j
(pattern 0-1)
Cmpul d cuprinde numrul subiecilor care au rspuns incorect att la itemul i,ct i la itemul j
(pattern 0 0)
nsumarea cmpurilor a i b ne indic numrul subiecilor care au rspuns corect la itemul i;
nsumarea cmpurilor c i d ne indic numrul subiecilor care au rspuns incorect la itemul i;
nsumarea cmpurilor a i c ne indic numrul subiecilor care au rspuns corect la itemul j;
nsumarea cmpurilor b i d ne indic numrul subiecilor care au rspuns incorect la itemul j.
Punnd n aplicare formula pentru calcularea covarianei pentru cei doi itemi din tabelul,
obinem urmtorul rezultat: Cij = pij pi*pj = 0,45 (0,63*0,63 ) = 0,45 0,40 = 0,05.
51

AUREL STAN

Pentru un chestionar n care rspunsurile sunt da i nu (care pot fi traduse numeric n 1 i 0),
douard Friemel i Annick Weil-Barais sugereaz posibilitatea existenei unei structuri de date
particulare n cadrul unui tabel, care fac posibile urmtoarele tipuri de relaii ntre rspunsurile la doi
itemi60:
Relaii de independen, n care toate celulele tabelului sunt completate cu o cifr care confirm
existena unui anumit pattern de rspuns. Itemii sunt considerai independeni, n sensul c
msoar caracteristici diferite;

Itemul i

Da
Nu

Itemul j
Da
Nu
X
X
X
X

n acest tabel gsim prezente pattern-urile: Da-Da, Da-Nu, Nu-Da i Nu-Nu, deci toate tipurile
posibile.
Relaii de echivalen, n situaia n care toi subiecii care rspuns Da la j rspund, de asemenea,
Da la i i toi subiecii care rspund Nu la j, rspund Nu i la i.

Itemul i

Da
Nu

Itemul j
Da
Nu
X
0
0
X

Relaia de echivalen presupune c cei doi itemi msoar acelai lucru


Relaii de excludere, n situaia n care toi subiecii care rspund Da la j, rspund Nu la i i toi
subiecii care rspund Nu la j rspund Da la i. Existena acestei relaii presupune c exist
excludere ntre ceea ce msoar cei doi itemi.

Itemul i

Da
Nu

Itemul j
Da
Nu
0
X
X
0

Relaii de ordine sau de implicare, n situaia n care subiecii care rspund Da la i rspund Da i la
j, dar nu i invers, toate celelalte cazuri fiind posibile.

Itemul i

Da
Nu

Itemul j
Da
Nu
X
0
X
X

n acest caz se prezum o relaie de implicare ntre ceea ce msoar itemii (i implic j, dar nu i
invers), deci o relaie de ordine ntre itemi. O variant a unei astfel de relaii este urmtoarea:

Itemul i

Da
Nu

Itemul j
Da
Nu
X
X
0
X

n acest caz, j implic i, dar nu i invers.


Pentru a avea un tablou general al tendinelor de variaie a itemilor i a covariaiei acestora
este util de a crea matricea varian covarian. Inspectnd aceast matrice ne putem face o impresie
60

n Weil-Barais, A (coordinatrice), Les Mthodes en Psychologie, Bral , Rosny, 1997, pag.200-201.

52

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

despre omogenitatea sau eterogenitatea structurii itemilor care compun un test. Variana unui test este
egal cu suma varianei fiecrui item la care se adaug dublul sumei valorilor fiecrei covariane
posibile n ansamblul itemilor componeni. Schema teoretic a matricei varian-covarian este
urmtoarea (presupunem un ansamblu de 6 itemi):
ITEMI

S2T =

I
T
E
M
I

1
S21
C21
C31
C41
C51
C61

1
2
3
4
5
6

2
C12
S22
C32
C42
C52
C62

3
C13
C23
S23
C43
C53
C63

4
C14
C24
C34
S24
C54
C64

5
C15
C25
C35
C45
S25
C65

6
C16
C26
C36
C46
C56
S26

Tabelul 11. Cuprinde exemplificarea modului de formare a varianei rezultatului global al unui test.
Pentru cele dou tabele exemplificative pentru utilizarea itemilor omogeni i eterogeni rezult,
dup efectuarea calculelor, urmtoarea situaie:
1
I
2
T
3
E
4
M
I 5
6

1
0,28
0,28
0,28
0,28
0.00
0,28

2
0,28
0,28
0,28
0,28
0.00
0,28

ITEMI
3
4
0,28 0.28
0,28 0.28
0,28 0.28
0,28 0.28
0.00 0.00
0,28 0.28

5
0.00
0.00
0.00
0.00
0.00
0.00

6
0,28
0.28
0.28
0.28
0.00
0,28

1
I
2
T
3
E
4
M
5
I
6

1
0,25
-0,19
0,03
-0,08
0,00
-0,08

2
-0,19
0,25
-0,08
0,14
0,00
0,14

ITEMI
3
4
0,03
-0,08
-0.08
0,14
0,25
-0,19
-0,19
0,25
0,00
0,00
-0,19
0,25

5
0,00
0,00
0,00
0,00
0,00
0,00

6
-0,08
0,14
-0,19
0,25
0,00
0,25

Tabelul 12. Cuprinde dou exemplificri pentru varianele i covarianele itemilor omogeni(stnga) i
eterogeni(dreapta)
Observm clar n tabelul din dreapta o serie de valori negative care trag n jos valoarea de
ansamblu a varianei, Valorile negativ exprim o lips de consonan a tendinelor de variaie. Cu ct
asemenea valori negative se gsesc mai frecvent, cu att variana global a testului va fi mai sczut.
Inspectarea matricei varian-covarian ne permite s observm rapid acele zone de itemi care
ngusteaz mprtierea valorilor unui test i, implicit, capacitatea sa de discriminare.
Tabelul din stnga ofer valori mari ale varianei, fapt cele mai mari, cu excepia itemului
deosebit de facil, care prezint un rezultat uniform (doar valori 1). Vom face n continuare cteva
consideraii asupra valorilor maximale pe care le pot lua anumii indicatori n cadrul operaiilor efectuate
asupra itemilor.
Indicatori maximali ai itemului
Variana cea mai nalt posibil a unui item se obine atunci cnd media aritmetic (care se
confund la itemii care se exprim binar cu indicele de dificultate a itemului) a punctajului itemului este
0,5. Deci valoarea maximal pe care o poate lua variana este 0,25, situaie n care jumtate din
subieci au obinut nota 1 i jumtate nota 0. Valoarea lui p variaz n funcie de calitatea subiecilor
existent ntr-un anumit eantion. Expunem 7 cazuri posibile de evoluie a valorilor varianei n funcie de
valorile p i q.
Situaia
Valoare pi
Valoare qi
Variana pi*qi

a
0,00
1,00
0,00

b
0,20
0,80
0,16

c
0,40
0,60
0,24

d
0,50
0,50
0,25

e
0,60
0,40
0,24

f
0,80
0,20
0,16

g
1,00
0,00
0,00

Tabelul 13. Cuprinde exemplificarea diferenierii valorilor varianei n funcie de diferite valori ale
coeficientului de dificultate.
53

AUREL STAN

Se observ clar c punctul maxim al varianei se produce atunci cnd pi atinge 0,5, dup care
variana ncepe s scad. Exprimm grafic aceast situaie
0,3
0,25
0,2
0,15
0,1
0,05
0
a

Figura 2. Reprezentare grafic pentru diferite valori ale varianei itemilor.


Covariana maximal rezult din formula anunat anterior a covarianei pentru dou iruri de
valori binare.
Mrimea covarianei depinde de cota parte a subiecilor care au rezolvat corect concomitent
ambii itemi. Cota parte de subieci cu dou rezolvri corecte concomitente nu poate s fie mai mare
dect cota parte a rezolvrilor corecte la itemul cu cea mai mic valoare a lui p din ambii itemi. De
aceea, formula poate fi transpus n felul urmtor:
Cmax = pj pipj,
la care pjpi.
Deci covarian maximal este dat de cota parte a subiecilor care au rezolvat corect itemul
greu, i care micoreaz produsul valorilor celor 2 itemi. Dac, de exemplu, vom avea itemi cu
dificultile 0,8 i 0,5, rezultatul maximal va fi 0,10. Deci covariana maximal ntre doi itemi poate fi
exprimat i n felul urmtor:
Cmax pjqi
n consecin, covariana maximal este produsul cotelor parte a acelor subieci care au
rezolvat corect cel mai greu item i fals pe cel mai slab. Cnd ambele cote pri sunt egale, rezult
urmtoarea formul pentru covariana maximal:
Cmax = pq.
Se observ c valoarea maxim a covarianei este egal varianei maximale a punctajelor
itemilor.
Gradul relaiei ntre dou serii de itemi sau indicele de corelaie ntre doi itemi poate fi
exprimat prin intermediul aa-numitului coeficient , care poate fi exprimat prin intermediul formulei:
pij pi * p j
=
. Toi termenii formulei sunt cunoscui din explicaiile anterioare pentru
p i pi2 * p j p 2j
itemii care prezint valori binare, 0 i 1. O formul similar pentru calcularea coeficientului de corelaie
pij pi * p j
pentru doi itemi care posed valori binare este: urmtoarea =
. De asemenea
pi * qi * p j * q j
termenii au fost explicai anterior61.

61Formulele

54

sunt preluate din Paul Horst,op.cit.pag.112

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

Matricile de corelaii sunt necesare n cazul unor analize care urmresc stabilirea gradului de
satisfacere a unor criterii de apreciere pentru anumii itemi sau pentru ansamblul lor.
Exemplificm calculul unei corelaii pe datele folosite pentru exemplificarea calcului
covarianei:
Nr. crt.
1
2
3
4
5
6
7
8
9
10
11

Item i
1
1
0
1
0
1
1
1
0
0
1
fi = 7
pi = 0,63

Item j
0
1
1
1
0
1
0
1
0
1
1
fj = 7
pj = 0,63

Coinciden de rezolvare concomitent


+
+
+
+
+
fij = 5
pij= 0,45

Tabelul 14. Cuprinde date ilustrative pentru calculul corelaiei dintre valorile a doi itemi
0,45 0,63 * 0,63
0,45 0,40
0,05
Astfel, =
=
=
= 0,21
0,23 * 0,23 0,23
0,63 0,63 2 * 0,63 0,63 2
Datele organizate ntr-o matrice a lui Stern se pot transforma prin prelucrrile matematice
corespunztoare ntr-o matrice de corelaii. Exemplificm prin urmtoarea matrice cu date binare, 6
itemi i 11 subieci62.
Ca i n cazul seriilor de date continue sau discret polihotomice, coeficientul de corelaie a
unei serii de date binare poate lua valori pozitive, nule i negative, avnd aceeai semnificaie. n
exemplul dat nu au rezultat indici negativi de corelaie datorit particularitii de structurare a datelor.
Coeficientul de corelaie joac un mare rol n psihometrie. Coeficientul de corelaie prin
momentul produselor a lui Karl Pearson poate s ia cea mai mate valoare 1,00 i cea mai mic
valoare 1,00. Aceste granie sunt atinse n cazuri speciale. La punctajele testelor care se compun din
valori de msur binare, coeficientul de corelaie prin momentul produselor este n general mai mare
dect 1,00 i mai mic dect 1,00. Coeficienii sunt funcii ale valorilor maxime care pot s le
primeasc varianele i covarianele itemilor.
Subieci
1
2
3
4
5
6
7
8
9
10
11

1
1
0
0
1
1
1
0
1
0
1
0

2
1
1
0
1
1
0
1
1
0
1
1

ITEMI
3
4
1
1
0
0
0
1
0
0
0
1
1
1
1
1
1
1
0
1
1
0
0
1

5
0
0
1
1
1
0
0
0
0
1
0

6
0
1
0
1
0
1
0
1
1
0
0

1
I 2
T 3
E 4
M 5
I 6

1
1,00
0,44
0,15
0,66
0,35
0,77

2
0,44
1,00
0,66
0,26
0,91
0,44

3
0,15
0,66
1,00
0,66
0,35
0,77

ITEMI
4
0,66
0,26
0,66
1,00
0,24
0,44

5
0,35
0,91
0,35
0,24
1,00
0,35

6
0,77
0,44
0,77
0,44
0,35
1,00

Tabelul 15. Cuprinde date ilustrative pentru matricea de corelaii interitemi


62

Aceast matrice are date fictive i prezint doar o raiune exemplificativ.

55

AUREL STAN

Toate procedeele de corelare prezentate pn n prezent sunt variante ale r-ului lui Karl
Pearson. n 1968 F.M. Lord i M.R, Nowick au demonstrat c un coeficient biserial obinut este cu 20%
superior coeficientului de corelaie punct biserial. Urmtoarea ecuaie permite de a transforma o
corelaie punct biserial n corelaie biserial:
pq
* rpbis
Y
n cazul valorilor extreme ale lui p sau q, David Magnusson a demonstrat c o corelaie
biserial poate fi pn la 4 ori superioar corelaiei punct biseriale, din cauza faptului c variana
itemului poate afecta n mare msur valoarea maxim pe care o poate lua corelaia punct biserial,
care este echivalentul algebric al r-ului lui Pearson. Din acest motiv este important, atunci cnd folosim
un program de calcul computerizat, conceput pentru a calcula indicele de discriminare, s tim ce tip de
corelaie este folosit pentru a calcula corelaia dintre rezultatul itemului i rezultatul total al testului.
Pentru aprecierea calitilor itemilor se efectueaz corelaii ntre acetia i rezultatul global al
testului sau, n cadrul operaiunii de validare, ntre itemi i rezultatelor unor criterii. Formulele pentru
efectuarea corelaiilor se disting n funcie de faptul dac seria binare este dihotomic sau dihotomizat.
Seria binar este considerat dihotomic n situaia n care mprirea n 0 i 1 este natural, de
exemplu rspuns corect-rspuns incorect, i dihotomizat cnd ea traduce o situaie n care valorile
sunt acordate prin convenie, situaie ntlnit prin traducerea binar a unor date biografice (exemplu
cstorit necstorit, provenien din mediul urban provenien din mediul rural). n primul caz
vorbim de o corelaie punct biserial i n al doilea caz de o corelaie biserial. Redm n continuare
dou formule de calcul pentru corelaia punct biserial. Indicele de corelaie punct-biseriale se noteaz
rpbis

rbis =

rpbis =

X p Xq
sT

* p * q i rpbis =

X p XT
sT

p
, n care
q

X p este media acelor valori ale rezultatului total al testului care au corespondent n seria

binar a rezultatelor itemilor valoarea 1;


X q este media acelor valori ale rezultatului total care au corespondent n seria binar a

rezultatelor itemilor valoarea 0;


X T este media ntregii serii de rezultate totale;

ST este abaterea standard a seriei de rezultate totale;

p i q sunt cunoscui din consideraiile anterioare, p fiind indicele de dificultate al seriei de date
binare, iar q = 1- p
X p XT
p
Coeficientul de corelaie biserial are urmtoarea formul: rbis =
*
, formul n
ST

care singura necunoscut este litera greceasc , care reprezint nlimea curbei normale n punctul y
corespunznd unei densiti de probabilitate egal cu p.
Oferim, n continuare, un exemplu:

56

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC


Nr.crt.
1
2
3
4
5
6
7
8
9
10
11

p
q
P*q

Item
1
0
1
1
0
0
1
0
1
0
1
6
0,54
0,46
0,248

.
.

Rezultate total (X)


37
29
33
42
27
37
32
25
39
32
45
378

X T = 34,36
ST = 6,24
2
S T =38,93; ST =

Xp
37
33
42
32
39
45
228

Xq
29
27
37
25
32
150

X p = 38

X q = 30

6,24

Tabelul 16. Cuprinde date ilustrative pentru realizarea corelaiei dintre rezultatul unui item binar i
rezultatul global al unui test
n ultimele linii ale tabelului sunt trecute datele necesare calculrii formulelor corelaiilor.
Valoarea pentru un p = 0,54 este egal cu 0,3958.
Aplicnd prima formul pentru coeficientul de corelaie punct biserial, obinem:
38 30
8
rpbis =
* 0,54 * 0,46 =
* 0,2484 = 1,26 * 0,5 = 0,63
6,24
6,24
Aplicnd a doua formul pentru calcularea coeficientului de corelaie punct biserial, obinem

rpbis =

38 34,36
0,54 3,64
*
=
* 1,17 = 0,58 * 1,08 = 0,627 . Observm c prin cele dou
6,24
0,46 6,24

formule se obin practic rezultate identice (jocul aproximrilor face s existe o diferen de 0,003 ntre
cele dou rezultate).
Aplicnd la aceleai date formula pentru variabile dihotomizate obinem:

rbis =

38 34,36
0,54
3,64
*
=
* 1,36 = 0,58 * 1,16 = 0,672 . Observm la aplicarea acestei
6,24
0,3958 6,24

formule o uoar diferen.


Analiza capacitii de discriminare a unui item. Am amintit faptul c variana este un indicator
grosier al capacitii de discriminare a unui item. Aceast capacitate devine important atunci cnd
dorim s difereniem ntre scorurile subiecilor. Din acest punct de vedere, un item apreciat este acela
care va fi rezolvat de o mare proporie din subiecii care au obinut un scor ridicat la test n ansamblu, i
nu de subiecii care au obinut un scor slab la rezultatul de ansamblu al testului. De asemenea, un astfel
de item va prezenta o corelaie ridicat cu scorul de ansamblu al testului.
Anterior am prezentat modul de realizare a corelaiei biseriale i a celei punct-biseriale, cu
ajutorul crora se poate stabili puterea discriminatorie a unui test, urmnd logica corelaiilor, n general.
La testele cu care dorim s efectum o msurare criterial, cerina de discriminare nu
figureaz pe prim plan. Are importan dac depim sau nu valoarea-prag a unui criteriu stabilit
anterior procesului de msurare propriu-zis. Se utilizeaz cu prioritate n evaluarea formativ.
Un indice cunoscut de discriminare i frecvent folosit n practic psihometric este indicele de
discriminare D, pus n circulaie de W.G. Findley n anul 1956, care realizeaz practic diferena dintre
57

AUREL STAN

indicele de dificultate a unui item pentru grupa de subieci considerat puternic dup rezultatele
globale ale testului (notare p+) i indicele de dificultate pentru grupa considerat slab(notare p-).
Indicele D poate lua orice valoare ntre 1 i + 1. Valoarea 0 semnific faptul c un item poate fi rezolvat
la fel de bine de ctre un subiect care are un scor total ridicat i de ctre un subiect care are un scor
total sczut. O valoare negativ semnific faptul c un item a fost reuit de o proporie mai mare de
subieci care au un scor total slab la ansamblul testului Astfel de valori ridic semne de ntrebare
asupra oportunitii utilizrii unui anumit item. ntr-un studiu din anul 1939 asupra seleciei grupurilor
slabe i puternice n operaiunea de elecie a itemilor, T.L. Kelley consider c grupul puternic este
format din acei subieci care au obinut un scor total care-i plaseaz valoric n primii 27% din subieci, iar
grupul slab din subiecii care a obinut cele mai slabe 27% din ansamblul rezultatelor globale de la
test.63 S presupunem c la examinarea a 30 de subieci rezultatele care aparin grupului puternic
cuprind 8 subieci (uoar aproximare a procentului primilor 27% din subieci) i cele care aparin
grupului slab, de asemenea, 8 subieci. Oferim un exemplu fictiv, cu rezultatele totale ale testului i
rezultatul unui anumit item pentru primii i ultimii 8 subieci.
1+1+1+1+1+ 0 +1+ 0 6
0 +1+ 0 +1+ 0 + 0 + 0 + 0
p+ =
= = 0,75 p =
= 0,25
8
8
8
Nr.crt.
1
2
3
4
5
6
7
8

23
24
25
26
27
28
29
30

Rezultat test
65
59
57
55
53
50
49
47

24
23
21
20
19
17
16
14

Rezultat item
1
1
1
1
1
0
1
0
..
0
1
0
1
0
0
0
0

Tabelul 17. Cuprinde date ilustrative pentru calcularea indicelui de discriminare


D=0,75-0,25=0,50. R.L. Ebel a propus n 1965 o scal de repere pentru interpretarea valoric a
indicelui de discriminare E:
Interpretarea discriminrii
Interval valoric al indicelui D
0,40 i mai mult
discriminare foarte bun
De la 0,30 la 0,39
discriminare bun
De la 0,20 la 0,29
discriminare slab
De la 0,10 la 0,19
discriminare limit
Sub 0,10
fr utilitate
Rezultatul obinut la exemplul nostru fictiv este foarte bun din punctul de vedere al reperelor
propuse de Ebel.

proporia de 27% este stabilit ntr-un articol a lui T.L. Kelley din 1939, publicat n "Journal Of Educational Psychology"
intitulat "Selection of upper and lower groups for the validation of test items".
63

58

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

III. CONSTRUCIA TESTULUI PSIHOLOGIC

III.1. CONSIDERAII PRELIMINARE


n momentul n care un specialist i propune s construiasc un test psihologic acesta trebuie
s aib, cu siguran, o motivaie care poate fi de ordin pragmatic sau de natur tiinific. Motivaia
pragmatic decurge din nevoia folosirii unui instrument adecvat pentru detectarea unei caracteristici
folositoare bunei ndepliniri a unei activiti, iar cea tiinific din nevoia gsirii unui instrument sensibil
pentru punerea n eviden a diferenierii unei trsturi pe care autorul testului i propune s o studieze
difereniat. Crearea testului psihologic impune s se urmeze ndeaproape scopul propus i, ca atare,
constructorul testului trebuie s realizeze dac exigenele sale sunt satisfcute, iar n cazul cnd acest
lucru nu se ntmpl, se impune operarea de schimbri n concepie i n planul experimental pentru a
corecta deficienele sesizate.
Paul Kline, un reputat specialist n domeniu susine ideea dup care construcia unui test
psihologic presupune caliti care aparin att omului de tiin (exact, metodic) ct i artistului
(dezinvolt, fantezist). Psihologul care i propune s construiasc un test nu este satisfcut de
exemplarele care exist pn n momentul deciziei de a ntreprinde construcia unui nou instrument sau
cele existente nu-i sunt accesibile datorit preului. Preurile unor teste oferite de firmele constructoare
afirmate sunt uneori inaccesibile. O parte din marile corporaii care ntrein servicii psihologice cu
personal de specialitate bine pregtit i construiesc propriile probe psihologice pentru folosin
exclusiv (dup cum afirm Paul Horst, care a fost amintit anterior n lucrarea noastr).
Profesionistul care i propune s construiasc un test psihologic trebuie s aib serioase
disponibiliti n materie de practic experimental, deoarece lansarea n folosire a unei probe
psihologice presupune examinarea unui mare numr de subieci i prelucrarea corespunztoare a
datelor. n rile n care asociaiile profesioniste sunt puternice, exigenele fa de calitile unui test
psihologic sunt deosebit de mari. Este cazul Asociaiei Psihologilor Americani (APA) care posed norme
severe de acceptare a produselor metodologice, norme care sunt reevaluate periodic.
Sub numele de teste psihologice se produc i o serie de creaii care satisfac nevoile
consumului popular de divertisment (sub form de problematizri uoare) i care au un deosebit succes
de pia64.

O serie de hibrizi ntre profesionism i amatorism a aprut i n ara noastr, dintre care amintim:Horst H, Siewert Cum s
ne calculm coeficientul de inteligen, Gemma Press, Bucureti, 1998; dr. Gerti Senger, dr. Walter Hofmann Cum s ne
calculm coeficientul de personalitate, Gemma Press, Bucureti, 1998; Philip Carter & Ken Russel Teste de inteligen,
Aldo Press, Bucureti, 1998; Hans Jurgen Eysenck Teste de inteligen, Editura Queen, Bucureti, 1998.
64

59

AUREL STAN

Un procedeu mai practic de a lansa un nou test psihologic este acela de a modifica
semnificativ sau a recombina creaiile deja existente. David Wechsler l-a practicat cu deosebit succes,
dar a avut acceptul autorilor testelor (teste ale cror componente au fost combinate ntr-un mod foarte
inteligent). n acest caz, este important proporia modificrii, deoarece, n majoritatea rilor din
civilizaiile de tip occidental, protejarea dreptului de autor opereaz cu deosebit severitate.
Construcia unui test psihologic cunoate o serie de etape care difer neesenial de la autor la
autor.
Dany Laveault i Jacques Gregoire disting 5 etape:
1. Determinarea utilizrilor prevzute de test.
2. Definiia a ceea ce se dorete a msura.
3. Crearea itemilor.
4. Evaluarea itemilor.
5. Determinarea proprietilor metrice ale testului definit. 65
Robert Gregory stabilete urmtoarele etape:
definirea testului;
stabilirea unei metode de scalare;
construcia itemilor;
testarea itemilor;
revizia testului;
publicarea testului66.
A.F. Vukovici consider c, n cazul construciei testului, trebuiesc realizate o serie de prescripii de
procedur referitoare la:
populaia examinailor;
materialul testului care trebuie s stimuleze examinatul spre un comportament specific;
stabilirea indicaiilor testului prin care este expus problema cercetat sau este invitat
subiectul la o anumit interaciune cu materialul testului;
stabilirea diverselor condiii prin care sunt oferite instrucia i materialul testului;
delimitarea comportamentelor ca re sunt considerate relevant diagnostice;
stabilirea unor reguli de ordonare i scheme de clasificare n care diferitele moduri de
comportament semnificative sunt mprite n categorii;
calcularea frecvenelor claselor de valori brute;
sistemul de norme i referine care servete interpretrii i comparrii valorilor brute67.

65 vezi Laveault, Dany-Gregoire, Jacques, Introductions aux theories des tests en sciences humaine, De Boeck&Larcier,
Departament de Boech Universite, Paris, Bruxelles, 1997, pag 79-85.
66 vezi Gregory, Robert J., Psychological Testing, Allyn and Bacon, Boston, London, Toronto, Sydney, Tokyo, Singapore,
1996, pag. 129.
67 vezi Vukovich A. F., Die Konstruktion psychologischer Testen, n Psychologischee Diagnostik (hrsg R. Heiss), Verlag
fur Psychologie Dr. C Hogrefe, Gottingen, 1964.

60

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

Paul Kline indic dou metode de abordare a construciei testelor:


metoda bazat pe analiza itemilor sau metoda bazat pe analiza factorial;
demersul empiric, care a fost pus la punct de creatorii testului clinic MMPI.
n primul caz, se folosesc intens analize statistice care au drept scop crearea unui test
unidimensional, ce i propune de a msura o dimensiune sau un factor. Dup punerea la punct a
ansamblului de itemi, este permanent necesar demonstrarea validitii. Aceast prim manier de
abordare a construciei testului are urmtoarele subetape: stabilirea numrului de itemi; stabilirea
eantioanelor de ncercare; efectuarea testului de ctre subieci; analiza itemilor; selecia itemilor dup
o prim analiz de itemi; rescrierea i validarea itemilor.
A doua manier de abordare presupune depirea a dou probleme cruciale: compoziia
grupului criteriu i stabilirea semnificaiei scalelor care sunt construite plecnd de la aceste criterii.
J. J. Bernier i B. Petrulowicz stabilesc o cale de 8 etape, pe care o considerm un demers clar:
specificarea scopului;
expresia acestui scop n termeni discursivi;
precizarea coninuturilor (care se subdivide n a) descrierea coninuturilor i a abilitilor; b) definirea
unei trsturi i c) analiza muncii i definirea componentelor trsturii i a criteriilor) ;
redactarea itemilor;
punerea la ncercare a itemilor i analiza pretestului (discriminarea i dificultatea, pertinena altor
posibiliti);
compunerea formei finale a testului;
standardizarea (administrare, limite de timp, moduri de corecie);
analiza tehnic a testului (precizie validitate, norme)68.
Dup aceast trecere n revist a unor etape n construcia testului ne permitem s facem
cteva remarci, sperm judicioase:
nu toi autorii stabilesc o ordine n etape a construciei testului (exemplu Lienert, Guthke,
Magnusson, dar acestea sunt implicite). Etapele, odat fixate, au ceva din aerul rigid al unei
construcii scolastice;
construcia unui test nu este niciodat ncheiat. Elaborrile reputate din istoria testului psihologic
au suferit repetate revizii, ncepnd cu scalele Binet Simon i Terman Merril. McKinley i Hathaway
atrag atenia n manualul de prezentare MMPI c proba lor nu este terminat i c gruparea n scale
poate continua dup alte criterii69. Probele lui David Wechsler a avut o elaborare de durat i
multiple revizuiri. La fel s-a ntmplat cu 16 PF-ul lui R.B. Cattell. Matricele progresive Raven
cunosc mbuntiri n scopul onorrii destinaiei psihodiagnostice;
anumite etape ale construciei testului devin preocupri autonome. Exemplu: analiza de itemi (i
chiar n cadrul acesteia analiza distractorilor). ntr-o lucrare de referin din domeniul psihometriei se
afirm c o teorie a distractorilor rmne de construit70.

Bernier, J.J.; Pietrulewicz, B., La psychometrie Gaetan Morin Editeur, Montreal, Paris, Casablanca, 1997, pag.235.
vezi MMPI Saarbrucken (bearbeitet von dr. phil o Spreen) , Verlag Hans Huber, Bern und Stuttgart, 1963.
70 vezi Dickes, Paul, Tournois, Jocelyne , Flieller, Andre, Kop, Jean-Luc, La psychometrie. Thorie et methode de la
mesure, PUF, 1994, pag. 89.
68
69

61

AUREL STAN

Dintre aspectele care condiioneaz construcia unui bun test ne vom opri la concepia care
st baza construciei testului, condiiile unui bun item i la eantioanele pe care se verific testul.

III.2. TEORIA CARE ST LA BAZA CONSTRUCIEI TESTULUI PSIHOLOGIC


La baza construciei oricrui test psihologic se afl o teorie a personalitii sau o teorie despre
natura caracteristicii investigate. Referindu-se la principiile metodologice dup care s-ar ordona
metodele de evaluare n psihologie, Gordon Allport consider c n prim plan se afl teoriile care stau
la baza unui instrument (dac deriv din psihanaliz, asociaionism, analiz factorial, psihologia
genetic, behaviorism)71.
Teoria care st la baza construciei unui test este implicit sau explicit. n unele cazuri, teoria
are componente provenind din mai multe curente psihologice. Zena Helman, profesor de psihopatologie
la Universitatea Lille III spune n aceast privin: Psihodiagnostik-ul pe care Rorschach l public n
anul 1910 se gsete la o rspntie de drumuri. Acest volum dens i foarte bogat, dar n mare parte
empiric-dup cum o recunoate chiar autorul-poart pecetea mai multor curente: psihologia
asociaionist motenit din secolul al XIX-lea, psihanaliza care apruse prin opera lui Freud de circa un
sfert de secol i psihopatologia structural care i are nceputul n acea epoc72.
ntr-o parte din cazuri prii teoretice i se consacr un spaiu foarte restrns, dar n alta spaiul
teoriei cuprinde lucrri n mai multe volume. Ne referim la baza teoretic a testelor proiective
Rorschach, Luscher, Szondi. Der 4 Farben Mensch oder Weg zum Gleichgewicht a lui Max Luscher
cuprinde n sute de pagini lungi excursuri despre specificul uman i echilibrul su intern, psihologia i
filozofia celor 4 culori, normele etice fundamentale, tacticile de aprare contra agresivitii cromatice.
Manualul testului Rorschach, prezentat de ctre M. Loosli-Usteri conine proceduri
asemntoare (de dimensiuni mai reduse) despre studiul teoretic al interpretrilor culoare, studiul
teoretic al interpretrilor clar-obscur, analiza interpretrii formelor umane i animale, etc.
Testul proiectiv creat de Leopold Szondi (una din cele mai enigmatice figuri din istoria
psihodiagnosticului) impresioneaz prin discrepana dintre teoria sa genetic a alelelor recesive,
depit actualmente de evoluia tiinei biologice, i puzderia de formule pulsionale rezultnd din
aceasta73.
n general, o teorie este un corp sistematizat de aseriuni n legtur cu un domeniu al
realitii, care rmne deschis confirmrii sau punerii n discuie. O ntreag sistematic opereaz n
studiul teoriilor tiinifice. Karl Popper, n lucrarea amintit de noi anterior, susine c orice teorie este
falsificabil, adic poate fi infirmat de evoluia investigaiilor tiinifice. Ca atare, teoria tiinific nu are
statutul unui adevr tiinific definitiv. Prin celebra sa teorie a paradigmelor, Thomas Kuhn precizeaz
foarte clar durata de via a teoriilor tiinifice n cadrul comunitii specialitilor dintr-un domeniu.
Asimilarea de durat a termenilor unei teorii poate duna evoluiei tiinifice prin subordonarea metodei
vezi Allport, Gordon W., Structura i dezvoltarea personalitii, Editura didactic i Pedagogic, 1991, pag. 395.
vezi Zena Helman,nnoirea Rorschach-ului i aportul su la psihopatologie din perspectiva curentului fenomenostructural, n Analele tiinifice ale Universitii Al. I. Cuza din Iai (serie nou) - Psihologie-tiinele Educaiei, Tom IV-V,
1995-1996, pag. 113.
73 vezi Legrand, Michel, Leopold Szondi, son test, sa doctrine, Pierre Mardaga, Editeur, Bruxelles, 1979.
71
72

62

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

de cercetare poziiei teoretice. Francoise Parot i Marc Richelle se exprim foarte plastic n aceast
privin: Cnd omul de tiin i proclam supunerea n faa faptelor, el nu poate ignora c le privete,
le nelege, le caut prin formulri teoretice ca printr-o lentil uor colorat care, chiar prin proprietile
sale decupeaz i coloreaz realitatea ntr-un anumit mod74. Despre implicaiile categorizrii s-au scris
lucrri care constituie subiect de interes pentru specialitii n metateorii.
O teorie poate fi meninut artificial prin operarea cu anumite trucuri metodologice, dintre care
amintim selectarea doar a faptelor care o confirm, ntreruperea cercetrii n momentul n care
rezultatele sunt favorabile teoriei, etc.
Investigarea prin intermediul testului psihologic nu permite examinarea unor concepte pure,
ci doar a unor modele ale acestora.
O excelent prezentare a modelelor psihologice de descriere a activitii aparine unui grup de
autori francezi, format din Claude Bonnet, Christiane Kekenbosch, Anh Nguyen Xuan, J.F. Richard i
Charles Tijus75. Conform concepiei lor modelele n discuie au cinci caracteristici majore:
Un model este o particularizare a unei teorii de funcionare cognitiv. El se ataeaz unei teorii,
dar se aplic la un tip de situaie particular i face ipoteze suplimentare n raport cu teoria a crui
prelungire este.
Un model este o formalizare i, ca atare, se exprim ntr-un limbaj formalizat. Acest gen de limbaj
este fr ambiguitate i permite calcule, adic deducii automate. O bun perioad de timp limbajul
logic i matematic erau singurele care permiteau calcule. ns informatica a permis dezvoltarea
altor limbaje formalizate care fac posibile, pe lng calcule numerice, i calcule simbolice, adic
deducii care se poart asupra cunotinelor i a semnificaiilor.
Un model este schematic, adic este o simplificare a realitii care nu reine dect aspectele
eseniale (acestea sunt aspectele care, n principiu, sunt suficiente pentru a prezice un
comportament). Caracterul schematic este i o caracteristic a teoriilor, deci att modelele ct i
teoriile revendic ideea dup care aceste simplificri conserv trsturile eseniale ale realitii prin
raport la tipul de comportament pe care l explic.
Un model furnizeaz predicii validabile prin date experimentale, deci el trebuie s reziste la o
serie de provocri ale realitii. Un model psihologic conine o descriere a situaiei la care el se
aplic (care nu reine dect un anumit numr de elemente pertinente). Modelele conin o descriere
a mecanismelor de tratament informaional pentru acele tipuri de situaii prin care se poate deduce
prin proceduri de calcul automatic (datorit faptului c descrierea este realizat printr-un limbaj
formalizat) comportamentul pe care-l va avea un subiect care se comport precum modelul. Un
astfel de procedeu de tratament informaional se numete simularea comportamentului.
Investigarea prin intermediul unui model se realizeaz n proporii variabile. n multe cazuri,
att modelele ct i teoriile sunt implicite i autorul testului nu insist prea mult asupra prii de
fundamentare teoretic a instrumentului su. Tipul de solicitare pe care l presupune sarcina psihologic
trebuie s fie exprimat n forme concrete, care s realizeze exigena teoretic.
Practic, orice test aflat n construcie trebuie s verifice o ipotez. Pentru a pune o ipotez la
vezi Parot, Francoise, Richelle, Marc, Introducere n psihologie. Istorie i metod, Humanitas, 1995, pag. 195.
Studiul se intituleaz Mesure et modelisation i este o component a volumului Cours de Psychologie (sous la direction
de R. Ghiglione et J. F. Richard, Dunod, Paris, 1995, pag. 268-384.

74
75

63

AUREL STAN

proba faptelor este necesar s traducem noiunile prin operaii de msur sau observaii care le vor da
un coninut empiric. Dac o experien face s intervin viteza de tratament a informaiei de ctre
subieci, trebuie aleas o operaie permind a obine o msur a acestei viteze. ns, exist mai multe
operaii, deja utilizate de diferii cercettori, pentru a efectua o msur. Aceste procedee diferite
furnizeaz msuri n corelaii relativ slabe. Mijlocul de a defini care este cel mai bun, nu este evident.
Pentru a avea certitudine trebuiesc sa fie toate comparate cu o msur adevrat a vitezei de
tratament a informaiilor (n cazul cnd tim o msur adevrat nu trebuie s ne punem problema
care este cel mai bun procedeu). n fapt, alegerea unei operaii se face n fiecare cercetare sub efectul
ipotezelor, care sunt rar explicite. Se poate ajunge n situaia n care alegerea procedeelor diferite
pentru a operaionaliza aceeai noiune s suscite diferene n rezultatele obinute prin cercettori
diferii.
Maurice Reauchlin ofer exemple foarte interesante pentru operaia realizrii diferite a unei
aceleai noiuni76. Realizrile aparin mai multor cercettori care au studiat sarcinile n care viteza cu
care subiectul trateaz informaia care i este furnizat intervine n rezultat. Procedeele poart numele
autorilor lor.
Paradigma lui T. Nethlebeck (timpul de inspecie): Dou linii verticale de lungimi puin diferite
sunt prezentate subiectului ntr-un timp foarte scurt. El trebuie s semnaleze dac cea mai scurt
se situeaz n dreapta sau n stnga. Se determin durata prezentrii care este necesar
subiectului pentru ca el s furnizeze un procentaj de rspunsuri exacte (de exemplu, 95%).
Paradigma lui W. Hick (a timpului de decizie): Subiectul trebuie s sting lumina chiar din
momentul n care ea se aprinde, apsnd un buton. Becul care se aprinde poate fi singura surs
de lumin care i este prezentat sau aceasta trebuie aleas la ntmplare de ctre experimentator
(sau printr-un program care piloteaz experiena) ntr-o serie de 2, 4 sau 8 surse susceptibile de a
se aprinde. Incertitudinea subiectului se mrete odat cu creterea numrului de surse
luminoase. Timpul de reacie crete liniar n funcie de aceast msur de incertitudine. Panta
dreptei care reprezint aceast cretere este un parametru reinut.
Paradigma lui S. Sternberg (viteza de explorare a memoriei de scurt termen): Subiectul observ
n timpul mai multor secunde o serie de cifre de la 2 la 7. Apoi seria dispare i o cifr este
prezentat. Subiectul trebuie s semnalizeze cel mai rapid posibil, apsnd pe unul din cele dou
butoane aflate la dispoziia sa, dac cifra figureaz sau nu n seria aprut. Parametrii reinui sunt
ordonata la origine i panta dreptei reprezentnd creterea timpului n funcie de numrul de cifre
n serie.
Paradigma lui M. Posner (viteza de acces la memoria de lung termen). Se prezint subiectului
cupluri de litere precum AA, Aa, Ab. Timpul de reacie este mai nti msurat cnd se cere
subiectului de a semnala dup prezentarea fiecrei perechi dac cele dou litere sunt fizic diferite
sau nu. Acest timp de reacie este mai lung dac subiectului i se cere apoi de a semnala dac cele
dou litere sunt semantic diferite sau nu. Diferena dintre cei doi timpi este luat ca norm a
timpului de acces la memoria de lung termen care intervine pentru a constata dac A i a sunt
dou litere semantice identice, pe cnd el nu are de intervenit n constatarea unei identiti fizice
(ntr-un cuplu AA, de exemplu).
76

vezi Reuchlin, Maurice Introduction a la recherche en psychologie, Nathan, Paris, 1992, pag. 33-34.

64

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

Viteza de tratament a informaiei pare s intervin n rezultatul celor 4 probe. Dar ea intervine
concurent cu ali factori variind de la o sarcin la alta. Autorul poate s continue de a defini n
cercetarea sa viteza de tratament a informaiei printr-una din aceste paradigme.
III.3. FORMULAREA UNUI BUN ITEM
n privina formulrii unui bun item, considerm important de a aminti c nu orice test se
compune din itemi, n unele cazuri aflndu-ne n situaia unui continuum solicitativ (cum este cazul
probelor pentru examinarea asocierii i disocierii manuale-DM, sinusoida Bonnardel). Itemul, n calitate
de component informaional bazal, se ntlnete la chestionarele de personalitate, la teste de
cunotine colare, testele verbale i nonverbale de inteligen. Exigenele n privina formulrii itemilor
se afl n continu cretere, tot aa sunt i eforturile de cercetare privind selectarea unui bun item,
specificul informaional al fiecrui tip de item, determinarea numrului optim de itemi care compun un
test. Transferul preocuprilor tiinifice ctre aceti atomi ai testului se pare c este o mutaie deosebit
de benefic pentru construirea unui instrument de msura progresiv adecvat domeniului
psihodiagnosticului. Aceast analiz n amnunt a testului, pornind de la iruri de 0 i 1, aduce un spor
informaional considerabil i de o mare diversificare.
Pentru chestionarele de personalitate se recomand respectarea unor exigene formale de
formulare a itemilor, pe lng cele de coninut77:
evitarea folosirii unor termeni care sunt vdit social dezirabili sau indezirabili. Mai ales n cadrul
unor examene de evaluare, se vor da acele rspunsuri care vor fi considerate apreciate de
examinator;
se impune, ca la o parte din itemi, sa se rspund cu da i la alt parte cu nu (rspunsul
valorizat de chestionar), pentru a evita aa-numitul efect de aprobare;
se impune, de asemenea, a redacta ct mai simplu posibil itemii care trimit mai curnd la
comportamente, dect la sentimente sau la emoii;
evitarea referinelor la frecvent, de obicei, adesea;
fiecare item nu trebuie s conin dect un element de apreciat (nu se pot admite formulri de
genul: mi place la fel de mult literatura i istoria);
parte din autori nu recomand rspunsuri ntre da i nu, deoarece aceasta ar atrage indecizia.
Considerm c doar ntr-o mic parte din ntrebrile unui chestionar de personalitate se poate
rspunde prin da i nu, adevrat sau fals. Se poate, de asemenea, afirma c nu exist o
form perfect de exprimare la item care s satisfac absolut toi constructorii de teste.
Nu se poate afirma nici existena unei mrimi standard a testului, legat de numrul de itemi.
Dac un criteriu de economicitate este presant, va trebui redus numrul itemilor, dar nu dincolo de limita
unor valori minimale asiguratorii pentru criteriile de apreciere ale testului. Un numr mare de itemi cer
testele care au ca exigen o mare fidelitate.
Din literatura de specialitate parcurs, doar Paul Kline face referire la numrul minim de itemi
pe care trebuie s-i conin un test, i anume minimum 10 itemi. Considerm cifra exagerat de mic,
gndindu-ne la foarte slaba putere de discriminare a unei probe cu o amplitudine mic a distribuiei. n
faza preliminar de construcie a testului se recomand, de ctre majoritatea autorilor de specialitate, ca
vezi Kline, P., La construction des tests, n Beech, John R., Harding, Leonora, Tests, mode d'emploi. Guide de
psychometrie, ECPA, Paris, 1995, pag. 122-123.

77

65

AUREL STAN

numrul de itemi s fie mrit cu 15-30% n comparaie cu numrul proiectat pentru varianta final.
Partea neartistic de construcie a testului, cea psihometric, va avea n vedere stabilirea unor
indicatori i a unor corelaii: indice de dificultate, indice de segregare, de validitate, de fidelitate i
corelaia itemului cu rezultatul total prin intermediul analizei punct biseriale (ilustrat de noi ntr-un
capitol anterior).
Specialistul care concepe un test psihologic este obligat de a proceda n funcie de accentul
pus pe validitatea de coninut sau validitatea predictiv. n cazul cnd se decide pentru validitatea de
coninut va proceda la un eantionaj de coninut n domeniul de interes. Seria procedural cuprinde
calculul corelaiei punct biseriale, calculul consistenei interne, stabilirea frecvenei scorurilor totale i
exemplificri grafice ale situaiilor.
n cazul testelor de randament, Bogdan Pietrulewicz78 recomand efectuarea corelaiilor
itemilor singulari cu scorul total. Indicele de dificultate este recomandat mai puin pentru selectarea
itemilor.
III.4. PROBLEMA EANTIONAJULUI
Construcia unui test necesit examinarea unui numr apreciabil de subieci. La realizarea
MMPI (Minnesota Multiphasic Personality Inventory) au fost examinai numai n faza de nceput 700 de
subieci dintr-un eantion de locuitori ai statului Minnesota, 350 de aspirani la colegiu i 800 de pacieni
ai spitalului din Minneapolis. Grupa de standardizare pentru spaiul lingvistic german a cuprins 365 de
persoane. Pentru a se asigura contra posibilelor deformri ale sensului ntrebrilor prin traducere n
german a MMPI, acest chestionar a fost aplicat pe un numr de 700 de bilingvi79.
Eantionarea n psihologie se realizeaz mult mai greu dect in alte domenii. Spre deosebire
de sociologi, psihologii nu gsesc subiecii pe strad i nu pot merge dect n rare cazuri la domiciliul lor
pentru a face investigaii tiinifice. n marea majoritate a cazurilor examenul psihologic se desfoar n
spaii special amenajate, cu respectarea anumitor etape. Chiar dac anumii subieci reuesc s
rspund unei invitaii pentru a fi examinai la un laborator psihologic, nu putem fi siguri c au o
motivaie corespunztoare pentru efectuarea examinrii. n ultima vreme, mai ales n ri nalt civilizate,
se practic plata subiecilor, nct problemelor de eantionaj li se adaug unele noi, legate de
dimensiunea financiar a unei examinri.
Practic, subiecii care pot fi examinai n condiii de asigurare a ambianei specifice examinrii
psihologice sunt cei selecionai prin intermediul unei instituii (pacienii spitalelor, elevii liceelor,
persoanele care vin la centrele de evaluare sau la Laboratoarele unor mari ntreprinderi sau regii
naionale. n momentul n care un subiect tie c de rezultatul examenului depinde viitorul su
profesional avem o probabilitate mare de a rspunde motivat la solicitrile testului. Considerm c
subiecii folosii la verificarea probelor psihologice sunt fatalmente selecionai. Constituirea unor
eantioane complet aleatoare duce la complicaii mari de ordin metodologic.
n privina eantionajului avem n fa dou situaii, distincte; eantionaj de persoane care
efectueaz examinarea i eantionaj dintr-un anumit univers specific de itemi. n cazul primei situaii de
eantionaj dintr-o anumit populaie suntem n prezena unei eantionri probabiliste (prin tragere la
sori elementar, prin tragere la sori secvenial, prin grappes i stratificate) i a unei empirice (prin
78
79

vezi Bernier, J.J., Pietrulewicz, B., La psychometrie, Gaetan Morin Editeur, Montreal, Paris, Casablanca, 1997, pag. 240.
Hathaway, S.R., Mckinley, J.C., MMPI Saarbrucken, Verlag Hans Huber, Bern und Stuttgart, 1963.

66

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

quote, prin uniti tip). n privina eantionajului itemilor avem eantionaj simplu, eantionaj stratificat,
eantionaj prin grappes i eantionaj ierarhic.
Chiar n situaia n care subiectul este condiionat instituional apar o serie de probleme, una
dintre ele fiind compoziia unui grup criteriu. Dac la unele problema este simpl (cercetarea n
psihologie colar, de exemplu), n psihologia patologic nu exist un adevrat acord ntre specialiti n
materie de diagnostic. Existena unor nomenclatoare, de genul DSM IV, nu rezolv problema constituirii
unor grupe de subieci criteriu. Paul Kline spune n aceast privin: Chiar dac este posibil de a-i
seleciona plecnd de la un criteriu pentru a constitui un grup, subiecii afectai acestui grup criteriu pot
s se diferenieze de subiecii grupului martor pe mai mult de o variabil. Nite subieci schizofreni
(afectai grupului criteriu) pot s se diferenieze de subiecii grupului de control n domeniul
personalitii, al funciei sociale i al aptitudinilor intelectuale, pentru a nu reine dect trei variabile
importante80.
n timpul primului rzboi mondial Robert Yerkes i colaboratorii si au putut s examineze n
jur de 1,7 milioane de oameni, iar n al doilea rzboi mondial au examinat sute de mii de subieci n
laboratoarele psihologice ale beligeranilor. n urma acestei experiene de rzboi, Germania a fost prima
ar din lume care a definitivat juridic statutul psihologului n anul 1941. Cercetrile din domeniu militar
se dovedesc a fi una din cele mai serioase surse de date pentru verificarea testelor.
III.5.NORMELE I NORMAREA N PSIHOMETRIE
Cuvntul norm are o arie extins i diversificat de utilizare, cuprinznd domeniile
disciplinelor tiinifice i ale activitilor practice. Se vorbete de norme juridice, norme etice, norme
deontologice, norme de circulaie, norme de consum, norme tehnologice, norme ecologice, norme de
comportament, norme de reprezentare.
Sensul general al termenului de norm n disciplinele psihologice aplicative (derivat n limba
romn din termenul englez norm) este un ansamblu de date caracteristice unei populaii, pentru o
sarcin de efectuat i un material determinat, pe care un cercettor l utilizeaz n momentul construciei
unui plan experimental. Normele sunt totodat convenii care regleaz viaa social i trebuie s rezolve
conflictele nainte ca acestea s izbucneasc. Normele de comportament, n calitate de prescripii
nescrise constituite de fiecare grup sau fiecare societate, preocup mai ales psihologia social.
Intereseaz, n special, caracteristicile, geneza i schimbarea normelor, sistemul normativ i deviana
comportamental.
Cel mai frecvent, cuvntul norm se folosete n domeniul psihometric, parte integrant a
psihologiei difereniale, disciplin care se ocup cu teoria i tehnologia instrumentelor de msur n
psihologie. Deseori, termenul de norm se folosete n strns legtur cu cel de etalon, iar cel de
normare cu cel de etalonare. A etalona un test i a norma un test sunt considerate activiti identice. n
definiia lui Maurice Reuchlin, personalitate tiinific de referin n domeniul utilizrii metodelor
cantitative n cercetarea psihologic, etalonarea este stabilirea, ntr-o prob psihologic, a unei scale
permind de a situa rezultatul obinut de un subiect prin raportare la rezultatele care au fost observate
anterior ntr-o populaie de referin suficient de numeroas i omogen de subieci comparabili aceluia
care a fost examinat81. Etalonul, n general , este o mrime standardizat servind de referin i de
Vezi Kline, Paul, La construcion des tests, n Beech, John R. , Harding, Leonora Tests, mode d'emploi. Guide de
psychometrie, ECPA, Paris, 1995, pag. 120.
81 Vezi Grand dictionnaire de la psychologie, Larousse, Paris, 1992, pag. 284
80

67

AUREL STAN

msur ntre diverse obiecte. A etalona presupune fixarea gradaiilor pentru un instrument de msur,
stabilirea gradaiilor pentru o scal. A norma nseamn a fixa pentru o mrime numrul de norme sau
de etaloane care sunt cuprinse. Att etalonul ct i norma presupun o convenien ntre utilizatorii de
msuri. Considerm c normarea presupune un grad de convenien crescut n comparaie cu
etalonarea, operaiune care implic un interes crescut pentru asigurarea identitii semnificaiei unitii
de msur. Atunci cnd efectum o operaiune de msurare suntem dependeni foarte mult n apreciere
de puterea informaional pe care am dobndit-o n urma efecturii acesteia Nu ne este indiferent dac
suntem n domeniul scalar nominal, ordinal, de log-interval, de interval, de raport sau absolut. Ignorarea
acestui fapt duce la grave erori de aprecieri i la operaii statistice lipsite de sens.
Problema normrii rezultatelor cantitative ale cercetrii psihologice a aprut odat cu
dezvoltarea psihologiei experimentale i, mai ales, cu apariia testului psihologie, dar continu s creeze
probleme tinerilor psihologi practicieni prin confuziile unor termeni i a unor tehnici folosite n realizare,
fapt pentru care este nc apreciat drept una de actualitate. Aceast problem apare frecvent n
interpretarea cantitativ a datelor provenind din aplicarea instrumentelor psihologice de investigaie i n
docimologie, n general. Normarea poate fi aplicat pentru orice metod psihologic de investigaie ale
crei rezultate pot fi exprimate mai ales cantitativ, dar, n special, n domeniul construciei i aplicrii
testelor psihologice, care sunt instrumente standardizate. n general vorbind, standardizarea
procedurilor este indispensabil comunicrii tiinifice a informaiilor care se prezint sub form
cantitativ i oricrei ntreprinderi metodologice de comparare. Ea este inerent oricrui demers de
observaie tiinific.
III.5.1. Metode de etalonare a rezultatelor persoanelor
Interpretarea scorurilor obinute la un anumit test psihologic se face n etape. Prima etap
este transformarea scorurilor brute ntr-o scal care permite de a stabili o baz de comparaie.
Orice subiect cruia i-a fost aplicat un instrument de investigaie psihologic obine un rezultat
observabil, exprimat conform prescripiilor manualului de rspunsuri (n urma aplicrii grilei de corecie).
Testul computerizat exclude existena unei grile de corecie ca material al testului, procednd
automatizat, avnd precizie i rapiditate de necomparat cu modalitile tradiionale de corectare.
Redarea automat a rezultatelor brute i a diferitelor feluri de transformri posibile nu exclude
necesitatea nvrii modului de constituire a etaloanelor i a cunotinelor privind reconsiderarea i
reevaluarea lor. Operaiile tehnice care stau la baza unei astfel de practici nu trebuie totui s fie uitate
de ctre cercettori i practicieni.
Mai ales testele de randament intelectual i pentru msurarea diferitelor abiliti psihomotorii
au rspunsurile mprite n corecte i incorecte, n marea lor majoritate. Realizarea punctrii unui
singur item este n concordan cu valoarea rspunsului, 0 puncte pentru rspuns incorect, 1 punct
pentru rspunsul corect. La inventarele de personalitate i de interes rspunsurile nu se apreciaz n
aceti termeni, ci n funcie de faptul dac pun n eviden sau nu caracteristica investigat sau, mai clar
exprimat, atitudinea exprimat fa de coninutul aseriunii unui item.
n marea majoritate a cazurilor rezultatele aplicrii unor instrumente de investigaie
psihometric dobndesc consisten cantitativ prin operaiile de adiie realizate n cadrul unor matrici.
Cel mai simplu i cel mai frecvent tip de matrice este matricea lui W. Stern.
O astfel matrice de date care poate fi reprezentat sub dou dimensiuni:
Liniile care reprezint rspunsurile unei aceleai persoane la itemi diferii
68

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

Coloanele, care cuprind rezultatele diferiilor subieci la un singur stimul.


Deoarece elementele liniilor sunt constituite din rezultatele subiecilor la fiecare item, din
analiza acestora putem trage concluzii asupra unor profile de rspuns ale subiecilor (crora li se spune
i pattern-uri de rspuns). Din analiza coloanelor putem trage concluzii asupra calitii itemilor. Indici de
similaritate i de distan pot fi calculai att pe liniile ct i pe coloanele aceleai matrici. n 1966,
R.B. Cattel a propus o extensie a matricii lui W. Stern pentru veni n ntmpinarea unei practici curente a
cercetrii, aceea care const n a aprecia stabilitatea temporal sau intersituaional. Dac se repet
acelai chestionar n mai multe ocazii se obine o matrice subieci-itemi-ocazii. Ocaziile temporale vor
ocupa o a treia intrare a unei structuri tridimensionale, numit curent cutia lui Cattel.
O serie de teste psihologice de randament psihomotor nu sunt compuse din item, ci
puncteaz diferite criterii de apreciere a ndeplinirii sarcinii prezentat sub forma unui continuum
solicitativ (n acest caz punctarea este constituit prin numrul de erori, durata medie acestora, timpul
de efectuare a probei etc.).
Problema care const n a msura subiecii dup o trstur, o caracteristic sau o abilitate,
se rezum la a nsuma rspunsurile unui anumit numr de itemi, n aa fel nct s se obin un rezultat
care s fie fructul msurii pentru fiecare persoan. O asemenea nsumare d natere la un scor.
Operaiunea de creare a unui scor este numit de specialitii psihometricieni scorare.82 Scorul realizat
prin adiionarea valorilor obinute la itemi poart numele de scor compozit. Itemii se pot prezenta i mai
diversificat dect notarea dihotomic, situaie care se ntlnete mai ales la inventarele de atitudini.
Aproape totdeauna se pot reprezenta modele pentru a msura indivizii, trasnd o curb care face
legtura dintre intensitatea caracteristicii i probabilitatea de a obine un rspuns corect. Chiar dac nu
suntem niciodat sigur de faptul c msurm bine o anumit caracteristic, se poate aprecia c
scorurile obinute, printr-o combinaie de itemi, se constituie ntr-o bun aproximare.
Scorurile brute sunt acele scoruri care sunt obinute direct, imediat dup corectarea probei,
fr nici o alt intervenie prealabil. Aceste variabile brute au amplitudini foarte diferite, fapt care face
s nu ne putem orienta apreciativ n privina locului relativ al unui subiect ntr-un ansamblu de subieci
care au efectuat o anumit prob. Scorul 75 la un test psihologic care poate obine note brute de 0 la
200 nu poate fi comparat cu cel de 178, obinut la un test la care se pot obine note ntre 0 i 380. Este
nevoie de o serie de prelucrri matematice ale variabilelor brute, operaiune care le va face
comparabile.
Un scor brut nu are semnificaie psihodiagnostic dect dac este pus n legtur cu
randamentul unui grup de respondeni comparabili. Grupul de referin se mai cheam i grup normativ.
Primul element care trebuie luat n seam n cazul cnd dorim s aflm poziia relativ a unui subiect n
interiorul unui grup este tabelul care prezint norme referitoare la ansamblul randamentelor individuale
din grupul de referin. Utilizarea normelor este ghidat de anumite principii de interpretare a
rezultatelor. Respondentul al crui scor este comparat cu norma sau etalonul trebuie s posede
anumite caracteristici asemntoare acelora ale grupului de apartenen. Msurarea cu ajutorul unui
test psihologic construit n spiritul teoretic clasic capt sens prin raportare.

O asemenea denumire este folosit frecvent de Constantin Mitrofan n cartea Testarea psihologic a copilului mic, Editura
All, Bucureti, 1997

82

69

AUREL STAN

Alte elemente care trebuiesc luate n consideraie sunt validitatea i fidelitatea datelor,
operaiuni strict specializate n psihometrie i a cror realizare cere un timp considerabil.
Pentru a putea raporta valorile brute obinute de un subiect la valori de referin trebuiesc
efectuate examinri pe grupuri de subieci posednd aceleai caracteristici. Este necesar de a face
distincia dintre noiunea de populaie i cea de eantion. Populaia este constituit din ansamblul
indivizilor (n domeniul psihologic, ansamblul subiecilor) care satisface exigenele unei anumite definiii.
Grupul de referin poart numele de eantion doar n cazul n care selecia subiecilor s-a fcut prin
respectarea rigorilor unor anumite reguli, fapt care-i confer acestuia reprezentativitate, adic calitatea
care face posibil tragerea acelorai concluzii din analiza grupului ca i din analiza populaiei, admind
anumite riscuri tolerabile de eroare.
Procedura de etalonare a unui test cuprinde efectuarea acestuia de ctre cel puin un
eantion din populaia de referin. Debutul procedurii trebuie s se fac printr-o definiie foarte clar a
acestei populaii. Din punct de vedere statistic, populaia este ansamblul tuturor cazurilor care constituie
obiectul de interes al cercettorului, clar precizat. Din punct de vedere teoretic ansamblul poate fi finit
sau infinit, dar datele cu care se confrunt psihologul sunt n toate cazurile n numr finit. n cazul n
care populaia este constituit dintr-un mic numr de cazuri, ea poate fi n ntregime msurat. Dar,
colectarea exhaustiv de rspunsuri ale subiecilor din populaie este de cele mai multe ori imposibil.
Trebuie s ne limitm la domeniul eantioanelor, adic la pri, subansambluri ale populaiei, plecnd de
la care caracteristicile populaiei trebuie aproximate ntr-un mod satisfctor. n definirea populaiei
trebuie s se in cont de o serie de caracteristici precizate de destinaia psihodiagnostic a testului.
Dac testul este destinat a diagnostica tulburrile de dezvoltare senso-motorie a copilului mic (02 ani),
populaia vizat va fi, desigur, aceea a copiilor n vrst de la 0 la 2 ani. Un chestionar care i propune
s evalueze dezvoltarea social a handicapailor mentali, va avea ca populaie de referin aceast
categorie demografic defavorizat. O recomandare general este ca populaia de referin s fie
suficient de omogen, adic ca toi indivizii susceptibili de a fi evaluai cu ajutorul unui test s fac clar
parte din ea. Cnd un test este dezvoltat de ctre un editor comercial, exist frecvent exigena ca
normele s fie naionale Avantajul major de a se referi la o populaie naional este de a permite
producia unui sistem unic de norme, valabil pentru un foarte mare numr de subieci. Interesul
comercial i uurina de folosire sunt evidente. Referina la populaia naional nu implic ca normele
diferitelor teste s fie ipso facto comparabile, deoarece aceast populaie nu este totdeauna definit cu
aceeai rigoare de ctre cei care editeaz un instrument de investigaie. Neconcordanele survin cnd
editorii nu se pun de acord n legtur cu includerea anumitor grupuri atipice n populaia de referin.
Deficienii mentali, sunt cteodat inclui i, n alte cazuri, exclui din populaie. Ca atare, normele
naionale sunt deficitare, datorit prea extinsei lor generaliti. De aceea, este mai adecvat pentru
practicieni de a lua decizii sprijinindu-se pe norme specifice. Un psiholog care activeaz profesional n
medii socioeconomice defavorizate va avea mai mare nevoie, n general, de norme elaborate pentru
acest tip de populaie. Aceast raiune, alturi de cea financiar, este frecvent invocat ca justificare a
practicii de a nu dezvolta dect norme locale. n acest caz, populaia de referin va fi mai bine
circumscris. Ea va corespunde elevilor din colile unui ora sau pacienilor dintr-o instituie de
recuperare psihomotorie. Normele vor avea referin la aceste populaii i vor servi, n mod obinuit,
pentru obiective foarte precise: a ajuta la orientarea elevilor ctre diferite profesiuni, la constituirea de

70

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

grupuri omogene pentru nvare etc. Limitele folosirii normelor locale decurg din prea marea lor
specificitate. n acest caz, pentru alte utilizri ale testului sau chestionarului va fi adesea necesar de a
dezvolta noi norme, extinse n privina ariei de apartenen a populaiei.
Din raiuni de economie, se procedeaz frecvent la o eantionare de convenien, deoarece
este comod pentru practician, adic la utilizarea de subieci apropiai anturajului psihologului sau de
persoane care se prezint voluntar ca urmare a unui anun. Aceast procedur trebuie respins,
deoarece antreneaz serioase deformri sistematice n estimarea parametrilor populaiei. Lsarea la
aprecierea practicianului nu conduce, n general, la constituirea unui eantion reprezentativ din
populaie, deoarece erorile datorate unei lipse de sistematizare sunt foarte dificil de controlat. Mai mult,
procedura nefiind aleatorie, nu este posibil de a evalua importana erorii de estimaie a parametrilor. n
1971, W.H. Angoff face remarca c, pentru testele cognitive folosirea eantionajului de convenien
conduce n mod obinuit la o supraestimare a scorurilor populaiei. ntr-adevr, subiecii voluntari sau
care aparin ambianei cercettorului constituie un subgrup sociocultural favorizat n rndul populaiei.
III.5.2.Tipuri de scale normative n psihometrie
n general, n psihometrie se face raportare la 5 categorii de scale83:
- scale de coninut.
- scale de dezvoltare;
- scale care utilizeaz raporturi i coeficieni;
- scale care se bazeaz pe cuantumuri procentuale sau cuantile,
- scale care face apel la scoruri standardizate;
III.5.2.1. Scalele normative de coninut
Aceste scale permit de a compara randamentul unui respondent la un standard definit prin
coninutul testului. Acest tip de scale se folosete mai ales la acele teste utilizate n activitatea de
selecie profesional n care sarcina este foarte apropiat activitii reale pe care o va avea de efectuat
candidatul n cazul n care va fi admis. Exemplul clasic este proba mainii de scris. n acest caz este
stabilit clar un randament maximal, ideal, de care subiectul se poate apropia i, n cazuri excepionale,
chiar realiza. Se compar deci un randament individual cu un randament ideal. Acest tip de scal nu se
aplic dect la testele de randament maximal. Randamentul subiectului se calculeaz prin urmtoarea
formul:

Numarul de raspunsuri corecte


*100 .
Numarul total de itemi
Dac subiectul poate realiza un randament maxim de 400 de puncte i nu a realizat dect 324
324
atunci se va face urmtorul calcul:
* 100 = 81% . Scorurile derivate n acest mod sunt foarte
400
dependente de proprietile itemilor testului. Un scor de 81% va fi interpretat dup uurina sau
dificultatea itemilor. Pentru doi respondeni este posibil de a obine acelai scor rspunznd corect la
O scal variaz dup postulatele subiacente la fiecare nivel de msur. Astfel, centilele sunt ranguri; scorurile standard
sunt bazate de o unitate standard z i constituie o scal de intervale egale. Calculul coeficienilor nu este posibil dect
plecnd de la scale de proporii.
83

71

AUREL STAN

itemi comportnd un grad de dificultate variabil. De exemplu, dac A i B obin amndoi 70% se poate
spune c A a reuit itemii uori i c B a reuit itemi uori i dificili. Scalele de coninut pun o serie de
probleme:

validitatea trebuie s fie asigurat printr-o eantionare adecvat bazat pe o definiie precis a
domeniului msurat;

interpretarea scorurilor trebuie s fie n funcie de coninutul msurat i de itemi rezolvai prin
respondent.
Astfel de scale prezint avantajul c permit de a interpreta scorurile calculate n funcie de
randament. Aceste scoruri indic gradul de abilitate pe care l posed n prezent un respondent, mai
curnd dect poziia sa relativ ntr-un grup.
Dezavantajele constau n dificultatea de a preciza coninutul i natura sarcinilor complexe i n
dificultatea de a afirma c un respondent stpnete un nivel de dificultate dat pentru c el a reuit,
probabil, att la itemi uori ct i la itemi dificili. Interpretarea unui scor este totdeauna aproximativ,
deoarece noiunea de dificultate se raporteaz mai mult dect la un singur subiect.
III.5.2.2. Scale normative de dezvoltare
Exist dou tipuri de scale de dezvoltare: una este n funcie de vrst, alta n funcie de
nivelul de colarizare. Principiul care st la baza construciei acestora este c anumite abiliti i
caracteristici se dezvolt ntr-un mod sistematic. Se utilizeaz pentru a compara randamentul unui
subiect cu randamentul mediu al altor subieci avnd atins un anumit nivel de dezvoltare.
Postulatul fundamental al scalelor de dezvoltare mintal este c gradul prezenei unor abiliti
sau caracteristici msurate se mrete sistematic cu vrsta. Dac o caracteristic nu se mrete
sistematic cu vrsta, ea nu este adecvat pentru scopul propus. Dac procentul de schimbare variaz
de la an la an, inegalitatea mrimii unitii complic interpretarea. n general, dezvoltarea mintal se
stabilizeaz la adolescen.
Rezultatele scalei de dezvoltare sunt tributare unui numr de factori, precum educaia, mediu
social-economic, influenei culturale, stabilitii emotive. Aceast scal pare s convin pentru copiii
care triesc ntr-un mediu tipic.
Scale normative pe niveluri de vrst Dup vrst, Alfred Binet a considerat c dezvoltarea
mintal se estimeaz prin compararea randamentului unui copil cu acela al copiilor de vrste diferite. El
a selecionat sarcini intelectuale (itemi) care i permiteau de a discrimina copiii de vrste diferite.
Exemplu: itemul 9 l efectueaz doar civa copii de 7 ani i majoritatea celor de 8 ani. Este recomandat
pentru vrsta de cel puin 8 ani. Binet a realizat colecii de itemi pentru examinarea fiecrei vrste.
Scorul reprezentativ este cel al eantionului reprezentativ.
Vrst mental este termenul pe care-l folosete pentru prima dat Alfred Binet. Este vrsta
corespunztoare performanelor realizate de ctre copiii normali de o anumit vrst, la anumite
solicitri de natur intelectual. Este determinat prin nivelul probelor reuite de ctre un anumit copil.
Probele create de Binet (i ulterior de Simon) constituie o scal ierarhic. Vrsta mental este nivelul de
vrst pentru care toate rspunsurile specifice sunt corecte.
n 1905, treizeci de probleme sunt prezentate n ordine cresctoare de ctre Alfred Binet i
Thodule Simon. Acest nivel de dificultate a fost determinat empiric, administrnd probele la 50 de copii
72

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

normali n vrst de la 3 la 11 ani i la civa copii i aduli retardai. Nu este dat nici o metod de a
ajunge la un scor total. n 1908, numrul probelor a crescut, unele din cele vechi au fost eliminate, i ele
sunt regrupate prin nivelul de vrst mental n funcie de rezultatele obinute de ctre 300 de copii
normali. Dup anul 1911 ,(an n care testul modificat comport 5 itemi pentru fiecare nivel de vrst), se
calculeaz vrsta mental innd cont de reuita parial n vrstele superioare vrstei de baz. Astfel,
un copil care a reuit toi itemii pentru 7 ani i 5 itemi reuii pe un nivel superior va avea o vrst
mental avansat n funcie de reuita suplimentar. S-a constatat c un acelai numr de ani, de
avans sau de ntrziere, nu are aceiai semnificaie pentru vrsta real. Un an de ntrziere la 4 ani nu
are acelai sens ca un an de ntrziere la 11 ani.
Pentru a ine cont de aceasta situaie, William Stern a introdus n 1912 noiunea de Q.I. care
este un raport ntre vrsta mental i vrsta cronologic (sau vrsta real calculat n luni). Acest raport
este multiplicat prin 100, ceea ce determin anularea numerelor zecimale. Un Q.I de 100 reprezint o
performan potrivit cu vrsta real, unul inferior cifrei 100 indic o ntrziere n viteza de dezvoltare
i un Q.I. mai mare 100 indic un avans n dezvoltare.
Constituirea de scale pe niveluri de vrst se deruleaz n mai multe etape.
1. Sunt constituite eantioane de subieci pentru o anume vrst. O vrst este definit ca un interval
mai mult sau mai puin extins dect vrsta n chestiune.
2. Este calculat un scor mediu la fiecare grup de vrst.
3. Eventual, scorurile diferitelor trane de vrst sunt estimate prin interpolare. Procedura se utilizeaz
cnd anumite vrste nu au fost incluse n eantionul de etalonare i cnd se dorete a prezenta
normele pe luni i nu numai pe ani. Procedura de interpolare rspunde la postulatul unei progresii
liniare a caracteristicilor evaluate prin test. Ea const n a calcula valoarea intermediar ntre
valorile inventariate prin eantionul de etalonare. Exemplu: dac scorul mediu obinut la test pentru
copiii de 7 ani este de 14 puncte i cel obinut de copiii de 9 ani este de 18 puncte, se poate estima
c scorurile medii ale copiilor de 8 ani este de 16 puncte.
Scale dup nivelul colar. Se compar randamentul colar al unui subiect cu acela al unui
cursant mediu din diverse niveluri colare. Exemplu: 7,6 este randamentul comparaiei cu nivelul mediu
de 7 ani i 6 luni. Stabilirea acestei valori indic faptul c elevul are nivelul corespunztor de cunotine.
Este vorba de o msur continua. Trstura trebuie s varieze sistematic cu nivelul colar. Efortul fcut
pentru a determina i reevalua nivelurile colare este foarte mare i cercettorul se lovete de
nenumrate dificulti pe care nu le poate depi dect stabilind o serie de convenii.
III.5.2.3 .Scale bazate pe raporturi i coeficieni.
Cel mai bun exemplu este msura coeficientului intelectual Q.I., care se obine prin
compararea vrstei mentale cu vrsta cronologic. Specialitii au demonstrat c vrsta mental luat
izolat nu d un indice suficient de precis al dezvoltrii mentale. Pentru calcul se utiliza formula:
virsta mentala
Q.I.=
* 100 . Raportul se va numi coeficient de inteligen. Denumirea va face
virsta crono log ica
carier, fiind utilizat n varii domenii de activitate tiinific i practic.
Q.I.-ul lui W. Stern, ca raport ntre vrsta mental i vrsta cronologic, nu trebuie confundat
cu Q.I.-ul lui Wechsler, care n general, are valori mai nalte. Unui Q.I. de 115, n varianta Wechsler, i
corespunde un clasament identic pentru subieci aparinnd la grupe de vrst diferite, pe cnd
73

AUREL STAN

semnificaia Q.I.-ului lui W. Stern variaz n funcie de vrst, deoarece abaterea standard a distribuiilor
acestor Q.I.-uri nu este aceeai pentru toate vrstele.
n funcie de problemele asociate abaterilor standard, neechilibrate i de faptul c dezvoltarea
intelectual nu are o relaie liniar cu vrsta, raportul coeficientului creat de W. Stern nu mai este utilizat
i nu mai prezint dect un interes istoric. n locul raportului de coeficient se utilizeaz scoruri standard
bazate pe eantioane reprezentative ale populaiei de fiecare nivel. Aceste scoruri, numite i Q.I.-uri
deviate, prezint o medie de 100 i o abatere standard de 15, pentru scala Wechsler, i egal cu 16
pentru scala Stanford-Binet (pentru fiecare categorie de vrst).
III.5.2.4.Scale care se bazeaz pe cuantumuri procentuale sau cuantile
Quantilul este un element al unei serii ordonate de elemente care va avea n faa lui (valori
mai mari) un procentaj determinat al unui ansamblu de date. Practic, este o born numeric separnd
dou cuantumuri procentuale al valorilor obinute de un grup de referin la o anumit examinare prin
intermediul unui instrument psihometric. Separaia unui ansamblu de valori ale unei variabile n quantile
constituie o form de etalonare. Ea permite de a situa un subiect, care a obinut un scor determinat,
ntr-o anumit clas a subiecilor pentru care testul a fost etalonat. Se va vorbi de intercuantile (de
interdecile, de exemplu) pentru a desemna n+1 zone de distribuie delimitate prin quantile. Uneori se
utilizeaz termenul de interquantil n loc de quantil. Distincia clar se face prin precizarea c
interqantilul este, n majoritatea cazurilor, un interval numeric, pe cnd quantilul este reprezentat de o
singur valoarea numeric. Lucrrile se specialitate ale lui Maurice Reuchlin consacrate statisticii
aplicate n psihologie fac clar aceast separaie de sensuri pentru cele dou noiuni.84
La nceputul procedurii de cuantilaj (form particular a etalonajului) se alege o metric, adic
un numr de niveluri pe care scala permite de a le discrimina. Dac o scal cuprinde n niveluri i dac
N
. Scala n cuantile va
efectivul total al unui eantion este N, efectivul fiecrui nivel va fi teoretic
n
corespunde, deci, unui model rectangular. Cele mai frecvente mpriri n cuantile se fac ntre 1 i 10
trepte, cu urmtoarele denumiri.
Nr.crt.
Nr. interquantile
Nr. quantile
Denumire tehnic
1
3
2
Trecil
2
4
3
Quartil
3
5
4
Quintil
4
6
5
Sextil
5
7
6
Septil
6
8
7
Octiil
7
9
8
Nonil
8
10
9
Decil
9
100
99
Centil
Tabelul 18. Denumirile formelor de etalonare prin intermediul cuantilelor, gradiente de la 3 la 10.
Pentru a construi un decilaj se procedeaz n aa fel ca toate clasele noii scale s conin
fiecare un acelai numr de scoruri din eantionul de referin. Este vorba de o convenie care va face
distribuia rectangular. Dac scala este constituit din 10 clase egale n efectiv, acest efectiv va trebui
s aib 10% din numrul total al subiecilor. Interquantilul I corespunde primelor 10 % din notele brute,
84

Vezi Reuchlin, Maurice, Prcis de statistique, PUF, Paris, 1976, pp. 67-78

74

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

celor mai slabe din distribuie, interquantilul II 10% din rezultatele care urmeaz, i aa mai departe,
pn la interquantilul X. Quantilul I va separa primii 10% din subieci de urmtorii 90%, quantilul II primii
20% din subieci de urmtorii 80 %, i aa mai departe pn la quantilul IX, care va separa primii 90%
de urmtorii 10% .
Oferim un exemplu imaginat n care un psiholog examineaz un numr de 360 de subieci cu
un anumit test n vederea etalonrii acestuia. Aceast procedur se efectueaz n faza construirii unui
instrument de investigaie psihologic sau n cazul reevalurii acestuia. Notele testului variaz ntre 0 i
35. Exemplu dat este unul imaginat i nu va conine primele 5 valori (1, 2, 3, 4, 5) i ultimele 3 (33, 34 i
35). De obicei, n examinare se obin foarte rar scorurile cele mai mici i scorurile cele mai mari. Dac
datele ar fi fost reale ar fi trebuit s se fac o serie de precizri cu privire la constituirea eantionului de
etalonaj, adic la proveniena subiecilor examinai, vrsta, nivelul de studii, sexul, etc. De asemenea, ar
fi trebuit s se fac precizri cu privire la tehnicile folosite pentru selectarea subiecilor n eantion.
naintea operaiunii de etalonare, datele se organizeaz cresctor n variante de variaie.
Tabelul ntocmit n vederea stabilirii scalei de etaloane n 10 interquantile (sau n 10 clase) va
arta n felul urmtor:
X
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

N
3
7
4
6
8
11
14
17
16
19
24
22
26
21
24
18
19
17
14
16
14
11
9
7
6
5
2

NC

3
10
14
20
28
39
53
70
86
105
129
151
177
198
222
240
259
276
290
306
320
331
340
347
353
358
360

NCT

INTERDECIL

DECIL

NUMEROTARE

% INTERDECIL

SEPARAIE DECIL

36

0 11

11

10,88%

10,88%/89,12%

72

12 13

13

II

8,61%

19,49%/80,51%

108

14 15

15

III

9,72%

29,21%/70,79%

144
180

16 17
18

17
18

IV
V

12,77%
7,22%

41,98%/58,02%
49,20%/50,80%

216

19 20

20

VI

12,50%

61,70%/38,30%

252

21 22

22

VII

10,27%

71,97%/28,03%

288

23 24

24

VIII

8,61%

79,58%/20,42%

324
331
340
347
353
358
360

25 26

26

IX

8,33%

87,91%/12,09%

12,09%

27-32

Tabelul 19. Coloanele tabelului conin etape ale procedurii de etalonare prin metoda cuantilelor a
rezultatelor obinute de un eantion de subieci la un test psihologic

75

AUREL STAN

Notaiile folosite n tabel:


X: nota brut
n: frecvena absolut a unei variante de variaie
nc: frecvena cumulat absolut
nct: frecvena cumulat absolut necesar teoretic pentru calcularea interquantilelor i quantilelor.
Jocul frecvenelor cumulate absolute face s nu putem tia distribuia exact acolo unde
trebuie. n acest caz, ne limitm n calcul la cele mai apropiate valori de cele teoretice. Astfel, la primul
decil ar fi trebuit s ne oprim la valoarea 36. Valoarea 39 folosit de noi ca valoare delimitativ pentru
primul decil este cea mai apropiat valoare de valoarea 36. Procednd n acest fel am realizat un
compromis metodologic. Acceptabilitatea compromisului poate fi stabilit prin metoda chi-ului ptrat de
ajustare.
ft

fo

( f o f t )2

fo- ft

( f o f t )2

ft
39
36
3
9
0,23
31
36
-5
25
0,81
35
36
-1
1
0,03
46
36
10
100
2,17
26
36
-10
100
3,85
45
36
9
81
1,80
37
36
1
1
0.03
31
36
-5
25
0,81
30
36
-6
36
1,20
40
36
4
16
0,40
Total
11,32
Tabelul 20. Coloanele tabelului indic desfurarea procedurii Chi ptrat de ajustare pentru calcularea
distanei dintre efectivele teoretice necesare calculrii decilelor i cele observate practic.
Coloana fo desemneaz efectivele observate, iar coloana ft efectivele teoretice
Pentru aceast valoare a lui chi ptrat gsim un p>0,10, ceea ce duce la acceptarea ipotezei
de nul, constatare care arat c distana dintre cele dou serii de efective nu este semnificativ. Deci,
utilizarea efectivelor observate poate fi considerat un compromis acceptabil
n cazul cnd dorim s stabilim o scal n centile, avem la ndemn o procedur puin
diferit. Pentru a pune n aplicare aceast procedur trebuie s avem distribuii ale cror amplitudini
sunt de ordinul sutelor. Raiunea construirii scalelor care fac apel la centile este de a asigura o
discriminare foarte fin a subiecilor dar, n cazul cnd amplitudinea distribuiei este sub 100, asigurm
o fals finee a diferenierii. Redm, n continuare, un tabel ale crui coloane indic paii de urmat n
procedura de calcul:
Lum exemplu a 137 de subieci care au fost examinai cu un anumit test (exemplul este
fictiv):
Nr.crt.
1.
2.
3.
4.
76

X
11
12
13
14

F
2
5
7
11

f%
1,57
3,94
5,51
8,68

fc
2
7
14
25

fc%
1,57
5,51
11,02
19,69

Percentila
0,79
3,54
8,27
15,35

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC


5.
6.
7.
8.
9.
10.
11.
12.

15
16
17
18
19
20
21
22

19
26
18
15
11
7
4
2

14,96
20,47
14,17
11,81
8,66
5,51
3,15
1,57

44
70
88
103
114
121
125
127

34,65
55,12
69,29
81,10
89,76
95,28
98,43
100,00

27,17
44,89
62,21
74,50
85,43
92,52
96,85
99,22

Tabelul 21 Coloanele tabelului indic etapele necesare calculrii valorilor percentile.


Avem n fa un exemplu simplu, deoarece n practic este foarte puin probabil s se
gseasc un test la care s se poat obine doar 12 valori distincte.
Procedura exemplificat de noi este folosit de autori reputai n domeniul psihometric ca
David Magnusson85, J.J. Bernier i B. Pietrulewicz86. Prin aceast procedur se ncearc a se ameliora
impreciziile metodei prezentate la calculul decilelor.
Coloana notat cu X conine diferitele variante ale variabilei obinute n urma unei examinri
cu un anumit test. A doua coloan, notat cu f, conine frecvenele diferitelor valori ale variabilei. n total,
au fost cuprini n analiz 127 de rezultate ale subiecilor. Cu f% a fost notat frecvena simpl relativ,
care se obine prin nmulirea cu 100 a rezultatului mpririi fiecrei frecvene simple la 127 (numrul
total de subieci examinai). Cu fc a fost notat frecvena absolut cumulat ascendent, iar cu fc%
frecvena relativ cumulat ascendent. Valorile din aceast coloan se obin prin nmulirea cu 100 a
rezultatului mpririi fiecrei valori din coloana fc la 127. Ultima coloan conine transformarea n valori
percentile a valorilor iniiale ale testului. Cum se obin aceste valori? Valoarea 13 este considerat
mijlocul unui interval de clas care se ntinde de la 12,5 pn la 13,5. Ca atare, valoarea percentil este
constituit din frecvena cumulat relativ anterioar valorii 13 i din adugarea din frecvena relativ
din dreptul valorii 13.
5,51
8,56
8,27 = 5,51 +
; 15,35 = 11,2 +
2
2
Ce ne spune o valoare percentil? Ea ne spune, de exemplu, c sub valoarea 16 se gsesc
aproximativ 45% din totalul subiecilor, iar peste aceast valoare se gsesc aproximativ 55 % din totalul
subiecilor.
III.5.2.5. Scale care fac apel la scoruri standardizate
Printre transformrile curente pentru a face lizibile scorurile brute se numr i urmtoarele:
Transformri liniare n scoruri standard, folosind media i abaterea standard a distribuiilor.
Normalizarea, const n a transforma distribuia scorurilor ntr-o distribuie normal. Practic se
divizeaz curba normal ntr-un numr de clase de lungimi egale, dup care este uor de a
determina efectivele de subieci corespunznd fiecrei clase. Se pot ntocmi tabele care s
furnizeze procentaje teoretice de efective de clas a unei distribuii normale n care se divizeaz
ansamblul ordonat al valorilor n 7, 9, 11, etc. pri egale. Este suficient de a repartiza msurile
originale ntr-un numr de clase, respectnd procentajele. Aceste transformri sunt nonliniare.
Una dintre cele mai cunoscute transformri se refer la interpretarea msurilor de interval,
85
86

vezi Magnusson, David, Testtheorie, Verlag Fraanz Deutlicke Wien,1973, p. 252


vezi Bernier, J.J., Pietrulewicz, B., La psychometrie, Gaetan Morin Editeur, Montreal, Paris, Casablanca, 1997, pg.371-372

77

AUREL STAN

care poate fi facilitat efectund o simpl transformare liniar de forma: x2= ax1+b, n care x1 este
msura original i x2 este msura transformat.
a=

1
i b = m2 am1, m1 i 1 fiind media i abaterea standard a distribuiei msurilor originale, m2
2

i 2 fiind valorile corespunztoare pentru distribuia dorit. n transformarea n scoruri centrate reduse
sau scoruri z avem formula: x2 = (x1-m1)/1.
Astfel, msurile pot face obiectul unei interpretri mai directe. Dac aceste scoruri au o
distribuie apropiat de legea normal Gauss-Laplace pentru a determina unde se situeaz rezultatul
unui subiect prin raport cu rezultatele subiecilor unui grup de referin, aplicnd proprietile acestei legi
de repartiie. De exemplu, despre un subiect care va obine un scor egal cu 2 ntr-o distribuie normal
de medie 0 i o abatere standard egal cu 1 ,,vom putea spune c doar 2,3% din subiecii grupului
referin obin un scor superior celui obinut de el.
n schimb, utilizarea scorurilor z pentru a facilita interpretarea unui scor este jenat de faptul
c aceste scoruri prezint valori negative, au o amplitudine foarte redus i se prezint sub form
zecimal. Este motivul pentru care se utilizeaz adesea alte transformri liniare. Prezentm, n
continuare, o serie de transformri liniare posibile:
Scor
m
Scor original
37,4
Scoruri z
0,00
Scoruri Stanford-Binet
100
Scoruri Wechsler
100
Scoruri H
50
Army General Clasification Test
100
Scala Wechsler (pentru subteste)
10
College Board Scholar Aptitude
500
Scoruri Stanine
5
Graduate Record Examination
500
Scoruri STEN
5,5
California Entrance Examination 500
Board
Scoruri T
50
%>scor

6,5
1
16
15
14
20
3
100
2
100
2
100

Corespondene ntre diferite scoruri transformate liniar


19
25
43
36
29
48
- 2,83 - 1,91 0,86
- 0,22 - 1,29 1,63
54,71 64,48 113,78 96,56 79,32 126,09
57,54 74,38 112,92 96,77 86,62 124,46
10,37 23,29 62,06 46,98 31,91 72,83
43,38 61,85 117,23 95,68 74,15 132,62
1,51
4,28
12,58 9,35
6,12
14,89
216,92 309,29 586,15 478,46 370,77 663,08
- 0,66 1,18
6,72
4,57
2,42
8,76
216,92 309,29 586,15 478,46 370,77 663,08
- 0,16 1,68
7,22
5,07
2,92
8,76
216,92 309,29 586,15 478,46 370,77 663,08

10

21,89 30,92
99,76 97,20

58,82
19,50

47,85
59,70

37,08
90,15

66,31
5,26

Tabelul. 22 Conine 12 exemple de transformri liniare aplicate la 6 scoruri i procentajul de subieci


care au un scor superior scorului considerat, n situaia n care scorurile se distribuie
normal.
Exemplul este imaginat pentru o distribuie care are o medie a scorurilor brute egal cu 37,4 i
o abatere standard egal cu 6,5. Coloanele m i conin (cu excepia primelor valori) mediile i
abaterile standard pentru distribuiile n care dorim s facem conversiunea scorurilor. n practic, decizia
este luat n funcie de particularitile situaiei n care se afl cercettorul sau psihologul practician.
X m
Pentru obinerea scorurilor z folosim formula: z =
. Pentru o valoare brut egal cu 19

(prima exemplificare n tabel) vom avea: z =

78

19 37,4
= 2,83 . Pentru obinerea scorurilor T
6,5

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

(introduse de McCall n 1922) vom folosi formula T=50 +

10

( X m).

Pentru obinerea scorurilor H (sau scoruri Hull), formula va fi foarte apropiat de cea
14
precedent, avnd o singur modificare: H = 50 +
( X m) .

Dac facem transformri ale unei distribuii observate care nu deviaz semnificativ de la
exigenele curbei Gauss-Laplace obinem o nou distribuie n care quasitotalitatea valorilor variaz
ntre 3 i +3, obinndu-se valori cu zecimale. Dac transformarea se face n variabile T, noile date
obinute vor varia ntre 20 i 80, iar dac conversiunea se face n variabile H se vor observa valori care
variaz ntre 0 i 100. Aceste note vor avea un plus de comoditate n utilizare. Optarea pentru un
anumit tip de conversie a datelor nsemn i optarea pentru aceste limite de oscilaie, indiferent ce
amplitudini au distribuiile notelor brute ale diferitelor teste aplicate pe diferite eantioane i indiferent ce
medii i abateri standard utilizm. Am amintit anterior condiia ca aceste date brute s se distribuie
apropiat de o distribuie normal. Denumirea frecvent a conversiunilor bazate pe utilizarea mediei i
abaterii standard este de scoruri standard.
n obinerea unor etaloane de bun calitate intervin constrngeri de reprezentativitate i de
cost. Exist o nevoie justificat de a le reactualiza periodic, date fiind schimbrile temporare care se
observ mai ales n randamentul la probele cognitive (autorii de specialitate vorbesc de o accelerare
biologic i intelectual a dezvoltrii). Dup 1980 s-au produs teste psihologice computerizate care
beneficiaz prin program de o reetalonare permanent, odat cu introducerea unor noi date n memoria
calculatorului. Scorurile standard prezint avantajul de a prezerva forma distribuiei msurilor originale.
Din nefericire, dac aceast distribuie nu este normal, interpretarea scorurilor nu este n nici un fel
facilitat prin transformare.
Un punctaj al unei distribuii de valori brute care a fost obinut prin transformare liniar are
semnificaie statistic clar. Poziia relativ care este indicat de o anumit valoare standard a unei
distribuii de valori nenormalizate depinde n ntregime de forma distribuiei. Cu ct mai mult o distribuie
de scoruri se apropie ca de o distribuie normal Gauss, cu att mai sigur poate fi interpretat o valoare
standard n distribuie.
n scopul de a obine o semnificaie statistic clar a scorurilor individuale, este realizat
adesea o normalizare a distribuiei.
ntr-o distribuie normal Gauss, se tie exact cte procente de subieci exist deasupra,
respectiv dedesubtul unei valori pe o scal de o anumit medie i o anumit unitate de msur. Aceast
calitate este exploatat la prezentarea rezultatelor testelor psihologice n selecie i consiliere. Atenia
nu este concentrat pe comparaia ntre diferite niveluri ale scalei, ci pe poziia relativ pe care un
individ o ocup ntr-o distribuie ale crei proprieti sunt cunoscute.
O normalizare poate s fie realizat i din alte motive. Cnd vrem s lucrm cu diferite
diferene inter i intraindividuale trebuie s prezentm poziiile indivizilor n valori ale unei scale de
interval. Nici o piedic insurmontabil nu poate s apar la construcia instrumentelor de msur, dac
acestea trebuie s msoare variabile de randament, care ofer de regul distribuii normale. ns, la alte
tipuri de variabile este mai greu de realizat o distribuie normal. Exemplu, acele variabile care sunt
msurate cu ajutorul unui inventar de personalitate sau chestionar de atitudini. Chiar cnd acceptm
79

AUREL STAN

premisele teoretice ale distribuiei normale a variabilei cercetate pe un continuum ipotetic, obinem, de
regul, puternice distribuii asimetrice. n acest caz, asimetria este semnificativ, n alte cazuri poate fi
mai puin evident, ns noi nu putem s apreciem n aceast situaie, dac valorile brute indic poziia
indivizilor pe o scal de interval.
Cnd acceptarea distribuiei normale este ndreptit i cnd se obine o distribuie asimetric
a valorilor brute, aceasta semnific c instrumentul de msur nu indic ndreptit poziia relativ. n
astfel de cazuri putem s normalizm distribuia asimetric a valorilor obinute, aceasta nseamn
transformarea formei distribuiei, nct s obinem o distribuie normal a valorilor.
n cazul n care avem distribuii care deviaz semnificativ de la distribuia teoretic GaussLaplace, putem normaliza aceste distribuiii prin repartizarea variabilelor ordonate n limite impuse de
procentele teoretice ale distribuiei amintite anterior. Prezentm un tabel cu rezultate care sunt
normalizate:
Nr.crt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

X
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

Valoare brut
f
Fc
7
7
4
11
8
19
6
25
13
38
16
54
7
61
11
72
19
91
13
104
24
128
14
142
6
148
16
164
7
171
4
175

Fcpm
3,5
9
15
22
31,5
46
57,5
66,5
81,5
97,5
116
135
145
156
167,5
173

p
0,020
0,051
0,085
0,125
0,180
0,262
0,328
0,380
0,465
0,557
0,662
0,771
0,828
0,891
0,957
0,988

Valoare standard normalizat


Z
-2,05
-1,64
-1,37
-1,15
-0,91
-0,84
-0,45
-0,31
-0,09
0,14
0,42
0,61
0,95
1,23
1,72
2,25

Tabelul 23. Tabelul conine n coloanele sale datele necesare pentru a normaliza o distribuie.
Semnificaia simbolurilor din capul coloanelor este urmtoarea:
X variabila brut distribuit pe variante de variaie;
f frecvena simpl absolut;
fc frecvena cumulat absolut
fcpm frecvena cumulat de punct mediu exprimat n valori absolute;
P- proporie care se obine prin mprirea fiecrei valori din coloana fcpm la valoarea numrul total al
subiecilor (175)
z valoarea variabilei centrate reduse care separ ntr-o curb normal Gauss proporia respectiv de
subiecii de valoarea complementar pn la 100. Valoarea z egal cu 2,05 separ primii 2% din
subieci de restul 98%
Indiferent de transformarea aleas trebuie s fim contieni de limitele acestora. Cuantilajele
au meritul simplitii care conduce la a amplifica diferenele minime ntre subiecii din centrul distribuiei
(acolo unde se gsesc cei mai muli dintre subieci) i de a atenua aceste diferene la extremitile
80

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

distribuiei (care nu comport dect foarte puini subieci). Normalizarea pare s posede numeroase
avantaje: msurile transformate sunt de nivel de interval i se distribuie normal, ceea ce faciliteaz
interpretarea i aplicarea de metode de analiz care cer normalitatea distribuiilor (analiz de varian,
regresie multipl).
Totui, nu trebuie uitat c aceast metod duce la schimbarea formei distribuiei, fr ca s
aib totdeauna raiunea teoretic de a o face. Transformarea msurilor originare permite de a ameliora
interpretarea care poate fi fcut unui scor. Transformrile normative sunt cele mai cunoscute i cele
mai vechi. Ele sunt legate de interesul pentru diferenele interindividuale. Transformrile legate de
cadrul de referin predictiv i mai ales la msurile de referin criterial sunt opuse, cteodat n
manier ideologic msurilor normative (este vorba de a lupta contra ierarhizrii subiective care permit
msuri normative).
n practic, nu exist transformri bune i transformri rele. Diferitele metode aduc informaii
de natur diferit. Nevoile concrete ale psihologului practician sau ale cercettorului sunt cele ce impun
alegerea celei mai bune forme de transformare a notelor brute.

BIBLIOGRAFIE

Albu, Monica, 1998, Construirea i utilizarea testelor psihologice, Editura CLUSIUM.,1998 Cluj
Bernier, J.J., Pietrulewicz, B., 1997, La psychometrie, Gaetan Morin Editeur, Montreal, Paris,
Casablanca
Botez, C., 1971, Utilizarea testelor pentru depistarea si aprecierea aptitudinilor profesionale, n
"Revista de Psihologie", t.17, nr.1/1971, Editura Academiei, Bucureti
Cosmovici, A., 1971, Aplicarea testelor pentru determinarea nivelului de dezvoltare intelectuala, n
"Revista de Psihologie", t.17, nr.1, Editura Academiei, Bucuresti
Guillevic, Ch.,Vautier, S., 1998, Diagnostic et tests psychologique, Nathan, Paris
Holban, I., 1995, Testele de cunotine, Editura didactic i pedagogic, R.A., Bucureti
Horst, P., 1971, Messung und Vorhersage.Eine Einfhrung in die psychologische Testtheorie,
Verlag Julius Beltz, Weinheim, Berlin, Basel
Huteau, M., Lautrey J., 1995, valuer lintelligence, Presses Universitaire de France, Paris
Laveault, D., Gregoire, J., 1997, Introductions aux theories des tests en sciences humaine, De
Boeck & Larcier, Departament de Boech Universite, Paris, Bruxelles
Lienert, G.A., 1967, Testaufbau und Testanalyse, Verlag Julius Beltz, Weinheim/Berlin
Lussato, Ariane, 1998, Les tests de recrutement, Presses Universitaires de France, Paris
Magnusson, D., 1969, Testtheorie, Verlag Frank Deuticke Wien
Miclea, M., 1994, Psihologie cognitiv, Casa de Editur Gloria S.R.L., Cluj-Napoca
Mitrofan, N., 1998, Testarea psihologic a copilului mic , Editura All, Bucureti
Radu, I., 1991, Metode de cercetare n psihologie, n Introducere n psihologia contemporan
(coord. I. Radu), Editura Sincron, Cluj
81

AUREL STAN

82

Rost, J., Golombock, Susan, 1989, Modern Psychometrics. The science of psychological
assessement, Routledge, London and New York
Roca, Mariana, 1972, Metode de psihodiagnostic, Editura Didactic i pedagogic, Bucureti
Stan, A., 2002, Testul psihologic, Editura Polirom, Iai
Stan, A., Hvrneanu, C., 1989, Utilizarea calculatorului n examinarea psihologic n Revista de
Psihologie, Editura Academiei, Bucureti
Szamoskzi, ., 1997, Psihometria clasic i evaluarea formativ, n "Cogniie, creier,
comportament", Volumul I, nr.2, iunie 1997, Cluj Napoca.

S-ar putea să vă placă și