Documente Academic
Documente Profesional
Documente Cultură
AUREL STAN
CONSIDERAII PRELIMINARE
Cuvntul test este de origine englez i nseamn prob. Verbul to test nseamn a proba, a
supune unui examen. Acest termen nu este unul specific psihologic, adic nu se folosete doar n
examinarea psihologic sau doar n domeniul psihologic. El este utilizat ntr-o diversitate de discipline
tiinifice i de domenii practice. Majoritatea manualelor tiinifice au pregtite teste de cunotine Se
vorbete de testarea motoarelor, a anumitor dispozitive tehnice, a capacitii fizice de efort, a ipotezelor
tiinifice. Este cazul s prezentm semnificaia extins a acestui termen. n viziunea lui Gustav A. Lienert,
testul este:
Un procedeu de cercetare a unei caracteristici a personalitii;
Procedeu de realizare a unei cercetri;
Totalitatea rechizitelor necesare pentru realizarea cercetrii
Orice cercetare, n msura n care are caracterul de prob prin sondaj;
Anumite procedee de verificare statistic-matematice (de exemplu, testul chi ptrat, testul t a
lui Student)1.
Acest termen tiinific a fost folosit n psihologie de ctre James McKeen Cattell, profesor la
Universitatea din Pennsylvania, ulterior la Columbia, care a publicat n anul 1890 articolul Mental Tests
and Measurements n revista Mind. Dei a fost un nume tiinific prestigios i a avut realizri deosebite
n psihologie, testele sale au avut o rspndire limitat, datorit succesului slab n aplicarea practic. Cu
toate c a folosit pentru prima dat acest termen, James McKeen Cattell nu este unanim recunoscut ca
printe al metodei testului n cercetarea psihologic. O serie de autori occidentali au publicat probe
psihologic, fr s poarte numele de test, nainte de anul 1890, numele celebrului savant englez Francis
Galton fiind cel mai frecvent invocat drept argument. Se poate vorbi de o faz presistematic a testului
psihologic, n cadrul acesteia putnd fi evideniate ncercri de a crea diferite probe care s pun n
eviden mai ales debilitatea mintal, utilitatea acestora fiind reclamat de nevoia crerii unor
aezminte colare speciale, destinate copiilor care aveau probleme de retardare mintal. Evoluia vieii
social-economice fcea necesar inventarea unor instrumente de investigaie care s se refere la
caracteristicile vieii psihice, domeniile justiiei, industriei, activitii colare reclamnd cel mai frecvent
astfel de instrumente. Testul psihologic n forma sa modern nu este dect produsul final al unei lungi
perioade de cutri i ncercri.2
Satisfacerea exigenelor teoretice i practice fa de un instrument de investigaie psihologic
a fost reuit de Scala metric a inteligenei, creat de medicii francezi Alfred Binet i Thodor Simon n
anul 1905, cu perfecionri n anii 1908 i 1911. Recunoaterea scalei metrice a inteligenei, creat de
cei doi medici francezi, ca prototip al testului psihologic, se datoreaz intersectrii unor acumulri
tiinifice apreciabile cu nevoile instituionale, reflectate n comenzi adresate de ctre autoriti
guvernamentale franceze, fapt care a fcut ca testul s intre n viaa practic a societii. Ca atare,
1
2
Vezi Gustav A. Lienert, Testaufbau und Testanalyse, Verlag Julius Beltz, Weinheim und Berlin, 1967, pag. 7.
Vezi Aurel Stan Testul psihologic, Editura Polirom, Iai, 2002
AUREL STAN
paternitatea metodei testului psihologic este atribuit adesea lui Alfred Binet, personalitate strlucitoare
a vieii tiinifice din Frana la sfritul secolului XIX i nceputul secolului XX3. Prin perfecionarea
metodologiei de construcie i prin concepia realist privind menirea testului psihologic, Alfred Binet a
reuit s introduc testul n viaa instituiilor sociale i s-l fac util pentru un mare numr de oameni.
Practic, prin creaia lui Binet, testul psihologic a primit botezul social. Impresioneaz durabilitatea
temporal a acestui instrument de psihodiagnostic, nefiind scos din uz nici pn n zile noastre, este
adevrat prin intervenia unor adaptri fireti, cea mai cunoscut fiind forma Stanford-Binet. Spaiul
restrns al acestui curs nu ne permite s realizm o istorie a testului psihologic, parte a tratrii testului
psihologic care este considerat de noi ca fiind deosebit de interesant i instructiv. n aceast parte
de istorie gsim informaii care ne permit o imagine complet a unui efort tiinific i practic-aplicativ de
mare anvergur. Spaiul rezervat acestui curs nu permite dezvoltarea dimensiunii istorice a testului
psihologic. Putem sintetiza dezvoltarea testului psihologic prin conturarea a dou tendine:
Tendina extensiv de dezvoltare se caracterizeaz prin:
Extinderea ariei geografice de rspndire;
Mrirea amplitudinii vrstei de aplicare la cele dou limite, inferioar i superioar;
Diversificarea formelor i complexitii solicitrilor;
Creterea numrului domeniilor de aplicaie;
Diversificarea categoriilor de populaie care beneficiaz de examinarea psihologic prin
intermediul testelor.
Tendina intensiv are urmtoarele direcii:
Creterea obiectivitii n evaluare(o instrucie mai adecvat n evaluarea sarcinilor, punctarea
mai adecvat a variantelor de rspuns);
Perfecionarea teoriilor care stau la baza construciei testelor;
Intervenia statisticii n construcia i exploatarea informaional a testului;
Perfecionarea analizei itemilor;
Creterea exigenelor cu privire la calitatea msurrii.
Prin aceast afirmaie nu se ignor contribuia lui Thodore Simon, dar considerm c cel mai mare merit i revine lui Binet
AUREL STAN
comparaie statistic cu acela al altor indivizi plasai n aceiai situaie, permind astfel de a clasa
subiectul examinat, fie cantitativ, fie tipologic7.
Parcurgnd definiiile anterioare i analiznd deficienele acestora am elaborat urmtoarea
definiie pentru testul psihologic: "Procedeu standardizat de investigaie psihodiagnostic care pune n
eviden prin diferite modaliti de stimulare ale subiecilor comportamente relevant diagnostice,
exploatabile informaional pe baza comparrii rezultatelor obinute cu cele ale unor eantioane
reprezentative de persoane aflate ntr-o situaie de examinare identic i care folosete n descrierea i
explicarea concluziilor termeni tiinifici specifici teoriei care stau la baza construciei sale".
Din definiiile elaborate se pot detaa un ansamblu de trsturi de consens:
testul psihologic este un instrument standardizat de investigaie;
pentru aprecierea rezultatelor sale se face referin la rezultatele unui grup de referin;
diagnosticul realizat prin folosirea testului psihologic se refer la un larg domeniu de
comportamente considerate relevant diagnostice
I.1.3.Prile componente ale unui test psihologic
n calitate de procedeu standardizat de investigaie un test psihologic are o serie de
componente care n ansamblu asigur funcionalitatea sa:
a) Componenta static, material a testului, denumit uneori i partea de rechizite a testului, se
subdivide n:
1. Manualul testului, n care sunt prezentate: descrierea, geneza constructiv, fundamentele
tiinifice, indicaii privind punerea n aplicare i normele stabilite. Este sursa informaional
principal pentru aprecierea ncrederii pe care trebuie s o avem ntr-un anumit test. Manualul
trebuie s dea indicaii detaliate despre procedeele de evaluare i despre modul n care se
redacteaz concluziile aplicrii unui test. ntre exigenele ideale i realitatea practic exist o
anumit distan. Calitatea prezentrii poate lsa de dorit, n unele cazuri, prin omisiunea unor
factori care ar putea folosi utilizatorului i prin ascunderea, omiterea unor aspecte
dezavantajoase ale testului. L.J. Cronbach afirm c testele elaborate nainte de 1945 posedau
foarte rar manuale complete i nu erau conforme celor mai noi standarde din domeniul examinrii
prin intermediul testelor (elaborate de asociaii profesionale i internaionale)8. Producerea unui
bun manual este o chestiune cu att mai dificil, cu ct mai multe rezultate s-au cumulat despre
test. Manualul trebuie s fie redacta n aa fel, nct s fie foarte clar pentru profesioniti i s
duc la recunoaterea de ctre non-profesioniti a faptului c ei nu posed o calificare n
domeniu. Un important ajutor n redactarea manualelor l constituie recomandrile tehnicile
editate de asociaiile profesionale internaionale i naionale (cele mai cunoscute sunt cele editate
de Asociaia Psihologilor Americani (APA). Recomandrile tehnice ale asociaiilor profesionale
indic ce trebuie s conin un bun manual.
2. Materialul testului const din diferite tipuri de aparate pentru evidenierea stimulrilor, caietul
testului, foi de rspuns, materiale pentru prelucrare i pentru manipulare. Este partea care
asigur stimularea comportamentelor de rspuns.
vezi Pichot, Pierre Les tests mentaux, Presses Universitaires de France, Paris, 1994, pag. 5.
Cronbach, Lee, J., Validitt, n Psychologische Diagnostik (herausgegeben von Karl-Herman Wewetzer),
Wissenschaftliche Buchgeselschaft, Darmstadt, 1979, pag.159-162
7
8
3. Auxiliare de evaluare precum grilele de corectur, abloane, folii cu orificii, aparate de msur;
b) componenta dinamic, de realizare a, unui test se divizeaz metodologic i tehnologic, dup cum
urmeaz:
1. Consemnul testului instruiete persoana profesional calificat n aplicarea testelor n privina
condiiilor de realizare i evaluare a testelor i despre ceea ce le este pretins examinailor n
timpul examinrii prin intermediul unui test. Informaii de acest gen pot fi cuprinse uneori n
manualul testului.
2. Partea de realizare rezid ntr-o reacie motorie (exemplu, reacie senzorial-motorie sau verbal
la stimuli simpli sau compleci, tapping), ntr-o percepie senzorial (exemplu tahistoscop), ntr-o
activitate de rutin mental sau fizic (a nira perle, a calcula dup un algoritm, cum este cazul
la testul Kraepelin), n rezolvarea unei probleme concrete abstracte (a construi pompa Schulze, a
monta instalaia denumit Winkeltrieb a rezolva sarcina de gndire) sau n luarea n consideraie
asupra unei ntrebri privind comportamentul, tririle sau dispoziiile. Sarcinile din cadrul unui test
pot s aib un coninut simplu sau complex, dificultile lor putnd fi aproximativ egale sau foarte
inegale.
3. Evaluarea poate s se realizeze intuitiv, regulat, schematic sau automatic. Prin evaluare,
rezultatele realizrii testului sunt cunoscute prin intermediul unuia sau mai multor scoruri.
Componentele testului suport condensri informaionale odat cu procesul de computerizare
a testului psihologic. Practic, informaiile prii statistice sunt condensate pe o dischet care pot fi
ilustrate prin intermediul diferitelor tipuri de computere. Testele computerizate vor avea consacrat un
capitol aparte n lucrarea noastr.
I.1.4. Clasificarea testelor psihologice
Clasificarea este o operaie intelectual prin care obiectele dintr-o mulime dat sau un
univers sunt mprite n clase n funcie de asemnrile i deosebirile dintre ele. Referitor la puterea
informaional, menionm c o clasificare a testelor are fora informaional a cel mult unei scale
ordinale, dar, de cele mai multe ori a celor nominal,e n care pot opera grupri i rafinri. Compararea
obiectelor unui univers se face dintr-un anumit unghi de vedere, numit criteriu. Clasificarea poate fi
numit natural, dac ea descrie clasele aa cum exist n realitate, sau artificial, n cazul n care
clasele sunt formate dup anumite criterii convenionale funcie de utilitate. Clasificarea poate fi
teoretic, n care avem nu numai clase reale, ci i clase posibile, i empiric, n care avem doar clase
reale. Clasificarea poate fi fcut dup unul sau mai multe criterii. n funcie de natura obiectelor, ea
poate fi exact sau inexact. O clasificare exact presupune c pentru orice obiect din universul supus
clasificrii putem spune exact crei clase aparine. Pentru cazul testelor psihologice putem spune c
avem o clasificare artificial, empiric i inexact.
n mod tradiional, n clasificare se pornete de la tipul ideal de clasificare care are la baz
supoziii referitoare la satisfacerea terului exclus pentru orice obiect din universul supus clasificrii n
raport cu proprietile invocate, la faptul c o clasificare este complet, adic fiecare obiect din
universul de clasificare face parte din una din clasele indicate i la faptul c n ansamblu clasele se
exclud ntre ele, suma claselor identificndu-se cu universul. n realitate, aceste cerine nu sunt realizate
dect imperfect datorit faptului c n practica clasificrii suntem confruntai adesea cu mulimile vagi;
n unele cazuri cu mulimile infinite sau mulimi nedefinite. Universul testelor psihologice realizeaz
9
AUREL STAN
imperfect exigenele ideale ale clasificrii, deoarece se opereaz cu mulimi vagi (unele clasificri includ
i testele de personalitate subiective, altele nu), care nu sunt finite (clasificrile actuale cuprind mai
multe clase de testele dect cuprindeau cele de acum 50 de ani, deci numrul obiectelor universului de
clasificare este n cretere cu o rat imprevizibil).
Din analiza clasificrii testelor psihologice fcut de ctre diveri autori de specialitate putem
afirma c nu exist o unitate de preri, dar ntre majoritatea criteriilor de clasificare utilizate exist o
concordan apreciabil. n privina clasificrii testelor s-au pronunat personaliti de prim rang ale
psihologiei aplicate. Astfel, enumerm n aceast privin autori ca H.J. Eysenck (1953), M. Irle (1956),
G. Lienert (1969), L.J. Cronbach (1970), P. Horst (1971), R.L. Thorndike (1971), R. Meili i E.
Steingruber (1978), Anna Anastasi, Rolf Brickenkamp (1997), D. Laveault i J. Gregoire (1994)9. n
1973 D. Speck i R. Speck introduc dou grupe de criterii de clasificare, preluate de majoritatea celor ce
se ocup de clasificarea testelor. Autorii germani fac o diviziune utilitar-pragmatic a testelor, din
punctul de vedere al coninutului i din punctul de vedere al formei. Cea mai mare concordan n
sistemele de clasificare se afl n grupa celor ce adopt punctul de vedere formal. Aspectele clasificrii
formale sunt: caracteristicile construciei testului, materialele pe care le utilizeaz testul, felul realizrii
comportamentului revant diagnostic, felurile de reacie care sunt pretinse i modul de realizare a
evalurii. Cronbach, Eysenck, Michel, Lienert, Ingekamp i Irle fac referiri asupra criteriilor de clasificare
formale. Acest punct de vedere poate s fie important mai ales pentru practicieni, deoarece pentru
acetia este foarte important s tie dac un test poate fi aplicat individual sau n grup, dac face apel la
exprimarea verbal n efectuare, dac pretinde reacii motorii n rspuns. Clasificarea care adopt acest
punct de vedere are un dezavantaj clar prin faptul c nu face nici o referire la scopul unui procedeu de
examinare, deci nu se tie nimic despre ceea ce conine un test, despre ceea ce trebuie s msoare un
test. Este, de asemenea, dificil s ne exprimm clar n privina domeniile de aplicaie ale unui test.
Practic testele de inteligen se pot ncadra n oricare din clasificrile adoptnd punctul de vedere
formal. Cele mai importante criterii de clasificare ale grupei de clasificare formal sunt:
Dac lum n consideraie gradul de standardizare i cuantificare, testele se mpart n psihometrice
(evaluarea se produce numeric i prin norme) i nepsihometrice (care fac apel n elaborarea
concluziilor la virtuile clinice de exprimare). Acesta este un punct de vedere ntlnit n bibliografia
de specialitate nu este mprtit de autorul acestei lucrri (care a definit anterior testul ca un
procedeu de investigaie standardizat). Aceasta nu nseamn c putem ignora alte puncte de
vedere exprimate de autori cu experien n domeniul teoriei i practicii aplicrii testelor psihologice.
Diviziunea n teste standardizate (etalonate) i nestandardizate (informale) se ntlnete ntr-un
tratat al crei autor este Gustav A. Lienert10. Dup concepia autorul amintit testele informale sunt
destinate uzului personal al psihologilor i profesorilor, care i propun, de exemplu, s claseze
doar membrii unei singure clase colare cu care lucreaz frecvent. Rezultatele testelor
standardizate capt semnificaie cantitativ prin raportare la cele ale unui grup de referin, numit
i grup normativ.
n privina posibilitii de a examina simultan mai muli subieci distingem ntre teste individuale i
teste colective sau teste de grup. Testul individual are dezavantajul care const n alocarea unui
timp de aplicare crescut pentru un singur subiect, dar are avantajul c ofer posibilitatea de a
Anul care este trecut n parantez este cel al ntocmirii unor sisteme de clasificare de ctre autorii respectivi. Precizrile
sunt realizate n limita bibliografiei parcurse.
10 Lienert, Gustav.A., "Testaufbau und Testanalyse", Verlag Julius Beltz, Weinheim/Berlin, 1967, pag.21
9
10
observa mai bine reaciile particulare n timpul examinrii. Testul colectiv are ca principal avantaj
economia de timp a examinrii i ca dezavantaj observarea insuficient a subiectului. Clasele
rezultate din operarea cu acest criteriu de diviziune interfereaz cu cele rezultate din aplicarea altor
criterii de clasificare i sunt , de asemenea, interanjabile n interiorul aceluiai criteriu. Astfel,
majoritatea testelor colective sunt teste creion-hrtie i majoritatea testelor individuale sunt teste
aparative sau de prelucrare a materialelor. O tendin demn de luat n seam este aceea a
transformrii testelor individuale n teste colective, prin computerizare Astfel testele care presupun
evidenierea timpului de reacie, simplu sau complex, pot fi efectuate colectiv prin deservirea de
ctre acelai computer a mai multor instalaii de examinare.
Din punctul de vedere al medium-ului testului, care privete suportul informaional al testului, se
poate vorbi de teste creion-hrtie, teste de reacie verbal, teste de manipulare i prelucrare
materiale, teste imagini, teste care apar pe display-ul computerului, teste aparative. Clasele
constituite prin activarea acestui criteriu sunt ntr-o interanjabilitate accentuat, fapt care face ca
anumite clase s fie golite, aspirate de alte clase. Este cazul testelor creion-hrtie care sunt
transformate, ntr-o proporie apreciabil, n teste computerizate.
n funcie de utilizarea formei verbale de exprimare n producerea rspunsului la situaia
problematic pe care o cuprinde testul, deosebim ntre teste verbale (care depind, de cele mai
multe ori de nivelul de cultur al subiectului) i teste non-verbale (care nu depind de nivelul de
cultur, create special pentru a contracara influena acestuia); n decursul istoriei exploatrii
diagnostice a testelor psihologice s-a reproat deseori testelor c favorizeaz subiecii care provin
din straturi sociale cultivate. Forma non-verbal de exprimare este parial sau total, adic poate
aparine doar subiectului, cruia i se poate adresa pentru a nelege ce are de fcut, sau att
subiectului ct i examinatorului, mai ales n examinarea surdo-muilor. Pentru exprimarea
rspunsurilor acestei categorii de teste se poate folosi ntreaga gam a comunicrii paraverbale.
n funcie de numrul dimensiunilor cuprinse n destinaia psihodiagnostic a testului, deosebim
teste unidimensionale(exemplu MMQ aparinnd lui H.J. Eysenck, KLT, aparinnd lui H. Dker) i
teste multidimensionale (IST, aparinnd lui R. Amthauer i PIT, aparinnd lui E. Mittennecker)
Acest criteriu este exprimat i prin formularea de teste singulare (care posed o singur
component) i baterii de teste. Testele singulare11 nu se confund cu testele individuale cu care
pot doar interfera. Atributul de singular se refer la numrul componentelor testului, pe cnd cel
individual la faptul c se poate aplica unui singur individ. Testul singular poate fi aplicat individual
sau colectiv, iar testul individual poate fi unidimensional sau multidimensional. Exigenele n privina
realizrii unidimensionalitii unui instrument de investigaie psihodiagnostic sunt foarte ridicate,
deoarece faptul psihic este prin esena sa se afl n interdependen, i nu se realizeaz dect
imperfect.
Dac lum n consideraie gradul de structurare a configuraiei stimulilor care provoac
comportamentul analizat facem separare ntre teste nalt structurate i teste slab structurate.
Stimularea n cazul testelor slab structurate nu este dat sub forma unei solicitri ce presupune o
form de rspuns dihotomic sau polihotomic, ci sub o form care impune un efort de structurare
din partea subiectului.
Denumirea reprezint traducerea termenului german Einzeltest, ntlnit n Rolf Brickenkamp (hrsg.), "Handbuch
psychologischer und padagogischer Tests", Hogreffe, Verlag fur Psychologie, Gottingen, Bern, Toronto, Seattle, 1997,
pag.XV.
11
11
AUREL STAN
n funcie de felul comportamentului provocat sau comportamentului indus prin situaia de testare,
avem teste care cer un comportament maximal, care presupun mobilizarea subiectului pentru
atingerea unui nivel de randament ct mai nalt, i teste care provoac un comportament tipic, cum
este cazul testelor de personalitate, la care rspunsul cuprinde opiuni bazate pe sistemul moral valoric al examinatului sau pe gusturile, nclinaiile, preferinele acestuia. Rspunsurile ce provoac
un comportament tipic nu pot fi considerate bune sau rele, corecte sau incorecte.
n funcie de limita de timp pentru efectuarea testului, deosebim doar n cadrul testelor ce provoac
un comportament maximal teste de rapiditate (speed test) i teste de nivel (power test), ns n
majoritatea situaiilor practice avem de-a face cu o mixtur ntre cele dou clase. Testele de
rapiditate cuprind sarcini (itemi) de dificultate medie i uoar ntr-un asemenea numr nct nici un
subiect nu poate s rspund la toate ntr-un anumit timp prestabilit. Un exemplu pentru testele de
rapiditate este unul din cele mai vechi teste (din 1895), i anume testul Bourdon-Amfimov n care
se cere subiectului de bara literele O i C n cadrul unor rnduri de litere diverse care le conin pe
cele dou. Se pune accentul n aprecierea randamentului pe rapiditatea n rezolvarea sarcinilor.
Testele de nivel (numite n literatura de specialitate de limb englez power test sau level test)
cuprind sarcini care ridic continuu gradul de dificultate, nct ultimele sarcini abia sunt rezolvate,
cu toate c limita de timp este generos acordat.
O separare frecvent n spaiul cultural anglo-saxon i foarte redus n cel german este ntre
"aptitude tests" i "achievement tests", cele din urm urmrind diagnosticarea cunotinelor i
dexteritilor dobndite prin exerciiu i colarizare;
O serie de autori, dintre care enumerm pe P. Horst (1971), J.P. Guilford (1954), R.B. Cattell
(1962) i E. Todt (1968), deosebesc ntre teste normative i teste ipsative. n cadrul acestei
distincii referirea se face la dou feluri de msurare: normativ i ipsativ. Am mai amintit faptul
c, n cadrul opticii normative, aprecierea valoric a unui rezultat individual se face prin raportare la
rezultatele unui grup, numit grup de referin. n cadrul unui instrument de msur ipsativ, valorile
de punctaj pentru o anumit caracteristic supus msurrii nu sunt comparabile de la un subiect la
altul, ci ele au semnificaie numai n relaie cu un singur subiect. deci suntem n prezena unui
univers de apreciere strict personal;
Dac lum drept criteriu libertatea posibilitii de reacie avem teste cu dispozitiv de rspuns creativ
sau deschis i teste cu dispozitiv de rspuns legat sau nchis. La primul fel de dispozitiv de
rspuns, subiectul are libertatea producerii rspunsului, iar la al doilea trebuie s aleag dintr-o
serie de rspunsuri oferite;
O separare similar cu cea anterioar distinge ntre testele formale i cele informale. Testele
formale sunt testele n care forma de interpretare a rspunsului este strict condiionat de o
terminologie prestabilit . Testele informale sunt cele care las un anumit grad de libertate n
aceast privin. Revine, n aceast mprire dihotomic, problema standardizrii instrumentelor
de msur, deoarece standardizarea este o exigen i pentru partea de interpretare a
rspunsurilor;
Un criteriu formal de clasificare a testelor este cel referitor la interpretare. Astfel, se deosebete
ntre teste directe sau psihometrice i teste indirecte sau proiective. Cele proiective se mpart la
rndul lor n realiste (exemplu TAT) i simbolice (exemplu Rorschach). De asemenea, un criteriu
12
care posed clase care interfereaz cu cele ale altor criterii. O parte din clasificatorii testelor
psihologice utilizeaz denumirea de tehnici proiective, n loc de teste proiective;
Deosebirea ntre teste psihometrice clasice i teste probabiliste se face n funcie de structurile
sintactice i semantice ale modelului care se afl la baz construciei lor.
Punctul de vedere formal este util pentru practicieni, deoarece este important de a ti dac un
test poate fi aplicat n grup sau individual, dac are exigene speciale n privina nivelului verbal de
exprimare, dac cere sau nu reacii motorii n privina rspunsului. Dezavantajul principal al clasificrii
care adopt punctul de vedere formal const n faptul c acesta nu spune nimic despre scopul unui
procedeu de investigaie psihodiagnostic, adic despre coninutul unui anumit test. Specialistul care se
intereseaz de un test n scopul de a-l folosi, dorete n primul rnd s tie ce variabile sunt msurate i
dup aceea sub ce modaliti formale se realizeaz cel mai bine. S-a tratat n primul rnd criteriile
formale, deoarece n privina lor exist un mai mare acord ntre autorii de specialitate care au efectuat
clasificri.
Aspectele de coninut ale clasificrii, chiar cu dezacordurile care se manifest, sunt
indispensabile pentru orientarea practic a psihologului i psihopedagogului. Prin aspectele de coninut
s-ar putea nelege domeniile de aplicaie ale diverselor teste, dar, n acest caz, un test de inteligen sar putea plasa n aproape toate domeniile de aplicaie. Cel mai adesea, clasificarea de coninut a
testelor psihologice rspunde la ntrebarea: Ce caracteristic examineaz, de fapt, respectivul procedeu
de investigaie psihodiagnostic?
Dei este un teren mai diversificat, cmpul clasificrilor de coninut posed o clasificare larg
acceptat n teste de aptitudini (teste de inteligen i teste de randament), pe de o parte, i teste de
personalitate, pe de alt parte. Este adevrat c dihotomia aptitudine (respectiv capacitate) i
personalitate este destul de greu de acceptat. Practic noiunea de personalitate implic i aspecte de
randament sau de capacitate. Ca atare, R.B. Cattel i F. Wurburton subsumeaz sub genul proxim
"Teste de personalitate" procedee pentru cuprinderea att a aptitudinilor, ct i a aspectelor eseniale
dinamic motivaionale i modalitilor temperamentale. n privina coninutului noiunii "teste de
randament" exist un mai mare consens dect n cel al noiunii de "test de personalitate". De mare
rspndire sunt clasificrile din punctul de vedere al coninutului, aparinnd lui L.J. Cronbach,
A. Anastasi, M. Irle, R. Brickenkamp i G. Lienert. Redm aceste clasificri de coninut care au o mare
circulaie:
ANA ANASTASI (folosim i denumirile n limba englez, des uzitate n lucrrile de specialitate):
1. Test of general intellectual development (Teste de dezvoltare intelectual general)
2. Test of separate abilities (teste de aptitudini(capaciti) individuale)
2.1. Measuring multiple aptitude (msurarea aptitudinilor multiple)
2.2. Special aptitude test (teste de aptitudini speciale)
2.3. Educational tests (teste educaionale)
2.4. Occupational test (teste ocupaionale)
3. Personality tests (teste de personalitate)
3.1. Self-report inventories (inventare de autoraportare)
3.2. Measures of interests and atitudes (msurare a intereselor i atitudinilor)
3.3. Proiectives techniques (tehnici proiective)
3.4.Other techniques for personality assessement (alte tehnici pentru evaluarea personalitii)
13
AUREL STAN
CRONBACH
1. Tests of ability (tests of maximum performance) - teste de capacitate (teste de performane
maxime)
1.1. Measure of general mental ability (msurarea capacitilor mentale generale)
1.2. Measure of special abilities (msurarea capacitilor speciale)
1.3. Aptitude tests (teste de aptitudini)
1.4. Achievement tests
1.5. Proficiency tests (teste de expertiz)
2. Tests of typical performance (teste de aptitudini tipice)
2.1. Behavior observations (observaii comportamentale)
2.2. Self report devices (procedee de autoraportare)
Denumirile claselor sistemelor de clasificare sunt trecute n limba englez de majoritatea celor
ce opereaz cu clasificri, din cauza unor ambiguiti de traducere a termenilor utilizai. Prin "general
mental ability" se nelege (frecvent, dar nu exclusiv) capacitate general n care importante sunt
activitile de gndire i nvare. La testele pentru examinarea capacitilor speciale i nzestrrilor se
poate deosebi ntre teste care sunt direcionate pentru cuprinderea funciilor sau capacitilor psihice
elementare i bateriilor de teste, care n spaiul lingvistic anglo-saxon sunt desemnate ca "multiple
aptitude batteries" (care trebuie s serveasc examinrii unor capaciti empirice delimitabile una de
alta). De la L.L. Thurstone i Thelma G. Thurstone avem denumirea "Tests of Primary Mental Abilities".
La doi autori americani exist tendina, aflat n permanent progres n SUA, de a dezvolta baterii de
teste pentru capaciti multiple care sunt fondate, de cele mai multe ori, pe analiz factorial. O parte
din aceste teste sunt folosite ntr-un domeniu ngust (examinarea aptitudinii pentru anumite profesiuni,
teste de selecie colar etc.), altele ntr-un domeniu mai larg.
BRICKENKAMP
1. Teste de randament
1.1. Teste de dezvoltare
1.2. Teste de inteligen
1.3. Teste generale de randament
1.4. Teste colare
1.5. Teste pentru examinarea funciilor generale i teste de aptitudini
2. Teste psihometrice de personalitate
2.1. Teste de structur a personalitii
2.2. Teste de dispoziii i interese
2.3. Teste clinice
3. Procedee de desfurare a personalitii
3.1. Procedee de interpretare a formelor
3.2. Procedee verbal-tematice
3.3. Procedee grafice i de structurare
n 1956, M. Irle ntocmete o clasificare n 4 grupe, clasificare aflat n legtur cu standardele
14
americane12:
1. Teste de inteligen general.
2. Teste de capacitate/teste de nzestrare.
3. Teste de cunotine/teste de randament.
4. Teste de personalitate.
n 1961, Gustav Lienert ntocmete o clasificare de larg rspndire:
1. Teste de inteligen: a. teste de inteligen general
b. teste speciale de inteligen sau teste de nzestrare
2. Teste de randament: a. teste de randament motric
b. teste de randament senzorial
c. teste de randament psihic
3. Teste de personalitate:
a. teste de caracteristici
b. teste de interese
c. teste de dispoziii,
d. teste de caracter
e. teste de tip.
Acestea sunt principalele sisteme de clasificare, care, ns, nu epuizeaz spectrul acestui
domeniu. Punem punct aici ncercrilor de clasificare a testelor psihologice i sub ameninarea briciului
lui Ockham, denumire a unui principiu atribuit lui W. Ockham i destinat s combat distinciile inutile
sau multiplicarea inutil a entitilor n filosofia medieval, principiu care are formularea urmtoare:
Entia non sunt multiplicanda praeter necessitatem (entitile nu trebuiesc nmulite peste necesiti).
I.1.5 Clarificri necesare
n continuare, ncercm s facem succint o serie de clarificri pentru anumite clase i
subclase ale sistemelor de clasificare din punctul de vedere a coninutului, comune sau necomune
sistemelor amintite anterior. Vom observa i aici clase ale sistemelor de clasificare ce se intersecteaz
n coninut i clase care sunt acceptate doar parial ca fiind teste. O serie de subdiviziuni ale sistemului
de clasificare le considerm de la sine clarificare, cum ar fi, de exemplu, testele de randament, n
calitate de categorie de teste n care se pune accentul pe cantitatea de sarcini rezolvate corect.
Vom ncepe comentariile noastre cu testele numite de dezvoltare. Referirea este la acele
procedee de investigaie care trebuie s cuprind nivelul de dezvoltare a unui subiect. n 1964,
G. Reinert face distincia ntre teste de dezvoltare primare i teste de dezvoltare secundare. Cele
primare definesc cursul dezvoltrii i au ca obiectiv cuprinderea nivelului de dezvoltare a
comportamentului, pe cnd la cele secundare obiectivul propriu-zis st n afara sistemului de referin
de diagnoz a dezvoltrii. Astfel, testele generale de randament sunt normate pe un larg domeniu de
vrste i las s se recunoasc anumite tendine de dezvoltare general. Denumirea cea mai frecvent
folosit n legtur cu diagnosticare nivelului de dezvoltare este cea de scal sau scar de dezvoltare.
Este necesar s facem o serie de precizri n privina noiunii de scal, a asemnrilor i deosebirilor
dintre scal i test. Exist o tendin de a considera sinonimi termenii test i scal. Se folosete curent
Dup Michel, Lothar, "Allgemeine Grundlagen psychometrischer tests", n "Psychologische Diagnostik" (hrsg. Prof. dr.
R. Heiss), Verlag fur Psychologie, Dr. C. Hogreffe, Gottingen, 1964.
12
15
AUREL STAN
expresia scala Binet Simon sau testul Binet-Simon, scala Terman-Merill sau testul Terman-Merill.13. De
asemenea, exist tendina de a considera scala o grupare de itemi referitori la un acelai aspect, deci
de a considera termenul scala rezervat construciilor psihodiagnostice unidimensionale. n cazul
chestionarelor de personalitate aceast tendin este cea mai justificat. Dar exist i scale
multidimensionale. WISC-ul lui Wechsler este o scal pentru diagnosticarea inteligenei la copil
compus din mai multe componente psihodiagnostice difereniate. Instrumentul pe ansamblu poart
denumirea de scal, iar componentele sale sunt denumite teste sau subscale. n bibliografia consultat
am ntlnit expresia testele scalei Binet Simon. Iat, deci, cum o scal cuprinde mai multe teste. Cu
toate acestea, noiunea de scal nu este supraordonat celei de test.
Termenul de scal ca instrument de investigare psihodiagnostic este o form particular a
scalei de msur n general care i propune s pun n eviden ansamblul modalitilor sau valorilor
observabile ale unei variabile14. Prin scal de msurare psihologic se nelege un instrument de
msur utilizat n psihologia aplicat care servete la ordonarea progresiv a unor niveluri. Fora
informaional a scalelor este foarte difereniat.
n domeniul psihometric prin scal se nelege un test sau o baterie de teste care-i permite de
a clasa subiecii n diferite niveluri. Nota definitorie a unei scale considerm a fi capacitatea acesteia de
a diferenia cel puin ordinal subiecii, de a-i plasa n funcie de un gradient al su, n funcie de
rezultatul obinut. Obiectele evalurii pot fi niveluri de dezvoltare intelectual (unde opereaz predilect
cu noiunile de vrst mental i I.Q), niveluri de dezvoltare motric, ct i niveluri de dezvoltare a
personalitii. n psihologia diferenial scalele sunt n general probe constituite din itemi ordonai prin
dificultate cresctoare, permind de a exprima niveluri adesea exprimate prin dificultate cresctoare.
Cele mai cunoscute sunt: Scala Binet-Simon (dezvoltare a inteligenei), scala Alexander (inteligen
ptratic, non-verbal), scala Brunet-Lzine (dezvoltare psihomotorie a primei copilrii sau de
maturitate mental) scala Columbia (scala colectiv de nivel intelectual), scala Grace-Arthur (scal de
inteligen non-verbal), scala Taylor (anxietate manifest), etc.
Testele de aptitudini. La autorii englezi care ntocmesc clasificri ale testelor psihologice poate
lua natere o ambiguitate n interpretare n privina termenului abilities, care se traduce prin aptitudine,
dar i prin capacitate. Aceeai ambiguitate poate lua natere prin traducerea termenului german
Fahigkeitstest. Ca atare, facem nc o dat precizarea c aptitudinea este o caracteristic subiacent,
indirect observabil. Pe lng acest sens general, sunt de luat n seam trei conotaii:
n primul rnd trebuie evideniat concepia lui L.L. Thurstone (n lucrarea sa Primary Mental
Abilities, aprut n anul 1938) care consider aptitudinile drept caracteristici elementare
fundamentale. n acest sens, testele de aptitudini furnizeaz o serie de caracteristici analitice,
evideniate n aa-numitele profile psihologice, care se opun scalelor de inteligen de tipul BinetSimon care sunt exprimate n I.Q. sau vrst mental. Aceast concepie a fost susinut de o
serie de cercetri de analiz factorial, nc de la nceputul dezvoltrii acestui model de cercetare.
Cercetrile lui R.B. Cattell depesc opoziia pe care aceast concepie se fondeaz i propune o
structur de aptitudini umane n form de arbore care se pune n aplicare ntr-un cmp din ce n
ce mai ngust.
Ultima expresie este utilizat de Maurice Reuchlin n "Grand dictionnaire de la psychologie", Larousse, Paris, 1992,
pag.254, n seciunea din dicionar rezevat precizrii termenilor de scal i scal de msur.
14 Aspectul general al scalei de msur este tratat detaliat n lucrarea: Clocotici, Valentin, Stan, Aurel Statistic aplicat n
psihologie, Polirom, Iai, 2000
13
16
AUREL STAN
Un prim sens denot o aciune fizic de aruncare, de lansare a unui proiectil.. Trecnd pe plan
psihic, Sigmund Freud consider n acest sens proiecia ca o aciune psihic specific strii de
paranoia, care const n expulzarea din incontient a unor sentimente blamabile pentru a le
atribui altuia;
Al doilea sens este unul matematic, care apare n secolul XVII odat cu apariia geometriei
proiective. Prin proiecie facem s corespund unui punct (sau unui ansamblu de puncte) din
spaiu un punct (sau un ansamblu de puncte) unei drepte sau unei suprafee. n acest sens,
proiecia poate fi oblic, ortogonal, cilindric, stereografic, ortogonal. Transpunnd n planul
nostru de interes tiinific, testele proiective aduc subiectul n situaia de a produce un protocol de
rspuns a crui structur corespunde structurii personalitii, caracteristicile fundamentale ale
acesteia regsindu-se n aceast situaie;
Originea celui de-al treilea sens se gsete ntr-un fenomen optic pus n eviden la sfritul
secolului al XIX-lea, prin care, plecnd de la un focar de raze sau radiaii, se trimite o proiecia
luminoas pe o suprafa. Astfel, proiecia fixeaz o imagine pe un ecran, aa cum se ntmpl n
cinematografie. Sensul este adoptat i popularizat de ctre scriitorii sfritului de secol XIX, i,
ulterior, n psihopatologie i n psihologie. Un test proiectiv, precum o raz X, traverseaz
interiorul personalitii, fixeaz imaginea nucleului secret al acestuia pe un revelator (trecerea sau
efectuarea testului) i permite astfel o lectur facil prin mrirea sau proiecia ngroat pe un
ecran (interpretarea protocolului). Ceea ce era ascuns este pus n lumin, latentul devine
manifest, interiorul este adus la suprafa, ceea ce este stabil n noi se dezvluie.
Tehnicile proiective au rmas n practica psihodiagnostic (n ciuda reprourilor fcute) un
domeniu rezervat specialitilor din domeniu clinic care un deosebit sim al nuanei n observaie i un
rafinament deosebit n interpretare.
15vezi
Anzieu, Didier., Chabert, Catherine Les mthodes projectives, Presses Universitaires de France, Paris,1997 (11e
dition corrige), pag 14
16 apud. op.cit. pag 16
18
19
AUREL STAN
X
60
45
53
59
.
62
V
55
55
55
55
.
55
E
5
-10
-2
4
7
Guthke; Bottcher; Sprung (hrsg.), Psychodiagnostik", Band I, Deutscher Verlag der Wissenschaften, Berlin 1991.,
pag.133
18 Michel, Lothar; Conrad, Wolfgang, "Theoretische Grundlagen psychometrischer Tests" n "Grundlagen psychologischer
Diagnostik", herausgegeben von Prof.Dr Karl-Josef Groffmann und Prod.Dr.Lothar Michel, Mannheim, Enzyklopedie der
Psychologie, Band I, Verlag fur Psychologie, Dr C.J.Hogreffe, Gottingen, Toronto, Zurich, 1982., pag.17-19.
19 Kristof, Walther Klassische Testtheorie und Testkonstruktion, n Feger, Hubert.,Bredenkamp, Jrgen, Messen und Testen,
Verlag fr Psychologie, Dr. C.J. Hogrefe, Gttingen, Toronto, Zrich,1983, pag. 545 - 547
20 vezi Laveault, D., Gregoire, J., "Introduction aux theories des tests en sciences humaines", De Boeck & Larcier .a. 1997,
Paris, Bruxelles, pag. 132-134.
17
20
Aceast formul art c scorul adevrat obinut de un subiect este sperana matematic a
scorurilor observate. Precizia unui scor observat crete odat cu numrul de aplicri a testului.
Dac se aplic de multe ori acelai test la acelai subiect, media rezultatului va fi egal cu scorul
adevrat. Dispersia scorului observat X n jurul scorului adevrat V constituie eroarea de msur
pentru ansamblul acestor aplicri.
Postulatul 3. ntre eroarea de msur i scorul adevrat al unui subiect nu exist corelaie. (sau
exist o corelaie nul).
V = 0
Aceasta nseamn c eroarea ntmpltoare de msur nu va fi mai mare dac subiectul posed
un scor adevrat ridicat, sau mai slab, dac el posed un scor adevrat slab.
Postulatul 4. Erorile la dou teste diferite ( E1 i E 2 ) nu sunt corelate ntre ele
E E = 0
1 2
Postulatul 5. ntre eroarea de msur la un test i scorul adevrat la un alt test nu exist corelaie.
E 1V 2 = 0
Postulatul 6. Dou teste X i X' sunt paralele dac, i numai dac, scorurile lor adevrate i erorile
lor de msur sunt egale:
V=V'
E = E'
Din cauza postulatului 1 care stipuleaz c scorul observat este suma unui scor adevrat i a unui
scor de eroare aleatoare, decurge c dou teste paralele vor avea sensibil aceeai medie i
aceeai varian a scorurilor observate.
Postulatul 7. Un test este -echivalent (tau echivalent) cu un alt test, cnd scorurile lor adevrate
difer printr-o constant aditiv k.
V1 = V2 + k
Astfel dac 4 subieci obin notele 23, 45, 67, 55 la un test i 34, 56, 68, 66 la un alt test, constanta
k are valoarea 11. Testele paralele satisfac exigena de -echivalente pe cnd reciproca nu este
adevrat.
Putem rezuma uor ansamblul celor 7 postulate a teoriei clasice a testului prin aseriunea c
erorile aleatoare de msur trebuie s fie independente n orice circumstan. Ca atare,condiiile de
examinare trebuie s fie pregtite n aa fel, nct s nu existe corelaie ntre scorurile adevrate ale
unui subiect, eroarea de msur la un test i eroarea de msur la un alt test. Fr ndeplinirea unor
condiii minimale, scorurile observate devin dificil interpretabile. Teoria clasic a scorurilor ia n
consideraie o eroare strict ntmpltoare.
Pentru un grup de subieci examinai cu un acelai test situaia rezultatelor scorurilor se poate
prezenta n felul urmtor (date fictive):
Subiect
1 2 3
4
5
6
7
8
9 10 11 12 Medie Varian
Scor observat(X) 8 8 5
9
3
7
8
5 10 7
8
9
7,25
3,68
Scor adevrat(V) 9 9 5
8
5
8
6
5
8 7
8
9
7,25
2,35
Eroare(E)
-1 -1 0
1 -2 -1
2
0
2 0
0
0
0,00
1,33
Tabelul 1. Cuprinde rubrici exemplificative ale raporturilor dintre scorul adevrat i scorul observat
21
AUREL STAN
Din tabel se observ c scorul observat este format din suma scorului adevrat i a erorii:
X=V+E. n cazul unui scor compozit variana scorului total are urmtoarea formul:
S X2 = SV2 + S E2 + 2COVVE . Dac avem n vedere faptul c valoarea covarianei dintre V i E este
egal cu 0, atunci formula se transform n felul urmtor: S X2 = SV2 + S E2 . n cazul nostru concret 3,68 =
2,35 + 1,33.
Adiia unui mare numr de astfel de erori care apar n stnga i n dreapta mediei duc la un
rezultat nul. Dar exist i erori sistematice ale cror efect se manifest constant i, n acest caz,
rezultatul adiiei nu mai este nul. Preocuparea pentru astfel de erori nu mai intr n sfera teoriei clasice a
scorurilor, ci n cea a validrii rezultatelor (n cazul cnd o prob este prea uoar sau prea dificil apar
astfel de erori). n acest caz, ecuaia de la postulatul 1 se poate rescrie n felul urmtor:
X=V+ es + ea
Scorul observat este egal cu suma unui scor adevrat, a unei erori aleatoare i a unei erori
sistematice. Vom fi n faa unei astfel de situaii n cazul n cnd un examinator insist asupra unui
aspect foarte facil al disciplinei sale i, n consecin, toi examinaii vor lua note maxime Eroarea
aleatoare va fi cu totul i cu totul derizorie n comparaie cu cea sistematic. Noiunile de validitate i de
fidelitate se pot reprezenta n funcie de proporia varianei scorurilor observate imputabil varianei
pertinente ( 2v ) , varianei nepertinente ( 2vs ) sau varianei erorii ( 2ea ) . Un constructor de test are
drept scop maximizarea prii scorului adevrat, care este pertinent la ceea ce dorete s msoare, i
minimizarea erorii aleatoare de msur. Pentru a reui acest lucru este necesar ca variana scorului
adevrat s ocupe o mare proporie din variana scorului observat i ca variana erorii sistematice s fie
minimal.
n practica aplicrii testelor psihologice, erorile pot aprea din urmtoarele direcii (surse):
Din partea subiecilor care particip la examinare, prin lips de motivare n obinerea unui
randament bun, concentrare deficitar, stare precar a sntii, oboseal accentuat. Erorile
cauzate de factori de natur fiziologic sunt printre cele mai imprevizibile i mai individualizate.
Deloc neglijabil este sursa de eroare datorat lipsei de experiene a subiecilor n efectuarea unui
test. Postura de participant la testare este relativ nou pentru unii subiecii din ara noastr, fapt
care le poate produce diminuarea randamentului. Trebuie s inem cont i de existena
specialitilor care antreneaz o serie de subieci pentru situaia de testare psihologic. O specie
aparte de erori din aceast categorie este aceea realizat de subieci care fac parte dintr-un
subgrup i au o motivaie diferit de cea a ansamblului grupului care particip la testare, mai ales
la testele care pretind un randament maximal.
Din partea psihologilor care realizeaz testare psihologic (printr-o serie de omisiuni n
instruciunile de aplicare, prin limbajul utilizat, ambiguitatea enunurilor) i a operatorilor implicai n
examinarea psihologic prin explicaii insuficiente primite pentru corectarea probelor, prin erori de
codificare i de corectare a rspunsurilor, erori n colectarea datelor (variantele computerizate
anuleaz posibilitatea unor astfel de erori, n majoritatea cazurilor);
Din partea testului nsui. Din aceast categorie de erori fac partea cele datorate eantionajului
itemilor care pot duce la versiuni lipsite de identitate a unor teste ce se consider paralele,
imprecizii de funcionare i nregistrare n cazul unor teste aparative, limitei improprii de timp date
pentru efectuarea testului;
Din cartea ambianei n care se desfoar testarea psihologic, care poate fi total improprie
pentru o examinare.
22
Erorile datorate testului nsui sunt mai uor de prevenit, dar cele datorate subiecilor sunt
dificil de evitat. R.L. Thorndike s-a ocupat special de inventarierea acestor erori. Aceast influenare
diversificat a erorii face ca autorii care au contribuii de valoare n domeniul teoriei testului psihologic
s formalizeze sursa erorilor, realiznd o descompunere a varianei erorii (Lord i Nowick, Gulliksen,
Magnusson, Horst, Lienert, Bernier i Petrulewicz, Monica Albu i Horia Pitaru)21. Astfel H. Guliksen
descompune variana total pentru nu import ce test(n care introduce i varianele erorii) n:
S2X = variana total;
S2V = variana adevrat;
S2EM = variana de eroare datorat msurii;
S2VEQ = variana adevrat specific;
S2EA = variana de eroare datorat condiiilor de administrare a testului,
S2EH = variana erorii datorat hazardului n rspunsuri.
S2ES = variana erorii datorat subiectivitii n corecie.22
S2VF = variana datorat fluctuaiei n scorurile adevrate, de la o ocazie la alta.
David Magnusson, caut s stabileasc direciile din care s-ar putea afecta variana scorului
total n cazul unei a doua aplicri a testului. i expune urmtoarea ecuaie23:
s t2 = s T2 + s e2( m ) + s e2*adm ( + s e2( g ) + s e2( subj ) + sT2 ( f ) , n care
23
AUREL STAN
S1
S2
S3
S4
S5
S6
I1
0
0
0
1
0
0
ITEMI
I2
I3
I4
0
1
0
0
0
0
0
1
1
1
1
1
1
1
1
0
0
0
SUBIECI
SUBIECI
S2
S6
S1
S3
S5
S4
I5
0
1
1
1
1
1
I3
0
0
1
1
1
1
ITEMI
I4
0
0
0
1
1
1
I2
0
0
0
0
1
1
I1
0
0
0
0
0
1
Tabelul 2. Cuprinde matricea cu date observate(stnga) i matricea cu date permutate dup exigenele
scale Guttman (dreapta)
La examinare se pornete de la premiza c subiecii au poteniale difereniate n privina
raionamentului deductiv i c itemii nu au toi aceiai dificultate. Cercettorii i propun n urma acestei
examinri de a ordona att itemii (dup dificultatea lor) ct i subiecii dup potenialul lor). Cerina este
de a ordona subiecii n raport cu itemii i invers, n aa fel nct al doilea subiect plasat pe vertical s
fie mai capabil dect primul, al treilea mai capabil dect al doilea, .a.m.d. ( i al doilea item pe
orizontal d fie mai dificil dect primul, al treilea mai dificil dect al doilea). Din matricea permutat se
observ clar c un subiect care rezolv corect un item trebuie s rezolve corect i itemii de dificultate
mai mic. Realizarea acestui obiectiv presupune enunarea unor reguli de coresponden ntre
rezultatele empirice i rezultatul vizat. Matricea permutat poate fi transpus geometric printr-un model
al lui van der Ven, care indic faptul c dac o persoan a rspuns corect la un item, punctul care
reprezint persoana pe o dreapt care traduce poziia persoanelor i a itemilor va fi la dreapta punctului
care reprezint acest item. n cazul n care punctul va fi situat la stnga unui item acest fapt semnific
faptul c nu a rezolvat corect itemul respectiv24.
I5
I3
I4
I2
I1
S2
S6
S1 S3
S5 S4
Figura 1. Reprezentarea ordinii dificultii itemilor i ordinii capacitii persoanelor
n exemplul nostru fictiv nu exist nici o derogare de la model i datele se conformeaz
regulilor anunate. Un coeficient de reproductibilitate ne poate indica faptul dac un instrument de
msur construit dup modelul Guttman satisface exigenele sale teoretice. Se admite o toleran de
5% pentru devierea de la model pentru a pretinde c un instrument de msur se revendic de la teoria
lui Guttman. Rezultatul se consider a fi nregistrat pe un acelai continuum latent. Exemplificarea a fost
fcut pe unul din cele mai simple i mai cunoscute modele (un model unidimensional, folosindu-se
date dihotomice). Modelele mai complexe cuprind mai multe matrici de date n care se folosesc diferite
24
Adaptare dup Dick, P.; Tournois, Jocelyne; Flieler, Andre; Kop, Jean-Luc La Psychometrie, PUF, Paris, 1994, p.140.
24
tipuri de date pentru diferite nivele de msur (nominal, ordinal etc.). Practic modelele sunt construite pe
baza unor ipoteze de structurare a datelor i ofer proceduri de testate a postulatelor lor.
Modelul lui Gutman este un model determinist i implic urmtoarea supoziie: dac subiectul
domin itemul (expresia a domina nseamn c rspunde adecvat dificultii pe care o presupune, deci
stpnete dificultatea respectiv), valoarea scalar a subiectului este superioar valorii scalare a
itemului (ne referim la scala van der Ven). n schimb, n optica probabilist supoziia susine c dac
subiectul domin itemul, este probabil ca valoarea sa de scal s fie superioar aceleia a itemului.
Dac se ntocmesc curbe caracteristice ale itemilor (un graf al relaiei dintre un continuum
laten pe care itemul este destinat de a-l msura i probabilitatea de a furniza un rspuns corect), optica
determinist indic o trecere brusc de la 0 la 1 n cazul n care competena crete (funcia este
discontinu), pe cnd cea probabilist indic o relaie monoton cresctoare). n cadrul opticii
probabiliste rezolvarea unui item mai greu i euarea unuia mai uor nu constituie o violare a modelului.
Trecerea de la optica determinist la cea probabilist nu nseamn pur i simplu tolerarea erorilor, ci
gestionarea lor, adic nregistrarea i estimarea influenei acestora. Un model probabilist emite ipoteze
asupra distribuiei erorilor pentru a le putea estima, operaiune care lipsete celor deterministe.
n opoziie cu modelul clasic al testului psihologic, modelul probabilistic se edific pe ipoteza
c trsturile psihice, n calitate de dimensiuni latente, nu pot s fie puse pe aceleai plan cu
comportamentul observabil. Autorii principali care s-au dedicat acestei teme sunt: G. Rasch (1960),
P.F. Lazarsfeld i N.W. Henry (1968), F.M. Lord i M.R. Novick (1968), J. Rost i H. Spada (1978),
R.K. Hambleton i H. Swaminathan (1993)25. Valoarea observat a testului ndeplinete n calitate de
msurare deviat funcia unui indicator privind starea parametrului "latent trit", n consecin valorile
testului indic parametrul caracterului probabilist. Dezvoltarea unui test cu ajutorul cruia trebuie s fie
stabilit fundamentul pozitiv rezidual pe un continuum latent al caracteristicii presupune o teorie
psihologic, care se raporteaz la o lege general care guverneaz raportul ntre comportamentul
manifest n test i o dimensiunea latent (i descrie procesul probabilistic care determin intervale de
ncredere ale parametrului care se cere estimat). Testul, n calitate de instrument de investigaie,
indiferent dac este psihologic sau nu, duce implicit la concluzii cu caracter probabilistic. Probabilismul
exprimrii este o form adecvat de exprimare pentru studiile viznd domenii de cercetare
caracterizate de complexitate i dinamism.
Una din carenele analizei clasice a itemului este dat de faptul c proprietile metrice ale
acestuia sunt relative. Aproape toi indicii pe care noi putem s-i calculm depind de eantionul de
subieci utilizai, aceasta mai ales n domeniul cercetrilor de psihologie colar, unde problema
relativitii valorii itemilor se pune cu acuitat, deoarece examinarea cu acelai test de achiziii colare (n
momente diferite ale procesului de nvmnt) duce la oscilaii serioase ale indicelui de dificultate.
Cercetrile noastre cu testul Matricea Progresiv Raven arat clare oscilaii ale indicilor de dificultate a
itemilor prin trecerea examinrilor de la mediul urban la mediul rural, de la studii generale la studii medii
i superioare. Crearea bncilor de itemi ntmpin, din acest motiv al oscilaiei indicelui de dificultate,
serioase dificulti i problema care se pune este aceea de a crea itemi care s nu depind de grupul de
subieci pe care s-a calculat dificultatea. Mai ales n domeniul educaiei se pune problema crerii unor
scale absolute independente de un anumit grup de referin. Desigur aceasta pare o utopie, dar, prin
perseverena unor cercettori, utopiile pot deveni realitate. Primele ncercri n vederea crerii unei
25
25
AUREL STAN
scale care s nu depinde de un grup de referin au fost fcute de Guttman la nceputul anilor 50, n
scopul de a msura atitudinile.
Modelul probabilist se sprijin pe postulatul dup care calitatea unui rspuns este determinat
prin trstura msurat, dificultatea itemului i discriminarea itemului. Deci probabilitatea de a reui la
un item este o funcie a caracteristicii a subiectului (trstura msurat) i a proprietilor metrice ale
itemului (dificultatea i discriminarea sa). Psihometricienii au iniiat diverse modele de relaii funcionale
ntre item i caracteristica msurat. Un element comun la aceste diverse modele este faptul c ele
mprtesc postulatul c totalitatea itemilor unui test msoar aceeai caracteristic psihologic, dar
c nivelul rspunsurilor la acest item poate fi afectat prin erori aleatoare. Obiectivul unor astfel de
modele este acela de a permite o estimare a proprietilor metrice ale itemilor invariani pe suprafaa
unei populaii i, pe de alt parte, o estimare de trsturi psihologice independente de itemii utilizai
pentru a msura. Prin denumirea de MRI (Modele de Rspuns la Itemi) sunt reprezentate majoritatea
modelelor probabiliste26.
26
27
AUREL STAN
O foarte interesant prezentare a calitilor testului psihologic o fac Lothar i Helga Sprung
ntr-o lucrare consacrat metodicii i metodologiei psihologice. Criteriile de apreciere care sunt atribuite
testului fac parte i din sistemul metodicii psihologice n general, fiind enumerate validitatea, fidelitatea,
concordana interpersonal sau obiectivitatea, normativitatea i utilitatea. Fiecare din aceste caliti
suport efectul unei pedanterii taxonomice rar ntlnite (innd seama de informaia pe care o avem la
dispoziie)38.
Monica Albu i Horia Pitariu introduc ntre calitile testelor (cu referire special la testele de
cunotine) pe lng validitate, fidelitate, obiectivitate, putere discriminativ, aplicabilitate i o serie de
denumiri rar ntlnite la ali autori, i anume:
caracterul reprezentativ al testului (cu referire la itemii alei pentru a compune un test);
pertinena testului (gradul de respectare a criteriilor stabilite pentru selectarea ntrebrilor n aa fel
nct acestea s se conformeze scopului instrumentului de msur);
specificitatea testului (calitate care se dobndete n situaia n care un subiect care nu dispune de
cunotine care fac obiectul verificrii va obine un scor egal cu cel pe care l-ar fi realizat dac ar fi
rspuns la ntmplare)39.
Un termen similar pentru fidelitate este cel de fiabilitate, termen folosit exclusiv n
argumentaie de Dany Laveault i Jacques Gregoire, i ocazional de J.J. Bernier i B. Pietrulewicz.
Sensul este, credem, o transpunere a celui din tehnic, adic probabilitate a bunei funcionri a unei
componente sau a unui aparat ntr-o perioada de timp. Urmrind desfurarea de proceduri
demonstrative i de argumentare teoretic a autorilor considerm c suntem n prezena unei extensii
semantice binevenite a ceea ce era denumit pn acum fidelitate40.
Nu am trecut n revist dect o parte din consideraiilor unor autori ( condiionai fiind de
bibliografia parcurs), care au avut viziuni simplificante sau foarte extinse, considernd, totui, c am
conturat ansamblul criteriilor de apreciere a testului psihologic.
Vom cuta s abordm fiecare noiune care este considerat de autorii de specialitate drept
criteriu de apreciere sau calitate a testului (nsumnd acel ansamblu de trsturi, care n subsidiar se
sprijin pe un set clar precizat de proceduri statistico-matematice), satisfacerea sau ndeplinirea
ansamblului format de acestea conferind identitate metodei testului. Variaiile numrului de caliti ale
testului n abordrile diverilor autori au dou cauze: 1) extinderea semnificaiei denumirii de calitate
sau criteriu de apreciere a testului asupra unor elemente contextuale i conjuncturale care influeneaz
accidental, sporadic valorile rezultate dintr-o examinare i 2) preocuparea superficial pentru criteriile de
apreciere a n lucrri care aveau n atenie alte aspecte ale testului.
Autorii de notorietate care s-au ocupat de precizarea coninutului i fundamentarea criteriilor
de apreciere a testelor psihologice au avut n vedere preponderent dou criterii de apreciere,
considerate a fi cele mai importante: fidelitatea i validitatea. Dac aceste dou caliti nu sunt
asigurate, nu are nici un rost s ne ocupm de modul de satisfacere a celorlalte (pentru care exist
anumite tehnici constructive de ameliorare). Nici un fel de clasificare a criteriilor de valabilitate a testului
vezi Sprung, L.; Sprung, H., "Grundlagen der Methodologie + Metodik der Psychologie", VEB, Deutscher Verlag der
Wissenschaft, Berlin, 1987, pag.147-210.
39 vezi Albu, Monica; Pitariu, Horia, "Proiectarea testelor de cunotine i examenul asistat pe calculator", Editura Casa Crii
de tiin, Cluj, 1993, pag. 102-103.
40 vezi op.cit., pag 140-200.
38
28
psihologic nu omite fidelitatea i validitatea. Considerm c obiectivitatea este omis pe nedrept dintre
cele mai importante criterii. Ca atare ncepem cu aceast calitate a testului psihologic.
I.3.2 Obiectivitatea sau concordana interpersonal a testului psihologic
Obiectivitatea sau concordana interpersonal este gradul n care rezultatele unui test
psihologic sunt independente de persoana examinatorului care exploateaz psihodiagnostic acest
instrument. Putem spune c un test este deplin obiectiv atunci cnd diveri examinatori obin aceleai
rezultate la aceiai subieci. Desigur, n aplicrile practice se obine foarte rar strict acelai rezultat.
Faptul de a aplica a doua oar acelai test influeneaz rezultatul, de aceea putem vorbi de oscilaii
nesemnificative ale rezultatelor la folosirea testului pentru examinarea aceleai persoane de ctre alt
examinator. Subiectivitate poate surveni n trei faze diferite ale derulrii a testrii psihologice, motiv
pentru care vorbim de tot attea feluri de obiectivitate: obiectivitatea de realizare, obiectivitatea de
evaluare i obiectivitatea de interpretare. n primul caz, modul de a administra testul al unui examinator
nu ar trebui sa duca la obinerea unor rezultate semnificativ diferite la aceeai grup de subieci fa de
cele obinute de un alt examinator. n mod firesc, condiiile de administrare a testului trebuie s fie ct
mai asemntoare, dac se poate chiar identice, iar consemnul stabilit n caietul testului trebuie s fie
respectat cu strictee.
Obiectivitatea de evaluare este mai greu de atins fa de cea de realizare, iar cea de
interpretare este mai greu de atins dect cea de evaluare.
Testele sunt difereniate n ceea ce privete dificultatea asigurrii obiectivitii sau
concordantei interpersonale. Asigurarea este mai simpl la testele creion-hrtie care posed, n cea mai
mare parte, reguli clare de dare a rspunsului corect, de corectare i de evaluare i mult mai grea la
testele proiective unde pregtirea psihologului pentru test este de durat i unde intervine un numr mai
mare de criterii de evaluare i de interpretare. Metoda statistic folosit pentru calcularea indicelui de
concordanta interpersonal este cea a corelaiilor simple i multiple.
I. 3. 3 Fidelitatea testului
Fidelitatea unui test este dat de precizia cu care un test msoar o anumit caracteristic,
indiferent de faptul dac respectiva caracteristic este cea pe care pretinde c o msoar (care indic
validitatea testului).Termenul englezesc utilizat pentru fidelitate este reliability, termen tiinific de larg
circulaie.
n spiritul concepiei teoriei clasice a testului se afirm c diferena dintre scorul observat sau
msurat al unui test i scorul su adevrat trebuie s fie ct mai mic.
Raportul dintre cele dou variane definesc practic fidelitatea unui test, ca atare fidelitatea
=
29
AUREL STAN
41
42
30
eantion, adic prin eroarea standard de msur a mediei. Avnd n vedere faptul c fidelitatea se
pronun n primul rnd asupra preciziei msurrii, un rol important n teorie l joac eroarea standard
de msur.
Formula erorii standard de msur(SE) este urmtoarea:
SE= s x x (1 rxx ) ;
n care sX = eroarea standard a scorurilor variabilei X i r xx = indicele de fidelitate
Cnd se utilizeaz un scor observat sau failibil (vulnerabil la eroare), eroarea standard a
msurii d o indicaie asupra intervalului probabilist de ncredere n care se situeaz scorul "adevrat".
Fr aceast informaie asupra preciziei estimrii un scor este practic inutilizabil. Ca atare media,
variana i eroarea standard de msur sunt cei mai importani indici statistici n psihometrie.
Cuantificarea fidelitii unui test are ca raiune obinerea estimaiei erorii standard de msur.
Asociaia Psihologilor Americani a elaborat un document. (1985), intitulat "Standards for
Educational and Psychological Testing", n care recomand constructorilor de teste de a comunica
eroarea tip de msur pentru diferite nivele ale scorurilor.
Maniera cea mai cunoscut de a asigura corelaia ntre dou forme paralele ale unui test este
de administra aceluiai eantion de subieci, n dou reprize diferite, acelai test. Corelaia care rezult
din dou treceri succesive ale aceluiai test se numete indice de fidelitate test-retest. Acelai test la
dou treceri succesive constituie echivalentul a dou forme paralele, deoarece aceiai itemi sunt utilizai
n timpul celor dou treceri succesive. Practic se msoar stabilitatea temporal a aceluiai test, motiv
pentru care coeficientul de corelaie obinut se mai numete coeficient de stabilitate. Durata de timp
ntre cele dou aplicri trebuie s fie o durat semnificativ, de obicei de ordinul lunilor, deoarece
reaplicrile imediate ale unui test conin n rezultat mai multe influene favorizante. n acest caz este
vorba de rezultatele la acelai test in momente temporale diferite. Se constant n general ca acest
coeficient de stabilitate se diminueaz cu timpul i este indicat de a lua n seam timpul scurs de la
efectuarea ultimelor calcule asupra fidelitii prin acest procedeu. Dac perioada de timp scurs este de
ordinul anilor, atunci ne putem atepta ca un coeficient de stabilitate s scad de la 0,90 (o corelaie de
bun nivel) pn la 0,60.
R.B. Cattell vorbete de o fidelitate test-retest de scurt termen i una de lung termen, fiecare
din ele furniznd informaii diferite. Cea de scurt termen (dou sptmni i chiar mai puin) mai este
numit i coeficient de ncredere (dependability) i indic gradul de ncredere ce se poate acorda
instrumentului utilizat. n acest timp nu se poate vorbi ntr-adevr de schimbri semnificative ale
trsturii msurate. R.B. Cattell conserv termenul de stabilitate asupra coeficienilor test-retest care se
realizeaz pe un interval temporar important, el susinnd c prin extragerea coeficientului de stabilitate
din cel de ncredere se poate obine partea varianei care este datorat fluctuaiilor reale ale trsturii.
n cazul n care perioada de timp este scurt la procedeul test-retest, prima efectuare poate
influena rspunsurile la a doua efectuare, mai ales la teste de randament.
Se consider c la acest fel de fidelitate exist tendina de supraestimare, prin manifestarea
varianei reziduale specifice itemilor, care reprezint variana sistematic specific a acestora.
n mediul constructorilor de teste exist tendina de a crea forme paralele ale aceluiai test.
Chestionarul de personalitate 16 PF, creat de R.B. Cattell are pn n prezent 4 forme (A, B, C, D).
Fiecare prob este compus din itemi diferii, ns i propune acelai scop psihodiagnostic. Dac prima
dat s-a aplicat forma A, retestul se face cu forma B, corelaia dintre cele dou forme numindu-se
31
AUREL STAN
fidelitate a formelor paralele, iar coeficientul obinut coeficient de echivalen. Acest coeficient de
fidelitate are, de obicei, o valoare mai mic dect cel de stabilitate.
ns, de multe ori nu este posibil de a gsi nici un test paralele i nu avem la dispoziie
sptmni sau luni pentru a atepta aplicarea aceluiai test, stndu-ne la dispoziie doar posibilitatea
administrrii unei singure probe o singur dat. Itemii pot fi tratai ca aparinnd la dou teste paralele.
Astfel, un test de 100 de itemi poate fi mprit n dou pri de cte 50 de itemi fiecare. Coeficientul
obinut se aseamn cu cel de echivalen,. dar testul nu conine n acest caz dect jumtate din
cantitatea de itemi folosit la alte forme. n asemenea situaii avem la dispoziie posibilitatea unei
2 xrxx
corecii a coeficientului de corelaie, utiliznd formula Spearman-Brown. Astfel rxx ' =
n care
(1 + rxx )
rxx este corelaia ntre cele dou jumti ale testului, rxx estimarea fidelitii ansamblului testului.
Aceast metod de mprite n dou a testului, care mai poart numele de metoda split-half,
informeaz despre omogenitatea sau coerena itemilor. n cazul n care corelaiile ntre itemi sunt
ridicate ne putem atepta ca i cele ntre dou jumti ale testului s fie ridicate. Media sumei
corelaiilor tuturor variantelor de njumtire a testului este foarte apropiat de media tuturor corelaiilor
interitemi. Dac cineva corijeaz media corelaiilor interitemi cu formula Spearman-Brown se obine un
coeficient egal cu media corelaiilor corijate ntre toate perechile posibile de partaj prin njumtire.
Coeficientul obinut se numete coeficient de consisten intern.
Consistena intern =
k r
1 (k 1) * r
n care k = numr de itemi paraleli i r = media corelaiilor interitemi. Pentru a estima coerena intern
trebuie s scindm ansamblul intemilor ntr-un mare numr de fraciuni, pe care trebuie s le corelm
(sferturi, optimi, aisprezecimi de test).
Un mod simplificat de a exprima simplificat consistena intern este exprimat prin formula a
lui Cronbach. :
s i2
k
=
* 1 ( 2 )
(k 1)
s X
n care k = nr. de itemi,
2
i
rxx =
pi * qi
k
* 1
(k 1)
s X2
n care pi este indicele de dificultate al itemului i qi este egal cu 1-p, k este numrul de itemi, s2x este
variana rezultatului global al testului. n cazul n care una sau mai multe supoziiile prezentate anterior
nu sunt verificate, atunci coeficientul obinut subestimeaz consistena intern.
Dup trecerea n revist a diferitelor metode de calcul a coeficientului de fidelitate se poate
concluziona c nu exist o identitate valoric a rezultatului dac folosim metode diferite. Este de
presupus c surse diferite de eroare influeneaz difereniat fidelitatea unui test. Pot interveni situaii
specifice n privina explicaiilor date pentru efectuarea testului, modul de administrare al acestuia i
modul de corectare. Poate interveni chiar i lipsa de stabilitate a trsturii n sine. H.J. Eysenck insist
asupra cercetrii fidelitii subiectului n privina unei anumite capaciti, nu doar asupra fidelitii probei
psihologice.
I.3.4 Validitatea testului psihologic
Validitatea unui test este acea calitate a testului de a msura o caracteristic pe care pretinde
c o msoar. n spiritul teoriei clasice a testului psihologic, Gustav Lienert considera c validitatea unui
test d gradul de precizie cu care acest test msoar faptic acea caracteristic a personalitii sau acel
mod de comportament pe care el trebuie s-l msoare sau pretinde s-l msoare44. Un test este deplin
valid cnd rezultatele sale permit o concluzie nemijlocit i fr greeli asupra gradului de reliefare a
caracteristicii comportamentale cercetate.
Stabilirea validitii este principala sarcin a celor ce construiesc i vor s impun n practic
folosirea unui anumit test psihologic. Spre deosebire de validitate, validarea este un ansamblu de
proceduri cantitative i calitative care au drept finalitate asigurarea validitii.
n sens general, validitatea este o proprietate a unui model, a unui enun, a unui concept, a
unui indicator specific a unui test statistic de a corespunde intr-un mod apropiat destinaiei pentru care
au fost create.
Acest concept trimite la relaia care exist ntre teorie sau orice element teoretic (model,
ipoteza, concept, instrument, test) i realitatea empiric pe care teoria consider c o reprezint.
Noiunea de validitate are o legtur strns cu aceea de adevr. A spune despre un model ca este
valid nseamn a afirma c entitile pe care le utilizeaz (exemplu procese, reprezentri, motivaii,
stadii, complexe) au o anumit form de "realitate" i c enunurile pe care le conin sunt adevrate
(exemple de enunuri - nivelul de motivaie modific rapiditatea proceselor de percepie sau complexul
lui Oedip este un constitutiv al personalitii tuturor indivizilor). n teoria percepiei de vorbete despre
validitate ecologic. Termenul este creat de Egon Brunswik pentru a desemna gradul n care stimuli
distali i proximali covariaz. El s-a gndit la operaia de baz a percepiei, aceea de a nva s
Kline, Paul, "Fidelit et validit", n Beech, R., Harding, Leonora, "Tests, mode d'emploi. Guide de psychometrie", ECPA,
Paris, 1994, pag.82.
44 vezi Lienert, Gustav, "Testaufbau und Testanalyse", Verlag Julius Beltz, Weinheim und Berlin, 1967, pag. 255.
43
33
AUREL STAN
estimm adevratul stimul (distal = fizic) pe baza valorilor variabile ale stimulului proximal care excit
sistemele receptoare. Cu ct este mai mare validitatea ecologic a unui semn proximal pentru o
proprietate a unui stimul distal, cu att e mai probabil ca acesta s fie nvat i folosit. Termenul e
folosit n teoria percepiei directe a lui J.J. Gibson.
Autorul sau utilizatorul unui model, n funcie de cadrul epistemologic n care se situeaz, este
nevoit s respecte definiia termenilor teoretici i s fixeze n acelai timp condiiile pe care el pretinde
c trebuie s dispun un model valid.
Pentru testele psihologice condiiile standard de validitate sunt, n general, definite n termeni
de valoare predictiv, adic, prin intermediul unei valori de corelaie cu ceea ce ele sunt investite de a
diagnostica (inteligena, nivel de dezvoltare, trstura de personalitate, capacitate ntr-o sarcina sau
ntr-o profesiune).
Noiunea de validitate este central pentru psihologia tiinific, adic psihologia care caut
s-i fundamenteze afirmaiile (aseriunile) prin intervenia procedurilor experimentale, la care se
adaug un sistem statistic adecvat de verificare a rezultatelor. Nu este exagerat s se afirme c
psihologii se divizeaz n dou categorii:
1. cei care se preocup de validitatea (afirmaiilor), a teoriilor, a modelelor, a conceptelor i
instrumentelor pe care le folosesc;
2. cei care nu se preocup de acestea, ci se mulumesc cu aseriuni (afirmaii care nu sunt
demonstrate).
Noiunile teoretice sunt justificabile (fundamentate) printr-o procedur n care ele sunt
confruntate cu datele. Reguli metodologice riguroase fixeaz pe baze raionale etapele pe care trebuie
s le parcurg o validare sistematic. Elementele teoretice pot sa fie, in acest proces sunt sau respinse
ca nonvalide, sau ameliorate, sau acceptate ca provizoriu valide (pn la o confirmare mai ampl).
"American Psychological Association" i"American Educational Research Association" au
publicat mpreun n anul 1985 "Standard for Educational and Psychological Testing" n care se
pronun pentru integrarea diferitelor tipuri de validitate. n documentul amintit anterior, care constituie
un punct de referin pentru psihometricienii americani, se afirm c validitatea este "un concept unitar
care se refer nu la testul n sine, ci la inferenele fcute plecnd de la rezultatele acestuia"45. n
aceast perspectiv este incorect s se vorbeasc despre validitatea unui test n general, deci se
prefer a defini noiunea de validitate prin referina la intercorelarea care este realizat cu rezultatele
unui test (sau a unui indicator oarecare al acestuia).
n privina validitii exist 3 diviziuni fundamentale i o serie de diviziuni secundare: Facem
consideraii, n primul rnd, asupra celor fundamentale.
Validitatea de coninut. ntr-o viziune restrns asupra acestui gen de validitate,
caracteristic mai ales domeniului aptitudinal, nsui coninutul testului prezint criteriu optimal pentru
caracteristica personalitii care se cere reliefat. Un test de cunotine colare va fi valid n privina
coninutului dac sarcinile sale prezint alegeri reprezentative din materia de nvmnt. Cel mai
ilustrativ exemplu pentru acest tip de validitate este proba la maina de scris.
n viziune strict, estimarea validitii unui instrument de testare este ntemeiat pe o
examinare detaliat a coninuturilor itemilor testului. Evaluarea acestora este realizat analitic prin
analiza atent a fiecrui item n vederea stabilirii potrivirii cu testul i examinarea coeziunii globale a
Dup Laveault, Dany, Gregoire, Jacques, "Introduction aux theorie des tests en sciences humaine", De Boeck Universit, Paris,
Bruxelles, 1997, pag. 189-190.
45
34
itemilor testului. De exemplu, un test de abiliti matematice, pentru a avea un grad de validitate de
coninut respectabil ar trebui s formuleze itemii ntr-un mod foarte clar pentru ca subiectul s poat
nelege ceea ce e ntrebat. Mai mult, coninuturile ar trebui s fie astfel gndite nct toate aspectele
testate s fie reprezentate adecvat. Testul nu trebuie s fie suprancrcat cu itemi despre nmulire n
defavoarea itemilor despre adunare.
Stabilirea validitii de coninut este o operaie subiectiv i se bazeaz pe evalurile
experilior n ceea ce privete relevana materialelor utilizate. Este specific unei situaii i estimrile
fcute ntr-o anumit situaie circumstanial pot s nu se aplice i altor sitaii. Un test de aptitudini
aritmetice, construit i validat n privina coninutului pentru o coal tradiional, poate avea o validitate
de coninut foarte sczut dac este aplicat ntr-o coal ce folosete aa-numita matematic nou.
Validitatea de coninut, n viziune extins,. este conferit unui test, de regul, printr-un consiliu
de experi, cruia i se cere s se pronune n ce msur sarcinile sunt reprezentative pentru un concept
care constituie baza teoretic a testului. Itemilor li se cerceteaz toate faetele care converg spre
identitatea noional a anxietii, depresiei, introversiunii etc. Reproul de subiectivitate poate fi
contracarat prin crearea i respectarea unei metodologii foarte riguroase. Validitatea de coninut este
direcionat n majoritatea cazurilor spre coninutul itemilor care nu se confund n multe cazuri cu
coninutul testului. pentru evaluarea cruia se iau n consideraie i alte aspecte precum instruciunile
date, modalitile de rspuns i de cotare, limita de timp. Merit de precizat faptul c termenul de
concept psihodiagnostic desemneaz maniera generic de raportare a testului. Nici un test nu msoar
direct o trstur, ci ntr-un mod mediat, prin intermediul unui model al conceptului. Neglijarea acestei
precizri a dus la reificarea unor concepte n faza de nceput a testrii psihologice, cu consecine
nefaste pentru aceasta. Astfel, inteligena era considerat ca avnd o realitate aproape de substan,
care se localiza n creierul uman. Maurice Reuchlin spune n aceast privin: "Iluzia const n a crede
c, deoarece un cuvnt exist n limb, acestuia i corespunde n mod necesar, fr ambiguitate, un
obiect identificabil. Aceasta nseamn s uitm pluralitatea definiiilor posibile a fiecrui cuvnt a limbii,
faptul interpretrii diverse a cuvintelor care compun definiiile, i c limba nu are rolul de a furniza
procedee empirice permind de a ti n ce msur o anumit observaie corespunde unei anumite
definiii (ea furnizeaz un cod, nu o metod de codaj)"46.
Psihometricienii englezi utilizeaz termenul de "construct" pentru a desemna modelizarea unui
concept. Validitatea de construct se rezum la un set de proceduri evaluare a validitii unui instrument
de testare bazate pe determinarea gradului n care itemii testului cuprind trstura, constructul ipotetic
pe care pretind c l msoar. Astfel, dac se presupune c un test msoar inteligena, ne putem
ntreba:
Ce trsturi sau caliti caracterizeaz inteligena?
Itemii testului reflect ntr-adevr aceste constructe?
Studiile iniiale ale construirii unui test sunt de obicei legate de validitatea de construct. Este
de remarcat faptul c aceast validitate nu asigur o msurare cantitativ a validitii. Spre deosebire
de o validitate care depinde de msurtorile de corelaie, aici nu exist baze matematice pentru
determinarea validitii i spre deosebire de msurtorile care depind de structurile de comportament
cunoscute (de exemplu validitatea legat de criterii), estimarea validitii construciei este ntotdeauna n
46
Vezi Reuchlin, Maurice, "Introduction la recherche en psychologie", Editions Nathan, Paris, 1992, pag.51-52.
35
AUREL STAN
schimbare odat cu acumularea mai multor dovezi despre trsturile i calitile care fundamenteaz
constructul.
Orice aciune de validare debuteaz printr-o definiie precis a caracteristicii investigate de
test. Prezena unor elemente vagi n definiii mpiedic stabilirea corespunztoare a validitii. Asociaiile
profesionale se preocup intens de concizia i de unitatea de sens a termenilor utilizai. n domeniul
psihiatric i psihologic DSM-IV (Diagnostic and Statistical Manual of Mental Disorders), publicat de
Asociaia Psihiatric American47, furnizeaz standarde ale conciziei n terminologia utilizat.
Validitatea bazat pe un criteriu. Alt denumire pentru validitatea bazat pe un criteriu este
validitatea extern. Validitatea unui instrument de testare evaluat prin determinarea relaiei dintre
scorurile la test i un criteriu independent Validitatea simultan, convergent i validitatea predictiv
sunt dou feluri diferite ale acestei diviziuni a validitii. Dac un test pretinde c msoar o anumit
caracteristic psihic este firesc ca testul s coreleze cu un criteriu care msoar aceeai trstur sau
una foarte apropiat. Cnd avem posibilitatea s comparm imediat valorile testului cu cele ale unei
mrimi care are o validitate recunoscut, atunci suntem n prezena unei validiti concomitente sau
concurente. Validitatea concurent este un fel de validitate bazata pe criterii corelate n care relaia
dintre punctajul (scorul) testului i scorurile criterii se stabilete n acelai timp. Este denumit i
validitate convergent, simultan sau de statut. O modalitate de a evalua validitatea unui test de abiliti
de lucru la birou va fi s stabilim modul n care scorurile la test vor corela cu abilitile cunoscute ale
unui grup de lucrtori la birou ale cror performane au fost evaluate n condiii de munc reale. Un alt
exemplu: rezultatele subtestului de calcule aritmetice ale probei WISC pot fi imediat corelate cu
rezultatele obinute la disciplina respectiv de un elev.
n cazul n care performana cu care se compar rezultatele testului urmeaz s fie stabilit
ulterior examinrii, atunci validitatea este predictiv. Dar criteriu poate fi o realitate complex i atunci
va trebui s-l definim operaional, fapt care constituie una din cele mai importante etape practice n
precizarea validitii. Un criteriu deficitar definit poate duce la compromiterea validitii unui bun
instrument de msur. De asemenea, n joc intr o serie de factori care pot influena acest criteriu de
apreciere a testului. Acetia sunt:
fidelitatea predictorului i a criteriului. Criteriu este suficient de valid n msura in care este
fidel, deci reproductibil.Ca atare, trebuie de demonstrat c la repetare, acelai criteriu produce
rezultate relativ identice n corelaie;
mrimea eantionului de subieci;
tolerana fa de dispersia rezultatelor;
Modificrile operate n rndul acestor factori de influenare pot afecta serios indicele de
validitate. Dac un eantion are o valoare modest (sub 30), atunci afectarea validitii este de 25-30%.
Validitatea teoretic sau conceptual. Este tipul de validitate care pretinde un efort de un
rafinament deosebit, deoarece se refer la natura instrumentului de msur. n psihologie i n alte
discipline, nelegerea unui fenomen progreseaz n armonie cu capacitatea noastr de a-l msura.
Operaionalizarea variabilelor st n centrul ateniei n cazul validitii teoretice, ntreprindere tiinific
care presupune o mare cantitate de informaii. n cazul n care o ipotez nu se verific i instrumentul
de msur este bine operaionalizat, atunci teoria se cere schimbat sau ameliorat structural i
funcional. Semnalul de alarm asupra calitii teoriilor psihologice nu este o chestiune recent, el fiind o
47
36
preocupare constant a unor epistemologi de marc. Unul dintre acetia, Karl Popper, fcea
urmtoarea remarc nc din anul 1934: "Pentru a putea clarifica aceast concepie (deductivist), este
necesar s clarificm opoziia dintre psihologia empiric a cunoaterii, care opereaz cu fapte empirice,
i logica cunoaterii, care nu se intereseaz dect de corelaii logice, cci prejudecile logice inductive
sunt legate de confundarea problemelor psihologice cu cele epistemologice, ceea ce, n treact fie
spus, are urmri neplcute nu numai pentru teoria cunoaterii, ci i pentru psihologie"48.
Dac teoria este valid i instrumentul de cercetare dovedete o operaionalizare deficitar,
atunci poate interveni schimbarea sau ameliorarea constructiv a instrumentului sau a procedurii de
validare.
Testul psihologic are o serie de validiti de importanta mai mic, dar care n anumite contexte
pot sa joace un rol important, n condiiile cnd se asigura realizarea lor. Ele constituie, n mare parte,
variante ale primelor trei sau proceduri simplificate determinate de contextul empiric49.
Validitatea"a priori" este o estimare preliminar i intuitiv a validitii de coninut a unui test.
Stabilete gradul in care itemii testului au o legtur intuitiv "a priori" cu acele comportamentele pe
care se presupune c le testeaz. Se mai numete "validitate de sim comun".
Validitatea congruenta este o metod de stabilire a validitii unui nou test prin corelarea
scorurilor obinute la acest test cu altele, a cror validitate a fost stabilit anterior. Un caz tipic este dat
de lumea testelor de inteligen, unde noile teste create sunt comparate cu testele recunoscute ca fiind
validate, cum sunt Stanford-Binet sau diferite forme de teste create de David Wechsler.
Validitate intern este o procedur intern de determinare a validitii unui test prin
cercetarea fiecrei componente i evaluarea gradului n care i ndeplinete rolul in cadrul testului.
Astfel se poate vorbi i de validitatea itemului, ca fiind gradul n care un singur item al unui test msoar
ceea ce a fost gndit s msoare.
Validitate reprezentativ (bazat pe un model) este o variant a validitii de coninut, bazata
pe evaluarea ponderii n care diferite caracteristici presupuse a susine i fundament ceea ce se
msoar sunt reprezentate n test. Este mai mult dect o procedur de control pentru a se evita
subiectivismul n cadrul testului, i are drept obiectiv prevenirea defavorizrii adevratei msurri.
Validitatea sintetic (syntethic validity)50 este validitatea unui instrument complex de testare
sau a unei ntregi baterii de teste, i este bazat pe relaia dintre un scor compozit, care presupune
reprezentarea diferiilor factori prezeni n test, i performana real. Termenul deriv din procedura
sintetizrii mai multor factori ntr-o singur valoare.
Validitate aparent (face validity) sau validitatea de faad este validitatea evaluata de
ctre subieci (care au n aceast situaie calitatea de "experi"), care apreciaz coninutul unui test
pentru a aprecia dac este potrivit, adecvat lor. Este o procedur destul de vag pentru validarea unui
test, aceasta i datorit subiectivitii inerente, fiind tipic doar fazelor incipiente de construcie a
testelor. Este de remarcat faptul c, n timp ce validitatea aparent pare, superficial vorbind, similar cu
Vezi Popper, Karl R., "Logica cercetrii", Editura tiinific i enciclopedic, Bucureti, 1981, pag.75.
Aceste validiti ocup spaii modeste n manuale sau lucrri de specialitate. Pentru inventarierea lor am consultat
urmtoarele dicionare: Heber, Arthur, "Dictionary of Psychology", Penguin Books, London, New York, 1985; "Grand
Dictionnaire de la Psychologie", Larousse, Paris, 1992; Hehlmann, Wilhelm, "Worterbuch der Psychologie", Alfred Kroner
Verlag, Stuttgart, 1968; chiopu, Ursula (coord), "Dicionar de Psihololgie", Editura Babel, Bucureti, 1997; Benesch,
Hellmuth, "Atlas de la Psychologie", Libraire Generale Francaise, Paris, 1995; Mucchielli, A. et R., "Lexique de la
Psychologie", Entreprise Moderne d'Edition, Editions Sociales Francaises, Paris, 1969.
50 n parantez este trecut forma sub care circul noiunea respectiv n terminologia englez de specialitate.
48
49
37
AUREL STAN
validitatea de coninut, procedurile sunt destul de diferite, ultima fiind o procedura sistematic, iar prima
fiind mai apropiat de validitatea "a priori".
Validitate de consens sau de prere general. Este realizat printr-o procedur informal
de evaluare a validitii bazat pe noiunea de prere general. Aceasta pornete de la aseriunea c o
afirmaie este cu att mai posibil s fie adevrat cu ct mai multe persoane sunt de acord n privina
adevrului acesteia sau cu ct mai multe persoane sunt de acord n privina unei percepii cu att e mai
posibil ca ea s fie adevrat. Termenul de validitate de consens este rar folosit n cercetarea ce
utilizeaz teste i msurtori. Este un termen tipic pentru psihologia social i se conformeaz
principiului conform cruia susinerea sistematic a unei anumite poziii i acord o mai mare
acceptabilitate din partea celorlali.
Standardizarea procesul diagnostic prin intermediul testului are loc n mai multe faze:
provocarea stimulrii, nregistrarea rspunsului, evaluarea rezultatului i interpretarea acestuia. Aceast
fracionare a procesului de diagnosticare prin test este o exigen teoretic, dar n examinarea concret
fazele nu sunt separabile la fel de eficient la toate clasele de teste.
n faza de provocare a stimulrii pe baza configuraiei de itemi se constat variaii
nensemnate ale ordonrii experimentale, care pot s influeneze mai mult sau mai puin rezultatele
testului.
O serie de atenionri pot juca un rol benefic, i anume:
a se pstra doar instruciunile de cercetare proiectate pentru test;
a se utiliza materialele de cercetare recomandate pentru test, altfel rezultatele nu pot fi
comparate;
s fie create pentru toi participanii aceleai condiii, deoarece, pe lng materiale, sunt
relevante i indicaiile date subiecilor pentru situaia de testare;
condiiile i instruciunile nu au aceeai importan pentru toi candidaii, ci una diferenial
pentru fiecare condiie;
Un test trebuie s fie realizat la fel pentru toi candidaii, ntr-o ambian pe ct posibil
neperturbat;
Condiiile exterioare nu pot s fi identificate complet, deoarece ntr n calcul starea vremii,
raportul spaial, starea instrumentului de scris, mirosuri indezirabile. idiosincrasii perceptive. Atenia
pentru crearea unei situaii sterile n privina condiiilor de ambiant nu poate fi comparat cu cea din
medicin.
Mai greu de delimitat i normalizat sunt condiiile intraindividuale, proprii fiecrui subiect.
Tragerea unor concluzii psihodiagnostice din rezultatele unui test presupune c subiectul se gsea, n
momentul examenului, ntr-o dispoziie corporal i psihic normal.
Perturbrile momentane ale strii de sntate, efectele farmacologice de timp scurt sau lung,
tensiunile emoionale acute, grijile, gradul de nelinite, nesigurana, oscilaia dispoziiilor personale pot
s influeneze n mai mare sau mai mic msur cantitatea i calitatea rspunsurilor.
Atenie special trebuie acordat efectelor posibile care rezult din dispoziia personal,
ateptrile personale ale examinatului fa de cercetarea prin test i consecinele presupuse ale
acesteia
Cercetri empirice indic faptul c determinani speciali precum motivaia efecturii testului,
participarea eului, anxietatea fa de test. succesul sau insuccesul trit, caracterul stresului (presiunea
examenului i a timpului) pot s influeneze negativ considerabil fundamentul diagnosticului.
n sens mai larg strategiile de realizare, care variaz interindividual, nclinaii latente sau
ascunse la colaborare, minciuna, exagerarea i afirmaiile neconvingtoare, ca i stilul de reacie
general sau specific al candidatului fac parte din izvorul de perturbri intern psihice care pot s
provoace rezultate neregulate ale testului.
Provocarea comportamental ca situaie social, este prezent mai ales la examenul
individual. la care particip i un complex semnificativ de condiii marginale. Printre acestea sunt
caracteristicile ale randamentului la test, vrsta, sexul, statutul social, rudele, vestimentaia caracteristici
presupuse sau ateptate ale examinatorului, mecanisme de interreacie condiionate (prezena sau
absena examinatorului n spaiu de examinare, cunoaterea sau necunoaterea lui, intensitatea
39
AUREL STAN
observrii i a sprijinului, condiionri atmosferice, mimice, gestice sau verbale, ncurajarea sau
descurajarea, lauda sau mustrare). Anna Anastasi spunea n 1968 c semnificaia variabilelor
situaionale la examenul prin test are valoare diferenial n funcie de fiecare test.
nregistrarea rspunsurilor. n privina nregistrrii rspunsurilor la test se poate spune c
aceasta nu este niciodat deplin. Exist o diferena ntre nregistrarea rezultatelor i n observarea
liber a datelor. nregistrarea cunoate forme multiple i presupune protocalarea verbal a rspunsului,
depozitarea anumitor semnale prin ajutorarea de ctre mijloace tehnice-aparat fotografic, casetofon,
instalaii video, aparate de nregistrare numerice i verbale, terminale ale computerelor, etc.
nregistrarea standardizat a datelor trebuie realizat n msura n care aceasta nu se
produce automatizat. n acest caz se stabilesc reguli clare, n aa fel nct fiecare conductor de testare
s nregistreze aceeai cantitate de informaii.
Evaluarea rspunsurilor la test. Prelucrarea rezultatelor nregistrate de la teste, precizarea
frecvenei anumitor reacii-rspuns coerente se realizeaz parial cu diverse aparate de evaluat, mai
ales ntr-un test de aptitudini. Teste cu rspuns creativ fac imposibil lucrul cu mainile de evaluat. elul
evalurii datelor este obinerea unui extract din datele nregistrate, avnd ca rezultat unul sau mai muli
indicatori. Valorile brute se preteaz la transformri pe baza raportrii la datelor grupurilor de referin.
Evalurile sunt nsoite n unele cazuri de calcule vaste asupra sindroamelor i de prezentri grafice n
profile pentru a face materialul mai uor de neles. n evaluare se fac simite efectele de informare
precum i de halo, centrare, contrast i ancoraj.
Interpretarea rezultatelor. Calitatea consecinele diagnostice pentru interpretare constituie
obiectul de interes al obiectivitii. Dintr-un rezultat individual mai muli cercettori trebuie s trag
aceleai concluzii. n timpul examenului ns se produc o serie de interaciuni ntre conductorul de
examen i cel examinat. Cu ct regulile sunt mai puin formalizate, cu att mai mare este riscul efectelor
de interpretare explicat prin ecuaia personal a conductorului de examen. Imperfeciunile sunt doar
incomplet corijate. n faa exigenelor unei valorificri depline sunt obiecii mai mult sau mai puin
ndreptite, datorate caracterului de "realitate deficitar" al variaiei condiiilor controlate empiric.
Eantioane nereprezentative de subieci i metodele inadecvate de analiz a datelor i pun
amprenta asupra calitii interpretrii. n practic este posibil doar aproximativ de a estima condiiile
marginale care anormalizeaz situaiile de standardizare ale fazelor individuale ale procesului
diagnostic. Ele sunt stabilite segmentat, chiar la testele construite i verificate cu grij.
Pentru asigurarea unei bune interpretri sunt necesare, uneori, aplicri ale unor teste
preliminare suplimentare care s limiteze efectele deformatoare (pentru stabilirea motivaiei testului sau
scalele de minciuni).
I.4.3.Comparabilitatea unui test
Un test este comparabil dac:
Exista unul sau mai multe forme de teste paralele;
Sunt disponibile teste asemntoare n privina validitii.
Forma paralel a unui test permite comparaia testului cu sine nsui. Ea face posibil un
control intraindividual al fidelitii prin care se cerceteaz un anumit subiect cu o anumit form de test
i se compar rezultatele. Testele asemntoare sau egal valide, examineaz aceeai caracteristic a
personalitii sau una apropiat.
40
51
Vezi Lienert, Gustav, "Testaufbau und Testanalyse", Verlag Julius Beltz, Weinheim/Berlin, 1967, pag.19-20.
41
AUREL STAN
52
53
42
folosete noiunile de sarcini i analiz de sarcini n loc de itemi i analiz de itemi. 54, dei referirile sunt
clare a ceea ce se numete analiz de itemi. Gustav Lienert nu folosete pe parcursul tratatului su
asupra construciei testelor psihologice noiunea de item dect o singur dat, i atunci pentru a indica
o procedur similar de analiz a discriminrii ntlnit la A.F. Vukovich55.
Luat n sens general, analiza itemilor este o analiz detaliat a itemilor individuali ai unui test
sau ai unui chestionar cu scopul de a evalua validitatea i sigurana, gradul de ncredere acordat
fiecruia din itemi. n general disponibilitatea testului pentru aplicare practic.
Sub aspect general, asemenea analize pot fi direcionate pe coninut i form sau pot fi
realizate n mod cantitativ, observndu-se modul n care fiecare item contribuie la precizia msurrii i
validitatea generala a testului. n sensul cel mai restrns, analiza de itemi este folosit prioritar mai ales
pentru evaluarea modului efectiv n care fiecare item contribuie la validitatea general a testului.
Aceast analiz nu se poate realiza dect pentru testele la care subiecii sunt lsai s
parcurg toi itemii, deci este imposibil de realizat la aa-numitele teste de rapiditate (speed-test), adic
teste care au o limit de timp i sunt construite n aa fel nct foarte puini subieci s termine de
parcurs toate solicitrile n limita de timp fixat. Este adevrat c o serie de autori susin c la testele
realizate incomplet de ctre subieci se pot prevedea restul rspunsurilor neefectuate prin studierea
atent a modului n care subiectul a rspuns pn atunci. Considerm c o asemenea previziune ar
aduce un plus de relativism n privina concluziilor, relativism care nu lipsete n interpretare nici fr
aceast prognoz. n cazul cnd un mare numr de persoane nu au putut s rspund la item din lips
de timp indicele de dificultate nu este exprimat cu adevrat.
Analiza de itemi este diversificat, opiunea pentru o anumit categorie depinznd de scopul
special pe care l urmrim n construcia unui anumit test. Caracteristicile valorilor brute ale ntregului
test sau ale itemilor individuali nu sunt independente de caracteristicile eantioanelor care sunt
msurate cu ajutorul testului. Acest aspect al eantionrii l vom trata n capitolul referitor la construcia
testului. Un model teoretic ireproabil care s integreze perfect caracteristicile subiecilor n eantion i
caracteristicile variabilelor msurate nu este disponibil. Creatorii de teste construite pe baza teoriei
probabiliste a testului psihologic aspir la un model care s ofere parametri ai testului independent de
eantioanele cercetate i independent chiar testele utilizate. n aceast lucrare vom face aprecieri
prioritar referitoare la o metod de analiz pentru un singur eantion. Acest eantion trebuie s fie
reprezentativ i pentru alte grupe la care testul trebuie s fie aplicat mai trziu. Abordarea pragmatic a
metodei analizei de itemi o vom ncepe prin considerarea ctorva din scopurile sale cele mai
importante. Se pot distinge dou feluri de analize de itemi, aceea la care n urma prelucrrii rezultatelor
este extras un singur indice i aceea la care sunt extrai mai muli indici pentru selectarea i
recomandarea unui anumit item. Cele mai frecvente analize sunt efectuate pentru cazul n care exist
un anumit rspuns la item considerat corect.
Realizarea unor exigene abstracte, bazate pe o puternic formalizare cantitativ, este o
operaiune dificil i conduce, n cazul statisticilor neexhaustive, la o pierdere de informaii despre
configuraii posibile ale categoriilor de itemi din care poate s rezulte valoarea sumei. Pe de alt parte,
formalizarea i raportarea la modele este o procedur de neevitat, dar postulatele pot fi n unele cazuri
slbite. Astfel, modelul teoriei clasice a testului ofer fundamentul pentru dobndirea valorilor fidele
ale testului. Se poate concluziona c testele psihometrice se caracterizeaz prin aceea c multitudinea
54
55
Vezi Magnusson, David, "Testtheorie", Verlag Frank Deuticke Wien, 1969, pag.22-35
Lienert, Gustav.A., "Testaufbau und Testanalyse", Verlag Julius Beltz, Weinheim/Berlin, 1967, pag.93
43
AUREL STAN
de categorii de itemi posibile este ordonat i delimitat, fie pe calea avansrii unor categorii selective,
fie prin categorizri ulterioare dup prescripii standardizate. La categoriile de itemi care sunt ordonate
numerice, valorile numerice joase indic o reliefare sczut, iar cele mari una puternic a caracteristicii
pus n discuie. n majoritatea cazurilor sunt preferate structuri informaionale binare, cu categorii de
msurare 0 i 1, dar acest model nu este obligatoriu de urmat, existnd i alte posibiliti. Dac o
valoare a unui test trebuie s indice sub form de msur caracteristica pus n discuie, atunci putem
presupune c i valorile itemului indic relaii sistematice cu categoriile caracteristicii de msurat.
Prezentarea sistematic a metodelor analizei itemului i cu aceast a tehnicilor de selecie se
gsete n literatura standard despre construcia testului.
Unul din scopul analizei de itemi este de a selecta dintr-o colecie mai mare de itemi
(existent n faza preliminar a construciei unui test) una sau mai multe grupe de itemi, n aa fel nct
punctajele corespunztoare ale testelor s satisfac diverse condiii prestabilite n relaie cu distribuia i
anumite corelaii.. Ca tipuri de analize de itemi putem enumera analiza dificultii, a distractorilor, a
omogenitii, a specificitii, a validitii, a excesului i a asimetriei.
n construcia testelor psihologice se pleac de la un ansamblu de itemi mai numeros dect
cel care se consider necesar, deoarece pe parcursul perioadei de elaborare a testelor o serie de itemi
va fi eliminat, ca urmare a neconcordanei acesteia cu exigenele unor criterii de valabilitate.
Structura de colectare a datelor necesare constituirii scorului testului n ansamblu a fost creat
de William Stern n anul 1912, purtnd denumirea de matricea lui Stern. Exprimat n form generic,
ea se prezint n felul urmtor:
Item
Subiect
1
2
3
4
i
..
n
tj
n
X11
X12
X13
X14
X1i
..
X1n
i =1
1i
X21
X22
X23
X24
X2i
X2n
i =1
2i
X31
X32
X33
X34
X3i
X3n
i =1
3i
X41
X42
X43
X44
X4i
X4n
i =1
...
..
..
..
4i
.
n
Xj1
Xj2
Xj3
Xj4
Xji
..
Xjn
i =1
ji
..
..
..
..
..
..
..
X
i =1
Ni
XN1
XN2
XN3
XN4
..
XNi
XNn
X
i =1
fi
X j1
J =1
X j2
j =1
X j3
j =1
X j4
j =1
..
X ji
j =1
X jn
j =1
Ni
J =1 i =1
X ji
56
Guthke; Bottcher; Sprung (hrsg.), Psychodiagnostik", Band I, Deutscher Verlag der Wissenschaften, Berlin 1991, p.230.
45
AUREL STAN
Nr.crt.
1
2
3
4
5
6
7
8
9
10
11
fi
pi
qi
si2
2
0,18
0,82
0,15
Subiect
A.B.
T.R.
M.V.
Z.D.
A.T.
N.F.
U.J.
L.E.
U.I.
D.R.
T.A.
7
0,64
0,36
0,23
ITEMI
1
2
3
4
5
6
7
8
9
1
1
0
1
1
1
1
1
0
0
1
0
1
0
1
0
1
0
0
0
1
1
1
1
0
0
1
0
1
0
0
0
1
1
1
0
0
0
1
1
0
1
1
1
1
0
1
1
1
1
1
1
1
0
0
0
1
1
1
1
0
0
0
0
1
0
0
0
1
0
0
0
0
1
0
1
0
0
1
0
0
0
0
0
1
0
1
0
1
0
1
1
1
0
0
0
1
0
1
Prelucrare elemenetar a datelor cu stabilirea unor indicatori
5
8
4
9
6
6
3
7
0,45
0,73
0,36
0,82
0,55
0,55
0,27
0,64
0,55
0,27
0,64
0,18
0,45
0,45
0,73
0,36
0,25
0,20
0,23
0,15
0,25
0,25
0,20
0,23
10
1
0
1
1
0
1
0
1
0
1
1
Total
8
4
6
5
6
8
4
3
3
4
6
3 , simbolul care reprezint indicatorul de asimetrie pentru un item. Celelalte simboluri din formul au
fost prezentate anterior.
Dac un item are p = 0,6 i q = 0,4 se obine urmtorul rezultat pentru coeficientul de
asimetrie:
0,4 - 0,6 0,2
3 =
=
= 0,29
0,69
4*6
Formula de calcul pentru asimetrie este specific itemilor cu exprimare valoric binar( 0 i 1).
Itemul analizat de noi are o asimetrie pozitiv, fiind cunoscut faptul c valoarea normal pentru
asimetrie este 0.
Asimetria este, deci, funcie a cotei parte a subiecilor care au rezolvat corect itemul sau care
au dat un rspuns punctat prin 1 n cazul unor chestionare de personalitate.
De asemenea, calculul excesului unui item cu exprimare numeric binar este o form
46
4 , termenul necunoscut al acestei formule, reprezint indicele de exces sau indicele de kurtosis al
unui item cu exprimare binar a rezultatului. Aplicnd datele din exemplul anterior obinem:
1
1
4 =
6 =
6 =
0.6 * 0,4
0,24
4,16 6=-1,86
innd cont de faptul c valoarea normal a indicatorului de exces este 3,00, putem aprecia
c acest item are o distribuie platicurtic.
Prin indicele de dificultate se precizeaz ntr-o matrice a punctajelor itemilor vectorul mediei,
deoarece este foarte clar c pi se confund cu media distribuiei valorilor itemilor. Aceast identitate a
modului de calcul nu mai este valabil la matricile n care valorile itemilor nu mai sunt binare. Notaii
diferite pentru itemi survin la inventarelor de interese, n care intensitatea rspunsului este mai fin
difereniat, n marea majoritate a cazurilor nedepind valoarea 7, deci itemii primesc valori ntre 0 i 7,
subiecii putnd obine oricare dintre valorile 0 i 7. Notri diferite de forma binar se ntlnesc i la
probele de randament intelectual, i anume la WISC, prob la care unele scale de performan
puncteaz i reuita parial.
n cazul chestionarelor de interese sau de atitudini, cu ct cifra rspunsului la item este mai
mare, cu att subiectul consider c un anumit interes sau o anumit atitudine, de exemplu, este mai
intens O astfel de matrice se prezint astfel (date fictive):
Nr.crt
1.
2
3
4
5
6
7
8
9
10
11
Subiect
D.B.
L.T/
P.R.
M.D.
F.T.
O.P.
E.T.
D.P.
S.H.
Z.O.
C.I.
1
1
2
6
3
4
5
2
7
3
1
1
2
2
3
4
2
3
5
2
6
4
3
4
3
2
1
1
4
3
1
1
1
1
2
1
4
2
7
5
6
3
4
2
3
5
4
2
ITEMI
5
7
7
5
7
6
7
6
7
6
5
7
6
5
4
4
5
4
3
5
4
4
3
4
7
3
4
2
4
3
4
6
4
3
4
3
8
1
7
7
2
7
4
6
5
4
3
3
9
5
4
3
6
7
5
6
4
6
5
6
10
1
2
1
1
1
1
2
1
1
2
1
Total
29
41
38
40
41
39
38
42
37
32
32
AUREL STAN
fi
, n care pi este indicele de dificultate, fi este suma valorilor
f i max
obinute la un item de ctre ansamblul subiecilor (n cazul nostru 11 subieci), fi max este valoarea
maxim pe care ar fi putut-o obine ansamblul subiecilor, dac fiecare ar fi obinut nota maxim. n
exemplul nostru fi max este egal cu 77, valoare care rezult din nmulirea cifrei 7 (valoarea maxim pe
care o poate obine un subiect la un item) cu valoarea 11, care reprezint numrul total de subieci.
Valoarea pi = 0,45, indicele de dificultate al primului item se obine prin mprirea valorii 35 (fi) la 77 (fi
35
max). Astfel, pi =
= 0,45 . Media itemului, notat de noi cu X i se obine prin mprirea valorii fi
77
(suma valorilor unui item) la N (numrul total de subieci care au efectuat itemul. Astfel, pentru calculul
f
35
= 3,18
mediei primului item avem: X i = i =
N 11
n unele cazuri se calculeaz dificultatea medie itemilor unui test, notat mp. n cazul
k
4,80
= 0,48 , n care pi este indicele de dificultate a itemilor i k
10
k
numrul total de itemi, n cazul nostru k = 10. Aceast valoare este preferabil mediei testului pentru a
exprima tendina central din cadrul ansamblului itemilor, deoarece aceasta este influenat prin
sistemul de notare a rspunsurilor.
Valoarea indicelui de dificultate poate fi influenat de doi factori, i anumite de probabilitate
de reuit prin ntmplare i de numrul de itemi care sunt omii. Dei o serie de autori consider i
itemii omii n calculul dificultii itemului57, noi considerm c analiza de itemi nu poate fi efectuat
dect atunci cnd itemii sunt rezolvai n ntregime sau cnd subiecii omit foarte puine rspunsuri. n
cazul n care dispozitivul de rspuns este cu alegere multipl, pot interveni rezolvri prin hazard,
subiectul alegnd la ntmplare un anumit rspuns care poate fi cel corect.
n cazul rspunsurilor de tip da/nu cota de hazard poate s ating 50%, n cazul cnd trei
posibiliti de alegere, i doar una este corect, cota de hazard poate s ating 33%, iar cnd subiectul
are ase posibiliti de alegere, dintre care doar una este corect, cota de hazard poate s ating 16%.
Se consider util, n unele cazuri, calcularea unei corecii pentru a preveni deformarea
rezultatelor.
Redm n continuare un exemplu cu rezultate fictive pentru a exemplifica coreciile pentru
cazul alegerii dintre mai multe variante de rspuns:
exemplificat de noi mp =
57
1=1
48
Subieci
1
2
3
4
5
6
7
8
9
10
Pi
Pi
diferena
1 pi 58
p'i=pi-
M 1
n aceast formul p'i reprezint indicele de
dificultate corectat; pi reprezint indicele de dificultate de
plecare; M reprezint numrul de alegeri la acel item.
Aceast corecie poate fi realizat doar n unele cazuri i
nu ntr-un mod sistematic, deoarece este puin plauzibil
situaia ca subiecii s efectueze la hazard itemii. Corecia operat nu schimb ordinea de clasare
subiecilor.
Vom face o serie de consideraii asupra varianei, noiune deosebit de important n analizele
statistice descriptive i infereniale. Pentru calculul varianei itemilor se utilizeaz, n exemplul care
urmeaz, formula de calcul anunat anterior59. i n cazul analizei de itemi variana este un indicator al
dimensiunii capacitii de discriminare, care de fapt este menirea general a acestui indicator statistic.
Dac un ir de valori ale unei variabile (rezultatele la un test sau la un item) prezint o valoare
constant pentru toate valorile, atunci valoarea varianei este egal cu 0 i , n consecin, nu avem
nimic de studiat la irul respectiv. n cercetrile psihologice i n cele care privesc testul psihologic
variana joac un rol deosebit, deoarece n quasitotalitatea cazurilor ne intereseaz de a opera
discriminri ntre subieci prin intermediul rezultatele acestora. Este, de aceea, interesant de a studia
raporturile dintre varianele itemilor i variana rezultatelor testului n ntregime. Vom apela la un
exemplu fictiv simplu, care prezint un numr redus de itemi i un numr redus de subieci.
Subieci
1
2
3
4
5
6
7
8
9
Media
Variana
Tabelul 7.
Item 1
Item 2
Item 3
Item 4 Scor X Item 5
Item 6
X+5
X+6
1
1
1
1
4
1
1
5
5
0
0
0
0
0
1
0
1
0
0
0
0
0
0
1
0
1
0
1
1
1
1
4
1
1
5
5
0
0
0
0
0
1
0
1
0
0
0
0
0
0
1
0
1
0
1
1
1
1
4
1
1
5
5
1
1
1
1
4
1
1
5
5
0
0
0
0
0
1
0
1
0
0,44
0,44
0,44
0,44
1,77
1
0,44
2,77
2,22
0,278
0,278
0,278
0,278
4,44
0,00
0,278
4,44
6,94
Cuprinde date ilustrative pentru evidenierea raporturilor dintre variana itemilor i variana
rezultatului global al testului.
n tabelul cu rezultate prezentat observm c itemii 1,2,3,4 sunt rezolvai de 4 subieci din
nou, aceeai de fiecare dat (subiecii 1,4,7,8 i rezolv i subiecii 2,3,5,6, i 9 nu i rezolv). Aceti
58
59
49
AUREL STAN
itemi au aceeai medie i aceeai varian. Pot fi considerai omogeni, cel puin din punct de vedere
formal. Scorul X constituie scorul compozit al itemilor 1- 4. Liniile terminale inferioare ale tabelului conin
calculele mediilor i varianele scorurilor itemilor i a celui composit. Itemul 5 este reuit de toi subiecii.
Scorul compozit (X+5) are, firesc, o medie mai mare cu 1 fa de scorurile compozite X, dar o abatere
standard identic cu acestea (4,44). Itemul 6 are aceeai medie i aceeai varian ca fiecare din itemii
1-4. Scorul compozite X+6 este rezultat din adiia scorurilor compozite X i a scorurilor itemului 6. n
mod firesc media scorurilor compozite (X+6) este mai mare cu media scorurilor compozite X cu 0,44,
dar variana este aproape egal cu valoarea 2,50. Observm clar c variana scorului X este mult
superioar sumei varianelor scorurilor de la itemii 1 la 4 (0,278+0,278+0,278+0,278<4,44), De
asemenea observm c variana scorurilor (X+6) este mult mai mare dect suma varianei
scorurilor(4,44+0,278 < 6,94). Se observ clar faptul c adugarea unui item omogen mrete
capacitatea de discriminare a testului.
Pentru a evidenia efectul schimbrii structurii rspunsurilor subiecilor la itemi, oferim, n
continuare, un nou exemplu.
Subieci Item 1 Item 2 Item 3 Item 4 Scor X Item 5 Item 6 X+5
X+6
1
1
0
1
0
2
1
0
3
2
2
0
1
1
0
2
1
0
3
2
3
0
0
1
0
1
1
0
2
1
4
1
0
0
0
1
1
0
2
1
5
0
1
0
1
2
1
1
3
3
6
1
0
1
0
2
1
0
3
2
7
0
1
0
1
1
1
1
2
2
8
1
0
0
1
2
1
1
3
3
9
0
1
0
1
2
1
1
3
3
Media
0,44
0,44
0,44
0,44
1,766 1,000 0,444 2,666 2,111
Variana 0,278 0.278 0,278 0,278 0,250 0,000 0,278 0,250 0,611
Tabelul 8. Cuprinde date ilustrative pentru evidenierea raporturilor dintre variana itemilor i variana
rezultatului global al testului
Observm la acest tabel o situaie complet schimbat n privina varianei testului, n ciuda
faptului c itemii componeni au aceeai medie i aceeai varian. Explicaia acestei stri de fapt o
gsim n examenul atent al relaiei care exist ntre itemii constituind testele. Astfel, variana scorurilor
compozite X este mult mai mic dect fiecare din varianele itemilor testului (0,250<0,278). n tabelul
anterior itemii sunt euai sau reuii simultan. n ultimul tabel informaia furnizat prin itemi este mai
contradictorie, deoarece avem un ansamblu: format din itemi cu structuri (cu pattern-uri) eterogene. La
un item reuit nu avem o situaie similar la alt item, considernd n ansamblu situaia. La o bun parte
din cazuri, cnd un item este reuit, cellalt este euat i invers. La primul test itemii constituie structuri
omogene, iar la al doilea test ei constituie structuri eterogene. Pentru a explica oscilaiile de valoare ale
varianei totale fa de varianele itemilor vom constitui matricea varian covarian pentru itemi
binari. Dac variana este un indicator care se refer la o singur serie de valori, covariana este un
indicator care se obine prin prelucrarea a dou serii de valori i exprim cantitatea comun de variaie
a acestora. n cazul cnd avem la dispoziie valorile acelorai subieci la itemii i i j, atunci formula
covarianei este:
50
Covij = pij pi * pj
n care pi este indicele de dificultate a itemului i, pj este indicele de dificultate a itemului j i pij este
proporia subiecilor care au rezolvat concomitent itemul i i j.
Nr. crt.
1
2
3
4
5
6
7
8
9
10
11
Item i
Item j
Coinciden de rezolvare concomitent
1
0
1
1
+
0
1
1
1
+
0
0
1
1
+
1
0
1
1
+
0
0
0
1
1
1
+
fi = 7
fj = 7
fij = 5
pi = 0,63
pj = 0,63
pij= 0,45
Tabelul 9. Cuprinde ilustrarea etapelor de calcul pentru efectuarea calculului covarianei.
Pentru a uura observarea ansamblul combinaiilor de concomitene i neconcomitene ale
rezolvrilor corecte se ntocmete n analiza de itemi un aa-numit tabel al celor 4 cmpuri. Pentru cele
dou serii de date de mai sus, tabelul celor 4 cmpuri se prezint n felul urmtor.
Item
Rspuns corect
i
Rspuns incorect
Total
Tabelul 10. Tabelul celor 4 cmpuri.
Itemul j
Rspuns corect Rspuns incorect
a
5
b
2
d
2
c
2
7
4
Total
7
4
11
AUREL STAN
Pentru un chestionar n care rspunsurile sunt da i nu (care pot fi traduse numeric n 1 i 0),
douard Friemel i Annick Weil-Barais sugereaz posibilitatea existenei unei structuri de date
particulare n cadrul unui tabel, care fac posibile urmtoarele tipuri de relaii ntre rspunsurile la doi
itemi60:
Relaii de independen, n care toate celulele tabelului sunt completate cu o cifr care confirm
existena unui anumit pattern de rspuns. Itemii sunt considerai independeni, n sensul c
msoar caracteristici diferite;
Itemul i
Da
Nu
Itemul j
Da
Nu
X
X
X
X
n acest tabel gsim prezente pattern-urile: Da-Da, Da-Nu, Nu-Da i Nu-Nu, deci toate tipurile
posibile.
Relaii de echivalen, n situaia n care toi subiecii care rspuns Da la j rspund, de asemenea,
Da la i i toi subiecii care rspund Nu la j, rspund Nu i la i.
Itemul i
Da
Nu
Itemul j
Da
Nu
X
0
0
X
Itemul i
Da
Nu
Itemul j
Da
Nu
0
X
X
0
Relaii de ordine sau de implicare, n situaia n care subiecii care rspund Da la i rspund Da i la
j, dar nu i invers, toate celelalte cazuri fiind posibile.
Itemul i
Da
Nu
Itemul j
Da
Nu
X
0
X
X
n acest caz se prezum o relaie de implicare ntre ceea ce msoar itemii (i implic j, dar nu i
invers), deci o relaie de ordine ntre itemi. O variant a unei astfel de relaii este urmtoarea:
Itemul i
Da
Nu
Itemul j
Da
Nu
X
X
0
X
52
despre omogenitatea sau eterogenitatea structurii itemilor care compun un test. Variana unui test este
egal cu suma varianei fiecrui item la care se adaug dublul sumei valorilor fiecrei covariane
posibile n ansamblul itemilor componeni. Schema teoretic a matricei varian-covarian este
urmtoarea (presupunem un ansamblu de 6 itemi):
ITEMI
S2T =
I
T
E
M
I
1
S21
C21
C31
C41
C51
C61
1
2
3
4
5
6
2
C12
S22
C32
C42
C52
C62
3
C13
C23
S23
C43
C53
C63
4
C14
C24
C34
S24
C54
C64
5
C15
C25
C35
C45
S25
C65
6
C16
C26
C36
C46
C56
S26
Tabelul 11. Cuprinde exemplificarea modului de formare a varianei rezultatului global al unui test.
Pentru cele dou tabele exemplificative pentru utilizarea itemilor omogeni i eterogeni rezult,
dup efectuarea calculelor, urmtoarea situaie:
1
I
2
T
3
E
4
M
I 5
6
1
0,28
0,28
0,28
0,28
0.00
0,28
2
0,28
0,28
0,28
0,28
0.00
0,28
ITEMI
3
4
0,28 0.28
0,28 0.28
0,28 0.28
0,28 0.28
0.00 0.00
0,28 0.28
5
0.00
0.00
0.00
0.00
0.00
0.00
6
0,28
0.28
0.28
0.28
0.00
0,28
1
I
2
T
3
E
4
M
5
I
6
1
0,25
-0,19
0,03
-0,08
0,00
-0,08
2
-0,19
0,25
-0,08
0,14
0,00
0,14
ITEMI
3
4
0,03
-0,08
-0.08
0,14
0,25
-0,19
-0,19
0,25
0,00
0,00
-0,19
0,25
5
0,00
0,00
0,00
0,00
0,00
0,00
6
-0,08
0,14
-0,19
0,25
0,00
0,25
Tabelul 12. Cuprinde dou exemplificri pentru varianele i covarianele itemilor omogeni(stnga) i
eterogeni(dreapta)
Observm clar n tabelul din dreapta o serie de valori negative care trag n jos valoarea de
ansamblu a varianei, Valorile negativ exprim o lips de consonan a tendinelor de variaie. Cu ct
asemenea valori negative se gsesc mai frecvent, cu att variana global a testului va fi mai sczut.
Inspectarea matricei varian-covarian ne permite s observm rapid acele zone de itemi care
ngusteaz mprtierea valorilor unui test i, implicit, capacitatea sa de discriminare.
Tabelul din stnga ofer valori mari ale varianei, fapt cele mai mari, cu excepia itemului
deosebit de facil, care prezint un rezultat uniform (doar valori 1). Vom face n continuare cteva
consideraii asupra valorilor maximale pe care le pot lua anumii indicatori n cadrul operaiilor efectuate
asupra itemilor.
Indicatori maximali ai itemului
Variana cea mai nalt posibil a unui item se obine atunci cnd media aritmetic (care se
confund la itemii care se exprim binar cu indicele de dificultate a itemului) a punctajului itemului este
0,5. Deci valoarea maximal pe care o poate lua variana este 0,25, situaie n care jumtate din
subieci au obinut nota 1 i jumtate nota 0. Valoarea lui p variaz n funcie de calitatea subiecilor
existent ntr-un anumit eantion. Expunem 7 cazuri posibile de evoluie a valorilor varianei n funcie de
valorile p i q.
Situaia
Valoare pi
Valoare qi
Variana pi*qi
a
0,00
1,00
0,00
b
0,20
0,80
0,16
c
0,40
0,60
0,24
d
0,50
0,50
0,25
e
0,60
0,40
0,24
f
0,80
0,20
0,16
g
1,00
0,00
0,00
Tabelul 13. Cuprinde exemplificarea diferenierii valorilor varianei n funcie de diferite valori ale
coeficientului de dificultate.
53
AUREL STAN
Se observ clar c punctul maxim al varianei se produce atunci cnd pi atinge 0,5, dup care
variana ncepe s scad. Exprimm grafic aceast situaie
0,3
0,25
0,2
0,15
0,1
0,05
0
a
61Formulele
54
Matricile de corelaii sunt necesare n cazul unor analize care urmresc stabilirea gradului de
satisfacere a unor criterii de apreciere pentru anumii itemi sau pentru ansamblul lor.
Exemplificm calculul unei corelaii pe datele folosite pentru exemplificarea calcului
covarianei:
Nr. crt.
1
2
3
4
5
6
7
8
9
10
11
Item i
1
1
0
1
0
1
1
1
0
0
1
fi = 7
pi = 0,63
Item j
0
1
1
1
0
1
0
1
0
1
1
fj = 7
pj = 0,63
Tabelul 14. Cuprinde date ilustrative pentru calculul corelaiei dintre valorile a doi itemi
0,45 0,63 * 0,63
0,45 0,40
0,05
Astfel, =
=
=
= 0,21
0,23 * 0,23 0,23
0,63 0,63 2 * 0,63 0,63 2
Datele organizate ntr-o matrice a lui Stern se pot transforma prin prelucrrile matematice
corespunztoare ntr-o matrice de corelaii. Exemplificm prin urmtoarea matrice cu date binare, 6
itemi i 11 subieci62.
Ca i n cazul seriilor de date continue sau discret polihotomice, coeficientul de corelaie a
unei serii de date binare poate lua valori pozitive, nule i negative, avnd aceeai semnificaie. n
exemplul dat nu au rezultat indici negativi de corelaie datorit particularitii de structurare a datelor.
Coeficientul de corelaie joac un mare rol n psihometrie. Coeficientul de corelaie prin
momentul produselor a lui Karl Pearson poate s ia cea mai mate valoare 1,00 i cea mai mic
valoare 1,00. Aceste granie sunt atinse n cazuri speciale. La punctajele testelor care se compun din
valori de msur binare, coeficientul de corelaie prin momentul produselor este n general mai mare
dect 1,00 i mai mic dect 1,00. Coeficienii sunt funcii ale valorilor maxime care pot s le
primeasc varianele i covarianele itemilor.
Subieci
1
2
3
4
5
6
7
8
9
10
11
1
1
0
0
1
1
1
0
1
0
1
0
2
1
1
0
1
1
0
1
1
0
1
1
ITEMI
3
4
1
1
0
0
0
1
0
0
0
1
1
1
1
1
1
1
0
1
1
0
0
1
5
0
0
1
1
1
0
0
0
0
1
0
6
0
1
0
1
0
1
0
1
1
0
0
1
I 2
T 3
E 4
M 5
I 6
1
1,00
0,44
0,15
0,66
0,35
0,77
2
0,44
1,00
0,66
0,26
0,91
0,44
3
0,15
0,66
1,00
0,66
0,35
0,77
ITEMI
4
0,66
0,26
0,66
1,00
0,24
0,44
5
0,35
0,91
0,35
0,24
1,00
0,35
6
0,77
0,44
0,77
0,44
0,35
1,00
55
AUREL STAN
Toate procedeele de corelare prezentate pn n prezent sunt variante ale r-ului lui Karl
Pearson. n 1968 F.M. Lord i M.R, Nowick au demonstrat c un coeficient biserial obinut este cu 20%
superior coeficientului de corelaie punct biserial. Urmtoarea ecuaie permite de a transforma o
corelaie punct biserial n corelaie biserial:
pq
* rpbis
Y
n cazul valorilor extreme ale lui p sau q, David Magnusson a demonstrat c o corelaie
biserial poate fi pn la 4 ori superioar corelaiei punct biseriale, din cauza faptului c variana
itemului poate afecta n mare msur valoarea maxim pe care o poate lua corelaia punct biserial,
care este echivalentul algebric al r-ului lui Pearson. Din acest motiv este important, atunci cnd folosim
un program de calcul computerizat, conceput pentru a calcula indicele de discriminare, s tim ce tip de
corelaie este folosit pentru a calcula corelaia dintre rezultatul itemului i rezultatul total al testului.
Pentru aprecierea calitilor itemilor se efectueaz corelaii ntre acetia i rezultatul global al
testului sau, n cadrul operaiunii de validare, ntre itemi i rezultatelor unor criterii. Formulele pentru
efectuarea corelaiilor se disting n funcie de faptul dac seria binare este dihotomic sau dihotomizat.
Seria binar este considerat dihotomic n situaia n care mprirea n 0 i 1 este natural, de
exemplu rspuns corect-rspuns incorect, i dihotomizat cnd ea traduce o situaie n care valorile
sunt acordate prin convenie, situaie ntlnit prin traducerea binar a unor date biografice (exemplu
cstorit necstorit, provenien din mediul urban provenien din mediul rural). n primul caz
vorbim de o corelaie punct biserial i n al doilea caz de o corelaie biserial. Redm n continuare
dou formule de calcul pentru corelaia punct biserial. Indicele de corelaie punct-biseriale se noteaz
rpbis
rbis =
rpbis =
X p Xq
sT
* p * q i rpbis =
X p XT
sT
p
, n care
q
X p este media acelor valori ale rezultatului total al testului care au corespondent n seria
p i q sunt cunoscui din consideraiile anterioare, p fiind indicele de dificultate al seriei de date
binare, iar q = 1- p
X p XT
p
Coeficientul de corelaie biserial are urmtoarea formul: rbis =
*
, formul n
ST
care singura necunoscut este litera greceasc , care reprezint nlimea curbei normale n punctul y
corespunznd unei densiti de probabilitate egal cu p.
Oferim, n continuare, un exemplu:
56
p
q
P*q
Item
1
0
1
1
0
0
1
0
1
0
1
6
0,54
0,46
0,248
.
.
X T = 34,36
ST = 6,24
2
S T =38,93; ST =
Xp
37
33
42
32
39
45
228
Xq
29
27
37
25
32
150
X p = 38
X q = 30
6,24
Tabelul 16. Cuprinde date ilustrative pentru realizarea corelaiei dintre rezultatul unui item binar i
rezultatul global al unui test
n ultimele linii ale tabelului sunt trecute datele necesare calculrii formulelor corelaiilor.
Valoarea pentru un p = 0,54 este egal cu 0,3958.
Aplicnd prima formul pentru coeficientul de corelaie punct biserial, obinem:
38 30
8
rpbis =
* 0,54 * 0,46 =
* 0,2484 = 1,26 * 0,5 = 0,63
6,24
6,24
Aplicnd a doua formul pentru calcularea coeficientului de corelaie punct biserial, obinem
rpbis =
38 34,36
0,54 3,64
*
=
* 1,17 = 0,58 * 1,08 = 0,627 . Observm c prin cele dou
6,24
0,46 6,24
formule se obin practic rezultate identice (jocul aproximrilor face s existe o diferen de 0,003 ntre
cele dou rezultate).
Aplicnd la aceleai date formula pentru variabile dihotomizate obinem:
rbis =
38 34,36
0,54
3,64
*
=
* 1,36 = 0,58 * 1,16 = 0,672 . Observm la aplicarea acestei
6,24
0,3958 6,24
AUREL STAN
indicele de dificultate a unui item pentru grupa de subieci considerat puternic dup rezultatele
globale ale testului (notare p+) i indicele de dificultate pentru grupa considerat slab(notare p-).
Indicele D poate lua orice valoare ntre 1 i + 1. Valoarea 0 semnific faptul c un item poate fi rezolvat
la fel de bine de ctre un subiect care are un scor total ridicat i de ctre un subiect care are un scor
total sczut. O valoare negativ semnific faptul c un item a fost reuit de o proporie mai mare de
subieci care au un scor total slab la ansamblul testului Astfel de valori ridic semne de ntrebare
asupra oportunitii utilizrii unui anumit item. ntr-un studiu din anul 1939 asupra seleciei grupurilor
slabe i puternice n operaiunea de elecie a itemilor, T.L. Kelley consider c grupul puternic este
format din acei subieci care au obinut un scor total care-i plaseaz valoric n primii 27% din subieci, iar
grupul slab din subiecii care a obinut cele mai slabe 27% din ansamblul rezultatelor globale de la
test.63 S presupunem c la examinarea a 30 de subieci rezultatele care aparin grupului puternic
cuprind 8 subieci (uoar aproximare a procentului primilor 27% din subieci) i cele care aparin
grupului slab, de asemenea, 8 subieci. Oferim un exemplu fictiv, cu rezultatele totale ale testului i
rezultatul unui anumit item pentru primii i ultimii 8 subieci.
1+1+1+1+1+ 0 +1+ 0 6
0 +1+ 0 +1+ 0 + 0 + 0 + 0
p+ =
= = 0,75 p =
= 0,25
8
8
8
Nr.crt.
1
2
3
4
5
6
7
8
23
24
25
26
27
28
29
30
Rezultat test
65
59
57
55
53
50
49
47
24
23
21
20
19
17
16
14
Rezultat item
1
1
1
1
1
0
1
0
..
0
1
0
1
0
0
0
0
proporia de 27% este stabilit ntr-un articol a lui T.L. Kelley din 1939, publicat n "Journal Of Educational Psychology"
intitulat "Selection of upper and lower groups for the validation of test items".
63
58
O serie de hibrizi ntre profesionism i amatorism a aprut i n ara noastr, dintre care amintim:Horst H, Siewert Cum s
ne calculm coeficientul de inteligen, Gemma Press, Bucureti, 1998; dr. Gerti Senger, dr. Walter Hofmann Cum s ne
calculm coeficientul de personalitate, Gemma Press, Bucureti, 1998; Philip Carter & Ken Russel Teste de inteligen,
Aldo Press, Bucureti, 1998; Hans Jurgen Eysenck Teste de inteligen, Editura Queen, Bucureti, 1998.
64
59
AUREL STAN
Un procedeu mai practic de a lansa un nou test psihologic este acela de a modifica
semnificativ sau a recombina creaiile deja existente. David Wechsler l-a practicat cu deosebit succes,
dar a avut acceptul autorilor testelor (teste ale cror componente au fost combinate ntr-un mod foarte
inteligent). n acest caz, este important proporia modificrii, deoarece, n majoritatea rilor din
civilizaiile de tip occidental, protejarea dreptului de autor opereaz cu deosebit severitate.
Construcia unui test psihologic cunoate o serie de etape care difer neesenial de la autor la
autor.
Dany Laveault i Jacques Gregoire disting 5 etape:
1. Determinarea utilizrilor prevzute de test.
2. Definiia a ceea ce se dorete a msura.
3. Crearea itemilor.
4. Evaluarea itemilor.
5. Determinarea proprietilor metrice ale testului definit. 65
Robert Gregory stabilete urmtoarele etape:
definirea testului;
stabilirea unei metode de scalare;
construcia itemilor;
testarea itemilor;
revizia testului;
publicarea testului66.
A.F. Vukovici consider c, n cazul construciei testului, trebuiesc realizate o serie de prescripii de
procedur referitoare la:
populaia examinailor;
materialul testului care trebuie s stimuleze examinatul spre un comportament specific;
stabilirea indicaiilor testului prin care este expus problema cercetat sau este invitat
subiectul la o anumit interaciune cu materialul testului;
stabilirea diverselor condiii prin care sunt oferite instrucia i materialul testului;
delimitarea comportamentelor ca re sunt considerate relevant diagnostice;
stabilirea unor reguli de ordonare i scheme de clasificare n care diferitele moduri de
comportament semnificative sunt mprite n categorii;
calcularea frecvenelor claselor de valori brute;
sistemul de norme i referine care servete interpretrii i comparrii valorilor brute67.
65 vezi Laveault, Dany-Gregoire, Jacques, Introductions aux theories des tests en sciences humaine, De Boeck&Larcier,
Departament de Boech Universite, Paris, Bruxelles, 1997, pag 79-85.
66 vezi Gregory, Robert J., Psychological Testing, Allyn and Bacon, Boston, London, Toronto, Sydney, Tokyo, Singapore,
1996, pag. 129.
67 vezi Vukovich A. F., Die Konstruktion psychologischer Testen, n Psychologischee Diagnostik (hrsg R. Heiss), Verlag
fur Psychologie Dr. C Hogrefe, Gottingen, 1964.
60
Bernier, J.J.; Pietrulewicz, B., La psychometrie Gaetan Morin Editeur, Montreal, Paris, Casablanca, 1997, pag.235.
vezi MMPI Saarbrucken (bearbeitet von dr. phil o Spreen) , Verlag Hans Huber, Bern und Stuttgart, 1963.
70 vezi Dickes, Paul, Tournois, Jocelyne , Flieller, Andre, Kop, Jean-Luc, La psychometrie. Thorie et methode de la
mesure, PUF, 1994, pag. 89.
68
69
61
AUREL STAN
Dintre aspectele care condiioneaz construcia unui bun test ne vom opri la concepia care
st baza construciei testului, condiiile unui bun item i la eantioanele pe care se verific testul.
62
de cercetare poziiei teoretice. Francoise Parot i Marc Richelle se exprim foarte plastic n aceast
privin: Cnd omul de tiin i proclam supunerea n faa faptelor, el nu poate ignora c le privete,
le nelege, le caut prin formulri teoretice ca printr-o lentil uor colorat care, chiar prin proprietile
sale decupeaz i coloreaz realitatea ntr-un anumit mod74. Despre implicaiile categorizrii s-au scris
lucrri care constituie subiect de interes pentru specialitii n metateorii.
O teorie poate fi meninut artificial prin operarea cu anumite trucuri metodologice, dintre care
amintim selectarea doar a faptelor care o confirm, ntreruperea cercetrii n momentul n care
rezultatele sunt favorabile teoriei, etc.
Investigarea prin intermediul testului psihologic nu permite examinarea unor concepte pure,
ci doar a unor modele ale acestora.
O excelent prezentare a modelelor psihologice de descriere a activitii aparine unui grup de
autori francezi, format din Claude Bonnet, Christiane Kekenbosch, Anh Nguyen Xuan, J.F. Richard i
Charles Tijus75. Conform concepiei lor modelele n discuie au cinci caracteristici majore:
Un model este o particularizare a unei teorii de funcionare cognitiv. El se ataeaz unei teorii,
dar se aplic la un tip de situaie particular i face ipoteze suplimentare n raport cu teoria a crui
prelungire este.
Un model este o formalizare i, ca atare, se exprim ntr-un limbaj formalizat. Acest gen de limbaj
este fr ambiguitate i permite calcule, adic deducii automate. O bun perioad de timp limbajul
logic i matematic erau singurele care permiteau calcule. ns informatica a permis dezvoltarea
altor limbaje formalizate care fac posibile, pe lng calcule numerice, i calcule simbolice, adic
deducii care se poart asupra cunotinelor i a semnificaiilor.
Un model este schematic, adic este o simplificare a realitii care nu reine dect aspectele
eseniale (acestea sunt aspectele care, n principiu, sunt suficiente pentru a prezice un
comportament). Caracterul schematic este i o caracteristic a teoriilor, deci att modelele ct i
teoriile revendic ideea dup care aceste simplificri conserv trsturile eseniale ale realitii prin
raport la tipul de comportament pe care l explic.
Un model furnizeaz predicii validabile prin date experimentale, deci el trebuie s reziste la o
serie de provocri ale realitii. Un model psihologic conine o descriere a situaiei la care el se
aplic (care nu reine dect un anumit numr de elemente pertinente). Modelele conin o descriere
a mecanismelor de tratament informaional pentru acele tipuri de situaii prin care se poate deduce
prin proceduri de calcul automatic (datorit faptului c descrierea este realizat printr-un limbaj
formalizat) comportamentul pe care-l va avea un subiect care se comport precum modelul. Un
astfel de procedeu de tratament informaional se numete simularea comportamentului.
Investigarea prin intermediul unui model se realizeaz n proporii variabile. n multe cazuri,
att modelele ct i teoriile sunt implicite i autorul testului nu insist prea mult asupra prii de
fundamentare teoretic a instrumentului su. Tipul de solicitare pe care l presupune sarcina psihologic
trebuie s fie exprimat n forme concrete, care s realizeze exigena teoretic.
Practic, orice test aflat n construcie trebuie s verifice o ipotez. Pentru a pune o ipotez la
vezi Parot, Francoise, Richelle, Marc, Introducere n psihologie. Istorie i metod, Humanitas, 1995, pag. 195.
Studiul se intituleaz Mesure et modelisation i este o component a volumului Cours de Psychologie (sous la direction
de R. Ghiglione et J. F. Richard, Dunod, Paris, 1995, pag. 268-384.
74
75
63
AUREL STAN
proba faptelor este necesar s traducem noiunile prin operaii de msur sau observaii care le vor da
un coninut empiric. Dac o experien face s intervin viteza de tratament a informaiei de ctre
subieci, trebuie aleas o operaie permind a obine o msur a acestei viteze. ns, exist mai multe
operaii, deja utilizate de diferii cercettori, pentru a efectua o msur. Aceste procedee diferite
furnizeaz msuri n corelaii relativ slabe. Mijlocul de a defini care este cel mai bun, nu este evident.
Pentru a avea certitudine trebuiesc sa fie toate comparate cu o msur adevrat a vitezei de
tratament a informaiilor (n cazul cnd tim o msur adevrat nu trebuie s ne punem problema
care este cel mai bun procedeu). n fapt, alegerea unei operaii se face n fiecare cercetare sub efectul
ipotezelor, care sunt rar explicite. Se poate ajunge n situaia n care alegerea procedeelor diferite
pentru a operaionaliza aceeai noiune s suscite diferene n rezultatele obinute prin cercettori
diferii.
Maurice Reauchlin ofer exemple foarte interesante pentru operaia realizrii diferite a unei
aceleai noiuni76. Realizrile aparin mai multor cercettori care au studiat sarcinile n care viteza cu
care subiectul trateaz informaia care i este furnizat intervine n rezultat. Procedeele poart numele
autorilor lor.
Paradigma lui T. Nethlebeck (timpul de inspecie): Dou linii verticale de lungimi puin diferite
sunt prezentate subiectului ntr-un timp foarte scurt. El trebuie s semnaleze dac cea mai scurt
se situeaz n dreapta sau n stnga. Se determin durata prezentrii care este necesar
subiectului pentru ca el s furnizeze un procentaj de rspunsuri exacte (de exemplu, 95%).
Paradigma lui W. Hick (a timpului de decizie): Subiectul trebuie s sting lumina chiar din
momentul n care ea se aprinde, apsnd un buton. Becul care se aprinde poate fi singura surs
de lumin care i este prezentat sau aceasta trebuie aleas la ntmplare de ctre experimentator
(sau printr-un program care piloteaz experiena) ntr-o serie de 2, 4 sau 8 surse susceptibile de a
se aprinde. Incertitudinea subiectului se mrete odat cu creterea numrului de surse
luminoase. Timpul de reacie crete liniar n funcie de aceast msur de incertitudine. Panta
dreptei care reprezint aceast cretere este un parametru reinut.
Paradigma lui S. Sternberg (viteza de explorare a memoriei de scurt termen): Subiectul observ
n timpul mai multor secunde o serie de cifre de la 2 la 7. Apoi seria dispare i o cifr este
prezentat. Subiectul trebuie s semnalizeze cel mai rapid posibil, apsnd pe unul din cele dou
butoane aflate la dispoziia sa, dac cifra figureaz sau nu n seria aprut. Parametrii reinui sunt
ordonata la origine i panta dreptei reprezentnd creterea timpului n funcie de numrul de cifre
n serie.
Paradigma lui M. Posner (viteza de acces la memoria de lung termen). Se prezint subiectului
cupluri de litere precum AA, Aa, Ab. Timpul de reacie este mai nti msurat cnd se cere
subiectului de a semnala dup prezentarea fiecrei perechi dac cele dou litere sunt fizic diferite
sau nu. Acest timp de reacie este mai lung dac subiectului i se cere apoi de a semnala dac cele
dou litere sunt semantic diferite sau nu. Diferena dintre cei doi timpi este luat ca norm a
timpului de acces la memoria de lung termen care intervine pentru a constata dac A i a sunt
dou litere semantice identice, pe cnd el nu are de intervenit n constatarea unei identiti fizice
(ntr-un cuplu AA, de exemplu).
76
vezi Reuchlin, Maurice Introduction a la recherche en psychologie, Nathan, Paris, 1992, pag. 33-34.
64
Viteza de tratament a informaiei pare s intervin n rezultatul celor 4 probe. Dar ea intervine
concurent cu ali factori variind de la o sarcin la alta. Autorul poate s continue de a defini n
cercetarea sa viteza de tratament a informaiei printr-una din aceste paradigme.
III.3. FORMULAREA UNUI BUN ITEM
n privina formulrii unui bun item, considerm important de a aminti c nu orice test se
compune din itemi, n unele cazuri aflndu-ne n situaia unui continuum solicitativ (cum este cazul
probelor pentru examinarea asocierii i disocierii manuale-DM, sinusoida Bonnardel). Itemul, n calitate
de component informaional bazal, se ntlnete la chestionarele de personalitate, la teste de
cunotine colare, testele verbale i nonverbale de inteligen. Exigenele n privina formulrii itemilor
se afl n continu cretere, tot aa sunt i eforturile de cercetare privind selectarea unui bun item,
specificul informaional al fiecrui tip de item, determinarea numrului optim de itemi care compun un
test. Transferul preocuprilor tiinifice ctre aceti atomi ai testului se pare c este o mutaie deosebit
de benefic pentru construirea unui instrument de msura progresiv adecvat domeniului
psihodiagnosticului. Aceast analiz n amnunt a testului, pornind de la iruri de 0 i 1, aduce un spor
informaional considerabil i de o mare diversificare.
Pentru chestionarele de personalitate se recomand respectarea unor exigene formale de
formulare a itemilor, pe lng cele de coninut77:
evitarea folosirii unor termeni care sunt vdit social dezirabili sau indezirabili. Mai ales n cadrul
unor examene de evaluare, se vor da acele rspunsuri care vor fi considerate apreciate de
examinator;
se impune, ca la o parte din itemi, sa se rspund cu da i la alt parte cu nu (rspunsul
valorizat de chestionar), pentru a evita aa-numitul efect de aprobare;
se impune, de asemenea, a redacta ct mai simplu posibil itemii care trimit mai curnd la
comportamente, dect la sentimente sau la emoii;
evitarea referinelor la frecvent, de obicei, adesea;
fiecare item nu trebuie s conin dect un element de apreciat (nu se pot admite formulri de
genul: mi place la fel de mult literatura i istoria);
parte din autori nu recomand rspunsuri ntre da i nu, deoarece aceasta ar atrage indecizia.
Considerm c doar ntr-o mic parte din ntrebrile unui chestionar de personalitate se poate
rspunde prin da i nu, adevrat sau fals. Se poate, de asemenea, afirma c nu exist o
form perfect de exprimare la item care s satisfac absolut toi constructorii de teste.
Nu se poate afirma nici existena unei mrimi standard a testului, legat de numrul de itemi.
Dac un criteriu de economicitate este presant, va trebui redus numrul itemilor, dar nu dincolo de limita
unor valori minimale asiguratorii pentru criteriile de apreciere ale testului. Un numr mare de itemi cer
testele care au ca exigen o mare fidelitate.
Din literatura de specialitate parcurs, doar Paul Kline face referire la numrul minim de itemi
pe care trebuie s-i conin un test, i anume minimum 10 itemi. Considerm cifra exagerat de mic,
gndindu-ne la foarte slaba putere de discriminare a unei probe cu o amplitudine mic a distribuiei. n
faza preliminar de construcie a testului se recomand, de ctre majoritatea autorilor de specialitate, ca
vezi Kline, P., La construction des tests, n Beech, John R., Harding, Leonora, Tests, mode d'emploi. Guide de
psychometrie, ECPA, Paris, 1995, pag. 122-123.
77
65
AUREL STAN
numrul de itemi s fie mrit cu 15-30% n comparaie cu numrul proiectat pentru varianta final.
Partea neartistic de construcie a testului, cea psihometric, va avea n vedere stabilirea unor
indicatori i a unor corelaii: indice de dificultate, indice de segregare, de validitate, de fidelitate i
corelaia itemului cu rezultatul total prin intermediul analizei punct biseriale (ilustrat de noi ntr-un
capitol anterior).
Specialistul care concepe un test psihologic este obligat de a proceda n funcie de accentul
pus pe validitatea de coninut sau validitatea predictiv. n cazul cnd se decide pentru validitatea de
coninut va proceda la un eantionaj de coninut n domeniul de interes. Seria procedural cuprinde
calculul corelaiei punct biseriale, calculul consistenei interne, stabilirea frecvenei scorurilor totale i
exemplificri grafice ale situaiilor.
n cazul testelor de randament, Bogdan Pietrulewicz78 recomand efectuarea corelaiilor
itemilor singulari cu scorul total. Indicele de dificultate este recomandat mai puin pentru selectarea
itemilor.
III.4. PROBLEMA EANTIONAJULUI
Construcia unui test necesit examinarea unui numr apreciabil de subieci. La realizarea
MMPI (Minnesota Multiphasic Personality Inventory) au fost examinai numai n faza de nceput 700 de
subieci dintr-un eantion de locuitori ai statului Minnesota, 350 de aspirani la colegiu i 800 de pacieni
ai spitalului din Minneapolis. Grupa de standardizare pentru spaiul lingvistic german a cuprins 365 de
persoane. Pentru a se asigura contra posibilelor deformri ale sensului ntrebrilor prin traducere n
german a MMPI, acest chestionar a fost aplicat pe un numr de 700 de bilingvi79.
Eantionarea n psihologie se realizeaz mult mai greu dect in alte domenii. Spre deosebire
de sociologi, psihologii nu gsesc subiecii pe strad i nu pot merge dect n rare cazuri la domiciliul lor
pentru a face investigaii tiinifice. n marea majoritate a cazurilor examenul psihologic se desfoar n
spaii special amenajate, cu respectarea anumitor etape. Chiar dac anumii subieci reuesc s
rspund unei invitaii pentru a fi examinai la un laborator psihologic, nu putem fi siguri c au o
motivaie corespunztoare pentru efectuarea examinrii. n ultima vreme, mai ales n ri nalt civilizate,
se practic plata subiecilor, nct problemelor de eantionaj li se adaug unele noi, legate de
dimensiunea financiar a unei examinri.
Practic, subiecii care pot fi examinai n condiii de asigurare a ambianei specifice examinrii
psihologice sunt cei selecionai prin intermediul unei instituii (pacienii spitalelor, elevii liceelor,
persoanele care vin la centrele de evaluare sau la Laboratoarele unor mari ntreprinderi sau regii
naionale. n momentul n care un subiect tie c de rezultatul examenului depinde viitorul su
profesional avem o probabilitate mare de a rspunde motivat la solicitrile testului. Considerm c
subiecii folosii la verificarea probelor psihologice sunt fatalmente selecionai. Constituirea unor
eantioane complet aleatoare duce la complicaii mari de ordin metodologic.
n privina eantionajului avem n fa dou situaii, distincte; eantionaj de persoane care
efectueaz examinarea i eantionaj dintr-un anumit univers specific de itemi. n cazul primei situaii de
eantionaj dintr-o anumit populaie suntem n prezena unei eantionri probabiliste (prin tragere la
sori elementar, prin tragere la sori secvenial, prin grappes i stratificate) i a unei empirice (prin
78
79
vezi Bernier, J.J., Pietrulewicz, B., La psychometrie, Gaetan Morin Editeur, Montreal, Paris, Casablanca, 1997, pag. 240.
Hathaway, S.R., Mckinley, J.C., MMPI Saarbrucken, Verlag Hans Huber, Bern und Stuttgart, 1963.
66
quote, prin uniti tip). n privina eantionajului itemilor avem eantionaj simplu, eantionaj stratificat,
eantionaj prin grappes i eantionaj ierarhic.
Chiar n situaia n care subiectul este condiionat instituional apar o serie de probleme, una
dintre ele fiind compoziia unui grup criteriu. Dac la unele problema este simpl (cercetarea n
psihologie colar, de exemplu), n psihologia patologic nu exist un adevrat acord ntre specialiti n
materie de diagnostic. Existena unor nomenclatoare, de genul DSM IV, nu rezolv problema constituirii
unor grupe de subieci criteriu. Paul Kline spune n aceast privin: Chiar dac este posibil de a-i
seleciona plecnd de la un criteriu pentru a constitui un grup, subiecii afectai acestui grup criteriu pot
s se diferenieze de subiecii grupului martor pe mai mult de o variabil. Nite subieci schizofreni
(afectai grupului criteriu) pot s se diferenieze de subiecii grupului de control n domeniul
personalitii, al funciei sociale i al aptitudinilor intelectuale, pentru a nu reine dect trei variabile
importante80.
n timpul primului rzboi mondial Robert Yerkes i colaboratorii si au putut s examineze n
jur de 1,7 milioane de oameni, iar n al doilea rzboi mondial au examinat sute de mii de subieci n
laboratoarele psihologice ale beligeranilor. n urma acestei experiene de rzboi, Germania a fost prima
ar din lume care a definitivat juridic statutul psihologului n anul 1941. Cercetrile din domeniu militar
se dovedesc a fi una din cele mai serioase surse de date pentru verificarea testelor.
III.5.NORMELE I NORMAREA N PSIHOMETRIE
Cuvntul norm are o arie extins i diversificat de utilizare, cuprinznd domeniile
disciplinelor tiinifice i ale activitilor practice. Se vorbete de norme juridice, norme etice, norme
deontologice, norme de circulaie, norme de consum, norme tehnologice, norme ecologice, norme de
comportament, norme de reprezentare.
Sensul general al termenului de norm n disciplinele psihologice aplicative (derivat n limba
romn din termenul englez norm) este un ansamblu de date caracteristice unei populaii, pentru o
sarcin de efectuat i un material determinat, pe care un cercettor l utilizeaz n momentul construciei
unui plan experimental. Normele sunt totodat convenii care regleaz viaa social i trebuie s rezolve
conflictele nainte ca acestea s izbucneasc. Normele de comportament, n calitate de prescripii
nescrise constituite de fiecare grup sau fiecare societate, preocup mai ales psihologia social.
Intereseaz, n special, caracteristicile, geneza i schimbarea normelor, sistemul normativ i deviana
comportamental.
Cel mai frecvent, cuvntul norm se folosete n domeniul psihometric, parte integrant a
psihologiei difereniale, disciplin care se ocup cu teoria i tehnologia instrumentelor de msur n
psihologie. Deseori, termenul de norm se folosete n strns legtur cu cel de etalon, iar cel de
normare cu cel de etalonare. A etalona un test i a norma un test sunt considerate activiti identice. n
definiia lui Maurice Reuchlin, personalitate tiinific de referin n domeniul utilizrii metodelor
cantitative n cercetarea psihologic, etalonarea este stabilirea, ntr-o prob psihologic, a unei scale
permind de a situa rezultatul obinut de un subiect prin raportare la rezultatele care au fost observate
anterior ntr-o populaie de referin suficient de numeroas i omogen de subieci comparabili aceluia
care a fost examinat81. Etalonul, n general , este o mrime standardizat servind de referin i de
Vezi Kline, Paul, La construcion des tests, n Beech, John R. , Harding, Leonora Tests, mode d'emploi. Guide de
psychometrie, ECPA, Paris, 1995, pag. 120.
81 Vezi Grand dictionnaire de la psychologie, Larousse, Paris, 1992, pag. 284
80
67
AUREL STAN
msur ntre diverse obiecte. A etalona presupune fixarea gradaiilor pentru un instrument de msur,
stabilirea gradaiilor pentru o scal. A norma nseamn a fixa pentru o mrime numrul de norme sau
de etaloane care sunt cuprinse. Att etalonul ct i norma presupun o convenien ntre utilizatorii de
msuri. Considerm c normarea presupune un grad de convenien crescut n comparaie cu
etalonarea, operaiune care implic un interes crescut pentru asigurarea identitii semnificaiei unitii
de msur. Atunci cnd efectum o operaiune de msurare suntem dependeni foarte mult n apreciere
de puterea informaional pe care am dobndit-o n urma efecturii acesteia Nu ne este indiferent dac
suntem n domeniul scalar nominal, ordinal, de log-interval, de interval, de raport sau absolut. Ignorarea
acestui fapt duce la grave erori de aprecieri i la operaii statistice lipsite de sens.
Problema normrii rezultatelor cantitative ale cercetrii psihologice a aprut odat cu
dezvoltarea psihologiei experimentale i, mai ales, cu apariia testului psihologie, dar continu s creeze
probleme tinerilor psihologi practicieni prin confuziile unor termeni i a unor tehnici folosite n realizare,
fapt pentru care este nc apreciat drept una de actualitate. Aceast problem apare frecvent n
interpretarea cantitativ a datelor provenind din aplicarea instrumentelor psihologice de investigaie i n
docimologie, n general. Normarea poate fi aplicat pentru orice metod psihologic de investigaie ale
crei rezultate pot fi exprimate mai ales cantitativ, dar, n special, n domeniul construciei i aplicrii
testelor psihologice, care sunt instrumente standardizate. n general vorbind, standardizarea
procedurilor este indispensabil comunicrii tiinifice a informaiilor care se prezint sub form
cantitativ i oricrei ntreprinderi metodologice de comparare. Ea este inerent oricrui demers de
observaie tiinific.
III.5.1. Metode de etalonare a rezultatelor persoanelor
Interpretarea scorurilor obinute la un anumit test psihologic se face n etape. Prima etap
este transformarea scorurilor brute ntr-o scal care permite de a stabili o baz de comparaie.
Orice subiect cruia i-a fost aplicat un instrument de investigaie psihologic obine un rezultat
observabil, exprimat conform prescripiilor manualului de rspunsuri (n urma aplicrii grilei de corecie).
Testul computerizat exclude existena unei grile de corecie ca material al testului, procednd
automatizat, avnd precizie i rapiditate de necomparat cu modalitile tradiionale de corectare.
Redarea automat a rezultatelor brute i a diferitelor feluri de transformri posibile nu exclude
necesitatea nvrii modului de constituire a etaloanelor i a cunotinelor privind reconsiderarea i
reevaluarea lor. Operaiile tehnice care stau la baza unei astfel de practici nu trebuie totui s fie uitate
de ctre cercettori i practicieni.
Mai ales testele de randament intelectual i pentru msurarea diferitelor abiliti psihomotorii
au rspunsurile mprite n corecte i incorecte, n marea lor majoritate. Realizarea punctrii unui
singur item este n concordan cu valoarea rspunsului, 0 puncte pentru rspuns incorect, 1 punct
pentru rspunsul corect. La inventarele de personalitate i de interes rspunsurile nu se apreciaz n
aceti termeni, ci n funcie de faptul dac pun n eviden sau nu caracteristica investigat sau, mai clar
exprimat, atitudinea exprimat fa de coninutul aseriunii unui item.
n marea majoritate a cazurilor rezultatele aplicrii unor instrumente de investigaie
psihometric dobndesc consisten cantitativ prin operaiile de adiie realizate n cadrul unor matrici.
Cel mai simplu i cel mai frecvent tip de matrice este matricea lui W. Stern.
O astfel matrice de date care poate fi reprezentat sub dou dimensiuni:
Liniile care reprezint rspunsurile unei aceleai persoane la itemi diferii
68
O asemenea denumire este folosit frecvent de Constantin Mitrofan n cartea Testarea psihologic a copilului mic, Editura
All, Bucureti, 1997
82
69
AUREL STAN
Alte elemente care trebuiesc luate n consideraie sunt validitatea i fidelitatea datelor,
operaiuni strict specializate n psihometrie i a cror realizare cere un timp considerabil.
Pentru a putea raporta valorile brute obinute de un subiect la valori de referin trebuiesc
efectuate examinri pe grupuri de subieci posednd aceleai caracteristici. Este necesar de a face
distincia dintre noiunea de populaie i cea de eantion. Populaia este constituit din ansamblul
indivizilor (n domeniul psihologic, ansamblul subiecilor) care satisface exigenele unei anumite definiii.
Grupul de referin poart numele de eantion doar n cazul n care selecia subiecilor s-a fcut prin
respectarea rigorilor unor anumite reguli, fapt care-i confer acestuia reprezentativitate, adic calitatea
care face posibil tragerea acelorai concluzii din analiza grupului ca i din analiza populaiei, admind
anumite riscuri tolerabile de eroare.
Procedura de etalonare a unui test cuprinde efectuarea acestuia de ctre cel puin un
eantion din populaia de referin. Debutul procedurii trebuie s se fac printr-o definiie foarte clar a
acestei populaii. Din punct de vedere statistic, populaia este ansamblul tuturor cazurilor care constituie
obiectul de interes al cercettorului, clar precizat. Din punct de vedere teoretic ansamblul poate fi finit
sau infinit, dar datele cu care se confrunt psihologul sunt n toate cazurile n numr finit. n cazul n
care populaia este constituit dintr-un mic numr de cazuri, ea poate fi n ntregime msurat. Dar,
colectarea exhaustiv de rspunsuri ale subiecilor din populaie este de cele mai multe ori imposibil.
Trebuie s ne limitm la domeniul eantioanelor, adic la pri, subansambluri ale populaiei, plecnd de
la care caracteristicile populaiei trebuie aproximate ntr-un mod satisfctor. n definirea populaiei
trebuie s se in cont de o serie de caracteristici precizate de destinaia psihodiagnostic a testului.
Dac testul este destinat a diagnostica tulburrile de dezvoltare senso-motorie a copilului mic (02 ani),
populaia vizat va fi, desigur, aceea a copiilor n vrst de la 0 la 2 ani. Un chestionar care i propune
s evalueze dezvoltarea social a handicapailor mentali, va avea ca populaie de referin aceast
categorie demografic defavorizat. O recomandare general este ca populaia de referin s fie
suficient de omogen, adic ca toi indivizii susceptibili de a fi evaluai cu ajutorul unui test s fac clar
parte din ea. Cnd un test este dezvoltat de ctre un editor comercial, exist frecvent exigena ca
normele s fie naionale Avantajul major de a se referi la o populaie naional este de a permite
producia unui sistem unic de norme, valabil pentru un foarte mare numr de subieci. Interesul
comercial i uurina de folosire sunt evidente. Referina la populaia naional nu implic ca normele
diferitelor teste s fie ipso facto comparabile, deoarece aceast populaie nu este totdeauna definit cu
aceeai rigoare de ctre cei care editeaz un instrument de investigaie. Neconcordanele survin cnd
editorii nu se pun de acord n legtur cu includerea anumitor grupuri atipice n populaia de referin.
Deficienii mentali, sunt cteodat inclui i, n alte cazuri, exclui din populaie. Ca atare, normele
naionale sunt deficitare, datorit prea extinsei lor generaliti. De aceea, este mai adecvat pentru
practicieni de a lua decizii sprijinindu-se pe norme specifice. Un psiholog care activeaz profesional n
medii socioeconomice defavorizate va avea mai mare nevoie, n general, de norme elaborate pentru
acest tip de populaie. Aceast raiune, alturi de cea financiar, este frecvent invocat ca justificare a
practicii de a nu dezvolta dect norme locale. n acest caz, populaia de referin va fi mai bine
circumscris. Ea va corespunde elevilor din colile unui ora sau pacienilor dintr-o instituie de
recuperare psihomotorie. Normele vor avea referin la aceste populaii i vor servi, n mod obinuit,
pentru obiective foarte precise: a ajuta la orientarea elevilor ctre diferite profesiuni, la constituirea de
70
grupuri omogene pentru nvare etc. Limitele folosirii normelor locale decurg din prea marea lor
specificitate. n acest caz, pentru alte utilizri ale testului sau chestionarului va fi adesea necesar de a
dezvolta noi norme, extinse n privina ariei de apartenen a populaiei.
Din raiuni de economie, se procedeaz frecvent la o eantionare de convenien, deoarece
este comod pentru practician, adic la utilizarea de subieci apropiai anturajului psihologului sau de
persoane care se prezint voluntar ca urmare a unui anun. Aceast procedur trebuie respins,
deoarece antreneaz serioase deformri sistematice n estimarea parametrilor populaiei. Lsarea la
aprecierea practicianului nu conduce, n general, la constituirea unui eantion reprezentativ din
populaie, deoarece erorile datorate unei lipse de sistematizare sunt foarte dificil de controlat. Mai mult,
procedura nefiind aleatorie, nu este posibil de a evalua importana erorii de estimaie a parametrilor. n
1971, W.H. Angoff face remarca c, pentru testele cognitive folosirea eantionajului de convenien
conduce n mod obinuit la o supraestimare a scorurilor populaiei. ntr-adevr, subiecii voluntari sau
care aparin ambianei cercettorului constituie un subgrup sociocultural favorizat n rndul populaiei.
III.5.2.Tipuri de scale normative n psihometrie
n general, n psihometrie se face raportare la 5 categorii de scale83:
- scale de coninut.
- scale de dezvoltare;
- scale care utilizeaz raporturi i coeficieni;
- scale care se bazeaz pe cuantumuri procentuale sau cuantile,
- scale care face apel la scoruri standardizate;
III.5.2.1. Scalele normative de coninut
Aceste scale permit de a compara randamentul unui respondent la un standard definit prin
coninutul testului. Acest tip de scale se folosete mai ales la acele teste utilizate n activitatea de
selecie profesional n care sarcina este foarte apropiat activitii reale pe care o va avea de efectuat
candidatul n cazul n care va fi admis. Exemplul clasic este proba mainii de scris. n acest caz este
stabilit clar un randament maximal, ideal, de care subiectul se poate apropia i, n cazuri excepionale,
chiar realiza. Se compar deci un randament individual cu un randament ideal. Acest tip de scal nu se
aplic dect la testele de randament maximal. Randamentul subiectului se calculeaz prin urmtoarea
formul:
71
AUREL STAN
itemi comportnd un grad de dificultate variabil. De exemplu, dac A i B obin amndoi 70% se poate
spune c A a reuit itemii uori i c B a reuit itemi uori i dificili. Scalele de coninut pun o serie de
probleme:
validitatea trebuie s fie asigurat printr-o eantionare adecvat bazat pe o definiie precis a
domeniului msurat;
interpretarea scorurilor trebuie s fie n funcie de coninutul msurat i de itemi rezolvai prin
respondent.
Astfel de scale prezint avantajul c permit de a interpreta scorurile calculate n funcie de
randament. Aceste scoruri indic gradul de abilitate pe care l posed n prezent un respondent, mai
curnd dect poziia sa relativ ntr-un grup.
Dezavantajele constau n dificultatea de a preciza coninutul i natura sarcinilor complexe i n
dificultatea de a afirma c un respondent stpnete un nivel de dificultate dat pentru c el a reuit,
probabil, att la itemi uori ct i la itemi dificili. Interpretarea unui scor este totdeauna aproximativ,
deoarece noiunea de dificultate se raporteaz mai mult dect la un singur subiect.
III.5.2.2. Scale normative de dezvoltare
Exist dou tipuri de scale de dezvoltare: una este n funcie de vrst, alta n funcie de
nivelul de colarizare. Principiul care st la baza construciei acestora este c anumite abiliti i
caracteristici se dezvolt ntr-un mod sistematic. Se utilizeaz pentru a compara randamentul unui
subiect cu randamentul mediu al altor subieci avnd atins un anumit nivel de dezvoltare.
Postulatul fundamental al scalelor de dezvoltare mintal este c gradul prezenei unor abiliti
sau caracteristici msurate se mrete sistematic cu vrsta. Dac o caracteristic nu se mrete
sistematic cu vrsta, ea nu este adecvat pentru scopul propus. Dac procentul de schimbare variaz
de la an la an, inegalitatea mrimii unitii complic interpretarea. n general, dezvoltarea mintal se
stabilizeaz la adolescen.
Rezultatele scalei de dezvoltare sunt tributare unui numr de factori, precum educaia, mediu
social-economic, influenei culturale, stabilitii emotive. Aceast scal pare s convin pentru copiii
care triesc ntr-un mediu tipic.
Scale normative pe niveluri de vrst Dup vrst, Alfred Binet a considerat c dezvoltarea
mintal se estimeaz prin compararea randamentului unui copil cu acela al copiilor de vrste diferite. El
a selecionat sarcini intelectuale (itemi) care i permiteau de a discrimina copiii de vrste diferite.
Exemplu: itemul 9 l efectueaz doar civa copii de 7 ani i majoritatea celor de 8 ani. Este recomandat
pentru vrsta de cel puin 8 ani. Binet a realizat colecii de itemi pentru examinarea fiecrei vrste.
Scorul reprezentativ este cel al eantionului reprezentativ.
Vrst mental este termenul pe care-l folosete pentru prima dat Alfred Binet. Este vrsta
corespunztoare performanelor realizate de ctre copiii normali de o anumit vrst, la anumite
solicitri de natur intelectual. Este determinat prin nivelul probelor reuite de ctre un anumit copil.
Probele create de Binet (i ulterior de Simon) constituie o scal ierarhic. Vrsta mental este nivelul de
vrst pentru care toate rspunsurile specifice sunt corecte.
n 1905, treizeci de probleme sunt prezentate n ordine cresctoare de ctre Alfred Binet i
Thodule Simon. Acest nivel de dificultate a fost determinat empiric, administrnd probele la 50 de copii
72
normali n vrst de la 3 la 11 ani i la civa copii i aduli retardai. Nu este dat nici o metod de a
ajunge la un scor total. n 1908, numrul probelor a crescut, unele din cele vechi au fost eliminate, i ele
sunt regrupate prin nivelul de vrst mental n funcie de rezultatele obinute de ctre 300 de copii
normali. Dup anul 1911 ,(an n care testul modificat comport 5 itemi pentru fiecare nivel de vrst), se
calculeaz vrsta mental innd cont de reuita parial n vrstele superioare vrstei de baz. Astfel,
un copil care a reuit toi itemii pentru 7 ani i 5 itemi reuii pe un nivel superior va avea o vrst
mental avansat n funcie de reuita suplimentar. S-a constatat c un acelai numr de ani, de
avans sau de ntrziere, nu are aceiai semnificaie pentru vrsta real. Un an de ntrziere la 4 ani nu
are acelai sens ca un an de ntrziere la 11 ani.
Pentru a ine cont de aceasta situaie, William Stern a introdus n 1912 noiunea de Q.I. care
este un raport ntre vrsta mental i vrsta cronologic (sau vrsta real calculat n luni). Acest raport
este multiplicat prin 100, ceea ce determin anularea numerelor zecimale. Un Q.I de 100 reprezint o
performan potrivit cu vrsta real, unul inferior cifrei 100 indic o ntrziere n viteza de dezvoltare
i un Q.I. mai mare 100 indic un avans n dezvoltare.
Constituirea de scale pe niveluri de vrst se deruleaz n mai multe etape.
1. Sunt constituite eantioane de subieci pentru o anume vrst. O vrst este definit ca un interval
mai mult sau mai puin extins dect vrsta n chestiune.
2. Este calculat un scor mediu la fiecare grup de vrst.
3. Eventual, scorurile diferitelor trane de vrst sunt estimate prin interpolare. Procedura se utilizeaz
cnd anumite vrste nu au fost incluse n eantionul de etalonare i cnd se dorete a prezenta
normele pe luni i nu numai pe ani. Procedura de interpolare rspunde la postulatul unei progresii
liniare a caracteristicilor evaluate prin test. Ea const n a calcula valoarea intermediar ntre
valorile inventariate prin eantionul de etalonare. Exemplu: dac scorul mediu obinut la test pentru
copiii de 7 ani este de 14 puncte i cel obinut de copiii de 9 ani este de 18 puncte, se poate estima
c scorurile medii ale copiilor de 8 ani este de 16 puncte.
Scale dup nivelul colar. Se compar randamentul colar al unui subiect cu acela al unui
cursant mediu din diverse niveluri colare. Exemplu: 7,6 este randamentul comparaiei cu nivelul mediu
de 7 ani i 6 luni. Stabilirea acestei valori indic faptul c elevul are nivelul corespunztor de cunotine.
Este vorba de o msur continua. Trstura trebuie s varieze sistematic cu nivelul colar. Efortul fcut
pentru a determina i reevalua nivelurile colare este foarte mare i cercettorul se lovete de
nenumrate dificulti pe care nu le poate depi dect stabilind o serie de convenii.
III.5.2.3 .Scale bazate pe raporturi i coeficieni.
Cel mai bun exemplu este msura coeficientului intelectual Q.I., care se obine prin
compararea vrstei mentale cu vrsta cronologic. Specialitii au demonstrat c vrsta mental luat
izolat nu d un indice suficient de precis al dezvoltrii mentale. Pentru calcul se utiliza formula:
virsta mentala
Q.I.=
* 100 . Raportul se va numi coeficient de inteligen. Denumirea va face
virsta crono log ica
carier, fiind utilizat n varii domenii de activitate tiinific i practic.
Q.I.-ul lui W. Stern, ca raport ntre vrsta mental i vrsta cronologic, nu trebuie confundat
cu Q.I.-ul lui Wechsler, care n general, are valori mai nalte. Unui Q.I. de 115, n varianta Wechsler, i
corespunde un clasament identic pentru subieci aparinnd la grupe de vrst diferite, pe cnd
73
AUREL STAN
semnificaia Q.I.-ului lui W. Stern variaz n funcie de vrst, deoarece abaterea standard a distribuiilor
acestor Q.I.-uri nu este aceeai pentru toate vrstele.
n funcie de problemele asociate abaterilor standard, neechilibrate i de faptul c dezvoltarea
intelectual nu are o relaie liniar cu vrsta, raportul coeficientului creat de W. Stern nu mai este utilizat
i nu mai prezint dect un interes istoric. n locul raportului de coeficient se utilizeaz scoruri standard
bazate pe eantioane reprezentative ale populaiei de fiecare nivel. Aceste scoruri, numite i Q.I.-uri
deviate, prezint o medie de 100 i o abatere standard de 15, pentru scala Wechsler, i egal cu 16
pentru scala Stanford-Binet (pentru fiecare categorie de vrst).
III.5.2.4.Scale care se bazeaz pe cuantumuri procentuale sau cuantile
Quantilul este un element al unei serii ordonate de elemente care va avea n faa lui (valori
mai mari) un procentaj determinat al unui ansamblu de date. Practic, este o born numeric separnd
dou cuantumuri procentuale al valorilor obinute de un grup de referin la o anumit examinare prin
intermediul unui instrument psihometric. Separaia unui ansamblu de valori ale unei variabile n quantile
constituie o form de etalonare. Ea permite de a situa un subiect, care a obinut un scor determinat,
ntr-o anumit clas a subiecilor pentru care testul a fost etalonat. Se va vorbi de intercuantile (de
interdecile, de exemplu) pentru a desemna n+1 zone de distribuie delimitate prin quantile. Uneori se
utilizeaz termenul de interquantil n loc de quantil. Distincia clar se face prin precizarea c
interqantilul este, n majoritatea cazurilor, un interval numeric, pe cnd quantilul este reprezentat de o
singur valoarea numeric. Lucrrile se specialitate ale lui Maurice Reuchlin consacrate statisticii
aplicate n psihologie fac clar aceast separaie de sensuri pentru cele dou noiuni.84
La nceputul procedurii de cuantilaj (form particular a etalonajului) se alege o metric, adic
un numr de niveluri pe care scala permite de a le discrimina. Dac o scal cuprinde n niveluri i dac
N
. Scala n cuantile va
efectivul total al unui eantion este N, efectivul fiecrui nivel va fi teoretic
n
corespunde, deci, unui model rectangular. Cele mai frecvente mpriri n cuantile se fac ntre 1 i 10
trepte, cu urmtoarele denumiri.
Nr.crt.
Nr. interquantile
Nr. quantile
Denumire tehnic
1
3
2
Trecil
2
4
3
Quartil
3
5
4
Quintil
4
6
5
Sextil
5
7
6
Septil
6
8
7
Octiil
7
9
8
Nonil
8
10
9
Decil
9
100
99
Centil
Tabelul 18. Denumirile formelor de etalonare prin intermediul cuantilelor, gradiente de la 3 la 10.
Pentru a construi un decilaj se procedeaz n aa fel ca toate clasele noii scale s conin
fiecare un acelai numr de scoruri din eantionul de referin. Este vorba de o convenie care va face
distribuia rectangular. Dac scala este constituit din 10 clase egale n efectiv, acest efectiv va trebui
s aib 10% din numrul total al subiecilor. Interquantilul I corespunde primelor 10 % din notele brute,
84
Vezi Reuchlin, Maurice, Prcis de statistique, PUF, Paris, 1976, pp. 67-78
74
celor mai slabe din distribuie, interquantilul II 10% din rezultatele care urmeaz, i aa mai departe,
pn la interquantilul X. Quantilul I va separa primii 10% din subieci de urmtorii 90%, quantilul II primii
20% din subieci de urmtorii 80 %, i aa mai departe pn la quantilul IX, care va separa primii 90%
de urmtorii 10% .
Oferim un exemplu imaginat n care un psiholog examineaz un numr de 360 de subieci cu
un anumit test n vederea etalonrii acestuia. Aceast procedur se efectueaz n faza construirii unui
instrument de investigaie psihologic sau n cazul reevalurii acestuia. Notele testului variaz ntre 0 i
35. Exemplu dat este unul imaginat i nu va conine primele 5 valori (1, 2, 3, 4, 5) i ultimele 3 (33, 34 i
35). De obicei, n examinare se obin foarte rar scorurile cele mai mici i scorurile cele mai mari. Dac
datele ar fi fost reale ar fi trebuit s se fac o serie de precizri cu privire la constituirea eantionului de
etalonaj, adic la proveniena subiecilor examinai, vrsta, nivelul de studii, sexul, etc. De asemenea, ar
fi trebuit s se fac precizri cu privire la tehnicile folosite pentru selectarea subiecilor n eantion.
naintea operaiunii de etalonare, datele se organizeaz cresctor n variante de variaie.
Tabelul ntocmit n vederea stabilirii scalei de etaloane n 10 interquantile (sau n 10 clase) va
arta n felul urmtor:
X
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
N
3
7
4
6
8
11
14
17
16
19
24
22
26
21
24
18
19
17
14
16
14
11
9
7
6
5
2
NC
3
10
14
20
28
39
53
70
86
105
129
151
177
198
222
240
259
276
290
306
320
331
340
347
353
358
360
NCT
INTERDECIL
DECIL
NUMEROTARE
% INTERDECIL
SEPARAIE DECIL
36
0 11
11
10,88%
10,88%/89,12%
72
12 13
13
II
8,61%
19,49%/80,51%
108
14 15
15
III
9,72%
29,21%/70,79%
144
180
16 17
18
17
18
IV
V
12,77%
7,22%
41,98%/58,02%
49,20%/50,80%
216
19 20
20
VI
12,50%
61,70%/38,30%
252
21 22
22
VII
10,27%
71,97%/28,03%
288
23 24
24
VIII
8,61%
79,58%/20,42%
324
331
340
347
353
358
360
25 26
26
IX
8,33%
87,91%/12,09%
12,09%
27-32
Tabelul 19. Coloanele tabelului conin etape ale procedurii de etalonare prin metoda cuantilelor a
rezultatelor obinute de un eantion de subieci la un test psihologic
75
AUREL STAN
fo
( f o f t )2
fo- ft
( f o f t )2
ft
39
36
3
9
0,23
31
36
-5
25
0,81
35
36
-1
1
0,03
46
36
10
100
2,17
26
36
-10
100
3,85
45
36
9
81
1,80
37
36
1
1
0.03
31
36
-5
25
0,81
30
36
-6
36
1,20
40
36
4
16
0,40
Total
11,32
Tabelul 20. Coloanele tabelului indic desfurarea procedurii Chi ptrat de ajustare pentru calcularea
distanei dintre efectivele teoretice necesare calculrii decilelor i cele observate practic.
Coloana fo desemneaz efectivele observate, iar coloana ft efectivele teoretice
Pentru aceast valoare a lui chi ptrat gsim un p>0,10, ceea ce duce la acceptarea ipotezei
de nul, constatare care arat c distana dintre cele dou serii de efective nu este semnificativ. Deci,
utilizarea efectivelor observate poate fi considerat un compromis acceptabil
n cazul cnd dorim s stabilim o scal n centile, avem la ndemn o procedur puin
diferit. Pentru a pune n aplicare aceast procedur trebuie s avem distribuii ale cror amplitudini
sunt de ordinul sutelor. Raiunea construirii scalelor care fac apel la centile este de a asigura o
discriminare foarte fin a subiecilor dar, n cazul cnd amplitudinea distribuiei este sub 100, asigurm
o fals finee a diferenierii. Redm, n continuare, un tabel ale crui coloane indic paii de urmat n
procedura de calcul:
Lum exemplu a 137 de subieci care au fost examinai cu un anumit test (exemplul este
fictiv):
Nr.crt.
1.
2.
3.
4.
76
X
11
12
13
14
F
2
5
7
11
f%
1,57
3,94
5,51
8,68
fc
2
7
14
25
fc%
1,57
5,51
11,02
19,69
Percentila
0,79
3,54
8,27
15,35
15
16
17
18
19
20
21
22
19
26
18
15
11
7
4
2
14,96
20,47
14,17
11,81
8,66
5,51
3,15
1,57
44
70
88
103
114
121
125
127
34,65
55,12
69,29
81,10
89,76
95,28
98,43
100,00
27,17
44,89
62,21
74,50
85,43
92,52
96,85
99,22
77
AUREL STAN
care poate fi facilitat efectund o simpl transformare liniar de forma: x2= ax1+b, n care x1 este
msura original i x2 este msura transformat.
a=
1
i b = m2 am1, m1 i 1 fiind media i abaterea standard a distribuiei msurilor originale, m2
2
i 2 fiind valorile corespunztoare pentru distribuia dorit. n transformarea n scoruri centrate reduse
sau scoruri z avem formula: x2 = (x1-m1)/1.
Astfel, msurile pot face obiectul unei interpretri mai directe. Dac aceste scoruri au o
distribuie apropiat de legea normal Gauss-Laplace pentru a determina unde se situeaz rezultatul
unui subiect prin raport cu rezultatele subiecilor unui grup de referin, aplicnd proprietile acestei legi
de repartiie. De exemplu, despre un subiect care va obine un scor egal cu 2 ntr-o distribuie normal
de medie 0 i o abatere standard egal cu 1 ,,vom putea spune c doar 2,3% din subiecii grupului
referin obin un scor superior celui obinut de el.
n schimb, utilizarea scorurilor z pentru a facilita interpretarea unui scor este jenat de faptul
c aceste scoruri prezint valori negative, au o amplitudine foarte redus i se prezint sub form
zecimal. Este motivul pentru care se utilizeaz adesea alte transformri liniare. Prezentm, n
continuare, o serie de transformri liniare posibile:
Scor
m
Scor original
37,4
Scoruri z
0,00
Scoruri Stanford-Binet
100
Scoruri Wechsler
100
Scoruri H
50
Army General Clasification Test
100
Scala Wechsler (pentru subteste)
10
College Board Scholar Aptitude
500
Scoruri Stanine
5
Graduate Record Examination
500
Scoruri STEN
5,5
California Entrance Examination 500
Board
Scoruri T
50
%>scor
6,5
1
16
15
14
20
3
100
2
100
2
100
10
21,89 30,92
99,76 97,20
58,82
19,50
47,85
59,70
37,08
90,15
66,31
5,26
78
19 37,4
= 2,83 . Pentru obinerea scorurilor T
6,5
10
( X m).
Pentru obinerea scorurilor H (sau scoruri Hull), formula va fi foarte apropiat de cea
14
precedent, avnd o singur modificare: H = 50 +
( X m) .
Dac facem transformri ale unei distribuii observate care nu deviaz semnificativ de la
exigenele curbei Gauss-Laplace obinem o nou distribuie n care quasitotalitatea valorilor variaz
ntre 3 i +3, obinndu-se valori cu zecimale. Dac transformarea se face n variabile T, noile date
obinute vor varia ntre 20 i 80, iar dac conversiunea se face n variabile H se vor observa valori care
variaz ntre 0 i 100. Aceste note vor avea un plus de comoditate n utilizare. Optarea pentru un
anumit tip de conversie a datelor nsemn i optarea pentru aceste limite de oscilaie, indiferent ce
amplitudini au distribuiile notelor brute ale diferitelor teste aplicate pe diferite eantioane i indiferent ce
medii i abateri standard utilizm. Am amintit anterior condiia ca aceste date brute s se distribuie
apropiat de o distribuie normal. Denumirea frecvent a conversiunilor bazate pe utilizarea mediei i
abaterii standard este de scoruri standard.
n obinerea unor etaloane de bun calitate intervin constrngeri de reprezentativitate i de
cost. Exist o nevoie justificat de a le reactualiza periodic, date fiind schimbrile temporare care se
observ mai ales n randamentul la probele cognitive (autorii de specialitate vorbesc de o accelerare
biologic i intelectual a dezvoltrii). Dup 1980 s-au produs teste psihologice computerizate care
beneficiaz prin program de o reetalonare permanent, odat cu introducerea unor noi date n memoria
calculatorului. Scorurile standard prezint avantajul de a prezerva forma distribuiei msurilor originale.
Din nefericire, dac aceast distribuie nu este normal, interpretarea scorurilor nu este n nici un fel
facilitat prin transformare.
Un punctaj al unei distribuii de valori brute care a fost obinut prin transformare liniar are
semnificaie statistic clar. Poziia relativ care este indicat de o anumit valoare standard a unei
distribuii de valori nenormalizate depinde n ntregime de forma distribuiei. Cu ct mai mult o distribuie
de scoruri se apropie ca de o distribuie normal Gauss, cu att mai sigur poate fi interpretat o valoare
standard n distribuie.
n scopul de a obine o semnificaie statistic clar a scorurilor individuale, este realizat
adesea o normalizare a distribuiei.
ntr-o distribuie normal Gauss, se tie exact cte procente de subieci exist deasupra,
respectiv dedesubtul unei valori pe o scal de o anumit medie i o anumit unitate de msur. Aceast
calitate este exploatat la prezentarea rezultatelor testelor psihologice n selecie i consiliere. Atenia
nu este concentrat pe comparaia ntre diferite niveluri ale scalei, ci pe poziia relativ pe care un
individ o ocup ntr-o distribuie ale crei proprieti sunt cunoscute.
O normalizare poate s fie realizat i din alte motive. Cnd vrem s lucrm cu diferite
diferene inter i intraindividuale trebuie s prezentm poziiile indivizilor n valori ale unei scale de
interval. Nici o piedic insurmontabil nu poate s apar la construcia instrumentelor de msur, dac
acestea trebuie s msoare variabile de randament, care ofer de regul distribuii normale. ns, la alte
tipuri de variabile este mai greu de realizat o distribuie normal. Exemplu, acele variabile care sunt
msurate cu ajutorul unui inventar de personalitate sau chestionar de atitudini. Chiar cnd acceptm
79
AUREL STAN
premisele teoretice ale distribuiei normale a variabilei cercetate pe un continuum ipotetic, obinem, de
regul, puternice distribuii asimetrice. n acest caz, asimetria este semnificativ, n alte cazuri poate fi
mai puin evident, ns noi nu putem s apreciem n aceast situaie, dac valorile brute indic poziia
indivizilor pe o scal de interval.
Cnd acceptarea distribuiei normale este ndreptit i cnd se obine o distribuie asimetric
a valorilor brute, aceasta semnific c instrumentul de msur nu indic ndreptit poziia relativ. n
astfel de cazuri putem s normalizm distribuia asimetric a valorilor obinute, aceasta nseamn
transformarea formei distribuiei, nct s obinem o distribuie normal a valorilor.
n cazul n care avem distribuii care deviaz semnificativ de la distribuia teoretic GaussLaplace, putem normaliza aceste distribuiii prin repartizarea variabilelor ordonate n limite impuse de
procentele teoretice ale distribuiei amintite anterior. Prezentm un tabel cu rezultate care sunt
normalizate:
Nr.crt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
X
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Valoare brut
f
Fc
7
7
4
11
8
19
6
25
13
38
16
54
7
61
11
72
19
91
13
104
24
128
14
142
6
148
16
164
7
171
4
175
Fcpm
3,5
9
15
22
31,5
46
57,5
66,5
81,5
97,5
116
135
145
156
167,5
173
p
0,020
0,051
0,085
0,125
0,180
0,262
0,328
0,380
0,465
0,557
0,662
0,771
0,828
0,891
0,957
0,988
Tabelul 23. Tabelul conine n coloanele sale datele necesare pentru a normaliza o distribuie.
Semnificaia simbolurilor din capul coloanelor este urmtoarea:
X variabila brut distribuit pe variante de variaie;
f frecvena simpl absolut;
fc frecvena cumulat absolut
fcpm frecvena cumulat de punct mediu exprimat n valori absolute;
P- proporie care se obine prin mprirea fiecrei valori din coloana fcpm la valoarea numrul total al
subiecilor (175)
z valoarea variabilei centrate reduse care separ ntr-o curb normal Gauss proporia respectiv de
subiecii de valoarea complementar pn la 100. Valoarea z egal cu 2,05 separ primii 2% din
subieci de restul 98%
Indiferent de transformarea aleas trebuie s fim contieni de limitele acestora. Cuantilajele
au meritul simplitii care conduce la a amplifica diferenele minime ntre subiecii din centrul distribuiei
(acolo unde se gsesc cei mai muli dintre subieci) i de a atenua aceste diferene la extremitile
80
distribuiei (care nu comport dect foarte puini subieci). Normalizarea pare s posede numeroase
avantaje: msurile transformate sunt de nivel de interval i se distribuie normal, ceea ce faciliteaz
interpretarea i aplicarea de metode de analiz care cer normalitatea distribuiilor (analiz de varian,
regresie multipl).
Totui, nu trebuie uitat c aceast metod duce la schimbarea formei distribuiei, fr ca s
aib totdeauna raiunea teoretic de a o face. Transformarea msurilor originare permite de a ameliora
interpretarea care poate fi fcut unui scor. Transformrile normative sunt cele mai cunoscute i cele
mai vechi. Ele sunt legate de interesul pentru diferenele interindividuale. Transformrile legate de
cadrul de referin predictiv i mai ales la msurile de referin criterial sunt opuse, cteodat n
manier ideologic msurilor normative (este vorba de a lupta contra ierarhizrii subiective care permit
msuri normative).
n practic, nu exist transformri bune i transformri rele. Diferitele metode aduc informaii
de natur diferit. Nevoile concrete ale psihologului practician sau ale cercettorului sunt cele ce impun
alegerea celei mai bune forme de transformare a notelor brute.
BIBLIOGRAFIE
Albu, Monica, 1998, Construirea i utilizarea testelor psihologice, Editura CLUSIUM.,1998 Cluj
Bernier, J.J., Pietrulewicz, B., 1997, La psychometrie, Gaetan Morin Editeur, Montreal, Paris,
Casablanca
Botez, C., 1971, Utilizarea testelor pentru depistarea si aprecierea aptitudinilor profesionale, n
"Revista de Psihologie", t.17, nr.1/1971, Editura Academiei, Bucureti
Cosmovici, A., 1971, Aplicarea testelor pentru determinarea nivelului de dezvoltare intelectuala, n
"Revista de Psihologie", t.17, nr.1, Editura Academiei, Bucuresti
Guillevic, Ch.,Vautier, S., 1998, Diagnostic et tests psychologique, Nathan, Paris
Holban, I., 1995, Testele de cunotine, Editura didactic i pedagogic, R.A., Bucureti
Horst, P., 1971, Messung und Vorhersage.Eine Einfhrung in die psychologische Testtheorie,
Verlag Julius Beltz, Weinheim, Berlin, Basel
Huteau, M., Lautrey J., 1995, valuer lintelligence, Presses Universitaire de France, Paris
Laveault, D., Gregoire, J., 1997, Introductions aux theories des tests en sciences humaine, De
Boeck & Larcier, Departament de Boech Universite, Paris, Bruxelles
Lienert, G.A., 1967, Testaufbau und Testanalyse, Verlag Julius Beltz, Weinheim/Berlin
Lussato, Ariane, 1998, Les tests de recrutement, Presses Universitaires de France, Paris
Magnusson, D., 1969, Testtheorie, Verlag Frank Deuticke Wien
Miclea, M., 1994, Psihologie cognitiv, Casa de Editur Gloria S.R.L., Cluj-Napoca
Mitrofan, N., 1998, Testarea psihologic a copilului mic , Editura All, Bucureti
Radu, I., 1991, Metode de cercetare n psihologie, n Introducere n psihologia contemporan
(coord. I. Radu), Editura Sincron, Cluj
81
AUREL STAN
82
Rost, J., Golombock, Susan, 1989, Modern Psychometrics. The science of psychological
assessement, Routledge, London and New York
Roca, Mariana, 1972, Metode de psihodiagnostic, Editura Didactic i pedagogic, Bucureti
Stan, A., 2002, Testul psihologic, Editura Polirom, Iai
Stan, A., Hvrneanu, C., 1989, Utilizarea calculatorului n examinarea psihologic n Revista de
Psihologie, Editura Academiei, Bucureti
Szamoskzi, ., 1997, Psihometria clasic i evaluarea formativ, n "Cogniie, creier,
comportament", Volumul I, nr.2, iunie 1997, Cluj Napoca.