Sunteți pe pagina 1din 80

BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

CAPITOLUL 1
INTRODUCERE
1.1. Psihodiagnoza, domeniu de vocaie al profesiunii de psiholog
O revist literaturii privind principala activitate a profesiunii de psiholog
clinician scotea n eviden, acum dou decenii, un ntreg spectru de preocupri,
dintre care evaluarea i psihodiagnoza deineau cea mai mare pondere (50%), urmate
de psihoterapie (30%), de cercetarea tiinific (30%), de consiliere (5%) i de
terapia de mediu i socioterapie (5%) (vezi Ionescu, 1985, p. 51).
Plasarea n top a psihodiagnozei nu este specific numai domeniului clinic, ci
ntregului teritoriu al psihologiei aplicate, pentru c, prin instrumentele ei nalt
standardizate, ea ofer o cunoatere de adncime asupra fiinei umane, pe care se pot
fundamenta ulterior consilierea, psihoterapia sau ghidarea vocaional. Afirmaia lui
Perse (1972, p. 112), conform creia la ora actual, examenul psihometric constituie
partea cea mai important a interveniei psihologului () metoda testelor fiind poate
singura datorit creia specificitatea i autonomia sa nu sunt contestate i pstreaz
i astzi valabilitatea, cu meniunea c termenul de testare ar trebui completat cu acela
mai cuprinztor de evaluare.
mprtim punctul de vedere al lui Kaplan i Saccuzzo (1993, p. iii) care i
exprim mhnirea pentru c prea muli studeni din colegii vd cursul de testare
psihologic ca plictisitor i nelegat de obiectivele lor sau de interesele lor pentru
carier. nsi evoluia psihologiei, prin ruperea ei din trunchiul disciplinelor
speculativ-filosofice spre cele practic-aplicative, este marcat de intrarea ei n
laborator n 1879, prin Wundt i de supunerea la rigoarea tiinific a experimentului,
tendin continuat de Galton, cu al su laborator de antropometrie din 1884, sau de J.
McKeen Cattell care, n 1888, propunea termenul de teste mintale, ce urmau s fie
aplicate n laboratorul su de testare.
Recursul la experiment a fost indisolubil legat de apelul la cifr, la cuantificare
i msurtoare, care fceau ca psihologia s i dezvolte instrumente precise de
investigaie, metode din ce n ce mai elaborate de analiz a datelor rezultate, ce
confereau cunoaterii psihologice rigoare, exactitate i generalitate. Este deci cu totul
surprinztor faptul c acest curs de evaluare-testare psihologic, care pregtete
studentul pentru ceea ce va fi partea fundamental a profesiunii sale, s fie gsit
plictisitor, ceea ce s-ar putea explica eventual prin faptul c aceste domeniu de
supraspecializare a devenit din ce n ce mai tehnic, ncorpornd procedee de lucru i
proceduri statistice sofisticate, care de multe ori estompeaz frumuseea lui
provocatoare. Acest impediment nu poate fi depit dect prin faptul ca profesorul s
fie el nsui un practician cu mult experien, astfel nct printre rnduri s se simt
freamtul problemelor vii, al implicrii profunde i devotate ntr-o profesie care a
devenit, prin toate acestea, o vocaie.
1.2. Psihodiagnoz, testare i evaluare
Psihodiagnoza este un concept foarte puin sau deloc utilizat de coala anglo-
saxon i aceasta probabil din cauza nedoritei apropieri a acestui termen de acela de
diagnostic, creat i consacrat de practica medical. n acest spaiu cultural a fost
folosit extensiv termenul de testare (testing), pentru a circumscrie teritoriul
cunoaterii exacte i obiective, de tip psihometric a persoanei, dei n ultimele decenii
cel de evaluare (assessment) a ctigat tot mai mult teren. i aceasta din mai multe
motive:
Chiar dac din capul locului testele au fost destinate unor scopuri nu doar
constatative sau exclusiv tiinifice (de cunoatere), ci i-au propus s aduc o
schimbare benefic n viaa oamenilor, ele au generat o anumit aprehensiune,
rezisten sau chiar o reacie advers. Deoarece testele i itemii ce le compun au
fost pstrai departe de ochiul public, ca de altfel i procedurile de scorare,
interpretare i utilizare a rezultatelor, ele au creat un val de mister ce a generat
team n rndul publicului larg, cu att mai mult cu ct utilizarea lor a cunoscut o
adevrat explozie ntre cele dou rzboaie mondiale.
Psihologii s-au vzut constrni de reglementrile legale din domeniu, de teama
publicului larg fa de teste (i de consecinele acesteia) s priveasc cu interes i
spre alte instrumente ale profesiunii lor (interviul, ancheta, studiul de caz etc.),
testul rmnnd instrumentul cel mai elaborat, n mna examinatorului cu o foarte
nalt calificare, la care are acces dup stagii riguroase de pregtire, asistat,
controlat i certificat de specialiti recunoscui.
Evaluarea psihologic (assessment) a devenit termenul integrator, el fiind
conceput ca o rezolvare de probleme, deoarece fiecare variabil din natur este
rezultatul combinrii unor factori diferii, de unde necesitatea unor metode variate
(printre care i testele), depinznd de obiectivele, scopurile sau circumstanele n
care se desfoar procesul evaluativ.
Testarea psihologic a devenit specific unor scopuri mai nguste i mai bine
circumscrise, n timp ce evaluarea este mai larg, prediciile i deciziile ei
bazndu-se pe o multitudine de surse.
Ca i obiective, testarea nu i propune s rspund la ntrebarea cum proceseaz
persoana o anumit informaie, fiind centrat pe produs (rezultatul la test) i nu pe
proces (maniera de a ajunge la acel rezultat).
Evaluarea (inclusiv cea formativ) ncearc s neleag o problem n cadrul ei
ecologic mai larg, de unde i spectrul mult mai extins de informaii utilizate
(observaia naturalist, vizita la domiciliu, ancheta, interviul sau simpla discuie
cu prinii, profesorii i reprezentanii autoritii). Ea nu dezavueaz procedurile
standardizate, tipice testrii, dar fiind contient c acestea nu pot rspunde la
toate ntrebrile, valorizeaz i informaiile colaterale (stil de via, atmosfer
familial, interaciunile din grup etc.).
Relaia cu clientul este diferit n testare, unde poate s existe o legtur
discontinu, multiplu mediat sau chiar absent (n testarea de grup) sau o mai
mic responsabilitate legal a examinatorului fa de cel examinat. n evaluare
relaia este una de fa-n-fa, cu responsabiliti explicite din partea
examinatorului de a desfura o activitate n folosul clientului su.
n practic, distincia nu este aa de tranant, aa cum arat Cohen, Swerdlik i
Smith (1992), termenii fiind deseori utilizai ca echivaleni i interanjabili, dei
distincia dintre ei trebuie pstrat. Iat cum definesc autorii citai evaluarea
psihologic (assessment): proces de strngere i de integrare a datelor
psihologice, corelate scopului de a face o evaluare psihologic, utiliznd
instrumente ca testele, interviul, studiul de caz, observaia comportamental i
aparate special destinate, mpreun cu procedee de msurtoare adecvate (p. 11).
Deoarece n terminologia romneasc nu s-a impus termenul de testare i nici
cel de evaluare, pentru circumscrierea domeniului termenul consacrat fiind cel de
psihodiagnostic, ca i n unele dintre rile francofone, vom face distincia dintre
diagnosticul medical i cel psihologic. Dup cum se tie, medicul identific o anumit
boal, prin mijloace clinice (observaie, anamnez, interviu clinic, examen somatic
sau psihic etc.) i paraclinice (analize de laborator, radiografie, echografie etc.) pentru
a o introduce ntr-un cadru nosologic i a formula un tratament. Schema consacrat de
mai bine de un secol pentru multe din domeniile medicinei este: diagnostic etiologic
(viznd cauza bolii), patogenetic (mecanismele ei de producere), diagnosticul pozitiv
(raportarea semnelor la un sindrom) i diferenial (raportarea la entiti apropiate din
cadrul nosografic mai general). Toate acestea nu numai pentru a circumscrie boala, ci
pentru a stabili un prognostic i un tratament adecvat.
n psihologie, diagnosticul utilizeaz de asemenea o multitudine de mijloace,
dintre care doar unele standardizate: testul, interviul, studiul de caz, observaia
comportamentului, tehnici derivate din metoda experimental, ca reacia
electrogalvanic, reflexul fotopupilar sau timpul de reacie ori cel de laten.
Sursele majore ale informaiilor sunt analiza comportamentelor, a activitii i
a produselor acestora, studiul expresiei i al conduitei verbale (chiopu, 1976). Marea
diferen n raport cu diagnosticul medical este aceea c n psihodiagnoz se are n
vedere terenul psihologic nealterat al omului de pe versantul normalitii (excepie
fcnd munca psihologului din clinica neuropsihiatric), pentru a face bilanul
caracteristicilor psihice definitorii.
n viziunea Ursulei chiopu, psihodiagnoza este un act de analiz psihologic
a unui caz i, concomitent, o sintez logic ce permite organizarea contient a
msurilor generale de influenare a dezvoltrii personalitii cazului considerat (op.
cit., p. 33). Elementul comun este aadar succesiunea dintre latura constatativ
(diagnostic) i cea prognostic-ameliorativ i formativ (personalitatea optimal,
selecia omului potrivit pentru locul potrivit, personalizarea interveniei etc.). n acest
sens psihodiagnoza este elementul de baz al psihologiei difereniale, pe care a i
fcut-o posibil.
Dei ocup un teritoriu extrem de important al psihologiei aplicate, din care s-
a nscut i pe care a dezvoltat-o continuu, psihodiagnoza nu se ntlnete definit ca
atare n dicionarele de psihologie, dup cum nici noiunile de testare i de evaluare,
care o circumscriu, nu sunt definite. Eventual ele rein accepiunea iniial a
termenului propus de ctre Herman Rorschach, dup care psihodiagnosticul este o
metod de explorare a personalitii, bazat pe interpretarea liber de forme
accidentale, cum ar fi petele de cerneal, ca n Dicionarul de psihologie Larousse, al
lui N. Sillamy (1996, p. 244), sau ca n Dicionarul de psihologie al lui Doron i Parot
(1999, p. 624). Niciunul dintre ele nu definete termenul de diagnostic psihologic, dat
ca i titlu unei lucrri de referin a lui Richard Meili (Manual psihodiagnostic, 1964),
dar nici pe aceia de testare-evaluare, n accepiunea american a termenilor utilizai de
numeroi autori (Anastasi, Cronbach, Gregory, Aiken, Kaplan, Saccuzzo etc.), pentru
a-i numi lucrrile lor.
n Dicionarul encilcopedic de psihologie din 1997, coordonat de Ursula
chiopu, reinem definiia termenului care exprim chiar viziunea autoarei, dup care
diagnoza psihic se refer la omul viu i concret i const dintr-o cunoatere
complex a acestuia prin tehnici psihologice, aplicate conform unei strategii, ce
permit colectri de informaii organizate privind persoana dat (op. cit., p. 542).
Termenul de psihodiagnostic este prezent i la Mariana Roca (Metode de
psihodiagnostic, 1974) i la ali autori clujeni care, n deceniul al optulea au editat un
valoros ndrumtor psihodiagnostic, n mai multe volume. Acesta a fost un foarte
preios ghid pentru psihologul practician, cci coninea nu numai elemente de natur
teoretic despre exigenele examinrilor psihologice, ci prezenta o diversitate de
instrumente practice, adaptate i etalonate pe populaie romneasc. Lucrare
remarcabil prin preocuparea ei de a oferi elemente de sprijin practic muncii
psihologului a fost Aptitudinile i msurarea lor, a lui Bontil, editat de Centrul de
documentare i publicaii al Ministerului Muncii n 1971.
Lucrrile mai noi, de dup revoluia din 1989, par a evita ns termenul de
psihodiagnostic, ele vorbind de Construirea i utilizarea testelor psihologice (Albu,
1998), despre Cunoaterea psihologic a persoanei (Havrneanu, 2000), despre
Evaluarea n actul educaional terapeutic (Vlad, 1999) sau despre Testarea
psihologic a copilului mic (Mitrofan, 1997). Doar Valentina Horghidan mai conserv
un concept care pare s devin inactual, cel de psihodiagnostic, n lucrarea intitulat
chiar Metode de psihodiagnostic (1997). n aceasta autoarea include o multitudine de
metode, pe lng clasicele test i chestionar aprnd i observaia, convorbirea,
ancheta, experimentul, scalele de evaluare a abilitilor, metoda aprecierii obiective a
personalitii, fia de caracterizare psihopedagogic a elevului i chiar metodele
sociometrice. Se produce astfel o lrgire exagerat de mare a cadrului metodologic al
acestei discipline ce tinde s-i subsumeze prin nglobare ntreaga metodologie a
tiinei psihologice, cu deschidere i spre sociologie.
Opinm c termenul tradiional de psihodiagnostic poate fi pstrat, pentru c el
include i pe cel foarte tehnic i consacrat de testare (testing), destinat determinrilor
cantitative, dar i pe cel de evaluare (assessment), desemnat s completeze i s
nuaneze diagnosticul cu elemente calitative. Dar, pentru c testul psihologic rmne
instrumentul su cel mai tehnic i cel mai puternic, cu o evoluie neegalat de niciuna
dintre celelalte metode, genernd o adevrat tiin legat de construcia i aplicarea
sa, credem c centrul de greutate al acestei discipline a pihologiei aplicate,
psihodiagnoza, trebuie s rmn testarea psihologic.
1.3. Marile domenii ale psihodiagnosticului
Prima arie n care s-a produs dezvoltarea i utilizarea testelor mentale (pentru
a respecta termenul propus de Cattell) a fost cmpul educaional, coala, prin bateria
creat i publicat de Binet i Simon n 1905. La peste un secol de la lansarea primei
Scale metrice a inteligenei, coala rmne n continuare marele beneficiar al
psihodiagnozei. Utilizarea acesteia pe terenul educaiei a avut i are i astzi funcii
complexe:
Depistarea copiilor cu o dotare intelectual submedie (debilitate mintal, intelect
de limit), sau cu alte caracteristici neuropsihiatrice, pentru a li se crea condiii
favorabile de tratament psihopedagogic difereniat, prin coli speciale sau prin
integrarea lor n nvmntul de mas.
Depistarea supradotailor, pentru instituirea unei pedagogii a excelenei
(curriculum difereniat).
Diagnosticarea problemelor de nvare i a celor comportamentale (de conduit),
pentru a stabili programe educaionale adecvate.
Selecia educaional prin teste standardizate la colegii sau universiti (nu ca o
procedur unic i exclusiv, ci n asociere cu alte metode, cum ar fi scrisorile de
recomandare, mediile din timpul anilor de studiu la anumite discipline colare,
interesele elevului n afara colii etc.).
Testele educaionale (docimologice sau de cunotine), pentru a verifica fie gradul
de atingere a obiectivelor operaionale, fie pentru a face un diagnostic local,
regional sau naional al nvmntului nsui ca sistem, fie pentru a detecta
cunoaterea minim prin posesia creia se poate face o certificare a educaiei
primite ntr-un ciclu sau tip de coal.
Prin intermediul psihodiagnosticului colar se poate asigura personalizarea
nvmntului i tratarea difereniat a elevilor, determinarea nevoilor de educaie,
orientarea colar i profesional, selecia elevilor pentru programe speciale,
determinarea potenialului de nvare i promovarea metodelor de diagnostic
formativ, controlul i autocontrolul procesului educativ, surprinderea elementelor
motivaional-afective legate de nvare, radiografierea grupului i a dinamicii sale
etc.
Credem c zona celei mai vaste i mai fructuoase ntlniri dintre tiina testelor
(psihometria) i tiina examinrii (docimologia, doxolgia sau docimastica) este cel al
evalurii. Chiar randamentul colar, ca raport dintre aptitudinile, interesele elevului i
gradul de acoperire al obiectivelor operaionale, exprimate prin calificative, note sau
medii colare, este locul unde testarea psihologic i cea educaional se ntlnesc n
modul cel mai fericit.
Domeniul sntii, n general, i cel al sntii mintale n special, presupune
o fericit sintez ntre funcia de psihometrician a psihologului clinician i cea de
diagnostician, unde contribuia lui rmne esenial i fundametal (Ionescu, op.
cit., p. 55), cu cea de psihoterapeut i de cercettor. n echipa medic-psiholg, cel din
urm ar avea o situaie privilegiat n cercetare, unde el nu face, asemenea
medicului, un examen, nu acord o consultaie, ci ntreprinde o investigaie, el
desfoar o activitate de explorare, ceea ce i asigur un statut special n cercetere
(idem, p. 59). Locul psihologului nu este numai n clinica de boli nervoase, deoarece
prezena sa n sntate duce la o reconsiderare a actului medical n ansamblul su prin
repunerea n drepturi a subiectivitii bolnavului. De aceea asistm la o extindere
progresiv a ariei de competen a acestui tip de specialist, i simultan a calitii
prestaiei sale, motiv pentru care n multe dintre rile vestice stagiile de formare
pentru psihologul clinician sunt pe deplin comparabile cu cele ale medicului, pentru a
nu mai aduce n discuie importana acordat pregtirii psihologice a medicului nsui.
Psihologul clinician intervine diagnostic i terapeutic n:
Aprecierea normalitii/anormalitii dezvoltrii neuropsihice a copilului i
adolescentului (clinica pediatric).
n investigarea dezordinilor de personalitate, a strilor reactiv-anxioase, a
tentativelor de suicid sau a strilor de criz.
n comportamentul deviant, asocial, antisocial sau delictual.
n diagnoza i tratamentul tulburrilor alimentare (anorexie, obezitate, bulimie).
n evaluarea dezordinilor neurologice sau psihiatrice, prin calculul indicelui de
deteriorare, ca i n recuperarea unor funcii mintale deteriorate parial sau total.
n diagnoza i recuperarea problemelor produse de involuie, sau de patologia
asociat mbtrnirii.
n expertizarea capacitii de munc sau a deficienelor de intelect pentru
acordarea certificatelor de persoan handicapat.
Domeniul sntii este cel n care funcia diagnostic i cea prognostic sau
recuperatorie se ntlnesc plenar, fcnd din psiholog nu numai un om care aplic
teste (de inteligen, memorie, personalitate, aptitudini, valori, interese etc.), ci un
specialist care acumuleaz o experien preioas n prevenie i n terapie, oriunde
intervine o disfuncie, sau acolo unde ea nc nici nu exist, pentru a face posibil nu
numai personalitatea optimal, ci i pe cea maximal.
n toate aceste domenii s-a conturat o zon de elecie a muncii psihologului,
cea de consiliere, a sfatului avizat, pentru o tot mai mare diversitate de situaii. Cum
ar putea fi acest copil mai puin conflictual n grup? Ce carier ar fi cea mai potrivit
pentru persoana X? Ce activiti i s-ar putea recomanda dup pensionare lui Y, pentru
a se potrivi cu structura sa cognitiv i cu interesele sale? Cum ar putea depi
solicitrile prea stresante o personalitate de tip A, pentru a preveni un infarct? Dar
diabeticul sau hemofilicul ce anse au s coabiteze cu aceste boli cronice? Sau ce
risc exist pentru un cuplu care are un copil cu o boal genetic (sindrom Down, de
exemplu) de a avea un al doilea copil cu aceeai afeciune (sfat genetic)?
Domeniul muncii ofer un cmp de aciune imens psihodiagnosticianului, care
trebuie:
S evalueze fora de munc, pentru a face o selecie n domeniul profesiunilor.
S previn fluctuaia forei de munc i s limiteze accidentele de munc.
S avizeze periodic activitile cu risc crescut (lucrul la nlime, portul de arm
etc.).
S ofere criterii valide de promovare i s ajute la construirea carierei.
S identifice structura aptitudinal, cea a factorilor de personalitate i a intereselor
pentru a ajuta la reprofesionalizare, adic la reconversie profesional.
S asiste tehnic reciclarea i reprofilarea, ntr-o lume n care schimbarea devine
condiia sa permanent.
S contribuie la ameliorarea climatului de munc prin cunoaterea dinamicii
grupurilor.
S se implice n adaptarea omului la main i a mainii la om (aspecte ce in de
ergonomie, destinat s amelioreze mijloacele puse la ndemna muncitorilor i s
le fac compatibile cu caracteristicile lor fiziologice i psihologice).
n lumea afacerilor testarea i evaluarea psihologic au o pondere n cretere
accentuat, deoarece de ele beneficiaz ntreg domeniul resurselor umane: selecia
funcionarilor i a celorlali angajai se bazeaz pe teste de aptitudini, achiziii,
interese, motivaii, valori, care ajut nu doar la angajare, ci i la promovare, transfer,
creterea performanelor, satisfacia muncii, alegerea pentru stagii de formare
aprofundat. Studiul comportamentului consumatorului, marketingul i vnzarea
produselor, managementul, reclama etc., toate intr n aceast sfer a lumii afacerilor,
care are foarte multe suprapuneri cu cea a muncii, a educaiei i a sntii. De fapt,
toate domeniile activitilor umane, de la cele deja amintite, la transporturi, armat,
poliie i pn la creaie i art beneficiaz de ctigurile din zona diagnosticului i a
evalurii psihologice.
Nu exist nici un domeniu al activitilor umane, nici un fel de manifestare a
umanului care s nu poat servi ca punct de plecare pentru diagnoza psihic.
Remarcabil este faptul c n acest domeniu experiena practic i cercetarea tiinific,
ce duce la cristalizri teoretice, se presupun permanent. Iat cuvintele generoase ale
promotoarei psihodiagnosticului n Romnia, Ursula chiopu: Prin diagnoza psihic
se pune naturii umane o ntrebare, se caut un rspuns care devine ntr-un fel valabil
pentru mai ample probleme eseniale privind personalitatea uman. Actul diagnozei
psihice este doar momentul prim al unei activiti mai complexe, aceea de recuperare
i de recondiionare psihologic a capacitii umane i a dimensiunilor funcionale
optime ale personalitii umane (op. cit., p. 45). Aceasta nseamn c un
psihodiagnostician bun nu iese ca atare de pe bncile facultii, de unde el ia doar
cadrul general al pregtirii sale. El se formeaz n timp, prin acumulare de experien
practic divers (diagnostic, formativ i terapeutic), de cunoatere teoretic pentru
a putea pune ordine i extrage informaie relevant din datele culese. Un bun
psihodiagnostician are n spate ani de munc, fiiere cu mii de cazuri care i ofer
baza de date pentru construcia de bareme i etaloane aduse la zi, are instrumente
diverse i verificate practic, cu care poate s rezolve o gam larg de probleme
concrete. Formarea sa prin zeci de ore de practic pe lng un psiholog experimentat
i certificarea competenei sale sunt alte aplicaii importante ale psihodiagnozei.
1.4. Probleme etice ale psihodiagnozei
Discuiile n legtur cu responsabilitile sociale ale muncii psihologului au
fost frecvent reluate la majoritatea congreselor internaionale, fiind concretizate ntr-
un cod deontologic al Asociaiei Internaionale a Psihologilor, la care i Romnia a
aderat.
Trebuie s artm c perioada de dezvoltare exploziv a testelor standardizate
n America dintre cele dou rzboaie mondiale a avut mai multe consecine practice,
printre care i publicarea unei sinteze bibliografice, mereu rembogit, numit
Educational, Psychological and Personality Tests of 1933 and 1934, care va fi de fapt
prima ediie a ceea ce mai trziu se va numi Mental Measurements Yearbook (Buros,
1938), ce lista miile de teste aprute, sortndu-le tematic, dar i dup criterii de
calitate i performane tehnice.
Interesul pentru copii supradotai s-a revigorat odat cu lansarea n spaiu de
ctre fosta Uniune Sovietic a primului satelit Sputnik (4 octombrie 1957), cnd, la un
an, Congresul american a alocat sume importante pentru crearea de teste de abiliti i
de aptitudini n graba de a detecta studeni dotai i talentai academic (Cohen,
Swerdlik i Smith, 1992, p. 53).
Extinderea programelor de testare pe scar larg, combinat cu utilizarea
excesiv a testelor de aptitudini i de personalitate n toate domeniile, au redeteptat
ngrijorarea public legat de utilizarea i eficiena testelor psihologice. Primele
Recomandri tehnice pentru testele de achiziii au fost publicate de Asociaia
Psihologilor Americani (APA, datnd din 1895) n anul 1954, precedate fiind de
Standardele etice ale psihologilor (1953) i urmate de Standarde pentru testele
educaionale i psihologice i manualele lor n 1966. Acestea vor fi urmate de
Principiile etice ale psihologilor (1981) i de o Caset cu principiile psihologilor
(1987) sau de un Cod al practicilor de testare n educaie (1988). Recomandri
speciale au fost fcute n legtur cu testarea membrilor minoritilor culturale i
lingvistice, a persoanelor cu dizabiliti, ca i n legtur cu nou apruta ramur a
administrrii, scorrii i interpretrii computerizate a testelor.
Standardele din 1985 indic i cteva dintre drepturile celor testai.
Dreptul de a-i da consimmntul asupra testrii: cu ce instrumente sunt
testai, cum vor fi utilizate datele i cui vor fi remise informaiile despre
rezultatele obinute.
Dreptul de a fi informat asupra rezultatelor: pentru a contrabalansa tendina
ncetenit de a da celui testat ct mai puine informaii despre performana sa
(cu scopul de a nu produce o cretere a anxietii sau de a nu genera o criz),
s-a hotrt s se dea un feedback mai realist subiectului, centrat nu numai pe
rezultatele pozitive obinute de el, ci i pe cele negative.
Dreptul la non-invazia vieii intime, private: exist o informaie privilegiat,
protejat prin lege, cum ar fi cea obinut din relaia avocat-client, medic-
pacient, preot-credincios, so-soie i psiholog-client.
Dreptul la cea mai puin stigmatizant etichetare, care s nu lezeze demnitatea
uman a clientului.
Dreptul de pstrare a confidenialitii datelor: utilizatorul trebuie s-i ia
toate precauiile n depozitarea acestora n spaii ncuiate, n dulapuri de oel
sau n computere parolate, care s limiteze accesul doar la persoanele
autorizate.
O parte dintre aspectele prezentate mai sus se regsesc stipulate i de legislaia
altor ri n care practica profesiei de psiholog a atins anumite standarde. Astfel,
Societatea Francez de Psihologie a creat un cod deontologic similar celui american,
cu precizarea unor reguli de conduit moral ce pot fi considerate de valoare
universal. Redm doar cteva dintre ele, pentru o posibil analiz comparativ,
inclusiv cu legislaia romneasc.
Etica profesional stipuleaz c n exercitarea profesiunii, psihologului i este
interzis orice act sau cuvnt care ar putea aduce atingere demnitii umane.
Secretul profesional, care trebuie pstrat n vorbe, n conversaie sau n
depozitarea documentelor n legtur cu tot ceea ce psihologul a vzut, a auzit
sau a neles n cursul practicii sale.
Respectul altuia: psihologul nu trebuie s se foloseasc de mijloace
profesionale pentru a-i asigura avantaje personale.
Informarea tiinific este un principiu care stipuleaz obligaia psihologului
de a se informa continuu asupra evoluiei cunotinelor din domeniul su i s
aib grij de a comunica tiina sa ct mai complet posibil, ntr-un spirit de
exactitate i de adevr.
Autonomia tehnic oblig psihologul s rezilieze orice angajament pentru care
nu se simte apt prin tehnicile pe care le deine, el avnd n ntregime
responsabilitatea alegerii metodelor pe care le folosete.
Independena profesional, care nu neag munca de echip a psihologului, ci
prevede doar faptul c el nu trebuie s accepte condiii care ar putea s ating
independena sa profesional, adic l-ar mpiedica s aplice principiile
deontologiei profesionale.
Consecin a legii 213/2004 care reglementeaz profesia de psiholog n
Romnia, a fost elaborat i un Cod deontologic al profesiei de psiholog cu drept de
liber practic care instituie regulile de conduit profesional ale practicianului sau
cercettorului din acest domeniu de activitate. Codul deontologic este destinat n mod
expres orientrii i reglrii doar a acelor activiti n care psihologii sunt angajai
profesional, i nu se refer la viaa particular a acestora, care poate fi luat n discuie
doar atunci cnd aceasta ar aduce prejudicii profesiei de psiholog.
Codul deontologic se sprijin pe urmtoarele principii fundamentale:
Respectarea drepturilor i demnitii oricrei persoane: prin activitatea lor
profesional psihologii respect tririle, experienele, valorile, opiunile
celorlali. Ei nu prejudiciaz imaginea public a clienilor lor i vor utiliza un
limbaj care indic respectul autentic al demnitii umane. Utilizarea
informaiilor obinute pe cale profesional nu se va face niciodat n
detrimentul drepturilor fundamentale ale omului, fie el beneficiar de servicii
psihologice, participani la cercetare, angajai sau studeni.
Principiul responsabilitii profesionale i sociale: psihologii vor ncuraja
starea de bine a clienilor lor i vor respecta dreptul acestora de a sista, fr
nici o justificare, participarea la serviciul furnizat sau la activitile de
cercetare, n calitate de subieci. Psihologii vor participa direct la dezvoltarea
psihologiei ca tiin, prin meninerea celor mai nalte standarde n materie,
dar i la dezvoltarea societii n general. Ei vor respecta legile i
reglementrile societii sau comunitii n care triesc i vor face tot posibilul
pentru a fi impuse i respectate standardele i principiile etice.
Principiul integritii profesionale: potrivit acestui principiu psihologul nu va
practica nici un fel de discriminare. El vor promova acurateea, obiectivitatea
i onestitatea sau buna credin n raporturile cu clienii lor. De asemenea, el
va evita recompensele exagerate, conflictele de interese care i-ar reduce
imparialitatea sau care ar putea aduce atingeri profesiei sale sau imaginii
celorlali psihologi. El va fi deschis i va recunoater cu onestitate limitele
propriilor competene.
n mod foarte explicit, codul deontologic analizeaz cteva categorii de
standarde etice generale, cum ar fi cel al competenei, standardele cu privire la
relaiile umane, standardele de confidenialitate, standardele de conduit colegial,
standardele de nregistrare, prelucrare i pstrare a datelor, standardele relative la
onorarii i taxe, ca i standardele pentru declaraii publice i reclam. O categorie
special o constituie standardele specifice, care se refer n mod explicit la educaie
i formare profesional, la evaluare i diagnoz, la cercetarea tiinific i la
valorificarea rezultatelor acesteia.
Astfel, pentru evaluare i diagnoz sunt formulate prevederi exprese despre
prezentarea caracteristicilor psihologice, condiiile de utilizare a testelor psihologice,
obinerea consimmntului pentru evaluare/ diagnoz, construcia instrumentelor,
interpretarea rezultatelor, calificarea necesar pentru a dezvolta o testare/ evaluare,
responsabilitile legate de administrarea instrumentelor i prezentarea rezultatelor
pentru cei evaluai, ca i respectarea dreptului de proprietate intelectual. Codul
deontologic furnizeaz indicaii la fel de detaliate pentru cercetarea tiinific i
valorificarea rezultatelor acesteia, n acord cu standardele internaionale existente
relative la obinerea acordului de a dezvolta o cercetare, obinerea consimmntului,
utilizarea suporturilor de nregistrare audio-video, evitarea unor categorii de subieci,
utilizarea animalelor n cercetare, plagiat, abuz de status, transmiterea i protejarea
datelor, onestitatea tiinific i regulile de bun conduit n cercetarea tiinific.
CAPITOLUL 2
TESTUL PSIHOLOGIC, INSTRUMENTUL DE BAZ
AL PSIHOLOGIEI APLICATE
2.1. Scurt istoric al apariiei i dezvoltrii testelor
Nici o alt metod a psihologiei aplicate nu a avut o contribuie mai efectiv n
impunerea ei n aproape toate domeniile de activitate uman, dar i n declanarea
unor dispute care au culminat cu o puternic atitudine antitest, iniial n fosta
U.R.S.S., apoi n Statele Unite ale Americii (ara n care practica testelor a luat cea
mai mare amploare), dar i n rile de Jos, ulterior. Este de aceea ntemeiat
metafora Ursulei chiopu, care consider testul copilul scandalos al psihologiei, ce
mai tulbur i astzi spiritele (1976, p. 104).
Intuit nc de Francis Galton la sfritul secolului al XIX-lea, care a ncercat
fr succes s dezvolte un test pentru a determina abilitile mintale prin msurarea
unor caracteristici perceptual-motrice, termenul a fost introdus n psihologie n 1890
de James McKeen Cattell. Consacrarea metodei testelor vine ns prin Alfred Binet,
care folosete Scara Metric a Inteligenei (1905) pentru determinarea dezvoltrii
intelectuale a copiilor, extinderea utilizrii lor datorndu-i-se lui Munsterberg
(determinarea aptitudinilor n vederea seleciei profesionale).
La mai mult de un deceniu (1916) de la publicarea testului Binet, Louis
Terman de la Universitatea Stanford a elaborat versiunea englez a acestuia,
cunoscut sub numele de Scala Stanford-Binet. Chiar dup aceast dat Henry
Goddard a realizat propria sa traducere a acestei scale, dei anterior (nc din 1912) el
dezvoltase o metod de determinare a defectivitii mintale prin testarea imigranilor
i selectarea acelora care urmau s fie deportai. Incluznd probe care cereau
familiarizarea cu scrisul, dar i cu cultura american, Goddard a descoperit (1917) c
peste 80% din imigrani erau defectivi mintal, dnd i un clasament pe naiuni Era o
prim utilizare greit a testelor, dar nu i ultima.
n timpul primului rzboi mondial (1917, 1918), o echip de psihologi, care l-a
inclus i pe Goddard, a dezvoltat dou baterii de teste pentru selecia primar i
repartizarea pe arme a recruilor: Army Alpha Test i Army Beta Test, pentru cei care
aveau o bun, respectiv slab posesie a limbii engleze. Aplicate n condiii de stres,
improprii dup standardele de astzi (camere aglomerate, instructaj greu audibil de
ctre toi subiecii), rezultatele acestor teste l-au determinat pe Robert Jerkes s
concluzioneze c vrsta mintal, pentru 47% dintre recrui, nu depea 13 ani
Statistici tiinifice, ntemeiate pe astfel de date oferite de testri n mas, au dus la
apariia Legii Imigraiei din SUA anilor 1924, care stabilea cote de imigraie pentru
diferite naiuni, dup rezultatele obinute la testele aplicate anterior altor imigrani.
Rezultatele la teste au fost de asemenea utilizate de unii pentru a argumenta
segregarea negrilor i, n unele state, unii oameni, dup scorul testelor de QI, au primit
eticheta de 'imbecil' i au putut fi sterilizai mpotriva dorinei lor, sau chiar fr ca ei
s tie (Bernstein, Roy, Srull i Wickens, 1988, p. 372).
Toate acestea nu au putut ns opri evoluia testului psihologic, a crui
extindere progresiv a fcut ca rolul su s fie considerabil i n cretere i azi. Copil
al altor metode, cum ar fi observaia i experimentul, testul a nsemnat un progres
enorm n metodologia cunoaterii structurii individuale i prin aceasta a condiionat
extinderea aplicaiilor psihologiei i consolidarea pe baz experimental a psihologiei
difereniale (Holban, 1973, p. 142). i aceasta deoarece testele au o valoare practic
dovedit, generat mai ales de precizia, obiectivitatea i relevana informaiilor
obinute. Testele psihologice au un mare randament, ofer, n condiii de costuri
materiale i de timp sczute, o informaie care ar fi fost greu de obinut prin alte
metode. Astzi este tot mai evident c nu testele nsei trebuie incriminate, deoarece
la captul unei lungi evoluii au standarde foarte nalte relative la elaborare, utilizare
i interpretare, incomparabile cu oricare alt metod, ci modul lor de utilizare. Ele
sunt doar instrumentele perfecionate ale psihologiei aplicate, dar maniera lor de
folosire depinde n principal de utilizator, i nu de caracteristicile lor intrinseci.
2.2. Definirea testelor
Termenul test este preluat din limba englez, unde to test nseamn a pune
la prob, a ncerca, chiar dac, pe filiera latin, cuvntul exista i n limba romn
(testamentul este un mod de probare a voinei cuiva n legtur cu destinaia bunurilor
sale dup moarte). Mai mult, termenul nu este specific psihologiei: medicina folosete
tuberculina pentru a testa reacia organismului la bacilul Koch, chimia are testul
hrtiei de turnesol, fizica testul descompunerii luminii i analiza spectrografic iar
sociologia testeaz opinia public prin chestionare. n sens larg, chiar o ipotez sau o
teorie tiinific devin valide prin testarea lor n realitate (o eclips de soare a testat
ipoteza curbrii razei de lumin n preajma corpurilor cu mase mari, element central al
teoriei lui Einstein), n timp ce Freud sau psihologia cognitiv vorbesc de capacitatea
unei persoane de a testa realitatea.
Pentru a surprinde specificul testelor i al testrii psihologice, vom semnala
cteva definiii, aceasta deoarece nici n aceast privin nu s-a ajuns la un consens.
Testul este deci:
Prob, instrument pentru diagnosticarea de caracteristici psihice (chiopu,
Dicionar enciclopedic de psihologie, 1997).
Prob utilizat mai ales n psihologia diferenial, care permite descrierea
comportamentului unui subiect ntr-o situaie precis definit (instructajul testului),
prin raportare la comportamentul unui grup de subieci plasai n aceeai situaie
(Grand dictionnaire de psychologie, 1994).
Msurtoare obiectiv a unui eantion de comportament (Anastasi, 1976).
Procedeu sistematizat de msurare a comportamentului unor persoane i de
descriere a acestuia cu ajutorul unor scri numerice sau a unui sistem de categorii
(Cronbach, 1966).
Prob determinat, implicnd o sarcin de executat, identic pentru toi subiecii
examinai. Dispune de o tehnic precis pentru aprecierea succesului i pentru
notarea numeric a reuitei (Piron, 1963).
Situaie standardizat, servind drept stimul unui comportament. Acest
comportament este evaluat i comparat statistic cu al altor persoane plasate n
aceeai situaie, ceea ce permite clasarea subiectului, fie cantitativ, fie tipologic
(Pichot, 1984).
Procedur standardizat prin care se formeaz un eantion de comportament care
va fi descris prin categorii sau scoruri. n plus, multe teste au norme sau standarde
care fac posibil utilizarea rezultatelor n predicia altor comportamente, mai
importante (Gregory, 1992).
Instrument al metodei experimentale, organizat sub forma unor probe
standardizate din punct de vedere al coninutului, al condiiilor de aplicare i al
modalitii de apreciere a rezultatelor, instrument care este folosit n stabilirea
unei anumite variabile (Holban, 1973).
Vom reine din aceast multitudine de definiii elementele sintetice cele mai
semnificative, eseniale pentru nelegerea specificului unui test psihologic care:
este prob, procedur, procedeu sau instrument standardizat;
care servete drept stimul pentru producerea i msurarea unui eantion de
comportament;
care va fi apreciat prin raportarea i compararea cu o populaie de referin, testat
n condiii identice, n raport cu care s-a construit sistemul de apreciere (barem,
etalon, norme, categorii tipologice);
funcia lui fiind n acelai timp diagnostic (apreciaz starea de fapt), dar i
prognostic (anticipeaz categorii viitoare de comportamente mai importante
dect cele msurate efectiv);
pentru ndeplinirea acestor funcii ele trebuind s aib caliti psihometrice
specificate (fidelitate, validitate, sensibilitate sau for de discriminare).
2.2.1. Eantionul de comportament
Ca i biochimistul, care ia un eantion de snge sau mostre de ap din locuri
diferite pentru a determina, prin analize, starea de sntate sau potabilitatea apei,
psihologul alege pentru testare eantioane mici, dar cu grij selecionate, din
comportamentul unei persoane. Aceasta deoarece el trebuie nu numai s
diagnosticheze, ci mai ales s fac predicii valide. Cum investigarea
comportamentului n totalitatea sa este imposibil, cu att mai mult cu ct el se
desfoar pe scara timpului, avnd doar o constan relativ, psihometricianul trebuie
s aleag eantioane de comportament mai mici, dar strns i semnificativ legate de
comportamentul marii mase studiate. Aceast unitate ia n test forma itemului, ce este
constituit dintr-o situaie stimul care solicit un rspuns ce poate fi evaluat separat de
restul testului (Albu, 1998).
Nu este obligatoriu s existe o coresponden sau o similaritate foarte mare
ntre comportamentul prezis i itemii testului: n timp ce corespondena dintre proba
de examen la conducerea auto i conducerea efectiv este deplin, un test proiectiv
poate prezice, din mrimea, forma, culoarea sau micarea invocate n rspunsurile la
test, importante caracteristici ale personalitii celui examinat. Testul nu este nici
analitic, nici sintetic, ci analog cu situaia real, n sensul c modeleaz coninutul
psihologic al activitii reale, dar nu i forma exterioar a acestuia, afirm
Havrneanu (op. cit., p. 90). Aceasta ne ndreptete s afirmm c dincolo de
deosebirile de form, trebuie s existe o identitate intern sau de coninut ntre test i
sarcina real n raport cu care se face predicia, de unde rezult i valoarea
constructiv a testului.
Aa cum apreciaz Anne Anastasi, de multe ori predicia se bazeaz pe
diagnosticul unui potenial sau capaciti: nici un test psihologic nu poate face mai
mult dect s msoare un comportament. Dac un asemenea comportament poate
servi ca un indicator efectiv al altui comportament, acesta poate fi determinat numai
prin cercetare empiric (1976, p. 25).
2.2.2. Standardizarea
Standardizarea este o condiie fundamental a testului psihologic, unde orice
variaie a condiiilor produce o variaie a rezultatelor. Standardizarea se refer att la
coninut (proba este identic cu sine nsi n ce privete nu numai coninutul itemilor,
dar chiar i forma lor de prezentare i foaia de rspuns), ci i la condiiile de aplicare
(asemnarea pn la identitate dintre condiiile n care s-a experimentat i cele n care
se aplic proba) i n modul de corectare, cotare i apreciere a probei de ctre
autorul, respectiv utilizatorul unui test. Fiind o metod de baz a psihologiei
difereniale, testul poate fi considerat variabila independent prin care o nsuire
psihic (variabila dependent) este observat prin examinarea persoanelor care sunt
testate (pstrarea constanei situaiei, elementul de variabilitate fiind persoanele).
Deoarece n psihologie pluri-determinarea face dificil izolarea fenomenelor,
cerina uniformitii i a identitii de procedur este mai stringent ca n alte
domenii. Pentru a asigura uniformitatea, autorul testului d indicaii precise i
detaliate despre cum se administreaz i cum se scoreaz rezultatele testului, indicaii
ce vor fi respectate foarte strict, pentru c altminteri rezultatele culese nu vor mai fi
compatibile cu cele obinute pe eantionul standard (de etalonare sau eantion
normativ). Materialele folosite, modul lor de prezentare, instructajul subiecilor,
limitele de timp, demonstraia prealabil, modul de manevrare a materialelor, toate
sunt specificate i respectate ntocmai. Uniformitatea se refer i la rata vorbirii
examinatorului, la tonul, inflexiunile vocii sau expresia sa facial.
Deoarece un test nu are indicatori predeterminai pentru aprecierea succesului
sau a eecului, un alt aspect al standardizrii se refer la norme, adic la stabilirea
valorilor medii (normale) ale performanelor, n funcie de care, plecnd de la
scorurile brute (numrul de itemi rezolvai corect, timpul, viteza, numrul de erori
etc.) se stabilesc scorurile standard. Aceasta presupune activitatea de etalonare, care
se face pe loturi mari, reprezentative statistic, crora li se determin media, mediana,
abaterea standard, frecvenele brute i cumulate, n funcie de care se stabilesc cotele
standard. Performana oricrui individ nou examinat va fi raportat la acest cadru de
referin. Pentru ca acest lucru s fie posibil este obligatorie uniformitatea i
identitatea procedurilor de aplicare a testului n noul caz, cu situaia de etalonare
originar.
2.2.3. Fidelitatea
Dac cineva i-ar msura greutatea, citind la un cntar 80 de kg., iar la altul 92
de kg. n aceeai zi, nu ar ti nici care este greutatea sa real, nici care dintre cntare
este bun (dac este vreunul). Cu att mai mult ne vom ndoi de indicaiile cntarului
respectiv cu ct, la dou msurtori succesive ale aceleiai persoane, el va indica
valori diferite. Un test, ca oricare alt scal de msurare, trebuie s fie fidel, adic egal
cu sine nsui, rezultatele unor msurtori repetate trebuind s fie cel puin stabile,
dac nu identice.
Cu ct fidelitatea unui test este mai mare, cu att mai mare siguran avem c
rezultatele lui sunt reale, nefiind n mod semnificativ afectate de schimbri aleatoare,
cum ar fi contextul, situaia de testare, starea subiectului, particularitile
examinatorului etc. Utilizat n psihometrie, termenul de fidelitate (reliability n
englez) ntotdeauna nseamn consisten, afirm Anastasi (1972, p. 27).
Exist modaliti speciale de determinare a fidelitii. Acestea sunt:
Procedura test retest (corelaia dintre rezultatele aplicrii aceluiai
test, n aceleai condiii, acelorai subieci, eventual de ctre acelai
examinator, n dou momente de timp diferite, la distan relativ scurt, pentru
a nu aprea modificri n structura parametrului investigat).
Calculul corelaiei dintre rezultatele unui test i forma sa paralel,
alternativ (n cazul n care ea exist), aplicat n condiii identice.
Tehnica njumtirii (split-half), prin care jumtatea par a unui test
(itemii cu numr par) este pus n corelaie cu jumtatea lui impar. Exist i
alte metode de njumtire.
Corelaia ntre modul n care psihologi diferii scoreaz acelai test,
aplicat acelorai persoane, n aceleai condiii (fidelitatea interscoreri).
2.2.4. Validitatea
Un test poate s fie fidel fr a fi ns i valid, nsuire care se refer la faptul
c el msoar efectiv ceea ce i-a propus. Nici un test nu are validitate sczut sau
ridicat n mod absolut, deoarece aceasta depinde de maniera n care el este utilizat.
Galton a ncercat s determine ntr-o manier corect acuitatea perceptiv sau
sensibilitatea la durere, dar acestea s-au dovedit a nu fi determinri valide ale
inteligenei, aa cum el a presupus.
Spre deosebire de fidelitate, care se poate determina relativ uor, validitatea are
nevoie de acumulri graduale de informaie, din foarte diferite tipuri de investigaii.
Deoarece este un proces progresiv, dependent de timp, este mai potrivit s spunem c
un test se valideaz, validitatea fiind acea determinare care permite s spunem n ce
msur el i ndeplinete funciile pentru care a fost proiectat, n raport cu diversele
sale domenii de aplicaie. Prin validitate, testul se testeaz pe sine, fcnd apel la
diverse criterii externe, pentru a determina dac prediciile sale au fost valabile i n
ce msur, n funcie de care vom ti ce ncredere s i acordm.
Efectiv, validitatea (ca i fidelitatea), este o corelaie care se poate stabili n trei
feluri:
1. Msura n care un test acoper un domeniu, adic validitatea de coninut. Un
test de cunotine poate acoperi un mic sector al matematicii, sau unul larg, caz
n care el este mai valid n raport cu acest domeniu.
2. Msura n care scorurile la un test sunt n acord cu teoria care susine trstura
sau constructul msurat, adic validitatea de construct.
3. Msura n care testul coreleaz cu un alt test independent, recunoscut ca un bun
instrument de msur al aceluiai domeniu (inteligen, memorie, personalitate
etc.), ceea ce reprezint validitatea relativ la criteriu. Cnd scopul testului
este predicia unui anumit comportament, criteriul va fi msurtoarea viitoarei
performane i corelarea ei cu testul iniial, n acest caz vorbind de validitatea
predictiv. Aceasta este o form fundamental de validitate, pentru c de cele
mai multe ori psihodiagnoza are n vedere prognoza, adic anticiparea
rezultatelor. Unii detractori ai metodei testelor susin c cea mai bun predicie
a rezultatelor unei munci sau a unei activiti ar fi rezultatele obinute ntr-o
perioad de timp n chiar munca sau activitatea respectiv. Aceasta ar face
inutil chiar activitatea de selecie, dar aceast idee nu poate fi utilizat practic
din cauza marii cheltuieli de timp i bani presupuse de punerea ei n aplicare.
La aceste trei caracteristici: standardizarea, fidelitatea i validitatea testelor, se
adug i sensibilitatea sau fora discriminativ, ct i ideea de standardizare,
etalonare i norm, ce vor fi tratate mai detaliat n capitolele urmtoare, ntruct de ele
depind nelegerea i buna utilizare a acestor puternice instrumente psihodiagnostice,
care sunt testele psihologice.
2.3. Administrarea testelor
Necesitatea de a avea stabilite proceduri detaliate sau doar orientative pentru
administrarea i scorarea testelor psihologice i educaionale a fost recunoscut de
toate organizaiile care se ocup cu testele. American Educational Research
Association a stabilit 180 de standarde care accentueaz asupra importanei
uniformitii n administrarea i scorarea testelor. Procedurile de testare depind fie de
tipurile de teste (individuale sau de grup, cu i fr limit de timp, cognitive, afective
sau de personalitate, psihologice sau educaionale etc.), fie de subiecii supui
examinrii (vrst, sex, cultur, grad de motivaie, anxietate etc.).
Formarea specialitilor care vor administra teste este una de durat, se face sub
supravegherea unui psiholog cu experien i presupune caliti personale dublate de
cunotine detaliate despre instrumentele psihometrice utilizate. Cum variabilele
situaionale au o pondere n rezultatul final, ele trebuie controlate ct mai complet
posibil.
2.3.1. ndatoririle examinatorului nainte de administrarea testelor
Pentru a prentmpina efectul de surpriz (neindicat), testele psihologice vor fi
programate i anunate din timp, pentru a evita plasarea lor dup mas, n timpul
programului de joac sau n concuren cu alte activiti mai interesante.
n acord cu particularitile de vrst, dac edina de testare ar putea depi o
jumtate de or la grdini, o or n primul ciclu coalar i o or i jumtate n al
doilea ciclu colar, atunci se vor organiza mai multe edine. n cazul testelor
educaionale elevii vor fi anunai din timp, pentru a se putea pregti fizic (odihn),
emoional i intelectual. Acolo unde este cazul, se va cere consimmntul scris, care
este un acord de principiu al examinatului sau al reprezentantului legal al acestuia c
el consimte s fie examinat. n rile avansate aceast problem este reglementat prin
lege.
Tot ca o faz preparatoare este i pregtirea prealabil a examinatorului, care
trebuie s fi parcurs el nsui testul o dat, apoi s memoreze la nuan i n detaliu
instruciunile, pentru a nu avea nesiguran i ezitri n aplicarea acestuia. Pentru a
crea o atmosfer informal, calm i destins (mai ales n examinrile individuale) el
trebuie s pregteasc i s verifice cu minuiozitate materialele necesare, reducnd
la minimum cutarea i organizarea lor n timpul edinei de testare. Dac va folosi
aparate, verificarea bunei funcionri i calibrarea lor periodic sunt obligatorii. n
examinrile colective (de grup), fiecare caiet de test, foaie de rspuns, creioane sau
instrumente necesare trebuie atent verificate. Familiarizarea cu procedurile de
examinare presupune practica asistat de specialistul calificat, care poate merge de la
simpla observaie, pn la peste un an de instruire supervizat.
Asigurarea condiiilor satisfctoare de testare oblig psihologul s verifice
condiiile de ordin fizic (aezare, iluminare, ventilare, temperatur, nivelul
zgomotului) i psihice, prin care examenul s se desfoare confortabil. Anunul: Se
testeaz! V rugm, nu deranjai! va descuraja pe cei din exterior s inoportuneze,
dei prezena unui supraveghetor la u, i chiar ncuierea ei pe perioada sesiunii de
testare, ar fi i mai de dorit.
Dac n cazul examenelor individuale (mai costisitoare, dar i mai
edificatoare) se pot controla mai uor variabilele externe, examinatorul alegnd o
camer linitit, potrivit scopului i lucrnd singur cu subiectul (chiar dac uneori
prezena printelui, a reprezentantului legal sau a poliistului se impune), n
examinrile colective precauiile vor fi mult mai mari, n special datorit larg
rspnditei tendine de a tria sau de a fi incorect, care poate vicia semnificativ
rezultatele. Pentru aceasta exist mai multe msuri de siguran ce pot fi luate:
distribuirea de teste cu acelai coninut, dar aezate n forme diferite, prezena unui
numr suficient de supraveghetori atent instruii, care vor descuraja activ sau prin
simpla lor prezen tendina spre fraud. Acetia sunt cu att mai necesari cu ct
grupul este mai mare, iar importana testrii (miza ei) este mai ridicat, fiind de mare
ajutor n distribuirea i colectarea materialelor, n secretizarea foilor de rspuns (cnd
se impune) i la supraveghere pentru preveniia oricrei situaii nedorite.
Detalii aparent nesemnificative cum ar fi forma pupitrului, tipul de foi de
rspuns utilizate (indicate a se folosi pentru subieci de peste 11 ani, pentru c ele
ncetinesc considerabil viteza de parcurgere a testului), prezena sau nu a ncurajrilor
sau a comentariilor examinatorului, pot afecta performana la un test i de aceea
standardizarea procedurii de aplicare a acestuia trebuie s mearg pn la cele mai
mici nuane. Orice modificare a acesteia trebuie notat i luat n calcul la
interpretarea rezultatelor.
2.3.2. Faza de administrare a testelor
Examenul i testarea efectiv pun probleme specifice, una dintre cele mai
importante fiind stabilirea relaiei (raportului) examinator subiect (subieci). Primul
va trebui s declaneze interesul, curiozitatea i cooperarea explicit a celui examinat.
Testele de abiliti trebuie s aduc subiectul n situaia de a da cea mai bun
performan posibil a sa, pe cnd la testele de personalitate, la chestionarele de
opinii, atitudini i valori, obinerea sinceritii rspunsurilor este fundamental. La
testele proiective, evocarea liber, fr cenzur, este factorul cel mai important.
Problemele motivrii, constana n lucru, evitarea negativismului i a distragerii
ateniei presupun tehnici de stabilire a contactului bine exersate. Copiii (cu precdere
cei mici) i btrnii, persoanele vulnerabile sau cele foarte ruinoase, timide, din
medii defavorizate sau aparinnd altor culturi ori etnii, creeaz probleme specifice.
La acestea se mai adaug delincvenii, recidivitii, deinuii, bolnavii psihic (n special
psihopaii, dar i anxioii, emotivii, depresivii, schizoizii i persoanele paranoiace),
care pot dezvolta suspiciune, indiferen, atitudini marcate de cinism, agresivitate sau
nesinceritate.
Dac la vrsta colar mic prezentarea testului ca un joc poate fi soluia
optim, la cea colar mare prghiile cele mai indicate sunt prezentarea testrii ca pe o
competiie cu sine i cu ceilali iar la liceeni stimularea nevoii de stim i de prestigiu.
De asemenea, familiarizarea prealabil cu sarcini asemntoare celor din edina de
testare ar putea fi folosit ca mijloc de reducere a tensiunii anxioase. Examenul
adulilor pentru ocuparea unor posturi, selecia n anumite profesii sau pentru cursuri
de calificare reclam mult tact, pruden i experien din partea psihologului.
n timpul desfurrii examenului psihologic, examinatorul va trebui s aib
mult grij n a urmri cu strictee procedurile standardizate de aplicare a testelor,
neavnd voie s dea nici un fel de indicaii, lmuriri suplimentare sau ajutoare, altele
dect cele stipulate n mod expres de manualul testului. Excepie fac edinele pentru
determinarea potenialului de nvare (strategie formativ definit i de Feuerstein n
1987), cnd se dau ajutoare n plus fa de cele prevzute, dar i acestea ntr-o form
standardizat, cuantificabil, pentru ca prin calculul diferenei fazei pre-test i post-
test s se determine n mod obiectiv acest potenial de nvare.
Examinatorul trebuie s rmn n alert, pentru a rezolva orice problem
urgent care apare, s fie flexibil n atitudine, cu sensibilitate i rbdare mai ales
pentru subiecii care au probleme (handicapai, hiperkinetici, copii mici, timizi etc.).
Aiken (1997) face cteva recomandri valabile pentru aceste categorii speciale:
psihologul s asigure timp suficient celui examinat pentru a nelege i
rspunde;
s permit suficient antrenament la itemii simpli, pregtitori;
s foloseasc perioade mai scurte de testare;
s observe oboseala i anxietatea i s le ia n calcul;
s sesizeze i s noteze deficienele perceptiv-motrice (defectele de auz, vz,
motrice, lateralizarea invers);
s foloseasc generos ncurajarea i ntrirea pozitiv;
s nu foreze subiectul s rspund cnd el nu mai dorete.
n timpul testrii, mai ales la testele cu rspunsuri la alegere din mai multe
posibiliti sau variante, este posibil ca o parte dintre rspunsurile bune s poat fi
efectiv ghicite, sau determinate prin ceea ce Aiken numete deteptciunea n test
(test wiseness). Prin aceasta se elimin opiunile nepotrivite, prin semne adiionale
scpate n formularea itemilor, ce permit judeci comparative ntre opiuni. Exist
tehnici speciale de ameliorare a performanelor la anumite teste, nu prin pregtirea
specific n domeniu, ci prin respectarea unor reguli (Aiken, op. cit., p. 57).
2.3.3. Faza post-test
Dup terminarea edinei de testare, examinatorul colecteaz i pune n
siguran materialele de testare i foile de rspuns. D mici bonusuri, recompense
copiilor sau celor mai anxioi sau vulnerabili. Uneori informeaz prinii sau persoana
n cauz despre utilitatea ce va fi dat rezultatelor testului. De asemenea el promite s
furnizeze informaiile rezultate persoanei sau ageniei care l-a angajat. n caz de
examen colectiv, psihologul i ajutoarele sale colecteaz toate materialele utilizate n
examen, se asigur c nimic nu lipsete i abia dup aceea permite retragerea
subiecilor, dup care el va pune n ordine foile de rspuns i se va pregti s le
scoreze.
2.4. Examinatorul i variabilele situaionale
Exist muli stimuli externi ambigui care trebuie luai n considerare sau
controlai de ctre examinator. Copiii precolari pun probleme speciale
examinatorului, ca i btrnii, emotivii, ruinoii, anxioii sau vulnerabilii.
Vrsta, sexul, rasa, statusul social, economic i cultural, experiena,
antrenamentul, aparena exterioar i altele sunt de luat de asemenea n calcul n ceea
ce privete diferenele pe care examinatorul nsui le poate introduce. Uneori chiar
nivelul lui de expectaie poate genera profeia care se automplinete sau efectul
Rosenthal.
Situaia de examinare are i alte faete. Anne Anastasi arat c recruii abia
ncorporai dau rezultate mai slabe dac sunt examinai imediat dup ncorporare, fr
s fi avut timp s se acomodeze cu noul mediu. Uneori activitile imediat precedente
i pun amprenta asupra performanei la test. Feedback-ul pozitiv sau negativ dat de
examinator pe parcursul desfurrii testului poate ameliora sau diminua rezultatele
finale. Chiar dac ponderea acestor factori nu este foarte mare, ntr-un program de
testare bine conceput examinatorul trebuie s fie foarte atent la ei pentru a le minimiza
influena. Probleme suplimentare apar i atunci cnd o edin de testare este
precedat de un antrenament practicat cu teste similare.
Deoarece practica testelor a luat o amploare extrem de mare n toat lumea i
deoarece multe decizii importante se bazeaz pe rezultatele obinute la teste, edituri
specializate sau firme i ofer serviciile n antrenarea candidailor. ntr-o manier
similar cu a iluzionitilor care fac publice secretele confrailor, sau cu a
informaticienilor care introduc virui n programele calculatoarelor, psihologii au
czut n propria curs, ceea ce i oblig la precauii suplimentare ce fac din
psihodiagnoz un domeniu tot mai tehnicizat i mai sofisticat.
CAPITOLUL 3
DIFICULTATEA I SENSIBILITATEA UNUI TEST
PSIHOLOGIC SAU EDUCAIONAL
3.1. Dificultatea unui test
Aplicarea unui test psihologic sau educaional ridic o problem tehnic foarte
important i anume dac el este adecvat, ca i grad de dificultate, populaiei sau
grupului respectiv. Dac este prea uor, majoritatea scorurilor la test vor fi mari i
curba rezultat, n form de j, va fi asimetric spre dreapta; dac va fi prea greu,
curba n form de i va fi asimetric spre extrema stng. Se apreciaz c testul este
adecvat unei populaii doar n cazul n care repartiia scorurilor sale este simetric,
genernd o curb de tip gaussian.
Problema dificultii unui test se pune i n funcie de tipul acestuia. Dac el
este un test de aptitudini, capaciti, deprinderi sau cunotine, aceast problem este
mult mai relevant dect pentru testele de personalitate sau chestionarele de opinii,
atitudini, interese, valori, caz n care termenul de dificultate ar putea fi nlocuit cu cel
de accesibilitate.
Dificultatea testului depinde simultan de coninutul su, ca i de
particularitile subiecilor investigai, ceea ce face ca n construirea unui asemenea
instrument s existe o faz iniial (definirea testului, crearea bncii de itemi i
construirea unei variante preliminare a acestuia), o faz intermediar (administrarea
testului, analiza rezultatelor obinute i, prin analiza de itemi, depistarea erorilor,
corectarea, reelaborarea, selectarea i ordonarea itemilor) i o faz final (creararea
normelor, a etaloanelor i elaborarea manualului testului, vezi Albu, 1998, p. 199).
Dac testele de aptitudini i de cunotine aplicate adulilor iau n considerare
un proces ncheiat, variabilitatea fiind dat mai ales de studii, profesie sau sex, cele
mai multe teste de inteligen, memorie, aptitudini speciale i cunotine, aplicate
copiilor sau adolescenilor, au n factorul vrst cea mai important surs de
variabilitate. n acest sens, elementele de dificultate ale testului trebuie s evolueze
paralel cu vrsta (s aib indice genetic, dup expresia lui Claparde), n cadrul
fiecrei vrste el trebuind s aib o ct mai bun acoperire a spectrului domeniului
investigat. Aceasta trimite la puterea de discriminare a testului, adic la sensibilitatea
lui.
Un test este uor sau greu n situaia cnd unitile lui, fiind foarte puternic
corelate ntre ele (test omogen), creeaz posibilitatea ca majoritatea itemilor s fie
rezolvai ori corect, ori greit, ceea ce va da curbe asimetrice spre dreapta sau spre
stnga. Exist i posibilitatea ca populaia s cuprind dou grupuri distincte, care vor
da scoruri polarizate dup o curb bimodal (cu dou cocoae), ca n cazul testelor
dihotomice: masculinitate-feminitate, extraversiune-introversiune, stabilitate-
instabilitate, admis-respins. Multe teste de selecie profesional nu urmresc
ierarhizarea de finee a persoanelor, ci ruperea grupului n categorii extreme: apt-
inapt, admis-respins, capabil-incapabil. Aici testele folosite vor fi mai mult centrate pe
dificultate (mic, medie, mare) i mai puin pe sensibilitate sau putere de discriminare.
Aplicate la nceputul sau la sfritul unui proces de formare, acelai test poate poate
avea o curb iniial n form de i (cnd deprinderea nc nu exist), n form de j
(cnd n final aceasta s-a cristalizat pentru majoritatea subiecilor), ntre care se
interpune o repartiie normal, simetric, pentru perioada intermediar (vezi Albu, op.
cit., p.185).
3.2. Sensibilitatea unui test
Asemenea lentilelor, a cror calitate depinde n principal de puterea lor de
separaie (numrul de linii independente discriminate pe o suprafa de un centimetru
ptrat), sau a balanelor de finee, ca cele analitice, capabile s dea subdiviziuni din ce
n ce mai fine i continue pn la a cincea zecimal, caz n care se spune c sunt foarte
sensibile, testele psihologice au aceast caracteristic n funcie de numrul claselor
pe care le pot delimita n interiorul unui grup. Cu ct numrul valorilor de scor este
mai mare, cu att ele discrimineaz (difereniaz) mai bine ntre indivizi.
n afara acestei accepiuni, Kline (1993) leag sensibilitatea unui test de
capacitatea sa de a produce scoruri diferite pentru subiecii care difer ntre ei n ce
privete caracteristica msurat. Deoarece sensibilitatea conjug caracteristicile
testului cu cele ale populaiei msurate, vom remarca faptul c testele mai lungi, cu
itemi gradai ca dificultate (deci neomogeni) sunt mai sensibile, pentru c ele produc
mai multe clase, i deci mai multe valori ale scorurilor. Prin contrast, testele scurte
sau cu itemi foarte omogeni, genereaz mai degrab categorii de scor dihotomice,
foarte contrastante, deci ele sunt puin discriminative. Depinznd de forma repartiiei
pe care o d scorurilor sale, testul cu curbe atipice (i, j sau bimodal) sunt puin
sensibile n zonele de mare aglomerare a scorurilor i sensibile n rest: curba lui Gauss
este tot mai discriminativ spre extreme, i tot mai puin sensibil pe poriunea sa
central, unde aglomerarea rezultatelor d un numr mai mic de scoruri.
Exist o legtur foarte puternic ntre dificultatea unui test i sensibilitatea sa.
La fel cum n fotografie filmele foarte sensibile (care se impresioneaz la cantiti
mici de lumin) pltesc un pre n ceea ce privete calitatea imaginilor (mai puin nete,
deoarece imaginea este tradus pe pelicul prin grupuri mai mari de puncte), sau la fel
ca n metrologie, unde balana analitic i dovedete utilitatea pentru greutile mici,
iar nu pentru kilograme sau tone, testele psihologice trebuie s stabileasc un raport
optim ntre dificultate i sensibilitate.
Sensibilitatea presupune, pe de o parte, o ct mai bun acoperire a domeniului
de coninut al variabilei, pentru care testul trebuie s aib grade diferite ale dificultii,
pe de alt parte discriminarea de finee la nivelul fiecrui palier de dificultate
considerat. Pentru a exemplifica, testele de inteligen WISC sunt operaionale de la
5-6 ani la 14-16 ani, pentru fiecare an dndu-se etaloane din 4 n 4 luni. Dar, n timp
ce anumite subteste ale bateriei (Informaii, Comprehensiune) dau un larg evantai de
scoruri, nct etaloanele nu au goluri, altele (Cifrele, Labirinturile), din cauza
numrului mic de itemi care le compun, discrimineaz foarte grosier pe anumite
poriuni ale scalei, la anumite vrste. Subtestul Cuburilor, o foarte valid expresie a
inteligenei concret-spaiale, compus din 10 patternuri ce pot da (n forma iniial) 55
de puncte de scor, are un prag nalt de intrare n prob la vrstele mici (5-6 ani), unde
nu distinge fin coeficienii de inteligen mai mici de 80, i un prag jos la vrste mari
(peste 13 ani), unde nu mai distinge supradotaii (QI > 125/130). Pentru bateria
WISC, combinarea optim a celor dou caracteristici (dificultatea cu sensibilitatea) se
face pentru vrstele de 11-13 ani, unde ea are cea mai mare for discriminativ i
deci cele mai bune caliti psihometrice (Zimmerman i Woo-Sam, 1973). n mod
similar, testul PM 38 (Matricile Progresive Standard ale lui Raven) are un prag nalt
de intrare n prob la 5-7 ani i unul jos dup 14 ani, deci nu distinge bine insuficiena
ori supradotarea mintal, la vrstele mici, respectiv mari.
Sensibilitatea testelor depinde de muli factori (care pot fi identificai i prin
analiza de itemi), dintre care amintim:
Numrul itemilor, care, aa cum am artat, creeaz posibilitatea stabilirii
numrului de clase de scor, progresiv cu creterea acestuia. Numrul maxim de
clase este chiar numrul de itemi, atunci cnd ei nu sunt echivaleni sau
intercorelai. Dac lum exemplul testelor de inteligen, acestea ar trebui s
msoare QI-uri de la 40 la 160, avnd o lungime a amplitudinii scorurilor (cea
care trebuie s acopere ntreg spectrul de variaie) de 120 de uniti. Dac
subtestul are 40 de itemi, nseamn c cea mai fin rezoluie este de 3 uniti de
QI pentru un item; dac am avea, ca la subtestul Cifre, 8 itemi pentru prezentarea
direct i 7 pentru prezentarea invers, nseamn c 120/(8+7) = 8, adic fiecare
item acoper 8 uniti de QI, ceea ce nseamn o discriminare mult mai grosier,
n care orice eroare de aplicare ar putea avea consecine nsemnate asupra scorului
la acest subtest. Pe de alt parte, este aproape imposibil a genera un test cu
maxim sensibilitate (un punct de QI s fie dat de cte un item separat), nu numai
din cauza extensiei amplitudinii mprtierii la 120 de uniti, dar i din cauza
numrului de vrste distincte pe care testul le acoper (de la 5 la 16 ani sunt 12
vrste). Aceasta ar da subteste neobinuit de lungi i de greu aplicabile
(nemaniabile). De aceea, teste de inteligen cu o rezoluie de pn la 5 uniti de
QI pe item sunt nc acceptabile, dei cele mai bune valori ar fi ntre 2 i 3.
Maniera de scorare a probelor este iari o modalitate important de cretere a
sensibilitii testelor. La testele Domino (D 48 i D 70), pentru fiecare problem
(alctuit din desenele unor piese de domino ce solicit stabilirea a dou valori) se
acord doar un punct, performana maxim fiind de 44 de puncte. Imaginnd un
alt sistem de scorare, prin care s nu se piard puncte, i acordnd un punct dac
un element din csua dubl este corect, nc unul pentru al doilea, plus un bonus
de un punct pentru simultaneitatea lor i orientarea corect pe vertical
(neinversare), se obin 443 = 132 de puncte de scor, cu care se baleiaz un
domeniu mai extins al variabilei, dar i vrstele succesive. Similar, la subtestul
Cuburilor din bateria WISC, se dau 4 puncte pentru patternul rezolvat corect i
nc maximum 3 puncte drept bonificaie de timp, rezultnd maximum 7 puncte
per item i 55 de puncte n total. Deoarece rezolvrile parial corecte nu se iau n
considerare, rezult c o bun parte din variabilitatea scorurilor se pierde inutil.
mbuntirea sistemului de scorare, prin acordarea unui punct pentru fiecare cub
cu o culoare omogen (rou sau alb), pus n locul potrivit, i nc un punct pentru
feele bicolore (rou i alb) care respect nu numai locul, ci i poziia relativ
(nclinarea), ar putea duce la dublarea ambitusului scorurilor posibile i deci la o
for discriminativ dubl. Adugarea a nc doi itemi (unul foarte uor, pentru
intrarea n prob i unul foarte greu, pentru a ridica pragul de ieire din prob),
reconsiderarea timpului de aplicare i al manierei de acordare a bonificaiilor de
timp ar fi nc dou surse de mrire a sensibilitii testului, cu meniunea c toate
aceste modificri reiau de la zero problemele construcie, de etalonare, de
determinare a validitii i fidelitii probei, pentru c, de fapt, aceasta nseamn
crearea unui test nou, ce trebuie studiat ca atare.
Tipul de norme utilizate n etalonare este a treia caracteristic ce poate contribui la
ameliorarea semnificativ a sensibilitii unui test. Selecia acestora depinde de
precizia dorit n utilizarea testului. Dac la normele exprimate n centile se poate
determina n principiu fiecare punct percentil (caz foarte rar, pentru c testul ar
trebui s fie foarte lung i eantionul foarte extins), sau mcar punctele decile, la
care se mai adaug percentilele 3, 5, 25, 75, 95 i 97, dezavantajul const n
inegalitatea unitilor de msur (mai mici pe poriunea central a benzii i mai
lungi spre extreme). n consecin, rezultatele unei baterii de teste etalonate n
centile nu pot fi adunate i integrate, prin medie, ntr-un scor unic. Cuartilele dau
o mprire i mai grosier (4 clase), foarte larg, nepermind discriminrile de
finee. Testele moderne sunt etalonate n note z (standardizate), sau n norme
derivate din acestea, cum sunt notele C, T, Hull, stanine, stens etc. Dintre acestea,
foarte utile sunt notele T (cu media de 50 i abaterea standard de 10), dar i scalele
de QI (cu media 100 i abaterea standard de 15 sau 16). Ca o regul vom meniona
c, cu ct o scal va avea mai puine intervale (11, 10, 7, 5, 3), cu att mai mult se
va produce o pierdere de varian i deci o scdere de sensibilitate a scorurilor
testului. Dac un test de memoria cuvintelor este etalonat n stanine i clasa 5, la
10 ani are, s zicem, scorurile 48-52, nseamn c diferena de performan de 5
puncte dintre subieci este practic anulat: fie c scorul este 48 sau este 52, se
obine aceeai stanin 5, aadar sensibilitatea discriminrii va avea de suferit.
Aceasta nu nseamn ns c scalele cu mai puine intervale nu sunt foarte utile (i
utilizate) n practic: multe baterii au subteste foarte diferite ca putere de
discriminare i atunci se alege o scal cu 9-10-11 trepte standardizate (stanine,
stens sau note C), care integreaz bine toate subtestele n baterie. Unii psihologi s-
au acomodat mai bine cu proprietile matematice ale unui tip de scal i l prefer
n virtutea obinuinei. Esenialmente acordajul dintre scorurile la test i gradul de
extensie al scalei utilizate trebuie s ne conduc la alegerea unor scale foarte
discriminative cnd testul are mai muli itemi (peste 30-40) eterogeni, nu din
punctul de vedere al coninutului sau al performanei msurate, ci al gradului lor
de dificultate. Testele ce acoper multe vrste, difereniate ntre ele prin
performane ce au ambitusul amplitudinii mprtierii mare (ntre 40 i 160 la
testele de inteligen, sau chiar mai mari) au nevoie de scale discriminative,
celelalte putnd opera, pentru scopuri practice i de cercetare, cu scale mai puin
extinse, chiar dac aceasta nseamn scderea puterii discriminative a testului.
Pentru subtestele bateriei sale, Wechsler a optat pentru scale standardizate de 19
trepte.
Cum dificultatea i sensibilitatea unui test depind de mrimea i de
caracteristicile lotului particular de subieci la care aplicm testul, nseamn c
obligatoriu trebuie s determinm valorile tendinei centrale pentru a determina
gradul de suprapunere ale acestora cu lotul de eantionare, indicat de manualul
testului. Cnd media grupului nostru este semnificativ diferit de cea a populaiei de
etalonare din manual nseamn c testul este prea uor sau prea greu n raport cu
aceasta i concluziile trase, prin raportarea valorilor brute la etalonul standard, pot fi
greite. Dac abaterea standard indic o valoare mult diferit (mai mic sau mai mare
dect cea a lotului normativ), nseamn c lotul nostru este fie prea omogen, fie prea
eterogen n raport cu eantionul standard. n prima situaie fora de discriminare a
testului descrete, n a doua ea crete, dar n ambele va trebui avut n vedere
construcia unui etalon mai adecvat pentru populaia respectiv.
Trebuie observat c nici un test nu poate fi att de sensibil nct totdeauna,
dou persoane deosebite n privina variabilei msurate de test s obin scoruri
diferite, afirm Monica Albu (1998, p. 189). Aceasta pentru c, n timp ce trsturile
psihice sunt variabile continue, scorurile la test sunt variabile discontinue (discrete) i
de aceea o coresponden biunivoc ntre variabil i scorul la test este un fapt
imposibil de realizat practic. Scorul fiind afectat de diverse tipuri de erori (generate de
testul nsui, de subiect sau de situaia de examinare), este posibil ca aceeai variabil,
msurat la acelai individ, s aib mai multe valori de scor. ntruct performana la
un test se raporteaz la un numr de intervale mai mic dect numrul valorilor de scor
pe care el le poate nregistra, nseamn c indivizii plasai pe acelai interval de scor
nu sunt discriminai. Deci un test va fi cu att mai discriminativ cu ct va separa mai
bine indivizii care au valori ale variabilei msurate de test plasate n acea zon a axei
sale n care exist un numr suficient de intervale de lungimi mici (Albu, op. cit., p.
190).
3.3. Construcia unui test psihologic
Analiza de itemi nu se face numai n sensul determinrii puterii discriminative
a unui test, ci i n contextul mai general al construirii unui test bun. Deoarece
construcia testelor a devenit n acelai timp o tiin i o art, ce implic o tradiie i
experi n domeniu, nu vom aborda aceast problem complex, prezentnd doar
principiile generale care stau la baza acestei activiti.
Elaborarea unui test ncepe (vezi figura 3.1) cu decizia referitoare la ce fel de
informaie vrem s obinem prin utilizarea sa. Itemii de genul adevrat-fals vor fi
utilizai doar cnd vrem s evalum judeci absolute, n rest fiind preferabili cei cu
alegeri multiple. i n acest caz constructorul trebuie s ia n calcul probabilitatea ca
cineva s dea rspunsul din ntmplare (prin ans). Pentru scalele de atitudini sau de
opinii, cel mai popular este formatul dat de scala Likert (ntre acord total i dezacord
total de interpun 3-7 trepte, dintre care treapta intermediar reprezint neutralitatea).
Un alt format este scala n 10 puncte (metoda scalrii categoriilor) folosit n ratingul
unor comportamente, n care punctele de nceput i de sfrit sunt foarte clar definite.
Tehnica Q-Sort, folosit n studiul personalitii, cere unui subiect s fac evaluri
asupra msurii n care anumii itemi l descriu pe el sau pe altcineva (a se vedea
capitolul ultim, despre crearea i statisticile scalelor psihologice). Dup ce au fost
creai i li s-a stabilit formatul, itemii vor fi administrai unui grup iar caracteristicile
lor vor fi apreciate printr-o evaluare sistematic a dificultii i discriminabilitii
itemilor, prin determinarea curbelor caracteristice ale acestora, prin studierea
consistenei interne sau a validitii relative la criteriu etc. Abia dup aceasta se face
definitivarea formei finale a testului care va fi aplicat, urmnd procedurile de
standardizare stabilite (condiii de aplicare, instructaj, limite de timp i mod de
prelucrare a rezultatelor). Analiza tehnic a testului (fidelitate, validitate i etalonare)
ncheie un ciclu care se poate relua de cte ori constructorul dorete s-i
perfecioneze sau s reetaloneze testul, s-l mbunteasc din punctul de vedere al
fidelitii sau al validitii prin eliminarea sau adugarea de itemi.
STABILIREA SCOPULUI
EXPRIMAREA SCOPULUI N TERMENI OPERAIONALI
STABILIREA SCOPULUI
EXPRIMAREA SCOPULUI N TERMENI OPERAIONALI
DEFINIREA
CONINUTULUI I
ABILITII MSURATE
DEFINIREA
UNEI
TRSTURI
ANALIZA MUNCII
Def. comportamentelor,
trsturilor i criteriilor.
A ABILITILOR UNEI Def.
Comportament
REDACTAREAUIREA LOR.
Figura 3.1. Algoritmul de construire a unui test
(dup Havrneanu, 2000, p. 130).
CAPITOLUL 4
FIDELITATEA TESTELOR
4.1. Problematica general a fidelitii testelor
Testele sunt concepute ca instrumente de msur perfecionate, n consecin
ele trebuie s aib calitile psihometrice presupuse de acest fapt. Dac pentru
lungime, mas, volum, timp sau temperatur exist att instrumente perfecionate de
msur, ct i uniti metrice bine definite, inteligena, memoria, personalitatea,
motivaia, iubirea sau sntatea, agresivitatea, tolerana la frustrare sunt caracteristici
psihologice foarte complexe, ce nu pot fi vzute i atinse n sens fizic, deci greu
cuantificabile.
Cu toate problemele pe care msurarea le pune n psihologie, preocuparea
pentru acurateea instrumentelor utilizate n sens metric a generat standarde extrem de
exigente i de sofisticate. Plecnd de la Spearman (1904), Thorndike (1904), Kuder i
REDACTAREA ITEMILOR
REVIZUIREA LOR
ANALIZA ITEMILOR (PRETEST)
INDICATORI (DIFICULTATE, SENSIBILITATE)
STABILIREA FORMEI FINALE A TESTULUI
STANDARDIZAREA PROCEDURII DE APLICARE,
A INSTRUCTAJULUI, TIMPULUI I A MODULUI DE CORECTARE
ANALIZA TEHNIC A TESTULUI
(FIDELITATE, VALIDITATE, ETALONARE)
Richardson (1937) i pn la Cronbach (1972, 1989) i Bentler (1990, 1991), a existat
o linie de evoluie continu n dezvoltarea unor teorii tot mai elaborate despre
fidelitatea probelor psihometrice. Teoria clasic asupra fidelitii testelor este
construit n jurul erorii de msurare care plec de la ideea c fiecare persoan testat
ar avea un scor adevrat, care ar fi obinut dac aceast eroare nu ar exista. Deci
scorul observat (O) este alctuit din scorul adevrat (A), la care se adaug eroarea de
msurare (E):
O = A + E
O alt supoziie a teoriei clasice a testului este c aceast eroare este aleatoare,
deci scorul adevrat va fi media unei distribuii n care dispersia reprezint erorile
aleatoare de msurare. Cum aceste distribuii pot avea dispersii largi sau nguste,
nseamn c i erorile de msurare vor fi mai mari sau mai mici. n felul acesta teoria
clasic a folosit abaterea standard a erorilor ca msur de baz a erorii de msurare,
numit i SEM
1
.
Fidelitatea unui set de scoruri este exprimat de un numr zecimal cuprins
ntre 0,00 i 1,00, indicnd absena, respectiv fidelitatea perfect. Deoarece nu poate fi
determinat direct, fidelitatea se estimeaz prin analiza efectelor variatelor condiii de
administrare i a coninutului testului asupra scorurilor finale. Ea va fi influenat doar
de schimbrile nesistematice care vor avea diferite efecte asupra celor examinai.
Fiecare din multiplele metode de estimare a fidelitii va lua n calcul diferitele
condiii ce pot produce asemenea schimbri nesistematice n scorul testului, ce vor
afecta n consecin mrimea erorii de msurare. n funcie de condiiile concrete n
care a fost administrat testul i n funcie de ceea ce acesta msoar, se calculeaz
unul sau mai muli coeficieni de corelaie ca o aproximare a fidelitii testului.
4.2. Fidelitatea test-retest
Numit i coeficient de stabilitate, acesta este obinut prin corelarea scorurilor
obinute de un grup de persoane la o administrare a testului cu scorurile nregistrate la
o administrare ulterioar a acestuia, dup un interval de timp. Procedeul ncearc
determinarea erorilor legate de condiiile de aplicare. Cum testul aplicat este acelai,
inconstana scorurilor nu poate fi imputat itemilor si, ci diferenei dintre condiiile
de aplicare, cu att mai mari cu ct intervalul dintre testretest este mai lung (luni sau
ani). Aceasta presupune ns c trstura msurat este ea nsi stabil n timp, deci
1
Standard Error of Measurement, adic eroarea standard a msurtorii.
procedeul nu este adecvat pentru unele probe (pentru testele proiective de exemplu,
dar nici pentru chestionarele de motivaii, opinii, dispoziii afective sau sntate).
Deoarece pot interveni efectele practicii (unele abiliti se mbuntesc prin
exerciiu) sau ale nvrii (coninuturile testului pot fi memorate spre a fi rezolvate
ulterior), se pune problema alegerii atente a intervalului dintre cele dou examinri.
Aceste efecte sunt mai accentuate pentru intervalele scurte (ore sau zile), dar un
interval mai lung are dezavantajul de a produce modificri chiar n structura
aptitudinii (efectul de cretere sau de maturare, foarte evident mai ales la testele
educaionale). Intervalul optim pentru retest pare a fi de cteva sptmni pn la o
lun sau, unde este posibil, se pot calcula coeficieni de fidelitate pentru intervale de
timp diferite (sptmni, luni sau ani).
4.3. Coeficientul formelor parale
Memorarea testelor nu d o eroare sistematic, deoarece proporia itemilor pe
care subiecii i-i reamintesc dup o perioad este diferit de la individ la individ, ceea
ce produce descreterea corelaiei test-retest. Pentru depirea acestei surse de eroare
se poate utiliza procedeul formelor paralele prin calcularea aa-numitului coeficient
de echivalen, un alt indicator al fidelitii. Pentru a msura acelai atribut o form
paralel a unui test trebuie s fie construit n acelai mod ca i prima variant. Ele
vor fi considerate forme paralele doar pentru c utilizeaz itemi formulai diferit, dar
procedeul de generare i selecie a acestora pentru un anumit nivel de dificultate este
acelai, deoarece ambele trebuie s msoare acelai construct, n aceeai manier.
Formele paralele pot fi aplicate chiar i n aceeai zi, caz n care singura surs de
diferen dintre scorurile la cele dou forme este eroarea aleatoare a diferenei dintre
itemii testului.
O procedur mai rafinat utilizat este aceea de a aplica unei jumti din populaie
forma A a testului i celeilalte forma paralel B, urmnd ca dup o perioad de timp
aceluiai eantion s i se aplice tot ambele forme, dar de data aceasta primei jumti
forma B iar celei de a doua jumti forma A. Coeficientul de corelaie ce rezult se
numete coeficient de stabilitate i echivalen, pentru c ia simultan n calcul, ca
surse de eroare, itemii testului i factorul timp.
4.4. Coeficienii de consisten intern
Din cauza costurilor de construcie ridicate, nu toate testele au forme
echivalente, de aceea se folosete o cale mai puin direct de determinare a fidelitii:
cea a consistenei interne, ce include metoda njumtirii (splithalf) a lui Spearman,
formulele Kuder-Richardson i coeficientul alpha (

) al lui Cronbach, care nu trebuie


considerai echivaleni cu coeficienii de fidelitate obinui prin testretest sau prin
forme paralele.
a. Metoda splithalf
n englez, to split nseamn a despica, iar half, jumtate, de unde i
numele metodei, care poate fi tradus prin njumtire. ntr-un test omogen, toi
itemii msoar (n diverse grade) acelai construct, deci este posibil s construim dou
jumti relativ echivalente pentru a le pune ulterior n corelaie. Cele dou jumti
pot fi obinute n diverse maniere, cum ar fi: prima parte a testului i a doua sa parte,
sau subteste ce ar rezulta din reunirea tuturor itemilor cu numr par i cu numr impar
(tehnica parimpar), sau oricare alt procedeu, chiar i aleator, de a genera jumti.
Problema tehnic spinoas este c acestea trebuie s fie echivalente, ceea ce n primul
exemplu nu se ntmpl: n cele mai multe teste de aptitudini, itemii dificili sunt
plasai n a doua parte a probei. Chiar i tehnica parimpar este aplicabil doar parial
pentru c, dei n multe teste itemii sunt aranjai n ordinea cresctoare a dificultii,
sunt greu de gsit cte doi itemi perfect echivaleni din acest punct de vedere, pentru a
putea compune cele dou jumti. n plus, n unele teste, anumii itemi sunt folosii
pentru a-i introduce pe alii, adic nu sunt independeni (itemi legai).
Deci metoda splithalf presupune analiza de itemi i calculul mediei i a
abaterii standard, valori care trebuie s fie aproximativ egale pentru fiecare jumtate,
pentru a verifica faptul c ele sunt echivalente. Cum corelaia dintre dou seturi de
scoruri este mai mic pentru seturile mai scurte, fidelitatea ce rezult pentru testul n
ansamblul su, plecnd de la jumtile sale, poate fi estimat prin corecia pe care
formula de profeie a lui Spearman-Brown o propune:
R =
r
r
+ 1
2
De exemplu, dac corelaia dintre jumti este de r = 0,64, fidelitatea testului n
ansamblul su va fi R = 20,64/(1+0,64) = 0,78. Aceast formul are un efect
substanial pentru corelaiile medii, dar unul mai mic pentru cele extreme.
b. Metoda Kuder-Richardson
n 1937, Kuder i Richardson au dezvoltat metode de evaluare a fidelitii
dintr-o singur aplicare a unui test, ceea ce a nsemnat un mare progres, deoarece
aceasta nu mai depindea de maniera arbitrar n care se fcea njumtirea testului.
Scorarea separat a jumtilor crea o alt problem, pe lng cea legat de
dificultatea obinerii unor forme realmente echivalente. Formula de mai jos se poate
aplica doar testelor ai cror itemi sunt scorai dihotomic (zero sau unu, adic fals sau
adevrat):

,
_



2
2
20
1 s
pq s
N
N
R KR
unde KR sunt iniialele celor doi psihologi, R este fidelitatea estimat, N numrul de
itemi ai testului, s
2
variana scorului la test n ansamblul su, p este proporia
(calculat pentru fiecare item n parte) n care un item este rezolvat corect, q este
complementul acestei proporii, adic (1 p), pq este suma produselor pq pentru
fiecare item al testului. Studiind formula, vom vedea c partea ei din dreapta
comport o analiz din care rezult c pentru a avea o fidelitate mai mare ca zero,
variana testului trebuie s fie mai mare ca suma varianelor individuale ale fiecrui
item (s
2
> pq). Acest lucru este posibil doar n cazul n care itemii, n calitatea lor de
msur a aceluiai construct, sunt intercorelai.
Pentru situaia cnd itemii celor dou jumti sunt aproximativ egali ca nivel
de dificultate (cazul echivalenei), cei doi autori au propus o alt formul, mai uor de
calculat, dar care nu se poate aplica jumtilor neechivalente, ntruct le va subevalua
fidelitatea:
1
1
1
1
1
]
1

,
_

2 21
1
1
1 s
N
x
x
N
N
KR
unde toate notaiile sunt aceleai ca n formula precedent, iar
x
reprezint media
scorurilor totale la test.
c. Coeficientul alpha (

) al lui Cronbach
Formula
20
KR
este o foarte valoroas procedur de estimare a consistenei
interne a unui test. Cu toate acestea, exist situaii n care ea nu este potrivit, iar
acestea apar atunci cnd testul nu a fost scorat n termeni de adevratfas, sau zero
unu, deoarece formula se bazeaz pe cunoaterea proporiei n care subiecii au
rezolvat corect fiecare item. Unele chestionare de opinii, atitudini sau valori sunt
elaborate nu n termeni dihotomici, ci presupun o scar a gradului de acorddezacord
sau atracierespingere. n aceast situaie, Cronbach (1951) a elaborat o procedur
mai general de estimare a fidelitii, aa-numitul coeficient alpha, a crui formul
este:

,
_



2
2 2
1 s
s s
N
N
R
i

Se observ o mare similitudine cu formula


20
KR
chiar i n notaii, termenul nou fiind
2
i
s .
Termenul s
i
2
nlocuiete n aceast formul pq i el reprezint suma varianelor
individuale ale fiecrui item. Singura diferen const deci n maniera n care este
exprimat variana. Deoarece
2
i
s exprim variana itemilor care nu sunt rezolvabili
doar prin da/nu, coeficientul alpha este considerat a fi soluia cea mai general
pentru determinarea fidelitii pentru consistena intern.
Kaplan i Saccuzzo (1993) sesizeaz foarte ntemeiat c toate msurile care
evalueaz consistena intern, determin de fapt gradul n care fiecare item diferit
msoar aceeai trstur sau abilitate. Acest lucru presupune implicit c testul este
omogen, n caz contrar acesta neavnd consisten intern. Pentru testele neomogene,
procedeul cel mai indicat este analiza factorial, prin care se vor putea submpri
itemii pe grupe omogene, subtestele ce rezult avnd fiecare o consisten intern
ridicat, dar fiind relativ independente unul n raport cu celelalte, ca n cazul
subscalelor testului de prsonalitate 16PF Cattell.
Aiken (1997) sesizeaz de asemenea c cele trei procedee de determinare a
fidelitii, amintite anterior, supraestimeaz valoarea acesteia pentru testele n care
este implicat viteza. n acest caz procedurile de apreciere a fidelitii trebuie
modificate, recomandarea fcut fiind aceea de a administra cele dou jumti ale
testului n momente diferite, dar cu limit de timp egal. Dup aceasta se calculeaz
fidelitatea, operndu-se corecia ei prin formula SpearmanBrown.
d. Fidelitatea interscoreri
Majoritatea testelor de aptitudini, de performan i de personalitate au
proceduri de scorare standardizate, aa c nu va fi nici o problem n privina
scorurilor obinute de ctre persoane diferite, devreme ce aceste proceduri de
apreciere pot fi ncredinate mainilor automate de scorare sau computerului.
Tehnicile proiective, judecile evaluativapreciative, evaluarea unor produse
complexe ale activitii (desene, mostre de scris, obiecte manufacturate etc.) sau
ratingul personalitii include, prin natura lucrurilor, o doz crescut de subiectivitate.
n acest caz trebuie s determinm gradul de intervenie n apreciere al subiectivitii,
determinnd fidelitatea interscoreri sau interevaluatori prin calculul corelaiei dintre
dou seturi de scoruri acordate de evaluatori diferii, unui numr determinat de
examinai. Se poate apela i la metoda mai muli examinatori un singur examinat,
sau mai muli examinatori mai muli examinai, procedee care culeg coeficieni de
fidelitate intraclas, sau de concordan (cum ar fi coeficientul tau al lui Kendall,
vezi Radu et al., 1991), pentru care exist programe speciale de calculator, cum ar fi
SPSS.
4.5. Factorii care intervin n determinarea fidelitii
Pentru ca estimarea fidelitii s fie ct mai precis, trebuie ndeplinite cteva
condiii (Traub, 1944, apud Albu, 1998):
Eantionul s fie ct mai mare, pentru a reduce eroarea standard a repartiiei, care
este invers proporional cu rdcina ptrat din numrul subiecilor ce compun
eantionul.
Eantionul s fie reprezentativ pentru populaia creia i este destinat testul, avnd
acelai grad de eterogenitate, deoarece omogenitatea diminueaz valoarea
coeficientului de fidelitate.
Msurtorile s fie independente ntre ele, astfel nct msurtoarea de la un
examinator s nu o influeneze pe a altuia, iar dac examenul este colectiv, s nu
se poat tria prin copiere. Independena cere ca persoanelor supuse la testretest
s nu li se dea informaii despre rezultatele examinrii precedente, iar itemii s nu
se condiioneze reciproc.
Toate aspectele de procedur n test i retest sau la formele paralele trebuie s fie
identice.
Creterea nivelului de fidelitate a unui test pn la limita dorit sau cerut de
situaia de utilizare concret este posibil prin creterea numrului de itemi (care
trebuie s fie de acelai format i s msoare aceeai trstur sau acelai construct)
2
.
Decizia aceasta angajeaz un proces lung i costisitor, pentru c testul nou generat
trebuie reevaluat de la nceput i uneori se dovedete a fi sub nivelul de fidelitate
ateptat. De asemenea, crescndu-i lungimea, testul devine mai greu de aplicat i de
scorat. Manipulnd formula de profeie a lui SpearmanBrown se calculeaz un indice
de multiplicare a numrului de itemi pentru a atinge fidelitatea dorit: un test de 20 de
itemi trebuie s ajung la 56 de itemi pentru a-i crete fidelitatea de la 0,87 la 0,95
(Kaplan i Saccuzzo, op. cit., p. 127).
Ca o concluzie a acestor consideraii despre fidelitatea testelor, se relev faptul
c aceasta este mai bun pentru teste unidimensionale i cu numr mai mare de itemi,
ct i pentru testele cognitive i c ea angajeaz un studiu analitic al itemilor (analiza
de itemi) pentru a le determina fora de discriminare. n multe situaii analiza
factorial este metoda cea mai eficient prin care se pot construi subteste omogene i
unidimensionale. Fidelitatea este una din fundamentrile de baz ale cercetrilor
asupra comportamentului. Dac un test nu este fidel, nu va fi posibil s demonstrm
c el are vreun neles, afirm Kaplan i Saccuzzo (op. cit., p. 131). Deci, dei
validitatea pare a fi o caracteristic psihometric mai important, din punct de vedere
tehnic studiul ei nu poate ncepe cu teste care nu i dovedesc o fidelitate minim,
acceptabil, care depinde de scopul n care acestea vor fi utilizate.
2
Vezi capitolul urmtor.

CAPITOLUL 5
FACTORI CARE AFECTEAZ FIDELITATEA TESTELOR
5.1. ntinderea diferenelor individuale
Deoarece estimarea fidelitii rezult din calculul corelaiei r Pearson limitele
statistice ale acestuia se repercuteaz i asupra coeficientului de fidelitate. Astfel, r
este calculat pentru variana total a testului ceea ce este o condiie necesar, dar nu
i suficient pentru a determina fidelitatea. Atunci cnd se produce o reducere sau o
cretere a ambitusului scorurilor individuale, corelaia dintre variabile (i implicit
fidelitatea testului) scade sau crete n mod artificial, diminund ansa de a determina
corect fidelitatea sa. Astfel, dac n faza de studiu pilot se utilizeaz un eantion care
are o varian mai mic dect populaia general, fidelitatea testului va fi subestimat
(va fi mai mic dect dac eantionul ar fi fost reprezentativ). Aplicarea testului pe o
categorie populaional foarte omogen (clase de elit sau de subdotai intelectual,
clase vocaionale etc.) ar putea furniza o corelaie mai mic dect cea existent la
clasele normale, unde extremele (subdotai, supradotai intelectual) sunt reprezentate
normal.
Variana i implicit fidelitatea poate fi crescut artificial prin folosirea de
eantioane cu grad mare de eterogenitate. Agregarea ntr-un eantion comun a unor
clase de elit (supradotai), normale i de integrare (subdotai) accentueaz mrimea
corelaiei, ca i reunirea n acelai eantion a unor niveluri de pregtire colar aflate
la mare distan unele de altele. Pentru situaia n care eantionul a fost prea omogen,
diminund astfel variana total a scorurilor la test, i deci fidelitatea sa, Magnuson a
propus o formul de corecie:
r
uu
=
( )
2
'
2
1 1
u
xx x
r


n care r
uu
este fidelitatea estimat pentru noul eantion,
x
este variana noului
eantion iar
u
este fidelitatea calculat ntre vechiul i noul eantion.
Pentru utilizatorul unui test precauiile legate de ntinderea diferenelor
individuale sunt dou:
utilizarea tabelelor de norme, care aduc distribuiile la un numitor
comun prin raportarea la notele standardizate z;
studiul pilot al fidelitii pe propriul eantion de lucru pentru a ne
asigura c populaia noastr corespunde ca raport de omogenitate/eterogenitate
populaiei pe care s-a determinat fidelitatea raportat n manualul testului.
5.2. Lungimea unui test
Teoria eantionajului demonstreaz faptul c, cu ct un eantion este mai
mare, cu att mai mult estimarea caracteristicilor populaiei din care acesta a fost
extras este mai exact. n mod similar, cu ct numrul de itemi ai unui test este mai
mare, cu att mai bine este msurat constructul sau domeniul investigat, i aceasta
deoarece suma erorilor aleatorii tinde tot mai mult spre zero.
Relaia dintre fidelitatea i lungimea testului este exprimat de formula de
profeie a lui Spearman-Brown, care ne va arta cu ct crete precizia estimarii prin
modificarea numrului itemilor ntr-o anumit proporie K:
' xx
r
=
( )
'
'
1 1
jj
jj
r K
r K
+

n care r
xx'
este fidelitatea expectat prin lungirea testului, iar r
jj'
este fidelitatea
calculat pentru testul iniial. Aceast formul poate fi utilizat n dou feluri:
dac iniial testul avea 20 de itemi i dorim s-l aducem la 45 de itemi,
K reprezint raportul 45/20 = 2,25. Plecnd de la fidelitate iniial de 0,83,
fidelitatea expectat prin lungirea testului va ajunge la: (2,250,83)/[(1+2,25-
1)0,83] = 1,8675/(1+1,0375) = 1,8675/2,0375 = 0,92;
invers, dac vrem s tim ci itemi trebuie s adugm pentru a atinge
valoarea dorit a fidelitii, de exemplu creterea de la 0,83 la 0,95 (pentru a putea
ajunge n zona n care putem lua decizii care privesc destinul unei persoane),
maniera de lucru presupune mai nti izolarea lui K, plecnd de la formula
anterioar.
K =
( )
( )
' '
' '
1
1
xx jj
jj xx
r r
r r

n cazul nostru: K=
89 , 3
5 04 , 0
5 16 , 0
05 , 0 83 , 0
17 , 0 95 , 0
) 95 , 0 1 ( 83 , 0
) 83 , 0 1 ( 95 , 0

aceasta nseamn c, pentru a avea creterea de fidelitate expectat,


testul trebuie mrit de 3,89 ori i deci de la 20 de itemi el va ajunge la 78 (203,89
= 77,8).
Formulele de mai sus pot fi folosite i n sensul scurtrii unui test prea lung
(cu scderea de rigoare a fidelitii sale) dar fie ntr-o situaie, fie n alta, itemii trebuie
s aib acelai coninut i acelai grad de dificultate, fiind consisteni cu itemii de
plecare. Ori aceasta nseamn parcurgerea prealabil a fazei analizei de itemi, cci
itemii foarte diferii ca nivel de dificultate sau ca i coninut nu vor avea o bun
corelaie cu cea deja existeni, scznd omogenitatea de ansamblu a testului.
Metoda Spearman-Brown nu poate preciza care sunt caracteristicile itemilor
ce vor fi adugai n termeni de format i de coninut al acestora pentru a face s
creasc fidelitatea testului pn la o precizie antecalculat acceptabil. Dac n testele
de aptitudini itemii ce vor fi adugai vor fi definii n acelai fel ca i ceilali, pentru a
fi corelai cu constructul msurat, n testele educaionale ei vor viza aceleai obiective
pedagogice ca i testul iniial. Acesta nu este un lucru dificil, cci itemii paraleli se
creeaz uor dac am folosit din start tehnica specificrii domeniului. Principalul
inconvenient al metodei este utilizarea unui demers empiric n crearea setului de
itemi. Fidelitatea poate fi mai bine ameliorat atunci cnd un test a fost construit dup
demersul criterial, n care caracteristicile itemilor trebuie s fie bine cunoscute.
5.3. Dificultatea testului
Corelaia dintre dou teste tinde s fie maxim doar atunci cnd distribuiile
celor dou variabile au acelai tip de asimetrie. Aa cum am artat n paginile
anterioare, n fazele testrii formrii unei deprinderi aceasta poate avea o asimetrie
pozitiv n faza iniial (testul este prea greu) i una negativ n faza final (testul
devine prea uor), trecnd printr-o faz intermediar unde exist simetrie a distribuiei
scorurilor. Asimetriile fiind n direcii opuse, cea mai mic fidelitate a testului va fi
corelarea dintre faza iniial i faza final, dup care corelarea dintre faza
intermediar i celelalte dou faze, iniial sau final.
Schimbarea formei distribuiei poate fi principala cauz a unei fidelitai mici,
prin faptul c un test a devenit mai uor la o a doua aplicare, dnd o curb asimetric
negativ, ceea ce presupune contaminarea rezultatelor ca efect al nvrii. n
consecin, verificarea formei distribuiei scorurilor pentru acele dou aplicri devine
obligatorie.
5.4. Testele cu limit de timp
Multe teste de cunostine sau de aptitudini conserv primatul gradrii
dificultii itemilor, de la cei mai uori la nceputul testului (pentru creterea ncrederii
n sine), la cei mai dificili spre sfritul acestuia (pentru a crete puterea diagnostic a
instrumentului n zona vrstelor mari ori a supradotrii). Dac ele au o limit de timp,
itemii dificili nici mcar nu vor fi abordai de majoritatea subiecilor, fiind scorai cu
zero i la prima aplicare, i la cea de a doua. Acest fapt va crea o cretere artificial a
corelaiei prin care se pune n eviden fidelitatea, deoarece vor intra n corelaie
multe perechi identice de rezultate (0 - 0). Inflaia fidelitii poate crea imaginea
distorsionat a unui test cu itemi ce vor aprea ca mai omogeni dect sunt de fapt n
realitate. De fapt, la testele de vitez nu toate formele de determinare a fidelitii sunt
afectate. n timp ce n cazul jumtii vii (split-half) aceasta va fi afectat (itemii
scorai zero se distribuie aproximativ egal n cele dou jumti ale testului, crescnd
artificial fidelitatea), consistena intern prin indicele alpha al lui Cronbach sau prin
metoda test-retest nu va fi afectat semnificativ n acest caz.
Pentru a determina totui i celelalte forme de fidelitate se dau testul i retestul
cu limita de timp convenit de autor, se marcheaz ultimul item (de aceea itemii
trebuie pasai n ordine, i nu pe srite) apoi se continu pn la capt testul, fr
limit de timp. Scorurile din prima categorie vor servi pentru determinarea mediilor, a
abaterilor standard i a formei distribuiei, necesare scopurilor avute n vedere
(cercetare, crearea de etaloane), n timp ce scorurile brute obinute fr limit de timp
vor da o mai bun expresie a fidelitii prin metodele split-half i alpha al lui
Cronbach.
5.5. Fidelitatea i eroarea de msurtoare
Deoarece fidelitatea nu exprim valoarea preciziei msurtorii n aceleai
uniti ca i scorul total la test (exprimat n note standard), uneori ea este mai greu de
interpretat. Acesta este motivul pentru care precizia msurtorii poate fi indicat i
sub forma unei erori de interpretare a scorului la test, care va fi cu att mai mic cu
ct eroarea de msurare va fi i ea mai mic. Aceast zon de ncredere poate fi
determinat n dou maniere:
a) se determin eroarea de msurtoare (interval de ncredere nuntrul cruia
se afl adevratul scor al unui subiect, pentru niveluri de ncredere specificate);
b) se determin eroare de estimare (nivelul de ncredere al scorului observat
dac subiectul ar fi retestat).
5.5.1. Eroarea standard a msurtorii (SEM)
Conform teoriei clasice a testului, scorul adevrat al unui subiect se distribuie
normal n jurul unei valorii medii, dnd o distribuie pentru care putem determina
abaterea standard. Abaterea standard a diferitelor distribuii rezultate pentru toi
subiecii grupului n cauz se numete SEM (
e
) adic Eroarea Standard a
Msurtorii i se determin astfel:
SEM =
e

=
x

'
1
xx
r
n care: r
xx'
este coeficientul de fidelitate iar
x
este abaterea standard de la care s-a
plecat n calculul coeficientului de fidelitate r
xx'
. De exemplu, pentru o fidelitate de
0,93 i o abatere standard de 12, 17 , 3 93 , 0 1 12
e
. Plecnd de la premisa c
eroarea de msurtoare este normal distribuit, 68% din scoruri se vor situa ntre un
interval de 1
e
n jurul scorului adevrat, 95% la 1,96
e
iar 99% la 2,58
e
. Nu
ne rmne dect s definim aceste intervale. Cum noi nu cunoatem adevratul scor al
subiectului, este preferabil s construim intervalul de ncredere n jurul a ceea ce deja
cunoatem, adic nota observat x (obinut de subiect) i eroarea standard a
msurtorii:
x - z
c

e
x + z
c

e
n care:
x = scorul observat;
z
c
= valoarea critic a lui z pentru p 0,05 (z = 1,96) sau p 0,01 (z = 2,58);

e
= eroarea standard a msurtorii;
A = scorul adevrat.
Exemplu: scorul x al unui subiect la un test de inteligen este de 121, eroarea
standard a msurtorii este de 3,17 i vrem s construim intervalul de ncredere pentru
p 0,05 i p 0,01. Pentru prima situaie avem 121 1,963,17 = 121 6,21. Deci
pentru un p 0,05, intervalul este [115; 127], adic sunt 95% anse ca scorul adevrat
al subiectului s cad ntre 115 i 127.
Pentru a doua situaie avem: 121 2,583,17 = 121 8,18, deci pentru un prag
de ncredere p 0,01, intervalul definit este [113; 129], existnd 99% anse ca scorul
subiectului s cad ntre aceste limite. Se observ de aici faptul c: a. cu ct fidelitatea
este mai mare, cu att mai mult limitele intervalelor de ncredere pentru orice nivel de
ncredere calculat sunt mai mici (mai strnse) i b. cu ct vrem s tim cu o precizie
mai mare n ce zon cad scorurile cuiva, cu att mai larg va fi intervalul de ncredere
rezultat, i reciproc.
Aceste intervale de ncredere fie sunt adesea neluate n seam de pracricieni,
fie sunt ru interpretate. De fapt noi nu avem nicicum certitudinea c scorul adevrat
al subiectului va cdea n intervalul de ncredere determinat, cci exist doar o
probabilitate de a fi aa i, n al doilea rnd, (i aceasta pare a fi defieciena major a
acestei metode) intervalele de ncredere astfel determinate se sprijin pe postulatul
homoscedasticitii, adic pe prezumia c eroarea tip este aceeai pe toat scara
nivelurilor successive ale performanei. n al treilea rand, corelaia dintre scorul
observat i cel estimat nu este niciodat una perfect (Nunnally & Bernstein, 1994) i
n consecin prezicerea scorului adevrat plecnd de la cel observat produce
fenomenul de regresie spre medie al scorurilor adevrate. Lund n consideraie
aceast problem, Glutting, McDermott i Stanley (1987) au propus o modalitate de
construcie a intervalului de ncredere mult mai riguroas, dup formula:
) (
'
x x r x
xx

+
n care este scorul adevrat estimat,
x
scorul observat, x

media scorurilor
observate, iar r
xx'
este coeficientul de fidelitate.
Eroarea tip a estimrii se va calcula i ea dup o formul modificat:
' '
) 1 (
xx xx x eu
r r
n care
x
este eroarea standard a distribuiei de la care s-a calculat r
xx'
iar r
xx'
este chiar
coeficientul de fidelitate calculat. Pentru exemplul nostru, n care un subiect obinea
121 la un test de inteligen cu media 100 i cu abaterea standard de 15, testul avnd
fidelitatea de 0,93, determinarea scorului adevrat devine: 100 + 0,93(121 - 100) =
100 + 0,9321 = 100 + 19,53 = 119,53, rotunjit 120. Calculul erorii standard a
estimaiei este urmtoarea: (151-0,93)0,93 = 150,260,93 = 3,69. Intervalul de
ncredere pentru p = 0,05 este egal cu 1,963,69 = 7,23 n jurul scorului adevrat
estimat, adic 120 7. Acesta este intervalul [113-127]. Pentru pragul de p 0,01,
eroarea va fi 7,58 - 3,69 = 9,52, iar intervalul va fi 120 9,52, adic [110-130]. Aa
cum se observ n raport cu scorul observat de 121 intervalul nu mai este unul
simetric n jurul valorii obinute de subiect: n prima situaie de la 121 113 = 8
puncte de scor, pentru limita inferioar, i n a doua situaie sunt 127 121 = 6
puncte, pentru limita superioar. Aceast asimetrie provine din centrarea intervalelor
de ncredere diferite nu pe scorul observat, ci pe cel estimat ca adevrat, ceea ce face
din aceast procedur cea mai riguroas metod de determinare a intervalelor de
ncredere.
5.5.2. Eroarea tip a estimrii
Eroarea tip a estimrii se regsete de fiecare dat cnd dorim s calculm intervalul
de ncredere a valorii prezise plecnd de la o ecuaie de regresie liniar. Acest tip de
eroare se obine extrgnd rdcina ptrat din variana rezidual, adic acea varian
a scorurilor care se regsete la al doilea test atunci cnd se ine cont de primul test.
Cum metoda de calcul i interpretarea erorii de estimaie sunt mai laborioase, ele nu
au fost incluse n capitolul de fa. Menionm de asemenea faptul c n corelaia
liniar pe care se bazeaz de regul determinarea fidelitii homoscedasticitatea
este presupus ca o condiie implicit. Deoarece eroarea de msurtoare este mai mic
la cei care au preponderant reuite sau nereuite (extremele seriei de variaie a
performanelor), comparai cu cei de pe poriunea de mijloc, Keats i Lord au propus
un model fundamentat pe distribuia binominal, care permite estimarea erorii tip a
msurtorii indiferent de nivelul scorului subiecilor. Nici aceast procedur nu a fost
inclus aici.
5.5.3. Interpretarea fidelitii
Rspunsul la ntrebarea ct de mare trebuie s fie fidelitatea unui test?
depinde de utilitatea practic care se d acestuia.
O fidelitate de 0,70 0,80 este suficient de bun atunci cnd testul este folosit n
scopuri de cercetare.
Se accept niveluri sczute ale fidelitii atunci cnd testele se utilizeaz pentru a
lua decizii preliminare i ridicate pentru decizii finale, sau cnd ele sunt folosite
pentru mprirea grupului n subgcategorii, pe baza unor diferene interidividuale
mari.
Dac testul servete la compararea grupurilor de persoane ntre ele, coeficienii de
fidelitate de 0,60 0,70 sunt suficieni, dar cnd testul devine o baz de
comparaie ntre persoane individuale, fidelitatea lui trebuie s fie de la 0,85 n
sus.
Cnd se iau decizii importante pe baz de teste, prin care se mpart persoanele n
categorii, n virtutea unor diferene mici (ca n selecia profesional), fidelitatea
acestora trebuie s fie de peste 0,90.
Cnd decizia privete destinul unei persoane individuale, fidelitatea testului
trebuie s fie de cel puin 0,95.
Testele cognitive, i n special cele de inteligen, au de regul o fidelitate
foarte mare (peste 0,90), n timp ce chestionarele de personalitate rareori depesc
0,80. Aplicate colectiv, chiar i testele cognitive furnizeaz coeficieni de fidelitate
mai sczui (n jur de 0,80). Testele cotate subiectiv, ce msoar aptitudini, i testele
de cunotine (educaionale) rareori depesc valori ale fidelitii de 0,80 (Traub,
1944). Testele cu alegere multipl, utilizate colectiv, sunt considerate a avea o
fidelitate bun cnd aceasta atinge 0,75.
5.5.4. Generalizabilitatea
Potrivit paradigmei clasice relativ la fidelitate, O = A + E, descris n partea
introductiv a capitolului de fa, fidelitatea unui instrument psihometric este n
funcie de ntinderea spectrului diferenelor individuale, de lungimea testului nsui,
de limita de timp acordat i de dificultatea testului. Cu toate acestea condiiile de
observare i de msurtoare sunt mult mai complexe dect cele enumerate anterior,
ceea ce a condus la conturarea unei noiuni noi i anume cea de generalizabilitate.
Aceasta presupune studiul fidelitii n familii de situaii similare, ceea ce face ca
scorul adevrat (A, din formula de mai sus) s fie nlocuit cu termenul de univers al
scorului ateptat de la un subiect, ntr-un anumit ansamblu de condiii de observare i
de msurtoare.
Teoria generalizabilitii a fost elaborat n 1963 de Cronbach, Gleser i
Rajaratnam cu scopul de a reuni ntr-un concept unic diferitele definiii ale fidelitii.
Astfel, pentru a cuantifica importana fiecrei surse de varian dintr-o situaie de
msurtoare ei au folosit analiza de varian. Scorul adevrat i lrgete nelesul
pentru c ia n calcul toate observaiile posibile, mpreun cu erorile aferente rezultate
din fluctuaiile de eantionaj legate de momentele de evaluare, de forma itemilor sau
de ecuaia personal a fiecrui evaluator n parte. Din aceast cauz
generalizabilitatea este un concept mai cuprinztor dect cel de fidelitate, cci el
descrie situaia de msurare ntr-un cadru mai complex i mai apropiat de realitate. n
esen aceasta indic msura n care se poate generaliza un rezultat obinut n anumite
condiii.
Noiunea de univers al scorului se cheam astfel pentru c are n vedere
fidelitatea scorurilor ntr-un ntreg univers de condiii care alctuiesc sau definesc tot
attea faete ale planului de observaie. Iat definiia dat de Cardinet i Turneur
(1985, p. 23) universului scorului: Universul scorului unei persoane p, dat ideal,
reprezint media scorurilor persoanei p calculat pe toate observaiile admisibile. Ori
observatorul utilizeaz scorul observat, sau o funcie a scorului observat pentru a
estima valoarea universului scorului. El generalizeaz astfel de la eanion ctre
populaia de ansamblu.
O paralel cu fidelitatea se impune i pentru generalizabilitate. Dac n primul
caz, cu ct corelaia dintre scorul observat i cel adevrat este mai mare, i fidelitatea
este mai bun, n generalizabilitate aceasta este cu att mai mare cu ct scorul
observat la un subiect este mai asemntor cu cel pe care el l-ar fi obinut n
ansamblul de condiii pentru care vrem s generalizm. Cum universul scorului nu
poate fi obinut direct, ceea ce ne rmne de fcut este eantionarea sa. Aici problema
cheie este cea legat de rezolvarea unei contradicii: generalizabilitatea este cu atat
mai mare cu ct ine sub control mai multe faete ale dispozitivului de msurare, ceea
ce nseamn sporirea numrului de itemi (de teme) investigate, al numrului de
corectori i de grile de corecie, dispozitivul devenind astfel foarte costisitor. Ar trebui
gsit deci un echilibru ntre economicitatea i eficacitatea dispozitivului de msurare,
ori pentru aceasta ar trebui determinat ponderea fiecrei faete a examinrii, doar
astfel putnd s le reunim ntr-un model eficace.
Pentru a ine cont de multitudinea variaiilor ce se produc ntre diversele faete
ale unui dispozitiv de msurare, ca i de diversele interaciuni posibile dintre acestea,
studiul generalizabilitii are n mod expres nevoie de analiza de varian.
5.5.5. Analiza de varian i planul de optimizare
Studiul generalizabilitii permite un control crescut al surselor de eroare
dintr-un dispozitiv de msurare (sau dispozitiv observaional). Dincolo de calculul
unui indice de fidelitate al unui univers al scorului, cercettorul poate detrmina n ce
condiii sau situaii dispozitivul su va prezenta caracteristicile cele mai bune ale
msurtorii. n forma iniial a teoriei generalizabilitii Cronbach, Gleser, Nanda i
Rajaratnam (1971) s-au interesat doar de stabilitatea scorurilor subiecilor. n
psihologie i pedagogie merit tot atta interes un numai subiecii, ci i itemii
testuluo, cci se poate estima stabilitatea diferitelor modaliti de prezentare sau de
evaluare a lor, ca i diferitele coninuturi ce fac obiectul testului (msurtorii)
respective. Cardinet i Tourneur (1985) au definit un procedeu de calcul care permite
s se in cont n dispozitivul de msurare respectiv att de subieci, ct i de itemii
utilizai. n consecin ei au indicat cei patru pai ai procesului, primii doi fiind o
analiz de varian, faza a treia studiaz diferenierea iar faza a patra optimizarea.
Mai jos facem o succint prezentare a acestei proceduri:
1. Plan de observaie: se procedeaz la alegerea faetelor i a numrului de
niveluri ale fiecrei faete, precizndu-se i interrelaiile dintre ele.
2. Plan de estimare: se determin care faete reprezint un ansamblu de
niveluri finite i care dintre ele sunt eantionate aleator sau exhaustiv.
3. Plan de msurare: se identific ce faete sunt legate de planul de msurare
(faete ale diferenierii) i care sunt sursele de eroare ale msurrii (faetele de
instrumentaie). Cu alte cuvinte abia acum variana calculat n faza a doua se
atribuie fie varianei adevrate, fie varianei erorii, permind calculul
coeficientului de generalizabilitate i calculul marjei de eroare aplicabil
scorurilor observate.
Plan de optimizare: acesta permite modificarea oricruia din planurile precedente, ca
i a combinaiilor dintre ele, cu scopul de a maximiza generalizabilitatea observaiilor
(msurtorilor). Este faza n care cercettorul caut acel echilibru dintre precizia
msurtorii i ntinderea universului generalizrii: cu ct acesta este mai restrns, este
mai uor de obinut msurtori adecvate ale acestuia, fapt care este mai dificil n
situaia invers.
CAPITOLUL 6
VALIDITATEA
Spre deosebire de fidelitate, care este influenat numai de erorile de msurare
nesistematice, validitatea unui test este afectat att de erorile nesistematice, ct i de
cele sistematice (constante). Din aceast cauz, un test poate s fie fidel, fr a fi
valid, dar nu poate fi valid fr s fie fidel, afirm Aiken (1993, p. 94).
Accepiunea clasic a validitii se refer la gradul n care un test msoar
ceea ce i-a propus, ceea ce sugereaz c ar exista doar un singur tip de validitate.
Actualmente este unanim acceptat faptul c un test poate avea diferite forme de
validitate, dependente de scopurile specifice n care el a fost utilizat. De aceea ni se
pare de mare actualitate afirmaia Ursulei chiopu (1974, p. 156) potrivit creia un
test este bidimensional, axat pe doi factori, adic pe diagnoz i pe validarea ei,
concepui ca axele unui sistem de coordonate: n acest sistem axa X reprezint o
diagnoz cuantificabil (test comportament), axa Y reprezint criteriul de
valabilitate al diagnozei.
n acest sens poate fi neleas sintagma c un test se valideaz continuu.
Fcnd o analogie cu justiia, unde opereaz prezumia de nevinovie (fr dovezi
concrete, cel trimis n instan este nevinovat), psihologul trebuie s se supun unor
reguli specifice de probare, n stabilirea faptului c un anumit test are o nsemntate
special pentru un scop specific (Aiken, op. cit., p. 133). Deci validitatea ar putea fi
definit mai corect ca o extindere progresiv, pe msur ce testul primete noi
utilizri, a cunoaterii noastre n legtur cu ceea ce msoar el de fapt.
6.1. Validitatea de faad
Este mai mult o aparen de validitate dect o form de validitate n sens strict,
deoarece ea indic ce pare a msura o prob, i nu ceea ce msoar ea efectiv. Uneori
psihologii raporteaz exact ceea ce observ, fr a interpreta sau generaliza, i atunci
intervine tot validitatea de faad.
Chiar dac tehnic ea este slab definit (i de aceea uneori nici nu este analizat
de muli autori), validitatea de faad pare a avea o important funcie practic,
deoarece motiveaz subiecii s accepte mai uor un test nou, sau permite extensia
utilizrii instrumentelor spre alte zone dect cele care le-au consacrat: adesea
spunem c un test are validitate de faad dac itemii lui sunt relaionai rezonabil cu
scopurile percepute ale testului (Kaplan i Saccuzzo, op. cit., p. 135). Uneori acest
tip de validitate poate da o mai bun valoare de pia unui test.
6.2. Validitatea relativ la coninut
Aa cum reprezentativitatea eantionului de populaie ales permite generalizri
asupra populaieiint pe care o reprezint, itemii testului prin maniera lor de
construcie i de selecie pot acoperi ntr-o mai mare sau mai mic msur domeniul
sau universul trsturii sau al aptitudinii msurate. n felul acesta rspunsurile la un
eantion de itemi dintr-un test cu validitate de coninut sunt reprezentative pentru
rspunsurile pe care subiectul le-ar fi dat dac ntreg universul trsturii ar fi fost
msurat. Acest tip de validitate este decisiv n testele educaionale i de achiziii,
ridicnd probleme specifice evaluatorului. Se va genera deci o banc sau set de itemi
care s acopere bine ntregul domeniu investigat (cunotinele la un obiect colar,
gradul de elaborare a unor deprinderi, nivelul de cristalizare a unor atitudini), din care
vor fi selecionai i agregai ntr-un test doar un numr limitat de itemi, reprezentativi
pentru ntregul domeniu.
Unele date de personalitate, obinute prin chestionare (de opinii, atitudini,
interese, motivaii sau valori), beneficiaz mai mult de acest tip de validitate dect
celelalte. n testele de achiziii itemii sunt creai innd cont simultan de obiectivele,
finalitile procesului instructiv, dar i de mecanismele proceselor cognitive la care se
face apel n elaborarea rspunsului la itemi. Aceasta presupune nc din start prezena
experilor care vor judeca i hotr care itemi vor fi inclui n test. De aceea putem
spune c dintre formele fundamentale de validitate, cea de coninut este singura care
are o susinere mai degrab logic dect statistic.
Pentru a da validitate de coninut unui test, constructorul se angajeaz ntr-un
proces de durat, ce presupune o foarte bun cunoatere a domeniului, raionament
logic, intuiie i perseveren, cci itemii trebuie continuu revizuii. Pentru a face
generalizri ntemeiate plecnd de la scorurile la test, constructorul trebuie s
cunoasc bine toi factorii care ar putea afecta performana subiecilor.
6.3. Validitatea relativ la criteriu
n acord cu aceast faet a validitii, un test este valid relativ la criteriu dac
pe baza lui se pot lua decizii corecte sau se pot face predicii/ prognoze asupra
persoanelor examinate. Un test este valid dac poate nlocui variabila criteriu n
virtutea unor corelaii mari ntre test i aceasta, astfel nct cunoscnd scorul la test s
deducem valoarea variabilei criteriu pentru persoana examinat. Dup maniera n care
sunt colectate datele la test i cele la criteriu distingem dou situaii, care produc dou
subcategorii ale validitii relative la criteriu:
Cnd scorurile la test i la criteriu se obin simultan, este vorba de validitate
concurent.
Cnd ntre obinerea scorurilor la test i cele la criteriu se interpune o perioad de
timp, vorbim de validitate predictiv.
Fiecare dintre aceste tipuri presupune strategii de validare diferite
3
, care vor fi
detaliat analizate n capitolul urmtor. De exemplu, un test de anxietate (Cattell) are
validitate concurent dac scorurile la testul psihologic i gsesc confirmarea, n
aceeai perioad de timp, prin diagnosticul psihiatric. Atunci cnd criteriul se
matureaz dup un timp (luni sau ani) i scorurile lui nu pot fi determinate simultan
cu cele la test, folosim o a doua strategie de validare, cea predictiv. n selecia
profesional, de exemplu, se va calcula coeficientul de corelaie liniar dintre
scorurile la testul aplicat iniial i msuri (exprimate prin note sau calificative) ale
performanelor obinute de aceleai persoane n activitatea sau profesia pentru care au
fost selecionate. Deoarece o funcie fundamental a testului este aceea de a face
diagnoza n scopul unei prognoze (deci faptul de prezice), validitatea predictiv
capt o importan special n acest context.
ntruct msurile la test i cele la criteriu intr n corelaie, pentru a determina
cu exactitate limitele prediciei, aceasta impune ca ambele elemente corelate s
satisfac standarde nalte de fidelitate i de validitate. Cu alte cuvinte, o msur
criteriu este pertinent dac este i ea fidel i valid, fapt ce introduce problema
validitii ntr-o relaie circular cu criteriul ales. Aceasta nseamn c factorii de
eroare care afecteaz criteriul vor fi controlai n aceeai manier ca i predictorii
(testele). Atunci cnd controlul lor nu d rezultatele scontate, putem spori fidelitatea
criteriului fie lund mai multe eantioane de msurtori ale acestuia (msuri mai
dese), fie adugnd noi tipuri de msuri, incluse ntr-un criteriu compozit, pentru a
spori fidelitatea lui n aceeai manier n care procedm cu un test cruia i adugm
itemi suplimentari.
O caracteristic important a criteriului este absena contaminrii, adic
necunoaterea rezultatelor la test de ctre cel care evalueaz msurilecriteriu. Un
psiholog va obine, independent de diagnosticul medicului psihiatru, scorurile la testul
su de anxietate, deci va face o analiz oarb. Prin efectul de halo, indulgen,
predicia pentru sine sau profeia care se automplinete, rezultatele prezise pot fi
produse ntr-o oarecare msur de predictorul nsui, caz n care comparaia nu mai
este valid. Havrneanu apreciaz c cele mai bune msuricriteriu sunt cele care
prezint ct mai multe avantaje practice, care sunt mai simplu de folosit, disponibile i
mai puin costisitoare (op. cit., p. 113). Dintre acestea enumerm:
msurarea direct a produciei sau a randamentului;
3
Vezi capitolul urmtor.
evalurile performanelor angajailor fcute de ctre efii lor sau de ctre
serviciile de personal ale ntreprinderilor;
msuracriteriu poate aparine unui grup, n sensul c testul care reuete s
clasifice persoanele n grupuri bine precizate, sunt valide.
Strategiile de validare predictiv cele mai utilizate calculeaz fie un indice de
eficacitate, fie scoruri de separare a categoriilor, indici de separare a grupurilor sau
indicele de utilitate (vezi Havrneanu, op. cit., pp. 113-126).
Dintre factorii care afecteaz validitatea relativ la criteriu, Aiken indic
diferenele de omogenitate ale grupurilor (validitatea tinde s fie cu att mai mic cu
ct grupurile sunt mai eterogene), lungimea testului (testele mai lungi sunt mai valide)
i contaminarea criteriului, de care am vorbit deja. Creterea validitii unui test, n
calitatea lui de instrument diagnostic sau prognostic, presupune costuri ce trebuie
atent evaluate, cci uneori metode mai puin costisitoare (observaia, interviul sau
inventarul biografic) pot aduce plusul de informaie necesar n atingerea scopurilor
propuse.
6.4. Validitatea relativ la construct
Multe dintre testele de personalitate msoar dimensiuni ale acesteia
(anxietate, depresie, nevrotism, motivaie, introversie-extraversie), mai slab definite
iniial, dar din ce n ce mai bine circumscrise, pe msur ce teoriile n domeniu au
avansat. Conceptualizrile progresive ale acestora (dar i ale inteligenei, memoriei,
creativitii etc.) au dus la apariia de constructe tot mai evoluate.
Unele teste sunt construite plecnd de la date empirice (ca MMPI sau
Inventarul de Personalitate California al lui Gough), altele se origineaz n teorii
anterior elaborate oricrei cercetri empirice (Chestionarele de personalitate Cattell
sau Indicatorul Tipologic Myers-Briggs). Validitatea relativ la construct verific, pe
de o parte, dac testul se refer realmente la constructul pe care vrea s-l msoare, i
apoi dac scorurile subiecilor testai reflect corect mrimea acestui construct la
persoanele n cauz. Strategia determinrii acestui tip de validitate impune un
algoritm (vezi Albu, 1998, pp. 165-166):
Descrierea amnunit a domeniului constructului respectiv (adic a tuturor
atributelor ce au legtur cu acesta i specificarea relaiilor dintre ele), printr-o
reea nomologic, pe care un grup de experi o va evalua pentru a determina
nivelul la care ea acoper constructul. Apoi se realizeaz un model al rezolvrii
testului, cu mecanismele teoretice implicate, pentru a vedea legtura acestuia cu
constructul, dar i cu rspunsurile posibile la test. Este posibil s se constate o
bun reprezentare a constructului n test, dar i diverse grade de subreprezentare
(mai ales cnd sarcinile sunt prea grele sau prea uoare).
Se analizeaz consecvena rspunsurilor la itemii testului, adic dac procesele
implicate n rezolvarea acestora acioneaz similar la toi itemii, pe parcursul
ntregului test.
Se urmrete dac structura global a scorului la test reflect structura domeniului
constructului msurat. Pentru aceasta se apeleaz la analiza factorial (de unde i
numele de validare factorial), care determin cteva variabile latente numite
factori, alctuii din itemi ce dau scoruri care coreleaz ntre ele, ce acoper
variana ntregului test. Se caut semnificaia acestor variabile, reinndu-se cele
care au o mai mare legtur cu constructul, asigurndu-se o coresponden ntre
importana avut n definirea constructului respectiv i ponderea lor ca itemi n
testul final.
Se extind generalizrile acestor prime etape, schimbnd fie populaiile examinate,
fie examinatorul sau contextele de examinare, pentru a vedea dac relaiile
sesizate rmn constante.
n final se caut stabilirea relaiilor dintre testul cercetat i alte tipuri de msurtori
sau de observaii. Testul poate avea o validitate convergent (ntre scorurile sale i
alte tipuri de teste ce msoar acelai construct exist o relaie liniar), sau
discriminant (cnd scorurile la teste nu coreleaz cu teste care se tie c nu msoar
constructul respectiv).
CAPITOLUL 7
ALTE FEE ALE VALIDITII
Orice student la psihologie tie c meritele unui test psihologic ncep s fie
judecate prin fidelitate dar sfresc prin aprecierea validitii sale. Aceasta i datorit
faptului c, n timp ce fidelitatea se judec simplu, prin sumarizarea unor coeficieni
de corelaie, validitatea presupune demersuri interpretative mai complicate i de mai
lung durat. nsui conceptul de validitate este unul evolutiv, aflat n plin dezvoltare
i de aceea strnete mult mai mult controvers dect mai stabilul i mai bine
aezatul su vr, fidelitatea (Cronbach, apud Gregory, op. cit., p. 106). Acesta este
motivul pentru care cteva aspecte legate de validitate, abia schiate n capitolul
anterior, sunt abordate mai pe larg n capitolul de fa.
7.1. Validitatea relativ la construct (conceptual)
Este cu siguran tipul de validitate care necesit cea mai mare cantitate de
efort n vederea validrii unui instrument psihometric. Dei se admite faptul c soarta
unei tiine este dependent de nivelul cuantificrilor sale, adic de capacitatea sa de a
msura adecvat ceea ce intr n domeniul obiectului su de studiu, i reciproca este
valabil. Astfel, nu am putea spune nimic concret despre variabile complexe ca
inteligena, memoria, stilurile de evaluare sau cele cognitive dac nu am avea i
posibilitatea s le testm, adic s le supunem msurrii. Dar, pe de alt parte,
msurarea lor este departe de a fi posibil fr o cunoatere teoretic prealabil a
acestor constructe.
Raportul dintre teorie i msurare este cel mai bine surprins prin conceptul de
validitate de construct sau conceptual, care este chiar inima operaionalizrii
variabilelor. A operaionaliza nseamn de fapt a aduce un construct teoretic n
situaia de putea fi surprins i evideniat prin msurare. n cazul n care
operaionalizarea unei teorii bune a fost fcut corect, printr-un instrument corect,
capabil s o surprind, atunci putem formula predicii sub forma ipotezelor ce rezult
din teoria respectiv. Dac ipotezele se verific, atunci i teoria, dar i
operaionalizarea ei sub forma instrumentului de msur respectiv sunt n regul.
Dac ipotezele nu se verific, sunt posibile dou explicaii alternative:
instrumentul este bun, dar deoarece teoria nu se verific, aceasta trebuie
schimbat;
teoria este una valabil, dar instrumentul nu o operaionalizeaz corespunztor
i atunci nu putem dovedi ce ne-am propus i deci trebuie schimbat chiar
instrumentul de msur.
De exemplu, cercetrile lui Witkin i ale colaboratorilor si au evideniat mai
mult difereniere i mai mult independen de cmp pentru genul masculin. Studiile
neuropsihologice actuale despre lateralizarea emisferelor cerebrale indic de
asemenea o specializare emisferic mai accentuat pentru genul masculin, ca i un
acces bicerebral la limb pentru genul feminin, de unde superioritatea brbailor
pentru sarcinile spaiale i a femeilor pentru cele legate de limb i comunicare.
Faptul c la un test spaial ca i Cuburile Kohs, de exemplu, bieii obin performane
superioare comparativ cu fetele, n timp ce acestea au performane superioare la un
test de inteligen verbal, este consistent cu teoriile anterior menionate.
n alte situaii se ateapt ca itemii unui test s se organizeze ntr-o ordine
progresiv, ceea ce ar corespunde unei structuri ierarhice, rezultat din chiar
dezvoltarea funciei sau abilitii respective. De exemplu, dac vom operaionaliza
teoria psihogenetic piagetian ntr-o scal de itemi, aceasta va fi una ierarhic, pentru
c orice stadiu l nglobeaz pe cel precedent, facndu-l posibil pe cel care urmeaz.
Validitatea conceptual va fi serios pus la ndoial n cazul n care un subiect paseaz
itemii pentru stadiul operaiilor formale i nu-i trece pe cei din stadiul operaiilor
concrete, fapt care ar contrazice chiar ideea de dezvoltare stadial i ierarhic. n mod
sporadic s-ar putea ntmpla s existe i itemi de acest fel, care vor constitui ns
erori.
Se poate deci afirma c rezultatele la acest tip de test sunt reproductibile, adic
pornind de la scorul total la test putem s prezicem care itemi vor fi pasai i care
vor fi euai. Pentru aceasta ns trebuie s tim ordinea de dificultate a itemilor, iar
aceast ordine s fie aceeai la toi subiecii. Cazurile (ct mai puine!) n care ierarhia
itemilor este nclcat produc erori de reproductibilitate, cci ele limiteaz
posibilitatea prediciei corecte a itemilor care vor fi pasai i al celor ce vor fi euai.
Guttman (1950) a propus ca rezultatele la un test s fie considerate ierarhice atunci
cnd mai puin de 10% din rezultate nu sunt reproductibile i a propus o formul de
calculul al unui coeficient de reproductibilitate:
CR =
p j
e
N N
N
1
n care:
CR = coeficientul de repreoductibilitate;
N
e
= numrul erorilor de reproductibilitate (numrul de itemi care ncalc
ierarhia, adic furnizeaz rezultate n dezacord cu scorul total obinut i cu
ordinea de dificultate a ansamblului itemilor);
N
j
= numrul de itemi;
N
p
= numrul de persoane (subieci).
Aceasta poate fi considerat o bun metod de validitate conceptual pentru probele
piagetiene, condiia recomandat de Guttman fiind un CR de peste 0,90, deoarece
peste aceast valoare invariana ordinii de reuit se consider a fi bine demonstrat.
Alte metode de demonstare a validitii conceptuale o constituie metoda
corelaiilor simple, metoda multitrstur-multimetod i studiul trsturilor latente.
7.1.1. Metodele corelaionale simple
Acestea permit evidenierea faptului dac un test msoar acelai lucru cu un
alt test despre care se tie deja c este o msur valid a constructului respectiv. Acest
tip de validitate se numete validitate convergent. Cnd ns testul respectiv este
pus n corelaie cu un alt test care msoar o aptitudine complet diferit, aceast
corelaie trebuie s fie foarte mic i atunci vom pune n eviden validitatea
divergent (sau discriminant). De exemplu, este cu totul de ateptat ca un test de
inteligen s coreleze puternic cu randamentul colar la 12 ani, aa cum menioneaz
i literatura de specialitate, cci cele dou variabile sunt nvecinate. Cnd ns testul
nostru coreleaz puternic cu motivaia, cu locus of control sau cu alte variabile
ndeprtate apar mari suspiciuni n legtur cu ce msoar de fapt acest test.
7.1.2. Matricile multitrstur-multimetod
4
Procedeul descris aici a fost inventat nc din 1959 de Campbell i Fiske, el
fiind n acelai timp i o metodologie important pentru nelegerea procesului de
validare. Acesta este un design ce ia simultan n considerare validitatea convergent i
pe cea divergent (discriminant). Se cheam multidimensional pentru c ia n
evaluare dou sau mai multe trasturi, prin dou sau mai multe metode.
n exemplul dat de Gregory n figura de mai jos, trei trsturi A, B i C
(Interesele, Creativitatea i Dominana) sunt msurate cu metodele 1, 2 i 3 (inventar
autoaplicat, evaluarea covrstnicilor i un test proiectiv). Deoarece fiecare dintre cele
3 trsturi sunt msurate prin toate cele 3 metode, rezult de fapt 9 teste, exprimate
prin coeficienii de corelaie din triunghiurile cu linie continu de pe diagonala mare.
Cnd fiecare dintre aceste teste este administrat a doua oar aceluiai grup de subieci
i scorurile fiecrei perechi de teste rezultate prin test-retest sunt corelate, rezult
matricea multitrstur-multimetod care devine o surs extrem de bogat de
informaii, att pentru fidelitate, ct i pentru validitatea convergent i divergent.
4
Multitrait-Multimethod Matrix n limba englez.
Metoda Trsturile Metoda 1 Metoda 2 Metoda 3
A1 B1 C1 A2 B2 C2 A3 B3 .C3
Metoda 1
Metoda 2
Metoda 3
A1
B1
C1
A2
B2
C2
A3
B3
C3
(.89)
.51 (.89)
.38 .37 (.76)
.57 .22 .09 (.93)
.22 .57 .10 .68 (.94)
.11 .11 .46 .59 .58 (.84)
.56 .22 .11 .67 .42 .33 (.94)
.23 .58 .12 .43 .66 .34 .67 (.92)
.11 .11 .45 .34 .32 .58 .58 .60 (.85)
Not: - literele A, B i C se refer la trsturi iar cifrele 1, 2, i 3 subscrise se refer la
metode.
- matricile const din coeficieni de corelaie.
Surs: Gregory, R.J. (1996). Psychological Testing. History, Principles, and
Applications. Boston, London, Toronto, Sidney, Tokio, Singapore: Allyn and Bacon,
p. 122.
Figura 7.1. Modul de raportare a validitii prin Matricea multimetod-multitrstur.
Orientarea n tabelul de mai sus se face astfel:
coeficienii dintre paranteze de pe diagonala mare sunt coeficienii de
fidelitate pentru fiecare test n parte: cu ct este mai mare, cu att fidelitatea este
mai bun, dei n realitate ne mulumim cu r cuprini ntre 0,80 i 0,90;
coeficienii boldai de pe cele trei diagonale mici reprezint dovezi ale
validitii convergente: aceeai trstur fiind msurat prin diferite metode,
corelaia trebuie s fie una pozitiv i puternic;
n triunghiurile cu linie continu sunt incluse corelaiile dintre diferitele
trsturi msurate cu aceeai metod: acestea trebuie s aib valori medii sau
ridicate;
cele 6 triunghiuri din linii punctate includ corelaiile dintre diferitele
trsturi msurate cu diferite metode; acestea trebuind s fie ct mai mici n
fiecare triunghi, deoarece ele sunt dovezi importante despre validitatea
discriminant (divergent).
Aceast metodologie este o contribuie important la nelegerea procesului de
validare, dar reclam un efort de cercetare uria. De aceea cei mai muli creatori de
teste prefer s culeag informaii separate, pe buci despre fidelitate i validitate,
pe care s le reuneasc ulterior ntr-un tabel compozit, dect o matrice care s le
integreze din capul locului pe toate deodat simultan.
7.1.3. Studiul trsturilor latente
Ne ateptm ca itemii care msoar un acelai construct sau caracteristic s
fie puternic corelai ntre ei, ceea ce ar putea primi o reprezentare grafic de tip
scatter, care evideniaz norul de puncte dintre o abscis i o ordonat reprezentnd
cele dou variabile intercorelate. Analiza factorial este o tehnic special care
permite s se mearg mult mai departe dect simpla inspecie vizual a matricilor de
intercorelaii sau a norului de puncte. Scopul metodei este acela de a determina
numrul minim de determinani numii factori, dar i trsturi latente, necesari
explicrii intercorelaiilor din matricile respective.
Demersul tipic al analizei factoriale const din a administra o baterie de teste
ctorva sute de subieci i apoi de a calcula intercorelaiile dintre toate perechile
posibile de teste, ceea ce va produce o matrice de intercorelaii. Deoarece fiecare test
nu este o trstur independent (caz n care intercorelaiile din matrice ar tinde spre
zero) i deoarece mai multe teste msoar n diverse grade o aceeai trstur,
formnd clusteri (ciorchini), analiza factorial tinde s descopere un numr mai mic
de factori dect numrul testelor intercorelate i apoi s produc un tabel care s
indice ncrctura (saturaia) fiecrei variabile n factorul respectiv. Aceasta poate
varia, ca orice coeficient de corelaie, ntre -1,00 i +1,00. Rezultatul cel mai
important al analizei factoriale este un tabel cu factorii i saturaia fiecrei variabile n
factorii respectivi, ceea ce ne ajut s descriem structura factorial i s producem
astfel dovezi despre validitatea de construct a unei baterii de teste sau de variabile
reunite.
Creatorul analizei factoriale, Charles Spearman (1907) a dezvoltat o metod
capabil s pun n eviden existena unui factor general al inteligenei, prezent n
orice tip de sarcin mintal (i de aceea numit i factor g), n combinaii diferite cu un
factor specific numit s. Procedeul dezvoltat de el, numit metoda componentelor
principale, i-a permis s produc dovezi n favoarea ipotezei sale, numit modelul
bifactorial al inteligenei.
n 1928, un creator american n domeniul analizei factoriale, Thurstone, a
utilizat aceeai metod ortogonal (dou axe aflate n unghi drept, adic independente
ntre ele) dar cu un mic amendament: n loc ca o ax s explice variana factorului
major i cealalt variana rezidual (variana rmas neexplicat de factorul major) el
a propus rotirea celor dou axe ortogonale pn la obinerea structurii celei mai
simple, ameliornd astfel gradul de adaptare al datelor la structura factorial. Metoda
se mai numete i Varimax deoarece ea caut ca pe fiecare dintre cele dou axe
ortogonale variana explicat s fie una maximal. Aceasta face ca fiecare factor s
explice un grup de rezultate i doar att, cci cu aceast metod nu mai poate fi
identificat factorul general, ceea ce pune n discuie modelul propus de Spearman
pentru a defini inteligena uman.
Din punct de vedere matematic ambele metode sunt valide, dar fiecare are
propriile posibiliti i limite: una ajut la identificarea factorului general pe care
cealalt l neag, dar cealalt ajut la mai buna identificare, nelegere i numire a
factorilor rezultai. De aceea utilizarea lor este corelativ. Analiza factorial permite
doar verificarea faptului dac datele sunt consistente cu structura factorial postulat.
Cnd datele sunt compatibile cu mai multe structuri latente, analiza factorial nu ne
poate ajuta s alegem una singur, aceast alegere fundamentndu-se pe baza unei
teorii prealabil elaborat. ntr-un demers de validare, analiza factorial ne va aduce
deci informaiile necesare, dar nu i suficiente lurii unei decizii.
Analiza factorial se sprijin pe dou postulate de baz:
postulatul cauzalitii factoriale: variabilele observate sunt combinaii lineare
de variabile cauzale subiacente;
postulatul parcimoniei: dintre dou soluii factoriale trebuie s o alegem pe
cea mai simpl. Dei larg acceptat de majoritatea cercettorilor, nu este posibil de
demonstrat c acest postulat este bine fundamentat i nici nu este valabil faptul c
ntotdeauna structura cea mai simpl s fie mai plauzibil dect cea mai complex.
Oricum, n funcie de tipul de analiz ales ajungem la soluii factoriale diferite,
iar soluia final pe care o alegem nu este una de natur matematic, ci de natur
teoretic. n plus, analiza factorial pune nu numai probleme de interpretere, ci i
cteva importante probleme metodologice, rezumate mai jos.
Mrimea eantionului: cu ct eantionul pe care se face analiza factorial este
mai mic, cu att mai mult coeficienii de corelaie din matrice pierd din
semnificaia statistic, soluiile factoriale obinute trebuind examinate cu mai
mult pruden. Dei nu poate fi indicat o mrime ideal, cercettorii au czut de
acord cu raportul de 5 la 1 ntre numrul subiecilor din eantion i numrul
variabilelor supuse factorizrii. Dar i acest lucru trebuie luat cu rezerv, pentru c
corelaiile mici (sub 0,30) pun n discuie nu mrimea eentionului, ci chiar
necesitatea desfurrii unei analize factoriale, dup cum corelaiile mai mari de
0,50 se pot desfura cu rezultate bune i pe eantioane mai mici dect cele ce ar
rezulta din raportul 5/1. Deci, nainte de a efectua o analiz factorial, obligatoriu
vom inspecta cu atenie matricea de intercorelaii a variabilelor factorizate.
Normalitatea multivariat: aceasta semnific faptul c toate variabilele i
toate combinaiile lor se distribuie normal. Cum nu putem testa toate combinaiile
de variabile, ceea ce ne rmne de fcut este faptul de a aprecia normalitatea
fiecrei variabile n parte din coeficientul de asimetrie i de boltire (skewness i
kurtosis).
Liniaritatea: relaia dintre variabile trebuie s fie liniar, n caz de
curbiliniaritate rezultatele analizei factoriale fiind de pus la ndoial. Liniaritatea
dintre variabile se poate verifica prin scatter-ul cu norul de puncte pentru fiecare
combinaie de cte 2 variabile.
7.2. Validitatea diferenial
Validitatea unui test este determinat pe ansamblul populaiei pe care el a fost
aplicat. Aceasta ar putea s nsemne c c validitatea astfel determinat este una
valabil pentru toi subiecii acestei populaii, postulat care afost tot mai mult pus la
ndoial dup anii 70. n felul acesta s-a ajuns la concluzia c validitatea unui test
poate varia nuntrul aceleiai populaii prin faptul c unii subieci pot aprine unor
subgrupuri speciale. De exeemplu, validitatea determinat pentru un test de lectur
poate fi diferit pentru stngaci, ca subpopulaie a grupului total. Validitatea pentru un
test de matematic poate fi afectat n cazul unui grup special, care obine
performane sistematic mai sczute, nu din cauza capacitii de raionament mai
sczut a membrilor acestui subgrup, ci ca urmare a faptului c acetia au o tulburare
specific de citit (dislexie) i neleg cu mai mare dificultatea enunurile itemilor
testului.
Aceste constatri conduc la lrgirea cadrului conceptual al validitii nu numai
la diferitele utilizri care se dau unui test, ci i pentru diferitele subgrupuri
populaionale pe care se aplic, n raport cu care el este mai mult sau mai puin valid.
Pentru acest tip de validitate termenul care s-a ncetenit este acela de validitate
diferenial iar populaiile care se abat de la regula general se cheam c sunt
biasate (distorsionate).
Studiul acestei forme de validitate este i el foarte complex i rmne ca
orice alt form de validitate un demers doar parial mplinit, adic neterminat.
Pentru orice utilizare a unui test pe un grup nou trebuie s se aduc dovezi c el nu
este unul biasat. Simpla constatare a diferenei dintre dou grupuri nu nseman
neaprat c unul dintre ele este neaprat biasat. Performanele mai slabe la un test de
vocabular ar putea avea ca explicaie i oportunitile de nvare diferite pentru cele
dou grupuri.
Testele ce ar putea pune n eviden diferenele dintre cele dou grupuri pot
avea i o utilitate social, pentru c pot pune n micare aciuni de remediere pentru a
da membrilor fiecrui grup anse egale. Ca i validitatea n general, cea diferenial se
determin tot prin trei procedee, ce au i acelai nume: validitatea de coninut,
validitatea relativ la criteriu i validitatea relativ la construct (sau conceptual).
Pentru a nu ngusta prea mult problematica validitii difereniale, nu vom intra n
detalii cu prezentarea sa.
7.3. Teoria deciziei aplicat la testele psihologice, asociat validitii
predictive
Muli psihologi susin c scopul testrii psihologice nu este msurarea n sine,
ci msurarea n serviciul lurii unei decizii optime. Astfel, managerul vrea s tie pe
cine s angajeze, examinatorul pe cine s admit iar psihiatrul pe cine s interneze.
Testele psihologice joac n mod frecvent un rol important n aceste tipuri de decizii
instituionale. Dei n luarea unei decizii adesea sunt luate n considerare mai multe
puncte de separaie a grupurilor, numite i puncte de tietur (cutoff), pentru a
simplica lucrurile noi vom pleca de la exemplul unui singur test. n realitate, scorurile
la un test se dispun pe ceea ce n statistic numim amplitudinea mprtierii (R =
range). Cu toate acestea este posibil s identificm punctul care desparte jumtatea
creia i se prezice succes de cea creia i se prezice nereuit.
S presupunem de asemena c cei crora li s-a prezis succes au fost i selectai
sau angajai ntr-o oarecare proporie, ce poate varia de la 0 la 1, dup numrul de
persoane considerate a fi susceptibile s reueasc n funcie de criteriul de msur
adoptat. Dac procedm foarte reducionist, succesul poate fi mprit ntr-o variabil
dihotomic predicie succes versus predicie eec n timp ce criteriul prin care
se va determina succesul ulterior poate fi mprit la rndul su n a reuit i a avut
eec. Aadar, orice studiu de validitate predictiv poate produce o matrice cu dou
intrri de tipul celei de mai jos.
P
r
e
d
i
c

i
a

l
a

t
e
s
t
Performana la criteriu
A avut succes A avut eec
Va avea succes Predicie corect Fali pozitivi
Va avea eec Fali negativi Predicie corect
Figura 7.2. Rezultatele posibile ale unui test de selecie
utilizat pentru a preciza un criteriu-msur.
Dac un test a avut o bun validitate predictiv, atunci diagonala stnga-sus dreapta-
jos se maximizeaz: cele mai multe persoane crora li s-a prezis succes au i avut
succes iar cele mai multe persoane crora li s-a prezis eec au i euat, deci ambele
predicii s-au adeverit. Dar cum nici un test de selecie nu este un predictor perfect,
sunt posibile i celelalte dou situaii: s-a prezis succes unor persoane care au euat
(falii pozitivi) ori s-a prezis eec i acesta nu a avut loc (falii negativi). Ambele
categorii de fali, pozitivi i negativi, sunt considerate n egal msur eecuri ale
prediciei, deoarece ambele au fcut predicii inacurate. Se poate astfel calcula
urmtoarea proporie:
Rata de reuit = reuite / (reuite + eecuri)
n lumea real fals-pozitivii i fals-negativii sunt evitai, dar nu pn la eliminare,
pentru c aceasta ar presupune un test care are o corelaie perfect (r = + 1,00) cu
criteriul prezis. Cum acest lucru nu este posibil, ceea ce rmne de fcut pentru a
minimiza erorile de decizie este dezvoltarea de teste cu o mare valoare predictiv.
n luarea deciziilor, adepii teoriei deciziei se sprijin pe dou asumpiuni:
Dezvoltarea unei scale de utilitate, astfel nct indicatori importani ai
instituiei s poat fi exprimai n profituri sau pierderi. De exemplu, dac dup un
chestionar de tipul EPI al lui Eysenck, prin care se poate determina i
introversia/extraversia, o companie poate identifica pierderile asociate cu
vnztorul de maini introvert, comparativ cu ctigurile aduse de vnztorul
extravert. Astfel, falii pozitivi sunt cei ce aduc pierderi instituiei (vnd mai
puine maini dect ar fi necesar pentru plata propriului salariu), ca i falii
negativi (cei care, dac ar fi fost ncadrai, ar fi contribuit la creterea profiturilor
companiei). Acesta este un exemplu de operaionalizare a testului i a seleciei pe
o scal de utilitate.
n deciziile de selecie instituional strategia cea mai satisfctoare este aceea
de a maximiza ctigul scalei de utilitate i de a minimiza pierderile. Ea trebuie s
rspund la ntrebarea la ce proporie de selecie se produce cel mai mare ctig
mediu al scalei?
Tabelele Taylor-Russell, publicate prima dat de aceti autori americani n
1939, permit unui utilizator de teste s determine proporia expectat pentru aplicanii
selectai dac se specific trei elemente: 1. validitatea predictiv a testului, 2. rata
(proporia) seleciilor i 3. proporia bazal pentru aplicanii de succes.
Ce sunt aceste elemente?
- validitatea predictiv este determinat anterior prin studii i se exprim
printr-o corelaie de tipul r
xy
;
- proporia selecionailor este cea rezultat din numrul de alei supra
numrul de aplicani, nmulit cu 100;
- rata de baz este proporia celor ce ar fi fost selecionai prin metodele
curente, fr beneficiul adus de noul test. Cum acest lucru este mai greu de
determinat, la extrem se folosete pentru rata de baz proporia aplicanilor de
succes, dac ei ar fi fost alei aleator.
Cunoaterea celor trei factori de mai sus face posibil utilizarea unor tabele
special construite prin care se determin cu ct mbuntete noul test selecia,
comparativ cu metoda anterioar. Pe lng faptul c leag testul psihologic de aspecte
economice foarte pragmatice, determinnd efectiv valoarea practic a unui test,
tabelele Taylor-Russell evideniaz i aspecte care intrig, cum ar fi creteri
substaniale ale acurateei seleciei, chiar i la validiti foarte mici, n anumite
condiii.
7.4. Precauii legate de evaluarea coeficienilor de validitate predictiv
Standards for Educational and Psychological Testing din SUA atrag atenia
asupra ctorva probleme importante i precauii legate de interpretarea coeficienilor
de validitate:
Cercetai schimbrile aprute n sensul cauzalitii test-criteriu: de regul
presupunem implicit c relaia dintre test i criteriu este nc n funciune atunci
cnd aplicm noi testul. De exemplu, testul s-a dovedit util n selecia de
supraveghetori femini, ceea ce s-a soldat cu succes ntr-o prim faz, cnd grupul
era demixtat (numai femei), dar nu ia n consideraie situaia actual n care grupul
de munc este unul mixt.
Ce nseman criteriul ales? Coeficientul de validitate contra criteriului obinut
poate s nu nsemne nimic dac criteriul nu este el nsui fidel i valid. A corela un
test cu un altul despre care nu tim prea multe lucruri sub aspectul validitii nu ne
ajut prea mult n determinarea validitii convergente a primului test.
Luai ntotdeauna n consideraie populaia pe care s-a obinut o anume validitate:
o validitate ridicat pe o populaie de albi se pstreaz ea oare i pe o populaie de
negri?
Asigurai-v c mrimea eantionului populaional este suficient i adecvat: cu
ct este mai mare grupul iniial pe care s-a studiat validitatea, cu att mai bun este
validitatea ncruciat.
Niciodat s nu confundai criteriul cu predictorul.
Verificai spectrul de valabilitate att pentru predictor, ct i pentru criteriu:
deoarece corelaia depinde de mrimea variabilitii, ea este subestimat sever
atunci cnd predictorul sau criteriul au un spectru de variabilitate foarte ngust.
Generalizai cu pruden o validitate gsit: cu alte cuvinte trebuie demonstrat c
validitatea descoperit ntr-un studiu nu este dependent de situaie.
Luai n calcul i validitatea diferenial: relaiile descoperite pentru o populaie
demografic s-ar putea s nu fie deloc aceleai pentru toate subgrupurile care o
compun.
7.5. Interpretarea coeficienilor de validitate
Pentru c strategiile de validare a unui test sunt att de diverse, nu exist o
interpretare uniform a acestora. n practic ntlnim destul de rar coeficieni mai mari
de 0,60, cei mai muli (considerai satisfctori sau chiar mari) oscilnd ntre 0,30
0,40.
Un coeficient de validitate este semnificativ statistic cnd ansele de a-l obine
din ntmplare sunt sub 5 procente. Pentru a fi mai specifici, vom arta c ptratul
unui coeficient de validitate (coeficientul de determinare) indic procentajul din
variabilitatea criteriului pe care ateptm s o tim n avans prin cunoaterea
scorurilor la test. La o corelaie de 0,60 dintre o baterie de teste i media colar
anual, vom ti c
2
60 , 0 = 0,36, adic 36% din variabilitatea mediei colare depinde
de inteligen, aa cum am msurat-o cu bateria noastr, restul depinznd de alte
cauze, printre care i de factorii de eroare.
Uneori o validitate de 0,30 ar putea nseamna economii de milioane de dolari
n orientarea i selecia profesional, alteori o validitate de 0,40 poate fi
nesatisfctoare. Chiar dac Ursula chiopu (1974) apreciaz c o validitate de peste
0,25 face ca testul s dea predicii superioare oricrei sondri empirice, asociaiile
profesionale ale psihologilor din America au dat n 1985, prin Standards for
Educational and Psychological Testing o list de probleme ce pot aprea n
interpretarea coeficienilor de validitate. Redm cteva din ele:
Validitatea nu se msoar, ci se deduce. Dei autorul testului trebuie s dea mai
muli coeficieni de validitate, indicnd procedura urmat, utilizarea lui pe alte
grupuri, sau n alte scopuri, necesit studii de validare suplimentare. Aceasta
deoarece validitatea testului depinde simultan de scopul testrii i de populaia
creia i se administreaz. Toate aceste determinri ale validitii care vin din studii
ulterioare, desfurate n scopuri specifice i pe alte eantioane de populaie, vor fi
considerate doar dovezi ale unui anumit tip de validitate.
Studierea validitii testelor angajeaz metode elaborate de analiz (analiza de
itemi, calculul corelaiei, analiza factorial, regresia simpl i multipl) care
combinate, dau strategii de validare mai bine definite. Utilizarea lor se face n
funcie de scopul i de exigenele beneficiarului.
Strategiile de validare se aplic odat cu construirea testului i se repet de cte
ori este nevoie pentru a obine un test bun ca lungime, mod de aplicare, for
discriminativ, uurin n administrare, cotare i interpretare, care alturi de
fidelitate i validitate, dau o imagine mai adecvat despre valoarea sa.
Utilizarea testului impune procesul repetrii periodice a cercetrii validitii, ntruct
validarea unui test nu se ncheie niciodat, datele nou acumulate din diverse domenii
conducnd la ameliorarea i rafinarea sa, dar nu i la o soluie definitiv. Cu att mai
mult se pune problema relurii studiului validitii unui test cnd i se schimb
formatul (prin aplicarea pe calculator, de exemplu), coninutul, instructajul sau modul
de cotare.
CAPITOLUL 8
ANALIZA DE ITEMI
8.1. Precizri terminologice
ntr-o manier similar cu cea din fizic, n care interesul iniial pentru lumea
macroscopic s-a recentrat pe cea microscopic, atomic i subatomic, n
psihodiagnostic aceast schimbare se manifest prin mutarea centrului de greutate al
preocuprilor de analiz de pe testul psihologic ca unitate de baz, pe analiza de itemi,
adic pe cele mai mici uniti care compun un test i care pot fi analizate independent.
Fundamentarea msurrii n psihologie se face prin psihometrie iar unitatea
fundamental a acesteia a devenit itemul. Evoluia i rafinarea domeniului testelor
este astzi tot mai dependent de analiza de itemi, pentru c pentru a-i cita pe
Laveault i Grgoire analiza de itemi seamn cu repetiia unei orchestre. ntr-o
orchestr instrumentele trebuie s cnte ntr-o manier armonioas.
5
O defiiniie mai larg a itemilor este aceea c ei reprezint orice tip de enun
din alctuirea unui test obiectiv care urmeaz a fi cotat ca o valoare.
6
Elementul
fundamental al acestei definiii este partea care stipuleaz c itemul va fi cotat ca o
valoare cifric, permind deci determinri cantitative ale unor caracteristici ale sale,
dar acest lucru nu este specific doar testelor obiective, ci oricrui tip de test, inclusiv
celor educaionale. Merit subliniat i precizarea lui Stan (2002): itemul este
componenta informaional a unui test care se ntlnete la chestionarul de
personalitate, la testele de cunotine colare, la testele verbale i neverbale de
inteligen. Nu trebuie deci confundate noiunile de sarcin a testului cu cea de item
al testului, deosebirea fundamental fiind aceea c itemul are autonomie
informaional care permite efectuarea unor prelucrri statistice proprii asupra
5
Laveault, D., Grgoire, J. (2002). Itroduction aux thoriex des tests en Psychologie et en scieces de
l'ducation. 2
eme
edition. Bruxelles: ditions De Boeck Universit, p. 199.
6
Biceanu, L. (2004). Dicionar ilustrat de psihologie englez romn. Bucureti: Editura tehnic, p.
191.
rezultatelor sale, ceea ce permite evidenierea altor indicatori.
7
Individualitatea sau
autonomia funcional a unui test este acea caracteristic a sa de a contribui la scorul
total al testului i de a produce rezultate care pot fi prelucrate independent sau
intercorelate cu rezultatul final la test. De aceea cea mai bun definiie a itemului este
cea potrivit creia acesta reprezint cea mai mic unitate informaional a unui test
care poate fi analizat independent.
La modul foarte general, analiza de itemi a unui test sau chestionar are scopul
de evalua fidelitatea i validitatea fiecrei uniti componente, pentru a surprinde n
termeni cantitativi ct de efectiv contribuie fiecare item la fidelitatea i validitatea de
ansamblu a testului sau chestionarului respectiv.
8
n sens foarte strict, analiza de
itemi nu se va confunda cu analiza itemului, deoarece scopurile lor sunt distincte.
Analiza de itemi vizeaz evidenierea dificultii itemilor, a puterii lor discriminative,
a calitilor psihometrice de tipul fidelitii i al validitii, dar i al altor caracteristici
ca simetria i boltirea (excesul), omogenitatea i specificitatea sa ori raportul item-
distractor. Analiza itemului se refer mai ales la procedurile corecte de prelucrare
informaional, la procedurile semantice de formulare sau de modificare a
coninutului itemilor, la limita de timp necesar rezolvrii sale, la ambiguitatea
formulrii.
Analiza de itemi este greu de desfurat pentru testele de vitez sau pentru cele
n care factorul rapiditate intervine masiv, cum ar fi testele de atenie, testele de
performan cu limit de timp, i aceasta deoarece o condiie a analizei de itemi este
parcurgerea integral a tuturor itemilor testului, de ctre toi subiecii, fr de care
indicele de dificultate nu poate fi determinat. Dei aceast condiie nu este formulat
explicit la testele de putere, n care factorul timp conteaz, problema se poate rezolva
dndu-se testul spre rezolvare n limita de timp prevzut, cnd itemii se rezolv n
ordine, se marcheaz ultimul item pasat la expirarea timpului, dup care testul se
continu pn la rezolvarea sa n ntregime de ctre toi subiecii.
Dificultatea major a anlizei de itemi este aceea c exist o legtur evident
ntre caracteristicile testului i ale itemilor si i caracteristicile eantioanelor care
sunt msurate cu ajutorul acestuia. Noua direcie n psihometria modern aspir la
degajarea parametrilor testului de caracteristicile eantioanelor cercetate, dar aceasta
complic destul de mult datele problemei. n cazul n care analiza se face plecnd de
7
Stan, A. (2002). Testul psihologic. Evoluie, construcie, aplicaii. Iai: Editura Polirom, p. 259.
8
Reber, A.S. (1985). Dictionary of Psychology. London, New York etc.: Penguin Books, p. 378.
la un singur eantion, acesta ar trebui s aib ntr-o ct mai mare msur caracteristica
de a fi reprezentativ, pentru a putea extrapola caracteristicile degajate de pe acest
eantion pe alte grupuri sau subgrupuri populaionale pe care urmeaz a fi aplicat.
Analiza de itemi este o operaie de neevitat n construcia unui bun test sau
chestionar, fie pentru a genera uniti de msur valide ale unui singur construct
(unidimensionalitatea scalei de msur), fie pentru a selecta itemii care au cele mai
bune combinaii dintre dificultate for de discriminare i omogenitate
specificitate. Aceasta este raiunea pentru care analiza de itemi pleac de la un set
iniial mai mare de itemi (cu pn la o treime sau chiar dublu), din care vor rmnea
cei care corespund cel mai bine exigenelor de construcie a unui test modern.
Numrul minim de itemi care vor rmnea n urma acestei selecii este de 10, sub care
nici o scal nu mai discrimineaz suficient de nuanat ntre diverse subcategorii,
fiecare item avnd o pondere mult prea mare n scorul final. De regul, scalele
unidimensionale rein ntre 20 i 30 de itemi pentru a mpca criteriul economiei cu
cel al sensibilitii i al forei de discriminare a testului.
Elementul tehnic necesar pentru analiza caracteristicilor de dificultate i
discriminabilitate ale itemilor este matricea lui Stern
9
care plaseaz pe fiecare coloan
itemii ce vor fi supui analizei i pe fiecare linie cte un subiect, ultimele linii i
coloane fiind necesare sumarizrii rezultatelor i calculrii unor indici. Analiza de pe
coloan se numete ipsatizare (rezultatele tuturor subiecilor la un anumit item), iar
cea de pe linie obiectivare (rezultatele unui singur subiect la toi itemii). mprirea
scorului total pentru toi subiecii la numrul acestora d o medie pe subiect, iar
mprirea scorului total pentru fiecare item la numrul de subieci d o medie a
reuitelor. n concluzie, se poate determina o medie pentru fiecare subiect, o medie
pentru fiecare item i o medie pentru testul total, care este de fapt o sum a mediilor
tuturor itemilor.
8.2. Dificultatea itemilor
n cazul itemilor dihotomici adic scorai cu 0 i 1 dificultatea unui item
este dat de proporia celor care au reuit rezolvarea sa. Indicele de dificultate poate
lua valori cuprinse ntre 0 i 1, n prima situaie itemul fiind foarte greu (majoritatea,
sau chiar toi subiecii nu l-au putut rezolva), n a doua situaie el fiind foarte uor
9
William Stern, 1912.
(majoritatea sau aproape toi subiecii l-au rezolvat). Dac itemul a fost cotat pe o
scal de mai multe puncte (polihotomic), indicele de dificultate se afl dup formula:
p =
n
x

n care x este suma scorurilor obinute fiecare subiect iar n este scorul maxim. Pentru
a avea o imagine mai clar asupra dificultii itemului, prin comparaie cu un alt
indicator care este media itemului, dm tabelul de mai jos, n care sunt calculate
mediile i dificultile a 3 itemi scorai pe o scal de 5, 3 i 1 punct.
Aa cum se observ din exemplul de mai jos, media itemului nu permite
comparaia direct a itemilor, deoarece numai pentru scala dihotomic cei doi indici -
media i procentul de reuit - coincid. Pentru a fi direct comparabile, rezultatele
trebuie aduse la acelai tip de scal, prin mprirea mediei la valoarea maxim a
fiecrei scale i n felul acestea ele vor indica n acelai fel dificultatea itemilor, ca i
cnd toi itemii ar fi scorai dihotomic.
Subiect Itemi
Item (/5) Item (/3) Item (/1) Total (/8)
1 4 3 1 8
2 5 2 0 7
3 1 0 0 1
4 3 1 1 5
5 4 2 1 7
6 2 1 1 4
7 2 3 0 5
8 0 3 1 4
9 5 2 1 8
10 1 1 1 3
11 3 1 0 4
12 3 2 1 6
Media (x/n) 33/12 = 2,75 21/12 = 1,75 8/12 = 0,67 62/12 = 5,17
Dificultatea p 2,75/5 = 0,55 1,75/3 = 0,58 0,67/1 = 0,67 5,17/9 = 0,57
Complement q (1-p) 1-0,55 = 0,45 1-0,58 = 0,42 1-0,67 = 0,33 1-0,65 = 0,43
Corecie p' 0,44 0,37 0,34 -
Figura 8.1. Mediile i indicii de dificultate pentru 3 itemi
scorai pe o scal de 5, 3 i 1 punct.
n exemplul de mai sus valoarea medie a dificultii celor 3 itemi este de 0,57,
dar observm c itemul cel mai dificil este pe scala de 5 puncte (p = 0,55), apoi cel pe
scala de 3 puncte (p = 0,58), cel mai uor fiind cel de pe scala dihotomic (p = 0,67).
Dificultatea medie a itemilor sumarizai pe ultima coloan este de 0,57, valoare care
poate fi considerat media itemilor ntregului test, care se poate obine fie mprind
media de 5,17 la 5+3+1 = 9, fie fcnd o medie a dificultii celor 3 itemi
(0,55+0,58+0,67)/3 = 0,60.
Aa cum reiese din cele artate anterior, itemul care se apropie ca proporie p
de rezolvare de valoarea 1 este unul extrem de uor, deoarece majoritatea sau chiar
toi subiecii l rezolv, pe cnd itemul al crui p care se apropioe 0 este unul extrem
de greu, fiind rezolvat de extrem de puini subieci, poate de niciunul. Dificultatea
medie a unui item este de 0,50, de regul itemii aflai spre valori p extreme 0 i 1
se recomand s fie nlocuii, ei aducnd puine servicii psihodiagnostice testului,
pentru a se reine prioritar itemii de dificultate medie (p = 0,40 0,60). n scopul de a
da o gradaie mai fin scalei, limitele de acceptabilitate ale dificultii itemilor se
plaseat de fapt ntre 0,20 i 0,80.
Cunoaterea dificultii itemilor este important din mai multe motive:
permite eliminarea itemilor mult prea uori ori mult prea dificili;
permite selecia i organizarea itemilor pe scale ierarhice de dificultate, de la
uor la greu, acestea dnd gradaii cu att mai fine cu ct numrul itemilor este
mai mare i diferenele de dificultate dintre itemii progresivi sunt mai mici, p
acoperind ns spectrul de la 0,20 la 0,80, sau chiar depind-o dac se impune;
permite crearea de seturi mari de itemi, cunoaterea caracteristicilor privitoare
la dificultate i la indicele de discriminare, ca i curba caracteristic a fiecrui item
dnd posibilitatea de a fi asamblai automat n examenul adaptat computerizat.
De notat c decizia de a elimina un item se poate lua mai uor sau mai greu,
deoarece acelai item care la o categorie superioar de vrst este prea uor devine
greu sau foarte greu la o categorie mai mic de vrst, itemul cptnd valene
diagnostice noi funcie de particularitile eantionului pe care se face analiza de
itemi. Mai mult, un item foarte uor, chiar dac nu are caliti psihometrice, d
ncredere n sine subiectului i l ajut s intre n examen cu o reuit, ridicndu-i
motivaia pentru testare, pe cnd un item foarte greu poate distinge spre extrema
excepionalitii. Aadar pstrarea sau respingerea unor itemi se face n funcie de
utilitatea care se va da testului respectiv. Mai mult, problema dificultii itemilor este
important n mod special la testele de randament sau la cele educaionale (de
cunotine i de achiziii), pe cnd la testele de personalitate indicele de dificultate va
fi nlocuit cu un indice de proeminen
10
, capabil s evidenieze msura n care un
item reliefeaz un anumit comportament rezultat din operaionalizarea unei trsturi
de personalitate.
Dintre factorii care pot afecta indicele de dificultate al unui test, Laveault i
Grgoire enumer numrul de rspunsuri omise ca urmare a existenei unei limite de
timp i probabilitatea reuitei prin ans/hazard. n prima situaie, din cauza
presiunilor legate de timp, un mare numr de persoane nu au putut rezolva rezolva un
item amplasat de regul spre zona final a testului (atunci cnd itemii au fost
asamblai ierarhic), indicele de dificultate ne mai reflectnd acurat dificultatea
itemului respectiv, pentru c dac ar fi existat mai mult timp, cu siguran c el ar fi
fost rezolvat de mai muli subieci. n acest caz indicele de dificultate msoar de fapt
dou lucruri distincte, dificultatea itemului n cauz i rapiditatea respondentului,
caracteristici care nu ntotdeauna se gsesc reunite la acelai subiect.
Atunci cnd dificultatea se calculeaz pentru itemi la care alegerea rspunsului
se face dintre mai multe posibiliti trebuie s se in cont de probabilitatea alegerii
rspunsului bun prin ans sau hazard, care este cu att mai mare cu ct numrul
variantelor de rspuns este mai mic. Astfel, la o variant corect din 8, rspunsul bun
prin ans are probabilitatea de 12 procente, la 1 din 6 de 17 procente, la 1 din 4 de 25
de procente i la 1 din 2 de 50 de procente. n scopul de a corija indicele de
dificultate, atunci cnd distractorii au anse apropiate de a fi alei, Laveault i
Grgoirea propun urmtoarea formul de corecie:
1
]
1


1
1
'
M
p
p p
n care p este indicele de dificultate iniial, p' este cel corijat, iar M este numrul
variantelor de rspuns pentru itemul n cauz. Introducnd n formula de mai sus
datele pentru primul item din exemplul de la figura 8.1, p' = 0,55 - [(1 0,55)/(5 -1)]
i p' = 0,44. Pentru al doilea item, cotat pe o scal de 3 posibiliti, p' devine 0,37 iar
pentru itemul dihotomic corecia ajunge la 0,34. Comparnd indicile de dificultate
iniial cu cel corijat se observ uor c corecia este cu att mai puternic cu ct
numrul variantelor de rspuns este mai mic. Se degaj de asemenea concluzia c
atunci cnd avem de comparat mai muli itemi, exprimai pe scale diferite ca numr
de variante de rspuns, aducerea lor la formatul unic al unei scale dihotomice este o
10
Stan, op. cit., p. 2007.
condiie necesar, dar nu i suficient, cci pentru a avea o baz de comparaie
comun trebuie s operm corecia necesar prin formula de mai sus.
Cteva caracteristici importante ale itemului se determin plecnd de la
constatarea c exist o legtur strns ntre dificultatea sa i simetria distribuiei sale.
Astfel, itemii a cror dificultate este n jurul mediei (p = 0,50) sunt simetrici iar cei cu
dificulti extreme sunt asimetrici, dar n mod difereniat: cei cu dificultate foarte
mare (p < 0,10) au o asimetrie puternic pozitiv, pe cnd cei cu dificultatea foarte
mic (p > 0,90) au o asimetrie puternic negativ. De aceea este mai grav situaia unui
item uor, euat, dect a unuia greu, euat, pe care oricum l rezolv puini subieci.
De aici concluzia c itemii uori sunt discriminativi pentru subiecii slabi sau pentru
vrstele mici, pe cnd cei dificili sunt discriminativi pentru subiecii foarte dotai
i/sau pentru vrstele mai mari, la testele care evideniaz o ierarhie sau care au un
indice genetic puternic (creterea performanei paralel cu vrsta pn la un punct). De
aici i rolurile diferite alocate itemilor n funcie de dificultatea lor, cei mai utili fiind
cei de dificultate medie, care difereniaz subiecii ntre ei indiferent de scorul obinut,
fiind utili i pentru discriminarea subiecilor buni i a celor slabi.
Un concept important, derivat din cele artate mai sus, este acela de varian
a itemului, care ne informeaz n legtur cu gradul de mprtiere al performanei la
acel item n jurul unei medii, fiind n acelai timp i un indicator mai grosier al puterii
de discriminare a itemului. Pentru itemii cu mai multe valori de rspuns
(polihotomici), variana se determina prin metoda clasic, dar pentru o scal
dihotomic exist o formul mult mai simpl pentru a o determina:
s
2
= pq
n care s
2
este variana itemului, p este indicele de dificultate iar q complementul su
(1 - p). Pentru a avea o reprezentare mai clar asupra acestei probleme prezentm mai
jos o situaie ipotetic, constnd din 11 itemi propui spre rezolvare la 10 subieci.
Subiec
i
I T E M I
Total 1 2 3 4 5 6 7 8 9 10 11
1 1 1 1 1 1 1 1 1 1 1 0 10
2 1 1 1 1 1 1 1 1 1 0 0 9
3 1 1 1 1 1 1 1 1 0 0 0 8
4 1 1 1 1 1 1 1 0 0 0 0 7
5 1 1 1 1 1 1 0 0 0 0 0 6
6 1 1 1 1 1 0 0 0 0 0 0 5
7 1 1 1 1 0 0 0 0 0 0 0 4
8 1 1 1 0 0 0 0 0 0 0 0 3
9 1 1 0 0 0 0 0 0 0 0 0 2
10 1 0 0 0 0 0 0 0 0 0 0 1
p 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 x=5,50
q 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 =2,87
pq 0,0
0
0,0
9
0,1
8
0,2
1
0,2
4
0,2
5
0,2
4
0,2
1
0,1
6
0,0
9
0,0
0
x=55
pq 0,00 + 0,09 + 0,16 + 0,24 + 0,25 + 0,24 + 0,21 + 0,16 + 0,09 + 0,00 =
1,65
x
2
=385
Figura 8.2. Evoluia varianei itemilor n funcie de indicele de dificultate p.
Din tabelul de mai sus se poate observa faptul c cea mai mare varian o au
itemii din zona central a indicelui de dificultate (la p = 0,5 s
2
= 0,25) i, pe msur ce
ne deprtm simetric spre zonele extreme, variana itemilor descrete de asemenea
simetric, de la 0,21 la 0,18, apoi la 0,09 i 0. Aceata este nc un argument matematic
puternic pentru a selecta n test itemii din zona central a dificultii, pentru c acetia
au fora discriminativ cea mai mare, i spre subiecii slabi, i spre cei buni. Itemii cu
varian mic au funcii speciale, fiind destinai fie discriminrii subiecilor slabi (p >
0,90), fie celor buni (p < 0,10), dar chiar i n cadrul acestor categorii speciale fora
lor de discriminare este mai sczut din cauza varianei lor mai mici. Pe de alt parte,
din figura de mai sus se observ c variana total a testului (2,87
2
= 8,25) nu este
egal cu suma varianelor fiecrui item n parte (pq = 1,65).
11
Pornind de la datele de mai sus pot fi calculai doi indicatori care regsesc la
nivel de item caracteristicile de ansamblu ale formei distribuiei testului, i anume
simetria (skewness) i excesul sau boltirea (kurtosis), dup formulele:
simetria =
pq
p q

, n care
3
este asimetria itemului;
boltirea =
6
1
4

pq

, ecuaie a crei valoare normal este 3.


Subiec
i
I T E M I
Total 1 2 3 4 5 6 7 8 9 10 11
p 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 n = 10
q 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 x =5,50
11 1
n mod explicit, variana unui test este egal cu suma varianelor fiecrui item, la care se adaug dublul
sumei valorilor fiecrei covariane posibile n ansamblul itemilor componeni. Vezi Stan, op. cit., p.
216.
pq 0,0
0
0,09 0,18 0,21 0,24 0,2
5
0,24 0,21 0,16 0,09 0,0
0
=2,87

3
- 2,6
7
1,5
0
0,8
7
0,4
1
0 -
0,4
1
-
0,8
7
-
1,5
0
-
2,6
7
- x=55

4
- 5,1
1
0,2
5
-
1,2
3
-
1,8
3
-2 -
1,8
3
-
1,2
3
0,2
5
5,1
1
x
2
=385
Figura 8.3. Indicatori ai simetriei i ai boltirii pentru tabelul precedent.
Tabelul de mai sus evideniaz foarte clar faptul c valorile lui p cuprinse ntre
0,70 i 0,30 dau distribuii relativ simetrice i c asimetria este cu att mai accentuat
cu ct ne deprtm mai mult spre extreme: pentru valori ale lui p > 0,80 asimetria este
puternic pozitiv iar pentru p < 0,20 aceasta este puternic negativ. Acesta poate fi i
motivul pentru care Guthke, Btcher i Spring (1991, p. 230) fixeaz limitele
inferioar i superioar pentru selecia itemilor unui test de randament la p = 0, 20,
respectiv p = 0,80.
Rspunsul la ntrebarea ct de dificili trebuie s fie itemii unui test? depinde,
pe de o parte, de utilizarea testului, pe de alt parte de tipurile de rspunsuri sau de
lungimea scalei. Aa cum am mai artat i anterior, un test n care itemii se scoreaz
adevrat-fals (sau 0 1) d o probabilitate de 50% ca rspunsul s se dea prin ans
(aleator), iar cnd variantele de rspuns sunt 4, aceast probabilitate este de 25%. Deci
probabilitatea
i
p
, care descrie dificultatea unui item, se plaseaz ntre 0 i 1 (nici un
subiect, respectiv toi subiecii l rezolv). n practic, dificultatea optim a unui item
se calculeaz n doi timpi:
1. Se calculeaz jumtatea diferenei dintre 100% succes i ansa de performan.
Pentru un test cu 4 posibiliti de rspuns, probabilitatea unui rspuns corect prin
ans (ntmplare) este de 25%, deci:
375 , 0
2
75 , 0
2
25 , 0 00 , 1

2. Se adaug la valoarea gsit probabilitatea rspunsului prin ans:


0,375 + 0,25 = 0,625 (dificultatea optim).
Iat cteva exemple:
Test cu dou variante de rspuns: p
s
= 0,50 + (1 - 0,50)/2 = 0,750
Test cu patru variante de rspuns: p
s
= 0,25 + (1 - 0,25)/2 = 0,625
Test cu ase variante de rspuna: p
s
= 0,167 + (1- 0,167)/2 = 0,584
Test cu opt variante de rspuns: p
s
= 0,125 + (1 0,125)/2 = 0,563
Test cu zece variante de rspuns: p
s
= 0,10 + (1 -0,10)/2 = 0,550.
Alegerea dificultii optime a unui test trebuie s rezolve aceast problem
complicat: cu ct itemii au mai puine variante de rspuns, cu att mai mare este
probabilitatea de a nimeri prin ans rspunsul corect, ceea ce oblig la creterea
dificultii optime la un nivel foarte ridicat, de 0,75. Aceasta coboar progresiv cu
mrirea numrului de variante de rspuns spre 0,50, dar cu ct acestea sunt mai multe,
timpul de analiz pentru fiecare item crete (sunt mai multe variante de luat n
considerare), ceea ce oblig la reducerea numrului de itemi. Aceast reducere
afecteaz simultan fidelitatea i validitatea testului n ansamblul su, ajungnd astfel
la alternativa variante mai multe de rspuns versus mai muli itemi. Dilema se rezolv
alegnd ntre 4 i 8 variante de rspuns, aceasta fiind o zon de echilibru ntre cele
dou extreme.
n rezumat, precizm nc o dat c pentru majoritatea testelor nu este deloc
indicat s avem itemi de dificultate egal (eventual cu dificultatea optim), pentru c
urmrim s avem itemi pentru o varietate a nivelurilor de dificultate, astfel nct testul
s aib o bun putere discriminativ n ansamblul su. Pentru cele mai multe dintre
teste itemii au o dificultate ce acoper spectrul de la 0,20 la 0,80, pentru a maximiza
astfel diferenele dintre subieci. n funcie de scopul testrii, pot fi concentrai itemi
preponderent dificili (sub 0,20), ca n cazul seleciei unor candidai pentru o facultate,
post sau meserie foarte pretenioas, sau itemi foarte uori (selecie indulgent).
Pe de alt parte, cunoaterea dificultii itemilor este fundamental n
aranjarea lor n test ntr-o ordine ierarhic. Itemii foarte uori, de la nceputul
testului, ajut persoana s neleag ce se cere de la ea i, chiar dac ei nu au valoare
psihometric probat, ajut la ridicarea moralului, inspirnd ncrederea n resursele
proprii. Itemii foarte dificili sunt destinai extremei drepte a scalei, deci supradotailor
sau celor de vrste mari, avnd utilitate pentru un numr mai mic de cazuri, ce apar
doar pe eantioane extinse ca volum.
8.3. Discriminabilitatea itemului
Dei fora de discriminare a unui item poate fi evaluat grosier i dup
variana sa, ntr-un mod mult mai specific discriminarea itemului leag destinul su de
destinul de ansamblu al testului din care el face parte. Astfel, se consider c un item
este discriminativ atunci cnd exist un bun paralelism ntre scorurile la test n
ansamblul su i scorul la itemul n cauz. Aceasta nseamn c scorurile mari la test
se asociaz cu o rat de reuit ridicat pentru itemul respectiv, dup cum scorurile
sczute la test se asociaz cu un nivel sczut de reuit la acest item.
Exist mai multe metode de a studia dac destinul itemului este solidar cu cel
al testului n ansamblul su. Indicele de discriminare, pus n circulaie de W.G.
Findley n 1956, se mai cheam i metoda grupurilor de contrast sau a grupurilor
extreme. Acesta este probabil i motivul pentru care metoda s-a bucurat de o mare
popularitate printre psihometricieni, dar este i motivul pentru care ea este astzi
criticat, cci uurina analizei se sprijin pe faptul c las pe dinafar aproape
jumtate dintre subieci (46%). Metoda propune pentru comparaia itemilor unui test
dou grupuri aflate la extremele seriei de variaie a scorurilor, 27%
12
din cei care au
dat rspunsurile cele mai bune la test fiind comparai cu ceilali 27% care au dat cele
mai slabe rspunsuri, pentru a determina pentru fiecare item n parte dac reuita se
asociaz cu apartenena la grupul superior. Dac vom nota cu p
s
indicele de dificultate
pentru grupul superior i cu p
i
pe cel pentru grupul inferior, formula indicelui de
discriminare va fi:
D = p
s
- p
i
Concret, indicele de discriminare se calculeaz astfel:
1. dup scorurile la test se determin grupul superior, grupul inferior i cel neutru;
2. se caut proporia n care subiecii din grupul superior i din cel inferior au rspuns
corect la fiecare item;
3. pentru fiecare item se scade proporia rspunsurilor corecte ale grupului slab din
proporia rspunsurilor corecte ale grupului bun, ceea ce d indicele de
discriminabilitate, a crui valoare poate varia ntre -1 i +1.
Valoarea 0 semnific egalitatea rezolvrii de ctre cele dou grupuri i deci
absena discriminrii; valorile pozitive indic preponderena rezolvrii itemului de
ctre grupul superior, iar cele negative de ctre grupul inferior i de aceea el trebuie
eliminat fr discuie, cci n acest caz destinul itemului nu este solidar cu al testului
din care el face parte. Se apreciaz c valorile lui D ntre:
12
Proporia respectiv a fost propus de Kelley n 1939.
0,00 - 0,10 indic absena discriminrii;
0,11 - 0,19 valoare de limit a discriminrii;
0,20 - 0,29 valoare sczut a discriminrii;
0,30 - 0,39 valoare bun a discriminrii;
0,40

item cu o foarte bun putere discriminativ.


Metoda presupune cel puin 30 de subieci n grup, pentru a nu avea mai puin de 8
subieci n grupurile de contrast.
Utilitatea i popularitatea indicelui D provine i din uurina cu care el poate fi
determinat manual, nelund n calcul dect ceva mai mult de jumtate dintre subieci.
Mai mult, n pofida acestui fapt, el d rezultate ntru totul comparabile cu metode de
lucru mai rafinate, cum ar fi cele corelaionale. De aceea n opinia lui Laveault i
Grgoire el poate fi folosit mai ales pentru testele educaionale, cu condiia ca nunrul
itemilor i al subiecilor s fie suficient de mare (peste 30) cci, n caz contrar,
valoarea acestui item este artificial umflat, fiecare item acoperind o proporie prea
mare din variana total. Autorii citai aduc i un alt punct de vedere interesant: n
testele educaionale indicele D poate servi nu numai la selecia celor mai
discriminativi itemi, pentru a construi o scal puternic, ci i ca metod de analiz a
distractorilor i a erorilor. Pentru acetia, indicele de discriminare trebuie s aib o
valoare negativ, dar el va fi informativ i n legtur cu faptul dac cheia
rspunsurilor nu este eronat sau dac rspunsul ales de grupul superior nu este
realmente acceptabil. Dac nu, se va putea cerceta motivul pentru care rspunsul a
prut a fi acceptabil n mare msur pentru grupul superior. Dup corectarea
lucrrilor, chestionarea elevilor poate clarifica problema n cauz, iar rezolvarea ei
duce la ameliorarea structurii itemului i implicit a instrumentului.
8.4. Raportul dintre dificultatea i discriminabilitatea itemului
Determinarea indicilor de dificultate i de discriminabuilitate a itemului nu
creeaz probleme tehnice insurmontabile, deoarece acestea au un algoritm de lucru
foarte clar. Exceptnd problema eantionrii, aceti indici sunt dependeni n mare
msur de populaiile din care au fost obinui. Problema cu adevrat important i
destul de complex este selecia itemilor celor mai buni dintr-un test innd cont
corelativ i simultan de ambele condiii (dificultate i discriminabilitate). Aceasta
deoarece att indicele D, ct i valorile corelaionale ce vor fi prezentate ulterior, sunt
influenate de dificultatea itemului, care devine astfel condiia bazal pentru selecie,
fiind de aceea pus pe abscis.
Situaia paradoxal a constructorului unui test de randament sau de cunotine
este aceea c el trebuie s opereze n zona de aciune a dou condiii care par reciproc
exclusive: pe de o parte selecia de itemi ce difereniaz bine ntre subieci (i aceasta
presupune ca dificultatea lor s fie centrat pe 0,50), iar pe de alt parte el nu ar
renuna nici la itemii mai uori (deoarece favorizeaz intrarea n prob i
discrimineaz n zona performanelor slabe) i nici la cei mai grei (discrimineaz
supradotarea i excelena). n aceste cazuri speciale, itemii prea uori sau prea grei
trebuie judecai cu atenie din perspectiva rolului jucat de ei n raport cu scopul
evalurii. Analiza de itemi poate s ajute la punerea de ntrebri pertinente n
legtur cu rolul jucat de fiecare item, ca i asupra mijloacelor celor mai bune de a
ameliora calitatea unui instrument de msur, apreciaz Laveault i Grgoire
13
.
Metoda simpl a lui Findley a fost operaionalizat de Ebel, care a oferit o
modalitate practic de interpretare simultan a dificultii i forei de discriminare a
itemilor, metod ce a devenit extrem de popular datorit utilizrii sale extensive i
ndelungate. Chiar dac las aproape jumtate din cazuri n afara analizei, utilizarea ei
actual este nc foarte mare, mai ales n domeniul testelor educaionale. n favoarea
sa pledeaz nu numai uurina aplicrii, ci i elegana soluiilor difereniate pentru
diversele combinaii ale dificultii i discriminabilitii itemilor.
Pentru a exemplifica toate acestea, furnizm mai jos un exemplu ipotetic care
ne va ajuta s nelegem modul n care opereaz selecia celor mai buni itemi dintr-o
scal.
13
Idem, p. 216.

S-ar putea să vă placă și