Sunteți pe pagina 1din 153

1

BAZE TEORETICE ALE


P S I H O D I A G N O S T I C U L U I




AUREL ION CLINCIU














UNIVERSITATEA TRANSILVANIA BRAOV

2009
2


















































3
CAPITOLUL 1

INTRODUCERE


1.1. Psihodiagnoza, domeniu de vocaie al profesiunii de psiholog
O revist literaturii privind principala activitate a profesiunii de psiholog clinician
scotea n eviden, acum dou decenii, un ntreg spectru de preocupri, dintre care evaluarea
i psihodiagnoza deineau cea mai mare pondere (50%), urmate de psihoterapie (30%), de
cercetarea tiinific (30%), de consiliere (5%) i de terapia de mediu i socioterapie (5%)
(vezi Ionescu, 1985, p. 51).
Plasarea n top a psihodiagnozei nu este specific numai domeniului clinic, ci
ntregului teritoriu al psihologiei aplicate, pentru c, prin instrumentele ei nalt standardizate,
ea ofer o cunoatere de adncime asupra fiinei umane, pe care se pot fundamenta ulterior
consilierea, psihoterapia sau ghidarea vocaional. Afirmaia lui Perse (1972, p. 112),
conform creia la ora actual, examenul psihometric constituie partea cea mai important a
interveniei psihologului () metoda testelor fiind poate singura datorit creia specificitatea
i autonomia sa nu sunt contestate i pstreaz i astzi valabilitatea, cu meniunea c
termenul de testare ar trebui completat cu acela mai cuprinztor de evaluare.
mprtim punctul de vedere al lui Kaplan i Saccuzzo (1993, p. iii) care i exprim
mhnirea pentru c prea muli studeni din colegii vd cursul de testare psihologic ca
plictisitor i nelegat de obiectivele lor sau de interesele lor pentru carier. nsi evoluia
psihologiei, prin ruperea ei din trunchiul disciplinelor speculativ-filosofice spre cele practic-
aplicative, este marcat de intrarea ei n laborator n 1879, prin Wundt i de supunerea la
rigoarea tiinific a experimentului, tendin continuat de Galton, cu al su laborator de
antropometrie din 1884, sau de James McKeen Cattell care, n 1888, propunea termenul de
teste mintale, ce urmau s fie aplicate n laboratorul su de testare.
Recursul la experiment a fost indisolubil legat de apelul la cifr, la cuantificare i
msurtoare, care fceau ca psihologia s i dezvolte instrumente precise de investigaie,
metode din ce n ce mai elaborate de analiz a datelor rezultate, ce confereau cunoaterii
psihologice rigoare, exactitate i generalitate. Este deci cu totul surprinztor faptul c acest
curs de evaluare-testare psihologic, care pregtete studentul pentru ceea ce va fi partea
fundamental a profesiunii sale, s fie gsit plictisitor, ceea ce s-ar putea explica eventual prin
faptul c aceste domeniu de supraspecializare a devenit din ce n ce mai tehnic, ncorpornd
procedee de lucru i proceduri statistice sofisticate, care de multe ori estompeaz frumuseea
4
lui provocatoare. Acest impediment nu poate fi depit dect prin faptul ca profesorul s fie el
nsui un practician cu mult experien, astfel nct printre rnduri s se simt freamtul
problemelor vii, al implicrii profunde i devotate ntr-o profesie care a devenit, prin toate
acestea, o vocaie.

1.2. Psihodiagnoz, testare i evaluare
Psihodiagnoza este un concept foarte puin sau deloc utilizat de coala anglo-saxon
i aceasta probabil din cauza nedoritei apropieri a acestui termen de acela de diagnostic, creat
i consacrat de practica medical. n acest spaiu cultural a fost folosit extensiv termenul de
testare (testing), pentru a circumscrie teritoriul cunoaterii exacte i obiective, de tip
psihometric a persoanei, dei n ultimele decenii cel de evaluare (assessment) a ctigat tot
mai mult teren. i aceasta din mai multe motive:
- Chiar dac din capul locului testele au fost destinate unor scopuri nu doar constatative sau
exclusiv tiinifice (de cunoatere), ci i-au propus s aduc o schimbare benefic n viaa
oamenilor, ele au generat o anumit aprehensiune, rezisten sau chiar o reacie advers.
Deoarece testele i itemii ce le compun au fost pstrai departe de ochiul public, ca de
altfel i procedurile de scorare, interpretare i utilizare a rezultatelor, ele au creat un val de
mister ce a generat team n rndul publicului larg, cu att mai mult cu ct utilizarea lor a
cunoscut o adevrat explozie ntre cele dou rzboaie mondiale.
- Psihologii s-au vzut constrni de reglementrile legale din domeniu, de teama
publicului larg fa de teste (i de consecinele acesteia) s priveasc cu interes i spre alte
instrumente ale profesiunii lor (interviul, ancheta, studiul de caz etc.), testul rmnnd
instrumentul cel mai elaborat, n mna examinatorului cu o foarte nalt calificare, la care
are acces dup stagii riguroase de pregtire, asistat, controlat i certificat de specialiti
recunoscui.
- Evaluarea psihologic (assessment) a devenit termenul integrator, el fiind conceput ca o
rezolvare de probleme, deoarece fiecare variabil din natur este rezultatul combinrii
unor factori diferii, de unde necesitatea unor metode variate (printre care i testele),
depinznd de obiectivele, scopurile sau circumstanele n care se desfoar procesul
evaluativ.
- Testarea psihologic a devenit specific unor scopuri mai nguste i mai bine
circumscrise, n timp ce evaluarea este mai larg, prediciile i deciziile ei bazndu-se pe
o multitudine de surse.
5
- Ca i obiective, testarea nu i propune s rspund la ntrebarea cum proceseaz persoana
o anumit informaie, fiind centrat pe produs (rezultatul la test) i nu pe proces (maniera
de a ajunge la acel rezultat).
- Evaluarea (inclusiv cea formativ) ncearc s neleag o problem n cadrul ei ecologic
mai larg, de unde i spectrul mult mai extins de informaii utilizate (observaia naturalist,
vizita la domiciliu, ancheta, interviul sau simpla discuie cu prinii, profesorii i
reprezentanii autoritii). Ea nu dezavueaz procedurile standardizate, tipice testrii, dar
fiind contient c acestea nu pot rspunde la toate ntrebrile, valorizeaz i informaiile
colaterale (stil de via, atmosfer familial, interaciunile din grup etc.).
- Relaia cu clientul este diferit n testare, unde poate s existe o legtur discontinu,
multiplu mediat sau chiar absent (n testarea de grup) sau o mai mic responsabilitate
legal a examinatorului fa de cel examinat. n evaluare relaia este una de fa-n-fa,
cu responsabiliti explicite din partea examinatorului de a desfura o activitate n
folosul clientului su.
- n practic, distincia nu este aa de tranant, aa cum arat Cohen, Swerdlik i Smith
(1992), termenii fiind deseori utilizai ca echivaleni i interanjabili, dei distincia dintre
ei trebuie pstrat. Iat cum definesc autorii citai evaluarea psihologic (assessment):
proces de strngere i de integrare a datelor psihologice, corelate scopului de a face o
evaluare psihologic, utiliznd instrumente ca testele, interviul, studiul de caz, observaia
comportamental i aparate special destinate, mpreun cu procedee de msurtoare
adecvate (p. 11).

Deoarece n terminologia romneasc nu s-a impus termenul de testare i nici cel de
evaluare, pentru circumscrierea domeniului termenul consacrat fiind cel de psihodiagnostic,
ca i n unele dintre rile francofone, vom face distincia dintre diagnosticul medical i cel
psihologic. Dup cum se tie, medicul identific o anumit boal, prin mijloace clinice
(observaie, anamnez, interviu clinic, examen somatic sau psihic etc.) i paraclinice (analize
de laborator, radiografie, echografie etc.) pentru a o introduce ntr-un cadru nosologic i a
formula un tratament. Schema consacrat de mai bine de un secol pentru multe din domeniile
medicinei este: diagnostic etiologic (viznd cauza bolii), patogenetic (mecanismele ei de
producere), diagnosticul pozitiv (raportarea semnelor la un sindrom) i diferenial (raportarea
la entiti apropiate din cadrul nosografic mai general). Toate acestea nu numai pentru a
circumscrie boala, ci pentru a stabili un prognostic i un tratament adecvat.
6
n psihologie, diagnosticul utilizeaz de asemenea o multitudine de mijloace, dintre
care doar unele standardizate: testul, interviul, studiul de caz, observaia comportamentului,
tehnici derivate din metoda experimental, ca reacia electrogalvanic, reflexul fotopupilar
sau timpul de reacie ori cel de laten.
Sursele majore ale informaiilor sunt analiza comportamentelor, a activitii i a
produselor acestora, studiul expresiei i al conduitei verbale (chiopu, 1976). Marea diferen
n raport cu diagnosticul medical este aceea c n psihodiagnoz se are n vedere terenul
psihologic nealterat al omului de pe versantul normalitii (excepie fcnd munca
psihologului din clinica neuropsihiatric), pentru a face bilanul caracteristicilor psihice
definitorii.
n viziunea Ursulei chiopu, psihodiagnoza este un act de analiz psihologic a unui
caz i, concomitent, o sintez logic ce permite organizarea contient a msurilor generale
de influenare a dezvoltrii personalitii cazului considerat (op. cit., p. 33). Elementul
comun este aadar succesiunea dintre latura constatativ (diagnostic) i cea prognostic-
ameliorativ i formativ (personalitatea optimal, selecia omului potrivit pentru locul
potrivit, personalizarea interveniei etc.). n acest sens psihodiagnoza este elementul de baz
al psihologiei difereniale, pe care a i fcut-o posibil.
Dei ocup un teritoriu extrem de important al psihologiei aplicate, din care s-a nscut
i pe care a dezvoltat-o continuu, psihodiagnoza nu se ntlnete definit ca atare n
dicionarele de psihologie, dup cum nici noiunile de testare i de evaluare, care o
circumscriu, nu sunt definite. Eventual ele rein accepiunea iniial a termenului propus de
ctre Herman Rorschach, dup care psihodiagnosticul este o metod de explorare a
personalitii, bazat pe interpretarea liber de forme accidentale, cum ar fi petele de
cerneal, ca n Dicionarul de psihologie Larousse, al lui N. Sillamy (1996, p. 244), sau ca n
Dicionarul de psihologie al lui Doron i Parot (1999, p. 624). Niciunul dintre ele nu
definete termenul de diagnostic psihologic, dat ca i titlu unei lucrri de referin a lui
Richard Meili (Manual psihodiagnostic, 1964), dar nici pe aceia de testare-evaluare, n
accepiunea american a termenilor utilizai de numeroi autori (Anastasi, Cronbach,
Gregory, Aiken, Kaplan, Saccuzzo etc.), pentru a-i numi lucrrile lor.
n Dicionarul encilcopedic de psihologie din 1997, coordonat de Ursula chiopu,
reinem definiia termenului care exprim chiar viziunea autoarei, dup care diagnoza
psihic se refer la omul viu i concret i const dintr-o cunoatere complex a acestuia prin
tehnici psihologice, aplicate conform unei strategii, ce permit colectri de informaii
organizate privind persoana dat (op. cit., p. 542). Termenul de psihodiagnostic este prezent
7
i la Mariana Roca (Metode de psihodiagnostic, 1974) i la ali autori clujeni care, n
deceniul al optulea au editat un valoros ndrumtor psihodiagnostic, n mai multe volume.
Acesta a fost un foarte preios ghid pentru psihologul practician, cci coninea nu numai
elemente de natur teoretic despre exigenele examinrilor psihologice, ci prezenta o
diversitate de instrumente practice, adaptate i etalonate pe populaie romneasc. Lucrare
remarcabil prin preocuparea ei de a oferi elemente de sprijin practic muncii psihologului a
fost Aptitudinile i msurarea lor, a lui Bontil, editat de Centrul de documentare i
publicaii al Ministerului Muncii n 1971.
Lucrrile mai noi, de dup revoluia din 1989, par a evita ns termenul de
psihodiagnostic, ele vorbind de Construirea i utilizarea testelor psihologice (Albu, 1998),
despre Cunoaterea psihologic a persoanei (Havrneanu, 2000), despre Evaluarea n actul
educaional terapeutic (Vlad, 1999) sau despre Testarea psihologic a copilului mic
(Mitrofan, 1997). Doar Valentina Horghidan mai conserv un concept care pare s devin
inactual, cel de psihodiagnostic, n lucrarea intitulat chiar Metode de psihodiagnostic (1997).
n aceasta autoarea include o multitudine de metode, pe lng clasicele test i chestionar
aprnd i observaia, convorbirea, ancheta, experimentul, scalele de evaluare a abilitilor,
metoda aprecierii obiective a personalitii, fia de caracterizare psihopedagogic a elevului i
chiar metodele sociometrice. Se produce astfel o lrgire exagerat de mare a cadrului
metodologic al acestei discipline ce tinde s-i subsumeze prin nglobare ntreaga
metodologie a tiinei psihologice, cu deschidere i spre sociologie.
Opinm c termenul tradiional de psihodiagnostic poate fi pstrat, pentru c el
include i pe cel foarte tehnic i consacrat de testare (testing), destinat determinrilor
cantitative, dar i pe cel de evaluare (assessment), desemnat s completeze i s nuaneze
diagnosticul cu elemente calitative. Dar, pentru c testul psihologic rmne instrumentul su
cel mai tehnic i cel mai puternic, cu o evoluie neegalat de niciuna dintre celelalte metode,
genernd o adevrat tiin legat de construcia i aplicarea sa, credem c centrul de
greutate al acestei discipline a pihologiei aplicate, psihodiagnoza, trebuie s rmn testarea
psihologic.

1.3. Marile domenii ale psihodiagnosticului
Prima arie n care s-a produs dezvoltarea i utilizarea testelor mentale (pentru a
respecta termenul propus de Cattell) a fost cmpul educaional, coala, prin bateria creat i
publicat de Binet i Simon n 1905. La peste un secol de la lansarea primei Scale metrice a
8
inteligenei, coala rmne n continuare marele beneficiar al psihodiagnozei. Utilizarea
acesteia pe terenul educaiei a avut i are i astzi funcii complexe:
- Depistarea copiilor cu o dotare intelectual submedie (debilitate mintal, intelect de
limit), sau cu alte caracteristici neuropsihiatrice, pentru a li se crea condiii favorabile de
tratament psihopedagogic difereniat, prin coli speciale sau prin integrarea lor n
nvmntul de mas.
- Depistarea supradotailor, pentru instituirea unei pedagogii a excelenei (curriculum
difereniat).
- Diagnosticarea problemelor de nvare i a celor comportamentale (de conduit), pentru
a stabili programe educaionale adecvate.
- Selecia educaional prin teste standardizate la colegii sau universiti (nu ca o procedur
unic i exclusiv, ci n asociere cu alte metode, cum ar fi scrisorile de recomandare,
mediile din timpul anilor de studiu la anumite discipline colare, interesele elevului n
afara colii etc.).
- Testele educaionale (docimologice sau de cunotine), pentru a verifica fie gradul de
atingere a obiectivelor operaionale, fie pentru a face un diagnostic local, regional sau
naional al nvmntului nsui ca sistem, fie pentru a detecta cunoaterea minim prin
posesia creia se poate face o certificare a educaiei primite ntr-un ciclu sau tip de coal.

Prin intermediul psihodiagnosticului colar se poate asigura personalizarea
nvmntului i tratarea difereniat a elevilor, determinarea nevoilor de educaie, orientarea
colar i profesional, selecia elevilor pentru programe speciale, determinarea potenialului
de nvare i promovarea metodelor de diagnostic formativ, controlul i autocontrolul
procesului educativ, surprinderea elementelor motivaional-afective legate de nvare,
radiografierea grupului i a dinamicii sale etc.
Credem c zona celei mai vaste i mai fructuoase ntlniri dintre tiina testelor
(psihometria) i tiina examinrii (docimologia, doxolgia sau docimastica) este cel al
evalurii. Chiar randamentul colar, ca raport dintre aptitudinile, interesele elevului i gradul
de acoperire al obiectivelor operaionale, exprimate prin calificative, note sau medii colare,
este locul unde testarea psihologic i cea educaional se ntlnesc n modul cel mai fericit.


9
Domeniul sntii, n general, i cel al sntii mintale n special, presupune o
fericit sintez ntre funcia de psihometrician a psihologului clinician i cea de diagnostician,
unde contribuia lui rmne esenial i fundametal (Ionescu, op. cit., p. 55), cu cea de
psihoterapeut i de cercettor. n echipa medic-psiholg, cel din urm ar avea o situaie
privilegiat n cercetare, unde el nu face, asemenea medicului, un examen, nu acord o
consultaie, ci ntreprinde o investigaie, el desfoar o activitate de explorare, ceea ce i
asigur un statut special n cercetere (idem, p. 59). Locul psihologului nu este numai n
clinica de boli nervoase, deoarece prezena sa n sntate duce la o reconsiderare a actului
medical n ansamblul su prin repunerea n drepturi a subiectivitii bolnavului. De aceea
asistm la o extindere progresiv a ariei de competen a acestui tip de specialist, i simultan
a calitii prestaiei sale, motiv pentru care n multe dintre rile vestice stagiile de formare
pentru psihologul clinician sunt pe deplin comparabile cu cele ale medicului, pentru a nu mai
aduce n discuie importana acordat pregtirii psihologice a medicului nsui.
Psihologul clinician intervine diagnostic i terapeutic n:
- Aprecierea normalitii/anormalitii dezvoltrii neuropsihice a copilului i adolescentului
(clinica pediatric).
- n investigarea dezordinilor de personalitate, a strilor reactiv-anxioase, a tentativelor de
suicid sau a strilor de criz.
- n comportamentul deviant, asocial, antisocial sau delictual.
- n diagnoza i tratamentul tulburrilor alimentare (anorexie, obezitate, bulimie).
- n evaluarea dezordinilor neurologice sau psihiatrice, prin calculul indicelui de
deteriorare, ca i n recuperarea unor funcii mintale deteriorate parial sau total.
- n diagnoza i recuperarea problemelor produse de involuie, sau de patologia asociat
mbtrnirii.
- n expertizarea capacitii de munc sau a deficienelor de intelect pentru acordarea
certificatelor de persoan handicapat.

Domeniul sntii este cel n care funcia diagnostic i cea prognostic sau
recuperatorie se ntlnesc plenar, fcnd din psiholog nu numai un om care aplic teste (de
inteligen, memorie, personalitate, aptitudini, valori, interese etc.), ci un specialist care
acumuleaz o experien preioas n prevenie i n terapie, oriunde intervine o disfuncie,
sau acolo unde ea nc nici nu exist, pentru a face posibil nu numai personalitatea optimal,
ci i pe cea maximal.
10
n toate aceste domenii s-a conturat o zon de elecie a muncii psihologului, cea de
consiliere, a sfatului avizat, pentru o tot mai mare diversitate de situaii. Cum ar putea fi acest
copil mai puin conflictual n grup? Ce carier ar fi cea mai potrivit pentru persoana X? Ce
activiti i s-ar putea recomanda dup pensionare lui Y, pentru a se potrivi cu structura sa
cognitiv i cu interesele sale? Cum ar putea depi solicitrile prea stresante o personalitate
de tip A, pentru a preveni un infarct? Dar diabeticul sau hemofilicul ce anse au s
coabiteze cu aceste boli cronice? Sau ce risc exist pentru un cuplu care are un copil cu o
boal genetic (sindrom Down, de exemplu) de a avea un al doilea copil cu aceeai afeciune
(sfat genetic)?

Domeniul muncii ofer un cmp de aciune imens psihodiagnosticianului, care trebuie:
- S evalueze fora de munc, pentru a face o selecie n domeniul profesiunilor.
- S previn fluctuaia forei de munc i s limiteze accidentele de munc.
- S avizeze periodic activitile cu risc crescut (lucrul la nlime, portul de arm etc.).
- S ofere criterii valide de promovare i s ajute la construirea carierei.
- S identifice structura aptitudinal, cea a factorilor de personalitate i a intereselor pentru
a ajuta la reprofesionalizare, adic la reconversie profesional.
- S asiste tehnic reciclarea i reprofilarea, ntr-o lume n care schimbarea devine condiia
sa permanent.
- S contribuie la ameliorarea climatului de munc prin cunoaterea dinamicii grupurilor.
- S se implice n adaptarea omului la main i a mainii la om (aspecte ce in de
ergonomie, destinat s amelioreze mijloacele puse la ndemna muncitorilor i s le fac
compatibile cu caracteristicile lor fiziologice i psihologice).

n lumea afacerilor testarea i evaluarea psihologic au o pondere n cretere accentuat,
deoarece de ele beneficiaz ntreg domeniul resurselor umane: selecia funcionarilor i a
celorlali angajai se bazeaz pe teste de aptitudini, achiziii, interese, motivaii, valori, care
ajut nu doar la angajare, ci i la promovare, transfer, creterea performanelor, satisfacia
muncii, alegerea pentru stagii de formare aprofundat. Studiul comportamentului
consumatorului, marketingul i vnzarea produselor, managementul, reclama etc., toate intr
n aceast sfer a lumii afacerilor, care are foarte multe suprapuneri cu cea a muncii, a
educaiei i a sntii. De fapt, toate domeniile activitilor umane, de la cele deja amintite,
11
la transporturi, armat, poliie i pn la creaie i art beneficiaz de ctigurile din zona
diagnosticului i a evalurii psihologice.
Nu exist nici un domeniu al activitilor umane, nici un fel de manifestare a
umanului care s nu poat servi ca punct de plecare pentru diagnoza psihic. Remarcabil este
faptul c n acest domeniu experiena practic i cercetarea tiinific, ce duce la cristalizri
teoretice, se presupun permanent. Iat cuvintele generoase ale promotoarei
psihodiagnosticului n Romnia, Ursula chiopu: Prin diagnoza psihic se pune naturii
umane o ntrebare, se caut un rspuns care devine ntr-un fel valabil pentru mai ample
probleme eseniale privind personalitatea uman. Actul diagnozei psihice este doar
momentul prim al unei activiti mai complexe, aceea de recuperare i de recondiionare
psihologic a capacitii umane i a dimensiunilor funcionale optime ale personalitii
umane (op. cit., p. 45). Aceasta nseamn c un psihodiagnostician bun nu iese ca atare de
pe bncile facultii, de unde el ia doar cadrul general al pregtirii sale. El se formeaz n
timp, prin acumulare de experien practic divers (diagnostic, formativ i terapeutic), de
cunoatere teoretic pentru a putea pune ordine i extrage informaie relevant din datele
culese. Un bun psihodiagnostician are n spate ani de munc, fiiere cu mii de cazuri care i
ofer baza de date pentru construcia de bareme i etaloane aduse la zi, are instrumente
diverse i verificate practic, cu care poate s rezolve o gam larg de probleme concrete.
Formarea sa prin zeci de ore de practic pe lng un psiholog experimentat i certificarea
competenei sale sunt alte aplicaii importante ale psihodiagnozei.

1.4. Probleme etice ale psihodiagnozei
Discuiile n legtur cu responsabilitile sociale ale muncii psihologului au fost
frecvent reluate la majoritatea congreselor internaionale, fiind concretizate ntr-un cod
deontologic al Asociaiei Internaionale a Psihologilor, la care i Romnia a aderat.
Trebuie s artm c perioada de dezvoltare exploziv a testelor standardizate n
America dintre cele dou rzboaie mondiale a avut mai multe consecine practice, printre care
i publicarea unei sinteze bibliografice, mereu rembogit, numit Educational,
Psychological and Personality Tests of 1933 and 1934, care va fi de fapt prima ediie a ceea
ce mai trziu se va numi Mental Measurements Yearbook (Buros, 1938), ce lista miile de
teste aprute, sortndu-le tematic, dar i dup criterii de calitate i performane tehnice.
Interesul pentru copii supradotai s-a revigorat odat cu lansarea n spaiu de ctre
fosta Uniune Sovietic a primului satelit Sputnik (4 octombrie 1957), cnd, la un an,
Congresul american a alocat sume importante pentru crearea de teste de abiliti i de
12
aptitudini n graba de a detecta studeni dotai i talentai academic (Cohen, Swerdlik i
Smith, 1992, p. 53).
Extinderea programelor de testare pe scar larg, combinat cu utilizarea excesiv a
testelor de aptitudini i de personalitate n toate domeniile, au redeteptat ngrijorarea public
legat de utilizarea i eficiena testelor psihologice. Primele Recomandri tehnice pentru
testele de achiziii au fost publicate de Asociaia Psihologilor Americani (APA, datnd din
1895) n anul 1954, precedate fiind de Standardele etice ale psihologilor (1953) i urmate de
Standarde pentru testele educaionale i psihologice i manualele lor n 1966. Acestea vor fi
urmate de Principiile etice ale psihologilor (1981) i de o Caset cu principiile psihologilor
(1987) sau de un Cod al practicilor de testare n educaie (1988). Recomandri speciale au
fost fcute n legtur cu testarea membrilor minoritilor culturale i lingvistice, a
persoanelor cu dizabiliti, ca i n legtur cu nou apruta ramur a administrrii, scorrii i
interpretrii computerizate a testelor.
Standardele din 1985 indic i cteva dintre drepturile celor testai.
- Dreptul de a-i da consimmntul asupra testrii: cu ce instrumente sunt testai, cum
vor fi utilizate datele i cui vor fi remise informaiile despre rezultatele obinute.
- Dreptul de a fi informat asupra rezultatelor: pentru a contrabalansa tendina
ncetenit de a da celui testat ct mai puine informaii despre performana sa (cu
scopul de a nu produce o cretere a anxietii sau de a nu genera o criz), s-a hotrt
s se dea un feedback mai realist subiectului, centrat nu numai pe rezultatele pozitive
obinute de el, ci i pe cele negative.
- Dreptul la non-invazia vieii intime, private: exist o informaie privilegiat, protejat
prin lege, cum ar fi cea obinut din relaia avocat-client, medic-pacient, preot-
credincios, so-soie i psiholog-client.
- Dreptul la cea mai puin stigmatizant etichetare, care s nu lezeze demnitatea uman
a clientului.
- Dreptul de pstrare a confidenialitii datelor: utilizatorul trebuie s-i ia toate
precauiile n depozitarea acestora n spaii ncuiate, n dulapuri de oel sau n
computere parolate, care s limiteze accesul doar la persoanele autorizate.

O parte dintre aspectele prezentate mai sus se regsesc stipulate i de legislaia altor
ri n care practica profesiei de psiholog a atins anumite standarde. Astfel, Societatea
Francez de Psihologie a creat un cod deontologic similar celui american, cu precizarea unor
13
reguli de conduit moral ce pot fi considerate de valoare universal. Redm doar cteva
dintre ele, pentru o posibil analiz comparativ, inclusiv cu legislaia romneasc.
- Etica profesional stipuleaz c n exercitarea profesiunii, psihologului i este
interzis orice act sau cuvnt care ar putea aduce atingere demnitii umane.
- Secretul profesional, care trebuie pstrat n vorbe, n conversaie sau n depozitarea
documentelor n legtur cu tot ceea ce psihologul a vzut, a auzit sau a neles n
cursul practicii sale.
- Respectul altuia: psihologul nu trebuie s se foloseasc de mijloace profesionale
pentru a-i asigura avantaje personale.
- Informarea tiinific este un principiu care stipuleaz obligaia psihologului de a se
informa continuu asupra evoluiei cunotinelor din domeniul su i s aib grij de a
comunica tiina sa ct mai complet posibil, ntr-un spirit de exactitate i de adevr.
- Autonomia tehnic oblig psihologul s rezilieze orice angajament pentru care nu se
simte apt prin tehnicile pe care le deine, el avnd n ntregime responsabilitatea
alegerii metodelor pe care le folosete.
- Independena profesional, care nu neag munca de echip a psihologului, ci prevede
doar faptul c el nu trebuie s accepte condiii care ar putea s ating independena
sa profesional, adic l-ar mpiedica s aplice principiile deontologiei profesionale.
Consecin a legii 213/2004 care reglementeaz profesia de psiholog n Romnia, a
fost elaborat i un Cod deontologic al profesiei de psiholog cu drept de liber practic
care instituie regulile de conduit profesional ale practicianului sau cercettorului din acest
domeniu de activitate. Codul deontologic este destinat n mod expres orientrii i reglrii doar
a acelor activiti n care psihologii sunt angajai profesional, i nu se refer la viaa
particular a acestora, care poate fi luat n discuie doar atunci cnd aceasta ar aduce
prejudicii profesiei de psiholog.
Codul deontologic se sprijin pe urmtoarele principii fundamentale:
- Respectarea drepturilor i demnitii oricrei persoane: prin activitatea lor
profesional psihologii respect tririle, experienele, valorile, opiunile celorlali. Ei
nu prejudiciaz imaginea public a clienilor lor i vor utiliza un limbaj care indic
respectul autentic al demnitii umane. Utilizarea informaiilor obinute pe cale
profesional nu se va face niciodat n detrimentul drepturilor fundamentale ale
omului, fie el beneficiar de servicii psihologice, participani la cercetare, angajai sau
studeni.
14
- Principiul responsabilitii profesionale i sociale: psihologii vor ncuraja starea de
bine a clienilor lor i vor respecta dreptul acestora de a sista, fr nici o justificare,
participarea la serviciul furnizat sau la activitile de cercetare, n calitate de subieci.
Psihologii vor participa direct la dezvoltarea psihologiei ca tiin, prin meninerea
celor mai nalte standarde n materie, dar i la dezvoltarea societii n general. Ei vor
respecta legile i reglementrile societii sau comunitii n care triesc i vor face tot
posibilul pentru a fi impuse i respectate standardele i principiile etice.
- Principiul integritii profesionale: potrivit acestui principiu psihologul nu va
practica nici un fel de discriminare. El vor promova acurateea, obiectivitatea i
onestitatea sau buna credin n raporturile cu clienii lor. De asemenea, el va evita
recompensele exagerate, conflictele de interese care i-ar reduce imparialitatea sau
care ar putea aduce atingeri profesiei sale sau imaginii celorlali psihologi. El va fi
deschis i va recunoater cu onestitate limitele propriilor competene.
n mod foarte explicit, codul deontologic analizeaz cteva categorii de standarde
etice generale, cum ar fi cel al competenei, standardele cu privire la relaiile umane,
standardele de confidenialitate, standardele de conduit colegial, standardele de nregistrare,
prelucrare i pstrare a datelor, standardele relative la onorarii i taxe, ca i standardele pentru
declaraii publice i reclam. O categorie special o constituie standardele specifice, care se
refer n mod explicit la educaie i formare profesional, la evaluare i diagnoz, la
cercetarea tiinific i la valorificarea rezultatelor acesteia.
Astfel, pentru evaluare i diagnoz sunt formulate prevederi exprese despre
prezentarea caracteristicilor psihologice, condiiile de utilizare a testelor psihologice,
obinerea consimmntului pentru evaluare/ diagnoz, construcia instrumentelor,
interpretarea rezultatelor, calificarea necesar pentru a dezvolta o testare/ evaluare,
responsabilitile legate de administrarea instrumentelor i prezentarea rezultatelor pentru cei
evaluai, ca i respectarea dreptului de proprietate intelectual. Codul deontologic furnizeaz
indicaii la fel de detaliate pentru cercetarea tiinific i valorificarea rezultatelor acesteia, n
acord cu standardele internaionale existente relative la obinerea acordului de a dezvolta o
cercetare, obinerea consimmntului, utilizarea suporturilor de nregistrare audio-video,
evitarea unor categorii de subieci, utilizarea animalelor n cercetare, plagiat, abuz de status,
transmiterea i protejarea datelor, onestitatea tiinific i regulile de bun conduit n
cercetarea tiinific.

15
CAPITOLUL 2

TESTUL PSIHOLOGIC, INSTRUMENTUL DE BAZ
AL PSIHOLOGIEI APLICATE


2.1. Scurt istoric al apariiei i dezvoltrii testelor
Nici o alt metod a psihologiei aplicate nu a avut o contribuie mai efectiv n
impunerea ei n aproape toate domeniile de activitate uman, dar i n declanarea unor
dispute care au culminat cu o puternic atitudine antitest, iniial n fosta U.R.S.S., apoi n
Statele Unite ale Americii (ara n care practica testelor a luat cea mai mare amploare), dar i
n rile de Jos, ulterior. Este de aceea ntemeiat metafora Ursulei chiopu, care consider
testul copilul scandalos al psihologiei, ce mai tulbur i astzi spiritele (1976, p. 104).
Intuit nc de Francis Galton la sfritul secolului al XIX-lea, care a ncercat fr
succes s dezvolte un test pentru a determina abilitile mintale prin msurarea unor
caracteristici perceptual-motrice, termenul a fost introdus n psihologie n 1890 de James
McKeen Cattell. Consacrarea metodei testelor vine ns prin Alfred Binet, care folosete
Scara Metric a Inteligenei (1905) pentru determinarea dezvoltrii intelectuale a copiilor,
extinderea utilizrii lor datorndu-i-se lui Munsterberg (determinarea aptitudinilor n vederea
seleciei profesionale).
La mai mult de un deceniu (1916) de la publicarea testului Binet, Louis Terman de la
Universitatea Stanford a elaborat versiunea englez a acestuia, cunoscut sub numele de
Scala Stanford-Binet. Chiar dup aceast dat Henry Goddard a realizat propria sa
traducere a acestei scale, dei anterior (nc din 1912) el dezvoltase o metod de determinare
a defectivitii mintale prin testarea imigranilor i selectarea acelora care urmau s fie
deportai. Incluznd probe care cereau familiarizarea cu scrisul, dar i cu cultura american,
Goddard a descoperit (1917) c peste 80% din imigrani erau defectivi mintal, dnd i un
clasament pe naiuni Era o prim utilizare greit a testelor, dar nu i ultima.
n timpul primului rzboi mondial (1917, 1918), o echip de psihologi, care l-a inclus
i pe Goddard, a dezvoltat dou baterii de teste pentru selecia primar i repartizarea pe arme
a recruilor: Army Alpha Test i Army Beta Test, pentru cei care aveau o bun, respectiv slab
posesie a limbii engleze. Aplicate n condiii de stres, improprii dup standardele de astzi
(camere aglomerate, instructaj greu audibil de ctre toi subiecii), rezultatele acestor teste l-
au determinat pe Robert Jerkes s concluzioneze c vrsta mintal, pentru 47% dintre recrui,
nu depea 13 ani Statistici tiinifice, ntemeiate pe astfel de date oferite de testri n
16
mas, au dus la apariia Legii Imigraiei din SUA anilor 1924, care stabilea cote de
imigraie pentru diferite naiuni, dup rezultatele obinute la testele aplicate anterior altor
imigrani. Rezultatele la teste au fost de asemenea utilizate de unii pentru a argumenta
segregarea negrilor i, n unele state, unii oameni, dup scorul testelor de QI, au primit
eticheta de 'imbecil' i au putut fi sterilizai mpotriva dorinei lor, sau chiar fr ca ei s tie
(Bernstein, Roy, Srull i Wickens, 1988, p. 372).
Toate acestea nu au putut ns opri evoluia testului psihologic, a crui extindere
progresiv a fcut ca rolul su s fie considerabil i n cretere i azi. Copil al altor metode,
cum ar fi observaia i experimentul, testul a nsemnat un progres enorm n metodologia
cunoaterii structurii individuale i prin aceasta a condiionat extinderea aplicaiilor
psihologiei i consolidarea pe baz experimental a psihologiei difereniale (Holban, 1973,
p. 142). i aceasta deoarece testele au o valoare practic dovedit, generat mai ales de
precizia, obiectivitatea i relevana informaiilor obinute. Testele psihologice au un mare
randament, ofer, n condiii de costuri materiale i de timp sczute, o informaie care ar fi
fost greu de obinut prin alte metode. Astzi este tot mai evident c nu testele nsei trebuie
incriminate, deoarece la captul unei lungi evoluii au standarde foarte nalte relative la
elaborare, utilizare i interpretare, incomparabile cu oricare alt metod, ci modul lor de
utilizare. Ele sunt doar instrumentele perfecionate ale psihologiei aplicate, dar maniera lor de
folosire depinde n principal de utilizator, i nu de caracteristicile lor intrinseci.

2.2. Definirea testelor
Termenul test este preluat din limba englez, unde to test nseamn a pune la
prob, a ncerca, chiar dac, pe filiera latin, cuvntul exista i n limba romn
(testamentul este un mod de probare a voinei cuiva n legtur cu destinaia bunurilor sale
dup moarte). Mai mult, termenul nu este specific psihologiei: medicina folosete tuberculina
pentru a testa reacia organismului la bacilul Koch, chimia are testul hrtiei de turnesol, fizica
testul descompunerii luminii i analiza spectrografic iar sociologia testeaz opinia public
prin chestionare. n sens larg, chiar o ipotez sau o teorie tiinific devin valide prin testarea
lor n realitate (o eclips de soare a testat ipoteza curbrii razei de lumin n preajma
corpurilor cu mase mari, element central al teoriei lui Einstein), n timp ce Freud sau
psihologia cognitiv vorbesc de capacitatea unei persoane de a testa realitatea.
Pentru a surprinde specificul testelor i al testrii psihologice, vom semnala cteva
definiii, aceasta deoarece nici n aceast privin nu s-a ajuns la un consens. Testul este deci:
17
- Prob, instrument pentru diagnosticarea de caracteristici psihice (chiopu, Dicionar
enciclopedic de psihologie, 1997).
- Prob utilizat mai ales n psihologia diferenial, care permite descrierea
comportamentului unui subiect ntr-o situaie precis definit (instructajul testului), prin
raportare la comportamentul unui grup de subieci plasai n aceeai situaie (Grand
dictionnaire de psychologie, 1994).
- Msurtoare obiectiv a unui eantion de comportament (Anastasi, 1976).
- Procedeu sistematizat de msurare a comportamentului unor persoane i de descriere a
acestuia cu ajutorul unor scri numerice sau a unui sistem de categorii (Cronbach, 1966).
- Prob determinat, implicnd o sarcin de executat, identic pentru toi subiecii
examinai. Dispune de o tehnic precis pentru aprecierea succesului i pentru notarea
numeric a reuitei (Piron, 1963).
- Situaie standardizat, servind drept stimul unui comportament. Acest comportament este
evaluat i comparat statistic cu al altor persoane plasate n aceeai situaie, ceea ce
permite clasarea subiectului, fie cantitativ, fie tipologic (Pichot, 1984).
- Procedur standardizat prin care se formeaz un eantion de comportament care va fi
descris prin categorii sau scoruri. n plus, multe teste au norme sau standarde care fac
posibil utilizarea rezultatelor n predicia altor comportamente, mai importante (Gregory,
1992).
- Instrument al metodei experimentale, organizat sub forma unor probe standardizate din
punct de vedere al coninutului, al condiiilor de aplicare i al modalitii de apreciere a
rezultatelor, instrument care este folosit n stabilirea unei anumite variabile (Holban,
1973).

Vom reine din aceast multitudine de definiii elementele sintetice cele mai
semnificative, eseniale pentru nelegerea specificului unui test psihologic care:
- este prob, procedur, procedeu sau instrument standardizat;
- care servete drept stimul pentru producerea i msurarea unui eantion de comportament;
- care va fi apreciat prin raportarea i compararea cu o populaie de referin, testat n
condiii identice, n raport cu care s-a construit sistemul de apreciere (barem, etalon,
norme, categorii tipologice);
18
- funcia lui fiind n acelai timp diagnostic (apreciaz starea de fapt), dar i prognostic
(anticipeaz categorii viitoare de comportamente mai importante dect cele msurate
efectiv);
- pentru ndeplinirea acestor funcii ele trebuind s aib caliti psihometrice specificate
(fidelitate, validitate, sensibilitate sau for de discriminare).

2.2.1. Eantionul de comportament
Ca i biochimistul, care ia un eantion de snge sau mostre de ap din locuri diferite
pentru a determina, prin analize, starea de sntate sau potabilitatea apei, psihologul alege
pentru testare eantioane mici, dar cu grij selecionate, din comportamentul unei persoane.
Aceasta deoarece el trebuie nu numai s diagnosticheze, ci mai ales s fac predicii valide.
Cum investigarea comportamentului n totalitatea sa este imposibil, cu att mai mult cu ct
el se desfoar pe scara timpului, avnd doar o constan relativ, psihometricianul trebuie
s aleag eantioane de comportament mai mici, dar strns i semnificativ legate de
comportamentul marii mase studiate. Aceast unitate ia n test forma itemului, ce este
constituit dintr-o situaie stimul care solicit un rspuns ce poate fi evaluat separat de restul
testului (Albu, 1998).
Nu este obligatoriu s existe o coresponden sau o similaritate foarte mare ntre
comportamentul prezis i itemii testului: n timp ce corespondena dintre proba de examen la
conducerea auto i conducerea efectiv este deplin, un test proiectiv poate prezice, din
mrimea, forma, culoarea sau micarea invocate n rspunsurile la test, importante
caracteristici ale personalitii celui examinat. Testul nu este nici analitic, nici sintetic, ci
analog cu situaia real, n sensul c modeleaz coninutul psihologic al activitii reale, dar
nu i forma exterioar a acestuia, afirm Havrneanu (op. cit., p. 90). Aceasta ne
ndreptete s afirmm c dincolo de deosebirile de form, trebuie s existe o identitate
intern sau de coninut ntre test i sarcina real n raport cu care se face predicia, de unde
rezult i valoarea constructiv a testului.
Aa cum apreciaz Anne Anastasi, de multe ori predicia se bazeaz pe diagnosticul
unui potenial sau capaciti: nici un test psihologic nu poate face mai mult dect s msoare
un comportament. Dac un asemenea comportament poate servi ca un indicator efectiv al
altui comportament, acesta poate fi determinat numai prin cercetare empiric (1976, p. 25).


19
2.2.2. Standardizarea
Standardizarea este o condiie fundamental a testului psihologic, unde orice variaie a
condiiilor produce o variaie a rezultatelor. Standardizarea se refer att la coninut (proba
este identic cu sine nsi n ce privete nu numai coninutul itemilor, dar chiar i forma lor
de prezentare i foaia de rspuns), ci i la condiiile de aplicare (asemnarea pn la identitate
dintre condiiile n care s-a experimentat i cele n care se aplic proba) i n modul de
corectare, cotare i apreciere a probei de ctre autorul, respectiv utilizatorul unui test. Fiind
o metod de baz a psihologiei difereniale, testul poate fi considerat variabila independent
prin care o nsuire psihic (variabila dependent) este observat prin examinarea persoanelor
care sunt testate (pstrarea constanei situaiei, elementul de variabilitate fiind persoanele).
Deoarece n psihologie pluri-determinarea face dificil izolarea fenomenelor, cerina
uniformitii i a identitii de procedur este mai stringent ca n alte domenii. Pentru a
asigura uniformitatea, autorul testului d indicaii precise i detaliate despre cum se
administreaz i cum se scoreaz rezultatele testului, indicaii ce vor fi respectate foarte strict,
pentru c altminteri rezultatele culese nu vor mai fi compatibile cu cele obinute pe eantionul
standard (de etalonare sau eantion normativ). Materialele folosite, modul lor de prezentare,
instructajul subiecilor, limitele de timp, demonstraia prealabil, modul de manevrare a
materialelor, toate sunt specificate i respectate ntocmai. Uniformitatea se refer i la rata
vorbirii examinatorului, la tonul, inflexiunile vocii sau expresia sa facial.
Deoarece un test nu are indicatori predeterminai pentru aprecierea succesului sau a
eecului, un alt aspect al standardizrii se refer la norme, adic la stabilirea valorilor medii
(normale) ale performanelor, n funcie de care, plecnd de la scorurile brute (numrul de
itemi rezolvai corect, timpul, viteza, numrul de erori etc.) se stabilesc scorurile standard.
Aceasta presupune activitatea de etalonare, care se face pe loturi mari, reprezentative statistic,
crora li se determin media, mediana, abaterea standard, frecvenele brute i cumulate, n
funcie de care se stabilesc cotele standard. Performana oricrui individ nou examinat va fi
raportat la acest cadru de referin. Pentru ca acest lucru s fie posibil este obligatorie
uniformitatea i identitatea procedurilor de aplicare a testului n noul caz, cu situaia de
etalonare originar.

2.2.3. Fidelitatea
Dac cineva i-ar msura greutatea, citind la un cntar 80 de kg., iar la altul 92 de kg.
n aceeai zi, nu ar ti nici care este greutatea sa real, nici care dintre cntare este bun (dac
este vreunul). Cu att mai mult ne vom ndoi de indicaiile cntarului respectiv cu ct, la dou
20
msurtori succesive ale aceleiai persoane, el va indica valori diferite. Un test, ca oricare alt
scal de msurare, trebuie s fie fidel, adic egal cu sine nsui, rezultatele unor msurtori
repetate trebuind s fie cel puin stabile, dac nu identice.
Cu ct fidelitatea unui test este mai mare, cu att mai mare siguran avem c
rezultatele lui sunt reale, nefiind n mod semnificativ afectate de schimbri aleatoare, cum ar
fi contextul, situaia de testare, starea subiectului, particularitile examinatorului etc.
Utilizat n psihometrie, termenul de fidelitate (reliability n englez) ntotdeauna nseamn
consisten, afirm Anastasi (1972, p. 27).
Exist modaliti speciale de determinare a fidelitii. Acestea sunt:
- Procedura test retest (corelaia dintre rezultatele aplicrii aceluiai test, n aceleai
condiii, acelorai subieci, eventual de ctre acelai examinator, n dou momente de
timp diferite, la distan relativ scurt, pentru a nu aprea modificri n structura
parametrului investigat).
- Calculul corelaiei dintre rezultatele unui test i forma sa paralel, alternativ (n cazul
n care ea exist), aplicat n condiii identice.
- Tehnica njumtirii (split-half), prin care jumtatea par a unui test (itemii cu numr
par) este pus n corelaie cu jumtatea lui impar. Exist i alte metode de
njumtire.
- Corelaia ntre modul n care psihologi diferii scoreaz acelai test, aplicat acelorai
persoane, n aceleai condiii (fidelitatea interscoreri).

2.2.4. Validitatea
Un test poate s fie fidel fr a fi ns i valid, nsuire care se refer la faptul c el
msoar efectiv ceea ce i-a propus. Nici un test nu are validitate sczut sau ridicat n mod
absolut, deoarece aceasta depinde de maniera n care el este utilizat. Galton a ncercat s
determine ntr-o manier corect acuitatea perceptiv sau sensibilitatea la durere, dar acestea
s-au dovedit a nu fi determinri valide ale inteligenei, aa cum el a presupus.
Spre deosebire de fidelitate, care se poate determina relativ uor, validitatea are nevoie
de acumulri graduale de informaie, din foarte diferite tipuri de investigaii. Deoarece este
un proces progresiv, dependent de timp, este mai potrivit s spunem c un test se valideaz,
validitatea fiind acea determinare care permite s spunem n ce msur el i ndeplinete
funciile pentru care a fost proiectat, n raport cu diversele sale domenii de aplicaie. Prin
validitate, testul se testeaz pe sine, fcnd apel la diverse criterii externe, pentru a determina
21
dac prediciile sale au fost valabile i n ce msur, n funcie de care vom ti ce ncredere s
i acordm.
Efectiv, validitatea (ca i fidelitatea), este o corelaie care se poate stabili n trei feluri:
1. Msura n care un test acoper un domeniu, adic validitatea de coninut. Un test de
cunotine poate acoperi un mic sector al matematicii, sau unul larg, caz n care el este
mai valid n raport cu acest domeniu.
2. Msura n care scorurile la un test sunt n acord cu teoria care susine trstura sau
constructul msurat, adic validitatea de construct.
3. Msura n care testul coreleaz cu un alt test independent, recunoscut ca un bun
instrument de msur al aceluiai domeniu (inteligen, memorie, personalitate etc.), ceea
ce reprezint validitatea relativ la criteriu. Cnd scopul testului este predicia unui
anumit comportament, criteriul va fi msurtoarea viitoarei performane i corelarea ei cu
testul iniial, n acest caz vorbind de validitatea predictiv. Aceasta este o form
fundamental de validitate, pentru c de cele mai multe ori psihodiagnoza are n vedere
prognoza, adic anticiparea rezultatelor. Unii detractori ai metodei testelor susin c cea
mai bun predicie a rezultatelor unei munci sau a unei activiti ar fi rezultatele obinute
ntr-o perioad de timp n chiar munca sau activitatea respectiv. Aceasta ar face inutil
chiar activitatea de selecie, dar aceast idee nu poate fi utilizat practic din cauza marii
cheltuieli de timp i bani presupuse de punerea ei n aplicare.
La aceste trei caracteristici: standardizarea, fidelitatea i validitatea testelor, se adug
i sensibilitatea sau fora discriminativ, ct i ideea de standardizare, etalonare i norm, ce
vor fi tratate mai detaliat n capitolele urmtoare, ntruct de ele depind nelegerea i buna
utilizare a acestor puternice instrumente psihodiagnostice, care sunt testele psihologice.

2.3. Administrarea testelor
Necesitatea de a avea stabilite proceduri detaliate sau doar orientative pentru
administrarea i scorarea testelor psihologice i educaionale a fost recunoscut de toate
organizaiile care se ocup cu testele. American Educational Research Association a stabilit
180 de standarde care accentueaz asupra importanei uniformitii n administrarea i
scorarea testelor. Procedurile de testare depind fie de tipurile de teste (individuale sau de
grup, cu i fr limit de timp, cognitive, afective sau de personalitate, psihologice sau
educaionale etc.), fie de subiecii supui examinrii (vrst, sex, cultur, grad de motivaie,
anxietate etc.).
22
Formarea specialitilor care vor administra teste este una de durat, se face sub
supravegherea unui psiholog cu experien i presupune caliti personale dublate de
cunotine detaliate despre instrumentele psihometrice utilizate. Cum variabilele situaionale
au o pondere n rezultatul final, ele trebuie controlate ct mai complet posibil.

2.3.1. ndatoririle examinatorului nainte de administrarea testelor
Pentru a prentmpina efectul de surpriz (neindicat), testele psihologice vor fi
programate i anunate din timp, pentru a evita plasarea lor dup mas, n timpul programului
de joac sau n concuren cu alte activiti mai interesante.
n acord cu particularitile de vrst, dac edina de testare ar putea depi o
jumtate de or la grdini, o or n primul ciclu coalar i o or i jumtate n al doilea ciclu
colar, atunci se vor organiza mai multe edine. n cazul testelor educaionale elevii vor fi
anunai din timp, pentru a se putea pregti fizic (odihn), emoional i intelectual. Acolo
unde este cazul, se va cere consimmntul scris, care este un acord de principiu al
examinatului sau al reprezentantului legal al acestuia c el consimte s fie examinat. n rile
avansate aceast problem este reglementat prin lege.
Tot ca o faz preparatoare este i pregtirea prealabil a examinatorului, care trebuie
s fi parcurs el nsui testul o dat, apoi s memoreze la nuan i n detaliu instruciunile,
pentru a nu avea nesiguran i ezitri n aplicarea acestuia. Pentru a crea o atmosfer
informal, calm i destins (mai ales n examinrile individuale) el trebuie s pregteasc i
s verifice cu minuiozitate materialele necesare, reducnd la minimum cutarea i
organizarea lor n timpul edinei de testare. Dac va folosi aparate, verificarea bunei
funcionri i calibrarea lor periodic sunt obligatorii. n examinrile colective (de grup),
fiecare caiet de test, foaie de rspuns, creioane sau instrumente necesare trebuie atent
verificate. Familiarizarea cu procedurile de examinare presupune practica asistat de
specialistul calificat, care poate merge de la simpla observaie, pn la peste un an de
instruire supervizat.
Asigurarea condiiilor satisfctoare de testare oblig psihologul s verifice
condiiile de ordin fizic (aezare, iluminare, ventilare, temperatur, nivelul zgomotului) i
psihice, prin care examenul s se desfoare confortabil. Anunul: Se testeaz! V rugm, nu
deranjai! va descuraja pe cei din exterior s inoportuneze, dei prezena unui supraveghetor
la u, i chiar ncuierea ei pe perioada sesiunii de testare, ar fi i mai de dorit.
Dac n cazul examenelor individuale (mai costisitoare, dar i mai edificatoare) se pot
controla mai uor variabilele externe, examinatorul alegnd o camer linitit, potrivit
23
scopului i lucrnd singur cu subiectul (chiar dac uneori prezena printelui, a
reprezentantului legal sau a poliistului se impune), n examinrile colective precauiile vor fi
mult mai mari, n special datorit larg rspnditei tendine de a tria sau de a fi incorect, care
poate vicia semnificativ rezultatele. Pentru aceasta exist mai multe msuri de siguran ce
pot fi luate: distribuirea de teste cu acelai coninut, dar aezate n forme diferite, prezena
unui numr suficient de supraveghetori atent instruii, care vor descuraja activ sau prin simpla
lor prezen tendina spre fraud. Acetia sunt cu att mai necesari cu ct grupul este mai
mare, iar importana testrii (miza ei) este mai ridicat, fiind de mare ajutor n distribuirea i
colectarea materialelor, n secretizarea foilor de rspuns (cnd se impune) i la supraveghere
pentru preveniia oricrei situaii nedorite.
Detalii aparent nesemnificative cum ar fi forma pupitrului, tipul de foi de rspuns
utilizate (indicate a se folosi pentru subieci de peste 11 ani, pentru c ele ncetinesc
considerabil viteza de parcurgere a testului), prezena sau nu a ncurajrilor sau a
comentariilor examinatorului, pot afecta performana la un test i de aceea standardizarea
procedurii de aplicare a acestuia trebuie s mearg pn la cele mai mici nuane. Orice
modificare a acesteia trebuie notat i luat n calcul la interpretarea rezultatelor.

2.3.2. Faza de administrare a testelor
Examenul i testarea efectiv pun probleme specifice, una dintre cele mai importante
fiind stabilirea relaiei (raportului) examinator subiect (subieci). Primul va trebui s
declaneze interesul, curiozitatea i cooperarea explicit a celui examinat. Testele de abiliti
trebuie s aduc subiectul n situaia de a da cea mai bun performan posibil a sa, pe cnd
la testele de personalitate, la chestionarele de opinii, atitudini i valori, obinerea sinceritii
rspunsurilor este fundamental. La testele proiective, evocarea liber, fr cenzur, este
factorul cel mai important. Problemele motivrii, constana n lucru, evitarea negativismului
i a distragerii ateniei presupun tehnici de stabilire a contactului bine exersate. Copiii (cu
precdere cei mici) i btrnii, persoanele vulnerabile sau cele foarte ruinoase, timide, din
medii defavorizate sau aparinnd altor culturi ori etnii, creeaz probleme specifice. La
acestea se mai adaug delincvenii, recidivitii, deinuii, bolnavii psihic (n special
psihopaii, dar i anxioii, emotivii, depresivii, schizoizii i persoanele paranoiace), care pot
dezvolta suspiciune, indiferen, atitudini marcate de cinism, agresivitate sau nesinceritate.
Dac la vrsta colar mic prezentarea testului ca un joc poate fi soluia optim, la
cea colar mare prghiile cele mai indicate sunt prezentarea testrii ca pe o competiie cu
sine i cu ceilali iar la liceeni stimularea nevoii de stim i de prestigiu. De asemenea,
24
familiarizarea prealabil cu sarcini asemntoare celor din edina de testare ar putea fi
folosit ca mijloc de reducere a tensiunii anxioase. Examenul adulilor pentru ocuparea unor
posturi, selecia n anumite profesii sau pentru cursuri de calificare reclam mult tact,
pruden i experien din partea psihologului.

n timpul desfurrii examenului psihologic, examinatorul va trebui s aib mult
grij n a urmri cu strictee procedurile standardizate de aplicare a testelor, neavnd voie s
dea nici un fel de indicaii, lmuriri suplimentare sau ajutoare, altele dect cele stipulate n
mod expres de manualul testului. Excepie fac edinele pentru determinarea potenialului de
nvare (strategie formativ definit i de Feuerstein n 1987), cnd se dau ajutoare n plus
fa de cele prevzute, dar i acestea ntr-o form standardizat, cuantificabil, pentru ca prin
calculul diferenei fazei pre-test i post-test s se determine n mod obiectiv acest potenial de
nvare.
Examinatorul trebuie s rmn n alert, pentru a rezolva orice problem urgent
care apare, s fie flexibil n atitudine, cu sensibilitate i rbdare mai ales pentru subiecii care
au probleme (handicapai, hiperkinetici, copii mici, timizi etc.). Aiken (1997) face cteva
recomandri valabile pentru aceste categorii speciale:
- psihologul s asigure timp suficient celui examinat pentru a nelege i rspunde;
- s permit suficient antrenament la itemii simpli, pregtitori;
- s foloseasc perioade mai scurte de testare;
- s observe oboseala i anxietatea i s le ia n calcul;
- s sesizeze i s noteze deficienele perceptiv-motrice (defectele de auz, vz, motrice,
lateralizarea invers);
- s foloseasc generos ncurajarea i ntrirea pozitiv;
- s nu foreze subiectul s rspund cnd el nu mai dorete.

n timpul testrii, mai ales la testele cu rspunsuri la alegere din mai multe posibiliti
sau variante, este posibil ca o parte dintre rspunsurile bune s poat fi efectiv ghicite, sau
determinate prin ceea ce Aiken numete deteptciunea n test (test wiseness). Prin aceasta
se elimin opiunile nepotrivite, prin semne adiionale scpate n formularea itemilor, ce
permit judeci comparative ntre opiuni. Exist tehnici speciale de ameliorare a
performanelor la anumite teste, nu prin pregtirea specific n domeniu, ci prin respectarea
unor reguli (Aiken, op. cit., p. 57).
25
2.3.3. Faza post-test
Dup terminarea edinei de testare, examinatorul colecteaz i pune n siguran
materialele de testare i foile de rspuns. D mici bonusuri, recompense copiilor sau celor
mai anxioi sau vulnerabili. Uneori informeaz prinii sau persoana n cauz despre utilitatea
ce va fi dat rezultatelor testului. De asemenea el promite s furnizeze informaiile rezultate
persoanei sau ageniei care l-a angajat. n caz de examen colectiv, psihologul i ajutoarele
sale colecteaz toate materialele utilizate n examen, se asigur c nimic nu lipsete i abia
dup aceea permite retragerea subiecilor, dup care el va pune n ordine foile de rspuns i se
va pregti s le scoreze.

2.4. Examinatorul i variabilele situaionale
Exist muli stimuli externi ambigui care trebuie luai n considerare sau controlai de
ctre examinator. Copiii precolari pun probleme speciale examinatorului, ca i btrnii,
emotivii, ruinoii, anxioii sau vulnerabilii.
Vrsta, sexul, rasa, statusul social, economic i cultural, experiena, antrenamentul,
aparena exterioar i altele sunt de luat de asemenea n calcul n ceea ce privete diferenele
pe care examinatorul nsui le poate introduce. Uneori chiar nivelul lui de expectaie poate
genera profeia care se automplinete sau efectul Rosenthal.
Situaia de examinare are i alte faete. Anne Anastasi arat c recruii abia ncorporai
dau rezultate mai slabe dac sunt examinai imediat dup ncorporare, fr s fi avut timp s
se acomodeze cu noul mediu. Uneori activitile imediat precedente i pun amprenta asupra
performanei la test. Feedback-ul pozitiv sau negativ dat de examinator pe parcursul
desfurrii testului poate ameliora sau diminua rezultatele finale. Chiar dac ponderea
acestor factori nu este foarte mare, ntr-un program de testare bine conceput examinatorul
trebuie s fie foarte atent la ei pentru a le minimiza influena. Probleme suplimentare apar i
atunci cnd o edin de testare este precedat de un antrenament practicat cu teste similare.
Deoarece practica testelor a luat o amploare extrem de mare n toat lumea i
deoarece multe decizii importante se bazeaz pe rezultatele obinute la teste, edituri
specializate sau firme i ofer serviciile n antrenarea candidailor. ntr-o manier similar
cu a iluzionitilor care fac publice secretele confrailor, sau cu a informaticienilor care
introduc virui n programele calculatoarelor, psihologii au czut n propria curs, ceea ce i
oblig la precauii suplimentare ce fac din psihodiagnoz un domeniu tot mai tehnicizat i
mai sofisticat.

26
CAPITOLUL 3

DIFICULTATEA I SENSIBILITATEA UNUI TEST
PSIHOLOGIC SAU EDUCAIONAL


3.1. Dificultatea unui test
Aplicarea unui test psihologic sau educaional ridic o problem tehnic foarte
important i anume dac el este adecvat, ca i grad de dificultate, populaiei sau grupului
respectiv. Dac este prea uor, majoritatea scorurilor la test vor fi mari i curba rezultat, n
form de j, va fi asimetric spre dreapta; dac va fi prea greu, curba n form de i va fi
asimetric spre extrema stng. Se apreciaz c testul este adecvat unei populaii doar n
cazul n care repartiia scorurilor sale este simetric, genernd o curb de tip gaussian.
Problema dificultii unui test se pune i n funcie de tipul acestuia. Dac el este un
test de aptitudini, capaciti, deprinderi sau cunotine, aceast problem este mult mai
relevant dect pentru testele de personalitate sau chestionarele de opinii, atitudini, interese,
valori, caz n care termenul de dificultate ar putea fi nlocuit cu cel de accesibilitate.
Dificultatea testului depinde simultan de coninutul su, ca i de particularitile
subiecilor investigai, ceea ce face ca n construirea unui asemenea instrument s existe o
faz iniial (definirea testului, crearea bncii de itemi i construirea unei variante
preliminare a acestuia), o faz intermediar (administrarea testului, analiza rezultatelor
obinute i, prin analiza de itemi, depistarea erorilor, corectarea, reelaborarea, selectarea i
ordonarea itemilor) i o faz final (creararea normelor, a etaloanelor i elaborarea
manualului testului, vezi Albu, 1998, p. 199).
Dac testele de aptitudini i de cunotine aplicate adulilor iau n considerare un
proces ncheiat, variabilitatea fiind dat mai ales de studii, profesie sau sex, cele mai multe
teste de inteligen, memorie, aptitudini speciale i cunotine, aplicate copiilor sau
adolescenilor, au n factorul vrst cea mai important surs de variabilitate. n acest sens,
elementele de dificultate ale testului trebuie s evolueze paralel cu vrsta (s aib indice
genetic, dup expresia lui Claparde), n cadrul fiecrei vrste el trebuind s aib o ct mai
bun acoperire a spectrului domeniului investigat. Aceasta trimite la puterea de discriminare
a testului, adic la sensibilitatea lui.
Un test este uor sau greu n situaia cnd unitile lui, fiind foarte puternic corelate
ntre ele (test omogen), creeaz posibilitatea ca majoritatea itemilor s fie rezolvai ori corect,
ori greit, ceea ce va da curbe asimetrice spre dreapta sau spre stnga. Exist i posibilitatea
27
ca populaia s cuprind dou grupuri distincte, care vor da scoruri polarizate dup o curb
bimodal (cu dou cocoae), ca n cazul testelor dihotomice: masculinitate-feminitate,
extraversiune-introversiune, stabilitate-instabilitate, admis-respins. Multe teste de selecie
profesional nu urmresc ierarhizarea de finee a persoanelor, ci ruperea grupului n
categorii extreme: apt-inapt, admis-respins, capabil-incapabil. Aici testele folosite vor fi mai
mult centrate pe dificultate (mic, medie, mare) i mai puin pe sensibilitate sau putere de
discriminare. Aplicate la nceputul sau la sfritul unui proces de formare, acelai test poate
poate avea o curb iniial n form de i (cnd deprinderea nc nu exist), n form de j
(cnd n final aceasta s-a cristalizat pentru majoritatea subiecilor), ntre care se interpune o
repartiie normal, simetric, pentru perioada intermediar (vezi Albu, op. cit., p.185).

3.2. Sensibilitatea unui test
Asemenea lentilelor, a cror calitate depinde n principal de puterea lor de separaie
(numrul de linii independente discriminate pe o suprafa de un centimetru ptrat), sau a
balanelor de finee, ca cele analitice, capabile s dea subdiviziuni din ce n ce mai fine i
continue pn la a cincea zecimal, caz n care se spune c sunt foarte sensibile, testele
psihologice au aceast caracteristic n funcie de numrul claselor pe care le pot delimita n
interiorul unui grup. Cu ct numrul valorilor de scor este mai mare, cu att ele discrimineaz
(difereniaz) mai bine ntre indivizi.
n afara acestei accepiuni, Kline (1993) leag sensibilitatea unui test de capacitatea sa
de a produce scoruri diferite pentru subiecii care difer ntre ei n ce privete caracteristica
msurat. Deoarece sensibilitatea conjug caracteristicile testului cu cele ale populaiei
msurate, vom remarca faptul c testele mai lungi, cu itemi gradai ca dificultate (deci
neomogeni) sunt mai sensibile, pentru c ele produc mai multe clase, i deci mai multe valori
ale scorurilor. Prin contrast, testele scurte sau cu itemi foarte omogeni, genereaz mai
degrab categorii de scor dihotomice, foarte contrastante, deci ele sunt puin discriminative.
Depinznd de forma repartiiei pe care o d scorurilor sale, testul cu curbe atipice (i, j sau
bimodal) sunt puin sensibile n zonele de mare aglomerare a scorurilor i sensibile n rest:
curba lui Gauss este tot mai discriminativ spre extreme, i tot mai puin sensibil pe
poriunea sa central, unde aglomerarea rezultatelor d un numr mai mic de scoruri.
Exist o legtur foarte puternic ntre dificultatea unui test i sensibilitatea sa. La fel
cum n fotografie filmele foarte sensibile (care se impresioneaz la cantiti mici de lumin)
pltesc un pre n ceea ce privete calitatea imaginilor (mai puin nete, deoarece imaginea este
tradus pe pelicul prin grupuri mai mari de puncte), sau la fel ca n metrologie, unde balana
28
analitic i dovedete utilitatea pentru greutile mici, iar nu pentru kilograme sau tone,
testele psihologice trebuie s stabileasc un raport optim ntre dificultate i sensibilitate.
Sensibilitatea presupune, pe de o parte, o ct mai bun acoperire a domeniului de
coninut al variabilei, pentru care testul trebuie s aib grade diferite ale dificultii, pe de alt
parte discriminarea de finee la nivelul fiecrui palier de dificultate considerat. Pentru a
exemplifica, testele de inteligen WISC sunt operaionale de la 5-6 ani la 14-16 ani, pentru
fiecare an dndu-se etaloane din 4 n 4 luni. Dar, n timp ce anumite subteste ale bateriei
(Informaii, Comprehensiune) dau un larg evantai de scoruri, nct etaloanele nu au goluri,
altele (Cifrele, Labirinturile), din cauza numrului mic de itemi care le compun,
discrimineaz foarte grosier pe anumite poriuni ale scalei, la anumite vrste. Subtestul
Cuburilor, o foarte valid expresie a inteligenei concret-spaiale, compus din 10 patternuri ce
pot da (n forma iniial) 55 de puncte de scor, are un prag nalt de intrare n prob la vrstele
mici (5-6 ani), unde nu distinge fin coeficienii de inteligen mai mici de 80, i un prag jos
la vrste mari (peste 13 ani), unde nu mai distinge supradotaii (QI > 125/130). Pentru bateria
WISC, combinarea optim a celor dou caracteristici (dificultatea cu sensibilitatea) se face
pentru vrstele de 11-13 ani, unde ea are cea mai mare for discriminativ i deci cele mai
bune caliti psihometrice (Zimmerman i Woo-Sam, 1973). n mod similar, testul PM 38
(Matricile Progresive Standard ale lui Raven) are un prag nalt de intrare n prob la 5-7 ani
i unul jos dup 14 ani, deci nu distinge bine insuficiena ori supradotarea mintal, la vrstele
mici, respectiv mari.
Sensibilitatea testelor depinde de muli factori (care pot fi identificai i prin analiza de
itemi), dintre care amintim:
- Numrul itemilor, care, aa cum am artat, creeaz posibilitatea stabilirii numrului de
clase de scor, progresiv cu creterea acestuia. Numrul maxim de clase este chiar numrul
de itemi, atunci cnd ei nu sunt echivaleni sau intercorelai. Dac lum exemplul testelor
de inteligen, acestea ar trebui s msoare QI-uri de la 40 la 160, avnd o lungime a
amplitudinii scorurilor (cea care trebuie s acopere ntreg spectrul de variaie) de 120 de
uniti. Dac subtestul are 40 de itemi, nseamn c cea mai fin rezoluie este de 3 uniti
de QI pentru un item; dac am avea, ca la subtestul Cifre, 8 itemi pentru prezentarea
direct i 7 pentru prezentarea invers, nseamn c 120/(8+7) = 8, adic fiecare item
acoper 8 uniti de QI, ceea ce nseamn o discriminare mult mai grosier, n care orice
eroare de aplicare ar putea avea consecine nsemnate asupra scorului la acest subtest. Pe
de alt parte, este aproape imposibil a genera un test cu maxim sensibilitate (un punct de
29
QI s fie dat de cte un item separat), nu numai din cauza extensiei amplitudinii
mprtierii la 120 de uniti, dar i din cauza numrului de vrste distincte pe care testul
le acoper (de la 5 la 16 ani sunt 12 vrste). Aceasta ar da subteste neobinuit de lungi i
de greu aplicabile (nemaniabile). De aceea, teste de inteligen cu o rezoluie de pn la 5
uniti de QI pe item sunt nc acceptabile, dei cele mai bune valori ar fi ntre 2 i 3.
- Maniera de scorare a probelor este iari o modalitate important de cretere a
sensibilitii testelor. La testele Domino (D 48 i D 70), pentru fiecare problem (alctuit
din desenele unor piese de domino ce solicit stabilirea a dou valori) se acord doar un
punct, performana maxim fiind de 44 de puncte. Imaginnd un alt sistem de scorare,
prin care s nu se piard puncte, i acordnd un punct dac un element din csua dubl
este corect, nc unul pentru al doilea, plus un bonus de un punct pentru simultaneitatea
lor i orientarea corect pe vertical (neinversare), se obin 443 = 132 de puncte de scor,
cu care se baleiaz un domeniu mai extins al variabilei, dar i vrstele succesive. Similar,
la subtestul Cuburilor din bateria WISC, se dau 4 puncte pentru patternul rezolvat corect
i nc maximum 3 puncte drept bonificaie de timp, rezultnd maximum 7 puncte per
item i 55 de puncte n total. Deoarece rezolvrile parial corecte nu se iau n considerare,
rezult c o bun parte din variabilitatea scorurilor se pierde inutil. mbuntirea
sistemului de scorare, prin acordarea unui punct pentru fiecare cub cu o culoare omogen
(rou sau alb), pus n locul potrivit, i nc un punct pentru feele bicolore (rou i alb)
care respect nu numai locul, ci i poziia relativ (nclinarea), ar putea duce la dublarea
ambitusului scorurilor posibile i deci la o for discriminativ dubl. Adugarea a nc
doi itemi (unul foarte uor, pentru intrarea n prob i unul foarte greu, pentru a ridica
pragul de ieire din prob), reconsiderarea timpului de aplicare i al manierei de acordare
a bonificaiilor de timp ar fi nc dou surse de mrire a sensibilitii testului, cu
meniunea c toate aceste modificri reiau de la zero problemele construcie, de etalonare,
de determinare a validitii i fidelitii probei, pentru c, de fapt, aceasta nseamn
crearea unui test nou, ce trebuie studiat ca atare.
- Tipul de norme utilizate n etalonare este a treia caracteristic ce poate contribui la
ameliorarea semnificativ a sensibilitii unui test. Selecia acestora depinde de precizia
dorit n utilizarea testului. Dac la normele exprimate n centile se poate determina n
principiu fiecare punct percentil (caz foarte rar, pentru c testul ar trebui s fie foarte lung
i eantionul foarte extins), sau mcar punctele decile, la care se mai adaug percentilele
3, 5, 25, 75, 95 i 97, dezavantajul const n inegalitatea unitilor de msur (mai mici pe
30
poriunea central a benzii i mai lungi spre extreme). n consecin, rezultatele unei
baterii de teste etalonate n centile nu pot fi adunate i integrate, prin medie, ntr-un scor
unic. Cuartilele dau o mprire i mai grosier (4 clase), foarte larg, nepermind
discriminrile de finee. Testele moderne sunt etalonate n note z (standardizate), sau n
norme derivate din acestea, cum sunt notele C, T, Hull, stanine, stens etc. Dintre acestea,
foarte utile sunt notele T (cu media de 50 i abaterea standard de 10), dar i scalele de QI
(cu media 100 i abaterea standard de 15 sau 16). Ca o regul vom meniona c, cu ct o
scal va avea mai puine intervale (11, 10, 7, 5, 3), cu att mai mult se va produce o
pierdere de varian i deci o scdere de sensibilitate a scorurilor testului. Dac un test de
memoria cuvintelor este etalonat n stanine i clasa 5, la 10 ani are, s zicem, scorurile 48-
52, nseamn c diferena de performan de 5 puncte dintre subieci este practic anulat:
fie c scorul este 48 sau este 52, se obine aceeai stanin 5, aadar sensibilitatea
discriminrii va avea de suferit. Aceasta nu nseamn ns c scalele cu mai puine
intervale nu sunt foarte utile (i utilizate) n practic: multe baterii au subteste foarte
diferite ca putere de discriminare i atunci se alege o scal cu 9-10-11 trepte standardizate
(stanine, stens sau note C), care integreaz bine toate subtestele n baterie. Unii psihologi
s-au acomodat mai bine cu proprietile matematice ale unui tip de scal i l prefer n
virtutea obinuinei. Esenialmente acordajul dintre scorurile la test i gradul de extensie
al scalei utilizate trebuie s ne conduc la alegerea unor scale foarte discriminative cnd
testul are mai muli itemi (peste 30-40) eterogeni, nu din punctul de vedere al coninutului
sau al performanei msurate, ci al gradului lor de dificultate. Testele ce acoper multe
vrste, difereniate ntre ele prin performane ce au ambitusul amplitudinii mprtierii
mare (ntre 40 i 160 la testele de inteligen, sau chiar mai mari) au nevoie de scale
discriminative, celelalte putnd opera, pentru scopuri practice i de cercetare, cu scale mai
puin extinse, chiar dac aceasta nseamn scderea puterii discriminative a testului.
Pentru subtestele bateriei sale, Wechsler a optat pentru scale standardizate de 19 trepte.
Cum dificultatea i sensibilitatea unui test depind de mrimea i de caracteristicile
lotului particular de subieci la care aplicm testul, nseamn c obligatoriu trebuie s
determinm valorile tendinei centrale pentru a determina gradul de suprapunere ale acestora
cu lotul de eantionare, indicat de manualul testului. Cnd media grupului nostru este
semnificativ diferit de cea a populaiei de etalonare din manual nseamn c testul este prea
uor sau prea greu n raport cu aceasta i concluziile trase, prin raportarea valorilor brute la
etalonul standard, pot fi greite. Dac abaterea standard indic o valoare mult diferit (mai
31
mic sau mai mare dect cea a lotului normativ), nseamn c lotul nostru este fie prea
omogen, fie prea eterogen n raport cu eantionul standard. n prima situaie fora de
discriminare a testului descrete, n a doua ea crete, dar n ambele va trebui avut n vedere
construcia unui etalon mai adecvat pentru populaia respectiv.
Trebuie observat c nici un test nu poate fi att de sensibil nct totdeauna, dou
persoane deosebite n privina variabilei msurate de test s obin scoruri diferite, afirm
Monica Albu (1998, p. 189). Aceasta pentru c, n timp ce trsturile psihice sunt variabile
continue, scorurile la test sunt variabile discontinue (discrete) i de aceea o coresponden
biunivoc ntre variabil i scorul la test este un fapt imposibil de realizat practic. Scorul fiind
afectat de diverse tipuri de erori (generate de testul nsui, de subiect sau de situaia de
examinare), este posibil ca aceeai variabil, msurat la acelai individ, s aib mai multe
valori de scor. ntruct performana la un test se raporteaz la un numr de intervale mai mic
dect numrul valorilor de scor pe care el le poate nregistra, nseamn c indivizii plasai pe
acelai interval de scor nu sunt discriminai. Deci un test va fi cu att mai discriminativ cu ct
va separa mai bine indivizii care au valori ale variabilei msurate de test plasate n acea zon
a axei sale n care exist un numr suficient de intervale de lungimi mici (Albu, op. cit., p.
190).

3.3. Construcia unui test psihologic
Analiza de itemi nu se face numai n sensul determinrii puterii discriminative a unui
test, ci i n contextul mai general al construirii unui test bun. Deoarece construcia testelor a
devenit n acelai timp o tiin i o art, ce implic o tradiie i experi n domeniu, nu vom
aborda aceast problem complex, prezentnd doar principiile generale care stau la baza
acestei activiti.
Elaborarea unui test ncepe (vezi figura 3.1) cu decizia referitoare la ce fel de
informaie vrem s obinem prin utilizarea sa. Itemii de genul adevrat-fals vor fi utilizai
doar cnd vrem s evalum judeci absolute, n rest fiind preferabili cei cu alegeri multiple.
i n acest caz constructorul trebuie s ia n calcul probabilitatea ca cineva s dea rspunsul
din ntmplare (prin ans). Pentru scalele de atitudini sau de opinii, cel mai popular este
formatul dat de scala Likert (ntre acord total i dezacord total de interpun 3-7 trepte, dintre
care treapta intermediar reprezint neutralitatea). Un alt format este scala n 10 puncte
(metoda scalrii categoriilor) folosit n ratingul unor comportamente, n care punctele de
nceput i de sfrit sunt foarte clar definite. Tehnica Q-Sort, folosit n studiul personalitii,
cere unui subiect s fac evaluri asupra msurii n care anumii itemi l descriu pe el sau pe
32
altcineva (a se vedea capitolul ultim, despre crearea i statisticile scalelor psihologice). Dup
ce au fost creai i li s-a stabilit formatul, itemii vor fi administrai unui grup iar
caracteristicile lor vor fi apreciate printr-o evaluare sistematic a dificultii i
discriminabilitii itemilor, prin determinarea curbelor caracteristice ale acestora, prin
studierea consistenei interne sau a validitii relative la criteriu etc. Abia dup aceasta se face
definitivarea formei finale a testului care va fi aplicat, urmnd procedurile de standardizare
stabilite (condiii de aplicare, instructaj, limite de timp i mod de prelucrare a rezultatelor).
Analiza tehnic a testului (fidelitate, validitate i etalonare) ncheie un ciclu care se poate
relua de cte ori constructorul dorete s-i perfecioneze sau s reetaloneze testul, s-l
mbunteasc din punctul de vedere al fidelitii sau al validitii prin eliminarea sau
adugarea de itemi.

STABILIREA SCOPULUI


EXPRIMAREA SCOPULUI N TERMENI OPERAIONALI



A ABILITILOR UNEI Def. Comportament





REDACTAREAUIREA LOR.
















Figura 3.1. Algoritmul de construire a unui test
(dup Havrneanu, 2000, p. 130).

STABILIREA SCOPULUI
EXPRIMAREA SCOPULUI N TERMENI OPERAIONALI
DEFINIREA
CONINUTULUI I
ABILITII MSURATE
DEFINIREA
UNEI
TRSTURI
ANALIZA MUNCII
Def. comportamentelor,
trsturilor i criteriilor.
REDACTAREA ITEMILOR
REVIZUIREA LOR
ANALIZA ITEMILOR (PRETEST)
INDICATORI (DIFICULTATE, SENSIBILITATE)
STABILIREA FORMEI FINALE A TESTULUI
STANDARDIZAREA PROCEDURII DE APLICARE,
A INSTRUCTAJULUI, TIMPULUI I A MODULUI DE CORECTARE
ANALIZA TEHNIC A TESTULUI
(FIDELITATE, VALIDITATE, ETALONARE)
33
CAPITOLUL 4

FIDELITATEA TESTELOR


4.1. Problematica general a fidelitii testelor
Testele sunt concepute ca instrumente de msur perfecionate, n consecin ele
trebuie s aib calitile psihometrice presupuse de acest fapt. Dac pentru lungime, mas,
volum, timp sau temperatur exist att instrumente perfecionate de msur, ct i uniti
metrice bine definite, inteligena, memoria, personalitatea, motivaia, iubirea sau sntatea,
agresivitatea, tolerana la frustrare sunt caracteristici psihologice foarte complexe, ce nu pot fi
vzute i atinse n sens fizic, deci greu cuantificabile.
Cu toate problemele pe care msurarea le pune n psihologie, preocuparea pentru
acurateea instrumentelor utilizate n sens metric a generat standarde extrem de exigente i de
sofisticate. Plecnd de la Spearman (1904), Thorndike (1904), Kuder i Richardson (1937) i
pn la Cronbach (1972, 1989) i Bentler (1990, 1991), a existat o linie de evoluie continu
n dezvoltarea unor teorii tot mai elaborate despre fidelitatea probelor psihometrice. Teoria
clasic asupra fidelitii testelor este construit n jurul erorii de msurare care plec de la
ideea c fiecare persoan testat ar avea un scor adevrat, care ar fi obinut dac aceast
eroare nu ar exista. Deci scorul observat (O) este alctuit din scorul adevrat (A), la care se
adaug eroarea de msurare (E):
O = A + E
O alt supoziie a teoriei clasice a testului este c aceast eroare este aleatoare, deci
scorul adevrat va fi media unei distribuii n care dispersia reprezint erorile aleatoare de
msurare. Cum aceste distribuii pot avea dispersii largi sau nguste, nseamn c i erorile de
msurare vor fi mai mari sau mai mici. n felul acesta teoria clasic a folosit abaterea
standard a erorilor ca msur de baz a erorii de msurare, numit i SEM
1
.
Fidelitatea unui set de scoruri este exprimat de un numr zecimal cuprins ntre 0,00
i 1,00, indicnd absena, respectiv fidelitatea perfect. Deoarece nu poate fi determinat
direct, fidelitatea se estimeaz prin analiza efectelor variatelor condiii de administrare i a
coninutului testului asupra scorurilor finale. Ea va fi influenat doar de schimbrile
nesistematice care vor avea diferite efecte asupra celor examinai. Fiecare din multiplele
metode de estimare a fidelitii va lua n calcul diferitele condiii ce pot produce asemenea

1
Standard Error of Measurement, adic eroarea standard a msurtorii.
34
schimbri nesistematice n scorul testului, ce vor afecta n consecin mrimea erorii de
msurare. n funcie de condiiile concrete n care a fost administrat testul i n funcie de
ceea ce acesta msoar, se calculeaz unul sau mai muli coeficieni de corelaie ca o
aproximare a fidelitii testului.

4.2. Fidelitatea test-retest
Numit i coeficient de stabilitate, acesta este obinut prin corelarea scorurilor obinute
de un grup de persoane la o administrare a testului cu scorurile nregistrate la o administrare
ulterioar a acestuia, dup un interval de timp. Procedeul ncearc determinarea erorilor
legate de condiiile de aplicare. Cum testul aplicat este acelai, inconstana scorurilor nu
poate fi imputat itemilor si, ci diferenei dintre condiiile de aplicare, cu att mai mari cu
ct intervalul dintre testretest este mai lung (luni sau ani). Aceasta presupune ns c
trstura msurat este ea nsi stabil n timp, deci procedeul nu este adecvat pentru unele
probe (pentru testele proiective de exemplu, dar nici pentru chestionarele de motivaii, opinii,
dispoziii afective sau sntate).
Deoarece pot interveni efectele practicii (unele abiliti se mbuntesc prin exerciiu)
sau ale nvrii (coninuturile testului pot fi memorate spre a fi rezolvate ulterior), se pune
problema alegerii atente a intervalului dintre cele dou examinri. Aceste efecte sunt mai
accentuate pentru intervalele scurte (ore sau zile), dar un interval mai lung are dezavantajul
de a produce modificri chiar n structura aptitudinii (efectul de cretere sau de maturare,
foarte evident mai ales la testele educaionale). Intervalul optim pentru retest pare a fi de
cteva sptmni pn la o lun sau, unde este posibil, se pot calcula coeficieni de fidelitate
pentru intervale de timp diferite (sptmni, luni sau ani).

4.3. Coeficientul formelor parale
Memorarea testelor nu d o eroare sistematic, deoarece proporia itemilor pe care
subiecii i-i reamintesc dup o perioad este diferit de la individ la individ, ceea ce produce
descreterea corelaiei test-retest. Pentru depirea acestei surse de eroare se poate utiliza
procedeul formelor paralele prin calcularea aa-numitului coeficient de echivalen, un alt
indicator al fidelitii. Pentru a msura acelai atribut o form paralel a unui test trebuie s
fie construit n acelai mod ca i prima variant. Ele vor fi considerate forme paralele doar
pentru c utilizeaz itemi formulai diferit, dar procedeul de generare i selecie a acestora
pentru un anumit nivel de dificultate este acelai, deoarece ambele trebuie s msoare acelai
construct, n aceeai manier. Formele paralele pot fi aplicate chiar i n aceeai zi, caz n care
35
singura surs de diferen dintre scorurile la cele dou forme este eroarea aleatoare a
diferenei dintre itemii testului.
O procedur mai rafinat utilizat este aceea de a aplica unei jumti din populaie
forma A a testului i celeilalte forma paralel B, urmnd ca dup o perioad de timp aceluiai
eantion s i se aplice tot ambele forme, dar de data aceasta primei jumti forma B iar celei
de a doua jumti forma A. Coeficientul de corelaie ce rezult se numete coeficient de
stabilitate i echivalen, pentru c ia simultan n calcul, ca surse de eroare, itemii testului i
factorul timp.

4.4. Coeficienii de consisten intern
Din cauza costurilor de construcie ridicate, nu toate testele au forme echivalente, de
aceea se folosete o cale mai puin direct de determinare a fidelitii: cea a consistenei
interne, ce include metoda njumtirii (splithalf) a lui Spearman, formulele Kuder-
Richardson i coeficientul alpha (o ) al lui Cronbach, care nu trebuie considerai echivaleni
cu coeficienii de fidelitate obinui prin testretest sau prin forme paralele.

a. Metoda splithalf
n englez, to split nseamn a despica, iar half, jumtate, de unde i numele
metodei, care poate fi tradus prin njumtire. ntr-un test omogen, toi itemii msoar (n
diverse grade) acelai construct, deci este posibil s construim dou jumti relativ
echivalente pentru a le pune ulterior n corelaie. Cele dou jumti pot fi obinute n diverse
maniere, cum ar fi: prima parte a testului i a doua sa parte, sau subteste ce ar rezulta din
reunirea tuturor itemilor cu numr par i cu numr impar (tehnica parimpar), sau oricare alt
procedeu, chiar i aleator, de a genera jumti. Problema tehnic spinoas este c acestea
trebuie s fie echivalente, ceea ce n primul exemplu nu se ntmpl: n cele mai multe teste
de aptitudini, itemii dificili sunt plasai n a doua parte a probei. Chiar i tehnica parimpar
este aplicabil doar parial pentru c, dei n multe teste itemii sunt aranjai n ordinea
cresctoare a dificultii, sunt greu de gsit cte doi itemi perfect echivaleni din acest punct
de vedere, pentru a putea compune cele dou jumti. n plus, n unele teste, anumii itemi
sunt folosii pentru a-i introduce pe alii, adic nu sunt independeni (itemi legai).
Deci metoda splithalf presupune analiza de itemi i calculul mediei i a abaterii
standard, valori care trebuie s fie aproximativ egale pentru fiecare jumtate, pentru a verifica
faptul c ele sunt echivalente. Cum corelaia dintre dou seturi de scoruri este mai mic
pentru seturile mai scurte, fidelitatea ce rezult pentru testul n ansamblul su, plecnd de la
36
jumtile sale, poate fi estimat prin corecia pe care formula de profeie a lui Spearman-
Brown o propune:
R =
r
r
+ 1
2

De exemplu, dac corelaia dintre jumti este de r = 0,64, fidelitatea testului n ansamblul
su va fi R = 20,64/(1+0,64) = 0,78. Aceast formul are un efect substanial pentru
corelaiile medii, dar unul mai mic pentru cele extreme.

b. Metoda Kuder-Richardson
n 1937, Kuder i Richardson au dezvoltat metode de evaluare a fidelitii dintr-o
singur aplicare a unui test, ceea ce a nsemnat un mare progres, deoarece aceasta nu mai
depindea de maniera arbitrar n care se fcea njumtirea testului. Scorarea separat a
jumtilor crea o alt problem, pe lng cea legat de dificultatea obinerii unor forme
realmente echivalente. Formula de mai jos se poate aplica doar testelor ai cror itemi sunt
scorai dihotomic (zero sau unu, adic fals sau adevrat):
|
|
.
|

\
|

= =

2
2
20
1 s
pq s
N
N
R KR
unde KR sunt iniialele celor doi psihologi, R este fidelitatea estimat, N numrul de itemi ai
testului, s
2
variana scorului la test n ansamblul su, p este proporia (calculat pentru fiecare
item n parte) n care un item este rezolvat corect, q este complementul acestei proporii,
adic (1 p), pq este suma produselor pq pentru fiecare item al testului. Studiind formula,
vom vedea c partea ei din dreapta comport o analiz din care rezult c pentru a avea o
fidelitate mai mare ca zero, variana testului trebuie s fie mai mare ca suma varianelor
individuale ale fiecrui item (s
2
> pq). Acest lucru este posibil doar n cazul n care itemii,
n calitatea lor de msur a aceluiai construct, sunt intercorelai.
Pentru situaia cnd itemii celor dou jumti sunt aproximativ egali ca nivel de
dificultate (cazul echivalenei), cei doi autori au propus o alt formul, mai uor de calculat,
dar care nu se poate aplica jumtilor neechivalente, ntruct le va subevalua fidelitatea:
(
(
(
(
(

|
|
.
|

\
|

=
2 21
1
1
1 s
N
x
x
N
N
KR

unde toate notaiile sunt aceleai ca n formula precedent, iar x reprezint media scorurilor
totale la test.
37
c. Coeficientul alpha (o ) al lui Cronbach
Formula
20
KR este o foarte valoroas procedur de estimare a consistenei interne a
unui test. Cu toate acestea, exist situaii n care ea nu este potrivit, iar acestea apar atunci
cnd testul nu a fost scorat n termeni de adevratfas, sau zerounu, deoarece formula se
bazeaz pe cunoaterea proporiei n care subiecii au rezolvat corect fiecare item. Unele
chestionare de opinii, atitudini sau valori sunt elaborate nu n termeni dihotomici, ci presupun
o scar a gradului de acorddezacord sau atracierespingere. n aceast situaie, Cronbach
(1951) a elaborat o procedur mai general de estimare a fidelitii, aa-numitul coeficient
alpha, a crui formul este:
|
|
.
|

\
|

= =

2
2 2
1 s
s s
N
N
R
i
o
Se observ o mare similitudine cu formula
20
KR chiar i n notaii, termenul nou fiind
2
i
s .
Termenul s
i
2
nlocuiete n aceast formul pq i el reprezint suma varianelor individuale
ale fiecrui item. Singura diferen const deci n maniera n care este exprimat variana.
Deoarece
2
i
s exprim variana itemilor care nu sunt rezolvabili doar prin da/nu, coeficientul
alpha este considerat a fi soluia cea mai general pentru determinarea fidelitii pentru
consistena intern.
Kaplan i Saccuzzo (1993) sesizeaz foarte ntemeiat c toate msurile care evalueaz
consistena intern, determin de fapt gradul n care fiecare item diferit msoar aceeai
trstur sau abilitate. Acest lucru presupune implicit c testul este omogen, n caz contrar
acesta neavnd consisten intern. Pentru testele neomogene, procedeul cel mai indicat este
analiza factorial, prin care se vor putea submpri itemii pe grupe omogene, subtestele ce
rezult avnd fiecare o consisten intern ridicat, dar fiind relativ independente unul n
raport cu celelalte, ca n cazul subscalelor testului de prsonalitate 16PF Cattell.
Aiken (1997) sesizeaz de asemenea c cele trei procedee de determinare a fidelitii,
amintite anterior, supraestimeaz valoarea acesteia pentru testele n care este implicat viteza.
n acest caz procedurile de apreciere a fidelitii trebuie modificate, recomandarea fcut
fiind aceea de a administra cele dou jumti ale testului n momente diferite, dar cu limit
de timp egal. Dup aceasta se calculeaz fidelitatea, operndu-se corecia ei prin formula
SpearmanBrown.


38
d. Fidelitatea interscoreri
Majoritatea testelor de aptitudini, de performan i de personalitate au proceduri de
scorare standardizate, aa c nu va fi nici o problem n privina scorurilor obinute de ctre
persoane diferite, devreme ce aceste proceduri de apreciere pot fi ncredinate mainilor
automate de scorare sau computerului.
Tehnicile proiective, judecile evaluativapreciative, evaluarea unor produse
complexe ale activitii (desene, mostre de scris, obiecte manufacturate etc.) sau ratingul
personalitii include, prin natura lucrurilor, o doz crescut de subiectivitate. n acest caz
trebuie s determinm gradul de intervenie n apreciere al subiectivitii, determinnd
fidelitatea interscoreri sau interevaluatori prin calculul corelaiei dintre dou seturi de scoruri
acordate de evaluatori diferii, unui numr determinat de examinai. Se poate apela i la
metoda mai muli examinatori un singur examinat, sau mai muli examinatori mai
muli examinai, procedee care culeg coeficieni de fidelitate intraclas, sau de concordan
(cum ar fi coeficientul tau al lui Kendall, vezi Radu et al., 1991), pentru care exist programe
speciale de calculator, cum ar fi SPSS.


4.5. Factorii care intervin n determinarea fidelitii
Pentru ca estimarea fidelitii s fie ct mai precis, trebuie ndeplinite cteva condiii
(Traub, 1944, apud Albu, 1998):
- Eantionul s fie ct mai mare, pentru a reduce eroarea standard a repartiiei, care este
invers proporional cu rdcina ptrat din numrul subiecilor ce compun eantionul.
- Eantionul s fie reprezentativ pentru populaia creia i este destinat testul, avnd acelai
grad de eterogenitate, deoarece omogenitatea diminueaz valoarea coeficientului de
fidelitate.
- Msurtorile s fie independente ntre ele, astfel nct msurtoarea de la un examinator
s nu o influeneze pe a altuia, iar dac examenul este colectiv, s nu se poat tria prin
copiere. Independena cere ca persoanelor supuse la testretest s nu li se dea informaii
despre rezultatele examinrii precedente, iar itemii s nu se condiioneze reciproc.
- Toate aspectele de procedur n test i retest sau la formele paralele trebuie s fie identice.


39
Creterea nivelului de fidelitate a unui test pn la limita dorit sau cerut de situaia
de utilizare concret este posibil prin creterea numrului de itemi (care trebuie s fie de
acelai format i s msoare aceeai trstur sau acelai construct)
2
. Decizia aceasta
angajeaz un proces lung i costisitor, pentru c testul nou generat trebuie reevaluat de la
nceput i uneori se dovedete a fi sub nivelul de fidelitate ateptat. De asemenea, crescndu-i
lungimea, testul devine mai greu de aplicat i de scorat. Manipulnd formula de profeie a lui
SpearmanBrown se calculeaz un indice de multiplicare a numrului de itemi pentru a
atinge fidelitatea dorit: un test de 20 de itemi trebuie s ajung la 56 de itemi pentru a-i
crete fidelitatea de la 0,87 la 0,95 (Kaplan i Saccuzzo, op. cit., p. 127).
Ca o concluzie a acestor consideraii despre fidelitatea testelor, se relev faptul c
aceasta este mai bun pentru teste unidimensionale i cu numr mai mare de itemi, ct i
pentru testele cognitive i c ea angajeaz un studiu analitic al itemilor (analiza de itemi)
pentru a le determina fora de discriminare. n multe situaii analiza factorial este metoda cea
mai eficient prin care se pot construi subteste omogene i unidimensionale. Fidelitatea este
una din fundamentrile de baz ale cercetrilor asupra comportamentului. Dac un test nu
este fidel, nu va fi posibil s demonstrm c el are vreun neles, afirm Kaplan i Saccuzzo
(op. cit., p. 131). Deci, dei validitatea pare a fi o caracteristic psihometric mai important,
din punct de vedere tehnic studiul ei nu poate ncepe cu teste care nu i dovedesc o fidelitate
minim, acceptabil, care depinde de scopul n care acestea vor fi utilizate.














2
Vezi capitolul urmtor.
40

CAPITOLUL 5

FACTORI CARE AFECTEAZ FIDELITATEA TESTELOR


5.1. ntinderea diferenelor individuale
Deoarece estimarea fidelitii rezult din calculul corelaiei r Pearson limitele
statistice ale acestuia se repercuteaz i asupra coeficientului de fidelitate. Astfel, r este
calculat pentru variana total a testului ceea ce este o condiie necesar, dar nu i suficient
pentru a determina fidelitatea. Atunci cnd se produce o reducere sau o cretere a ambitusului
scorurilor individuale, corelaia dintre variabile (i implicit fidelitatea testului) scade sau
crete n mod artificial, diminund ansa de a determina corect fidelitatea sa. Astfel, dac n
faza de studiu pilot se utilizeaz un eantion care are o varian mai mic dect populaia
general, fidelitatea testului va fi subestimat (va fi mai mic dect dac eantionul ar fi fost
reprezentativ). Aplicarea testului pe o categorie populaional foarte omogen (clase de elit
sau de subdotai intelectual, clase vocaionale etc.) ar putea furniza o corelaie mai mic dect
cea existent la clasele normale, unde extremele (subdotai, supradotai intelectual) sunt
reprezentate normal.
Variana i implicit fidelitatea poate fi crescut artificial prin folosirea de
eantioane cu grad mare de eterogenitate. Agregarea ntr-un eantion comun a unor clase de
elit (supradotai), normale i de integrare (subdotai) accentueaz mrimea corelaiei, ca i
reunirea n acelai eantion a unor niveluri de pregtire colar aflate la mare distan unele
de altele. Pentru situaia n care eantionul a fost prea omogen, diminund astfel variana
total a scorurilor la test, i deci fidelitatea sa, Magnuson a propus o formul de corecie:
r
uu
=
( )
2
'
2
1 1
u
xx x
r
o
o

n care r
uu
este fidelitatea estimat pentru noul eantion,
x
este variana noului eantion iar

u
este fidelitatea calculat ntre vechiul i noul eantion.
Pentru utilizatorul unui test precauiile legate de ntinderea diferenelor individuale
sunt dou:
- utilizarea tabelelor de norme, care aduc distribuiile la un numitor comun prin
raportarea la notele standardizate z;
41
- studiul pilot al fidelitii pe propriul eantion de lucru pentru a ne asigura c populaia
noastr corespunde ca raport de omogenitate/eterogenitate populaiei pe care s-a
determinat fidelitatea raportat n manualul testului.

5.2. Lungimea unui test
Teoria eantionajului demonstreaz faptul c, cu ct un eantion este mai mare, cu att
mai mult estimarea caracteristicilor populaiei din care acesta a fost extras este mai exact. n
mod similar, cu ct numrul de itemi ai unui test este mai mare, cu att mai bine este msurat
constructul sau domeniul investigat, i aceasta deoarece suma erorilor aleatorii tinde tot mai
mult spre zero.
Relaia dintre fidelitatea i lungimea testului este exprimat de formula de profeie a
lui Spearman-Brown, care ne va arta cu ct crete precizia estimarii prin modificarea
numrului itemilor ntr-o anumit proporie K:
' xx
r =
( )
'
'
1 1
jj
jj
r K
r K
+


n care r
xx'
este fidelitatea expectat prin lungirea testului, iar r
jj'
este fidelitatea calculat
pentru testul iniial. Aceast formul poate fi utilizat n dou feluri:
- dac iniial testul avea 20 de itemi i dorim s-l aducem la 45 de itemi, K reprezint
raportul 45/20 = 2,25. Plecnd de la fidelitate iniial de 0,83, fidelitatea expectat prin
lungirea testului va ajunge la: (2,25 0,83)/[(1+2,25-1) 0,83] = 1,8675/(1+1,0375) =
1,8675/2,0375 = 0,92;
- invers, dac vrem s tim ci itemi trebuie s adugm pentru a atinge valoarea dorit a
fidelitii, de exemplu creterea de la 0,83 la 0,95 (pentru a putea ajunge n zona n care
putem lua decizii care privesc destinul unei persoane), maniera de lucru presupune mai
nti izolarea lui K, plecnd de la formula anterioar.
K =
( )
( )
' '
' '
1
1
xx jj
jj xx
r r
r r


n cazul nostru: K= 89 , 3
5 04 , 0
5 16 , 0
05 , 0 83 , 0
17 , 0 95 , 0
) 95 , 0 1 ( 83 , 0
) 83 , 0 1 ( 95 , 0
=


- aceasta nseamn c, pentru a avea creterea de fidelitate expectat, testul trebuie mrit de
3,89 ori i deci de la 20 de itemi el va ajunge la 78 (20 3,89 = 77,8).

42
Formulele de mai sus pot fi folosite i n sensul scurtrii unui test prea lung (cu
scderea de rigoare a fidelitii sale) dar fie ntr-o situaie, fie n alta, itemii trebuie s aib
acelai coninut i acelai grad de dificultate, fiind consisteni cu itemii de plecare. Ori
aceasta nseamn parcurgerea prealabil a fazei analizei de itemi, cci itemii foarte diferii ca
nivel de dificultate sau ca i coninut nu vor avea o bun corelaie cu cea deja existeni,
scznd omogenitatea de ansamblu a testului.
Metoda Spearman-Brown nu poate preciza care sunt caracteristicile itemilor ce vor fi
adugai n termeni de format i de coninut al acestora pentru a face s creasc fidelitatea
testului pn la o precizie antecalculat acceptabil. Dac n testele de aptitudini itemii ce vor
fi adugai vor fi definii n acelai fel ca i ceilali, pentru a fi corelai cu constructul msurat,
n testele educaionale ei vor viza aceleai obiective pedagogice ca i testul iniial. Acesta nu
este un lucru dificil, cci itemii paraleli se creeaz uor dac am folosit din start tehnica
specificrii domeniului. Principalul inconvenient al metodei este utilizarea unui demers
empiric n crearea setului de itemi. Fidelitatea poate fi mai bine ameliorat atunci cnd un test
a fost construit dup demersul criterial, n care caracteristicile itemilor trebuie s fie bine
cunoscute.

5.3. Dificultatea testului
Corelaia dintre dou teste tinde s fie maxim doar atunci cnd distribuiile celor
dou variabile au acelai tip de asimetrie. Aa cum am artat n paginile anterioare, n fazele
testrii formrii unei deprinderi aceasta poate avea o asimetrie pozitiv n faza iniial (testul
este prea greu) i una negativ n faza final (testul devine prea uor), trecnd printr-o faz
intermediar unde exist simetrie a distribuiei scorurilor. Asimetriile fiind n direcii opuse,
cea mai mic fidelitate a testului va fi corelarea dintre faza iniial i faza final, dup care
corelarea dintre faza intermediar i celelalte dou faze, iniial sau final.
Schimbarea formei distribuiei poate fi principala cauz a unei fidelitai mici, prin
faptul c un test a devenit mai uor la o a doua aplicare, dnd o curb asimetric negativ, ceea
ce presupune contaminarea rezultatelor ca efect al nvrii. n consecin, verificarea formei
distribuiei scorurilor pentru acele dou aplicri devine obligatorie.

5.4. Testele cu limit de timp
Multe teste de cunostine sau de aptitudini conserv primatul gradrii dificultii
itemilor, de la cei mai uori la nceputul testului (pentru creterea ncrederii n sine), la cei
mai dificili spre sfritul acestuia (pentru a crete puterea diagnostic a instrumentului n
43
zona vrstelor mari ori a supradotrii). Dac ele au o limit de timp, itemii dificili nici mcar
nu vor fi abordai de majoritatea subiecilor, fiind scorai cu zero i la prima aplicare, i la cea
de a doua. Acest fapt va crea o cretere artificial a corelaiei prin care se pune n eviden
fidelitatea, deoarece vor intra n corelaie multe perechi identice de rezultate (0 - 0). Inflaia
fidelitii poate crea imaginea distorsionat a unui test cu itemi ce vor aprea ca mai omogeni
dect sunt de fapt n realitate. De fapt, la testele de vitez nu toate formele de determinare a
fidelitii sunt afectate. n timp ce n cazul jumtii vii (split-half) aceasta va fi afectat
(itemii scorai zero se distribuie aproximativ egal n cele dou jumti ale testului, crescnd
artificial fidelitatea), consistena intern prin indicele alpha al lui Cronbach sau prin metoda
test-retest nu va fi afectat semnificativ n acest caz.
Pentru a determina totui i celelalte forme de fidelitate se dau testul i retestul cu
limita de timp convenit de autor, se marcheaz ultimul item (de aceea itemii trebuie pasai n
ordine, i nu pe srite) apoi se continu pn la capt testul, fr limit de timp. Scorurile
din prima categorie vor servi pentru determinarea mediilor, a abaterilor standard i a formei
distribuiei, necesare scopurilor avute n vedere (cercetare, crearea de etaloane), n timp ce
scorurile brute obinute fr limit de timp vor da o mai bun expresie a fidelitii prin
metodele split-half i alpha al lui Cronbach.

5.5. Fidelitatea i eroarea de msurtoare
Deoarece fidelitatea nu exprim valoarea preciziei msurtorii n aceleai uniti ca i
scorul total la test (exprimat n note standard), uneori ea este mai greu de interpretat. Acesta
este motivul pentru care precizia msurtorii poate fi indicat i sub forma unei erori de
interpretare a scorului la test, care va fi cu att mai mic cu ct eroarea de msurare va fi i ea
mai mic. Aceast zon de ncredere poate fi determinat n dou maniere:
a) se determin eroarea de msurtoare (interval de ncredere nuntrul cruia se afl
adevratul scor al unui subiect, pentru niveluri de ncredere specificate);
b) se determin eroare de estimare (nivelul de ncredere al scorului observat dac
subiectul ar fi retestat).

5.5.1. Eroarea standard a msurtorii (SEM)
Conform teoriei clasice a testului, scorul adevrat al unui subiect se distribuie normal
n jurul unei valorii medii, dnd o distribuie pentru care putem determina abaterea standard.
Abaterea standard a diferitelor distribuii rezultate pentru toi subiecii grupului n cauz se
numete SEM (
e
) adic Eroarea Standard a Msurtorii i se determin astfel:
44
SEM =
e
o =
x
o
'
1
xx
r
n care: r
xx'
este coeficientul de fidelitate iar
x
este abaterea standard de la care s-a plecat n
calculul coeficientului de fidelitate r
xx'
. De exemplu, pentru o fidelitate de 0,93 i o abatere
standard de 12, 17 , 3 93 , 0 1 12 = =
e
o . Plecnd de la premisa c eroarea de msurtoare
este normal distribuit, 68% din scoruri se vor situa ntre un interval de 1
e
n jurul scorului
adevrat, 95% la 1,96
e
iar 99% la 2,58
e
. Nu ne rmne dect s definim aceste
intervale. Cum noi nu cunoatem adevratul scor al subiectului, este preferabil s construim
intervalul de ncredere n jurul a ceea ce deja cunoatem, adic nota observat x (obinut de
subiect) i eroarea standard a msurtorii:
x - z
c

e
x + z
c

e

n care:
x = scorul observat;
z
c
= valoarea critic a lui z pentru p 0,05 (z = 1,96) sau p 0,01 (z = 2,58);

e
= eroarea standard a msurtorii;
A = scorul adevrat.
Exemplu: scorul x al unui subiect la un test de inteligen este de 121, eroarea
standard a msurtorii este de 3,17 i vrem s construim intervalul de ncredere pentru p
0,05 i p 0,01. Pentru prima situaie avem 121 1,963,17 = 121 6,21. Deci pentru un p
0,05, intervalul este [115; 127], adic sunt 95% anse ca scorul adevrat al subiectului s cad
ntre 115 i 127.
Pentru a doua situaie avem: 121 2,583,17 = 121 8,18, deci pentru un prag de
ncredere p 0,01, intervalul definit este [113; 129], existnd 99% anse ca scorul subiectului
s cad ntre aceste limite. Se observ de aici faptul c: a. cu ct fidelitatea este mai mare, cu
att mai mult limitele intervalelor de ncredere pentru orice nivel de ncredere calculat sunt
mai mici (mai strnse) i b. cu ct vrem s tim cu o precizie mai mare n ce zon cad
scorurile cuiva, cu att mai larg va fi intervalul de ncredere rezultat, i reciproc.
Aceste intervale de ncredere fie sunt adesea neluate n seam de pracricieni, fie sunt
ru interpretate. De fapt noi nu avem nicicum certitudinea c scorul adevrat al subiectului va
cdea n intervalul de ncredere determinat, cci exist doar o probabilitate de a fi aa i, n al
doilea rnd, (i aceasta pare a fi defieciena major a acestei metode) intervalele de ncredere
astfel determinate se sprijin pe postulatul homoscedasticitii, adic pe prezumia c eroarea
tip este aceeai pe toat scara nivelurilor successive ale performanei. n al treilea rand,
corelaia dintre scorul observat i cel estimat nu este niciodat una perfect (Nunnally &
45
Bernstein, 1994) i n consecin prezicerea scorului adevrat plecnd de la cel observat
produce fenomenul de regresie spre medie al scorurilor adevrate. Lund n consideraie
aceast problem, Glutting, McDermott i Stanley (1987) au propus o modalitate de
construcie a intervalului de ncredere mult mai riguroas, dup formula:
) (
'
x x r x
xx

+ =
n care este scorul adevrat estimat, x scorul observat, x

media scorurilor observate, iar


r
xx'
este coeficientul de fidelitate.
Eroarea tip a estimrii se va calcula i ea dup o formul modificat:
' '
) 1 (
xx xx x eu
r r = o o
n care
x
este eroarea standard a distribuiei de la care s-a calculat r
xx'
iar r
xx'
este chiar
coeficientul de fidelitate calculat. Pentru exemplul nostru, n care un subiect obinea 121 la un
test de inteligen cu media 100 i cu abaterea standard de 15, testul avnd fidelitatea de 0,93,
determinarea scorului adevrat devine: 100 + 0,93(121 - 100) = 100 + 0,93 21 = 100 + 19,53
= 119,53, rotunjit 120. Calculul erorii standard a estimaiei este urmtoarea: (151-0,93) 0,93
= 15 0,26 0,93 = 3,69. Intervalul de ncredere pentru p = 0,05 este egal cu 1,96 3,69 = 7,23 n
jurul scorului adevrat estimat, adic 120 7. Acesta este intervalul [113-127]. Pentru pragul
de p 0,01, eroarea va fi 7,58 - 3,69 = 9,52, iar intervalul va fi 120 9,52, adic [110-130].
Aa cum se observ n raport cu scorul observat de 121 intervalul nu mai este unul simetric n
jurul valorii obinute de subiect: n prima situaie de la 121 113 = 8 puncte de scor, pentru
limita inferioar, i n a doua situaie sunt 127 121 = 6 puncte, pentru limita superioar.
Aceast asimetrie provine din centrarea intervalelor de ncredere diferite nu pe scorul
observat, ci pe cel estimat ca adevrat, ceea ce face din aceast procedur cea mai riguroas
metod de determinare a intervalelor de ncredere.

5.5.2. Eroarea tip a estimrii
Eroarea tip a estimrii se regsete de fiecare dat cnd dorim s calculm intervalul
de ncredere a valorii prezise plecnd de la o ecuaie de regresie liniar. Acest tip de eroare se
obine extrgnd rdcina ptrat din variana rezidual, adic acea varian a scorurilor care
se regsete la al doilea test atunci cnd se ine cont de primul test. Cum metoda de calcul i
interpretarea erorii de estimaie sunt mai laborioase, ele nu au fost incluse n capitolul de fa.
Menionm de asemenea faptul c n corelaia liniar pe care se bazeaz de regul
determinarea fidelitii homoscedasticitatea este presupus ca o condiie implicit.
Deoarece eroarea de msurtoare este mai mic la cei care au preponderant reuite sau
46
nereuite (extremele seriei de variaie a performanelor), comparai cu cei de pe poriunea de
mijloc, Keats i Lord au propus un model fundamentat pe distribuia binominal, care permite
estimarea erorii tip a msurtorii indiferent de nivelul scorului subiecilor. Nici aceast
procedur nu a fost inclus aici.

5.5.3. Interpretarea fidelitii
Rspunsul la ntrebarea ct de mare trebuie s fie fidelitatea unui test? depinde de
utilitatea practic care se d acestuia.
- O fidelitate de 0,70 0,80 este suficient de bun atunci cnd testul este folosit n scopuri
de cercetare.
- Se accept niveluri sczute ale fidelitii atunci cnd testele se utilizeaz pentru a lua
decizii preliminare i ridicate pentru decizii finale, sau cnd ele sunt folosite pentru
mprirea grupului n subgcategorii, pe baza unor diferene interidividuale mari.
- Dac testul servete la compararea grupurilor de persoane ntre ele, coeficienii de
fidelitate de 0,60 0,70 sunt suficieni, dar cnd testul devine o baz de comparaie ntre
persoane individuale, fidelitatea lui trebuie s fie de la 0,85 n sus.
- Cnd se iau decizii importante pe baz de teste, prin care se mpart persoanele n
categorii, n virtutea unor diferene mici (ca n selecia profesional), fidelitatea acestora
trebuie s fie de peste 0,90.
- Cnd decizia privete destinul unei persoane individuale, fidelitatea testului trebuie s fie
de cel puin 0,95.
Testele cognitive, i n special cele de inteligen, au de regul o fidelitate foarte mare
(peste 0,90), n timp ce chestionarele de personalitate rareori depesc 0,80. Aplicate colectiv,
chiar i testele cognitive furnizeaz coeficieni de fidelitate mai sczui (n jur de 0,80).
Testele cotate subiectiv, ce msoar aptitudini, i testele de cunotine (educaionale) rareori
depesc valori ale fidelitii de 0,80 (Traub, 1944). Testele cu alegere multipl, utilizate
colectiv, sunt considerate a avea o fidelitate bun cnd aceasta atinge 0,75.

5.5.4. Generalizabilitatea
Potrivit paradigmei clasice relativ la fidelitate, O = A + E, descris n partea
introductiv a capitolului de fa, fidelitatea unui instrument psihometric este n funcie de
ntinderea spectrului diferenelor individuale, de lungimea testului nsui, de limita de timp
acordat i de dificultatea testului. Cu toate acestea condiiile de observare i de msurtoare
47
sunt mult mai complexe dect cele enumerate anterior, ceea ce a condus la conturarea unei
noiuni noi i anume cea de generalizabilitate. Aceasta presupune studiul fidelitii n familii
de situaii similare, ceea ce face ca scorul adevrat (A, din formula de mai sus) s fie nlocuit
cu termenul de univers al scorului ateptat de la un subiect, ntr-un anumit ansamblu de
condiii de observare i de msurtoare.
Teoria generalizabilitii a fost elaborat n 1963 de Cronbach, Gleser i Rajaratnam
cu scopul de a reuni ntr-un concept unic diferitele definiii ale fidelitii. Astfel, pentru a
cuantifica importana fiecrei surse de varian dintr-o situaie de msurtoare ei au folosit
analiza de varian. Scorul adevrat i lrgete nelesul pentru c ia n calcul toate
observaiile posibile, mpreun cu erorile aferente rezultate din fluctuaiile de eantionaj
legate de momentele de evaluare, de forma itemilor sau de ecuaia personal a fiecrui
evaluator n parte. Din aceast cauz generalizabilitatea este un concept mai cuprinztor dect
cel de fidelitate, cci el descrie situaia de msurare ntr-un cadru mai complex i mai
apropiat de realitate. n esen aceasta indic msura n care se poate generaliza un rezultat
obinut n anumite condiii.
Noiunea de univers al scorului se cheam astfel pentru c are n vedere fidelitatea
scorurilor ntr-un ntreg univers de condiii care alctuiesc sau definesc tot attea faete ale
planului de observaie. Iat definiia dat de Cardinet i Turneur (1985, p. 23) universului
scorului: Universul scorului unei persoane p, dat ideal, reprezint media scorurilor
persoanei p calculat pe toate observaiile admisibile. Ori observatorul utilizeaz scorul
observat, sau o funcie a scorului observat pentru a estima valoarea universului scorului. El
generalizeaz astfel de la eanion ctre populaia de ansamblu.
O paralel cu fidelitatea se impune i pentru generalizabilitate. Dac n primul caz, cu
ct corelaia dintre scorul observat i cel adevrat este mai mare, i fidelitatea este mai bun,
n generalizabilitate aceasta este cu att mai mare cu ct scorul observat la un subiect este mai
asemntor cu cel pe care el l-ar fi obinut n ansamblul de condiii pentru care vrem s
generalizm. Cum universul scorului nu poate fi obinut direct, ceea ce ne rmne de fcut
este eantionarea sa. Aici problema cheie este cea legat de rezolvarea unei contradicii:
generalizabilitatea este cu atat mai mare cu ct ine sub control mai multe faete ale
dispozitivului de msurare, ceea ce nseamn sporirea numrului de itemi (de teme)
investigate, al numrului de corectori i de grile de corecie, dispozitivul devenind astfel
foarte costisitor. Ar trebui gsit deci un echilibru ntre economicitatea i eficacitatea
dispozitivului de msurare, ori pentru aceasta ar trebui determinat ponderea fiecrei faete a
examinrii, doar astfel putnd s le reunim ntr-un model eficace.
48
Pentru a ine cont de multitudinea variaiilor ce se produc ntre diversele faete ale
unui dispozitiv de msurare, ca i de diversele interaciuni posibile dintre acestea, studiul
generalizabilitii are n mod expres nevoie de analiza de varian.

5.5.5. Analiza de varian i planul de optimizare
Studiul generalizabilitii permite un control crescut al surselor de eroare dintr-un
dispozitiv de msurare (sau dispozitiv observaional). Dincolo de calculul unui indice de
fidelitate al unui univers al scorului, cercettorul poate detrmina n ce condiii sau situaii
dispozitivul su va prezenta caracteristicile cele mai bune ale msurtorii. n forma iniial a
teoriei generalizabilitii Cronbach, Gleser, Nanda i Rajaratnam (1971) s-au interesat doar
de stabilitatea scorurilor subiecilor. n psihologie i pedagogie merit tot atta interes un
numai subiecii, ci i itemii testuluo, cci se poate estima stabilitatea diferitelor modaliti de
prezentare sau de evaluare a lor, ca i diferitele coninuturi ce fac obiectul testului
(msurtorii) respective. Cardinet i Tourneur (1985) au definit un procedeu de calcul care
permite s se in cont n dispozitivul de msurare respectiv att de subieci, ct i de itemii
utilizai. n consecin ei au indicat cei patru pai ai procesului, primii doi fiind o analiz de
varian, faza a treia studiaz diferenierea iar faza a patra optimizarea.
Mai jos facem o succint prezentare a acestei proceduri:
1. Plan de observaie: se procedeaz la alegerea faetelor i a numrului de niveluri
ale fiecrei faete, precizndu-se i interrelaiile dintre ele.
2. Plan de estimare: se determin care faete reprezint un ansamblu de niveluri finite
i care dintre ele sunt eantionate aleator sau exhaustiv.
3. Plan de msurare: se identific ce faete sunt legate de planul de msurare (faete
ale diferenierii) i care sunt sursele de eroare ale msurrii (faetele de
instrumentaie). Cu alte cuvinte abia acum variana calculat n faza a doua se atribuie
fie varianei adevrate, fie varianei erorii, permind calculul coeficientului de
generalizabilitate i calculul marjei de eroare aplicabil scorurilor observate.
4. Plan de optimizare: acesta permite modificarea oricruia din planurile precedente,
ca i a combinaiilor dintre ele, cu scopul de a maximiza generalizabilitatea
observaiilor (msurtorilor). Este faza n care cercettorul caut acel echilibru dintre
precizia msurtorii i ntinderea universului generalizrii: cu ct acesta este mai
restrns, este mai uor de obinut msurtori adecvate ale acestuia, fapt care este mai
dificil n situaia invers.

49
CAPITOLUL 6

VALIDITATEA


Spre deosebire de fidelitate, care este influenat numai de erorile de msurare
nesistematice, validitatea unui test este afectat att de erorile nesistematice, ct i de cele
sistematice (constante). Din aceast cauz, un test poate s fie fidel, fr a fi valid, dar nu
poate fi valid fr s fie fidel, afirm Aiken (1993, p. 94).
Accepiunea clasic a validitii se refer la gradul n care un test msoar ceea ce i-a
propus, ceea ce sugereaz c ar exista doar un singur tip de validitate. Actualmente este
unanim acceptat faptul c un test poate avea diferite forme de validitate, dependente de
scopurile specifice n care el a fost utilizat. De aceea ni se pare de mare actualitate afirmaia
Ursulei chiopu (1974, p. 156) potrivit creia un test este bidimensional, axat pe doi factori,
adic pe diagnoz i pe validarea ei, concepui ca axele unui sistem de coordonate: n acest
sistem axa X reprezint o diagnoz cuantificabil (test comportament), axa Y reprezint
criteriul de valabilitate al diagnozei.
n acest sens poate fi neleas sintagma c un test se valideaz continuu. Fcnd o
analogie cu justiia, unde opereaz prezumia de nevinovie (fr dovezi concrete, cel trimis
n instan este nevinovat), psihologul trebuie s se supun unor reguli specifice de probare,
n stabilirea faptului c un anumit test are o nsemntate special pentru un scop specific
(Aiken, op. cit., p. 133). Deci validitatea ar putea fi definit mai corect ca o extindere
progresiv, pe msur ce testul primete noi utilizri, a cunoaterii noastre n legtur cu ceea
ce msoar el de fapt.

6.1. Validitatea de faad
Este mai mult o aparen de validitate dect o form de validitate n sens strict,
deoarece ea indic ce pare a msura o prob, i nu ceea ce msoar ea efectiv. Uneori
psihologii raporteaz exact ceea ce observ, fr a interpreta sau generaliza, i atunci
intervine tot validitatea de faad.
Chiar dac tehnic ea este slab definit (i de aceea uneori nici nu este analizat de
muli autori), validitatea de faad pare a avea o important funcie practic, deoarece
motiveaz subiecii s accepte mai uor un test nou, sau permite extensia utilizrii
instrumentelor spre alte zone dect cele care le-au consacrat: adesea spunem c un test are
50
validitate de faad dac itemii lui sunt relaionai rezonabil cu scopurile percepute ale
testului (Kaplan i Saccuzzo, op. cit., p. 135). Uneori acest tip de validitate poate da o mai
bun valoare de pia unui test.

6.2. Validitatea relativ la coninut
Aa cum reprezentativitatea eantionului de populaie ales permite generalizri asupra
populaieiint pe care o reprezint, itemii testului prin maniera lor de construcie i de
selecie pot acoperi ntr-o mai mare sau mai mic msur domeniul sau universul trsturii
sau al aptitudinii msurate. n felul acesta rspunsurile la un eantion de itemi dintr-un test cu
validitate de coninut sunt reprezentative pentru rspunsurile pe care subiectul le-ar fi dat
dac ntreg universul trsturii ar fi fost msurat. Acest tip de validitate este decisiv n testele
educaionale i de achiziii, ridicnd probleme specifice evaluatorului. Se va genera deci o
banc sau set de itemi care s acopere bine ntregul domeniu investigat (cunotinele la un
obiect colar, gradul de elaborare a unor deprinderi, nivelul de cristalizare a unor atitudini),
din care vor fi selecionai i agregai ntr-un test doar un numr limitat de itemi,
reprezentativi pentru ntregul domeniu.
Unele date de personalitate, obinute prin chestionare (de opinii, atitudini, interese,
motivaii sau valori), beneficiaz mai mult de acest tip de validitate dect celelalte. n testele
de achiziii itemii sunt creai innd cont simultan de obiectivele, finalitile procesului
instructiv, dar i de mecanismele proceselor cognitive la care se face apel n elaborarea
rspunsului la itemi. Aceasta presupune nc din start prezena experilor care vor judeca i
hotr care itemi vor fi inclui n test. De aceea putem spune c dintre formele fundamentale
de validitate, cea de coninut este singura care are o susinere mai degrab logic dect
statistic.
Pentru a da validitate de coninut unui test, constructorul se angajeaz ntr-un proces
de durat, ce presupune o foarte bun cunoatere a domeniului, raionament logic, intuiie i
perseveren, cci itemii trebuie continuu revizuii. Pentru a face generalizri ntemeiate
plecnd de la scorurile la test, constructorul trebuie s cunoasc bine toi factorii care ar putea
afecta performana subiecilor.

6.3. Validitatea relativ la criteriu
n acord cu aceast faet a validitii, un test este valid relativ la criteriu dac pe baza
lui se pot lua decizii corecte sau se pot face predicii/ prognoze asupra persoanelor examinate.
Un test este valid dac poate nlocui variabila criteriu n virtutea unor corelaii mari ntre test
51
i aceasta, astfel nct cunoscnd scorul la test s deducem valoarea variabilei criteriu pentru
persoana examinat. Dup maniera n care sunt colectate datele la test i cele la criteriu
distingem dou situaii, care produc dou subcategorii ale validitii relative la criteriu:
- Cnd scorurile la test i la criteriu se obin simultan, este vorba de validitate concurent.
- Cnd ntre obinerea scorurilor la test i cele la criteriu se interpune o perioad de timp,
vorbim de validitate predictiv.

Fiecare dintre aceste tipuri presupune strategii de validare diferite
3
, care vor fi
detaliat analizate n capitolul urmtor. De exemplu, un test de anxietate (Cattell) are validitate
concurent dac scorurile la testul psihologic i gsesc confirmarea, n aceeai perioad de
timp, prin diagnosticul psihiatric. Atunci cnd criteriul se matureaz dup un timp (luni sau
ani) i scorurile lui nu pot fi determinate simultan cu cele la test, folosim o a doua strategie de
validare, cea predictiv. n selecia profesional, de exemplu, se va calcula coeficientul de
corelaie liniar dintre scorurile la testul aplicat iniial i msuri (exprimate prin note sau
calificative) ale performanelor obinute de aceleai persoane n activitatea sau profesia pentru
care au fost selecionate. Deoarece o funcie fundamental a testului este aceea de a face
diagnoza n scopul unei prognoze (deci faptul de prezice), validitatea predictiv capt o
importan special n acest context.
ntruct msurile la test i cele la criteriu intr n corelaie, pentru a determina cu
exactitate limitele prediciei, aceasta impune ca ambele elemente corelate s satisfac
standarde nalte de fidelitate i de validitate. Cu alte cuvinte, o msur criteriu este pertinent
dac este i ea fidel i valid, fapt ce introduce problema validitii ntr-o relaie circular cu
criteriul ales. Aceasta nseamn c factorii de eroare care afecteaz criteriul vor fi controlai
n aceeai manier ca i predictorii (testele). Atunci cnd controlul lor nu d rezultatele
scontate, putem spori fidelitatea criteriului fie lund mai multe eantioane de msurtori ale
acestuia (msuri mai dese), fie adugnd noi tipuri de msuri, incluse ntr-un criteriu
compozit, pentru a spori fidelitatea lui n aceeai manier n care procedm cu un test cruia
i adugm itemi suplimentari.
O caracteristic important a criteriului este absena contaminrii, adic
necunoaterea rezultatelor la test de ctre cel care evalueaz msurilecriteriu. Un psiholog
va obine, independent de diagnosticul medicului psihiatru, scorurile la testul su de
anxietate, deci va face o analiz oarb. Prin efectul de halo, indulgen, predicia pentru sine

3
Vezi capitolul urmtor.
52
sau profeia care se automplinete, rezultatele prezise pot fi produse ntr-o oarecare msur
de predictorul nsui, caz n care comparaia nu mai este valid. Havrneanu apreciaz c
cele mai bune msuricriteriu sunt cele care prezint ct mai multe avantaje practice, care
sunt mai simplu de folosit, disponibile i mai puin costisitoare (op. cit., p. 113). Dintre
acestea enumerm:
- msurarea direct a produciei sau a randamentului;
- evalurile performanelor angajailor fcute de ctre efii lor sau de ctre serviciile de
personal ale ntreprinderilor;
- msuracriteriu poate aparine unui grup, n sensul c testul care reuete s clasifice
persoanele n grupuri bine precizate, sunt valide.
Strategiile de validare predictiv cele mai utilizate calculeaz fie un indice de
eficacitate, fie scoruri de separare a categoriilor, indici de separare a grupurilor sau indicele
de utilitate (vezi Havrneanu, op. cit., pp. 113-126).
Dintre factorii care afecteaz validitatea relativ la criteriu, Aiken indic diferenele
de omogenitate ale grupurilor (validitatea tinde s fie cu att mai mic cu ct grupurile sunt
mai eterogene), lungimea testului (testele mai lungi sunt mai valide) i contaminarea
criteriului, de care am vorbit deja. Creterea validitii unui test, n calitatea lui de instrument
diagnostic sau prognostic, presupune costuri ce trebuie atent evaluate, cci uneori metode mai
puin costisitoare (observaia, interviul sau inventarul biografic) pot aduce plusul de
informaie necesar n atingerea scopurilor propuse.

6.4. Validitatea relativ la construct
Multe dintre testele de personalitate msoar dimensiuni ale acesteia (anxietate,
depresie, nevrotism, motivaie, introversie-extraversie), mai slab definite iniial, dar din ce n
ce mai bine circumscrise, pe msur ce teoriile n domeniu au avansat. Conceptualizrile
progresive ale acestora (dar i ale inteligenei, memoriei, creativitii etc.) au dus la apariia
de constructe tot mai evoluate.
Unele teste sunt construite plecnd de la date empirice (ca MMPI sau Inventarul de
Personalitate California al lui Gough), altele se origineaz n teorii anterior elaborate oricrei
cercetri empirice (Chestionarele de personalitate Cattell sau Indicatorul Tipologic Myers-
Briggs). Validitatea relativ la construct verific, pe de o parte, dac testul se refer realmente
la constructul pe care vrea s-l msoare, i apoi dac scorurile subiecilor testai reflect
53
corect mrimea acestui construct la persoanele n cauz. Strategia determinrii acestui tip de
validitate impune un algoritm (vezi Albu, 1998, pp. 165-166):
- Descrierea amnunit a domeniului constructului respectiv (adic a tuturor atributelor ce
au legtur cu acesta i specificarea relaiilor dintre ele), printr-o reea nomologic, pe
care un grup de experi o va evalua pentru a determina nivelul la care ea acoper
constructul. Apoi se realizeaz un model al rezolvrii testului, cu mecanismele teoretice
implicate, pentru a vedea legtura acestuia cu constructul, dar i cu rspunsurile posibile
la test. Este posibil s se constate o bun reprezentare a constructului n test, dar i diverse
grade de subreprezentare (mai ales cnd sarcinile sunt prea grele sau prea uoare).
- Se analizeaz consecvena rspunsurilor la itemii testului, adic dac procesele implicate
n rezolvarea acestora acioneaz similar la toi itemii, pe parcursul ntregului test.
- Se urmrete dac structura global a scorului la test reflect structura domeniului
constructului msurat. Pentru aceasta se apeleaz la analiza factorial (de unde i numele
de validare factorial), care determin cteva variabile latente numite factori, alctuii din
itemi ce dau scoruri care coreleaz ntre ele, ce acoper variana ntregului test. Se caut
semnificaia acestor variabile, reinndu-se cele care au o mai mare legtur cu
constructul, asigurndu-se o coresponden ntre importana avut n definirea
constructului respectiv i ponderea lor ca itemi n testul final.
- Se extind generalizrile acestor prime etape, schimbnd fie populaiile examinate, fie
examinatorul sau contextele de examinare, pentru a vedea dac relaiile sesizate rmn
constante.
- n final se caut stabilirea relaiilor dintre testul cercetat i alte tipuri de msurtori
sau de observaii. Testul poate avea o validitate convergent (ntre scorurile sale i
alte tipuri de teste ce msoar acelai construct exist o relaie liniar), sau
discriminant (cnd scorurile la teste nu coreleaz cu teste care se tie c nu msoar
constructul respectiv).







54
CAPITOLUL 7

ALTE FEE ALE VALIDITII


Orice student la psihologie tie c meritele unui test psihologic ncep s fie judecate
prin fidelitate dar sfresc prin aprecierea validitii sale. Aceasta i datorit faptului c, n
timp ce fidelitatea se judec simplu, prin sumarizarea unor coeficieni de corelaie, validitatea
presupune demersuri interpretative mai complicate i de mai lung durat. nsui conceptul
de validitate este unul evolutiv, aflat n plin dezvoltare i de aceea strnete mult mai mult
controvers dect mai stabilul i mai bine aezatul su vr, fidelitatea (Cronbach, apud
Gregory, op. cit., p. 106). Acesta este motivul pentru care cteva aspecte legate de validitate,
abia schiate n capitolul anterior, sunt abordate mai pe larg n capitolul de fa.

7.1. Validitatea relativ la construct (conceptual)
Este cu siguran tipul de validitate care necesit cea mai mare cantitate de efort n
vederea validrii unui instrument psihometric. Dei se admite faptul c soarta unei tiine este
dependent de nivelul cuantificrilor sale, adic de capacitatea sa de a msura adecvat ceea ce
intr n domeniul obiectului su de studiu, i reciproca este valabil. Astfel, nu am putea
spune nimic concret despre variabile complexe ca inteligena, memoria, stilurile de evaluare
sau cele cognitive dac nu am avea i posibilitatea s le testm, adic s le supunem
msurrii. Dar, pe de alt parte, msurarea lor este departe de a fi posibil fr o cunoatere
teoretic prealabil a acestor constructe.
Raportul dintre teorie i msurare este cel mai bine surprins prin conceptul de
validitate de construct sau conceptual, care este chiar inima operaionalizrii variabilelor.
A operaionaliza nseamn de fapt a aduce un construct teoretic n situaia de putea fi surprins
i evideniat prin msurare. n cazul n care operaionalizarea unei teorii bune a fost fcut
corect, printr-un instrument corect, capabil s o surprind, atunci putem formula predicii sub
forma ipotezelor ce rezult din teoria respectiv. Dac ipotezele se verific, atunci i teoria,
dar i operaionalizarea ei sub forma instrumentului de msur respectiv sunt n regul.
Dac ipotezele nu se verific, sunt posibile dou explicaii alternative:
- instrumentul este bun, dar deoarece teoria nu se verific, aceasta trebuie schimbat;
55
- teoria este una valabil, dar instrumentul nu o operaionalizeaz corespunztor i
atunci nu putem dovedi ce ne-am propus i deci trebuie schimbat chiar instrumentul
de msur.
De exemplu, cercetrile lui Witkin i ale colaboratorilor si au evideniat mai mult
difereniere i mai mult independen de cmp pentru genul masculin. Studiile
neuropsihologice actuale despre lateralizarea emisferelor cerebrale indic de asemenea o
specializare emisferic mai accentuat pentru genul masculin, ca i un acces bicerebral la
limb pentru genul feminin, de unde superioritatea brbailor pentru sarcinile spaiale i a
femeilor pentru cele legate de limb i comunicare. Faptul c la un test spaial ca i Cuburile
Kohs, de exemplu, bieii obin performane superioare comparativ cu fetele, n timp ce
acestea au performane superioare la un test de inteligen verbal, este consistent cu teoriile
anterior menionate.
n alte situaii se ateapt ca itemii unui test s se organizeze ntr-o ordine progresiv,
ceea ce ar corespunde unei structuri ierarhice, rezultat din chiar dezvoltarea funciei sau
abilitii respective. De exemplu, dac vom operaionaliza teoria psihogenetic piagetian
ntr-o scal de itemi, aceasta va fi una ierarhic, pentru c orice stadiu l nglobeaz pe cel
precedent, facndu-l posibil pe cel care urmeaz. Validitatea conceptual va fi serios pus la
ndoial n cazul n care un subiect paseaz itemii pentru stadiul operaiilor formale i nu-i
trece pe cei din stadiul operaiilor concrete, fapt care ar contrazice chiar ideea de dezvoltare
stadial i ierarhic. n mod sporadic s-ar putea ntmpla s existe i itemi de acest fel, care
vor constitui ns erori.
Se poate deci afirma c rezultatele la acest tip de test sunt reproductibile, adic
pornind de la scorul total la test putem s prezicem care itemi vor fi pasai i care vor fi
euai. Pentru aceasta ns trebuie s tim ordinea de dificultate a itemilor, iar aceast ordine
s fie aceeai la toi subiecii. Cazurile (ct mai puine!) n care ierarhia itemilor este nclcat
produc erori de reproductibilitate, cci ele limiteaz posibilitatea prediciei corecte a itemilor
care vor fi pasai i al celor ce vor fi euai. Guttman (1950) a propus ca rezultatele la un test
s fie considerate ierarhice atunci cnd mai puin de 10% din rezultate nu sunt reproductibile
i a propus o formul de calculul al unui coeficient de reproductibilitate:
CR =
p j
e
N N
N
1
n care:
CR = coeficientul de repreoductibilitate;
56
N
e
= numrul erorilor de reproductibilitate (numrul de itemi care ncalc ierarhia,
adic furnizeaz rezultate n dezacord cu scorul total obinut i cu ordinea de
dificultate a ansamblului itemilor);
N
j
= numrul de itemi;
N
p
= numrul de persoane (subieci).
Aceasta poate fi considerat o bun metod de validitate conceptual pentru probele
piagetiene, condiia recomandat de Guttman fiind un CR de peste 0,90, deoarece peste
aceast valoare invariana ordinii de reuit se consider a fi bine demonstrat.
Alte metode de demonstare a validitii conceptuale o constituie metoda corelaiilor
simple, metoda multitrstur-multimetod i studiul trsturilor latente.

7.1.1. Metodele corelaionale simple
Acestea permit evidenierea faptului dac un test msoar acelai lucru cu un alt test
despre care se tie deja c este o msur valid a constructului respectiv. Acest tip de
validitate se numete validitate convergent. Cnd ns testul respectiv este pus n corelaie
cu un alt test care msoar o aptitudine complet diferit, aceast corelaie trebuie s fie foarte
mic i atunci vom pune n eviden validitatea divergent (sau discriminant). De exemplu,
este cu totul de ateptat ca un test de inteligen s coreleze puternic cu randamentul colar la
12 ani, aa cum menioneaz i literatura de specialitate, cci cele dou variabile sunt
nvecinate. Cnd ns testul nostru coreleaz puternic cu motivaia, cu locus of control sau cu
alte variabile ndeprtate apar mari suspiciuni n legtur cu ce msoar de fapt acest test.

7.1.2. Matricile multitrstur-multimetod
4

Procedeul descris aici a fost inventat nc din 1959 de Campbell i Fiske, el fiind n
acelai timp i o metodologie important pentru nelegerea procesului de validare. Acesta
este un design ce ia simultan n considerare validitatea convergent i pe cea divergent
(discriminant). Se cheam multidimensional pentru c ia n evaluare dou sau mai multe
trasturi, prin dou sau mai multe metode.
n exemplul dat de Gregory n figura de mai jos, trei trsturi A, B i C (Interesele,
Creativitatea i Dominana) sunt msurate cu metodele 1, 2 i 3 (inventar autoaplicat,
evaluarea covrstnicilor i un test proiectiv). Deoarece fiecare dintre cele 3 trsturi sunt
msurate prin toate cele 3 metode, rezult de fapt 9 teste, exprimate prin coeficienii de

4
Multitrait-Multimethod Matrix n limba englez.
57
corelaie din triunghiurile cu linie continu de pe diagonala mare. Cnd fiecare dintre aceste
teste este administrat a doua oar aceluiai grup de subieci i scorurile fiecrei perechi de
teste rezultate prin test-retest sunt corelate, rezult matricea multitrstur-multimetod care
devine o surs extrem de bogat de informaii, att pentru fidelitate, ct i pentru validitatea
convergent i divergent.

Metoda Trsturile Metoda 1 Metoda 2 Metoda 3
A1 B1 C1 A2 B2 C2 A3 B3 .C3

Metoda 1



Metoda 2



Metoda 3

A1
B1
C1

A2
B2
C2

A3
B3
C3

(.89)
.51 (.89)
.38 .37 (.76)

.57 .22 .09 (.93)
.22 .57 .10 .68 (.94)
.11 .11 .46 .59 .58 (.84)

.56 .22 .11 .67 .42 .33 (.94)
.23 .58 .12 .43 .66 .34 .67 (.92)
.11 .11 .45 .34 .32 .58 .58 .60 (.85)

Not: - literele A, B i C se refer la trsturi iar cifrele 1, 2, i 3 subscrise se refer la metode.
- matricile const din coeficieni de corelaie.
Surs: Gregory, R.J. (1996). Psychological Testing. History, Principles, and Applications.
Boston, London, Toronto, Sidney, Tokio, Singapore: Allyn and Bacon, p. 122.
Figura 7.1. Modul de raportare a validitii prin Matricea multimetod-multitrstur.

Orientarea n tabelul de mai sus se face astfel:
- coeficienii dintre paranteze de pe diagonala mare sunt coeficienii de fidelitate pentru
fiecare test n parte: cu ct este mai mare, cu att fidelitatea este mai bun, dei n realitate
ne mulumim cu r cuprini ntre 0,80 i 0,90;
- coeficienii boldai de pe cele trei diagonale mici reprezint dovezi ale validitii
convergente: aceeai trstur fiind msurat prin diferite metode, corelaia trebuie s fie
una pozitiv i puternic;
- n triunghiurile cu linie continu sunt incluse corelaiile dintre diferitele trsturi msurate
cu aceeai metod: acestea trebuie s aib valori medii sau ridicate;
- cele 6 triunghiuri din linii punctate includ corelaiile dintre diferitele trsturi msurate cu
diferite metode; acestea trebuind s fie ct mai mici n fiecare triunghi, deoarece ele sunt
dovezi importante despre validitatea discriminant (divergent).

58
Aceast metodologie este o contribuie important la nelegerea procesului de
validare, dar reclam un efort de cercetare uria. De aceea cei mai muli creatori de teste
prefer s culeag informaii separate, pe buci despre fidelitate i validitate, pe care s le
reuneasc ulterior ntr-un tabel compozit, dect o matrice care s le integreze din capul
locului pe toate deodat simultan.

7.1.3. Studiul trsturilor latente
Ne ateptm ca itemii care msoar un acelai construct sau caracteristic s fie
puternic corelai ntre ei, ceea ce ar putea primi o reprezentare grafic de tip scatter, care
evideniaz norul de puncte dintre o abscis i o ordonat reprezentnd cele dou variabile
intercorelate. Analiza factorial este o tehnic special care permite s se mearg mult mai
departe dect simpla inspecie vizual a matricilor de intercorelaii sau a norului de puncte.
Scopul metodei este acela de a determina numrul minim de determinani numii factori, dar
i trsturi latente, necesari explicrii intercorelaiilor din matricile respective.
Demersul tipic al analizei factoriale const din a administra o baterie de teste ctorva
sute de subieci i apoi de a calcula intercorelaiile dintre toate perechile posibile de teste,
ceea ce va produce o matrice de intercorelaii. Deoarece fiecare test nu este o trstur
independent (caz n care intercorelaiile din matrice ar tinde spre zero) i deoarece mai multe
teste msoar n diverse grade o aceeai trstur, formnd clusteri (ciorchini), analiza
factorial tinde s descopere un numr mai mic de factori dect numrul testelor intercorelate
i apoi s produc un tabel care s indice ncrctura (saturaia) fiecrei variabile n factorul
respectiv. Aceasta poate varia, ca orice coeficient de corelaie, ntre -1,00 i +1,00. Rezultatul
cel mai important al analizei factoriale este un tabel cu factorii i saturaia fiecrei variabile n
factorii respectivi, ceea ce ne ajut s descriem structura factorial i s producem astfel
dovezi despre validitatea de construct a unei baterii de teste sau de variabile reunite.
Creatorul analizei factoriale, Charles Spearman (1907) a dezvoltat o metod capabil
s pun n eviden existena unui factor general al inteligenei, prezent n orice tip de sarcin
mintal (i de aceea numit i factor g), n combinaii diferite cu un factor specific numit s.
Procedeul dezvoltat de el, numit metoda componentelor principale, i-a permis s produc
dovezi n favoarea ipotezei sale, numit modelul bifactorial al inteligenei.
n 1928, un creator american n domeniul analizei factoriale, Thurstone, a utilizat
aceeai metod ortogonal (dou axe aflate n unghi drept, adic independente ntre ele) dar
cu un mic amendament: n loc ca o ax s explice variana factorului major i cealalt
variana rezidual (variana rmas neexplicat de factorul major) el a propus rotirea celor
59
dou axe ortogonale pn la obinerea structurii celei mai simple, ameliornd astfel gradul de
adaptare al datelor la structura factorial. Metoda se mai numete i Varimax deoarece ea
caut ca pe fiecare dintre cele dou axe ortogonale variana explicat s fie una maximal.
Aceasta face ca fiecare factor s explice un grup de rezultate i doar att, cci cu aceast
metod nu mai poate fi identificat factorul general, ceea ce pune n discuie modelul propus
de Spearman pentru a defini inteligena uman.
Din punct de vedere matematic ambele metode sunt valide, dar fiecare are propriile
posibiliti i limite: una ajut la identificarea factorului general pe care cealalt l neag, dar
cealalt ajut la mai buna identificare, nelegere i numire a factorilor rezultai. De aceea
utilizarea lor este corelativ. Analiza factorial permite doar verificarea faptului dac datele
sunt consistente cu structura factorial postulat. Cnd datele sunt compatibile cu mai multe
structuri latente, analiza factorial nu ne poate ajuta s alegem una singur, aceast alegere
fundamentndu-se pe baza unei teorii prealabil elaborat. ntr-un demers de validare, analiza
factorial ne va aduce deci informaiile necesare, dar nu i suficiente lurii unei decizii.
Analiza factorial se sprijin pe dou postulate de baz:
- postulatul cauzalitii factoriale: variabilele observate sunt combinaii lineare de variabile
cauzale subiacente;
- postulatul parcimoniei: dintre dou soluii factoriale trebuie s o alegem pe cea mai
simpl. Dei larg acceptat de majoritatea cercettorilor, nu este posibil de demonstrat c
acest postulat este bine fundamentat i nici nu este valabil faptul c ntotdeauna structura
cea mai simpl s fie mai plauzibil dect cea mai complex.
Oricum, n funcie de tipul de analiz ales ajungem la soluii factoriale diferite, iar
soluia final pe care o alegem nu este una de natur matematic, ci de natur teoretic. n
plus, analiza factorial pune nu numai probleme de interpretere, ci i cteva importante
probleme metodologice, rezumate mai jos.
- Mrimea eantionului: cu ct eantionul pe care se face analiza factorial este mai mic,
cu att mai mult coeficienii de corelaie din matrice pierd din semnificaia statistic,
soluiile factoriale obinute trebuind examinate cu mai mult pruden. Dei nu poate fi
indicat o mrime ideal, cercettorii au czut de acord cu raportul de 5 la 1 ntre numrul
subiecilor din eantion i numrul variabilelor supuse factorizrii. Dar i acest lucru
trebuie luat cu rezerv, pentru c corelaiile mici (sub 0,30) pun n discuie nu mrimea
eentionului, ci chiar necesitatea desfurrii unei analize factoriale, dup cum corelaiile
mai mari de 0,50 se pot desfura cu rezultate bune i pe eantioane mai mici dect cele
60
ce ar rezulta din raportul 5/1. Deci, nainte de a efectua o analiz factorial, obligatoriu
vom inspecta cu atenie matricea de intercorelaii a variabilelor factorizate.
- Normalitatea multivariat: aceasta semnific faptul c toate variabilele i toate
combinaiile lor se distribuie normal. Cum nu putem testa toate combinaiile de variabile,
ceea ce ne rmne de fcut este faptul de a aprecia normalitatea fiecrei variabile n parte
din coeficientul de asimetrie i de boltire (skewness i kurtosis).
- Liniaritatea: relaia dintre variabile trebuie s fie liniar, n caz de curbiliniaritate
rezultatele analizei factoriale fiind de pus la ndoial. Liniaritatea dintre variabile se poate
verifica prin scatter-ul cu norul de puncte pentru fiecare combinaie de cte 2 variabile.

7.2. Validitatea diferenial
Validitatea unui test este determinat pe ansamblul populaiei pe care el a fost aplicat.
Aceasta ar putea s nsemne c c validitatea astfel determinat este una valabil pentru toi
subiecii acestei populaii, postulat care afost tot mai mult pus la ndoial dup anii 70. n
felul acesta s-a ajuns la concluzia c validitatea unui test poate varia nuntrul aceleiai
populaii prin faptul c unii subieci pot aprine unor subgrupuri speciale. De exeemplu,
validitatea determinat pentru un test de lectur poate fi diferit pentru stngaci, ca
subpopulaie a grupului total. Validitatea pentru un test de matematic poate fi afectat n
cazul unui grup special, care obine performane sistematic mai sczute, nu din cauza
capacitii de raionament mai sczut a membrilor acestui subgrup, ci ca urmare a faptului c
acetia au o tulburare specific de citit (dislexie) i neleg cu mai mare dificultatea enunurile
itemilor testului.
Aceste constatri conduc la lrgirea cadrului conceptual al validitii nu numai la
diferitele utilizri care se dau unui test, ci i pentru diferitele subgrupuri populaionale pe care
se aplic, n raport cu care el este mai mult sau mai puin valid. Pentru acest tip de validitate
termenul care s-a ncetenit este acela de validitate diferenial iar populaiile care se abat de
la regula general se cheam c sunt biasate (distorsionate).
Studiul acestei forme de validitate este i el foarte complex i rmne ca orice alt
form de validitate un demers doar parial mplinit, adic neterminat. Pentru orice utilizare
a unui test pe un grup nou trebuie s se aduc dovezi c el nu este unul biasat. Simpla
constatare a diferenei dintre dou grupuri nu nseman neaprat c unul dintre ele este
neaprat biasat. Performanele mai slabe la un test de vocabular ar putea avea ca explicaie i
oportunitile de nvare diferite pentru cele dou grupuri.
61
Testele ce ar putea pune n eviden diferenele dintre cele dou grupuri pot avea i o
utilitate social, pentru c pot pune n micare aciuni de remediere pentru a da membrilor
fiecrui grup anse egale. Ca i validitatea n general, cea diferenial se determin tot prin
trei procedee, ce au i acelai nume: validitatea de coninut, validitatea relativ la criteriu i
validitatea relativ la construct (sau conceptual). Pentru a nu ngusta prea mult problematica
validitii difereniale, nu vom intra n detalii cu prezentarea sa.

7.3. Teoria deciziei aplicat la testele psihologice, asociat validitii predictive
Muli psihologi susin c scopul testrii psihologice nu este msurarea n sine, ci
msurarea n serviciul lurii unei decizii optime. Astfel, managerul vrea s tie pe cine s
angajeze, examinatorul pe cine s admit iar psihiatrul pe cine s interneze. Testele
psihologice joac n mod frecvent un rol important n aceste tipuri de decizii instituionale.
Dei n luarea unei decizii adesea sunt luate n considerare mai multe puncte de separaie a
grupurilor, numite i puncte de tietur (cutoff), pentru a simplica lucrurile noi vom pleca de
la exemplul unui singur test. n realitate, scorurile la un test se dispun pe ceea ce n statistic
numim amplitudinea mprtierii (R = range). Cu toate acestea este posibil s identificm
punctul care desparte jumtatea creia i se prezice succes de cea creia i se prezice nereuit.
S presupunem de asemena c cei crora li s-a prezis succes au fost i selectai sau
angajai ntr-o oarecare proporie, ce poate varia de la 0 la 1, dup numrul de persoane
considerate a fi susceptibile s reueasc n funcie de criteriul de msur adoptat. Dac
procedm foarte reducionist, succesul poate fi mprit ntr-o variabil dihotomic
predicie succes versus predicie eec n timp ce criteriul prin care se va determina
succesul ulterior poate fi mprit la rndul su n a reuit i a avut eec. Aadar, orice
studiu de validitate predictiv poate produce o matrice cu dou intrri de tipul celei de mai
jos.
P
r
e
d
i
c

i
a

l
a

t
e
s
t

Performana la criteriu
A avut succes A avut eec

Va avea succes

Predicie corect

Fali pozitivi

Va avea eec

Fali negativi

Predicie corect
Figura 7.2. Rezultatele posibile ale unui test de selecie
utilizat pentru a preciza un criteriu-msur.
62

Dac un test a avut o bun validitate predictiv, atunci diagonala stnga-sus dreapta-jos se
maximizeaz: cele mai multe persoane crora li s-a prezis succes au i avut succes iar cele
mai multe persoane crora li s-a prezis eec au i euat, deci ambele predicii s-au adeverit.
Dar cum nici un test de selecie nu este un predictor perfect, sunt posibile i celelalte dou
situaii: s-a prezis succes unor persoane care au euat (falii pozitivi) ori s-a prezis eec i
acesta nu a avut loc (falii negativi). Ambele categorii de fali, pozitivi i negativi, sunt
considerate n egal msur eecuri ale prediciei, deoarece ambele au fcut predicii
inacurate. Se poate astfel calcula urmtoarea proporie:
Rata de reuit = reuite / (reuite + eecuri)
n lumea real fals-pozitivii i fals-negativii sunt evitai, dar nu pn la eliminare, pentru c
aceasta ar presupune un test care are o corelaie perfect (r = + 1,00) cu criteriul prezis. Cum
acest lucru nu este posibil, ceea ce rmne de fcut pentru a minimiza erorile de decizie este
dezvoltarea de teste cu o mare valoare predictiv.
n luarea deciziilor, adepii teoriei deciziei se sprijin pe dou asumpiuni:
- Dezvoltarea unei scale de utilitate, astfel nct indicatori importani ai instituiei s poat
fi exprimai n profituri sau pierderi. De exemplu, dac dup un chestionar de tipul EPI al
lui Eysenck, prin care se poate determina i introversia/extraversia, o companie poate
identifica pierderile asociate cu vnztorul de maini introvert, comparativ cu ctigurile
aduse de vnztorul extravert. Astfel, falii pozitivi sunt cei ce aduc pierderi instituiei
(vnd mai puine maini dect ar fi necesar pentru plata propriului salariu), ca i falii
negativi (cei care, dac ar fi fost ncadrai, ar fi contribuit la creterea profiturilor
companiei). Acesta este un exemplu de operaionalizare a testului i a seleciei pe o scal
de utilitate.
- n deciziile de selecie instituional strategia cea mai satisfctoare este aceea de a
maximiza ctigul scalei de utilitate i de a minimiza pierderile. Ea trebuie s rspund la
ntrebarea la ce proporie de selecie se produce cel mai mare ctig mediu al scalei?

Tabelele Taylor-Russell, publicate prima dat de aceti autori americani n 1939,
permit unui utilizator de teste s determine proporia expectat pentru aplicanii selectai dac
se specific trei elemente: 1. validitatea predictiv a testului, 2. rata (proporia) seleciilor i 3.
proporia bazal pentru aplicanii de succes.

63
Ce sunt aceste elemente?
- validitatea predictiv este determinat anterior prin studii i se exprim printr-o corelaie
de tipul r
xy
;
- proporia selecionailor este cea rezultat din numrul de alei supra numrul de
aplicani, nmulit cu 100;
- rata de baz este proporia celor ce ar fi fost selecionai prin metodele curente, fr
beneficiul adus de noul test. Cum acest lucru este mai greu de determinat, la extrem se
folosete pentru rata de baz proporia aplicanilor de succes, dac ei ar fi fost alei
aleator.
Cunoaterea celor trei factori de mai sus face posibil utilizarea unor tabele special
construite prin care se determin cu ct mbuntete noul test selecia, comparativ cu
metoda anterioar. Pe lng faptul c leag testul psihologic de aspecte economice foarte
pragmatice, determinnd efectiv valoarea practic a unui test, tabelele Taylor-Russell
evideniaz i aspecte care intrig, cum ar fi creteri substaniale ale acurateei seleciei, chiar
i la validiti foarte mici, n anumite condiii.

7.4. Precauii legate de evaluarea coeficienilor de validitate predictiv
Standards for Educational and Psychological Testing din SUA atrag atenia asupra
ctorva probleme importante i precauii legate de interpretarea coeficienilor de validitate:
- Cercetai schimbrile aprute n sensul cauzalitii test-criteriu: de regul presupunem
implicit c relaia dintre test i criteriu este nc n funciune atunci cnd aplicm noi
testul. De exemplu, testul s-a dovedit util n selecia de supraveghetori femini, ceea ce s-a
soldat cu succes ntr-o prim faz, cnd grupul era demixtat (numai femei), dar nu ia n
consideraie situaia actual n care grupul de munc este unul mixt.
- Ce nseman criteriul ales? Coeficientul de validitate contra criteriului obinut poate s nu
nsemne nimic dac criteriul nu este el nsui fidel i valid. A corela un test cu un altul
despre care nu tim prea multe lucruri sub aspectul validitii nu ne ajut prea mult n
determinarea validitii convergente a primului test.
- Luai ntotdeauna n consideraie populaia pe care s-a obinut o anume validitate: o
validitate ridicat pe o populaie de albi se pstreaz ea oare i pe o populaie de negri?
- Asigurai-v c mrimea eantionului populaional este suficient i adecvat: cu ct este
mai mare grupul iniial pe care s-a studiat validitatea, cu att mai bun este validitatea
ncruciat.
64
- Niciodat s nu confundai criteriul cu predictorul.
- Verificai spectrul de valabilitate att pentru predictor, ct i pentru criteriu: deoarece
corelaia depinde de mrimea variabilitii, ea este subestimat sever atunci cnd
predictorul sau criteriul au un spectru de variabilitate foarte ngust.
- Generalizai cu pruden o validitate gsit: cu alte cuvinte trebuie demonstrat c
validitatea descoperit ntr-un studiu nu este dependent de situaie.
- Luai n calcul i validitatea diferenial: relaiile descoperite pentru o populaie
demografic s-ar putea s nu fie deloc aceleai pentru toate subgrupurile care o compun.

7.5. Interpretarea coeficienilor de validitate
Pentru c strategiile de validare a unui test sunt att de diverse, nu exist o interpretare
uniform a acestora. n practic ntlnim destul de rar coeficieni mai mari de 0,60, cei mai
muli (considerai satisfctori sau chiar mari) oscilnd ntre 0,30 0,40.
Un coeficient de validitate este semnificativ statistic cnd ansele de a-l obine din
ntmplare sunt sub 5 procente. Pentru a fi mai specifici, vom arta c ptratul unui coeficient
de validitate (coeficientul de determinare) indic procentajul din variabilitatea criteriului pe
care ateptm s o tim n avans prin cunoaterea scorurilor la test. La o corelaie de 0,60
dintre o baterie de teste i media colar anual, vom ti c
2
60 , 0 = 0,36, adic 36% din
variabilitatea mediei colare depinde de inteligen, aa cum am msurat-o cu bateria noastr,
restul depinznd de alte cauze, printre care i de factorii de eroare.
Uneori o validitate de 0,30 ar putea nseamna economii de milioane de dolari n
orientarea i selecia profesional, alteori o validitate de 0,40 poate fi nesatisfctoare. Chiar
dac Ursula chiopu (1974) apreciaz c o validitate de peste 0,25 face ca testul s dea
predicii superioare oricrei sondri empirice, asociaiile profesionale ale psihologilor din
America au dat n 1985, prin Standards for Educational and Psychological Testing o list de
probleme ce pot aprea n interpretarea coeficienilor de validitate. Redm cteva din ele:
- Validitatea nu se msoar, ci se deduce. Dei autorul testului trebuie s dea mai muli
coeficieni de validitate, indicnd procedura urmat, utilizarea lui pe alte grupuri, sau n
alte scopuri, necesit studii de validare suplimentare. Aceasta deoarece validitatea testului
depinde simultan de scopul testrii i de populaia creia i se administreaz. Toate aceste
determinri ale validitii care vin din studii ulterioare, desfurate n scopuri specifice i
pe alte eantioane de populaie, vor fi considerate doar dovezi ale unui anumit tip de
validitate.
65
- Studierea validitii testelor angajeaz metode elaborate de analiz (analiza de itemi,
calculul corelaiei, analiza factorial, regresia simpl i multipl) care combinate, dau
strategii de validare mai bine definite. Utilizarea lor se face n funcie de scopul i de
exigenele beneficiarului.
- Strategiile de validare se aplic odat cu construirea testului i se repet de cte ori este
nevoie pentru a obine un test bun ca lungime, mod de aplicare, for discriminativ,
uurin n administrare, cotare i interpretare, care alturi de fidelitate i validitate, dau o
imagine mai adecvat despre valoarea sa.

Utilizarea testului impune procesul repetrii periodice a cercetrii validitii, ntruct
validarea unui test nu se ncheie niciodat, datele nou acumulate din diverse domenii
conducnd la ameliorarea i rafinarea sa, dar nu i la o soluie definitiv. Cu att mai mult se
pune problema relurii studiului validitii unui test cnd i se schimb formatul (prin
aplicarea pe calculator, de exemplu), coninutul, instructajul sau modul de cotare.



















66
CAPITOLUL 8

ANALIZA DE ITEMI


8.1. Precizri terminologice
ntr-o manier similar cu cea din fizic, n care interesul iniial pentru lumea
macroscopic s-a recentrat pe cea microscopic, atomic i subatomic, n psihodiagnostic
aceast schimbare se manifest prin mutarea centrului de greutate al preocuprilor de analiz
de pe testul psihologic ca unitate de baz, pe analiza de itemi, adic pe cele mai mici uniti
care compun un test i care pot fi analizate independent. Fundamentarea msurrii n
psihologie se face prin psihometrie iar unitatea fundamental a acesteia a devenit itemul.
Evoluia i rafinarea domeniului testelor este astzi tot mai dependent de analiza de itemi,
pentru c pentru a-i cita pe Laveault i Grgoire analiza de itemi seamn cu repetiia
unei orchestre. ntr-o orchestr instrumentele trebuie s cnte ntr-o manier armonioas.
5

O defiiniie mai larg a itemilor este aceea c ei reprezint orice tip de enun din
alctuirea unui test obiectiv care urmeaz a fi cotat ca o valoare.
6
Elementul fundamental al
acestei definiii este partea care stipuleaz c itemul va fi cotat ca o valoare cifric, permind
deci determinri cantitative ale unor caracteristici ale sale, dar acest lucru nu este specific
doar testelor obiective, ci oricrui tip de test, inclusiv celor educaionale. Merit subliniat i
precizarea lui Stan (2002): itemul este componenta informaional a unui test care se
ntlnete la chestionarul de personalitate, la testele de cunotine colare, la testele verbale i
neverbale de inteligen. Nu trebuie deci confundate noiunile de sarcin a testului cu cea de
item al testului, deosebirea fundamental fiind aceea c itemul are autonomie
informaional care permite efectuarea unor prelucrri statistice proprii asupra rezultatelor
sale, ceea ce permite evidenierea altor indicatori.
7
Individualitatea sau autonomia
funcional a unui test este acea caracteristic a sa de a contribui la scorul total al testului i
de a produce rezultate care pot fi prelucrate independent sau intercorelate cu rezultatul final la
test. De aceea cea mai bun definiie a itemului este cea potrivit creia acesta reprezint cea
mai mic unitate informaional a unui test care poate fi analizat independent.

5
Laveault, D., Grgoire, J. (2002). Itroduction aux thoriex des tests en Psychologie et en scieces de
l'ducation. 2
eme
edition. Bruxelles: ditions De Boeck Universit, p. 199.
6
Biceanu, L. (2004). Dicionar ilustrat de psihologie englez romn. Bucureti: Editura tehnic, p. 191.
7
Stan, A. (2002). Testul psihologic. Evoluie, construcie, aplicaii. Iai: Editura Polirom, p. 259.
67
La modul foarte general, analiza de itemi a unui test sau chestionar are scopul de
evalua fidelitatea i validitatea fiecrei uniti componente, pentru a surprinde n termeni
cantitativi ct de efectiv contribuie fiecare item la fidelitatea i validitatea de ansamblu a
testului sau chestionarului respectiv.
8
n sens foarte strict, analiza de itemi nu se va confunda
cu analiza itemului, deoarece scopurile lor sunt distincte. Analiza de itemi vizeaz
evidenierea dificultii itemilor, a puterii lor discriminative, a calitilor psihometrice de tipul
fidelitii i al validitii, dar i al altor caracteristici ca simetria i boltirea (excesul),
omogenitatea i specificitatea sa ori raportul item-distractor. Analiza itemului se refer mai
ales la procedurile corecte de prelucrare informaional, la procedurile semantice de
formulare sau de modificare a coninutului itemilor, la limita de timp necesar rezolvrii sale,
la ambiguitatea formulrii.
Analiza de itemi este greu de desfurat pentru testele de vitez sau pentru cele n care
factorul rapiditate intervine masiv, cum ar fi testele de atenie, testele de performan cu
limit de timp, i aceasta deoarece o condiie a analizei de itemi este parcurgerea integral a
tuturor itemilor testului, de ctre toi subiecii, fr de care indicele de dificultate nu poate fi
determinat. Dei aceast condiie nu este formulat explicit la testele de putere, n care
factorul timp conteaz, problema se poate rezolva dndu-se testul spre rezolvare n limita de
timp prevzut, cnd itemii se rezolv n ordine, se marcheaz ultimul item pasat la expirarea
timpului, dup care testul se continu pn la rezolvarea sa n ntregime de ctre toi subiecii.
Dificultatea major a anlizei de itemi este aceea c exist o legtur evident ntre
caracteristicile testului i ale itemilor si i caracteristicile eantioanelor care sunt msurate cu
ajutorul acestuia. Noua direcie n psihometria modern aspir la degajarea parametrilor
testului de caracteristicile eantioanelor cercetate, dar aceasta complic destul de mult datele
problemei. n cazul n care analiza se face plecnd de la un singur eantion, acesta ar trebui s
aib ntr-o ct mai mare msur caracteristica de a fi reprezentativ, pentru a putea extrapola
caracteristicile degajate de pe acest eantion pe alte grupuri sau subgrupuri populaionale pe
care urmeaz a fi aplicat.
Analiza de itemi este o operaie de neevitat n construcia unui bun test sau chestionar,
fie pentru a genera uniti de msur valide ale unui singur construct (unidimensionalitatea
scalei de msur), fie pentru a selecta itemii care au cele mai bune combinaii dintre
dificultate for de discriminare i omogenitate specificitate. Aceasta este raiunea pentru
care analiza de itemi pleac de la un set iniial mai mare de itemi (cu pn la o treime sau

8
Reber, A.S. (1985). Dictionary of Psychology. London, New York etc.: Penguin Books, p. 378.
68
chiar dublu), din care vor rmnea cei care corespund cel mai bine exigenelor de construcie
a unui test modern. Numrul minim de itemi care vor rmnea n urma acestei selecii este de
10, sub care nici o scal nu mai discrimineaz suficient de nuanat ntre diverse subcategorii,
fiecare item avnd o pondere mult prea mare n scorul final. De regul, scalele
unidimensionale rein ntre 20 i 30 de itemi pentru a mpca criteriul economiei cu cel al
sensibilitii i al forei de discriminare a testului.
Elementul tehnic necesar pentru analiza caracteristicilor de dificultate i
discriminabilitate ale itemilor este matricea lui Stern
9
care plaseaz pe fiecare coloan itemii
ce vor fi supui analizei i pe fiecare linie cte un subiect, ultimele linii i coloane fiind
necesare sumarizrii rezultatelor i calculrii unor indici. Analiza de pe coloan se numete
ipsatizare (rezultatele tuturor subiecilor la un anumit item), iar cea de pe linie obiectivare
(rezultatele unui singur subiect la toi itemii). mprirea scorului total pentru toi subiecii la
numrul acestora d o medie pe subiect, iar mprirea scorului total pentru fiecare item la
numrul de subieci d o medie a reuitelor. n concluzie, se poate determina o medie pentru
fiecare subiect, o medie pentru fiecare item i o medie pentru testul total, care este de fapt o
sum a mediilor tuturor itemilor.


8.2. Dificultatea itemilor
n cazul itemilor dihotomici adic scorai cu 0 i 1 dificultatea unui item este dat
de proporia celor care au reuit rezolvarea sa. Indicele de dificultate poate lua valori cuprinse
ntre 0 i 1, n prima situaie itemul fiind foarte greu (majoritatea, sau chiar toi subiecii nu l-
au putut rezolva), n a doua situaie el fiind foarte uor (majoritatea sau aproape toi subiecii
l-au rezolvat). Dac itemul a fost cotat pe o scal de mai multe puncte (polihotomic),
indicele de dificultate se afl dup formula:
p =
n
x


n care x este suma scorurilor obinute fiecare subiect iar n este scorul maxim. Pentru a avea
o imagine mai clar asupra dificultii itemului, prin comparaie cu un alt indicator care este
media itemului, dm tabelul de mai jos, n care sunt calculate mediile i dificultile a 3 itemi
scorai pe o scal de 5, 3 i 1 punct.

9
William Stern, 1912.
69
Aa cum se observ din exemplul de mai jos, media itemului nu permite comparaia
direct a itemilor, deoarece numai pentru scala dihotomic cei doi indici - media i procentul
de reuit - coincid. Pentru a fi direct comparabile, rezultatele trebuie aduse la acelai tip de
scal, prin mprirea mediei la valoarea maxim a fiecrei scale i n felul acestea ele vor
indica n acelai fel dificultatea itemilor, ca i cnd toi itemii ar fi scorai dihotomic.

Subiect Itemi
Item (/5) Item (/3) Item (/1) Total (/8)
1 4 3 1 8
2 5 2 0 7
3 1 0 0 1
4 3 1 1 5
5 4 2 1 7
6 2 1 1 4
7 2 3 0 5
8 0 3 1 4
9 5 2 1 8
10 1 1 1 3
11 3 1 0 4
12 3 2 1 6
Media (x/n) 33/12 = 2,75 21/12 = 1,75 8/12 = 0,67 62/12 = 5,17
Dificultatea p 2,75/5 = 0,55 1,75/3 = 0,58 0,67/1 = 0,67 5,17/9 = 0,57
Complement q (1-p) 1-0,55 = 0,45 1-0,58 = 0,42 1-0,67 = 0,33 1-0,65 = 0,43
Corecie p' 0,44 0,37 0,34 -
Figura 8.1. Mediile i indicii de dificultate pentru 3 itemi
scorai pe o scal de 5, 3 i 1 punct.

n exemplul de mai sus valoarea medie a dificultii celor 3 itemi este de 0,57, dar
observm c itemul cel mai dificil este pe scala de 5 puncte (p = 0,55), apoi cel pe scala de 3
puncte (p = 0,58), cel mai uor fiind cel de pe scala dihotomic (p = 0,67). Dificultatea medie
a itemilor sumarizai pe ultima coloan este de 0,57, valoare care poate fi considerat media
itemilor ntregului test, care se poate obine fie mprind media de 5,17 la 5+3+1 = 9, fie
fcnd o medie a dificultii celor 3 itemi (0,55+0,58+0,67)/3 = 0,60.
Aa cum reiese din cele artate anterior, itemul care se apropie ca proporie p de
rezolvare de valoarea 1 este unul extrem de uor, deoarece majoritatea sau chiar toi subiecii
l rezolv, pe cnd itemul al crui p care se apropioe 0 este unul extrem de greu, fiind rezolvat
de extrem de puini subieci, poate de niciunul. Dificultatea medie a unui item este de 0,50, de
regul itemii aflai spre valori p extreme 0 i 1 se recomand s fie nlocuii, ei aducnd
puine servicii psihodiagnostice testului, pentru a se reine prioritar itemii de dificultate medie
(p = 0,40 0,60). n scopul de a da o gradaie mai fin scalei, limitele de acceptabilitate ale
dificultii itemilor se plaseat de fapt ntre 0,20 i 0,80.
70
Cunoaterea dificultii itemilor este important din mai multe motive:
- permite eliminarea itemilor mult prea uori ori mult prea dificili;
- permite selecia i organizarea itemilor pe scale ierarhice de dificultate, de la uor la greu,
acestea dnd gradaii cu att mai fine cu ct numrul itemilor este mai mare i diferenele
de dificultate dintre itemii progresivi sunt mai mici, p acoperind ns spectrul de la 0,20 la
0,80, sau chiar depind-o dac se impune;
- permite crearea de seturi mari de itemi, cunoaterea caracteristicilor privitoare la
dificultate i la indicele de discriminare, ca i curba caracteristic a fiecrui item dnd
posibilitatea de a fi asamblai automat n examenul adaptat computerizat.
De notat c decizia de a elimina un item se poate lua mai uor sau mai greu, deoarece
acelai item care la o categorie superioar de vrst este prea uor devine greu sau foarte greu
la o categorie mai mic de vrst, itemul cptnd valene diagnostice noi funcie de
particularitile eantionului pe care se face analiza de itemi. Mai mult, un item foarte uor,
chiar dac nu are caliti psihometrice, d ncredere n sine subiectului i l ajut s intre n
examen cu o reuit, ridicndu-i motivaia pentru testare, pe cnd un item foarte greu poate
distinge spre extrema excepionalitii. Aadar pstrarea sau respingerea unor itemi se face n
funcie de utilitatea care se va da testului respectiv. Mai mult, problema dificultii itemilor
este important n mod special la testele de randament sau la cele educaionale (de cunotine
i de achiziii), pe cnd la testele de personalitate indicele de dificultate va fi nlocuit cu un
indice de proeminen
10
, capabil s evidenieze msura n care un item reliefeaz un anumit
comportament rezultat din operaionalizarea unei trsturi de personalitate.
Dintre factorii care pot afecta indicele de dificultate al unui test, Laveault i Grgoire
enumer numrul de rspunsuri omise ca urmare a existenei unei limite de timp i
probabilitatea reuitei prin ans/hazard. n prima situaie, din cauza presiunilor legate de
timp, un mare numr de persoane nu au putut rezolva rezolva un item amplasat de regul spre
zona final a testului (atunci cnd itemii au fost asamblai ierarhic), indicele de dificultate ne
mai reflectnd acurat dificultatea itemului respectiv, pentru c dac ar fi existat mai mult
timp, cu siguran c el ar fi fost rezolvat de mai muli subieci. n acest caz indicele de
dificultate msoar de fapt dou lucruri distincte, dificultatea itemului n cauz i rapiditatea
respondentului, caracteristici care nu ntotdeauna se gsesc reunite la acelai subiect.
Atunci cnd dificultatea se calculeaz pentru itemi la care alegerea rspunsului se face
dintre mai multe posibiliti trebuie s se in cont de probabilitatea alegerii rspunsului bun

10
Stan, op. cit., p. 2007.
71
prin ans sau hazard, care este cu att mai mare cu ct numrul variantelor de rspuns este
mai mic. Astfel, la o variant corect din 8, rspunsul bun prin ans are probabilitatea de 12
procente, la 1 din 6 de 17 procente, la 1 din 4 de 25 de procente i la 1 din 2 de 50 de
procente. n scopul de a corija indicele de dificultate, atunci cnd distractorii au anse
apropiate de a fi alei, Laveault i Grgoirea propun urmtoarea formul de corecie:
(

=
1
1
'
M
p
p p
n care p este indicele de dificultate iniial, p' este cel corijat, iar M este numrul variantelor
de rspuns pentru itemul n cauz. Introducnd n formula de mai sus datele pentru primul
item din exemplul de la figura 8.1, p' = 0,55 - [(1 0,55)/(5 -1)] i p' = 0,44. Pentru al doilea
item, cotat pe o scal de 3 posibiliti, p' devine 0,37 iar pentru itemul dihotomic corecia
ajunge la 0,34. Comparnd indicile de dificultate iniial cu cel corijat se observ uor c
corecia este cu att mai puternic cu ct numrul variantelor de rspuns este mai mic. Se
degaj de asemenea concluzia c atunci cnd avem de comparat mai muli itemi, exprimai pe
scale diferite ca numr de variante de rspuns, aducerea lor la formatul unic al unei scale
dihotomice este o condiie necesar, dar nu i suficient, cci pentru a avea o baz de
comparaie comun trebuie s operm corecia necesar prin formula de mai sus.
Cteva caracteristici importante ale itemului se determin plecnd de la constatarea c
exist o legtur strns ntre dificultatea sa i simetria distribuiei sale. Astfel, itemii a cror
dificultate este n jurul mediei (p = 0,50) sunt simetrici iar cei cu dificulti extreme sunt
asimetrici, dar n mod difereniat: cei cu dificultate foarte mare (p < 0,10) au o asimetrie
puternic pozitiv, pe cnd cei cu dificultatea foarte mic (p > 0,90) au o asimetrie puternic
negativ. De aceea este mai grav situaia unui item uor, euat, dect a unuia greu, euat, pe
care oricum l rezolv puini subieci. De aici concluzia c itemii uori sunt discriminativi
pentru subiecii slabi sau pentru vrstele mici, pe cnd cei dificili sunt discriminativi pentru
subiecii foarte dotai i/sau pentru vrstele mai mari, la testele care evideniaz o ierarhie sau
care au un indice genetic puternic (creterea performanei paralel cu vrsta pn la un punct).
De aici i rolurile diferite alocate itemilor n funcie de dificultatea lor, cei mai utili fiind cei
de dificultate medie, care difereniaz subiecii ntre ei indiferent de scorul obinut, fiind utili
i pentru discriminarea subiecilor buni i a celor slabi.

Un concept important, derivat din cele artate mai sus, este acela de varian a
itemului, care ne informeaz n legtur cu gradul de mprtiere al performanei la acel item
n jurul unei medii, fiind n acelai timp i un indicator mai grosier al puterii de discriminare a
72
itemului. Pentru itemii cu mai multe valori de rspuns (polihotomici), variana se determina
prin metoda clasic, dar pentru o scal dihotomic exist o formul mult mai simpl pentru a
o determina:
s
2
= pq
n care s
2
este variana itemului, p este indicele de dificultate iar q complementul su (1 - p).
Pentru a avea o reprezentare mai clar asupra acestei probleme prezentm mai jos o situaie
ipotetic, constnd din 11 itemi propui spre rezolvare la 10 subieci.


Subieci
I T E M I
Total 1 2 3 4 5 6 7 8 9 10 11
1 1 1 1 1 1 1 1 1 1 1 0 10
2 1 1 1 1 1 1 1 1 1 0 0 9
3 1 1 1 1 1 1 1 1 0 0 0 8
4 1 1 1 1 1 1 1 0 0 0 0 7
5 1 1 1 1 1 1 0 0 0 0 0 6
6 1 1 1 1 1 0 0 0 0 0 0 5
7 1 1 1 1 0 0 0 0 0 0 0 4
8 1 1 1 0 0 0 0 0 0 0 0 3
9 1 1 0 0 0 0 0 0 0 0 0 2
10 1 0 0 0 0 0 0 0 0 0 0 1
p 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 x=5,50
q 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 =2,87
pq 0,00 0,09 0,18 0,21 0,24 0,25 0,24 0,21 0,16 0,09 0,00 x=55
pq 0,00 + 0,09 + 0,16 + 0,24 + 0,25 + 0,24 + 0,21 + 0,16 + 0,09 + 0,00 = 1,65 x
2
=385
Figura 8.2. Evoluia varianei itemilor n funcie de indicele de dificultate p.

Din tabelul de mai sus se poate observa faptul c cea mai mare varian o au itemii
din zona central a indicelui de dificultate (la p = 0,5 s
2
= 0,25) i, pe msur ce ne deprtm
simetric spre zonele extreme, variana itemilor descrete de asemenea simetric, de la 0,21 la
0,18, apoi la 0,09 i 0. Aceata este nc un argument matematic puternic pentru a selecta n
test itemii din zona central a dificultii, pentru c acetia au fora discriminativ cea mai
mare, i spre subiecii slabi, i spre cei buni. Itemii cu varian mic au funcii speciale, fiind
destinai fie discriminrii subiecilor slabi (p > 0,90), fie celor buni (p < 0,10), dar chiar i n
cadrul acestor categorii speciale fora lor de discriminare este mai sczut din cauza varianei
lor mai mici. Pe de alt parte, din figura de mai sus se observ c variana total a testului
(2,87
2
= 8,25) nu este egal cu suma varianelor fiecrui item n parte (pq = 1,65).
11




11
n mod explicit, variana unui test este egal cu suma varianelor fiecrui item, la care se adaug dublul sumei
valorilor fiecrei covariane posibile n ansamblul itemilor componeni. Vezi Stan, op. cit., p. 216.
73
Pornind de la datele de mai sus pot fi calculai doi indicatori care regsesc la nivel de
item caracteristicile de ansamblu ale formei distribuiei testului, i anume simetria (skewness)
i excesul sau boltirea (kurtosis), dup formulele:
simetria =
pq
p q
=
3
o , n care
3
este asimetria itemului;
boltirea = 6
1
4
=
pq
o , ecuaie a crei valoare normal este 3.

Subieci
I T E M I
Total 1 2 3 4 5 6 7 8 9 10 11
p 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 n = 10
q 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 x =5,50
pq 0,00 0,09 0,18 0,21 0,24 0,25 0,24 0,21 0,16 0,09 0,00 =2,87

3
- 2,67 1,50 0,87 0,41 0 -0,41 -0,87 -1,50 -2,67 - x=55

4
- 5,11 0,25 -1,23 -1,83 -2 -1,83 -1,23 0,25 5,11 x
2
=385
Figura 8.3. Indicatori ai simetriei i ai boltirii pentru tabelul precedent.

Tabelul de mai sus evideniaz foarte clar faptul c valorile lui p cuprinse ntre 0,70 i
0,30 dau distribuii relativ simetrice i c asimetria este cu att mai accentuat cu ct ne
deprtm mai mult spre extreme: pentru valori ale lui p > 0,80 asimetria este puternic pozitiv
iar pentru p < 0,20 aceasta este puternic negativ. Acesta poate fi i motivul pentru care
Guthke, Btcher i Spring (1991, p. 230) fixeaz limitele inferioar i superioar pentru
selecia itemilor unui test de randament la p = 0, 20, respectiv p = 0,80.
Rspunsul la ntrebarea ct de dificili trebuie s fie itemii unui test? depinde, pe de
o parte, de utilizarea testului, pe de alt parte de tipurile de rspunsuri sau de lungimea scalei.
Aa cum am mai artat i anterior, un test n care itemii se scoreaz adevrat-fals (sau 0 1)
d o probabilitate de 50% ca rspunsul s se dea prin ans (aleator), iar cnd variantele de
rspuns sunt 4, aceast probabilitate este de 25%. Deci probabilitatea
i
p , care descrie
dificultatea unui item, se plaseaz ntre 0 i 1 (nici un subiect, respectiv toi subiecii l
rezolv). n practic, dificultatea optim a unui item se calculeaz n doi timpi:
1. Se calculeaz jumtatea diferenei dintre 100% succes i ansa de performan. Pentru un
test cu 4 posibiliti de rspuns, probabilitatea unui rspuns corect prin ans (ntmplare)
este de 25%, deci:
375 , 0
2
75 , 0
2
25 , 0 00 , 1
= =


2. Se adaug la valoarea gsit probabilitatea rspunsului prin ans:
0,375 + 0,25 = 0,625 (dificultatea optim).
74
Iat cteva exemple:
- Test cu dou variante de rspuns: p
s
= 0,50 + (1 - 0,50)/2 = 0,750
- Test cu patru variante de rspuns: p
s
= 0,25 + (1 - 0,25)/2 = 0,625
- Test cu ase variante de rspuna: p
s
= 0,167 + (1- 0,167)/2 = 0,584
- Test cu opt variante de rspuns: p
s
= 0,125 + (1 0,125)/2 = 0,563
- Test cu zece variante de rspuns: p
s
= 0,10 + (1 -0,10)/2 = 0,550.
Alegerea dificultii optime a unui test trebuie s rezolve aceast problem
complicat: cu ct itemii au mai puine variante de rspuns, cu att mai mare este
probabilitatea de a nimeri prin ans rspunsul corect, ceea ce oblig la creterea dificultii
optime la un nivel foarte ridicat, de 0,75. Aceasta coboar progresiv cu mrirea numrului de
variante de rspuns spre 0,50, dar cu ct acestea sunt mai multe, timpul de analiz pentru
fiecare item crete (sunt mai multe variante de luat n considerare), ceea ce oblig la
reducerea numrului de itemi. Aceast reducere afecteaz simultan fidelitatea i validitatea
testului n ansamblul su, ajungnd astfel la alternativa variante mai multe de rspuns versus
mai muli itemi. Dilema se rezolv alegnd ntre 4 i 8 variante de rspuns, aceasta fiind o
zon de echilibru ntre cele dou extreme.

n rezumat, precizm nc o dat c pentru majoritatea testelor nu este deloc indicat s
avem itemi de dificultate egal (eventual cu dificultatea optim), pentru c urmrim s avem
itemi pentru o varietate a nivelurilor de dificultate, astfel nct testul s aib o bun putere
discriminativ n ansamblul su. Pentru cele mai multe dintre teste itemii au o dificultate ce
acoper spectrul de la 0,20 la 0,80, pentru a maximiza astfel diferenele dintre subieci. n
funcie de scopul testrii, pot fi concentrai itemi preponderent dificili (sub 0,20), ca n cazul
seleciei unor candidai pentru o facultate, post sau meserie foarte pretenioas, sau itemi
foarte uori (selecie indulgent).
Pe de alt parte, cunoaterea dificultii itemilor este fundamental n aranjarea lor n
test ntr-o ordine ierarhic. Itemii foarte uori, de la nceputul testului, ajut persoana s
neleag ce se cere de la ea i, chiar dac ei nu au valoare psihometric probat, ajut la
ridicarea moralului, inspirnd ncrederea n resursele proprii. Itemii foarte dificili sunt
destinai extremei drepte a scalei, deci supradotailor sau celor de vrste mari, avnd utilitate
pentru un numr mai mic de cazuri, ce apar doar pe eantioane extinse ca volum.


75
8.3. Discriminabilitatea itemului
Dei fora de discriminare a unui item poate fi evaluat grosier i dup variana sa,
ntr-un mod mult mai specific discriminarea itemului leag destinul su de destinul de
ansamblu al testului din care el face parte. Astfel, se consider c un item este discriminativ
atunci cnd exist un bun paralelism ntre scorurile la test n ansamblul su i scorul la itemul
n cauz. Aceasta nseamn c scorurile mari la test se asociaz cu o rat de reuit ridicat
pentru itemul respectiv, dup cum scorurile sczute la test se asociaz cu un nivel sczut de
reuit la acest item.
Exist mai multe metode de a studia dac destinul itemului este solidar cu cel al
testului n ansamblul su. Indicele de discriminare, pus n circulaie de W.G. Findley n 1956,
se mai cheam i metoda grupurilor de contrast sau a grupurilor extreme. Acesta este probabil
i motivul pentru care metoda s-a bucurat de o mare popularitate printre psihometricieni, dar
este i motivul pentru care ea este astzi criticat, cci uurina analizei se sprijin pe faptul
c las pe dinafar aproape jumtate dintre subieci (46%). Metoda propune pentru
comparaia itemilor unui test dou grupuri aflate la extremele seriei de variaie a scorurilor,
27%
12
din cei care au dat rspunsurile cele mai bune la test fiind comparai cu ceilali 27%
care au dat cele mai slabe rspunsuri, pentru a determina pentru fiecare item n parte dac
reuita se asociaz cu apartenena la grupul superior. Dac vom nota cu p
s
indicele de
dificultate pentru grupul superior i cu p
i
pe cel pentru grupul inferior, formula indicelui de
discriminare va fi:
D = p
s
- p
i

Concret, indicele de discriminare se calculeaz astfel:
1. dup scorurile la test se determin grupul superior, grupul inferior i cel neutru;
2. se caut proporia n care subiecii din grupul superior i din cel inferior au rspuns corect
la fiecare item;
3. pentru fiecare item se scade proporia rspunsurilor corecte ale grupului slab din proporia
rspunsurilor corecte ale grupului bun, ceea ce d indicele de discriminabilitate, a crui
valoare poate varia ntre -1 i +1.
Valoarea 0 semnific egalitatea rezolvrii de ctre cele dou grupuri i deci absena
discriminrii; valorile pozitive indic preponderena rezolvrii itemului de ctre grupul
superior, iar cele negative de ctre grupul inferior i de aceea el trebuie eliminat fr discuie,

12
Proporia respectiv a fost propus de Kelley n 1939.
76
cci n acest caz destinul itemului nu este solidar cu al testului din care el face parte. Se
apreciaz c valorile lui D ntre:
0,00 - 0,10 indic absena discriminrii;
0,11 - 0,19 valoare de limit a discriminrii;
0,20 - 0,29 valoare sczut a discriminrii;
0,30 - 0,39 valoare bun a discriminrii;
0,40 item cu o foarte bun putere discriminativ.
Metoda presupune cel puin 30 de subieci n grup, pentru a nu avea mai puin de 8 subieci n
grupurile de contrast.
Utilitatea i popularitatea indicelui D provine i din uurina cu care el poate fi
determinat manual, nelund n calcul dect ceva mai mult de jumtate dintre subieci. Mai
mult, n pofida acestui fapt, el d rezultate ntru totul comparabile cu metode de lucru mai
rafinate, cum ar fi cele corelaionale. De aceea n opinia lui Laveault i Grgoire el poate fi
folosit mai ales pentru testele educaionale, cu condiia ca nunrul itemilor i al subiecilor s
fie suficient de mare (peste 30) cci, n caz contrar, valoarea acestui item este artificial
umflat, fiecare item acoperind o proporie prea mare din variana total. Autorii citai aduc i
un alt punct de vedere interesant: n testele educaionale indicele D poate servi nu numai la
selecia celor mai discriminativi itemi, pentru a construi o scal puternic, ci i ca metod de
analiz a distractorilor i a erorilor. Pentru acetia, indicele de discriminare trebuie s aib o
valoare negativ, dar el va fi informativ i n legtur cu faptul dac cheia rspunsurilor nu
este eronat sau dac rspunsul ales de grupul superior nu este realmente acceptabil. Dac nu,
se va putea cerceta motivul pentru care rspunsul a prut a fi acceptabil n mare msur
pentru grupul superior. Dup corectarea lucrrilor, chestionarea elevilor poate clarifica
problema n cauz, iar rezolvarea ei duce la ameliorarea structurii itemului i implicit a
instrumentului.

8.4. Raportul dintre dificultatea i discriminabilitatea itemului
Determinarea indicilor de dificultate i de discriminabuilitate a itemului nu creeaz
probleme tehnice insurmontabile, deoarece acestea au un algoritm de lucru foarte clar.
Exceptnd problema eantionrii, aceti indici sunt dependeni n mare msur de populaiile
din care au fost obinui. Problema cu adevrat important i destul de complex este selecia
itemilor celor mai buni dintr-un test innd cont corelativ i simultan de ambele condiii
(dificultate i discriminabilitate). Aceasta deoarece att indicele D, ct i valorile
77
corelaionale ce vor fi prezentate ulterior, sunt influenate de dificultatea itemului, care devine
astfel condiia bazal pentru selecie, fiind de aceea pus pe abscis.
Situaia paradoxal a constructorului unui test de randament sau de cunotine este
aceea c el trebuie s opereze n zona de aciune a dou condiii care par reciproc exclusive:
pe de o parte selecia de itemi ce difereniaz bine ntre subieci (i aceasta presupune ca
dificultatea lor s fie centrat pe 0,50), iar pe de alt parte el nu ar renuna nici la itemii mai
uori (deoarece favorizeaz intrarea n prob i discrimineaz n zona performanelor slabe) i
nici la cei mai grei (discrimineaz supradotarea i excelena). n aceste cazuri speciale, itemii
prea uori sau prea grei trebuie judecai cu atenie din perspectiva rolului jucat de ei n raport
cu scopul evalurii. Analiza de itemi poate s ajute la punerea de ntrebri pertinente n
legtur cu rolul jucat de fiecare item, ca i asupra mijloacelor celor mai bune de a ameliora
calitatea unui instrument de msur, apreciaz Laveault i Grgoire
13
.
Metoda simpl a lui Findley a fost operaionalizat de Ebel, care a oferit o modalitate
practic de interpretare simultan a dificultii i forei de discriminare a itemilor, metod ce
a devenit extrem de popular datorit utilizrii sale extensive i ndelungate. Chiar dac las
aproape jumtate din cazuri n afara analizei, utilizarea ei actual este nc foarte mare, mai
ales n domeniul testelor educaionale. n favoarea sa pledeaz nu numai uurina aplicrii, ci
i elegana soluiilor difereniate pentru diversele combinaii ale dificultii i
discriminabilitii itemilor.
Pentru a exemplifica toate acestea, furnizm mai jos un exemplu ipotetic care ne va
ajuta s nelegem modul n care opereaz selecia celor mai buni itemi dintr-o scal.

Item 1 2 3 4 5 6 7 8 9 10
1 1 1 1 0 1 0 1 0 1 0
2 1 1 1 1 0 0 1 1 0 0
3 1 0 1 1 1 0 1 0 1 1
4 0 0 0 0 1 0 1 0 1 1
5 1 1 1 0 1 0 1 0 1 1
6 1 1 1 1 1 1 1 1 0 1
7 1 1 1 0 1 0 1 0 1 1
8 1 1 1 0 1 0 0 0 1 0
9 1 0 0 1 1 0 1 0 1 1
10 1 0 1 1 1 0 1 1 1 0
11 0 0 1 1 1 0 1 0 1 0
...
29 1 1 1 1 0 1 0 0 0 0
30 0 0 0 1 1 1 1 1 1 1
31 0 0 0 0 0 1 1 1 0 0

13
Idem, p. 216.
78
32 1 0 1 1 0 1 1 0 0 1
33 0 1 0 1 1 1 0 1 0 0
34 1 1 0 1 0 1 1 0 0 1
35 0 1 1 0 0 1 1 1 0 0
36 0 0 0 0 0 1 1 1 1 0
37 1 0 1 1 0 1 1 1 0 1
38 1 0 0 0 0 1 1 0 0 0
39 1 1 1 1 1 1 1 1 0 0
15 11 14 12 12 12 19 10 11 10
p 0,8 0,1 0,2 0,4 0,5 0,5 0,9 0,3 0,4 0,6
p
s
0,8 0,5 0,8 0,5 0,9 0,1 0,9 0,3 0,8 0,5
p
i
0,5 0,5 0,5 0,6 0,3 1,0 0,8 0,6 0,1 0,4
=(p
s
- p
i
) 0,3 0 0,3 0,1 0,6 -0,9 0,1 -0,3 0,7 0,1
Figura 8.4. Analiza capacitii de discriminare pentru 10 itemi ipotetici dup metoda lui Findley.
p = d i f i c u l t a t e a i t e m i l o r
Decizia Grup puternic Grup slab



=


c
a
p
a
c
i
t
a
t
e
a

d
i
s
c
r
i
m
i
n
a
t
i
v


a

i
t
e
m
i
l
o
r

1,0


Acceptarea
itemilor
0,9
0,8
0,7 9
0,6 5
0,5
0,4
0,3 3 1
0,2 Revizia
itemilor 0,1 4 10 7
0 2
0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 1,00




Respingerea
itemilor
-0,1
-0,2
-0,3 8
-0,4
-0,5
-0,6
-0,7
-0,8
-0,9 6
-1,0
Figura 8.5. Interpretarea capacitii de discriminare
pentru cei 10 itemi anteriori dup schema lui Ebel.

Comentarii
- itemii 9 i 5 trebuie reinui, avnd caracteristici ideale: dificultate medie i capacitate de
discriminare foarte puternic;
- itemul 3 trebuie de asemenea reinut: el este la limit ca dificultate, dar discrimineaz
destul de bine;
- i itemul 1 trebuie reinut: dei este foarte dificil, el se ncadreaz n zona p = 0,20 0,80
i discrimineaz bine;
79
- itemii 4, 10 i 7 sunt de revizuit: 4 i 10 au dificultate optim, dar din pcate
discrimineaz slab, iar itemul 7 este foarte dificil i discrimineaz slab;
- itemul 2 este de eliminat, odat pentru c este extrem de dificil i n al doilea rnd pentru
c discrimineaz slab;
- itemul 8 va fi eliminat, pentru c dei este de dificultate optim, el discrimineaz negativ;
- la itemul 6 eliminarea este cel mai imperios necesar: dei foarte bun ca dificultate, are o
foarte mare capacitate de discriminare, dar negativ, fiind cel mai puternic n contratimp
cum scorul general la test i deci cel mai contraproductiv. Eventual el ar putea meninut
doar prin scorare invers.

8.5. Indici corelaionali ai discriminrii itemilor
Ca i indicele de discriminare D al lui Findley, metodele corelaionale pot surprinde
foarte bine paralelismul dintre destinul itemului i cel al scorului total la test, n plus ele
avnd i avantajul de face s participe la analiz toate datele, i nu doar o parte dintre ele. Mai
mult, pentru fiecare coeficient de corelaie se poate determina semnificaia sa statistic, ceea
ce d mai mult precizie i rigoare interpretrii sale.
Dac procedurile computerizate nu creeaz nici o problem pentru determinarea lui r
al lui Pearson, r
s
(rho) al lui Spearman sau tau-b al lui Kendall, alte proceduri corelaionale
sunt mai laborioase i mai pretenioase. Acestea se refer la corelaiile n care o variabil sau
ambele sunt msurate pe scale non-numerice, discontinue (dihotomice sau polihotomice). n
acest caz nu numai procedura de calcul este mai complicat, dar chiar selecia celei mai
potrivite metode trebuie fcut cu grij. Laveault i Grgoire (op. cit., p. 210) fac cteva
recomandri sintetizate n figura de mai jos:

Scala de msur Dihotomic Dihotomizat Continu
Dihotomic (Fi)
bis
r
pbis
Dihotomizat r
tetrahoric
r
bis

Continu r, r
s
(rho)
Figura 8.6. Selecia celui mai potrivit tip de corelaie dup tipul de scal.

Meniuni
O variabil este dihotomic prin natura ei dac nu are dect dou stri posibile, cum ar
fi masculin-feminin, ca apartenen de gen; ea este dihotomizat atunci cnd este adus la
doar dou valori, dei iniial mai multe variante erau posibile, cum ar fi cstorit-necstorit,
80
rural-urban, introvert-extravert, admis-respins etc., dei pentru fiecare din acestea exist i
alte variante intermediare: pentru starea civil mai exist i variantele separat, divorat sau
vduv, pentru mediu i varianta preurban, pentru extraversie/introversie i varianta anbivert
etc.; variabilele continue sunt cele de pe scalele de intervale sau de rapoarte, care pot lua n
principiu orice valoare pe toat ntinderea amplitudinii variabilei.

Pentru c metodele corelaionale constituie un capitol distinct al statisticii, redm
condensat trei dintre coeficieni de corelaie prezeni n diagrama de mai sus.
(1)
i
i
x
p
pbis
q
p
s
x x
r

=
unde p x este media variabilei x (scorul total la test) a subiecilor ce au reuit la itemul i;
x este media variabilei x (scorul total la test) a tuturor subiecilor;
x
s este abaterea standard a scorului la test;
i
p este proporia subiecilor care au rspuns corect la itemul i;
i
q este proporia subiecilor care au rspuns greit la itemul i.
(2) r
pbis
=
q
p
s
x x
x
i s


unde
s
x


i
i
x

reprezint mediile grupului superior i inferior;


S
x
este abaterea standar a ntregului grup;
p i q reprezint proporia reusitelor la item i complementul su
(3) r
bis
=
q
p
s
x x
x
i s


unde
s
x

este media grupului superior iar


i
x

media ntregului grup;


s
x
este abaterea standard a ntregului grup;
y este este ordonata lui p transformat n note z; de fapt raportul
q
p
este furnizat de
tabele speciale;
(4) r
bis
=
pbis
r
Y
pq
, aceasta fiind ecuaia de transformare ntre cei doi coeficieni de
corelaie biserial i punct-biserial.

81
Aceast mare diversitate de mijloace corelaionale, adaugat la clasicul indice de
discriminare al lui Findley ar putea deconcerta. Din fericire, exist o foarte bun suprapunere
i concordan ntre rezultatele pe care ele le furnizeaz, exceptnd valorile extreme ale
dificultii itemilor, 0 i 1, unde apar cele mai mari diferene i discordane. Pentru aceasta
furnizm sfatul avizat al experilor Crocker i Algina
14
:
- toate metodele, corelaionale sau noncorelaionale, au o bun concordan n zona medie a
indicilor de dificultate; dei se poate utiliza foarte bine indicele D, o metod corelaional
are avantajul suplimenar al testelor de semnificaie care arat mai precis pragul de
ncredere al relaiei descoperite;
- cnd indicii de dificultate se situeaz spre extremele 0 i 1 trebuie folosit corelaia
biserial;
- acelai lucru este valabil i atunci cnd se suspecteaz c eantioanele viitoare pe care va
fi aplicat testul difer semnificativ de cel pe care acesta a fost aplicat iniial;
- cnd se ateapt acelai nivel al aptitudunii la viitorul eantion ca la cel iniial este
indicat corelaia punct-biserial;
- cnd itemul i variabila criteriu sunt dihotomizate, sau cotate n aceast manier, trebuie
utilizat coeficientul de corelaie tetrahoric, cu att mai mult cu ct itemul sau criteriul iau
valori extreme.

8.6. Curba caracteristic a itemului (CCI)
Dac ntr-un spaiu cartezian pe abscis se pun scorurile progresiv cresctoare la test
iar pe ordonat probabilitatea la care examinaii rezolv fiecare item, obinem o reprezentare
grafic ce d o imagine intuitiv uor de interpretat n legtur cu calitile discriminatoare
ale itemului respectiv. Ea materializeaz mai puin sintetic, dar mai util, raportul dintre
performana la test i performana la item pentru c indic i zona pe care relaia este bun,
staionar sau rea. Aa cum o definete Gregory, CCI este de fapt o idealizare matematic a
relaiei dintre probabilitatea unui rspuns corect i msura n care trstura msurat este
deinut de respondent.
15

Exist o diversitate de modele ale curbei caracteristice a itemului care se sprijin pe
diferite funcii matematice, cum ar fi teoria danezului George Rasch (1966), considerat a fi
cel mai simplu i elegant model.

14
Apud Laveault i Grgoire, op. cit., p. 215.

15
Gregory, op. cit., p. 142.
82

Acesta se sprijin pe dou presupuneri:
- itemii testului sunt unidimensionali, ei msurnd o singur trstur comun;
- itemii testului variaz pe un continuum al nivelului de dificultate.
Atunci cnd abilitatea de a rezolva un item este distribuit gaussian, CCI are
binecunoscuta form de S a ogivei lui Galton. Dei aceasta este preferat de majoritatea
psihometricienilor, pentru c permite deducii matematice despre trstura n cauz, selecia
itemilor dup curbele lor caracteristice depinde n mare msur de scopul testrii. De
exemplu, atunci cnd se dorete construirea unui test de selecie care s evidenieze clar un
punct de tietur a scorurilor (cutoff) sunt de preferat curbele cu prag abrupt (vezi ilustrrile
de mai jos). Alteori scopul este urmrirea validitii difereniale, caz n care itemii ce dau
curbe net diferite dup gen, etnie sau cultur sunt cei care vor fi eliminai sau revizuii, pentru
a avea teste nesexiste sau corecte cultural.
Cel care i-a pus problema utilitii teoriei rspunsului la itemi, care st conceptual n
spatele curbei caracteristice a itemilor, a fost Nunnally
16
(1978). El a fost cel care s-a mirat de
faptul c aceast teorie nu a fost adoptat mai demult n serviciul construciei testelor
psihologice, dar tot el este acela care a dat rspunsul la aceast ntrebare, atunci cnd a
descoperit c presupunerea unidimensionalitii nu se verific pentru cele mai multe dintre
testele pe care le-a luat n discuie.
Conform lui Gregory, marea utilitate a curbei caracteristice a itemilor vine dinspre
viitor, adic dinspre testarea adaptat computerizat, n care fiecare subiect rspunde la un set
individualizat i unic de itemi, scorat pe o scal uniform i unidimensional. Fr CCI, acest
tip de examen adaptat computerizat nici nu ar putea fi imaginat. Dat fiind legtura dintre
teoria rspunsului la itemi i curba caracteristic a itemilor, rezervm acestei probleme un
capitol special.
Mai jos oferim imaginea grafic a curbelor mai multor tipuri de itemi, cu meniunea
c pe abscis sunt trecute trei niveluri ale dificultii uor, mediu i greu , iar pe vertical
de asemenea trei niveluri ale probabilitii rspunsului la item mic, mijlociu i mare.





16
Nunnally, J.C. (1978). Psychometric Theory. (2
nd
ed.). New York: McGaw Hill.
83
CAPITOLUL 9

NORMELE I ETALONAREA TESTELOR.
CLASIFICAREA TESTELOR


9. Normele i etalonarea testelor
9.1. Normele testelor
Nici un test nu are norme pentru ntreaga specia uman! afirm Anne Anastasi
(1976, p. 90). Aceasta nseamn c rezultatele la orice test au limite de valabilitate, generate
de populaia pe care el a fost aplicat i n raport cu care s-a obinut sistemul de referin
reprezentat de normele sale (baremele sau etaloanele).
n psihodiagnoz noiunea de eantion are o tripl accepiune:
- se refer la elementele de comportament msurate de un test (definit de Anastasi ca
msur a unui eantion de comportament);
- are n vedere poriuni din testul deja construit (un item poate fi considerat cea mai
mic unitate, eantion din test );
- are un neles statistic, pentru c se refer la populaia pe care s-a aplicat testul n
forma lui final, n raport cu care se construiete etalonul (eantion normativ).
Aceasta din urm este accepiunea pe care o vom da conceptului de eantion, necesar
din dou motive: aprecierea performanelor unui subiect nu se poate face dect prin
comparaie cu un grup de referin, iar cum aceast comparaie nu se poate face cu ntreaga
populaie, din ea se extrage un eantion reprezentativ, pe care se aplic i se etaloneaz testul.
De aici rezult c normele la un test nu au un neles absolut, universal sau permanent
(Anastasi, op. cit.) i c pentru a fi relevante ele trebuie raportate la eantionul de referin,
care confer valabilitate social-istoric testului sau bateriei de teste (chiopu, 1976, p. 151).
Aceasta este i raiunea pentru care un test trebuie revizuit periodic.
Cea mai important caracteristic a eantionului este reprezentativitatea sa, care
nseamn c el va fi construit innd cont de toi factorii de variabilitate importani: vrst,
sex, mediu (ruralurban), la care se adaug nivelul de instrucie, pregtirea profesional,
statutul socio-economic i cultural, compoziia etnic, distribuia geografic i orice alt
caracteristic, atribut pe care populaia de ansamblu o are i care ar putea s genereze
diferene n scorurile le test. Eantionarea este un capitol important al Statisticii, care i-a pus
la punct procedee bine definite de alegere a sa pentru a-i crete reprezentativitatea: metoda
84
cotelor, procedeul loteriei, al pasului, al eantionrii stratificate, multifazice, al eantionului
fix, metoda panel etc., tratate i cu alte ocazii.
Deoarece tabelul de norme este relativ la populaia avut n vedere, nu se pot utiliza
etaloane ntocmite n alte ri i n alte condiii, tabelul de norme are o valoare local, cel
mult naional (Radu, 1993, p. 381). Mrimea (volumul) eantionului este foarte important:
dac este prea mare el genereaz o cantitate de munc greu de acoperit, dac este prea mic
poate s lase pe dinafar populaii sau caracteristici importante ale acesteia, ceea ce i
diminueaz reprezentativitatea.
Raportul omogenitate-eterogenitate este o alt nsuite imporatnt a eantionului, cci
n funcie de numrul i de ponderea atributelor sale, pot fi construite subeantioane
populaionale caracteristice. Acolo unde pot fi puse n eviden diferene legate de vrst, sex,
mediu sau nivel de instruire, se vor construi etaloane pe categoriile amintite, n cadrul
fiecreia celelalte elemente importante ce caracterizeaz populaia trebuind s se regseasc
n proporii egale sau apropiate.
n cazul n care se intenioneaz ca testul s aib aplicabilitate foarte larg, naional,
atunci eantionul normativ va fi suficient de mare i de cuprinztor pentru a da valori stabile
i reprezentative. Pentru aceasta, populaia va trebui definit n avans n termenii obiectivelor
testului, dup care, prin proceduri statistice specifice, va fi asamblat eantionul pe care el va
fi aplicat. n rile n care exist populaii de mai multe tipuri (eterogenitate etnic), diferene
foarte mari n standardele de via sau de cultur, este de preferat s avem n vedere etaloane
regionale sau locale, etaloanele naionale fiind indicate aici doar pentru studiul opiniilor,
atitudinilor sau inteniilor de vot. Studierea erorii de eantionare (care trebuie s fie ct mai
mic) i a distribuiei scorurilor obinute (care trebuie s fie unimodal) sunt repere statistice
importante n construirea eantionului.
Volumul eantionului presupune exigena ca din fiecare clas s se extrag cel puin
300 de persoane (Kline, 1993), ceea ce nseamn c populaiile largi i eterogene, genernd
multe variabile ce vor forma clase diferite, impun eantioane att de mari nct este preferabil
s utilizm etaloane pentru populaii mai mici i mai omogene, pentru care obinem norme
locale. Atunci cnd se pun n eviden diferene nsemnate ale mediilor diferitelor subgrupuri
chiar n cadrul acestora, ele pot fi utilizate n construirea unor etaloane de finee, cci permit
raportarea mai nuanat a fiecrui caz nou la sisteme de referin difereniate. Aceste
subgrupuri pot fi formate pe vrste, sex, clas colar, tip de curriculum, regiune geografic,
mediu rural sau urban, nivel economic etc.
85
Normele locale, dezvoltate cel mai adesea de nii utilizatorii de teste, sunt
avantajoase pentru c definesc mult mai strict subgrupele menionate anterior. Mai mult, pe
msur ce testul este utilizat, el furnizeaz continuu date pentru subgrupuri tot mai bine
definite, de unde i posibilitatea de a construi etaloane tot mai difereniate, nct la limit se
poate face spre exemplu predicia pentru un elev n raport cu propriile lui rezultate anterioare.
Msura progresului unui subiect n timp, predicia succesului n achiziia colar sau a
performanelor ntr-un serviciu/munc se bazeaz mult mai mult pe normele locale, dect pe
cele larg reprezentative naional. Acestea sunt extrem de necesare pentru c ofer cel mai larg
i mai stabil sistem de referin, necesar pentru a valida, de exemplu, examenele naionale
(capacitatea sau bacalaureatul, n ara noastr). Deoarece costurile de obinere a unor astfel de
etaloane sunt foarte ridicate i deoarece practicianul are de rezolvat probleme de mai mic
anvergur i mult mai specifice, etalonul local i este mai accesibil i mai util pentru c
tezaurizeaz n timp i valorific propria sa munc.

9.2. Etalonarea testelor
Aplicarea testului d scoruri sub forma cotelor brute, care se analizeaz i se trateaz
statistic pentru a obine cotele standard, sau normele fixate n etalon. n acest scop se folosesc
dou tipuri de transformri (Albu, 1998, p. 246):
- transformri liniare, prin care se obin cotele standard z i cotele standardizate (pstrnd
nemodificat ordinea indivizilor n eantion, adic repartiia nemodificat a cotelor);
- transformri neliniare (de arie), prin care se modific repartiia cotelor brute, pentru a
semna cu o repartiie uniform, ca n cazul quartilelor, decilelor sau centilelor, sau cu
una normal, ca n cazul scalelor normalizate cu 5, 7, 9 sau 11 trepte.
Dac n primul caz se modific unitatea divizionar a scalei pentru a se lua arii egale
n trane succesive (cte 10% n cazul decilelor, 25% n cazul quartilelor i 1% n al
centilelor), n al doilea caz unitatea de scal este egal i cea care difer este aria poriunii de
sub curb, corespunztoare unei uniti, aceasta n cadrul unei repartiii care a fost
normalizat (combin transformrile liniare cu cele de arie).
Pe lng aceasta, unele etaloane folosesc vrste echivalente, vrste mintale sau clase
echivalente pentru variabile care au o cretere continu n raport cu vrsta (nlimea,
greutatea, inteligena, vocabularul sau cunotinele la o materie colar).
Clasele echivalente, folosite mai ales pentru ciclul primar, n construirea testelor de
cunotine standardizate, exprim pentru fiecare clas i lun de coal, mediana cotelor brute
86
la test, ceea ce permite reperarea unui scor particular al unui elev: citire 4,5 (nivel de clasa a
IV-a, luna a cincea a anului colar), aritmetic 3,6, istorie 4 etc.
Vrstele echivalente dau fie vrste mintale, ca la testele de inteligen de tip Binet
(unde raportul vrst mintal/ vrst cronologic, multiplicat cu 100, d coeficientul de
inteligen), fie vrste ale citirii sau socotitului, pentru testele de cunotine. Se pot calcula
astfel coeficieni de inteligen (QI), de dezvoltare (QD, ca n bateriile Gesell) sau de educaie
(QE).
Cotele standard z arat cu cte uniti reprezentate dintr-o abatere standard se
distaneaz o cot brut a unui subiect la un test, comparativ cu media populaiei de referin.
Formula este:
s
m x
z

=

unde rezultatul este cota z corespunztoare scorului la testul x, iar m i s sunt media, respectiv
abaterea standard a populaiei pe care s-a fcut etalonarea. Cotele standard z au avantajul
unitii de scar egale, exprimabil n abateri standard (s), dar dezavantajul de a avea valori
pozitive i negative (cuprinse n intervalul 3 ,+3) i de a cuprinde populaii prea mari pe
poriunea central (68% din cazuri sunt cuprinse n intervalul de plus i minus o abatere
standard).
Rezolvarea practic o constituie transformarea liniar asupra cotelor z i obinerea
cotelor standardizate dup formula :
+ = M z' sz
unde ' z este cota transformat a cotei standard z, iar M i s sunt media i abaterea standard
pentru cotele standardizate obinute prin transformare. Valorile ' z se rotunjesc la numere
ntregi i proprietile lor sunt aceleai cu ale cotelor standard z , exceptnd firete media i
abaterea standard, modificate prin transformare. Iat cteva tipuri de transformri (dup Albu,
p. 332):
SCALA
N C WP L T Z QI H
Media 3 5 10 10 50 100 100 50
Ab. sta. 1 2 3 5 10 10 15 14
Figura 9.1. Tipuri se scale utilizate n psihodiagnoz

Foarte utilizate n psihologia aplicat sunt quartilele, decilele i centilele. Dac
primele dau o mprire grosier, n numai patru clase, centilele dau o ierarhie de finee a
87
rangurilor, din procent n procent, dar aceasta nseamn teste lungi, cu muli itemi de putere
discriminativ variabil (ntre 0,30 i 0,70 cel mai adesea), aplicate pe populaii foarte mari
(peste 100 de subieci). De aceea mai practice sunt decilele: fa de gradul de exactitate al
msurii psihologice, mprirea n decile ceea ce nseamn individualizarea a 10 trepte de
reuit la o prob reprezint adeseori limita maxim, afirm Radu et al. (1993, p. 376). De
aceea vom ilustra operaia de construire a unui etalon n decile, adic decilarea, prin care
efectivul total se mparte n 10 clase, fiecare cuprinznd 10% din numrul total de subieci.
Prin analogie, centilarea nseamn 100 de clase, a 1% din efectiv fiecare.
Primul decil este acel reper sau valoare a variabilei care are naintea sa 10% din
ansamblul datelor ordonate, al doilea decil este elementul ce are nainte 20% din aceste date
etc. Decilele sunt deci indicatori ai locului sau ai poziiei pe scara considerat i pentru a
determina cele 9 repere ce vor delimita cele 10 decile, datele trebuie ordonate ierarhic. Pe
prima linie vom avea valorile (cotele) brute ale variabilei test (x), pe a doua frecvenele
absolute (
a
f ) i pe a treia frecvenele relative cumulate (
c
f ). Iat rezultatele la testul Raven
Standard (PM 38) aplicate pe 448 de concureni la un examen de admitere, utilizate pentru
exerciiul nostru de etalonare:

X
18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
a
f
0 0 1 0 1 3 0 0 1 0 1 0 0 1 0 3 1 2 3 4 7 3 2
c
f
0 0 1 1 2 5 5 5 6 6 7 7 7 8 8 11 12 14 17 21 28 31 33

X
41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
a
f
11 12 15 18 24 20 28 28 36 37 32 29 35 23 28 22 13 4 5 0
c
f
44 56 71 89 113 133 161 189 225 262 294 323 358 381 404 426 439 443 448 448
N = 448; x = 48,63; S = 6,12; mediana = 49,50.
Figura 9.2. Distribuia unor rezultate la Matricile avansate Raven

a. Etalonul n quartile
Quartilul 1 (inferior) are naintea sa 25% din subieci, adic (448 25)/100 = 112.
Cutm pe linia frecvenelor cumulate (
c
f ) cea mai apropiat valoare de 112, care este 113,
corespunznd cotei brute de 45. Quartilul 2 (mediana), mparte pe din dou efectivul, deci are
naintea sa 50% din efectiv, adic (448 50)/100 sau 448/2 = 224. Valoarea cea mai apropiat
de aceasta este 225, ceea ce corespunde cotei brute de 49. Quartilul 3 (superior) are naintea
sa 75% din efectiv, adic (448 75)/100 = 336. Valoarea cea mai apropiat este 353,
corespunznd cotei brute de 53.
88
Etalonul va arta astfel:
Procente
Quartile Clase Teoretice Cumulate
1
Q
0 45 25 25
2
Q
46 49 25 50
3
Q
50 53 25 75
4
Q
54 60 25 100
Figura 9.3. Etalon n 4 clase (quartile).

b. Etalonul n decile i centile (percentile)
Primul decil are 10% din efectiv naintea sa, deci (448 10)/100 sau 448/10 = 44,80.
Rotunjind, obinem 45. Pe linia frecvenelor cumulate valoarea cea mai apropiat de aceasta
este 44, corespunztoare cotei brute de 41, care devine reper pentru primul decil. Al doilea
decil are 20% din efectiv naintea sa, deci (448 20)/100 = 89,60, rotunjit 90, care pe linia
frecvenelor cumulate are valoarea cea mai apropiat 89, corespunznd cotei brute de 44, care
devine reperul celui de al doilea decil. n mod corespunztor, reperele pentru celelalte decile
sunt 46, 48, 49, 50, 52, 53 i 55.
Etalonul n decile arat finalmente astfel:

Procente
Decile Clase Teoretice Cumulate
10 0 41 10 10
20 42 44 10 20
30 45 46 10 30
40 47 48 10 40
50 49 10 50
60 50 10 60
70 51 52 10 70
80 53 10 80
90 54 55 10 90
100 56 60 10 100
Figura 9.4. Etalonul n 10 clase (decile).

Pentru c etaloane n centile ntlnim rareori, cel mai adesea se calculeaz reperele
pentru punctele percentile 3, 5, 25, 75, 95 i 97, celelalte valori (10, 20, 30 etc.) fiind
respectiv primul, al doilea, al treilea decil etc. Modalitatea de calcul este similar: percentilul
3 are 3 procente din efectiv naintea sa, deci (448 3)/100 = 13,44 rotunjit la 13, care pe linia
frecvenelor cumulate are cea mai apropiat valoare 14, cu cota brut corespunztoare 35
(reperul pentru percentilul 3). Similar, percentilul 97 este (448 97)/100 = 434,56, rotunjit
435, care are ca reper scorul brut 57.
89

c. Etaloanele n clase normalizate
Acest tip de etalonare se realizeaz n clase care au efective conforme distribuiei
normale, ceea ce presupune c distribuia original va fi normalizat prin folosirea de clase ce
au proporii derivate din proporiile unei curbe gaussiene normale. Se folosesc mai multe
astfel de etaloane, care pot avea 5, 7, 9, 10 sau 11 clase, cu urmtoarele distribuii
procentuale:
Etalon n 5 clase: 6,7; 24,2; 38,2; 24,2; 6,7 (%)
Etalon n 7 clase: 4,8; 11,1; 21,2; 25,8; 21,2; 11,1; 4,8 (%)
Stanine = 9 clase: 4,0; 6,6; 12,1; 17,5; 19,6; 17,5; 12,1; 6,6; 4,0 (%)
Stens = 10 clase:
Note C = 11 clase: 3,6; 4,5; 7,7; 11,6; 14,6; 16,0; 14,6; 11,6; 7,7; 4,5; 3,6 (%).
Pentru c etalonarea n stanine a cunoscut o larg extindere dup cel de al doilea
rzboi mondial (ea d 9 clase ce pot fi grupate ntre ele cte 3, fiecare cu cte 3 gradaii; cu
excepia staninei 1 i 9, au uniti de scar echivalente, deci sunt aditive), vom exemplifica
construirea unui etalon plecnd tot de la datele anterioare. Stanina 1 are sub ea 4% din
efectiv, deci (448 4)/100 = 17,92, rotunjit 18, care are pe linia frecvenelor cumulate valoarea
cea mai apropiat 17, creia i corespunde cota brut de 36. Similar stanina 2 are naintea sa
4,0+6,6 = 10,0 procente din efectiv, adic (448 10,6)/100 = 47,468 rotunjit la 47, care pe linia
frecvenelor cumulate are cea mai apropiat valoare 41.
Etaloane de calitate se obin atunci cnd volumul eantionului depete 100 de
subieci, selecionai dup criterii (de regul nu mai mult de 4) de vrst, sex, mediu, profesie
etc., pentru a fi n acelai timp omogene n raport cu criteriul i eterogene n aceeai proporie
cu populaia mai mare din care a fost extras, adic pentru a fi reprezentativ. Iat etalonul:
Procente:
Stanine Clase Teoretice Cumulate
1 0 36 4,0 4,0
2 37 41 6,6 10,6
3 42 45 12,1 22,7
4 46 48 17,5 40,2
5 49 50 19,6 59,8
6 51 53 17,5 77,3
7 54 55 12,1 89,4
8 56 6,6 96,0
9 57 - 60 4,0 100,0
Figura 9.5. Etalonul n 9 clase (stanine).

90
Trebuie precizat c de foarte mare utilita sunt dou tipuri de scale standardizate,
scorurile T (introduse de MCCall n 1922) i scorurile H, introduse de Hull, ale cror formule
de transformare a scorurilor brute n scoruri standard sunt urmtoarele:
( ) M x
s
T + =
10
50
respectiv
( ) M x
s
H + =
14
50 .

9.3. Clasificarea testelor
n binecunoscuta sa lucrare Psychological Testing, Anne Anastasi (1976) trateaz
testele psihologice dup trei mari subdiviziuni:
1. teste de nivel intelectual general, n care include testele individuale, testele pentru
populaii speciale i testele de grup;
2. testele pentru abiliti separate, cu trei subdiviziuni majore: teste educaionale,
ocupaionale i clinice;
3. testele de personalitate, care includ inventarele autoaplicate, testele ce msoar interese,
atitudini, valori i tehnicile proiective.
Aiken (1997) trateaz evaluarea abilitilor (inteligena i abilitile speciale) i a
personalitii (interese, atitudini, valori; observaia, interviul i ratingul; inventarele i
tehnicile proiective).
Kaplan i Saccuzzo (1993) disting tehnicile interviului, testele de abiliti mintale,
alte teste de abiliti individuale sau de grup, apoi teste pentru alegerea carierei, teste de
personalitate structurate, teste de personalitate proiective, la care adaug procedurile de
evaluare a comportamentului, de msur a anxietii i a stresului, testarea strii de
sntate i testele computerizate.
Ion Holban (1973) propune o clasificare ce cuprindea testele de randament, de
dezvoltare mintal, de aptitudini, de cunotine, de comportament, de alegere, teste
proiective, sociometrice, degajnd i alte criterii de clasificare.
Ursula chiopu (1976) propune ca mari categorii de tehnici psihodiagnostice testele
de dezvoltare, cele de inteligen, de aptitudini, de personalitate i de examinare
psihologic a sociabilitii.

91
Fiecare clasificare configureaz n alt mod domeniul psihodiagnozei, care uneori se
rezum la testare (testing), alteori i la evaluare (assessment), putnd include i toate
metodele clasice utilizate n vederea diagnozei (anamneza, metoda biografic, convorbirea,
observaia, ancheta, interviul, chestionarele sau metodele sociometrice). Dei observm c
multe dintre clasificrile enunate mai sus se suprapun n bun msur, este necesar s
delimitm cteva criterii clare de clasificare, care ne vor ajuta s circumscriem mai bine
domeniul testrii psihologice i s nelegem mai nuanat diferena specific dintre tipurile de
teste. Deoarece este greu de ierarhizat ponderea fiecrui criteriu i deoarece graniele dintre
ele sunt relative, ordinea lor nu este neaprat cea pe care o vom adopta n continuare.

9.3.1 Clasificarea testelor dup modul de administrare: teste individuale i de grup
- Testele individuale, foarte apropiate de metoda clinic, sunt mari consumatoare de timp,
dar ele permit stabilirea unui contact mai bun cu subiectul, ce va fi observat mai uor,
informaia dat de test putnd fi suplimentat semnificativ cu alte date care sporesc
acurateea diagnosticului.
- Testele de grup (colective): n cazul lor examenul este mai strict standardizat (pentru a
controla toate elementele ce ar putea denatura rezultatul final, n special nenelegerea
instructajului i frauda), adun o mare cantitate de date ntr-un interval scurt (deci sunt
foarte economice), dar srcesc examenul de date importante privind motivaia,
implicarea n prob, oboseala, anxietatea, boala sau plictiseala. Sunt foarte indicate n
examenele de selecie primar, de cunoatere a opiniilor sau a atitudinilor. Pentru
consiliere, ghidare vocaional, orientare sau n clinic sunt de preferat abordrile
individuale, datorit plusului lor de calitate.

9.3.2. Clasificarea testelor dup timpul de execuie:
teste de vitez i teste de randament
- Testele de vitez pleac de la presupunerea c exist o corelaie ntre viteza de lucru i
dezvoltarea unei caracteristici (atenia, de exemplu). Sarcinile nu sunt organizate ierarhic,
avnd acelai grad de dificultate, dar testul are un numr foarte mare de itemi, pentru a nu
putea fi integral rezolvat de nici un subiect. Evident, primeaz aspectul cantitativ.
- Testele de randament au itemii de dificulti diferite, aranjai ierarhic, timpul fiind
suficient de mare pentru a permite parcurgerea lor de ctre toi subiecii. Cota brut o
92
reprezint numrul de probleme corect rezolvate (primeaz deci aspectul calitativ al
rezolvrii).
Cele mai multe teste combin aceste dou criterii, cum este subtestul Cuburilor WISC,
unde modelele de realizat sunt progresive ca dificultate (utilizeaz patternuri caroiate, apoi
fr caroiaj, modele de 2x2, apoi de 3x3 cuburi), iar punctele rezult din rezolvarea corect a
modelului i din bonificaiile de timp (de vitez, de fapt).

9.3.3. Clasificarea testelor dup modul de executare a sarcinii de ctre subiect: n
teste orale, scrise (tip creion-hrtie) i de performan
- Testele orale cer rspunsuri verbale (informaii, vocabular, completare de propoziii,
comprehensiune, asociere verbal etc.).
- Testele scrise cer un rspuns scris (care poate fi i desenat), dat pe foaia de test sau de
rspuns. Proliferarea lor extraordinar, dat de comoditatea soluiei, tinde astzi s fie
blocat de extinderea examenului cu ajutorul calculatorului, care afieaz pe ecran
problema, soluia fiind indicat prin tast, mouse sau creion optic. Mai mult, calculatorul
scaneaz foi de rspuns, scoreaz, analizeaz rspunsul i furnizeaz o foaie de profil,
avnd un rol esenial i n re-etalonarea progresiv a testului.
- Testele de performan presupun materiale, instrumente sau aparate, dispuse n condiiile
speciale de laborator, necesit o supraveghere atent i rareori permit examene colective.
n acest context, distincia teste verbalenonverbale, dei des utilizat, nu este
operant, pentru c este greu de specificat pn la ce nivel intervine sau nu factorul verbal.
Testele la care exist preponderent rspunsuri motorii, construite cel mai adesea pentru a fi
free culture, adic independente de limb, sunt destinate imigranilor, handicapailor
cultural, hipoacuzicilor ori minoritilor etnice, adic cei crora factorul verbal poate s le
modifice negativ performana final.

9.3.4. Clasificarea testelor dup modul de procesare implicat:
teste de eficien i teste de personalitate
Fiecare categorie are mai multe subdiviziuni:
- Testele de eficien se refer la aptitudini generale (inteligen, memorie) i speciale, la
cunotine, la probele de lucru i la testele situaionale.
- Testele de personalitate includ chestionarele autoaplicate, tehnicile proiective i testele
obiective de personalitate.
93
Dac testele de eficien ncearc s surprind performana maxim a unei persoane, cele de
personalitate vor s surprind performana ei tipic (Corsini, 1994), primele avnd itemi de
genul adevratfals, prin care se obine un scor numeric i o ierarhizare a indivizilor, n timp
ce la a doua categorie rspunsurile nu sunt dihotomice (bune/rele), deci nu permit o
ierarhizare, ci o raportare tipologic.

Teste de eficien sunt la rndul lor:
- Testele de aptitudini: conformndu-se unui model evolutiv i ierarhic asupra inteligenei,
sunt teste de aptitudine general (inteligen), care msoar un potenial general, teste de
aptitudini speciale (muzic, mecanic, sport, arte etc.) i teste de aptitudini multiple, care
cuprind ntr-o singur baterie mai multe feluri de aptitudini, definite factorial, ce pot
interveni n domenii specifice (dexteritate, inteligen spaial, tehnic, manualitate etc.).
- Testele de cunotine msoar nu un potenial (ca cele de inteligen), ci nivelul efectiv
atins n achiziia de informaii sau de deprinderi specifice unui domeniu (matematic,
istorie, informatic etc.). Pentru c cel mai bun predictor asupra a ceea ce poate nva
cineva este ceea ce el deja a nvat pn la un moment dat, testele de cunotine au n
vedere n mod expres experiena anterioar de nvare. De fapt, cea mai bun predicie
este dat de folosirea concomitent a testelor de aptitudini generale (inteligen) cu cele
de cunotine, pentru c combinarea lor este mai informativ (indic i ceea ce este
potenial, dar i ceea ce este dobndit prin nvare). Unele dintre testele de cunotine
sunt de tip informativ (elaborate de profesorii nii pentru a determina nivelul unei clase),
sau standardizate (elaborate de specialiti, destinate utilizrii pe scar larg, avnd un
manual care indic strict condiiile de standardizare n aplicare, cotare, raportare la norme
elaborate pe eantioane reprezentative i acoperind o mare varietate de coninuturi, ce le
fac foarte recomandabile pentru evaluri sumative).
- Probele de lucru sunt extrem de indicative pentru evaluarea nivelului atins ntr-o
profesie, activitate, dependent de formarea unor deprinderi motrice, intelectuale sau
rezultate dintr-o experien. Unele dintre elementele implicate ntr-o munc devin foarte
diagnostice pentru rezultatele ce se vor obine ulterior n munca respectiv. naintea unui
program de instruire, deseori se face o astfel de evaluare care, cnd este bine conceput,
are validitate predictiv i face o mare economie de timp i bani, programele putnd dura
luni sau ani.
94
- Testele situaionle sunt echivalentele probelor de lucru n cazul profesiilor
administrative (Albu, 1998, p. 74), deosebirea major fiind c n testul situaional se
regsete sarcina de lucru n totalitatea ei, i nu numai anumite elemente. n afar de
aceasta, ea nu cuprinde numai deprinderi (skills) ci i variabile de personalitate i sociale
(emoii, opinii, stil personal, aptitudinea de lider, etc.). Scopul lor este adesea deghizat,
ele fiind construite ca simulri ale unor situaii reale, pe care cel n cauz trebuie s le
rezolve. Tehnica in-basket (coul de lucru) simuleaz condiiile de lucru ale unui
manager, director de firm, care trebuie s rspund la toate solicitrile cuprinse n co:
telefoane, decizii, scrisori, directive, interviuri etc. Capacitatea de conducere i stilul
personal n lucrul cu oamenii se evideniaz astfel printr-un test n care itemii sunt de
aceeai natur i complexitate ca munca efectiv. Evident c aceste teste se organizeaz
dup faza interviurilor preliminare i dup examenele psihologice cu teste clasice, prin
care numrul candidailor cu anse de a fi selectai pentru post se reduce drastic.

Teste de personalitate sunt:
- Chestionarele de personalitate. Acestea pot fi unifazice sau multifazice, dup cum
msoar una sau mai multe dimensiuni de personalitate (extraversie, anxietate, nevrotism,
maturizare emoional, fora Eului, masculinitate-feminitate, tendine patologice etc.)
Dup coninut, ele pot fi de adaptare, caz n care se numesc inventare de personalitate,
indicative pentru integrarea social a propriei conduite sau pentru starea de sntate. n
afara acestora, chestionarele pot msura interesele (foarte importante n orientarea
profesional), atitudinile, opiniile (fundamentale n anchetele sociologice), sau valorile.
Uor de administrat i de cotat, chestionarele de personalitate au o larg utilizare, cci se
bazeaz pe supoziia (discutabil!) potrivit creia cea mai bun cale de a afla ceva despre
un individ este de a-l ntreba direct (Hammond, 1995). Sunt multe dovezi c ntre sinele
social i cel psihologic, ntre sinele real i cel ideal pot exista distane mari sau conflicte
(surse de inadaptare social) i, mai mult, dac situaia de examinare are miz (angajare,
selecie profesional), rspunsurile pot fi trucate intenionat (rspunsuri de faad).
- Tehnicile proiective nu sunt teste n sens strict, pentru c au un grad de standardizare i
etalonare redus i, n consecin, caliti psihometrice foarte discutabile, de unde i
rezerva multor psihometricieni fa de acestea. Ele urmresc sesizarea nu a ceea ce este
comun tuturor oamenilor (planul nomotetic), ci aspectele idiografice, adic ceea ce este
profund individual i specific unei singure persoane, fiind calea cea mai important pentru
95
a ajunge la un diagnostic diferenial. Cunoaterea acestor factori unici, numit diagnoza la
nivel intim, de adncime, structural, plaseaz aceste probe n afara posibilitilor de
etalonare, de unde i numele de tehnici i nu de teste proiective. Au o utilizare foarte
frecvent n clinic (n psihiatrie cu precdere), dar sunt foarte rspndite i n domeniul
judiciar, n coal sau transporturi, acolo unde se pune problema surprinderii unitii,
integritii sau sntii mentale a persoanei. De multe ori ele premerg psihoterapia sau i
evalueaz rezultatele. Sarcina subiectului are caracter foarte general i vag precizat, el
trebuind s spun ce-i trece prin minte, uneori o poveste despre o fotografie, imagine,
desen, pat de cerneal, elementele inductoare fiind nite stimuli nestructurai, vagi,
ambigui. n construcia relatrii sale, subiectul va folosi materialul pe care l are la
dispoziie, stocat n fondul aperceptiv al memoriei sau n incontientul su, de unde i
numele de probe proiective. Pentru a le desemna se mai utilizeaz i ali termeni: teste
aperceptive (ca TAT, CAT, Symonds), teste nestructurate sau de dinamism. Dou sunt
problemele de fond ale acestor tehnici: subiectivitatea accentuat a interpretrii (validitate
concurent i ncruciat reduse) i timpul extrem de lung necesar formrii unui
psihodiagnostician bun, specializat n domeniu. Dac la acestea adugm timpul mare,
cerut de aplicare i interpretarea rezultatelor, faptul c sunt folosite doar scale nominale
(raportarea persoanei la o tipologie sau categorie) i faptul c msoar date ce au o mare
fluctuaie de moment (dependente de factori dispoziionali), vom nelege de ce
entuziasmul iniial pentru aceste tehnici s-a mai temperat, ele rmnnd ns, pentru unele
zone, singurele instrumente diagnostice dezirabile.
- Testele obiective de personalitate sunt, ca i cele proiective, teste indirecte pentru c-i
deghizeaz scopul, dar sunt numite obiective pentru c folosesc stimuli structurai
(activiti simple, manipulabile experimental), din execuia crora se deduc aspecte
relevante ale personalitii, cu o mult mai mare concordan ntre evaluatori, comparativ
cu cele proiective. Modificarea vigilitii (arous-ului cortical) la introveri i extraveri
este extrem de diferit, primii avnd o descretere accentuat, ceilali o cretere
progresiv, paralel cu concentraia de cofein. Muli constructori de chestionare
(inventare) de personalitate s-au lsat sedui de ideea gsirii unor validri externe a
acestora prin teste obiective, printre acetia numrndu-se Eysenck sau Cattell.



96
9.3.5. Clasificarea testelor dup constana coninutului de la o
administrare la alta: teste cu coninut fix i teste cu coninut variabil
Dac cele cu coninut fix pot fi pot fi considerate teste n sensul clasic (toate
persoanele testate parcurg aceiai itemi, prezentai n aceeai form), cele cu coninut
variabil contureaz un mare domeniu (uria) al testelor adaptate, administrate, scorate i
prelucrate computerizat. n acest caz nu mai exist un test unic, ci o banc de itemi, ale cror
caracteristici au fost determinate din administrri anterioare (ansamblu larg de itemi calibrai
ca discriminabilitate i dificultate, vezi Havrneanu, 2000).
Testele adaptative computerizate sunt construite pe baza teoriei rspunsului la itemi,
selecia itemului administrat fiind n funcie de caracteristicile conjugate ale acestuia i ale
subiectului examinat, pentru a maximiza informaia despre el, n condiiile unei testri mai
eficiente i mai rapide. Algoritmul cuprinde o secven care ncepe cu un item de dificultate
medie care este administrat, se evalueaz rspunsul n raport cu variabila test apoi, funcie i
de rspunsurile anterioare ale subiectului, pentru itemii care vor urma se decide continuarea
sau stoparea testrii, dac s-a atins un nivel de ncredere specificat, sau timpul ori numrul de
itemi de administrat a fost epuizat. Dac la nceput testele adaptative computerizate msurau
doar aptitudini i cunotine (itemi omogeni relativ la construct), acum ele tind s se extind
spre msurarea de variabile necognitive (opinii, atitudini, valori sau interese).

9.3.6. Clasificarea testelor dup modul de cotare
Exist teste obiective i subiective, distincie care deja s-a degajat prin compararea
tehnicilor proiective (cotare subiectiv) cu cele cognitive sau de cunotine (obiective).
Obiectivitatea n cotare este o important calitate psihometric a unui test, care presupune ca
sarcina s fie structurat i rspunsurile bune s fie alese dintr-un numr fix de rspunsuri
preformate. Ea se obine i cnd numrul itemilor este mare i scorul la test are o formul de
calcul clar specificat.

9.3.7. Clasificarea testelor dup modul de interpretare a scorurilor
- Teste normative, unde scorul individual i dezvluie semnificaia prin raportarea la
etalonul obinut pe un eantion reprezentativ statistic i omogen.
- Teste centrate pe criteriu, unde se stabilete un anumit nivel acceptabil al performanei,
n funcie de care subiectul este admis sau respins. Acestea sunt utilizate fie n selecia
primar (apt/inapt pentru conducerea auto), fie n coal, n ciclul primar, cnd criteriul
97
arat ct de mult s-a apropiat elevul de obiectivul educaional scontat i mai puin de un
anumit loc n ierarhia clasei.
- Teste idiografice, n care se construiete un instrument diagnostic doar pentru un singur
individ, sau scorul su la un chestionar devine criteriu de evaluare a unui program
psihoterapeutic, prin pre-test i post-test.
- Teste ipsative, care cer subiectului s aloce o resurs personal limitat mai multor
domenii, urmrind compararea ntre domenii sau ntre scorurile obinute la mai multe din
scalele testului.

9.3.8. Clasificarea testelor dup numrul variabilelor implicate
- Teste analitice. Acestea s-au impus tot mai mult datorit dezvoltrii metodelor de analiz
factorial, care permit selecia de itemi omogeni n raport cu un construct. Ele au la baz
principiul din fizic al izolrii fenomenului de investigat, ceea ce este relativ dificil la
nivelul psihicului, cci el tinde, prin evoluia sa, spre o unificare progresiv prin largi
sisteme de integrare (Allport, 1937).
- Teste sintetice. Ele pun persoana n condiiile de solicitare complex, permind iden-
tificarea unor parametri aptitudinali diferii, concomitent cu surprinderea (prin
observaie), a unor trsturi sau chiar factori mai generali de personalitate.

9.3.9. Clasificarea testelor din punctul de vedere al procesului psihic investigat
Din acest punct de vedere i n prelungirea unei perspective atomist-facultaioniste n
psihologie, tot mai puin utilizat astzi, exist teste de atenie, de percepie, de memorie, de
inteligen, de creativitate, de personalitateetc. Este de ajuns s artm cum inteligena pune
n micare toate rezervele psihice n scopul adaptrii i cum personalitatea tinde spre integrri
succesive, spre a evidenia relativitatea acestui criteriu, care pstreaz o utilitate pur didactic.

Not: Subcapitolul Clasificarea testelor a fost elaborat n principal pe baza capitolului 4
(Clasificri ale testelor psihologice) din lucrarea Monici Albu "Construirea i utilizarea
testelor psihologice, Cluj-Napoca, 2000, pp. 65 92, pe care l recomandm pentru detalieri
i o nelegere mai analitic.



98
CAPITOLUL 10

DEZVOLTAREA SCALELOR PSIHOLOGICE


10.1. Introducere

O bun parte din activitatea practic a psihologului se sprijin pe diagnoza unor
aspecte cantitative ale aptitudinilor i dimensiunilor definitorii pentru personalitate. n acest
scop el utilizeaz instrumente ale cror caliti psihometrice trebuie construite i evaluate n
cunotin de cauz. n plus, pentru unele dimensiuni psihologice, pedagogice sau sociologice
specialistul trebuie s dezvolte singur scale destinate msurrii constructelor respective. Mai
mult, literatura domeniului face adesea referiri la aceste caracteristici, considerndu-se
implicit valabil c psihologul este avizat n legtur cu aspectele tehnice implicate de
construcia i dezvoltarea scalelor psihodiagnostice.
Pe de alt parte, dei se recunoate tacit c statistica este printre cele mai importante
instrumente al profesiunii de psiholog, ea determin nc o reacie de rezisten, sau chiar de
respingere din partea studenilor sau a novicilor, din cauza caracterului ei abstract i
formalizat, sau a evoluiei sale foarte rapide, prin care demersul matematic devine tot mai
sofisticat, parc anume rezervat unei elite capabile s in pasul cu ceea ce s-a numit
imperialismul metodologic al tiinei. Capitolul pe care l deschidem prin aceste rnduri
indic la modul clar cum o cunoatere psihologic abstract, de tip statistico-matematic,
devine extrem de util n contextul psihologic foarte concret al construciei de scale. El este
destinat a oferi reperele pe care psihologul, pedagogul sau sociologul trebuie s le aib n
dezvoltarea scalelor de msur a unor constructe specifice domeniului de activitate propriu.


10.2. Paii de urmat n dezvoltarea scalelor

10.2.1. Pasul nti: determinm cu claritate ceea ce dorim s msurm
a. Recursul la o teorie valabil
Ne putem imagina efortul psihologului de a asambla un set semnificativ de mare de
itemi presupui a avea legtur cu constructul msurat, de a-l aplica unei populaii destul de
numeroase, de a introduce item cu item datele ntr-un program de prelucrare statistic, de a
99
desfura o analiz factorial exploratorie pentru a determina care itemi bat n direcia
constructului presupus a fi msurat i care n alte direcii, de a-i selecta i reuni pe cei mai
reprezentativi ntr-o scal uni- sau multidimensional, de a determina gradul de consisten
intern (de omogenitate) al fiecrei subscale, stabilitatea ei n timp sau legtura cu constructul
msurat prin corelare cu alte scale presupuse a msura aceeai dimensiune. Un astfel de
demers tipic pentru dezvoltarea unei scale presupune un mare consum de energie i el ar
putea s nu fie rspltit cu rezultate corespunztoare. Aceasta deoarece specialistul trebuie s
aib o cunoatere i o conceptualizare prealabil a domeniului care urmeaz s fie investigat,
fie din parcurgerea literaturii i a teoriilor n legtur cu problema/ dimensiunea respectiv,
fie dintr-o experien prealabil, fie i este cazul cel mai fericit din amndou direciile.
Prin aceasta dorim s afirmm c aspectele tehnice care vor fi invocate n paginile care
urmeaz nu trebuie supraestimate n detrimentul nelegerii naturii reale a conceptului sau
faptului psihologic care urmeaz a fi msurat.
Recursul la teoriile cele mai consistente referitoare la acest construct este
fundamental pentru c aceasta ne ajut i ne ghideaz n selectarea elementelor sale
eseniale, care vor fi ulterior transformate n itemii scalei sau ai chestionarului. Multe dintre
dimensiunile i constructele care definesc aspecte psihice, comportamentale sau sociale sunt
subtile, ambigue i nu i gsesc o expresie direct sau deplin n experiena de practician. De
aceea este foarte important s ne facem o idee ct mai clar despre ceea ce urmeaz a fi
msurat. n acest sens teoria este de cel mai mare ajutor, pentru c ea ne ajut s ne facem o
idee clar asupra aspectului ce va fi abordat psihometric. Corobornd mai multe puncte de
vedere teoretice despre o problem se degaj elementele sale eseniale, dar i neclaritile sau
ambiguitile, fapt care ajut specialistul s decid dac este necesar o nou direcie de
abordare i s construiasc o prim schi a acesteia.
De exemplu, suntem preocupai de o problem practic, cum ar fi cea a tulburrilor de
citit-scris, i observm c aceast este mult mai frecvent la biei dect la fete. Am remarcat
de asemenea faptul c printre disgrafici i dislexici proporia stngacilor este de cteva ori
mai mare dect n restul populaiei, ceea ce ne ndreptete s credem c aceste tulburri sunt
asociate cu probleme de lateralizare (manual i/sau cortical) a unor funcii importante. De
aceea am dori s crem un instrument care s fie utilizat ca adjuvant n tulburrile
instrumentale i care s diagnosticheze gradul de lateralizare manual.
Literatura domeniului dominanei manuale ne atrage atenia asupra ctorva elemente
eseniale:
100
- stngcia poate fi ereditar sau non-ereditar, adic produs prin alte mecanisme, cum
ar fi excesul de testosteron din primele luni de sarcin, care inhib dezvoltarea
emisferei stngi, cel mai adesea dominant n populaia de baz, sau stngcia
accidental, prin scoaterea din uz a minii dominante un interval mai lung de 8 luni;
- mecanismul asimetriei cerebrale are o transmitere genetic, gena LRRTM1 avnd o
mare contribuie la aceasta, ea fiind ns implicat i n producerea schizofreniei;
- exist o gen (rs dup expresia lui Annett, 1972
17
) care controleaz orientarea
levogir sau dextrogir a unei persoane;
- lateralizarea manual se asociaz strns cu lateralizarea cortical a limbajului i cu
dominana cerebral;
- lateralizarea manual este impus i de presiunile socio-culturale enorme pentru
utilizarea minii drepte, presiuni evideniabile la aproape toate popoarele, din toate
timpurile, n unele culturi ea avnd i importante conotaii religioase;
- rata stngacilor este aproximativ constant (10% din populaie) de-a lungul
timpurilor, dei de-a lungul vieii nuei singure persoane ea pare a fi ntr-o descretere
accentuat spre vrstele adulte, datorit mortalitii mai accentuate a stngacilor, de
unde i sperana de via mai redus a acestora;
- bolile autoimune, alergiile, tulburrile de somn, depresiile i tentativele de suicid,
alturi de problemele de nvat, balbism i enurezis nocturn sunt mult mai frecvente
pentru stngaci;
- problema lateralizrii nu se pune doar pentru utilizarea preferenial a unei mini, ci i
pentru picior, hemicorp sau pentru organele de sim cele mai performante (ochi i
urechi), putndu-se vorbi de o lateralizare omogen sau eterogen (ncruciat);
- problemele de citit-scris-vorbit apar mai frevent la anumite categorii de stngaci
(lateralizare ncruciat, nefamilial, patologic etc.);
- s-a avansat ideea c modul de tratare cerebral a informaiei de ctre stngaci este mai
curnd integrat-holistic i nu analitic-discursiv ca la dreptaci, de unde i plusul lor de
creativitate;
- stngacii se ntlnesc mult mai frecvent printre cei care urmeaz meserii vizuale, i
foarte rar n cele dependente de limb;

17
Annett, M. (1992). Spatial ability in subgroups of left- and right-handers. In British Journal of Psyuchology,
83, pp. 493-515.
101
- msurarea gradului de lateralizare cunoate cteva metode
18
de tip chestionar, dar pot
fi gndite i metode bazate pe aciune i observare (Annett, 1972);
- dincolo de stngcia tare sau dreptcia tare, exist variantele lor mai moi, o
multitudine de probleme fiind asociate mai curnd cu lipsa unei lateralizri ferme,
dect cu stngcia n sine;
- stngcia pare s aib efecte dezadaptative colar mult mai mari printre elevii de gen
masculin dect printre cei de gen feminin.

Din toat aceast mas de informaii i din altele de acelai tip trebuie extras cea de
interes pentru scopurile scalei ce va fi construit i apoi conceptualizat. Operaionalizarea
enormei mase de informaii despre stngai i stngcie nseamn traducerea acesteia ntr-o
form care s poat fi msurat, n cazul nostru sub forma itemilor unui chestionar sau a unor
probe practice care vor compune itemii unui test de lateralitate. Aa cum se observ, unele
dintre informaiile de mai sus par a fi mai importante dect altele, avnd rolul de a ghida
ntregul demers de construcie a scalei. Mergnd de exemplu pe modelul genetic al lui Annett
vom putea determina opt categorii referitoare la lateralitatea manual. Dac avem n vedere
problema omogenitii/eterogenitii lateraliztii va trebui s generm i s includem n scal
itemi legai de preferina pentru membrele inferioare, pentru ochi, ureche, hemicorp. Dac
lum n calcul dimensiunea ereditar a stngciei vom avea itemi legai de frecvena acestei
particulariti printre rudele apropiate, iar dac avem n vedere dimensiunea ei evolutiv pe
scala vrstelor vom avea itemi care s disting ntre manifestrile timpurii i cele ulterioare
ale stngciei.

b. Nivelul de specificitate al scalei
Din exemplul de mai sus se poate vedea c problema lateralizrii poate fi abordat
ntr-un cadru mai larg i mai general sau ntr-un cadru mai restrns i mai specific. Faptul de
a fi mai global poate fi un avantaj, dar preul pltit este o lungime mai mare a scalei i o
consisten intern mai sczut. Se tie c, cu ct nivelul de specificitate este mai ridicat,
itemii se coreleaz mai strns ntre ei i cu constructul sau variabila latent msurat. De
exemplu, dac chestionarul de lateralitate construit este unul antropologic, el va include itemi
care privesc atitudinea cultural fa de dextralitate, cum ar fi dac ai prefera s fii operat de

18
Oldfield, 1971: Edinburgh Handedness Questionnaire; Annett, 1970: Laterality tests and interests.
102
un chirurg dreptaci sau stngaci (Holder, 1992, Hand Preference Questionnaire
19
); dac scala
este destinat vrstei de peste 14 ani, ea poate fi una care doar ntreab oamenii despre mna
cu care scriu, deseneaz, taie, arunc, se perie, mtur, deschid o cutie etc. (Edinburgh
Handedness Inventory, EHI, Oldfield, 1971
20
); dac este destinat determinrii obiective a
minii dominante, se vor folosi itemi acionali, grupai ntr-o scal ca cea a lui Annett, unde
se folosesc n aciune efectiv cocoloae de hrtie, foarfece, chibrituri, periu de dini, ciocan
de jucrie etc. Copiii pot fi examinai i n clas, cerndu-li-se s se joace n perechi pentru a
exersa aciunile care vor fi observate, fapt ce va face posibil completarea grilei de observaie
sau a chestionarului acional de ctre observator.
ntr-o abordare de tip obiectiv noi
21
am propus determinarea unui indice de lateralitate
prin dou probe de tip aciune, cronometrate: tapping (puncte btute rapid pe o foaie de hrtie
cu creionul, cu mna dreapt, apoi cu mna stng, cte 10 secunde pentru fiecare, singura
constrngere fiind numrul de puncte) i trasaj (linii verticale, drepte, apropiate, executate
rapid, cte 6 secunde cu mna dreapt, apoi cu cea stng, dup o execuie demonstrativ
prealabil a examinatorului).
Gradele de specificitate i de obiectivitate cele mai ridicate sunt n ultimul exemplu,
deoarece probele sunt simple, clare, uor de testat, iar dispozitivul de nregistrare este unul
precis. Mai mult, se operaionalizeaz bine problema lateralizrii pentru sarcinile motrice
grosiere i pentru cele de finee, ambele fiind agregate ntr-un concludent Indice motric.
De aceast cerin a specificitii se leag i problema a ce includem n scal pentru a
fi msurat. n cazul de mai sus distincia este evident: itemii sunt de tip autoraportare
(primul exemplu), rezultai din observaie (al doilea exemplu) sau rezultai din msurarea
efectiv a unor comportamente induse (al treilea exemplu).
Dac am alctui o scal care amestec cele trei maniere de obinere a itemilor ar
rezulta probabil un instrument compozit, eterogen, mai puin maniabil. Problema se refer
ns nu numai la cum sunt produi itemii, ci i la coninutul lor. De exemplu, dac concepem
anxietatea ca pe un fenomen psihic (o team difuz, fr obiect) nu are rost s amestecm
elemente somatice ntr-o fenomenologie psiho-comportamental. Dar dac am relevat
conotaiile psihosomatice ale acesteia, putem concepe i operaionaliza anxietatea mult mai
nuanat, dintr-o parte afectiv, una cognitiv i una somatic, cum a procedat Burns n

19
Holder, M.K. (1992). Hand Preference Questionnaire: One Gets What one Asks For. M. Phil thesis,
Department of Antropology, Rutgers University, New Jersey, USA.
20
Oldfield, R.C. (1971). The assessment and analysis of hanhdedness: The Edinburgh Inventory.
Neuropsychologia, 9, pp. 77-114.
21
Clinciu, A.I. (2003). Vizual i auditiv n structura cognitiv uman. Tez de doctorat nepublicat.
Universitatea Bucureti, Facultatea de Psihologie i tiinele Educaiei.
103
chestionarul su. Acesta i-a construit Inventarul de anxietate astfel nct indicele global
obinut s fie o expresie a sentimentelor anxioase, a gndurilor anxioase i a simptomelor
anxioase de ordin fiziologic. Aceast perspectiv asupra anxietii este mult mai nuanat i
mai util ntr-o cercetare despre stres dect una care ar evalua doar aspectele cognitive sau
afective ale acesteia.
Pe de alt parte, ntr-un chestionar de scheme cognitive anxioase ar trebui respectat
reeta cognitivist de abordare, fiind eliminate referirile somatice la anxietate, n favoarea
cogniiilor patologice.


10.2.2. Pasul al doilea: generarea unui set mare de itemi
a. Lungimea i redundana setului iniial de itemi
Pasul acesta presupune crearea efectiv a unui mare numr de itemi, posibili candidai
la forma final a scalei. Acetia trebuie s fie gndii astfel nct s fie efectiv n legtur cu
constructul latent msurat, dei dovezile n acest sens vor fi culese mai trziu. Scopul de
ansamblu al scalei va fi cel care ne ghideaz n procesul de generare al itemilor, care sunt
proiectai fiecare ca un mic test separat, corelat cu variabila latent msurat. Dac fiecare
item este sensibil asociat cu aceast variabil, prin agregarea unui numr mare de itemi se
sper ca scala rezultat s fie o expresie mult mai concludent a variabilei sau a constructului
respectiv. Un test/scal bun() este aa datorit celor mai mici uniti care l compun i care
sunt itemii si.
Universul itemilor care descriu un construct psihologic este foarte larg i deschis, de
aceea nu se pot stabili cu precizie graniele sale. Vom fi de acord ns c putem asambla un
numr mare de itemi, c acetia pot corela ridicat ntre ei la un nivel ridicat, scala fiind una
omogen, fr ca doar prin aceasta ea s fi prins esena constructului respectiv. Fericire, sens
existenial, satisfacie n munc, adaptare colar sau la locul de munc, complian, identitate
sexual, satisfacie marital etc. sunt concepte vagi, care au nevoie de un cadru teoretic care
s le clarifice, dar i de o bun experien pentru a genera itemii care s le surprind esena.
O problem important a acestei faze de construcie a scalei este cea a redundanei:
trebuie ea evitat, trebuie admis, i pn la ce nivel? Teoreticienii admit c, atunci cnd
vrem s construim o scal, redundana nu este deloc un lucru ru, aceasta deoarece itemii
redundani sunt i intercorelai, prezena lor ducnd la creterea consistenei interne a scalei.
Singura problem este s avem o redundan bun, folositoare, care se refer la constructul
msurat, i nu la aspecte incidentale ale itemilor, cum ar fi acelea legate de detalii minore de
104
formulare. Cnd exprimi aceeai idee n dou moduri distinct diferite redundana respectiv
poate fi util, pentru c nu putem ti cu suguran care dintre formulri este mai diagnostic i
mai bine acceptat de subieci. De exemplu Nu am nici un fel de jen n a aborda persoane
necunoscute i mi vine uor s intru n vorb cu persoane necunoscute sunt enunuri
foarte similare, deoarece au n vedere dimensiunea inhibiiei, definitorie pentru fobia social.
Diferenele nu sunt ns pe sensul principal al enunurilor, ci pe conotaiile rezultate din
modul de exprimare al ideii: n prima situaie propoziia ncepe negativ, n a doua afirmativ;
n prima cuvntul jen are i conotaii etice (fr ruine), ceea ce nu este cazul n a doua; n
prima formulare a aborda este mai pretenios dect mai familiarul a intra n vorb. Nu tim
ns care dintre cele dou formulri este cea mai bun i de aceea le putem include n forma
iniial a scalei, urmnd s amnm decizia legat de selecia celui mai bun item pn la
prelucrarea datelor rezultate din aplicarea instrumentului.
O regul spune c putem tolera o oarecare redundan i n faza final de construcie a
unei scale, dei teoretic este permis mai mult redundan n faza iniial dect n cea final,
pentru a da ocazia constructorului scalei s-i manifeste preferinele i s selecteze forma mai
bun a itemilor redundani.
Problema redundanei angajeaz direct o problem la fel de important, cea a
numrului de itemi care compun setul iniial. Noi tim c un atribut fundamental al scalei
este consistena sa intern i c aceasta este dependent de dou lucruri: de gradul de corelare
al fiecrui item cu scorul final la constructul msurat i de numrul de itemi ai scalei. De
aceea putem afirma c, cu ct un set iniial de itemi este mai larg, cu att este mai bine,
deoarece avem de unde selecta. Trebuie tiut ns foarte bine c un set de itemi prea extins,
dintre care muli se repet, poate genera consumuri de timp suplimentare, sau chiar
plictiseal, putnd compromite sinceritatea i autenticitatea rspunsurilor. De aceea
cercettorul poate elimina din start itemii neclari, cu relevan sczut sau cu prea mult
similaritate, pentru a rmne n final la un set iniial rezonabil, pe care s-l aplice ntr-o
singur edin, pentru a nu avea prea mult moarte experimental.
Dei nu exist reguli fixe, paritatea dintre lotul iniial de itemi i cel final poate fi de
de 4/1 sau 3/1 (30-40 de itemi iniiali pentru o scal de 10 itemi) sau, cel mai adesea de 2/1,
atunci cnd itemii sunt construii cu grij i cu o bun cunoatere a constructului msurat.
Deoarece forma iniial depinde de cea final, ct de lung trebuie s fie o scal pentru a
avea caliti psihometrice bune? Este un rspuns dificil de furnizat, deoarece fiecare item
105
poate fi considerat ca o singur scal i exist chiar scale alctuite dintr-un singur item.
22
n
mod obinuit, cu ct o scal are mai muli itemi, cu att mai mult ea poate dispune de caliti
psihometrice (fidelitate, validitate, sensibilitate) mai bune; 50-60 de itemi pentru o scal
unidimensional reprezint limita de sus, iar 10-20 de itemi limita de jos. Scalele sub 10 itemi
pot fi utile instrumente de screening, dar nu difereniaz dect grosier ntre subieci, pe cnd
scalele lungi dau diferenieri de mai mare finee.

b. Reguli de scriere a itemilor unei scale
Dei procesul cel mai delicat, mai creativ i interesant din toat ciclicitatea descris
aici, scrierea itemilor nu este strict normat, lsnd loc masiv inspiraiei, creativitii i
experienei n domeniu. Scopul acestei etape este pur i simplu acela de a identifica o
multitudine de maniere n care constructul se leag de viaa real sau de comportament.
Pentru aceasta recursul la instrumente similare, la literatura (adnotat) a problemei pot fi
foarte utile (itemi de import), dar la ce bun s ncerci s compui o scal cnd deja exist
altele similare? Motivul pentru care ncercm altceva este pentru c sperm s o facem mai
bine dect alii sau pentru c mergem pe o cale nou i nebttorit. A scrie repede, la
inspiraie i relaxnd spiritul critic poate fi cel mai recomandat, dei personal cred c aceast
faz este cu att mai productiv cu ct creativitatea i spontaneitatea ei sunt mai bine
pregtite prin faza de documentare teoretic (parcurgerea literaturii aferente pentru a ne face
o idee cuprinztoare i nuanat despre constructul n cauz) i prin faza de incubaie/gestaie,
cnd lsm informaia s dospeasc i s se decanteze.
Un creator avizat tie c nainte de a se aterne pe scris itemi el trebuie s aib o
reprezentarea complex i nuanat a constructului de msurat; c a notat determinrile
eseniale ale acestuia pe o foaie de hrtie, pe care le-a studiat ncercnd s le pun mental n
legtur cu tema scalei sale, pentru a-l orienta ca un fel de ghid. De exemplu, fericirea
conjugal depinde ea doar de calitatea vieii sexuale a cuplului, sau i de implicarea soilor n
responsabilitile casnice (creterea copiilor, elaborarea bugetului i a modului de cheltuire a

22
Torque Test este o prob cu un singur item care i propune s determine simultan preferina manual i
dominana cerebral. Subiectul i scrie numele cu o mn i apoi l ncercuiete, dup care face acelai lucru cu
cealalt mn. Mna care produce cea mai frumoas scriere este cea preferat; dac ambele cercuri sunt
orientate n sensul acelor de ceasornic, dominana cerebral este de dreapta; dac ambele cercuri sunt orientate
n sensul invers acelor de ceasornic, dominana cerebral este de stnga; dominana cerebral este mixt n
situaia n care un cerc are o orientare i cellalt orientarea invers.
Testul pare seductor prin simplitate i acuratee, dar are multe inconveniente. Asfel, mai ales n cazul
scrierii, preferina manual poate fi impus prin educaie, subiectul efectund multe alte aciuni cu cealalt
mn. La o singur aplicare poate interveni cu o oarecare probabilitate hazardul; nu tim nimic de faptul dac
preferina pentru mn se extinde i asupra piciorului etc. (Vezi Molly Kalafut, Left-handedness. Nature or
Nurture, Blessing or Course?).
106
banilor, implicarea n curenie), de calitatea comunicrii dintre soi, de gradul de
independen reciproc acordat, de valorile comune, de tolerana fa de profesia celuilalt, de
acceptarea prietenilor partenerului, de multitudinea de proiecte i interese comune, de jocurile
comune, de aspectele hedonice i nonhedonice ale relaiei etc.?
Dei este foarte greu de fixat reguli, dm mai jos cteva caracteristici ale itemilor
buni i ri, indicnd i cele mai frecvente erori care pot aprea n scrierea acestora.
- Dei nu este indicat s sacrificm nelesul itemilor n favoarea scurtimii lor se
recomand ca itemii s fie scuri i clari. Putem formula acelai item astfel: La o
petrecere rein cu uurin chipurile i numele musafirilor; mi trebuie destul de
mult timp i am adesea mari probleme n a memora de la prima ntlnire numele sau
chipurile invitailor la o petrecere mai mare. Al doilea enun este de evitat pentru c
este lung i neclar, pentru c introduce termenii destul de mult i mai mare care sunt
vagi.
- Nivelul de dificultate al citirii la care sunt scrii itemii este de asemenea important.
Iat doi itemi din Miller Marital Locus of Control: Adesea gsesc comportamentul
soului meu nepredictibil; Cnd suntem n conflict, soul meu este acela care
reconciliaz cel mai adesea situaia. Cuvintele nepredictibil i reconciliaz in de un
nivel mai ridicat de cultur, fiind pretenioase n raport cu omul comun. Dei exist o
mulime de metode de a determina vrsta lecturii, s-a czut de acord c nivelul de
lectur al omului care citete ziarul este corespunztor clasei a asea (12 -13 ani).
Multe chestionare de personalitate (MMPI, CPI) presupun o vrst a lecturii tipic
acestui nivel, fenomen de care dac nu inem seama, reducem spectrul de utilizare al
unui instrument doar la anumite categorii de persoane. O propoziie de lungime medie
pentru clasa a asea are ntre 14 - 18 cuvinte i 24 de silabe; pentru clasa a aptea ea
are 18 cuvinte i 24 de silabe. Pentru majoritatea instrumentelor care aspir spre o
utilizare extensiv n populaie nivelul de lectur anticipat este ntre clasa a cincea i a
asea. Dificultatea citirii i nelegerii unui text provine nu numai din lungimea sa, ci
i din caracteristicile sintactice i semantice ale itemului.
- Cele mai frecvente erori de evitat sunt negaia, dubla negaie i enunurile dublu
ncapsulate (cu dubl determinare). De exemplu formularea Nu-mi place s nu-mi
fac temele trebuie evitat, pentru c rspunsul solicit un efort de analiz mare iar
rezultatul final este nesigur. De fapt i negaia simpl creeaz probleme de claritate: la
itemul Nu-mi plac rromii rspunsul Nu poate s semnifice simultan acordul (nu, nu-
107
mi plac) sau dezacordul (nu sunt de acord cu propoziia respectiv). Dubla
determinare este mai greu de sesizat. M enerveaz la culme invidia i dorina de
rzbunare a oamenilor pune respondentul n dificultate atunci cnd sursa enervrii
sale este ori numai invidia, ori numai dorina de rzbunare. Scorul pozitiv la acest
item nu distinge dac prima, a doua sau ambele determinri trebuie s fie prezente
pentru a rspunde afirmativ la itemul respectiv. Alt exemplu: Sprijin drepturile
rromilor pentru c discriminarea este un pcat pedepsit de Dumnezeu. Pot s sprijin
drepturile rromilor pentru c discriminarea este mpotriva valorilor democraiei, pe
care eu le apr, i nu pentru ea c este un pcat pedepsit de instana divin.
- Trebuie evitate pe ct se poate erorile de formulare care produc ambiguitate.
Reprezentanii notri din guvern ar trebui s susin cu mai muli bani cercetarea
tiinific induce confuzie din cauza pronumelui notri: se refer la noi ca popor, la
noi ca grup de partid sau la noi, cei din sistemul de nvmnt? Alteori confuzia
pleac de la utilizarea formei adjectivale n locul substantivului: Tratamentul
diabetului trebuie s fie o prioritate a sistemului de sntate sun mai bine i mai clar
dect Tratamentul diabeticilor trebuie s fie o prioritate a sistemului de sntate,
pentru c un sistem de sntate se lupt cu boala la modul cel mai general, i abia n
secundar cu cei care i-au czut deja victim. La aceste surse de ambiguitate se mai
adaug i propoziiile cu dublu neles. Guvernul N. a dat n primire corect gestiunea
rii poate produce mult ilaritate i confuzie printre respondeni din cauza sintagmei
a da n primire care n jargon nseamn a muri.
- Propoziii cu coninut pozitiv i negativ prezente n aceeai scal constituie o
precauie necesar pentru a evita distorsionarea rspunsurilor subiectului prin nevoia
de conformism, de a fi de acord sau de a consimi. n chestionarul de Stim de sine
(RSE) al lui Rosenberg (1965) propoziia A vrea s am mai mult respect pentru
mine este urmat de Uneori m simt inutil, ambele afirmative ca form, dar una cu
coninut pozitiv iar celalt negativ. Acest lucru oblig respondentul s evalueze cu
atenie fiecare item nainte de a da un rspuns, ceea ce duce la evitarea tendinelor de
contaminare pe care l-ar produce formularea exclusiv pozitiv a itemilor. DeVellis i
Callahan (1993)
23
remarc faptul c aceast precauiune de a introduce itemi cu
polaritate invers, negativ, are un pre, deoarece se poate produce o confuzie (mai


23
DeVellis, R.F., Callahan, L.F. (1993). A brief measure of helplesness: The helplesness subscale of
Rheumatology Attitude Index. Journal of Rheumatology, 20, pp. 866-869.
108
ales n cazul chestionarelor lungi) ntre gradul de acord al respondentului i coninutul
itemului, fr a mai ine cont de polaritatea negativ i de exprimarea triei atributului
de msurat. Concluzia ar fi c itemii formulai n direcie opus au performane mai
slabe dect cei cu orientare direct i c dezavantajele includerii lor n scal atrn
mai greu dect presupusele beneficii. Soluia ar fi, mai ales pentru chestionarele mai
lungi, ca numrul acestor itemi s fie mai mic dect cei formulai pozitiv, dar s fie
diseminai printre acetia.


10.2.3. Pasul al treilea: determinarea tipului de format al msurtorii
Aceast chestiune are n vedere mai puin itemul i mai mult formatul tipului de scal
pe care subiectul va rspunde. Dei muli autori nu fac distincia ntre o scal i un index
aceasta exist i trebuie luat n considerare. O scal difer de un index prin aceea c ntr-un
index itemii nu au nevoie s fie pui ntr-o anumit ordine, fiecare item avnd aceeai
pondere i importan, ceea ce permite nsumarea lor cu scoruri egale, rezultatul fiind chiar
indexul. n sens foarte larg, o scal este un set de numere ori de alte simboluri utilizate pentru
a desemna caracteristici ale unei variabile i care este utilizat pentru msurare. Numerele de
pe un termometru sau cuvintele mic mediu i mare de pe cutia de aer condiionat sunt
scale. Vogt (1999, p. 256) distinge i un neles mai special al cuvntului scal care este un
grup de msuri relaionate cu o variabil. Itemii dintr-o scal sunt aranjai ntr-o anumit
ordine a intensitii sau a importanei lor.
24


a. ScaleleLikert sau de tip Likert
Sunt cele mai larg utilizate n tiinele sociale pentru determinarea atitudinilor datorit
faptului c sunt uor de construit i tind s aib o mare fidelitate, ele fiind potrivite i pentru
cosntrucute multidimensionale. Rspunsurile respondentului sunt gradate de la Puternic de
acord, De acord, Nici acord, nici dezacord, Dezacord, Dezacord puternic. Tipul de expresii
verbale pentru a msura intensitatea poate varia considerabil, subiecii putnd fi chestionai
dac aprob n totalitate, aprob parial, dezaprob uor, dezaprob n totalitate. Deoarece
scalele Likert sunt destinate opiniilor, credinelor i atitudinilor, este o problem alegerea
rspunsurilor potrivite pentru categoriile extreme, care nu trebuie s fie de genul ntotdeauna
sau niciodat, pentru c aceste situaii se ntlnesc destul de rar n viaa real. n consecin

24
Vogt, W.P. (1999). Dictionary of Statistics and Methodology. A Nontechnical Guide for the Social Sciences.
Sec. edition. Thousand Oaks, London, New Delhi: Sage Publications, p. 256.
109
ele vor fi alese ct mai rar, pentru a nu contribui prin aceasta la descreterea variabilitii
scorurilor pentru itemul respectiv.
De fapt, scalele Likert au o interesant caracteristic, rezultat din faptul c ele au
dou modaliti de a grada intensitatea constructului respectiv pentru populaia studiat. Una
ine chiar de modalitile de gradare a acordului/dezacordului din variantele de rspuns
propuse, fapt de care am vorbit deja.
O a doua modalitate ine de tria/slbiciunea modului cum este exprimat itemul
nsui. De exemplu, opinia despre politicienii romni post-decembriti ar putea fi exprimat
la trei niveluri de trie (duritate):
1. Dezastrul moral i economic din Romnia post-revoluionar este integral opera politicienilor
incompeteni pe care i-am avut.
2. Deoarece nu am avut o clas politic constituit n timp, liderii politici ai Romniei post-
revoluionare au ntrziat evoluia economico-social a rii din cauza greelilor provocate de lipsa lor
de experien.
3. n pofida unor greeli cauzate de lipsa de experien, politicienii romni sunt pe cale s
construiasc o democraie real n Romnia post-revoluionar.
Cum tendina obinuit a majoritii oamenilor este aceea de nu fi din bun sim
prea ofensiv-agresivi, prima afirmaie ar putea discrimina doar printre cazurile extreme,
deoarece este una foarte tare. Ultima afirmaie, care este cea mai moale i mai mpciuitorist
are un caracter mai agreabil, ar putea conveni majoritii oamenilor, dar ar putea indica mai
mult lipsa opiniei, dect prezena ei. Ori o cercetare caut mai curnd ceea ce este i se
manifest (prezena), dect ceea ce nu este (absena). Aadar este o iluzie s credem c un
item poate baleia ntreg spectrul unei opinii n uniti de lungime egal. Avem doar
posibilitatea ca, din combinarea triei/slbiciunii modului de formulare a itemilor i din
tipurile de gradaii de pe scala de rspuns folosit s centrm itemul pentru zona
populaional i pe problema care ne intereseaz. Itemul trebuie s rspund la ntrebarea:
Cum sunt dispui s rspund oamenii la diferitele intensiti sau trii ale constructului
msurat prin acest item?.
Prezentm mai jos dou exemple de itemi construii pe scala Likert.
Prin sistemul reformei de la Bologna, nvmntul romnesc s-a integrat bine nvmntului
european.
1. Dezacord 2. Dezacord 3. Dezacord 4. Acord 5. Acord 6. Acord
puternic moderat uor uor moderat puternic
Combaterea consumului de igri este o prioritate naional de vrf.
1. Complet 2. Mai curnd 3. Aa i aa 4. Mai curnd 5. Complet
adevrat adevrat neadevrat neadevrat
110
b. Scalele Thurstone
Modalitate complex, rafinat i dificil de a construi itemii unei scale, iniiat de
Thurstone, acest tip de scal i-a pierdut mult din relevan n favoarea scalelor Likert. n
principiu elegana i dificultatea metodei vine din pre-calibrarea itemilor i asamblarea lor
pentru a rspunde la diferite niveluri de prezen n item a atributului sau a constructului
msurat. De regul, n acest tip de scal rspunsurile nu mai au o multitudine de nuane,
deoarece gradarea intensitii este pe vertical (mai muli itemi asamblai pe o aceeai
coloan n funcie de mrimea progresiv a atributului msurat), i nu pe orizontal
(modaliti din ce n ce mai accentuate ale intensitii atributului la un singur item, tipic
pentru scala Likert). Astfel, pentru aceeai idee se genereaz mai muli itemi (care au
formulri diferite) care s reprezinte intervale egale de-a lungul unui continuum vertical, ceea
ce confer scalei proprieti matematice remarcabile, pentru c se preteaz la tratamente
statistice tipice scalelor de intervale. Nunaly (1978) susine c este incomparabil mai uor s
explici principul unei scale Thurstone dect s o construieti. A gsi itemi care s rezoneze
la intervale egale cu constructul msurat (ca un diapazon acordat pe o anumit frecven) este
destul de dificil. Acest deziderat exprimat de scalele Thurstone i-a gsit totui o manier de
rezolvare prin Teoria rspunsului la itemi, unde calibrarea acestora urmrete totui un cu
totul alt demers.
Prezentm mai jos dou rspunsuri tipice pentru scala Thurstone.

Exemplul 1.
Cnd un elev are dificulti de nvare, profesorii:
Adevrat Fals
l insult
l critic sau ironizeaz
i ntrerup rspunsul
Nu au nici o reacie
i explic suplimentar
l ncurajeaz
Fac cu el pregtire dup ore

Exemplul 2.
a. Faptul de a termina cu medie mare coala i de a prinde un liceu bun este tot ce-mi doresc ca
rsplat de la copilul meu. Acord ........................ Dezacord ...................
b. Pentru mine ca printe cea mai mare rsplat din partea copilului este s fie sntos i s mearg la
coal. Acord ........................ Dezacord ....................
c. Fericirea copilului meu nu are nimic de-a face cu ceea ce el dobndete prin educaia colar sau cu
scopurile materiale. Acord ........................ Dezacord ....................
111
Modalitatea de gradare pe vertical i de construire a ierarhiei nu este o operaiune
foarte simpl. Metoda utilizat de Thurstone (1929) a fost cea a comparrii perechilor de
rspunsuri, deoarece ea presupune ca subiecii-observatori s judece de exemplu enunurile
A, B, C luate cte dou (A cu B, A cu C i B cu C), s evalueze din frecvena aprecierilor
ordinea ierarhic a celor trei enunuri, dup care s construiasc un indice pentru distana
dintre ele, care va fi exprimat n termeni de probabilitate prin raportarea la curba lui Gauss.
Scala obinut n felul acesta va putea fi verificat: pornind de la valorile ei trebuie s se
poat face predicii asupra viitoarelor alegeri ale indivizilor.
25


c. Scalele Guttman
Acestea sunt un tip de scal creat de Louis Guttman. Original ea a fost destinat s fie
utilizat dup ce datele au fost colectate, pentru a vedea dac ietemii dintr-un index pot fi
aranjai ntr-o scal n funcie de tria sau de puterea lor. De exemplu, ntr-o cercetare despre
avorturi itemii unui chestionar pot fi aranjai ierarhic ca intensitate astfel:
Ai fi de acord ca femeile s fac avort dac:
1. A nu face avort i-ar periclita viaa proprie?
2. Ftul este malformat?
3. Este prea srac pentru a se putea ocupa n mod adecvat de copil?
4. Ea nu mai dorete s aib copii?

Cine ar rspunde la aceast ntrebare ar face-o ntr-o manier scalar: persoanele care au
rspuns afirmativ la ntrebarea 4 ar fi rspuns afirmativ i la ntrebrile 1, 2, 3; cele care au
rspuns la ntrebarea 3 ar fi rspuns i la ntrebrile 1 i 2, dar nu obligatoriu i la 4, i aa
mai departe. Dac scala nu ar fi de tip Guttman, nu ar exista un astfel de pattern i rspunsul
afirmativ la numrul 4 nu ar implica rspunsurile afirmative i la celelalte 3 ntrebri.
Scalele Guttman sunt foarte utile i indicate pentru informaiile obiective sau n
situaiile n care este logic necesar ca, dac ai rspuns afirmativ la un anumit nivel dintr-o
ierahie, aceasta nseamn s faci acelai lucru i pentru nivelurile inferioare ale ierarhiei. De
exemplu, la ntrebarea dac fumai, variantele de rspuns pot fi organizate ierarhic astfel: nu
fumez deloc; fumez sub 10 igri pe zi; fumez sub 20 de igri pe zi; fumez sub 30 de igri
pe zi; fumez mai mult de 30 de igri pe zi. Variantele de rspuns sunt aranjate astfel c
nivelul la care este prezent atributul este indicat de cel mai de sus item la care subiectul a dat
un rspuns afirmativ, cei de sub el fiind i ei implicit afirmativi (deoarece reprezint niveluri
mai sczute ale atributului). Deci aceast scal presupune o gradaie i decelarea punctului

25
Vezi Laurens, S., Moscovici, S. (2007). Construirea scalelor. In S. Moscovici, F. Bruschini (coord.),
Metodologia tiinelor socioumane. Iai: Polirom, pp. 482-414.
112
critic n care rspunsul afirmativ devine negativ. Dac pentru informaiile obiective scala
Guttman este foarte indicat, pentru alte categorii de fenomene este dificil de ordonat
rspunsurile ntr-o manier uniform pentru toi indivizii, fapt care limiteaz utilizarea acestui
tip de scal. Pentru situaiile n care ordonarea itemilor este important, modelele bazate pe
teoria rspunsului la itemi par a oferi soluii mai adecvate. Prezent mai jos doi dintre itemii
scalei de depresie Beck, asamblai pe o scal Guttman.
A. TRISTEE

1. Nu m simt trist.
2. M simt trist.
3. Sunt trist tot timpul i nu pot scpa de tristee.
4. Sunt att de trist i de nefericit nct nu mai pot suporta.

B. PESIMISM

1. Viitorul nu m descurajeaz.
2. M simt descurajat cnd m gndesc la viitor.
3. Simt c nu am ce atepta de la viitor.
4. Simt c viitorul este fr speran i nimic nu se mai poate ndrepta.

d. Scala de distan social Bogardus
Acest tip de scal a aprut n 1923, fiind destinat s msoare distana social, adic
distana care separ un grup de altul. De aici rezult posibilitatea de a da o expresie
msurabil raporturilor de discriminare social dintre grupurile etnice, naionale sau
religioase. Scala Bogardus poate fi considerat n acelai timp i o scal de proximitate
deoarece indic cea mai mic proximitate acceptabil pentru un individ fa de grupul luat n
considerare. Individul este chestionat dac ar fi dispus, de exemplu, s triasc n aceeai ar
cu rromi; s triasc n aceeai localitate cu acetia; s aib vecini rromi; s locuiasc n
aceeai cas cu rromi; s aib prieteni de etnie rrom; s aib rude rromi; s aib un copil care
se cstorete cu o persoan de etnie rrom.
Populaiile pot fi comparate simultan trecnd pe vertical categoriile de proximitate
iar pe orizontal populaiile ce vor fi comparate: negri, latino, europeni, asiatici, sau turci,
evrei, polonezi, spanioli etc., pentru America. Sau romni, maghiari, sai, igani, ruteni etc.
perntru Romnia. Evident, distanele studiate sunt unele sociale i nu fizice, dar exprimarea n
termeni fizici a acestora este judicioas. Acest tip de scal permite compararea atitudinilor
grupurilor fa de alte grupuri deoarece enunurile despre obiectul social studiat pot s fie
astfel clasate pentru a indica fie proximitatea, fie distana. Scalele construite n acest fel dau
rezultate n acelai timp interesante i valide apreciaz Laurens i Moscovici (op. cit., p.
391).
113

e. Numrul optim al categoriilor de rspuns
Cei mai muli dintre itemii scalelor se prezint sub forma unui trunchi comun care
este enunul de baz al itemului, i o categorie de descriptori care s indice gradul de
acord/dezacord al respondentului cu enunul respectiv. Atenia noastr ce centreaz acum pe
aceast a doua categorie. Statistica ne nva c o caracteristic important a unui item sau set
de itemi este variabilitatea/variana. Teoria rspunsului la itemi determin tocmai relaia
existent ntre variabilitatea itemului i a scalei ca ntreg. Cu ct este mai mare aceast
variabilitate cu att este mai bine, deoarece variabilitatea itemilor contribuie la creterea
variabilitii de ansamblu a ntregii scale. Cu ct ea este mai mare, cu att se pot determina
mai multe categorii de scor i deci scala este mai discriminativ.
Variabilitatea unei scale depinde de doi factori: de numrul itemilor (cu ct mai muli
itemi, cu att mai mult variabilitate) i de numrul variantelor de rspuns pe care acetia le
prezint (cu ct mai multe, cu att mai mare este i variabilitatea itemului). De aici i
interesul pentru problema abordat n acest paragraf. Vom distinge deci existena unor itemi
cu o manier de scorare srac. Deoarece sunt necesare cel puin dou posibiliti de rspuns,
acest mod de operare poart numele de scorare binar. n msura n care exist posibilitatea
de a avea o multitudine de clase de scor, s zicem 100, cum se poate distinge fr fals
precizie ntre nivelurile 66 i 67 de anxietate, de exemplu? Cu ct mai multe clasele de
rspuns, cu att posibilitatea de a diferenia realmente ntre valorile de scor apropiate
descrete. n practic rareori se folosesc mai mult de 7-11 clase de scor i foarte frecvent ntre
3 i 7.
Opiunea binar de scorare este frecvent utilizat, cci, dei au cea mai mic
variabilitate a scorurilor per item, scalele de acest tip se completeaz extrem de facil i rapid,
lsnd deschis posibilitatea de a introduce un numr mai mare de itemi pentru a crete
variabilitatea de ansamblu a scalei sau pentru a vedea cum noi categorii de fapte coroboreaz
cu constructul msurat. Aceast manier de scorare este tipic dar nu exclusiv! scalelor
Thurstone i Guttman datorit complexitii de construcie a itemului, care agreg pe
vertical mai multe enunuri gradate ierarhic. De asemenea, acest tip de itemi este numit i cu
alegere forat
26
. Datorita uurinei cu care se lucreaz, opiunea binar este extrem de util n

26
Atenie, itemii cu alegere forat nu sunt numai cei binari, de tipul Adevrat/Fals sau Da/Nu, ci i unii itemi
pari pentru care, neexistnd varianta ehivoc din mijloc (aa i aa), subiectul trebuie s opteze clar ntr-o
direcie sau n alta.
114
completarea listelor de adjective prin care se investigheaz trsturile de personalitate
(modelele Big Five).
Dac la un pol sunt opiunile binare, la celallalt pol este numrul mare sau foarte
mare de clase de scor care pot aduce, cum am artat anterior, o fals precizie, adic o fals
variabilitate. Din statistic tim c variabilitatea poate fi descompus ntr-o parte bun,
numit i sistematic, deoarece este strns legat de oscilaiile reale ale prezenei
constructului msurat n item, i dintr-o parte rea, de eroare. Deoarece cretarea variabilitii
pe scalele cu numr mare de variante de rspuns se face n contul erorii, i nu al variabilitii
sistematice, nu este indicat s avem prea multe valori de scor. Numrul acestora este impus
finalmente de abilitatea respondenilor de a discrimina semnificativ ntre variantele de scor
propuse pentru fiecare item. Aceast capacitate depinde i de aranjarea n pagin a variantelor
de rspuns asfel nct acestea s sugereze un continuum. Astfel secvena:
Aproape niciodat Rareori Din cnd n cnd Deseori Aproape mereu
sugereaz bine un continuu temporal, divizat n uniti discrete de tipul frecvenei de apariie.
O problem important este dac optm pentru un numr impar de categorii de
rspuns, ceea ce n principiu este bine, pentru c se creeaz o anumit simetrie n jurul unui
punct zero natural. Acest fapt ofer ns de multe ori indeciilor posibilitatea refugierii n
rspunsul evaziv din mijloc. Numrul par sau impar de opiuni este mai puin important dect
modul cum sunt aranjate variantele de rspuns astfel ca distanele dintre ele s fie
aproximativ egale pentru a exprima gradul de acord sau de dezacord. Aceasta pentru c datele
vor fi codificate numeric prin cifre (1, 2, 3, 4, 5 pentru cinci variante de rspuns, de la foarte
puin sau deloc, la foarte mult sau n ntregime, ori invers 7, 6, 5, 4, 3, 2, 1 pentru o scal care
ncepe de exemplu cu totdeauna i se termin cu niciodat). Se poate construi astfel un
continuum divizat ntr-un numr de trepte (3-7 trepte), de la dezacordul total, la acordul
deplin sau invers.
n legtur cu punctul de simetrie din mijloc, el poate avea semnificaii diferite. Astfel
nici acord, nici dezacord indic mai curnd o atitudine apatic, pe cnd la fel de mult acord i
dezacord sugereaz o atracie egal fa de ambele variante de rspuns. Deci n cazul
numrului impar de variante de rspuns trebuie s controlm ca subiectul s nu selecteze
varianta neutr doar pentru a evita o alegere, oferind astfel un rspuns echivoc, cu o valoare
discutabil. n majoritatea situaiilor cercettorul ncearc s evite echivocul punctului central
i s foreze o alegere clar, dar trebuie spus c opiunea pentru variante pare/impare de
rspuns este funcie de ntrebare, de rspus i de scopul investigaiei. ntr-o cercetare cu dou
115
variante extreme de rspuns (ce situaii preferi: pe cele plicticoase?; pe cele primejdioase?)
introducerea variantei de rspuns ntre cele dou poate fi pe deplin justificat, subiecii
neputnd alege ntotdeauna ntre situaii att de tranant delimitate.

Ca tip de format al rspunsurilor amintim i diferenialul semantic al lui Osgood i
Tannenbaum (1955). Utilizat n studierea atitudinilor de grup, acest mod de scalare presupune
identificarea unui grup ce este studiat (s zicem avocai) i a unei liste de perechi de
adjective.
Onest __ __ __ __ __ __ __ __ __ Neonest
Competent __ __ __ __ __ __ __ __ __ Incompetent
Vorbre __ __ __ __ __ __ __ __ __ Taciturn
Liniuele (de regul 7 sau 9) reconstituie un continuu ntre polii definii de cele dou
adjective, subiectul marcnd cu un X punctul de pe acest continuu pe care el crede c se afl
membrii categoriei respective, dup care trece la ratingul urmtoarei perechi de adjective,
pn la epuizarea ntregii liste. Prin prelucrarea separat pe fiecare pereche de adjective se
poate obine un portret robot al grupului respectiv. Deoarece acest tip de scal are foarte
multe din caracteristicile necesare unor prelucrri matematice riguroase, finalmente itemii
valoroi care au fost selectai pot fi asamblai ntr-o scal omogen (de onestitate, de
competen, de moralitate etc.).

Analogul vizual reprezint un format foarte similar cu cel precedent, cu o singur
diferen major: continuumul nu mai este segregat ntr-un numr discret de categorii de
rspuns, ci subiectul marcheaz efectiv un semn pe linia continu dintre cele dou adjective,
exact n locul unde crede c s-ar plasa opinia, credina sau experiena sa. Ceea ce se
nregistreaz i se prelucreaz este distana msurat fa de unul dintre poli (se pornete de
regul de la cel care nseamn absena).
Nici urm de fric _____________________________x_____________ Fric paralizant
Dei pare seductor, acest tip de scal are destul de multe dezavantaje. De multe ori
precizia sa este o fals precizie, marcarea punctului pe linie implicnd i o doz de hazard sau
de circumstanialitate. Un subiect va distinge cu greu ntre o fric de 6,7 cm de una de 6,5 cm.
Mai mult, asignarea valorilor scalei poate fi una idiosincratic, adic distanele marcate s
aib semnificaii diferite de la un subiect la altul sau la acelai subiect la perioade de timp
diferite.
116
i totui, aceasta poate fi un tip de msurtoare foarte util atunci cnd cercetrile se
fac pe acelai subiect pentru a msura diferenele pe care tratamentul experimental le poate
aduce n tratarea fobiilor, n creterea nivelului de motivaie sau n alte direcii. Astfel, dac
scala Likert mparte un continuu ntr-un numr finit i mic de categorii, fiind foarte
maniabil, dar mai puin sensibil, scala analogului vizual poate fi sensibil la diferene mici:
dac rspunsurile la post-manipulare se deprteaz semnificativ i n aceeai direcie n raport
cu faza de pre-manipulare, se pot detecta diferenele mici pe care le-a adus tratamentul
experimental. Scala poate fi folosit i ca una alctuit dintr-un singur item, caz n care nu se
mai poate distinge cu claritate ntre instabilitatea msurtorii i instabilitatea fenomenului
msurat. Prin urmare, cea mai bun strategie ar fi aceea de a dezvolta mai multe msurtorii
de tipul analogului vizual pentru acelai fenomen, de a le asambla ntr-o scal i de a-i
determina consistena intern (stabilitatea).

O ultim problem este cea legat de cadrul temporal la care pot face sau nu referire
itemii unei scale. Prelund distincia pe care a fcut-o Cattell n legtur cu unele dispoziii de
personalitate care au un caracter situaional, n timp ce altele reprezint structuri stabile de
personalitate numite trsturi, Spielberger a dezvoltat scala STAI, n fapt o msur a
anxietii ca stare (conjunctural) i ca trstur de personalitate (stabil). Se tie de
asemenea c multe componente ale personalitii au mai mult sau mai puin stabilitate pe
axa timpului: fenomenologia afectiv de exemplu (emoie, anxietate, depresie) este mai
fluctuant dect cea cognitiv (inteligen, memorie).
O scal trebuie s fac referine i la dimensiunea temporal? Rspunsul este
nuanat: dac constructul msurat are o variabilitate temporal mare rspunsul este Da, dac
el este stabil n timp (cazul trsturilor de personalitate) rspunsul este Nu. Astfel,
chestionarul de depresie Burns se aplic periodic pacienilor depresivi pentru a monitoriza
evoluia depresiei lor n timp. Multe chestionare care urmresc aspecte fluctuante
menioneaz n instructaj formule de tipul n ultima lun, n ultima sptmn, n ultimele
zile, n ultimul timp etc. Unele chestionare includ itemi destinai detectrii modificrilor de
dispoziie aprute recent (un eveniment stresant) sau pe perioade mai lungi de timp (reforma
post-revoluie, intrarea rii n NATO etc.). Chiar formatul de rspuns al itemilor poate avea
n vedere decuparea continuumului temporal n uniti mai mici (uneori, din cnd n cnd,
des, n ultimul timp etc.).

117
nainte de a supune judecii experilor forma preliminar a unei scale, constructorul
trebuie s aib n vedere dac include sau nu i scale de validare, care s diminueze sau s
controleze tendina respondenilor la dezirabilitate social sau la fraud. De exemplu Sandra
Bem (BSRI, 1976), a inclus o scal de dezirabilitate social ca tampon ntre itemii care
msoar masculinitatea i cei care msoar feminitatea. Eysenck a inclus n EPI (Eysenck
Personality Inventory) o scal de minciun, devenit ulterior o scal de dezirabilitate social
n EPQ (Eysenck Personality Questionnaire).
n forma veche, dar i n cea revizuit a MMPI (Minnesota Multiphasic Personality
Inventory) Hathaway i McKinley au propus mai multe scale de validare, care sunt primele ce
vor fi evaluate de psiholog pentru a determina de ct credit se poate bucura profilul unui
respondent. Problema validrii se poate rezolva fie construind scale anume destinate acestui
scop, fie prelund unele deja existente pentru a le insera n chestionar pe post de distractor i
de mijloc de control.


10.2.4. Pasul al patrulea: revizia setului iniial de itemi de ctre experi
Avizul experilor este foarte necesar n legtur cu cteva probleme, sfatul lor
scutindu-ne de cheltuieli mari de resurse pentru obinerea de rezultate discutabile ca valoare.
Expertiza acestora este necesar pentru a determina:
- faptul dac definiia i operaionalizarea fenomenului sau a constructului ce va fi
msurat sunt bune sau n acord cu ceea ce i ei tiu despre acestea;
- ct de relevani sunt itemii selecionai pentru a fi inclui n formatul iniial al scalei,
n raport cu constructul msurat;
- claritatea, conciziunea i alte elemente legate de modul de formulare al itemilor;
- evidenierea fenomenelor sau a caracteristicilor importante asociate cu constructul ce
va fi msurat care nu s-au materializat n itemi corespunztori, setul iniial trebuind
deci augmentat cu noi itemi.
Prin revizuirea multitudinii de demersuri prin care vrem s surprindem constructul ce
ne intereseaz i prin examenul critic al itemilor destinai acestui scop experii ne pot ajuta la
maximizarea validitii de construct i de coninut a scalei. Trebuie ns precizat c cel care ia
deciziile finale este cel care construiete efectiv scala, i nu experii. Este posibil ca faza
pregtitoare pe care constructorul de scal a parcurs-o s-i fi dat un grad de cuprindere i de
nelegere a problemei mai bun dect al fiecrui expert n parte, aadar solicitarea lor de a fi
118
eliminai anumii itemi trebuie examinat cu atenie pentru a vedea dac ea are sau nu temei.
n al doilea rnd, cel mai adesea experii vor tinde s elimine itemii redundani, eliminnd
astfel posibilitatea constructorului de scal de a alege i de a pstra dintre cele dou formulri
aparent echivalente ale unor itemi, pe cea care se impune din analiza datelor rezultate din
aplicarea instrumentului.


10.2.5. Pasul al cincilea: administrarea setului iniial de itemi
Prima aplicare a unui instrument nou creat se face pe un lot suficient de larg pentru a
da rezultate stabile referitoare la universul itemilor. Ct de mare i de reprezentativ trebuie s
fie aceste eantion este n continuare obiect de dezbatere printre specialiti. Pentru o scal
unidimensional, 250-300 de subieci sunt suficieni pentru a desfura o analiz factorial,
urmat de o analiz de itemi i de scal, tehnici care vor ghida procesul de selecie a itemilor
ce evideniaz cel mai bine constructul msurat. Eantionul iniial se va mri n funcie i de
numrul de subscale care vor fi extrase.
Dac eantionul este mic din punct de vedere numeric pot aprea erori prin ans sau
hazard, erori ce se vor repercuta asupra corelaiilor dintre itemi i scal, astfel c unii itemi,
iniial promitori, s fie descoperii la retestare a fi de fapt unii slabi. Mai mult, loturile mici
au o probabilitate mai mare de a elimina anumite categorii de indivizi crora li se adreseaz
scala respectiv. Pe de alt parte, dac n eantionul extras caracteristica msurat este slab
distribuit, valorile parametrilor obinui (media i abaterea standard n principal) sunt mai
greu de extrapolat la populaia general. Gradul de generalizabilitate al acestora este n cazul
de fa unul redus.
De multe ori populaiile la care avem acces (elevi de liceu, studeni din campusuri
etc.) sunt destul de diferite n privina caracteristicii msurate fa de populaia int a scalei.
Unele diferene majore pot aprea din cauza conotaiilor particulare pe care anumite cuvinte
sau expresii le au ntr-o anumit categorie populaional, genernd sensuri care nu au fost
avute n vedere intenionat de ctre constructorul scalei sau care nu se regsesc ca atare i n
populaia int mai larg.


10.2.6. Pasul al aselea: evaluarea itemilor din setul iniial
Operaiunile descrise la acest nivel sunt cele mai tehnice i constituie inima ntregului
proces de construcie al scalelor.
119
a. Examinarea iniial a performanei itemilor
Cea mai important calitate pe care o cutm n aceast faz la un item este corelaia
sa ridicat cu variabila latent pe care dorim s o evideniem prin constructul msurat. Dar,
cum aceast corelaie nu poate fi determinat (dac am ti valoarea ei nu ar mai avea rost s
dezvoltm o scal), noi putem face inferene n legtur cu aceasta plecnd de la corelaia
dintre itemi i de la corelaia acestora cu scorul final la scal. Ca principiu, cu ct corelaia
dintre itemi este mai mare, cu att mai mare este i fidelitatea itemilor; cu ct itemii sunt mai
fideli, cu att mai mare este fidelitatea ntregii scale.
Deci, prima calitate a unei scale este aceea de a fi una nalt intercorelat, lucru care se
poate pune n eviden prin matricea de intercorelaii. Un examen atent al acesteia relev
existena unor itemi care au corelaii negative cu majoritatea celorlali itemi. Aceasta se poate
ntmpla din mai multe cauze. De exemplu, itemii cu coninut negativ care au fost scorai
invers; itemii care, dei scorai n acelai mod, msoar constructe diferite (dominan vs.
supunere, stabilitate emoional vs. emotivitate). n principiu, acetia ar putea fi reunii ntr-o
scal supraordonat unidimensional, dar cu doi poli (bipolar). Pentru aceast categorie
exist mai multe soluii. Prima ar fi aranjarea i numerotarea descriptorilor invers n text, n
funcie de coninutul itemilor, soluie care nu este recomandabil, pentru c nu este comod
pentru subiect. n timpul completrii, regularitatea dispunerii itemilor n scal creeaz
respondentului o anumit rutin prin care administrarea acesteia devine mai facil. Inversarea
distruge aceast regularitate, oblignd respondentul la mai mult efort. A doua i cea mai
practic soluie este aceea de a construi separat grile de corecie pentru fiecare dintre
dimensiunile msurate de scal, prin care anumii itemi vor fi scorai direct iar alii invers.
Pentru datele introduse n calculator n format de scal Likert, cea mai convenabil
soluie este scorarea invers a itemilor care ne intereseaz dup formula: Nou = (x+1) - vechi.
De exemplu, aplicnd formula de mai sus pentru o scal cu 7 trepte, 7 devine 1, 6 devine 2
etc., iar 1 devine 7. n SPSS exist i opiunea Recode into the same variable, prin care
vechea variabil este nlocuit cu cea rezultat dup scorarea invers. Avantajul este acela c
se poate face transformarea simultan, n bloc, a tuturor variabilelor de acelai format (cu
acelai numr de categorii de rspuns, definite n acelai fel).
Pentru c nu suntem ntotdeauna siguri dac rezultatul obinut prin scorare invers
este mai bun dect cel precedent, este bine s lucrm pe o copie a fiierului surs, copie
numit de exemplu Itemi inversai. Nu ntotdeauna inversarea scorrii, urmat de refacerea
matricii de intercorelaii, rezolv problema unui item. Este posibil ca el s fie corelat pozitiv
cu unii dintre itemi i negativ cu alii, deoarece el poate fi expresie a unui alt construct. n
120
acest caz soluia potrivit este eliminarea itemului respectiv, pentru a nu periclita
omogenitatea de ansamblu a scalei.

b. Corelaia item-scal
n SPSS procedeul de lucru pentru acest tip de analiz este relativ simplu, deoarece se
urmeaz urmtoarea secven: AnalyseScaleReliabilityAlphaStatistics, de unde se
activeaz Item, Scale; Scale if item deleted (scala, dac itemul ar fi nlturat). Dac dorim s
obinem i o matrice de intercorelaii sau o matrice de covariane, n dreapta-sus avem panoul
Inter-Item, de unde selectm Correlations sau Covariances (vezi imaginea de mai jos).
Finalmente dm Continue pentru fereastra Reliability Analysis: Statistics i apoi OK din
fereastra Reliability Analysis, dup ce vom fi introdus n panoul de lucru din dreapta-sus
(Items:) toi itemii care vor fi supui analizei.


Figura 10.1. Ferestrele de dialog pentru Relyability Analysis i Statstics.

Rezultatele arat la fel ca n fragmentele de output prezentate mai jos.
R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)
Mean Std Dev Cases
1. CEDA001 .1500 .3601 60.0
2. CEDA002 .1833 .3902 60.0
3. CEDA003 .1167 .3237 60.0
4. CEDA004 .3833 .4903 60.0
5. CEDA005 .1667 .3758 60.0
6. CEDA006 .5333 .5031 60.0
7. CEDA007 .3500 .4810 60.0
8. CEDA008 .3167 .4691 60.0
9. CEDA009 .4667 .5031 60.0
10. CEDA010 .1500 .3601 60.0

121
Item-total Statistics
Scale Scale Corrected
Mean Variance Item- Alpha
if Item if Item Total if Item
Deleted Deleted Correlation Deleted
CEDA001 28.7500 133.4788 .2944 .8785
CEDA002 28.7167 133.4607 .2712 .8787
CEDA003 28.7833 135.0879 .1149 .8799
CEDA004 28.5167 133.4065 .2128 .8793
CEDA005 28.7333 133.1141 .3231 .8782
CEDA006 28.3667 136.6429 -.0713 .8825
CEDA007 28.5500 132.9975 .2550 .8788
CEDA008 28.5833 132.4845 .3105 .8782
CEDA009 28.4333 132.6226 .2746 .8786
CEDA010 28.7500 131.9534 .4804 .8770
................................................
Reliability Coefficients
N of Cases = 165 N of Items = 112
Alpha = .8800

Figura 10.2. Outputurile rezultate din comenzile prezentate mai sus.

Fiecare dintre fragmentele de output de mai sus trebuie examinate cu mare atenie.
Primul element investigat este variana itemilor, pentru c de aceasta depinde finalmente
variabilitatea ntregii scale. Dac toi indivizii investigai ar rspunde doar ntr-un singur fel
la un item, variana (variabilitatea) sa ar fi zero, el nefiind de nici un folos n surprinderea
constructului de msurat. Cum unii subieci rspund ntr-un fel, iar alii n altul, fiecare item
are variabiliti mai mari sau mai mici: cei mai dezirabili sunt cei cu variabilitate mare. n
cazul de mai sus, itemii cu cea mai mare variabilitate sunt n ordine 6, 9, 4, 7 i 8, care au o
abatere standard n jur de 0,50.
Experiena statistic ne arat c este mai bine s nu examinm abaterea standard
separat, fcnd abstracie de medie. n principiu, cu ct aceasta este mai apropiat de centrul
intervalului de rspuns, cu att este mai bine, pentru c ea va face posibil mai mult
variabilitate a itemului. n condiiile n care la stnga au fost plasai descriptorii pentru
dezacord i la dreapta pentru acord, dac media este asimetric spre dreapta (negativ)
nseamn c majoritatea respondenilor au inut s fie de acord cu coninutul itemului
respectiv, deci el a fost formulat moale; dac asimetria este spre stnga (pozitiv) nseamn
c majoritatea i-a exprimat dezacordul cu coninutul itemului (formulare sa a fost cam
tare).
n cazurile de asimetrie se tie de asemenea faptul c puterea discriminativ a itemului
este mai mare pe coada (creoda) curbei gaussiene i mai mic pe ramura sa mai scurt.
122
Cum o distribuie simetric (cu media pe centrul seriei de variaie) are dou cozi lungi,
nseamn c puterea discriminativ a unui item de acest fel este maxim, el putnd distinge la
fel de bine n ambele direcii. n cazul nostru, deoarece numrul itemilor destinai depistrii
dezordinilor alimentare a fost foarte mare 112 am folosit scorarea dihotomic, deci
valoarea medie optim ar trebui s cad la jumtatea intervalului 0 1, adic n jurul lui
0,50, ceea ce se ntmpl doar pentru itemii 6 i 9.
27
Verificarea simultan a mediei i abaterii
standard este o condiie prealabil obligatorie pentru o tentativ de selecie a itemilor care se
bazeaz n principal pe corelaie. Din aceast analiz reiese c, la prima vedere, itemii 7 i 9
au simultan cele mai bune variane i valori medii.
Decizia final se ia ns dup ce se analizeaz atent datele din panoul Item-total
Statistics care are urmtoarea structur: primele dou coloane dau valorile medii i abaterile
standard pentru valorile totale ale scalei, n situaia n care itemul nu particip la scorul total.
Pentru scalele cu numr mare de itemi corecia adus la parametrii scalei prin absena unei
singure valori de scor este neglijabil, dar ea devine cu att mai important cu ct numrul
itemilor scalei este mai mic, fiind important de exemplu pentru scala de 10 itemi. Coloana
Corrected Item-Total Correlation este de maxim importan n luarea deciziei de selecie
deoarece ea indic gradul de asociere a fiecrui item cu scorul total, adic saturaia sa n
variabila latent msurat. n cazul nostru itemul 10 are o corelaie excelent cu scala (.48), n
timp ce itemii 3, 4 i mai ales 6 au corelaii slabe (itemul 6 chiar negativ) cu scorul total.
Dac scala noastr ar fi unidimensional (adic ar msura doar un singur construct i
nu mai multe) o valoare a corelaiei item-scal n jur de .30 ar fi suficient pentru includerea
itemului n scal, iar una de .40 aproape c ne foreaz s facem acest lucru. Aici este cazul s
spunem c nu ne vom concentra atenia doar pe numerele de cod ale itemilor, fapt care ne
mpiedic s tim care este coninutul lor. Cu foaia de test n mn, dup ce am identificat
itemii cu formulri foarte asemntoare (redundani), lum n cunotin de cauz decizia de
a-i pstra pe cei cu calitile psihometrice cele mai bune i de a-i elimina pe cei mai slabi.
Ultima coloan are de asemenea un rol important n luarea deciziei relative la selecia
itemilor deoarece ne indic ct ar fi fost coeficientul de consisten intern alpha dac itemul
analizat ar fi fost eliminat. Prin compararea cu scorul de referin al acestui coeficient (.88
pentru toat scala iniial, adic foarte mare) putem vedea dac absena itemului amelioreaz


27
Trebuie menionat c ipoteza rspndirii gaussiene a simptomelor tulburrilor alimentare n populaia de baz
este una care nu poate fi susinut, deoarece o mulime de itemi care determin anorexia i bulimia sunt relativ
rar ntlnii la persoanele obinuite. Acetia itemi vor avea probabil o alt distribuie pentru populaiile speciale
pe care scala va fi validat.
123
valoarea lui alpha (caz n care el trebuie eliminat) sau dimpotriv, o scade (semn c este unul
util). n cazul nostru itemul 6 este sigur unul condamnat, deoarece el d o corelaie uor
negativ cu scala i nu este consistent cu aceasta (absena lui din scal l mrete pe alpha).
i totui nu suntem nc n msur s lum decizia final pentru c nu am rspuns clar
la ntrebarea fundamental dac itemii testului msoar sau bat n direcia unei singure
variabile (scal unidimensional) sau a mai multora (scal multidimensional, neomogen).
Supoziia implicit pentru indicele de consisten intern alpha al lui Cronbach este aceea c
toi itemii msoar o singur variabil latent, fapt ce nu este dat prin definiie, ci trebuie
atent verificat.

c. Analiza factorial exploratorie
n aceast faz a procesului de construcie analiza factorial exploratorie devine
obligatorie. Aa cum se va observa cnd se parcurge pn la capt cursul de Statistic
avansat, o analiz factorial este o tehnic pretenioas, pentru c are nevoie de un numr
mare de subieci, de ordinul sutelor, pentru a furniza o soluie stabil i bine adecvat datelor.
Am solicitat din start un numr cel puin mediu de subieci (250-300) pentru a efectua o
analiz factorial corect deoarece cnd este desfurat pe prea puine cazuri, ea poate s dea
valori instabile, ce compromit uneori iremediabil ntregul proces de construcie a scalei. S
reinem deci c, n aceast faz de construcie a scalei, determinarea prin analiz factorial a
variabilei latente care st n spatele unui set de itemi este un fapt crucial.
Mergnd mai departe cu exerciiul nostru prezentm secvena de lucru pentru a
efectua analiza factorial exploratorie: AnalyseDataReductionFactor, care produce
deschiderea urmtoarei fereastre de lucru, n care vom introduce (prima fereastr, panoul din
dreapta-sus) toate datele de analizat, adic toi itemii chestionarului nostru.

Figura 10.3. Ferestrele de dialog pentru lansarea analizei factoriale exploratorii.
124

Pentru un numr aa de mare de itemi nu vom efectua nici o rotaie (butonul din
mijloc de la figura din stnga de mai sus), dar de la Options putem s selectm Supress
absolute values less than: (suprimarea valorilor mai mici dect:) pentru a pune valoarea de
.30 n ferestruica respectiv, care are din setare valoarea .10, dar neactivat (vezi fereastra din
dreapta-jos). n felul acesta valorile ce indic saturaii mici i nesemnificative n factorii
descoperii nu vor mai fi afiai, fapt ce uureaz inspecia vizual, selecia i luarea
deciziilor.
Trebuie precizat c metoda componentelor principale care este opiunea de baz a
programului este util mai ales pentru a vedea dac exist un factor general (cu o varian
mai mare de 50%) ce definete variabil latent, sau dac nu cumva exist mai muli factori
de magnitudine mai mic, ce acoper ntreaga varian a scorurilor scalei studiate. Vom putea
vedea deci dac avem de-a face cu o scal uni- sau multi-dimensional.
Atragem de asemenea atenia asupra faptului c dac o singur variabil inclus n
panoul de lucru are variana zero, analiza factorial nu mai poate fi efectuat. Deoarece acesta
este i cazul chestionarului nostru, identificm variabila sau variabilele cu varian zero prin
Frequencies ori Descriptives. n cazul nostru itemul 66 trebuie eliminat din analiz (i din
scal deoarece, avnd variana zero, el nu are nici o utilitate), dup care relum analiza
factorial. Aceasta va produce mai multe output-uri, din care dou sunt eseniale.


Figura 10.4. Unul dintre outputurile analizei factoriale
indicnd factorii selecionai i valorile lor eigen.
125
Outputul de mai sus indic faptul c itemii iniiali nu produc un singur factor general,
ci cteva zeci (fapt curent n construcia de scale cu numr mare de itemi), din care primul
acoper doar 13,36% din varian (deci este foarte departe de a fi un factor general), al doilea
8,21%, al treilea 4,96% etc. Chiar i al aisprezecelea factor produce o valoare eigen peste 2
(2,08%), ceea ce poate prea un adevrat comar statistic. Lucrurile nu stau ns chiar aa.
Dac analizm cu atenie outputul al doilea din figura 1.4, observm c acesta devine o
adevrat gril de selecie pentru factorii mai importani care vor fi reinui. Astfel, itemii vor
fi alocai la acei factori pentru care ei au cele mai mari corelaii (saturaii n factorul
respectiv). Atunci cnd se poate, itemii cu saturaii negative se aloc la factorul cu care
coreleaz pozitiv mai semnificativ, pentru a nu schimba maniera de scorare; la valori foarte
apropiate ale saturaiilor, un item se aloc scalei mai scurte pentru a o fortifica, deoarece tim
c puterea unei scale depinde i de numrul itemilor care o compun.
Observm c, dup ce ncep s fie alocai la primii trei factori, mai rmn foarte puini
itemi sau deloc pentru factorii urmtori, i aceast deoarece muli itemi i mpart variana
ntre mai muli factori (nu sunt foarte specifici). Alocnd itemii factorului pentru care ei au
cea mai mare saturaie, celorlali factori le rmn tot mai puini itemi, aceasta deoarece primii
factori dau corelaii mai mari cu itemii, avnd deci prioritate n selecia acestora. De fapt
afiarea n tabel a factorilor de la stnga la dreapta se face n ordinea magnitudii lor, dat de
mrimea corelaiilor cu itemii, dar i de numrul acestor corelaii. Itemii care nu se
repartizeaz n primele 3-4 categorii vor putea defini i ei nite factori de magnitudine mai
redus, dar reunindu-i n scale i studiind alpha pentru acestea vom observa c i consistena
intern este din ce n ce mai mic pentru factorii extrai ultimii.

Figura 10.5. Output al analizei factoriale indicnd factorii selecionai i valorile lor eigen.
126
Cum o scal trebuie s aib o consisten intern de peste .70 (aceasta fiind foarte
bun peste .80 i excelent peste .90) scalele mici neatingnd aceste valori trebuie n
principiu abandonate, pentru c ele sunt expresia unor construncte ce au o valoare
ndoielnic. n cazul de mai sus, itemii 5, 7, 8, 10, 13, 16, 17, 20, 21, 22 etc. vor fi alocai
primei scale; itemii 3, 9, 19 etc. celei de a doua, iar itemii 15, 24, 43 etc. celei de a treia. O
atenie special impune itemul 3, care poate fi distribuit i la factorul 2 i la 3 (decizia o lum
ulterior, cnd evalum care dintre cele dou subscale are mai mare nevoie de el) sau la itemul
22, care coreleaz semnificativ i cu factorul 1 (pozitiv) i cu factorul 3 (negativ). n aceste
situaii se observ ct de important este mrimea lotului pentru luarea unei decizii corecte,
bazat pe analiza factorial.
Hotrrea de a aloca itemii ntr-o scal sau alta poate fi irevocabil, chiar dac datele
ulterioare nu confirm deciziile noastre de acum. Prin mrirea semnificativ a numrului de
subieci, soluia factorial poate s aduc o mulime de diferene, ceea ce relanseaz practic
ntreg procesul de reconstrucie a scalei. Din aceast cauz vom cuta s lum decizii
importante i definitive doar dac eantionul pe care s-a efectuat analiza factorial este unul
sufiucient de mare i de reprezentativ.
Finalmente, scala desemnnd factorul 1 arat ca n figura de mai jos.

R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)
Mean Std Dev Cases
1. CEDA005 .2000 .4031 65.0
2. CEDA007 .3231 .4713 65.0
3. CEDA008 .3231 .4713 65.0
4. CEDA010 .1538 .3636 65.0
5. CEDA013 .4154 .4966 65.0
6. CEDA016 .5385 .5024 65.0
7. CEDA017 .4154 .4966 65.0
8. CEDA020 .1231 .3311 65.0
9. CEDA021 .4462 .5010 65.0
10. CEDA022 .3385 .4769 65.0
....................................................................................................................................................................
Statistics for Mean Variance Std Dev N of Variables
SCALE 11.9846 86.4841 9.2997 50

Item-total Statistics
Scale Scale Corrected
Mean Variance Item- Alpha
if Item if Item Total if Item
Deleted Deleted Correlation Deleted
CEDA005 11.7846 84.0154 .3121 .9203
CEDA007 11.6615 83.3212 .3418 .9202
CEDA008 11.6615 83.4462 .3270 .9204
CEDA010 11.8308 83.3928 .4456 .9192
127
CEDA013 11.5692 81.3115 .5500 .9180
CEDA016 11.4462 82.5635 .4018 .9197
CEDA017 11.5692 81.7178 .5034 .9185
CEDA020 11.8615 83.4337 .4862 .9190
CEDA021 11.5385 83.8149 .3636 .9202
CEDA022 11.6462 83.1385 .3586 .9201
....................................................................................................................................................................
Reliability Coefficients
N of Cases = 165.0 N of Items = 50

Figura 10.6. Unul dintre outputurile analizei factoriale
indicnd factorii selecionai i valorile lor eigen.

d. Scurt raport despre scal
Se pare c scala 1 obinut de noi este una foarte bun deoarece la ea contribuie 50 de
itemi ce-i dau o consisten intern extrem de mare (alpha = 0,92). Fiecare item d corelaii
de peste 0,30 cu scala, dar i mai mari. Scorul mediu la aceast scal este de 11,98, cu o
abatere standard de 9,30. Totui valorile medii ale itemilor nu sunt centrate majoritar pe
valoarea mijlocie de scor (0,50), ci sunt mai mici, fapt ce indic o asimetrie rezultat din
cauza caracterului mai curnd clinic al testului. Aceti itemi discrimineaz bine printre
subiecii care au valori mai mari ale scorurilor, dar mai slab pentru cei cu valori submedii.
Scala urmeaz a fi verificat i validat contra criteriul extern pe populaii clinice care
prezint realmente dezordinile alimentare diagnosticate.
Studiind itemii care l compun, primul factor a fost numit Stim de sine negativ
legat de aspectul fizic (50 de itemi), al doilea Propensiune anorexic (12 itemi) i al treilea
Propensiune bulimic (12 itemi). Deoarece cei trei factori sunt mediu-slab corelai ntre ei,
scorurile lor separate pot fi agregate ntr-un scor global, adic ntr-un Index al tulburrilor
alimentare, definit de preocuparea pentru aspectul fizic i pentru pierderea controlului asupra
ingestiei de alimente.
Numrul relativ mic de subieci pe care s-a desfurat analiza factorial (N = 165)
ridic totui semne de ntrebare n legtur cu stabilitatea soluiilor gsite, care trebuie
verificate i definitivate pe populaii mai largi.


10.3. Criterii de selecie a itemilor pentru optimizarea lungimii scalei

Pn n acest stadiu de dezvoltare al scalelor de tulburri alimentare cercettorul are
un numr bun de itemi (72), distribuii pe trei subscale n raport cu care acetia au o fidelitate
128
destul de ridicat. i totui, se observ diferene relativ nsemnate ntre acestea: prima are un
alpha de .92, a doua de doar de .70, iar a treia de .58. Alpha pentru toat scala este de .94. Se
pare deci c scalele 2 i 3 nu sunt suficient de fidele, aceasta probabil i din cauza scurtimii
lor. Se admite c scalele scurte sunt bune, pentru c se completeaz uor i nu pun prea mare
presiune pe subieci. Prin opoziie, scalele mai lungi creeaz mai mult stres la completare, dar
au caracteristici psihometrice mai bune (consisten intern, alte forme de fidelitate i de
validite, putere de discriminare mai mari). Este deci de dorit gsirea unui echilibru ntre
scurtimea scalei i calitile sale psihometrice.
Atunci cnd fidelitatea unei scale este prea mic, scurtimea ei nu este o calitate n
sine. Dac cercettorul nu poate asigura nici un neles unei scale scurte, nu s-a ctigat nimic
prin scurtimea ei. n cazul de fa exist o satisfacie legat de calitatea primei scale. Pentru
cea de a doua i de a treia ar putea rencepe travaliul de a genera itemi suplimentari, care s
surprind mai specific bulimia i anorexia i care vor trebui aplicai unor populaii clinice
identificate a avea aceste afeciuni.

n rezumat, pentru a clarifica criteriile dup care pstrm unii itemi n scal i-i
eliminm pe alii, furnizm n sintez cele mai importante repere orientative:
- sunt preferabili itemii care au valori medii apropiate de valoarea central, au varian
mare, se coreleaz bine cu ceilali itemi i mai ales coreleaz la un nivel ridicat
(peste .30, sau chiar peste .40) cu scorul total la scal;
- vor fi primii eliminai itemii care dau variana zero, corelaii slabe sau negative cu
scala (chiar dup scorarea invers);
- itemii care coreleaz slab cu scala vor fi de asemenea printre primii eliminai;
- vor fi eliminai i itemii a cror prezen n scal nu numai c nu amelioreaz
consistena sa intern, ci chiar o coboar;
- itemii care coreleaz slab cu dimensiunea/dimensiunile latente msurate, dar
coreleaz bine cu ali factori secundari, vor fi i ei eliminai din scal, dar vor fi
analizai pentru a dezvolta eventual noi scale, dac ei par s sugereze existena altor
constructe valide;
- dintre itemii foarte similari ca i formulare i coninut se pstreaz doar aceia care dau
cea mai bun corelaie cu scorul total la scal.

129
Nu putem omite o ntrebare legitim: ct de mic trebuie s fie pragul corelaiei item-
scal pentru a reine un item n scal? Rspunsul depinde i de inteniile autorului: dorete el
o scal scurt i relativ puternic, sau o scal mai lung, dar care d mai multe nuane, fiind
mai stabil i mai fidel? n primul caz pragul de selecie este mai ridicat (n principiu peste r
= .40), n al doilea ceva mai sczut (dar rareori sub r = .30).
Efectul eliminrii sau includerii unor itemi n scal trebuie i el bine tiut. Dac
cunoatem corelaia medie a scalei rezultate putem aplica o formul care ne ajut s
anticipm care va fi efectul adugrii sau eliminrii unui item. Aceast formul este:


n care N este numrul de itemi i r corelaia medie inter-itemi. Putem astfel determina ce se
ntmpl dac la o scal cu corelaia iter-itemi de .30 adugm sau scoatem un item: alpha =
[10 .30]/[1+9 .30] = .81 pentru 10 itemi; alpha = [11 .30]/[1+10 .30] = .83 pentru 11 itemi;
alpha = [9.30]/[1+8.30] = .79 pentru 9 itemi. Vedem c diferena de doar doi itemi ridic
consistena intern de la .79 la. 83, ceea ce este important. n general, dac corelaia inter-
itemi a unui item este egal sau cu puin sub corelaia inter-itemi medie, pstrarea itemului n
scal are un efect de cretere a lui alpha; cnd aceast corelaie este mult sub medie, ea poate
s duc la descreterea lui alpha i deci itemul ru trebuie eliminat.
O soluie interesant pentru a verifica stabilitatea caracteristicilor unei scale este
propus de DeVellis (2003, pp. 99-100), ea constnd n splitarea lotului. Cnd lotul este unul
suficient de mare el poate fi mprit n jumti. Cnd lotul nu este suficient de mare,
mprirea se poate face n pri inegale, partea cea mai mare fiind rezervat pentru
determinrile principale, pe cnd cea de a doua pentru verificarea constanei rezultatelor
gsite. Deci prima parte din lot folosete la evaluarea i selecia itemilor, la construcia
scalelor i la determinarea lui alpha pentru fiecare subscal; cea de a doua parte este util
pentru replicarea datelor i pentru a verifica dac ele se regsesc pe un lot foarte similar.
Avantajele acestei metode care oblig din start la abordarea unui numr mare de
subieci, de peste 500-600 de persoane sunt nsemnate. n primul rnd mprirea se poate
face aleatoriu, ceea ce asigur echivalena grupurilor, randomizarea genernd dou eantioane
echivalente. Dac acestea ar fi abordate n dou momente temporale diferite exist
probabilitatea ca factorul timp s aduc modificri (fie i discrete) la cel de al doilea grup, sau
ca el s difere prin alte caracteristici de primul grup. Apoi, un nou grup presupune expunerea
subiecilor la alt personal de cercetare, n alt perioad a anului, cu instrumente care pot diferi
uor de primele (forma iniial i forma definitiv a scalei), ceea ce poate introduce alte
r N
r N
alpha
+

=
) 1 ( 1
130
distorsiuni nedorite. Dar cel mai nsemnat avantaj al splitrii grupului original este acela c la
ambele subgrupuri vom avea forma original a instrumentului, ceea ce permite revenirea la
decizia eliminrii unor itemi dac grupul de control indic necesitatea schimbrii acestei
decizii. Dac pentru primul grup, cel pe care s-a fcut selecia itemilor, exist posibilitatea ca
factori de ans s fie confundai cu covariaia itemilor, la al doilea unde itemii sunt deja
selectai o asemenea posibilitate nu mai exist. Finalmente, prin reunirea celor dou grupuri
n unul singur se obin caracteristici psihometrice mai sigure i mai aproape de realitate dect
pentru fiecare grup luat separat.


10.4. Alte analize utile pentru determinarea fidelitii scalei

Ideea c prin coeficientul alpha al lui Cronbach se rezolv problema fidelitii unui
test/scale este una eronat deoarece n esen acesta indic doar msura n care itemii
formeaz un set omogen, bine sau satisfctor corelat cu scorul total la test. Alpha nu ne
spune totui dac scala nou creat surprinde sau nu cu adevrat estena constructului cutat,
pentru aceasta trebuind desfurate nenumrate studii de validare, pentru oricare nou
extensie legat de utilizarea scalei. Chiar fidelitatea presupune determinarea prin test-retest a
stabilitii n timp a rezultatelor obinute, corelaia dintre o form a testului i forma sa
paralel etc. Cum fidelitatea este cea mai important precondiie a validitii, trebuie spus c
programul SPSS ofer alturi de alpha i posibilitatea determinrii fidelitii prin metoda
jumtirii (split-half).
Demersurile necesare acestui tip de analiz sunt foarte asemnroare cu cele
presupuse de determinarea lui alpha (AnalyseScaleReliabilitySplit-halfStatistics),
doar c de la Statistics acum se dezactiveaz Descriptives for (Item, Scale, Scale if item
deleted), deja determinate anterior.

Figura 10.7. Ferestrele de dialog pentru Split-half i Statistics.
131
Output-ul acestei serii de comenzi este un indicator al consistenei interne care ia n calcul o
jumtate a testului comparat cu cealalt, prin dou metode: cea a lui Spearman-Brown i cea
a lui Guttman. Echivalena jumtilor se stabilete i prin compararea coeficientului alpha
pentru fiecare jumtate n parte. Cele dou jumti comparate sunt luate de computer ca
atare, dar dac vrem s determinm split-half pentru numerele pare i cele impare,
introducem n panoul de lucru nti itemii pari, apoi pe cei pari, dm OK i vom obine
analiza dorit.
R E L I A B I L I T Y A N A L Y S I S - S C A L E (S P L I T)
Reliability Coefficients
N of Cases = 165 N of Items = 112
Correlation between forms = .80 Equal-length Spearman-Brown = .89
Guttman Split-half = .89 Unequal-length Spearman-Brown = .89
56 Items in part 1 56 Items in part 2
Alpha for part 1 = .85 Alpha for part 2 = .87
Figura 10.8. Rezultatele outputului pentru Split-half.

Corelaiile obinute prin splitare sunt identice prin cele dou metode (.89) iar valorile
alpha pentru prima parte (.85) i pentru cea de a doua (.87) sunt extrem de asemntoare, de
unde deducem c exist o foarte bun consisten intern pentru fiecare jumtate a testului.
28

Procesul de construciei a unei scale nu se oprete aici. Destinul acesteia depinde doar
parial de calitile psihometrice identificarte preliminar i mai mult de utilitatea ei real, de
posibilitatea implicrii ei ntr-o multitudine de aplicaii practice sau de cercetri. Cel mai
adesea validitatea este cea care impune n timp o scal i aceasta poate fi probat ntr-o
multitudine de maniere. Prezentm mai jos o matrice de intercorelaii dintre cei trei factori
rezultai pentru Scala de tulburri alimentare i cele trei categorii de mecanisme de aprare
decelate de DSQ (The Defense Style Questionnaire) creat de Andrews, Singh i Bond.
FACTOR1 FACTOR2 FACTOR3 DSQ Mec.
mature
DSQ Mec.
nevrotice
FACTOR1 -
FACTOR2 .38** -
FACTOR3 .32** .28** -
DSQ Mec. mature -.09 .16 .01 -
DSQ Mec. nevrotice .23* .10 .18 .19* -
DSQ Mec. imature .51** .31** .29** .21* .53**
Not: ** Correlaia este semnificativ la pragul de 0,01 (bidirecional).
* Correlaia este semnificativ la pragul de 0,05 (bidirecional.
Figura 10.9. Matrice de intercorelaii dintre cei trei factori identificai i DSQ.

28
Not: Aceste determinri au fost fcute pe tot setul de itemi doar ca exerciiu, nainte de selecia i sortarea pe
scale a itemilor, ele trebuind reluate pentru subscalele obinute n finalul procesului de construcie, ca i pentru
scala global care le include pe toate trei. Dublarea numrului de subieci pentru a obine o soluie factorial
stabil relanseaz practic ntreg procesul de reconstrucie al scalelor.
132
Din tabelul de mai sus rezult c factorul 1 se valideaz la un nivel foarte ridicat prin
corelare cu mecanismele de aprare imature (r = .53) i la un nivel mai sczut cu cele
nevrotice (r = .23). Aceasta atrage atenia asupra faptului c factorul 1 are un coninut negativ
i c ar trebui s se numeasc Stim de sine negativ legat de aspectul fizic. Factorii 2 i 3 se
valideaz i ei concurent cu mecanismele de aprare imature, dar la niveluri mai sczute (r =
.31, respectiv r = .29). Evident c aceast prim confirmare are nevoie de o mulime de alte
studii, dar aceasta presupune ca instrumentul s fie publicat i lansat pentru a-i ndeplini
rolurile pentru care el a fost proiectat.


10.5. Proiect aplicativ:
construirea unui chestionar pentru o trstur de personalitate

Deoarece o treime din nota final depinde de acest proiect, cealalt depinznd de
activitatea de seminar i ultima de nota de la examenul final, indicm mai jos paii care
trebuie urmai pentru realizarea sa:
- vei citi cu atenie lista de la sfritul paragrafului de fa i vei alege o trstur de
personalitate, de preferin una care v intereseaz personal;
- vei efectua un studiu bibliografic detaliat pentru a putea identifica i defini detaliat
trstura/dimensiunea de personalitate aleas (aceasta este faza de documentare);
- folosind metoda intuitiv-raional vei operaionaliza aceast trstur/dimensiune
aleas sub forma unui numr de itemi cuprins ntre 20 i 40. n construcia itemilor
vei ine cont de toate precizrile din cursul de fa legate de caracteristicile de form,
lungime, coninut i cele semantice;
- chestionarul astfel obinut va fi aplicat ntr-un studiu-pilot pe un numr de minimum
30 de subieci. Dac optai pentru strategia grupurilor-criteriu (metoda empiric),
acestea vor avea minimum 20 de subieci fiecare;
- utiliznd cunotinele de la cursul Bazele teoretice ale psihodiagnosticului vei efectua
analiza itemilor (grad de discriminare, curb caracteristic sau semnificaia statistic a
diferenei dintre grupurile de contrast) i vei reine n forma intermediar redus a
chestionarului itemii cu caracteristicile psihometrice cele mai bune. Pentru aceast
form a chestionarului vei urma procedura descris n curs i vei face analiza
133
consistenei interne a scalei (din SPSS AnalyseScaleAlpha Cronbach i apoi
Split-half);
- vei redacta forma final a chestionarului;
- opional, valoarea proiectului va fi considerat mai bun i va primi punctaj superior
dac vei corela produsul obinut de voi cu un instrument despre care se tie c
msoar acelai construct, pentru a proba validitatea concurent a chestionarului
vostru.

Not: datorit complexitii cerinei formulate v putei asocia cte doi studeni
pentru un singur proiect, caz n care nota la acesta va fi identic pentru ambii autori, dei ei
i pot mpri dup dorin atribuiile ntre faza de documentare i cea de aplicare/prelucrare
a datelor. n acest caz ns ultimul aspect (validarea concurent a chestionarului nou creat)
devine obligatorie.
Produsul finit (chestionarul mpreun cu o lucrare de prezentare a fazelor proiectului,
de 3-4 pagini n TNR 12, pe hartie A4) va fi nsoit de o dischet sau CD cu datele de pe
calculator i prelucrrile aferente. Data predrii proiectului: ultima or de curs din semestru.

Prezentm mai jos cteva concepte care descriu trsturi de personalitate sau alte
domenii sau teme de cercetare ce pot fi abordate prin secvena metodologic prezentat
anterior:
Adaptare (colar, universitar, organizaional), agresivitate, asertivitate, atitudine fa de
(alcoolism, consum de droguri, risc, sexualitate, carier etc.), altruism/egoism, alimentare
(bulimie, anorexie, bulimi-anorexie), ambiie, androginitate, angoas/anxietate/fobie social,
aptitudini (didactic, social, de lider, empatic etc.), ataament (fa de valorile organizaiei,
fa de tradiie), aviditate (ca n chestionarul Gaston-Berger din tipologia franco-olandez),
btrnee, bioenergie/bioenergoterapie (atitudine fa de), bulimie, cafea, caren afectiv,
carism, chirologie, cinema, cleptomanie, comand, competiie, complexe (de inferioritate
sau de superioritate), comportament matern/patern, comportament proactiv, comunicativitate,
conflict/ conflictualitate (toleran la), conformism/nonconformism, contagiune (afectiv i
mental), control (locus of), cooperare, copil/copilrie (atitudine fa), creativitate,
culpabilitate, decizie (uurin/dificultate), difereniere (a Eului, cognitiv), delincven
(tendin la), dependen (alcoolic, de droguri, emoional-afectiv), depresie, dezacord/acord
conjugal, didactogenie, dipsomanie, disforie, dispoziie spre (tutun, alcool, droguri, abuz
134
sexual), drog, durere (cutarea plcerii/evitarea durerii - Cloninger), educaie/ educabilitate,
efort (rezisten la), egocentrism/egoism, emotivitate, empatie, erotism/senzualitate, eec
(toleran/intoleran, conduit de eec), Eu ideal, expectaie (nivel de),
extraversiune/introversiune, fabulaie (gndire magic), familie (fericire/nefericire conjugal
sau matrimonial), feminitate, fidelitate (relaional i n csnicie), foamea de stimulare, fobii
(sensibilitate la), fric, frigiditate, frustrare (toleran la), furie, gndire (magic, negativ,
depreciativ, autodevalorizatoare, creativ etc.), gelozie, gregarism, grup (atitudine fa de),
gust, hiperkinezie, homosexualitate/androginitate/sex-rol, idei (de persecuie, prevalente,
dominante) i scheme, identificare, imaginaie (reproductiv i creatoare), imitaie, inadaptare
la (mediu, coal, serviciu, csnicie), impulsivitate, inhibiie, instabilitate (emoional-afectiv,
caracterial), interese, introversie, intuiie, isteroidie, iubire, izolare, joc (disponibilitate
pentru), ncredere (n sine i n alii), labilitate, lateralitate cortical, lene social, lider
(aptitudine de), magie (gndire magic), manie, masochism, mecanisme de aprare ale Eului,
melancolie (dispoziie spre), minciun (scal de), mitomanie, mod (atitudine fa de), moarte
(atitudine fa de), motivaie (colar, profesional, de munc, creatoare etc.), narcisism,
nebunie (teama de), negativism/ncpnare, nervozitate, neutralitate (neimplicare), nevroz
(nevrozism, tendine nevrotice), nevroz de abandon, nevroz colar, obezitate, oboseal
(existenial), obsesii, opinii (de orice fel), optimism, orgoliu, panic (atacuri de), paranoia
(tendine spre), parapsihologie (atitudine fa de), pasiune, pasiv-dependent (personalitate),
pedeaps (atitudine fa de), pensionare, perfecionism/introversie, personalitate (isteric,
astenic, fobic etc.), persuasiune/sugestibilitate, perversiune (atitudine fa de), placebo
(susceptibilitate la), pragmatism (la valori/atitudini fundamentale), prejudeci, prestigiu,
prezen social, privaiune (toleran la), pubertate/adolescen, rsunetul reprezentrilor,
regresie, relaii umane, relaxare, remucare, respingere, responsabilitate, reuit/succes
(colar, profesional etc.), reverie, revolt, rezisten, rezonan, ritualuri fobice, roluri,
sadism, sntate mintal, schizoidie, secundaritate, sensibilitate, sentiment, separare (nevroz
de), sete (afectiv, de cunoatere), sfat conjugal, simulare (comportament),
suprasolicitare/burnout/brownout, sinucidere, sofrologie, stngcie, stres (toleran la,
mecanisme de coping cu), subiectivitate, succes, sugestibilitate, surmenaj, oc, talent,
tandree, temperament, tensiune, ticuri, timp (atitudine fa de, gestiune a), toleran (la
frustrare, social), trac, tutun, uitare, umor, valene, valori, vrst (atitudine fa de),
veleitarism, virilitate/masculinitate, vis, vocaie, voin, vorbire, zvon.


135
CAPITOLUL 11

RAPORTUL PSIHOLOGIC


11.1. Obiective
Dup parcurgerea acestei uniti, studenii vor fi capabili:
- s cunoasc elementele de coninut ale celor opt capitole ce intr n structura
raportului psihologic;
- s fac diferenele care se impun ntre fia psihologic (care sintetizeaz cifric datele
clientului) i raportul psihologic, care insist pe interpretarea narativ a acestora;
- pentru fiecare dintre cele opt capitole din structura raportului psihologic s poat
opera definirea, indica funciile, selecta elementele necesare realizrii corecte i
evitrii erorilor celor mai probabile;
- s concretizeze toate informaiile dobndite n blancul unei foi de raport-tip, printr-un
exerciiu de portofoliu.


11.2. Lecturi recomandate pentru acest curs
1. Aiken, L.R. (1997). Psychological Testing and Assessment. 9
th
ed. Boston, London,
Toronto, Sydney, Tokyo, Singapore: Allyn and Bacon.
2. Albu, M. (1998). Construirea i utilizarea testelor psihologice. Cluj-Napoca: Editura
Clusium.
3. Anastasi, A. (1974). Psychological Testing. New York: Macmillan Publishing Co.
Inc.
4. Clinciu, A.I. (2005). Psihodiagnostic. Braov: Editura Universitii Transilvania.
5. Gregory, R.J. (1996). Psychological Testing. History, Principles and Applications,
second edition, Boston, London, Toronto etc: Allyn and Bacon.
6. Stan, A. (2002). Testul psihologic. Evoluie, construcie, aplicaii. Iai: Editura
Polirom.
7. Zrgo, B, (1976). Examinrile psihologice. n ndrumtor psihodiagnostic. Cluj-
Napoca: Reprografia Universitii Babe-Bolyai, pp. 1-16.


136
11.3. Materiale i suporturi necesare
Hrtie i creioane; fi (blanc) de raport psihologic; cteva fie psihologice i un
raport psihologic real, rezultate din practica psihologic, de model.


11.4. Idei de baz pentru ntocmirea unui raport psihologic
1. Raportul psihologic este expresia condensat a activitii de testare / evaluare
psihologic a unei persoane (client, consumator de servicii etc.) de ctre un psiholog calificat
care rspunde cu instrumentele tiinei sale scopului pentru care a fost desfurat
investigaia, n termeni profesioniti, dar i accesibili celui care a comandat-o.
2. Raportul psihologic nu se confund cu Fia psihologic, deoarece prima ramne la
client, a doua la psiholog; prima traduce n termeni inteligibili informaia prezent n fi,
la care se adaug obligatoriu capitole de interpretare, sumarizare (concluzii) i recomandri.
3. Raportul psihologic nu exclude partea tehnic de prezentare a datelor (notele brute
i notele standard ale testelor utilizate), dar important este traducerea limbajului cifric ntr-
o descriere narativ, ntr-un limbaj accesibil clientului.
4. Ca structur, raportul psihologic (sau de examinare psihologic) cuprinde datele
factuale - de identificare, scopul sau problema pentru care a fost solicitat testarea, testele
administrate i rezultatele obinute, exprimate sub form de note brute (eventual) i note
standard (obligatoriu), o anamnez sau datele biografice relevante n raport cu scopul testrii,
observaiile relevante reieite n timpul desfurrii examenului psihologic, interpretarea
rezutatelor (sumarizarea) i recomandrile.
5. Dublarea laturii constatative cu cea formativ, cea diagnostic cu cea prognostic i
abordarea nomotetic cu cea idiografic (personalizarea examenului psihologic) face
diferena ntre un raport bun i unul slab, dei aici elementul difereniator major este
experiena capitalizat de psiholog, competena lui de psihodiagnostician, ca i lrgimea
repertoriului psihodiagnostic de care dispune i care-i permite s abordeze o gam mai larg
sau mai ngust de probleme.
6. Aceasta nseamn c nu aspectul formal (standard) d valoarea unui raport
psihologic, ci:
- gradul de acoperire a scopului i a ateptrilor clientului;
137
- msura n care s-a operat cea mai potrivit selecie a testelor i a procedurilor
disponibile la un moment dat, n raport cu solicitarea clientului;
- faptul de a include datele cele mai pertinente reieite din observaie, care au o mare
valoare diagnostic, acestea fiind cele care transfer examinarea psihologic din zona
nomoteticului n zona idiograficului;
- faptul dac rezultatele sunt confirmate de timp (fidelitatea test-retest), de ali
evaluatori (fidelitatea interscoreri sau interspecialiti), de faptele anticipate
(validitatea relativ la criteriu) sau de viaa nsi, aflat dincolo de pereii
laboratorului (validitatea ecologic);
- faptul de a oferi altor specialiti (profesori, medici, sociologi etc.) puncte de sprijin
solide n deciziile sau n interveniile lor de specialitate;
- faptul de a ine pasul cu cele mai noi i avansate standarde din domeniu, furnizate de
rile cu mare tradiie n testarea psihologic.


11.5. Activiti propuse
11.5.1. ntocmirea unui raport de examinare psihologic
Raportul psihologic materializeaz i finalizeaz o investigaie psihologic de tipul
testrii/ evalurii, adic un examen psihologic. Mrimea i gradul de elaborare al acestuia
depind simultan de scopul testrii/evalurii, de cerinele expres formulate de cel care a
comandat-o, de exigena i profesionalismul psihologului. Chiar i pentru testri foarte scurte
trebuie s existe un raport, adic ceva care traduce datele cantitative n date calitative cu sens,
inteligibile pentru client.

11.5.2. Structura raportului psihologic
Un raport de evaluare a funciilor intelectuale poate diferi semnificativ de unul care se
refer la structuri i funcii de personalitate. Astfel, testul CPI, cu multitudinea sa de scale
originare (18), la care se adaug cele suplimentare (cel puin tot attea) poate genera att efort
n sinteza i de intercorelare nct, mai nou, aceast sarcin a fost preluat de computer (care
nu poate suplini totui responsabilitatea psihologului, asumat prin semntur). Aceste
rapoarte computerizate au de regul o parte non-narativ - raportul scorurilor brute i
standard, incluznd testele de semnificaie statistic i intervalele de ncredere pentru
scorurile de la test, i una narativ. "Raporturile descriptive merg cu un pas dincolo de
138
raporturile de scoruri prin includerea unei interpretri a rezultatelor scal cu scal."
29

Lungimea raportului nu d ns i valoarea acestuia: profilurile furnizate de softurile
contemporane fiind excesiv de detaliate, clinicianul trebuie s parcurg rapoarte de peste zece
pagini pentru a putea extrage cteva caracteristici definitorii pentru clientul su. Concluzia lui
Gregory ni se pare una foarte valabil: "Un raport descriptiv poate da o informaie nepreuit
pe o jumtate de pagin."
30

Dac exist totui diferene mari de format ntre raportul psihologic al funciilor
intelectuale i al profilului de personalitate, nseamn c ne vom opri asupra celui cu structura
mai simpl (funcii intelectuale), dei n practica curent psihologul poate construi profile
hipercomplexe (care include inteligena, memoria, motricitatea, atenia i personalitatea),
atunci cnd vrea s surprind integral sau multiaxial persoana.

Structura raportului psihologic va trebui s cuprind:
31

I. Date factualei de identificare ale clientului.
II. ntrebarea de referin (scopul) evalurii psihologice.
III. Testele administrate, cu indicarea rezultatelor n note brute i note standard, ca i
a scorului final (QI, Indice de Memorie, Indice de Motricitate).
IV. Datele de anamnez (pacieni clinici) sau istoria personal a cazului.
V. Observaiile relevante reieite pe parcursul examinrii.
VI. I nterpretarea rezultatelor la teste prin raportarea datelor brute la etaloane,
raportarea unora la altele, a tuturor la o teorie, la un set de ipoteze sau la fapte).
VII. Sumarizarea concluziilor.
VIII. Recomandri.
Mai detaliat, aceast secven const din urmtoarele opt capitole ale raportului,
fiecare cu o scurt definiie, cu indicarea funciilor implicate, cu precizarea modului de
realizare corect i a erorilor cele mai frecvente, dar i a modului lor de evitare. n final se
propune un exerciiu imaginar pe un blanc anume elaborat.
Not: raportul psihologic se parafeaz, se dateaz i se semneaz, pentru c din
momentul emiterii lui devine un document oficial, cu consecine posibile asupra clientului, el
putnd fi invocat n instan sau n luarea unor decizii cu privire la persoana n cauz. Spre

29
Gregory, R.J. (1996). Psychological Testing. History, Principles and Applications, second edition. Boston,
London, Toronto etc: Allyn and Bacon, p. 575.
30
Ibidem.
31
Prelucrare dup Richard, 1988.
139
deosebire de raportul psihologic computerizat, raportul psihologic presupune deci asumarea
responsabilitii prin semntur i paraf.
I . Datele factuale i de identificare a subiectului
Definire: sunt datele care descriu caracteristicile demografice principale pentru
identificarea subiectului i includerea sa ntr-o categorie, cum ar fi: data naterii i data
examinrii, ce permit determinarea vrstei (n ani i luni, cci la vrsta copilriei dinamica
dezvoltrii este una foarte rapid), mediul (rural/urban = R/U), sexul (Masculin/Feminin =
M/F), studiile prinilor copiilor examinai (generale, medii, superioare = G, M, S) sau ale
celui n cauz, coala i clasa sau facultatea (dac este cazul), ultima coal absolvit (dac
este adult), mrimea i poziia sa n fratrie, familia de apartenen (cstorit, divorat, vduv,
concubinaj) sau cea proprie (stare marital = cstorit/necstorit), ocupaie, vechime,
calificare etc. Observm c pentru copii se pune problema background-ului cultural-
economic i educaional; cnd cel examinat este un adult, aceste elemente se transfer de pe
familie pe clientul nsui, de care ne mai putem interesa privitor la starea locativ, indicele de
aglomerare (numr de persoane pe numr de camere), venit (global sau pe membru de
familie). Toate acestea lungesc proporional durata edinei, de aceea trebuie s gsim un
echilibru rezonabil ntre lungimea datelor completate i relevana lor.
Funciile acestui capitol sunt urmtoarele:
- fixeaz datele cele mai relevante, care permit identificarea i raportarea clientului la o
clas;
- datele factuale sunt variabile "naturale" (uneori "etichet") n prelucrarea
computerizat a seturilor de date similare;
- din prelucrarea bazei de date acumulate n timp se pot extrage sub-eantioane mai
mici, pentru a genera bareme/etaloane mai fine sau pentru a desprinde regulariti
tipice (prin lucrri de cercetare tiinific).
Realizare corect
- Dac este structurat sub forma unei fie cu o rubricatur adecvat, datele sunt uor de
strns, putnd avea o multitudine de utiliti (vezi funciile).
- Deoarece raportul psihologic selecteaz doar datele (adevrate) din fia de test (mai
complet, mai tehnic i mai analitic), formularea din fi este diferit de cea din
raport. n primul caz, se completeaz datele n rubric, n al doilea li se d o structur
narativ sintetic.

140
De exemplu, datele de mai jos din fia psihologic, ce rmne la examinator:
Numele: Ionescu Mircea; Data naterii: 4. 01. 1975; Profesia: sudor; Sex: masculin (M)
Data examinrii: 21 05 2005; Vrsta: (n ani i luni): 46 de ani i 3 luni; Stare civil:
cstorit, 3 copii, ar putea arta astfel n raportul psihologic: Ionescu Mircea, de 46 ani i 3
luni, de profesie sudor, cu studii medii (coala profesional plus liceul la seral), cstorit, tatl
a 3 copii etc.
Erori probabile
- lungirea nejustificat a numrului de date de identificare solicitate clientului;
- contaminarea capitolului cu date rezultate din istoria personal, din observarea direct
sau din testarea efectiv a clientului.

I I . Scopul evalurii psihologice (ntrebarea de referin)
Definire: aceast rubric trebuie s indice fr dubiu cine a cerut evaluarea
psihologic i cu ce scop.
Funcie: scopul ghideaz ntreaga evaluare psihologic ca numr i tip de teste
selecionate, ca profunzime a investigarii, bogie a concluziilor i nuanare a recomandrilor.
Dac persoana care cere evaluarea nu poate preciza clar scopul, este datoria psihologului s-l
reformuleze astfel nct el s devin unul explicit. Realizarea corect va sintetiza ntr-o
manier ct se poate de clar i concis de ce i pentru cine se face evaluarea psihologic.
Greeli de evitat
- un scop ciorchine, amalgamnd o multitudine de elemente, dintre care unele reieite
din anamnez;
- scopuri vagi sau prea generale (dorim o evaluare de ansamblu, ne intereseaz cum
gndete, copilul nu are stare etc.), care vor fi nlocuite cu scopuri specifice
(consecinele cognitive ale unei nateri hipoxice, hiperkinezie cu deficit de atenie,
examen n vederea orientrii i ghidrii vocaionale etc.).

I I I . Testele administrate i rezultatele obinute (note brute i note standard)
Descriere: pentru anumite categorii de teste pot exista foi de nregistrare / centralizare
i asociere a datelor pre-elaborate, n care se folosesc aceleai baterii de teste. De exemplu,
pentru orientarea colar i ghidarea vocaional bateria va cuprinde teste de aptitudini
(generale i speciale), teste de memorie, un test de personalitate (HSPQ) i teste de interese
(Strong i/sau Holland). n consecin i pe foaia de raport psihologic ele vor fi trecute ca
141
atare, cu o coloan pentru note brute i una pentru note standard, utile pentru a verifica
informaia de specialitate cnd raportul circul printre psihologi sau ali specialiti.
Funcie: este aceea de a avea un sistem de control extern al elementelor pe care se
bazeaz interpretrile calitative care urmeaz, pentru a vedea n ce msura testarea
psihologic este adecvat scopului su declarat.
Greeli de evitat: adugarea sau omiterea de teste care nu au fost efectiv utilizate.

I V. Anamneza sau istoria personal a cazului
Descriere: anamneza este dictat de scopul explicit formulat al testrii, investigaia
trecutului clientului trebuind s surprind elementele semnificative din viaa persoanei n
raport cu acest fapt. De exemplu, dac copilul are hiperkinezie cu deficit de atenie (ADHD),
vom cuta n istoria sa timpurie evenimente ce ar fi putut genera disfuncia cerebral minim,
adic o hipoxie la natere, un Rh negativ, o circular de cordon, o natere provocat sau
dificil. Mai trziu ne vom interesa de traumatisme craniocerebrale, de asfixii mecanice sau
cu monoxid de carbon; vom cerceta dac semnele ADHD sunt centrate mai mult pe atenie
sau mai mult pe scderea autocontrolului (impulsivitate), dac fenomenologia a diminuat
odat cu vrsta, dac deficitul a avut concomitene legate de funcia grafic (desen, scris,
citit), ncercnd s distingem ntre un temperament necontrolat, instabil (coleric) i sindromul
amintit. Pot fi cercetate i antecedentele heredo-colaterale, pentru a diferenia ntre aspectul
dobndit i cel ereditar al tulburrii.
Funcie: comportamentul actual al subiectului are o istorie care poate fi reconstituit
mai larg sau mai nuanat, n funcie i de calitatea surselor de informaie disponibile.
Realizare corect: ca i n cazurile de informaii obinute prin spionaj, se pune problema
calitii acestora, care depinde de calitatea sursei, dar i de posibilitatea coroborrii surselor.
Astfel, mamele dau informaii mult mai detaliate i acurate dect taii, prinii dect bunicii,
rudele dect persoanele neutre etc. Cnd exist i o electroencefalogram, expertiza altor
specialiti (date consemnate n fia medical), diagnosticele sunt mai certe i cutarea este
mult uurat. Specialitii atrag atenia c trebuie nregistrate datele comportamentale
observate i interpretarea dat acestora. De exemplu, este preferabil s notm c elevul
umbl n timpul orelor printre bnci dect c este agitat i fr stare sau c este
indisciplinat, nu are rbdare, tulbur clasa etc. Aceasta deoarece persoane diferite
atribuie semnificaii diferite, n contexte diferite, acelorai fapte de conduit, urmnd a evita
operaionalizrile incorecte, mai ales cnd este vorba de surse nespecializate.
142
Greeli de evitat
Sondarea minuioas a trecutului unei persoane suprancarc rubrica respectiv cu o
multitudine de date irelevante n raport cu scopul investigaiei, dup cum una prea de la
deprtare omite chiar elemente dintre cele mai semnificative. Mai jos dm exemplu de
elemente semnificative din anamneza copiilor cu dificulti colare sau cu probleme de
dezvoltare care pot fi incluse n raportul psihologic.
- Probleme antenatale, perinatale i postnatale importante (de exemplu disgravidie,
natere precipitat sau nainte de termen, natere pe uscat, cianoz la natere, Rh
negativ, prematuritate, imaturitate, circular de cordon, asfixie albastr sau alb etc.).
- Boli importante ale micii copilrii.
- Retarduri legate de vorbit, mers, control sfincterian (primul pas, primul cuvnt).
- Tulburri ale senzorialitii (vz/auz) i gravitatea lor.
- Lateralizare, dominan invers sau ncruciat.
- Evoluia timpurie a limbajului, a comunicrii i socializrii.
- Apetitul pentru joc.
- Adaptabilitatea la colectivitate (cre, grdini) i uurina integrrii.
- Evenimentele majore din viaa copilului sau a familiei sale (separaii, divoruri etc.).
- Date de climat familial (relaii cu fraii, bunicii, rudele, prietenii).
- Rezultatele colare actuale i evoluia lor n timp.
Este inutil s spunem c alt categorie de probleme (tumori, accidente neurologice,
devian sau delincven juvenil, tulburri instrumentale, deficiene caracteriale) au alte
grile de anamnez, care se structureaz prin acumularea de experien, dar i prin
parcurgerea literaturii de specialitate. Cu att mai mult examenul adultului sau investigaii
mai speciale (avizarea pe post, de exemplu) au alte tipuri de screening al istoriei personale.
Este de asemenea foarte important de spus c cea mai mare parte din datele consemnate
rmn n fia de examinare (cea care face sinteza datelor), n raport trecndu-se datele filtrate
i cu adevrat concludente n raport cu problema care face obiectul investigaiei.

V. Observaiile relevante din timpul examinrii
Descriere: este locul n care diagnosticul medical i cel psihologic se suprapun n
bun msur. i psihologul trebuie s dezvolte un ascuit sim clinic, mai ales n examinrile
individuale, care furnizeaz acea informaie suplimentar, nicicnd surprins de teste i care
se refer la:
143
- Conduita general n timpul examenului.
- Starea de mobilizare atenional i fluctuaiile ateniei datorate scderii motivaiei,
interesului sau epuizrii resurselor energetice.
- Susinerea proceselor reglatorii i energetice (autocontrol, impulsivitate, declin
energetic).
- Stilul de abordare cognitiv, strategiile utilizate (mai ales la probele de performan).
- Comentariile cu care se asociaz reuita/nereuita, tolerana la frustrare, reacia la
eec, susinerea mnezic, promptitudinea reaciilor.
Este evident c n orice testare a aptitudinilor (i a inteligenei n special) persoana se
manifest ca ntreg, lucru precizat i de Binet, Piaget sau Wechsler, care au cutat s deriveze
concluzii despre personalitatea subiectului din examenul inteligenei. Piaget a propus i
realizat standardizarea observaiilor n timpul aplicrii probelor sale cognitive. Psihologul
obinuit tie c dac a folosit cum trebuie observaia, el poate agrementa raportul su cu
acele elemente decisive ce fac diferena dintre examenul lipsit de suflet - computerizat - i cel
efectuat de o fiin uman.
Rezolvarea corect: problema este aceea c din multitudinea datelor observate i
consemnate n fia de examen s selectm doar acele informaii concludente, ntr-o form
explicit. De exemplu, n loc s trecem c Ionel este inhibat, foarte dependent afectiv
(concepte vagi) putem utiliza formula Ionel a vrut s fie examinat doar n prezena prinilor
si, pe care-i solicita la cea mai mic neclaritate; la un moment dat el s-a ridicat de pe scaun
i nu a mai vrut s continue, refugiindu-se n spatele mamei, dei Ionel are deja apte ani i
jumtate. A comentat c coala nu este bun la nimic, poate doar s-i chinuie n zadar pe
copii. A revenit n examen dup insistene i rugmini, artndu-se foarte ngrijorat la tot ce
ar fi putut nsemna eec sau nereuit. La comunicarea rezultatelor a inut neaprat s fie de
fa, cernd explicaii i ntrebnd dac ce a fcut el este bine. La plecare nu i-a luat la
revedere i tata a comentat c este foarte puin probabil s mai vin din nou la examen, pentru
c examinarea seamn prea mult cu coala.
Erori posibile
- Contaminarea reciproc a datelor furnizate de observaie i a celor de anamnez.
- Selectarea datelor de observaie care se potrivesc cu diagnosticul psihologic sau
psihiatric anterior formulate.
144
- Contaminarea cu alte surse de informaii (de la nvatoare, profesori, medici, asisteni
sociali).

VI . I nterpretarea rezultatelor
Definire: este cea mai complex i cea mai important parte a raportului psihologic
deoarece face sinteza datelor psihometrice cu cele de anamnez, de observaie i provenite
din surse colaterale, cu scopul a le da un sens inteligibil pentru prini, client, beneficiar, ntr-
o manier obiectiv, dar care nu lezeaz, informaia fiind explicit, utilizabil i n alte
contexte.
Funcii
- Valorizeaz datele obinute n vederea atingerii scopului examinrii.
- D elemente clare beneficiarului imediat i celor ndeprtai (angajatorul, profesorul,
medicul, autoritatea local, poliia etc.).
- Face ca datele s convearg spre o finalizare, spre o concluzie.
Realizarea corect nu se sprijin pe o reet. n psihologia dezvoltrii, de exemplu,
aceast etap face dovada experienei, competenei, adncimii i pluridisciplinaritii n
pregtirea unui psiholog. Dac prinii suspecteaz de retard mintal o fat mai lent, cu
hidrocefalie n antecedente, ei au nevoie de un sfat avizat, care le-ar putea motiva ngrijorarea
sau adormi vigilena. Problema este ce spui i ct spui pentru ca bunstarea clientului s fie
servit, fr a omite totui adevrul. Tendina ultimilor ani n America este aceea de a fi mai
aproape de adevr, chiar i pentru persoane cu probleme reale, care-i pot mobiliza mai bine
resursele adaptative pentru a nfrunta un deficit sau handicap.
Interpretarea trebuie s fie corect, complet i obiectiv. Trebuie s sublinieze
minusurile, dar i plusurile, dac se poate dup stabilirea de intercorelaii ntre toate datele
sau dup conturarea unei scheme explicative ordonatoare.
Erori evitabile
- Suprasimplificarea: interpretarea de genul: rezultatul la testul cuburilor este peste
medie, deoarece subiectul a obinut nota standard 17. n fond, putem porni de la o
privire de ansamblu a rezultatelor, s vedem gradul lor de omogenitate/heterogenitate,
dominantele etc. De exemplu, cota standard 14 la cuburi poate s nsemne coordonare
oculo-manual foarte bun, susinut de un tempo de lucru alert (deoarece a primit
bonificaii de timp nsemnate), iar la testul Cod B - prob de nvare asociativ -
145
subiectul a obinut de asemenea un scor foarte ridicat, cota standard 16. Deoarece i
testul Bender-Gestalt indic o performan superioar, se poate concluziona c un
factor major al inteligenei - cel spaial - este supradezvoltat, avem deci de-a face aici
cu premisele unei aptitudini ce trebuie valorificat. Pe de alt parte, testul de
vocabular, memoria verbal i memoria ritmurilor se afl la un nivel mediocru, ceea
ce sugereaz o puternic asimetrie ntre factorul verbal i cel spaial, tipic stngciei.
Aceasta ar putea explica eecurile elevului la limbi, biologie i istorie. Blbiala de la
3 ani, instalarea tardiv a dominanei (dup 7 ani, odat cu coala, dar cu tendine
remanente spre ambidextrie) susin ipoteza unei organizri corticale particulare, cu o
dominan emisferic vag.
- Interpretrile incorecte provenite din necunoaterea testelor (a instrumentelor
psihometrice), din insuficienta cunoatere a teoriei psihologice (de unde nevoia
informrii / formrii continue) sau din supradimensionarea unei singure informaii. De
exemplu, un tnr psiholog de la Laboratorul de snatate mintal ddea urmtoarea
formulare: dac nu exist alt contraopinie, pacientul X este suspect de
schizofrenie, i aceasta dup un singur test proiectiv, Testul Arborelui! Confuzii de
acelai tip sunt i cele care concluzioneaz n legatur cu excesul de energie al
hiperkineticului (care nu debordeaz de energie, cum se creden mod curent, ci doar d
impresia, din cauza consumului haotic al acesteia).
- Uneori psihologul se rezum doar la scopul testrii, ferindu-se s valorifice date
valoroase care-l depesc ca putere explicativ, alteori examenul nu ine deloc cont de
scopul de referin, mergnd pe acelai ablon, stereotip, indiferent de tipologia
solicitrilor ntlnite.

VI I . Sumarizarea concluziilor
Definire: n aceast seciune a raportului psihologic se rezum n unul-dou paragrafe
rezultatele de ansamblu ale ntregului examen.
Funcii
- Aceea de a rspunde precis i concis la ntrebarea de referin care a declanat
evaluarea psihologic.
- Aceea de a face legtura cu ultima secven a raportului, cea a propunerilor i
recomandrilor.
Greeli: prolixitatea i redundana.
146
VI I I . Recomandri
Definire: sugestiile oferite sunt date n sensul potenrii calitilor insuficient puse n
valoare de ctre subiect i a optimizrii sau compensrii aspectelor deficitare.
Funcii: aceea de a depi planul constatativ i de a oferi soluii problemelor
diagnosticate, de a lrgi cadrul de referin prin implicarea altor specialiti (dac e cazul) i
de a gsi soluii problemelor pe care subiectul le are fr ca acestea s fi fost n mod expres
obiectul investigaiei.
Greeli de evitat
- Recomandrile s fie pertinente, la obiect i fezabile.
- Ele s rezulte din datele de investigaie, s fie solid susinute de datele empirice, dar i
de teoria din domeniu.
- S permit constatarea efectelor ameliorative dup o perioad de timp (prin retest).

Exerciiu pentru portofoliul de evaluare
Realizai un Raport psihologic pentru un caz imaginar, respectnd paii i
recomandrile corespunztoare.

















147
BIBLIOGRAFIE

1. Aiken, L.R. (1997). Psychological Testing and Assessment. 9
th
ed. Boston, London,
Toronto, Sydney, Tokyo, Singapore: Allyn and Bacon.
2. Albu, M. (1998). Construirea i utilizarea testelor psihologice. Cluj-Napoca: Editura
Clusium.
3. Allport, G.W. (1991). Structura i dezvoltarea personalitii. Bucureti: Editura Didactic
i Pedagogic.
4. Anastasi, A. (1974). Psychological Testing. New York: Macmillan Publishing Co.
5. Bban, A., Derevenco, P., Eysenck, S.B.G. (1990). Testul E.P.Q. n: Revista de
psihologie, 1, 37-45.
6. Biceanu, L. (2004). Dicionar ilustrat de psihologie englez romn. Bucureti: Editura
tehnic.
7. Bontil, Gh. (1971). Aptitudinile i msurarea lor. Bucureti: Centrul de Documentare i
Publicaii al Ministerului Muncii.
8. Carroll, J.B. (1993). Human Cognitive Abilities. Cambridge: Cambridge University Press.
9. Constantin, T. (2004). Evaluarea psihologic a personalului. Iai: Editura Polirom.
10. Bogthy, Z. (1978). ndreptarul psihologului industrial. Bucureti: Editura tiinific i
Enciclopedic.
11. Cattell, R.B. (1957), Personality and Motivation. Structure and Measurement. New York:
World Book Co.
12. Cattell, R.B. (1960). Manuel pour l'application de l'Echelle d'Anxiet. Paris: Ed. C.P.A.
13. Cattell, R.B., Beloff, H. (1966). Manuel d'application du H.S.P.Q. Paris: Ed. C.P.A.
14. Clocotici, V., Stan, A. (2000). Statistic aplicat n psihologie. Iai: Editura Polirom.
15. Cohen, R.J., Swerdlik, M.E., Smith, D.K. (1992). Psychological Testing and Assessment.
An Introduction to Tests and Measurement. second ed. California: Mayfield Publishing
Company, Mountain View.
16. Cronbach, L.J. (1970). Essential of Psychological Testing. New York: Harper and Row.
17. Deri, S. (2000). Introducere n testul Szondi. Bucureti: Editura Paideia.
18. Durand, G. (1999). Aventurile Imaginii. Imaginaia simbolic. Imaginarul. Bucureti:
Editura Nemira.
19. Dworetzky, D.J., Davis, N.J. (1989). Human development. A life span approach. St Paul,
New York: West Publishing Company.
20. Enchescu, C. (1975). Expresia plastic a personalitii. Bucureti: Editura tiinific.
148
21. Enchescu, C. (1977). Psihologia activitii patoplastice. Bucureti: Editura tiinific i
Enciclopedic.
22. Eysenck, H.J. (1953). The Structure of Human Personality. New York: Viley.
23. Eysenck, H.J. (1975). The Measurement of Personality. London: Routledge & Kegan.
24. Eysenck, H.J, Eysenck, S.B.G. (1975). Manual of the Eysenck Personality
Questionnaire. London: University of London Press.
25. Eysenck, M.W., Keane, M.T. (1995). Cognitive Psychology. A student's handbook. 3
rd

edition, Hove East Sussex, UK: Psychology Press Ltd.
26. Gardner, H. (1985). Frames of mind: The theory of multiple intelligences. New York:
Basic Books
27. Gregory, R.J. (1994). Psychological Testing. History, Principles and Applications, second
edition. Boston, London etc.: Alyn and Bacon.
28. Guilford, J.P. (1959). The Nature of Human Intelligence. New York: Mc Graw Hill Book
Company.
29. Harris, D.B. (1963). Children's drawings as measures of intellectual maturity. New York:
Harcourt, Brace & World.
30. Havrneanu, C. (2000). Cunoaterea psihologic a persoanei. Iai: Editura Polirom.
31. Holban, I (1970). Probleme de psihologia muncii. Bucureti: Editura tiinific.
32. Horghidan, V. (1992). Metode de psihodiagnostic. Bucureti: Editura Didactic i
Pedagogic.
33. Kaplan, R.M., Saccuzzo, D.P. (1993). Psychological Testing. Principles, Applications
and Issues, 3
th
ed. Belmont, California: Brooks Cole Publishing Company, Inc.
34. Kline, P. (1995). La construction des tests. n: Beech, J.R., Harding, L., Tests, mode
d'emploi. Guide de psychomtrie. Paris: Ed. C.P.A.
35. Kulcsar (1976). Testul Raven i variantele sale. n: ndrumtor psidodiagnostic, vol. II,
Cluj-Napoca: Reprografia Univeritii Babe Bolyai.
36. Laveault, D., Grgoire, J. (2002). Itroduction aux thoriex des tests en Psychologie et en
sceeces de l'ducation. 2
e
edition. Bruxelles: ditions De Boeck Universit, p. 199.
37. Meeker, M.N. (1969). The Structure of Intellect. Its interpretations and uses. Columbus,
Ohio: Charles E. Merrill Company.
38. Meili, R. (1962). Manuel du diagnostique psychologique. Paris: P.U.F.
39. Minulescu, M. (1996). Chestionarele de personalitate n evaluarea psihologic.
Bucureti: Garell Publishing House.
149
40. Mitrofan, N. (1993). Testarea psihologic a copilului mic. Bucureti: Editura Press
Mihaela.
41. Mitrofan, N., Mitrofan, L. (2005). Testarea psihologic. Inteligena i aptitudinile. Iai:
Editura Polirom.
42. Mitrofan, N. (2001). Psihometria i direciile ei de dezvoltare la nceput de mileniu. n M.
Zlate (coord.), Psihologia la rspntia mileniilor. Iai: Editura Polirom.
43. Nunnally, J.C. (1978). Psychometric Theory. (2
nd
Ed.). New York: McGaw Hill.
44. Parot, F., Richelle, M. (1995). Introducere n psihologie. Istoric i metode. Bucureti:
Editura Humanitas.
45. Perse, J. (1972). Collaboration

du psychologie au dpistage et au diagnostique des
maladies mentales. n: Reuchlin, M. (red.) Trait de psychologie aplique. Paris, Press
Univ. de France.
46. Piron, H. (coord.) (2001). Vocabular de psihologie. Bucureti: Editura Univers
Enciclopedic.
47. Pitariu, H. (1983). Psihologia seleciei i orientrii profesionale. Cluj-Napoca: Editura
Dacia.
48. Pitariu H. (1974). Testul Domino 48 (D 48); Testul Domino 70 (D 70). n: ndrumtor
psihodiagnostic, vol. II, Cluj-Napoca: Reprografia Universitii Babe Bolyai.
49. Popescu Neveanu, P. (1977). Psihologie general. Tipografia Universitii Bucureti.
50. Radu, I. (coord.) (1991). Metodologie psihologic de analiz a datelor. Cluj-Napoca:
Editura Sincron.
51. Reber, A.S. (1985). Dictionary of Psychology. London, New York etc.: Penguin Books.
52. Reuchlin, M. (1992). Introduction la recherche en psychologie. Paris: ditions Nathan.
53. Reuchlin, M. (2000). Psihologie general. Bucureti: Editura tiinific.
54. Ribault, C. (1965). Le dessin de la maison chez lenfant. n: Revue de Neuropsychiatrie
Infantile, 13, nr. 1-2.
55. Rorschach, H (2000). Manual de psihodiagnostic. Bucureti: Editura Trei.
56. Roca, M. (1972). Metode de psihodiagnostic. Bucureti: Editura Didactic i
Pedagogic.
57. Rozorea, A., Sterian, M. (2000). Testul arborelui.Bucureti: Editura Paideia.
58. Stan, A. (2002). Testul psihologic. Evoluie, construcie, aplicaii. Iai: Editura Polirom.
59. Sternberg, R.J. (1985). Beyond IQ: A triarchic treory of human intelligence. New York:
Cambridge University Press.
150
60. Sternberg, R.J., ed. (1990). Handbook of human intelligence. Cambridge, New York etc.:
Cambridge University Press.
61. Sternberg, R.J. (1993). Intelligence is more than IQ: The practical size of intelligence. In
Jurnal of Cooperative Education, 28 (2), pp. 6-10.
62. Szamoskzi, t. (1997). Psihometria clasic i evaluarea formativ. n Cogniie, creier,
comportament, vol. 1, nr. 2, iunie, Cluj-Napoca.
63. chiopu, U. (1974). Introducere n psihodiagnostic. Bucureti: Tipografia Universitii.
64. chiopu, U. (coord.) (1997). Dicionar enciclopedic de psihologie. Bucureti: Editura
Babel.
65. tefnescu-Goang, Fl. (1946). Msurarea inteligenei. Revizuirea, adaptarea i
completarea scrii de inteligen Binet-Simon. Cluj-Napoca: Editura Institutului de
psihologie.
66. Witkin, H.A., Dyk, R.B., Faterson, H.F., Goodenough, D.R., Karp, S.A. (1962).
Psychological differentiation. Studies of development. NewYork, London: John Wiley
and Sons, Inc.
67. Zazzo, R., Gilly, M., Verba-Rad, M. (1968). Nouvelle chelle mtrique de l'intelligence.
Paris: Librairie Armand, Colin.
68. Zimmerman I.L., Woo-Sam, J.M. (1973). Clinical Interpretation of the Wechsler Adult
Intelligence Scale. New York, San Francisco, London: Grune & Straton.
69. Zlate, M. (1999). Psihologia mecanismelor cognitive. Iai: Editura Polirom.














151

CUPRINS



Capitolul 1. Introducere ...

3
1.1. Psihodiagnoza, domeniu de vocaie al profesiunii de psiholog ....................... 3
1.2. Psihodiagnoz, testare i evaluare .................................................................... 4
1.3. Marile domenii ale psihodiagnosticului ........................................................... 7
1.4. Probleme etice ale psihodiagnozei ................................................................... 11

Capitolul 2. Testul psihologic, instrumentul de baz al psihologiei aplicate ...............

15
2.1. Scurt istoric al apariiei i dezvoltrii testelor .................................................. 15
2.2. Definirea testelor .............................................................................................. 16

2.2.1. Eantionul de comportament .............................................................. 16

2.2.2. Standardizarea ................................................................................... 19

2.2.3. Fidelitatea .......................................................................................... 19

2.2.4. Validitatea .......................................................................................... 20
2.3. Administrarea testelor ....................................................................................... 21

2.3.1. ndatoririle examinatorului nainte de administrarea testelor........... 22

2.3.2. Faza de administrare a testelor ......................................................... 23

2.3.3. Faza post-test ..................................................................................... 25
2.4. Examinatorul i variabilele situaionale ........................................................... 25

Capitolul 3. Dificultatea i sensibilitatea unui test psihologic sau educaional ...........

26
3.1. Dificultatea unui test ........................................................................................ 26
3.2. Sensibilitatea unui test ..................................................................................... 27
3.3. Construcia unui test psihologic ... 31

Capitolul 4. Fidelitatea testelor ........................................................................................

33
4.1. Problematica general a fidelitii testelor ....................................................... 33
4.2. Fidelitatea test-retest 34
4.3. Coeficientul formelor paralele . 34
4.4. Coeficienii de consisten intern ... 35
4.5. Factorii care intervin n determinarea fidelitii ............................................... 38

Capitolul 5. Factori care afecteaz fidelitatea testelor ..................................................

40
5.1. ntinderea diferenelor individuale ................................................................... 40
5.2. Lungimea unui test ............... 41
5.3. Dificultatea testului .. 42
5.4. Testele cu limit de timp .. 42
152
5.5. Fidelitatea i eroarea de msurtoare ... 43
5.5.1. Eroarea standard a msurtorii (SEM) .. 43
5.5.2. Eroarea tip a estimrii 45
5.5.3. Interpretarea fidelitii 46
5.5.4. Generalizabilitatea .. 46
5.5.5. Analiza de varian i planul de optimizare ....................................... 48

Capitolul 6. Validitatea .

49
6.1. Validitatea de faad . 49
6.2. Validitatea relativ la coninut . 50
6.3. Validitatea relativ la criteriu ... 50
6.4. Validitatea relativ la construct 52

Capitolul 7. Alte fee ale validitii ..................................................................................

54
7.1. Validitatea relativ la construct (conceptual) ................................................. 54
7.1.1. Metodele corelaionale simple ........................................................... 56
7.1.2. Matricile multitrstur-multimetod ................................................ 56
7.1.3. Studiul trsturilor latente ................................................................. 58
7.2. Validitatea diferenial ..................................................................................... 60
7.3. Teoria deciziei aplicat la testele psihologice, asociat validitii predictive... 61
7.4. Precauii legate de evaluarea coeficienilor de validitate predictiv ................ 63
7.5. Interpretarea coeficienilor de validitate .......................................................... 64

Capitolul 8. Analiza de itemi ............................................................................................

66
8.1. Precizri terminologice .................................................................................... 66
8.2. Dificultatea itemilor ......................................................................................... 68
8.3. Discriminabilitatea itemilor ............................................................................. 75
8.4. Raportul dintre dificultatea i discriminabilitatea itemului .............................. 76
8.5. Indici corelaionali ai discriminrii itemilor .................................................... 79
8.6. Curba caracteristic a itemului (CCI) .............................................................. 81

Capitolul 9. Normele i etalonarea testelor. Clasificarea testelor .................................

83
9.1. Normele testelor ............................................................................................... 83
9.2. Etalonarea testelor ............................................................................................ 83
9.3. Clasificarea testelor .......................................................................................... 90
9.3.1. Clasificarea testelor dup modul de administrare ............................. 91
9.3.2. Clasificarea testelor dup timpul de execuie .................................... 91
9.3.4. Clasificarea testelor dup modul de executare a sarcinii de ctre
subiect ...........................................................................................................

92
9.3.4. Clasificarea testelor dup modul de procesare implicat ................... 93
153
9.3.5. Clasificarea testelor dup constana coninutului de la o
administrare la alta ......................................................................................

96
9.3.6. Clasificarea testelor dup modul de cotare ....................................... 96
9.3.7. Clasificarea testelor dup modul de interpretare a scorurilor .......... 96
9.3.8. Clasificarea testelor dup numrul variabilelor implicate ................ 97
9.3.9. Clasificarea testelor din punctul de vedere al procesului psihic
investigat ......................................................................................................

97

Capitolul 10. Dezvoltarea scalelor psihologice ...............................................................

98
10.1. Introducere ..................................................................................................... 98
10.2. Paii de urmat n dezvoltarea scalelor ............................................................ 98
10.2.1. Pasul nti: determinm cu claritate ceea ce dorim s msurm .... 98
10.2.2. Pasul al doilea: generarea unui set mare de itemi ........................... 103
10.2.3. Pasul al treilea: determinarea tipului de format al msurtorii ...... 108
10.2.4. Pasul al patrulea: revizia setului iniial de itemi de ctre experi ... 117
10.2.5. Pasul al cincilea: administrarea setului iniial de itemi .................. 118
10.2.6. Pasul al cincilea: evaluarea itemilor din setul iniial ...................... 118
10.3. Criterii de selecie a itemilor pentru oprimizarea lungimii scalei .................. 127
10.4. Alte analize utile pentru determinarea fidelitii scalei .................................. 130
10.5. Proiect aplicativ:
construirea unui chestionar pentru o trstur de personalitate ..............................

132

Capitolul 11. Raportul psihologic ....................................................................................

135
11.1. Obiective ........................................................................................................ 135
11.2. Lecturi recomandate pentru acest curs ........................................................... 135
11.3. Materiale i suporturi necesare ...................................................................... 135
11.4. Idei de baz pentru ntocmirea unui raport psihologic ................................... 136
11.5. Activiti propuse ........................................................................................... 137
11.5.1. ntocmirea unui raport de examinare psihologic ........................... 137
11.5.2. Structura raportului psihologic ........................................................ 137

Bibliografie ........................................................................................................................

147

Cuprins ...............................................................................................................................

151