Documente Academic
Documente Profesional
Documente Cultură
BRAOV
2014
CUPRINS
Cuprins ............................................................................................................................................ 3
Bazele teoretice ale evalurii psihologice prezentare general ..............................................11
MODULUL 1. INTRODUCERE
Introducere ...................................................................................................................... 14
Competene ...................................................................................................................... 14
M1. Unitatea de nvare 1. Evaluarea psihologic, domeniu de vocaie al profesiunii de
psiholog ..................................................................................... 14
U1.1. Introducere ............................................................................................................ 13
U1.2. Competene ........................................................................................................... 14
U1.3. Psihodiagnoz, testare, evaluare............................................................................ 14
U1.4 Situaia termenului de psihodiagnostic n spaiul romnesc .................................. 16
U1.5. Marile domenii ale evalurii psihologice .............................................................. 17
U1.5.1. coala i domeniul educaional ................................................................ 17
U1.5.2. Domeniul sntii .................................................................................... 19
U1.5.3. Domeniul muncii ....................................................................................... 20
U1.5.4 Domeniul afacerilor i alte domenii de activitate ...................................... 20
U1.6. Probleme etice ale evalurii psihologice................................................................. 21
U1.7. Rezumat ................................................................................................................. 24
U1.8. Test de evaluare a cunotinelor ............................................................................. 25
M1. Unitatea de nvare 2. Testul psihologic, instrument de baz
al psihologiei aplicate ............................... 26
U2.1. Introducere ............................................................................................................. 26
U2.2. Competene ............................................................................................................ 26
U2.3. Scurt istoric al apariiei i dezvoltrii testelor ........................................................ 27
U2.4. Definirea testelor .................................................................................................... 28
U2.4.1. Eantionul de comportament ..................................................................... 29
U2.4.2. Standardizarea ........................................................................................... 30
U2.4.3. Fidelitatea .................................................................................................. 31
U2.4.3 Validitatea ................................................................................................... 31
U2.5. Administrarea testelor ............................................................................................ 32
U2.5.1. ndatoririle psihologului nainte de administrarea testelor ...................... 33
U2.5.2 Faza de administrare a testelor .................................................................. 34
U2.5.3. Faza post-test ............................................................................................. 35
U2.6. Examinatorul i variabilele situaionale ................................................................. 35
U2.7. Rezumat .................................................................................................................. 36
U2.8. Test de evaluare a cunotinelor ............................................................................. 37
3
Structura cursului
Cursul const din tre module, fiecare cu mai multe uniti de curs:
un modul introductiv, cu un caracter teoretic de ordin mai general, cuprinznd
dou uniti de curs ce trateaz despre specificul testrii i evalurii psihologice i
despre testul psihologic;
cel de al doilea modul este unul preponderent teoretic i cuprinde patru uniti de
curs, tratnd despre dificultatea i sensibilitatea testelor, dar i despre fidelitatea
i validitatea instrumentelor psihologice;
cel de al treilea modul trateaz exclusiv probleme practice ale evalurii
psihologice, cum ar fi analiza de itemi, construcia scalelor psihologice,
identificnd etapele i regulile de construcie ale unui raport psihologic de
calitate.
Aadar, ntregul curs const din 10 de uniti de nvare: dou pentru modulul
introductiv i cte patru pentru modulele urmtoare.
Pentru parcurgerea fiecrei uniti de nvare sunt necesare ntre 4 i 8 ore, fr a
socoti timpul necesar repetiiilor de consolidare sau efecturii cerinelor opionale
formulate n curs.
Patru uniti de curs (U2 din primul modul, U4 din al doilea i U2, U3 din cel de
al treilea modul) sunt considerate a fi uniti duble, ele necesitnd 6 8 ore de
studiu necesare citirii i aprofundrii cursurilor, dar i a efecturii unor dintre
cerinele practice necesare evalurii de parcurs.
Fiecare unitate de curs cuprinde exerciii i solicitri destinate fixrii i
aprofundrii informaiei prezentate, la aceasta contribuind i un scurt rezumat al
problematicii parcurse. n partea final unitatea de curs dispune i de un set de
sarcini destinate evalurii de parcurs care presupun parcurgerea prealabil i/sau
nvarea unitii respective.
Fiecare dintre cele trei module sunt evaluate printr-o tem de control care are un
caracter de sintez. Rezolvarea celor trei teme de control este obligatorie i
acestea vor fi predate la datele ce vor fi anunate la primele activitile tutoriale
sau cel mai trziu n ziua examenului scris. Fiecare tem conteaz ca 20% din
evaluarea final, restul de 40% fiind adus de examenul final.
Cerine preliminare
Bazele teoretice ale evalurii psihologice se afl ntr-o relaie de continuitate fireasc
cu cursul de Statistic, care ofer fundamentarea teoretic necesar nelegerii
construciei i utilizrii instrumentului su de baz care este testul psihometric. n
acelai timp, cunotinele de Psihologie general, Psihologia copilului i a
dezvoltrii, Psihologia educaional, Psihologia clinic, Psihologia organizaional i
a muncii sunt contributorii i beneficiarii majori ai evalurii i testrii psihologice.
10
Discipline deservite
Avnd un caracter de disciplin aplicativ, Bazele teoretice ale evalurii psihologice
este disciplina psihologic ce devine condiie necesar prealabil pentru parcurgerea
altor discipline nrudite: Metodologia cercetrii psihologice, Evaluarea aptitudinilor
i Evaluarea personalitii. n mod secundar, Psihologia social, educaional, a
muncii, clinic, organizaional i consilierea psihologic i gsesc un suport direct
n aceast disciplin.
Durata medie de studiu individual
Timpul mediu de studiu individual presupus de cele 10 de uniti de curs care
compun cele trei module, incluznd i exerciiile sau sarcinile prezente n fiecare
unitate de curs, este de 60 de ore. La acestea se adaug nc 20 de ore necesare
rezolvrii celor trei teme i aplicaii practice incluse n portofoliul de evaluare.
Evaluarea
Nota final la aceast disciplin va lua n consideraie urmtoarele elemente:
- nota la examenul teoretic din cele 10 uniti de curs ale celor trei module, care
confer 40% din nota final;
- trei teme i aplicaii practice n calitatea lor de evaluri de parcurs X 20% = 60%
din nota final.
11
MODULUL 1. INTRODUCERE
___________________________________________________________________
Cuprins
M1.1. Introducere ... 12
M1.2. Competene ........... 12
M1.1. Introducere
Modulul 1 are un caracter introductiv i de aceea el prezint conceptele i definiiile
principalelor constructe ce vor fi utilizate n modulele ulterioare.
Modulul 1 este alctuit din dou uniti de curs. Prima unitate de nvare dezvolt
ideea psihodiagnosticului ca domeniu de vocaie al profesiunii de psiholog i i
propune s opereze distinciile necesare ntre psihodiagnoz, testare i evaluare,
identificnd marile domenii ale evalurii psihologice, solidar cu conturarea
problematicii etice pe care aceasta o angajeaz.
Cea de a doua unitate de nvare furnizeaz o perspectiv nuanat asupra testului
psihologic, considerat instrument de baz al evalurii psihologice. Ea cuprinde un
scurt istoric, dup care este propus o definiie larg i nuanat a testului
psihometric, urmat de consideraii de ordin practic relative la administrarea testelor
i la ndatoririle psihologului n cele trei faze ale unei edine de testare/evaluare.
Ca pentru toate modulele care vor urma i acest prim modul poate fi (auto)evaluat
prin parcurgerea sarcinilor de lucru incluse n structura cursului (Do it), dar i prin
testul de autoevaluare prezentat la sfritul fiecreia dintre cele dou uniti de curs.
M1.2. Competene
Dup parcurgerea acestui modul, studenii vor fi capabili:
s identifice specificul, obiectul i marile domenii ale evalurii psihologice;
s efectueze distincia testare - evaluare psihologic;
s identifice marile domenii ale psihodiagnosticului i s cunoasc principalele
probleme etice ale evalurii psihologice;
s defineasc testul psihologic ]n acord cu standardele actuale n materie;
s tie n ce const administrarea testelor i s precizeze care sunt ndatoririle
psihologului naintea, n timpul i dup edina de evaluare psihologic.
Durata medie de parcurgere a fiecreia din cele patru uniti de nvare, incluznd
rezolvarea sarcinilor propuse i a temelor de evaluare, este de 4 ore.
12
___________________________________________________________________
Modulul M1. Unitatea de nvare 1
EVALUAREA PSIHOLOGIC, DOMENIU DE VOCAIE
AL PROFESIUNII DE PSIHOLOG
___________________________________________________________________
Cuprins
U1.1. Introducere ............................................................................................................ 13
U1.2. Competene ........................................................................................................... 14
U1.3. Psihodiagnoz, testare, evaluare............................................................................ 14
U1.4 Situaia termenului de psihodiagnostic n spaiul romnesc .................................. 16
U1.5. Marile domenii ale evalurii psihologice .............................................................. 17
U1.5.1. coala i domeniul educaional ................................................................ 17
U1.5.2. Domeniul sntii .................................................................................... 19
U1.5.3. Domeniul muncii ....................................................................................... 20
U1.5.4 Domeniul afacerilor i alte domenii de activitate ...................................... 20
U1.6. Probleme etice ale evalurii psihologice................................................................. 21
U1.7. Rezumat ................................................................................................................. 24
U1.8. Test de evaluare a cunotinelor ............................................................................. 25
U.1.1. Introducere
O revist a literaturii privind principala activitate a profesiunii de psiholog
clinician scotea n eviden, acum dou decenii, un ntreg spectru de preocupri,
dintre care evaluarea psihologic i psihodiagnoza deineau cea mai mare pondere
(50%), urmate de psihoterapie (30%), de cercetarea tiinific (30%), de consiliere
(5%) i de terapia de mediu i socioterapie (5%) (vezi Ionescu, 1985, p. 51).
Plasarea n top a evalurii psihologice nu este specific numai domeniului clinic,
ci ntregului teritoriu al psihologiei aplicate, pentru c, prin instrumentele ei nalt
standardizate, ea ofer o cunoatere de adncime asupra fiinei umane, pe care se
pot fundamenta ulterior consilierea, psihoterapia sau ghidarea vocaional.
Afirmaia lui Perse (1972, p. 112), conform cruia, n domeniul clinic ... la ora
actual, examenul psihometric constituie partea cea mai important a interveniei
psihologului () metoda testelor fiind poate singura datorit creia specificitatea
i autonomia sa nu sunt contestate. i pstreaz valabilitatea i n celelalte arii ale
psihologiei aplicate, cu meniunea c termenul de testare trebuie nlocuit cu acela
mai cuprinztor de evaluare.
mprtim punctul de vedere al lui Kaplan i Saccuzzo (1993, p. iii) care i
exprim ... mhnirea pentru c prea muli studeni din colegii vd cursul de testare
psihologic ca plictisitor i nelegat de obiectivele lor sau de interesele lor pentru
13
Durata medie de parcurgere a fiecreia din cele patru uniti de nvare, incluznd
rezolvarea sarcinilor propuse i a temelor de evaluare, este de 3-4 ore.
U1.3. Psihodiagnoz, testare i evaluare
Psihodiagnoza este un concept foarte puin sau deloc utilizat de coala de psihologie
anglo-saxon i aceasta probabil din cauza nedoritei apropieri a acestui termen de acela de
diagnostic, creat i consacrat de practica medical. n acest spaiu cultural a fost folosit extensiv
14
termenul de testare (testing), pentru a circumscrie teritoriul cunoaterii exacte i obiective, de tip
psihometric a persoanei, dei n ultimele decenii cel de evaluare (assessment) a ctigat tot mai
mult teren. Acest fapt are mai multe explicaii posibile:
Chiar dac din capul locului testele au fost destinate unor scopuri nu doar constatative sau
exclusiv tiinifice (de cunoatere), ci i-au propus s aduc o schimbare benefic n viaa
oamenilor, ele au generat o anumit aprehensiune, rezisten sau chiar o reacie advers.
Deoarece testele i itemii ce le compun au fost pstrai departe de ochiul public, ca de
altfel i procedurile de scorare, interpretare i utilizare a rezultatelor, ele au creat un val de
mister ce a generat team n rndul publicului larg, cu att mai mult cu ct utilizarea lor a
cunoscut o adevrat explozie ntre cele dou rzboaie mondiale.
Psihologii s-au vzut constrni de reglementrile legale din domeniu, de teama publicului
larg fa de teste i de consecinele acesteia s priveasc cu interes spre alte metode i
instrumente ale profesiunii lor (interviul, ancheta, studiul de caz etc.), testul rmnnd
instrumentul cel mai elaborat, n mna examinatorului cu o foarte nalt calificare, la care
acesta are acces dup stagii riguroase de pregtire, asistat, controlat i certificat de
specialiti recunoscui.
Testarea psihologic a devenit specific unor scopuri mai nguste i mai bine circumscrise,
n timp ce evaluarea este mai larg, prediciile i deciziile ei bazndu-se pe coroborarea
unei multitudini de surse adiacente.
Ca i obiective, testarea nu i propune s rspund la ntrebarea cum proceseaz persoana
o anumit informaie, fiind centrat pe produs (rezultatul la test), i nu pe proces (maniera
de a ajunge la acel rezultat).
Relaia cu clientul este diferit n testare, unde poate s existe o legtur discontinu,
multiplu mediat sau chiar absent (n testarea de grup) sau o responsabilitate legal
minimal a examinatorului fa de cel examinat. n evaluarea psihologic relaia cum
clientul este una de fa-n-fa, cu responsabiliti explicite din partea examinatorului de a
desfura o activitate n folosul clientului su.
15
Definiie
Autorii citai anterior definesc evaluarea psihologic (assessment) ca ... proces de strngere i de
integrare a datelor psihologice, corelate scopului de a face o evaluare psihologic, utiliznd
instrumente ca testele, interviul, studiul de caz, observaia comportamental i aparate special
destinate, mpreun cu procedee de msurare adecvate. (op. cit., p. 11).
U1.4. Situaia termenului de psihodiagnostic n spaiul romnesc
Deoarece n psihologia romneasc nu s-a impus nici termenul de testare, nici cel de
evaluare, pentru circumscrierea domeniului aplicativ termenul consacrat fiind cel de
psihodiagnostic, ca i n unele dintre rile francofone, vom face distincia dintre diagnosticul
medical i cel psihologic. Dup cum se tie, medicul identific o anumit boal, prin mijloace
clinice (observaie, anamnez, interviu clinic, examen somatic sau psihic etc.) i paraclinice
(analize de laborator, radiografie, echografie etc.) pentru a o introduce ntr-un cadru nosologic i a
formula un tratament. Schema consacrat de mai bine de un secol pentru multe din domeniile
medicinei este: diagnostic etiologic (viznd cauza bolii), patogenetic (mecanismele ei de
producere), diagnosticul pozitiv (raportarea semnelor la un sindrom) i diferenial (raportarea la
entiti apropiate din cadrul nosografic mai general). Toate acestea nu numai pentru a circumscrie
boala, ci pentru a stabili un prognostic i un tratament adecvat.
n psihologie, diagnosticul utilizeaz de asemenea o multitudine de mijloace, dintre care
doar unele standardizate: testul, interviul, studiul de caz, observaia comportamentului, tehnici
derivate din metoda experimental, ca reacia electrogalvanic, reflexul fotopupilar sau timpul de
reacie ori cel de laten. Sursele majore ale informaiilor sunt analiza comportamentelor, a
activitii i a produselor acestora, studiul expresiei i al conduitei verbale (chiopu, 1976). Marea
diferen n raport cu diagnosticul medical este aceea c n psihodiagnoz se are n vedere terenul
psihologic nealterat al omului de pe versantul normalitii (excepie fcnd munca psihologului
din clinica neuropsihiatric), pentru a face bilanul caracteristicilor sale psihice definitorii.
n viziunea Ursulei chiopu, psihodiagnoza este ... un act de analiz psihologic a unui
caz i, concomitent, o sintez logic ce permite organizarea contient a msurilor generale de
influenare a dezvoltrii personalitii cazului considerat (1976, p. 33). Elementul comun este
aadar succesiunea dintre latura constatativ (diagnostic) i cea prognostic-ameliorativ i
formativ (personalitatea optimal, selecia omului potrivit pentru locul potrivit, personalizarea
interveniei etc.). n acest sens psihodiagnoza este elementul de baz al psihologiei difereniale, pe
care a i fcut-o posibil.
Dei ocup un teritoriu extrem de important al psihologiei aplicate, din care s-a nscut i
pe care a dezvoltat-o continuu, psihodiagnoza nu se ntlnete definit ca atare n dicionarele de
psihologie, dup cum nici noiunile de testare i de evaluare, care o circumscriu, nu sunt definite.
Eventual ele rein accepiunea iniial a termenului propus de ctre Herman Rorschach, dup care
... psihodiagnosticul este o metod de explorare a personalitii, bazat pe interpretarea liber de
forme accidentale, cum ar fi petele de cerneal, ca n Dicionarul de psihologie Larousse, al lui
Sillamy (1996, p. 244), sau ca n Dicionarul de psihologie al lui Doron i Parot (1999, p. 624).
16
Niciunul dintre ele nu definete termenul de diagnostic psihologic, dat ca i titlu unei lucrri de
referin a lui Richard Meili (Manual psihodiagnostic, 1964), dar nici pe aceia de testare-evaluare,
n accepiunea american a termenilor utilizai de numeroi autori (Anastasi, Cronbach, Gregory,
Aiken, Kaplan i Saccuzzo etc.) pentru a-i numi lucrrile lor.
n Dicionarul encilcopedic de psihologie din 1997, coordonat de Ursula chiopu, reinem
definiia termenului care exprim chiar viziunea autoarei, dup care Diagnoza psihic se refer la
omul viu i concret i const dintr-o cunoatere complex a acestuia prin tehnici psihologice,
aplicate conform unei strategii, ce permit colectri de informaii organizate privind persoana dat.
(op. cit., p. 542). Termenul de psihodiagnostic este prezent i la Mariana Roca (Metode de
psihodiagnostic, 1974) i la ali autori clujeni care, n deceniul al optulea au editat un valoros
ndrumtor psihodiagnostic, n mai multe volume. Acesta a fost un foarte preios ghid pentru
psihologul practician, cci coninea nu numai elemente de natur teoretic despre exigenele
examinrilor psihologice, ci prezenta o diversitate de instrumente practice, adaptate i etalonate pe
populaie romneasc.
Lucrrile mai noi, din Romnia de dup revoluia din 1989, par a evita ns termenul de
psihodiagnostic, ele vorbind de Construirea i utilizarea testelor psihologice (Albu, 1998), despre
Cunoaterea psihologic a persoanei (Havrneanu, 2000), despre Evaluarea n actul educaional
terapeutic (Vlad, 1999) sau despre Testarea psihologic a copilului mic (Mitrofan, 1997). Doar
Valentina Horghidan mai conserv un concept care pare s devin inactual, cel de psihodiagnostic,
n lucrarea intitulat chiar Metode de psihodiagnostic (1997). n aceast lucrare autoarea include o
multitudine de metode, pe lng clasicele test i chestionar aprnd i observaia, convorbirea,
ancheta, experimentul, scalele de evaluare a abilitilor, metoda aprecierii obiective a
personalitii, fia de caracterizare psihopedagogic a elevului i chiar metodele sociometrice. Se
produce astfel o lrgire nepermis de mare a cadrului metodologic al acestei discipline ce tinde
astfel s-i subsumeze prin nglobare ntreaga metodologie a tiinei psihologice, cu deschidere
chiar i spre sociologie.
Opinm c termenul tradiional de psihodiagnostic poate fi totui pstrat, pentru c el
include i pe cel foarte tehnic i consacrat de testare (testing), destinat determinrilor cantitative,
dar i pe cel de evaluare (assessment), desemnat s completeze i s nuaneze diagnosticul cu
elemente calitative. Dar, pentru c testul psihologic rmne instrumentul su cel mai tehnic i cel
mai puternic, cu o evoluie neegalat de niciuna dintre celelalte metode, genernd o adevrat
tiin legat de construcia i aplicarea sa, credem c centrul de greutate al acestei discipline a
pihologiei aplicate, psihodiagnoza, trebuie s rmn testarea psihologic.
U1.5. Marile domenii ale evalurii psihologice
U1.5.1. coala i domeniul educaional
Prima arie n care s-a produs dezvoltarea i utilizarea testelor mentale a fost coala i
domeniul educaional, prin bateria publicat de Binet n 1905. La peste un secol de la lansarea
primei Scale metrice a inteligenei, coala rmne n continuare marele beneficiar al evalurii
psihologice.
17
Selecia educaional prin teste standardizate la colegii sau universiti (nu ca o procedur
unic i exclusiv, ci n asociere cu alte metode, cum ar fi scrisorile de recomandare,
mediile din timpul anilor de studiu la anumite discipline colare, interesele elevului din
afara colii etc.).
18
Credem c zona celei mai vaste i mai fructuoase ntlniri dintre tiina testelor
(psihometria) i tiina examinrii (docimologia, doxolgia sau docimastica) este cel al evalurii.
Chiar randamentul colar, ca raport dintre aptitudinile cognitive ale elevului i gradul de acoperire
a obiectivelor operaionale, exprimate prin calificative, note sau medii colare, este locul unde
testarea psihologic i evaluarea educaional se ntlnesc n modul cel mai fericit.
U1.5.2.Domeniul sntii
Domeniul sntii, n general, i cel al sntii mintale n special, presupune o fericit
sintez ntre funcia de psihometrician a psihologului clinician i cea de diagnostician, unde
contribuia lui rmne esenial i fundametal (Ionescu, 1985, p. 55), cu cea de psihoterapeut i
de cercettor. n echipa medic-psiholg, cel din urm pare a avea o ... situaie privilegiat n
cercetare, unde el nu face, asemenea medicului, un examen, nu acord o consultaie, ci ntreprinde
o investigaie, el desfoar o activitate de explorare, ceea ce i asigur un statut special n
cercetere. (idem, p. 59). Locul psihologului nu este numai n clinica de boli nervoase, deoarece
prezena sa n sntate duce la o reconsiderare a actului medical n ansamblul su prin repunerea
n drepturi a subiectivitii bolnavului. De aceea asistm la o extindere progresiv a ariei de
competen a acestui tip de specialist, i simultan a calitii prestaiei sale, motiv pentru care n
multe dintre rile vestice stagiile de formare pentru psihologul clinician sunt pe deplin
comparabile cu cele ale medicului, pentru a nu aduce n discuie i importana acordat pregtirii
psihologice a medicului nsui.
Psihologul clinician intervine diagnostic i terapeutic n:
Domeniul sntii este cel n care funcia diagnostic i cea prognostic sau recuperatorie
se ntlnesc plenar, fcnd din psiholog nu numai un om care aplic teste (de inteligen, memorie,
personalitate, aptitudini, valori, interese etc.), ci un specialist care acumuleaz o experien
19
preioas n prevenie i n terapie, oriunde intervine o disfuncie, sau acolo unde ea nc nici nu
exist, pentru a face posibil personalitatea optimal, integrat i adaptat.
n toate aceste domenii s-a conturat o zon de elecie a muncii psihologului, cea de
consiliere psihologic, a sfatului avizat, pentru o tot mai mare diversitate de situaii. Cum ar putea
fi acest copil mai puin conflictual n grup? Ce carier ar fi cea mai potrivit pentru persoana X?
Ce activiti i s-ar putea recomanda dup pensionare lui Y, pentru a se potrivi cu structura sa
cognitiv i cu interesele sale? Cum ar putea depi solicitrile prea stresante o personalitate de tip
A, pentru a preveni un infarct? Dar diabeticul sau hemofilicul ce anse au s coabiteze cu aceste
boli cronice? Sau ce risc exist pentru un cuplu care are un copil cu o boal genetic (sindrom
Down, de exemplu) de a avea un al doilea copil cu aceeai afeciune? (sfat genetic).
U1.5.3. Domeniul muncii
Domeniul muncii ofer un cmp de aciune imens psihodiagnozei i evalurii psihologice,
specialistul trebuind:
s avizeze periodic muncile i activitile cu risc crescut (lucrul la nlime, portul de arm,
serviciile de paz etc.);
s ofere criterii valide de promovare i s ajute la construirea carierei angajailor;
s asiste tehnic reciclarea i reprofilarea, ntr-o lume n care schimbarea devine condiia sa
permanent;
Dreptul de a-i da consimmntul asupra testrii: cu ce instrumente sunt testai, cum vor fi
utilizate datele i cui vor fi remise informaiile despre rezultatele obinute.
Dreptul la non-invazia vieii intime, private: exist o informaie privilegiat, protejat prin
lege, cum ar fi cea obinut din relaia avocat-client, medic-pacient, preot-credincios, sosoie i psiholog-client.
Dreptul la cea mai puin stigmatizant etichetare, care s nu lezeze demnitatea uman a
clientului.
Respectul altuia: psihologul nu trebuie s se foloseasc de mijloace profesionale pentru ai asigura avantaje personale.
Informarea tiinific este un principiu care stipuleaz obligaia psihologului de a se
informa continuu asupra evoluiei cunotinelor din domeniul su i de a avea grij s
comunice tiina sa ct mai complet posibil, ntr-un spirit de exactitate i de adevr.
22
Autonomia tehnic oblig psihologul s rezilieze orice angajament pentru care nu se simte
apt prin tehnicile pe care le deine, el avnd n ntregime responsabilitatea alegerii
metodelor pe care le folosete.
n mod foarte explicit, codul deontologic analizeaz cteva categorii de standarde etice
generale, cum ar fi cel al competenei, standardele cu privire la relaiile umane, standardele de
23
25
___________________________________________________________________
Modulul M1. Unitatea de nvare 2
TESTUL PSIHOLOGIC, INSTRUMENTUL DE BAZ
AL PSIHOLOGIEI APLICATE
_________________________________________________________________
Cuprins
U2.1. Introducere ............................................................................................................ 26
U2.2. Competene ........................................................................................................... 26
U2.3. Scurt istoric al apariiei i dezvoltrii testelor ....................................................... 27
U2.4. Definirea testelor ................................................................................................... 28
U2.4.1. Eantionul de comportament .................................................................... 29
U2.4.2. Standardizarea .......................................................................................... 30
U2.4.3. Fidelitatea ................................................................................................. 31
U2.4.3 Validitatea .................................................................................................. 31
U2.5. Administrarea testelor ........................................................................................... 32
U2.5.1. ndatoririle psihologului nainte de administrarea testelor ..................... 33
U2.5.2 Faza de administrare a testelor ................................................................. 34
U2.5.3. Faza post-test ............................................................................................ 35
U2.6. Examinatorul i variabilele situaionale ................................................................. 35
U2.7. Rezumat ................................................................................................................. 36
U2.8. Test de evaluare a cunotinelor ............................................................................ 37
U2.1. Introducere
Nicio alt metod a psihologiei aplicate nu a avut o contribuie mai efectiv n
impunerea ei n aproape toate domeniile de activitate uman, dar i n declanarea
unor dispute care au culminat cu o puternic atitudine antitest, iniial n fosta
U.R.S.S., apoi n Statele Unite ale Americii (ara n care practica testelor a luat cea
mai mare amploare), dar i n rile de Jos, ulterior. Este de aceea ntemeiat
metafora Ursulei chiopu, care consider testul psihologic ... copilul scandalos al
psihologiei, ce mai tulbur i astzi spiritele (1976, p. 104).
U2.2. Competene
Dup parcurgerea acestei uniti de curs, studenii vor ti:
s descrie pe scurt apariia conceptului de test psihologic;
s defineasc testul psihologic ca msur standardizat a unui eantion de
comportament;
s identifice i s descrie trei dintre caracteristicile de baz ale testelor
psihologice, standardizarea, fidelitatea i validitatea;
s identifice i s defineasc corect ndatoririle psihologului naintea
26
Prob determinat, implicnd o sarcin de executat, identic pentru toi subiecii examinai.
Ea dispune de o tehnic precis pentru aprecierea succesului i pentru notarea numeric a
reuitei (Piron, 1963).
Situaie standardizat, servind drept stimul unui comportament. Acest comportament este
evaluat i comparat statistic cu al altor persoane plasate n aceeai situaie, ceea ce permite
clasarea subiectului, fie cantitativ, fie tipologic (Pichot, 1984).
Instrument al metodei experimentale, organizat sub forma unor probe standardizate din
punct de vedere al coninutului, al condiiilor de aplicare i al modalitii de apreciere a
rezultatelor, care este folosit n stabilirea unei anumite variabile (Holban, 1973).
S ne reamintim...
Din aceast multitudine de definiii elementele sintetice cele mai semnificative,
eseniale pentru nelegerea specificului unui test psihologic sunt:
este prob, procedur, procedeu sau instrument standardizat;
funcia lui fiind n acelai timp diagnostic (apreciaz starea de fapt), dar i
prognostic (anticipeaz categorii viitoare de comportamente mai importante
dect cele msurate efectiv);
U2.4.2. Standardizarea
Standardizarea este o condiie fundamental a testului psihologic, unde orice variaie a
condiiilor de aplicare produce o variaie a rezultatelor. Standardizarea se refer att la coninuul
testului (proba este identic cu sine nsi n ce privete nu numai coninutul itemilor, dar chiar i
forma lor de prezentare i foaia de rspuns), ct i la condiiile de aplicare (asemnarea pn la
identitate dintre condiiile n care s-a experimentat i cele n care se aplic proba) i n modul de
corectare, cotare i apreciere a probei de ctre autorul, respectiv utilizatorul testului. Fiind o
metod de baz a psihologiei difereniale, testul poate fi considerat variabila independent prin
care o nsuire psihic (variabila dependent) este observat prin examinarea persoanelor care sunt
testate (pstrarea constanei situaiei, elementul de variabilitate fiind persoanele).
Deoarece n psihologie pluri-determinarea face dificil izolarea fenomenelor, cerina
uniformitii i a identitii de procedur este mai stringent ca n alte domenii. Pentru a asigura
uniformitatea, autorul testului d indicaii precise i detaliate despre cum se administreaz i cum
se scoreaz rezultatele testului, indicaii ce vor fi respectate foarte strict, pentru c altminteri
rezultatele culese nu vor mai fi compatibile cu cele obinute pe eantionul standard (eantion de
etalonare sau normativ). Materialele folosite, modul lor de prezentare i de manevrare,
demonstraia prealabil, instructajul subiecilor, limitele de timp toate sunt specificate i
respectate ntocmai. Uniformitatea se refer i la rata vorbirii examinatorului, la tonul, inflexiunile
vocii sau expresia sa facial, care trebuie s rmn constante de la o aplicare la alta a aceleiai
probe.
Deoarece un test nu are indicatori predeterminai pentru aprecierea succesului sau a
eecului, un alt aspect al standardizrii se refer la norme, adic la stabilirea valorilor medii
(normale) ale performanelor, n funcie de care, plecnd de la scorurile brute (numrul de itemi
rezolvai corect, timpul, viteza, numrul de erori etc.) se stabilesc scorurile standard. Aceasta
presupune activitatea de etalonare, care se face pe loturi mari, reprezentative statistic, crora li se
determin media, mediana, abaterea standard, frecvenele brute i cumulate, n funcie de care se
stabilesc cotele standard. Performana oricrui individ nou examinat va fi raportat la acest cadru
de referin. Pentru ca acest lucru s fie posibil este obligatorie uniformitatea i identitatea
procedurilor de aplicare a testului, cu situaia de etalonare originar, pentru orice caz nou testat.
S ne reamintim...
n rezumat, standardizarea testelor presupune identitatea de procedur, de
aplicare/administrare i de cotare a unui test. n mod mai explicit standardizarea se
refer:
la coninut (proba va fi identic cu ea nsi);
la materiale i la modul de manipulare a acestora;
la instructaj i la aplicarea efectiv a probei;
la modul de corectare, cotare, scorare sau apreciere a probei;
la existena unor bareme sau norme prin care performana brut a subiectului
capt relevan statistic.
30
U2.4.3. Fidelitatea
Dac cineva i-ar determina greutatea citind pe cadranul unui cntar 80 de kg, iar pe al
altuia 92 de kg, la distan de cteva secunde, nu ar ti nici care este greutatea sa real, nici care
dintre cntare este cel bun (dac este vreunul). Cu att mai mult ne vom ndoi de indicaiile
cntarului respectiv cu ct, la dou msurtori succesive ale aceleiai persoane, el va indica valori
diferite. Un test, ca oricare alt dispozitiv de msurare, trebuie s fie fidel, adic egal cu sine nsui
(consistent), rezultatele unor msurtori repetate trebuind s fie cel puin stabile, dac nu identice.
Cu ct fidelitatea unui test este mai mare, cu att mai mare siguran avem c rezultatele lui sunt
reale, nefiind n mod semnificativ afectate de schimbri aleatoare, cum ar fi contextul, situaia de
testare, starea subiectului sau particularitile examinatorului. Utilizat n psihometrie, termenul de
fidelitate (reliability n englez) ntotdeauna nseamn consisten, afirm Anastasi (1972, p. 27).
S ne reamintim...
Exist cteva modaliti speciale de determinare a fidelitii. n principiu acestea
sunt toate metode corelaionale:
Procedura test retest (corelaia dintre rezultatele aplicrii aceluiai test, n
aceleai condiii, acelorai subieci, eventual de ctre acelai examinator, n
dou momente de timp diferite, la distan relativ scurt, pentru a nu aprea
modificri n structura parametrului investigat).
Calculul corelaiei dintre rezultatele unui test i forma sa paralel, alternativ
(n cazul n care ea exist), aplicat n condiii identice.
Tehnica njumtirii (split-half), prin care jumtatea par a unui test (itemii cu
numr par) este pus n corelaie cu jumtatea lui impar. Exist i alte metode
de njumtire.
Corelaia ntre modul n care psihologi diferii scoreaz acelai test, aplicat
acelorai persoane, n aceleai condiii (fidelitatea interscoreri).
U.2.4.4. Validitatea
Un test poate s fie fidel fr a fi ns i valid, nsuire care se refer la faptul c el msoar
efectiv ceea ce i-a propus. Nici un test nu are validitate sczut sau ridicat n mod absolut,
deoarece aceasta depinde de scopul i maniera n care testul este utilizat.
Exemplu
Galton a ncercat s determine ntr-o manier corect acuitatea perceptiv sau
sensibilitatea la durere, dar acestea s-au dovedit a nu fi determinri valide ale
inteligenei, aa cum el a presupus.
Spre deosebire de fidelitate, care se poate determina relativ uor, validitatea are nevoie de
acumulri graduale de informaie, rezultate din diferite tipuri de investigaii. Deoarece este un
proces progresiv, dependent de timp, este mai potrivit s se spun c un test se valideaz,
validitatea fiind acea determinare care permite s spunem n ce msur el i ndeplinete funciile
pentru care a fost proiectat, n raport cu diversele sale domenii de aplicaie. Prin validitate, testul
se testeaz pe sine, fcnd apel la diverse criterii externe, pentru a determina dac prediciile sale
au fost valabile i n ce msur, n funcie de care se va ti ce ncredere poate s i fie acordat.
31
S ne reamintim...
Ca i fidelitatea, validitatea este o corelaie, care se poate stabili n cteva feluri:
1. Msura n care un test acoper un domeniu, adic validitatea de coninut. Un
test de cunotine poate acoperi un mic sector al matematicii, sau unul mai larg,
caz n care el devine mai valid n raport cu acest domeniu.
2. Msura n care scorurile la un test sunt n acord cu teoria care susine trstura
sau constructul msurat, adic validitatea de construct.
3. Msura n care testul coreleaz cu un alt test independent, recunoscut ca un
bun instrument de msur al aceluiai domeniu (inteligen, memorie,
personalitate etc.), ceea ce reprezint validitatea relativ la criteriu. Cnd
scopul testului este predicia unui anumit comportament, criteriul va fi
msurarea viitoarei performane i corelarea ei cu testul iniial, n acest caz
vorbind de validitatea predictiv. Aceasta este o form fundamental de
validitate, pentru c de cele mai multe ori psihodiagnoza are n vedere
prognoza, adic anticiparea rezultatelor.
Unii detractori ai metodei testelor susin c cea mai bun predicie a rezultatelor
unei munci sau a unei activiti ar fi rezultatele obinute ntr-o perioad de timp n
chiar munca sau activitatea respectiv. Aceasta ar face inutil chiar activitatea de
selecie pe baz de teste, dar aceast modalitate nu este utilizabil practic din cauza
marilor cheltuieli de timp i bani presupuse de punerea ei n aplicare.
La aceste trei caracteristici care sunt standardizarea, fidelitatea i validitatea testelor, se
adug i sensibilitatea sau fora discriminativ, ct i condiia de etalonare, aspecte ce vor fi
tratate mai detaliat n capitolele urmtoare, ntruct de ele depind nelegerea i buna utilizare a
acestor puternice instrumente psihodiagnostice, care sunt testele psihologice.
U2.5. Administrarea testelor psihologice
Necesitatea de a avea stabilite proceduri detaliate sau doar orientative pentru administrarea
i scorarea testelor psihologice i educaionale a fost recunoscut de toate organizaiile care se
ocup cu testele. American Educational Research Association a stabilit 180 de standarde care
accentueaz asupra importanei uniformitii n administrarea i scorarea testelor. Procedurile de
testare depind fie de tipurile de teste (individuale sau de grup, cu i fr limit de timp, cognitive
sau de personalitate, psihologice sau educaionale etc.), fie de subiecii supui examinrii
(difereniai dup vrst, sex, cultur, grad de motivaie, nivel de anxietate etc.).
Formarea specialitilor care vor administra teste este una de durat, se face sub
supervizarea unui psiholog cu experien i presupune caliti personale, dublate de cunotine
detaliate despre instrumentele psihometrice utilizate. Cum variabilele situaionale pot avea o
pondere important n rezultatul final (variabile confundate), ele trebuie controlate ct mai
complet posibil.
32
Exemple
Aiken (1997) face cteva recomandri valabile pentru aceste categorii speciale:
psihologul s asigure timp suficient celui examinat pentru a nelege i rspunde;
s permit suficient antrenament la itemii simpli, pregtitori;
s foloseasc perioade mai scurte de testare;
s observe oboseala i anxietatea i s le ia n calcul;
s sesizeze i s noteze deficienele perceptiv-motrice (defectele de auz, vz,
motrice, lateralizarea invers);
s foloseasc generos ncurajarea i ntrirea pozitiv;
s nu foreze subiectul s rspund cnd acesta nu mai dorete.
Toate recomandrile de mai sus nu trebuie s vin n conflict cu cerina de baz a
oricrei testri psihologice, care este standardizarea i uniformitatea de procedur.
n timpul testrii, mai ales la testele cu rspunsuri la alegere din mai multe posibiliti sau
variante, este posibil ca o parte dintre rspunsurile bune s poat fi efectiv ghicite, sau determinate
prin ceea ce Aiken (1997) numete deteptciunea n test (test wiseness). Prin aceasta se elimin
opiunile nepotrivite, prin semne adiionale scpate n formularea itemilor, ce permit judeci
comparative ntre opiuni. Exist tehnici speciale de ameliorare a performanelor la anumite teste,
nu prin pregtirea specific n domeniu, ci prin respectarea unor reguli.
U2.5.3. Faza post-test
Dup terminarea edinei de testare, examinatorul colecteaz i pune n siguran
materialele de testare i foile de rspuns. D mici bonusuri, recompense copiilor sau celor mai
anxioi sau vulnerabili. Uneori informeaz prinii sau persoana n cauz despre utilizarea ce va fi
dat rezultatelor testului. De asemenea el promite s furnizeze informaiile rezultate persoanei sau
ageniei care l-a angajat, indicnd timpul, locul sau maniera n care va face acest lucru. n caz de
examen colectiv, psihologul i ajutoarele sale colecteaz toate materialele utilizate n examen, se
asigur c nimic nu lipsete i abia dup aceea permite retragerea subiecilor, dup care el va pune
n ordine foile de rspuns i se va pregti s le scoreze.
V invitm la un exerciiu de imaginaie: anticipai consecinele posibile, n
plan practic, dar i etic, ale dispariiei unui caiet de test de inteligen larg
aplicat n evalurile colective pentru selecia de personal.
U2.6. Examinatorul i variabilele situaionale
Exist muli stimuli externi ambigui care trebuie luai n considerare sau controlai de ctre
examinator. Copiii precolari pun probleme speciale examinatorului, ca i btrnii, emotivii,
ruinoii, anxioii sau vulnerabilii. Vrsta, sexul, rasa, statusul social, economic i cultural,
experiena, antrenamentul, aparena exterioar a examinatorului sau a examinailor sunt de luat de
asemenea n calcul n ceea ce privete diferenele pe care examinatorul nsui le poate introduce.
Uneori chiar nivelul lui de expectaie poate genera profeia care se automplinete sau efectul
Rosenthal.
35
Situaia de examinare are i alte faete. Anne Anastasi arat c recruii abia ncorporai dau
rezultate mai slabe dac sunt examinai imediat dup ncorporare, fr s fi avut timp s se
acomodeze cu noul mediu. Uneori activitile imediat precedente i pun amprenta asupra
performanei la test. Feedback-ul pozitiv sau negativ dat de examinator pe parcursul desfurrii
testului poate ameliora sau diminua rezultatele finale. Chiar dac ponderea acestor factori nu este
foarte mare, ntr-un program de testare bine conceput examinatorul trebuie s fie foarte atent la ei
pentru a le minimiza influena.
Probleme suplimentare apar i atunci cnd o edin de testare este precedat de un
antrenament practicat cu teste similare. Deoarece practica testelor a luat o amploare extrem de
mare n toat lumea i deoarece multe decizii importante se bazeaz pe rezultatele obinute la
teste, edituri specializate sau firme de profil i ofer serviciile n antrenarea candidailor. ntr-o
manier similar cu a iluzionitilor care fac publice secretele confrailor, sau cu a informaticienilor
care introduc virui n programele calculatoarelor, psihologii au czut n propria curs, ceea ce i
oblig la precauii suplimentare ce fac din psihodiagnoz un domeniu tot mai tehnicizat.
Imaginai dou modaliti de a contrabalansa efectul antrenrii la teste de
performan prin parcurgerea unor sarcini de acest fel publicate de edituri sau
prin accesul la teste consacrate, favorizat de psihologi profesioniti.
U2.7. Rezumat
Testul este considerat copilul scandalos al psihologiei, care mai tulbur i
astzi spiritele.
Aceasta pentru c, nc de la nceput utilizrii sale, testul a creat posibilitatea
rezolvrii unor probleme practice, fiind instrumentul ce a generat apariia
psihologiei aplicative, educaionale i difereniale.
Testul este un instrument economic i cu mare randament de utilizare.
n acelai timp, testul a fcut posibile i utilizri inadecvate, ceea ce a avut drept
consecin apariia unor reglementri legale stricte privind utilizarea.
Testul psihologic este o prob sau procedur standardizat ce servete drept
stimul pentru producerea unui eantion de comportament (Anastasi).
Acesta va fi apreciat prin raportarea la un etalon sau tabel de norme, obinut pe
populaia de referin utilizat drept eantion normativ.
Prima dintre cele trei nsuiri eseniale ale unui test psihometric este
standardizarea, adic uniformitatea de coninut, de aplicare i de interpretare.
Fidelitatea unui test, determinat prin calculul corelaional, indic consistena
sa, adic stabilitatea sa n timp.
Validitatea unui test este o caracteristic esenial mai greu de probat, dar
obligatorie pentru fiecare extindere a utilizrii testelor spre noi populaii sau
spre noi utilizri.
n principiu, validitatea arat dac testul msoar efectiv ceea ce i-a propus s
msoare, pentru aceasta existnd mai multe tipuri de demersuri de validare.
36
37
39
___________________________________________________________________
Modulul M1. Unitatea de nvare 3
DIFICULTATEA I SENSIBILITATEA UNUI TEST PSIHOLOGIC
_________________________________________________________________
Cuprins
U1.1. Introducere ............................................................................................................. 40
U1.2. Competene ............................................................................................................ 40
U1.3. Dificultatea testelor ................................................................................................ 41
U1.4. Sensibilitatea testelor ............................................................................................. 41
U1.5. Construcia unui test psihologic ............................................................................. 45
U1.6. Rezumat .................................................................................................................. 47
U1.7. Test de autoevaluare a cunotinelor ...................................................................... 48
U1.1. Introducere
Aplicarea unui test psihologic sau educaional ridic o problem tehnic foarte
important i anume dac el este adecvat, ca i grad de dificultate, populaiei sau
grupului respectiv. Dac este prea uor, majoritatea scorurilor la test vor fi mari i
curba rezultat, n form de j, va fi asimetric spre dreapta; dac va fi prea greu,
curba n form de i va fi asimetric spre extrema stng. Se apreciaz c testul
este adecvat unei populaii doar n cazul n care repartiia scorurilor sale este
simetric, genernd o curb de tip gaussian.
Problema dificultii unui test se pune i n funcie de tipul acestuia. Dac el este
un test de aptitudini, capaciti, deprinderi sau cunotine, aceast problem este
mult mai relevant dect pentru testele de personalitate sau chestionarele de opinii,
atitudini, interese, valori, caz n care termenul de dificultate ar putea fi nlocuit cu
cel de accesibilitate.
U1.2. Competene
Dup parcurgerea acestei uniti cursanii vor fi capabili:
s pun n relaie forma distribuiei scorurilor unor probe psihologice cu
dificultatea testului;
s fac conexiunea dintre scopul testrii i nivelul de dificultate optim al unui
test sau baterii de teste;
s defineasc conceptual de sensibilitate a unui test i s l pun n legtur cu
forma distribuiei;
s identifice i s analizeze rolul lungimii testului, a manierei sale de scorare i a
tipului de norme utilizate n problema sensibilitii testelor;
s analizeze corelativ problema sensibilitii i dificultii unui test;
s prezinte etapele i specificul fiecrei etape din construcia unui test.
40
aceast caracteristic n funcie de numrul claselor de scor pe care le pot delimita n interiorul
unui grup. Cu ct numrul valorilor de scor este mai mare, cu att mai bine testul discrimineaz
(difereniaz) ntre indivizi.
n afara acestei accepiuni, Kline (1993) leag sensibilitatea unui test de capacitatea sa de a
produce scoruri diferite pentru subiecii care difer ntre ei n ce privete caracteristica msurat.
Deoarece sensibilitatea conjug caracteristicile testului cu cele ale populaiei msurate, vom
remarca faptul c testele mai lungi, cu itemi mai bine gradai ca dificultate sunt mai sensibile,
pentru c ele produc mai multe clase, i deci mai multe valori ale scorurilor posibile. Prin contrast,
testele scurte sau cu itemi foarte omogeni ca grad de dificultate, genereaz mai degrab categorii
de scor dihotomice, foarte contrastante, fiind puin discriminative. Depinznd de forma repartiiei
pe care o d scorurilor sale, testul cu curbe atipice (n i, j sau bimodal) sunt mai puin sensibile n
zonele de mare aglomerare a scorurilor i mai sensibile n rest. Curba lui Gauss este tot mai
discriminativ spre extreme, i tot mai puin sensibil pe poriunea sa central, unde aglomerarea
rezultatelor produce un numr mai mic de scoruri.
Exist o legtur foarte puternic ntre dificultatea unui test i sensibilitatea sa. La fel cum
n fotografie filmele foarte sensibile (care se impresioneaz la cantiti mici de lumin) pltesc un
pre n ceea ce privete calitatea imaginilor (mai puin nete, deoarece imaginea este tradus pe
pelicul prin grupuri mai mari de puncte), sau la fel ca n metrologie, unde balana analitic i
dovedete utilitatea pentru greutile mici, dar nu i pentru kilograme sau tone, testele psihologice
trebuie s stabileasc un raport optim ntre dificultate i sensibilitate.
Sensibilitatea presupune, pe de o parte, o ct mai bun acoperire a domeniului de coninut
al variabilei, pentru care testul trebuie s aib grade diferite ale dificultii, pe de alt parte discriminarea de finee la nivelul fiecrui palier de dificultate considerat. Pentru a exemplifica,
bateria de inteligen WISC este operaional de la 5-6 ani la 17-18 ani, pentru fiecare an
furnizndu-se etaloane din 4 n 4 luni. Dar, n timp ce anumite subteste ale bateriei (Informaii,
Comprehensiune) produc un larg evantai de scoruri, nct etaloanele nu au goluri, alte subteste
(Cifrele, Labirinturile), discrimineaz grosier pe anumite poriuni ale scalei, la anumite vrste, din
cauza numrului mic de itemi care le compun.
Subtestul Cuburilor, o foarte valid expresie a inteligenei concret-spaiale, compus din 10
pattern-uri ce pot da (n forma iniial) 55 de puncte de scor, are un prag nalt de intrare n prob la
vrstele mici (5-6 ani), unde nu distinge fin performana vizuo-spaial a celor cu coeficieni de
inteligen mai mici de 80, i un prag jos la vrste mari (peste 13 ani), unde nu mai distinge bine
supradotaii (IQ > 125/130). Pentru bateria WISC, combinarea optim a celor dou caracteristici
(dificultatea cu sensibilitatea) se face pentru vrstele de 11-13 ani, unde subtestele care o compun
au cea mai mare for discriminativ i deci cele mai bune caliti psihometrice (Zimmerman i
Woo-Sam, 1973). n mod similar, testul PM 38 (Matricile Progresive Standard ale lui Raven) are
un prag nalt de intrare n prob la 5-6 ani i unul jos dup vrsta de 14 ani, deci nu distinge bine
insuficiena ori supradotarea mintal, la vrstele mici, respectiv mari.
42
S ne reamintim...
Sensibilitatea testelor depinde de muli factori, dintre care amintim:
44
Exemplu
Cum dificultatea i sensibilitatea unui test depind de mrimea i de caracteristicile
lotului particular de subieci crora li se aplic testul, nseamn c este necesar s
se determin valorile tendinei centrale ale populaiei respective. Aceasta ofer o
imagine privitoare la gradul de suprapunere a lotului testat cu eantionul normativ,
prezentat de manualul testului. Cnd media grupului testat este semnificativ diferit
de cea a eantionului normativ din manual nseamn c testul este prea uor sau
prea greu, iar concluziile trase prin raportarea valorilor brute la etalon pot fi
distorsionate sau chiar greite. Dac abaterea standard indic o valoare mult
diferit (mai mic sau mai mare dect cea a lotului normativ), nseamn c lotul
testat este fie prea omogen, fie prea eterogen n raport cu eantionul normativ. n
prima situaie fora de discriminare a testului este mai sczut, n a doua mai
ridicat, dar n ambele situaii va trebui avut n vedere construcia unui etalon mai
adecvat populaiei respective.
Trebuie observat c nici un test nu poate fi att de sensibil nct totdeauna, dou persoane
deosebite n privina variabilei msurate de test s obin scoruri diferite, afirm Albu (1998, p.
189). Aceasta pentru c, n timp ce trsturile psihice sunt variabile continue, scorurile la test sunt
variabile discontinue i de aceea o coresponden biunivoc ntre variabila testat i scorul la test
este un fapt imposibil de realizat practic. Scorul la test fiind afectat de diverse tipuri de erori
(generate de testul nsui, de subiect, de examinator sau de situaia de examinare), este posibil ca
aceeai variabil, msurat la acelai individ, s aib mai multe valori de scor. ntruct
performana la un test se raporteaz la un numr de intervale mai mic dect numrul valorilor de
scor pe care el le poate nregistra, nseamn c indivizii plasai pe acelai interval de scor nu sunt
discriminai. Deci un test va fi cu att mai discriminativ cu ct va separa mai bine indivizii ce
prezint diferene mai mici n privina variabilei msurate.
U1.5. Construcia unui test psihologic
Analiza setului de itemi ai unui test se face nu numai n sensul determinrii puterii
discriminative a acestuia, ci i n contextul mai general al construirii unui test bun. Deoarece
construcia testelor a devenit n acelai timp o tiin i o art, ce implic o tradiie i experi n
domeniu, nu vom aborda aceast problem complex, prezentnd doar principiile generale care
stau la baza acestei activiti.
Aa cum se vede din figura 3.1 de mai jos, elaborarea unui test ncepe cu decizia
referitoare la ce fel de informaie dorim s obinem prin utilizarea sa. Itemii de genul adevrat-fals
vor fi utilizai doar cnd vrem s evalum judeci absolute, n rest fiind preferabili cei cu alegeri
multiple, care produc mai mult variabilitate a scorurilor. i n acest caz constructorul trebuie s ia
n calcul probabilitatea ca cineva s dea rspunsul din ntmplare (prin ans). Pentru scalele de
atitudini sau de opinii, cel mai popular este formatul dat de scala Likert: ntre acordul total i
dezacordul total se pot interpune 3 pn la 9 trepte, dintre care treapta intermediar reprezint
neutralitatea. Un alt format este scala n 10 puncte (metoda scalrii categoriilor) folosit n
45
ratingul unor comportamente, n care punctele de nceput i de sfrit sunt foarte clar definite.
Tehnica Q-Sort, folosit n studiul personalitii, cere unui subiect s fac evaluri asupra msurii
n care anumii itemi l descriu pe el sau pe altcineva (a se vedea capitolul ultim, despre crearea i
statisticile scalelor psihologice). Dup ce au fost creai i li s-a stabilit formatul, itemii vor fi
administrai unui grup pentru pilotarea formei iniiale a testului. Caracteristicile itemilor vor fi
apreciate printr-o evaluare sistematic a dificultii i forei lor de discriminare, prin determinarea
curbelor caracteristice ale acestora, prin studierea consistenei interne sau a validitii relative la
criteriu etc. Abia dup aceasta se face definitivarea formei finale a testului care va fi aplicat,
urmnd procedurile de standardizare stabilite (condiii de aplicare, instructaj, limite de timp i mod
de prelucrare a rezultatelor). Analiza tehnic a testului (fidelitate, validitate i etalonare) ncheie
un ciclu care se poate relua ori de cte ori constructorul dorete s-i perfecioneze sau s
reetaloneze testul, ori s-l mbunteasc din punctul de vedere al fidelitii sau al validitii prin
eliminarea sau adugarea de itemi.
Stabilirea scopului testului
STABILIREA SCOPULUI
Definirea coninutului
abilitii msurate
A ABILITILOR
Definirea unei
trsturi
UNEI
Revizuirea i redactarea
itemilor
46
U1.6. Rezumat
Analiza unui test se poate face la nivel molar (global) sau la nivel molecular
(analiza itemilor testului).
La nivel global se are n vedere determinarea dificultii i sensibilitii unui test
care msoar aptitudini, capaciti, priceperi, deprinderi sau cunotine.
Pentru chestionare (de interese, opinii, valori sau atitudini) problema dificultii
nu se pune, acestea trebuind s aib o larg accesibilitate.
Dificultatea testului cupleaz caracteristicile sale intrinsece, care in de coninut,
cu cele extrinsece, care in de populaia i de scopul testrii.
Dificultatea testului se determin prin tipul de curb care rezult din aplicarea sa
pe populaia int.
Sensibilitatea unui test este sinonim cu puterea sa de discriminare i este
definit prin numrul claselor de scor pe care le poate produce n interiorul unei
distribuii de scoruri.
Sensibilitatea unui test depinde de trei factori eseniali: de numrul itemilor, de
maniera de scorare a testului i de tipul de norme utilizat n etalonarea sa.
Astfel, un test cu mai muli itemi gradai ca dificultate, poate produce mai multe
clase de scor, fiind deci mai sensibil.
Maniera de scorare poate capta mai mult sau mai puin din variabilitatea
performanelor la test. Este de preferat s se utilizeze acea manier de scorare
care, fr a fi complicat, nu produce pierdere de variabilitate.
Timpul de lucru i bonusurile de vitez, de precizie, de calitate sau alte elemente
pot furniza maniere de scorare mai mult sau mai puin discriminative.
Opiunea pentru un anumit tip de scal poate fi foarte important: scalele cu
numr mic de trepte reduc din variabilitate, iar cele foarte discriminative
reclam un numr prea mare de itemi.
Sunt preferabile scalele care realizeaz cel mai bun echilibru ntre aceste
constrngeri i cele care integreaz cel mai bine itemii unei baterii.
Deoareace dificultatea i sensibilitatea testelor depinde de coninutul lor
intrinsec, conjugat cu caracteristicile populaiei int i cu scopul testrii, este de
dorit s se compare tendinele centrale ale acestei populaii cu valorile lotului
normativ publicate de manualul testului.
Dei rezervat experilor, construcia unui test este o secven circular de faze
ale unui algoritm ce debuteaz cu identificarea constructului de msurat, cu
operaionalizarea sa, cu redactarea formei iniiale a testului i cu pilotarea sa,
pentru a continua cu analiza i selecia itemilor n funcie de calitile lor
psihometrice, cu stabilirea formatului final al testului i standardizarea sa, cu
publicarea manualului prin includerea datelor tehnice necesare (fidelitate i
validitate). Algoritmul este unul circular pentru c fazele anterioare sunt urmate
de reelaborarea testului pentru a integra informaiile reieite din utilizarea sa i
a-l aduce la zi n raport cu schimbrile ce au loc la nivelul populaiei.
47
48
___________________________________________________________________
Modulul M2. Unitatea de nvare 2
FIDELITATEA TESTELOR
_________________________________________________________________
Cuprins
U2.1. Introducere ............................................................................................................ 49
U2.2. Competene ........................................................................................................... 49
U2.3. Problematica general a fidelitii testelor ............................................................ 50
U2.4. Fidelitatea test-retest ............................................................................................. 51
U2.5. Coeficientul formelor paralele ............................................................................... 51
U2.6. Coeficientul de consisten intern ........................................................................ 52
U2.6.1. Metoda njumtirii (split-half) ............................................................... 52
U2.6.2. Metoda Kuder-Richardson ........................................................................ 53
U2.6.3. Coeficientul alfa al lui Cronbach .............................................................. 53
U2.6.4. Fidelitatea interscoreri ............................................................................. 54
U2.7. Condiii pentru determinarea fidelitii .................................................................. 55
U2.8. Rezumat .................................................................................................................. 56
U2.9. Test de autoevaluare a cunotinelor ...................................................................... 56
U2.1. Introducere
Testele sunt concepute ca instrumente de msur perfecionate, n consecin ele
trebuie s aib calitile psihometrice presupuse de acest fapt. Dac pentru
lungime, mas, volum, timp sau temperatur exist att instrumente perfecionate
de msur, ct i uniti metrice bine definite, inteligena, memoria, personalitatea,
motivaia, iubirea sau sntatea, agresivitatea, tolerana la frustrare sunt
caracteristici psihologice foarte complexe, ce nu pot fi vzute i atinse n sens fizic,
fiind deci greu cuantificabile.
U2.2. Competene
Dup parcurgerea acestei uniti cursanii vor fi capabili:
s defineasc eroarea standard de msurare (SEM) i s argumenteze n legtur
cu rolul ei n problema determinrii fidelitii testelor psihometrice;
s defineasc conceptual de fidelitate a testelor psihologice;
s indice modul de determinare a coeficientului de stabilitate al unui test;
s defineasc modul de determinare al coeficientului formelor paralele;
s indice modul de obinere a coeficientului de fidelitate prin metoda
njumtirii (split-half);
s analizeze adecvat formulele Kuder-Richardson i Cronbach n calitatea lor de
msuri consacrate ale consistenei interne a unui test;
49
Exemplu
Chestionarul de personalitate HSPQ al lui Cattell are dou forme paralele, A i B,
generate n acelai fel i msurnd aceleai constructe psihologice. Prin urmare este
posibil s calculm un coeficient de stabilitate i echivalen pentru cele dou forme,
utiliznd un interval de la dou sptmni pn la o lun ntre cele dou testri.
U2.6. Coeficienii de consisten intern
Din cauza costurilor de construcie ridicate, nu toate testele au forme echivalente, de aceea
se folosete o cale mai puin direct de determinare a fidelitii: cea a consistenei interne, ce
include metoda njumtirii (splithalf) a lui Spearman, formulele Kuder-Richardson i
coeficientul alfa ( ) al lui Cronbach, care nu trebuie considerai echivaleni cu coeficienii de
fidelitate obinui prin metoda testretest sau prin metoda formelor paralele.
U2.6.1. Metoda njumtirii (splithalf)
n englez, to split nseamn a despica, iar half, jumtate, de unde i numele metodei,
care poate fi tradus prin njumtire. ntr-un test omogen, toi itemii msoar (n diverse grade)
acelai construct, fiind deci posibil s fie construite dou jumti relativ echivalente pentru a le
pune ulterior n corelaie. Cele dou jumti pot fi obinute n diverse maniere, cum ar fi: prima
parte a testului i a doua sa parte, sau subteste ce ar rezulta din reunirea tuturor itemilor cu numr
par i cu numr impar (tehnica parimpar), sau oricare alt procedeu, chiar i aleator, de a genera
jumti. Problema tehnic spinoas este aceea c jumtile trebuie s fie echivalente, ceea ce n
primul exemplu nu se ntmpl: n cele mai multe teste de aptitudini, itemii dificili sunt plasai n a
doua parte a probei. Chiar i tehnica parimpar este aplicabil doar parial pentru c, dei n multe
teste itemii sunt aranjai n ordinea cresctoare a dificultii, sunt greu de gsit cte doi itemi
perfect echivaleni din acest punct de vedere, pentru a putea compune cele dou jumti. n plus,
n unele teste, anumii itemi sunt folosii pentru a-i introduce pe alii, adic nu sunt independeni
(sunt itemi legai).
Deci metoda splithalf presupune analiza de itemi i calculul mediei i a abaterii standard,
valori care trebuie s fie aproximativ egale pentru fiecare jumtate considerat, pentru a verifica
faptul c ele sunt echivalente. Cum corelaia dintre dou seturi de scoruri este mai mic pentru
seturile mai scurte, fidelitatea ce rezult pentru testul n ansamblul su, plecnd de la jumtile
sale, poate fi estimat prin corecia pe care formula de profeie propus Spearman i Brown:
2r
1+ r
De exemplu, dac corelaia dintre jumti este de r = 0,64, fidelitatea testului n ansamblul su va
fi R = 20,64/(1+0,64) = 0,78. Aceast formul are un efect substanial pentru corelaiile medii, dar
unul mai mic pentru cele extreme. O corecie mai nuanat va fi prezentat n cursul urmtor.
R=
Testul Matricilor Progresive Raven (PM 36) const din 5 serii a 12 probleme
de raionamet i logic (educia relatelor i a corelatelor), gradate ca nivel de
dificultate, fiind cel mai larg utilizat test de inteligen fluid din lume. Cum
credei c ar trebui procedat pentru a se obine dou jumti echivalente?
52
KR20 = R =
2
N s pq
N 1
s2
unde KR sunt iniialele celor doi psihologi, R este fidelitatea estimat, N numrul de itemi ai
testului, s2 variana scorului la test n ansamblul su, p este proporia (calculat pentru fiecare item
n parte) n care un item este rezolvat corect, q este complementul acestei proporii, adic (1 p),
pq este suma produselor pq pentru fiecare item al testului. Studiind formula, vom vedea c partea
ei din dreapta comport o analiz din care rezult c pentru a avea o fidelitate mai mare ca zero,
variana testului trebuie s fie mai mare ca suma varianelor individuale ale fiecrui item (s2 >
pq). Acest lucru este posibil doar n cazul n care itemii, n calitatea lor de msur a aceluiai
construct, sunt intercorelai.
Pentru situaia cnd itemii celor dou jumti sunt aproximativ egali ca nivel de dificultate
(cazul echivalenei), cei doi autori au propus o alt formul, mai uor de calculat, dar care nu se
poate aplica jumtilor neechivalente, ntruct le va subevalua fidelitatea:
KR 21
N
=
1
N 1
x
x 1
N
s2
unde toate notaiile sunt aceleai ca n formula precedent, iar x reprezint media scorurilor totale
la test.
U2.6.3. Coeficientul alfa al lui Cronbach
Formula KR20 este o foarte valoroas procedur de estimare a consistenei interne a unui
test. Cu toate acestea, exist situaii n care ea nu este potrivit, iar acestea apar atunci cnd testul
nu a fost scorat n termeni de adevratfas, sau zerounu, deoarece formula se bazeaz pe
cunoaterea proporiei n care subiecii au rezolvat corect fiecare item. Unele chestionare de opinii,
atitudini sau valori sunt elaborate nu n termeni dihotomici, ci presupun o scar a gradului de
acorddezacord sau atracierespingere. n aceast situaie, Cronbach (1951) a elaborat o
procedur mai general de estimare a fidelitii, aa-numitul coeficient alfa, a crui formul este:
2
2
N s si
R = =
N 1
s2
53
Se observ o mare similitudine cu formula KR20 chiar i n notaii, termenul nou fiind si2 .
Termenul si2 nlocuiete n aceast formul pq i reprezint suma varianelor individuale ale
fiecrui item. Singura diferen const deci n maniera n care este exprimat variana.
Deoarece si2 exprim variana itemilor care nu sunt rezolvabili doar prin Da/Nu, coeficientul alfa
este considerat a fi soluia cea mai general pentru determinarea fidelitii pentru consistena
intern.
Analizai comparativ formulele Kuder-Richardson i Cronbach, preciznd care
sunt asemnrile i deosebirile lor de structur i de utilizare practic.
Kaplan i Saccuzzo (1993) sesizeaz foarte ntemeiat c toate msurile care evalueaz
consistena intern determin de fapt gradul n care fiecare item diferit msoar aceeai trstur
sau abilitate. Acest lucru presupune implicit c testul este omogen, n caz contrar acesta neavnd
consisten intern ridicat. Pentru testele neomogene, procedeul cel mai indicat este efectuarea
prealabil a unei analize factoriale, prin care se vor putea submpri itemii pe grupe omogene
(factori), subtestele ce rezult avnd fiecare o consisten intern ridicat, dar fiind relativ
independente unul n raport cu celelalte, ca n cazul subscalelor testului de prsonalitate 16 PF
Cattell. Aiken (1997) sesizeaz de asemenea c cele trei procedee de determinare a fidelitii
amintite anterior supraestimeaz valoarea acesteia pentru testele n care este implicat viteza
execuiei. n acest caz procedurile de apreciere a fidelitii trebuie modificate, recomandarea
fcut fiind aceea de a administra cele dou jumti ale testului n momente diferite, dar cu limit
de timp egal. Dup aceasta se calculeaz fidelitatea, operndu-se corecia ei prin formula
SpearmanBrown.
U2.6.4. Fidelitatea interscoreri
Majoritatea testelor de aptitudini, de performan i de personalitate au proceduri de
scorare standardizate, aa c nu va fi nici o problem n privina echivalenei scorurilor obinute de
ctre persoane diferite, devreme ce aceste proceduri de apreciere pot fi ncredinate mainilor
automate de scorare sau computerului. Tehnicile proiective, judecile evaluativapreciative,
evaluarea unor produse complexe ale activitii (desene, mostre de scris, obiecte manufacturate
etc.) sau ratingul personalitii include, prin natura lucrurilor, o doz crescut de subiectivitate. n
acest caz trebuie s se evalueze gradul de intervenie n apreciere al subiectivitii, determinnd
fidelitatea interscoreri sau interevaluatori prin calculul corelaiei dintre seturile de scoruri
acordate de evaluatori diferii, unui numr determinat de examinai. Se poate apela i la metoda
mai muli examinatori un singur examinat, sau mai muli examinatori mai muli
examinai, procedee care culeg coeficieni de fidelitate intraclas, sau de concordan (cum ar fi
coeficientul tau al lui Kendall, vezi Radu et al., 1991), pentru care exist programe speciale de
calculator.
54
55
Aadar, dei validitatea pare a fi o caracteristic psihometric mai important, din punct de
vedere tehnic studiul ei poate ncepe numai cu teste care i dovedesc o fidelitate minim
acceptabil, care depinde de scopul n care ele vor fi utilizate.
U2.8. Rezumat
Teoria clasic asupra fidelitii testelor este construit n jurul erorii standard de
msurare (SEM).
Fidelitatea este o corelaie, adic un numr zecimal cuprins ntre valorile de 1.
Fidelitatea estimeaz doar erorile nesistematice pe care variatele condiii de
aplicare a unui test le poate avea asupra scorurilor la respectivul instrument.
Consistena testului cu sine nsui, adic constana scorurilor sale pe scara
timpului este dat de coeficientul de stabilitate.
Acesta se obine prin metoda test-retest, intervalele dintre cele dou faze
trebuind sa nu fie prea mici (pentru a nu aprea efectul de practic sau cel de
nvare) i nici prea mari (pentru a nu se produce modificri importante n
structura constructului msurat, prin efectul de cretere i maturare).
Coeficientul de echivalen determin consistena a dou forme paralele ale
aceluiai test i poate fi determinat prin aplicarea lor simultan.
Cnd aplicarea se face la un interval de timp i pe jumti nccruciate, se
obine un coeficient de echivalen i stabilitate.
Consistena intern poate fi determinat prin metoda njumtirii: dac toi
itemii unui test msoar un acelai construct, trebuie s existe o echivalen ntre
prima i a doua sa parte sau ntre itemii cu so i cei fr so.
Crearea celor dou jumti este singura problemm tehnic important a acestei
metode de determinare a fidelitii.
Kuder i Richardson au propus o formul de determinare a fidelitii unui test
dintr-o singur aplicare a acestuia, exprimat prin formula KR20.
Cronbach a generalizat aceast formul pentru a fi aplicabil i itemilor scorai
nedihotomic (cu mai mult de dou variante de rspuns), prin coeficientul alfa.
Fidelitatea interscoreri este important doar acolo unde scorarea unui test
implic un grad de subiectivitate: teste proiective, judeci apreciative sau
evaluarea produselor unor activiti.
Condiiile cele mai importante pentru determinarea fidelitii sunt legate de
mrimea suficient de mare a eantionului, de nivelul su (ridicat) de
reprezentativitate, de independena msurtorilor i de identitatea de procedur
ntre fazele de test i retest.
U2.9. Test de evaluare a cunotinelor
1. Artai de ce SEM este eroarea standard de msurare.
2. Precizai ce precauii trebuie luate pentru a evita efectul de nvare, efectul
practicii i cel de cretere i maturare n determinarea coeficientului de stabilitate al
unui test psihometric.
56
57
___________________________________________________________________
Modulul M2. Unitatea de nvare 3
FACTORI CARE AFECTEAZ FIDELITATEA TESTELOR
_________________________________________________________________
Cuprins
59
Pentru situaia n care eantionul a fost prea omogen, diminund astfel variana total a
scorurilor la test, i deci fidelitatea sa, Magnuson a propus o formul de corecie:
1 x (1 rxx ' )
2
ruu =
u2
n care ruu este fidelitatea estimat pentru noul eantion, x este variana noului eantion iar u
este fidelitatea calculat ntre vechiul i noul eantion.
Pentru utilizatorul unui test precauiile legate de ntinderea diferenelor individuale sunt:
utilizarea tabelelor de norme, care aduc distribuiile la un numitor comun prin raportarea la
notele standardizate z, ca n cazul n care exist diferene foarte mari ale scorurilor brute ca
urmare a prezenei n eantion a unor niveluri de vrst foarte diferite;
studiul pilot al fidelitii pe propriul eantion de lucru pentru a ne asigura c populaia pe care
se aplic testul corespunde ca raport de omogenitate/eterogenitate populaiei pe care s-a
determinat fidelitatea raportat de autor n manualul testului.
Dac iniial testul avea 20 de itemi i dorim s-l aducem la 45 de itemi, K reprezint raportul
45/20 = 2,25. Plecnd de la fidelitate iniial de 0,83, fidelitatea expectat prin lungirea
testului va ajunge la: (2,250,83)/[1+(2,25-1)0,83] = 1,8675/(1+1,0375) = 1,8675/2,0375 =
0,92.
Invers, dac vrem s tim ci itemi trebuie s adugm pentru a atinge valoarea dorit a
fidelitii, de exemplu creterea de la 0,83 la 0,95 (pentru a putea ajunge n zona n care putem
lua decizii care privesc destinul unei persoane), maniera de lucru presupune mai nti izolarea
lui K, plecnd de la formula anterioar.
K=
n cazul analizat K=
Aceasta nseamn c, pentru a avea creterea de fidelitate expectat, testul trebuie mrit de
3,89 ori i deci de la 20 de itemi el va ajunge la 78 (203,89 = 77,8).
60
crea o cretere artificial a corelaiei prin care se pune n eviden fidelitatea, deoarece vor intra n
corelaie multe perechi de rezultate identice (0 - 0).
Inflaia fidelitii poate crea imaginea distorsionat a unui test cu itemi ce vor aprea ca
mai omogeni dect sunt de fapt n realitate. De fapt, la testele de vitez nu toate formele de
determinare a fidelitii sunt afectate. n timp ce n cazul jumtii vii (split-half) aceasta va fi
afectat (itemii scorai zero se distribuie aproximativ egal n cele dou jumti ale testului,
crescnd artificial fidelitatea), consistena intern prin indicele alfa al lui Cronbach sau prin
metoda test-retest nu va fi afectat semnificativ n acest caz.
Pentru a determina totui i celelalte forme de fidelitate se dau testul i retestul cu limita de
timp convenit de autor, se marcheaz ultimul item (de aceea itemii trebuie pasai n ordine, i nu
pe srite) apoi se continu pn la capt testul, fr limit de timp. Scorurile din prima categorie
vor servi pentru determinarea mediilor, a abaterilor standard i a formei distribuiei, necesare
scopurilor avute n vedere (cercetare, crearea de etaloane), n timp ce scorurile brute obinute fr
limit de timp vor da o mai bun expresie a fidelitii prin metodele split-half i alfa Cronbach.
Exemple
La Testul Cuburilor, aplicabil de la 5 ani la vrsta adult, fiecare pattern are o limit
de timp, mai mic iniial i mai mare pentru modelele mai complexe. Limita de timp
nu poate fi modificat pentru c ar aprea un masiv efect de nvare. Mai mult,
proba se oprete automat dup trei eecuri consecutive. n aceast situaie este de
preferat determinarea fidelitii testului doar pentru vrstele mari, unde marea
majoritatea participanilor rezolv integral fiecare model, cea care face diferena
fiind rapiditatea execuiei.
U3.7. Fidelitatea i erorile de msurare
Deoarece fidelitatea nu exprim valoarea preciziei msurtorii n aceleai uniti ca i
scorul total la test (exprimat n note standard), uneori ea este mai greu de interpretat. Acesta este
motivul pentru care precizia msurtorii poate fi indicat i sub forma unei erori de interpretare a
scorului la test, care va fi cu att mai mic cu ct eroarea de msurare va fi i ea mai mic. Aceast
zon sau interval de ncredere poate fi determinat n dou maniere: a) se determin eroarea de
msurare (interval de ncredere nuntrul cruia se afl adevratul scor al unui subiect, pentru
niveluri de ncredere specificate); b) se determin eroare de estimare (nivelul de ncredere al
scorului observat dac subiectul ar fi retestat).
U3.7.1. Eroarea standard a msurtorii (SEM)
Conform teoriei clasice a testului, scorul adevrat al unui subiect se distribuie normal n
jurul unei valorii medii, dnd o distribuie pentru care se pot determina media i abaterea standard.
Abaterea standard a diferitelor distribuii rezultate pentru toi subiecii grupului n cauz se
numete SEM (e) adic Eroarea Standard a Msurtorii i se determin astfel:
n care: rxx' este coeficientul de fidelitate iar x este abaterea standard de la care s-a plecat n
calculul coeficientului de fidelitate rxx'.
Exemplu
Aceste intervale de ncredere fie sunt adesea neluate n seam de practicieni, fie sunt ru
interpretate. De fapt noi nu avem nicicum certitudinea c scorul adevrat al subiectului va cdea n
intervalul de ncredere determinat, cci exist doar o probabilitate de a fi aa. n al doilea rand i
aceasta pare a fi defieciena major a acestei metode intervalele de ncredere astfel determinate
se sprijin pe postulatul homoscedasticitii, adic pe prezumia c eroarea tip este aceeai pe toat
scara nivelurilor succesive ale performanei. n al treilea rnd, corelaia dintre scorul observat i
cel estimat nu este niciodat una perfect (Nunnally i Bernstein, 1994). n consecin, prezicerea
scorului adevrat plecnd de la cel observat produce fenomenul de regresie spre medie al
63
= x + rxx ' ( x x )
n care este scorul adevrat estimat, x scorul observat, x media scorurilor observate, iar rxx' este
coeficientul de fidelitate. Eroarea tip a estimrii se va calcula i ea dup o formul modificat:
Exemple
Pentru exemplul anterior, n care un subiect obinea 121 la un test de inteligen cu
media 100 i cu abaterea standard de 15, testul avnd fidelitatea de 0,93,
determinarea scorului adevrat devine: 100 + 0,93(121 - 100) = 100 + 0,9321 = 100
+ 19,53 = 119,53, rotunjit 120. Calculul erorii standard a estimaiei este urmtoarea:
(151-0,93)0,93 = 150,260,93 = 3,69. Intervalul de ncredere pentru p = 0,05 este
egal cu 1,963,69 = 7,23 n jurul scorului adevrat estimat, adic 120 7. Acesta este
intervalul [113-127]. Pentru pragul de p 0,01, eroarea va fi 2,58 3,69 = 9,52, iar
intervalul va fi 120 9,52, adic [110-130]. Aa cum se observ n raport cu
scorul observat de 121 intervalul nu mai este unul simetric n jurul valorii obinute
de subiect: n prima situaie de la 121 113 = 8 puncte de scor, pentru limita
inferioar, i n a doua situaie sunt 127 121 = 6 puncte, pentru limita superioar.
Aceast asimetrie provine din centrarea intervalelor de ncredere diferite nu pe
scorul observat, ci pe cel estimat ca adevrat, ceea ce face din aceast procedur cea
mai riguroas metod de determinare a intervalelor de ncredere.
U3.7.2. Eroarea tip a estimrii
Eroarea tip a estimrii se regsete de fiecare dat cnd dorim s calculm intervalul de
ncredere al valorii prezise plecnd de la o ecuaie de regresie liniar. Acest tip de eroare se obine
extrgnd rdcina ptrat din variana rezidual, adic din acea varian a scorurilor care se
regsete la al doilea test atunci cnd se ine cont de primul test. Cum metoda de calcul i
interpretarea erorii de estimaie sunt mai laborioase, ele nu au fost incluse n capitolul de fa.
Menionm de asemenea faptul c n corelaia liniar pe care se bazeaz de fapt determinarea
fidelitii homoscedasticitatea este presupus ca o condiie implicit. Deoarece eroarea de
msurare este mai mic la cei care au preponderent reuite sau nereuite (extremele seriei de
variaie a performanelor), comparai cu cei de pe poriunea de mijloc, Keats i Lord au propus un
model fundamentat pe distribuia binominal, care permite estimarea erorii tip a msurtorii
indiferent de nivelul scorului subiecilor. Nici aceast procedur nu a fost inclus aici.
64
U3.9. Generalizabilitatea
Potrivit paradigmei clasice relativ la fidelitate, O = A+E, prezentat n partea introductiv
a capitolului anterior, fidelitatea unui instrument psihometric este n funcie de ntinderea
spectrului diferenelor individuale, de lungimea testului nsui, de limita de timp acordat i de
dificultatea testului. Cu toate acestea condiiile de observare i de msurare sunt mult mai
complexe dect cele enumerate anterior, ceea ce a condus la conturarea unei noiuni noi i anume
cea de generalizabilitate. Aceasta presupune studiul fidelitii n familii de situaii similare, ceea
ce face ca scorul adevrat (A, din formula de mai sus) s fie nlocuit cu termenul de univers al
scorului ateptat de la un subiect, ntr-un anumit ansamblu de condiii de observare i de
msurare.
Teoria generalizabilitii a fost elaborat n 1963 de ctre Cronbach, Gleser i Rajaratnam
cu scopul de a reuni ntr-un concept unitar diferitele definiii ale fidelitii. Astfel, pentru a
cuantifica importana fiecrei surse de varian dintr-o situaie de msurare ei au folosit analiza de
varian. Scorul adevrat i lrgete nelesul pentru c ia n calcul toate observaiile posibile,
mpreun cu erorile aferente rezultate din fluctuaiile de eantionaj legate de momentele de
evaluare, de forma itemilor sau de ecuaia personal a fiecrui evaluator n parte. Din aceast
cauz generalizabilitatea este un concept mai cuprinztor dect cel de fidelitate, cci el descrie
situaia de msurare ntr-un cadru mai complex i mai apropiat de realitate. n esen,
65
66
U3.11. Rezumat
Fiind exprimat printr-un coeficient de corelaie Pearson, fidelitatea are aceleai
limite ca i acesta.
n principiu determinarea fidelitii trebuie s se fac pe un eantion care prezint
acelai raport omogenitate/eterogenitate ca i populaia indicat de autor.
Extinderea sau restrngerea diferenelor individuale contribuie la accentuarea sau
la diminuarea eterogenitii i deci la inflaia sau deflaia coeficientului de
fidelitate.
Lungimea unui test este elementul cel mai strns asociat cu fidelitatea unui test.
Utiliznd adecvat formula de profeie a lui Spearman-Brown, un test poate fi
scurtat sau lungit dup anumite reguli, consecina fiind descreterea, respectiv
creterea fidelitii sale.
Atunci cnd se adaug itemi noi unui test sau scale, acetia trebuie definii i
generai astfel nct s msoare acelai construct, pentru a fi compatibili cu itemii
preexisteni.
Dificultatea itemilor presupune cercetarea formei distribuiei scorurilor pentru a
aduga sau elimina itemii care distorsioneaz repartizarea gaussian a scorurilor.
n plus, cunoaterea distribuiei scorurilor este important n studiul fidelitii
pentru a corela forme paralele sau retesta distribuii de acelai tip.
Determinarea fidelitii pentru testele cu limit de timp presupune o precauie
suplimentar: nu este indicat s rmn itemi nepasai la test sau retest pentru c
perechile scorate zero contribuie la o cretere inflaionist a fidelitii.
Determinarea fidelitii este esenial pentru interpretarea rezultatelor la un test.
Astfel, coeficientul de corelaie care exprim fidelitatea intr n determinarea
erorii standard a msurtorii, element de baz pentru determinarea intervalelor de
ncredere ale scorurilor.
67
68
__________________________________________________________________
Modulul M2. Unitatea de nvare 4
VALIDITATEA TESTELOR
_________________________________________________________________
Cuprins
U4.1. Introducere ............................................................................................................. 69
U4.2. Competene ............................................................................................................ 69
U4.3. Validitatea de faad ............................................................................................... 70
U4.4. Validitatea relativ la coninut ............................................................................... 71
U4.5. Validitatea relativ la criteriu ................................................................................. 71
U4.6. Validitatea relativ la construct .............................................................................. 73
U4.6.1. Validitatea convergent i divergent ....................................................... 75
U4.6.2. Matricile multitrstur-multimetod ....................................................... 76
U3.6.3. Studiul trsturilor latente......................................................................... 77
U4.7. Validitatea diferenial ........................................................................................... 79
U4.8. Teoria deciziei aplicat la testele psihologice,
asociat validitii predictive .................................................................................. 80
U4.9. Precauii legate de evaluarea coeficienilor de validitate predictiv ...................... 81
U4.10. Interpretarea coeficienilor de validitate .............................................................. 82
U4.11. Rezumat ................................................................................................................ 83
U4.12. Test de autoevaluare a cunotinelor .................................................................... 84
U4.1. Introducere
Orice student la psihologie tie c meritele unui test psihologic ncep s fie
judecate prin fidelitate, dar sfresc prin aprecierea validitii sale. Aceasta i
datorit faptului c, n timp ce fidelitatea se judec simplu, prin sumarizarea unor
coeficieni de corelaie, validitatea presupune demersuri interpretative mai
complicate i de mai lung durat. nsui conceptul de validitate este unul evolutiv,
aflat n plin dezvoltare i ... de aceea strnete mult mai mult controvers dect
mai stabilul i mai bine aezatul su vr, fidelitatea (Cronbach, apud Gregory,
1996, p. 106). Spre deosebire de fidelitate, care este influenat numai de erorile de
msurare nesistematice, validitatea unui test este afectat att de erorile
nesistematice, ct i de cele sistematice (constante). Din aceast cauz, Un test
poate s fie fidel, fr a fi valid, dar nu poate fi valid fr s fie fidel, afirm
Aiken (1993, p. 94).
Accepiunea clasic a validitii se refer la gradul n care un test msoar ceea ce
i-a propus s msoare, ceea ce sugereaz c ar exista doar un singur tip de
validitate. Actualmente este unanim acceptat faptul c un test poate avea diferite
forme de validitate, dependente de scopurile specifice n care el a fost utilizat. De
69
aceea ni se pare de mare actualitate afirmaia lui chiopu (1974) potrivit creia un
test este bidimensional, axat pe doi factori, adic pe diagnoz i pe validarea ei,
concepui ca axele unui sistem de coordonate: n acest sistem axa X reprezint o
diagnoz cuantificabil (test comportamen), axa Y reprezint criteriul de
valabilitate al diagnozei. (p. 156).
n acest sens poate fi neleas sintagma c un test se valideaz continuu. Fcnd o
analogie cu justiia, unde opereaz prezumia de nevinovie (fr dovezi concrete,
cel trimis n instan este nevinovat), Psihologul trebuie s se supun unor reguli
specifice de probare, n stabilirea faptului c un anumit test are o nsemntate
special pentru un scop specific (Aiken, 1997, p. 133). Deci validitatea ar putea fi
definit mai corect ca o extindere progresiv, pe msur ce testul primete noi
utilizri, a cunoaterii noastre n legtur cu ceea ce msoar el de fapt.
U4.2. Competene
Dup parcurgerea acestei uniti cursanii vor fi capabili:
s defineasc termenul de validitate de faad, indicnd utilitatea sa practic;
s defineasc principalele tipuri de validitate: relativ la coninut, la criteriu i la
construct;
s indice modalitile concrete prin care se determin cele trei tipuri
fundamentale de validitate;
s indice secvena de pai prin care se determin validitatea relativ la construct.
Fiecare dintre aceste tipuri presupune strategii de validare diferite, care vor fi detaliat
analizate n capitolul urmtor. De exemplu, un test de anxietate are validitate concurent dac
scorurile la testul psihologic i gsesc confirmarea, n aceeai perioad de timp, prin diagnosticul
psihiatric. Atunci cnd criteriul se matureaz dup un timp (luni sau ani) i scorurile lui nu pot fi
determinate simultan cu cele de la test, folosim o a doua strategie de validare, cea predictiv. n
selecia profesional, de exemplu, se va calcula coeficientul de corelaie liniar dintre scorurile la
testul aplicat iniial i msuri (exprimate prin note sau calificative) ale performanelor obinute de
aceleai persoane n activitatea sau profesia pentru care au fost selecionate.
Deoarece o funcie fundamental a testului este aceea de a face diagnoza n scopul unei
prognoze (adic faptul de prezice), validitatea predictiv capt o importan special n acest
context. ntruct pentru a determina cu exactitate limitele prediciei msurile la test i cele la
criteriu intr n corelaie, acest fapt impune ca ambele categorii corelate s satisfac standarde
nalte de fidelitate i de validitate. Cu alte cuvinte, o msur criteriu este pertinent dac i ea este
fidel i valid. Acest fapt introduce problema validitii ntr-o relaie circular cu criteriul ales.
Aceasta nseamn c factorii de eroare care afecteaz criteriul vor fi controlai n aceeai manier
ca i predictorii (testele). Atunci cnd controlul lor nu d rezultatele scontate, se poate spori
fidelitatea criteriului, fie lund mai multe eantioane de msurtori ale acestuia (msuri mai dese),
fie adugnd noi tipuri de msuri, incluse ntr-un criteriu compozit, pentru a spori fidelitatea lui n
aceeai manier n care procedm cu un test cruia i adugm itemi suplimentari. O caracteristic
important a criteriului este absena contaminrii, adic necunoaterea rezultatelor la test de ctre
cel care evalueaz msurilecriteriu. Un psiholog va obine independent de diagnosticul medicului
psihiatru scorurile la testul su de anxietate, deci va face o analiz oarb. Prin efectul de halo,
indulgen, predicia pentru sine sau profeia care se automplinete, rezultatele prezise pot fi
produse ntr-o oarecare msur de predictorul nsui, caz n care comparaia nu mai este valid.
Exemple
Havrneanu (2000) apreciaz c cele mai bune msuricriteriu sunt cele care
prezint mai multe avantaje practice, care sunt mai simplu de folosit, mai
disponibile i mai puin costisitoare. Dintre acestea se pot enumera:
msurarea direct a produciei sau a randamentului muncii;
evalurile performanelor angajailor fcute de ctre efii lor sau de ctre
serviciile de personal ale ntreprinderilor.
Msuracriteriu poate aparine unui grup, n sensul c testul care reuete s clasifice
persoanele n grupuri bine precizate, sunt valide. Strategiile de validare predictiv cele mai
utilizate calculeaz fie un indice de eficacitate, fie scoruri de separare a categoriilor, indici de
separare a grupurilor sau indicele de utilitate (vezi Havrneanu, 2000, pp. 113-126). Dintre factorii
care afecteaz validitatea relativ la criteriu, Aiken (1997) indic diferenele de omogenitate ale
grupurilor (validitatea tinde s fie cu att mai mic cu ct grupurile sunt mai eterogene), lungimea
testului (testele mai lungi sunt mai valide) i contaminarea criteriului, de care am amintit deja.
72
Creterea validitii unui test, n calitatea lui de instrument diagnostic sau prognostic,
presupune costuri ce trebuie atent evaluate, cci uneori metode mai puin costisitoare (observaia,
interviul sau inventarul biografic) pot aduce plusul de informaie necesar n atingerea scopurilor
propuse.
Se extind generalizrile acestor prime etape, schimbnd fie populaiile examinate, fie
examinatorul sau contextele de examinare, pentru a vedea dac relaiile sesizate rmn
constante.
n final se caut stabilirea relaiilor dintre testul cercetat i alte tipuri de msurtori sau de
observaii. Testul poate avea o validitate convergent (ntre scorurile sale i alte tipuri de
teste ce msoar acelai construct exist o relaie liniar), sau discriminant (cnd scorurile
la teste nu coreleaz cu teste care se tie c nu msoar constructul respectiv).
73
Exemplu
Raportul dintre teorie i msurare este cel mai bine surprins prin conceptul de
validitate de construct care este chiar elementul cheie al operaionalizrii
variabilelor. A operaionaliza nseamn a aduce un construct teoretic n situaia de
putea fi surprins i evideniat prin msurare. n cazul n care operaionalizarea unei
teorii bune a fost fcut adecvat, printr-un instrument corect elaborat, capabil s o
surprind, atunci putem formula predicii sub forma ipotezelor ce rezult din teoria
respectiv. Dac ipotezele se verific, atunci i teoria, dar i operaionalizarea ei
sub forma instrumentului de msur respectiv sunt n regul.
Dac ipotezele nu se verific, sunt posibile dou explicaii alternative:
instrumentul este bun, dar deoarece teoria nu se verific, aceasta trebuie
schimbat;
teoria este una valabil, dar instrumentul nu o operaionalizeaz corespunztor i
atunci nu putem dovedi ce ne-am propus i deci trebuie schimbat chiar
instrumentul de msur.
De exemplu, cercetrile lui Witkin i ale colaboratorilor si au evideniat mai mult
difereniere i mai mult independen de cmp pentru genul masculin. Studiile
neuropsihologice actuale despre lateralizarea funciilor corticale i asimetria
emisferelor cerebrale indic de asemenea o specializare emisferic mai accentuat
pentru genul masculin, ca i un acces bicerebral la limb pentru genul feminin, de
unde superioritatea brbailor pentru sarcinile spaiale i a femeilor pentru cele
legate de limb i comunicare. Faptul c la un test spaial ca cel al Cuburile Kohs,
bieii obin performane superioare comparativ cu fetele, n timp ce acestea au
performane superioare la un test de inteligen verbal, este consistent cu teoriile
anterior menionate.
n alte situaii se ateapt ca itemii unui test s se organizeze ntr-o ordine progresiv, ceea
ce ar corespunde unei structuri ierarhice, rezultat din chiar dezvoltarea funciei sau abilitii
respective. De exemplu, dac vom operaionaliza teoria psihogenetic piagetian ntr-o scal de
itemi, aceasta va fi una ierarhic, pentru c orice stadiu l nglobeaz pe cel precedent, fcndu-l
posibil pe cel care urmeaz. Validitatea conceptual va fi serios pus la ndoial n cazul n care un
subiect paseaz itemii pentru stadiul operaiilor formale i nu-i trece pe cei din stadiul operaiilor
concrete, fapt care ar contrazice chiar ideea de dezvoltare stadial i ierarhic. n mod sporadic sar putea ntmpla s existe i itemi de acest fel, care vor constitui ns erori.
74
Se poate deci afirma c rezultatele la acest tip de test sunt reproductibile: pornind de la
scorul total la test, putem s prezicem care itemi vor fi pasai i care vor fi euai. Pentru aceasta
ns trebuie s tim ordinea de dificultate a itemilor, iar aceast ordine s fie aceeai la toi
subiecii. Cazurile (ct mai puine!) n care ierarhia itemilor este nclcat produc erori de
reproductibilitate, cci ele limiteaz posibilitatea prediciei corecte a itemilor care vor fi pasai i al
celor ce vor fi euai.
Exemplu
Guttman (1950) a propus ca rezultatele la un test s fie considerate ierarhice atunci
cnd mai puin de 10% din rezultate nu sunt reproductibile. El a propus o formul
de calcul pentru coeficientul de reproductibilitate:
Ne
CR = 1
N jNp
n care:
CR = coeficientul de reproductibilitate;
Ne = numrul erorilor de reproductibilitate (numrul de itemi care ncalc
ierarhia, adic furnizeaz rezultate n dezacord cu scorul total obinut i cu
ordinea de dificultate a ansamblului itemilor);
Nj = numrul de itemi;
Np = numrul de persoane (subieci).
Aceasta poate fi considerat o bun metod de validare conceptual pentru probele
piagetiene, condiia recomandat de Guttman fiind un CR de peste 0,90, deoarece
peste aceast valoare invariana ordinii de reuit se consider a fi bine
demonstrat.
Metode speciale de demonstare a validitii conceptuale a unui test o constituie metoda
corelaiilor simple, metoda multitrstur-multimetod i studiul trsturilor latente.
75
Trsturile
Metoda 1
A1 B1 C1
Metoda 2
A2 B2 C2
Metoda 1
A1
B1
C1
(.89)
.51 (.89)
.38 .37 (.76)
Metoda 2
A2
B2
C2
.57
.22
.11
.22
.57
.11
.09
.10
.46
(.93)
.68 (.94)
.59 .58 (.84)
Metoda 3
A3
B3
C3
.56
.23
.11
.22
.58
.11
.11
.12
.45
.67
.43
.34
.42
.66
.32
.33
.34
.58
Metoda 3
A3 B3 .C3
(.94)
.67 (.92)
.58 .60 (.85)
coeficienii boldai de pe cele trei diagonale mici reprezint dovezi ale validitii
convergente: aceeai trstur fiind msurat prin diferite metode, corelaia trebuie s fie
una pozitiv i puternic;
n triunghiurile cu linie continu sunt incluse corelaiile dintre diferitele trsturi msurate
cu aceeai metod: acestea trebuie s aib valori medii sau ridicate;
cele ase triunghiuri din linii punctate includ corelaiile dintre diferitele trsturi msurate
cu diferite metode; acestea trebuie s fie ct mai mici n fiecare triunghi, deoarece ele sunt
dovezi importante relative la validitatea discriminant (divergent).
77
ntotdeauna valabil faptul ca structura cea mai simpl s fie mai plauzibil dect
structura mai complex. Oricum, n funcie de tipul de analiz ales ajungem la
soluii factoriale diferite, iar soluia final pe care o alegem nu este una de natur
matematic, ci mai degrab de natur teoretic.
Prin crearea analizei factoriale, Charles Spearman (1907) a dezvoltat de fapt o metod
capabil s pun n eviden existena unui factor general al inteligenei, prezent n orice tip de
sarcin mintal (i de aceea numit i factor g), n combinaii diferite cu un factor specific numit s.
Procedeul dezvoltat de el, numit metoda componentelor principale, i-a permis s produc dovezi
n favoarea ipotezei sale, numit modelul bifactorial al inteligenei.
n 1928, Thurstone, un creator american de marc n domeniul analizei factoriale, a utilizat
aceeai metod ortogonal (dou axe aflate n unghi drept, adic independente ntre ele) dar cu un
mic amendament: n loc ca o ax s explice variana factorului major i cealalt variana rezidual
(variana rmas neexplicat de factorul major), el a propus rotirea celor dou axe ortogonale pn
la obinerea structurii celei mai simple, ameliornd astfel gradul de adaptare a datelor la structura
factorial. Metoda se mai numete i Varimax deoarece ea caut ca pe fiecare dintre cele dou axe
ortogonale variana explicat s fie una maximal. Aceasta face ca fiecare factor s explice un
grup de rezultate i doar att, cci prin aceast metod nu mai poate fi identificat factorul general,
ceea ce pune n discuie chiar modelul propus de Spearman pentru definirea inteligenei umane.
Din punct de vedere matematic ambele metode sunt valide, dar fiecare are propriile posibiliti i
limite: una ajut la identificarea factorului general, pe care cealalt l neag; cealalt ajut la mai
buna identificare, nelegere i numire a factorilor rezultai. De aceea utilizarea celor dou metode
este corelativ.
Analiza factorial permite doar verificarea faptului dac datele sunt consistente cu structura
factorial postulat. Cnd datele sunt compatibile cu mai multe structuri latente posibile, analiza
factorial nu ne poate ajuta s alegem una singur, aceast alegere fundamentndu-se pe baza unei
teorii prealabil elaborat. ntr-un demers de validare, analiza factorial va aduce deci informaiile
necesare, dar nu i suficiente lurii unei decizii.
Exemple
Analiza factorial pune nu numai probleme de interpretere, ci i cteva importante
probleme metodologice, rezumate mai jos.
Mrimea eantionului: cu ct eantionul pe care se face analiza factorial este
mai mic, cu att mai mult coeficienii de corelaie din matrice pierd din
semnificaia statistic, soluiile factoriale obinute trebuind examinate cu mai
mult pruden. Dei nu poate fi indicat o mrime ideal, cercettorii au czut de
acord cu raportul de 5 la 1 ntre numrul subiecilor din eantion i numrul
variabilelor supuse factorizrii. Dar i acest lucru trebuie luat cu rezerv, pentru
c corelaiile mici (sub 0,30) pun n discuie nu mrimea eentionului, ci chiar
necesitatea desfurrii unei analize factoriale, dup cum corelaiile mai mari de
0,50 se pot desfura cu rezultate bune i pe eantioane mai mici dect cele ce ar
rezulta din raportul 5/1. Deci, nainte de a efectua o analiz factorial, obligatoriu
78
79
Predicia la test
Predicie corect
Fali pozitivi
Va avea eec
Fali negativi
Predicie corect
Figura 7.2. Rezultatele posibile ale unui test de selecie utilizat pentru a preciza un criteriu-msur.
Dac un test a avut o bun validitate predictiv, atunci diagonala stnga-sus dreapta-jos
se maximizeaz: cele mai multe persoane crora li s-a prezis succes au i avut succes, iar cele mai
multe persoane crora li s-a prezis eec au i euat, deci ambele predicii s-au adeverit. Dar cum
nici un test de selecie nu este un predictor perfect, sunt posibile i celelalte dou situaii: s-a
prezis succes unor persoane care au euat (falii pozitivi), ori s-a prezis eec i acesta nu a avut loc
(falii negativi). Ambele categorii de fali (pozitivi i negativi) sunt considerate n egal msur
eecuri ale prediciei, deoarece ambele au fcut predicii inacurate. Se poate astfel calcula
urmtoarea proporie:
Rata de reuit = reuite / (reuite + eecuri)
n lumea real fals-pozitivii i fals-negativii sunt evitai, dar nu pn la eliminare, pentru c
aceasta ar presupune un test care are o corelaie perfect (r = +1,00) cu criteriul prezis. Cum acest
lucru nu este posibil, ceea ce rmne de fcut pentru a minimiza erorile de decizie este dezvoltarea
unor teste cu o mare valoare predictiv.
80
Exemple
n luarea deciziilor, adepii teoriei deciziei se sprijin pe dou asumpiuni:
1. Dezvoltarea unei scale de utilitate, astfel nct indicatori importani ai instituiei
s poat fi exprimai n profituri sau pierderi. De exemplu, dac dup un chestionar
de tipul EPI al lui Eysenck, prin care se poate determina i introversia/extraversia,
o companie poate identifica pierderile asociate cu vnztorul de maini introvert,
comparativ cu ctigurile aduse de vnztorul extravert. Astfel, falii pozitivi sunt
cei ce aduc pierderi instituiei (vnd mai puine maini dect ar fi necesar pentru
plata propriului salariu), ca i falii negativi (cei care, dac ar fi fost ncadrai, ar fi
contribuit la creterea profiturilor companiei). Acesta este un exemplu de
operaionalizare a testului i a seleciei pe o scal de utilitate.
2. n deciziile de selecie instituional strategia cea mai satisfctoare este aceea
de a maximiza ctigul scalei de utilitate i de a minimiza pierderile. Scala trebuie
s rspund la ntrebarea: La ce proporie de selecie se produce cel mai mare
ctig mediu al scalei?
Tabelele Taylor-Russell, publicate prima dat de aceti autori americani n 1939, permit
unui utilizator de teste s determine proporia expectat pentru aplicanii selectai, dac se
specific trei elemente: 1. validitatea predictiv a testului, 2. rata (proporia) seleciilor i 3.
proporia bazal pentru aplicanii de succes.
Ce sunt aceste elemente?
validitatea predictiv este determinat anterior prin studii i se exprim printr-o corelaie
de tipul rxy;
proporia selecionailor este cea rezultat din numrul de alei supra numrul de aplicani,
nmulit cu 100;
rata de baz este proporia celor ce ar fi fost selecionai prin metodele curente, fr
beneficiul adus de noul test. Cum acest lucru este mai greu de determinat, la extrem se
folosete pentru rata de baz proporia aplicanilor de succes, dac ei ar fi fost alei aleator.
Cunoaterea celor trei factori de mai sus face posibil utilizarea unor tabele special
construite prin care se determin cu ct mbuntete noul test selecia, comparativ cu metoda
anterioar. Pe lng faptul c leag testul psihologic de aspecte economice foarte pragmatice,
determinnd efectiv valoarea practic a unui test, tabelele Taylor-Russell evideniaz i aspecte
care intrig, cum ar fi creteri substaniale ale acurateei seleciei, chiar i la validiti foarte mici,
n anumite condiii.
succes ntr-o prim faz, cnd grupul era demixtat (numai femei), dar nu ia n consideraie
situaia actual n care grupul de munc este unul mixt.
Ce nseman criteriul ales? Coeficientul de validitate contra criteriului obinut poate s nu
nsemne nimic dac criteriul nu este el nsui fidel i valid. A corela un test cu un altul despre
care nu tim prea multe lucruri sub aspectul validitii nu ne ajut prea mult n determinarea
validitii convergente a primului test.
Luai ntotdeauna n consideraie populaia pe care s-a obinut o anume validitate: o
validitate ridicat pe o populaie de albi se pstreaz ea oare i pe o populaie de negri?
Asigurai-v c mrimea eantionului populaional este suficient i adecvat: cu ct este
mai mare grupul iniial pe care s-a studiat validitatea, cu att mai bun este validitatea
ncruciat.
Niciodat s nu confundai criteriul cu predictorul.
Verificai spectrul de valabilitate att pentru predictor, ct i pentru criteriu: deoarece corelaia
depinde de mrimea variabilitii, ea este subestimat sever atunci cnd predictorul sau criteriul
au un spectru de variabilitate foarte ngust.
Generalizai cu pruden o validitate gsit: cu alte cuvinte trebuie demonstrat c validitatea
descoperit ntr-un studiu nu este dependent de situaie.
Luai n calcul i validitatea diferenial: relaiile descoperite pentru o populaie demografic
s-ar putea s nu fie deloc aceleai pentru toate subgrupurile care o compun.
82
Educational and Psychological Testing, 1985) o list de probleme ce pot aprea n interpretarea
coeficienilor de validitate. Redm mai jos cteva dintre acestea:
Validitatea nu se msoar, ci se deduce. Dei autorul testului trebuie s dea mai muli
coeficieni de validitate, indicnd procedura urmat, utilizarea lui pe alte grupuri, sau n
alte scopuri, necesit studii de validare suplimentare. Aceasta deoarece validitatea testului
depinde simultan de scopul testrii i de populaia creia i se administreaz. Toate aceste
determinri ale validitii care vin din studii ulterioare, desfurate n scopuri specifice i
pe alte eantioane de populaie, vor fi considerate doar dovezi ale unui anumit tip de
validitate.
Strategiile de validare se aplic odat cu construirea testului i se repet de cte ori este
nevoie pentru a obine un test bun ca lungime, mod de aplicare, for discriminativ,
uurin n administrare, cotare i interpretare, care alturi de fidelitate i validitate, dau o
imagine mai adecvat despre valoarea sa.
Utilizarea testului impune repetarea periodic a procesului de cercetare a validitii,
ntruct validarea unui test nu se ncheie niciodat, datele nou acumulate din diverse domenii
conducnd la ameliorarea i rafinarea sa, dar nu i la o soluie definitiv. Cu att mai mult se pune
problema relurii studiului validitii unui test atunci cnd i se schimb formatul (prin aplicarea pe
calculator, de exemplu), coninutul, instructajul sau modul de cotare.
U4.11. Rezumat
Valoarea unui test ncepe prin a se judeca plecnd de la fidelitatea sa dar sfrete
prin evaluarea validitii sale.
Validitea unui test un este niciodat pe deplin dovedit. Ea este un proces care un
se ncheie practic niciodat.
Cercetarea validitii este un proces continuu, ce se reia odat cu fiecare
modificarea testului i cu fiecare extensie a utilizrii sale spre noi aplicaii sau
populaii.
Validitatea de faad (ceea ce pare a msura un test) este cea mai slab definit
form de validitate.
Validitatea relativ la coninut indic gradul n care testul acoper domeniul
msurat, fiind definitorie mai ales pentru testele de achiziii i educaionale.
Validitatea relativ la criteriu este cea mai important form de validitate pentru
c exprim msura n care testul poate face predicii acurate.
Dup maniera n care se culeg datele de testare i de criteriu (simultan sau la
distan n timp) se pot identifica validitatea concurent i validitatea
predictiv.
83
84
MODULUL 3.
DEMERSURI APLICATIVE ALE TEORIEI TESTELOR PSIHOMETRICE
___________________________________________________________________
Cuprins
M3.1. Introducere 85
M3.2. Competene ........... 85
M3.1. Introducere
Modulul 3 este alctuit din patru uniti distincte de curs, dedicate prezentrii unor
aspecte de ordin practic-aplicativ a problematicii legate de testul psihologic. Astfel,
prima unitate de curs a acestui modul transfer analiza caracteristicilor testului
psihologic de la nivelul molecular (unitatea de baz este testul nsui), la nivel molar
(este analizat itemul n calitatea sa de cea mai mic unitate a unui test, ce poate fi
abordat independent). Plecnd de la principiul c un test bun este alctuit din itemi
buni, sunt analizate dificultatea i discriminabilitatea itemilor, dar i raportul dintre
aceste dou categorii terminologice. Ulterior, sunt prezentai indicii corelaionali ai
capacitii de discriminare a unui test i curba caracteristic a itemului (CCI).
Cea de a doua unitate de curs este probabil cea mai important din toat lucrarea
deoarece, plecnd de la cteva consistente consideraii teoretice privitoare la normele
i etalonarea testelor, sunt prezentate o multitudine de metode de etalonare. Fiind un
capitol dublu ca i coninut, cea de a doua sa parte abordeaz problema clasificrii
testelor dup mai multe criterii, furniznd cteva exemple urmate de o aplicaie
practic.
Cel de al treilea capitol este unul extrem de relevant practic i se refer la construirea
scalelor psihologice. Este prezentat un demers complet, cu exemplificri concrete ale
celor ase pai ce sunt de regul urmai n procesul de construcie a unei scale. Sunt
furnizate criterii practice de selecie a itemilor n scal i sunt prezentate cele mai
utile analize statistice pentru determinarea fidelitii acesteia. Evaluarea acestui
capitol se face printr-un proiect aplicativ cu pondere nsemnat n nota final.
Ultimul capitol furnizeaz reeta de construcie a unui raport psihologic de calitate,
prin indicarea structurii acestuia, a funciilor fiecrei componente, a modului de
rezovare corect, a celor mai frecvente erori i a modului de prevenire a acestora.
Evaluarea acestui capitol este de asemenea de ordin practic, constnd din ntocmirea
unui raport psihologic pe date fictive.
M3.2. Competene
Dup parcurgerea acestui modul, studenii vor fi capabili:
85
Durata medie de parcurgere a fiecreia din cele patru uniti de nvare, incluznd
rezolvarea sarcinilor propuse i a temelor de evaluare, este de 4 la 8 ore, primul fiind
un curs simplu iar ultimele dou unitai fiind de mrime dubl.
86
_________________________________________________________________
Modulul M3. Unitatea de nvare 1
ANALIZA DE ITEMI
Cuprins
U1.1. Introducere ............................................................................................................. 87
U1.2. Competene ............................................................................................................ 89
U1.3. Dificultatea itemilor ............................................................................................... 90
U1.4. Discriminabilitatea itemilor ................................................................................... 96
U1.5. Raportul dintre dificultatea i discriminabilitatea itemilor ................................... 97
U1.6. Indici corelaionali ai discriminabilitii itemilor .................................................. 99
U1.7. Rezumatul metodelor corelaionale .. 101
U1.8. Curba caracteristic a itemului ............................................................................. 101
U1.9. Test de autoevaluare a cunotinelor .................................................................... 103
U1.1. Introducere
ntr-o manier similar cu cea din fizic, n care interesul iniial pentru lumea
macroscopic s-a recentrat ulterior pe cea microscopic, atomic i subatomic, n
evaluarea psihologic aceast schimbare se manifest prin mutarea centrului de
greutate al analizei de pe testul psihologic ca unitate de baz, pe analiza de itemi,
adic pe cele mai mici uniti care compun un test i care pot fi analizate
independent. Fundamentarea msurrii n psihologie se face prin psihometrie iar
unitatea fundamental a acesteia a devenit itemul. Evoluia i rafinarea domeniului
testelor este astzi tot mai dependent de analiza de itemi, cci pentru a-i cita pe
Laveault i Grgoire (2002) analiza de itemi seamn cu repetiia unei
orchestre. ntr-o orchestr instrumentele trebuie s cnte ntr-o manier
armonioas. (p. 199)
O definiie mai larg a itemilor este aceea c acetia reprezint ... orice tip de
enun din alctuirea unui test obiectiv care urmeaz a fi cotat ca o valoare.
(Biceanu, 2004, p. 191) Elementul fundamental al acestei definiii este partea care
stipuleaz c itemul va fi cotat ca o valoare cifric, permind deci determinri
cantitative ale unor caracteristici ale sale. Acest lucru nu este specific doar testelor
obiective, ci oricrui tip de test, inclusiv celor educaionale. Merit subliniat i
precizarea lui Stan (2002, p. 259): itemul este componenta informaional a unui
test ... care se ntlnete la chestionarul de personalitate, la testele de cunotine
colare, la testele verbale i neverbale de inteligen. Nu trebuie deci confundate
noiunile de sarcin a testului cu cea de item al testului, deosebirea fundamental
fiind aceea c itemul are o autonomie informaional care permite efectuarea unor
prelucrri statistice proprii asupra rezultatelor sale, ceea ce permite evidenierea
altor indicatori (idem). Individualitatea sau autonomia funcional a unui item
este acea caracteristic a sa de a contribui la scorul total al testului i de a produce
87
sau chiar dublu), din care vor rmne cei care corespund cel mai bine exigenelor
de construcie a unui test modern. Numrul minim recomandat de itemi care vor
rmne n urma acestei selecii este de 10, sub care nici o scal nu mai
discrimineaz suficient de nuanat ntre diverse subcategorii, fiecare item avnd o
pondere mult prea mare n scorul final. De regul, scalele unidimensionale rein
ntre 20 i 30 de itemi pentru a mpca criteriul economiei cu cel al sensibilitii i
al forei de discriminare a testului. Cu toate acestea, multe scale actuale au un
numr de itemi mai mic de 10, consecina fiind o consisten intern mnai sczut.
Elementul tehnic necesar pentru analiza caracteristicilor de dificultate i
discriminabilitate ale itemilor este matricea lui Stern (Stern, 1912), care plaseaz
pe fiecare coloan itemii ce vor fi supui analizei i pe fiecare linie cte un subiect,
ultimele linii i coloane fiind necesare sumarizrii rezultatelor i calculrii unor
indici. Analiza de pe coloan se numete ipsatizare (rezultatele tuturor subiecilor
la un anumit item), iar cea de pe linie obiectivare (rezultatele unui singur subiect la
toi itemii). mprirea scorului total pentru toi subiecii la numrul acestora d o
medie pe subiect, iar mprirea scorului total pentru fiecare item la numrul de
subieci d o medie a reuitelor. n concluzie, se poate determina o medie pentru
fiecare subiect, o medie pentru fiecare item i o medie pentru testul total.
U1.2. Competene
Dup parcurgerea acestei uniti cursanii vor fi capabili:
s defineasc conceptul de dificultate a itemului;
s analizeze importana practic a cunoaterii dificultii itemilor;
s identifica factorii care pot afecta indicele de dificultate a unui test;
s stabileasc relaiile dintre dificultatea itemilor i forma distribuiilor pe care
acetia le produc (simetria i boltirea);
s analizeze dificultatea itemului corelativ cu variana itemului;
s determine ct de dificili trebuie s fie itemii unui test;
s determine dificultatea optim a unui test, corelativ cu numrul variantelor de
rspuns utilizate;
s defineasc concepul de discriminabilitate i s determine practic aceast
caracteristic a itemului prin metoda grupurilor de contrast a lui Findley;
s analizeze raporturile dintre dificultatea i discriminabilitatea itemilor;
s utilizeze adecvat schema lui Ebel pentru selectarea itemilor unui test, simultan
dup dificultatea i puterea lor de discriminare;
s cunoasc principalele metode corelaionale pentru determinarea forei
discriminative a itemilor;
s defineasc CCI i modul ei de utilizare n raport cu tipul testului i scopul
testrii.
89
N n
n care x este suma scorurilor obinute fiecare subiect, N este numrul de subieci iar n este scorul
maxim.
Exemplu
Pentru a avea o imagine mai clar asupra dificultii itemului, prin comparaie cu un
alt indicator care este media itemului, dm tabelul de mai jos, n care sunt calculate
mediile i dificultile a trei itemi, scorai pe o scal de 5, 3 i 1 punct.
Subiect
1
2
3
4
5
6
7
8
9
10
11
12
Media (x/N)
Dificultatea p
Complement q (1-p)
Corecie p'
Item (/5)
4
5
1
3
4
2
2
0
5
1
3
3
33/12 = 2,75
2,75/5 = 0,55
1-0,55 = 0,45
0,44
Item (/3)
3
2
0
1
2
1
3
3
2
1
1
2
21/12 = 1,75
1,75/3 = 0,58
1-0,58 = 0,42
0,37
Item (/1)
1
0
0
1
1
1
0
1
1
1
0
1
8/12 = 0,67
0,67/1 = 0,67
1-0,67 = 0,33
0,34
Total (/9)
8
7
1
5
7
4
5
4
8
3
4
6
62/12 = 5,17
5,17/9 = 0,57
1-0,65 = 0,43
-
Aa cum se observ din exemplul de mai sus, media itemului nu permite comparaia
direct a itemilor, deoarece numai pentru scala dihotomic cei doi indici - media i
procentul de reuit - coincid. Pentru a fi direct comparabile, rezultatele trebuie
aduse la acelai tip de scal, prin mprirea mediei la valoarea maxim a fiecrei
scale i n felul acestea ele vor indica dificultatea itemilor ca i cnd toi itemii ar fi
scorai dihotomic.
90
n exemplul analizat valoarea medie a dificultii celor trei itemi este de 0,57, dar se
observ c itemul cel mai dificil este pe scala de 5 puncte (p = 0,55), apoi cel pe scala de 3 puncte
(p = 0,58), cel mai uor fiind cel de pe scala dihotomic (p = 0,67). Dificultatea medie a itemilor
sumarizai pe ultima coloan este de 0,57, valoare care poate fi considerat media itemilor
ntregului test, care se poate obine mprind media de 5,17 la 5+3+1 = 9. Aa cum reiese din
acest exemplu, itemul care se apropie ca proporie p de rezolvare de valoarea 1 este unul extrem
de uor, deoarece majoritatea sau chiar toi subiecii l rezolv, pe cnd itemul al crui p care se
apropie de 0 este unul extrem de dificil, fiind rezolvat de extrem de puini subieci, poate de
niciunul. Dificultatea medie a unui item este de 0,50. De regul, itemii aflai spre valori p extreme
0 i 1 se recomand s fie nlocuii, ei aducnd puine servicii psihometrice testului, pentru a se
reine prioritar itemii de dificultate medie (p = 0,40 0,60). n scopul de a da o gradaie mai fin
scalei, limitele de acceptabilitate ale dificultii itemilor se plaseaz de fapt ntre 0,20 i 0,80.
S ne reamintim...
Cunoaterea dificultii itemilor este important din mai multe motive:
permite eliminarea itemilor mult prea uori ori mult prea dificili;
permite selecia i organizarea itemilor pe scale ierarhice de dificultate, de la
uor la greu, acestea dnd gradaii cu att mai fine cu ct numrul itemilor este
mai mare i diferenele de dificultate dintre itemii progresivi sunt mai mici, p
acoperind ns spectrul de la 0,20 la 0,80, dar depindu-l dac faptul se impune;
permite crearea unor seturi mari de itemi, cunoaterea caracteristicilor privitoare
la dificultate i la indicele de discriminare, ca i curba caracteristic a fiecrui
item. Acest fapt creeaz posibilitatea asamblrii automate a seturilor de itemi ce
vor fi administrai n examenul adaptat computerizat;
st la baza crerii formelor paralele ale unor teste.
Exemplu
Decizia de a elimina un item dintr-un set de itemi ai unuui test se poate lua mai
uor sau mai greu, deoarece acelai item care la o categorie superioar de vrst
este prea uor, devine dificil sau foarte dificil la categorii de vrste mai mici.
Astfel, itemul capt valene diagnostice noi funcie de particularitile
eantionului pe care se face analiza de itemi. Mai mult, un item foarte uor, chiar
dac nu are caliti psihometrice ridicate, d ncredere n sine subiectului pentru c
l ajut s intre n examen cu o reuit, ridicndu-i motivaia pentru testare, pe cnd
un item foarte dificil poate discrimina spre extrema excepionalitii. Aadar,
pstrarea sau respingerea itemilor se face n funcie de utilitatea care se va da
testului respectiv.
Problema dificultii itemilor este important n mod special pentru testele de randament
sau pentru cele educaionale (de cunotine i de achiziii). La testele de personalitate indicele de
dificultate va fi nlocuit cu un indice de proeminen, capabil s evidenieze msura n care un
91
item reliefeaz sau nu un anumit comportament rezultat din operaionalizarea unei trsturi de
personalitate.
Dintre factorii care pot afecta indicele de dificultate al unui test, Laveault i Grgoire
amintesc numrul de rspunsuri omise ca urmare a existenei unei limite de timp i probabilitatea
reuitei prin ans (hazard). n prima situaie, din cauza presiunilor legate de timp, un mare numr
de persoane nu au putut rezolva rezolva un item amplasat de regul spre zona final a testului
(atunci cnd itemii au fost asamblai ierarhic), indicele de dificultate ne mai reflectnd acurat
dificultatea itemului respectiv: dac ar fi existat mai mult timp, cu siguran c acesta ar fi fost
rezolvat de mai muli subieci. n acest caz indicele de dificultate msoar de fapt dou lucruri
distincte, dificultatea itemului n cauz i rapiditatea respondentului, caracteristici care nu se
regsesc ntotdeauna reunite la acelai subiect.
Atunci cnd dificultatea se calculeaz pentru itemi la care alegerea rspunsului se face
dintre mai multe posibiliti trebuie s se in cont de probabilitatea alegerii rspunsului bun prin
ans sau hazard, care este cu att mai mare cu ct numrul variantelor de rspuns este mai mic.
Astfel, la o variant corect din 8, rspunsul bun prin ans are probabilitatea de 12 procente, la 1
din 6 de 17 procente, la 1 din 4 de 25 de procente i la 1 din 2 de 50 de procente. n scopul de a
corija indicele de dificultate, atunci cnd distractorii au anse apropiate de a fi alei, Laveault i
Grgoire propun urmtoarea formul de corecie:
1 p
p' = p
M 1
n care p este indicele de dificultate iniial, p' este cel corijat, iar M este numrul variantelor de
rspuns pentru itemul n cauz. Introducnd n formula de mai sus datele pentru primul item din
exemplul de la figura 8.1, p' = 0,55 - [(1 0,55)/(5 -1)], deci p' = 0,44. Pentru al doilea item, cotat
pe o scal de 3 posibiliti, p' devine 0,37, iar pentru itemul dihotomic corecia ajunge la 0,34.
Comparnd indicile de dificultate iniial cu cel corijat se desprinde uor faptul c corecia este cu
att mai puternic cu ct numrul variantelor de rspuns este mai mic. Se degaj de asemenea
concluzia c atunci cnd avem de comparat mai muli itemi care, dei provin din acelai test sau
chestionar, sunt exprimai pe scale diferite ca numr de variante de rspuns, aducerea lor la
formatul unic al unei scale dihotomice este o condiie necesar, dar nu i suficient. Pentru a avea
o baz de comparaie comun trebuie s se opereze corecia prin formula de mai sus.
De aici i rolurile diferite alocate itemilor n funcie de dificultatea lor, cei mai utili fiind
cei de dificultate medie, care difereniaz subiecii ntre ei indiferent de scorul obinut, fiind utili i
pentru discriminarea subiecilor buni, i a celor slabi.
Un concept important, derivat din cele artate mai sus, este acela de varian a itemului,
care informeaz n legtur cu gradul de mprtiere a performanei la acel item n jurul unei
medii, fiind n acelai timp i un indicator mai grosier al puterii de discriminare a itemului. Pentru
itemii cu mai multe valori de rspuns (polihotomici), variana se determina prin metoda clasic,
dar pentru o scal dihotomic exist o formul mult mai simpl pentru a face aceast determinare:
s2 = pq
n care s2 este variana itemului, p este indicele de dificultate iar q complementul su (1 - p).
Pentru a avea o reprezentare mai clar asupra acestei probleme prezentm mai jos o situaie
ipotetic, constnd din 11 itemi propui spre rezolvare la 10 subieci.
Tabel 1.1. Evoluia varianei itemilor n funcie de indicele de dificultate p.
Itemi
Subieci
1
2
3
4
5
6
7
8
9
10
1
1
1
1
1
1
1
1
1
1
1
2
1
1
1
1
1
1
1
1
1
0
3
1
1
1
1
1
1
1
1
0
0
4
1
1
1
1
1
1
1
0
0
0
5
1
1
1
1
1
1
0
0
0
0
6
1
1
1
1
1
0
0
0
0
0
7
1
1
1
1
0
0
0
0
0
0
8
1
1
1
0
0
0
0
0
0
0
9
1
1
0
0
0
0
0
0
0
0
10
1
0
0
0
0
0
0
0
0
0
p
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
q
pq
pq
11
0
0
0
0
0
0
0
0
0
0
0,0
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,00 0,09 0,16 0,21 0,24 0,25 0,24 0,21 0,16 0,09 0,00
0,00 + 0,09 + 0,16 + 0,21 + 0,24 + 0,25 + 0,24 + 0,21 + 0,16 + 0,09 + 0,00 =
1,65
Total
10
9
8
7
6
5
4
3
2
1
x = 5,50
= 2,87
2 = 8,25
x = 55
x2 = 385
Din tabelul de mai sus se poate observa faptul c cea mai mare varian o au itemii din
zona central a indicelui de dificultate (pentru p = 0,5 s2 = 0,25). Pe msur ce ne deprtm
simetric spre zonele extreme, variana itemilor descrete de asemenea simetric, de la 0,21 la 0,18,
apoi la 0,09 i 0. Acesta este un argument matematic suplimentar puternic pentru a selecta n test
itemii din zona central a dificultii, pentru c acetia au fora discriminativ cea mai mare, att
spre zona performanelor slabe, ct i spre zona celor bune. Itemii cu varian mic au funcii
speciale, fiind destinai fie discriminrii performanelor slabe (p > 0,90), fie celor bune (p < 0,10),
dar chiar i n cadrul acestor categorii speciale fora de discriminare a acestora este mai sczut
din cauza varianei lor mai mici. Pe de alt parte, din tabelul de mai sus se observ c variana
93
total a testului (2,872 = 8,25) nu este egal cu suma varianelor fiecrui item n parte (pq =
1,65).3
Pornind de la datele de mai sus pot fi calculai doi indicatori care regsesc la nivel de item
caracteristicile de ansamblu ale formei distribuiei testului, i anume simetria (skewness) i excesul
sau boltirea (kurtosis) itemului, dup formulele:
Simetria = 3 =
q p
, n care 3 este simetria itemului
pq
Boltirea (excesul) = 4 =
Subieci
p
q
pq
3
4
1
6 , ecuaie a crei valoare normal este 3.
pq
0,09
-2,67
5,11
0,18
-1,50
0,25
0,21
-0,87
-1,23
0,24
-0,41
-1,83
0,25
0
-2
0,24
0,41
-1,83
0,21
0,87
-1,23
0,16
1,50
0,25
10
0,1
0,9
11
0,0
1,0
0,09
2,67
5,11
0,00
-
Total
n = 10
x = 5,50
= 2,87
x = 55
x2= 385
Tabelul 1.2 de mai sus evideniaz foarte clar faptul c valorile lui p cuprinse ntre 0,70 i
0,30 dau distribuii relativ simetrice i c asimetria este cu att mai accentuat cu ct ne deprtm
mai mult spre extreme: pentru valori ale lui p > 0,80 asimetria este puternic pozitiv iar pentru p <
0,20 ea este puternic negativ. Acesta poate fi i motivul pentru care Guthke, Btcher i Spring
(1991, p. 230) fixeaz limitele inferioar i superioar pentru selecia itemilor testelor de
randament la p = 0, 20, respectiv p = 0,80.
Rspunsul la ntrebarea Ct de dificili trebuie s fie itemii unui test? depinde, pe de o
parte, de utilizarea testului, pe de alt parte de tipurile de rspunsuri sau de lungimea scalei. Aa
cum s-a artat i anterior, un test n care itemii se scoreaz adevrat-fals (sau 0 1) are o
probabilitate de 50% ca rspunsul s se dea prin ans (aleator), iar cnd variantele de rspuns sunt
4, aceast probabilitate este de 25%. Deci probabilitatea p i , care descrie dificultatea unui item, se
plaseaz ntre 0 i 1 (nici un subiect, respectiv toi subiecii l rezolv). n practic, dificultatea
optim a unui item se calculeaz n doi timpi:
1. Se calculeaz jumtatea diferenei dintre 100% succes i ansa de performan. Pentru un test
cu 4 posibiliti de rspuns, probabilitatea unui rspuns corect prin ans (ntmplare) este de
25%, deci:
1,00 0,25 0,75
=
= 0,375 .
2
2
3
n mod explicit, variana unui test este egal cu suma varianelor fiecrui item, la care se adaug dublul sumei
valorilor fiecrei covariane posibile n ansamblul itemilor componeni. Vezi Stan, 2002, p. 216).
94
Exemple
Test cu dou variante de rspuns:
Test cu patru variante de rspuns:
Test cu ase variante de rspuns:
Test cu opt variante de rspuns:
Test cu zece variante de rspuns:
S ne reamintim...
Alegerea dificultii optime a itemilor unui test trebuie s rezolve aceast problem
complicat: cu ct itemii au mai puine variante de rspuns, cu att mai mare este
probabilitatea de a nimeri prin ans rspunsul corect, ceea ce oblig la creterea
dificultii optime la un nivel foarte ridicat, de 0,75. Dificultatea optim diminu
progresiv cu mrirea numrului de variante de rspuns spre 0,50, dar cu ct acestea
sunt mai multe, timpul de analiz pentru fiecare item crete (sunt mai multe
variante de rspuns care trebuie luate n considerare), ceea ce oblig la reducerea
numrului de itemi. Aceast reducere afecteaz simultan fidelitatea i validitatea
testului n ansamblul su, ajungndu-se astfel la alternative: variante mai multe de
rspuns versus mai muli itemi. Cel mai adesea dilema se rezolv alegnd ntre 4 i
8 variante de rspuns, aceasta fiind zona de echilibru ntre cele dou extreme.
Rezumat relativ la dificultatea itemilor
Pentru majoritatea testelor nu este deloc indicat s avem itemi de dificultate egal
(eventual cu dificultatea optim), pentru c se urmrete s avem itemi pentru o
varietate a nivelurilor de dificultate, astfel nct testul s aib o bun putere
discriminativ n ansamblul su. Pentru cele mai multe dintre teste itemii au o
dificultate ce acoper spectrul de la 0,20 la 0,80, pentru a maximiza astfel
diferenele dintre subieci.
n funcie de scopul testrii, pot fi concentrai itemi preponderent dificili (sub 0,20),
ca n cazul seleciei unor candidai pentru o facultate, post sau meserie foarte
pretenioas, sau itemi foarte uori (cazul seleciei indulgente).
Pe de alt parte, cunoaterea dificultii itemilor este fundamental n aranjarea
acestora n test ntr-o ordine ierarhic. Itemii foarte uori, de la nceputul testului,
ajut persoana s neleag ce se cere de la ea i, chiar dac acetia nu au valoare
psihometric probat, ei ajut la ridicarea moralului, inspirnd ncrederea n
resursele proprii. Itemii foarte dificili sunt destinai extremei drepte a scalei, deci
celor de vrste mari sau supradotailor, avnd utilitate pentru un numr mai mic de
cazuri, ce apar doar pe eantioane extinse ca volum.
95
Metoda analizat presupune cel puin 30 de subieci n grup, pentru a nu avea mai puin de
8 subieci n grupurile de contrast. Utilitatea i popularitatea indicelui D provine i din uurina cu
care el poate fi determinat manual, nelund n calcul dect ceva mai mult de jumtate dintre
subieci. Mai mult, n pofida acestui fapt, el d rezultate ntru totul comparabile cu metode de
lucru mai rafinate, cum ar fi cele corelaionale. De aceea metoda grupurilor de contrast poate fi
folosit mai ales pentru testele educaionale, cu condiia ca numrul itemilor i al subiecilor s fie
suficient de mare (peste 30) cci, n caz contrar, valoarea acestui indice este artificial umflat,
fiecare item acoperind o proporie prea mare din variana total. n testele educaionale indicele D
poate servi nu numai la selecia celor mai discriminativi itemi, pentru a construi o scal puternic,
ci i ca metod de analiz a distractorilor i a erorilor, pentru care indicele de discriminare trebuie
s aib o valoare negativ. Acesta poate fi informativ i n legtur cu faptul dac cheia
rspunsurilor este sau nu este eronat sau dac rspunsul ales de grupul superior nu este realmente
acceptabil.
Tabel 1.3. Analiza capacitii de discriminare pentru 10 itemi ipotetici dup metoda lui Findley
Item
1
2
3
4
5
6
7
8
9
10
11
...
29
30
31
32
33
34
35
36
37
38
39
p
ps
pi
=(ps- pi)
1
1
1
1
0
1
1
1
1
1
1
0
2
1
1
0
0
1
1
1
1
0
0
0
3
1
1
1
0
1
1
1
1
0
1
1
4
0
1
1
0
0
1
0
0
1
1
1
5
1
0
1
1
1
1
1
1
1
1
1
6
0
0
0
0
0
1
0
0
0
0
0
7
1
1
1
1
1
1
1
0
1
1
1
8
0
1
0
0
0
1
0
0
0
1
0
9
1
0
1
1
1
0
1
1
1
1
1
10
0
0
1
1
1
1
1
0
1
0
0
1
0
0
1
0
1
0
0
1
1
1
15
1
0
0
0
1
1
1
0
0
0
1
11
1
0
0
1
0
0
1
0
1
0
1
14
1
1
0
1
1
1
0
0
1
0
1
12
0
1
0
0
1
0
0
0
0
0
1
12
1
1
1
1
1
1
1
1
1
1
1
12
0
1
1
1
0
1
1
1
1
1
1
19
0
1
1
0
1
0
1
1
1
0
1
10
0
1
0
0
0
0
0
1
0
0
0
11
0
1
0
1
0
1
0
0
1
0
0
10
0,8
0,8
0,5
0,3
0,1
0,5
0,5
0
0,2
0,8
0,5
0,3
0,4
0,5
0,6
0,1
0,5
0,9
0,3
0,6
0,5
0,1
1,0
-0,9
0,9
0,9
0,8
0,1
0,3
0,3
0,6
-0,3
0,4
0,8
0,1
0,7
0,6
0,5
0,4
0,1
p=dificultatea itemilor
Grup puternic
Grup slab
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-0,1
-0,2
-0,3
-0,4
-0,5
-0,6
-0,7
-0,8
-0,9
-1,0
Acceptarea
itemilor
9
5
1
4
0,1
0,2
Decizia
0,3
0,4
10
0,5
0,6
Revizia
itemilor
7
0,7
0,8
0,9
1,00
8
Respingerea
itemilor
99
celei mai potrivite metode corelaionale trebuie fcut cu grij. Laveault i Grgoire (op. cit., p.
210) fac cteva recomandri sintetizate n tabelul de mai jos:
Scala de msur
Dihotomic
Dihotomizat
Continu
Dihotomic
(Fi)
Dihotomizat
bis
rtetrahoric
Continu
rpbis
rbis
r, rs (rho)
S ne reamintim...
O variabil este dihotomic prin natura ei dac nu are dect dou stri posibile,
cum ar fi masculin-feminin, ca apartenen de gen;
variabila este dihotomizat atunci cnd ea este adus la doar dou valori, dei
iniial mai multe variante erau posibile, cum ar fi cstorit-necstorit, ruralurban, introvert-extravert, admis-respins etc., dei pentru fiecare dintre acestea
exist i alte variante intermediare: pentru starea civil mai exist i variantele
separat, divorat sau vduv, pentru mediu i varianta preurban, pentru
extraversie/introversie i varianta ambivert etc.;
variabilele continue sunt cele de pe scalele de interval sau de raport, care pot
lua n principiu orice valoare pe toat ntinderea amplitudinii variabilei.
Pentru c metodele corelaionale constituie un capitol distinct al statisticii, redm
condensat trei dintre coeficienii de corelaie prezeni n diagrama de mai sus.
(1)
rpbis =
xp x
sx
pi
qi
unde x p este media variabilei x (scorul total la test) a subiecilor ce au reuit la itemul i;
(2)
rpbis
xs xi p
=
Sx
q
unde xs i xi reprezint mediile grupului superior i inferior;
(3)
xs xi p
rbis =
sx
q
p
este furnizat de tabele
q
speciale.
pq
rpbis
Y
aceasta fiind ecuaia de transformare ntre cei doi coeficieni de corelaie, biserial i punct-biserial.
(4)
rbis =
Exemplu
Exist o diversitate de modele ale curbei caracteristice a itemului care se sprijin pe
diferite funcii matematice, cum ar fi teoria danezului George Rasch (1966),
considerat a fi oferit cel mai simplu i elegant model pentru CCI. Acesta se
sprijin pe dou presupuneri:
itemii testului sunt unidimensionali, ei msurnd o singur trstur comun;
itemii testului variaz uniform, pe un continuu al nivelului de dificultate.
Atunci cnd abilitatea de a rezolva un item este distribuit gaussian, CCI are binecunoscuta
form de S a ogivei lui Galton. Dei aceasta este preferat de majoritatea psihometricienilor,
pentru c permite deducii matematice despre trstura n cauz, selecia itemilor dup curbele lor
caracteristice depinde n mare msur de scopul testrii. De exemplu, atunci cnd se dorete
construirea unui test de selecie care s evidenieze clar un punct de tietur a scorurilor (cutoff)
sunt de preferat curbele cu prag abrupt (vezi ilustrrile de mai jos). Alteori scopul este urmrirea
validitii difereniale, caz n care itemii ce dau curbe net diferite dup gen, etnie sau cultur sunt
cei care vor fi eliminai sau revizuii, pentru a avea teste nesexiste ori teste corecte cultural.
Exemplu
Cel care i-a pus problema utilitii teoriei rspunsului la itemi, care st conceptual
n spatele curbei caracteristice a itemilor, a fost Nunnally6 (1978). El a fost cel care
i-a exprimat mirarea n legtur cu faptul c aceast teorie nu a fost adoptat mai
de timpuriu n serviciul construciei testelor psihologice, dar tot el este acela care a
dat rspunsul la aceast ntrebare, atunci cnd a descoperit c presupunerea
unidimensionalitii nu se verific pentru cele mai multe dintre testele analizate.
Conform lui Gregory, marea utilitate a curbei caracteristice a itemilor vine dinspre viitor,
adic dinspre testarea adaptat computerizat, n care fiecare subiect rspunde la un set
individualizat i unic de itemi, scorat pe o scal uniform i unidimensional. Fr CCI, acest tip
de examen adaptat computerizat nici nu ar putea fi imaginat. Dat fiind legtura dintre teoria
rspunsului la itemi i curba caracteristic a itemilor, rezervm acestei probleme un capitol
special. Mai jos oferim imaginea grafic a curbelor mai multor tipuri de itemi, cu meniunea c pe
abscis sunt trecute trei niveluri ale dificultii uor, mediu i greu , iar pe vertical de
asemenea trei niveluri ale probabilitii rspunsului la item mic, mijlociu i mare (sursa:
Gregory, 1996, p. 143).
Nunnally, J. C. (1978). Psychometric Theory (2nd ed.). New York: McGaw Hill.
102
103
__________________________________________________________________
Modulul M3. Unitatea de nvare 2
NORMELE I ETALONAREA TESTELOR
CLASIFICAREA TESTELOR
__________________________________________________________________
Cuprins
U2.1. Introducere ........................................................................................................... 104
U2.2. Competene .......................................................................................................... 104
U2.3. Eantionul normativ i normele testelor ............................................................... 105
U2.4. Etalonarea testelor ................................................................................................ 108
U2.4.1. Transformri de arie (neliniare) ............................................................. 108
U2.4.2. Transformrile liniare ............................................................................. 110
U2.4.3. Normalizarea scorurilor standard .......................................................... 111
U2.4.4. Stanine, stens i scale C .......................................................................... 113
U2.5. Exemple practice de construire a etaloanelor ....................................................... 114
U2.6. Clasificarea testelor .............................................................................................. 117
U2.6.1. Dup modul de administrare ................................................................... 117
U2.6.2. Dup timpul de execuie .......................................................................... 118
U2.6.3. Dup modul de executare a sarcinii de ctre subiect ............................. 119
U2.6.4. Dup modul de procesare implicat ......................................................... 119
U2.6.5. Dup constana coninutului de la o aplicare la alta .............................. 122
U2.6.6. Dup modul de cotare ............................................................................. 122
U2.6.7. Dup modul de interpretarea a scorurilor .............................................. 123
U2.6.8. Dup numrul variabilelor implicate ..................................................... 123
U2.6.9. Dup procesul psihic implicat ................................................................. 123
U2.7. Rezumat ................................................................................................................ 124
U2.8. Test de autoevaluare a cunotinelor .................................................................... 125
U2.1. Introducere
Nici un test nu are norme pentru ntreaga specia uman! afirm Anne Anastasi
(1976, p. 90). Aceasta nseamn c rezultatele la orice test au limite de valabilitate,
generate de populaia pe care el a fost aplicat i n raport cu care s-a obinut
sistemul de referin reprezentat de normele sale (baremele sau etaloanele).
U2.2. Competene
Dup parcurgerea acestei uniti cursanii vor fi capabili:
s defineasc noiunea de eantion i s indice principalele caracteristici ale
eantionului normativ;
s indice importana reprezentativitii, volumului eantionului i a raportului
104
Aceasta din urm este accepiunea pe care o vom da n aceast unitate de curs conceptului
de eantion, necesar din dou motive: aprecierea performanelor unui subiect nu se poate face
dect prin comparaie cu un grup de referin; cum aceast comparaie nu se poate face cu ntreaga
populaie, din ea se extrage un eantion reprezentativ, pe care se aplic i se etaloneaz testul. De
aici rezult c normele unui test nu au un neles absolut, universal sau permanent (Anastasi, 1974)
i c pentru a fi relevante ele trebuie raportate la eantionul construit pe populaia de referin,
...care confer valabilitate social-istoric testului sau bateriei de teste (chiopu, 1976, p. 151).
Aceasta este i raiunea pentru care un test trebuie revizuit periodic. Deoarece tabelul de norme
este relativ la populaia avut n vedere, ... nu se pot utiliza etaloane ntocmite n alte ri i n alte
condiii, tabelul de norme are o valoare local, cel mult naional (Radu, 1993, p. 381).
105
Cea mai important caracteristic a unui eantion este reprezentativitatea sa, care
presupune faptul c el va fi construit innd cont de toi factorii de variabilitate importani ce pot
produce diferene n scorurile testului: vrsta, apartenena de gen, mediul (ruralurban), la care se
pot aduga nivelul de instrucie, pregtirea profesional, statutul socio-economic i cultural,
apartenena etnic, distribuia geografic i orice alt caracteristic sau atribut pe care populaia de
ansamblu o are i care ar putea s genereze scoruri difereniate. Eantionarea este un capitol
important al Statisticii, care i-a pus la punct procedee bine definite de construcie a eantionului
pentru a crete reprezentativitatea acestuia: metoda cotelor, procedeul loteriei, al pasului, metoda
eantionrii stratificate, multifazice, a eantionului fix sau metoda panel.
Raportul omogenitate-eterogenitate este o alt nsuite imporatnt a eantionului, cci n
funcie de numrul i de ponderea atributelor sale, pot fi construite sub-eantioane populaionale
caracteristice. Acolo unde pot fi puse n eviden diferene legate de vrst, gen, mediu sau nivel
de instruire, se vor construi etaloane pentru categoriile amintite, n cadrul fiecrei categorii
celelalte elemente importante ce caracterizeaz populaia trebuind s se regseasc n proporii
egale sau apropiate.
n cazul n care se intenioneaz ca testul s aib o aplicabilitate foarte larg, naional,
atunci eantionul normativ va fi suficient de mare i de cuprinztor pentru a produce valori stabile
i reprezentative. Pentru aceasta, populaia va trebui definit n avans n termenii obiectivelor
testului, dup care, prin proceduri statistice specifice, va fi asamblat eantionul pe care va fi
aplicat testul. n rile n care exist populaii de mai multe tipuri (adic eterogenitate etnic) sau
diferene foarte mari n standardele de via sau de cultur, este de preferat s se aib n vedere
elabortarea de etaloane regionale sau locale, etaloanele naionale fiind indicate aici doar pentru
studiul opiniilor, atitudinilor sau al inteniilor de vot. Studierea erorii de eantionare (care trebuie
s fie ct mai mic) i a distribuiei scorurilor obinute (care trebuie s fie unimodal) sunt repere
statistice importante n construirea eantionului.
Mrimea (volumul) eantionului este foarte important: dac eantionul este prea mare
genereaz o cantitate de munc greu de acoperit, dar dac este prea mic el poate s lase pe dinafar
subgrupuri populaionale cu caracteristici importante, ceea ce va diminua reprezentativitatea sa.
Volumul eantionului genereaz exigena ca din fiecare clas sau categorie identificat s se
extrag cel puin 300 de persoane (Kline, 1993). Aceasta nseamn c, genernd un numr ridicat
de clase diferite, populaiile largi i eterogene se vor regsi n eantioane normative voluminoase,
abordabile cu costuri de resurse umane i materiale ridicate. n aceast situaie este preferabil
utilizarea de etaloane pentru populaii mai mici i mai omogene, pentru care se vor obine norme
zonale sau locale. Atunci cnd se pun n eviden diferene nsemnate ale mediilor i abaterilor
standard pentru diferite subgrupuri populaionale ale eantionului normativ este indicat
construirea unor etaloane difereniate, ce vor permite raportarea mai nuanat a fiecrui caz nou la
un sistem de referin mai adecvat. Aceste subgrupuri pot fi formate dup vrst, apartenen de
gen, clas colar, tip de curriculum, regiune geografic, mediu rural sau urban, nivel de instrucie,
nivel economic etc.
Normele locale, dezvoltate cel mai adesea de nii utilizatorii de teste, sunt avantajoase
pentru c definesc mult mai strict subgrupurile menionate anterior. Mai mult, pe msur ce testul
106
este utilizat, el furnizeaz continuu date pentru subgrupuri tot mai bine definite, de unde i
posibilitatea de a construi etaloane tot mai difereniate. La limit, se poate face spre exemplu
predicia rezultatelor la test ale unui elev n raport cu propriile sale rezultate anterioare. Msura
progresului unui subiect n timp, predicia succesului n achiziia colar sau a performanelor ntrun serviciu sau munc se bazeaz mult mai mult pe normele locale, dect pe cele larg
reprezentative naional. Baremele naionale sunt ns extrem de necesare pentru c ofer cel mai
larg i mai stabil sistem de referin, necesar pentru a valida, de exemplu, examenele naionale.
Deoarece costurile de obinere a unor astfel de etaloane sunt foarte ridicate i deoarece
practicianul are de rezolvat probleme de mai mic anvergur i mult mai specifice, etalonul local
este cel mai accesibil i mai util pentru c reproduce cel mai bine i cu cele mai mici costuri
caracteristicile populaiei testate. Etaloanele pentru grupuri speciale tezaurizeaz i valorific n
timp propria munc a psihologului atunci cnd acesta se ocup de categorii ocupaionale sau
populaionale speciale: electricieni, transportatori, pacieni cu sindrom Down, autiti etc.
S ne reamintim
Principalele caracteristicei ale unui eantion sunt legate de reprezentativitatea i
de volumul su, dar i de raportul omogenitate-eterogenitate.
Asamblarea unui eantion este o operaie laborioas, care revine de regul
constructorului testului.
Aceast operaie presupune luarea n considerare a principalelor surse de variaie
identificate la nivelul populaiei int.
Cele mai importante surse de variaie considerate sunt vrsta, apartenena de gen,
mediul sau zona geografic, la care se pot aduga nivelul de instrucie, profesia,
studiile parentale, nivelul socio-economic etc.
Utilizatorii testelor pot crea ei nii etaloane sau bareme pentru categorii
populaionale mai restrictiv definite, operaie prin care prediciile bazate pe un
test sau pe o baterie de teste devin mai acurate.
Aceste etaloane speciale capitalizeaz munca i experiena de durat a
practicianului.
Etaloanele i baremele trebuie actualizate (upgradate) pe msur ce
caracteristicile populaiei int se schimb.
Deorece nu exist bareme sau norme internaionale sau universale, pot fi
identificate doar etaloane naionale, zonale sau locale, la care se adaug i
categoria etaloanelor pentru grupuri speciale.
Activitatea de etalonare este una prin care cotele brute ale unei distribuii sunt
transformate n cote standard.
Aceast transformare poate fi una liniar sau una de arie.
107
cele dou teste i de poziia persoanei n cele dou distribuii. Dac am ti, de
exempu, c scorul maxim la testul de memorie a fost de 20, c performana medie a
fost de 10, iar abaterea standard de 3,5, am avea o idee mult mai clar despre
performana sa la acest test, care este una superioar: ea este deasupra mediei cu
dou abateri standard. Dac la testul de motricitate am ti c performana maxim a
fost de 50, cea medie de 30 i abaterea standard a fost de 5, vom ti c performana
sa a fost sub medie cu o abatere standard. Rspunsul devine acum foarte clar:
performana la memorie a fost mult peste medie, dar la motricitate a fost una slab.
Din exemplele de mai sus rezult clar c scorurile brute nu pot fi luate ca baz de
comparaie nici ale persoanelor ntre ele, nici ale aceleiai persoane la probe
diferite. Pentru a cpta un neles cotele brute trebuie transformate, adic trebuie
raportate la un sistem de referin mai precis, n care forma distribuiei i valorile
tendinei centrale devin reperele eseniale. Aceast operaie de transformare a
scorurilor brute n scoruri standard, cu proprieti matematice dinainte tiute,
definete activitatea de etalonare, la sfritul creia se obin tabelele de norme sau
etaloanele.
Aplicarea testului d scoruri sub forma cotelor brute, care sunt analizate i tratate statistic
pentru a obine cotele standard, adic normele fixate n etalon. n acest scop se folosesc dou tipuri
de transformri (Albu, 1998, p. 246):
transformri de arie (neliniare), prin care se modific repartiia cotelor brute, pentru a semna
cu o repartiie uniform, ca n cazul quartilelor, decilelor sau centilelor, sau cu una normal,
ca n cazul scalelor normalizate cu 5, 7, 9, 10, 11 sau 19 trepte;
transformri liniare, prin care se obin cotele standard z i cotele standardizate (pstrnd
nemodificat ordinea indivizilor n eantion, adic repartiia nemodificat a cotelor).
Dac n primul caz se modific unitatea divizionar a scalei pentru a se lua arii egale n
trane succesive (cte 10% n cazul decilelor, 25% n cazul quartilelor i 1% n al percentilelor), n
al doilea caz unitatea de scal este egal, cea care difer fiind aria poriunii de sub curb
corespunztoare unei uniti, aceasta n cadrul unei repartiii care a fost normalizat.
Pe lng cele dou tipuri de transformri unele etaloane folosesc vrstele echivalente,
vrstele mintale sau clasele echivalente pentru variabile care au o cretere continu n raport cu
vrsta (nlimea, greutatea, inteligena, vocabularul sau cunotinele la o materie colar).
Clasele echivalente, folosite mai ales pentru ciclul primar, n construirea testelor de
cunotine standardizate, exprim pentru fiecare clas i lun de coal, mediana cotelor brute la
test, ceea ce permite reperarea unui scor particular al unui elev: citire 4,5 (nivel de clasa a IV-a,
luna a cincea a anului colar), aritmetic 3,6, istorie 4 etc.
Vrstele echivalente dau fie vrste mintale, ca la testele de inteligen de tip Binet (unde
raportul vrst mintal/vrst cronologic, multiplicat cu 100, d coeficientul de inteligen), fie
vrste ale citirii sau socotitului, pentru testele de cunotine. Se pot calcula astfel coeficieni de
inteligen (IQ), de dezvoltare (QD, ca n bateriile Gesell) sau de educaie (QE).
109
Termenul de percentil este adesea substituit cu unul mai simplu, care este cel de centil, cu care este echivalent. O
exprimare mai corect, dar mai pretenioas, va folosi n loc de percentil termenii de punct percentil sau de rang
percentil.
8
A se vedea Anexa 2 de la sfritul lucrrii.
110
n 4 trane egale (quartile). Pentru fiecare dintre aceste operaii furnizm aplicaii n paginile care
urmeaz.
xm
s
unde rezultatul este cota z corespunztoare scorului la testul x, iar m i s sunt media, respectiv
abaterea standard a populaiei pe care s-a fcut etalonarea. Spre deosebire de percentile, cotele
standard z au avantajul unitii egale pe toat lungimea scalei, exprimate n abateri standard (s),
ceea ce le face tipice pentru o scar de interval i de raport. Utilizarea lor nu distorsioneaz scala
de msur, conservnd nu numai ordinea subiecilor, dar i magnitudinea distanei relative dintre
acetia. Cu alte cuvinte, scorurile standard pstreaz neschimbat forma curbei de distribuie a
scorurilor, posednd n plus proprieti matematice care nu se regsesc la nivelul distribuiilor
brute. Astfel, cnd o distribuie de scoruri brute este transforat n scoruri standard z, colecia de
scoruri standard rezultat va avea ntotdeauna o medie de zero, o varian i o abatere standard de
1. n plus, aria de sub curb este distribuit gaussian astfel nct suprafeele de sub curb dintre
dou pucte ale liniei distribuiilor sunt dinainte tiute. Dar raiunea de baz pentru care sunt
transformate scorurile brute n scoruri standard este aceea c ele aduc la un format comun
rezultatele unor teste foarte diferite ca medii i ca abateri standard. Fiind msuri independente de o
unitate de msur (fiind adic msuri amodale) acestea fac posibil comparaia direct a nlimii
cu greutatea i a amndurora cu neuroticismul, de exemplu.
z=
111
Exerciiu
ntr-o colecie de scoruri la un test cu media de 50 i abaterea standard de 7,
persoana A are scorul de 30, persoana B de 50 i persoana C de 65. Aplicnd
formula de calcul a notelor z determinai cotele standard pentru cei trei
subieci i comentai rezultatele obinute.
Cotele standard au i cteva dejavantaje care trebuie cunoscute de psihologul practician.
Dezavantajul minor este acela de a fi exprimate prin valori pozitive (pentru scorurile brute aflate
peste medie) i negative (pentru scorurile brute aflate sub medie), cea mai mare parte fiind
cuprinse n intervalul [3; +3]. Pentru muli psihologi utilizarea numerelor negative pare mai puin
atractiv. n plus, repartiia normal aglomereaz cea mai mare parte a populaiei de date pe
poriunea central (68% din cazuri sunt cuprinse n intervalul de plus i minus o abatere standard),
extremele fiind mai rarefiate. Dejavantajul major al cotelor z provine ns din faptul c, atunci
cnd sunt comparate dou distribuii standard care au forme diferite (asimetrii de sensuri diferite,
sau o distribuie normal i una asimetric), acest fapt poate duce la concluzii eronate. Cu alte
cuvinte, cazul ideal este acela al comparrii unor distribuii normale ca form, iar dac acest fapt
nu se ntmpl, asimetria trebuie s fie de acelai tip.
B. Scorurile standardizate
De la cursul de Statistic se tie c adunarea unei constante la o colecie de date modific
doar media acelei distribuii, dar relaiile de ordine i de mrime, abaterea standard i forma
distribuiei rmn neschimbate. Mai mult, prin nmulirea sau mprirea tuturor valorilor unei
distribuii cu o constant, acea distribuie se dilat sau comprim proporional cu constanta
respectiv, simultan cu abaterea standard. Prin urmare, utiliznd cele dou perechi de opereaii
aritmetice de baz este posibil ca o distribuie brut oarecare s fie transformat n una care are o
origine i o abatere standard convenabile. Prin aceasta se face o transformare liniar asupra
distribuiei originare sau asupra cotelor standard ale acesteia, ceea ce se obine fiind cotele
standardizate.
Rezolvarea practic a transformrii liniare asupra cotelor z i obinerea cotelor
standardizate se face dup formula:
z ' = M + sz
unde z ' este cota transformat a cotei standard z, iar M i s sunt media i abaterea standard pentru
cotele standardizate obinute prin transformare. Valorile z ' se rotunjesc la numere ntregi,
proprietile lor fiind aceleai cu ale cotelor standard z, exceptnd firete media i abaterea
standard, modificate prin transformare.
Dei mai maniabile, din punct de vedere conceptual scorurile standardizate sunt identice cu
cele standard, deoarece ambele conin exact acelai tip de informaie, iar forma distribuiilor
rezultate este identic: reprezentarea grafic a relaiei dintre cele dou distribuii este o linie
dreapt. Singura diferen notabil este aceea c scorurile standardizate sunt ntotdeauna numere
pozitive ntregi, acesta fiind faptul pentru care ele sunt preferate. Dar cel mai important lucru
relativ la distribuiile standardizate este acela c orice distribuie de scoruri brute poate fi
112
IQ
IQ
GRE
subscale
Media
AS
3
1
5
2
10
5
50
10
50
14
100
10
100
15
10
3
500
100
Trebuie precizat faptul c de foarte mare utilitate sunt dou tipuri de scale standardizate,
scorurile T (introduse de McCall n 1922) i scorurile H, introduse de Hull, ale cror formule de
complete de transformare a scorurilor brute n scoruri standard sunt urmtoarele:
T = 50 +
10
(x M )
s
respectiv:
14
(x M )
s
n cele dou formule de mai sus termenul (x + M)/s este echivalentul cotei z, aa c ele se
pot rescrie ca simple transformri de cote z astfel:
T = 50 + 10z i H = 50+ 14z .
H = 50 +
distribuiilor i pe eantioane populaionale largi i reprezentative. Deoarece cel mai adesea aceste
asimetrii rezult dint-o gradare greit a dificultii itemilor, prea muli itemi dificili producnd
asimetrii pozitive, prea muli itemi uori o asimetrie negativ, soluie optim este aceea de
normalizare a distribuiei prin eliminarea itemilor inadecvai ca dificultate.
relative cumulate (fc). Iat rezultatele la testul Raven Standard (PM 38) aplicat pe 448 de
concureni la un examen de admitere, utilizate pentru exerciiile noastre de etalonare.
Tabel 2.2. Distribuia unor rezultate la Matricile Avansate Raven
x
fa
fc
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
11
12
14
17
21
28
31
33
x
fa
fc
41
42
43
44
45
46
50
51
55
56
11
12
15
18
24
20
28
28
36
37
32
29
35
23
23
22
13
44
56
71
89
113
133
161
189
225
262
294
323
358
381
404
426
439
443
448
448
47
48
49
52
53
54
57
58
59
60
d. Etalonul n quartile
Quartilul 1 (inferior) are naintea sa 25% dintre subieci, adic (44825)/100 = 112. Cutm
pe linia frecvenelor cumulate (fc) cea mai apropiat valoare de 112, care este 113, corespunznd
cotei brute de 45. Aadar qurtilul 1 are valorile de scor de la 0 la 45, care se i trec n tabel.
Quartilul 2 (mediana), mparte pe din dou efectivul, deci are naintea sa 50% din efectiv, adic
(44850)/100 sau 448/2 = 224. Valoarea cea mai apropiat de aceasta este 225, ceea ce corespunde
cotei brute de 49. Pentru qurtilul 2 se va ntabela deci 46 49. Quartilul 3 (superior) are naintea
sa 75% din efectiv, adic (44875)/100 = 336. Valoarea cea mai apropiat este 353, corespunznd
cotei brute de 53.
Finalmente, etalonul rezultat va arta astfel:
Tabel 2.3. Etalonul n patru clase (quartile)
Quartile
Procente
Teoretice
Cumulate
25
25
Q1
Clase
0 45
Q2
46 49
25
50
Q3
50 53
25
75
Q4
54 60
25
100
Clase
0 41
42 44
45 46
47 48
49
50
51 52
53
54 55
56 60
Teoretice
10
10
10
10
10
10
10
10
10
10
Procente
Cumulate
10
20
30
40
50
60
70
80
90
100
Pentru c etaloane n centile ntlnim rareori, cel mai adesea se calculeaz reperele pentru
punctele percentile 3, 5, 25, 75, 95 i 97, celelalte valori (10, 20, 30 etc.) fiind respectiv primul, al
doilea, al treilea decil etc. Modalitatea de calcul este similar: percentilul 3 are 3 procente din
efectiv naintea sa, deci (4483)/100 = 13,44 rotunjit la 13, care pe linia frecvenelor cumulate are
cea mai apropiat valoare 14, cu cota brut corespunztoare 35 (reperul pentru percentilul 3).
Similar, percentilul 97 este (44897)/100 = 434,56, rotunjit 435, care are ca reper scorul brut 57
.a.m.d.
116
Procente:
Teoretice
4,0
6,6
12,1
17,5
19,6
17,5
12,1
6,6
4,0
Clase
0 36
37 41
42 45
46 48
49 50
51 53
54 55
56
57 60
Cumulate
4,0
10,6
22,7
40,2
59,8
77,3
89,4
96,0
100,0
118
Testele de randament au itemii de dificulti diferite, aranjai ierarhic, timpul fiind suficient
de mare pentru a permite parcurgerea lor de ctre toi subiecii. Cota brut o reprezint
numrul de probleme corect rezolvate (primeaz deci aspectul calitativ al rezolvrii).
Cele mai multe teste combin aceste dou criterii, cum este subtestul Cuburilor WISC, unde
modelele de realizat sunt progresive ca dificultate (utilizeaz patternuri caroiate, apoi fr caroiaj,
modele de 2x2, apoi de 3x3 cuburi), iar punctele rezult din rezolvarea corect a modelului i din
bonificaiile de timp (de vitez, de fapt).
119
Dac testele de eficien ncearc s surprind performana maxim a unei persoane, cele de
personalitate vor s surprind performana ei tipic (Corsini, 1994), primele avnd itemi de genul
adevratfals, prin care se obine un scor numeric i o ierarhizare a indivizilor, n timp ce la a doua
categorie rspunsurile nu sunt dihotomice (bune/rele), deci nu permit o ierarhizare, ci o raportare
tipologic.
Testele de aptitudini: conformndu-se unui model evolutiv i ierarhic asupra inteligenei, sunt
teste de aptitudine general (inteligen), care msoar un potenial general, teste de aptitudini
speciale (muzic, mecanic, sport, arte etc.) i teste de aptitudini multiple, care cuprind ntr-o
singur baterie mai multe feluri de aptitudini, definite factorial, ce pot interveni n domenii
specifice (dexteritate, inteligen spaial, tehnic, manualitate etc.).
Testele de cunotine msoar nu un potenial (ca cele de inteligen), ci nivelul efectiv atins
n achiziia de informaii sau de deprinderi specifice unui domeniu (matematic, istorie,
informatic etc.). Pentru c cel mai bun predictor asupra a ceea ce poate nva cineva este
ceea ce el deja a nvat pn la un moment dat, testele de cunotine au n vedere n mod
expres experiena anterioar de nvare. De fapt, cea mai bun predicie este dat de folosirea
concomitent a testelor de aptitudini generale (inteligen) cu cele de cunotine, pentru c
combinarea lor este mai informativ (indic i ceea ce este potenial, dar i ceea ce este
dobndit prin nvare). Unele dintre testele de cunotine sunt de tip informativ (elaborate de
profesorii nii pentru a determina nivelul unei clase), sau standardizate (elaborate de
specialiti, destinate utilizrii pe scar larg, avnd un manual care indic strict condiiile de
standardizare n aplicare, cotare, raportare la norme elaborate pe eantioane reprezentative i
acoperind o mare varietate de coninuturi, ce le fac foarte recomandabile pentru evaluri
sumative).
Probele de lucru sunt extrem de indicative pentru evaluarea nivelului atins ntr-o profesie,
activitate, dependent de formarea unor deprinderi motrice, intelectuale sau rezultate dintr-o
experien. Unele dintre elementele implicate ntr-o munc devin foarte diagnostice pentru
rezultatele ce se vor obine ulterior n munca respectiv. naintea unui program de instruire,
deseori se face o astfel de evaluare care, cnd este bine conceput, are validitate predictiv i
face o mare economie de timp i bani, programele putnd dura luni sau ani.
Testele situaionle sunt echivalentele probelor de lucru n cazul profesiilor administrative
(Albu, 1998, p. 74), deosebirea major fiind c n testul situaional se regsete sarcina de
lucru n totalitatea ei, i nu numai anumite elemente. n afar de aceasta, ea nu cuprinde numai
deprinderi (skills) ci i variabile de personalitate i sociale (emoii, opinii, stil personal,
aptitudinea de lider, etc.). Scopul lor este adesea deghizat, ele fiind construite ca simulri ale
unor situaii reale, pe care cel n cauz trebuie s le rezolve. Tehnica in-basket (coul de
lucru) simuleaz condiiile de lucru ale unui manager, director de firm, care trebuie s
120
rspund la toate solicitrile cuprinse n co: telefoane, decizii, scrisori, directive, interviuri
etc. Capacitatea de conducere i stilul personal n lucrul cu oamenii se evideniaz astfel
printr-un test n care itemii sunt de aceeai natur i complexitate ca munca efectiv.
Evident c aceste teste se organizeaz dup faza interviurilor preliminare i dup examenele
psihologice cu teste clasice, prin care numrul candidailor cu anse de a fi selectai pentru
post se reduce drastic.
Chestionarele de personalitate. Acestea pot fi unifazice sau multifazice, dup cum msoar
una sau mai multe dimensiuni de personalitate (extraversie, anxietate, nevrotism, maturizare
emoional, fora Eului, masculinitate-feminitate, tendine patologice etc.) Dup coninut, ele
pot fi de adaptare, caz n care se numesc inventare de personalitate, indicative pentru
integrarea social a propriei conduite sau pentru starea de sntate. n afara acestora,
chestionarele pot msura interesele (foarte importante n orientarea profesional), atitudinile,
opiniile (fundamentale n anchetele sociologice), sau valorile. Uor de administrat i de cotat,
chestionarele de personalitate au o larg utilizare, cci se bazeaz pe supoziia (discutabil!)
potrivit creia cea mai bun cale de a afla ceva despre un individ este de a-l ntreba direct
(Hammond, 1995). Sunt multe dovezi c ntre sinele social i cel psihologic, ntre sinele real i
cel ideal pot exista distane mari sau conflicte (surse de inadaptare social) i, mai mult, dac
situaia de examinare are miz (angajare, selecie profesional), rspunsurile pot fi trucate
intenionat (rspunsuri de faad).
psihodiagnostician bun, specializat n domeniu. Dac la acestea adugm timpul mare, cerut de
aplicare i interpretarea rezultatelor, faptul c sunt folosite doar scale nominale (raportarea
persoanei la o tipologie sau categorie) i faptul c msoar date ce au o mare fluctuaie de
moment (dependente de factori dispoziionali), vom nelege de ce entuziasmul iniial pentru
aceste tehnici s-a mai temperat, ele rmnnd ns, pentru unele zone, singurele instrumente
diagnostice dezirabile.
Testele obiective de personalitate sunt, ca i cele proiective, teste indirecte pentru c-i
deghizeaz scopul, dar sunt numite obiective pentru c folosesc stimuli structurai (activiti
simple, manipulabile experimental), din execuia crora se deduc aspecte relevante ale
personalitii, cu o mult mai mare concordan ntre evaluatori, comparativ cu cele proiective.
Modificarea vigilitii (arous-ului cortical) la introveri i extraveri este extrem de diferit,
primii avnd o descretere accentuat, ceilali o cretere progresiv, paralel cu concentraia de
cofein. Muli constructori de chestionare (inventare) de personalitate s-au lsat sedui de
ideea gsirii unor validri externe a acestora prin teste obiective, printre acetia numrndu-se
Eysenck sau Cattell.
preformate. Ea se obine i cnd numrul itemilor este mare i scorul la test are o formul de calcul
clar specificat.
Teste ipsative, care cer subiectului s aloce o resurs personal limitat mai multor domenii,
urmrind compararea ntre domenii sau ntre scorurile obinute la mai multe din scalele
testului.
Criteriu
Mod de administrare
Timp de execuie
Mod de executare a
sarcinii
Mod de procesare
Constan coninut
Mod de cotare
Mod de interpretare a
scorurilor
Numr de variabile
Proces psihic
investigat
Categorii majore de
teste (Anastasi)
Categorii de teste
Idividuale
De vitez
Orale
Scrise
(creion-hrtie)
De grup
De randament
De performan
De eficien
De personalitate
De aptitudini
Chestionare
De cunotine
Tehnici proiective
Probe de lucru
Teste obiective
Teste situaionale
Coninut fix
Coninut variabil
Obiective
Subiective
Normative
Centrate pe
Idiografice
Ipsative
criteriu
Analitice
Sintetice
Unifazice (chestionare)
Multifazice (chestionare)
De inteligen, de memorie, de atenie, de creativitate, de percepie, de
reprezentri spaiale, de temperament, de caracter etc.
De abiliti separate
De personalitate
De nivel intelectual
general
U2.7. Rezumat
Deoarece scorurile brute ale unui test nu au nici o semnificaie prin ele nsele,
acestea trebuie raportate la scorurile unui grup de referin prin construirea unui
etalon sau barem.
Etalonul convertete (transform) cotele brute n cote standard i permit
interpretarea unui scor n termenii poziiei ocupate de acesta ntr-o ierarhie.
Deoarece nu au valibilitate universal i permanent, testele trebuie revizuite i
etalonate periodic.
Etalonarea se face pe un eantion normativ, care trebuie s fie extins numeric,
reprezentativ pentru populaia int i cu un bun raport omogenitate-eterogenitate.
Etaloanele pot fi naionale, zonale sau locale, la care se mai adaug etaloanele
destinate grupurilor speciale.
Punctul de plecare n construirea unui etalon este distribuia scorurilor brute iar
sistemul de referin curba distribuiei gaussiene.
Etalonarea se face fie prin transformri de arie (trane succesive de mrime egal
din distribuie), fie prin transformri liniare (uniti egale pe linia de distribuie a
scorurilor).
Cele mai tipice transformri de arie sunt operaiile de centilare i decilare prin care
124
__________________________________________________________________
Modulul M3. Unitatea de nvare 3
CONSTRUCIA I DEZVOLTAREA SCALELOR PSIHOLOGICE
Cuprins
U3.1. Introducere .......................................................................................................... 126
U3.2. Competene ......................................................................................................... 126
U3.3. Paii de urmat n dezvoltarea scalelor ................................................................. 127
U3.3.1. Pasul nti ................................................................................................ 127
a. Recursul la o teorie valabil ................................................................ 127
b. Nivelul de specificitate al scalei ........................................................... 130
U3.3.2. Pasul al doilea .......................................................................................... 131
a. Lungimea i redundana setului iniial de itemi ................................... 131
b. Reguli de scriere a itemilor unei scale ................................................. 133
U3.3.3. Pasul al treilea .......................................................................................... 135
a. Scalele Likert ........................................................................................ 136
b. Scalele Thurstone .................................................................................. 137
c. Scalele Guttman .................................................................................... 138
d. Scala de distan social Bogardus ...................................................... 139
e. Numrul optim al categoriilor de rspuns ............................................ 140
U3.3.4. Pasul al patrulea ....................................................................................... 143
U3.3.5. Pasul al cincilea ....................................................................................... 144
U3.3.6. Pasul al aselea ........................................................................................ 145
a. Examinarea iniial a setului de itemi .................................................. 145
b. Corelaia item-scal ............................................................................. 146
c. Analiza factorial exploratorie ............................................................ 148
d. Scurt raport despre scal ...................................................................... 152
U3.4. Criterii de selecie pentru optimizarea lungimii scalei ......................................... 153
U3.5. Analize utile pentru determinarea fidelitii scalei .............................................. 154
U3.6. Rezumat ................................................................................................................ 156
U3.7. Evaluare: proiect aplicativ .................................................................................... 157
Lista de termeni .............................................................................................................. 157
U3.1. Introducere
O bun parte din activitatea practic a psihologului se sprijin pe diagnoza unor
aspecte cantitative ale aptitudinilor i dimensiunilor definitorii pentru personalitate.
n acest scop el utilizeaz instrumente ale cror caliti psihometrice trebuie
construite i evaluate n cunotin de cauz. n plus, pentru unele dimensiuni
psihologice, pedagogice sau sociologice specialistul trebuie s dezvolte singur
scale destinate msurrii constructelor respective. Mai mult, literatura domeniului
face adesea referiri la aceste caracteristici, considerndu-se implicit valabil c
126
U3.2. Competene
Dup parcurgerea acestei uniti cursanii vor fi capabili:
s defineasc paii i etapele urmate n construcia scalelor psihologice;
s genereze setul iniial de itemi respectnd regulile de scriere a acestora;
s determine formatul scalei, selectnd tipul de scal de msur adecvat;
s administreze, s piloteze i s examineze performana iniial a itemilor;
s utilizeze analiza factorial exploratorie i alte analize statistice pentru selecia
itemilor formei finale a scalei;
s construiasc un chestionar pentru o variabil de personalitate indicat, cu
parcurgerea tuturor pailor i a etapelor prezentate n curs.
alte direcii, de a-i selecta i reuni pe cei mai reprezentativi ntr-o scal uni- sau
multidimensional, de a determina gradul de consisten intern (de omogenitate)
al fiecrei subscale, stabilitatea ei n timp sau legtura cu constructul msurat prin
corelare cu alte scale presupuse a msura aceeai dimensiune. Un astfel de demers
tipic pentru dezvoltarea unei scale presupune un mare consum de energie i el
ar putea s nu fie rspltit cu rezultatele ateptate. Aceasta deoarece specialistul
trebuie s aib o cunoatere i o conceptualizare prealabil a domeniului care
urmeaz s fie investigat, fie din parcurgerea literaturii i a teoriilor n legtur cu
problema/ dimensiunea respectiv, fie dintr-o experien prealabil, fie i este
cazul cel mai fericit din amndou direciile. Prin aceasta dorim s afirmm c
aspectele tehnice care vor fi invocate n paginile care urmeaz nu trebuie
supraestimate n detrimentul nelegerii naturii reale a conceptului sau faptului
psihologic care urmeaz a fi msurat.
Recursul la teoriile cele mai consistente referitoare la acest construct este fundamental
pentru c aceasta ne ajut i ne ghideaz n selectarea elementelor sale eseniale, care vor fi
ulterior transformate n itemii scalei sau ai chestionarului. Multe dintre dimensiunile i
constructele care definesc aspecte psihice, comportamentale sau sociale sunt subtile, ambigue i
nu i gsesc o expresie direct sau deplin n experiena de practician. De aceea este foarte
important s ne facem o idee ct mai clar despre ceea ce urmeaz a fi msurat. n acest sens
teoria este de cel mai mare ajutor, pentru c ea ne ajut s dobndim o imagine consistent asupra
aspectului ce va fi abordat psihometric. Corobornd mai multe puncte de vedere teoretice despre o
problem se degaj elementele sale eseniale, dar i neclaritile sau ambiguitile, fapt care ajut
specialistul s decid dac este necesar o nou direcie de abordare i s construiasc o prim
schi a instrumentului de msur corespunztor.
Exemplu
S presupunem c suntem preocupai de o problem practic, cum ar fi cea a
tulburrilor de citit-scris, i observm c aceasta este mult mai frecvent la biei
dect la fete. Am remarcat de asemenea faptul c printre disgrafici i dislexici
proporia stngacilor este de cteva ori mai mare dect n restul populaiei, ceea ce
ne ndreptete s credem c aceste tulburri sunt asociate cu probleme de
lateralizare (manual i/sau cortical) a unor funcii importante. De aceea am dori
s crem un instrument care s fie utilizat n tulburrile instrumentale pentru a
diagnostica gradul de lateralizare manual.
Literatura domeniului dominanei manuale atrage atenia asupra ctorva elemente
importante:
stngcia poate fi ereditar sau non-ereditar, adic produs prin alte mecanisme,
dect cel genetic, cum ar fi excesul de testosteron din primele luni de sarcin,
care inhib dezvoltarea emisferei stngi (cel mai adesea dominant n populaia
de baz) sau stngcia accidental, prin scoaterea din uz a minii dominante un
128
9
Annett, M. (1992). Spatial ability in subgroups of left- and right-handers. In British Journal of Psyuchology, 83, pp.
493-515.
10
Oldfield, 1971: Edinburgh Handedness Questionnaire; Annett, 1970: Laterality tests and interests.
129
Din toat aceast mas de informaii i din altele de acelai tip trebuie extras cea de
interes pentru scopurile scalei ce va fi construit. Operaionalizarea enormei mase de informaii
despre stngaci i stngcie nseamn traducerea acesteia ntr-o form care s poat fi msurat, n
cazul de fa sub forma itemilor unui chestionar sau a unor probe practice care vor compune itemii
unui test de lateralitate. Aa cum se observ, unele dintre informaiile de mai sus par a fi mai
importante dect altele, avnd rolul de a ghida ntregul demers de construcie a scalei. Mergnd de
exemplu pe modelul genetic al lui Annett vom putea determina opt categorii referitoare la
lateralitatea manual. Dac se are n vedere problema omogenitii/eterogenitii lateraliztii va
trebui s se generm i s se includ n scal itemi legai de preferina pentru membrele
inferioare, pentru ochi, ureche, hemicorp. Dac se ia n calcul dimensiunea ereditar a stngciei
vom include itemi legai de frecvena acestei particulariti printre rudele apropiate, iar dac avem
n vedere dimensiunea ei evolutiv pe scala vrstelor vom include itemi care s disting ntre
manifestrile timpurii i cele ulterioare ale stngciei.
Exemple
Nu am nici un fel de jen n a aborda persoane necunoscute i mi vine uor s
intru n vorb cu persoane necunoscute sunt enunuri foarte similare, deoarece au
n vedere dimensiunea inhibiiei, definitorie pentru fobia social. Diferenele nu
sunt ns pe sensul principal al enunurilor, ci pe conotaiile rezultate din modul de
exprimare al ideii: n prima situaie propoziia ncepe negativ, n a doua afirmativ;
n prima cuvntul jen are i conotaii etice (fr ruine), ceea ce nu este cazul n
ceade a doua; n prima formulare a aborda este mai pretenios dect mai familiarul
a intra n vorb. Nu tim ns care dintre cele dou formulri este cea mai bun i
de aceea le putem include n forma iniial a scalei, urmnd s amnm decizia
legat de selecia celui mai bun item pn la prelucrarea datelor rezultate din
aplicarea instrumentului.
O regul spune c putem tolera o oarecare redundan n faza final de construcie a unei
scale, dei teoretic este permis mai mult redundan n faza iniial dect n cea final, pentru a
da ocazia constructorului scalei s-i manifeste preferinele i s selecteze forma mai bun a
itemilor redundani. Problema redundanei angajeaz direct o problem la fel de important, cea a
numrului de itemi care compun setul iniial. Se tie c un atribut fundamental al unei scale bune
este consistena intern ridicat, aceasta fiind dependent de dou lucruri: de gradul de corelare al
fiecrui item cu scorul final la constructul msurat i de numrul de itemi ai scalei. De aceea
putem afirma c, cu ct un set iniial de itemi este mai larg, cu att este mai bine, deoarece avem
de unde selecta. Trebuie tiut ns i faptul c un set iniial de itemi prea extins, dintre care muli
132
se repet, poate genera consumuri de timp suplimentare, sau chiar plictiseal, putnd compromite
sinceritatea i autenticitatea rspunsurilor. De aceea cercettorul poate elimina din start itemii
neclari, cu relevan sczut sau cu prea mult similaritate, pentru a rmne n final la un set iniial
rezonabil, pe care s-l aplice ntr-o singur edin, pentru a nu avea prea mult moarte
experimental.
Dei nu exist reguli fixe, paritatea dintre lotul iniial de itemi i cel final poate fi de de 4/1
sau 3/1 (30-40 de itemi iniiali pentru o scal de 10 itemi) sau, cel mai adesea de 2/1, atunci cnd
itemii sunt construii cu grij i cu o bun cunoatere a constructului msurat. Deoarece forma
iniial depinde de cea final, ct de lung trebuie s fie o scal pentru a avea caliti psihometrice
bune? Este un rspuns dificil de furnizat, deoarece fiecare item poate fi considerat ca o singur
scal i exist chiar scale alctuite dintr-un singur item.14 n mod obinuit, cu ct o scal are mai
muli itemi, cu att mai mult ea poate dispune de caliti psihometrice (fidelitate, validitate,
sensibilitate) mai bune; 50-60 de itemi pentru o scal unidimensional reprezint limita de sus, iar
10-20 de itemi limita de jos. Scalele sub 10 itemi pot fi utile instrumente de screening, dar nu
difereniaz dect grosier ntre subieci, pe cnd scalele lungi dau diferenieri de mai mare finee.
133
S ne reamintim...
Dei este foarte greu de fixat reguli precise dm mai jos cteva caracteristici ale
itemilor buni i ri, indicnd i cele mai frecvente erori care pot aprea n scrierea
acestora.
Dei nu este indicat s sacrificm nelesul itemilor n favoarea scurtimii lor se
recomand ca itemii s fie scuri i clari. Putem formula acelai item astfel: La
o petrecere rein cu uurin chipurile i numele musafirilor; mi trebuie destul
de mult timp i am adesea mari probleme n a memora de la prima ntlnire
numele sau chipurile invitailor la o petrecere mai mare. Al doilea enun este de
evitat pentru c este lung i neclar, pentru c introduce termenii destul de mult i
mai mare, care sunt vagi.
Nivelul de dificultate al citirii la care sunt scrii itemii este de asemenea
important. Iat doi itemi din Miller Marital Locus of Control: Adesea gsesc
comportamentul soului meu nepredictibil; Cnd suntem n conflict, soul meu
este acela care reconciliaz cel mai adesea situaia. Cuvintele nepredictibil i
reconciliaz in de un nivel mai ridicat de cultur, fiind pretenioase n raport cu
omul comun. Dei exist o mulime de metode de a determina vrsta lecturii, s-a
czut de acord c nivelul de lectur al omului care citete ziarul este
corespunztor clasei a asea (12 -13 ani). Multe chestionare de personalitate
(MMPI, CPI, NEO PI-R) presupun o vrst a lecturii tipic acestui nivel,
fenomen de care dac nu inem seama, reducem spectrul de utilizare al unui
instrument doar la anumite categorii de persoane. O propoziie de lungime medie
pentru clasa a asea are ntre 14 - 18 cuvinte i 24 de silabe; pentru clasa a aptea
ea are 18 cuvinte i 28 de silabe. Pentru majoritatea instrumentelor care aspir
spre o utilizare extensiv n populaie nivelul de lectur anticipat este ntre clasa
a cincea i a asea. Dificultatea citirii i nelegerii unui text provine nu numai
din lungimea sa, ci i din caracteristicile sintactice i semantice ale itemului.
Cele mai frecvente erori de evitat sunt negaia, dubla negaie i enunurile dublu
ncapsulate (cu dubl determinare). De exemplu formularea Nu-mi place s numi fac temele trebuie evitat, pentru c rspunsul solicit un efort de analiz
mare iar rezultatul final este nesigur. De fapt i negaia simpl creeaz probleme
de claritate: la itemul Nu-mi plac rromii rspunsul Nu poate s semnifice
simultan acordul (nu, nu-mi plac) sau dezacordul (nu sunt de acord cu propoziia
respectiv). Dubla determinare este mai greu de sesizat. M enerveaz la culme
invidia i dorina de rzbunare a oamenilor pune respondentul n dificultate
atunci cnd sursa enervrii sale este ori numai invidia, ori numai dorina de
rzbunare. Scorul pozitiv la acest item nu distinge dac prima, a doua sau ambele
determinri trebuie s fie prezente pentru a rspunde afirmativ la itemul
respectiv. Alt exemplu: Sprijin drepturile rromilor pentru c discriminarea este
un pcat pedepsit de Dumnezeu. Pot s sprijin drepturile rromilor pentru c
134
ceea ce permite nsumarea lor cu scoruri egale, rezultatul fiind chiar indexul. n sens foarte larg, o
scal este un set de numere ori de alte simboluri utilizate pentru a desemna caracteristici ale unei
variabile i care este utilizat pentru msurare. Numerele de pe un termometru sau cuvintele mic
mediu i mare de pe cutia de aer condiionat sunt scale. Vogt (1999, p. 256) distinge i un
neles mai special al cuvntului scal, care este ... un grup de msuri relaionate cu o variabil.
Itemii dintr-o scal sunt aranjai ntr-o anumit ordine a intensitii sau a importanei lor.16
a. Scalele Likert
Sunt cele mai larg utilizate n tiinele sociale pentru determinarea atitudinilor datorit
faptului c sunt uor de construit i tind s aib o mare fidelitate, ele fiind potrivite i pentru
construcute multidimensionale. Rspunsurile respondentului sunt gradate de la Puternic de acord,
De acord, Nici acord, nici dezacord, Dezacord, Dezacord puternic. Tipul de expresii verbale
pentru a msura intensitatea poate varia considerabil, subiecii putnd fi chestionai dac aprob n
totalitate, aprob parial, dezaprob uor, dezaprob n totalitate. Deoarece scalele Likert sunt
destinate opiniilor, atitudinilor i credinelor, apare o problem legat de alegerea rspunsurilor
potrivite pentru categoriile extreme, care nu trebuie s fie de genul ntotdeauna sau niciodat,
pentru c aceste situaii se ntlnesc destul de rar n viaa real. n consecin, ele vor fi alese ct
mai rar, pentru a nu contribui prin aceasta la descreterea variabilitii scorurilor pentru itemul
respectiv. De fapt, scalele Likert au o interesant caracteristic, rezultat din faptul c ele au dou
modaliti de a grada intensitatea constructului respectiv pentru populaia studiat. Una ine chiar
de modalitile de gradare a acordului/dezacordului din variantele de rspuns propuse, fapt de care
am vorbit deja; o a doua modalitate ine de tria/slbiciunea modului cum este exprimat itemul
nsui.
Exemplu
Opinia despre politicienii romni post-decembriti ar putea fi exprimat la trei
niveluri de trie (duritate):
1. Dezastrul moral i economic din Romnia post-revoluionar este integral opera
politicienilor incompeteni pe care i-am avut.
2. Neavnd o clas politic constituit n timp, liderii politici ai Romniei postrevoluionare au ntrziat reformarea economic i social a rii din cauza greelilor
provocate de lipsa lor de experien.
3. n pofida unor greeli cauzate de lipsa de experien, politicienii romni sunt pe cale
s construiasc o democraie real n Romnia post-revoluionar.
Cum tendina obinuit a majoritii oamenilor este aceea de nu fi din bun sim
prea ofensiv-agresivi, prima afirmaie ar putea discrimina doar printre cazurile
extreme, deoarece este una foarte tare. Ultima afirmaie, care este cea mai moale i
mai mpciuitorist, avnd un caracter mai agreabil, ar putea conveni majoritii
oamenilor, dar ar putea indica mai mult lipsa opiniei, dect prezena ei. Ori o
cercetare caut mai curnd ceea ce este i se manifest (prezena), dect ceea ce nu
este (absena).
136
Aadar, este o iluzie s credem c un item poate baleia ntreg spectrul unei opinii n uniti
de lungime egal. Avem doar posibilitatea ca, din combinarea triei/slbiciunii modului de
formulare a itemilor i din tipurile de gradaii de pe scala de rspuns folosit s centrm itemul
pentru zona populaional i pe problema care ne intereseaz. Itemul trebuie s rspund la
ntrebarea: Cum sunt dispui s rspund oamenii la diferitele intensiti sau trii ale
constructului msurat prin acest item?
Exemple
Prezentm mai jos dou exemple de itemi construii pe scala Likert.
Prin sistemul reformei de la Bologna, nvmntul romnesc s-a integrat bine n
nvmntul european.
1. Dezacord 2. Dezacord 3. Dezacord
4. Acord
5. Acord
6. Acord
puternic
moderat
uor
uor
moderat
puternic
Combaterea consumului de igri este o prioritate naional de vrf.
1. Complet
2. Mai curnd
3. Aa i aa
4. Mai curnd
adevrat
adevrat
neadevrat
5. Complet
neadevrat
b. Scalele Thurstone
Modalitate complex, rafinat i dificil de a construi itemii unei scale, iniiat de
Thurstone, acest tip de scal i-a pierdut mult din relevan n favoarea scalelor Likert. n principiu
elegana i dificultatea metodei vine din pre-calibrarea itemilor i asamblarea lor pentru a rspunde
la niveluri distincte de prezen n item a atributului sau a constructului msurat. De regul, n
acest tip de scal rspunsurile nu mai au o multitudine de nuane, deoarece gradarea intensitii
este pe vertical (mai muli itemi asamblai pe o aceeai coloan n funcie de mrimea progresiv
a atributului msurat), i nu pe orizontal (modaliti din ce n ce mai accentuate ale intensitii
sau frecvenei atributului la un singur item, tipic pentru scala Likert). Astfel, pentru aceeai idee se
genereaz mai muli itemi (care au formulri diferite) care s reprezinte intervale egale de-a lungul
unui continuum vertical, ceea ce confer scalei proprieti matematice remarcabile, pentru c se
preteaz la tratamente statistice tipice scalelor de interval. Nunaly (1978) susine c este
incomparabil mai uor s explici principul unei scale Thurstone dect s o construieti. A gsi
itemi care s rezoneze la intervale egale cu constructul msurat (ca un diapazon acordat pe o
anumit frecven) este destul de dificil. Acest deziderat exprimat de scalele Thurstone i-a gsit
totui o manier de rezolvare prin Teoria rspunsului la itemi, unde calibrarea acestora urmrete
totui un cu totul alt demers. Prezentm mai jos dou rspunsuri tipice pentru scala Thurstone.
Exemplul 1
1. Cnd un elev are dificulti de nvare, profesorii:
Adevrat
l insult
l critic sau ironizeaz
i ntrerup rspunsul
137
Fals
Nu au nici o reacie
i explic suplimentar
l ncurajeaz
Fac cu el pregtire dup ore
Exemplul 2
a. Faptul de a termina cu medie mare coala i de a prinde un liceu bun este tot ce-mi
doresc ca rsplat de la copilul meu.
Acord ........................ Dezacord ...........................
b. Pentru mine ca printe cea mai mare rsplat din partea copilului este s fie sntos i s
mearg la coal.
Acord ........................ Dezacord ..........................
c. Fericirea copilului meu nu are nimic de-a face cu ceea ce el dobndete prin educaia
colar.
Acord ........................ Dezacord ..........................
c. Scalele Guttman
Acestea sunt un tip de scal creat de Louis Guttman. Original ea a fost destinat s fie
utilizat dup ce datele au fost colectate, pentru a vedea dac itemii dintr-un index pot fi aranjai
ntr-o scal n funcie de tria sau de puterea lor.
Exemplu
ntr-o cercetare despre avorturi itemii unui chestionar pot fi aranjai ierarhic ca
intensitate astfel:
Ai fi de acord ca femeia s fac avort dac:
1. Ea nu mai dorete s aib copii.
2. Este prea srac pentru a se putea ocupa n mod adecvat de copil.
3. Ftul are o boal genetic grav sau este malformat.
4. A nu face avort ar periclita viaa proprie a femeii.
Scalele Guttman sunt foarte utile i indicate pentru informaiile obiective sau n situaiile n
care este logic necesar ca, dac ai rspuns afirmativ la un anumit nivel dintr-o ierahie, aceasta
nseamn s faci acelai lucru i pentru nivelurile inferioare ale ierarhiei.
Exemplu
De exemplu, la ntrebarea dac fumai, variantele de rspuns pot fi organizate
ierarhic astfel: nu fumez deloc; fumez sub 10 igri pe zi; fumez sub 20 de igri pe
zi; fumez sub 30 de igri pe zi; fumez mai mult de 30 de igri pe zi. Variantele de
rspuns sunt aranjate astfel c nivelul la care este prezent atributul este indicat de
cel mai de sus item la care subiectul a dat un rspuns afirmativ, cei de sub el fiind
i ei implicit afirmativi (deoarece reprezint niveluri mai sczute ale atributului).
Deci aceast scal presupune o gradaie i decelarea punctului critic n care rspunsul
afirmativ devine negativ. Dac pentru informaiile obiective scala Guttman este foarte indicat,
pentru alte categorii de fenomene este mai dificil de ordonat rspunsurile ntr-o manier uniform
pentru toi indivizii, fapt care limiteaz utilizarea acestui tip de scal. Pentru situaiile n care
ordonarea itemilor este important, modelele bazate pe teoria rspunsului la itemi par a oferi
soluii mai adecvate.
Exemplu
Prezent mai jos doi dintre itemii scalei de depresie Beck (BDI), asamblai pe o
scal Guttman.
A. TRISTEE
1. Nu m simt trist.
2. M simt trist.
3. Sunt trist tot timpul i nu pot scpa de tristee.
4. Sunt att de trist i de nefericit nct nu mai pot suporta.
B. PESIMISM
1. Viitorul nu m descurajeaz.
2. M simt descurajat cnd m gndesc la viitor.
3. Simt c nu am ce atepta de la viitor.
4. Simt c viitorul este fr speran i nimic nu se mai poate ndrepta.
deoarece este strns legat de oscilaiile reale ale prezenei constructului msurat n item, i dintr-o
parte rea, numit eroare. Deoarece cretarea variabilitii pe scalele cu numr mare de variante de
rspuns se face n contul erorii, i nu al variabilitii sistematice, nu este indicat s avem prea
multe valori de scor. Numrul acestora este impus finalmente de abilitatea respondenilor de a
discrimina semnificativ ntre variantele de scor propuse pentru fiecare item. Aceast capacitate
depinde i de aranjarea n pagin a variantelor de rspuns asfel nct acestea s sugereze un
continuum.
Exemplu
Astfel secvena de mai jos sugereaz bine un continuu temporal, divizat n uniti
discrete de tipul frecvenei de apariie.
Aproape niciodat
Rareori
Deseori
Aproape mereu
O problem important este dac optm pentru un numr impar de categorii de rspuns,
ceea ce n principiu este bine, pentru c se creeaz o anumit simetrie n jurul unui punct zero
natural. Acest fapt ofer ns de multe ori indeciilor posibilitatea refugierii n rspunsul evaziv
din mijloc. Numrul par sau impar de opiuni este mai puin important dect modul cum sunt
aranjate variantele de rspuns astfel ca distanele dintre ele s fie aproximativ egale pentru a
exprima gradul de acord sau de dezacord. Aceasta pentru c datele vor fi codificate numeric prin
cifre (1, 2, 3, 4, 5 pentru cinci variante de rspuns, de la foarte puin sau deloc, la foarte mult sau
n ntregime, ori invers 7, 6, 5, 4, 3, 2, 1 pentru o scal care ncepe de exemplu cu totdeauna i se
termin cu niciodat). Se poate construi astfel un continuum divizat ntr-un numr de trepte (3-7
trepte), de la dezacordul total, la acordul deplin sau invers.
n legtur cu punctul de simetrie din mijloc, el poate avea semnificaii diferite. Astfel nici
acord, nici dezacord indic mai curnd o atitudine apatic, pe cnd la fel de mult acord i
dezacord sugereaz o atracie egal fa de ambele variante de rspuns. Deci, n cazul numrului
impar de variante de rspuns trebuie s controlm ca subiectul s nu selecteze varianta neutr doar
pentru a evita o alegere, oferind astfel un rspuns echivoc, cu o valoare discutabil. n majoritatea
situaiilor cercettorul ncearc s evite echivocul punctului central i s foreze o alegere clar,
dar trebuie spus c opiunea pentru variante pare/impare de rspuns este funcie de ntrebare, de
rspus i de scopul investigaiei. ntr-o cercetare cu dou variante extreme de rspuns (ce situaii
preferi: pe cele plicticoase?; pe cele primejdioase?) introducerea variantei de rspuns ntre cele
dou poate fi pe deplin justificat, subiecii neputnd alege ntotdeauna ntre situaii att de
tranant delimitate.
Ca tip de format al rspunsurilor amintim i diferenialul semantic al lui Osgood i
Tannenbaum (1955). Utilizat n studierea atitudinilor de grup, acest mod de scalare presupune
identificarea unui grup ce este studiat (s zicem avocai) i a unei liste de perechi de adjective.
Exemplu
Onest
Competent
Vorbre
__ __ __ __ __ __ __ __ __ Neonest
__ __ __ __ __ __ __ __ __ Incompetent
__ __ __ __ __ __ __ __ __ Taciturn
141
Liniuele (de regul 7 sau 9) reconstituie un continuu ntre polii definii de cele dou
adjective, subiectul marcnd cu un X punctul de pe acest continuu pe care el crede c se afl
membrii categoriei respective, dup care trece la ratingul urmtoarei perechi de adjective, pn la
epuizarea ntregii liste. Prin prelucrarea separat pe fiecare pereche de adjective se poate obine un
portret robot al grupului respectiv. Deoarece acest tip de scal are foarte multe din caracteristicile
necesare unor prelucrri matematice riguroase, finalmente itemii valoroi care au fost selectai pot
fi asamblai ntr-o scal omogen (de onestitate, de competen, de moralitate etc.).
Dei pare seductor, acest tip de scal are destul de multe dezavantaje. De multe ori
precizia sa este o fals precizie, marcarea punctului pe linie implicnd i o doz de hazard sau de
circumstanialitate. Un subiect va distinge cu greu ntre o fric de 6,7 cm de una de 6,5 cm. Mai
mult, asignarea valorilor scalei poate fi una idiosincratic, adic distanele marcate s aib
semnificaii diferite de la un subiect la altul sau la acelai subiect la perioade de timp diferite.
i totui, aceasta poate fi un tip de msurare foarte util atunci cnd cercetrile se fac pe
acelai subiect pentru a msura diferenele pe care tratamentul experimental le poate aduce n
tratarea fobiilor, n creterea nivelului de motivaie sau n alte direcii. Astfel, dac scala Likert
mparte un continuu ntr-un numr finit i mic de categorii, fiind foarte maniabil, dar mai puin
sensibil, scala analogului vizual poate fi sensibil la diferene mici: dac rspunsurile la postmanipulare se deprteaz semnificativ i n aceeai direcie n raport cu faza de pre-manipulare, se
pot detecta diferenele mici pe care le-a adus tratamentul experimental. Scala poate fi folosit i ca
una alctuit dintr-un singur item, caz n care nu se mai poate distinge cu claritate ntre
instabilitatea msurtorii i instabilitatea fenomenului msurat. Prin urmare, cea mai bun strategie
ar fi aceea de a dezvolta mai multe msurtorii de tipul analogului vizual pentru acelai fenomen,
de a le asambla ntr-o scal i de a-i determina consistena intern (stabilitatea).
O ultim problem este cea legat de cadrul temporal la care pot face sau nu referire
itemii unei scale. Prelund distincia pe care a fcut-o Cattell n legtur cu unele dispoziii de
personalitate care au un caracter situaional, n timp ce altele reprezint structuri stabile de
personalitate numite trsturi, Spielberger a dezvoltat scala STAI, n fapt o msur a anxietii ca
stare (conjunctural) i ca trstur de personalitate (stabil). Se tie de asemenea c multe
componente ale personalitii au mai mult sau mai puin stabilitate pe axa timpului:
142
fenomenologia afectiv de exemplu (emoie, anxietate, depresie) este mai fluctuant dect cea
cognitiv (inteligen, memorie).
O scal trebuie s fac referine i la dimensiunea temporal? Rspunsul este nuanat:
dac constructul msurat are o variabilitate temporal mare rspunsul este Da, dac el este stabil n
timp (cazul trsturilor de personalitate) rspunsul este Nu. Astfel, chestionarul de depresie Burns
se aplic periodic pacienilor depresivi pentru a monitoriza evoluia depresiei lor n timp. Multe
chestionare care urmresc aspecte fluctuante menioneaz n instructaj formule de tipul n ultima
lun, n ultima sptmn, n ultimele zile, n ultimul timp etc. Unele chestionare includ itemi
destinai detectrii modificrilor de dispoziie aprute recent (un eveniment stresant) sau pe
perioade mai lungi de timp (reforma post-revoluie, intrarea rii n NATO etc.). Chiar formatul de
rspuns al itemilor poate avea n vedere decuparea continuumului temporal n uniti mai mici
(uneori, din cnd n cnd, des, n ultimul timp etc.).
nainte de a supune judecii experilor forma preliminar a unei scale, constructorul
trebuie s aib n vedere dac include sau nu i scale de validare, care s diminueze sau s
controleze tendina respondenilor la dezirabilitate social sau la fraud.
Exemple
Sandra Bem (BSRI, 1976), a inclus o scal de dezirabilitate social ca tampon
ntre itemii care msoar masculinitatea i cei care msoar feminitatea. Eysenck
a inclus n EPI (Eysenck Personality Inventory) o scal de minciun, devenit
ulterior o scal de dezirabilitate social n EPQ (Eysenck Personality
Questionnaire).
n forma veche, dar i n cea revizuit a MMPI (Minnesota Multiphasic
Personality Inventory) Hathaway i McKinley au propus mai multe scale de
validare, care sunt primele ce vor fi evaluate de psiholog pentru a determina de
ct credit se poate bucura profilul unui respondent. Problema validrii se poate
rezolva fie construind scale anume destinate acestui scop, fie prelund unele deja
existente pentru a le insera n chestionar pe post de distractor i de mijloc de
control.
rezolv problema unui item. Este posibil ca el s fie corelat pozitiv cu unii dintre itemi i negativ
cu alii, deoarece el poate fi expresie a unui alt construct. n acest caz soluia potrivit este
eliminarea itemului respectiv, pentru a nu periclita omogenitatea de ansamblu a scalei.
b. Corelaia item-scal
n SPSS procedeul de lucru pentru acest tip de analiz este relativ simplu, deoarece se
urmeaz urmtoarea secven: AnalyseScaleReliabilityAlfaStatistics, de unde se
activeaz Item, Scale; Scale if item deleted (scala, dac itemul ar fi nlturat).
146
Item-total Statistics
Scale
Scale
Corrected
Mean
Variance
ItemAlfa
if Item
if Item
Total
if Item
Deleted
Deleted
Correlation Deleted
CEDA001
28.7500
133.4788
.2944
.8785
CEDA002
28.7167
133.4607
.2712
.8787
CEDA003
28.7833
135.0879
.1149
.8799
CEDA004
28.5167
133.4065
.2128
.8793
CEDA005
28.7333
133.1141
.3231
.8782
CEDA006
28.3667
136.6429
-.0713
.8825
CEDA007
28.5500
132.9975
.2550
.8788
CEDA008
28.5833
132.4845
.3105
.8782
CEDA009
28.4333
132.6226
.2746
.8786
CEDA010
28.7500
131.9534
.4804
.8770
................................................
Reliability Coefficients
N of Cases = 165
N of Items = 112
Alfa = .8800
Fiecare dintre fragmentele de output de mai sus trebuie examinate cu mare atenie. Primul
element investigat este variana itemilor, pentru c de aceasta depinde finalmente variabilitatea
ntregii scale. Dac toi indivizii investigai ar rspunde doar ntr-un singur fel la un item, variana
(variabilitatea) sa ar fi zero, el nefiind de nici un folos n surprinderea constructului de msurat.
Cum unii subieci rspund ntr-un fel, iar alii n altul, fiecare item are variabiliti mai mari sau
mai mici: cei mai dezirabili sunt cei cu variabilitate mare. n cazul de mai sus, itemii cu cea mai
mare variabilitate sunt n ordine 6, 9, 4, 7 i 8, care au o abatere standard n jur de 0,50.
Experiena statistic ne arat c este mai bine s nu examinm abaterea standard separat,
fcnd abstracie de medie. n principiu, cu ct aceasta este mai apropiat de centrul intervalului
de rspuns, cu att este mai bine, pentru c ea va face posibil mai mult variabilitate a itemului.
n condiiile n care la stnga au fost plasai descriptorii pentru dezacord i la dreapta pentru acord,
dac media este asimetric spre dreapta (negativ) nseamn c majoritatea respondenilor au inut
s fie de acord cu coninutul itemului respectiv, deci el a fost formulat moale; dac asimetria
este spre stnga (pozitiv) nseamn c majoritatea i-a exprimat dezacordul cu coninutul itemului
(formulare sa a fost cam tare).
n cazurile de asimetrie se tie de asemenea faptul c puterea discriminativ a itemului este
mai mare pe coada (creoda) curbei gaussiene i mai mic pe ramura sa mai scurt. Cum o
distribuie simetric (cu media pe centrul seriei de variaie) are dou cozi lungi, nseamn c
puterea discriminativ a unui item de acest fel este maxim, el putnd distinge la fel de bine n
ambele direcii. n cazul nostru, deoarece numrul itemilor destinai depistrii dezordinilor
alimentare a fost foarte mare 112 am folosit scorarea dihotomic, deci valoarea medie optim
147
ar trebui s cad la jumtatea intervalului 0 1, adic n jurul lui 0,50, ceea ce se ntmpl doar
pentru itemii 6 i 9.19 Verificarea simultan a mediei i abaterii standard este o condiie prealabil
obligatorie pentru o tentativ de selecie a itemilor care se bazeaz n principal pe corelaie. Din
aceast analiz reiese c, la prima vedere, itemii 7 i 9 au simultan cele mai bune variane i valori
medii.
Decizia final se ia ns dup ce se analizeaz atent datele din panoul Item-total Statistics
care are urmtoarea structur: primele dou coloane dau valorile medii i abaterile standard pentru
valorile totale ale scalei, n situaia n care itemul nu particip la scorul total. Pentru scalele cu
numr mare de itemi corecia adus la parametrii scalei prin absena unei singure valori de scor
este neglijabil, dar ea devine cu att mai important cu ct numrul itemilor scalei este mai mic,
fiind important de exemplu pentru scala de 10 itemi. Coloana Corrected Item-Total
Correlation este de maxim importan n luarea deciziei de selecie deoarece ea indic gradul de
asociere a fiecrui item cu scorul total, adic saturaia sa n variabila latent msurat. n cazul
nostru itemul 10 are o corelaie excelent cu scala (.48), n timp ce itemii 3, 4 i mai ales 6 au
corelaii slabe (itemul 6 chiar negativ) cu scorul total.
Dac scala noastr ar fi unidimensional (adic ar msura doar un singur construct i nu
mai multe) o valoare a corelaiei item-scal n jur de .30 ar fi suficient pentru includerea itemului
n scal, iar una de .40 aproape c ne foreaz s facem acest lucru. Aici este cazul s spunem c
nu ne vom concentra atenia doar pe numerele de cod ale itemilor, fapt care ne mpiedic s tim
care este coninutul lor. Cu foaia de test n mn, dup ce am identificat itemii cu formulri foarte
asemntoare (redundani), lum n cunotin de cauz decizia de a-i pstra pe cei cu calitile
psihometrice cele mai bune i de a-i elimina pe cei mai slabi.
Ultima coloan are de asemenea un rol important n luarea deciziei relative la selecia
itemilor deoarece ne indic ct ar fi fost coeficientul de consisten intern alfa dac itemul
analizat ar fi fost eliminat. Prin compararea cu scorul de referin al acestui coeficient (.88 pentru
toat scala iniial, adic foarte mare) putem vedea dac absena itemului amelioreaz valoarea lui
alfa (caz n care el trebuie eliminat) sau dimpotriv, o scade (semn c este unul util). n cazul
nostru itemul 6 este sigur unul condamnat, deoarece el d o corelaie uor negativ cu scala i nu
este consistent cu aceasta (absena lui din scal l mrete pe alfa).
i totui nu suntem nc n msur s lum decizia final pentru c nu am rspuns clar la
ntrebarea fundamental dac itemii testului msoar sau bat n direcia unei singure variabile
(scal unidimensional) sau a mai multora (scal multidimensional, neomogen). Supoziia
implicit pentru indicele de consisten intern alfa al lui Cronbach este aceea c toi itemii
msoar o singur variabil latent, fapt ce nu este dat prin definiie, ci trebuie atent verificat.
deoarece cnd este desfurat pe prea puine cazuri, ea poate s dea valori instabile, ce
compromit uneori iremediabil ntregul proces de construcie a scalei. S reinem deci c, n aceast
faz de construcie a scalei, determinarea prin analiz factorial a variabilei latente care st n
spatele unui set de itemi este un fapt crucial.
Mergnd mai departe cu exerciiul nostru prezentm secvena de lucru pentru a efectua
analiza factorial exploratorie: AnalyseDataReductionFactor, care produce deschiderea
urmtoarei fereastre de lucru, n care vom introduce (prima fereastr, panoul din dreapta-sus) toate
datele de analizat, adic toi itemii chestionarului nostru.
Pentru un numr aa de mare de itemi nu vom efectua nici o rotaie (butonul din mijloc de
la figura din stnga de mai sus), dar de la Options putem s selectm Supress absolute values
less than: (suprimarea valorilor mai mici dect:) pentru a pune valoarea de .30 n ferestruica
respectiv, care are din setare valoarea .10, dar neactivat (vezi fereastra din dreapta-jos). n felul
acesta valorile ce indic saturaii mici i nesemnificative n factorii descoperii nu vor mai fi
afiai, fapt ce uureaz inspecia vizual, selecia i luarea deciziilor.
Trebuie precizat c metoda componentelor principale care este opiunea de baz a
programului este util mai ales pentru a vedea dac exist un factor general (cu o varian mai
mare de 50%) ce definete variabil latent, sau dac nu cumva exist mai muli factori de
magnitudine mai mic, ce acoper ntreaga varian a scorurilor scalei studiate. Vom putea vedea
deci dac avem de-a face cu o scal uni- sau multi-dimensional.
Atragem de asemenea atenia asupra faptului c dac o singur variabil inclus n panoul
de lucru are variana zero, analiza factorial nu mai poate fi efectuat. Deoarece acesta este i
cazul chestionarului nostru, identificm variabila sau variabilele cu varian zero prin Frequencies
ori Descriptives. n cazul nostru itemul 66 trebuie eliminat din analiz (i din scal deoarece,
avnd variana zero, el nu are nici o utilitate), dup care relum analiza factorial. Aceasta va
produce mai multe output-uri, din care dou sunt eseniale.
149
Outputul de mai sus indic faptul c itemii iniiali nu produc un singur factor general, ci
cteva zeci (fapt curent n construcia de scale cu numr mare de itemi), din care primul acoper
doar 13,36% din varian (deci este foarte departe de a fi un factor general), al doilea 8,21%, al
treilea 4,96% etc. Chiar i al aisprezecelea factor produce o valoare eigen peste 2 (2,08%), ceea
ce poate prea un adevrat comar statistic. Lucrurile nu stau ns chiar aa. Dac analizm cu
atenie outputul al doilea din figura 1.4, observm c acesta devine o adevrat gril de selecie
pentru factorii mai importani care vor fi reinui. Astfel, itemii vor fi alocai la acei factori pentru
care ei au cele mai mari corelaii (saturaii n factorul respectiv). Atunci cnd se poate, itemii cu
saturaii negative se aloc la factorul cu care coreleaz pozitiv mai semnificativ, pentru a nu
schimba maniera de scorare; la valori foarte apropiate ale saturaiilor, un item se aloc scalei mai
scurte pentru a o fortifica, deoarece tim c puterea unei scale depinde i de numrul itemilor care
o compun. Se observ c, dup ce ncep s fie alocai la primii trei factori, mai rmn foarte puini
itemi sau deloc pentru factorii urmtori, i aceast deoarece muli itemi i mpart variana ntre
mai muli factori (nu sunt foarte specifici). Alocnd itemii factorului pentru care ei au cea mai
mare saturaie, celorlali factori le rmn tot mai puini itemi, aceasta deoarece primii factori dau
corelaii mai mari cu itemii, avnd deci prioritate n selecia acestora. De fapt afiarea n tabel a
factorilor de la stnga la dreapta se face n ordinea magnitudii lor, dat de mrimea corelaiilor cu
itemii, dar i de numrul acestor corelaii. Itemii care nu se repartizeaz n primele 3-4 categorii
vor putea defini i ei nite factori de magnitudine mai redus, dar reunindu-i n scale i studiind
alfa pentru acestea vom observa c i consistena intern este din ce n ce mai mic pentru factorii
extrai ultimii.
150
Figura U3.5. Output al analizei factoriale indicnd factorii selecionai i valorile lor eigen.
Cum o scal trebuie s aib o consisten intern de peste .70 (aceasta fiind foarte bun
peste .80 i excelent peste .90) scalele mici neatingnd aceste valori trebuie n principiu
abandonate, pentru c ele sunt expresia unor construncte ce au o valoare ndoielnic. n cazul de
mai sus, itemii 5, 7, 8, 10, 13, 16, 17, 20, 21, 22 etc. vor fi alocai primei scale; itemii 3, 9, 19 etc.
celei de a doua, iar itemii 15, 24, 43 etc. celei de a treia. O atenie special impune itemul 3, care
poate fi distribuit i la factorul 2 i la 3 (decizia o lum ulterior, cnd evalum care dintre cele
dou subscale are mai mare nevoie de el) sau la itemul 22, care coreleaz semnificativ i cu
factorul 1 (pozitiv) i cu factorul 3 (negativ). n aceste situaii se observ ct de important este
mrimea lotului pentru luarea unei decizii corecte, bazat pe analiza factorial.
Hotrrea de a aloca itemii ntr-o scal sau alta poate fi irevocabil, chiar dac datele
ulterioare nu confirm deciziile noastre de acum. Prin mrirea semnificativ a numrului de
subieci, soluia factorial poate s aduc o mulime de diferene, ceea ce relanseaz practic ntreg
procesul de reconstrucie a scalei. Din aceast cauz vom cuta s lum decizii importante i
definitive doar dac eantionul pe care s-a efectuat analiza factorial este unul sufiucient de mare
i de reprezentativ. Finalmente, scala desemnnd factorul 1 arat ca n figura de mai jos.
R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)
Mean
Std Dev Cases
1. CEDA005
.2000
.4031
65.0
2. CEDA007
.3231
.4713
65.0
3. CEDA008
.3231
.4713
65.0
4. CEDA010
.1538
.3636
65.0
5. CEDA013
.4154
.4966
65.0
6. CEDA016
.5385
.5024
65.0
7. CEDA017
.4154
.4966
65.0
8. CEDA020
.1231
.3311
65.0
9. CEDA021
.4462
.5010
65.0
10. CEDA022
.3385
.4769
65.0
Statistics for
Mean Variance Std Dev N of Variables
SCALE
11.9846 86.4841 9.2997
50
151
Item-total Statistics
Scale
Scale
Corrected
Mean
Variance ItemAlfa
if Item
if Item
Total
if Item
Deleted Deleted Correlation Deleted
CEDA005
11.7846
84.0154
.3121
.9203
CEDA007
11.6615
83.3212
.3418
.9202
CEDA008
11.6615
83.4462
.3270
.9204
CEDA010
11.8308
83.3928
.4456
.9192
CEDA013
11.5692
81.3115
.5500
.9180
CEDA016
11.4462
82.5635
.4018
.9197
CEDA017
11.5692
81.7178
.5034
.9185
CEDA020
11.8615
83.4337
.4862
.9190
CEDA021
11.5385
83.8149
.3636
.9202
CEDA022
11.6462
83.1385
.3586
.9201
......................................................................................................................................................................
Reliability Coefficients
N of Cases = 165.0
N of Items = 50
..
Figura U3.6. Unul dintre outputurile analizei factoriale
indicnd factorii selecionai i valorile lor eigen.
152
Nu putem omite o ntrebare legitim: ct de mic trebuie s fie pragul corelaiei item-scal
pentru a reine un item n scal? Rspunsul depinde i de inteniile autorului: dorete el o scal
scurt i relativ puternic, sau o scal mai lung, dar care d mai multe nuane, fiind mai stabil i
mai fidel? n primul caz pragul de selecie este mai ridicat (n principiu peste r = .40), n al doilea
ceva mai sczut (dar rareori sub r = .30).
153
Efectul eliminrii sau includerii unor itemi n scal trebuie i el bine tiut. Dac cunoatem
corelaia medie a scalei rezultate putem aplica o formul care ne ajut s anticipm care va fi
efectul adugrii sau eliminrii unui item. Aceast formul este:
N r
alpha =
1 + ( N 1) r
n care N este numrul de itemi i r corelaia medie inter-itemi. Putem astfel determina ce se
ntmpl dac la o scal cu corelaia iter-itemi de .30 adugm sau scoatem un item: alfa =
[10.30]/[1+9.30] = .81 pentru 10 itemi; alfa = [11.30]/[1+10.30] = .83 pentru 11 itemi; alfa =
[9.30]/[1+8.30] = .79 pentru 9 itemi. Vedem c diferena de doar doi itemi ridic consistena
intern de la .79 la. 83, ceea ce este important. n general, dac corelaia inter-itemi a unui item
este egal sau cu puin sub corelaia inter-itemi medie, pstrarea itemului n scal are un efect de
cretere a lui alfa; cnd aceast corelaie este mult sub medie, ea poate s duc la descreterea lui
alfa i deci itemul ru trebuie eliminat.
O soluie interesant pentru a verifica stabilitatea caracteristicilor unei scale este propus
de DeVellis (2003, pp. 99-100), ea constnd n splitarea lotului. Cnd lotul este unul suficient de
mare el poate fi mprit n jumti. Cnd lotul nu este suficient de mare, mprirea se poate face
n pri inegale, partea cea mai mare fiind rezervat pentru determinrile principale, pe cnd cea de
a doua pentru verificarea constanei rezultatelor gsite. Deci prima parte din lot folosete la
evaluarea i selecia itemilor, la construcia scalelor i la determinarea lui alfa pentru fiecare
subscal; cea de a doua parte este util pentru replicarea datelor i pentru a verifica dac ele se
regsesc pe un lot foarte similar. Avantajele acestei metode care oblig din start la abordarea
unui numr mare de subieci, de peste 500-600 de persoane sunt nsemnate. n primul rnd
mprirea se poate face aleatoriu, ceea ce asigur echivalena grupurilor, randomizarea genernd
dou eantioane echivalente. Dac acestea ar fi abordate n dou momente temporale diferite
exist probabilitatea ca factorul timp s aduc modificri (fie i discrete) la cel de al doilea grup,
sau ca el s difere prin alte caracteristici de primul grup. Apoi, un nou grup presupune expunerea
subiecilor la alt personal de cercetare, n alt perioad a anului, cu instrumente care pot diferi uor
de primele (forma iniial i forma definitiv a scalei), ceea ce poate introduce alte distorsiuni
nedorite. Dar cel mai nsemnat avantaj al splitrii grupului original este acela c la ambele
subgrupuri vom avea forma original a instrumentului, ceea ce permite revenirea la decizia
eliminrii unor itemi dac grupul de control indic necesitatea schimbrii acestei decizii. Dac
pentru primul grup, cel pe care s-a fcut selecia itemilor, exist posibilitatea ca factori de ans s
fie confundai cu covariaia itemilor, la al doilea unde itemii sunt deja selectai o asemenea
posibilitate nu mai exist. Finalmente, prin reunirea celor dou grupuri n unul singur se obin
caracteristici psihometrice mai sigure i mai aproape de realitate dect pentru fiecare grup luat
separat.
creat surprinde sau nu cu adevrat estena constructului cutat, pentru aceasta trebuind
desfurate nenumrate studii de validare, pentru oricare nou extensie legat de utilizarea scalei.
Chiar fidelitatea presupune determinarea prin test-retest a stabilitii n timp a rezultatelor
obinute, corelaia dintre o form a testului i forma sa paralel etc. Cum fidelitatea este cea mai
important precondiie a validitii, trebuie spus c programul SPSS ofer alturi de alfa i
posibilitatea determinrii fidelitii prin metoda jumtirii (split-half).
Demersurile necesare acestui tip de analiz sunt foarte asemnroare cu cele presupuse de
determinarea lui alfa (AnalyseScaleReliabilitySplit-halfStatistics), doar c de la
Statistics acum se dezactiveaz Descriptives for (Item, Scale, Scale if item deleted), deja
determinate anterior.
Output-ul acestei serii de comenzi este un indicator al consistenei interne care ia n calcul
o jumtate a testului comparat cu cealalt, prin dou metode: cea a lui Spearman-Brown i cea a
lui Guttman. Echivalena jumtilor se stabilete i prin compararea coeficientului alfa pentru
fiecare jumtate n parte. Cele dou jumti comparate sunt luate de computer ca atare, dar dac
vrem s determinm split-half pentru numerele pare i cele impare, introducem n panoul de lucru
nti itemii pari, apoi pe cei pari, dm OK i vom obine analiza dorit.
Exemplu
R E L I A B I L I T Y A N A L Y S I S - S C A L E (S P L I T)
Reliability Coefficients
N of Cases = 165
N of Items = 112
Correlation between forms = .80
Equal-length Spearman-Brown = .89
Guttman Split-half = .89
Unequal-length Spearman-Brown = .89
56 Items in part 1
56 Items in part 2
Alfa for part 1 = .85
Alfa for part 2 = .87
Corelaiile obinute prin splitare sunt identice prin cele dou metode (.89) iar
valorile alfa pentru prima parte (.85) i pentru cea de a doua (.87) sunt extrem de
asemntoare, de unde deducem c exist o foarte bun consisten intern pentru
fiecare jumtate a testului.20
155
Procesul de construciei a unei scale nu se oprete aici. Destinul acesteia depinde doar parial de
calitile psihometrice identificarte preliminar i mai mult de utilitatea ei real, de posibilitatea
implicrii ei ntr-o multitudine de aplicaii practice sau de cercetri. Cel mai adesea validitatea este
cea care impune n timp o scal ce poate fi probat ntr-o multitudine de maniere.
Exemplu
Prezentm matricea de intercorelaii dintre cei trei factori rezultai pentru Scala de
tulburri alimentare i cele trei categorii de mecanisme de aprare decelate de
DSQ (The Defense Style Questionnaire) creat de Andrews, Singh i Bond.
FACTOR1 FACTOR2 FACTOR3 DSQ Mec.
mature
FACTOR1
FACTOR2
.38**
FACTOR3
.32**
.28**
DSQ Mec. mature
-.09
.16
.01
.23*
.10
.18
.19*
DSQ Mec. nevrotice
DSQ Mec. imature
.51**
.31**
.29**
.21*
DSQ Mec.
nevrotice
.53**
Din tabelul de mai sus rezult c factorul 1 se valideaz la un nivel foarte ridicat
prin corelare cu mecanismele de aprare imature (r = .53) i la un nivel mai sczut
cu cele nevrotice (r = .23). Aceasta atrage atenia asupra faptului c factorul 1 are
un coninut negativ i c ar trebui s se numeasc Stim de sine negativ legat de
aspectul fizic. Factorii 2 i 3 se valideaz i ei concurent cu mecanismele de
aprare imature, dar la niveluri mai sczute (r = .31, respectiv r = .29). Evident c
aceast prim confirmare are nevoie de o mulime de alte studii, dar aceasta
presupune ca instrumentul s fie publicat i lansat pentru a-i ndeplini rolurile
pentru care el a fost proiectat.
U3.6. Rezumat
Construcia scalelor psihologice se sprijin pe un algoritm complex care poate fi
rezumat la urmtoarea secven: determinarea a ceea ce se dorete s se msoare
generarea setului iniial (mare) de itemi determinarea tipului de format al
msurtorii revizia setului iniial de itemi de ctre experi administrarea
setului iniial de itemi selecia itemilor pentru forma final a scalei
rafinarea ulterioar a scalei.
n fazele preliminare de construcie recursul la teorie este esenial.
n fazele finale recursul la procedee avansate de prelucrare este esenial.
Partea cea mai creativ a crerii unei scale ine de identificarea unui construct
valid i de generarea setului iniial de itemi, dar valoarea scalei ine de
respectarea unor constrngeri de ordin tehnic: scrierea corect a itemilor, selecia
tipului de scal de msur care este adecvat, recursul la sfatul experilor etc.
156
U3.7. Evaluare
Proiect aplicativ:
Construirea unui chestionar pentru o trstur de personalitate
Deoarece o parte nsemnat din nota final depinde de acest proiect, cealalt
depinznd de activitatea de seminar i ultima de nota de la examenul final, indicm
mai jos paii care trebuie urmai pentru realizarea sa:
vei citi cu atenie lista de la sfritul paragrafului de fa i vei alege o
trstur de personalitate, de preferin una care v intereseaz personal;
vei efectua un studiu bibliografic detaliat pentru a putea identifica i defini
detaliat trstura/dimensiunea de personalitate aleas (aceasta este faza de
documentare);
folosind
metoda
intuitiv-raional
vei
operaionaliza
aceast
trstur/dimensiune aleas sub forma unui numr de itemi cuprins ntre 20 i
50. n construcia itemilor vei ine cont de toate precizrile din cursul de fa
legate de caracteristicile de form, lungime, coninut i cele semantice;
chestionarul astfel obinut va fi aplicat ntr-un studiu-pilot pe un numr de
minimum 30 de subieci. Dac optai pentru strategia grupurilor-criteriu
(metoda empiric), acestea vor avea minimum 20 de subieci fiecare;
utiliznd cunotinele de la cursul Bazele teoretice ale psihodiagnosticului vei
efectua analiza itemilor (grad de discriminare, curb caracteristic sau
semnificaia statistic a diferenei dintre grupurile de contrast) i vei reine n
forma intermediar redus a chestionarului itemii cu caracteristicile
psihometrice cele mai bune. Pentru aceast form a chestionarului vei urma
procedura descris n curs i vei face analiza consistenei interne a scalei (din
SPSS AnalyseScaleAlfa Cronbach i apoi Split-half);
vei redacta forma final a chestionarului;
opional, valoarea proiectului va fi considerat mai bun i va primi punctaj
superior dac vei corela produsul obinut de voi cu un instrument despre care se
tie c msoar acelai construct, pentru a proba validitatea concurent a
chestionarului vostru.
Not: datorit complexitii cerinei formulate v putei asocia cte doi sau trei
studeni pentru un singur proiect, caz n care numrul va crete cu cte 30 de cazuri
pentru fiecare. Nota la proiect va fi identic pentru ambii autori, dei ei i pot
mpri dup dorin atribuiile ntre faza de documentare i cea de
aplicare/prelucrare a datelor. n cazul asocierii a trei studeni ultimul aspect
(validarea concurent a chestionarului nou creat contra unui instrument deja
consacrat) devine obligatorie. Produsul finit (chestionarul mpreun cu o lucrare de
prezentare a fazelor proiectului, de 3-4 pagini maximum 2000 de cuvinte n
TNR 12, pe hartie A4) va fi nsoit de o dischet sau CD cu baza de date i
prelucrrile aferente. Data predrii proiectului este n ziua examenului.
157
159
__________________________________________________________________
Modulul M3. Unitatea de nvare 4
RAPORTUL PSIHOLOGIC
__________________________________________________________________
Cuprins
U4.1. Introducere ........................................................................................................... 160
U4.2. Competene .......................................................................................................... 160
U4.3. Idei de baz pentru ntocmirea unui raport psihologic ......................................... 161
U4.4. Activiti propuse ................................................................................................. 162
U4.4.1. ntocmirea unui raport de examinare psihologic ...... 162
U4.4.5. Structura raportului psihologic ............................................................... 161
I. Datele factuale i de identificare a subiectului ..................................... 163
II. Scopul evalurii psihologice (ntrebarea de referin) ........ 164
III. Testele administrate i rezultatele obinute (note brute i standard).. 165
IV. Anamneza sau istoria personal a cazului ......................................... 165
V. Observaiile relevante din timpul examinrii ...................................... 166
VI Interpretarea rezultatelor .................................................................... 167
VII. Sumarizarea concluziilor .................................................................. 168
VIII. Recomandri .................................................................................... 169
U4.5. Rezumat ................................................................................................................ 169
U4.6.Test de evaluare a cunotinelor ............................................................................ 169
U4.7. Lecturi recomandate pentru acest curs ..... 170
U4.1. Introducere
Raportul psihologic este expresia condensat a activitii de testare/evaluare
psihologic a unei persoane (client, consumator de servicii etc.) de ctre un
psiholog calificat care rspunde cu instrumentele tiinei sale scopului pentru care
a fost desfurat investigaia, n termeni profesioniti, dar i accesibili celui care a
comandat-o.
U4.2. Competene
Dup parcurgerea acestei uniti cursanii vor fi capabili:
s cunoasc elementele de coninut ale celor opt capitole ce intr n structura
raportului psihologic;
s fac diferenele care se impun ntre fia psihologic (care sintetizeaz cifric
datele clientului) i raportul psihologic, care insist pe interpretarea narativ a
rezulzatelor;
pentru fiecare dintre cele opt capitole din structura raportului psihologic s
poat opera definirea, indica funciile, selecta elementele necesare realizrii
corecte i evitrii erorilor celor mai probabile;
160
S ne reamintim...
Materiale i suporturi necesare ntocmirii raportului psihologic
Hrtie i creioane; fi (blanc) de raport psihologic; cteva fie psihologice i unul
sau mai multe raporarte psihologice reale, rezultate din practica psihologic, de
model.
U4.3. Idei de baz pentru ntocmirea unui raport psihologic
S ne reamintim...
1. Raportul psihologic nu se confund cu Fia psihologic, deoarece prima ramne
la client, a doua la psiholog; prima traduce n termeni inteligibili informaia
prezent n fi, la care se adaug obligatoriu capitole de interpretare, sumarizare
(concluzii) i recomandri.
2. Raportul psihologic nu exclude partea tehnic de prezentare a datelor (notele
brute i notele standard ale testelor utilizate), dar important este traducerea
limbajului cifric ntr-o descriere narativ, ntr-un limbaj accesibil clientului.
3. Ca structur, raportul psihologic (sau de examinare psihologic) cuprinde datele
factuale - de identificare, scopul sau problema pentru care a fost solicitat testarea,
testele administrate i rezultatele obinute, exprimate sub form de note brute
(eventual) i note standard (obligatoriu), o anamnez sau datele biografice
relevante n raport cu scopul testrii, observaiile relevante reieite n timpul
desfurrii examenului psihologic, interpretarea rezutatelor (sumarizarea) i
recomandrile.
4. Dublarea laturii constatative cu cea formativ, cea diagnostic cu cea
prognostic i abordarea nomotetic cu cea idiografic (personalizarea examenului
psihologic) face diferena ntre un raport bun i unul slab, dei aici elementul
difereniator major este experiena capitalizat de psiholog, competena lui de
psihodiagnostician, ca i lrgimea repertoriului psihodiagnostic de care dispune i
care-i permite s abordeze o gam mai larg sau mai ngust de probleme.
Exemplu
Din cele de mai sus rezult c nu aspectul formal (standard) d valoarea unui
raport psihologic, ci:
gradul de acoperire a scopului i a ateptrilor clientului;
161
msura n care s-a operat cea mai potrivit selecie a testelor i a procedurilor
disponibile la un moment dat, n raport cu solicitarea clientului;
faptul de a include datele cele mai pertinente reieite din observaie, care au o
mare valoare diagnostic, acestea fiind cele care transfer examinarea
psihologic din zona nomoteticului n zona idiograficului;
faptul dac rezultatele sunt confirmate de timp (fidelitatea test-retest), de ali
evaluatori (fidelitatea interscoreri sau interspecialiti), de faptele anticipate
(validitatea relativ la criteriu) sau de viaa nsi, aflat dincolo de pereii
laboratorului (validitatea ecologic);
faptul de a oferi altor specialiti (profesori, medici, sociologi etc.) puncte de
sprijin solide n deciziile sau n interveniile lor de specialitate;
faptul de a ine pasul cu cele mai noi i avansate standarde din domeniu, furnizate
de rile cu mare tradiie n testarea psihologic.
U4.4. Activiti propuse
U4.4.1. ntocmirea unui raport de examinare psihologic
Raportul psihologic materializeaz i finalizeaz o investigaie psihologic de tipul testrii/
evalurii, adic un examen psihologic. Mrimea i gradul de elaborare al acestuia depind simultan
de scopul testrii/evalurii, de cerinele expres formulate de cel care a comandat-o, de exigena i
profesionalismul psihologului. Chiar i pentru testri foarte scurte trebuie s existe un raport, adic
ceva care traduce datele cantitative n date calitative cu sens, inteligibile pentru client.
U4.4.2. Structura raportului psihologic
Un raport de evaluare a funciilor intelectuale poate diferi semnificativ de unul care se
refer la structuri i funcii de personalitate. Astfel, testul CPI, cu multitudinea sa de scale
originare (18), la care se adaug cele suplimentare (cel puin tot attea) poate genera att efort n
sinteza i de intercorelare nct, mai nou, aceast sarcin a fost preluat de computer (care nu
poate suplini totui responsabilitatea psihologului, asumat prin semntur). Aceste rapoarte
computerizate au de regul o parte non-narativ - raportul scorurilor brute i standard, incluznd
testele de semnificaie statistic i intervalele de ncredere pentru scorurile de la test, i una
narativ. Raporturile descriptive merg cu un pas dincolo de raporturile de scoruri prin includerea
unei interpretri a rezultatelor scal cu scal."21 Lungimea raportului nu d ns i valoarea
acestuia: profilurile furnizate de softurile contemporane fiind excesiv de detaliate, clinicianul
trebuie s parcurg rapoarte de peste zece pagini pentru a putea extrage cteva caracteristici
definitorii pentru clientul su. Concluzia lui Gregory ni se pare una foarte valabil: "Un raport
descriptiv poate da o informaie nepreuit pe o jumtate de pagin."22
Dac exist totui diferene mari de format ntre raportul psihologic al funciilor
intelectuale i al profilului de personalitate, nseamn c ne vom opri asupra celui cu structura mai
simpl (funcii intelectuale), dei n practica curent psihologul poate construi profile
162
S ne reamintim...
Structura raportului psihologic va trebui s cuprind:23
I. Date factuale i de identificare ale clientului.
II. ntrebarea de referin (scopul) evalurii psihologice.
III. Testele administrate, cu indicarea rezultatelor n note brute i note standard, ca
i a scorului final (IQ, Indice de Memorie, Indice de Motricitate).
IV. Datele de anamnez (pacieni clinici) sau istoria personal a cazului.
V. Observaiile relevante reieite pe parcursul examinrii.
VI. Interpretarea rezultatelor la teste prin raportarea datelor brute la etaloane,
raportarea unora la altele, a tuturor la o teorie, la un set de ipoteze sau la fapte).
VII. Sumarizarea concluziilor.
VIII. Recomandri.
Mai detaliat, aceast secven const din urmtoarele opt capitole ale raportului,
fiecare cu o scurt definiie, cu indicarea funciilor implicate, cu precizarea
modului de realizare corect i a erorilor cele mai frecvente, dar i a modului lor
de evitare. n final se propune un exerciiu imaginar pe un blanc anume elaborat.
Not: raportul psihologic se parafeaz, se dateaz i se semneaz, pentru c din
momentul emiterii lui devine un document oficial, cu consecine posibile asupra
clientului, el putnd fi invocat n instan sau n luarea unor decizii cu privire la
persoana n cauz. Spre deosebire de raportul psihologic computerizat, raportul
psihologic presupune deci asumarea responsabilitii prin semntur i paraf.
I. Datele factuale i de identificare a subiectului
Definire: sunt datele care descriu caracteristicile demografice principale pentru
identificarea subiectului i includerea sa ntr-o categorie, cum ar fi: data naterii i data examinrii,
ce permit determinarea vrstei (n ani i luni, cci la vrsta copilriei dinamica dezvoltrii este una
foarte rapid), mediul (rural/urban = R/U), sexul (Masculin/Feminin = M/F), studiile prinilor
copiilor examinai (generale, medii, superioare = G, M, S) sau ale celui n cauz, coala i clasa
sau facultatea (dac este cazul), ultima coal absolvit (dac este adult), mrimea i poziia sa n
fratrie, familia de apartenen (cstorit, divorat, vduv, concubinaj) sau cea proprie (stare
marital = cstorit/necstorit), ocupaie, vechime, calificare etc. Observm c pentru copii se
pune problema background-ului cultural-economic i educaional; cnd cel examinat este un adult,
aceste elemente se transfer de pe familie pe clientul nsui, de care ne mai putem interesa privitor
la starea locativ, indicele de aglomerare (numr de persoane pe numr de camere), venit (global
sau pe membru de familie). Toate acestea lungesc proporional durata edinei, de aceea trebuie s
gsim un echilibru rezonabil ntre lungimea datelor completate i relevana lor.
Funciile acestui capitol sunt urmtoarele:
163
- fixeaz datele cele mai relevante, care permit identificarea i raportarea clientului la o
clas;
- datele factuale sunt variabile "naturale" (uneori "etichet") n prelucrarea computerizat a
seturilor de date similare;
- din prelucrarea bazei de date acumulate n timp se pot extrage sub-eantioane mai mici,
pentru a genera bareme/etaloane mai fine sau pentru a desprinde regulariti tipice (prin
lucrri de cercetare tiinific).
Realizare corect
Dac este structurat sub forma unei fie cu o rubricatur adecvat, datele sunt uor de
strns, putnd avea o multitudine de utiliti (vezi funciile).
Deoarece raportul psihologic selecteaz doar datele (adevrate) din fia de test (mai
complet, mai tehnic i mai analitic), formularea din fi este diferit de cea din raport.
n primul caz, se completeaz datele n rubric, n al doilea li se d o structur narativ
sintetic.
contaminarea capitolului cu date rezultate din istoria personal, din observarea direct sau
din testarea efectiv a clientului.
un scop ciorchine, amalgamnd o multitudine de elemente, dintre care unele reieite din
anamnez;
scopuri vagi sau prea generale (dorim o evaluare de ansamblu, ne intereseaz cum
gndete, copilul nu are stare etc.), care vor fi nlocuite cu scopuri specifice
(consecinele cognitive ale unei nateri hipoxice, hiperkinezie cu deficit de atenie, examen
n vederea orientrii i ghidrii vocaionale etc.).
164
deprtare omite chiar elemente dintre cele mai semnificative. Mai jos dm exemplu de elemente
semnificative din anamneza copiilor cu dificulti colare sau cu probleme de dezvoltare care pot
fi incluse n raportul psihologic.
Retarduri legate de vorbit, mers, control sfincterian (primul pas, primul cuvnt).
Evenimentele majore din viaa copilului sau a familiei sale (separaii, divoruri etc.).
standardizarea observaiilor n timpul aplicrii probelor sale cognitive. Psihologul obinuit tie c
dac a folosit cum trebuie observaia, el poate agrementa raportul su cu acele elemente decisive
ce fac diferena dintre examenul lipsit de suflet - computerizat - i cel efectuat de o fiin uman.
Rezolvarea corect: problema este aceea c din multitudinea datelor observate i
consemnate n fia de examen s selectm doar acele informaii concludente, ntr-o form
explicit. De exemplu, n loc s trecem c Ionel este inhibat, foarte dependent afectiv (concepte
vagi) putem utiliza formula Ionel a vrut s fie examinat doar n prezena prinilor si, pe care-i
solicita la cea mai mic neclaritate; la un moment dat el s-a ridicat de pe scaun i nu a mai vrut s
continue, refugiindu-se n spatele mamei, dei Ionel are deja apte ani i jumtate. A comentat c
coala nu este bun la nimic, poate doar s-i chinuie n zadar pe copii. A revenit n examen dup
insistene i rugmini, artndu-se foarte ngrijorat la tot ce ar fi putut nsemna eec sau nereuit.
La comunicarea rezultatelor a inut neaprat s fie de fa, cernd explicaii i ntrebnd dac ce a
fcut el este bine. La plecare nu i-a luat la revedere i tata a comentat c este foarte puin probabil
s mai vin din nou la examen, pentru c examinarea seamn prea mult cu coala.
Erori posibile
Contaminarea reciproc a datelor furnizate de observaie i a celor de anamnez.
167
Uneori psihologul se rezum doar la scopul testrii, ferindu-se s valorifice date valoroase
care-l depesc ca putere explicativ, alteori examenul nu ine deloc cont de scopul de
referin, mergnd pe acelai ablon, stereotip, indiferent de tipologia solicitrilor ntlnite.
VIII. Recomandri
Definire: sugestiile oferite sunt date n sensul potenrii calitilor insuficient puse n
valoare de ctre subiect i a optimizrii sau compensrii aspectelor deficitare.
Funcii: aceea de a depi planul constatativ i de a oferi soluii problemelor diagnosticate,
de a lrgi cadrul de referin prin implicarea altor specialiti (dac e cazul) i de a gsi soluii
problemelor pe care subiectul le are fr ca acestea s fi fost n mod expres obiectul investigaiei.
Greeli de evitat
Recomandrile s fie pertinente, la obiect i fezabile.
Ele s rezulte din datele de investigaie, s fie solid susinute de datele empirice, dar i de
teoria din domeniu.
U4.5. Rezumat
Raportul psihologic condenseaz ntreaga activitate de evaluare psihologic.
Scopul su de baz este acela de a traduce n termeni inteligibili pentru client
informaia reieit i de a rspunde ntrebrii de referin care a declanat
activitatea de evaluare.
Structura raportului psihologic este urmtoarea: date factuale, scopul evalurii,
teste administrate i cote brute cote standard pentru fiecare, anamneza,
observaiile reieite, sumarizarea rezultatelor i recomandrile formulate.
Un raport psihologic de bun calitate este acela care ine cont de ntrebarea de
referin, ajustnd dispozitivul de testare/evaluare pentru a rspunde ct mai
satisfctor la aceast ntrebare.
n al doilea rnd, un raport bun integreaz o multitudine de alte surse de
informaii i metode n afara testelor psihometrice, cum ar fi anamneza,
observaia sau interviul dirijat.
n plus, un raport psihologic bun traduce n termeni inteligibili pentru client
rezultatele investigaiei, formulnd concluzii i propuneri ameliorative.
U4.6. Test de evaluare a cunotinelor
1. Precizai care sunt asemnrile i deosebirile dintre fia psihologic i raportul
de evaluare psihologic.
2. Indicaii paii de baz i structura unui raport de evaluare psihologic.
3. Definii ce sunt datele factuale i care este rolul lor n structura unui raport de
evaluare psihologic.
4. Precizai ce este ntrebarea de referin i care sunt funciile ei de baz.
5. Indicai care sunt elementele definitorii pentru o bun anamnez i care este rolul
su n raportul psihologic.
6. Precizai felul n care metoda observaiei dirijate transform o edin de testare
n una de evaluare psihologic.
169
170
BIBLIOGRAFIE
1. Aiken, L.R. (1997). Psychological Testing and Assessment. 9th ed. Boston, London, Toronto,
Sydney, Tokyo, Singapore: Allyn and Bacon.
2. Albu, M. (1998). Construirea i utilizarea testelor psihologice. Cluj-Napoca: Editura
Clusium.
3. Allport, G.W. (1991). Structura i dezvoltarea personalitii. Bucureti: Editura Didactic i
Pedagogic.
4. Anastasi, A. (1974). Psychological Testing. New York: Macmillan Publishing Co.
5. Bban, A., Derevenco, P., Eysenck, S.B.G. (1990). Testul E.P.Q. n: Revista de psihologie, 1,
37-45.
6. Biceanu, L. (2004). Dicionar ilustrat de psihologie englez romn. Bucureti: Editura
tehnic.
7. Bontil, Gh. (1971). Aptitudinile i msurarea lor. Bucureti: Centrul de Documentare i
Publicaii al Ministerului Muncii.
8. Carroll, J.B. (1993). Human Cognitive Abilities. Cambridge: Cambridge University Press.
9. Constantin, T. (2004). Evaluarea psihologic a personalului. Iai: Editura Polirom.
10. Bogthy, Z. (1978). ndreptarul psihologului industrial. Bucureti: Editura tiinific i
Enciclopedic.
11. Cattell, R.B. (1957), Personality and Motivation. Structure and Measurement. New York:
World Book Co.
12. Cattell, R.B. (1960). Manuel pour l'application de l'Echelle d'Anxiet. Paris: Ed. C.P.A.
13. Cattell, R.B., Beloff, H. (1966). Manuel d'application du H.S.P.Q. Paris: Ed. C.P.A.
14. Clinciu, A.I. (2005). Psihodiagnostic. Braov: Editura Universitii Transilvania.
15. Clocotici, V., Stan, A. (2000). Statistic aplicat n psihologie. Iai: Editura Polirom.
16. Cohen, R.J., Swerdlik, M.E., Smith, D.K. (1992). Psychological Testing and Assessment. An
Introduction to Tests and Measurement. second ed. California: Mayfield Publishing Company,
Mountain View.
17. Cronbach, L.J. (1970). Essential of Psychological Testing. New York: Harper and Row.
18. Deri, S. (2000). Introducere n testul Szondi. Bucureti: Editura Paideia.
19. Durand, G. (1999). Aventurile Imaginii. Imaginaia simbolic. Imaginarul. Bucureti: Editura
Nemira.
20. Dworetzky, D.J., Davis, N.J. (1989). Human development. A life span approach. St Paul, New
York: West Publishing Company.
21. Enchescu, C. (1975). Expresia plastic a personalitii. Bucureti: Editura tiinific.
22. Enchescu, C. (1977). Psihologia activitii patoplastice. Bucureti: Editura tiinific i
Enciclopedic.
23. Eysenck, H.J. (1953). The Structure of Human Personality. New York: Viley.
24. Eysenck, H.J. (1975). The Measurement of Personality. London: Routledge & Kegan.
25. Eysenck, H.J, Eysenck, S.B.G. (1975). Manual of the Eysenck Personality Questionnaire.
London: University of London Press.
171
26. Eysenck, M.W., Keane, M.T. (1995). Cognitive Psychology. A student's handbook. 3rd edition,
Hove East Sussex, UK: Psychology Press Ltd.
27. Gardner, H. (1985). Frames of mind: The theory of multiple intelligences. New York: Basic
Books
28. Gregory, R.J. (1994). Psychological Testing. History, Principles and Applications, second
edition. Boston, London etc.: Alyn and Bacon.
29. Guilford, J.P. (1959). The Nature of Human Intelligence. New York: Mc Graw Hill Book
Company.
30. Harris, D.B. (1963). Children's drawings as measures of intellectual maturity. New York:
Harcourt, Brace & World.
31. Havrneanu, C. (2000). Cunoaterea psihologic a persoanei. Iai: Editura Polirom.
32. Holban, I (1970). Probleme de psihologia muncii. Bucureti: Editura tiinific.
33. Horghidan, V. (1992). Metode de psihodiagnostic. Bucureti: Editura Didactic i Pedagogic.
34. Kaplan, R.M., Saccuzzo, D.P. (1993). Psychological Testing. Principles, Applications and
Issues, 3th ed. Belmont, California: Brooks Cole Publishing Company, Inc.
35. Kline, P. (1995). La construction des tests. n: J.R., Beech, L., Harding Tests, mode d'emploi.
Guide de psychomtrie. Paris: Edition C.P.A.
36. Kulcsar (1976). Testul Raven i variantele sale. n: ndrumtor psidodiagnostic, vol. II, ClujNapoca: Reprografia Univeritii Babe Bolyai.
37. Laveault, D., Grgoire, J. (2002). Introduction aux thoriex des tests en Psychologie et en
sceeces de l'ducation. 2e edition. Bruxelles: ditions De Boeck Universit, p. 199.
38. Meeker, M.N. (1969). The Structure of Intellect. Its interpretations and uses. Columbus, Ohio:
Charles E. Merrill Company.
39. Meili, R. (1962). Manuel du diagnostique psychologique. Paris: P.U.F.
40. Minulescu, M. (1996). Chestionarele de personalitate n evaluarea psihologic. Bucureti:
Garell Publishing House.
41. Mitrofan, N. (1993). Testarea psihologic a copilului mic. Bucureti: Editura Press Mihaela.
42. Mitrofan, N., Mitrofan, L. (2005). Testarea psihologic. Inteligena i aptitudinile. Iai:
Editura Polirom.
43. Mitrofan, N. (2001). Psihometria i direciile ei de dezvoltare la nceput de mileniu. n M.
Zlate (coord.), Psihologia la rspntia mileniilor. Iai: Editura Polirom.
44. Nunnally, J.C. (1978). Psychometric Theory. (2nd Ed.). New York: McGaw Hill.
45. Parot, F., Richelle, M. (1995). Introducere n psihologie. Istoric i metode. Bucureti: Editura
Humanitas.
46. Perse, J. (1972). Collaboration du psychologie au dpistage et au diagnostique des maladies
mentales. n: Reuchlin, M. (red.) Trait de psychologie aplique. Paris, Press Univ. de France.
47. Piron, H. (coord.) (2001). Vocabular de psihologie. Bucureti: Editura Univers Enciclopedic.
48. Pitariu, H. (1983). Psihologia seleciei i orientrii profesionale. Cluj-Napoca: Editura Dacia.
49. Pitariu H. (1974). Testul Domino 48 (D 48); Testul Domino 70 (D 70). n: ndrumtor
psihodiagnostic, vol. II, Cluj-Napoca: Reprografia Universitii Babe Bolyai.
50. Popescu Neveanu, P. (1977). Psihologie general. Tipografia Universitii Bucureti.
172
51. Radu, I. (coord.) (1991). Metodologie psihologic de analiz a datelor. Cluj-Napoca: Editura
Sincron.
52. Reber, A.S. (1985). Dictionary of Psychology. London, New York etc.: Penguin Books.
53. Reuchlin, M. (1992). Introduction la recherche en psychologie. Paris: ditions Nathan.
54. Reuchlin, M. (2000). Psihologie general. Bucureti: Editura tiinific.
55. Ribault, C. (1965). Le dessin de la maison chez lenfant. n: Revue de Neuropsychiatrie
Infantile, 13, nr. 1-2.
56. Rorschach, H (2000). Manual de psihodiagnostic. Bucureti: Editura Trei.
57. Roca, M. (1972). Metode de psihodiagnostic. Bucureti: Editura Didactic i Pedagogic.
58. Rozorea, A., Sterian, M. (2000). Testul arborelui.Bucureti: Editura Paideia.
59. Stan, A. (2002). Testul psihologic. Evoluie, construcie, aplicaii. Iai: Editura Polirom.
60. Sternberg, R.J. (1985). Beyond IQ: A triarchic treory of human intelligence. New York:
Cambridge University Press.
61. Sternberg, R.J., ed. (1990). Handbook of human intelligence. Cambridge, New York etc.:
Cambridge University Press.
62. Sternberg, R.J. (1993). Intelligence is more than IQ: The practical size of intelligence. In
Jurnal of Cooperative Education, 28 (2), pp. 6-10.
63. Szamoskzi, t. (1997). Psihometria clasic i evaluarea formativ. n Cogniie, creier,
comportament, vol. 1, nr. 2, iunie, Cluj-Napoca.
64. chiopu, U. (1974). Introducere n psihodiagnostic. Bucureti: Tipografia Universitii.
65. chiopu, U. (coord.) (1997). Dicionar enciclopedic de psihologie. Bucureti: Editura Babel.
66. tefnescu-Goang, Fl. (1946). Msurarea inteligenei. Revizuirea, adaptarea i completarea
scrii de inteligen Binet-Simon. Cluj-Napoca: Editura Institutului de psihologie.
67. Witkin, H.A., Dyk, R.B., Faterson, H.F., Goodenough, D.R., Karp, S.A. (1962). Psychological
differentiation. Studies of development. NewYork, London: John Wiley and Sons, Inc.
68. Zazzo, R., Gilly, M., Verba-Rad, M. (1968). Nouvelle chelle mtrique de l'intelligence. Paris:
Librairie Armand, Colin.
69. Zimmerman I.L., Woo-Sam, J.M. (1973). Clinical Interpretation of the Wechsler Adult
Intelligence Scale. New York, San Francisco, London: Grune & Straton.
70. Zlate, M. (1999). Psihologia mecanismelor cognitive. Iai: Editura Polirom.
71. Zrgo, B, (1976). Examinrile psihologice. n ndrumtor psihodiagnostic. Cluj-Napoca:
Reprografia Universitii Babe-Bolyai, pp. 1-16.
173
Anexa 1
Echivalenele rangurilor percentile n scoruri standard i standardizate
Percentile
Media
AS
99
98
97
96
95
94
93
92
91
90
89
88
87
86
85
84
83
82
81
80
79
78
77
76
75
74
73
72
71
70
69
68
67
66
65
64
63
62
61
60
59
58
57
56
55
54
53
52
51
50
Cote
z
0.00
1.00
2.33
2.05
1.88
1.75
1.64
1.55
1.48
1.41
1.34
1.28
1.22
1.18
1.13
1.08
1.04
0.99
0.95
0.91
0.88
0.84
0.80
0.77
0.74
0.71
0.67
0.64
0.61
0.58
0.55
0.52
0.49
0.47
0.44
0.41
0.39
0.36
0.33
0.31
0.28
0.25
0.23
0.20
0.18
0.15
0.12
0.10
0.07
0.05
0.03
0.00
Deviaii
IQ
100
15
135
131
128
126
125
123
122
121
120
119
118
118
117
116
116
115
114
114
113
113
112
112
111
111
110
110
110
109
108
108
107
107
107
106
106
105
105
105
104
104
104
103
103
102
102
102
101
101
100
100
Scoruri
T
50
10
73
71
68
68
66
66
65
64
63
63
62
62
61
61
60
60
60
59
59
58
58
58
57
57
57
56
56
56
56
55
55
55
54
54
54
54
53
53
53
53
52
52
52
52
51
51
51
51
50
50
Scoruri
GRE
500
100
733
705
688
675
664
655
648
641
634
628
622
618
613
608
604
599
595
591
588
584
580
577
574
571
567
564
561
558
555
552
549
547
544
541
539
536
533
531
528
525
523
520
518
515
512
510
507
505
503
500
Percentile
Media
AS
50
49
48
47
46
45
44
43
42
41
40
39
38
37
36
35
34
33
32
31
30
29
28
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
174
Cote
z
0.00
1.00
0.00
-0.03
-0.05
-0.07
-0.10
-0.12
-0.15
-0.18
-0.20
-0.23
-0.25
-0.28
-0.31
-0.33
-0.36
-0.39
-0.41
-0.44
-0.47
-0.49
-0.52
-0.55
-0.58
-0.61
-0.64
-0.67
-0.71
-0.74
-0.77
-0.80
-0.84
-0.88
-0.91
-0.95
-0.99
-1.04
-1.08
-1.13
-1.18
-1.22
-1.28
-1.34
-1.41
-1.48
-1.55
-1.64
-1.75
-1.88
-2.05
-2.33
Deviaii
IQ
100
15
100
100
99
99
98
98
98
97
97
96
96
96
95
95
95
94
94
93
93
93
92
92
91
90
90
90
89
89
88
88
87
87
86
86
85
84
84
83
82
82
81
80
79
78
77
75
74
72
69
65
Scoruri
T
50
10
50
50
49
49
49
49
48
48
48
48
47
47
47
47
46
46
46
46
45
45
45
44
44
44
44
43
43
43
42
42
42
41
41
40
40
40
39
39
38
38
37
37
36
35
34
34
32
31
29
27
Scoruri
GRE
500
100
500
497
495
493
490
488
485
482
480
477
475
472
469
467
464
461
459
456
453
451
448
445
442
439
436
433
429
426
423
420
416
412
409
405
401
396
392
387
382
378
372
366
359
352
345
336
325
312
295
267
Anexa 2
Echivalenele dintre diferite tipuri de scale normalizate
175
176