Documente Academic
Documente Profesional
Documente Cultură
curs 1 1
Evaluare psihologică – metode psihometrice curs 1
curs 1 2
Evaluare psihologică – metode psihometrice curs 1
În locul evaluărilor sistematice, cei care profesează în psihoterapie aleg de multe ori
evaluarea „clinică”, în sensul fundamentării diagnosticului şi profilului psihologic al pacientului
pe un set de informaţii prelevate prin diverse alte metode (interviuri, observaţie, studiul de caz,
sau chiar altfel de instrumente de evaluare cu o validitate contestată în psihologia contemporană,
cum sunt testele proiective). Combinarea acestor informaţii (şi ponderarea lor în funcţie de
importanţa percepută pe care o deţin) în direcţia inferării dinamicii psihologice şi trăsăturilor
relevante ale individului se face deseori pe baza intuiţiei psihologului, a unui set de reguli de
decizie derivat din experienţa personală cu cazuri similare. O astfel de abordare are avantaje
clare în ceea ce priveşte gradul de control personal al psihologului asupra metodei, respectiv în
cea a uşurinţei de utilizare. Cei care optează pentru acest domeniu profesional sunt de multe ori
seduşi intelectual tocmai de subiectivismul său extrem, de fluiditatea şi creativitatea implicate în
înţelegerea psihicului uman, de relaţia „sufletească” dintre terapeut şi client ghidată cu precădere
de primul pe baza intuiţiilor şi aşteptărilor sale.
curs 1 3
Evaluare psihologică – metode psihometrice curs 1
Totuşi, acest tip de evaluare are un nivel de corectitudine şi eficienţă semnificativ mai
slab în comparaţie cu utilizarea metodelor sistematice, statistice. Tema comparaţiei dintre cele
două abordări nu este deloc una nouă. Încă din 1954, Paul Meehl – un psiholog clinician ce a
insistat pe parcursul carierei sale în favoarea utilizării suportului oferit de statistică de către
colegii săi de breaslă – a sintetizat rezultatele mai multor studii asupra validităţii celor două
abordări, toate indicând faptul că evaluarea sistematică este superioară celei pur clinice.
Cercetările de după acel moment au întărit acest rezultat, majoritatea utilizând drept criteriu al
validităţii corectitudinea predicţiei făcute de reprezentanţii celor două abordări. Opţiunea pentru
acest criteriu este explicabilă prin prisma faptului că el pune în relaţie evaluarea propriu-zisă a
individului cu un set de comportamente pe care psihologul prezice că le va desfăşura în viitor, în
funcţie de caracteristicile psihologice rezultate în urma evaluării. Cu alte cuvinte, el reprezintă un
reper obiectiv de departajare, spre deosebire de diagnosticul în sine, a cărui validitate nu poate fi
evaluată printr-un criteriu obiectiv. Trebuie menţionat că în construcţia instrumentelor
standardizate, acest aspect al predicţiei comportamentale reprezintă o dimensiune obligatorie a
calităţii psihometrice a scalei de evaluare – cea a validităţii de criteriu predictive. Mai mult,
cunoaşterea acestei caracteristici psihometrice a instrumentului oferă psihologului informaţii nu
doar despre relaţia dintre trăsătura măsurată şi un anumit comportament, ci şi cu privire la
probabilitatea ca un anume individ să realizeze acel comportament.
Un exemplu de astfel de studiu de evaluare paralelă a celor două abordări este cel realizat
într-o clinică asociată universităţii din Pittsburgh (Gardner et al., 1996). Sarcina pe care au
realizat-o psihologii (subiecţi ai acestei cercetări) practicanţi ai evaluării de tip clinic, respectiv
sistematic a fost să prezică apariţia comportamentelor violente în cazul fiecăruia dintre cei 784
de pacienţi internaţi în acea clinică în următoarele 6 luni. Indicatorul utilizat pentru a aprecia
corectitudinea prognosticului a fost unul relevant pentru validitatea discriminativă a
instrumentelor din psihologie, şi anume AUC (Area Under the Curve – prezentat într-un curs
ulterior). Rezultatele au arătat că acest indicator a avut valoarea 0,74 pentru predicţia statistică; şi
doar 0,63 pentru cea clinică, adică mult mai apropiat de pragul de 0,5 care corespunde absenţei
totale a corectitudinii predicţiei.
O meta-analiză mai recentă a studiilor de acest tip (Grove et al., 2000) arată faptul că
predicţia statistică a fost mai validă decât cea clinică în 44% din cazurile incluse în studiile
citate, în timp ce predicţia clinică a fost mai validă decât cea statistică doar în 6% din cazuri. În
medie, diferenţa dintre corectitudininea predicţiilor pe baza celor două abordări este de 10%, în
favoarea celei sistematice. Dintre toate sursele de informaţii ce pot fi incluse în evaluarea clinică,
una are o influenţă negativă mai substanţială asupra corectitudinii sale, ea fiind, în acelaşi timp,
şi prototipul acestui tip de abordare; astfel, se pare că predicţia clinică îşi pierde din validitate în
special atunci când evaluarea includea interviuri cu pacienţii, relevând încă o dată diversele
probleme şi limite ale acestei metode.
Un alt rezultat interesant al cercetărilor pe această temă, relevat prin comparaţii între
clinicieni cu grade diverse de experienţă, doctoranzi, studenţi, etc., este acela că nivelul de
experienţă în evaluarea clinică nu influenţează corectitudinea acesteia (Walters et al., 1988). De
curs 1 4
Evaluare psihologică – metode psihometrice curs 1
curs 1 5
Evaluare psihologică – metode psihometrice curs 1
faptului că el este reprezentativ în gândirea curentă, în simţul comun, pentru „portretul robot” al
unei persoane suspicioase sau vigilente.
• Eroarea de confirmare este un alt fenomen – pe lângă cele legate de calitatea feed-back-
ului primit de la clienţi – care afectează capacitatea psihologilor de a-şi îmbunătăţi în timp
corectitudinea evaluărilor, prin raportare la evoluţia psihologică a individului evaluat. Ea se
referă la tendinţa lor de a acorda mai multă atenţie şi chiar de a căuta, selecta, şi ţine minte cu
precădere informaţiile care le sprijină sau confirmă ipotezele, în defavoarea celor care le
contrazic (Garb, 2003). Ea apare încă din momentul deciziei psihologului cu privire la
„întrebările potrivite” pe care le va adresa clientului în procesul evaluării clinice, pentru că de
multe ori ele sunt ghidate de o impresie (în termeni psihologici) construită de la primul moment
al interacţiunii dintre ei. Această primă impresie (mai mult sau mai puţin conştientă) reprezintă
ipoteze pe care răspunsurile la întrebările puse au rolul de a le confirma. De asemenea,
informaţiile care confirmă aceste ipoteze vor fi cele cărora li se va acorda o atenţie superioară în
construcţia diagnosticului final. Dat fiind faptul că aceste deformări ale răspunsurilor şi
comportamentului celui evaluat sub impactul ipotezelor psihologului se prelungesc şi în aria
memoriei, eroarea de confirmare explică dificultăţile psihologilor care utilizează exclusiv
evaluarea clinică de a învăţa din experienţă.
curs 1 6
Evaluare psihologică – metode psihometrice curs 1
de existenţa unui etalon pe întreaga populaţie, presupune însă investiţii considerabile (în special
de timp şi de ordin logistic) în etapa de construcţie a instrumentului. De asemenea, majoritatea
testelor acoperă concepte psihologice destul de generale (de exemplu, personalitatea sau
inteligenţa), încadrând individul evaluat pe un set de factori ce compun respectivul concept,
reflectând dimensiuni mai specifice.
Cu toate că utilizarea testelor are avantaje clare – în termeni de evaluare în raport cu
întreaga populaţie şi de bogăţie a rezultatelor, de comprehensivitate a evaluării), în psihologia
contemporană – atât în spaţiul cercetării, cât şi în cel aplicat în diverse arii, inclusiv cea clinică) –
sunt din ce în ce mai des utilizate aşa-numitele „scale scurte” (RAI - Rapid Assessment
Instruments). Termenul de „scală” sugerează diferenţa faţă de test, în cele două privinţe
menţionate mai sus: în primul rând, ele vizează concepte mult mai specifice, bazate pe o
decupare precisă a spaţiului psihologic asociat lor (de exemplu, „auto-monitorizarea”, sau
„nevoia de cogniţie”). În al doilea rând, majoritatea acestor instrumente nu au un etalon construit
pe întreaga populaţie, ci cel mult unul valabil pe o populaţie foarte specifică (de exemplu, un
etalon pe copiii cu părinţi divorţaţi în cazul scalei de Lipsă de speranţă la copii). În rest, însă,
construcţia lor respectă aceleaşi exigenţe psihometrice ca şi cele implicate în construcţia testelor,
de la alegerea itemilor şi a scalelor de răspuns potrivite la rafinarea progresivă a bateriei de itemi
până la momentul în care aceasta respectă standardele cu privire la fidelitate, validitate de
conţinut, de construct, predictivă, etc. Avantajul acestor instrumente în psihologia clinică este
acela că ele oferă posibilitatea evaluării în profunzime a unui număr mare de dimensiuni
psihologice pe care clinicianul le consideră a fi relevante pentru respectivul individ,
administrându-i un număr redus de itemi; în acest fel, validitatea răspunsurilor sale este crescută,
iar gradul de discomfort pe care îl induce situaţia de evaluare este minimizat.
Bibliografie
• Arrindell, W.A., Perris, C., Eisemann, M., van der Ende., J., Gaszner, P., Iwawaki, S., Maj, M., Zhang, J.
Parental rearing behaviour from a cross!cultural perspective: a summary of data obtained in 14 nations. In C. Perris,
W. A. Arrindell, & M. Eisemann (Eds), Parenting and Psychopathology. Chichester: Wiley
• Chapman, L. J., & Chapman, J. P. (1967). Genesis of popular but erroneous diagnostic observations.
Journal of Abnormal Psychology, 72, 193-204.
• Garb, H. (2003). Clinical judgment and mechanical prediction, în Graham, J., Naglieri, J., Handbook of
psychology Vol X. Assessment psychology, John Wiley & Sons, Inc.
• Gardner, W., Lidz, C. W., Mulvey, E. P., & Shaw, E. C. (1996). Clinical versus actuarial predictions of
violence by patients with mental illnesses. Journal of Consulting and Clinical Psychology, 64, 602–609.
• Goldberg, L. R. (1959). The effectiveness of clinicians’ judgments: The diagnosis of organic brain damage
from the Bender-Gestalt test. Journal of Consulting Psychology, 23, 25–33.
• Grove, W. M., Zald, D. H., Lebow, B. S., Snitz, B. E., & Nelson, C. (2000). Clinical versus mechanical
prediction: A meta-analysis. Psychological Assessment, 12, 19–30.
• Havârneanu, C. (2000). Cunoaşterea psihologică a persoanei, Iaşi, Polirom
• Hermann, R. C., Ettner, S. L., Dorwart, R. A., Langman-Dorwart, N., & Kleinman, S. (1999). Diagnoses of
patients treated with ECT: A comparison of evidence-based standards with reported use. Psychiatric Services, 50,
1059–1065.
curs 1 7
Evaluare psihologică – metode psihometrice curs 1
curs 1 8
Evaluare psihologică – metode psihometrice curs 2
În construcţia unui test sau a unei scale în vederea evaluării unei dimensiuni psihologice,
fie ea de nivel general sau specific, stabilă – „trăsătură” - sau tranzitorie – „stare”, psihologul are
la dispoziţie două abordări generale: metoda constructului şi metoda empirică.
1. Metoda constructului sau metoda teoretică presupune focalizarea, în prima etapă a
construcţiei instrumentului, pe definirea teoretică a spaţiului psihologic asociat respectivului
concept, căutând cunoaşterea fundamentelor teoretice ale acestuia din literatura de specialitate,
ca şi a relaţiilor sale cu alte concepte din acelaşi spaţiu. Cu alte cuvinte, efortul de construcţie
presupune două direcţii: în primul rând, cea a operaţionalizării nuanţelor constructului, aşa cum
este el definit în literatură; colecţia de itemi elaboraţi ar trebui să acopere toate faţetele acestuia.
În al doilea rând, elaborarea itemilor trebuie să ţină cont de relaţiile teoretice dintre constructul
vizat şi alte concepte. Principiul din spatele acestei abordări este acela că nici o dimensiune
psihologică nu este insulară, ci face parte dintr-un ansamblu de caracteristici mentale şi
comportamentale care se condiţionează reciproc sau care, cel puţin, sunt în corelaţie. De aceea,
prin cunoaşterea „reţelei nomotetice” în care este integrat constructul vizat ne asigurăm că baza
psihologică de plecare este mai consistentă decât în cazul în care am avea în atenţie exclusiv
acest construct. Prin această abordare ce insistă pe definirea teoretică a întregului spaţiu
psihologic în care este ancorată respectiva dimensiune se urmăreşte maximizarea validităţii de
construct, una din calităţile psihometrice fundamentale ale instrumentelor din psihologie, ce se
referă la gradul în care instrumentul construit generează scoruri ce se află în anumite relaţii
prezise pe baze teoretice cu scorurile generate de instrumentele din acelaşi spaţiu psihologic.
Practic, prin conturarea atentă a bazei teoretice a constructului în prima etapă creştem
probabilitatea ca itemii elaboraţi ţinând cont de această bază să respecte această condiţie, adică
să aibă anumite legături statistice cu instrumentele deja validate şi recunoscute care evaluează
conceptele din acelaşi spaţiu.
Această etapă iniţială de definire teoretică se referă, mai precis, la trei tipuri de informaţii
pe care psihologul ar trebui să le cunoască vizavi de inserţia respectivului concept în ansamblul
dimensiunilor psihologice din care face parte:
a. distincţii, adică diferenţele faţă de alte concepte care, la o privire superficială, ar putea
părea apropiate. Prin răspunsul atent la întrebarea „ce nu este acest concept?”, ne asigurăm că
instrumentul construit va îndeplini unul din criteriile particulare ale validităţii de construct, şi
anume validitatea divergentă. Din punct de vedere psihometric, în acest fel se minimizează riscul
suprapunerilor cu alte concepte şi, implicit, cel al redundanţei instrumentului construit (sau al
unui set de itemi al acestuia).
b. dependenţe, adică dimensiunile psihologice supraordonate; practic, aceasta presupune
definirea conceptului vizat ca funcţie a unor alte concepte.
curs 2 9
Evaluare psihologică – metode psihometrice curs 2
c. relaţii, adică identificarea legăturilor cu alte concepte, fie ele pozitive (în sensul că
aşteptările teoretice susţin că prezenţa acelei caracteristici la un individ este însoţită de prezenţa
celeilalte) sau negative.
Ultimele două tipuri de informaţii au utilitate în special în ceea ce priveşte celălalt tip de
validitate de construct, şi anume validitatea convergentă.
În elaborarea itemilor scalei, teoria pe care se bazează constructul oferă puncte de reper
în două direcţii:
a. Conţinutul scalei, adică semnificaţiile pe care ar trebui să le acopere itemii construiţi,
prin operaţionalizarea constructului. În această privinţă, una dintre cele mai frecvent întâlnite
probleme este cea a dimensiunilor sau formelor particulare ale constructului şi a relaţiei dintre
acestea. Astfel, un construct poate avea două manifestări posibile şi opuse, ordonate pe o singură
dimensiune – construct unidimensional bipolar (de exemplu, în anumite teorii referitoare la
identitatea de gen, aceasta este conceptualizată ca o dimensiune psihologică cu doi poli -
masculinitate / feminitate – aflaţi în opoziţie, în sensul că individul se poate situa mai aproape de
unul dintre ei şi, implicit, mai departe de celălalt). Alte constructe implică două manifestări ce ar
putea fi considerate, la o privire superficială, ca având aceeaşi relaţie de opoziţie (de exemplu,
tendinţa de a trăi afecte pozitive, respectiv negative); în realitate, însă, teoriile din acest domeniu
(sprijinite de cercetări de neuropsihologie a emoţiilor) descriu acest concept ca fiind
bidimensional, fiecare din cele două tendinţe reprezentând factori separaţi (şi ortogonali, adică
necorelaţi statistic). Aceasta implică faptul că încadrarea individului la un nivel ridicat pe una din
dimensiuni nu implică neapărat un nivel redus al celeilalte. În fine, multe instrumentelor din
psihologie sunt pluri-factoriale, ele subsumând o serie de dimensiuni care reflectă faţete diferite
ale conceptului (de exemplu, instrumentele care operaţionalizează perspectiva Big Five asupra
personalităţii).
b. Formatul scalei, adică tipul de itemi şi de scale de răspuns din care este ea formată.
Uneori, teoria psihologică nu poate fi „tradusă” în instrumentul psihologic destinat să evalueze
acel concept decât într-o manieră foarte precisă – aşa cum este cazul teoriei constructelor
personale (Kelly, 1955/1991). Principiul acestei perspective este acela că oamenii nu
reacţionează la evenimente, ci la felul în care ei îşi reprezintă aceste evenimente; de aceea,
cunoaşterea psihologică trebuie să descifreze în primul rând constructele personale pe care
individul le aplică lui şi altora, adică sistemele de semnificaţii prin intermediul cărora individul
îşi reprezintă experienţele de viaţă. Prin investigarea acestor constructe, psihologul poate recrea
experienţa personală a acelui om şi îi poate construi alternative posibile.
Instrumentul tipic de evaluare utilizat în această abordare se bazează pe tehnica „reţelei
repertoriilor constructelor de rol” - Role Construct Repertory Grid (RepGrid). Cel mai frecvent,
instrumentul include descriptori ai subiectului şi ai altora semnificativi pentru el, adică tocmai
aceste constructe personale. În etapa premergătoare, de construcţie a instrumentului, se
inventariază constructele, adică descriptorii aplicaţi de subiect comparaţiilor propriei persoane cu
eul ideal şi alţii semnificativi; astfel, psihologul are acces la „repertoriul” său de constructe
2
curs 2 10
Evaluare psihologică – metode psihometrice curs 2
personale. Apoi, pentru fiecare descriptor, se enunţă şi opusul său (de exemplu, dacă unul din
constructele folosite cu predilecţie de individ în descrierea oamenilor este „înţelegător”,
instrumentul va include şi constructul „intransigent”). Instrumentul solicită subiectului să
evalueze pe rând o serie de repere (de exemplu, eul actual, ideal, alţii semnificativi) pe fiecare
dimensiune formată din cei doi poli, adică cele două constructe aflate în opoziţie; deci, el
poziţionează aceste repere pe “reţeaua de constructe” care îl caracterizează, în evaluarea fiecăruia
el trebuind să adopte un anumit „rol”, o modalitate de raportare psiho-socială (de exemplu,
poziţia sinelui actual faţă de cel ideal, rolul de fiu în evaluarea părinţilor, etc.). Practic, lui i se
cere să evalueze fiecare punct de reper pe o scală Likert de la 1 la 7 în funcţie de măsura în care
în caracterizează unul dintre cele două constructe opuse, unde 1 înseamnă “extrem de A”, iar 7
înseamnă “extrem de B”.
De asemenea, influenţa teoriei asupra formatului scalei apare şi în cazul tipului de item
cel mai simplu şi mai frecvent utilizat – Likert. Această variantă are, pe lângă avantajul
comodității, și pe cel al posibilității de a surprinde intensitatea acelei trăsături. Variantele de
răspuns ce pot fi incluse într-o scală Likert sunt multiple: de la “deloc” la “extrem de”,
3
curs 2 11
Evaluare psihologică – metode psihometrice curs 2
curs 2 12
Evaluare psihologică – metode psihometrice curs 2
deoarece estimarea nivelului său de aptitudine poate fi deja făcută cu suficientă precizie pe baza
curbei caracteristice a itemilor deja completaţi (a probabilităţilor ca el să aibă diverse niveluri de
aptitudine). Mai simplu spus, daca subiectul greşeşte la itemii simpli, probabilitatea ca el să aibă
un grad înalt a acelei aptitudini devine foarte redusă (apropiată de 0), deci este foarte probabil ca
nivelul său real de aptitudine să fie unul scăzut. În mod similar şi pentru acelaşi scop al
economiei de timp şi efort, există o serie de itemi foarte uşori (pe care marea majoritate a
oamenilor îi rezolvă fără probleme), care nu sunt incluşi în prima versiune a testului dată
subiectului. Lui i se administrează, însă, şi aceşti itemi suplimentari (meniţi a face diferenţa între
niveluri foarte reduse de aptitudine) dacă eşuează la primii din setul administrat iniţial.
Aceste principii care stau la baza teoriei răspunsului la item sunt aplicate în metodele de
scalare a răspunsurilor (cele mai utilizate fiind metodele Guttman şi Rasch), care se folosesc şi
în construcţia scalelor din alte domenii decât cel aptitudinal. De exemplu, scalarea Guttman în
construcţia scalelor are drept obiectiv fundamental eliminarea uneia dintre problemele cu care se
confruntă majoritatea instrumentelor psihologice, şi anume contaminarea semnificaţiei itemilor
cu alte trăsături psihologice decât cea vizată; din cauza acestei contaminări, psihologul care
administrează instrumentului nu poate fi pe deplin sigur că răspunsul subiectului este generat
doar de caracteristica psihologică pe care o vizează explicit instrumentul sau d acă el n u este
influenţat de faptul că anumite nuanţe ale itemilor sunt relevante pentru alte caracteristici
neintenţionate (tema va fi reluată în cadrul cursului despre validitatea de conţinut). Deci, scopul
scalării de tip Guttman este unidimensionalitatea scalei, adică situaţia în care răspunsurile
subiectului ar fi influenţate de un singur factor: trăsătura evaluată.
Şi aici, itemii sunt ordonaţi după intensitatea cu care reflectă constructul vizat, iar
răspunsurile solicitate subiectului sunt de obicei de tip da/nu. Principiul aplicat pentru a urmări
scopul menţionat mai sus este acela că la scalele perfect unidimensionale, cunoaşterea scorului
total al unui subiect ar trebui să permită reproducerea răspunsurilor sale la itemi, deoarece
acordul cu un item puternic implică acordul şi cu itemii mai slabi decât el. Deci, dacă am
cunoaşte cu câţi itemi a fost el de acord (prin intermediul scorului total, răspunsurile de tip Da
fiind cotate cu 1 şi cele de tip Nu cu 0), ar trebui să ghicim corect toţi itemii cu care a fost el de
acord (şi, implicit, cei la care a răspuns negativ).
Un exemplu de scalare într-un alt domeniu decât cel aptitudinal este scala de distanţă
socială Bogardus, elaborată în scopul evaluării tendinţei de discriminarea a altor rase sau naţiuni.
Instrumentul solicită subiectului să îşi manifeste acordul sau dezacordul cu o serie de acţiuni
potenţiale pe care le-ar putea realiza reprezentantul unui alt grup social; aceste acţiuni sunt
ordonate în funcţie de intensitatea discriminării pe care o reflectă; o variantă de ierarhie a
itemilor este cea din lista de mai jos, mergând de la acţiunea a cărei acceptare ar reflecta cel mai
redus grad de tendinţe de discriminare socială la cea de la polul opus.
• Căsătorie cu o rudă apropiată (de exemplu, cu fiica subiectului)
• Membri în acelaşi club
• Vecini de stradă
5
curs 2 13
Evaluare psihologică – metode psihometrice curs 2
curs 2 14
Evaluare psihologică – metode psihometrice curs 2
Această abordare este cea folosită intensiv în primele etape ale construcţiei testelor de
personalitate, ea stând la baza elaborării celor mai cunoscute astfel de instrumente, ce vizează
întreaga sferă a personalităţii. Instrumentele construite astfel sunt deseori validate prin metoda
“grupurilor cunoscute”, care evaluează măsura în care instrumentul discriminează între două
grupuri despre care se cunoaşte faptul că posedă tipuri diferite (opuse sau nu) ale respectivei
trăsături; de exemplu, în cazul instrumentului de temperament, un indiciu al validităţii sale ar fi
acela că scorurile totale obţinut de un grup de persoane despre care psihologul ştie din alte surse
(alte instrumente, evaluare clinică, etc.) că sunt introvertite ar fi semnificativ diferite (în direcţia
aşteptată) faţă de cele obţinute de un grup de extravertiţi.
Dincolo de validarea scalei pe ansamblul său, aceeaşi abordare empirică poate fi folosită
şi în selecţia itemilor, adică decizia de păstrare a una dintre ei pe baza corespondenţei lor
statistice cu un criteriu exterior. De obicei, scopul acestei selecţii este construirea unui
instrument cu putere mare de predicţie a unui criteriu, adică a unor comportamente sau stări
psihologice ale individului (de exemplu, probabilitatea ca el să dezvolte depresie). Acest obiectiv
poate fi urmărit prin trei metode psihometrice:
a. Metoda grupurilor cunoscute este similară celei descrise mai sus cu privire la
validarea instrumentului pe ansamblul său. De această dată, criteriul de selecţie a itemilor este
diferenţa dintre mediile celor 2 grupuri la fiecare dintre itemi, fiind selectaţi itemii cu diferenţele
maxime de medii, deci care diferenţiază cel mai puternic între cele două grupuri (de exemplu, cei
cu diagnostic clinic de depresie şi cei clinic sănătoşi).
Pe lângă utilizarea acestei diferenţe de medii ca criteriu de selecţie, ea poate fi inclusă şi
în cotarea instrumentului final, în sensul că ea poate fi folosită ca pondere în calculul scorului
total al subiectului. Astfel, itemii care diferenţiază mai puternic între cele două grupuri devin mai
importanţi în scorul total al subiectului decât ceilal ți . Prin această metodă se obține un tip
specific de instrument de evaluare, denumit ”scala cu intervale egale aparente”, sau de tip
Thurstone (după numele autorului ce a introdus-o). Într-un astfel de instrument, subiectului i se
prezintă lista de itemi, iar el îi alege pe cei cu care este de acord, sau despre care consideră că îl
caracterizează cel mai bine. Un exemplu de instrument construit prin această abordare este scala
Beck de evaluare a depresiei care, în versiunea originară, conține colecții de câte patru itemi
grupate pe arii psihologice; fiecare dintre itemi are o anumită pondere, ce ține de intensitatea
respectivei trăsături psihologice pe care o relevă. De exemplu, itemii grupați în trăsătura
”sentimentul eșecului” sunt: ”1. Nu am sentimentul ratării. 2. Simt că am avut mai mult ghinion
decât persoanele din jur. 3. Dacă îmi privesc viața retrospectiv o văd ca pe o totalitate de eșecuri.
4. Mă simt complet ratat ca persoană.”. Itemii sunt ordonați crescător în funcție de ponderea lor;
valoarea specifică a acestor ponderi în orice populație variază cultural, și deci ar trebui calculată
prin studii asupra unor loturi extrase din acea populație. Cu cât diferențele între răspunsuril e
loturilor non-clinice și cele ale persoanelor cu depresie sunt mai mari pe un item, cu atât acel
item ar urma să aibă o pondere mai mare. Aceeași idee este ilustrată de un alt instrument -
Profilul Impactului Bolii (SIP, Bergner et. al., 1981). De exemplu, factorul ”Impactul social al
7
curs 2 15
Evaluare psihologică – metode psihometrice curs 2
bolii” include la extrema puternică următorii itemi (fiecăruia îi este atașată o pondere extrasă din
studiile de pretestare pe populaţia americană): ”Am izbucniri frecvente de furie faţă de ceilalţi
membri ai familiei (pondere 11,9); Refuz contactul cu orice membru al familiei (pondere 11,5);
Mă izolez cât pot de mult de restul familiei (pondere 10,2)”. Itemii de la extrema slabă a acestui
factor sunt: ”Am mai puţine activităţi sociale în grupuri de oameni (pondere 3,6); Vizitele la
prieteni sunt mai scurte (pondere 4,3); Nu mai glumesc cu membrii familiei aşa cum obişnuiam
înainte (pondere 4,3)”.
În cotarea acestui tip de instrumente, scorul fiecărui subiect este calculat ca media
valorilor (ponderilor) itemilor aleşi de el. În cazul instrumentelor cu subscale (factori), calcularea
scorurilor pe fiecare dintre acestea presupune adunarea ponderilor itemilor aleşi şi împărţirea la
scorul maxim posibil la acea subscală; prin această operaţie se pot compara scorurile la diversele
subscale ale instrumentului, obţinând un profil general al individului.
curs 2 16
Evaluare psihologică – metode psihometrice curs 2
versiunea iniţială a scalei au aceeaşi capacitate de discriminare a altor grupuri decât cele pe care
a fost ea construită.
c. Instrumentele construite astfel nu stimulează teoria psihologică, deoarece ele nu
vizează relaţii teoretice între constructul vizat şi altele.
Pe fondul acestor probleme, şi mai ales odată cu creşterea importanţei validităţii de
construct în literatura ştiinţifică pe tema construcţiei instrumentelor psihologice, folosirea acestei
abordări a devenit din ce în ce mai puţin frecventă. Totuşi, 17 % din testele disponibile acum (în
special cele de personalitate) sunt construite astfel, selecţia itemilor ce le compun fiind realizată
mai ales prin metoda grupurilor cunoscute.
Pentru a evita erorile la care pot duce aceste scale, se recomandă:
a. utilizarea unor grupuri de contrast mari (peste 300 de subiecţi)
b. validarea scalei după selecţia itemilor şi pe alte eşantioane din populaţie, pentru a
verifica semnificaţia diferenţelor sau corelaţiilor, măsura în care ele pot fi generalizate.
curs 2 17
Evaluare psihologică – metode psihometrice curs 2
relevanţa etaloanelor sale pentru celelalte populaţii definite de rasă. Această obiecţie, împreună
cu altele, au motivat construcţia în 1989 a celei de-a doua versiuni, conţinând 567 itemi, pe un
eşantion de peste 2000 de subiecţi din toate zonele şi comunităţile S.U.A. În fine, ultima versiune
elaborată - MMPI-2 Restructured Form (MMPI-2-RF) şi publicată în 2008 include 338 itemi;
specificul său în raport cu cele anterioare este abandonarea punctului de reper exclusiv empiric în
construcţia şi selecţia itemilor; o parte dintre scalele acestei versiuni contemporane sunt
construite teoretic; de exemplu, una dintre scalele introduse în ea este cea de Demoralizare,
elaborată pe baza teoriilor despre structura ierarhică a stărilor afective.
Bibliografie
• Aiken, L.R. (2000). Psychological testing and assessment, (10th edition), Allyn and Bacon
• Bergner M, Bobbitt RA, Carter WB, Gilson BS. (1981). The Sickness Impact Profile: development and
final revision of a health status measure. Med Care; 19(8):787-805.
• Bohrnstedt G. (1983). Measurement. în Rossi PH, Wright JD, Anderson AB (Eds.) Handbook of Survey
Research. Orlando , FL : Academic Press
• Dawis, R. (1998). Scale Construction, în Kazdin, A. E. (Ed.), Methodological issues & strategies in clinical
research, Washington, DC : American Psychological Association
• Feixas, G., Erazo-Caicedo, M., Harter, S., Bach, L. (2008). Construction of Self and Others in Unipolar
Depressive Disorders: A Study Using Repertory Grid Technique. Cogn Ther Res 32:386–400
• Fischer J & Corcoran K (2007). Measures for clinical practice: A sourcebook. 4nd Ed., New York: Oxford
University
• Hathaway, S.R., & McKinley, J.C. (1943). The Minnesota Multiphasic Personality Inventory (Rev.ed.).
Minneapolis: University of Minnesota Press.
• Kelly, G. A. (1955/1991). The Psychology of personal constructs (Vol. 2). New York: Norton/London:
Routledge.
• Kerlinger, F.N. (1986). Foundations of behavioral research (3rd ed.) New York: Holt, Rinehart and
Winston.
• Switzer, G., et al. (2000). Measurement issues in intervention research. în R. Schulz (Ed.), Handbook on
dementia caregiving: Evidence-based interventions for family caregivers. New York: Springer
• Toyer EA, Weed NC. (1998). Concurrent validity of the MMPI-A in a counseling program for juvenile
offenders. Journal of Clinical Psychology 54(4):395-9.
10
curs 2 18
Evaluare psihologică – metode psihometrice curs 3
Fidelitatea instrumentelor
1. Definire
Definiţia generală a fidelităţii este cea conform căreia ea reprezintă măsura în care scorul
obţinut de subiect la respectivul instrument de evaluare psihologică („scor observat”) corespunde
„scorului adevărat”, adică celui care ar fi fost obţinut cu un instrument perfect, fără eroare. În
termeni tehnici, ea se referă la gradul în care diferenţele dintre subiecţi în ceea ce priveşte
scorurile lor la instrument sunt generate de diferenţele de „scor adevărat” dintre ei, adică de
anumite caracteristici psihologice pe care ei le posedă. Această temă a diferenţelor dintre subiecţi
este exprimată în psihometrie prin intermediul conceptului de „varianţă”; astfel, definiţia de mai
sus poate fi tradusă prin proporţia de varianţă observată (a scorurilor observate) care provine din
varianţa adevărată. Cu cât diferenţele dintre subiecţi la scorurile obţinute la acel instrument sunt
în mai mare măsură determinate de diferenţele lor reale de ordin psihologic, cu atât instrumentul
are o fidelitate mai mare; cu alte cuvinte, el oferă „imagini mai fidele” asupra caracteristicilor lor
mentale.
În realitate, nici un instrument psihologic nu are o fidelitate perfectă, deoarece scorurile
observate sunt întotdeauna afectate de diverse surse de eroare – completare superficială,
înţelegere greşită sau parţială a sensului itemilor, oboseală, tendinţe de a răspunde într-o anumită
manieră (scorul fiind, în consecinţă, altul decât cel real psihologic), etc. De aceea, scopul
construcţiei instrumentelor psihologice nu este cel de a obţine instrumente cu fidelitate perfectă,
ci doar cu un nivel satisfăcător al acestei calităţi psihometrice, astfel încât prin folosirea lor să
poată fi obţinute informaţii cu un grad suficient de precizie despre nivelul prezenţei acelei
dimensiuni psihologice. Eroarea este admisă, cu condiţia ca ea să nu depăşească anumite limite,
şi, de asemenea, cu condiţia ca ea să poată fi estimată la anumite grade de probabilitate.
curs 3 19
Evaluare psihologică – metode psihometrice curs 3
curs 3 20
Evaluare psihologică – metode psihometrice curs 3
itemi, care să nu fie vizibile la examinarea indicatorului de ansamblu al mediei. Mai mult, este
posibil ca instrumentul să aibă mai mulţi factori ortogonali, adică cu corelaţii nule între itemii din
fiecare, şi deci el să vizeze dimensiuni psihologice în plus faţă de cele pe care ar trebui să le
evalueze. Din aceste motive, trebuie examinată şi matricea inter-corelaţiilor, conţinând corelaţiile
dintre fiecare pereche itemi în sine; valoarea fiecărei corelaţii ar trebui să se încadreze în acelaşi
interval - între 0,15 şi 0,5.
c. corelaţia itemului cu scorul total al instrumentului oferă o estimare a legăturii
fiecărui item cu ansamblul itemilor instrumentului, similară procedeului alfa Cronbach, dar
recomandabilă în special în cazurile în care limitările matematice ale acestuia ridică semne de
întrebare cu privire la validitatea sa.
d. analiza factorială poate fi utilizată în estimarea consistenţei interne, prin intermediul
asocierilor calculate între fiecare item şi factorul din care face parte. Ea se foloseşte în acest
context în special în cazul unui număr mare de itemi, construiţi pentru măsurarea mai multor
dimensiuni ale constructului, adică a situaţiei în care alfa Cronbach devine aproape inutil ca
valoare informaţională. Şi acest procedeu are însă un dezavantaj, şi anume numărul mare de
subiecţi (200 – 300) necesar în pretestarea instrumentului.
e. split-half reprezintă o metodă de estimare a consistenţei interne ce calculează corelaţia
dintre două jumătăţi ale instrumentului. Aceste jumătăţi pot fi stabilite în diverse forme; corelaţia
split-half poate fi calculată între prima jumătate dintre itemi cu cea de-a doua, între jumătatea ce
conţine itemii cu numere de ordine impare cu cea a itemilor pari („odd – even”), sau între
jumătăţi construite aleator. Pentru a ajunge la o evaluare cât mai completă a fidelităţii
instrumentului, în etapa de pretestare ar trebui evaluate corelaţiile dintre toate jumătăţile sale
posibile.
O problemă de ordin matematic a acestui procedeu este aceea că toate aceste metode de
stabilire a celor două jumătăţi de instrument (deci, toţi coeficienţii split-half) subestimează
consistenţa internă, deoarece corelaţia rezultată între jumătăţi este influenţată de numărul total de
itemi ai instrumentului. Mai precis, din cauza faptului că fiecare dintre jumătăţi conţine un număr
semnificativ mai mic de itemi decât instrumentul în sine, corelaţia dintre ele va fi întotdeauna
mai redusă decât adevăratul nivel de consistenţă internă al itemilor acestuia. Pentru eliminarea
acestei probleme se utilizează un procedeu de corecţie matematică (inclus în mod automat şi în
procedura split-half din SPSS), bazat pe formula Spearman – Brown. Această formulă este una
generală, ea acoperind toate situaţiile în care estimează fidelitatea unui instrument pornind de la
un set redus de itemi ai acestuia, deci de la o parte a sa. Formula Spearman – Brown generală
este următoarea:
Aici, N se referă la de câte ori este mai mare instrumentul respectiv faţă de setul de itemi
care a fost extras din el (şi căruia i-a fost calculată fidelitatea), ρxx’ înseamnă coeficientul de
fidelitate al acestui set de itemi, iar ρ*xx’ înseamnă coeficientul de fidelitate final al
instrumentului.
3
curs 3 21
Evaluare psihologică – metode psihometrice curs 3
Comparând ultimele două coloane ale tabelului, se observă faptul că diferenţele dintre
fidelităţile instrumentului iniţial şi a celui scurtat sunt din ce în ce mai mici pe măsură ce
fidelitatea primului este mai ridicată. De exemplu, un instrument cu jumătate din itemii unuia cu
fidelitate de 0,5 ar avea o fidelitate de 0,33 – diferenţa fiind de 0,17; la extrema opusă, un
instrument cu jumătate din itemii unuia cu fidelitate de 0,95 ar avea o fidelitate de 0,90, diferenţa
4
curs 3 22
Evaluare psihologică – metode psihometrice curs 3
fiind în acest caz de doar 0,5. Deci, scurtarea instrumentelor afectează fidelitatea celor cu nivel
redus şi mediu de fidelitate (sub 0,8) mai mult decât a celor cu grad ridicat de fidelitate. De
aceea, instrumentele cu fidelitate foarte ridicată pot fi scurtate cu pierderi nesemnificative ale
acestei calităţi psihometrice (în cazul unui instrument cu fidelitate de peste 0,9, chiar şi un subset
format dintr-un sfert din itemii săi ar forma un nou instrument cu fidelitate acceptabilă, în special
în scopuri de cercetare psihologică – în jur de 0,7).
„Paradoxul atenuării”
Dacă un item ce reflectă un aspect central al teoriei este exclus de analiza de consistenţă
internă, eliminarea sa nu este neaărat obligatorie; păstrarea sa poate fi utilă pentru conţinutul
instrumentului, iar calculele de consistenţă internă pot să îl indice ca fiind deficitar din alte
motive. Astfel, este posibil să nu fie suficienţi itemi vizând acel aspect psihologic specific la care
se referă itemul (în contrast cu majoritatea itemilor care vizează alt aspect); în acest caz, relaţiile
statistice dintre acel item şi restul ar fi reduse, chiar dacă itemul este important. De asemenea,
este posibil ca eşantionul din pretestare să nu fie reprezentativ pentru populaţia vizată, să difere
de aceasta în anumite privinţe importante.
O soluţie care ţine cont de aceste posibile surse ale relaţiilor slabe ale unui item cu restul
este cea de a adăuga itemi, al căror conţinut să fie cu precădere apropiat de cel al respectivului
item despre care analizele statistice sugerează că ar trebui exclus. Astfel se evită pericolul
„paradoxului atenuării”, adică cel ca creşterea consistenţei itemilor prin eliminarea unora dintre
ei să scadă validitatea de construct a instrumentului; în consecinţă, aria de acoperire psihologică
a acestuia ar putea deveni mai redusă decât constructul – ţintă vizat de el.
Deci, fidelitatea estimată prin consistenţa internă a itemilor nu reprezintă un criteriu
decisiv în evaluarea unui instrument psihologic; ea poate fi relativ uşor asigurată, chiar dacă
valoarea acelui instrument ar fi una discutabilă. Astfel, o consistenţă internă mare se poate obţine
prin utilizarea mai multor itemi sinonimi – şi deci redundanţi, dar care vizează un singur aspect
particular. În acest caz, instrumentul ar avea o arie de acoperire – şi deci o validitate – foarte
redusă. În general, se consideră că scopul analizei psihometrice este maximizarea validităţii, nu a
fidelităţii; în privinţa acesteia, după atingerea unui nivel acceptabil (de 0,8 în cazul alfa
Cronbach, de exemplu) cu minim 5 itemi pentru conceptele foarte specifice şi 30 de itemi pentru
cele generale, nu mai este necesară modificarea instrumentului sau, în orice caz, nu mai este
nevoie de eliminarea de itemi pentru a creşte şi mai mult consistenţa internă.
O altă limită a perspectivei consistenţei interne asupra fidelităţii este cea care vizează
scalele construite prin metoda criteriului exterior. Scopul acestor instrumente este în special
predicţia unui criteriu, a unui comportament real al acelei persoane (de exemplu, predicţia
probabilităţii de a dezvolta tulburări mentale, ca în unele din scalele MMPI). În general,
majoritatea acestor criterii sunt multidimensionale, în sensul că implică un set divers de aspecte
psihologice. Ca urmare, şi instrumentele de acest tip conţin itemi ce se referă la dimensiuni
psihologice diverse, deci ele tind să fie heterogene, şi astfel să aibă o consistenţă internă redusă.
curs 3 23
Evaluare psihologică – metode psihometrice curs 3
curs 3 24
Evaluare psihologică – metode psihometrice curs 3
Cu cât fidelitatea testului este mai mare, cu atât o proporţie mai mare din scorurile
observate la instrument provin din scorurile adevărate. Totuşi, eroarea este prezentă în orice
instrument, iar în folosirea practică a acestuia este importantă cunoaşterea magnitudinii sale.
Indicatorul care ne poate informa cu privire la acest aspect este eroarea standard de măsurare,
care, tehnic, reprezintă abaterea standard a erorii conţinute de instrument, Aceasta poate fi
calculată pe baza a doi parametri ai instrumentului: abaterea standard a scorurilor observate (Sy)
şi coeficientul de fidelitate (rxx’), după formula:
SE = S y 1 − rxx '
Această formulă este aplicabilă prin estimarea fidelităţii prin consistenţa internă a
itemilor prin coeficientul alfa Cronbach; deci, valoarea coeficientului de fidelitate rxx’ este cea a
lui alfa. Eroarea standard de măsurare poate fi utilizată, la rândul ei, în următoarele aplicaţii:
a. pe baza ei se poate determina schimbarea de scoruri de la o aplicare la alta care poate
proveni din eroarea instrumentului. De exemplu, în cazul unui instrument cu o eroare standard de
măsurare cu valoarea 4, o schimbare a scorului obţinut de un individ de la 20 la 24 de la o
administrare la alta este probabil determinată de eroarea de măsurare, deci ea nu reflectă o
schimbare psihologică reală. Cu alte cuvinte, doar schimbările mai mari decât eroarea standard
de măsurare pot fi considerate a fi reale.
În cazul în care suntem interesaţi de alegerea unui instrument cu o eroare de măsurare
minimă dintre mai multe disponibile, trebuie ţinut cont de faptul că acest parametru depinde de
amplitudinea instrumentului, adică de diferenţa dintre scorul maxim posibil şi cel minim posibil.
De aceea, nu se pot compara direct erorile standard ale unor instrumente diferite, ci ele trebuie
convertite mai întâi în procente, prin formula: SE * 100 / A (unde A = amplitudinea).
curs 3 25
Evaluare psihologică – metode psihometrice curs 3
este mai fidel, cu atât media eşantionului este mai apropiată de cea a populaţiei; distanţa dintre
cele două este măsurată prin indicatorul denumit „eroarea standard a mediei”, care sintetizează
acurateţea măsurării populaţiei prin intermediul acelui eşantion.
Un factor important al acestei acurateţi este fidelitatea instrumentului folosit; cu cât el
este mai fidel, cu atât media eşantionului va aproxima mai bine media populaţiei, şi deci o vom
putea localiza pe aceasta într-un interval mai restrâns şi vom putea face estimări mai precise.
Instrumentele cu fidelitate redusă nu ne permit decât estimări vagi, deoarece gradul lor de eroare
(similar sondajelor de opinie) este unul mare. Un alt factor al erorii standard a mediei este
volumul eşantionului pe care a fost aplicat instrumentul; fireşte că eşantioanele mari duc la
estimări mai precise decât cele care conţin puţin indivizi. Totuşi, relaţia dintre cele două aspecte
nu este una perfectă, mai ales ţinând cont şi de criteriul fidelităţii. Tabelul următor prezintă
erorile standard ale mediilor (fiind standard, ele sunt exprimate în sistemul de referinţă al
scorurilor standardizate z, de la -3 la 3) în funcţie de fidelitatea instrumentului folosit şi de
numărul de subiecţi din eşantion.
Fidelitate Nr subiecţi
10 30 100 300 1000
0,3 0,57 0,33 0,183 0,1 0,058
0,4 0,50 0,28 0,15 0,09 0,05
0,5 0,44 0,25 0,14 0,08 0,045
0,6 0,40 0,23 0,129 0,07 0,041
0,7 0,37 0,21 0,120 0,069 0,038
0,8 0,35 0,20 0,11 0,065 0,035
0,9 0,33 0,19 0,10 0,061 0,033
0,95 0,32 0,187 0,10 0,059 0,032
1 0,31 0,183 0,10 0,058 0,032
Valorile accentuate în tabel (0,183 şi 0,33) indică evidenţiază importanţa ambilor factori:
combinaţiile dintre diverse fidelităţi şi volume ale eşantionului pot genera aceleaşi erori standard
ale mediilor, deci acelaşi grad de eroare în măsurarea populaţiei. De exemplu, un instrument cu
fidelitate apropiată de cea perfectă (aproape de 1) ar măsura cu aceeaşi precizie populaţia prin
intermediul unui eşantion de 30 de oameni cu cea a unui instrument cu fidelitate slabă (0,3)
aplicat pe 100 de oameni. Aşadar, fidelităţile mari ale instrumentelor permit economii în ceea ce
priveşte numărul necesar de subiecţi pentru a ajunge la un anumit nivel de precizie.
curs 3 26
Evaluare psihologică – metode psihometrice curs 3
Bibliografie
• Aiken, L.R. (2000). Psychological testing and assessment, (10th edition), Allyn and Bacon
• Bohrnstedt G. (1983). Measurement. în Rossi PH, Wright JD, Anderson AB (Eds.) Handbook of Survey
Research. Orlando , FL : Academic Press
• Cohen, R., Swerdlik, M., & Smith, D. (2009). Psychological testing and assessment: An introduction to
tests and measurements (7th ed.). New York: McGraw-Hill
• Fischer J., Corcoran K. (2007). Measures for clinical practice: A sourcebook. 4nd Ed., New York: Oxford
University
• Kerlinger, F.N. (1986). Foundations of behavioral research (3rd ed.) New York: Holt, Rinehart and
Winston.
• Nunnally, J., Bernstein, I. (1994) Psychometric Theory. New York: McGraw Hill, 3rd ed.
• Rosenthal, J. A. (1994). Reliability and social work research. Social Work Research, 18, 115-121.
• Switzer, G., et al. (2000). Measurement issues in intervention research. în R. Schulz (Ed.), Handbook on
dementia caregiving: Evidence-based interventions for family caregivers. New York: Springer
• Urbina. S. (2004). Essentials of Psychological Testing, John Wiley & Sons, Inc.
curs 3 27
Evaluare psihologică – metode psihometrice curs 4
Validitatea instrumentelor
curs 4 28
Evaluare psihologică – metode psihometrice curs 4
2. Tipuri de validitate
Ca şi în cazul fidelităţii, validitatea reprezintă o calitate psihometrică abstractă; evaluarea
ei nu se poate face decât prin intermediul unor faţete particulare. Totuşi, spre deosebire de
fidelitate, unde fiecare astfel de faţetă este susţinută de o perspectivă distinctă şi auto-suficientă
(în sensul că de multe ori estimarea fidelităţii se realizează printr-o singură abordare din cele trei
posibile), estimarea validităţii necesită toate abordările enumerate mai jos (primele trei fiind cele
„tradiţionale” în această arie, iar tehnicile care se referă la ultimul tip reprezentând preocupări
mai recente în psihodiagnostic). Deci, susţinerea validităţii unui instrument se bazeză pe dovezi
ce se referă la toate aceste tipuri; ele nu sunt abordări echivalente între ele, ci planuri diferite de
analiză ce compun împreună validitatea instrumentului.
Principalele tipuri de validitate a instrumentelor din evaluarea psihometrică sunt
următoarele:
• De conţinut
• De criteriu
• De construct
• Incrementală
Acest tip de validitate are în atenţie măsura în care itemii scalei acoperă satisfăcător
conţinutul conceptului evaluat de acel instrument. Se presupune că orice concept psihologic
poate fi vizat de o populaţie infinită de itemi posibili; instrumentul are validitate de conţinut dacă
itemii săi compun un eşantion reprezentativ din această populaţie. Această problemă are două
componente, corespunzătoare celor două forme ale validităţii de conţinut, ambele focalizate pe
conţinutul itemilor şi a conceptului psihologic evaluat de instrument, şi anume:
a. Validitatea aparentă se referă la gradul în care fiecare item din instrument se
încadrează în aria psihologică a conceptului vizat. Evaluarea ei se face prin raţionament (aşa-
numita „metodă a experţilor”), judecându-se potrivirea dintre fiecare item şi constructul pe care
îl evaluează instrumentul.
curs 4 29
Evaluare psihologică – metode psihometrice curs 4
b. Validitatea logică se referă la măsura în care ansamblul de itemi acoperă toate faţetele
conceptului vizat; ea presupune tot o evaluare subiectivă, prin analiza psihologică a conceptului,
identificarea tuturor nuanţelor sale şi judecarea gradului în care fiecare dintre acestea se
regăseşte în conţinutul itemilor.
În ambele cazuri, un nivel satisfăcător de validitate de conţinut necesită nu doar ca
dimensiunea psihologică vizată să fie acoperită corespunzător (aspect important pentru creşterea
varianţei pertinente a instrumentului), ci şi ca itemii să nu invoce alte dimensiuni (crescând astfel
varianţa non-pertinentă), adică să ducă la răspunsuri generate de alte caracteristici psihologice
ale subiecţilor care îl completează. Acest aspect este investigat prin intermediul conceptului de
„erori de răspuns”.
a. Dezirabilitatea socială
Cea mai frecventă sursă de contaminare a instrumentelor psihologice este dezirabilitatea
socială, definită de obicei ca tendinţa de a proiecta o imagine pozitivă în exterior. Itemii multor
instrumente permit contaminarea răspunsurilor cu această caracteristică, deoarece ei plasează
subiectul în situaţii în care el devine motivat să ofere un răspuns care să implice faptul că posedă
trăsături pozitive şi, de asemenea, pentru că ei permit subiectului să dea un răspuns dezirabil
social (anumite instrumente nu oferă subiectului această posibilitate; de exemplu, tehnicile
implicite de evaluare psihologică scad capacitatea lui de a-şi controla răspunsurile, evitându-se
aproape complet această problemă a dezirabilităţii sociale).
curs 4 30
Evaluare psihologică – metode psihometrice curs 4
b. Tendinţa de achiesare
Aceasta reprezintă un alt factor ce poate induce distorsiuni ale răspunsurilor; de data
aceasta, el ţine cu precădere de caracteristicile psihologice ale individului căruia îi este
administrat instrumentul, însă prin cunoaşterea acestei surse de eroare pot fi luate măsuri în
construcţia formatului acestuia astfel încât influenţa ei să fie minimizată.
Ea presupune tendinţa de a aproba toţi itemii, şi are două forme, fiecare dintre ele putând
fi specifice unui individ:
4
curs 4 31
Evaluare psihologică – metode psihometrice curs 4
curs 4 32
Evaluare psihologică – metode psihometrice curs 4
curs 4 33
Evaluare psihologică – metode psihometrice curs 4
itemi care să genereze la răspunsuri construite de subiect prin intermediul acestor strategii cu
nivel ridicat de validitate.
curs 4 34
Evaluare psihologică – metode psihometrice curs 4
Bibliografie
• Aiken, L.R. (2000). Psychological testing and assessment, (10th edition), Allyn and Bacon
• Bohrnstedt G. (1983). Measurement. în Rossi PH, Wright JD, Anderson AB (Eds.) Handbook of Survey
Research. Orlando , FL : Academic Press
curs 4 35
Evaluare psihologică – metode psihometrice curs 4
• Clark, L. A., & Watson, D. (1995). Constructing validity: Basic issues in scale development. Psychological
Assessment, 7, 309-319.
• Cohen, R., Swerdlik, M., & Smith, D. (2009). Psychological testing and assessment: An introduction to
tests and measurements (7th ed.). New York: McGraw-Hill
• Crowne, D. P., & Marlowe, D. (1960). A new scale of social desirability independent of psychopathology.
Journal of Consulting Psychology, 24, 349–354.
• Fischer J., Corcoran K. (2007). Measures for clinical practice: A sourcebook. 4nd Ed., New York: Oxford
University
• Gordon, E., Holden, R. (1996). Use of item ratings to examine personality test item cognitive response
processes. Personality and Individual Differences Vol. 21, No. 6, pp. 897-905.
• Havârneanu, C. (2000). Cunoaşterea psihologică a persoanei, Iaşi, Polirom
• Kerlinger, F.N. (1986). Foundations of behavioral research (3rd ed.) New York: Holt, Rinehart and
Winston.
• Konstabel, K., Aavik, T., Allik, J. (2006). Social Desirability and Consensual Validity of Personality Traits,
European Journal of Personality 20: 549–566
• Messick, S. (1995). Validity of psychological assessment: Validation of inferences from persons' responses
and performances as scientific inquiry into score meaning. American Psychologist, Vol 50(9), 741-749.
• Nunnally, J., Bernstein, I. (1994) Psychometric Theory. New York: McGraw Hill, 3rd ed.
• Switzer, G., et al. (2000). Measurement issues in intervention research. în R. Schulz (Ed.), Handbook on
dementia caregiving: Evidence-based interventions for family caregivers. New York: Springer
• Urbina. S. (2004). Essentials of Psychological Testing, John Wiley & Sons, Inc.
curs 4 36
Evaluare psihologică – metode psihometrice curs 5
În psihologie rareori sunt evaluate concepte concrete şi observabile, sau care să aibă
manifestări exterioare uşor de remarcat şi direct asociate cu ele; un exemplu de caracteristică ce
implică astfel de manifestări este dependenţa de modificări corporale, ce poate fi evaluată prin
intermediul schimbărilor corporale vizibile (tatuaje, piercing-uri, etc.) ale persoanei. Însă de cele
mai multe ori sunt utilizate instrumente ce vizează concepte latente şi abstracte, denumite
„constructe”.
Premisa în construcţia unui instrument psihologic este că toate constructele au o serie de
manifestări care pot fi evaluate prin intermediul unor itemi; deci, ansamblul acestor itemi se
referă la un set de comportamente care ar trebui să fie inter-relaţionate, în virtutea faptului că
sunt generate sau cel puţin influenţate de acelaşi construct. Analiza validităţii de construct se
referă la măsura în care instrumentul permite evaluarea unui construct prin intermediul acelui set
de comportamente observabile prin care este el operaţionalizat în itemi.
Experienţa construcţiei instrumentelor psihologice arată că unele constructe sunt mai uşor
de operaţionalizat decât altele; de asemenea, în cazul unor constructe încrederea pe care o putem
avea în instrumentele elaborate pentru a le evalua este mai mare decât în cazul altora. De
exemplu, viteza de reacţie – ca trăsătură individuală – poate fi măsurată printr-un număr redus de
metode, ale căror rezultate sunt puternic corelate. Pe de altă parte, anxietatea reprezintă un
construct ale cărui instrumente dezvoltate până acum sunt mai puţin consensuale. Ea poate fi
evaluată prin metode diverse, însă studiile indică faptul că această diversitate a metodelor este
însoţită şi de o diversitate a rezultatelor; de exemplu, între rezultatele scalelor de auto-raportare
şi cele de observaţie clinică există de obicei corelaţii slabe, deci evaluările aceluiaşi individ prin
cele două abordări pot fi diferite. Acelaşi lucru poate fi valabil şi în cazul folosirii instrumentelor
psihometrice.
Pentru a elucida această problemă a corespondenţei dintre itemi şi construct, perspectiva
validităţii de construct se focalizează pe încadrările teoretice ale acestuia. Astfel, teoria pe care se
bazează constructul cuprinde, pe de o parte, definiţiile acelui concept, dar şi „reţeaua sa
nomologică”, adică acele constructe apropiate psihologic de cel vizat. Scopul procedurilor de
estimare a validităţii de construct este acelaşi ca cel al validităţii în general, adică cel de a
identifica sursele diferenţelor dintre scorurile la instrument, ale varianţei observate. Un
instrument valid este cel care generează scoruri ce provin din constructul urmărit şi nu din altele
irelevante sau din alte surse de eroare. Pentru a obţine informaţii despre sursele varianţei
scorurilor, în estimarea validităţii de construct există trei abordări, fiecare putând fi pusă în
practică prin anumite metode.
Curs 5 37
Evaluare psihologică – metode psihometrice curs 5
observaţiile sunt inter-corelate, atunci poate fi postulat (acceptat) un construct psihologic care să
le explice.
Această perspectivă este doar una parţială, deoarece acest construct poate fi altul decât
cel vizat de instrument; deci, la fel ca în cazul fidelităţii în general, consistenţa internă este
necesară, dar nu suficientă pentru a susţine validitatea de construct. Totuşi, atunci când
consistenţa internă este de nivel redus, ea reprezintă un indicator cert al unei validităţi de
construct nesatisfăcătoare a acelui instrument.
b. validitatea convergentă se referă la legăturile instrumentului cu altele ce măsoară
concepte apropiate (din „reţeaua sa nomologică”). Această abordare pleacă de la premisa că un
instrument ce vizează cu adevărat constructul pe care ar trebui să îl evalueze va avea asocieri
puternice cu instrumentele care evaluează concepte apropiate psihologic de acesta. De aceea,
dovada validităţii de construct a unui instrument nou poate fi constituită din legăturile sale
puternice cu alte instrumente, deja validate şi acceptate de comunitatea ştiinţifică, ce vizează
celelalte (sau o parte din) conceptele din reţeaua sa nomologică. În caz contrar, asocierile slabe
cu aceste instrumente indică faptul că ceea ce evaluează acel instrument nu reprezintă un concept
din acea reţea, şi deci itemii săi nu se referă cu adevărat la constructul pe care ar trebui să îl
operaţionalizeze.
c. validitatea divergentă are în vedere „limitele instrumentului”; un instrument valid nu
ar trebui să fie influenţat de trăsături psihologice din afara reţelei nomologice a constructului
vizat. Practic, aceasta implică faptul că o condiţie a validităţii de construct este ca scalele ce
evaluează astfel de trăsături non-relevante să nu fie asociate cu scorurile la instrumentul
respectiv. În construcţia instrumentelor există pericolul acoperirii unei arii psihologice prea mari,
semnificativ mai extinse decât constructul vizat. În aceste cazuri, condiţia validităţii convergente
ar fi respectate (instrumentul ar fi asociat cu cele care măsoară caracteristici apropiate), însă
scorurile ar fi influenţate şi de alte trăsături cu o legătură slabă cu acel construct, şi deci ar apărea
surse de varianţă non-pertinentă; de aceea este necesară şi respectarea validităţii divergente.
Curs 5 38
Evaluare psihologică – metode psihometrice curs 5
comun. Din moment ce aproximativ 70% din instrumentele psihologice au astfel de subscale
(vizând factori distincţi), metoda analizei factoriale este des utilizată pentru acest scop al grupării
itemilor în factori.
De asemenea, ea poate fi folosită şi pentru operaţii ce au ca scop creşterea validităţii de
construct; astfel, în etapa de pretestare a instrumentelor această metodă permite, pe lângă
identificarea structurii lor factoriale, selecţia itemilor, prin raportare la două criterii:
- eliminarea celor care nu corelează suficient de puternic cu nici unul dintre factorii
extraşi şi, deci, cu ansamblul celorlaltor itemi;
- prin aplicarea în pretestare şi a unor alte instrumente ce vizează constructe fără legătură
cu cel pe care ar trebui să îl evalueze instrumentul respectiv, analiza factorială oferă informaţii
despre relaţiile dintre itemii acestuia şi factorii celorlaltor instrumente. O astfel de metodă
permite aprecierea „graniţelor” instrumentului la modul general, adică a validităţii sale
divergente, dar şi eliminarea itemilor insuficient de specifici, deci a celor care corelează puternic
şi cu celelalte instrumente.
Pe lângă selecţia itemilor din varianta finală a instrumentului, analiza factorială permite
estimarea validităţii sale de construct (factoriale), prin următorii indicatori:
- asocierea dintre fiecare dintre itemi şi factorul de care aparţin (consistenţa internă);
- cantitatea de varianţă a instrumentului explicată de factorii extraşi, indicând măsura în
care structura factorială rezultată acoperă scorurile observate. În cazul în care ea are valori
reduse, înseamnă că faţetele constructului reprezintă o sursă minoră a scorurilor la instrument;
deci acesta este puternic contaminat cu alte caracteristici psihologice (necunoscute încă), el
având o validitate de construct nesatisfăcătoare.
- în cazul folosirii şi a unor instrumente care măsoară alte concepte în acea aplicare se pot
obţine informaţii despre această posibilă contaminare, prin examinarea relaţiilor dintre itemii
acestora şi factorii instrumentului pretestat. Dacă aceste legături sunt puternice, înseamnă că el
vizează şi acele constructe evaluate prin respectivele instrumente suplimentare, având deci o
validitate divergentă nesatisfăcătoare. Aşadar, validitatea divergentă poate fi analizată în două
maniere: prin intermediul relaţiilor dintre itemii instrumentului respectiv şi factorii altor scale ce
evaluează caracteristici din afara reţelei sale nomologice (itemii care corelează puternic cu
aceştia putând fi eliminaţi), respectiv prin examinarea contaminării factorilor instrumentului
pretestat cu itemi din aceste alte scale.
- în cazul folosirii şi a unor instrumente ce evaluează constructe apropiate psihologic,
studierea asocierilor dintre factorii rezultaţi este utilă pentru evaluarea validităţii convergente; în
acest caz, legăturile dintre factorii instrumentului pretestat şi cei ai celorlaltor instrumente ar
trebui să fie puternice pentru a susţine validitatea convergentă.
Date fiind exigenţele şi problemele practice ale analizei factoriale, uneori folosirea sa este
foarte dificilă; în aceste cazuri, se pot obţine unele informaţii despre validitatea factorială a
instrumentului, respectiv despre itemii ce ar trebui eliminaţi prin intermediul corelaţiilor fiecărui
item cu scorul total la instrument (ce indică consistenţa internă), respectiv cu cel al altor alte
instrumente (ce indică validitatea divergentă).
3
Curs 5 39
Evaluare psihologică – metode psihometrice curs 5
Curs 5 40
Evaluare psihologică – metode psihometrice curs 5
Likert Observaţie
Metoda
Trăsătura Anxietate Depresie Anxietate Depresie
Corelaţia Corelaţia
Anxietate Fidelitate
metodei trăsăturii
Likert
Corelaţia Corelaţia
Depresie Fidelitate
metodei trăsăturii
Corelaţia Corelaţia
Anxietate Fidelitate
trăsăturii metodei
Observaţie
Corelaţia Corelaţia
Depresie Fidelitate
trăsăturii metodei
Bibliografie
• Aiken, L.R. (2000). Psychological testing and assessment, (10th edition), Allyn and Bacon
• Angleitner, A., John, 0.P. & Löhr, F.J. (1986). It's how you ask and what you ask: an itemmetric analysis of
personality questionnaires. In: Angleitner, A. & Wiggins, J.S. (eds.). Personality Assessment via Questionnaires.
New York: Springer, 61-108.
• Bohrnstedt G. (1983). Measurement. în Rossi PH, Wright JD, Anderson AB (Eds.) Handbook of Survey
Research. Orlando , FL : Academic Press
• Clark, L. A., & Watson, D. (1995). Constructing validity: Basic issues in scale development. Psychological
Assessment, 7, 309-319.
• Cohen, R., Swerdlik, M., & Smith, D. (2009). Psychological testing and assessment: An introduction to
tests and measurements (7th ed.). New York: McGraw-Hill
• Fischer J., Corcoran K. (2007). Measures for clinical practice: A sourcebook. 4nd Ed., New York: Oxford
University
• Havârneanu, C. (2000). Cunoaşterea psihologică a persoanei, Iaşi, Polirom
• Kerlinger, F.N. (1986). Foundations of behavioral research (3rd ed.) New York: Holt, Rinehart and
Winston.
• Messick, S. (1995). Validity of psychological assessment: Validation of inferences from persons' responses
and performances as scientific inquiry into score meaning. American Psychologist, Vol 50(9), 741-749.
• Nunnally, J., Bernstein, I. (1994) Psychometric Theory. New York: McGraw Hill, 3rd ed.
• Switzer, G., et al. (2000). Measurement issues in intervention research. în R. Schulz (Ed.), Handbook on
dementia caregiving: Evidence-based interventions for family caregivers. New York: Springer
• Urbina. S. (2004). Essentials of Psychological Testing, John Wiley & Sons, Inc.
5
Curs 5 41
Evaluare psihologică – metode psihometrice curs 6
Curs 6 42
Evaluare psihologică – metode psihometrice curs 6
care este focalizată pe corectitudinea diagnosticului ce poate fi pus prin folosirea acelui
instrument.
În practică, instrumentele au un etalon ce permite identificarea de niveluri ale acelei
caracteristici psihologice, şi deci diagnosticarea oricărui individ care le completează prin
includerea sa într-o categorie. Decizia cu privire la aceasta se ia prin compararea scorului total cu
etalonul; de exemplu, un instrument care evaluează intensitatea depresiei şi care împarte oamenii
în două categorii (depresie prezentă / absentă) ar putea avea scorul de demarcaţie între cele două
25. În acest caz, toţi subiecţii cu scor mai mare decât 25 ar fi diagnosticaţi ca depresivi, iar cei cu
scor sub 25 – ca non-depresivi. În general, această abordare se aplică pe instrumentele similare
cu cel din acest exemplu, adică cele care oferă o evaluare în termeni bipolari: fie prezenţa
trăsăturii („diagnostic pozitiv”), fie absenţa sa („diagnostic negativ”).
Validitatea discriminativă este analizată, în această abordare, pe baza a două dimensiuni,
şi anume sensibilitatea şi specificitatea instrumentului.
a. Sensibilitatea înseamnă procentul de identificări pozitive corecte; de exemplu, dacă
dintre 100 de depresivi instrumentul ar diagnostica ca depresivi pe 80, atunci sensibilitatea sa ar
fi de 0,8. Termenul de „sensibilitate” sugerează tocmai această idee, a gradului în care
instrumentul poate detecta trăsătura pe care o evaluează (deci, este „sensibil” la ea). Deci,
sensibilitatea se calculează în etapa de pretestare (ce necesită aplicarea instrumentului pe oameni
din cele două categorii diagnostice – de exemplu, depresivi şi non-depresivi) ca raport dintre
numărul de identificări pozitive corecte şi numărul total de indivizi care au trăsătura. În aplicarea
viitoare a acelui instrument, ea indică probabilitatea de a obţine un diagnostic pozitiv corect în
populaţia cu acea trăsătură (“true positives”).
b. Specificitatea înseamnă procentul de identificări negative corecte; de exemplu, dacă
dintre 100 de oameni care nu au depresie, instrumentul ar diagnostica ca non-depresivi pe 40,
atunci specificitatea ar fi de 0,4 (implicit, el ar greşi la 60 dintre ei, diagnosticându-i ca
depresivi). Termenul de „specificitate” sugerează necesitatea ca instrumentul să fie specific în
diagnosticarea trăsăturii, adică diagnosticul pozitiv să fie limitat la oamenii care chiar au acea
trăsătură, să fie „specific” lor, şi să nu fie aplicat şi pe cei de la polul opus. În pretestare,
specificitatea se calculează ca raportul dintre numărul de identificări negative corecte şi numărul
de indivizi care nu au acea trăsătură. În aplicarea viitoare a acelui instrument, ea indică
probabilitatea de a obţine un diagnostic negativ corect în populaţia care nu posedă acea trăsătură
- “true negatives.
Deoarece în psihologie nu există instrumente perfecte, cele două dimensiuni sunt
dependente reciproc, în sensul că creşterea sensibilităţii (prin schimbarea punctului de tăiere, de
separare a celor două categorii, al scorurilor la instrument) duce la scăderea sensibilităţii: cu cât
creştem probabilitatea de a detecta oamenii care posedă acea trăsătură, cu atât mai mult ne
asumăm riscul de a diagnostica pozitiv – ca având acea caracteristică – şi oameni care, în
realitate, nu o posedă. De exemplu, dacă vrem să detectăm toţi oamenii care au acea trăsătură,
mutând punctul de tăiere în jos (de exemplu, la un instrument de evaluare a depresiei ce
generează scoruri de la 1 la 10, am putea stabili linia de demarcaţie între cele două categorii la 2,
2
Curs 6 43
Evaluare psihologică – metode psihometrice curs 6
cei cu scoruri peste aceasta fiind diagnosticaţi ca depresivi), atunci este foarte probabil să
diagnosticăm pozitiv şi mare parte din cei care nu au acea trăsătură.
Analiza validităţii discriminative a unui instrument presupune şi această investigare a
punctului de tăiere optim pentru a respecta obiectivele legate de specificitate şi sensibilitate.
Tehnic, o metodă de examinare a sa este ROC (Receiver Operating Characteristic). Ea
calculează cei doi parametri pentru fiecare scor al testului, considerat ca punct de tăiere:
- Sensibilitatea – indicând procentul de indivizi care posedă acea trăsătură care au scorul
mai mare decât acel punct de tăiere, deci procentul identificărilor pozitive corecte (în exemplul
precedent, procentul de subiecţi depresivi cu scor peste 2);
- 1 – specificitatea – aici, tehnica generează parametrul opus sensibilităţii, aşa cum a fost
definită teoretic; acest parametru indică procentul de indivizi care nu posedă acea trăsătură şi
care au, totuşi, scorul la test mai mare decât acel punct de tăiere (în exemplul anterior, procentul
de depresivi care au şi ei scorul mai mare de 2 şi care ar fi diagnosticaţi greşit de instrument ca
fiind depresivi). Deci, el arată procentul identificărilor pozitive eronate, care este inversul
specificităţii (procentul identificărilor negative corecte): dacă din 100 de indivizi care nu au
depresie, 40 sunt diagnosticaţi (greşit) ca având această caracteristică, atunci instrumentul oferă
un diagnostic negativ corect pentru restul de 60.
Cei doi parametri sunt reprezentaţi grafic, calculându-se “aria de sub curbă”, ce
reprezintă indicatorul de bază al validităţii discriminative a testului. Această arie trebuie să fie
semnificativ mai mare decât linia diagonală de reper, corespunzătoare valorii medii de 0,5, adică
ghicirii la întâmplare a celor care au acea trăsătură. Aplicând această metodă a ghicirii,
probabilitatea de a oferi un diagnostic corect unui individ este de 50% - din moment ce
caracteristica respectivă are 2 posibilităţi (de exemplu depresiv – non-depresiv) -, indiferent dacă
el este sau nu depresiv în realitate.
Linia de reper
Curs 6 44
Evaluare psihologică – metode psihometrice curs 6
Aria de sub curbă este calculată pe baza sensibilităţii şi specificităţii calculate pentru
fiecare scor total la instrument; acestea sunt prezentate comparativ într-un tabel ca cel următor:
Coordinates of the Curve
Prima coloană conţine fiecare dintre posibilele puncte de tăiere ce ar putea face diferenţa
între cele două categorii, derivate din scorurile totale ale instrumentului; a doua conţine
sensibilitatea obţinută dacă punctul de tăiere ar fi stabilit la acea valoare, iar ultima conţine
indicatorul „1 – specificitatea”, rezultat în aceeaşi situaţie. De exemplu, punctul de tăiere ar fi
stabilit la 6,5, atunci sensibilitatea ar avea valoarea 0,485, adică 48,5% dintre subiecţii care au în
realitate depresie ar fi diagnosticaţi ca atare; parametrul 1 – specificitatea ar fi 0,121, deci 12,1%
din oamenii diagnosticaţi cu depresie nu ar avea, în realitate, această trăsătură (specificitatea ar fi
de 87,9%).
Tabelul următor conţine valoarea ariei de sub curbă şi testarea semnificaţiei diferenţei
sale faţă de 0,5 (ghicirea la întâmplare).
Area Unde r the Curve
Test Result Variable(s): scor tes t 1
As ymptotic 95% Confidenc e
As ymptotic Int erval
a b
Area St d. E rror Sig. Lower Bound Upper Bound
.662 .055 .008 .554 .770
The tes t result variable(s): s cor test 1 has at leas t one tie bet ween the
positive ac tual state group and t he negative actual st ate group. S tatis tic
may be biased.
a. Under the nonparametric as sumption
b. Null hy pothesis : true area = 0.5
Valoarea Asymptotic Sig este mai mică decât 0,05, deci instrumentul oferă o clasificare
semnificativ mai bună decât ghicirea. Valoarea ariei de sub curbă este 0,662; ea indică
4
Curs 6 45
Evaluare psihologică – metode psihometrice curs 6
probabilitatea ca un individ care are, în realitate, acea trăsătură să obţină un scor diferit (în acest
caz, mai mare) la instrument decât unul care nu o posedă. Acest indicator sintetizează validitatea
discriminativă a instrumentului, deoarece cu cât el este mai mare, cu atât acesta face diferenţa
mai precis între oamenii din cele două categorii. Dacă valoarea ariei de sub curbă este maximă
(1) atunci ar fi sigur (probabilitate de 100%) că orice subiect depresiv ar obţine un scor mai mare
decât orice non-depresiv. Dacă ea ar fi redusă (apropiată de 0,5), ar înseamna că probabilitatea ca
oamenii care au acea trăsătură să obţină scoruri mai mari decât cei care nu o au este la fel cu cea
ca ei să obţină scoruri mai mici. Aşadar, instrumentul nu ar diferenţia între cele două grupuri şi
nu ar putea fi folosit pentru a decide dacă un individ are sau nu acea trăsătură (validitatea sa de
criteriu ar fi, în consecinţă, una redusă).
Curs 6 46
Evaluare psihologică – metode psihometrice curs 6
Curs 6 47
Evaluare psihologică – metode psihometrice curs 6
Aici, scopul diagnostic poate fi urmărit prin stabilirea punctului de tăiere la 5,5, deoarece
el echilibrează cel mai mult cei doi parametri: 0,588 la sensibilitate şi 0,636 la sensibilitate (1-
0,364). În scop de screening punctul de tăiere ar putea fi stabilit la 2,5, ceea ce ar asigura
sensibilitatea maximă, însă specificitatea ar fi extrem de redusă (de doar 0,061, deci peste 90%
din oamenii care nu au depresie ar fi diagnosticaţi greşit ca având). Acest procent extrem de
mare al identificărilor pozitive eronate face ca instrumentul 1 să fie mai puţin recomandat pentru
screening.
Bibliografie
• Aiken, L.R. (2000). Psychological testing and assessment, (10th edition), Allyn and Bacon
• Bohrnstedt G. (1983). Measurement. în Rossi PH, Wright JD, Anderson AB (Eds.) Handbook of Survey
Research. Orlando , FL : Academic Press
• Clark, L. A., & Watson, D. (1995). Constructing validity: Basic issues in scale development. Psychological
Assessment, 7, 309-319.
• Cohen, R., Swerdlik, M., & Smith, D. (2009). Psychological testing and assessment: An introduction to
tests and measurements (7th ed.). New York: McGraw-Hill
• Fischer J., Corcoran K. (2007). Measures for clinical practice: A sourcebook. 4nd Ed., New York: Oxford
University
• Havârneanu, C. (2000). Cunoaşterea psihologică a persoanei, Iaşi, Polirom
• Kerlinger, F.N. (1986). Foundations of behavioral research (3rd ed.) New York: Holt, Rinehart and
Winston.
• Nunnally, J., Bernstein, I. (1994) Psychometric Theory. New York: McGraw Hill, 3rd ed.
• Switzer, G., et al. (2000). Measurement issues in intervention research. în R. Schulz (Ed.), Handbook on
dementia caregiving: Evidence-based interventions for family caregivers. New York: Springer
• Urbina. S. (2004). Essentials of Psychological Testing, John Wiley & Sons, Inc.
Curs 6 48