Documente Academic
Documente Profesional
Documente Cultură
care este focalizată pe corectitudinea diagnosticului ce poate fi pus prin folosirea acelui
instrument.
În practică, instrumentele au un etalon ce permite identificarea de niveluri ale acelei
caracteristici psihologice, şi deci diagnosticarea oricărui individ care le completează prin
includerea sa într-o categorie. Decizia cu privire la aceasta se ia prin compararea scorului total cu
etalonul; de exemplu, un instrument care evaluează intensitatea depresiei şi care împarte oamenii
în două categorii (depresie prezentă / absentă) ar putea avea scorul de demarcaţie între cele două
25. În acest caz, toţi subiecţii cu scor mai mare decât 25 ar fi diagnosticaţi ca depresivi, iar cei cu
scor sub 25 – ca non-depresivi. În general, această abordare se aplică pe instrumentele similare
cu cel din acest exemplu, adică cele care oferă o evaluare în termeni bipolari: fie prezenţa
trăsăturii („diagnostic pozitiv”), fie absenţa sa („diagnostic negativ”).
Validitatea discriminativă este analizată, în această abordare, pe baza a două dimensiuni,
şi anume sensibilitatea şi specificitatea instrumentului.
a. Sensibilitatea înseamnă procentul de identificări pozitive corecte; de exemplu, dacă
dintre 100 de depresivi instrumentul ar diagnostica ca depresivi pe 80, atunci sensibilitatea sa ar
fi de 0,8. Termenul de „sensibilitate” sugerează tocmai această idee, a gradului în care
instrumentul poate detecta trăsătura pe care o evaluează (deci, este „sensibil” la ea). Deci,
sensibilitatea se calculează în etapa de pretestare (ce necesită aplicarea instrumentului pe oameni
din cele două categorii diagnostice – de exemplu, depresivi şi non-depresivi) ca raport dintre
numărul de identificări pozitive corecte şi numărul total de indivizi care au trăsătura. În aplicarea
viitoare a acelui instrument, ea indică probabilitatea de a obţine un diagnostic pozitiv corect în
populaţia cu acea trăsătură (“true positives”).
b. Specificitatea înseamnă procentul de identificări negative corecte; de exemplu, dacă
dintre 100 de oameni care nu au depresie, instrumentul ar diagnostica ca non-depresivi pe 40,
atunci specificitatea ar fi de 0,4 (implicit, el ar greşi la 60 dintre ei, diagnosticându-i ca
depresivi). Termenul de „specificitate” sugerează necesitatea ca instrumentul să fie specific în
diagnosticarea trăsăturii, adică diagnosticul pozitiv să fie limitat la oamenii care chiar au acea
trăsătură, să fie „specific” lor, şi să nu fie aplicat şi pe cei de la polul opus. În pretestare,
specificitatea se calculează ca raportul dintre numărul de identificări negative corecte şi numărul
de indivizi care nu au acea trăsătură. În aplicarea viitoare a acelui instrument, ea indică
probabilitatea de a obţine un diagnostic negativ corect în populaţia care nu posedă acea trăsătură
- “true negatives.
Deoarece în psihologie nu există instrumente perfecte, cele două dimensiuni sunt
dependente reciproc, în sensul că creşterea sensibilităţii (prin schimbarea punctului de tăiere, de
separare a celor două categorii, al scorurilor la instrument) duce la scăderea sensibilităţii: cu cât
creştem probabilitatea de a detecta oamenii care posedă acea trăsătură, cu atât mai mult ne
asumăm riscul de a diagnostica pozitiv – ca având acea caracteristică – şi oameni care, în
realitate, nu o posedă. De exemplu, dacă vrem să detectăm toţi oamenii care au acea trăsătură,
mutând punctul de tăiere în jos (de exemplu, la un instrument de evaluare a depresiei ce
generează scoruri de la 1 la 10, am putea stabili linia de demarcaţie între cele două categorii la 2,
2
Evaluare psihologică – metode psihometrice curs 6
cei cu scoruri peste aceasta fiind diagnosticaţi ca depresivi), atunci este foarte probabil să
diagnosticăm pozitiv şi mare parte din cei care nu au acea trăsătură.
Analiza validităţii discriminative a unui instrument presupune şi această investigare a
punctului de tăiere optim pentru a respecta obiectivele legate de specificitate şi sensibilitate.
Tehnic, o metodă de examinare a sa este ROC (Receiver Operating Characteristic). Ea
calculează cei doi parametri pentru fiecare scor al testului, considerat ca punct de tăiere:
- Sensibilitatea – indicând procentul de indivizi care posedă acea trăsătură care au scorul
mai mare decât acel punct de tăiere, deci procentul identificărilor pozitive corecte (în exemplul
precedent, procentul de subiecţi depresivi cu scor peste 2);
- 1 – specificitatea – aici, tehnica generează parametrul opus sensibilităţii, aşa cum a fost
definită teoretic; acest parametru indică procentul de indivizi care nu posedă acea trăsătură şi
care au, totuşi, scorul la test mai mare decât acel punct de tăiere (în exemplul anterior, procentul
de depresivi care au şi ei scorul mai mare de 2 şi care ar fi diagnosticaţi greşit de instrument ca
fiind depresivi). Deci, el arată procentul identificărilor pozitive eronate, care este inversul
specificităţii (procentul identificărilor negative corecte): dacă din 100 de indivizi care nu au
depresie, 40 sunt diagnosticaţi (greşit) ca având această caracteristică, atunci instrumentul oferă
un diagnostic negativ corect pentru restul de 60.
Cei doi parametri sunt reprezentaţi grafic, calculându-se “aria de sub curbă”, ce
reprezintă indicatorul de bază al validităţii discriminative a testului. Această arie trebuie să fie
semnificativ mai mare decât linia diagonală de reper, corespunzătoare valorii medii de 0,5, adică
ghicirii la întâmplare a celor care au acea trăsătură. Aplicând această metodă a ghicirii,
probabilitatea de a oferi un diagnostic corect unui individ este de 50% - din moment ce
caracteristica respectivă are 2 posibilităţi (de exemplu depresiv – non-depresiv) -, indiferent dacă
el este sau nu depresiv în realitate.
Linia de reper
3
Evaluare psihologică – metode psihometrice curs 6
Aria de sub curbă este calculată pe baza sensibilităţii şi specificităţii calculate pentru
fiecare scor total la instrument; acestea sunt prezentate comparativ într-un tabel ca cel următor:
Coordinates of the Curve
Prima coloană conţine fiecare dintre posibilele puncte de tăiere ce ar putea face diferenţa
între cele două categorii, derivate din scorurile totale ale instrumentului; a doua conţine
sensibilitatea obţinută dacă punctul de tăiere ar fi stabilit la acea valoare, iar ultima conţine
indicatorul „1 – specificitatea”, rezultat în aceeaşi situaţie. De exemplu, punctul de tăiere ar fi
stabilit la 6,5, atunci sensibilitatea ar avea valoarea 0,485, adică 48,5% dintre subiecţii care au în
realitate depresie ar fi diagnosticaţi ca atare; parametrul 1 – specificitatea ar fi 0,121, deci 12,1%
din oamenii diagnosticaţi cu depresie nu ar avea, în realitate, această trăsătură (specificitatea ar fi
de 87,9%).
Tabelul următor conţine valoarea ariei de sub curbă şi testarea semnificaţiei diferenţei
sale faţă de 0,5 (ghicirea la întâmplare).
Area Unde r the Curve
Test Result Variable(s): scor tes t 1
As ymptotic 95% Confidenc e
As ymptotic Int erval
a b
Area St d. E rror Sig. Lower Bound Upper Bound
.662 .055 .008 .554 .770
The tes t result variable(s): s cor test 1 has at leas t one tie bet ween the
positive ac tual state group and t he negative actual st ate group. S tatis tic
may be biased.
a. Under the nonparametric as sumption
b. Null hy pothesis : true area = 0.5
Valoarea Asymptotic Sig este mai mică decât 0,05, deci instrumentul oferă o clasificare
semnificativ mai bună decât ghicirea. Valoarea ariei de sub curbă este 0,662; ea indică
4
Evaluare psihologică – metode psihometrice curs 6
probabilitatea ca un individ care are, în realitate, acea trăsătură să obţină un scor diferit (în acest
caz, mai mare) la instrument decât unul care nu o posedă. Acest indicator sintetizează validitatea
discriminativă a instrumentului, deoarece cu cât el este mai mare, cu atât acesta face diferenţa
mai precis între oamenii din cele două categorii. Dacă valoarea ariei de sub curbă este maximă
(1) atunci ar fi sigur (probabilitate de 100%) că orice subiect depresiv ar obţine un scor mai mare
decât orice non-depresiv. Dacă ea ar fi redusă (apropiată de 0,5), ar înseamna că probabilitatea ca
oamenii care au acea trăsătură să obţină scoruri mai mari decât cei care nu o au este la fel cu cea
ca ei să obţină scoruri mai mici. Aşadar, instrumentul nu ar diferenţia între cele două grupuri şi
nu ar putea fi folosit pentru a decide dacă un individ are sau nu acea trăsătură (validitatea sa de
criteriu ar fi, în consecinţă, una redusă).
6
Evaluare psihologică – metode psihometrice curs 6
Aici, scopul diagnostic poate fi urmărit prin stabilirea punctului de tăiere la 5,5, deoarece
el echilibrează cel mai mult cei doi parametri: 0,588 la sensibilitate şi 0,636 la sensibilitate (1-
0,364). În scop de screening punctul de tăiere ar putea fi stabilit la 2,5, ceea ce ar asigura
sensibilitatea maximă, însă specificitatea ar fi extrem de redusă (de doar 0,061, deci peste 90%
din oamenii care nu au depresie ar fi diagnosticaţi greşit ca având). Acest procent extrem de
mare al identificărilor pozitive eronate face ca instrumentul 1 să fie mai puţin recomandat pentru
screening.
Bibliografie
• Aiken, L.R. (2000). Psychological testing and assessment, (10th edition), Allyn and Bacon
• Bohrnstedt G. (1983). Measurement. în Rossi PH, Wright JD, Anderson AB (Eds.) Handbook of Survey
Research. Orlando , FL : Academic Press
• Clark, L. A., & Watson, D. (1995). Constructing validity: Basic issues in scale development. Psychological
Assessment, 7, 309-319.
• Cohen, R., Swerdlik, M., & Smith, D. (2009). Psychological testing and assessment: An introduction to
tests and measurements (7th ed.). New York: McGraw-Hill
• Fischer J., Corcoran K. (2007). Measures for clinical practice: A sourcebook. 4nd Ed., New York: Oxford
University
• Havârneanu, C. (2000). Cunoaşterea psihologică a persoanei, Iaşi, Polirom
• Kerlinger, F.N. (1986). Foundations of behavioral research (3rd ed.) New York: Holt, Rinehart and
Winston.
• Nunnally, J., Bernstein, I. (1994) Psychometric Theory. New York: McGraw Hill, 3rd ed.
• Switzer, G., et al. (2000). Measurement issues in intervention research. în R. Schulz (Ed.), Handbook on
dementia caregiving: Evidence-based interventions for family caregivers. New York: Springer
• Urbina. S. (2004). Essentials of Psychological Testing, John Wiley & Sons, Inc.