Sunteți pe pagina 1din 4

VALIDITATE

În ce măsură folosim un test de inteligență ca bază pentru a ocupa un post de manipulare a


cărbunilor. Atunci când alegem teste în primul rând ne orientăm în funcție de scopul pentru care le alegem.
Atunci când dorim să aplicăm un test ne interesează validitatea acelui test.

Validitatea se referă la modalitatea în care un test măsoară ceea ce își propune să măsoare și cât de
bine face acest lucru. Când suntem în fața unui test ar trebui să ne întrebăm: „Măsoară acest test ceea ce ar
trebui să măsoare?”

Validitatea ajută pentru că în realitate noi nu avem constructe ci facem inferențe pe baza acestora. Nu
găsim un construct pe care să fim 100% siguri că l-am măsurat. De exemplu: inteligența sau empatia.
Suntem noi siguri 100% că noi am măsurat empatia?

Validarea se referă la un proces în care culegem informații despre teste și despre evaluarea lor.
Validarea este un proces comun care ține atât de persoana care completează testul dar și de persoana care
realizează testul. Informația despre un test este importantă pentru a afla care este scopul acestuia. Deși avem
teste aceste teste nu funcționează pentru toată lumea. Importanța studiilor locale de validare. Utilizatorii pot
să realizeze astfel de studii. Un test de anxietate de exemplu pe care vreau să îl folosesc la un grup de
persoane cu scleroză multiplă. Știu că testul de anxietate sau de depresie este validat. Ce ar însemna să îl
validez în populația aceasta. Aleg un eșantion reprezentativ, aplic testul, facem cotarea și după ce avem
rezultatele ne interesează dacă se compară cu versiunea originară.

Dacă un test nu este validat pe populația căreia îi aplicăm testul atunci apar erori. Avem un test
standardizat dar pe care noi vrem să îl adaptăm pentru o populație diferit dar dacă nu testăm acest chestionar
adaptat nu avem cum să știm dacă acest test investighează ce ne interesează. Există teste care au deja
manuale dar apar mereu ediții revizuite pentru că se schimbă caracteristicile populației și aceste caracteristici
ne interesează pentru că rezultatele și interpretarea testului depind de ele.

Tulburările obsesiv-compulsive erau trecute în DSM IV la tulburări de anxietate dar în DSM V nu


mai sunt trecute la tulburări anxioase. În tulburările de anxietate avem fobii, anxietate generalizată,
tulburările de panică, etc.

Dacă ar fi să am un chestionar care să îmi identifice tulburările de anxietate ar trebui să aibă


următoarele elemente dacă are subscale diferite: O subscală care măsoară fobiile, una care măsoară
anxietatea socială, una pe anxietate generalizată și una pe panică.

Dacă de exemplu am un item care spune „într-o zi verific cam de zece ori dacă ușa este încuiată” este
un item bun pentru chestionarul meu? NU

- Fiziologic – „simt că îmi bate inima foarte tare”, „simt că nu mai am aer”, „cred că o să amețesc”,
„îmi tremură mâinile foarte tare”
- Cognitiv –

Când aplic un instrument este nevoie să cunosc foarte bine scopul pentru care îl aplic. Scopurile pot
fi: să descopăr anumite abilități, compatibilitatea, nivelul de inteligență, etc. Domeniile mari ale scopului
pentru care aplic un chestionar ar fi:

- Clinic – rezultatele unui tratament, identificarea problemei,


- Organizațional
- Educațional
Nu există un test general valabil pentru toți utilizatorii și pentru toate scopurile. Și trebuie să
identificăm foarte clar care este scopul nostru (ce urmărim) și atunci trebuie să mă gândesc ce chestionar ar
trebui să folosesc în funcție de ce vreau să urmăresc.

Validitatea determină relația dintre inferențele făcute pe baza performanțelor și realitate. Există mai
multe forme de validitate.

1. Validitate de criteriu
2. Validitate de construct
3. Validitate de conținut
4. Validitate de aspect

Avem trei modalități prin care verificăm validitatea de construct, de conținut și de criteriu care nu
sunt mutual exclusive tocmai pentru că cele trei forme aparțin toate domeniului de validitate.

Pot să examinez conținutul testului (analiza itemilor); să relaționez (corelez) scorurile pe care le-am
obținut cu alte scoruri la alt chestionar; realizez analize comprehensive (mă documentez - atunci când mă
interesează un instrument, mă uit și la ce studii s-au realizat pentru că studiile sunt baza). Următorul aspect
este legat de constructul teoretic. Trebuie să știu foarte bine cadrul teoretic în care evaluez constructul
respectiv sau ce a fost testul proiectat să măsoare.

1. Validitate de aspect este ceea ce un test pare să măsoare mai degrabă decât ceea ce măsoară. Dacă
avem un chestionar despre care știm că măsoară anxietatea și avem i temi de genul „Inima îmi bate foarte
tare atunci când mă gândesc la câte am de făcut” sau „Mă doare stomacul atunci când știu că urmează un test
la școală” „mă doare stomacul când știu că am de făcut o prezentare”. Nu pot spune pe baza răspunsurilor la
întrebările de mai sus că persoana este anxioasă. Somatizarea apare într-adevăr în anxietate dar nu sunt
suficienți pentru că mă interesează și alți itemi. Modul în care utilizatorul percepe itemii testului se referă la
validitatea de aspect. Dacă ce măsoară testul este într-adevăr ce își propune spunem că are validitate de
aspect ridicată. Validitatea de aspect nu are indicatori statistici (nu avem coeficient de corelație – nu are un
indicator statistic), ci este mai degrabă utilă din perspectiva utilizatorului. Dacă utilizatorul percepe că de
fapt completează un chestionar care îi evaluează ceea ce i s-a spus.

Dacă un test nu are nici măcar validitate de aspect atunci este problematic de la bun început.

Validitatea de criteriu

Îmi arată cum se comportă testul comparativ cu alte măsurători și utilitatea diagnostică. Ea mai este
numită și validitate empirică și identifică măsura în care testul este un predictor pentru comportamente
viitoare.

Pot folosi, de exemplu, un test cu persoane care sunt logodite pentru a vedea câte dintre ele vor avea
o căsătorie de succes și care vor divorța. Predictorul este rezultatul la testul pe care îl aplic. Criteriul este
succesul în relație (aici avem o relație dihotomică – cu două variante de răspuns da/nu).

Validitatea de criteriu îmi indică măsura în care testul este un predictor bun pentru comportamentele
viitoare. Un criteriu poate fi aproape orice (are sau nu are depresie, anxietate, schizofrenie).

Ce predictor aș putea măsura pentru criteriul performanță școlară? Capacitatea de memorare poate fi
un predictor pentru criteriul performanța la materia istorie.

Un criteriu trebuie să fie:

- Relevant. Pentru activitatea sa caracteristică la care se referă.


- Fidel. Măsura în care la administrări repetate rezultatele sunt aceleași. Și un criteriu
trebuie să fie fidel adică să fie congruent cu evaluări diferite realizate la momente diferite
de timp.
- Practic.
- Necontaminat. Să nu am un predictor o abilitate pe care o evaluează profesorii și la
predictor tot ceva ce evaluează profesorii.
- Exprimat în aceleași unități pentru toate persoanele. Aici vine foarte mult pe partea de
care este scorul.

Există două mari categorii de validitate de criteriu:

I. Predictivă. Am predictorul care îmi prezice ceva din viitor. Acuratețea cu care putem exprima că
o anumită caracteristică sau trăsătură pe care noi am evaluat-o se va manifesta pe viitor pe baza
măsurii în care persoana posedă acea caracteristică.
II. Concurentă. Îmi prezice un comportament actual.

Toate formele de validitate noi putem să le evaluăm statistic. Avem coeficienți de corelație între
scorurile de la predictori și cele de la criterii. Valoarea acestor coeficienți știm că este cuprinsă între 0 și 1
pentru că 1 ar însemna suprapunere completă. De obicei valoarea lor este între 0 și 60 iar la testele de
personalitate este între 0-40.

Testul arborelui măsoară personalitatea sau anumite tulburări. Nu are validitate de criteriu pentru că
nu putem prezice nimic. Validitate de conținut nu are. Nu pot prezice nimic pentru viitor în urma unei
analize a arborelui desenat de cineva. Sunt tot felul de teste și de intervenții care nu au nici un suport
științific.

Utilitate diagnostică. Înseamnă că îmi oferă un răspuns când testul meu mă ajută să identific corect
câți oameni au și câți nu au tulburarea.

Cum judecăm utilitatea unui test.

Am un întreg demers. Un algoritm de analiză în care am inclusiv anumite formule care îmi permit să
calculez.

Dacă pe baza testului am un rezultat pozitiv iar pe baza criteriului diagnostic am tot un rezultat
pozitiv.

De exemplu am un test de depresie. La testul de depresie rezultatul este unul pozitiv. Am un scor
ridicat care îmi arată pe baza manualului că am depresie. Criteriul înseamnă că este depresie. Un alt caz
corect este cel în care testul îmi arată că nu am depresie și criteriul este absent.

Fals pozitiv înseamnă că pe aza testului este încadrat în categoria aceasta când de fapt criteriul este
absent.

Există formule diverse care îmi permită să identific sensibilitatea unui test: AP/(AP+FN)=1

Sunt foarte multe studii care merg pe realizarea de curbe roc care să ne ajute să identificăm pacienți
pe baza unor scoruri. Exemplul din curs arată că trebuie să se folosească un scor mai mic de 27 pentru
evaluarea funcțiilor cognitive mai degrabă decât scorul tradițional de 24. Asta ne arată curbele ROC. În
funcție de scop diferă și scorul Cutoff.
Dacă de exemplu eu am ca scop să identific toți copiii dintr-o clasă care ar avea simptome de
anxietate aș putea folosi un anumit scor. Dacă scopul meu ar fi să identific toți copiii dintr-o clasă care au
anxietate clinică am nevoie de un scor de 40.

Să știți ce înseamnă ROC dacă apare într-un manual la teste.

S-ar putea să vă placă și