Sunteți pe pagina 1din 8

Bazele teoretice ale evaluării psihologice (curs 10)

Validitatea testelor psihologice

Un chestionar nu poate fi valid fără a fi fidel, dar poate fi fidel fără a fi prin aceasta şi valid.
În timp ce fidelitatea se referă la precizia măsurării, validitatea se referă la calitatea măsurării.

Definiţii ale validităţii testelor:


Lafon, 1973: validitatea unui test este calitatea acestuia „de a măsura exact ceea ce trebuie să
măsoare”.
Lindeman, 1978: „validitatea unui test este dată de măsura în care acesta îşi îndeplineşte
funcţia”.
Standards for Educational and Psychological Tests, 1985: validitatea este gradul în care o
anumită inferenţă făcută plecând de la test are înţeles, este potrivită şi utilă.
Silva, 1993: validitatea unui test se referă la cât de potrivite sunt interpretările descriptive,
explicative sau predictive care se dau scorurilor sale.
Aceste definiţii scot în evidenţă faptul că validitatea unui test trebuie legată atât de test, de ceea
ce măsoară itemii săi, cât şi de contextul în care este utilizat testul şi persoanele care răspund la test.
Validarea unui test este procesul prin care se investighează gradul de validitate a interpretării
propuse de test (Standards for Educational and Psychological Tests, 1985). Orice validare trebuie să
înceapă prin a răspunde la întrebările:
Ce funcţie îndeplineşte testul?
În ce scop se utilizează testul?
În ce condiţii se foloseşte testul?
Ce caracteristici au persoanele cărora li se administrează testul?

În Standards for Educational and Psychological Tests, 1974, sunt prezentate trei tipuri de
validitate:
- validitatea conceptuală (de construct)
- validitatea de conţinut
- validitatea relativă la criteriu

Validitatea testului relativă la constructul măsurat de acesta


Se aplică în cazul testelor care măsoară constructe psihologice, cum sunt chestionarele de
personalitate. Validitatea de construct vizează măsura în care un test are capacitatea de a măsura un
anumit construct teoretic, de exemplu inteligenţa, fluenţa verbală, nevrotismul, anxietatea etc. Ea face
apel la diverse teorii psihologice pentru a verifica, în primul rând, dacă testul se referă cu adevărat la
constructul pe care trebuie să-l măsoare, şi apoi, dacă scorurile obţinute de subiecţi la test reflectă
corect mărimea acestui construct la persoanele respective.
Se verifică dacă dimensiunea măsurată este reprezentată de un concept teoretic solid, care este
definit în literatura de specialitate sau care nu este definit, dar poate fi pus în evidenţă prin inferenţă cu
alte concepte psihologice fundamentale.

Procedură: Toate constructele sunt conectate de realitate, reprezintă aspecte sau evenimente ale
realităţii observabile. Constructele psihologice sunt evidenţiate, direct sau indirect, de comportament
sau în urma conducerii unor experimente dedicate măsurării lor. Pentru a putea verifica dacă un test
măsoară bine un anumit construct, este necesar să se realizeze o descriere a constructului în termeni
comportamentali concreţi, actele comportamentale fiind observabile şi măsurabile.
Inventarierea actelor comportamentale care reflectă constructul reprezintă operaţionalizarea
constructului, proces ce presupune trei paşi (Murphy şi Davidshofer, 1991):
1. Se identifică acele comportamente care au legătură cu constructul măsurat de test.
2. Se identifică alte constructe şi pentru fiecare se decide dacă are sau nu legătură cu
constructul măsurat de test.
3. Se alcătuieşte câte o listă de comportamente prin care se manifestă aceste constructe. Pentru
fiecare din ele, pe baza relaţiilor dintre constructe, se decide dacă are sau nu legătură cu constructul
măsurat de test.
Deoarece termenii construct şi concept sau noţiune sunt adesea utilizaţi ca sinonimi, validitatea
relativă la construct a testului este denumită şi „validitate conceptuală”.
Operaţia de validare a testului relativă la constructul măsurat presupune şi validarea externă,
care se referă la calitatea testului de a avea relaţii corecte cu alte măsuri psihologice; ea este denumită
şi „validitate convergentă şi discriminantă”:
a. Un test are validitate convergentă dacă măsoară ceea ce evaluează şi alte
teste sau variabile care se referă la acelaşi construct, deci scorurile sale variază în acelaşi
sens cu rezultatele respectivelor măsurători.
b. Un test are validitate discriminantă dacă evaluează altceva decât diverse
teste sau variabile despre care se ştie că se referă la constructe ce nu au legătură cu
constructul măsurat de test.

Evaluarea validității de construct a unui test presupune o gamă largă de dovezi din diferite
surse. Gregory (2014) enumeră aceste surse:
 Omogenitatea itemilor testului (consistența internă)
 Dacă în ceea ce privește atributul psihic studiat există diferențe între
diferitele categorii de vârstă, atunci scorurile la testul pentru care se strâng
dovezi pentru validitatea de construct ar trebui să reflecte aceste diferențe
 Dacă în teorie se presupune că există diferențe, în ceea ce privește
atributul psihic măsurat de test, între diferite categorii de persoane (cu
anumite caracteristici, din diferite medii), un test are validitate de
construct dacă scorurile la acesta reflectă aceste diferențe
 Dovezi obținute prin analiză factorială
 Validitatea de construct poate fi evaluată și în relație cu două calități ale
testului: sensibilitatea (de exemplu, capacitatea testului de a identifica
subiecții care prezintă un anumit sindrom) și specificitatea (de exemplu,
capacitatea testului de a identifica subiecții care nu prezintă un anumit
sindrom)

Validitatea testului relativă la conţinutul său


În literatura psihologică există păreri diferite despre ceea ce se urmăreşte prin validarea testului
relativă la conţinut. Anastasi (1976) consideră că acest tip de validare implică “examinarea sistematică
a conţinutului testului pentru a determina dacă el acoperă un eşantion reprezentativ din domeniul de
comportamente pe care testul în cauză trebuie să îl măsoare”. Alţi autori înlocuiesc expresia “domeniu
de comportamente” cu “mulţimea sarcinilor” sau “mulţimea performanţelor”. R. T. Lennon consideră
că validitatea relativă la conţinut se referă la răspunsurile subiectului şi nu la întrebările testului.
Pentru analizarea acestui tip de validitate trebuie luat în considerare nu numai conţinutul
itemilor testului ci şi procesul utilizat de subiect pentru a ajunge la formularea răspunsului (Silva,
1993).
În unele accepţiuni, validarea relativă la conţinut este o componentă a validării relative la
construct. Ea se realizează după definirea constructului şi urmăreşte să verifice dacă eşantionul de
stimuli şi cel de răspunsuri observate şi înregistrate în procesul de măsurare sunt reprezentative pentru
universul de comportamente pe care îl defineşte constructul respectiv (M. M. Linehan, după Silva,
l993).
Validitatea de conţinut:
 se referă la calitatea itemilor selectați în test de a fi reprezentativi pentru întregul univers
de comportamente ce reflectă ceea ce testul urmărește să măsoare
 pentru a asigura acest tip de validitate se recurge la experți care pot specifica universul
de comportamente relevante și pot emite judecăți cu privire la reprezentativitatea
itemilor

Validitatea testului relativă la criteriu


Una dintre funcţiile cele mai importante ale psihodiagnozei este cea prognostică, adică în baza
rezultatelor la test putem să facem predicţii privind conduita pe care o va adopta subiectul într-o
activitate sau situaţie viitoare. Rezultatele obţinute de către subiect la test poartă numele de predictori,
iar rezultatele (performanţele) obţinute în cadrul activităţii în raport cu care s-au făcut predicţiile poartă
numele de criteriu. Puterea de anticipare sau de predicţie a testului depinde de validitatea sa de criteriu.
Aprecierea validităţii relative la criteriu se bazează pe valorile coeficientului de validitate al testului, ca
şi coeficient de corelaţie între scorurile testului şi măsurătorile criteriului. Un test poate fi validat printr-
un singur criteriu sau prin mai multe criterii.

Există două strategii utilizate în mod obişnuit pentru aprecierea validităţii relative la criteriu a
testelor:
a. validarea predictivă: este interesată de gradul de eficienţă a testului în prognoza
comportamentului unei persoane într-o situaţie dată. Permite ca administrarea testului să
preceadă înregistrarea valorilor variabilei criteriu, între cele două acţiuni existând un
interval de timp mai lung sau mai scurt, în funcţie de situaţia concretă. De exemplu, pentru
estimarea validităţii predictive a unui test utilizat în selecţia profesională se calculează
coeficientul de corelaţie liniară între scorurile testului, administrat, de pildă, cu ocazia
finalizării unui curs de pregătire profesională, şi măsurile performanţelor (criteriul) obţinute
de aceleaşi persoane după un anumit timp, când tuturor li s-a creat posibilitatea să aplice
cunoştinţele respective.
b. validarea concurentă: necesită obţinerea scorurilor la criteriu aproximativ în acelaşi timp
cu cele ale testului. Validitatea concurentă exprimă deci în ce măsură scorurile la test pot fi
utilizate pentru a estima performanţa actuală a unei persoane la un anumit criteriu. De
exemplu, dacă aplicăm elevilor un test care măsoară inteligenţa (predictorul) putem avea
deja la îndemână rezultatele la criteriu, şi anume mediile şcolare.

Astfel, testul este valoros numai dacă demonstrăm că poate fi folosit în predicţia unor
comportamente viitoare (validitatea predictivă) sau dacă poate fi folosit în diagnosticul psihologic în
relaţie cu alte teste sau în locul altor teste consacrate (validitatea concurentă).
Distincţia logică între validitatea predictivă şi cea concurentă nu se bazează pe relaţia
temporală dintre test şi criteriu, ci mai ales pe obiectivele testării. Astfel, în timp ce validitatea
concurentă are ca scop rezolvarea unei probleme privind starea actuală a subiectului, validarea
predictivă vizează evoluţia sa în viitor. Diferenţa între cele două tipuri de validitate poate fi sumarizată
pe baza următoarelor întrebări: “Este X anxios?” (validare concurentă) şi “Este posibil ca X să devină
anxios?” (validare predictivă).
Validitatea de aspect a testelor: Orice test psihologic sau educaţional destinat utilizării în
practică trebuie să fie perceput de cei examinaţi cu el ca fiind adecvat domeniului în care este aplicat.
Această calitate a testelor este denumită validitate de aspect (C. 1. Moşier, după Nevo, 1993).
Aprecierea validităţii de aspect nu este realizată de experţi şi pentru măsurarea sa nu se folosesc
metode psihometrice. Validitatea de aspect nu este inclusă printre celelalte tipuri de validitate
(Standards for Educational and Psychological Tests,1974) şi nici nu le poate înlocui.

Aspecte privind interpretarea validităţii


C.L. Hull a impus condiţia ca un test să fie utilizat în practică doar dacă are un coeficient de
validitate relativă la criteriu mai mare decât 0.45; această cerinţă este însă greu de realizat. Un test bun
rareori poate da, cu un criteriu important, un coeficient de corelaţie mai mare decât 0.5.
În experienţa practică, valoarea coeficientului de validitate predictivă al unui test este cuprinsă între 0 şi
0.60, în majoritatea cazurilor fiind situată în partea inferioară a intervalului (Guilford, 1965).

Aspecte importante despre validitatea testelor


a) Validitatea unui test este dependentă de scopul pentru care acesta este folosit şi de populaţia
căreia i se administrează testul. Nici un test nu este valid în orice situaţie de utilizare.
b) Există diverse metode pentru validarea testelor: analiza de itemi, analiza factorială, calculul
coeficienţilor de corelaţie dintre test şi diverse criterii etc. Alegerea strategiei de validare pentru
un anumit test trebuie să fie determinată de scopul pentru care se va utiliza testul şi de cerinţele
formulate de cel care a solicitat examinarea psihologică în cadrul căreia se intenţionează să se
administreze testul respectiv.
c) Validitatea unui test nu poate fi estimată printr-un singur coeficient, ci se deduce din
acumularea dovezilor empirice şi conceptuale.
d) Strategiile de validare se aplică încă din faza de construcţie a testului. Ele se repetă până când se
obţine un test acceptabil în ceea ce priveşte lungimea, fidelitatea, validitatea şi uşurinţa în
administrare, cotare şi interpretare.
e) Validarea unui test este un proces care trebuie repetat mereu pe parcursul perioadei în care
acesta este utilizat, întrucât datele care se acumulează, provenite din observaţii clinice şi din
diverse proiecte de cercetare, permit ca interpretarea propusă iniţial pentru scorurile testului să
fie îmbunătăţită şi rafinată.

Bibliografie:
Albu, M. (1998). Construirea şi utilizarea testelor psihologice, Ed. Clusium, Cluj-Napoca.
Constantin, T. (2004). Evaluarea psihologică a personalului. Polirom, Iaşi.
Dobrean, A. (2006/2007). Psihodiagnostic, Note de curs.
Minulescu, M. (2003). Teorie şi practică în psihodiagnoză. Fundamente în măsurarea psihologică.
Testarea intelectului. Bucureşti: Editura Fundaţiei România de Mâine.
Mitrofan, N. (2008). Bazele teoretice ale evaluării psihologice, Note de curs.
Bazele teoretice ale evaluării psihologice (curs 11)

Etalonarea testelor

Pentru a putea fi interpretată, nota brută obţinută la test trebuie să aibă sens şi consistenţă.

Normele reprezintă performanţele realizate la testare de către un eşantion luat ca model; acestea
sunt stabilite empiric, prin determinarea a ceea ce se poate obţine prin testare din partea unui grup
reprezentativ.

Orice normă se limitează la o populaţie normativă pe baza căreia a fost derivată; cel care
foloseşte testul şi modul de normare trebuie să cunoască modul cum s-au stabilit aceste norme.
Normele nu au valoare permanentă şi absolută, ci reprezintă performanţa la testare a subiecţilor
care constituie eşantionul de normare.
Dacă testul provine din altă ţară, deşi el are un etalon, trebuie să fie re-etalonat.

Se distinge între eşantion – care se referă la grupul efectiv de oameni testaţi şi populaţie – care
reprezintă tipul de indivizi din care este selectat eşantionul pe baza criteriilor de reprezentativitate.
În alegerea eşantionului efortul este de a stabili un grup reprezentativ şi variat pentru
populaţia căreia îi este destinată proba. Este necesar ca iniţial să se definească populaţia specifică la
care se aplică normele. Eşantionul pentru normare trebuie să fie suficient de mare pentru a asigura
valori stabile, astfel încât, un alt eşantion extras din aceeaşi populaţie să nu producă norme care să
difere semnificativ.
În practică, chiar când există norme reprezentative pentru o populaţie definită în linii generale,
sunt construite şi utilizate şi norme de subgrup. Acest lucru se întâmplă mai ales când subgrupele
produc diferenţe suficient de mari la test. Subgrupele se pot constitui în funcţie de criterii precum:
vârsta, fundalul cultural şi social, tipul de programe şcolare, sexul, regiunea geografică, mediul rural
sau urban de provenienţă etc.

Pentru a stabili cum se încadrează individul în cadrul rezultatelor populaţiei raportăm rezultatul
acestuia la rezultatele obţinute de eşantionul standard pentru a putea spune dacă acestea coincid cu
rezultatele medii ale grupului, sunt sub acestea sau peste acestea.

Pentru determinarea exactă a locului persoanei în distribuţia de scoruri, rezultatul este


transformat într-o unitate de măsură normată. Aceste valori derivate au un scop dublu:
- precizează locul individului faţă de alţi indivizi din eşantion;
- va permite compararea între rezultatele individuale la diferite teste.

Există modalităţi diferite de a transforma rezultatele brute la un test pentru a corespunde celor
două scopuri. În general, rezultatele derivate sunt de trei tipuri: norme de vârstă, scorurile standard şi
percentilele.

Tehnici de normare

Normele de vârstă mentală


Indică nivelul de performanță la test al subiecților din diferite grupuri de vârstă din grupul de
referință (Gregory, 2014)

Conceptul de vârstă mentală a fost introdus în revizia scalelor de inteligenţă Binet - Simon.
Acestea cuprind probe individuale grupate pe niveluri de vârstă. De exemplu, probele pe care
majoritatea de 8 ani le-au putut rezolva au fost cuprinse în testul dedicat pentru 8 ani. Rezultatul unui
copil la acest test va corespunde celui mai înalt nivel de vârstă pe care este în stare să îl rezolve.
Pentru a permite o interpretare uniformă, indiferent de subiect sau de vârstă, a fost introdus
coeficientul de inteligenţă (Q.I.). Stern şi Kuhlman sunt primii care subliniază necesitatea introducerii
acestui sistem de măsurare. Q.I.-ul reprezintă raportul dintre vârsta mentală şi cea cronologică, fracţia
fiind multiplicată cu 100.
Dacă vârsta mentală este aceeaşi cu vârsta cronologică, coeficientul de inteligenţă = 100.
Rezultatul reprezentat printr-un coeficient sub 100 – indică gradul de distanţă faţă de normal, ca şi cel
peste 100 – reprezentând avansul faţă de normal.
Raportul Q.I. funcţionează pentru copii de vârsta şcolii primare şi gimnaziale, perioadă în care
există tendinţa unui ritm stabil al creşterii intelectuale de la un an la altul. Cu toate acestea, raportul Q.I.
nu funcţionează pentru adolescenţi şi adulţi, din cauză că dezvoltarea lor intelectuală este mult mai
puţin uniformă şi schimbările sunt deseori imperceptibile de la un an la altul. Mai mult, scalele vârstei
mentale şi ale vârstei cronologice nu se află la acelaşi nivel de măsură. Vârsta mentală, aşa cum a fost
evaluată prin intermediul primelor teste de inteligenţă, reprezintă în mod fundamental un nivel ordinal
de măsură, în timp ce vârsta cronologică poate fi măsurată pe o scală de raport. Din aceste motive,
împărţirea unui număr la altul pentru a obţine un coeficient nu conduce la rezultate cu sens, consistente
logic. Acestea au făcut ca raportul Q.I. să fie abandonat.
Deoarece rezultatele normate în funcţie de vârstă nu pot fi utilizate decât pentru acele funcţii
psihice care prezintă o schimbare clară şi consecventă odată cu vârsta, trăsăturile psihice care au o
slabă legătură cu vârsta nu pot fi măsurate cu astfel de norme.

Scorurile standard

Rezultatele standard se pot obţine prin transformări lineare sau prin transformări nelineare ale
rezultatelor brute.
Când se obţin prin transformare lineară, vor păstra relaţiile numerice exacte ale rezultatelor
brute, deoarece sunt obţinute prin scăderea unei constante din fiecare rezultat brut şi apoi împrăştierea
rezultatelor conform altei constante. Într-un astfel de model, mărimea relativă a diferenţelor dintre
rezultatele standard derivate va corespunde exact celei dintre rezultatele brute şi toate proprietăţile
distribuţiei iniţiale a rezultatelor brute vor fi reproduse în distribuţia rezultatelor standard.

Scorurile standard (z)


Rezultatele derivate linear se numesc şi rezultate standard sau rezultate z. Calcularea
rezultatului z cere scăderea din rezultatul brut al persoanei media grupului normativ şi împărţirea
acestei diferenţe la abaterea standard a grupului. Astfel, un scor z exprimă distanţa dintre un scor brut şi
media grupului de referinţă în termenii abaterii standard a grupului de referinţă.
_
Z = (X – X) / σ
_
X – scorul brut; X – media grupului de referinţă ; σ - abaterea standard a grupului de referinţă

Scorul z are media 0 si abaterea standard 1.


Avantaje ale scorurilor z: între rezultatele z avem aceeaşi distanţă; permit compararea valorilor unei
distribuţii şi a valorilor provenind din distribuţii diferite, ca urmare a faptului că se exprimă în abateri
standard de la medie.
Dezavantaje ale scorurilor z: în situaţia în care media e mai mare decât rezultatul, rezultatul este
negativ.

Deşi scorurile z ne permit să aflăm imediat mărimea şi direcţia diferenţei dintre orice scor şi
media distribuţiei din care face parte, ele presupun valori negative şi zecimale. Din acest motiv ele sunt
supuse de obicei unei transformări liniare suplimentare. Scopul sistemelor de scoruri standard care
rezultă din aceste transformări consecutive este pur şi simplu acela de a exprima rezultatele obţinute la
test într-o formă mai convenabilă. Numerele alese ca medii şi abateri standard în transformarea
scorurilor z în alte formate de scoruri standard sunt arbitrare. Cele mai multe sisteme de scoruri
standard utilizează o medie de 100 şi o abatere standard de 15, deşi există alte sisteme care utilizează
alte abateri standard, cum ar fi 12 sau 18.

Scorurile T
În multe inventare de personalitate sunt utilizate scorurile T.
În notele (scorurile) T, se consideră că distribuţia are media 50 şi abaterea standard 10.

Formula bazată pe scorurile z: _


T = 50 + 10 x z, şi anume T = 50 + 10 x (X – X) / σ

Clasele scării normalizate


Clasele scării normalizate sunt rezultate standard exprimate în termenii unei distribuţii ce a fost
transformată pentru a se potrivi curbei normale de distribuţie.
Efectivul total al eşantionului se împarte în clase care cuprind procente conturate plecând de la
frecvenţele distribuţiei normale. Regula este ca numărul claselor să fie un număr impar: 5, 7 sau
9 clase normalizate, procentele fiind:
a) pentru 5 clase: 6,7%, 24,2%, 38,2%, 24,2%, 6,7%
b) pentru 7 clase: 4,8%, 11,1%, 21,2%, 25,8%, 21,2%, 11,1%, 4,8%
c) pentru 9 clase: 4,0%, 6,6%, 12,1%, 17,5%, 19,6%, 17,5%, 12,1%, 6,6%, 4,0% acestea din
urmă numindu-se stanine (standard nine)

Normele exprimate prin percentile


Nu toate transformările scorurilor sunt liniare. Transformările nonliniare sunt cele care
convertesc o distribuţie de scoruri brute într-o distribuţie cu o formă diferită de cea iniţială.
Transformarea scorurilor brute cu distribuţie normală în scoruri de rang percentilic este o conversie
nonliniară.
Decilele
Scorurile brute sunt împărţite în 10 grupe sau clase, fiecare dintre ele cuprinzând 10% din
efectivul total de subiecţi.
Centilele
Scorurile brute sunt împărţite în 100 grupe sau clase, fiecare dintre ele cuprinzând 1% din
efectivul total de subiecţi.
Cuartilele
Scorurile brute sunt împărţite în 4 clase sau 4 cuartile, fiecare dintre ele cuprinzând 25% din
efectivul total de subiecţi.
Avantajele rezultatelor exprimate în percentile: sunt uşor de evaluat şi au sens şi pentru
nespecialişti; pot fi folosite şi pentru adulţi şi pentru copii, şi pentru orice tip de test. Dezavantajul
principal constă în inegalitatea evidentă dintre unităţi, mai ales în zonele extreme ale distribuţiei
(diferenţele dintre rezultatele brute sunt exagerate prin transformarea în procente; diferenţele dintre
rezultatele aflate în apropierea extremităţilor sunt mult mai reduse).

Bibliografie:

Albu, M. (1998). Construirea şi utilizarea testelor psihologice. Cluj-Napoca: Ed. Clusium.


Constantin, T. (2004). Evaluarea psihologică a personalului. Iaşi: Polirom.
Dobrean, A., (2005/2006). Psihodiagnostic, Note de curs.
Gregory, R.J. (2014). Psychological testing: History, principles, and applications (7th edn).
Boston: Pearson Education.
Minulescu, M. (2003). Teorie şi practică în psihodiagnoză. Fundamente în măsurarea psihologică.
Testarea intelectului. Bucureşti: Editura Fundaţiei România de Mâine
Mitrofan, N. (2008). Bazele teoretice ale evaluării psihologice, Note de curs.
Popa, M. (2008). Statistica pentru psihologie. Teorie şi aplicaţii SPSS. Iaşi: Polirom.
Urbina, S. (2009). Aspecte esenţiale ale testării psihologice. (S. Reghintovschi, trad.). Bucureşti: Ed.
Trei. (lucrarea originală publicată în 2004).

S-ar putea să vă placă și