Sunteți pe pagina 1din 89

ELEMENTE DE BAZĂ ÎN

EVALUAREA
PERSONALITĂŢII
• Pentru a înţelege cât mai bine conceptul de personalitate
şi utilitatea evaluării acesteia în diferite arii ale psihologiei
aplicate, este necesară o scurtă introducere în măsurarea
psihologică.
• Trebuie spus că psihologia personalităţii s-a impus ca
domeniu de studiu în ştiinţă o dată cu dezvoltarea
psihometriei, făcându-se astfel posibilă dezvoltarea de
instrumente pentru măsurarea personalităţii.
• Până atunci cea mai mare parte a autorilor din psihologia
personalităţii şi-au dedicat întreaga carieră
conceptualizării personalităţii, lucru ce a dus la apariţia
marilor teorii despre personalitatea umană (teoria
psihanalitică, teoria umanistă, teoria behavioristă şi
cognitivistă, etc).
• Deşi această perioadă de studiu a personalităţii a fost foarte
bogată în cercetări şi materiale publicate, toate aceste lucrări
au explicat personalitatea umană exlcusiv la nivel teoretic.
• Astfel, comunitatea psihologilor şi a practicanţilor psihologiei
interesaţi de evaluarea personalităţii nu dispuneau de metode
şi instrumente ştiinţifice de măsurare a personalităţii.
• Soluţia acestei probleme a apărut atunci când au fost
dezvoltate şi publicate în comunitatea ştiinţifică primele
instrumente psihometrice de evaluare a personalităţii.Astfel,
psihologia personalităţii se află într-o relaţie foarte strânsă cu
psihometria şi testarea psihologică. De aceea, pentru a putea
înţelege personalitatea din perspectivă practicii psihologice
este necesară cunoaşterea elementelor de bază în evaluarea
psihologică.
• Ca toate instrumentele psihologice valide, instrumentele
de evaluare a personalităţii sunt teste psihologice. În
continuare vor fi explicate pe scurt concepte precum
testul psihologic, nivelurile de măsurare în psihologie,
scorurile standardizate şi principalele calităţi psihometrice
ale testelor.
• Una dintre cele mai generale şi utile definiţii ale testului
psihologic este următoarea: testul psihologic este o
modalitate obiectivă şi standardizată de a măsură o
“mostră” de comportament (Anastasi, 1988, citat în
Domino şi Domino, 2006; DeVellis, 2003).
• Prin această simplă definiţie se poate înţelege foarte bine
ceea ce înseamnă testul psihologic întrucât se referă la
cele mai importante trei caracteristici ale acestuia:
obiectiv, standardizat şi comportament.
• Caracterul obiectiv al testului se referă la modalitatea de a
obţine şi interpreta informaţiile colectate de acesta. Astfel,
modul în care rezultatele testului sunt scorate şi
interpretate nu se face în funcţie de preferinţa psihologului
sau a administratorului testului ci în funcţie de criterii
obiective.
• Termenul de standardizat se referă la două aspecte. În
primul rând prin standardizat se înţelege uniformitatea
procedurii de administrare, completare, scorare şi
interpretare a testului.
• Asta înseamnă că în folosirea unui anumit test
administratorul trebuie să respecte o serie de proceduri şi
etape care se regăsesc în manalul testului.
• Aşadar, indiferent de cine este administratorul testului şi
indiferent de contextul în care se aplică testul, vor fi
respectate normele şi procedurile existente ale testului în
cauză (Urbina, 2004).
• Cu alte cuvinte, este vorba despre controlul variabilelor ce
acţionează în procesul de testare, astfel încât
respondenţii să efectueze testul după aceeaşi procedură,
pentru a nu influenţa rezultatele obţinute.
• În al doilea rând, standardizarea se referă la utilizarea
unor standarde în interpetarea rezultatelor testului
(Urbina, 2004). Aceste standarde se numesc de regulă
norme şi sunt derivate din rezultatele obţinute la test de
un grup de indivizi denumit etalon.
• Rezultatele obţinute de persoanele incluse în etalon
reprezintă standarde cu care sunt comparate rezultatele
respondenţilor la testul respectiv.
• Obiectivul testului psihologic este acela de a măsura
comportamente umane.Se observă că în definiţia
prezentată anterior autorul menţionează expresia; mostră
de comportament. Acest lucru este esenţial în înţelegerea
testelor psihologice. Spre exemplu, un test care este
destinat să măsoare anxietatea, indiferent de calitatea sa,
nu va putea niciodată să măsoare în totalitate anxietatea
unei persoane.
• Asta deoarece constructele psihologice sunt concepte
abstracte, latente şi neobservabile care nu pot fi evaluate
printr-o metodă concretă.
• Totuşi, această mostră de comportament evaluată de
testul psihologic se doreşte să fie reprezentativă. Cu alte
cuvinte, testul care măsoară anxietatea, dacă este un test
de calitate, va măsura cu ajutorul conţinutului său
(indicatorii observabili ai constructului, numiţi itemi)
aspecte importante în ceea ce priveşte anxietatea
persoanei evaluate astfel încât se pot crea inferenţe şi
ipoteze cu privire la comportamentul acelei persoane.
Scoruriurile testelor de personalitate

• Concluziile şi inferenţele cu privire la rezultelte obţinute la


testele psihologice sunt obţinute prin interpretarea
scorurilor testelor respective. Pentru a putea fi siguri că
scourile au însemnătate pentru contextul ce ne
interesează treuie să ne asigurăm că itemii testului
respectiv au fost creaţi urmând etapele impuse în
literatura de specialitate, iar testul respectiv este valid.
• Există multe tipuri de scoruri în ceea ce priveşte testele
psihologice. În continuare, vor fi explicate sumar cele mai
importante dintre acestea în orice proces de evaluare
psihologică.
• Prima categorie de scoruri este reprezentată de scorurile
brute. Un test oferă în primul rând un scor brut, care poate
să reprezinte suma răspunsurilor corecte sau suma
tuturor răspunsurilor date de respondent în cazul testelor
self-report (Domino şi Domino, 2006; Urbina, 2004).
• Scorurile brute nu oferă informaţii de mare însemnătate
cu privire la performanţa respondentului în ceea ce
priveşte caracteristicile psihice măsurate. Cu ajutorul
scorurilor brute se pot calcula distribuţii de frecvenţă şi
valori ale tendinţei centrale şi dispersiei, însă nu se pot
trage concluzii cu privire la performanţa celui evaluat.
• Într-un proces de evaluare psihologică ne dorim să
comparăm performanţa celui evaluat cu performanţa altor
indivizi ce se consideră a fi reprezentativi pentru populaţia
respectivă şi fac parte din etalonul testului. Scorurile brute
nu ne permit să efectuăm acest lucru. Un scor brut poate
fi comparat cu media grupului ce a fost evaluat.
• Astfel, dacă avem un scor brut de 62 al unui individ dintr-
ungrup de 30 de indivizi evaluaţicu media grupului de 40,
putem trage concluzia că persoana evaluată a obţinut un
scor peste media grupului, ceea ce ne face să credem că
individul este caracterizat de un nivel ridicat al variabilei
psihologice măsurate.
• Totuşi, o astfel de concluzie ar fi total eronată. Individul evaluat
de noi se află peste media grupului din care face parte şi a fost
evaluat, însă nu putem şti unde se situează la nivelul întregii
populaţii.
• Există posibilitatea, destul de mare de altfel, ca cei 30 de
indivizi evaluaţi să fie caracterizaţi de niveluri scăzute şi medii
ale trăsăturii psihologice măsurate în comparaţie cu întreaga
populaţie din care ei fac parte.
• Aşadar, pentru a putea şti unde se situează persoana evaluată
ce a obţinut un scor brut egal cu 62 avem nevoie să comparăm
performanţa sa cu performanţa unui grup de persoane
reprezentativ pentru populaţia respectivă (etalon).
• Acest lucru nu este posibil cu ajutorul scorurilor brute. Pentru a
căpăta un înţeles, scorurile burte trebuie să fie transformate în
scoruri standardizate. Principalele scoruri standardizate sunt:
scorurile de tip percentilă, scorurile Z şi scorurile T. Vor fi
explicate sumar aceste tipuri de scoruri.
• Percentilele. Primul tip de scoruri standardizate sunt scorurile
de tip percentilă. Scorurile de tip percentilă, cunoscute şi ca
rank-ul percentil, reprezintă procentajul dintr-un grup care a
scorat peste sau sub un anumit scor brut. În evaluarea abilităţii
mentale generale (inteligenţa) se utilizează scoruri standard de
tip IQ, unde media este considerată 100, iar abaterea standard
15.
• Să preupunem că dorim să evaluăm inteligenţa unei persoane.
În urma completării unui teste de inteligenţă, persoana a
obţinut un scor standardizat IQ egal cu 100. Scorul de tip
percentilă al acestei persoane este egal cu 50, adică se află la
percentila 50, ceea ce înseamnă că persoana evaluată a
obţinut un scor IQ mai mare decât 50% din populaţia din care
face parte şi în acelaşi timp, un scor mai mic decât 50% din
populaţia din care face parte.
• De asemenea, un scor IQ egal cu 90, se află la percentila 25,
ceea ce înseamnă că persoana ce a obţinut un scor IQ de 90 a
performant mai bine decât 25% din populaţie. Astfel, percentila
50 dintr-o distribuţie de date corespunde scorului brut care
separă jumătatea superioară de jumătatea inferioară a
distribuţiei, aflându-se exact la jumătatea curbei normale.
• Principalul avantaj al scorurilor de tip percentilă este dat de
posiblitatea oferită respondentului de a înţelege semnificaţia
rezultatelor unui anumit test. Un scor standardizat de tip Z sau
T nu are însemnătate pentru cineva care nu este câtuşi de
puţin familiarizat cu testarea psihologică.
• Scorul de tip percentilă rezolvă această problemă deoarece,
prin transformarea scorului brut în scor percentilă, persoană
capătă o imagine de ansamblu asupra performanţei sale la
testul efectuat
• Aşadar, o persoană care se situează la percentila 67 într-
o anumită distribuţie de date, va înţelege mult mai uşor ce
înseamnă acest lucru, adică a obţinut o performanţă mai
ridicată decât 67% din populaţie, decât dacă i se prezintă
rezultatul în scor Z sau T. Un alt avantaj al percentilelor
este atunci când pentru un test există mai multe etaloane
sau când etaloanele sunt compuse din categorii (ex.
femei, bărbaţi, etc).
• Compararea unui scor dintr-un etalon cu un scor din alt
etalon la acelaşi test este mult mai facilă atunci când se
convertesc scorurile în percentile, astfel încât scorurile din
ambele etaloane sunt exprimate în procentaje.
• Scorurile Z. Acest tip de scoruri este cel mai utilizat în
testarea psihologică dintre toate categoriile de scoruri
standardizate. Scorurile Z au la bază curba de distirbuţie
nomală (curba lui Gauss). Reprezintă distanţa unui scor
faţă de medie exprimată în abateri standard (Urbina,
2004; Domino şi Domino, 2006).
• Suma scorurilor Z dintr-o distribuţie de date este
întotdeauna 0. Media unei distribuţii de scoruri Z este
întotdeauna 0, iar abaterea standard 1. Scorurile Z aflate
sub media distribuţiei au valoare negativă, iar cele aflate
peste medie au valoare pozitivă. Astfel, scorurile Z pot
varia între -4.00 şi +4.00. Este esenţial de ştiut de ce este
utilă transformarea scorurilor brute în scoruri Z (Coolican,
2009).
• În primul rând, orice scor poate fi exprimat în rank
percentil prin observarea scorului său Z aferent, existent
în cadrul curbei normale. Între medie şi prima abatere
standard se află 34.13% din totalul scorurilor, între prima
şi a doua abatere standard se află 13.59% dintre scoruri
şi între a doua şi a treia abatere standard se află 2.14%
din totalul scorurilor.
• Această distribuţie este valabilă fie pentru jumătatea
inferioară a distribuţiei, fie pentru jumătatea superioară.
Un scor Z egal cu 0 întotdeauna reprezintă media
distribuţiei ceea ce înseamnă că jumătate (50%) dintre
scoruri se situează sub medie şi jumătate (50%) peste
medie.
• Dacă scorul unei persoane este egal cu +1, scorul acesteia
este o abatere standard peste medie. Pentru a calcula rank-ul
perentil al unui scor Z egal cu +1 trebuie să aflăm procentajul
de scoruri existente de la capătul distribuţiei până la scorul Z
egal cu +1. Acest calcul se realizează prin însumarea
procentajului de 34.13% (distanţa dintre medie şi prima abatere
standad) şi 50% (procentajul tuturor scorurilor existente în
jumătatea inferioară a distribuţiei).
• Aşadar, scorul Z egal cu +1 se află la rank-ul percentil egal cu
84.13%. Acest lucru înseamnă că persoana ce a obţinut un
scor Z egal +1 a obţinut o performanţă mai bună decât 84.13%
dintre persoanele care au susţinut acelaşi test. Dacă o
persoană a obţinut un scor Z egal cu -1înseamnă că se află o
abatere standard sub medie.
• Pentru a calcula rank-ul percentl al unui scor Z egal cu -1
trebuie aflat procentajul de scoruri existente de la capătul
distribuţiei până la scorul Z egal cu -1. Acest calcul se
realizează prin scăderea a 34.13% (procentajul scorurilor dintre
-1 abatere standard şi medie) din 50% (totalul scorurilor ce se
află sub medie), însemnând că persoana ce a obţinut un scor Z
egal cu -1 a obţinut o performanţă mai bună decât 15.87%
dintre persoanele care au efectuat testul respectiv.
• Un alt avantaj important ce derivă din transformarea scorurilor
brute în scoruri standardizate Z este posibilitatea de a compara
scorul unei persoane la un anumit test cu scorul său obţinut la
un alt test. În practică, există situaţii când, în special studenţii,
compară scorurile brute ale unei persoane obţinute la două sau
mai multe teste.
• Această practică este greşită, deoarece pentru a face o
astfel de comparaţie trebuie ca scorurile de la teste să fie
standardizate. Spre exemplu, într-o evaluare psihologică,
un client obţine un scor pentru factorul de personalitate
conştiinciozitate de 26 puncte şi un scor pentru trăsătura
dominanţă de 18 puncte.
• Cele două trăsături au fost evaluate cu două instrumente
diferite (NEO-PI-R) în cazul conştiinciozităţii şi California
Psychologycal Inventory pentru dominanţă. La prima
impresie tindem să afirmăm că persoana evaluată
prezintă un nivel al conştiinciozităţii superior celui de
dominanţă. Totuşi, nu poate fi trasă o astfel de concluzie
având în vedere că este vorba de două teste care au
medii şi abateri standard diferite.
• Formula de calcul pentru scorurile Z este următoarea: Z
= X-M/AS


• Unde, X= scorul brut
• M = media
• AS = abaterea standard
• Scorurile T. Acest tip de scoruri reprezintă scoruri
standardizate fiind derivate din scorurile Z. Scorurile T au
fost create pentru a rezolva câteva inconveniente ale
scorurilor Z. Spre exemplu, scorurile Z pot avea atât
valoare pozitivă cât şi valoare negativă, fapt ce face
interpretarea rezultatelor testelor dificilă din anumite
puncte de vedere.
• Aşadar, pentru a elimina acest inconvenient, a fost creată
o scală de măsurare a cărei medie este egală cu 50, iar
abaterea standard egală cu 10 (Coolican, 2009). Scorurile
măsurate conform acestei scale standardizată sunt de
fapt scorurile T, şi nu reprezintă decât o simplă
transformare a scorurilor Z, schimbând valoarea mediei şi
a abaterii standard.
• Scorurile T se utilizează în special în realizarea profilelor
psihologice pentru testele de evaluare a personalităţii
întrucât oferă o interpretare a rezultatelor într-o formă cât
mai accesibilă şi familiară. Formula de calcul a scorurilor
T este următoarea: 10 * Z +50, unde Z = scorul Z. O
persoană care a obţinut un scor Z egal cu +0.3, va avea
un scor T egal cu 53 (T = 10*0.3 + 50 = 53).
• Scorurile IQ. Acest tip de scoruri are la bază tot scorurile Z,
fiind o transformare a acestora. Aceste scoruri standadizate se
utilizează în evaluarea abilităţii mentale generale (GMA)
cunoscută în sens comun drept inteligenţă. Formula de calcul a
scorurilor IQ este următoarea: AS* Z + M).
• AS = abaterea standard
• Z = scorul Z
• M = media
• Astfel, se observă că pentru calcularea scorului IQ trebuie
cunoscută media şi abaterea standard a populaţiei respective.
În literatura de specialitate se consideră că scorurile
standardizate IQ au media egală cu 100 şi abaterea standard
cu 15, astfel încât IQ = 15 * Z + 100) (Coolican, 2009).
Calităţile psihometrice ale testelor de
personalitate
• Înainte de a utiliza un test psihologic, fie în scopuri de
cercetare, fie în practica psihologică, psihologul trebuie să
aibă în vedere câteva aspecte esenţiale cu privire la
calitatea respectivului test. Acest lucru se impune
deoarece în psihologie se studiază şi se măsoară
preponderent constructe abstracte.
• Spre deosebire de alte ştiinţe, cum sunt ştiinţele naturale
unde variabilele măsurate sunt variabile concrete şi
observabile, în psihologie avem de a face cu variabile
neobservabile. Cu alte cuvinte, principalele caracteristici
psihologice studiate în psihologie, aşa cum sunt
anxietatea, depresia sau trăsăturile de
personalitate,reprezintă constructe neobservabile.
• Chiar dacă fiecare dintre aceste concepte prezintă o serie
de comportamente definitorii, măsurarea acestora este
mult mai dificilă ca în cazul variabilelor concrete şi
observabile.
• Atunci când un matematician care studiază formele
geometrice doreşte să măsoare laturile unui triunghi, va
utiliza un instrument de măsurare în centrimetri,
executând această sarcină fără dificultăţi.
• Este cunoscut faptul că utilizând un instrument de
măsurare în centrimetri putem măsura lungimea sau
lăţimea obiectelor. Asta deoarece înăţimea şi lungimea
sunt variabile observabile, concrete, ştiinţa dovedind că
acestea pot fi măsurate utilizând instrumente speciale
pentru acest lucru. În psihologie lucrurile stau diferit.
• Anxietatea nu poate fi observată, prin urmare nu poate fi
măsurtă în mod direct,deoarece este un construct
abstract, nepalpabil. Astfel, pentru a putea măsura
constructele psihologice, instrumentele destinate să facă
acest lucru trebuie să fie fundamentate ştiinţific şi să
îndeplinească o serie de calităţi.
• Aceste calităţi se numesc calităţi psihometrice sau
proprietăţi psihometrice şi sunt fundamentale pentru orice
instrument de evaluare psihologică. Aceste calităţi trebuie
să atingă praguri optime ce sunt acceptate în comunitatea
ştiinţifică pentru ca testul să fie considerat un test de
calitate. Existenţa calităţilor psihometrice ale unui test
psihologic atestă faptul că respectivul test este util în
măsurarea constructului ce este destinat să îl măsoare.
• Cu alte cuvinte, proprietăţile psihometrice ale unui test
înlătură riscul efecutării unei diagnostic psihologic de
proastă calitate. Trebuie spus că, indiferent de experienţa
şi pregătirea profesională a psihologului, calitatea
procesului de evaluare psihologică depinde în primul rând
şi în cea mai mare măsură de calitatea testului cu care se
face evaluarea.
• Oricât de bine pregătit este un psiholog, dacă are la
dispoziţie un test ale cărui calităţi psihometrice sunt slabe,
informaţiile obţinute vor fi cu siguranţă informaţii
redundante.
• Calităţile psihometrice ale testelor psihologice sunt validitatea
şi fidelitatea. În cel mai general sens, validitatea se referă la
capacitatea testutului psihologic de a măsura ceea ce îşi
propune să măsoare (Matsumoto şi van De Vijver, 2010), adica
dacă un test destinat să măsoare factorul de personalitate
agreabilitate, chiar măsoară agreabilitatea.
• Fidelitatea testului se referă la capacitatea acestuia de a
produce rezultate replicabile. Un test ce măsoară abilitatea de
leadership este fidel dacă o persoană obţine aceleaşi rezultate
în urma mai multor evaluări cu acelaşi test.
• Cu alte cuvinte se rerferă la consistenţa rezultatelor. Există mai
multe tipuri de validitate şi fidelitate, fiecare dintre ele având o
importanţă deosebită în ceea ce priveşte utilitatea testelor
psihologice. În continuare vor fi prezentate pe scurt principalele
tipuri de validitate şi fidelitate.
Fidelitatea testelor de personalitate

• Aşa cum am prezentat anterior, în general, fidelitatea


reprezintă capacitatea unui test de a produce rezultate
replicabile şi consistente (Ashton, 2013). Aşadar, când
există o foarte mare concordanţă între mai multe evaluări
ale aceluiaşi construct înseamnă că aceste evaluări au
măsurat cu adevărat o caracteristică psihologică reală,
având o semnificaţie ridicată.
• În primul rând este important să se măsoare fidelitatea
unor evaluări întrucât. indiferent de calitatea testului şi de
tipul de evaluare, va exista întotdeauna o eroare aleatorie
de măsurare (random error of measurement) a acelor
evaluări. Există mai multe tiprui de fidelitate în funcţie de
tipul de eroare de măsurare pe care îl luăm în calcul
(Ashton, 2013).
• Dacă măsurăm o caracteristică psihologică folosind un test
compus din mai mulţi itemi, în acest caz eroare este dată de
faptul că indiferent de cât de mare este calitatea acelor itemi,
aceştia nu măsoară 100% constructul respectiv. Cu alte
cuvinte, în nicio situaţie itemii unui test nu sunt indicatori
perfecţi ai acelui construct (Ashton, 2013).
• Dacă măsurăm o caracteristică psihologică solicitând mai
multe persoane pe post de evaluatori pentru a evalua
caracteristica respectivă în ceea ce priveşte mai multe
persoane. Și în acest caz vorbim de o eroare deoarece
evaluările oferite de cei aleşi, indiferend de nivelul de pregătire
al acestor sunt încărcate de subiectivitate, astfel încât
rezultatele evaluării conţin şi o părere subiectivă a
evaluatorului.
• De asemenea, dacă măsurăm o caracteristică psihologică
în mai multe ocazii la acelaşi individ, există şansa ca
nivelul trăsăturii respective să fie inconstant din diferite
cauze, acesta fiind alt tip de eroare de măsurare. Aşadar,
pentru a evalua calitatea măsurărilor şi pentru a diminua
cât mai mult tipurile de erori menţionate anterior, există
mai multe tipuri de fidelitate a testelor psihologice.
• Consistenţa internă. Acest tip de fidelitate are în vedere
eroare de măsurare derivată din natura itemilor ce
compun testul în cauză. Consistenţa internă a unei probe
psihologice mai este numită şi alpha Cronbach, denumire
care derivă din numele psihometricianului care a creat
acest tip de fidelitate, Lee Cronbach (1951).
• Pentru a înţelege cât mai bine ce înseamnă ca un test să
posede o consistenţă internă ridicată vom avea în vedere
următorul exemplu. Discutăm despre conceptul de
anxietate. Cum am amintit anterior, ca aproape toate
conceptele psihologice, anxietatea este o variabilă
neobservabilă.
• Pentru a o putea măsura facem apel la comportamente despre
care se ştie că sunt specifice anxietăţii. Aceşti indicatori
comportamentali ai constructului sunt reprezentaţi de itemii
testului ce pot fi sub formă de întrebări sau afirmaţii. Spre
exemplu, itemul “Obişnuiesc să-mi fac multe griji” este un item
ce se consideră că măsoară anxietatea, fiind un indicator
comportamental al anxietăţii.
• Totuşi, acest item nu este un indicator perfect pur, 100% al
anxietăţii. Astfel, măsoară parţial constructul de anxietate, însă
cu siguranţă mai măsoară şi alte variabile particulare. Atunci
când un anumit item măsoară în mare parte şi altă variabilă
decât variabila care se presupune că trebuie să o măsoare (în
cazul de faţă anxietate), se spune despre acel item că prezintă
o eroare de varianţă crescută (error variance) (Ashton, 2013).
• Totuşi, calculând media răspunsurilor unei persoane la o
serie de mai mulţi itemi care măsoară anxietatea, eroarea
creată de acel item particular tinde să nu mai fie atât de
importantă în scorul final, asta în cazul în care există un
număr semnificativ de alţi itemi care prezintă o mică
eroare de varianţă.
• În acest caz, scorul total al persoanei la testul de
anxietate va fi caracterizat de o eroare mică de măsurare,
reflectând în mod corect ceea ce itemii au în comun.
• Chiar şi în acest caz, când se realizează scorul total mediu al
persoanei la testul respectiv, acest scor nu este niciodată
perfect fidel (consistent), existând mereu un anumit nivel de
eroare (Ashton, 2013).
• Conform lui Ashton (2013) fidelitatea unui scor obşinut prin
calcularea mediei răspunsurilor la mai mulţi itemi depinde în
general de două lucuri: de numărul itemilor şi de corelaţiile
dintre itemi.
• Atunci când calculăm media răspunsurilor unei persoane la
itemi care au ceva în comun, elementul în comun
(caracteristica psihologică ce se doreşte a fi măsurată, în cazul
de faţă anxietatea) devine din ce în ce mai puternic cu cât
adăugăm mai mulţi itemi. Cu cât există mai mulţi itemi, cu atât
eroarea aferentă unui item paricular va fi mai mică.
• Spre exemplu, dacă măsurăm anxietatea printr-un item de tipul “În
general mă simt tensionat” eroarea va fi probabil destul de mare
deoarece o persoană poate să se simtă tensionată în general şi din
alte cauze decât anxietatea, cum ar fi existenţa unei probleme la locul
de muncă sau în familie, care persistă de foarte mult timp şi care se
resimte în starea generală a persoanei.
• Astfel, consistenţa internă a unui instrument format din doi sau trei
astfel de itemi va fi una mică, deoarece chiar dacă aceşti itemi
măsoară parţial anxietatea, măsoară cu siguranţă şi alte variabile
care nu fac parte din spectrul anxietăţii.
• Însă, dacă pe lângă aceşti itemi se mai adaugă 15 itemi cum ar fi
“Obişnuiesc să-mi fac griji destul de des”, “În general mă panichez
foarte uşor”, eroarea tinde să scadă, iar scorul total reflectă mult mai
mult din ceea ce itemii măsoară în comun, determinând o probă de
evaluare fidelă sau consistentă. Deci, în general, când numărul
itemilor destinaţi să măsoare aceeaşi caracteristică este mare, tinde
să scadă nivelul erorii, crescând consistenţa internă a măsurării
respective.
• De asemenea, atunci când calculăm media răspunsurilor unei
persoane la itemi care au ceva în comun, elementul în comun
(caracteristica psihologică ce se doreşte a fi măsurată, în cazul
de faţă anxietatea) devine din ce în ce mai puternic în măsura
în care itemii sunt corelaţi între ei (Ashton,2013).
• Asta se întamplă deoarece corelaţia ne spune în ce măsură
fiecare item luat individual măsoară o caracteristică psihologică
comună.
• Cu cât corelaţia este mai mare, cu atât fiecare item măsoară
caractersitica respectivă. Astfel, pentru a creşte nivelul
fidelităţii, adică pentru a spori capacitatea de a măsura o
caracteristică psihologică comună cu ajutorul a mai mulţi itemi
ce formează o scală este de dorit să existe un număr relativ
mare de itemi ce constituie respectiva scală şi itemii să fie
puternic intercorelaţi.
• Acest tip de fidelitate prezetat anterior este numit
consistenţă internă în primul rând pentru că se referă la
gradul în care itemii unui test sunt corelaţi între ei.
• Consistenţa internă se referă la nivelul de varianţă al unui
test determinat de varianţa comună a itemilor ce
alcătuiesc testul respectiv (Ashton, 2013).
• Confrom lui Ashton (2013), dacă o scală de evaluare
psihologică prezintă un nivel scăzut de consisnteţă
internă nu este recomandat ca aceasta să fie utilizată nici
în cercetare ştiinţifică nici în practica psihologică
deoarece, implicit, acea scală este caracterizată şi de un
nivel scăzut de validitate.
• O altă metodă de calcul a consistenţei unei probe de
evaluare psihologică, pe lângă coeficientul alpha
Cronbach este fidelitate de tip split half. Această tehnică
prespune împărţirea testului în două părţi egale (ex. Itemii
1, 3, 5, 7 şi 2, 4, 6, 8) şi calcularea corelaţiei dintre cele
două părţi. Un coeficient de corelaţie puternic indică o
fidelitate de tip split-half foarte bună.
• Nivelul acceptat al consistenţei interne impus de
standardele existente în comunitatea ştiinţifică este de
.70. Totuşi, conform lui Ashton (2013) o scală de evaluare
care are un coeficient de consistenţă internă între .50 şi
.60 poate fi caracterizată de un nivel acceptabil al
validităţii, putând fi considerată utilă în cercetarea
psihologică.
• Fidelitatea inter-evaluator. Un alt tip de fidelitate este
fidelitatea inter-evaluator. Este similară consistenţei interne
însă este specifică pentru evaluările psihologice ce nu sunt
efectuate cu ajutorul instrumentelor self-report.
• Acest tip de validitate este utilizat când evaluarea psihologică
este realizată cu ajutorul mai multor evaluatori ce au sarcina de
a măsura o anumită caracteristică psihologică (Ashton, 2013).
Pentru a înelege ce înseamnă acest tip de validitate vom oferi
exemplu următoar. Să presupunem că un grup de psihologi
organizaţionali iau parte la un proces de recrutare şi selecţie de
personal. Au sarcina de a evalua trăsăturile de personalitate ale
candidaţilor pentru postul de manager de vânzări, însă
organizaţia în care lucrează nu dispune de un instrument de
evaluare psihologică de tip-self report.
• Astfel, aceştia vor trebui să observe comportamentul
candidaţilor în timpul interviului de angajare pentru a face
inferenţe şi a trage concluzii cu privire la anumite trăsături
de personalitate. Astfel, pentru a asigura un optim de
fidelitate se verifică în ce măsură evaluările realizate de
grupul de psihologi sunt asemănătoare.
• Se aşteaptă ca o persoană care a fost evaluată în timpul
interviului ca fiind caracterizată de un nivel înalt de
extraversie de către evaluatorul A să fie evaluată tot ca o
persoană extravertă şi de către evaluatorii B şi C.
• Pentru a testa această concordanţă între evaluări se
calculează coeficientul de corelaţie dintre evaluările
psihologilor.
• Astfel, prin calcularea fidelităţii inter-evaluator se verifică
gradul în care grupul de evaluatori măsoară aceeaşi
caracteristică psihologică. Spre exemplu, presupunem că
un grup de trei psihologi trebuie să evalueze în cadrul
unui interviu trăsătura de personalitate conştiinciozitate a
unui individ.
• Dacă în urma evaluării, corelaţiile dintre evaluările acelor
psihologi nu se află la un nivel acceptabil, înseamnă că
evaluările celor trei experţi nu reflectă o imagine
acceptabilă despre nivelul conştiinciozităţii alpersoanei
evaluate (Ashton, 2013).
• Pentru a se considera că evaluarea psihologică este
fidelă nu trebuie să există o corelaţie foarte mare între
evaluările experţilor. Dacă cei trei experţi sunt de acord
relativ moderat că persoana testată este conştiincioasă,
atunci se poate afirma că există o bună fidelitate inter-
evaluator cu privire la testarea în cauză.
• Indiferent de context şi de situaţie, evaluările mai multor
experţi despre un subiect nu pto fi niciodată identice.
Întotdeauna unul dintre experţi va considera că persoana
evaluată este mai mult sau mai puţin conştiincioasă decât
consideră alt expert.
• Astfel, întotdeauna experţii, fie vor subestima nivelul
caracteristicii evaluate, fie îl vor supraestima, ceea ce
înseamnă că în orice evaluare va exista o eroare de
măsurare.
• Calculând media evaluărilor celor trei experţi se vor obţine
informaţii fidele cu privire la caracteristica măsurată,
deoarece calculând media evaluărilor, rezultatul reflectă
într-o mai mai mare măsura elementul comun măsurat de
cei trei experţi (în acest exemplu, conştiinciozitatea).
• În acest fel, eroare aferentă fiecărei măsurări va deveni mai
puţin semnificativă în comparaţie cu ceea ce au în comun cele
trei evaluări(Asthon, 2013). Ca şi în cazul consistenţei interne,
când numărul evaluatorilor este mai mare, va creşte şi
fidelitatea inter-evaluator.
• În calculul fidelităţii inter-evaluator, experţii evaluatori joacă
rolul itemilor aferenţi testelor de tip self-report. Spre exemplu,
dacă o caracteristică psihologică este evaluată de cinci experţi
în loc de trei, măsurarea va fi mai fidelă.
• De asemenea, când corelaţiile dintre evaluările experţilor sunt
puternice, avem de a face cu o fidelitate a măsurării mai
ridicată decât în cazul unor corelaţii slabe. În concluzie,
fidelitatea inter-evaluator reprezintă proporţia de varianţă care
este comună fiecărei evalări realizate de către experţi (Ashton,
2013).
• Fidelitatea test-retest . Altă sursă de eroare în măsurarea
psihologică provine din variaţia rezultatelor evaluării la intervale
relativ scurte de timp. Atunci când măsurăm anumite trăsături
psihologice la aceleaşi persoane de mai multe ori la perioade
de timp diferite, vom observa că scorurile persoanelor nu vor fi
identice cu cele din prima evaluare.
• Astfel, unii indivizi vor obţine scoruri mai mici decât au obţinut
iniţial, iar alţii vor obţine scoruri mai mari decât au obţinut la
prima evaluare (Ashton, 2013).
• Variaţia scorurilor persoanelor în ceea ce priveşte
caracteristicile psihologice evaluate în perioade de timp diferite,
în cele mai multe cazuri, nu este substanţială, însă, cercetătorii
şi specialiştii, pentru o calitate crescută a evaluării psihologice,
doresc să cunoască măsura în care scorurile sunt diferite de la
o testare la alta, cu alte cuvinte, să cunoască exact mărimea
erorii de măsurare determinată de acest aspect.
• Pentru a realiza acest lucru, cercetătorii şi psihologii
evaluează aceeaşi caracteristică psihologică în cadrul
aceluiaşi grup de indivizi de două ori, de cele mai multe
ori la distanţă de câteva săptămâni.
• Corelaţia dintre cele două măsurări poartă numele de
fidelitate test-retest. În cazul în care scorurile obţinute în
urma celor două evaluări sunt aproape identice, corelaţia
dintre evaluări va fi una puternică, indicând un nivel
crescut de fidelitate test-retest şi un nivel scăzut al erorii
de măsurare determinată de variaţia scorurilor între cele
două evaluări (Ashton, 2013).
• Un aspect important în ceea ce priveşte fidelitatea test-
retest este intervalul de timp la care sunt efectuate cele
două evaluări. Marii cercetători sugerează ca evaluările
să aibă loc în perioade de timp apropiate, de ordinul
zilelor sau maxim în câteva săptămâni.
• În cazul în care evaluările sunt separate de mai multe luni
sau chiar ani, este posibil ca variaţia scorurilor să nu se
mai datoreze erorii de măsurare ci chiar să existe o
modificare reală a caracteristicii evaluate.
• Spre exemplu, dacă într-un proces de validare a unei
probe de evaluare a stimei de sine, pentru verificarea
fidelităţii test-retest, echipa de cercetători realizează
testarea iniţială şi testarea a doua la o distanţă de un an.
Este posibil ca scorurile obţinute în urma celor două
evaluări să fie diferite semnificativ.
• Poate că o persoană a obţinut iniţial un scor semnificativ
mai mic decât în a doua evaluare. Totuşi, într-o astfel de
situaţie nu se poate afirma că scala supusă procesului de
validare nu este caracterizată de un nivel optim al
fidelităţii deoarece principala cauză din care rezultatele nu
sunt consistente poate fi chiar modificarea trăsăturii în
evaluate (stima de sine).
• Este posibil ca în intervalul de un an ce a separat testarea
I de testarea II, persoana să fi efectuat şedinţe de
dezvoltare personală în cadrul formării ca psihoterapeut,
sau şedinţe de psihoterapie ca şi client. În astfel de
circumstanţe sunt şanse foarte mari ca nivelul stimei de
sine al persoanei evaluate să fi crescut semnificativ în
decurs de un an.
• Astfel, în acest caz, testul măsoară cu acurateţe nivelul
stimei de sine, acesta variind datorită modificării reale ale
stime de sine, însă, cercetătorul poate trage concluzia că
testul nu oferă rezultate consistente în timp, ceea ce
înseamnă că nu este fidel, hotărând să restructureze
elemente componente ale scalei de evaluare când, de
fapt, nu se impune o astfel de abordare.
• Aşadar, pentru a investiga fidelitatea test-retest a unei
scale de măsurare psihologică se recomandă ca cele
două evaluări să se efectueze la perioade apropiate de
timp deoarece majoritatea caracteristicilor psihologice
sunt stabile pe perioade scurte de timp.
• Totuşi, conform lui Ashton (2013), fideltiatea test-retest
poate înregistra valori scăzute şi când cele două evaluări
sunt realizate la perioade scurte de timp.
• Acest lucru se întâmplă de obicei atunci când testul
doreşte să evalueze caracteristici psihologice din
categoria caracteristicilor emoţionale şi afective aşa cum
sunt anxietatea, depresia, starea de dispoziţie şi diferitele
emoţii generale (bucurie, tristeţe, exaltare, etc).
• Pentru a măsura astfel de caracteristici, trebuie acordată o
importanţă deosebită analizei constructului psihologic ce se
doreşte a fi măsurat. Dacă psihologul doreşte să măsoare
emoţii generale, adică cum se simte în general o persoană
(veselă, tristă, etc), trebuie ca testul respectiv să conţină itemi
care să facă referire la caracterul general al acestor stări şi
emoţii.
• Dacă testul va conţine itemi sub forma “Mă binedispun destul
de uşor” şi doreşte să măsoare starea generală de
bunădispoziţie a persoanei, pot apărea probleme în calcularea
fidelităţii test-retest, deoarece respondentul poate interpreta
acest item ca făcând referire la capacitatea de a se
binedispune fără prea mari eforturi ale acestuia în momentul
evaluării, în perioada prezentă, şi nu cum este el în general.
• Astfel, în testarea 1 respondentul poate raporta un nivel
ridicat al emoţiilor pozitive, iar peste o săptămână,
datorită unor evenimente de viaţă, poate raporta un nivel
scăzut al acestora, indicând o fidelitate test-retest
scăzută.
• Caracteristicile psihologice de tipul emoţiilor sunt uşor
modificabile, chiar şi în decursul a perioade scurte de
timp. De aceea, pentru a elimina acest inconvenient,
psihologul trebuie să utilizeze itemi care să facă referire la
caracterul general al acestor caractersitici, ca de exemplu
“În general, mă binedispun destul de uşor”.
Validitatea testlor psihologice
• Validitatea unui instrument psihologic reprezintă
capacitatea instrumentului de a măsura ceea ce îşi
propune să măsoare. Ashton (2013) afirmă că validitatea
unui instrument reprezintă măsura în care instrumentul
măsoara variaţia unui caracteristici psihologice ce se
presupune că ar trebui să o măsoare.
• Atât fidelitatea cât şi validitatea testelor psihologice
reprezintă calităţi psihometrice, însă, după cum se
observă din definiţia validităţii, aceasta are un caracter
mai calitativ decât fidelitatea, fiind si mult mai restrictivă.
• Referitor la fidelitate, aceasta urmăreşte măsura în care testul
măsoară o singură caracteristică psihologică, adică dacă
măsurarea are sens şi însemnătate. În schimb, prin validitate
se doreşte să se afle care este caracteristica psihologică ce
este măsurată, nu doar dacă testul măsoară o caracteristică
psihologică.
• Spre exemplu, un test care se presupune că măsoară
satisfacţia la locul de muncă poate să prezinte o consistenţă
internă de .80 (foarte bună), însă să nu fie un test valid pentru
a măsura satisfacţia la locul de muncă.
• Consistenţa internă de .80 ne spune că testul respectiv
măsoară un singur lucru şi că toţi itemii respectivi măsoară
acelaşi lucru, însă doar din această informaţie nu se poate şti
dacă întradevăr este vorba despre satisfacţia la locul de
muncă.
• Având în vedere aceste aspecte, cineva se poate întreba de ce
este necesară cunoaşterea fidelităţii unui test, din moment ce
validitatea nu derivă din fidelitate şi oferă informaţii de o calitate
superioară. În primul rând, cunoscând fidelitatea testului,
psihologul poate să îşi dea seama de potenţiala validitate a
testului.
• Un test care are o consistenţă internă foarte slabă, de .20,
înseamnă că nu măsoară nicio caracteristică psihologică, prin
urmare nu poate fi un test valid deoarece dacă nu măsoară
nicio caracteristică, cu siguranţă nu măsoară caracteristica pe
care doreşte să o măsoare.
• De asemenea, conform lui Ashton (2013), o scală care are o
validitate moderată, poate deveni o scală cu o validitate foarte
ridicată prin creşterea fidelităţii acesteia. Astfel, dacă anumiţi
itemi sunt îmbunătăţiţi şi modificaţi pentru a spori consistenţa
internă, sunt şanse foarte mari ca validitatea testului să
crească.
• Există mai multe tipuri de validitate a unui test psihologic.
În continuare vor fi prezentate principalele tipuri de
validitate.
• Validitatea de conţinut. Unul dintre aspectele cele mai
importante ale validităţii unui test se referă la măsura în
care componentele testului (itemii) sunt relevante pentru
caracteristica psihologică ce se presupune că trebuie să o
măsoare.
• Pentru ca un test să aibă validitate de conţinut, acesta
trebuie să măsoare toate aspectele importante şi
definitorii ale caracteristicii psihologice ce trebuie
măsurată şi în acelaşi timp să nu măsoare aspecte ale
altor caracteristici psihologice.
• Spre exemplu, atunci când dorim să evaluăm
conştiinciozitatea unei persoane trebuie utilizat un test
care evaluează toate aspectele şi caracteristicile definitorii
ale conştiinciozităţii. Astfel, un test care conţine itemii
“Acord o mare importanţă curăţeniei” “Sunt o persoană
organizată”, “Obişnuiesc să respect termenele limină” şi
“Îmi place să am mulţi prieteni”este un test ce nu are o
foarte bună validitate de conţinut deoarece din cei 4 itemi
care alcătuiesc acest test, 1 item, şi anume ultimul, nu
măsoară aspecte definitorii ale conştiinciozităţii.
• Dacă primii trei itemi cu siguranţă fac referire la
comportamente specifice conştiinciozităţii, utlimul item
măsoară mai degrabă extraversia. Astfel, 25% din conţinutul
acestui test măsoară aspecte ce nu sunt specifice trăsăturii de
conştiinciozitate.
• De cele mai multe, ori, având în vedere şi exemplul de mai
sus, tindem să considerăm că a asigura o validitate de conţinut
optimă unui test psihologic este un lucru destul de simplu, iar
eventualele erori sunt uşor detectabile.
• Totuşi, lucrurile nu sunt chiar atât de simple. Există situaţii în
care asigurarea unui nivel optim al validităţii de conţinut pentru
o anumită probă de evaluare psihologică este dificil, indiferent
de experienţa şi pregătirea specialistului
• Spre exemplu, în dezvoltarea unui test de evaluare a anxietăţii
trebuie acordată o importanţă deosebită conţinuturilor
constructului de anxietate. După cum este cunoscut în
literatura de specialitate, există covarianţă între anxietate,
depresie şi afectele negative generale.
• Astfel, în realizarea itemilor destinaţi să măsoare anxietatea
sunt greu de separat itemi care măsoară anxietatea de itemi
care măsoară depresia.
• Un item de tipul „În general am o stare de dispoziţie proastă”
se consideră a măsura anxietatea, însă la fel de bine poate fi
considerat că măsoară depresia. Specialiştii trebuie să cadă de
comun acord care sunt comportamentele cele mai relevante
specifice anxietăţii pentru a realiza itemi care să măsoare cât
de complet posibil constructul de anxietate (Wilson, Pan şi
Schumsky, 2012).
• Ashton (2013) consideră că validitatea de conţinut a unui
test poate avea de suferit atunci când se încearcă
creşterea consistenţei interne a testului.
• După cum a fost prezentat în paginile anterioare,
consistenţa internă se referă la capacitatea itemilor
componenţi dintr-un test psihologic de a măsura acelaşi
lucru (de a măsura o caracteristică psihologică comună).
• Astfel, când un test care măsoară anxietatea are o
consistenţă internă foarte ridicată, înseamnă că itemii
testului sunt foarte corelaţi între ei, măsurând acelaşi
lucru. Totuşi, există riscul ca măsurând acelaşi lucru, o
probă de evaluare psihologică să nu ia în considerare
aspecte importante ale constructului ce este destinată să
o măsoare.
• În cazul anxietăţii, o probă de evaluare anxietăţii
unidimensională ce are un coeficient de consistenţă
internă egal cu .90 poate să fie compusă exclusiv din
itemi ce au rolul de a măsura comportamente specifice
panicii, neluând în considerare itemi care să măsoare
comportamente specifice tendinţei de îngrijorare,
dimensiune definitorie pentru anxietatea generală. În
acest caz, vorbim de o probă de evaluare ce are o
validitate de conţinut scăzută.
• Una dintre metodele de calcul a validităţii de conţinut ce
s-a impus recent în comunitatea ştiinţifică este cea
propusă de Polit şi Beck (2006). Această metodă propune
calcularea unui indicator al validităţii de conţinut. Prima
etapă este alegerea unui grup de specialişti (experţi).
• Urmează ca fiecare dintre experţii aleşi să acorde câte un
scor fiecărui item component al textului în funcţie de
relevanţa itemului pentru constructul ce urmează a fi
măsurat. Scorurile ce pot fi acordate sunt 1 = irrelevant,
2= puţin important, 3 = important, 4 = foarte important.
Formula de calcul a indicatorului pentru validitatea de
conţinut este următoarea: Nr/Total

• Unde,
• Nr = Numărul de experţi care au acordat itemului scorul 3
sau 4
• Total = Numărul total de experţi
• Astfel, dacă dintr-un grup 5 experţi, 4 dintre aceştia au
acordat tuturor itemilor scoruri de 3 şi de 4 (important şi
foarte important) atunci coeficientul de validitate de
conţinut pentru testul respectiv este egal cu 4/5 =.80.
Această modalitate de calcul a validităţii de conţinut nu
este unanim acceptată de către comunitatea ştiinţifică,
existând destul critici asupra acesteia.
• Totuşi, indiferent de criticile existente metoda propusă de
Polit şi Beck (2006) prezintă o utilitate incontestabilă
deoarece oferă posibilitatea de cuantificare a validităţii de
construct sub forma unei expresii numerice. Până cu puţin
timp în urmă acest lucru era imposibil, validitatea de
conţinut ne putând fi măsurată printr-un indicator numeric,
reprezentând o evaluare de tip calitativ.
Validitatea de aspect

• Validitatea de aspect se referă la investigarea şi analiza de tip


vizual a itemilor cu scopul de a observa dacă aceştia par să
măsoare constructul ce se presupune că este măsurat (Howitt
şi Cramer, 2011).
• Howitt şi Cramer (2011) sunt de părere că validitatea de aspect
a unui test este realizată încă din procesul de construire şi
selectare a itemului deoarece, un item o dată ales să facă
parte dintr-o anumită scală, este deja considerat un item valid.
• De asemenea, validitatea de aspect a unui test se referă şi la
capacitatea celui evaluat de a înţelege informaţiile cu care intră
în contact în procesul de completare a testului. Astfel, se
aşteaptă de la un test ca itemii să fie formulaţi corect
gramatical şi să fie cât mai lipsiţi de ambiguitate. Instrucţiunile
de completare a testului trebuie să fie clare şi lipsite de
ambiguitate.
• Acest tip de validitate este unul informal, neputând fi
măsurat din punct de vedere cantitativ (nu se poate obţine
un indicator sau coeficient al validităţii de aspect). Datorită
caracterului său subiectiv şi vag, acest tip de validitate nu
este vital în procesul de construire al testelor psihologice,
mulţi cercetători neraportând acest tip de validitate în
publicaţiile sau manualele de utilizare ale testelor
construite.
• Totuşi, validitatea de aspect se regăseşte în majoritatea
cărţilor şi tratatelor de metodologie a cercetării şi de
testare psihologică deoarece reprezintă o metodă iniţială
şi rapidă de verificare a validităţii unei probe de evaluare
psihologică, chiar dacă această verificare este una
superficială şi lipsită de caracter empiric.
• Validitatea de construct. Pentru a putea înţelege
validitatea de construct mai întâi este necesar să
clarificăm semnificaţia termenului de construct (Cronbach
şi Meehl). Constructul este sinonim cu termenul de
concept şi reprezintă o organizare sub formă teoretică şi
abstractă a unor informaţii ce descriu fenomene din
mediul înconjurător.
• Un construct nu poate fi observat sau surprins în mod
concret (Pedhazur şi Shmelkin, 1991). Validarea de
construct se referă la demonstrarea unei cauzalităţi între
variabila neobservată sau latentă (constructul) şi
variabilele observate denumite indicatori (itemii testului)
(Pedhazur şi Pedhazur-Shmelkin, 1991).
• Vom da un exemplu folosind din nou conceptul de anxietate.
Anxietatea nu este un fenomen, un lucru ce poate fi observat.
Având în vedere că nu poate fi observat, nu poate fi nici
măsurat în mod direct, fiind cu alte cuvinte un construct
teoretic. Pentru a putea măsura anxietatea, avem nevoie de
indicatori observabili ai acesteia.
• Indicatorii observabili reprezintă comportante care de-a lungul
timpului s-au dovedit a fi definitorii pentru anxietate. Astfel,
nivelul total al anxietăţii este dat de totalul comportamentelor
ce exprimă anxietatea. Prin urmare, în cercetarea ştiinţifică se
consideră că indicatorii comportamentali sunt criterii pentru
constructul teoretic (sunt cauzaţi, determinaţi de variabila
latentă). Această relaţie este reprezentată în figura 1.
• În literatura de specialitate constructele teoretice se reprezintă
grafic printr-un oval, iar indicatorii acestuia sub formă de
dreptunghi. Trasarea unei săgeţi unidirecţionale de la
constructul teoretic spre indicatorii acestuia reprezintă relaţia
de cauzalitate dintre aceştia, adică indicatorii teoretici sunt
prezişi de constructul teoretic şi reprezintă dimensiunile
compoenente ale constructului.
• Astfel, după cum se observă în Figura 1, anxietatea care are
rolul constructului este reprezentată sub forma unui oval, iar
indicatorii anxietăţii (itemii testului) sunt reprezentaţi de către
dreptunghiuri. Pedhazur şi Shmelkin (1991) afirmă că validarea
de construct este un proces însoţit de erori, aspecte ambiguu şi
concluzii eronate datorită analizei semantice ce trebuie
realizată în acest proces.
• În acest sens, problemele apar atunci când un anumit
construct este analizat. Cei doi autori sunt de părere că
unele variabile sunt considerate de către cercetători fie ca
şi constructe teoretice sau fie ca indicatori ai unui anumit
construct.
• Spre exemplu, comportamentul votantului poate fi tratat în
unele cazuri ca şi construct teoretic şi în alte cazuri ca
indicator al altui construct, cum ar fi implicarea în viaţa
politică.
• Tehnici moderne de analiză statistică precum analiza
factorială de confirmare au făcut posibilă testarea
validităţii de construct. Pedhazur şi Shmelkin (1991)
enumeră etapele esenţiale ale analizei de construct.
• Acestea sunt: (1) analiza logică ce prespune definirea cât
mai corectă a constructului şi analiza conţinutului itemilor
şi (2) analiza structurii interne a testului ce se realizează
prin intermediul analizei factoriale exploratorii şi analizei
factoriale confirmatorii.
• În practică, cercetătorii, în cele mai multe dintre cazuri
recurg doar la analiza factorială exploratorie. Analiza
factorială exploratorie reprezintă o tehnică statistică
avansată ce are ca obiectiv identificarea unor factori
(constructe, variabile latente) care să exprime relaţiile
existente între un set de variabile observate (indicatorii
constructului sub forma itemilor ) (Pedhazur şi Shmelkin,
1991).
• Nu vom insista în această lucrare asupra acestor tehnici
de analiză statistică întrucât nu reprezintă informaţii
esenţiale în psihologia personalităţii. Conform lui Ashton
(2013) validitatea de construct reprezintă capacitatea unui
test de a măsura întradevar caracteristica psihologică ce
se presupune că trebuie să o măsoare.
• În practică, metoda prezentată anterior de analiză a
validităţii de construct este destul de puţin folosită. De
cele mai multe ori, cercetătorii ce testează validitatea de
construct a unui test fac acest lucru prin calcularea unor
corelaţii între scorurile constructului evaluat şi scorurile
altor variabile psihologice.
• Variabilele cu care este corelat constructul sunt
reprezentate de teste psihologice care sunt deja validate
şi care în cele mai multe cazuri măsoară acelaşi construct
ca şi testul ce se doreşte să fie validat sau de teste
psihologice deja validate care măsoară caracteristici
psihologice despre care se cunoaşte că se află într-o
anumită relaţie (pozitivă sau negativă) cu constructul
măsurat de testul ce se află în proces de validare.
• Aceste tipuri de validitate de construct poartă numele de
validitate convergentă şi validitate disciminantă.
• Atunci când dorim să evaluăm un construct psihologic,
există numeroase metode ştiinţifice de a face acest lucru.
Totuşi, unele dintre acestea sunt mai mult sau mai puţin
utile având în vedere scopul nostru.
• Spre exemplu, anxietatea poate fi măsurată cu ajutorul
instrumentelor psihometrice de tip-self report, al testelor
proiective sau al interviului clinic.
• Pentru a afla în ce măsură aceste metode de evaluare
măsoară acelaşi lucru, Campbel şi Fiske (1959 citat în
Pedhahur şi Shmelkin, 1991) au introdus termentul de
validitate discmininantă şi convergentă, propunând
tehnica multitrait-multimethod.
• Această tehnică investighează în ce măsură mai multe
caracteristici psihologice (trăsături) şi mai multe metode
de evaluare a acestor trăsături măsoară acelaşi lucru.
Când se dovedeşte că trăsături considerate diferite şi
metode diferite de evaluare măsoară acelaşi lucru
afirmăm că există validitate convergentă.
• Când trăsăturile şi metodele supuse studiului măsoară
lucruri diferite este vorba de validitate discriminată. Spre
exemplu, presupunem că suntem interesaţi de evaluarea
depresiei şi a anxietăţii utilizând un instrument
psihometric de tip self-report şi un instrument proiectiv.
• Pentru a testa validitatea convergentă şi discriminantă se vor
calcula coeficienţii de corelaţie între fiecare trăsătură măsurată
cu fiecare metodă de evaluare.
• Aşadar, dacă scorul obţinut la testul psihometric de evaluare a
anxietăţii corelează puternic cu scorul obţinut la testul proiectiv
de evaluare a anxietăţii vorbim de existenţa unei validităţi
convergente pentru testul ce se află în proces de validare.
• De asemenea, dacă testul psihometric de evaluare a anxietăţii
corelează foarte puţin cu testul psihometric de evaluare a
depresiei şi cu testul proiectiv de evaluare a depresiei, testul
supus validării prezintă un nivel înalt de validitate discriminantă
deoarece s-a dovedit că măsoară lucruri diferite, discriminând
între anxietate şi depresie, concepte despre care se cunoaşte
că sunt relativ intercorelate, împărţind varianţă comună întrucât
există comorbiditate între acestea.
• Totuşi, în prezent, în practica psihologică şi în cercetare,
specialiştii în psihometrie folosesc foarte rar matricea de
evaluare a validităţii convergente şi discriminantede tipul
mulitrăsături-multimetode datorită cantităţii ridicate pe
care implementarea acestei tehnici o implică.
• În practică, validitatea discriminantă şi convergentă a unei
probe psihologice este realizată de cele mai multe ori
utilizând o singură metodă de evaluare (instrumente
psihometrice de tip self-report) şi unul sau mai multe
constructe psihologice. În literatura de specialitate este
cunoscut faptul că anxietatea se află într-o relaţie pozitivă
cu depresia şi nivelul stresului autoperceput şi într-o
relaţie negativă cu emoţiile pozitive.
• Astfel, presupunând că dorim să realizăm un chestionar
de evaluare al anxietăţii, în vederea testării validităţii
convergente se va aplica chestionarul nou creat supus
validării unui lot de subiecţi împreună cu câte un
chestionar care este deja validat pe populaţia respectivă
ce va măsura nivelul stresului autoperceput, al depresiei
şi al emoţiilor pozitive.
• Pentru ca testul nostru să fie valid, ne aşteptăm să existe
o relaţie negativă între anxietate şi emoţii pozitive şi o
relaţie pozitivă între anxietate, stresul autoperceput şi
depresie.
• Aşadar, dacă vor exista corelaţii puternic negative între
scala destinată să măsoare anxietatea şi scala de
evaluare a emoţiilor pozitive şi corelaţii puternic pozitive
între scala de evaluare a anxietăţii şi scala de evaluare a
stresului şi a depresiei, atunci scala de evaluare a
anxietăţii supusă validării va avea o validitate convergentă
ridicată deoarece măsoară ceea ce şi-a propus să
măsoare.
• Un aspect de reţinut este că, deşi atunci când se testează
existenţa unei relaţii negative între două concepte, în
cazul de faţă între anxietate şi emoţiile pozitive, o
corelaţie puternic negativă între cele două denotă tot o
validitate convergentă şi nu validitate discriminantă
(Ashton, 2013).
• Atunci când se doreşte testarea validităţii discriminată a
unei probe psihologice se testează relaţia dintre
constructe despre care se ştie din literatura de
specialitate că nu se află într-o anumită relaţie.
• Aşadar, pentru evaluarea validităţii discriminantă a scalei
de evaluare aanxietăţii, se va testa relaţia dintre anxietate
şi agreabilitate, aşteptându-ne să nu existe o corelaţie
pozitivă sau negativă între anxietate şi nivelul
agreabilităţii. Dacă rezultatele evaluării scot în evidenţă
acest aspect, concluzia este că testul de anxietate
prezintă o bună validitate disciminantă.
• Validitatea relativă la criteriu. Validitatea relativă la
criteriu se referă la relaţia dintre constructul măsurat de
un test psihologic şi o variabilă de tip rezultat ce are o
semnificaţie practică ridicată denumită variabilă criteriu.
• În practica psihologică unul dintre principalele scopuri ale
evaluării psihologice este acela de a prezice
comportamente.
• Astfel, când un test are validitate relativă la criteriu
(validitate predictivă), având la bază rezultatele obţinute
în urma evaluării psihologice, se pot face inferenţe cu
privire la anumite comportamente viitoare ale persoanei
evaluate despre care se cunoaşte că sunt prezise de
constructul respectiv.
• . Pentru a testa validitatea predictivă a unui test psihologic
se va avea în vedere relaţia dintre constructul măsurat de
testul psihologic şi variabila criteriu (variabila ce se
doreşte a fi prezisă). Aşadar, va fi calculat coeficientul de
corelaţie dintre scorul obţinut la testul psihologic şi
expresia numerică a variabilei criteriu.
• Spre exemplu, pentru a valida predictiv o scală de
evaluare a conştiinciozităţii trebuie calculată corelaţia
dintre scorul obţinut de persoanele evaluate cu scala
respectivă şi scorul sau expresia numerică a unei
variabile despre care se cunoaşte că este prezisă de
conştiinciozite, aşa cum este performanţa la locul de
muncă.
• Dacă există o corelaţie pozitivă între scorul obţinut la scala de
evaluare a conştiinciozităţii (variabila predictor)şi indicatorul de
performanţă profesională (variabila criteriu), atunci vom afirma
despre scala de măsurare a nivelului de conştiinciozitate că are
valoare predictivă.
• Totuşi, trebuie avut în vedere că în procesul de validare la
criteriu a unei probe de evaluare psihologică nu trebuie ca
cercetătorul să anticipeze obţinerea unor corelaţii puternice
între variabila măsurată de testul în cauză (variabila predictor)
şi variabila criteriu deoarece, după cum se observă şi din
exemplul anterior, variabilele criteriu, de cele mai multe ori,
sunt foarte diferite în natura lor de variabilele predictori, iar în
numeroase cazuri acestea nu sunt reprezentate de
caracteristici şi trăsături psihologice (Ashton, 2013).
• De aceea, se poate spune despre un test că are valoare
predictivă şi atunci când există o corelaţie de aproximativ
.20 între variabila criteriu şi predictor, deoarece înseamnă
că testul prezice într-o măsură semnificativă variabila
criteriu.
• În concluzie, în orice proces de evaluare psihologică,
indiferent dacă are un obiectiv specific zonei de cercetare
ştiinţifice sau specific practicii psihologice, trebuie folosite
teste care să prezinte calităţi psihometrice (fidelitate,
validitate) la niveluri optime, acceptate de comunitatea
ştiinţifică.
Referinţe bibliografice
• Domino, G., şi Domino, M.L. (2008). Psychological Testing. An introduction. New York:
Cambridge University Press.
• DeVellis, R.F. (2003). Scale Development Theory and Applications. London: Sage
Publications.
• Urbina, S. (2004). Essentials of Psychological Testing. New Jersey: Wiley & Sons.
• Narens, L. (1981). On the Scales of Measurement. Journal of Mathematical Psychology, 24,
249-275.
• Coolican, H. (2009). Research Methods and Statistics in Psychology. London: Routledge.
• Matsumoto, D., şi van De Vijver, F.S.R. (2010). Cross-cultural research methods in
psychology. New York: Cambridge University Press.
• Ashton, M.C., (2013). Individual Differences and Personality, second edition.London:
Elsevier.
• Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika,
16(3), 297–334.
• Cronbach, L. J., şi Meehl, P.E. (1955). Construct Validity in Psychological Tests.
Psychological Bulletin, 52, 281–302.
• Wilson, F.R., Pan, W., şi Schumsky, D.A. (2012). Recalculation of the critical values for
Lawshe’s content validity ratio. Measurement and Evaluation in Counseling and
Development, 45(3), 197-210.
• Polit, D. F., & Beck, C. T. (2006). The content validity index: Are you sure you know what's
being reported? critique and recommendations. Research in Nursing & Health, 29(5), 489–
497.
• Howitt, D., şi Cramer, D. (2011). Introduction to
Research Methods in Psychology. Edinburgh: Pearson
Education.
• Pedhazur, E., şi Pedhazur-Schmelkin, L., (1991).
Measurement, Design, and Analysis:An integrated
approach. New Jersey: Lawrence Erlbaum Associates.

S-ar putea să vă placă și