Sunteți pe pagina 1din 17

CURSUL 4

ABORDAREA MĂSURĂRII ÎN EVALUAREA PSIHOLOGICĂ

Cuprins:

1. Măsurarea în psihologie şi tipuri de scale de măsurare


2. Calităţile psihometrice ale testelor psihologice
3. Concepte cheie implicate în metrologie

1. Măsurarea în psihologie şi tipuri de scale de măsurare

Debutul teoretizării măsurării în psihologie s-a produs odată cu apariţia articolului


“On the theory of scale of measurement” (Stevens, 1946, apud Popa, 2008, p.26). În opinia
autorului, a măsura înseamnă “a atribui valori numerice obiectelor şi fenomenelor, în
conformitate cu anumite reguli”.
Judd şi McClelland (1998, apud Popa, 2008, p.26) observă că această definiţie are cel
puţin 2 limite majore:
➢ nu toate măsurările au un caracter numeric (de exemplu, caracteristica de gen
poate fi simbolizată prin caracterele “M” şi “F”);
➢ o regulă de atribuire a numerelor are caracter de măsurare numai dacă instituie
o anumită semnificaţie cu privire la caracteristica măsurată (de exemplu, 0,25 secunde poate
fi timpul de reacţie la un stimul, dar o valoare calculată ca raport între acest timp de reacţie şi
numărul de la pantofi al persoanei respective, nu înseamnă nimic, neavând valoare de
măsurare).
Măsurarea înseamnă “cuantificarea” aspectului psihologic. Variabila psihologică
poate fi comportamentul clientului, sentimentele, atitudinile sau rezultatul unui tratament,
concepte teoretice ca stima de sine sau imaginea de sine. Numărul atribuit reprezintă o
caracteristică a variabilei respective (Minulescu, 2003, p.67).
Spre deosebire de caracteristicile de natură fizică, constructele psihice nu pot fi
măsurate direct, ci numai prin manifestările lor particulare (Popa, 2008, p.26).
Măsurarea cantitativă în psihologie include trei tipuri de statistici, şi anume
(Minulescu, 2003, p.67):
1. statistici descriptive,
2. statistici inferenţiale,
3. statistici multivariate.
Statisticile descriptive utilizează grafice, modul de prezentare, de manipulare simplă
a datelor (media, mediana, frecvenţa).
Statisticile inferenţiale permit tragerea unor concluzii referitoare la unul sau mai
mulţi indivizi, bazându-se pe datele de eşantion, de lot, de grup de indivizi. Acest tip de
statistici se referă la corelaţii, varianta comportamentală, capacitatea de a judeca diferenţele
dintre indivizi sau grupurile de indivizi.
Statisticile multivariate sunt utilizate atunci când punem în comparaţie două sau mai
multe caracteristici măsurate pe un grup de indivizi, relaţiile dintre interese, valori şi gradul
de diferenţiere dintre diferite curbe variaţionale, corelaţii multiple, calcularea regresiilor,
calcularea de tip factorial.
Cei mai mulţi experţi în măsurători, se exprimă în termenii a 4 scale de măsurare,
bazate pe operaţii matematice care pot fi efectuate cu datele la fiecare nivel (Stevens, 1946,
1951, 1961, apud McIntire şi Miller, 2010, p.153).

1
Aceste 4 nivele de măsurătoare sunt:
1. nominal,
2. ordinal,
3. de interval,
4. de raport.

A. Scalele nominale

Nivelul de bază al măsurării este scala nominală. Într-o scală nominală sunt atribuite
nişte numere grupurilor sau categoriilor de informaţii. Numerele din această scală servesc ca
etichete de identificare a datelor, pentru că nu au rolul de a fi folosite în calcule.
Scalele nominale sunt utilizate, în general, pentru date demografice, gruparea
populaţiei după gen, rasă sau domiciliu. De exemplu, putem atribui un 0 pentru femei şi un
1 pentru bărbaţi sau, 0 pentru caucazieni, 1 pentru hispanici, 2 pentru afro-americani, etc.
Aceste numere nu reprezintă valori cantitative (cu alte cuvinte, bărbaţii nu valorează mai
mult decât femeile), ci se atribuie doar un număr pentru fiecare categorie (McIntire şi Miller,
2010, p.153).
Scalele nominale produc numai date categoriale, adică date grupate după o
proprietate comună, de aceea sunt puţine modalităţi de descriere sau de manipulare a datelor
pe care le produc. De obicei, cercetătorii raportează datele nominale în termenii numărului
ocurenţelor din fiecare categorie. De exemplu, un psiholog poate raporta câţi indivizi a
desemnat cu 1 (mediu) şi cu 2 (supradotat) sau câţi indivizi a diagnostica ca maniaco-
depresivi (1) sau bipolari (2).

B. Scalele ordinale

Scalele ordinale sunt al doilea nivel de măsurare. Scalele ordinale au toate calităţile
scorurilor nominale, dar, în plus, numerele sunt atribuite pentru a ordona sau a clasifica
indivizii sau obiectele în constructul măsurat.
Scalele ordinale se folosesc în multe scopuri practice. De exeplu, liceele şi facultăţile
îşi ordonează ierarhic elevii şi studenţii, după media generală, raportată la numărul de ore
urmate, rezultând o măsură pentru statutul clasei.
Sunt 2 lucruri importante de subliniat în privinţa scalelor ordinale (McIntire şi Miller,
2010, p.154):
1. numărul sau rangul are înţeles numai în cadrul grupului, în comparaţie cu
celelalte componente, şi nu oferă nici o informaţie despre grup ca întreg;
2. o scală ordinală nu dă nici o informaţie despre cât de strânse sunt relaţiile
dintre 2 indivizi sau 2 obiecte.

C. Scalele de intervale egale

Scalele de intervale egale sunt al treilea nivel de măsurare (McIntire şi Miller, 2010,
p.155). Scalele de intervale egale au toate calităţile scalelor de dinainte şi, în plus, scorurile
lor brute sunt calculate plecând de la premisa că fiecare număr reprezintă un punct aflat
la egală distanţă de punctele adiacente lui. De exemplu, la o valoare de 5 puncte pe scală,
unde 1 = dezacord total, 2 = dezacord, 3 = aproape de acord, 4 = de acord, 5 = perfect de
acord, psihologul presupune adeseori că fiecare punct de pe scala proporţiilor reprezintă o
distanţă egală sau o valoare egală a constructului măsurat. Prin urmare, presupunem că
oricine ar răspunde la întrebările testului înţelege la fel ce înseamnă “aproape de acord” şi “de
acord”, ca şi distanţa dintre cele 2.

2
Avantajul acestei scale este că, pentru scorurile astfel aranjate, pot fi calculate
deviaţiile medii şi standard. Statisticile ne permit să comparăm performanţa unui grup cu
performanţa altui grup sau scorul unui individ cu scorul altui individ, la acelaşi test.
Un inconvenient al scalei este acela că nu are un punct care să indice o absenţă totală
a însuşirii de măsurat. De exemplu, scalele de temperatură (Farenheit, Celsius) au un punct de
valoare zero, dar acel punct nu reprezintă totala absenţă a căldurii. Cu alte cuvinte, punctul
zero pe o scală de intervale egale este arbitrar şi nu reprezintă punctul de la care însuşirea de
măsurat nu există.
În psihologie, este dificil, de exemplu, să stabilim punctul de la care un individ este
total lipsit de anxietate, inteligenţă sau aptitudine mecanică.

D. Scalele de raport

Scalele de raport sunt al patrulea nivel de măsurare. Ele au toate calităţile scalelor
precedente, dar au în plus un punct ce reprezintă absenţa totală a proprietăţii măsurate, iar
punctul acesta este numit 0 (zero).
Cele mai multe scale de măsurare pe care le folosim în viaţa de zi cu zi, pentru
măsurătorile fizice, sunt scale de raport. De exemplu, urcându-ne pe cântar, obţinem o
greutate de 65 kg, iar colegul de cameră 73 kg. Dacă fiecare se îngraşă cu câte o jumătate de
kilogram, câştigăm aceeaşi greutate. Când nu este nimic pe cântar, acesta arată zero, adică
absenţa oricărei greutăţi.
Pentru că există un adevărat punct zero, scalele de raport permit comparaţii de
raport (proporţie). De exemplu, putem spune că o persoană care cântăreşte 80 kg este de
două ori mai grea decât o persoană care cântăreşte 40 de kg.
Deşi cele mai multe măsurători ale constructelor psihologice nu îndeplinesc cerinţele
unei scale de raport, cele care folosesc măsurile obişnuite de timp sau distanţă se califică
drept măsuri de raport.

Este important să înţelegem nivelul de măsurare deoarece acesta ne oferă informaţii


despre ceea ce putem şi ceea ce nu putem spune despre scorurile la test (McIntire şi Miller,
2010, p.156).

2. Calităţile psihometrice ale testelor psihologice

“Nu orice test este un test” (Pitariu, H., 1982, apud Martin, N., 2007). Un test
presupune anumite caracteristici, respectiv îndeplinirea unor cerinţe acceptate de comunitatea
ştiinţifică.
Calităţile psihometrice ale testelor sunt acele însuşiri care asigură un înalt grad de
credibilitate rezultatelor obţinute în urma utilizării lor în activitatea psihodiagnostică.
(Mitrofan, 2009, p. 82). Foarte important este faptul că aceste calităţi sunt măsurabile şi
evaluabile. Ele se pot exprima în valori numerice (0,50; 0,65; 0,80, etc.).
Testele psihologice constituie instrumente ale căror principale calităţi metrologice
sunt:
 Fidelitatea
 Validitatea
 Sensibilitatea
 Standardizarea
Vom analiza în continuare fiecare dintre aceste calităţi psihometrice.

3
2.1. FIDELITATEA

1. Definiţii

Conceptul de fidelitate a cunoscut diverse accepţiuni pe parcursul timpului. Standards


for Educational and Psychological Tests definesc fidelitatea astfel:
 1954 şi 1966 – “precizia, consistenţa şi stabilitatea măsurării realizate de test”.
 1974 – “gradul în care rezultatele testării pot fi atribuite surselor sistematice de
variaţie”.
 1985 – “gradul în care scorurile testelor sunt consistente sau repetabile, adică gradul în
care ele nu sunt afectate de erorile de măsură”.
Orice test psihologic este fidel dacă întruneşte următoarele cerinţe:
 Este lipsit de erori de măsură, deci este precis;
 Orice persoană obţine scoruri egale la test şi la o formă paralelă a acestuia în situaţia
când erorile de măsură la cele două teste perntru orice persoană sunt independente.
Termenul “fidelitate” sugerează încredere. În măsura în care, în întregime sau parţial,
trebuie luate decizii pe baza scorurilor unui test, examinatorii trebuie să fie siguri că pot avea
o încredere destul de mare în scorurile obţinute. Fidelitatea este o calitate a scorurilor obţinute
la un test, care sugerează că acestea sunt suficient de consistente şi de lipsite de erori de
măsură pentru a fi utile. (Urbina, 2004, p.184).
Eroarea de măsură poate fi definită ca orice fluctuaţie a scorurilor rezultată din factori
legaţi de procesul de măsurare care sunt irelevanţi pentru ceea ce este măsurat.
Testele încearcă să măsoare o trăsătură sau o caracteristică psihologică utilizând o
unitate de măsură care este influenţată de surse de eroare. Scopul măsurării este de a găsi
scorul real al persoanei şi de a reduce eroarea de măsurare. Eroarea standard de estimare
indică cât de mult, în medie, variază scorul unei persoane de la scorul real al acesteia.
Erorile de măsură sunt aleatoare, nu sistematice, deci sunt complet nepredictibile,
indiferent de cunoştinţele pe care le avem despre persoanele măsurate sau despre procesul de
măsurare.
De asemenea, fidelitatea ne arată dacă diferenţele individuale obţinute cu ajutorul
testelor sunt rezultatul diferenţelor reale sau dacă sunt efectul unor factori exteriori trăsăturii
măsurate, adică al unor factori variabili.

2. Rolul coeficientului de fidelitate şi Eroarea standard de măsură

Coeficienţii de fidelitate se utilizează la compararea testelor.


Ca alternativă a fidelităţii, SEM, eroarea standard de măsură serveşte la interpretarea
scorurilor testului, mai precis, la determinarea intervalelor de încredere pentru scorurile reale
ale subiecţilor.
În raportul psihologic întocmit pentru o persoană, alături de scorul obţinut de aceasta
la test, se va indica şi intervalul de încredere al scorului real.
Sursele de variaţie a erorii în funcţie de tipul de fidelitate sunt:
1. test - retest: eşantionarea timpului
1. forme alternative (aplicare imediată): eşantionarea conţinutului
2. forme alternative (la interval mai mare de timp): eşantionare timp şi conţinut
3. împărţirea în două jumătăţi: eşantionarea conţinutului
4. Kuder-Richardson: eşantionarea conţinutului şi eterogenitatea acestuia
5. Inter evaluatori: diferenţe de caracterisitici ale personalităţii evaluatorilor

4
3. Metode de evaluare a fidelităţii

Fidelitatea exprimă acurateţea şi stabilitatea în timp a rezultatelor sub următoarele


aspecte:
 Constanţa rezultatelor obţinute (aceiaşi subiecţi au fost examinaţi de persoane
diferite, iar rezultatele obţinute au fost similare, chiar identice).
 Stabilitatea rezultatelor în timp (obţinerea aceloraşi rezultate la test de către aceleaşi
persoane, la intervale diferite de testare).
 Caracterul adecvat al tuturor probelor care constituie testul în ansamblu (Este
necesar ca testul să nu cuprindă itemi nesemnificativi pentru ca răspunsurile la itemii
nesemnificativi în amestec cu răspunsurile la itemii semnificativi le fac pe cele din urmă să-şi
piardă relevanţa).
 Omogenitatea probelor (exprimă coerenţa internă a testului în funcţie de utilizarea
unui procedeu de divizare. Testul se aplică în întregime, după care se stabilesc rezultatele
pentru fiecare jumătate din totalul itemilor care îl compun. Un test este omogen şi implicit
coerent dacă rezultatele obţinute de acelaşi subiect la cele 2 jumătăţi ale testului este ridicată).
Tipuri de metode de evaluare a fidelităţii:
 metoda test - retest,
 metoda analizei consistenţei interne;
 metoda formelor paralele;
 coeficienţi de fidelitate inter-evaluatori.

A. Coeficienţii de stabilitate - se calculează prin metoda test-retest, corelând


scorurile obţinute la test şi la retest (acelaşi test aplicat după un interval de timp). Arată cât de
stabile sunt scorurile în timp.
B. Coeficienţii de echivalenţă - rezultă din metoda formelor paralele, prin corelarea
scorurilor obţinute la două teste paralele, administrate aproape în acelaşi timp. Arată cât de
asemănătoare sunt cele două instrumente de măsură.
C. Coeficienţii consistenţei interne - se calculează în cadrul analizei consistenţei
interne, pe baza scorurilor obţinute la un test administrat o singură dată. Din această categorie
fac parte coeficientul a al lui Cronbach, coeficientul 3 al lui Guttman şi coeficienţii Kuder-
Richardson. Ei indică concordanţa diferitelor părţi ale testului.
D. Coeficienţii de fidelitate inter evaluatori - se calculează pentru teste al căror scor
este rezultatul aprecierii subiective făcute de evaluator. Ei arată în ce măsură părerile mai
multor evaluatori concordă între ele.

Metoda test-retest

Metoda test-retest evaluează gradul în care scorurile obţinute la un test de acelaşi


subiect sunt constante de la o administrare la alta.
Se procedează astfel:
(1) Se administrează testul unui grup de persoane.
(2) După un interval de timp se administrează testul, aceloraşi persoane, în aceleaşi condiţii
ca şi prima dată.
(3) Se calculează coeficientul de corelaţie liniară între scorurile observate în cele două
situaţii.
Valoarea obţinută se foloseşte pentru estimarea fidelităţii testului, considerându-se că
testul este paralel cu el însuşi, ceea ce înseamnă că între cele două administrări ale sale,
scorurile reale ale persoanelor nu s-au schimbat.

5
Metoda test-retest este utilă atunci când scorurile reale ale testului măsoară
caracteristici durabile, generale şi specifice, ale persoanelor.
Factorii temporari (starea de oboseală sau boală a celui examinat, emoţiile,
temperatura şi lumina din sala de testare etc.) pot ajuta unei persoane într-o ocazie şi îi pot
scădea scorul observat la un alt experiment. Ei nu modifică scorul real al persoanei, ci
influenţează erorile de măsură.
Condiţii: intervalul de timp dintre test şi retest trebuie stabilit astfel încât subiecţii să
nu îşi poată aminti cum au răspuns la test sau să nu intervină o serie de fenomene care
influenţează scorul: maturizarea, descoperirea răspunsurilor corecte la itemi în diferite cărţi,
dobândirea de noi cunoştinţe, etc.
Pentru o mai bună interpretare a modificărilor intervenite în persoane, între test şi
retest, este util să se calculeze media diferenţelor de scor dintre cele două administrări ale
testului şi să se verifice dacă aceasta diferă semnificativ de zero.
Testul este stabil dacă de la o administrare la alta nu se produc modificări ale
clasificării subiecţilor.
Dezavantajul metodei test-retest constă în faptul că pretinde două administrări ale
testului, ceea ce necesită timp şi cheltuieli materiale.

Metoda analizei consistenţei interne

Metoda analizei consistenţei interne practică o singură administrare a testului. Pe baza


scorurilor le itemilor se calculează de obicei unul dintre următorii coeficienţi:
 coeficientul Alpfa al lui Cronbach;
 coeficientul Lambda al lui Guttman;
 coeficientul r20 sau r21 al lui Kuder-Richardson (dacă itemii testului sunt binari).
Coeficienţi de consistenţă internă indică măsura în care itemii testului se referă la
acelaşi lucru.
În general, coeficienţii de consistenţă internă coincid cu coeficientul de fidelitate al
testului atunci când itemii componenţi sunt paraleli, adică măsoară acelaşi lucru şi îl măsoară
la fel de bine.
Fidelitatea testului depinde crescător de numărul itemilor componenţi.
Adăugarea de itemi paraleli va avea drept consecinţă o mărire a consistenţei interne a
testului.

Metoda formelor paralele

Metoda formelor paralele constă în administrarea a două teste, care reprezintă


instrumente de măsură paralele, la momente foarte apropiate unul de altul şi determinarea
coeficientului de corelaţie liniară între scorurile observate ale celor două forme.
Valoarea calculată se numeşte coeficient de echivalenţă.
Metoda formelor paralele este potrivită în cazul când se urmăreşte măsurarea
unor caracteristici generale ale persoanelor. Asemenea caracteristici vor influenţa în
acelaşi mod scorurile ambelor teste.
Metoda formelor paralele prezintă unele avantaje faţă de metoda test-retest: cele două
forme fiind diferite, rezultatele la cel de-al doilea test nu mai sunt influenţate nici de
memorarea răspunsurilor date la primul test şi nici de aflarea răspunsurilor la întrebările la
care nu s-a ştiut răspunde (în cazul testelor de aptitudini sau de cunoştinţe).

6
Dar, metoda formelor paralele are inconveniente. Dintre acestea amintim
următoarele:
 sunt necesare două administrări separate, ceea ce consumă timp;
 intervine oboseala sau plictiseala persoanelor examinate, ceea ce influenţează
scorurile la cel de-al doilea test;
 elaborarea mai multor forme paralele de test poate fi dificilă şi costisitoare.
Metoda formelor paralele se foloseşte şi atunci când se doreşte obţinerea unei
colecţii de teste paralele, de bună calitate. Este, de exemplu, situaţia întâlnită în
psihoterapie, când este necesară administrarea periodică, la intervale de timp relativ scurte, a
unor teste de anxietate sau de depresie. Pentru ca subiecţii să nu fie tentaţi să repete
răspunsurile date la administrările anterioare ale testului se preferă utilizarea alternativă a
unor forme de test paralele.
Un caz particular al metodei formelor paralele îl constituie metoda înjumătăţirii
(split-half). În literatura de specialitate, aceasta este inclusă uneori în cadrul analizei
consistenţei interne.
Metoda înjumătăţirii are următorii paşi:
 Se administrează testul unui lot de persoane.
 Se împarte testul în două părţi cât mai asemănătoare între ele.
 Se calculează coeficientul de corelaţie între scorurile observate la cele două jumătăţi.
Dacă jumătăţile testului sunt instrumente de măsură paralele, atunci valoarea calculată
reprezintă coeficientul de fidelitate al fiecăreia dintre părţi. Cu ajutorul lui, aplicând formula
lui Spearman-Brown, se poate determina coeficientul de fidelitate al întregului test.
Avantaje: Metoda înjumătăţirii rezolvă multe din problemele teoretice şi practice
inerente metodei test-retest şi metodei formelor paralele. Mai întâi, nu este necesar să se
administreze două teste diferite şi nici să se administreze de două ori acelaşi test. În felul
acesta nu există pericolul modificării scorurilor reale între administrări şi nici cel al
memorării şi repetării răspunsurilor date la primul test.
Dificultatea constă în construirea jumătăţilor care să fie măsurători paralele. Se
recomandă (Cronbach, 1943; Pitariu, 1978, cf. M.Albu 1998) să se elaboreze perechi de itemi
care să fie similari ca: formă (mod de prezentare a textului, a ilustraţiilor); conţinut; tip de
întrebare (cu răspuns liber, cu răspuns la alegere etc.); medie şi abatere standard a scorurilor.
Itemii trebuie să fie independenţi, adică unul să nu sugereze răspunsul la celălalt.
Astfel că, din fiecare pereche, un item va intra într-o jumătate de test, iar al doilea, în cealaltă
jumătate. Există multe posibilităţi de ordonare a itemilor în cadrul testului. Nu se recomandă
plasarea celor două părţi una după cealaltă, întrucât intervine oboseala persoanelor
examinate, care va influenţa scorurile la cea de-a doua jumătate, iar dacă testul este
administrat cu limită de timp, este foarte probabil ca mulţi itemi din cea de-a doua
parte să nu fie rezolvaţi datorită timpului de lucru insuficient şi nu din cauza
necunoaşterii răspunsului corect.
Pentru a evita asemenea situaţii, se poate adopta metoda par-impar: itemii unei
jumătăţi vor ocupa locurile cu număr de ordine par, iar ceilalţi, locurile cu număr de ordine
impar. Se obişnuieşte să se plaseze itemii în ordinea crescătoare a dificultăţii lor (Lord,
Novick, 1968 cf. M.Albu, 1998).
În cazul când testul se administrează cu limită de timp, fiecare persoană care nu
reuşeşte să răspundă la ultimii itemi va avea scorul zero la aceştia şi, deci, scorurile la itemii
pari şi la cei impari vor apărea mai puternic corelate decât sunt în realitate. Din acest motiv,
metoda înjumătăţirii nu se va aplica atunci când administrarea testului se face cu limită
de timp.

7
Coeficienţi de fidelitate inter-evaluatori

În cazul testelor care nu au o cotare obiectivă, cum sunt testele proiective sau cele de
creativitate, scorurile subiecţilor sunt influenţate şi de persoana care face evaluarea
răspunsurilor. Chiar dacă evaluatorii îndeplinesc cerinţele formulate în manualul testului,
referitoare la cunoştinţele şi experienţa necesare, este puţin probabil ca ei să atribuie scoruri
identice fiecărui subiect.
Pentru a verifica în ce măsură scorurile testului sunt dependente de cel care a făcut
cotarea, se calculează coeficientul de corelaţie liniară între scorurile atribuite aceloraşi
subiecţi de evaluatori diferiţi. Un asemenea coeficient se numeşte coeficient de fidelitate
inter-evaluatori.
4. Factori care intervin în estimarea coeficienţilor de fidelitate

Pentru creşterea preciziei coeficientului de fidelitate, este necesar să fie îndeplinite


următoarele condiţii (Traub, 1994, apud Minulescu, 2006, p.95):
A. Eşantionul să fie cât mai voluminos (Pentru a micşora de două ori eroarea
standard este necesar să se mărească de patru ori volumul eşantionului).
A. Eşantionul de subiecţi să fie reprezentativ pentru populaţia căreia îi este destinat
testul.
B. Măsurătorile efectuate cu ajutorul testului să fie independente între ele
(Măsurătoarea realizată asupra unui subiect să nu fie influenţată şi nici să nu influenţeze
măsurătorile efectuate asupra altor persoane).
C. Procedura de administrare a testului şi a retestului sau a celor două forme paralele ale
testului să fie identică şi, în acelaşi timp, să fie aceeaşi cu cea care se va utiliza în practică.
În general, se întâlnesc de obicei coeficienţi de fidelitate cuprinşi între 0.70 şi 0.98
(Guilford, 1965, apud Minulescu, 2006, p. 96).

2.2. VALIDITATEA

1. Definiţii

Validitatea este considerată o condiţie unică şi suficientă în predicţia performanţei


viitoare.
În concepţia lui Serge Legendre (apud Bernier şi Pietrulewicz, 1997, cf. Răşcanu,
2006), validitatea este ,,capacitatea unui instrument de a măsura realmente ceea ce trebuie să
măsoare, după utilizarea pe care vrea să o facă“.
Pe aceeaşi linie, a teoriei clasice a testului psihologic, Gustave Lienert (1967, apud
Răşcanu, 2006) considera că validitatea unui test dă gradul de precizie cu care acest test
măsoară faptic acea caracteristică a personalităţii sau acel mod de comportament pe care
trebuie să-l măsoare ori pretinde să-l măsoară.
Una din definiţiile operaţionale - în sensul înţelegerii facile a conceptului - consideră
că validitatea unui test indică gradul în care testul măsoară ceea ce îşi propune să măsoare. Un
test valid este un test care măsoară în mod adecvat trăsătura psihică propusă, care are o
valoare predictivă bună, fiind capabil să anticipeze cât mai corect manifestările, trăirile,
trăsăturile din viitoarea situaţie reală (Martin, 2007).
Validitatea se exprimă în indici de corelaţie între rzultatele la test şi valorile criteriului,
indici obţinuţi prin prelucrarea scorurilor la test şi la criteriu pe un anumit eşantion.

8
Validitatea testului trebuie să fie stabilită în legătură cu o anumită utilizare care este
conferită testului (Anastasi, 1976, apud Martin, 2007, p.124)

2. Faţetele validităţii

Două observaţii importante făcute de Standardele APA din 1985 relativ la “tipurile” de
validitate:
 prin “tipuri” de validitate nu se înţeleg “categorii disjuncte”;
 nu se poate afirma că un tip de validitate este mai potrivit decât altul pentru o anumită
utilizare a testelor sau pentru o categorie specifică de inferenţe bazate pe scoruri.

A. Validitatea de construcţie (sau conceptuală)

Prin intermediul testelor psihologice se măsoară atribute abstracte ca inteligenţa,


motivaţia agresivitatea, depresia etc., denumite constructe. Asemenea variabile sunt construite
pornind de la fapte observabile, printr-un şir de raţionamente bazate pe ipoteze şi deducţii.
Din acest motiv, va1iditatea relativă la construct este adesea denumită şi “validitate
ipotetico-deductivă” (Bacher, 1981, apud Minulescu, 2006, p.103). Toate constructele sunt
însă conectate de realitate, reprezintă aspecte sau evenimente ale realităţii observabile.
Validitatea de construcţie exprimă gradul în care un test concordă cu teoria subiacentă
sau, mai exact spus, faptul dacă testul măsoară constructul teoretic corelat (Martin, 2007,
p.127).
Anastasi (1976, apud Martin, 2007, p.127) propune următoarele metode de control ale
validităţii de construcţie:
 corelarea moderată cu un alt test;
 identificarea validităţii factoriale, respectiv stabilirea saturaţiei testului în factorii
identificaţi;
 controlul consistenţei interne prin tehnica înjumătăţirii sau prin eliminara itemilor care
nu departajează suficient subiecţii din lotul celor buni de aceia din lotul celor slabi;
 controlul validităţii divergente, respectiv verificarea existenţei unei corelaţii,
obligatoriu nesemnificative, cu alte teste cu care testul în cauză nu trebuie să coreleze.
Pentru a putea verifica dacă un test măsoară bine un anumit construct, este necesar să
se realizeze o descriere a constructului în termeni comportamentali concreţi. Operaţia se
numeşte “explicarea constructului” şi constă din trei paşi (Murphy şi Davidshofer, 199l, apud
Minulescu, 2006, p.104):
1. Se identifică acele comportamente care au legătură cu constructul măsurat de test.
1. Se identifică alte constructe şi pentru fiecare se decide dacă are sau nu legătură cu
constructul măsurat de test.
2. Se alcătuieşte câte o listă de comportamente prin care se manifestă aceste constructe.
Pentru fiecare din ele, pe baza relaţiilor dintre constructe, se decide dacă are sau nu legătură
cu constructul măsurat de test.
Operaţia de validare a testului relativă la constructul măsurat poate fi descompusă în
trei componente:
 validarea materialului testului (substantive validity), care necesită specificarea
constructului măsurat de test şi se confundă uneori cu validarea conţinutului testului;
 validarea structurii constructului aflat la baza testului (structural validity), care
identifică elementele componente ale constructului şi investighează legăturile dintre ele;
 validarea externă (extenal validity), care urmăreşte să determine relaţiile
constructului cu alte măsurători (constructe sau variabile observate).

9
Validarea externă se referă la calitatea testului de a avea relaţii corecte cu alte măsuri
psihologice; ea este denumită uneori "validitate convergentă şi discriminantă" (Murphy şi
Davidshofer, 1991, apud Minulescu, 2006, p.105):
a. Un test are validitate convergentă dacă măsoară ceea ce evaluează si alte teste sau
variabile care se referă la acelaşi construct.
b. Un test are validitate discriminantă dacă evaluează altceva decât diverse teste sau
variabile despre care se ştie că se referă la constructe ce nu au legătură cu constructul măsurat
de test.
Verificarea validităţii convergente şi discriminante se realizează conform următorului
algoritm:
 Se identifică acele comportamente care sunt legate de constructul măsurat de test.
 Se determină constructele care au legături cu constructul măsurat de test şi se pun în
evidentă acele comportamentele legate de ele care pot fi conectate cu constructul măsurat de
test.
 Pentru toate comportamentele reţinute se apreciază ce fel de corelaţii ar putea exista
între măsurile lor şi o măsură bună a constructului care ne interesează (corelaţii pozitive,
negative, mari, mici sau nule).
 Se determină coeficienţii de corelaţie între scorurile la testul studiat si rezultatele unor
măsurători (eventual scoruri de teste) efectuate asupra comportamentelor reţinute.
 Se compară coeficienţii de corelaţie obţinuţi cu valorile aşteptate.

B. Validitatea de conţinut

Acest tip de validitate este analizat la testele care se utilizează pentru a estima “cum
acţionează o persoană în universul de situaţii pe care testul intenţionează să îl reprezinte”
(APA Standards, 1974, apud Minulescu, 2006, p. 108).
Validitatea de conţinut indică gradul în care itemii testului sunt în adevăr un eşantion
de comportament, respectiv măsura în care testul acoperă ansamblul de sarcini, condiţii sau
procese mintale care privesc domeniul condensat de acesta (Radu, 1993, apud Martin, 2007,
p.127).
Validitatea de conţinut se realizează prin analiza de itemi.

C. Validitatea de criteriu

Validitatea de criteriu se referă la gradul în care deducţiile făcute pornind de la


scorurile testului concordă cu cele bazate pe scorurile unei alte măsurări, numită criteriu.
Aprecierea validităţii de criteriu se bazează, de obicei, pe valorile unui “coeficient de
validitate a testului”, obţinut în urma calculului coeficientului de corelaţie (liniară sau de alt
fel) între scorurilor testului si rezultatele criteriului.
Putem observa că:
1. În cazul testelor utilizate pentru măsurare, validitatea de criteriu este o componentă a
validităţii de construct. Ea apreciază “gradul în care rezultatele furnizate de test corelează cu
rezultatele altui instrument de evaluare despre care se presupune că măsoară acelaşi construct
sau unul similar” (S. N. Haynes, apud Silva, 1993, cf. Minulescu, 2006, p.110).
1. Validitatea factorială, adică acea capacitate a testului de a corela înalt şi semnificativ
cu factorul măsurat, echivalentă a saturaţiei testului într-un anumit factor, este utilizată pentru
cercetarea validităţii de construct, fiind de fapt, o validitate a criteriului. (Martin, 2007,
p.128). Criteriul este reprezentat, în acest caz, de factorul care corespunde constructului
măsurat de test. Saturaţia unui item într-un factor este valoarea coeficientului de corelaţie
liniară între scorurile itemului şi scorurile factorului.

10
2. În cazul testelor utilizate pentru a se lua decizii, validitatea de criteriu urmăreşte dacă
deciziile bazate pe scorurile testului coincid cu cele care au la bază valorile unei variabile
criteriu, despre care se presupune că permite să se ia decizii corecte. De exemplu, decizia
poate consta în acceptarea sau respingerea candidaţilor care concurează pentru un post. Se
dovedeşte că testul este valid relativ la acest criteriu dacă se constată că indivizii acceptaţi (pe
baza unor considerente care nu includ rezultatele testului) sunt tocmai cei care au scoruri mari
la test, iar cei respinşi sunt cei cu scoruri mici.
3. Variabila criteriu poate fi unidimensională sau multidimensională, cu valori cantitative
sau /şi calitative. De exemplu, în selecţia profesională o variabilă criteriu poate fi constituită
din performanţele în activitatea anterioară (apreciate printr-un calificativ), rezultatele unor
probe de lucru (cu valori cantitative) si unele date biografice (apreciate dihotomic, după cum
îndeplinesc sau nu anumite condiţii fixate anterior; de exemplu sexul, starea civilă etc.).

Procedee utilizate

Există două strategii utilizate în mod obişnuit pentru aprecierea validităţii de criteriu a
testelor:
a. aprecierea validităţii predictive;
b. aprecierea validităţii concurente.
Validitatea predictivă este interesată de gradul de eficientă al testului în prognoza
comportamentului unei persoane într-o situaţie dată. Ea se realizează prin compararea
scorurilor testului cu rezultatele obţinute la criteriu după un interval de timp mai lung sau mai
scurt.
Pentru estimarea validităţii concurente este necesară obţinerea scorurilor la criteriu
aproximativ în acelaşi timp cu cele ale testului.
Deosebirea esenţială dintre cele două tipuri de validităţi de criteriu nu constă în
lungimea intervalului de timp dintre administrarea testului şi înregistrarea rezultatelor
criteriului, ci în faptul că validarea concurentă utilizează un eşantion de populaţie
selecţionat (personal angajat deja sau studenţi admişi în facultăţi). Apare aici problema
denumită restrângerea mulţimii şi care face ca validarea concurentă să nu poată fumiza
totdeauna informaţii corecte asupra capacităţii predictive a testului.
Utilizarea unui test, pe o altă populaţie decât cea pe care s-a realizat validarea,
produce o restrângere a validităţii, pe care o contracarăm prin contra-validare (cross-
validation).
Astăzi însă, nu mai este agreată ideea unei predicţii pe termen lung (Radu, 1993, apud
Martin, 2007, p.125), datorită caracterului dinamic, în continuă schimbare, al diferitelor
activităţi umane în beneficiul cărora se realizează testarea psihologică.
Problema restrângerii mulţimii i-a făcut pe unii specialişti în teoria testelor să
recomande utilizarea validării predictive pentru testele care servesc la prognoză şi a
validării concurente pentru testele aplicate în scop de diagnoză.
Limitele validităţii de criteriu (Martin, 2007, p.126):
 Criteriul are o variabilitate mare;
 Eşantioanele pe care se întreprin studii de validitate sunt prea mici;
 Există diferenţe între aceleaşi posturi sau meserii din organizaţii diferite;
 Structura meseriilor suportă schimbări multiple.

D. Validitatea sintetică

Este definită ca fiind rezultatul analizei sistematice a elementelor activităţii, al

11
determinării validităţilor testelor pentru aceste elemente şi al combinării acestor validităţi într-
un întreg (Anastasi, 1976, apud Martin, 2007, p.126).
Validitatea sintetică şi-a găsit aplicarea în situaţiile în care companiile dispun de puţini
salariaţi ocupaţi în aceeaşi meserie, iar validitatea unor teste nu poate fi generalizată datorită
specificităţii elementelor meseriei în cauză.
2.3. SENSIBILITATEA

Sensibilitatea semnifică fineţea discriminativă, adică numărul de clase realizate de


note într-un grup de subiecţi. Ea ţine de capacitatea testului de a diferenţia cât mai mult, pe o
plajă cât mai largă, indivizii testaţi, între ei. Un test este cu atât mai sensibil cu cât împarte în
mai multe categorii indivizii, aceasta desigur în concordanţă şi cu diferenţele reale care există
între ei.
Sensibilitatea diferă la un test de dezvoltare faţă de un test de aptitudini. În cazul
testelor de dezvoltare, diferenţele între mediile a două vârste consecutive sunt mai mari decât
în interiorul grupelor respective. Invers, în cazul testelor de aptitudini, diferenţele dintre
indivizii de aceeaşi vârstă, depăşesc pe cele dintre două vârste succesive.

2.4. STANDARDIZAREA

Standardizarea este calitatea statistică ce exprimă uniformitatea lucrului cu testul,


uniformitate ce decurge dintr-un ansamblu de norme bine precizate şi care trebuie respectate.
Din chiar definiţia sa testul ni se propune ca un instrument standardizat sub trei aspecte:
conţinut, aplicare şi interpretare.
Standardizarea depinde de o serie de factori, cum ar fi:
 uniformitatea stimulilor prezentaţi pentru a provoca reacţiile subiectului (sarcină
identică pentru toţi).
 uniformitatea instructajului dat subiecţilor în legatură cu sarcina care trebuie
executată.
 respectarea timpilor de lucru prezenţi pentru rezolvarea sarcinii şi notarea precisă a
timpului de lucru al fiecărui subiect dacă timpul nu se măsoară (acest lucru are o valoare
simptomatică).
 uniformitatea modului de cotare a reacţiilor (raspunsurilor) astfel încât subiec-tivitatea
examinatorului să intervină cât mai puţin.
 uniformitatea interpretării rezultatelor în funcţie de procedee statistico-matematice
precise.
În concluzie, standardizarea este o cerinţă statistică prin care se urmăreşte
uniformizarea de ansamblu a examenului psihologic pe baza de test. Nivelul standardizării
exprimă gradul de obiectivitate al testului şi, prin urmare, există o cerinţă permanentă în
psihodiagnoză şi psihometrie pentru creşterea sa. (Răşcanu, 2006).

3. Concepte cheie implicate în metrologie

3.1 Constructul

Definiţie. Un construct este, în genere, o idee construită de experţi pentru a rezuma un


grup de fenomene sau de obiecte şi pentru a fi utilizat într-un cadru ştiinţific, teoretic,
metodologic sau aplicativ (Minulescu, 2003, p.71).
Proprietăţi. După Murphy şi Davidshofer (1991, apud Minulescu, 2003, p.71), orice

12
construct are 2 proprietăţi:
1. este o abstractizare a unor regularităţi din natură;
2. nu este observabil direct, dar poate fi conectat cu entităţi sau evenimente
concrete, observabile.
Constructele psihologice sunt evidenţiate, direct sau indirect, de comportament sau în
urma conducerii unor experimente dedicate măsurării lor. Un construct psihologic, arată J.F.
Binning şi G.V. Barett (apud Silva, 1993, cf. Minulescu, 2003, p.72), este “o etichetă aplicată
unei grupări de comportamente care covariază”.
Pentru Standards for Educational and Psychological Tests din1985, constructul este o
“noţiune teoretică derivată din cercetare şi din alte experienţe, care a fost construită pentru a
explica modele de comportament observabile”.
Constructele create pentru interpretarea rezultatelor testelor psihologice sunt
identificate, de obicei, cu câte o clasă de răspunsuri (L. J. Cronbach, apud Silva, 1993, cf.
Minulescu, p.72).
Structura constructului. Unii autori consideră constructele ca fiind
multidimensionale, formate din “componente” independente unele de altele, numite uneori
“faţete” şi recomandă utilizarea analizei factoriale ca metodă pentru studierea acestora. De
exemplu, în modelul elaborat de Guilford, constructul“creativitate” are drept componente:
fluiditatea, flexibilitatea, originalitatea, elaborarea, senzitivitatea faţă de probleme şi
redefinirea (Landau, 1979, apud Minulescu, 2003, p.72).
Construct şi teorie psihologică. Fiecare construct psihologic este fundamentat pe o
teorie, care permite descrierea şi predicţia comportamentelor legate de el, în situaţii specifice.
Pentru elaborarea unui test care să îl măsoare, constructului i se asociază o variabilă
cantitativă, despre care se presupune că se află în relaţie crescătoare cu scorurile testului. Se
formulează apoi o serie de afirmaţii referitoare la modul în care se comportă persoanele care
au valori mari ale acestei variabile, comparativ cu cele care au valori scăzute. De exemplu:
persoanele care au o motivaţie puternică pentru realizare au rezultate şcolare bune.
Construct şi comportamente. Comportamentele prin care autorul testului consideră
că se manifestă constructul pot fi influenţate de diverse variabile, precum vârsta, sexul,
educaţia primită, etc. Pentru unele dintre acestea, legătura cu constructul poate corespunde
unei situaţii reale, observată în populaţia căreia i se adresează testul şi acceptată de teoria care
stă la baza constructului. Pentru altele, însă, ea denotă că aceste comportamente nu sunt
caracteristice constructului. De asemenea, comportamentele prin care este descris constructul
măsurat de test se pot asocia cu comportamente prin care se manifestă alte constructe
psihologice, evaluate prin teste existente.
Descrierea constructului. Elaborarea unui test care să măsoare un anumit construct
impune descrierea constructului în termeni comportamentali concreţi. Operaţia se numeşte
explicarea constructului şi constă din următorii trei paşi (Murphy, Davidshofer, 1991, apud
Minulescu, 2003, p.73):
1. Se identifică acele comportamente care au legătură cu constructul măsurat de test.
2. Se identifică alte constructe şi pentru fiecare se decide dacă are sau nu legătură cu
constructul măsurat de test.
3. Pentru fiecare construct se alcătuieşte o listă de comportamente prin care acesta se
manifestă. Pentru fiecare comportament, pe baza relaţiilor dintre constructe, se decide dacă
are sau nu legătură cu constructul măsurat de test.
O descriere amănunţită a constructului trebuie să conţină şi relaţiile acestuia cu cât
mai multe variabile fiziologice, psihologice etc.

3.2. Domeniul de conţinut al unui test

13
Definiţie. Prin domeniu de conţinut al unui test se înţelege “mulţimea tuturor
comportamentelor care pot fi utilizate pentru a măsura atributul specific sau caracteristica la
care se referă testul” (Murphy şi Davidshofer, 1991, apud Minulescu, 2003, p.75).
Deosebirea dintre un construct şi un domeniu de conţinut constă numai în gradul de
abstractizare implicat, şi adesea este dificil de făcut diferenţa între ele.
Descrierea domeniului de conţinut trebuie în primul rând să precizeze limitele
acestuia. Apoi, pentru fiecare componentă se apreciază importanţa. În cazul testelor destinate
să măsoare rezultatele unui program de instruire (cunoştinţe sau deprinderi), descrierea
domeniului de conţinut al testului se bazează pe analiza conţinutului şi a obiectivelor
instrucţionale ale cursului urmat de persoanele care vor fi testate. Se încearcă să se includă în
domeniul de conţinut, aspectele pe care mai mulţi experţi le consideră importante.
Descrierea domeniului de conţinut cuprinde (Minulescu, 2003, p.75):
1. limitele domeniului – se au în vedere cunoştinţele cuprinse în bibliografia
indicată la curs (se anexează lista bibliografică);
2. componentele domeniului:
➔ probleme: analiza de itemi, validitatea testelor, fidelitatea testelor;
➔ aspecte tratate: definiţiile noţiunilor, metodele de cercetare, condiţiile de
utilizare a metodelor de cercetare şi a formulelor de calcul;
3. importanţa relativă a componentelor domeniului.

3.3. Grupele contrastante

Definiţie. Grupele contrastante sau grupele extreme, reprezintă două loturi de subiecţi
care, printr-o variabilă sau mai multe, au valori diferite extreme, respectiv, un grup are valori
foarte mari, celălalt grup are valori foarte mici.
Modul de formare a grupelor contrastante este dependent de numărul variabilelor alese
şi de scala pe care acestea sunt măsurate. În cazul unei singure variabile dihotomice, aşa cum
este sexul, grupele contrastante corespund celor 2 valori ale variabilei.

3.4. Criteriul

Definiţie. Prin criteriu se înţelege “o variabilă pe care încercăm să o prevedem în


general cu ajutorul testelor”, sau “o măsură acceptată a comportamentului evaluat de test”.
Criteriul, în aprecierea personalului este “o măsură a nivelului de performanţă
exprimată în termeni cantitativi, bazată pe o descriere completă a muncii prestate”.
Dimensiunile criteriului: variabila criteriu poate fi unidimensională sau
multidimensională, cu valori cantitative sau / şi calitative.
Spre exemplu, performanţa în muncă este un criteriu multidimensional. În compoziţia
criteriului intră aspecte ce ţin de (Gilmer, 1971, Pitariu, 1994, apud Minulescu, 2003, p.77):
➔ cantitatea realizată în unitatea de timp (piese produse, cuvinte dactilografiate,
itemi codificaţi, etc.);
➔ calitatea muncii (număr de piese rebutate, număr de erori de codificare, etc.);
➔ timpul de muncă neutilizat (absenţe, întârzieri, pauze neautorizate, etc.);
➔ stabilitatea în muncă (vechimea în muncă, schimbări de profesie, trasferări,
demisii, etc.);
➔ costul necesar pentru instruire (timpul de instruire pentru realizarea unei
producţii standard, costul materialului stricat în timpul instruirii, viteza de avansare, etc.);
➔ cunoştinţele profesionale;
➔ satisfacţia în muncă (număr de revendicări, de sugestii, examinări psihiatrice,
etc.);

14
➔ evaluările făcute de superiori sau de colegi.
Se recurge adesea la verificarea corectitudinii unui test, în cadrul operaţiei de validare
a testului, prin compararea scorurilor sale cu măsurile unui criteriu, atunci când testul trebuie
să înlocuiască variabila criteriu, fie din cauză că valorile variabilei criteriu nu sunt cunoscute
ăn momentul testării, fie pentru că administrarea testului este mai puţin costisitoare decât
măsurarea variabilei criteriu.
Condiţii. Pentru a face posibilă aprecierea corectă a calităţilor testului cercetat,
criteriul trebuie să îndeplinească următoarele condiţii (adaptare după Greuter, Algera, 1989 şi
Corsini, 1994, apud Minulescu, 2003, p.77):
1. Să fie relevant pentru activitatea sau caracteristica la care se referă, adică
ordinea subiecţilor determinată pe baza valorilor criteriului să corespundă ordinii reale a
acestora în privinţa succesului obţinut în activitatea respectivă sau a mărimii caracteristicii
măsurate. Pentru aceasta este necesar ca variabila criteriu să ia valori într-o mulţime total
ordonată ori să realizeze o măsurare pe scala ordinală, de interval sau de raport. De obicei, se
preferă criteriile cu valori cantitative.
2. Să fie fidel, adică să concorde cu diverse evaluări ale performanţelor la care el
se referă, făcute la momente diferite şi/sau cu alte instrumente de măsură similare lui.
Verificarea acestei condiţii se poate face cu ajutorul coeficientului de corelaţie.
3. Să fie practic, adică să nu coste mult şi să fie acceptabil pentru cei care doresc
să îl utilizeze în luarea deciziilor. Pentru îndeplinirea acestei condiţii, este important ca în
criteriu să fie înglobate principalele aspecte care sunt avute în vedere la aprecierea
performanţei sau a mărimii caracteristicii măsurate. Identificarea acestora se poate face
apelând la supervizori, respectiv la experţi.
4. Să fie exprimat în aceleaşi unităţi sau în unităţi comparabile pentru toate
persoanele. De exemplu, dacă valorile variabilei criteriu sunt dependente de vârsta
subiecţilor, atunci aceste valori vor fi transformate în cote standardizate, pentru fiecare
persoană, fiind utilizate în formula de transformare, media şi abaterea standard
corespunzătoare grupei de vârstă din care aceasta face parte.
5. Atunci când criteriul este multidimensional, valoarea criteriului pentru fiecare
persoană să se reflecte atât prin importanţa diverselor componente, cât şi prin nivelul
individului la fiecare dintr ele.
Criterii pentru analiza validităţii testelor care măsoară constructe. Anastasi
(1954, apud Minulescu, 2003, p.79) enumeră câteva criterii utilizate în practica psihologică
pentru analiza validităţii testelor care măsoară constructe. Acestea sunt:
1. vârsta – se foloseşte drept criteriu pentru testele de inteligenţă, întrucât se
consideră că scorurile acestora trebuie să crească pe parcursul copilăriei, până la maturitate.
Nu este un criteriu bun pentru testele care măsoară funcţiuni psihice invariabile sau variabile
în timp, cum sunt variabilele de personalitate;
2. cunoştinţele şcolare – exprimate prin note şcolare, rezultate la teste de
cunoştinţe sau evaluări făcute de profesori asupra inteligenţei elevilor – sunt adesea criterii
pentru testele care măsoară aptitudinea şcolară;
3. performanţele la diverse programe de instruire specială cum sunt cursurile de
dactilografie, programare, muzică etc. - furnizează criterii pentru teste de aptitudini speciale;
4. performaţa profesională serveşte uneori drept criteriu pentru testele de
personalitate;
5. evaluările făcute de profesori, instructori sau superiori sunt folosite mai mult
pentru a obţine informaţii despre alte criterii, cum ar fi cunoştinţele şcolare, performanţele la
diverse cursuri, reuşita profesională. Au rol de criteriu pentru unele teste care măsoară
trăsături psihice, precum anxietatea, onestitatea, originalitatea, etc.;
6. rezultatele altor teste se utilizează ca şi criteriu atunci când se urmăreşte să se

15
construiască un test care să măsoare acelaşi luru ca şi criteriul, dar să fie mai uşor de
administrat sau/şi de cotat, sau să fie mai ieftin;
7. grupele contrastante reprezintă, de obicei, un criteriu multidimensional, care
cuprinde aspecte diverse din viaţa zilnică.
Clasificarea criteriilor. Criteriile utilizate în cercetările asupra comportamentului pot
fi clasificate din 2 puncte de vedere, ambele permiţând plasarea criteriilor de-a lungul unei
axe (Barclay, 1968, apud Minulescu, 2003, p.79):
➔ după modul de obţinere a valorilor lor, la un pol se plasează criteriile
subiective (valorile furnizate de subiect), iar la celălalt, cele obiective (valorile obţinute de la
alte persoane sau cu ajutorul unor instrumente de măsură);
➔ după gradul în care valorile lor sunt dependente de contextul în care se află
persoana evaluată, la un pol se află criteriile individuale (valorile sunt independente de
contextul în care se află persoana), iar la celălalt, cele de grup (comportamentele sunt puternic
influenţate de grupul din care face parte persoana evaluată cu ajutorul criteriului).

3.5. Eşantionarea

Experimentarea testului pe un eşantion de selecţie este condiţionată de costurile mari


ale abordării întregii populaţii. Eşantionul reprezintă o colectivitate numerică restrânsă, aleasă
conform unor însuşiri (atribute). El trebuie să satisfacă o serie de cerinţe (Martin, 2007,
p.172):
➔ să aibă o mărime acceptabilă pentru criteriul vizat de test. Mărimea este
condiţionată de echilibrul care trebuie să funcţioneze între gradul de precizie aşteptat şi
costurile permise;
➔ să fie omogen (omogenitate de cultură, socială, de vârstă, de nivel de
şcolarizare, profesională). Omogenitatea este controlată prin gradul de aproximare a
distribuţiei normale (simetria curbei);
➔ să fie reprezentativ. Atunci când testul trebuie să aibă o aplicabilitate foarte
largă, eşantionul trebuie să reproducă structura populaţiei de adresare. În acest scop sunt alese
o serie de caracteristici unde reprezentativitatea în eşantion trebuie să fie proporţională cu cea
reală. Înăuntrul fiecărei caracteristici selecţia se face aleator.
Există mai multe tehnici de eşantionare:
A. Tehnici de eşantionare probabiliste:
1. eşantionare aleatoare simplă – fiecare membru al populaţiei are aceeaşi şansă
de a fi selecţionat;
2. eşantionare aleatoare sistemică – fiecare al n-lea membru este selecţionat
dintr-o listă a populaţiei;
3. eşantionare aleatoare stratificată – participanţii sunt aleator selecţionaţi din
grupuri, subgrupuri sau straturi ale populaţiei;
4. eşantionare aleatoare multistadială – grupurile sunt aleator selecţionate şi
toţi membrii unui grup selecţionat sunt testaţi.
B. Tehnici de eşantionare nonprobabiliste:
1. eşantionare de convenienţă – selecţionăm participanţi apţi, disponibili
(atenţie la deformarea prin voluntariat, unii se oferă să participe şi asta poate însemna că sunt
mai puţin emotivi de exemplu);
2. eşantionare prin evaluare – se alcătuieşte un eşantion, dar nu aleator, despre
care cercetătorul crede că e reprezentativ;
3. eşantionare pe cote – se stabilesc anumite cote, proporţii din populaţie (x
psihologi lucrează în domeniul y);
4. eşantionare prin identificare (snowball) – potenţialii participanţi sunt

16
identificaţi de participanţii deja aleşi pe baza unui criteriu.

3.6. Eroarea standard a măsurării

Interpretarea scorurilor individuale la teste se bazează pe eroarea standard a


măsurătorii. Ea se calculează pe baza coeficientului de fidelitate a testului respectiv şi în
funcţie de abaterea standard a scorurilor la nivelul eşantionului normativ.
Eroarea standard a măsurătorii ne permite ca, pe baza notei la test, puternic influenţată
de o serie de surse de variaţie, să estimăm limitele rezonabile în care se situează performanţa
reală a subiectului (Martin, 2007, p.186).
Formula de calcul utilizată este:

SEM = Sdy – rxy2

În formulă:
Sd = deviaţia standard la scorurile obţinute la criteriu,
rxy2 = pătratul valorii coeficientului de validitate,
dacă rxy = maxim 1, atunci SEM = 0, deci o certitudine de 100% privind
comportamentul subiectului în viitor,
dacă rxy = 0,00, atunci SEM = Sdy, deci criteriul folosit de cei care au utilizat testul.

17

S-ar putea să vă placă și