Documente Academic
Documente Profesional
Documente Cultură
NICOLAE MITROFAN
DEPARTAMENTUL DE
NVMNT LA DISTAN
NICOLAE MITROFAN
NICOLAE MITROFAN
Module:
Modulul 1 Situaia psihodiagnosticului n lume i n ara noastr
Modulul 2 Testul psihologic ca mijloc de evaluare
Modulul 3 - Caracteristicile psihometrice ale testului psihologic
Modulul 4 - Analiza itemului
Modulul 5 Etalonarea i standardizarea testelor
Modulul 1 Situaia psihodiagnosticului n lume i n ara noastr
Unitatea de nvare 1: Precizri prealabile privind evaluarea psihologic
Unitatea de nvare 2: Contribuii la dezvoltarea psihodiagnosticului n
secolul XX
Unitatea de nvare 3: Tendine i direcii de dezvoltare a
psihodiagnosticului la nceputul mileniului III.
Unitatea de nvare 4. Situaia psihodiagnosticului din Romnia
n perioada actual
Modulul II Testul psihologic ca mijloc de evaluare
Unitatea de nvare 1: Testul psihologic
Unitatea de nvare 2: Clasificarea testelor psihologice
Unitatea de nvare 3: Testul psihologic i Codul deontologic
Modulul III Caracteristici psihometrice ale testului psihologic
Unitatea de nvare 1: Ce sunt caracteristicile psihometrice ?
Unitatea de nvare 2: Fidelitatea testului
Unitatea de nvare 3: Validitatea testului
Unitatea de nvare 4: Testul psihologic i selecia profesional
Modulul IV Analiza itemului
NICOLAE MITROFAN
NICOLAE MITROFAN
MODULUL I
NICOLAE MITROFAN
NICOLAE MITROFAN
NICOLAE MITROFAN
NICOLAE MITROFAN
Obiective:
La sfritul acestei uniti de nvare studenii vor fi
capabili s:
defineasc corect noiunea de evaluare psihologic
s diferenieze evaluarea psihologic tiinific de
cea empiric
cunoasc ce criterii utilizm pentru a stabili marile
perioade de evoluie a evalurii psihologice
cunoasc unele dintre cele mai vechi preocupri
privind evaluarea psihologic
cunoasc
cine
este
considerat
printele
psihodiagnosticului
NICOLAE MITROFAN
NICOLAE MITROFAN
10
NICOLAE MITROFAN
11
NICOLAE MITROFAN
12
NICOLAE MITROFAN
13
NICOLAE MITROFAN
asemenea, dup unii autori (Cohen et al., 1996), el este primul care concepe
psihometria ca tiin.
Indiferent ns de disputele privind paternitatea unei noiuni sau a
alteia, putem afirma c, n perioada ultimelor dou secole ale mileniului II, s-a
produs, n domeniul psihologiei, un salt extraordinar prin promovarea
metodelor cantitative n tiina psihologic. Deci, fenomenele psihice, prin
excelen subiective, pot fi msurate i evaluate matematic. S-a rspuns n felul
acesta uneia dintre cele mai serioase acuze datorit creia psihologiei nu i s-a
acceptat mult timp statutul de tiin. Nu tim, astzi, ct de mult au neles
acest lucru contemporanii perioadei la care facem referire, ns noi, la mai bine
de un secol de atunci, nu putem s nu ne exprimm recunotina fa de toi cei
care au contribuit la realizarea acestei construcii extrem de importante
pentru evoluia ulterioar a psihologiei: psihometria.
Tem de reflecie/autoevaluare:
De ce este dificil s susinem faptul c exist un singur printe al psihometriei sau a
psihodiagnosticului ?
ntrebri de autoevaluare
1. Ce nelegem prin termenul de psihodiagnoz ?
2. Ce nelegem prin termenul de evaluare psihologic ?
3. Care sunt noiunile, ce se refer la evaluarea psihologic , vehiculate mai frecvent n
literatura de specialitate ?
4. Prin ce se deosebete un psihodiagnostician de un psihotehnician ?
5. De ce psihologul trebuie s promoveze n mod consecvent evaluarea psihologic
tiinific ?
6. Care sunt cele mai vechi forme ale testrii psihologice ?
7. Ce putem reproa celor care utilizau asemenea forme ?
8. Cui putem acorda paternitatea conceptului de psihometrie ?
9. Care sunt meritele principale ale lui A. Binet privind dezvoltarea psihometriei ?
10. Care sunt meritele principale ale lui James McKeen Cattell privind dezvoltarea
psihometriei ?
11. Care sunt contribuiile lui W. Wundt i ale doctoranzilor si la dezvoltarea
psihodiagnosticului ?
12. Cu ce au contribuit i unii filosofi la dezvoltarea psihometriei ?
13. Ai putea s precizai care este locul i rolul testelor n selecia profesional ?
BIBLIOGRAFIE MINIMAL
ALBU, M. (2000). Metode i instrumente de evaluare n psihologie, Cluj-Napoca: Argonaut.
MITROFAN, N. (2001), Psihometria i direciile ei de dezvoltare la nceput de mileniu. n ZLATE
M. (coord.), Psihologia la rspntia mileniilor. Iai: Polirom.
SCHIOPU, U. (2003), Introducere n psihodiagnostic. Bucureti: Editura Pro-Humanitas.
STAN, A. (2002). Testul psihologic.Evoluie, construcii, aplicaii. Iai: Polirom.
GREGORY, R.J. (1996). Psychological testing. History, Principles, and Applications. Needham
14
NICOLAE MITROFAN
15
NICOLAE MITROFAN
Obiective:
La sfritul acestei uniti de nvare studenii vor fi
capabili s:
cunoasc principalele contribuii privind testele
de inteligen
cunoasc principalele contribuii privind testele
de personalitate
cunoasc principalele contribuii privind testele
de aptitudini
cunoasc principalele contribuii privind testele
de achiziii
cunoasc principalele contribuii privind testele
folosite n clinic
evalueze critic toate contribuiile privind
psihodiagnoza de pn la sfritul sec. XX.
2.1. Testele de inteligen
Printre primele teste care au aprut la nceputul secolului XX au fost testele de inteligen. Dup ce A. Binet i colaboratorul su, T. Simon, au creat
prima scal metric a inteligenei, ce cuprindea 30 de itemi, destinat
identificrii copiilor colari retardai mintal din Paris, s-a produs o intensificare
fr precedent a interesului practicienilor pentru aceste instrumente. Ele vor fi
aplicate n coli, nchisori, tribunale pentru copii etc. Testul lui Binet a fost
supus unor multiple revizuiri i traduceri, att n Europa, ct i, mai ales, n
America. Revizuirea fcut de L. Terman, n 1916, confer acestui test
denumirea de Stanford-Binet Intelligence Scale (Scala de inteligen StanfordBinet). Testul lui Binet a fost un test individual, ns odat cu declanarea
primului rzboi mondial a aprut cerina creerii unor teste care s poat fi
aplicate pe grupuri mai mari de subieci i ntr-un timp mai scurt. Aa au aprut
testele de grup pentru abilitile umane (the Army Alpha i the Army Betha),
create de un colectiv de psihologi avndu-l n frunte pe Roberet Yerkes, care
deinea i funcia de preedinte al Asociaiei Psihologilor Americani.
16
NICOLAE MITROFAN
17
NICOLAE MITROFAN
18
NICOLAE MITROFAN
test care a fost supus, de ctre K.M. Cowdery, timp de doi ani, respectiv,
1926-1927, la mai multe mbuntiri, cum ar fi, de exemplu: creterea
numrului de itemi, compararea rspunsurilor a 3 grupe-criteriu (medici,
ingineri i juriti) cu grupe de control cuprinznd neprofesioniti.
Edward K. Strong a revizuit testul lui Cowdery i timp de 36 de ani s-a
ocupat de un nou instrument destinat a msura interesele, cunoscut sub
numele Strong Vocational Interest Blank (SVIB). Acesta va deveni unul
dintre cele mai utilizate teste din toate timpurile, dei, a avut, mai mereu, un
serios competitor testul ce purta denumirea de Kuder Preference Record,
creat n anul 1934. Ceea ce era specific pentru acest test era faptul c el
compara mai mult puterea relativ a intereselor la nivel individual dect
rspunsurile individuale cu rspunsurile variatelor grupe profesionale. Deci,
era un test ipsativ iar cele mai recente revizuiri ale acestui instrument
psihodiagnostic include variantele Kuder Survey i Kuder Occupational
Interest Survey (Zytowski, 1985).
Teme de reflecie/autoevaluare:
1. Care este primul test de personalitate construit n timpul primului rzboi mondial ?
Prin ce se caracterizeaz el ?
2. Care sunt cele mai importante teste proiective construite n prima jumtate a
secolului XX ?
3. Prin ce se deosebete testul 16PF Cattell de testele MMPI i CPI ?
4. Care sunt testele de interese mai cunoscute ? Prin ce se caracterizeaz ele ?
19
NICOLAE MITROFAN
20
NICOLAE MITROFAN
ntrebri de autoevaluare:
1. Care este contribuia lui A. Binet i a lui T. Simon la dezvoltarea psihodiagnozei ?
2. Ci itemi cuprinde prima scal metric a inteligenei ?
3. Care sunt primele teste de grup folosite pentru testarea abilitilor umane ?
4. Care este contribuia lui L. Terman privind dezvoltarea psihodiagnosticului ?
5. Dar a lui D. Wechsler ?
6. Care este cel mai vechi test de personalitate ?
7. Care sunt primele teste proiective create ?
8. Care sunt cele mai cunoscute i cel mai mult folosite chestionare de personalitate ?
9. Care este bateria de teste creat de L.L. Thurstone ?
10. Care este specificul testelor de achiziie ?
11. Care sunt diferenele de baz dintre cele 4 modele de testare clinic ?
21
NICOLAE MITROFAN
BIBLIOGRAFIE MINIMAL
GREGORY, R.J. (1996). Psychological Testing. History, Principles, and Applications. Alyyn &
Bacon, Needham Heights.
HORGHIDAN, V. (1998), Metode de psihodiagnostic. Bucureti: Editura didactic i pedagpogic.
MITROFAN, N. (2001), Psihometria i direciile ei de dezvoltare la nceput de mileniu. n M. Zlate
(coord.), Psihologia la rspntia mileniilor. Iai: Polirom.
SCHIOPU, U. (2003). Introducere n psihodiagnostic. Bucureti: Editura Pro-Humanitas.
LECTURI SUPLIMENTARE
ALBU, M. (2000). Metode i instrumente de evaluare n psihologie. Cluj-Napoca: Argonaut.
EYSENCK, H.J. (1998). Teste de inteligen. Bucureti: Queen.
22
NICOLAE MITROFAN
Unitatea de nvare 3
Tendine i direcii de dezvoltare a psihodiagnosticului la
nceptul mileniului III
Cuprins:
3.1. Teoria testelor
3.2. Construcia i dezvoltarea unor noi teste
3.3. Computerizarea testelor
3.4. Predicii pentru viitorul apropiat
3.1.
Obiective:
La sfritul acestei uniti de nvare, studenii vor fi
capabili s:
cunoasc diferenele dintre teoria clasic i teoria
rspunsului la item
cunoasc noile direcii de construcie i dezvoltare
a unor teste
evalueze critic utilizarea computerului n testarea
psihologic
cunoasc principalele predicii pentru viitorul
apropiat
Teoria testelor
n planul teoriei,
modelul
clasic
psihometric este nlocuit de un model nou i anume, IRT (Teoria rspunsului
la item). Fcnd o sintez a mai multor puncte de vedere, M. Albu (1998)
ajunge la concluzia c aceast teorie are la baz urmtoarele postulate: 1.
Comportarea unui subiect la un item al unui test poate fi explicat (sau prezis)
cu ajutorul unui set de factori, numii trsturi, trsturi latente sau abiliti.
Orice construct inobservabil, presupus continuu, n privina cruia o teorie
psihologic afirm c persoanele se deosebesc ntre ele poate fi privit ca factor.
Fiecrui factor i se asociaz o variabil cu valori numerice cuprinse ntre - i
+ , continu, denumit variabil latent. 2. Se infereaz existena unui factor
numai dac se observ c rspusnurile la itemi prin care se dorete msurarea
constructurlui covariaz (variaz la fel). 3. Relaia dintre performna la item a
subiecilor i fiecare dintre trsturile care au legtur cu performana poate fi
descris prin cte o funcie cresctoare, denumit funcie caracteristic a
itemului sau curb caracterisitic a itemului. Aceast funcie arat cum
depinde probabilitatea de a rspunde corect (sau afirmativ) la item de nivelul
trsturii.
Cei care susin acest model caut s evidenieze i argumentele sau
raiunile privind importana lui i anume: 1. IRT poate compara teste alctuite
explicit din itemi diferii. n consecin, ea permite comparaii ntre diferite
ocazii pentru acelai subiect, n raport cu care memoria pentru rspunsurile
anterioare este o problem, chiar dac cele dou teste nu au itemi comuni.
Aceasta este numit msurarea liber a testului i este important pentru
testarea ajustat i pentru testarea adaptativ computerizat. 2. Subiecii cu
23
NICOLAE MITROFAN
24
NICOLAE MITROFAN
25
NICOLAE MITROFAN
26
NICOLAE MITROFAN
27
NICOLAE MITROFAN
lucrarea sa, mult mai multe utiliti prezente i, mai ales, viitoare ale
programelor folosite n domeniul testrii psihologice: a) pstrarea rezultatelor
testrii psihologice, n fiiere sau n baze de date; b) calculul scorurilor la teste;
asemenea programe sunt utile mai ales n cazul testelor compuse dintr-un
numr mare de itemi, repartizai pe mai multe scale. Exist i teste care nu pot
fi cotate dect cu ajutorul calculatorului (de exemplu, testul pentru capacitatea
de organizare CO92); c) administrarea testelor, urmat, desigur, de calculul
scorurilor; cu ajutorul calculatorului pot fi administrate teste prin care se
msoar variabile psihice sau fiziologice care nu ar putea fi investigate n cazul
administrrii de tip creion-hrtie (de exemplu, timpul de reacie, timpul de
decizie, timpul de rspuns la fiecare item al unui chestionar etc.); d)
identificarea protocoalelor invalide, n care rspunsurile subiectului nu sunt
conforme cu realitatea. Un procedeu utilizat n acest scop aplic teste statistice
asupra succesiunilor de rspunsuri date de subiect; e) verificarea unor ipoteze
referitoare la persoana examinat, pe baza comparrii, prin teste statistice, a
rezultatelor obinute de aceasta la examenul psihologic cu cele ale unui
eantion extras din populaia creia i aparine subiectul; f) intervievarea
subiectului; programele conin, alturi de ntrebrile posibile, i un algoritm de
constituire a interviului n timpul examenului psihologic, n funcie de
rspunsurile date de subiect. Interviurile administrate de calculator sunt
contraindicate ns n cazul copiilor, al adulilor cu un nivel intelectual sczut i
al celor cu simptome psihiatrice; g) interpretarea rezultatelor la un test
psihologic, care are la baz transpunerea ntr-un program a unui set de reguli
prespecificate, referitoare la un rspuns sau la un pattern de rspunsuri (un scor
la un test sau un profil psihologic), ce permite analiza, interpretarea i
evaluarea unor caliti ale persoanelor; h) redactarea raportului psihologic;
uneori sunt formulate predicii referitoare la subiect, fie pe baza unor metode
statistice (de exemplu, folosind regresia liniar), fie pe baza identificrii unor
legturi ntre scorurile la test i unele caracteristici non-test, cum sunt datele
biografice. Alteori, n urma comparrii profilului psihologic al subiectului cu
rezultatele obinute la aceleai teste de diverse grupuri de persoane (de
exemplu, grupuri care difer ntre ele prin profesie, prin performana n munc
sau prin diagnosticul psihiatric) se determin populaia din care face parte
persoana examinat; i) alegerea tratamentului (a terapiei, a programului de
instruire etc.) cel mai potrivit pentru subiect; acesta reprezint cel mai nalt
nivel de implicare a calculatorului n activitatea psihologului i este de ateptat
ca numrul programelor de acest tip s creasc; j) construirea unui test
psihologic.
Dup unii autori (Cohen, Swerdlik i Phillips, 1996), programele
pentru computer, destinate a facilita construcia, administrarea, scorarea i
interpretarea unor teste, cum ar fi cazul testelor de achiziie dezvoltate de
cadrele didactice, vor prolifera ntr-un mod impresionant. Asemenea programe,
avnd denumiri de genul Make a test, Create a test, The Grand
Inquisitor, The First National Item Bank and Criterion-References Scoring
System, evideniaz dou avantaje majore ale testrii psihologice
computerizate: 1. capacitatea de a stoca itemi n banca de itemi; 2.
28
NICOLAE MITROFAN
29
NICOLAE MITROFAN
Tem de reflecie/autoevaluare:
Analizai aceste predicii i stabilii dac viitorul activitii psihodiagnostice
este de bun augur sau nu
ntrebri de autoevaluare:
1. Prin ce se caracterizeaz Teoria rspunsului la item (IRT) ?
2. Ce nseamn evaluarea potenialului de nvare ?
3. Care sunt cele mai importante teste mai nou construite ?
4. Ce avantaje prezint computerizarea testelor ?
5. Ce nseamn testarea computerizat adaptativ ?
6. Enumerai cteva programe pentru testarea computerizat.
7. Ce se ateapt n viitor privind activitatea psihodiagnostic ?
BIBLIOGRAFIE MINIMAL
ALBU, M. (1998), Construirea i utilizarea testelor psihologice. Cluj-Napoca: Clusium.
ALBU, M., Pitariu, H. (1993). Proiectarea testelor de cunotine i examenul asistat de
calculator. Cluj-Napoca: Casa crii de tiin.
HAVRNEANU, C. (2000). Cunoaterea psihologic a persoanei. Iai: Polirom.
KAPLAN, R.M., SACCUZZO, D.P. (1993). Psychological Testing. Principles, Applications,
and Issues. Pacific Grove: Brooks/Cole Publishing Company.
MINULESCU, M. (1996). Chestionarele de personalitate n evaluarea psihologic.
Bucureti: Garell Publishing House.
30
NICOLAE MITROFAN
Obiective:
La sfritul acestei uniti de nvare, studenii vor fi capabili s:
cunoasc bine problemele cu care se confrunt psihologii ce
folosesc teste;
cunoasc cerinele legate de aplicarea i comercializarea testelor;
cunoasc prevederile Legii 213/2004 privitoare la Crearea
Colegiului Psihologilor din Romnia;
identifice corect locul i rolul Comisiei metodologice;
fie familiarizat cu realizrile romneti n domeniul
psihodiagnosticului.
4.1.
Probleme mai vechi i mai noi cu care se confrunt psihodiagnosticienii.
Trebuie, mai nti, s subliniem faptul c, i nainte de 1989, chiar dac
psihologia nu era apreciat de guvernanii de atunci, au existat preocupri ale
psihologilor romni pentru dezvoltarea psihodiagnosticului. Putem aminti, n
acest sens, nume precum: Gh. Zapan, U. Schiopu, P. Constantinescu, G.
Bontil, I.M.Nestor, M. Roca, T. Kulcsar, I. Holban, A. Cosmovici .a. Din
nefericire, mai ales dup 1977, aproape un sfert de secol pedepsele politice
aplicate tiinelor sociale, dar mai ales psihologiei, au afectat grav i
psihodiagnosticul.
n perioada postdecembrist ns, psihologia romneasc a fost repus, n
mare msur, n drepturile ei fireti. S-au renfiinat seciile de psihologie din
cadrul universitilor, Institutul de psihologie, au aprut noi lucrri de valoare,
reviste, s-au organizat manifestri tiinifice. A aprut, totodat, i nvmntul
privat, aa c anual avem muli absolveni n psihologie, care doresc s activeze
ca specialiti n coli, clinici, firme, bnci, armat, transporturi etc. n aproape
orice domeniu sunt i trebuie s fie utilizate instrumente psihodiagnostice. Dar
i pn la absolvire studenii folosesc teste pentru diferite lucrri, inclusiv
pentru lucrarea de licen, pentru disertaia de masterat. Nu mai vorbim de cei
care fac tot felul de investigaii, pe baz de teste, pentru elaborarea tezei de
doctorat. Dar cum se prezint testele folosite n practic n ara noastr ?
Am putea analiza situaia lor n funcie de mai multe aspecte: a) starea
echipamentului testelor; b) aplicarea testelor; c) comercializarea testelor.
Referitor la starea echipamentului testelor, trebuie s menionm faptul
c, n marea lor majoritate, testele se prezentau ntr-o situaie
31
NICOLAE MITROFAN
necorespunztoare. Cele mai multe dintre teste erau vechi i foarte vechi,
folosite i rsfolosite, multiplicate n fel i chip, ceea ce fcea ca multe pagini
ale testelor s cuprind, pe lng coninutul itemilor, tot felul de semne i de
pete, din cauza multiplicrii n condiii tehnice discutabile. Erau multe teste
incomplete, fr manual, fr nicio surs privind istoricul, caracteristicile
psihometrice, valoarea psihodiagnostic. i n ceea ce privete, s spunem,
partea auxiliar a testelor, cum ar fi partea material, foile de rspuns, grilele
etc., au existat mari probleme, n sensul c acestea ori nu au existat, ori erau
confecionate ntr-o manier extrem de discutabil. Desigur, ntre timp lucrurile
s-au mai mbuntit. Au fost create teste noi, respectndu-se riguros cerinele
de ordin tiinific, au fost reetalonate i restandardizate teste ce erau folosite n
practic, multe teste au fost computerizate etc.
Activitatea de aplicare a testelor este serios i sever reglementat n
rile n care grija pentru meninerea prestigiului tiinific al psihologului este
permanent. Exist coduri, standarde etc. care precizeaz foarte clar cine
utilizeaz testele psihologice, cum le aplic i cum sunt folosite rezultatele. La
noi n ar, n perioada de dup Revoluie, nu au existat asemenea preocupri
iar consecinele negative nu au ntrziat s apar. Multe teste puteau fi aplicate
de oricine, fr nicio restricie. Unii psihologi au publicat chiar cri n care au
inclus informaii complete privind aplicarea testelor, cum este cazul unor teste
proiective. Ei au nclcat flagrant unele prevederi ale codului deontologic. Din
nefericire, unele teste ajunseser n mna altor specialiti (ingineri, economiti,
secretari etc.), fiind vorba de unele teste serioase i pretenioase n ceea ce
privete aplicarea i interpretarea rezultatelor.
Comercializarea testelor ridic cel puin dou ntrebri de baz: 1. de
unde procur psihologul specialist testele de care are nevoie ? 2. cine se ocup
n ara noastr de comercializarea testelor ? Ideal ar fi cam aa: un for naional
asigur revizuirea testelor, le reetaloneaz i, prin intermediul unor firme, care
trebuie s respecte strict anumite reguli de distribuire, le ofer solicitanilor, dar
mai ales celor care satisfac cerinele de formare i de specializare. Pn la
crearea Colegiului Psihologilor din Romnia, nimic din ce am menionat nu a
existat n realitate, absolvenii de psihologie fiind obligai, dac nu i-au
procurat din timpul facultii ceva teste prin multiplicare-copiere, s gseasc o
cale strict personal pentru a ajunge la unii psihologi care folosesc teste. i
iari multiplicare, cu toate consecinele sale, teste incomplete, etaloane inutile
etc. n ultimul timp mai multe firme au preluat activitatea de comercializare a
testelor, ele trebuind s aib acreditarea din partea Comisiei metodologice a
Colegiului.
Tem de reflecie/autoevaluare:
Cu ce probleme s-au confruntat, i se mai confrunt nc, psihodiagnosticienii din
ara noastr ?
4.2. Legea nr. 213/2004 i Colegiul Psihologilor din Romnia
Desigur, necesitile apariiei acestei legi nu in numai de problemele
legate de instrumentele psihodiagnostice. Ea a aprut n 2004 sub denumirea
complet Legea nr. 213 din 27 mai 2004 privind exercitarea profesiei de
32
NICOLAE MITROFAN
33
NICOLAE MITROFAN
ntrebri de autoevaluare:
1. De ce credei c psihologia nu era susinut ca tiin de ctre autoriti nainte de 1989 ?
2. Enumerai civa psihologi care s-au ocupat de problemele psihometriei nainte de 1989 ?
3. Cum se prezenta situaia testelor imediat dup 1990 ?
4. Cum se prezint situaia testelor n zilele noastre ?
5. n ce msur Colegiul Psihologilor sprijin dezvoltarea psihodiagnosticului ?
6. Ce atribuii are Comisia metodologic ?
7. Care sunt cele mai importante realizri n domeniul psihodiagnosticului ?
BIBLIOGRAFIE MINIMAL
MITROFAN, N. (2001), Psihometria i direciile ei de dezvoltare la nceput de mileniu. n
ZLATE, M., Psihologia la rspntia mileniilor. Iai: Polirom.
COLEGIUL PSIHOLOGILOR DIN ROMNIA (2005 i 2006), Acte normative.
34
NICOLAE MITROFAN
35
NICOLAE MITROFAN
36
NICOLAE MITROFAN
37
NICOLAE MITROFAN
netestate. Testul l poate ntreba pe subiect dac are prieteni sau nu, dac merge
la petreceri sau la ntlniri, dac-i place s stea mai mult singur etc.,
rspunsurile primite msurnd comportamentul introvert sau extrovert;
b) materiale auxiliare:
b1 manual i, eventual manual tehnic, n care se prezint, n mod obligatoriu,
urmtoarele:
- ce urmrete s msoare testul, dei intenia poate s apar din titlu;
- autorul sau autorii, reviziile efectuate, istoricul testului;
- cui se adreseaz (categoria socio-profesional, vrst, sex etc.);
- caracteristicile eantionului pe care a fost etalonat testul;
- valoarea coeficientului de fidelitate (inclusiv procedurile n baza crora s-a
calculat acest coeficient (forma test-retest, forma alternant, forma split-half
etc.);
- valoarea coeficientului de validitate (inclusiv procedurile n baza crora s-a
calculat acest coeficient; tipul de criteriu folosit);
- precizri privind timpul de rezolvare, precauii etc.;
- instruciuni privind cotarea rezultatelor (puncte, bonificri, penalizri etc.);
- norme sau etaloane, la care se raporteaz rspunsurile individuale.
b2 partea material a testului, cum este cazul a testelor-aparte, a testelor de
performan: - asamblri de obiecte; - aranjri de imagini; - construcii; cuburi
etc.;
b3 foi de rspuns, construite special, pentru a fi uor de cotat; ele poart
numele de foi standard;
b4 grila sau grilele de rspuns
Desigur, n cazul n care testul este computerizat el apare pe CD i multe
din componentele auxiliare ale testului sunt adaptate. Important este, ns,
faptul c pentru multe teste exist ambele forme i forma fizic, s-i spunem, i
forma electronic. Exist ns i teste care n-au cum s fie computerizate, cum
este cazul marilor baterii de inteligen (Bateria Stanford-Binet, Bateriile
Wechsler etc.), mai ales datorit subtestelor de performan ce presupun ca
subiectul s fac ceva (s construiasc, s identifice n imagini, s completeze
anumite lipsuri etc.).
Tem de reflecie/autoevaluare:
Dac dorim s cumprm un test ce msoar inteligena i constatm c vnztorul
(firma ce vinde teste) are 2 asemenea teste, pe care l preferm ? Deci, n baza a cror
criterii ?
2.3. Funciile psihodiagnozei
A aplica teste pe un subiect nu poate fi un simplu scop n sine. Chiar dac
o facem din curiozitate tot aflm ceva, deci tot ajungem la un rezultat, ceea
ce nseamn, de cele mai multe ori, un diagnostic. n practica
psihodiagnostic, ns, testele sunt folosite de ctre specialiti urmrindu-se
scopuri foarte precise. De aceea, autorii (U.Schiopu, 2003) vorbete de
existena mai multor funcii ale psihodiagnozei i anume:
38
NICOLAE MITROFAN
39
NICOLAE MITROFAN
ntrebri de autoevaluare:
1. De ce credei c exist mai multe definiii date testelor psihologice ?
2. Care sunt cele mai importante elemente de asemnare a multiplelor definiii
formulate ?
3. Ce nseamn msur obiectiv a unui eantion de comportament ?
4. Ce nseamn msur standardizat a unui eantion de comportament ?
5. n ce const echipamentul complet al unui test psihologic ?
6. La ce ne folosete manualul testului ?
7. n raport cu ce elemnte putem stabili valoarea testului psihologic ?
8. Care sunt principalele funcii ale psihodiagnozei ?
BIBLIOGRAFIE MINIMAL
40
NICOLAE MITROFAN
1. CLINCIU, AUREL, ION. 2005) Psihodiagnostic. Braov: Edit. Universitii din Braov.
2. ALBU, M (1998). Construirea i utilizarea testelor psihologice. Cluj-Napoca: Clusium.
3. SCHIOPU, U. (2003). Introducere n psihodiagnostic. Bucureti: Ed. Pro-Humanitas.
Unitatea de nvare 2
Clasificarea testelor psihologice
Cuprins:
2.1. Clasificarea realizat de U. Schiopu
2.2. Clasificarea realizat de H. Pitariu
2.3. Cum depim multiplele clasificri ?
Obiective:
La sfritul acestei uniti de nvare, studenii vor fi capabili s:
cunoasc criteriile de clasificare a testelor propuse de U. Schiopu;
cunoasc criteriile de clasificare a testelor propuse de H. Pitariu;
stabileasc n ce msur unele criterii de clasificare sunt exclusive
sau nu
diferenieze i alte criterii de clasificare a testelor psihologice
Clasificarea testelor realizat de U. Schiopu
Mai nti, trebuie s precizm faptul c exist un numr impresionant de
teste psihologice. Nimeni nu tie numrul lor exact, dar se vorbete de existena a
mii de teste. n unele ri, cum este cazul, mai ales, a SUA, psihodiagnosticul este
foarte bine dezvoltat i foarte bine reglementat. Sunt foarte multe studii efectuate
pentru a se urmri calitile psihometrice i n ce msur ele sunt utile n practic.
Avnd n vedere c exist extrem de multe teste, se ridic problema clasificrii
lor i, legat de aceasta, a criteriilor de clasificare. Desigur, mai muli autori au
ncercat s realizeze clasificri, ns noi ne vom referi la doi autori romni.
U. Schiopu (2003) reuete s diferenieze urmtoarele tipuri de clasificri:
a) clasificri ce se bazeaz pe sarcinile psihodiagnozei, adic pe structura
obiectivelor ce caracterizeaz testele unui sistem de diagnoz;
b) clasificri ce se bazeaz pe diferenele semnificative de strategie inclus n
structura de ansamblu a bateriei;
c) clasificri ce se bazeaz pe tipul de material administrat n teste i pe
caracteristicile acestuia;
d) clasificri ce se bazeaz pe diferene n ceea ce privete forma de administrare
a testelor;
e) clasificri ce se bazeaz pe caracteristicile tipurilor de rspunsuri solicitate;
f) clasificri ce se bazeaz pe tipurile de rspunsuri primite.
Clasificri n funcie de scopul urmrit. Putem diferenia:
- teste de cunotine sau teste pedagogice;
- teste de inteligen;
- teste de aptitudini;
- teste pentru msurarea unor abiliti senzorio-motorii;
41
NICOLAE MITROFAN
- teste de atenie;
- teste de memorie;
- teste de personalitate;
- teste de sociabilitate;
- teste de creativitate;
- teste pentru msurarea temperamentului;
- teste de interese;
Unele dintre aceste categorii de teste, la rndul lor, sunt profilate mai
precis, n funcie de obiectivul urmrit.
Ex. 1 - testele de inteligen pot fi:
- teste de inteligen general;
- teste de inteligen tehnic;
- teste de inteligen abstract;
- teste de inteligen social;
- teste de inteligen emoional;
- teste de inteligen kinestezic.
Ex. 2 testele de atenie pot fi teste care urmresc ca obiective:
- concentrarea ateniei;
- stabilitatea ateniei;
- mobilitatea ateniei;
- distributivitatea ateniei.
Ex. 3 testele de memorie pot fi:
- pentru memoria cifrelor, a figurilor;
- pentru memoria topografic
Ex. 4 testele de aptitudini pot fi:
- pentru aptitudini tehnice;
- pentru aptitudini numerice, matematice;
- pentru aptitudini artistice;
- pentru aptitudini verbale;
- pentru aptitudini pedagogice;
- pentru aptitudini organizatorice
Clasificri ce se bazeaz pe diferenele semnificative de strategie inclus
n structura de ansamblu a bateriei. Acest criteriu vizeaz, practic, nivelul de
corelaie dintre diferite teste. n aceast privin pot s existe urmtoarele
situaii:
a) ntre dou teste poate s nu existe niciun fel de legtur (deci, nivel de
corelaie = 0), ele urmrind s msoare n mod independent caracteristici
psihice total diferite;
b) ntre teste poate s existe o corelaie pozitiv, cu valoarea
coeficientului de corelaie ce tinde ctre valoarea + 1, atunci, mai ales, cnd
msoar aceeai nsuire psihic. Se poate da, ca exemplu, nivelul nalt de
corelaie dintre dou baterii de inteligen, cum ar fi cazul Bateriilor StanfordBinet i Wechsler;
c) ntre mai multe teste poate apare situaia intercorelrii unor factori,
cum ar fi cazul factorilor de grup; de exemplu: factorul verbal, factorul
42
NICOLAE MITROFAN
numeric, factorul spaial. Mai multe teste pot fi saturate diferit n ceea ce
privete fiecare dintre aceti factori.
Clasificri n funcie de materialele i caracteristicile materialelor
utilizate:
a) trebuie difereniate, mai nti, testele creion-hrtie, denumire
generic ce presupune rspunsul scris pe foi de rspuns, de testele- aparate, pe
de o parte (de exemplu, pompa Schultz, strungul Lahy etc.) i testele ce
folosesc diferite materiale, pe de alt parte (de exemplu, cuburile Kohs,
asamblarea de imagini etc.);
b) tot din perspectiva acestui criteriu, pot fi difereniate testele verbale i
testele nonverbale, prima categorie bazndu-se pe utilizarea limbajului i pe
comprehensiunea verbal. A doua categorie msoar o serie de capaciti
psihice care nu sunt condiionate de limbaj i ele pot fi aplicate celor ce
prezint unele handicapuri i celor care provin dintr-un mediu cultural modest
sau dintr-un mediu cultural strin;
Clasificri privind forma de administrare. n funcie de acest criteriu,
testele pot fi: individuale sau colective. Chiar dup denumire, cele individuale
se aplic exclusiv unui singur subiect; de exemplu, bateria de inteligen
Stanford-Binet, testul Bayley pentru copiii mici, testele proiective etc.). Ele
prezint marele avantaj c subiectul poate fi observat tot timpul ct i se aplic
testul. Testele colective se aplic pe grupuri mai mari sau mai mici de subieci.
Desigur ele se aplic i individual. Prezint avantajul c n timp scurt pot fi
testai muli subieci;
Clasificri n funcie de tipul de rspuns solicitat. n raport cu acest
criteriu testele pot fi grupate astfel:
a) teste cu rspuns la alegere; este cazul unor teste de personalitate, la care se
alege un rspuns din dou posibiliti, de tipul Da, Nu sau se folosesc scale
de rspuns, de tipul n foarte mare msur, n mare msur, n oarecare
msur, n mic msur, n foarte mic msur; de asemenea, este cazul
testelor de cunotine, la ai cror itemi exist mai multe rspunsuri la alegere,
printre care exist i rspunsul corect;
b) teste cu un singur rspuns bun, cum este cazul, mai ales, a testelor de
inteligen i a testelor de aptitudini. Subiectul ofer ca rspuns fie un numr,
fie un cuvnt, fie o figur sau o imagine etc. Rspunsul dat este corect sau nu;
c) teste cu rspuns liber, cum este cazul, mai ales, a testelor proiective, i mai
ales a celor pe baz de plane (de exemplu, testul Rorschach, Testul T.A.T), n
cadrul crora subiectul este lsat liber s ofere rspunsul. n cazul acestor teste,
ns, dificultile de cotare i de interpretare a rspunsurilor sunt mult mai mari,
necesitnd o mare specializare din partea practicienilor;
Clasificri n funcie de formele i tipurile de rezultate obinute. Plecnd
de la acest criteriu, putem diferenia dou categorii de teste: a) teste sintetice,
care, n urma aplicrii lor, ofer un rezultat global, de genul: QI coeficient de
inteligen; QD coeficient de dezvoltare; Q.Kre coeficient de creativitate;
Q.E. coeficient emoional; b) teste analitice, care, n urma aplicrii lor, permit
conturarea profilului psihologic. Este cazul, mai ales, a testelor de
43
NICOLAE MITROFAN
Teme de reflecie/autoevaluare:
1. Care sunt criteriile folosite de U. Schipou pentru clasificarea testelor ?
n ce msur putem considera c aceste criterii sunt suficiente ?
2.2. Clasificarea realizat de H. Pitariu (1993)
Aceast clasificare este fcut n funcie de elementele care dau testului
calitatea de prob standardizat: coninutul, administrarea i cotarea.
n funcie de coninut testele pot fi mprite n dou categorii:
1. dup sarcina i 2. dup modul de procesare
Dup sarcina cu care trebuie s se confrunte persoana examinat, testele
se pot mpri astfel:
a) teste verbale, care, la rndul lor, pot fi orale sau scrise (cele de tip creionhrtie);
b) teste nonverbale, care pot fi mprite n dou subcategorii: b1 cu
manipulare de aparate i piese; b2 administrate cu ajutorul calculatorului;
c) teste de performan (subiectului i se solicit s opereze la un aparat, s
completeze unele figuri lacunare sau s reproduc diferite imagini cu ajutorul
unor cuburi etc.).
Dup modul de procesare implicat (adic la ce i se cere persoanei s fac
pentru a da un rspuns), testele pot fi mprite n dou categorii:
a) teste intelective, care, la rndul lor, pot fi mprite n urmtoarele
subcategorii: a1 teste de performan; a2 teste de aptitudini; a3 teste de
cunotine; a4 teste situaionale;
b) teste nonintelective (chestionare/inventare de personalitate)
Criteriul administrarea testelor. Dup modul n care sunt administrate, ele
pot fi clasificate n termeni de eficacitate a examenului psihologic i n funcie
de unele exigene legate de timpul de examinare.
n funcie de eficacitate, testele pot fi mprite n dou grupe: a) teste
individuale; b) teste de grup sau colective;
n funcie de timp, testele pot fi grupate, de asemenea, n dou grupe,
respectiv: a) teste de vitez- cu limit de timp; b) teste de randament, care pot
fi: b1- cu limit de timp; b2 cu timp nelimitat.
Tot n raport cu criteriul administrare, putem mpri testele n dou grupe:
1. teste standardizate; 2. teste nestandardizate.
Criteriul cotarea testelor. Tehnica de cotare a unui test poate fi obiectiv
sau subiectiv. De aceea, testele pot fi clasificate n dou categorii: a) teste
obiective performana se apreciaz dup o procedur fix, impersonal, de
ctre un simplu operator sau cu ajutorul unei maini de cotare; b) teste
proiective (completare de fraze, pete de cerneal), cele care prezint n cotare o
doz mare de subiectivism.
44
NICOLAE MITROFAN
Teme de reflecie/autoevaluare
1. Care sunt criteriile folosite de H. Pitariu pentru clasificarea testelor ?
2. n ce msur aceste criterii sunt suficiente pentru clasificarea testelor ?
Care sunt elementele de asemnare i de diferen dintre clasificarea realizat de U.
chiopu i cea realizat de H. Pitariu ?
ntrebri de autoevaluare:
1. Ce criterii folosete U. Schiopu n clasificarea testelor psihologice ?
2. Cum sunt mprite testele n funcie de criteriul obiective urmrite ?
3. Ce criterii folosete H. Pitariu n clasificarea testelor psihologice ?
4. Dai un exemplu de test i ncercai s-l plasai n funcie de cerinele clasificrii
realizate de U. chiopu.
5. Dai un exemplu de test i ncercai s-l plasai n funcie de cerinele clasificrii
realizate de H. Pitariu.
45
NICOLAE MITROFAN
46
NICOLAE MITROFAN
47
NICOLAE MITROFAN
48
NICOLAE MITROFAN
concordante cu realitatea, cel care sufer este subiectul i nimeni nu are voie s se
joace cu soarta acestuia. n urma evalurii psihologice se poate determina dac
subiectul este apt sau nu pentru o anumit slujb, dac prezint un anumit nivel de
anormalitate psihic, dac este sau nu n posesia unor capaciti i aptitudini etc.
Dar n cazul n care diagnosticul este greit ce se ntmpl cu subiectul ? Haidei s
ne gndim ce se ntmpl cu un copil precolar care, n urma testrii psihologice,
este orientat ctre formele nvmntului special, dei, ulterior se poate constata c
acest copil prezint numai nite rmneri n urm pe linia dezvoltrii psihice, uor
recuperabile. Deci utilizarea testelor psihologice presupune mari rspunderi, de
ordin profesional, de ordin moral i chiar de ordin juridic.Aa se explic de ce au
existat i exist n continuare preocupri pentru elaborarea unor standarde i,
respectiv, a unor coduri deontologice.
n continuare noi vom face precizri mai ales n baza Codului deontologic
al Asociaiei Psihologilor Americani (APA), intitulat Ethical Principles of
Psychologists. (v. i Anastasi, A., 1996). i din acesta vom meniona n special
ceea ce ine de Tehnicile de msurare (Assessment Techiques). Vom lua n atenie
3 categorii de probleme:
a) legate de construcia i dezvoltarea testelor:
- cei care construiesc teste i le pun n circuit au obligaia de a evita graba i
superficialitatea lansndu-le n mod prematur pentru uzul general. Iar atunci cnd
un test este distribuit numai n scopuri de cercetare, aceast condiie trebuie
specificat foarte clar;
- manualul trebuie s ofere informaii ct mai complete i mai corecte asupra
testului, evitndu-se tendinele publicitare care s pun testul ntr-o lumin
favorabil;
- testele nu trebuie s fie publicate n ziare, magazine, cri populare, fie n scopuri
descriptive, fie n scop de autoevaluare;
- testarea prin pot sau telefonic este o practic contraindicat, deoarece, pe lng
alte riscuri, este contraindicat a se interpreta rezultatele la test n absena altor
informaii referitoare la subiectul examinat;
- cumprarea, procurarea testelor este accesibil n mod strict numai psihologilor
calificai. Fiecare catalog trebuie s cuprind, n mod obligatoriu, cerinele ce
trebuie ndeplinite de ctre solicitant sau cumprtor. De exemplu, un student care
are nevoie de un test particular pentru sarcini de nvare sau pentru cercetare
trebuie s prezinte o comand de cumprare contrasemnat de ctre profesorul lor,
care i asum responsabilitatea pentru corecta utilizare a testului.
b) legate de protecia subiectului; un factor deosebit de relevant l constituie
scopul urmrit de testarea psihologic, care poate fi: a) consilierea indivdual,
cunoaterea i autocunoaterea unor probleme i aspecte psihice individuale; b)
deciziile instituionale privind selecia i clasificarea subiecilor; c) cercetarea
psihologic. Este evident faptul c, n raport cu scopul urmrit, subiectul se
raporteaz diferit la testare i la examinator. Dac un subiect se prezint din proprie
iniiativ la un cabinet particular, solicitnd ajutor pentru anumite probleme psihice
cu care se confrunt, ei vor fi mult mai cooperani dect subiecii ce sunt solicitai
instituional s accepte aciunea de testare. Indiferent ns de scopul urmrit de
aciunea de testare, apare obligaia ca subiectul s fie informat (consimmntul
49
NICOLAE MITROFAN
50
NICOLAE MITROFAN
ntrebri de autoevaluare:
1. Enumerai cteva tipuri de preocupri existente la nivel internaional privind
elaborarea de standarde pentru testarea psihologic,
2. Ce credei c nseamn standarde ?
3. De ce se face diferenierea ntre 3 nivele de calificare pentru obinerea dreptului de a
aplica anumite teste ?
4. Care este explicaia faptului c se prognozeaz o cretere a preferinei practicienilor
pentru testele obiective (n special, testele de personalitate), n detrimentul testelor
proiective ?
5. Enumerai cteva cerine etice privind construcia i dezvoltarea testelor.
6. Enumerai cteva cerine privind protecia subiectului, a celui examinat.
7. Ce tipuri de coduri a elaborat Comisia de deontologie i disciplin a Consiliului
Psihologilor din Romnia ?
BIBLIOGRAFIE MINIMAL
ANASTASI, ANA. (1996). Psychological Testing (7th.ed.). New York: Macmillan.
COLEGIUL PSIHOLOGILOR DIN ROMNIA (2006), Acte normative. Ediie adugit.
MITROFAN, NICOLAE (2001), Psihometria i direciile ei de dezvoltare la nceput de
mileniu. n M. Zlate (coord.), Psihologia la rspntia mileniilor. Iai: Polirom.
CLINCIU, ION, AUREL (2005), Psihodiagnostic. Braov: Editura Universitii.
51
NICOLAE MITROFAN
52
NICOLAE MITROFAN
ceea ce msoar de fapt. Cea mai bun situaie este cea de tip a. Pentru a se menine n
aceast categorie, testul trebuie s rspund pozitiv la ntrebarea privind caracteristicile
sale psihometrice: Testul este fidel i valid?
Definiie: caracteristicile psihometrice sunt acele nsuiri ale testelor care asigur
un nalt grad de credibilitate rezultatelor obinute n urma utilizrii lor n activitatea
psihodiagnostic. Cele mai importante sunt fidelitatea i validitatea. i foarte important
este faptul c aceste nsuiri sunt msurabile i evaluabile. Dup cum o s vedem, ambele
caracteristici psihometrice pot fi msurate i exprimate n valori numerice: 0.50, 0.65 etc.
Pentru constructorii de teste apare obligaia de a include, n cadrul manualului,
informaii privind valoarea celor dou caracteristici psihometrice. i atunci este clar c, n
cazul n care avem de ales ntre dou teste care msoar acelai lucru (aceeai nsuire
psihic), dar care prezint valori diferite pentru cele dou caracteristici psihometrice, l
vom prefera pe cel care are valorile cele mai mari. Acesta este mult mai sigur n aciunea
de msurare psihologic. i, de aici, mai apare o obligaie pentru cei care construiesc teste
i anume, ei trebuie s acorde o mare atenie respectrii cerinelor privind cele dou
caracteristici psihometrice nc din fazele de nceput ale activitii de elaborare i de
construire a testelor. Realizai care sunt implicaiile a ce spunem asupra pieei
psihodiagnostice ? Fiind preferate testele care stau foarte bine la cerinele privind
fidelitatea i validitatea, cele care nu corespund vor iei imediat din competiie. i, ntradevr, n domeniul psihodiagnozei, mai ales a construirii de noi instrumente
psihodiagnostice, trebuie s existe o serioas competiie.
Tem de reflecie/autoevaluare:
ncercai s gsii ct mai multe exemple de situaii n care s-ar folosi teste
cu slabe caracteristici psihometrice i evideniai consecinele posibile.
1. 2. Fidelitatea i validitatea
Definiii: a) Fidelitatea nseamn gradul n care testul manifest constan n
msurare, adic dac el este capabil s ofere o aceeai informaie referitoare la subiectul
testat n cazul n care acesta este supus unei noi aciuni de testare folosind acelai test; b)
Validitatea se refer la capacitatea testului de a msura ntotdeauna ceea ce i-a propus s
msoare. Acum s explicm puin. n cazul fidelitii, dac un subiect a obinut, de
exemplu, ntr-o zi, n urma aplicrii unui test de inteligen, un Q.I. = 100 i, dup cteva
zile, n urma reaplicrii aceluiai test, ar obine un Q.I. = 70 ar nsemna c, n primul
moment el ar fi diagnosticat ca fiind normal, n ceea ce privete dezvoltarea
psihointelectual, iar n momentul 2, ar fi considerat a avea deficiene mentale. Cine ar
grei n acest caz ? Evident c testul folosit, care nu dovedete fidelitate. Realizai ce
consecine grave ar avea utilizarea unui asemenea test ? n limba englez se folosete
cuvntul reliability pentru a desemna fidelitatea testului, nsemnnd, mai ales, demn de
ncredere.
Pentru ambele caracteristici psihometrice se poate calcula valoarea unui coeficient,
de aceea, putem vorbi despre coeficientul de fidelitate (rtt) i coeficientul de validitate (rxy).
n cazul coeficientului de fidelitate, regsim dublat litera t, ceea ce nseamn c este
vorba de aplicarea n dou momente a aceluiai test (este vorba de un singur instrument),
iar n cazul coeficientului de validitate, avem dou litere, x i y, ceea ce nseamn c
sunt folosite dou instrumente de msur. Este vorba despre testul aplicat n momentul 1 i
53
NICOLAE MITROFAN
alt instrument de msurare folosit n momentul 2, care este, de regul, la mai mare distan
n timp folosit pentru a msura comportamentul anticipat n baza rezultatelor din
momentul 1.
Litera r nseamn coeficient de corelaie i, dei el poate fi calculat n mai multe
moduri, cea mai utilizat procedur este cea a lui Pearson (Pearson Product-Moment
Correlation Coefficient Coeficientul de corelaie moment-produs al lui Pearson). Se
folosete urmtoarea formul:
xy
rxy = ----------------N(SDx) (SDy)
n care: x = deviaia unei performane de la medie n proba x
y = deviaia peformanei (corespunztoare lui x) de la medie
n proba y
Revenind la conceptul de fidelitate, trebuie s menionm faptul c el a cunoscut
diverse accepiuni de-a lungul timpului. Astfel, ca s exemplificm, n Standardele APA
din anii 1954 i 1966, fidelitatea nsemna consistena sau stabilitatea (Fidelitatea se
refer la precizia consistena i stabilitatea msurrii realizate de test). n 1974,
fidelitatea era definit ca fiind gradul n care rezultatele testrii pot fi atribuite surselor
sistematice de varian. n Standardele de dup 1985, apare o nou schimbare n definirea
fidelitii, aceasta aprnd ca fiind gradul n care scorurile testului sunt consistente sau
repetabile, adic gradul n care ele sunt afectate de erorile de msur. Aadar, aa dup
cum precizeaz i prof. H. Pitariu, termenii de consisten i stabilitate continu s fie
utilizai, dar nu n sensul de consisten intern i stabilitate temporar a unui anumit
comportament, ci, mai degrab, ca reproductibilitate a rezultatelor cercetrii tiinifice.
Conceptul de fidelitate este utilizat pentru a acoperi mai multe aspecte ale
consistenei scorului (Anastasi, A., 1996). n primul rnd, fidelitatea indic msura n care
diferenele dintre subiecii testai, evideniate prin intermediul scorurilor obinute, se
datoreaz diferenelor reale (adevrate) privind nsuirea psihic msurat i msura n
care ele sunt atribuibile erorilor ansei. S explicm puin mai mult. n urma aplicrii
testului, se obine un anumit scor, numit scor brut (raw score), care poate fi exprimat
cifric. De exemplu, la un test de inteligen se obine scorul 120. n mod ideal, el ar trebui
s reflecte exact realitatea, ns niciodatr nu se ntmpl aa, deoarece, pe parcursul
activitii de testare pot interveni diveri factori care scap de sub controlul celui ce aplic
testul. De aceea, niciodat scorul brut nu coincide cu scorul real al subiectului. Nu
putem vorbi de utilizarea ecuaiei X = SR, X nsemnnd scorul brut iar SR, scorul real.
n realitate ntlnim situaia evideniat de urmtoarea ecuaie:
X = SR + E n care E = eroare
Plecnd de la aceast ecuaie, putem spune: cu ct eroarea este mai mic, cu att este
de ateptat mai mult ca scorul real s se apropie de scorul brut. Ce concluzie putem trage
de aici ? Trebuie luate toate msurile posibile pentru ca eroarea s fie ct mai mic. Orice
condiie, orice factor care este irelevant pentru scopul urmrit de un anumit test constituie
o surs pentru variana erorii. Astfel, cnd examinatorii ncearc s menin uniforme
condiiile testrii (respectnd ntocmai prevederile din cadrul manualului i controlnd
54
NICOLAE MITROFAN
factorii ambianei n care se face testarea), ei reduc variana erorii, ceea ce nseamn c fac
mult mai sigure scorurile obinute.
Apare, ns, o ntrebare: are examinatorul posibilitatea s controleze toi factorii care
pot interveni n timpul aciunii de testare, cptnd statutul de factor irelevant?
Rspunsul nu poate fi dect pozitiv, n practic existnd cel puin dou situaii: a) cnd
controlul asupra factorilor irelevani tinde ctre maximum, ceea ce nseamn c scorul real
se apropie pn la identitate de scorul brut; b) cnd controlul asupra factorilor irelevani
tinde ctre minimum, ceea ce nseamn c scorul real se ndeprteaz foarte mult de scorul
brut, eroarea n acest caz crescnd foarte mult.
Dar care sunt aceti factori irelevani care pot s intervin n aciunea de testare ? Unii
autori au ncercat s-i inventarieze. Astfel, de exemplu, fcnd o sintez a diferitelor
lucrri de specialitate, H. Pitariu ne ofer urmtorul tablou al surselor posibile de
variabilitate care pot afecta scorurile unui test.
I. Particulariti durabile i generale ale persoanei (cu influen asupra rezolvrii mai
multor teste:
A. Nivelul unor deprinderi care pot influena modul de a opera cu o serie de teste (de
exemplu, un rezolvitor de cuvinte ncruciate va fi avantajat n rezolvarea unor teste).
B. Deprinderile i tehnicile generale solicitate n testare (de exemplu, test de
excepie pentru profesioniti sau test pentru necunoscui).
C. Abilitatea general de a nelege instruciunile de lucru cu testele (de exemplu,
persoanele cu deficiene intelectuale vor nelege mai greu instruciunile de operare cu
testul, la fel cele neobinuite cu examinri prin teste).
II. Particulariti durabile dar specifice ale persoanei (cu influen numai asupra unui test
anume):
A. Specifice fa de testul luat ca ntreg
1. Nivelul individual de dezvoltare a abilitii msurate de acest test i care nu
influeneaz rezolvarea altor teste (de exemplu, o persoan dominant va obine scoruri
mari la scala de Dominan din cadrul testului CPI, dar nu i la scala de
Responsabilitate.
2. Cunotine i deprinderi specifice formei particulare a testului. De exemplu,
un programator va fi mai performant pe un test care solicit rezolvarea de scheme logice
lacunare; sau, un ceasornicar va avea rezultate mai bune la un test de dexteritate digital
care solicit operarea cu obiecte mici);
3. Pattern-uri de rspuns stabile (de exemplu, la un test cu rspunsuri
Adevrat/Fals, tendina de a alege opiunea Adevrat n toate situaiile de indecizie).
B. Specifice anumitor itemi ai testului:
1. ansa unei persoane n a cunoate rspunsul la un anumit fapt particular
cerut de un item (de exemplu, la un test de cunotine tehnice, un item poate solicita o
informaie pe care o cunosc doar subiecii care au citit o anumit lucrare).
2. Tipuri de itemi cu care diferii subieci sunt familiarizai inegal (de
exemplu, existena unor itemi cu rspuns la alegere i poate ncurca pe cei nefamiliarizai
cu stilul respectiv de lucru.
III. Particulariti temporare, dar generale ale persoanei (este vorba de existena unor
factori incidentali care pot afecta performanele n momentul n care este administrat testul
n cauz: a) sntatea; b) oboseala; c) motivaia; d) tensiunea emoional; e) nivelul prea
55
NICOLAE MITROFAN
56
NICOLAE MITROFAN
ntrebri de autoevaluare:
1. Ce sunt caracteristicile psihometrice ale testelor ?
2. Ce obligaii au constructorii de teste n raport cu ele ?
3. Ce este fidelitatea testului ?
4. Ce este validitatea testului ?
5. Care sunt elementele de asemnare i de deosebire dintre fidelitate i validitate ?
6. Ce este scorul brut i ce este scorul real al subiectului ?
7. Ce este variana erorii n msurare?
8. Ce pericole prezint variana erorii ?
9. Ce trebuie fcut pentru reducerea varianei erorii ?
10. Enumerai ct mai muli factori irelevani ce pot interveni n aciunea de testare.
11. Ce trebuie fcut pentru ca s reducem ct mai mult din aciunea acestor factori irelevani ?
12. Ce putem spune despre controlul pe care trebuie s-l asigure cel ce aplic testul asupra factorilor
irelevani ?
BIBLIOGRAFIE MINIMAL
ALBU, MONICA, PITARIU, HORIA (1993), Proiectarea testelor de cunotine i examenul asistat de
calculator. Cluj-Napoca: Casa crii de tiin.
ANASTASI, ANNE (1996), Psychological Testing (7th edition). New-York: Mcmillan.
CLINCIU, ION, AUREL (2005), Psihodiagnostic. Braov: Editura Universitii Transilvania.
STAN, AUREL (2002), Testul psihologic. Evoluie, construcie, aplicaie. Iai: Polirom.
HORGHIDAN, VALENTINA (1998), Metode de psihodiagnostic. Bucureti: Editura didactic i
pedagogic.
57
NICOLAE MITROFAN
Unitatea de nvare 2
Fidelitatea testului
Cuprins:
2.1. Proceduri de calculare a fidelitii testelor
2.2. Eroarea standard a msurrii
Obiective:
La sfritul acestei uniti de nvare, studenii vor fi
capabili s:
cunoasc tipurile de fidelitate
cunoasc procedurile de calcul a fidelitii
interpreteze exact ce nseamn eroarea standard a
msurrii
dea exemple din practic
58
NICOLAE MITROFAN
personale diferite, stri de dispoziie diferite etc). Deci, variana erorii corespunde
fluctuaiilor ntmpltoare ale performanei de la o testare la alta.
Cnd intervalul de timp este scurt sau foarte scurt (de ordinul zilelor, de exemplu) se
poate ntmpla ca subiecii s fie puternic influenai de ceea ce nseamn recunoaterea
principiului de construcie a testului. S lum, mai nti, cteva cazuri simple, pentru a
nelege mai bine:
Exemplul 1. Itemul testului apare n forma urmtoare:
A
R
P
duc
un
L
D
?
Sarcina subiectului este de a spune ce liter trebuie pus n locul semnului de
ntrebare. Voi ce prere avei ?
Exemplul 2. Itemul testului apare n forma urmtoare:
COCOLO
BALAMA
VIINE
PEPENE
mas
cobai
praline
oaie
Sarcina subiectului este de a stabili cu care dintre cuvintele scrise cu litere mici se
asociaz cuvintele scrise cu litere mari.
Exemplul 3. Itemul testului apare n forma urmtoare:
LONDRA este oraul n care se gssesc 6 teatre, 4 stadioane i 24 de cinematografe
MOSCOVA este oraul n care se gsesc 3 stadioane, 21 de cinematografe i 7
teatre
PARIS, capitala Franei, este oraul n care se gsesc 25 de cinematografe, 5 teatre
i 5 stadioane
Sarcina subiectului: cte teatre are oraul ROMA ?
Vom comenta acest ultim exemplu, lsndu-v bucuria de a descoperi singuri care
este rspunsul la primele dou cazuri. Principiul de construcie al itemului const n
asocierea dintre numrul de litere ce-l regsim n denumirea oraului i numrul de teatre.
LONDRA are 6 teatre, pentru c are ase litere, MOSCOVA are 7 teatre, pentru c are 7
litere i Paris are 5 teatre, pentru c are 5 litere. Deci, ROMA are 4 teatre, deoarece are 4
litere. Celelalte elemente din structura itemului (numrul de stadioane i de cinematografe)
sunt introduce pentru a face sarcina puin mai dificil pentru subiect.
Acum ne dm seama ct de mult ar fi ajutat subiectul, cunoscnd principiul de
construcie al testului, dac el ar trebui s fie reexaminat cu acelai instrument la un
interval de timp scurt.
59
NICOLAE MITROFAN
Pe de alt parte, n cazul n care intervalul de timp este foarte mare, este greu de
ignorat impactul pe care l are asupra subiectului experiena lui personal (noi achiziii n
plan informaional-cognitiv, n plan comportamental etc.).
n practica psihodiagnostic s-au conturat deja un fel de reguli sau recomandri i
anume: - n general, pentru orice tip de persoan intervalul dintre cele dou momente de
testare (test-retest) nu trebuie s depeasc, dect foarte rar, 6 luni; - pentru copiii mici i
foarte mici, datorit schimbrilor accentuate ca urmare a dezvoltrii progresive, intervalul
dintre cele dou momente ale testrii poate i trebuie s fie mai scurt dect n cazul
adulilor.
Dei aceast procedur de calculare a fidelitii este foarte mult folosit, exist,
totui, recomandarea ca s se apeleze la ea, mai ales n cazul testelor care nu pot fi afectate
de repetiie. n asemenea categorie ar intra unele teste de discriminare senzorial i unele
teste psihomotorii (Anastasi, A., 1996).
b) fidelitatea form alternant. n mod practic se procedeaz n felul urmtor: se
aplic pe un grup de subieci un test i, apoi, dup un anumit interval de timp, care poate fi
mai scurt sau mai lung, se aplic, pe acelai grup, un alt test dar care este obligatoriu
echivalent cu primul. n final, se calculeaz valoarea coeficientului de fidelitate, respectiv,
rtt. n cazul n care forma alternant a testului se aplic imediat dup ce s-a aplicat prima
variant a lui, vorbim de fidelitate form alternant imediat iar, n cazul n care intervalul
de timp este mai mare, vorbim de fidelitate form alternant ntrziat. n primul caz, sursa
varianei erorii o constituie eantionarea coninutului i, n al doilea caz, sursa varianei
erorii o constituie eantionarea coninutului dar i eantionarea timpului.
n cadrul manualului testului trebuie s fie incluse, n mod obligatoriu, informaii
privind lungimea intervalului de timp dintre cele dou momente de administrare i, n
cazul n care acest interval este mai mare, informaii privind tipurile de experiene cu care
s-au confruntat subiecii.
Dar cea mai important problem pe care o ridic folosirea acestei proceduri se
refer la modul n care se asigur ca cele dou variante ale testului s fie identice, deci se
pune problema asemnrilor i deosebirilor. n practic este destul de dificil de realizat
acest lucru, dar nu este imposibil, dovad c exist asemenea cazuri. Principala deosebire
const n faptul c ele nu seamn atunci cnd sunt puse n faa subiecilor. Sunt alte
figuri, alte exerciii, alte ntrebri etc. Asemnrile ns sunt mai multe i ele se refer la: obiectivul urmrit n aciunea de msurare este acelai; - privitor la coninut, exist un
numr egal de itemi; - acelai tip de instructaj, acelai format al testului; - egalitate n ceea
ce privete nivelul de dificultate al itemilor
c) fidelitatea half-split, sau fidelitatea bazat pe divizarea testului n dou jumti.
Din punct de vedere tehnic, testul este mprit n dou, cele dou jumti devenind un fel
de teste independente, se aplic pe un grup de subieci i apoi se calculeaz valoarea
coeficientului de fidelitate (rtt). Dar cum realizm cele dou jumti? Vom oferi dou
modaliti: 1) mprirea pur i simplu a testului n dou pri, fiecare coninnd un numr
egal de itemi. De exemplu, dac testul ntreg are 100 de itemi, cele dou jumti vor avea
cte 50 de itemi. Se aplic testul pe grupul de subieci i, apoi, se calcueaz coeficientul de
corelaie (respectiv, coeficientul de fidelitate) dintre cele dou serii de rezultate. Sunt ns
unele teste pentru care aceast modalitate nu poate fi aplicat. Astfel, dac testul este
construit pe principiul introducerii itemilor de la uor la greu, atunci prima jumtate va fi
foarte uoar i cealalt jumtate va fi foarte grea. Sau, dac testul este foarte lung, are un
60
NICOLAE MITROFAN
numr mare de itemi, la aplicarea celei de-a doua jumti va interveni n mod sigur
oboseala;
2) o procedur mai adecvat presupune mprirea testului n dou jumti, plecnd de la
numrul de ordine al itemilor. n prima jumtate sunt reinui itemii cu so (2,4,6,8
.a.m.d.) i n a doua jumtate, itemii cu so (1,3,5,7 .a.m.d.). Astfel, sunt mai multe anse
ca cele dou jumti s fie echivalente. Desigur, o semenea procedur nu se poate aplica
n cazul n care mai muli itemi se refer la o aceeai problem, cum ar fi cazul unei
situaii problematice.
Dar indiferent de ce procedur folosim, valoarea coeficientului de corelaie vizeaz
fidelitatea doar a unei jumti de test, or, pe noi ne intereseaz fidelitatea pentru ntregul
test. O prim tentaie ar fi aceea de a dubla, pur i simplu, valoarea coeficientului de
fidelitate. Dac am proceda aa, am ajunge la rezultate stranii. Gndii-v, de exemplu,
dac valoarea lui rtt pentru jumtate de test ar fi 0,65, dublnd am ajunge la o valoare egal
cu 1,30. Poate avea coeficientul de corelaie o asemenea valoare ? V-am rugat s v
ntoarcei la ce ai studiat la Statistic.
n realitate se aplic formula lui Spearman-Brown (Anastasi, A., 1988, 1996):
2rhh
rtt = ------------n care: rtt = coeficientul de fidelitate
1 + rhh
rhh = corelaia privind jumtatea de test
S lum un exemplu: dac rhh = 0,50, aplicm formula i vom vedea care este valoarea
coeficientului de fidelitate pentru ntregul test:
2 x (0,50)
1
rtt = ------------- = ------ = 0,66
1 + (0,50)
1,5
Acum voi trebuie s facei cteva exerciii i s vedei ce se ntmpl cu valoarea
coeficientului de fidelitate, cnd crete sau scade valoarea coeficientului de fidelitate
pentru jumtate de test: 1. rhh = 0,30; rhh = 0,80; rhh = 0,99.
Efectul pe care creterea sau scderea numrului de itemi ai testului l are asupra valorii
coeficientului de fidelitate poate fi calculat cu ajutorul altei formule Spearman-Brown:
nrtt
rnn = -------------n care: rnn = coeficientul estimat
rtt = coeficientul de corelaie obinut
1 + (n-1) rtt
n = numrul ce exprim de cte ori
crete sau descrete dimensiunea testului
S lum un exemplu: dac dorim ca numrul itemilor unui test, al crui coeficient de
fidelitate are valoarea 0,50, s creasc de la 25 la 100, deci s creasc de 4 ori, aplicm
formula:
rnn
4 x (0,50)
= --------------------- =
1 + (3 x 0,50)
2
--- = 0,80
2,5
61
NICOLAE MITROFAN
Deci, putem uor constata c, n cazul n care mrim dimensiunile unui test, valoarea
coeficientului de fidelitate crete. i, de aici, o concluzie foarte important pentru practic:
cu ct numrul itemilor unui test este mai mare, cu att nivelul de credibilitate acordat
informaiilor obinute cu ajutorul lui va crete. Am putea folosi o comparaie: dac am
asemna itemii cu ochii, cu ct sunt mai muli ochi cu att va fi vzut mai bine o
anumit realitate.
Pentru a vedea dac se confirm ceea ce spunem, ncercai s facei i voi unele
exerciii i anume: care este valoarea lui rnn dac: 1. dorim s micorm dimensiunile unui
test (rtt = 0,50) de 2 ori; 2. dorim s micorm dimensiunile unui test (rtt = 0,50) de 5 ori
i de 10 ori.
Se poate pune problema i aa: cunoatem valoarea actual a coeficientului de
fidelitate a unui test (care, normal, are un numr determinat de itemi) i dorim ca aceast
valoare s fie mbuntit, adic s ating o anumit valoare; avem nevoie s tim care va
trebui s fie numrul itemilor pentru testul modificat. n acest caz, aplicm formula
profeiei Spearman-Brown:
rttd (1 rtto)
N = -------------------- n care: rtto = coef. de fidelitate observat
rtto (1 rttd)
rttd = coef. de fidelitate dorit
N = de cte ori va crete numrul itemilor
S lum un exemplu: un test are 20 de itemi i rtto = 0,87; dac dorim ca rttd s aib
valoarea 0,95, pn la ce nivel trebuie s creasc numrul itemilor ? Aplicm formula:
0,95 (1 0,87)
N = ------------------- = 2,82 Apoi, 20 x 2,82 = 56,4, rotunjit, 56
0,87 (1 0,95)
Deci, pentru ca valoarea coeficientului de fidelitate s ating nivelul de 0,95, numrul
itemilor testului trebuie s ating nivelul de 56.
Dar de ce este important ca valoarea fidelitii testului s fie ct mai mare ? Desigur,
cazul ideal este ca valoarea lui rtt s fie egal cu +1,00. n realitate nu gsim asemenea
cazuri, valoarea lui rtt fiind mai aproape sau mai departe de aceast valoare ideal. Testele
existente n practic au valori diferite ale fidelitii, ridicndu-se problema seleciei lor n
funcie de ce obiective urmrim s atingem folosind rezultatele obinute. n acest sens, unii
autori fac urmtoarele recomandri (Kaplan, R., Saccuzzo, D., 1993): a) pentru cele mai
multe din scopurile de cercetare, valoarea acceptat a fidelitii testelor folosite este de
minimum 0,70; b) cnd testul este folosit pentru a lua o decizie important n legtur cu o
persoan, rtt trebuie s aib o valoare mai mare de 0,95; c) n alte scopuri de testare,
valoarea acceptat a fidelitii este de minimum 0,90.
d) fidelitatea Kuder-Richardson. Aceast procedur este aplicabil mai ales pentru
testele ale cror itemi sunt prevzui cu un sistem de rspuns de tip tot sau nimic. Este
vorba de variantele disjunctive, de genul: Da Nu, Adevrat-Fals etc. Ceea ce este
specific pentru aceast procedur este faptul c ea este bazat pe performana la fiecare
item. Formula care se aplic este urmtoarea:
n
SDt2 - pq
rtt = -------- x ------------------ , n care.
62
NICOLAE MITROFAN
SDt2
(n 1)
A
B
C
D
E
D
D
D
N
N
D
N
N
D
D
D
N
N
N
N
D
D
D
N
N
N
N
N
N
D
D
D
N
N
D
0,6
0,4
0,24
0,6
0,4
0,24
0,2
0,8
0,16
0,6
0,4
0,24
0,2
0,8
0,16
0,6
0,4
0,24
p=
q =
pq =
Scor
total
5
3
2
1
3
(p)(q) = 1,28
63
NICOLAE MITROFAN
Scor total
Sub. 1
19
Sub. 2
17
Sub. 3
13
Sub. 4
20
Sub. 5
15
Sub. 6
13
Deci, din punct de vedere practic, aceast procedur presupune gsirea varianei la
scorurile subiecilor pentru fiecare item, apoi se face suma, ajungndu-se la (SDi)2. S
lum i noi un exemplu practic (Friedenberg, L., 1995): unui grup de 6 elevi i s-a aplicat
un test, tip eseu, alctuit din 5 ntrebri. La fiecare dintre ntrebri scorul maxim era de 5
puncte.
SDi2 = .4722 .6667 .4722 .2222 .5833
( X = 16.1667; SD2 = 7.4722; SD = 2.7335; n = 5; N = 6)
Aplicm formula de mai sus:
5
.4722 + .6667 + 4722 + .2222 + .5833
= -- ( 1 - ----------------------------------------------) =
4
7.4722
2.4166
= (1.25) ( 1 - --------- ) = 1.25) (1 - .3234) = .84575 = .85
7.4722
f) fidelitatea legat de persoana celui care aplic testul. Din punct de vedere practic,
dup ce se aplic un test, mai muli examinatori sunt pui s coteze rezultatele. Apoi se
aplic procedurile uzuale de calculare a coeficientului de corelaie i ceea ce rezult este
64
NICOLAE MITROFAN
valoarea fidelitii examinatorului. Desigur, este vorba, mai ales, de acele teste care intr
n categoria testelor subiective (v mai amintii de clasificarea testelor n teste obiective i
teste subiective ?) i, mai exact este vorba de testele proiective, la care diferenele dintre
modul de cotare a acelorai rezultate de ctre mai muli examinatori pot fi destul de mari.
Iar dac, pentru un anumit test, se calculeaz valoarea acestui tip de coeficient de
fidelitate, acest gen de informaie trebuie s fie inclus n cadrul manualului testului.
Dup ce am trecut n revist mai multe forme ale fidelitii, s vedem, sintetic, care
sunt sursele specifice ale varianei erorii pentru ele (Anastasi, A.,1988, 1996).
Nr.
crt.
1
2
3
4
5
6
Fidelitate test-retest
Fidelitate form alternant (imediat)
Fidelitate form alternant (la un
interval de timp
Fidelitate half-split
Kuder-Richardson i Coeficientul
Alpha
Fidelitate legat de examinatori
- eantionarea timpului
- eantionarea coninutului
- eantionarea timpului i
coninutului
- eantionarea coninutului
eantionarea
coninutului
eterogenitatea coninutului
- diferenele dintre examinatori
a
i
Aa dup cum am mai precizat, valoarea coeficientului de fidelitate arat care este
procentul din variana scorurilor la test ce depinde de variana real legat de trstura
supus msurrii. De exemplu, dac rtt are valoarea 0,75, asta nseamn c 75% reprezint
variana real i 25%, variana erorii.
Tema de reflecie/autoevaluare
Vi s-au recomandat s facei cteva exerciii. Ce ai putut constata n
urma efecturii lor ?
2.2. Eroarea standard a msurrii.
Este o alt form de msurare a fidelitii, dar care este folosit pentru a interpreta
scorurile individuale. De aceea, mai este denumit i eroarea standard a scorului. Ca
formul de calcul este folosit urmtoarea:
n care: SDt = deviaia standard a scorurilor
SEM = SDt 1 rtt
testului
rtt = coeficientul de fidelitate
De exemplu, dac vom cunoate valoarea deviaiei standard, precum i a
coeficientului de fidelitate, putem calcula uor valoarea lui SEM. Astfel, dac SDt = 10 i
rtt = 0,80, valoarea lui SEM va fi 5. De regul, constructorul de test se ocup i de aceast
problem iar valoarea obinut a lui SEM este inclus n cadrul manualului. Pe noi ne
intereseaz mai mult s vedem ce reprezint aceast valoare i la ce ne folosete. Dup
cum am mai afirmat, scorul obinut de un subiect la un test (scor observat), cuprinde scorul
real (raw score) i eroarea. Un test este cu att mai valoros cu ct eroarea este mai mic.
Datorit erorii, n cazul n care reaplicm testul pe un subiect, scorul va varia, va fi mai
mare sau mai mic i ct de mult poate varia ne spune valoarea lui SEM.
65
NICOLAE MITROFAN
ntrebri de autoevaluare:
1.
2.
3.
4.
5.
6.
66
NICOLAE MITROFAN
10. Care sunt sursele varianei erorii pentru dintre procedurile de calcul a fidelitii ?
11. Ce reprezint eroarea standard a msurrii (SEM) ?
12. La ce ne ajut cunoaterea valorii lui SEM ?
13. Dai exemple privind utilizarea valorii lui SEM
BIBLIOGRAFIE MINIMAL
1. MINULESCU, M. (2003), Teorie i practic n psihodiagnoz. Bucureti: Editura
Fundaiei Romnia de mine.
2. STAN, A. (2002), Testul psihologic. Evoluie, construcie, aplicaii. Iai: Polirom.
3. CLINCIU, AUREL, ION (2005), Psihodiagnostic. Braov: Editura Universitii
Transilvania.
4. KAPLAN, M. ROBERT (2005), Psychological Testing. Principles, Applications,
And Issues. Wadsworth: Thompson.
5. FRIEDENBERG, L. (1995), Psychological Testing. Desigh, Analysis, and Use.
Allyn & Bacon.
67
NICOLAE MITROFAN
Unitatea de nvare 3
Validitatea testului
Cuprins
1. Validitatea de coninut
2. Validitatea de criteriu
3. Validitatea de construct
Obiective:
La sfritul acestei uniti de nvare, studenii vor fi capabili
s:
1. Validitatea de coninut.
Se refer mai ales la categoria testelor de achiziie. Spunem c un test are validitate de
coninut, dac el msoar ceea ce i-a propus s msoare i dac elementele sale de coninut
(itemii) sunt expresia unui eantion reprezentativ pentru un anumit univers de itemi sau univers
de sarcini. S ne explicm mai mult. S ne amintim de zilele cnd aveam de dat tez la o
anumit disciplin. Pentru aceasta trebuia s citim (si s retinem !!!) 50 de pagini. Un elev s-a
prezentat la tez cunoscnd 45 de pagini iar altul doar 5 pagini, respectiv, cele pe care nu le
citise primul. La tez s-au dat subiecte din cele 5 pagini. Primul elev nu a luat not de trecere iar
al doilea a luat o not mare. Dac aceast modalitate o asemnm cu un test de cunotine, este
clar c el nu are validitate de coninut. Subiectele au fost extrase la ntmplare iar norocul l-a
favorizat pe al doilea elev. Nota obinut de cei doi elevi nu reflect nivelul de achiziionare real
al celor doi elevi. Dac testul ar fi fost alctuit inndu-se seama i de cerinele validitii de
coninut, el ar fi trebuit s cuprind itemi referitor la ntreaga materie iar rspunsul dat de cei doi
elevi ar fi reflectat corect nivelul de achiziionare a cunotinelor.
Iat, aadar, c este extrem de important ca, atunci cnd construim un test de cunotine, s-i
asigurm validitatea de coninut. Aceasta nseamn mai multe aspecte. n primul rnd, cei care
fac o evaluare a programului educaional trebuie s fie experi n domeniu. Numai acetia au
competena de a analiza i de a evalua elementele de coninut, formulnd un anumit univers de
itemi. Acetia vor fi diferii n funcie de gradul de dificultate i, mai ales, n funcie de categoria
de care aparin. Unii se pot referi la cunotine factuale, alii se pot referi ca cunoaterea unor
principii, alii, la capacitatea de nelegere i de interpretare, alii, la capacitatea de evaluare etc.
Deci, mai ntotdeauna se pleac de la obiectivele urmrite de ctre programul educaional.
Acestea pot fi de natur informaional (elevul va cunoate, va ti....) i de natur operaional
(elevul va avea capacitatea de a face ceva....). n structura testului vom gsi itemi care vor
evalua achiziiile realizate pe cele dou direcii.
68
NICOLAE MITROFAN
69
NICOLAE MITROFAN
2. Validitatea de criteriu
Cnd am discutat despre funciile psihodiagnozei am artat c una dintre cele mai
importante este cea prognostic, adic n baza rezultatelor la test putem s facem predicii
privind conduita pe care o va adopta subiectul ntr-o activitate sau situaie viitoare.
Rezultatele obinute de ctre subiec la test poart numele de predictori iar rezultatele
(performanele) obinute n cadrul activitii (situaiei) n raport cu care s-au fcut prediciile
poart numele de criteriu. Deci, aici este vorba despre dou mijloace de msurare, respectiv,
testul, n baza cruia facem prediciile i criteriul, respectiv, mijlocul de msurare direct i
independent a ceea ce a anticipat sau a prognosticat testul. Deci testul poate s anticipe
corect conduita subiectului sau, dimpotriv, nu poate face acest lucru. Puterea lui de
anticipare sau de predicie depinde de validitatea sa de criteriu, exprimat de coeficientul de
validitate (rxy). Cu ct valoarea acestuia este mai mare, cu att devine mai sigur predicia
privind comportamentul viitor al subiectului. Desigur, un test poate fi validat printr-un
singur criteriu sau prin mai multe criterii.
Legat de intervalul de timp dintre cele dou momente de msurare (test i criteriu),
acesta poate fi mai mare sau, dimpotriv, mai mic, uneori att de mic nct msurarea
criteriului se poate face n acelai timp cu msurarea fcut cu ajutorul testului. n
consecin, putem diferenia dou forme de validitate, respectiv, validitate concurent i
validitate predictiv. n cazul validitii concurente, dei aplicm un anumit test cu care
msurm o anumit capacitate psihic (de exemplu, inteligena), rezultatele la criteriu le
avem deja la ndemn, cum este cazul rezultatelor colare. n asemenea situaii validitatea
concurent apare ca un substitut al validitii predictive, ea viznd n special statutul existent
al subiecilor. Avnd la ndemn informaiile privind rezultatele la test exist pericolul
influenrii celor care sunt implicai n evaluarea legat de criteriu. Acest fenomen este
cunoscut sub numele de contaminare a criteriului. De exmplu, un cadru didactic, dac ar
cunoate rezultatele la teste ar manifesta tendina (este real acest pericol !!!) de a evalua la
criteriu (cum este cazul unui test de cunotine) n funcie de aceste rezultate. De aici se
desprinde concluzia clar c este bine ca cei ce evalueaz la criteriu s nu aib acest la
rezultatele la teste.
Printre cele mai cunoscute criterii ce sunt utilizate n practica psihodiagnostic sunt
urmtoarele (Anastasi, A., 1988, 1996):
1) Achiziiile academice, evideniate prin note, medii, evidenieri speciale, rezultate la
concursuri, promovri, graduri, recompense, burse etc., sunt foarte frecvent folosite pentru
validarea testelor de inteligen. De aceea, mai muli autori au considerat aceste teste ca
fiind modaliti de msurare a aptitudinilor colare. De asemenea, achiziiile academice sunt
folosite i pentru validarea testelor de msurare a personalitii i a testelor pentru msurarea
aptitudinilor multiple;
2) Performana n cadrul unui domeniu de formare specializat este folosit n calitate de
criteriu pentru validarea unor teste folosite pentru msurarea aptitudinilor speciale. Pot fi
date ca exemple: - achiziiile finale n cadrul cursurilor de formare profesional special sunt
folosite pentru validarea testelor ce msoar aptitudinile tehnice; - performana n anumite
ramuri artistice pot fi folosite n vederea validrii testelor pentru msurarea aptitudinilor
artistice;
3) Performana muncii (job performance) apare n calitate de criteriu folosit pentru
validarea, n primul rnd, a testelor pentru aptitudini speciale. Totodat, ea este utilizat, dar
70
NICOLAE MITROFAN
71
NICOLAE MITROFAN
2. Alegerea, mai ales pentru dezvoltarea unor teste, a acelora care apar adaptate pentru
constructele indicate la a i b;
3. Formularea unei serii de ipoteze care se refer la msurarea constructelor corespunztoare
(tipul a se refer la validitatea convergent, tipul b la cea discriminant, iar tipul c la
validarea criteriului;
4. Verificarea sau falsificarea, respectiv modificarea ipotezelor anterioare, pe baza cercetrii.
Printre modalitile de evideniere a validitii constructului menionm urmtoarele:
1. Diferenierea vrstei, criteriu folosit pentru validarea mai ales a testelor de inteligen. De
exemplu, n cazul bateriei Stanford-Binet, este folosit vrsta cronologic pentru a se
evidenia dac scorurile obinute arat o cretere progresiv odat cu creterea nvrst a
subiectului;
2. Corelaiile cu alte teste similare anterioare, care msoar acelai tip de comportament. Un
test nou de inteligen nou este declarat valid dac el coreleaz cu un alt test de inteligen a
crui validitate a fost deja verificat;
3. Analiza factorial, ce ne apare n calitate de tehnic statistic rafinat pentru analizarea
interrelaiilor datelor comportamentale. Scopul major al analizei factoriale este de a
simplifica descrierea comportamentului supus msurrii, reducnd numrul mare de
variabile luate n atenie la civa factori sau trsturi comune.
4. Analiza consistenei interne, folosit mai ales pentru categoria testelor de personalitate, n
raport cu care criteriul nu este altceva dect scorul total al testului nsui.
5. Matrice multi-trsturi - multi-metode (multi-trait - multimethod matrix).
Aceast ultim modalitate o vom detalia mai mult, pentru c ea este prezentat
practic n toate tratatele de psihodiagnostic (Anastasi, A., 1988, 1996) i pentru c este una
dintre cele mai utile. Este vorba despre un proiect experimental propus de ctre Campbell i
Fiske (1959). Ei difereniaz dou tipuri de validitate, respectiv, validitatea convergent i
validitatea discriminatorie. Validitatea convergent se refer la faptul c un test coreleaz la
nivel nalt cu alte variabile cu care teoretic trebuie s coreleze. De exemplu, rezultatele unui
elev la un test pentru msurarea aptitudinilor matematice coreleaz cu rezultatele sale
colare la matematic (validitate convergent). Pe de alt parte, este de ateptat ca
performanele la acelai test s nu coreleze cu rezultatele lui colare la literatur (validitate
discriminatorie).
Revenind la proiectul experimental propus de Campbell i Fiske, menionm c
procedura folosit solicit msurarea a dou sau mai multe trsturi prin dou sau mai multe
metode. Concret, n proiectul lor: - cele trei trsturi sunt trsturi de personalitate,
respectiv: A (dominana); B (sociabilitatea); C (motivaia achiziionrii); - cele trei metode
sunt: 1) inventar de personalitate; 2) test proiectiv; 3) clasificarea n perechi. Pot rezulta
urmtoarele combinaii posibile:
A1, A2, A3 = dominana la testele 1, 2, 3;
B1, B2, B3 = sociabilitatea la testele 1, 2, 3;
C1, C2, C3 = motivaia achiziionrii la testele 1, 2, 3.
Se alctuiete un table cu dubl intrare, n cadrul cruia regsim urmtoarele tipuri
de informaii:
- valoarea coeficienilor de fidelitate;
- valoarea coeficienilor de validitate, rezultai n urma corelrii scorurilor obinute pentru
aceeai trstur prin diferite metode;
- corelaiile dintre diferite trsturi msurate cu aceeai metod;
72
NICOLAE MITROFAN
ntrebri de autoevaluare:
1. De ce validitatea de coninut nu este valabil pentru testele de personalitate i testele de aptitudini ?
2. n afar de testele de cunotine pentru ce categorii de teste mai este valabil validitatea de coninut ?
3. Ce cuprind specificaiile testului ?
4. La ce ne ajut formula lui Lawshe ?
5. Care este specificul validitii de criteriu ?
6. Care este deosebirea dintre predictori i criteriu ?
7. Prin ce se deosebete validitatea concurent de validitatea predictiv ?
8. n ce const fenomenul de contaminare a criteriului i cum poate fi el contracarat ?
9. Care sunt cele mai cunoscute criterii utilizate n practica psihodiagnostic ?
10. n ce const validitatea privitoare la construct ?
11. Care este poziia diferiilor autori privind etapele parcurse pentru evidenierea validitii de construct
?
12. Care sunt principalele modaliti de evideniere a validitii de construct ?
13. Prin ce se deosebete validitatea convergent de validitatea discriminatorie ?
14. n ce const i la ce folosete proiectul experimental propus de ctre Campbell i Fiske ?
15. Ce putem spune despre valoarea coeficientului de validitate ?
73
NICOLAE MITROFAN
16. De ce ntotdeauna valoarea coeficientului de validitate este mai mic dect valoarea coeficientului
de fidelitate ?
BIBLIOGRAFIE MINIMAL
1. ANASTASI, A. (1988, 1996). Psychological testing. New York: Macmillan.
2. COHEN, R.J., SWERDLIK, M.E. (2005). Psychological Testing and Assessment. An
Introduction to Tests and Assessment. McGraw-Hill
International Edition.
2. CLINCIU, A.I. (2005). Psihodiagnostic. Braov: Editura Universitii Transilvania.
3. MINULESCU, M. (2003). Teorie i practic n psihodiagnosz. Bucureti: Editura
Fundaiei Romnia de Mine.
4. STAN, A. (2002). Testul psihologic. Evoluie, construcie, aplicaie. Iai: Polirom.
74
NICOLAE MITROFAN
Unitatea de nvare 4
Testul psihologic i selecia profesional
Cuprins:
1. Eroarea standard a estimrii
2. Criterii de selectare a testelor
3. Locul i rolul testului n selecia profesional
Obiective:
La sfritul acestei uniti de nvare, studenii vor fi capabili
s:
1.
75
NICOLAE MITROFAN
Cunosc\nd valoarea lui SEE noi putem s anticipm ntre ce limite se va ncadra
scorul subiectului prognozat la criteriu. S presupunem c scorul prognozat este 100. Dac
reaplicm testul de 100 de ori, scorul prognozat va oscila n jurul scorului egal cu 100,
respectiv, jumtate dintre ele vor fi mai mari i jumtate vor fi mai mici. Apelnd la curba
lui Gauss, vom fi pui n faa unei distribuii normale, avnd media = 100. SEE va
reprezenta deviaia standard a acestei distribuii. Drept urmare: 34% din scorurile subiectului
vor cdea ntre 100 i + 1 SEE (nsemnnd media i plus o deviaie standard) i alte 34%
din scoruri vor cdea ntre 100 i - 1 SEE (nsemnnd media i minus o deviaie standard).
Luate mpreun, 68% din scorurile subiectului vor cdea n intervalul definit de 100 1
SEE. Deci, dac valoarea lui SEE ar fi 10, noi putem fi siguri c, n caz de reaplicare a
testului n vederea anticiprii scorului la criteriu, acesta din urm va cdea n intervalul 90 i
110, la un nivel de ncredere de 68%. La un nivel de ncredere de 95%, scorul prognozat ar
cdea n intervalul 100 2 SEE, respectiv, pentru exemplul dat, n intervalul 80 i 120. La
un nivel de ncredere de 99%, scorul prognozat ar cdea n intervalul 100 3 SEE,
respectiv, pentru exemplul nostru, n intervalul 70 i 130.
Exact ca i n cazul erorii standard a msurrii, formula pentru construirea intervalului
de ncredere este urmtoarea:
X (scorul z) (SEE), n care:
X + (scorul z) (SEE) = limita superioar a intervalului
X - (scorul z) (SEE) = limita inferioar a intervalului.
Aa dup cum am precizat de mai multe ori, valoarea coeficientului de validitate al
testelor este relativ mic, ceea ce nseamn c, de regul, eroarea scorurilor prognozate este
considerabil. De aceea, n realitate, cele mai multe teste sunt folosite nu pentru a prevedea
exact scorul unui subiect la criteriu, ci mai mult pentru a determina dac el va depi un
standard minim al performanei sau o linie de demarcaie ntre succes-eec (Anastasi, A.,
1988, 1996).
Tem de reflecie/autoevaluare:
1. Ce este eroarea standard a estimrii (SEE)i care este relaia sa cu validitatea
testului ?
2. Dac valoarea lui SEE este 5 i scorul prognozat al subiectului n baza
rezultatelor la un test aplicat este 120, ntre ce limite se va ntinde scorul
prognozat, la un nivel de ncredere de 99%, n caz de reaplicare a testului ?
3. Criterii de selectare a testelor.
n practica psihgodiagnostic exist foarte multe teste, de aceea, se pune problema
selectrii lor, att n funcie de caracteristicile psihometrice, ct i n funcie de scopul
aciunii de msurare. Desigur, trebuie evitat pe ct posibil utilizarea unui singur test, mai
ales atunci cnd trebuie luat o decizie important pentru subiect. Unele teste sunt deja
foarte cunoscute, ele fiind aplicate de foarte muli psihologi. n unele ri, cum este cazul
S.U.A. s-au realizat chiar ierarhizri ale testelor n funcie de preferina manifestat de
practicieni. Teste precum MMPI, CPI, WAIS, WISC, WPPSI, Rorschach, TAT etc. s-au
impus mai demult n partea de nceput a acestor ierarhizri. Cu toate acestea, selectarea
testelor pe care trebuie s le aplice psihologul nu este o sarcin uoar, el trebuind s
dovedeasc mult flexibilitate i mult rspundere n acest sens.
76
NICOLAE MITROFAN
Printre factorii care trebuie s fie luai n consideraie n selectarea testelor pot fi
inclui urmtorii:
- motivul pentru care subiectul a fost trimis la psiholog pentru msurarea i evaluarea
psihologic;
- vrsta subiectului;
- probleme prezentate de subiect de ordin snzorial (vz, auz) sau de ordin motor;
- perioada de timp disponibil pentru testare;
- disponibilitatea anumitor teste;
- abilitatea subiectului de a citi (pentru cazurile n care vom folosi teste de
personalitate sau anumite inventare de interese vocaionale);
- mediul socio-cultural din care provine subiectul.
n continuare vom prezenta cteva exemple (Bishop, E., 1992) de modul n care se
pot combina testele, inndu-se seam de scopul trimiterii spre examinare i de vrsta
subiecilor.
Exemplul 1: pentru un adult care este trimis pentru o examinare psihologic complet n
vederea stabilirii exacte a diagnosticului i planificrii tratamentului, fiind suspectat c are
probleme psihiatrice, cum ar fi, depresia sau anxietatea se poate folosi urmtoarea baterie de
teste. Testele sunt prezentate n ordinea aplicrii lor:
- Scala de inteligen pentru aduli a lui Wechsler (WAIS III);
- Inventarul multifazic de personalitate Minnesota (MMPI 2);
- Testul Bender Gestalt;
- Testul tematic de apercepie (TAT);
- Testul completrii de fraze (Incomplete Sentence Blank).
Acest grup de teste, att obiective, ct i proiective vor oferi informaii privind
abilitile cognitive i funcionarea personalitii.
Exemplul 2: pentru copiii ce urmeaz a fi evaluai pentru plasarea lor ntr-o instituie pentru
educaie special, se poate folosi urmtoarea baterie de teste:
- Scala de inteligen a lui Wechsler pentru copii (WISC-III);
- Testul pentru achiziii colare Woodcock-Johnson (Woodcock-Johnson Achievement Test
Revised);
- Testul Bender-Gestalt;
- Testul de dezvoltare a integrrii vizual-motorii (The Developmental Test of Visual-Motor
Integration);
- The Draw a Person (DAP) sau House-Tree-Person (HTP).
Deci aceast baterie vizeaz mai multe aspecte, respectiv, nivelul de dezvoltare
intelectual, nivelul i tipurile de achiziii colare, nivelul de funcionare cognitiv, nivelul
de funcionare a personalitii. Dac este necesar confirmarea unui diagnostic posibil
privind retardarea mental, trebuie s fie adugate alte instrumente de msurare a
comportamentului adaptativ, cum este cazul Scalelor Vineland pentru Comportamentul
Adaptativ (Vineland Adaptative Behavior Scales). Aceste scale sunt foarte necesare
deoarece diagnoza retardrii mentale presupune evidenierea unor ntrzieri semnificative
att n ceea ce privete funcionarea cognitiv, ct i n ceea ce privete comportamentul
adaptativ.
Exemplul 3. Dac un adolescent este evaluat pentru posibile servicii de reabilitare
vocaional, bateria folosit ar trebui s cuprind: teste pentru abiliti cognitive, teste de
77
NICOLAE MITROFAN
achiziii colare, teste pentru planificare i organizare, teste pentru interese vocaionale i
teste de personalitate. Concret, aceast baterie ar cuprinde:
- Scala de inteligen a lui Wechsler pentru aduli (WAIS-III);
- Wide Range Achievement Test- Revised;
- Strong Vocational Interst Blank;
- Incomplete Sentences Blank.
Exemplul 4. Pentru evaluarea unui copil mic i foarte mic, n vederea beneficierii de un
suport financiar datorit unor dizabiliti, se poate utiliza o baterie care s cuprind:
- Testele Bayley ale dezvoltrii copilului (Bayley Tests of Infant Development;
- Scalele Vineland pentru comportamentul adaptativ (The Vineland Adaptive behavior
Scales;
- Observarea interaciunii mam-copil.
O grij deosebit trebuie acordat selectrii testelor potrivite pentru evalurile
judiciare (forensic evaluations).
Exemplul 5. n cazul stabilirii custodiei pentru un copil, testele de evaluare sunt aplicate i
pe copii i pe prini, la care se adaug interviul clinic i observarea interaciunii printecopil. Ca teste pentru copii pot fi folosite urmtoarele:
- Testul Aperceptiv Robert pentru Copii (Roberts Apperception for Children);
- Testul vocabular n imagini Peabody (Peabody Picture Vocabulary Test- Revised);
- Desenul kinetic al familiei (Kinetic Family Drawing);
- Completare de propoziii (Incomplete Sentences Blank).
Pentru aduli se aplic testele:
- Inventarul multifazic de personalitate Minnesota (MMPI-2);
- Completare de propoziii (Incomplete Sentences Blank);
- Indexul stresului parental (Parenting Stress Index).
Teme de reflecie/autoevaluare:
1. De ce credei c este necesar, precum n exemplele de mai sus, s fie
incluse ntr-o baterie de testare mai multe teste ?
2. Care sunt cele mai importante criterii ce se iau n atenie n selectarea unor
teste folosite n aciunile de msurare psihologic ?
3. Locul i rolul testului n selecia profesional.
Testul este foarte frecvent folosit n aciunile de selecie profesional. n urma aplicrii
lui rezult dou categorii de subieci: a) cei care reuesc la test; b) cei care nu reuesc la test.
Primii mai sunt denumii subieci admii iar ceilali sunt denumii subieci respini. Cei care
organizeaz examenul de selecie trebuie s stabileasc linia de demarcaie (cut-off score)
dintre subiecii admii i cei respini. Aceast linie poate fi foarte apropiat de partea de
nceput a listei candidailor (de exemplu, dac se pot obine maximum de 100 de puncte la
test, vor fi declarai reuii numai cei ce obin peste 95 de puncte) sau, dimpotriv, poate fi
foarte mult ndeprtat de partea de nceput (n cadrul exemplului dat pot fi declarai admii
cei ce obin cel puin 25 de puncte). Este clar c, n primul caz, interesul organizatorului
examenului este de a face o selecie foarte sever, iar n al doilea caz, interesul este de a
accepta ct mai muli candidai.
Dac testul psihologic folosit pentru selecie ar fi un instrument perfect (coeficientul
de fidelitate = 1,00 i coeficientul de validitate = 1,00) atunci, n cadrul aciunii de selecie,
ar fi sigur departajai subiecii buni (admii) de cei slabi (respini). Deci nu ar exista nicio
greeal, n sensul c pot fi admii candidai slabi i respini candidai buni.
78
NICOLAE MITROFAN
Normal
Total
C
15
D
75
90
23
77
100
Citind datele din tabel, rezult c, n urma testrii psihologice a 100 de subieci, a
rezultat c 23 au afeciune neurologic i c 77 dintre ei nu au o asemenea afeciune. Pe de
alt parte, tot din tabel reiese c, n urma efectrii diagnosticului medical, a reieit c 10
subieci au afeciune neurologic iar ceilali 90 sunt normali. Ce rezult de aici ?
n tabel exist dou tipuri de preziceri corecte: a) din 10 subieci cu afeciune
neurologic, testul detecteaz 8, ceea ce nseamn c rata de detecie este de 80%; b) testul
arat c 75 dintre subieci sunt normali, fiind n total acord cu rezultatul examenului
medical. Deci, din 100 de subieci, testul stabilete corect diagnosticul pentru 83 dintre ei.
Putem spune, n consecin, c acest instrument psihodiagnostic prezint un procent de 83%
79
NICOLAE MITROFAN
a acurateei sau preciziei predictive. Totodat, ns, exist i dou tipuri de eecuri n
predicie. Astfel, exist dou cazuri considerate, n baza testului, ca neavnd afeciune
neurologic, n realitate nefiind aa. De asemenea, conform datelor obinute la test, 15 cazuri
prezint o afeciune neurologic, situaie neconfirmat de examenul medical.
Aadar, din tabelul de mai sus reies urmtoarele tipuri de informaii:
- A i D = predicie corect a testului
- B = fals negativi
- C = fals pozitivi
- A/(A + B) = rata de detecie
- D/(C + D) = specificitate
- (A + D)/(A + B + C + D) = rata acurateei sau preciziei predictive
Concluzia principal este aceea c acest test este relativ bun n detectarea afeciunilor
neurologice, deoarece 10% din toi subiecii au asemenea afeciuni iar testul detecteaz 80%
din cazuri.
Pentru a cunoate ct de mult ne poate ajuta un test psihologic n aciunile de
selecie, Taylor i Russell au oferit o metod pentru evaluarea validitii n relaie cu
cantitatea de informaie cu care testul contribuie dincolo de rata de baz. Aceast metod a
msurrii valorii testelor este prezentat ntr-o serie de tabele, cunoscute sub numele de
tabele Taylor-Russell (Kaplan, M.R., Saccuzzo, P.D., 1993). Cel care dorete s utilizeze
aceste tabele trebuie s dispun de urmtoarele informaii:
1. Definirea succesului i precizarea ct mai clar a limtei de demarcaie ntre cele dou
categorii de subieci (admii-respini);
2. Determinarea ratei de baz, adic procentul persoanelor care vor reui n condiiile n
care nu se folosete niciun test;
3. Definirea ratei de selecie: procentul candidailor selectai sau admii;
4. Determinarea coeficientului de validitate. Acesta, de regul, vizeaz corelaia dintre
rezultatele la test i rezultatele la criteriu.
Tabelele Taylor-Russell ofer probabilitatea ca o persoan selectat pe baza scorului la
test s reueasc la criteriu. Exist cte un tabel diferit pentru fiecare rat de baz. Tabelul
care este cel mai cunoscut i care poate fi regsit apropate n toate tratatele de
psihodiagnostic este cel cu o rat de baz: 0,60.
Pentru a utiliza tabelul se ia n atenie irul ce cuprinde valorile validitii testului ce
urmeaz a fi utilizat pentru selecie. Apoi se gsete coloana asociat procentului celor ce
vor fi selectai. Numrul gsit la intersectarea irului i coloanei ne ofer o estimare a celor
ce vor reui n cazul n care vor fi selectai pe baz de test.
Iat un exemplu concret (Kaplan, M.R., Saccuzzo, P.D., 1993). S presupunem c
avem n calitate de criteriu notele (mediile) obinute de elevi dup terminarea unui an colar.
Avnd n vedere c limita de demarcaie (cutt-off score) este 5,00, 60% dintre ei sunt
declarai reuii. Deci rata de baz = 60%. Apoi, considerm c vom utiliza pentru selecia
elevilor un test de inteligen. Rata de selecie va fi 60%, deoarece avem numai attea locuri.
Valoarea coeficientului de corelaie dintre acest test i criteriu este deja cunoscut: 0,30.
Pentru a estima ci candidai vor reui dac ei sunt selectai n baza testului de inteligen
folosim tabelul Taylor-Russell. Vom gsi procentul de .66 sau 66%. Deci, diferena este
doar de 6% fa de selecia bazat pe ntmplare. Dac valoarea coeficientului de validitate
ar fi fost 0,50, atunci procentul ar fi fost de 73%, ceea ce nseamn o diferen de 13% fa
de selecia bazat pe ntmplare.
80
NICOLAE MITROFAN
81
NICOLAE MITROFAN
Succes
27
33
60
Criteriu
Eec
Total
3
37
40
____________________________
30
70
100
Ce se poate observa din acest tabel ? Din cei 60 de candidai care ar reui la criteriu
sunt selectai, cu ajutorul testului, doar 27, ceea ce nseamn c 33 de candidai, care ar reui
la criteriu, nu sunt selectai. Totui, din cei 40 de candidai, care ar eua la criteriu, 37 au fost
bine diagnosticai. n concluzie, 90% (27/30) dintre candidaii selectai cu ajutorul testului
vor reui la criteriu iar 47% (33/70) dintre cei respini ar fi reuit la criteriu. Procedura
poate fi declarat a fi bun, deoarece procentul celor ce vor reui dintre cei selectai este
mult mai mare.
Teme de reflecie/autoevaluare:
1. Analiznd tabelul Taylor-Russell, ce putem spune despre testele ce au validitatea
mai mare iar rata de selecie este mai mic ? Dar despre testele care au validitatea
mai mic iar rata de selecie este mai mare ?
Intrebri de autoevaluare:
1. Ce reprezint eroarea standard a estimrii (SEE) ?
2. Care este formula de calcul a erorii standard a estimrii ?
3. Ce asemnri i ce deosebiri sunt ntre eroarea standard a msurrii (SEM) i eroarea standard a
estimrii (SEE) ?
4. Cine se ocup de calcularea celor dou forme de erori ?
5. Dai cel puin 2 exemple concrete privind utilizarea valorii lui SEE.
6. Care sunt cele mai importante criterii folosite n selectarea testelor ?
7. Dai cteva exemple de modul n care se pot combina testele ntr-o baterie de teste.
8. De ce trebuie s includem mai multe teste n aciunile de msurare i evaluare psihologic ?
9. Cnd folosim teste psihologice pentru selecia de personal, cte categorii reale de candidai avem
?
10. Ce nseamn rata de detecie a testelor ?
11. Ce nseamn rata acurateei sau a preciziei predictive a testelor ?
12. Care sunt paii parcuri cnd folosim tabelele Taylor-Russell ?
BIBLIOGRAFIE
1. BISHOP, E. (1992). Selection of psychological tests for different purposes:
children, adolescents, and adults. 50th International Convention of ICP, Olanda.
2. COHEN, J.R., SEWRDLIK; E:M: (2005). Psychological Testing and Assessment.
An Introduction to Tests and Measurement. McGraw-Hill International Edition.
3. CLINCIU, A. (2005). Psihodiagnostic. Braov: Ed. Universitii Transilvania.
4. KAPLAN, M. R., SACCUZZO, P.D. (1993). Psychological Testing. Brooks/Cole
Publishing Company.
5. STAN, A. (2003). Testul psihologic. Evoluie, construcie, aplicaii. Iai: Polirom.
82
NICOLAE MITROFAN
MODULUL IV
ANALIZA ITEMULUI
Unitatea de nvare 1: Ce este analiza itemului ?
Cuprins:
1. Relaia itemului cu testul
2. Tipuri de analiz a itemului
Obiective
La sfritul acestei uniti de nvare, studenii vor fi
capabili s:
defineasc itemul ca element component al testului;
cunoasc relaia dintre itemi i testul luat ca ntreg;
cunoasc funciile ndeplinite de item n cadrul testului;
evalueze diferite tipuri de analize a itemului
83
NICOLAE MITROFAN
itemul este un element al unui test, constituind o situaie particular i jucnd rolul unui
stimul la care subiectul nu poate da dect un rspuns dintre dou sau mai multe rspunsuri
teoretice prevzute de test. Ce reiese din aceast definiie ? n primul rnd, faptul c itemul
este o secven, o component a testului, un fel de mintest care are o anumit
individualitate. n al doilea rnd, faptul c itemul apare ca un stimul pentru subiect. n sfrit,
n al treilea rnd, faptul c subiectul ofer un rspuns, care poate fi corect sau nu.
Desigur, legat de formele de rspuns, lucrurile se prezint difereniat n funcie de
categoria testelor. De exemplu, la testele de performan, rspunsul la item poate fi corect
(subiectului i se acord 1 punct) sau incorect (subiectului nu i se acord niciun punct sau
subiectului i se acord 0 puncte). n cazul testelor de personalitate, dac se folosesc scale cu
mai multe variante de rspuns, subiectul poate obine un numr variabil de puncte, adic
obine attea puncte cte sunt acordate treptei de rspuns pe care a ales-o subiectul.
Pentru a fi considerat item o component a testului trebuie s aib individualitate
informaional pertinent, adic s contribuie distinct, clar i conturat, la scorul total al testului
(Stan, A., 2002). Un exemplu oferit de autor, care nu constituie item, este bararea unei litere,
O sau C, la testul de atenie Bourdon-Amfimov.
S-a pus i ntrebarea: ci itemi trebuie s aib un test ? Privind spre practic, putem
ntlni i teste cu mai puini itemi i teste cu foarte muli itemi, cum este cazul chestionarelor
i inventarelor de personalitate care au sute de itemi. Noi ne reamintim faptul c un test este de
ateptat s fie mai fidel i mai valid cu ct are mai muli itemi. Referitor la cel mai mic numr
de itemi pe care poate s-l aib un anumit test, Paul Kline, o autoritate n domeniul
psihodiagnosticului, susine c acesta nu poate fi mai mic de 10. Deci, niciun test i niciun
chestionar nu poate fi acceptat n calitate de instrument psihodiagnostic dac nu are cel puin
10 itemi.
Un alt aspect important este cel legat de modul n care se formuleaz itemii. Sarcina nu
este deloc uoar iar unii autori (DeVellis, 1991) a elaborat un fel de ghid ce cuprinde mai
multe recomandri din care Kaplan, K.R. i Saccuzzo, D. (2005) rein urmtoarele ase:
1. Definii clar ceea ce vrei s msurai. Pentru aceasta utilizai teoria substantivului n
calitate de ghid i ncercai s facei itemii att de specifici ct este posibil;
2. Creai o banc de itemi. Teoretic, toi itemii sunt alei ntmpltor dintr-un univers de
coninut al itemilor. n practic, totui, grija n selectarea i dezvoltarea itemilor este valabil.
Evitai itemii redundani. n fazele iniiale poate dorii s scriei 3 sau 4 variante pentru fiecare
item ce urmeaz a fi utilizat n structura noului test;
3. Evitai, pe ct posibil, itemii cu lungime mare, deoarece acetia sunt buni foarte rar;
4. Meninei nivelul de dificultate al lecturii i nelegerii ct mai potrivit pentru cei care vor
rspunde la test;
5. Evitai itemii cu un caracter echivoc, adic cei care conduc la dou sau mai multe idei n
acelai timp. De exemplu, s ne referim la un item care solicit respondentului s rspund cu
acord sau dezacord la afirmaia Votez democraii deoarece sprijin programe sociale.
Aici sunt, de fapt, dou afirmaii n raport cu care respondentul trebuie s-i exprime acordul:
Votez democraii i Eu sprijin programele sociale;
6. Combinai itemii formulai pozitiv i negativ. Uneori, respondenii dezvolt aa-numitul
set al rspunsului ncuviinat. Aceasta nseamn c respondenii vor tinde s rspund cu
sunt de acord la majoritatea itemilor. Or, pentru a evita o asemenea tendin, trebuie s
includei i itemi care sunt formulai n direcie opus. De exemplu, ntr-un test ce msoar
84
NICOLAE MITROFAN
depresia, regsim i itemi formulai pozitiv, de genul M-am simit deprimat dar i itemi
formulai n direcie opus, de genul M-am simit plin de speran privind viitorul.
Teme de reflecie/autoevaluare:
1. Care credei c sunt avantajele i dezavantajele n cazul n care
testul este foarte scurt i n cazul n care testul este foarte lung.
2. La ce categorii de instrumente psihodiagnostice se aplic cel mai
bine ghidul lui DeVellis ?
_____________________________________________________________
85
NICOLAE MITROFAN
Problema
Exemplu de ntrebare
_____________________________________________________________
Sensilibilitatea cultural
Ai simit c unii itemi au fost discriminatori
n raport cu anumite grupuri de subieci. Dac
da, de ce ?
Validitatea de faad
Pare testul c msoar ceea ce ateptai s
msoare ? Dac nu, ce este contrar ateptrilor ?
Aplicantul testului
V-a afectat n vreun fel conduita aplicantului
testului performanele dvs. ? Dac, da, cum ?
Mediul de aplicare
A afectat n vreun fel condiiile din sala de
testare performana dvs. la test ? Dac da,
cum ?
Corectitudinea testului
Credei c testul este corect n raport cu ceea
este considerat c msoar ? De ce sau de ce
nu ?
Limbajul testului
n raport cu care dintre instruciuni sau alte
aspecte scrise ale testului ai avut dificulti
de nelegere ?
Lungimea testului
Ce ai simit, referitor la lungimea testului, n
privina: a) timpul necesar pentru completare;
b) numrul de itemi ?
Ghicitul rspunsului
Ai ghicit la vreunul dintre itemii testului ?
Care credei c este procentul itemilor la care
ai ghicit ? Ai utilizat o strategie particular
pentru a ghici sau ai ghicit la ntmplare ?
Integritatea subiectului
Credei c s-a putut tria la acest test ? Dac
da, descriei metodele ce credei c au fost
utilizate.
Starea mental i fizic a
Cum ai descrie starea dvs. mental la ncepusubiectului
tul testrii ? Credei c aceast stare a afectat
n vreun fel rezultatele obinute ? Dac da,
cum ? Cum descriei starea dvs. fizic la nceputul testrii ? Credei c aceast stare a afectat n vreun fel rezultatele obinute ? Dac da,
cum ?
Starea mental i fizic a
Cum ai descrie starea dvs. mental pe parcursbiectului
sul testrii ? Credei c aceast stare a afectat
n vreun fel rezultatele obinute ? Dac da,
cum ? Cum ai descrie starea dvs. fizic pe
parcursul testrii ? Credei c aceast stare a
afectat n vreun fel rezultatele obinute ?
Dac da, cum ?
Impresia general a
Care este impresia dvs. general privind acest
subiectului
test ? Ce sugestii ai oferi constructorului de
tes pentru mbunire ?
86
NICOLAE MITROFAN
Preferinele subiectului
ntrebri de autoevaluare:
1. Ce este, de fapt, itemul unui test ?
2. Ce forme alternative exist pentru itemi i analiza de itemi ?
3. Ce efecte poate avea scurtarea lungimii unui test ?
4. Ce efecte poate avea mrirea dimensiunii testului ?
5. Ci itemi poate avea un test?
6. De cine depinde numrul itemilor ?
7. Cum se poate construi un nou test ?
8. n ce const analiza cantitativ a itemilor ?
9. n ce const analiza calitativ a itemilor ?
10. Ce tipuri de index pot fi calculate ?
11. Cum se poate asigura feed-back-ul pentru constructorul de test referitor
la aspectele calitative ale noului test ?
12. De ce este bine ca, atunci cnd verificm aspectele calitative ale unui
test nou, s pstrm confidenialitatea rspunsurilor ?
BIBLIOGRAFIE:
1. COHEN, J.R., Swerdlik, E.M. (2005). Psychological Tesing and Assessment.An Introduction to Tests
and Measurement. McGraw-Hill International Edition.
2. CLINCIU, A. I. (2005). Psihodiagnostic. Braov: Ed. Universitii Tansilvania.
3. FRIEDENBERG, L. (1995). Psychological testing. Design, Analysis, and use. Allyn & Bacon.
4. KAPLAN, M.R., SACCUZZO, P.D. (2005). Psychological Testing. Principles, Applications, and
Issues. Thomson Wadsworth.
5. MINULESCU, M. (2003). Teorie i practic n psihodiagnoz. Testarea intelectului. Bucureti:
Editura Fundaiei Romnia de Mine.
87
NICOLAE MITROFAN
88
NICOLAE MITROFAN
89
NICOLAE MITROFAN
att nivelul de dificultate al itemului va crete. Deci, ar rezulta, chiar i la o analiz mai
superficial, c valoarea optim a nivelului de dificultate al unui item este 0.50.
Dar pot fi aduse dovezi mai serioase. Astfel, dac la un test aplicat pe 100 de subieci,
reuesc 50 dintre ei, nseamn c, firesc, ceilali 50 nu reuesc. n felul acesta, putem s
comparam pe fiecare subiect din grupul de 50, care au reuit la item, cu fiecare dintre cei
50 de subieci care nu au reuit la item. Avem, astfel, 50 x 50 sau 2500 comparaii perechi
sau bii ai informaiei difereniale (Anastasi, A., 1988). Oricare alt combinaie nu conduce
la o asemenea valoare. Pentru mai mult siguran verificai tabelul de mai jos:
__________________
0 x 100 = 0
10 x 90 = 900
20 x 80 = 1600
30 x 70 = 2100
40 x 60 = 2400
50 x 50 = 2500
60 x 40 = 2400
70 x 30 = 2100
80 x 20 = 1600
90 x 10 = 900
100 x
0 = 0
___________________
Tem de reflecie/autoevaluare
Alctuii un test care s cuprind mai muli itemi, fiecare
dintre ei avnd un nivel de dificultate diferit, dar, pe
ansamblu, nivelul de dificultate al testului s fie 0,50.
90
NICOLAE MITROFAN
Un item trecut de 16% din cazuri va cdea n 1 deasupra mediei, pentru c, deasupra
acestui punct, exist 16% sin cazuri (50 34 = 16). Iar un item la care au reuit 50% din
cazuri, cade exact pe medie i ar avea, astfel, valoarea 0 pe aceast scal.
Deoarece dificultatea itemului exprimat n funcie de curba normal, ce presupune
deviaia standard ca distan, implic valori negative i zecimale, ele sunt convertite ntr-o
scal uor de mnuit i care este desemnat prin litera greceasc delta . Relaia dintre i
curba normal distanele (valori z) este urmtoarea:
= 13 + 4z
n aceast formul 13 i 4 sunt constante alese pentru a oferi o scal
care s elimine valorile negative i zecimalele.
Un item trecut de aproape 100% din subieci (99,87%), cznd n - 3, ar avea o valoare
a lui = 1 (aa cum reiese din formul: 13 + (4)(-3) = 1)
La cealalt extrem, un item care a fost trecut de mai puin de 1% din subieci (0,13%), ar
cdea n + 3 i ar avea valoarea lui = 25 (aa cum apare din formul: 13 + (4) (3) =
25). i, n sfrit, un item ce ar cdea pe medie va avea valoarea lui = 0 (aa cum reiese
din formul:
13 + (4) (0) = 25.
Se poate trage concluzia c este o scal n care, practic, toi itemii cad, n ceea ce
privete nivelul de dificultate, ntre valorile 1 i 25, cu o medie = 13.
Referitor la calcularea nivelului de dificultate al unui item mai este o problem extrem
de important. La un item se poate rspunde corect i din ntmplare sau, cum se mai spune
mai simplu, ghicind rspunsul. De exemplu, dac la un item se rspunde dihotomic, prin
Da sau Nu, Adevrat sau Fals, subiectul poate ghici 50 % din rspunsurile corecte.
Sau, dac la un item, exist 4 variante de rspuns, printre care i cel correct, subiectul poate
ghici rspunsul corect n procent de 25%.
Nivelul de dificultate optim al itemilor se afl la jumtatea diferenei dintre numrul
maxim de subieci ce rspund correct (100%) i nivelul reuitei bazat numai pe ans
(noroc). Astfel, nivelul optim de dificultate al unui item prevzut cu patru variante de
rspuns, printre care i cel corect este de aproximativ 0,625: Pentru a se ajunge la aceast
valoare, se parcurg urmtorii pai (Kaplan, M.R., Saccuzzo, P.D., 2005):
1. Gsii jumtate din diferena dintre 100% succes i performana pe baz de ans
100 - 0,25
0,75
--------------- = ----- = 0,375
2
2
2. Adugai aceast valoare probabilitii de a obine rspunsul corect pe
baz de ans
0,375 + 0,25 = 0,625
O metod mai simpl pentru obinerea aceluiai rezultat este de a aduga 1,00 la
probabilitatea de a reui pe baz de ans i apoi de a divide la 2. Astfel:
1,00 + 0,25
----------------- = 0,625
Tem de reflecie/autoevaluare:
91
NICOLAE MITROFAN
ntrebri de autoevaluare:
1. Ce nseamn c un item este prea dificil ?
2. Ce i se poate imputa unui asemenea item ?
3. Ce nseamn c un item este prea uor ?
4. Ce i se poate imputa unui asemenea item ?
5. Cum se poate pune n eviden nivelul de dificultate al unui item ?
6. Care este valoarea optim a nivelului de dificultate al unui item ?
7. La ce se refer sintagma bii ai informaiei difereniale ?
8. Care este utilitatea unei scale de interval ?
9. Care sunt principalele valori ale unei scale de interval ?
10. Care sunt paii ce trebuie parcuri pentru a calcula exact nivelul de dificultate al unui item ?
BIBLIOGRAFIE:
1. ALBU, M. (1998). Construirea i utilizarea testelor psihologice. Cluj: Editura
Clusium.
2. ALBU, M., PITARIU, H. (1993). Proiectarea testelor de cunotine i examenul
asistat de calculator. Cluj-Napoca: Editura Casa crii de tiin.
3. COHEN, J.R., SWERDLIK, E.M. (2005). Psychological Testing and Assessment.
An Introduction to Tests and Measurement. McGraw-Hill International Edition.
4. CLINCIU, A.I. (2005). Psihodiagnostic. Braov: Ed. Universitii Transilvania
5. FRIEDENBERG, L. (1995). Psychological Testing. Design, Analzsis, and use. Allyn & Bacon.
6. KAPLAN, M.R., SACCUZZO, P.D. (2005). Psychological Testing. Principles, Applications, and
Issues. Thomson Wadsworth.
7. MINULESCU, M. (2003). Teorie i practic n psihodiagnoz. Testarea intelectului. Bucureti:
Editura Fundaiei Romnia de Mine.
8. STAN, A. (2002). Testul psihologic.Evoluie, consatrucie, aplicaii. Iai: Polirom.
92
NICOLAE MITROFAN
93
NICOLAE MITROFAN
parte, nici subiecii buni i nici subiecii slabi nu au exact acelai nivel de dezvoltare al
nsuirii sau capacitii psihice supuse msurrii.
De aceea, testul trebuie s evidenieze ct mai exact posibil acest nivel de dezvoltare.
i atunci, subiecii, dei se afl ntr-un anumit registru de dezvoltare al nsuirii sau
capacitii psihice respective (nalt sau sczut), vor trebui s fie i ei difereniai sau, ca s
fim consecveni cu terminologia, discriminai. Aceasta nseamn c cei buni, dar nu
exceleni, vor mai grei la unii itemi i, pe de alt parte, cei slabi, dar nu extrem de slabi, vor
reui la unii itemi. Pot s apar i anumite paradoxuri. Cei foarte buni s nu reueasc la un
anumit item i cei slabi s reueasc la acesta. Putem nelege uor c, n asemenea cazuri,
este ceva n neregul cu itemii respectivi, ceea ce ne oblig la o reevaluare a acestora. Ei nu
pot s rmn aa cum sunt n structura testului, deoarece s-ar putea ca ei s msoare ceva ce
nu are legtur cu testul din care fac parte.
Tem de reflecie/autoevaluare:
Nivelul de dificultate optim al unui item este 0,50. Ce putem spune n
legtur cu capacitatea lui de discriminare?
1
2
15
20
9
20
7
16
Dificultate
U+M+L
31
56*
94
Discriminare
U - L
8
4
NICOLAE MITROFAN
3
4
5
6
7
19
10
11
16
5
18
11
13
14
0
9
16
11
9
0
46
37
35
39
5*
10
- 6*
0*
7
5
n acest tabel sunt prezentate rezultatele pentru numai 7 itemi din cadrul testului. Dup
cum se poate observa, nivelul de dificultate al itemului se afl nsumnd numrul subiecilor
din cele 3 grupe care rspund corect la toi itemii. Pe de alt parte, valoarea discriminativ a
fiecrui item poate fi aflat fcnd diferena dintre numrul subiecilor care rspund corect
n grupul U i numrul subiecilor care rspund corect n grupul L. Itemii ce prezint
probleme sunt cei care sunt prevzui cu stelu. Astfel, itemii 2 i 7 fac not discordant
fa de ceilali itemi, n sensul c itemul 2 este prea uor (56 de subieci rspund corect) iar
itemul 7 este prea greu (numai 5 subieci rspund corect).
n ultima coloan itemii 4 i 5 prezint probleme, n sensul c, dei satisfctori n
ceea ce privete nivelul de dificultate, itemul 4 prezint o valoare discriminativ negativ
iar itemul 5 prezint o valoare discriminativ egal cu zero. Aceti itemi nu pot s rmn
aa n structura testului existent sau nou construit, deoarece ei, practic, nu prezint niciun fel
de utilitate. Este clar c trebuie s fie supui unor serioase aciuni de analiz i evaluare sau,
pur i simplu, pot fi scoi definitiv din componena testului.
A. Anastasi arat c, n cazul n care numrul subiecilor care reuesc la fiecare item
din grupele U i L este exprimat n procente, indexul discriminrii poate fi calculat prin
diferena dintre cele dou procentaje, precum n tabelul urmtor:
Item
1
2
3
4
5
6
7
Procent reuit
U grup
Procent reuit
L grup
75
100
95
50
55
80
25
35
80
45
80
55
45
0
Indicele
discriminrii
U - L
40
20
50
- 30*
0*
35
25
Dup cum se poate observa din tabel, aceeai itemi prezint probleme, respectiv
itemii 4 i 5. Acetia trebuie s fie renalizai pentru a se vedea dac mai rmn n structura
testului. Deci i n cazul procentajului diferena dintre U i L constituie valoarea indexului
discriminrii pentru fiecare item. Acesta poate fi evideniat n mai multe forme, precum: UL, ULI, ULD, D sau d.
Analiznd datele din ambele tabele de mai sus, constatm c, n afar de itemii care
ridic probleme privind valoarea lor discriminativ, pentru ceilali itemi valorile sunt
diferite, de aceea apare ntrebarea care dintre ele este cea mai bun ? Referitor la metoda
utilizrii procentajelor, R.L. Ebel (apud Stan, A., 2002) a propus, n 1965, o scal de repere
pentru interpretarea valoric a indicelui de discriminare D:
___________________________________________________________
95
NICOLAE MITROFAN
96
NICOLAE MITROFAN
100
0
90
20
80
40
70
60
60
80
50
100
40
80
30
60
20
40
10
20
0
0
_____________________________________________________
Cum de apar asemenea valori ale lui D ? Cnd toi subiecii din grupul U reuesc la
item (50/50 = 100%) i toi subiecii din grupul L reuesc la acest item (0/50 = 0), atunci
valoarea lui D (U L) = 0. Cnd niciun subiect din grupul U (0/50 = 0) i niciun subiect din
grupul L (0/50 = L) nu reuete la un item, atunci valoarea lui D este tot 0. Cnd toi
subiecii din grupul U (50/50 = 100%) i niciun subiect din grupul L (0/50 = 0 %) atunci
valoarea lui D = 100. i aceasta este cea mai mare valoare a lui D. Dac reuesc la item 90
% din subieci, asta nseamn c au reuit toi din grupul U (50/50 = 100%) i 40 din grupul
L (40/50 = 80%). n consecin, valoarea lui D (U L) va fi 20. Dac reuesc la item 80%
din subieci, asta nseamn c toi subiecii din grupul U (50/50 = 100%) i numai 30 (30/50
= 60) din grupul L reuesc la item. Fcnd diferena vom constata c valoarea lui D = 40.
.a.m.d.
Teme de reflecie/autoevaluare:
1. Care este explicaia situaiei n care valoarea lui D (indicele de discriminare
al itemului) este negativ ?
2. De ce itemul al crui nivel de dificultate este 0,50 are cea mai mare valoare
a indicelui de discriminare ?
ntrebri de autoevaluare:
1. Ce este analiza discriminrii itemului ?
2. Ce proceduri de calculare a indexului discriminrii cunoatei ?
3. Care este procedura recomandat de A. Anastasi ?
4. n ce const metoda grupurilor extreme ?
5. Care este procentul subiecilor din grupurile U i L recomandat de autori ?
6. Ce trebuie fcut cu itemii ai cror valoare discriminativ este foarte sczut ?
7. Care sunt simbolurile recomandate pentru indexul discriminrii itemului ?
8. Care este opinia lui R.L. Ebel privind intervalul valoric al lui D ?
9. Dar a lui A. Anastasi ?
10. Explicai ce se ntmpl atunci cnd valoarea lui D este 1,00 i + 1,00
BIBLIOGRAFIE:
97
NICOLAE MITROFAN
98
NICOLAE MITROFAN
MODULUL V
ETALONAREA I STANDARDIZAREA TESTELOR
Unitatea de nvare nr. 1
Etapele etalonrii i standardizrii testelor
Cuprins:
1. Definirea conceptelor i etapele construirii testelor
2. Modele de scale utilizate n etalonare i standardizare
1.
conceptelor
Obiective:
La sfritul acestei uniti de nvare studenii vor fi
capabili s:
defineasc corect concepte precum: construcia testului,
etalonare, standardizare;
precizeze care sunt etapele parcurse n vederea etalonrii
unor noi teste;
difereneze ntre aciunea de etalonare i cea de reetalonare a testelor;
neleag bine ce nseamn
reprezentaivitatea
eantionului.
Definirea
De ce trebuie s fie
testele etalonate i
standardizate ? S presupunem c vom construi un nou test de inteligen pentru studenii
din Romnia i numai un singur student nu l includem n lot. Toate rezultatele obinute le
vom grupa n mai multe clase sau categorii, plecnd de la cele mai bune i ajungnd la cele
mai slabe. Desigur, vor exista muli studeni care vor obine acelai rezultat, de aceea trebuie
s lum n consideraie i frecvena rspunsurilor. Deci se face un fel de clasament, pe
primele locuri fiind rezultatele cele mai bune i, pe ultimile locuri, rezultatele cele mai slabe.
Singurului subiect care nu a fost inclus n lot i aplicm noul test de inteligen creat i, apoi,
rezultatul pe care l obine l raportm la clasamentul rezultatelor obinute de toi subiecii
inclui n lot. Vom vedea dac studentul respectiv se plaseaz pe o poziie mai spre vrful
clasamentului, mai spre mijloc sau mai spre baza acestuia. Deci comparm rezultatul
subiectului cu rezultatele ntregului lot.
Pornind de la acest exemplu, trebuie s deosebim ntre situaia n care un test deja
exist i cea n care se construiete un test nou. Pentru testul deja existent nu se pune
problema etalonrii lui, presupunnd c exist un etalon, ci, eventual, a reetalonrii lui, n
cazul n care etalonul nu mai corespunde. De asemenea, dac testul provine din alt ar,
dei el are un etalon (n limba englez se folosete termenul de norme norms - n loc de
etalon), trebuie s fie re-etalonat, trecnd, mai nti, prin faza traducerii i adaptrii. De aici
putem trage concluzia conform creia construirea unui test nou presupune automat i
etalonarea lui ns etalonarea nu presupune automat i construirea testului, deoarece acesta
poate exista deja (construit de alii) sau este luat din alt parte.
99
NICOLAE MITROFAN
O alt noiune care trebuie s o lum n atenie este cea de revizie a testelor. Mai nti,
s dm exemple. Bateria Stanford-Binet, care actualmente, este folosit sub denumirea de
Stanford-Binet Intelligence Scale (fifth edition) a trecut prin urmtoarele etape de revizuire:
1905 Scala de inteligen a lui A. Binet i T. Simon; 1908 prima revizie a Scalei de
inteligen Binet-Simon; 1911 a doua revizie a Scalei de inteligen Binet-Simon; 1916
apare versiunea Stanford-Binet Intelligence Scale, sub ngrijirea lui L. Terman; 1937
prima revizie a variantei lui Terman; 1960 a doua revizie; 1972 - a treia revizie; 1985 a
patra revizie (sub ndrumarea lui R.L. Thorndike, E. Hagen i J. Sattler); 2003 a cincea
revizie, sub ndrumarea lui G. Roid. Bateria WAIS III, respectiv, Scala de inteligen a lui
Wechsler pentru aduli a parcurs, de asemenea, mai multe etape de revizie. Prima variant a
aprut n anul 1939, sub denumirea Wechsler-Bellevue Intelligence Scale I. A doua a aprut
n 1942, sub denumirea de The Army Wechsler iar a treia, n 1946, sub denumirea Wechsler
Bellvue Intelligence Scale II. n 1955 apare, de fapt, prima variant a Scalei Wechsler de
inteligen pentru aduli (WAIS). Aceast variant este revizuit n 1981, devenind, WAIS R i, apoi, din nou, n 1997, variant care exist i n prezent, cunoscut sub denumirea
WAIS III (Scala de inteligen Wechsler pentru aduli III).
Revizia este o aciune foarte ampl, care poate dura mult timp (de exemplu, revizia
Bateriei Stanford-Binet, fourth edition, a durat ntre 6 i 8 ani) i ea presupune re-analizarea
i re-evaluarea testului din mai multe puncte de vedere: coninut, norme, direcii de
administrare i cotare etc. Prile testului care sunt mai sensibile la schimbare sunt cele ce
presupun folosirea limbajului. Un test preluat din America, de exemplu, trebuie tradus i
adaptat, deoarece acesta poate cuprinde informaii care nu sunt specifice i nu sunt
cunoscute de ctre populaia romneasc. Astfel, sunt unele aspecte legate de istorie, de
literatur, de obiceiuri, de tradiii, de preocupri etc. De exemplu, fotbalul american este un
sport foarte dur, foarte agresiv fa de fotbalul european. Deci, rspunsul pozitiv la
ntrebarea i place fotbalul ? nseamn cu totul altceva pentru un subiect romn dect
pentru un subiect american. Sau dac unii itemi presupun operarea cu sistemul de msurare
american, pentru subiecii romni trebuie neaprat s fie transpus n sistemul de msurare
folosit n Romnia.
La ntrebarea Cnd se impune revizuirea unui test ? putem apela la sugestiile
fcute de Asociaia Psihologilor Americani APA (1996, Standard 3.18): un test poate fi
meninut n forma actual atta timp ct este folositor i el trebuie s fie revizuit atunci
cnd apar schimbri semnificative n domeniul reprezentat sau cnd condiiile noi pentru
utilizare i interpretare fac testul s fie nepotrivit pentru ceea ce intenioneaz s msoare.
n opinia altor autori ns, testele trebuie s fie revizuite atunci cnd exist oricare din
urmtoarele condiii (Cohen, R.J., Swerdlik, E.M., 2005):
1. Materialele stimul par a fi demodate i subiecii nu se pot raporta la ele;
2. Coninutul verbal al testului, incluznd instruciunile pentru administrare i itemii
testului, conin un vocabular depit, care nu este imediat neles de ctre subieci;
3. ntruct cultura popular se schimb i cuvintele capt noi nelesuri, anumite cuvinte sau
expresii din coninutul itemilor sau din direciile de administrare pot fi percepute ca
nepotrivite sau chiar ofensatorii pentru un anumit grup particular, de aceea ele trebuie s fie
schimbate;
4. Normele testului nu mai sunt adecvate datorit schimbrilor n populaia subiecilor
poteniali;
100
NICOLAE MITROFAN
5. Normele testului nu mai sunt adecvate datorit schimbrilor pe linia abilitilor msurate
i datorit extinderii lor (n sus sau n jos) dac acest lucru devine necesar;
6. Fidelitatea sau validitatea testului, precum i eficacitatea itemilor individuali, pot fi
semnificativ mbuntite printr-o revizie.
7. Teoria ce a stat la baza testului original a fost mbuntit semnificativ i schimbrile
trebuie s fie reflectate n design-ul i coninutul testului.
Privitor la elaborarea i construirea unui test nou, trebuie s precizm faptul c este
obligatoriu s fie parcurse mai multe etape:
1. Analiza ct mai corect, ct mai clar a constructului, a nsuirii sau caracteristicii psihice
care urmeaz a fi testat cu instrumentul psihodiagnostic nou. Trebuie definit foarte clar
conceptul i, apoi, operaionalizat, adic descris din perspectiv comportamental, actele
comportamentale fiind evaluabile i msurabile. Trebuie rspuns, ct mai clar, la ntrebri de
genul: - ce nseamn a fi sau a nu fi inteligent ? ce nseamn a fi sau a nu fi anxios ? ce
nseamn a avea sa a nu avea memorie logic ? ce nseamn a fi sau a nu fi sociabil ?
Am mai vorbit despre asta, dac v mai amintii, la validitatea privitoare la construct.
2. Imaginarea modalitilor de simulare a situaiilor reale n raport cu care subiectul i
exteriorizeaz i i obiectiveaz capacitile, trsturile sale psihice. n aceast privin, un
rol foarte important l are imaginaia constructorului de test. El trebuie s dea dovad de
inventivitate i ingeniozitate. Uneori testele impresioneaz prin forma extrem de original a
itemilor, ns numai aceasta nu asigur automat i o bun fidelitate i validitate a testului. De
aceea, constructorul de test nu trebuie s acorde mai mare importan formei itemilor, n
detrimentul caracteristicilor psihometrice ale testelor.
Elaborarea testului presupune, de altfel, respectarea mai multor cerine i anume:
a) alegerea, selectarea materialului utilizat n cadrul testului (cuvinte, propoziii, numere,
figuri, expresii, cuburi, analogii, situaii problematice, ntrebri, evaluri, autoevaluri etc.);
b) formularea instructajului i a exemplelor pentru familiarizarea subiecilor cu principiul de
construcie al itemilor testului;
c) precizarea tipului de rspuns (un singur rspuns, mai multe rspunsuri la alegere, sarcin
de executat, rezolvarea problemei, exerciiu logic etc.;
d) elaborarea foii de rspuns, care trebuie s fie folosit numai n form original;
e) precizarea modului de cotare (puncte, procente, calificative), precum i a grilelor ce pot fi
folosite;
f) precizarea, dac este necesar, a timpului ct s dureze testarea, precum i a faptului dac
este vorba despre un test individual sau test colectiv;
3. Odat construit, testul nou se aplic n forma unei probe oarbe pe un eantion mai mic,
deoarece este o prim verificare a acestuia. Se acord atenie unor probleme precum: nivelul
de dificultate al itemilor, capacitatea lor de discriminare, dimensiunea testului, dac este
bine formulat i dac este suficient instructajul, reaciile subiectului la test etc.). n funcie de
rezultate, se fac modificrile necesare;
4. Etalonarea, etap ce vizeaz utilizarea unui ansamblu de procedee statistice pe baza crora
pot fi difereniai i clasificai subiecii inclui n eantionul folosit n funcie de rezultatele
lor obinute la un anumit test. n urma unor calcule statistice (trebuie s recunoatem c,
actualmente, acestea se pot realiza uor folosind calculatorul) rezultatele obinute de
membrii eantionului sunt grupate n forma unor norme sau etaloane, care, ulterior, sunt
folosite drept cadre de referin la care raportm rezultatele unui anumit subiect.
101
NICOLAE MITROFAN
102
NICOLAE MITROFAN
care au obinut note mari la tez. Pe de alt parte, dei notele la tez au fost identice pentru
doi elevi, n urma aplicrii testului standardizat s-ar putea s nu mai rmn niciun fel de
echivalen.
Din acest exemplu reiese clar necesitatea construirii unor teste care trebuie s efie
etalonate i standardizate. n procesul etalonrii, cotele brute sunt transformate n valori
numerice, acestea permind raportarea scorului individual al unui subiect, obinut n urma
aplicrii testului, la gruparea sau distribuirea rezultatelor obinute de eantion.
Etalonarea presupune, n principiu, dou operaii (Radu, I., 1991):
a) alctuirea sistemuluide norme sau a tabelului de norme pentru grupul de referin sau
eantionul de subieci (gruparea sau distribuirea n clase a cotelor brute);
b) alctuirea unui sistem de notare standard n care se convertesc cotele brute ale testului.
n practica psihodiagnostic ntlnim mai ales dou categorii de cote transformate,
respectiv:
a) cote exprimate, la rndul lor, n decile, centile i cuartile;
b) cote standardizate, cele care se bazeaz pe abaterea standard.
Prezentm, mai nti, prima categorie de cote transformate.
Sistemul decilajului presupune mprirea scorurilor sau a datelor brute n 10 grupe
sau clase, fiecare dintre ele cuprinznd 10% din efectivul total de subieci, exprimat, de
regul, prin litera N. Deci, dac numrul total al subiecilor inclui n eantion este de 1000,
o decil va cuprinde 10%, respectiv, 100 de subieci.
Sistemul centilajului, extrem de asemntor cu sistemul decilajului, presupune
mprirea n 100 de grupe sau clase, fiecare cuprinznd 1% din efectivul total al subiecilor
ce au fost inclui n eantion (N). Este de la sine neles c acest sistem se poate aplica n
cazul n care valoarea lui N este foarte mare.
Sistemul cuartilelor presupune mprirea n 4 clase sau 4 cuartile, fiecare din ele
cuprinznd 25% din N, deci din efectivul total al eantionului. Cele 4 cvartile sunt
urmtoarele (M = 50% din N):
a) cuartilul superior;
b) cuartilul mediu superior
c) cuartilul mediu inferior
d) cuartilul inferior
Folosirea tuturor celor 3 sisteme presupune parcurgerea unor etape asemntoare,
respectiv:
1. aplicarea testului pe ntreg eantionul (N);
2. ordonarea scorurilor sau rezultatelor, de la valoarea cea mai mare sau cea mai mic a
performanelor;
3. stabilirea frecvenelor, adic a numrului de subieci care obin aceeai performan (fa);
4. stabilirea frecvenelor cumulate sau nsumate (fc), nct fc = N.
Vom ncerca s exemplificm folosind rezultatele obinute la testul Raven Standard,
aplicat pe 448 de candidai de la un examen de admitere (Clinciu, A.I., 2005). Rezultatele
obinute sunt incluse, mai nti, n tabelul de mai jos:
x 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
fa 0 0 1 0 1 3 0 0 1 0 1 0 0 1 0 3 1
fc 0 0 1 1 2 5 5 5 6 6 7 7 7 8 8 11 12
103
35
2
14
NICOLAE MITROFAN
x
fa
fc
36
3
17
37
4
21
38
7
28
39
3
31
40
2
33
41
11
44
42
12
56
43
15
71
44
18
89
45
24
113
x
fa
fc
46
20
133
47
28
161
48
28
189
49
36
225
50
37
262
51
32
294
52
29
323
53
35
358
54
23
381
55
28
404
x
fa
fc
56
22
426
57
13
439
58
4
443
59
5
448
60
0
448
Procente
Teoretice
Cumulate
25
25
25
50
25
75
25
100
Clase
0 - 45
46 - 49
50 - 53
54 - 60
Etalonul n decile. Vor fi folosite tot datele rezultate n urma aplicrii testului
Raven. Primul decil are 10 % din N naintea sa, deci, 44,8 (448 x 10/100). n urma
rotunjirii, se obine 45. Cutnd pe irul frecvenelor cumulate vom gsi valoarea cea mai
apropiat, care este 44 i care corespunde cotei brute, respectiv, valorii lui x = 41. Asta
nseamn c primul decil va cuprinde valori ale lui x ntre 0 i 41. Al doilea decil are 20%
din efectivul total al subiecilor (N) naintea sa, ceea ce nseamn 89,6 (448 x 20/100) i
rotunjit, 90. Urmrind pe irul frecvenelor cumulate, vom vedea c valoarea cea mai
apropiat este 89 i ei i corespunde o valoare a lui x = 44. deci, al doilea decil va cuprinde
valori ale lui x ntre 42 i 44. Aa se procedeaz i pentru celelalte decile iar, n final,
etalonul n decile va arta n felul urmtor:
104
NICOLAE MITROFAN
Decilul
1
2
3
4
5
6
7
8
9
10
Clase
0 - 41
42 - 44
45 - 46
47 - 48
49
50
51 - 52
53
54 - 55
56 - 60
Procente
Teoretice
Cumulate
10
10
10
20
10
30
10
40
10
50
10
60
10
70
10
80
10
90
10
100
Al doilea sistem de cote transformate presupune cotele standardizate (Radu, I., 1991),
care nseamn tot mprirea n clase dar clase normalizate. Este vorba tot de un calcul
procentual, ns efectivul total al eantionului nu se mparte n clase sucesive egale (10%,
20% etc.), ci n clase care cuprind procente conturate plecnd de la frecvenele distribuiei
normale. Regula este ca numrul claselor s fie un numr impar: 5, 7, sau 9 clase, procentele
fiind, desigur, diferite de la un sistem la altul i anume:
a) pentru 5 clase: 6,7%; 24,2%; 38,2%; 24,2%; 6,7%;
b) pentru 7 clase: 4,8%; 11,1%; 21,2%; 25,8%; 21,2%; 11,1%; 4,8%;
c) pentru 9 clase: 4,0%; 6,6%; 12,1%; 17,5%; 19,6%; 17,5%; 12,1%; 6,6%; 4,0%.
n practic sistemul stanine este cel mai des folosit, de aceea l vom prezenta i noi
mai n detaliu. Vom face trimitere tot la rezultatele obinute n urma aplicrii testului Raven
(Clinciu, A., 2005).
Stanina 1 are sub ea 4% din efectiv, deci 17,92 (448 x 4/100), deci, rotunjit, 18.
Cutnd pe irul frecvenelor cumulate vom constata c valoarea cea mai apropiat este 17 i
acesteia i corespunde cota brut (valoarea lui x) = 36. Stanina 2 are naintea ei 10,6
procente din efectiv (4,0% + 6,6%), adic 47,468 (448 x 10,6), ceea ce nseamn, rotunjit,
47. Cutnd pe irul frecveelor cumulate, constatm c cea mai apropiat valoare este 44,
creia i corespunde cota brut = 41. Stanina 3 are naintea sa 22,7 procente din efectiv
(10,6 + 12,1), adic 101,696 (448 x 22,7/100) i, deci, rotunjit, 102. Cutnd pe irul
frecveelor cumulate, constatm c cea mai apropiat valoare este 113, creia i corespunde
cota brut = 45. .a.m.d. n final, etalonul va arta n felul urmtor:
Stanina
1
2
3
4
5
6
7
8
9
Clase
0 - 36
37 - 41
42 - 45
46 - 48
49 - 50
51 - 53
54 - 55
56
57 - 70
Teoretice
4,0
6,6
12,1
17,5
19,6
17,5
12,1
6,6
4,0
105
Procente
Cumulate
4,0
10,6
22,7
40,2
59,8
77,3
89,4
96,0
100,0
NICOLAE MITROFAN
Teme de reflecie/autoevaluare:
1. Artai cum va arta etalonul, n cazul n care folosii o scal cu 5 trepte;
2. Artai cum va arta etalonul n cazul n care folosii o scal cu 7 trepte.
Pentru ambele ntrebri vei face apel tot la rezultatele obinute n urma
aplicrii testului Raven.
ntrebri de autoevaluare:
1. Ce nseamn revizia testelor ?
2. Prin cte revizii a trecut Bateria de inteligen Stanford-Binet ?
3. Prin cte revizii a trecut Bateria de inteligen WAIS ?
4. Cnd se impune revizia unui test ?
5. Care sunt etapele elaborrii i construirii unui test nou ?
6. Care sunt principalele cerine n elaborarea unui test nou ?
7. Ce nseamn reprezentativitatea eantionului ?
8. Cte categorii de cote transformate cunoatei ?
9. Care este diferena dintre sistemul decilelor i sistemul centilelor ?
10. Care este specificul sistemului cuartilelor ?
11. Care sunt principalele etape ce trebuie parcurse cnd folosim oricare dintre cele 3 sisteme ?
12. Ce nseamn cote standardizate ?
13. Care este specificul sistemului stanine ?
14. De ce etaloanele bazate pe cote standardizate au un numr impar de clase ?
15. Care este relaia dintre frecvena absolut i frecvena cumulat ?
BIBLIOGRAFIE:
1. ALBU, M. (1998). Construirea i utilizarea testelor psihologice. Cluj: Editura
Clusium.
2. ALBU, M., PITARIU, H. (1993). Proiectarea testelor de cunotine i
examenul asistat de calculator. Cluj-Napoca: Editura Casa crii de tiin.
3. COHEN, J.R., SWERDLIK, E.M. (2005). Psychological Testing and Assessment.
An Introduction to Tests and Measurement. McGraw-Hill International Edition.
4. CLINCIU, A.I. (2005). Psihodiagnostic. Braov: Ed. Universitii Transilvania
5. FRIEDENBERG, L. (1995). Psychological Testing. Design, Analysis, and use.
Allyn & Bacon.
6. KAPLAN, M.R., SACCUZZO, P.D. (2005). Psychological Testing. Principles,
Applications, and Issues. Thomson Wadsworth.
7. MINULESCU, M. (2003). Teorie i practic n psihodiagnoz. Testarea intelectului. Bucureti:
Editura Fundaiei Romnia de Mine.
8. RADU, I. (coord.) (1991). Metodologie psihologic de analiz a datelor. Cluj-Napoca: Editura
Sincron.
10. STAN, A. (2002). Testul psihologic.Evoluie, consatrucie, aplicaii. Iai: Polirom.
106