ca i prima dat.
(3) Se calculeaz coeficientul de corelaie liniar ntre scorurile observate n cele dou
situaii.
Valoarea obinut se folosete pentru estimarea fidelitii testului, considerndu-se
c testul este paralel cu el nsui, ceea ce nseamn c ntre cele dou administrri ale
sale, scorurile reale ale persoanelor nu s-au schimbat.
Coeficientul de corelaie calculat prin aceast metod se numete coeficient de
stabilitate. Metoda test-retest este util atunci cnd scorurile reale ale testului msoar
caracteristici durabile, generale i specifice, ale persoanelor.
Dezavantajul metodei test-retest const n faptul c pretinde dou administrri ale
testului, ceea ce necesit timp i cheltuieli materiale.
Fidelitatea determinat prin utilizarea unor forme paralele/ alternative
Utilizeaz de obicei 2 forme diferite ale aceluiai test; ambele forme sunt date
tuturor subiecilor n cadrul aceleiai edine, echilibrnd administarea ca test prim i
secundar. Dac nu sunt date n acceai zi, se numete forme alternative ntrziate. Sunt
corelate cele dou scoruri ale aceleiai persoane.
Dac cele dou teste sunt paralele i dac pentru fiecare persoan erorile de msur
la cele dou administrri sunt variabile aleatoare independente, atunci coeficientul de
echivalen coincide cu coeficientul de fidelitate al fiecrui test.
Un caz particular al metodei formelor paralele l constituie metoda njumtirii
(split-half). n literatura de specialitate, aceasta este inclus uneori n cadrul analizei
consistenei interne.
Metoda njumtirii are urmtorii pai:
Se administreaz testul unui lot de persoane.
Se mparte testul n dou pri ct mai asemntoare ntre ele.
Se calculeaz coeficientul de corelaie ntre scorurile observate la cele dou
jumti.
Metoda formelor paralele este potrivit n cazul cnd se urmrete msurarea
unor caracteristici generale ale persoanelor.
Obs. Asemenea caracteristici vor influena n acelai mod scorurile ambelor teste.
Fidelitatea Kuder Richardson -Msoar statistic consistena intern a testului, formula KR
estimnd care este fidelitatea medie dac ai administra testul realiznd toate tipurile de
njumtiri posibile.Un tip special este KR 20, care realizeaz acelai lucru pentru acele teste
unde itemii sunt dihotomici.
Coeficieni de consisten intern indic msura n care itemii testului se refer
la acelai lucru. Metoda analizei consistenei interne utilizeaz pentru estimarea fidelitii unui
test dispersiile i covarianele scorurilor observate ale itemilor. Se practic o singur
administrare a testului. Pe baza scorurilor le itemilor se calculeaz de obicei unul dintre
urmtorii coeficieni:
coeficientul Alfa () al lui Cronbach;
coeficientul Lambda () al lui Guttman;
coeficientul : r20 sau r21 al lui Kuder-Richardson (dac itemii testului sunt
binari).
Aceti coeficieni sunt utili pentru calculul fidelitii testelor care msoar o caracteristic
(trstur) unidimensional. Indic caracterul omogen al itemilor testului sau scalei acestuia.
Cnd avem de ales dintr-o mulime de teste avnd toate celelalte caracteristici egale,
este de preferat testul care are cea mai mare fidelitate. n selecia profesional, de pild, se vor
folosi teste care au coeficieni de fidelitate mai mari dect 0.90.
Se vor accepta nivele sczute de fidelitate atunci cnd testele se utilizeaz pentru a
lua decizii preliminare, nu finale, i n cazul testelor care mpart persoanele ntr-un numr
mic de categorii, pe baza unor diferene individuale mari.
Dac un test servete la compararea grupelor de persoane, coeficientul su de
fidelitate poate fi mai mic, chiar cuprins ntre 0.6 i 0.7. Dac, testul se folosete pentru
compararea persoanelor, una cu alta, coeficientul su de fidelitate trebuie s fie mai mare
dect 0.85.
Observaii practice:
Fidelitatea chestionarelor de personalitate i a celor de interese tinde s fie mai mic
dect cea a testelor cognitive (de cunotine, de inteligen, de aptitudini speciale,
Aiken, 1994).
n general, se ntlnesc de obicei coeficieni de fidelitate cuprini ntre 0.70 i 0.98
(Guilford, 1965).
Testele cotate obiectiv care msoar aptitudini cognitive pot furniza, n loturi eterogene
de persoane, coeficieni de fidelitate mai mari dect 0.8.
Testele cotate subiectiv care msoar aptitudini, testele de cunotine i cele care
evalueaz performane tipice (de exemplu chestionare de personalitate) au, adesea,
coeficieni de fidelitate mai mici dect 0.80 (Traub, 1994).
Testele standardizate de cunotine au, n general, o fidelitate mare spre moderat.
Testele cu alegere multipl pot avea o fidelitate mai sczut. Coeficientul lor de
fidelitate este apropiat de 0.75.
PROPRIETI PSIHOMETRICE: VALIDITATEA
Definiie- validarea unui test este procesul prin care se investigheaz gradul de validitate a
interpretrii propuse de acesta (APA. Standards 1985); gradul n care testul msoar ceea
ce se presupune a msura.Validarea nu se mai refer att la instrumentul n sine, ci la
interpretarea datelor furnizate de el. Dar, pentru o interpretare corect a scorurilor unui test este
necesar s fie ndeplinite dou condiii (Albu, 1995): s se tie exact ce reprezint scorurile
testului si msurrile tcute de test s fie corecte.
Standardele APA (1985) propun patru categorii eseniale de definire a validitii
denumite cele patru fee ale validitii i care n prezent au devenit patru strategii ale
validrii inferenelor fcute pe baza scorurilor de test:
1. validitatea conceptual;
2. validitatea de coninut;
3. validitatea predictiv;
4. validitatea concurent.
Faete ale validitii
Validitate de coninut: validitatea itemilor specifici ai testului; include i validitatea
de aspect (de faad)
Validitatea de construct: gradul n care testul relaioneaz cu constructul teoretic
subiacent testului
Validitatea de criteriu: abilitatea unui test de a prezice cu acuratee performanele
4
dac ntre ele exist sau nu o relaie semnificativ, adic dac testul are sau nu o valoare
predictiv.
Metoda are avantajul c utilizeaz subieci existeni pe post, deci uor de grupat i
examinat; dezavantajul rezid n valoarea predictiv a coeficientului de validitate obinut.
De exemplu, o corelaie mare ntre un test de mecanic i performanele profesionale nu ne
spune nimic legat de faptul dac aceasta exprim o aptitudine sau cunotine cu care cel
testat a venit s se angajeze sau este rezultatul unei achiziii la locul de munc pe care l
deine. Un alt dezavantaj este i faptul c persoanele pe care le avem la dispoziie
reprezint numai o parte din eantion, al celor care au rezistat n timp la cerinele postului,
nu i cei care ar fi fost incompeteni n postul n cauz. Este vorba deci de un lot
selecionat.
Validitatea n raport cu criteriul: proiectarea predictiv
Validitatea predictiv este caracterizat prin aceea c ntre administrarea testului i
obinerea informaiilor criteriu se las un anumit interval de timp. Astfel, un test de
aptitudini mecanice administrat la angajare, este corelat cu performanele profesionale
recoltate dup un an; un coeficient de validitate semnificativ va fi astfel un indicator al
capacitii predictive a testului experimentat. De menionat c n acest caz testul nu este
utilizat ca instrument de selecie dect dup ce i-a dovedit utilitatea (dup ce a fost
validat). Obinuit, coeficienii de validitate, n acest caz, sunt mai realiti, mai apropiai de
realitate.
Coeficientul de validitate
R este coeficientul de validitate; ridicat la ptrat indic variania scorurilor la test
explicat de test
De exemplu: dac r este .80, atunci coeficientul de validitate la ptrat va fii .64 ceea
ce nseamn c 64% din varian poate fi explicat de test.Se apreciaz c un test are validitate
de criteriu bun atunci cnd coeficientul de validitate este mare. Valoarea coeficientului de
validitate evideniaz gradul n care randamentul la test coreleaz cu rezultatele la criteriu.
Valoarea coeficientului este influenat de o serie de factori avnd n vedere c, de
regul, mai ales cnd apelm la modalitatea predictiv, exist o durat de timp ntre
cele dou serii de msurtori. n orice caz, dou aspecte sunt implicate:
1. natura i specificul grupului (vrst, sex, pregtire profesional)
2. caracter omogen sau eterogen al eantionului (val. coeficientului de corelaie e mai
mare)
Majoritatea consider c valoarea corelaiei trebuie s fie suficient de mare pentru a fi
semnificativ la un prag de 0.01 - 0.05
n experiena obinut, valoarea coeficientului de validitate predictiv al unui test
este cuprins ntre 0 i 0.60, n majoritatea cazurilor fiind situat n partea inferioar a
intervalului (Guilford, 1965)
Validitatea de coninut
Acest tip de validitate se refer la eantionul de itemi din care este alctuit testul (i
eantionul de comportament evideniat de aceti itemi), dac reprezint ntr-adevr
domeniul (atributul sau nsuirea de personalitate) din care a fost eantionat. De exemplu,
dac cineva dorete s selecioneze dintr-un grup de candidai pentru postul de dactilograf,
pe civa dintre ei, n bateria de teste va include i unul de dactilografiere. Acest test va fi
bine reprezentat de itemi specifici activitii respective (aptitudinea de dactilografiere).
Validitatea de coninut este determinat de ct de bine materialul testului ncorporeaz un
6
eantion de itemi conectai cu profesia n care este utilizat. Urmtorul demers n studiul
validitii de coninut, presupune analiza de itemi ai testului. Se elimin itemii care nu se refer
la comportamentele cuprinse n domeniul de coninut la care se refer testul.
Validitatea de construct
Validitatea de construct a unui test de inteligen este n esen un rspuns la
ntrebarea: Acest grupaj de operaii (testul) msoar n realitate acel ceva (construit
ipotetic sau abstract) pe care noi l etichetm ca inteligen?. De fapt, aceasta este cea mai
teoretic definiie a validitii ntruct se refer la abstraciile care definesc structuri, funcii
sau nsuiri psihologice i nu la predicia unor criterii externe. O informaie despre
validitatea de construct ne poate fi oferit i de la corelaia unui test nou construit cu altul
consacrat, despre care tim c msoar o anumit calitate.
Validitatea de construct este denumit i validitate ipotetico-deductiv. Ea este
strns legat de ilustrarea unor comportamente observabile mijlocit sau nemijlocit
(comportamentul inteligent al managerului, creativitatea sculptorului, ingeniozitatea
pompierului etc.). Adesea ntlnit i sub denumirea de validitate conceptual, validitatea
de construct presupune o descriere ct mai adecvat a constructorului n termeni
comportamentali concrei explicarea constructorului (Murphy & Davidshofer, 1991). Ea
presupune parcurgerea a trei pai:
1. Se identific setul de comportamente care au legtur cu constructul msurat de test.
2. Se identific constructele, pentru fiecare decizndu-se dac are sau nu vreo legtur
cu constructul msurat de test.
3. Se face o list de comportamente prin care se manifest constructele respective.
n final, un test pentru a fi valid trebuie s fie fidel.
n practic, pentru a valida teoretic un test, se folosesc diferite tehnici i criterii care
ne ajut s identificm constructul msurat de test.
Criterii/proceduri folosite pentru validare:
1. Vrsta/dezvoltarea n timp a subiectului.
De exemplu, testele de inteligen pleac de la ideea implicit c inteligena copiilor
evolueaz n timp, cel puin pn la maturitate, deci orice test de inteligen trebuie s arate
o cretere a performanei copiilor pe msur ce avanseaz n vrst. Dac un test nu relev
o asemenea evoluie pe vrste, nseamn c el nu msoar inteligena. Acest criteriu al
vrstei nu este valabil i pentru testele (n special de personalitate) care msoar trsturi
relativ stabile de la o vrst la alta (temperamentul, agresivitatea, dominana etc).
De asemenea, acest criteriu al vrstei este necesar dar nu suficient pentru a valida
teoretic un test. Odat cu vrsta copiii cresc i n nlime i n greutate.
n fine, acest criteriu al vrstei nu este universal pentru toate culturile i societile,
nici mcar pentru testele de inteligen. n societile moderne oamenii investesc n
instruirea copiilor, n special n abilitile matematice, pe cnd ntr-o societate de tip
tradiional (mediu rural)/primitiv nu exist o astfel de cultur numeric aceti copii nu vor
avea o inteligen matematic semnificativ mai mare dect copii mai mici.
2. Corelaia cu alte teste este folosit uneori ca dovad c testul msoar/atinge
aproximativ acelai domeniu de comportament ca un alt test mai vechi, dar corelaia
dintre cele dou teste nu trebuie s fie prea mare, ci doar moderat pentru c altfel
noul test nu-i are sensul dac nu ar avea alte avantaje. Exemplu: n general,
depresivii prezint i un anumit grad de anxietate, dar corelaia dintre un test de
depresie i unul de anxietate trebuie s fie moderat (nu foarte mare pentru c astfel
7
Dac un test este incapabil s prezic ceva (performana viitoare), rxy ar trebui s
fie 0, atunci SEE=SDy. Practic, dect s aplici testul ca s faci o predicie despre subiect,
mai bine ghiceti.
SEE ne arat de fapt cu ct cresc ansele noastre s prezicem corect evoluia
subiectului n baza scorului la test, fa de simplul ghicit.
2. Prin cte metode trebuie validat un test?
Depinde de natura testului i de scopul lui. (pn acum am discutat despre 12
metode vezi validitatea de criteriu, validitatea de construct)
De exemplu:
dac avem un test de cunotine este suficient s folosim validitatea de coninut;
dac avem un test de aptitudini i vrem s prezicem evoluia subiectului trebuie s
foloseti metoda validrii predictive;
dac vrem s evalum starea actual a subiectului pe o anumit trstur, foloseti
proceduri de validare concurent (corelezi performana la test imediat cu un criteriu
disponibil imediat).
3. Cnd este nevoie s revalidm un test?
Ori de cte ori acelui test i se aduce o modificare (n natura itemilor ori n instructaj,
ori n alte caracteristici) i, de asemenea, atunci cnd l traduci dintr-o alt limb i atunci
cnd vrei s-l aplici pe o populaie diferit de cea pe care a fost validat testul trebuie
revalidat. Majoritatea testelor serioase, cnd fac diferite validri, tind s replice demersurile
de validare pe diferite loturi de subieci, repet acest proces de mai multe ori ca s se
asigure c acei coeficieni rmn apropiai de la o testare la alta.