Sunteți pe pagina 1din 32

CONSTRUCTIA TESTELOR PSIHOLOGICE

Sursa: P. Kline Handboock of Psychological Testing

I.

PROBLEMATICA
CONSTRUCTIEI
TESTELOR,
A
PARTICULARITAILOR ACESTEIA, FUNCTIE DE CATEGORIA
INSTRUMENTELOR DE TESTARE SI DE DOMENIUL IN CARE SE
APLICA

Vorbind de constructia testelor psihologice se au in vedere testele de aptitudini si


testele care evalueaza trasaturile de personalitate, structura acesteia, precum si
diversele dezordini psihice. Includem inventarele de personalitate aici, deoarece prin
structura lor constituie instrumente metodologice aidoma testelor de capacitate.
A doua categorie, testele de cunostinte, construite, in concordanta cu programa
educationala in scoli generale, licee, facultati, trebuie sa respecte intocmai standardele
constructiei, administrarii si implementarii testelor psihologice in vederea asigurarii
reliabilitatii masuratorilor. pentru ca numai astfel aplicarea acestor instrumente
permie luarea unei decizii corecte la orice nivel.
Problematica constructiei testelor psihologice si a testelor in general, include, de
asemenea, unele principii teoretico-metodologice ale adaptarii testelor dintr-o cultura
si limba sursa, intr-o alta cultura si limba tinta.
Teoretizarea problematicii adaptarii lingvistice si culturale a testelor psihologice
este cu atat mai justificata cu cat multa vreme, cam pana in deceniul al -IX-lea al
secolului trecut, multi autori au considerat suficienta traducerea corecta intr-o alta
limba, decat cea de origine, a anumitor teste de aptitudini si mai ales anumitor
inventare de personalitate.
(Ronald K. Hambleton si P. Merenda Adaptarea testelor psihologice si
educationale pentru evaluarea comparativa a mai multor culturi)
II.

PASII ESENTIALI AI CONSTRUCTIEI TESTELOR

1. Determinarea trasaturii, a abilitatii, a starii emotionale a tulburarii care ne


intereseaza si nu in ultimul rand a atitudinii care umeaza sa fie masurata.
NB: In problematica constructiei si adaptarii testelor psihologice trebuie inclusa si
metoda sondajelor de opinie atunci cand acestea sunt utilizate de psiholog. Pentru a
obiectiva preferinte, atitudini, este necesar sa se satisfaca aceleasi exigente de natura
psihometrica pe care de obicei le adresam testelor psihologice.
Abilitatile se refera la latura instrumentala a personalitatii, respectiv la acele
aptitudini care au fost obiectivate in performanta.
Ex.: aptitudini muzicale, de inteligenta, aptitudine tehnica, matematica,
comprehensiune a scrisului etc.
Cand vorbim de trasaturi ale personalitatii, ne gandim in principal la acele dimensiuni
care exprima modurile constante de comportament in conduita oamenilor, in general.

Exemplu: extroversiunea, psihotismul, devianta, creativitatea;


2. alegerea manierei in care constructul respectiv va fi masurat
In general, o masuratoare adecvata a conceptului trebuie sa fie efectuata asupra unui
esantion de comportament, intrucat comportamentul in intregime nu este accesibil. Pe de
alta parte, conceptul respectiv va fi testat mai degraba indirect decat direct, datorita unor
limitari de ordin metodologic si etic.
Exemplu: masurarea agresivitatii este realizata indirect prin intermediul manifestarilor
comportamentale care insotesc comportamentul de frustrare. O buna cale ar fi sa
introducem persoana testata intr-o situatie de frustrare, dar cea mai buna cale este aceea
de a ne bizui pe capacitatea individului de a relata despre propriile sale experiente legate
de nodul cum s-a comportat in cutare si cutare situatie frustranta. In cursul acestei etape,
constructorul de test trebuie sa-si puna problema daca testul va fi administrat in scris sau
oral, daca raspunsurile vor fi discrete sau de tipul DA/NU (raspunsurile discrete sunt
specifice scalelor de masurare care implica mai multe variante). Exista si optiunea ca
raspunsurile sa fie deschise daca acestea pot fi evaluate reliabil (cu exactitate). De
asemenea, in legatura cu raspunsurile la itemi, constructorul trebuie sa ia decizia daca ele
vor fi orale, scrise sau nonverbale.
3. stabilirea daca constructul ce urmeaza a fi masurat are una sau mai multe
dimensiuni si cum ar putea acel construct fi impartit in mai multe dimensiuni
4. scrierea itemilor
Daca este evaluata o trasatura de personalitate sau o stare emotionala, atunci itemii ar
trebui sa fie concordanti cu teoria sau cu descrierea care este data caracteristii ce
urmaeaza a fi evaluata. Se apeleaza la cativa experti pentru a genera acesti itemi. Daca
este insa masurat nivelul de cunoastere intr-un anumit domeniu, atunci trebuie apelat la
manuale si tratate ale domeniului respectiv sau la experti.
In legatura cu redactarea itemilor exista o discutie extrem de ampla asupra careia vom
mai reveni.
5. apelarea la experti dupa generarea itemilor pentru a evalua calitatea acestora in
vederea retinerii doar acelora care intrunesc rangurile cele mai inalte
In general acesti experti trebuie sa provina din domeniile pe care testul le are in
vedere.
Exemplu: itemii pentru masurarea depresiei ar trebui evaluati de catre experti in
domeniul sanatatii mentale (psihologii clinicieni)
6. pilotarea sau pretestarea testului
Esantionul utilizat pentru pilotare ar trebui sa reprezinte o extractie reprezentativa din
populatia cu care persoana testata in viitor va fi comparata. Odata administrat testul pe
esantionul pilot, se intrepirnd urmatorele operatiuni:
a) determinarea corelatiei dintre fiecare item si scorul general. In cazul in care testul
are in compozitia sa alte subteste, aceasta procedura trebuie realizata inclusiv la
nivelul fiecarui subtest pentru a fi inlaturati itemii care nu coreleaza semnificativ
cu scorul total;
b) eliminarea itemilor prea facili sau prea dificili. Aceasta procedura va maximiza
consistenta interna a testului. Consistenta interna constituie o masura a fidelitatii
testului;

c) se calculeaza coeficientul Alfa-Kronbach. Aceasta statistica exprima masura in


care un subtest sau testul insusi, cand nu are in componenta alte subteste, masoara
un singur construct, respectiv gradul in care toti itemii masoara aceeasi abilitate
sau trasatura.(> 0,70)
7. validarea si crossvalidarea testului
Validarea reprezinta corelarea performantelor obtinute pe un esantion la test cu
performantele aceluiasi esantion la o activitate (ex. : notele la matematica pentru un test
de inteligenta scolara).
Crosvalidarea reprezinta utilizarea unui alt esantion extras din aceeasi populatie prin
care sa se realizeze o noua validare.
8. calcularea datelor normative
Se calculeaza o serie de statistici (tendinte centrale, medie, abatere standard etc) care
permit convertirea scorurilor individuale la test in exprimari calitative, bazate pe
compararea scorului individual cu performanta esantionului normativ.
Metode de construcie ale testelor psihologice

Construcia testelor psihologice se fundamenteaz pe operaiunea de scriere a


itemilor. Dup ce itemii au fost redactai, ei trebuie administrai unui eantion de
ncercare (pilotare). Datele sunt supuse unor proceduri statistice destinate s produc un
test valid, reliabil i fidel, si de preferin s msoare un singur factor.
Exist dou metode des utilizate n construcia testelor psihologice:
1. Metoda bazat pe criteriu
2. Metoda analizei factoriale
1. Metoda de construcie bazat pe criteriu
Itemii sunt selectai dintr-o colecie mai larg n msura n care ei pot s
discrimineze unul sau mai multe grupuri pe care le confruntm cu un grup de control. O
astfel de metod are o larg aplicare n construcia testelor clinice, dar nu numai (MMPI,
SVIB).
Raiunea care st la baza acestei metode este aceea de a genera itemi care n
mod pragmatic i nu teoretic discrimineaz, de exemplu, un grup de maniaci, de grupul
de control normal.
Un item va fi selectat dac va discrimina grupul criteriu de grupul de control, indiferent
dac e evident, sau exist sau nu o baz teoretic pentru a face acest lucru. Din aceast
cauz, este de ateptat ca itemii s aib o validitate de faad sczut i s poat fi
completai de subieci cu o mai mic probabilitate n intenia de a falsifica rspunsul.
Principalele utilizri ale testelor elaborate prin metoda bazat pe criteriu sunt
legate de acele contexte unde este necesar ca anumite grupuri s fie discriminate
(diagnoz, selecie, consiliere).
Ceea ce conteaz este abilitatea de a discrimina i nu nelegerea motivelor pentru care
testul face aceast discriminare.
n multe proceduri de selecie este util ca subiecii s fie decelai, depistai, dac nu
ndeplinesc anumite cerine eseniale pentru exercitarea uni job.
Exemplu: Paul Klein- Manual de testare psihologic

Soldaii care ar trebui s lucreze n buncrele care adpostesc armele nucleare ar trebui s
fie depistai, mai nti, cei instabili psihic sau care manifest trsturi psihopatice.
Un instrument realizat prin aceast metod va fi capabil s discrimineze
persoanele instabile i care manifest trsturi psihopate.
n diagnoza psihopatologic, datorit faptului c unele tratamente pot fi diferite n
cazul unor categorii de dezordini mentale, un test construit prin aceast metod va putea
discrimina un grup clinic de altul, fcnd astfel posibil mai buna compatibilizare a
tratamentului.
n consilierea vocaional practicienii, pe baza rezultatelor la un astfel de test,
vor putea stabili dac patternul de scoruri al unui subiect este asemntor unui anumit
grup ocupaional. Pe aceast baz va discuta posibilitatea formrii sau angajrii ntr-un
post din aceast categorie.
Dezavantaje:
-Dificultatea constituirii grupurilor criteriu ( n clinic i n psihiatrie clasificarea
n grupuri diagnostice este destul de dificil, ntruct itemii care discirmineaz
bine n faza de prob sunt mai puin discriminativi ntr-o etap ulterioar)
-MMPI- n afar de fidelitatea sczut, exist o clasificare psihiatric, un slab
acord n legtur cu conceptele, categoriile care ar trebui utilizate (utilizeaza o
nosologie elaborat de Kraepelin)
-Lipsa de semnificaie (neles psihologic)
Exemplu- MMPI:
Itemii consacrai scalei maniacale au fost selectai n msura n care au
putut discrimina maniacii de normali sau alte grupuri clinice
Maniacii nu difer printr-un singur lucru de celelalte categorii
nosologice, asa cum presupune utilizarea acestei metode.
De aceea, astfel de scale nu vor fi, aa cum ne-am dori, unifactoriale
Dei doi subieci ar avea acelai scor, ele nu sunt echivalente din punct
de vedere psihologic pentru ca nu putem ti ce msoar de fapt fiecare
dintre ele ,deoarece nu tim care variabile intervin in cele doua scoruri
( dac un subiect obine un scor x la scala maniacal, nu exist o
semnificaie atribuit acestui scor, ci faptul c scorul seamn cu cel al
grupului maniacal).
-Teste create prin acesata metoda sunt instrumente care opereaz dup o metod
oarb, fr semnificaie psihologic a rezultatelor, care doar discrimineaz
-n grupurile selecionate e greu s gseti un grup foarte slab (ei sunt deja
preselectai).
Pai n construcia testelor prin metoda bazat pe criteriu
1. Fixarea grupului/ grupurilor criteriu
-n alte situaii se fixeaz un scor la criteriu care are valoare difereniatoare
Exemplu: una din metodele de interpretare EPQ este aceea de a realiza un scor
unic pentru extraversie/introversie, un altul pentru neuroticism i un altul pentru

minciun; pentru minciun se stabilete un scor critic, dincolo de care


chestionarul nu mai poate fi interpretat, sau trebuie interpretat cu atenie.
Scorul mic la extraversie presupune stabilirea unui prag care difereniaz
extravertiii de intravertii.
n acest stadiu trebuie constituite dou grupuri criteriu care vor fi
comparate (grupuri disjuncte). Exist metode statistice de a radicaliza grupurile,
astfel nct s mrim diferena care ar putea exista ntre ele din punct de vedere al
criteriului (se elimin cei cu note medii, se pstreaz doar cei cu note extreme, iar
acestea se transorm n note t).
2. Stabilirea mrimii eantionului
Cu ct este mai mare numrul componenilor grupurilor criteriu i de control, cu
att mai mare este fidelitatea.
3. Pilotarea
- o colecie de itemi, din care vrem s derivm testul final va fi administrat
grupului criteriu, de la care vom obine abumite scoruri
- ar trebui s utilizm un eantion de cel puin 200 de indivizi, iar dac avem i
brbai i femei, minim 200 din fiecare
4. Analizele statistice
-scopul de a selecta itemii nalt discriminativi
-o metod este de a compara scorul mediu al celor dou grupuri pentru fiecare
item
-puterea discriminativ a itemului este verificat prin testul T (Student)
-atunci cnd avem i brbai i femei ar trebui efectuate analize statistice separate
-ar trebui selectai itemi care sunt echivaleni i pentru brbai i pentru femei
(statisticile itemilor pentru brbai s fie identice cu cele ale femeilor).
Utilizarea analizei factoriale n validarea testelor elaborate prin metoda
bazat pe criteriu
Scopul aplicrii analizei factoriale este s demonstreze c testul va discrimina
grupurile aa cum a intenionat constructorul testului.
Aceast procedur implic dou modaliti:
a. factorizarea scalelor
b. factorizarea itemilor
a. Factorizarea scalelor
Este posibil ca acestea s fie localizate n spaiul factorial; aceasta implic
factorizarea scorurilor, mpreun cu cei mai importani factori de personalitate.
b. Factorizarea itemilor
-Sunt analizate factorial scorurile obinute de subiecii din eantion la toi itemii

-Analiza factorial va arta ce msoar itemii i msura n care ei o fac n mod


similar cu alte scale
-Va indica factorii care prezint importan n discriminarea grupului criteriu.

2. Metoda analizei factoriale utilizat n construcia testelor psihologice


Klein:
1. Analiza factorial
2. Analiza itemilor
1. Analiza factorial
-n construcia testelor scopul este de a produce teste saturate ntr-un singur factor
(teste unifactoriale)
-Un astfel de test este fidel i valid (msoar un singur factor)
Avantajul testelor unifactoriale: scorurile la teste au un sens psihologic, care rmne
ntotdeauna acelai. Dou scoruri de 10 reflect acelai status cu privire la factorul
msurat de test; nu acelai lucru este i pentru doi factori; nota 10 ar putea fi rezultatul
notei de 5 la fiecare factor.
Este relativ uor de construit mai multe teste odat dect o singur scal.
Este necesar s se realizeze iniial un numr dublu de itemi dect cei necesari sau stabilii
anterior. Numrul nu trebuie s fie nici prea mare, ntruct pot interveni plictiseala i
oboseala.
Eantioanele trebuie s aib ca rezultat un numr suficient de mare de subieci inclui n
studiu, cu scopul de a minimiza eroarea standard a corelaiilor (minim 100 de subieci).
Corelaiile ntre itemi trebuie realizate nainte de analiza factorial. n vederea
calculului corelaiei ntre scorurile la itemi se folosesc diverde proceduri:
-Corelaia lui Pearson este adecvat pentru calculul corelaiei dintre itemii care
sunt prevzui cu scale de rspuns cu 3-5 puncte.
Privitor la analiza factorial, constructorul de teste trebuie s ia o serie de
decizii n legtur cu metoda de analiz factorial, numrul de factori rezultai n urma
rotaiei Varimex, alegerea tipului de rotaie i obinerea valorii p (indexul de rezoltivitate
al itemului).
a. Analiza n componente principale
-Privitor la alegerea factorilor rotii, cea mai bun alegere este de a analiza nti
prin analiza elementelor principale i de ndeprtat factorii nesemnificativi.
-Cea mai bun metod de rotire a factorilor este rotaia ortogonal Varimex.
-Valoarea p reprezint propria de subieci din eantion care a rezolvat corect
itemul, i ea trebuie s fie cuprins ntre 0,20 i 0,80 (sub 0,20 va fi dificil, iar
peste 0,80 va fi facil i nesemnificativ).
Analizele trebuie s fie realizate separat pe sexe.

Paul Klein: unele diferente obinute nu reprezint dect artefacte (consecine ale itemilor
i nu diferene ntre sexe). Diferenele reale ar trebui testate prin metoda ipotezei de nul i
prin testul T al lui Spearman.
b. Analiza de itemi n construcia testelor psihologice
Are ca scop selecia itemilor nalt discriminativi (metoda de a corela fiecare item cu
scorul total la test n scopul de a produce un test unifactorial omogen). Fiecare item ar
trebui s msoare ceea ce msoar testul n ansamblu. Itemul este discriminativ dac
valoarea p este cuprins ntre 0,20 i 0,80.
Avantajele analizei de itemi:
-Nu este necesar s avem un esantion foarte mare de subieci (este suficient un
eantion de 100 de subieci)
-Nunnally- pilotarea itemilor se realizeaz pe un numr mai mic de subieci.
O alt metod de construcie, care nu se bazeaz pe teoria clasic a erorii de msurare
este Teoria Rspunsului la Itemi. Aceasta opereaz cu cel mult dou caracteristici ale
itemilor: puterea discriminativ i gradul de dificultate. Ca pretenie, aceast metod
presupune un numr mai mic de subieci cuprini n eantionul de calibrare. n realitate,
construcia scalei Rash presupune minim 1000 de subieci (Klein).
Problematica privind construcia i funcionarea testelor de tip tailored, a scalei
Guttman i a sclai Lykert este n general aceeai ca la analiza factorial i metoda bazat
pe criteriu.
12 pai de construcie a testelor psihologice
Sursa: Handbook Of Test Development, Steven M. Downing, Thomas M. Haladyna
Lawrence Erlbaum, 2006
Constructia testelor psihologice eprezint o abordare sistemic, bine organizat, pentru
a asigura suficiente dovezi privitoare la validitatea interpretrilor scorurilor la test,
interpretri care au o int pragmatic, cu implicaii dintre cele mai critice asupra
oamenilor.
Construcia testelor psihologice tinde s devin o specializare de sine stttoare a
psihologilor, care beneficiaz astzi de un cadru normativ (standards for educational and
psychological testing) i reglementeaz i ghideaz specialitii n construcia testelor
psihologice.
n aceast expunere, noiunea de test psihologic nglobeaz, nu ntotdeauna
justificat, i alte tipuri de teste, cum sunt cele de cunotine (achieffment tests) sau cele
pentru autorizarea sau certificarea specialitilor n diverse domenii de activitate.
Testele de cunotine sunt acele teste care evalueaz cunotinele dobndite de ctre
elevi sau studeni. Ele se deosebesc de skils tests, care msoar nivelul de competen al

unui specialist ntr-un domeniu (aa-zisul test de capacitate funcionreasc- clerical test
aptitude).
Este esenial ca indiferent de ce tip de tedt este vorba, toate trebuie s se
conformeze standardelor de natur tiinific, pe care comunitatea tiinific
internaional le respect.
Activitile asociate termenului de construcie a testelor psihologice se refer la
detalii i probleme a cror rezolvare intete realizarea unor instrumente care s se bizuie
pe un fundament solid n interpretarea i valorificarea scorurilor.
Autorii detaliaz procesualitatea stadial de construcie a testelor psihologice n 12 pai:
1. Stabilirea planului general
2. Definirea domeniului coninutului
3. Stabilirea specificaiilor testului
4. Elaborarea itemilor
5. Stabilirea designului testului
6. Producia testului
7. Administrarea testului (pentru validare, standardizare)
8. Stabilirea modalitilor de scorare a rspunsurilor
9. Stabilirea scorurilor de admisibilitate
10. Prezentarea rezultatelor
11. Banca de itemi
12. Raportul tehnic
1. Planul general
Stabilete cadrul general al tuturor activitilor implicate n construcia testului:
Construcia propriu-zis
Interpretare
Formatul testului
Identificarea surselor majore de validitate a testului
Inferenele ce urmeaz a fi efectuate
Stabilirea unor termene
Stabilirea elementelor de securitate
Controlul calitii
Face explicite cele mai multe decizii care vor fi luate pe parcursul construciei testului.
Fixeaz n mod realist termenele de finalizare ale fiecrei etape. Este definit clar i oncis
scopul testului. Operaionalizarea teoriei subiacente in itemii testului va influena toate
deciziile luate pe parcurs, privitor la validitatea instrumentului.
Definirea coninutului, delimitarea constructului teoretic (etapele urmtoare) sunt
strns dependente de modul n care a fost definit scopul testului.
Strns legate de definirea scopului sunt o serie de decizii fundamentale, pe tot parcursul
testului i n prima faz:
-Cine va scrie itemii
-Cine va verifica itemii
-Cine va selecta itemii
-Cine va fi productorul
-Cine va implementa pe PC (dac e cazul)

-Ce controale de calitate vor trebui ntreprinse pentru acuratee i precizie


-Cum, cnd, cine va pilota testul
-Care sunt termenele pentru fiecare etap
-Cine este responsabil cu realizarea ntregii documentaii a testului i evaluarea
final.
2. Definirea coninutului
Se refer la coninutul pe care testul trebuie s l testeze i la delimitarea
coninutului de cunotine, capaciti, deprinderi i aptitudini care urmeaz s fie
eantionat n itemii testului. Mai ales testele de abiliti i de cunotine se bazeaz pe
validitatea de coninut (totalitatea itemilor constituie un eantion reprezentativ pentru
coninutul msurat).
Validitatea inferenelor care vor fi fcute de utilizatorii testului, mai ales la testele
de cunotine, se bazeaz pe gradul de adecvare a metodelor utilizate n definirea
operaional a coninutului, domeniului i constructului msurat.
Metodele de a defini coninutul variaz n funcie de scop i consecinele luate pe
baza testrii. Aceste metode depind de ct de bine trebuie susinute, inclusiv n instan,
deciziile luate de cel care interpreteaz testul.
Pentru un program de evaluare a cunotinelor cu o mai miz mai puin
important (evaluarea cunotinelor de mecanic la coala de oferi amatori) pot fi
utilizate metode simple de definire i delimitare a coninuturilor.
Exemplu: instructorii pot emite judeci de acest gen; ce anume ar trebui s ie
mai bine testat la cursanii colii auto, astfel nct s obin o evaluare valid a achiziiilor
acestora n domeniul mecanic.
Pentru evalurile cu mize mult mai mari, definirea coninutului trebuie s nceap
asemenea analizei postului. Coninutul poate s implice foarte muli bani i participarea
unor specialiti de nalt clas.
Exemplu: conducerea unei faculti tehnice ar dori s realizeze un test pentru
evaluarea achiziiilor din curricula primilor doi ani, ca o condiie pentru promovarea n al
treilea an de studiu. Toate deciziile privind coninutul, formatul, metodele de selecie a
coninutului, devin aspecte eseniale ale testului. Pentru a realiza testul, facultatea are
nevoie s dezvolte metode sistematice i directe de definire a coninutului, prin:
consultarea unor documente curriculare, a programelor de studiu, a manualelor, a
cursurilor, precum i prin consultarea opiunilor conducerii facultii privind
competenele finale. Facultatea poate implica specialiti n fiecare disciplin curricular.
Profesorii ar putea fi rugai s utilizeze metode empirice (probe de lucru) pentru a ranga
importana anumitor coninuturi, pentru a fi testate. Evalurile ar putea fi rafinate cernd
conducerii facultii s aprecieze criticabilitatea fiecrui coninut, ct de esenial este
pentru activitile viitoare de nvare sau pentru succesul activitilor practice conexe
disciplinei. Aceasta ar nsemna delimitarea unui coninut complex, mpreun cu un plan
de a eantiona acel coninut n itemii viitorului test.
3. Stabilirea specificaiilor testului
a. Eantionarea sistematic a coninutului

Se ia o decizie privitoare la dimensiunea eantionrii, numrul de itemi, ct de


reprezentativ trebuie s fie acest eantion, dac e stabilit pe criterii aleatoare
sau prin stratificare.
b. Stabilirea normelor sau a criteriilor de referin
Norma sau criteriul de referin se refere n acest context la tabelul de norme
(cum vor fi stabilite normele: percentile sau clase normalizate).
Fiecare sistem de normare i gsete utilitatea n funcie de o serie de indici
statistici de start.
c. Caracteristicile itemilor
Specificaiile testului privesc decizii dac itemii vor fi implementai pe PC sau
vor avea forma traditionala.
Aceast etap i gsete prelungirea logic n etapa a patra.
4. Elaborarea propriu-zis a itemilor
Dezvoltarea unor itemi eficieni care s elimine pe ct posibil variaia irelevant a
constructului (CIV). Aceast apar datorit erorilor de elaborare a itemilor nerezolvate n
aceast etap.
Formatul itemilor presupune o decizie foarte important n legtur cu scopul i
coninutul testrii. Itemii pot fi cu alegere multipl sau cu rspuns liber. Alegerea
formatului itemilor este o surs important de dovezi privitoare la validitatea testului.
Scrierea itemilor este o specializare de sine stttoare (psiholog cu expertiz n
domeniul coninutului care trebuie msurat). De exemplu, in cazul testelor de inteligen
persoana respectiv trebuie s cunoasc strategiile de investigare a inteligenei.
A fi expert ntr-un domeniu nu decurge n mod automat c eti expert n
msurarea acelui domeniu. Scriitorii de itemi nu au aceast aptitudine ca fiind nnscut.
Ea este mai degraba o deprindere format i antrenat. Exersarea deprinderii de scriere a
itemilor se realizeaz de obicei n work-shopuri, unde cei antrenai beneficiaz att de
ghidare, ct i de feedback. Scrierea itemilor este pn la urm o capacitate care ine
inclusiv de creativitate.
Coninutul itemilor redactai formeaz obiectul unor serioase revizii, efectuate de
ali specialiti, ct i de ctre editorul testului respectiv, care are expertiza necesar de a
corecta anumii itemi deficitari din punct de vedere al coninutului, al claritii i al
preciziei cu care exprim coninutul respectiv.
5. Stabilirea designului testului
-Proiectarea i crearea formelor testului
-Selectarea itemilor pentru forme speciale
-Eantionarea operaional
-Probleme de pretestare
Validitatea interpretrii scorului final depinde n mare msur de calitatea
asamblrii itemilor n forma final.

Designul general este planificat n prima etap, odat cu modalitatea de


interpretare a scorurilor la test.
Metodele de asamblare a itemilor depind de modalitatea de examinare.
Testarea cu un singur test creion-hrtie presupune asamblarea manual de ctre
dezvoltatori, fr apelul la softuri specializate. Aceti experi vor putea utiliza diferite
softuri, fr ns ca acest lucru s fie caracteristic pentru aceast metod.
Dac trebuie asamblate simultan mai multe forme paralele ale unui test,
dezvoltatorii vor trebui s utilizeze softuri performante. Dac trebuie implementate pe PC
vor fi necesare softuri specializate care s asigure forma computerizat. Dac e un test
adaptativ, vor fi utilizate softuri foarte avansate care vor realiza asamblarea automat i
simultan a mai multor forme ale testului. Acele softuri vor manageria i vor rezolva
simulta multiplele probleme i caracteristici ale itemilor.
O problem important o reprezint formatarea (maximizarea citirii itemilor i
minimizarea dificultilor cognitive cnd nu au legtur cu constructul msurat).
Exemplu: un principiu de formatare este de a ncadra pe aceeai pagin att itemul, ct i
stimulul.
6. Producia testului
Se refer la activitatea de: editare, printare, implementare pe PC, securitate,
validare, control al calitii.
Fructific i materializeaz rezultatele etapelor anterioare (care dureaz luni, sau chiar
ani). Testul capt forma final. Testele sunt tiprite, adaptate n formatul necesar
administrrii pe PC (dac e cazul) i cel necesar livrrii pe pia.
Itemilor le este conferit formula final i inclusiv ordinea lor n test.
Se acord o importan deosebit problemelor de securitate (accesul membrilor stafului
care construiete testul la informaiile legate de test, erorile care pot s apar n aceast
faz).
Securitatea n timpul producerii se refer la accesul la fiierele electronice, transmiterea
datelor electronice, circulaia formelor pretiprite (n curs de adaptare). Se nltur erorile
de tiprire. Se asigur managementul caltii prin repetarea auditului (intervenia unor
experi).
7. Administrarea testului pilotare), pentru a obine datele care vor sta la baza
seleciei itemilor i a studiilor de fidelitate i validitate. Nu se face rabat de la
standardele care reglementeaz aceast problem privind administrarea testului in
faza de pilotare. Preocuparea pentru o administrare corect n faza de pilotare are
la baz faptul c anumite variabile nu se afl sub controlul administratorului:
gradul de oboseal, nivelul de motivaie, disconfortul psihologic, anxietatea legat
de test.
Una dintre soluiile soluiile atenurii aportului acestor variabile strine, la
variaia total a testrii, este standardizarea tuturor aspectelor care in de test/ testare.
Unele aspecte privind standardizarea administrrii:
a. Controlarea mediului fizic (nivel de iluminat, temperatur, zgomot, ventilaie,
factori distractori); o modalitate de a atenua aciunea acestor factori este aceea
de a administra testul ntr-o singur sesiune tuturor subiecilor implicai n

studiu, prin aceasta avnd loc o egalizare a aciunilor acestor variabile pentru
toi subiecii.
b. n administrarea testului, administratorul are urmtoarele responsabiliti:
S nu fixeze testarea la ore nepotrivite;
S nu programeze examenul imediat dup vacane sau dup
evenimente incitante;
Testarea s nu dureze mai mult de o or (pentru precolari nu mai mult
de 30 minute, iar pentru gimnaziu nu mai mult de 60 minute);
S informeze subiecii privitor la tipurile de sarcini pe care le vor
rezolva, ct de mult timp va fi alocat acestor sarcini;
n aplicarea anumitor tipuri de teste este nevoie de consimmntul
avizat al persoanei testate (cu ce scop este administrat testul, cine va
avea acces la rezultatele lui, cum vor fi folosite rezultatele).;
S fie familiarizat cu testul (trebuie s citeasc manualul i s-i
administreze testul siei nainte de a-l aplica altora); anumite ndrumri
specifice i proceduri trebuie revzute n ultimul timp, nainte ca testul
s nceap; s fie familiarizat cu procedurile de securitate (falsificarea
rspunsurilor, furnizarea de rspunsuri la ntmplare).
c. Privitor la persoana examinatorului, examinatorul trebuie:
S le ctige ncrederea (examinatul trebuie s cread c examinatorul
poate utiliza n interesul lui rezultatele testrii, c este capabil s
conduc n mod corect i fr eroare ntreaga procedur de aplicare a
testului
S aib urmtoarele trsturi: prietenos, obiectiv, autoritar, politicos,
inut potrivit i maniere adecvate.
d. Pe durata testului, examinatorul trebuie:
S rmn atent, pentru a preveni frauda
S fie pregtit pentru situaii speciale (cineva i-a uitat ochelarii acas,
sunt prezente persoane cu probleme medicale).
Administrarea testului constituie o etap n care echipa implicat n procesul de
construcie este preocupat de problemele de validare, de standardizare, teme legate de
securitatea testului i de fixare a duratelor cele mai potrivite, atunci cnd este vorba de un
test cu timp impus.
Exemplu: fixarea duratei de administrarea a unui test de aptitudini se realizeaz
asemntor aa numitelor speedy-test. Subiecilor li se d instructajul s lucreze ct pot
de repede, fr a neglija calitatea, preciznd c timpul este limitat. n momentul nceperii
testrii se pornete cronometrul. Pe msur ce subiecii anun finalizarea, se noteaz pe
protocol timpul realizat. Se procedeazo astfel pn ce ultimul subiect d testul. Se
consider ca fiind cel mai reprezentativ timp durata medie ntrunit de 80% dintre
subieci.

8. Scorarea rspunsurilor

Privete acurateea cu care sunt reprezentate performanele subiectului privitor la


constructul msurat (un anumit domeniu de cunoatere, la testele de cunotine, sau cu
privire la abilitile i capacitile care fac obiectul msurat, la testele de aptitudini).
Din perspectiva Teoriei rspunsului la itemi, ar fi ideal ca scorul obinut de un
subiect s corespund statutului su real n ce privete constructul sau domeniul msurat
(trstur latent).
O procedur esenial de control al calitii n construcia testelor psihologice o constituie
prescorarea itemilor, analiza de itemi, la care se adaug verificarea final a cheii de
scorare (modalitatea specific testului respectiv de acordare a unui punctaj, funcie de
calitatea rspunsului).
n aceast etap, datele rezultate din testare au ca scop depistarea itemilor care
scoreaz dubios sau au probleme de coninut. Aceast scorare preliminar i verificare a
cheii de scorare se realizeaz cu ajutorul experilor (stpnesc foarte bine domeniul de
coninut al testului). Astfel, dac este vorba de un test de cunotine n domeniul fizicii,
experii vor fi fizicieni.
Etapa de scorare este important pentru c pot fi depistai itemi eronai care nu au
putut fi descoperii n controalele precedente.
Validare cheie (verificare cheie) = scorarea preliminar i analiza de itemi
9. Stabilirea scorurilor de admisibilitate
Pentru unele teste se stabilesc scoruri prag (cut of point). Pentru altele este nevoie
de o modalitate de interpretare standard a coninutului rspunsurilor, iar pentru altele
stabilirea unor niveluri calitative asociate scorurilor la test ( sau intervale). Acestea
reprezint surse importante de dovezi privind validitatea, iar realizarea lor o parte
important a procesului de construire a testelor.
n cazul anumitor intervale de scoruri, acestora li se pot asocia diverse grade calitative.
Pentru testele cu nalt miz (rezultatele examenului au consecine importante) stabilirea
unor scoruri prag alturi de legitimitatea procedurilor urmate n stabilirea lor, constituie
de asemenea o condiie important a validitii instrumentului.
Fixarea scorurilor prag face parte din cadrul mai amplu, stabilirea standardelor
testului. Implic diverse metode de elaborare a scorurilor de admisibilitate (alese n faza
de proiectare, planul, ntruct implementarea unora dintre metode poate solicita unele
proceduri i efectuarea unor studii i exerciii).
Scorurile prag (de admisibilitate, de trecere) rspund la ntrebarea: De ct cunoatere
este nevoie, Ct de dezvoltat s fie o anumit aptitudine pentru ca cineva s promoveze
testul?
Metode de stabilire a standardelor:
a. Relative

Se bizuie pe distribuia dup frecven a scorurilor la test; pe aceast distribuie se alege


un punct care s reprezinte scorul prag.
Exemplu: pentru o distribuie a notelor T, pragul poate fi fixat la T = 45. (Reamintim ca
up ce am obinut scorurile brute, acestea pot fi transformm n note T. Acesta au nedia
teroretica egala cu 50 si abaterea standard teoretica egala cu 10.
O alt procedur de admisibilitate este s-i admitem pe cei ale cror scoruri sunt situate la
cel mult o abtere stndard sub medie, sau s fixm punctul de admisibilitate la rangul
percentil 0,30. Decila 30 sugereaz c individul situat aici va fi mai bun decat cei 30% i
mai slab decat cei 70% din 100 de indivizi, luati la intamplre din populatia tinta, fie ca
este vorba de capaciti, aptitudin sau alte trasaturi ale personalitatii.
Eroarea standard a msurtorii ne va ajuta s stabilim marja de eroare inerent
masuratorilor efectuate.
Aceste puncte sau praguri de admisibilitate sunt de obicei fixate de ctre experi n
problem. Aceste scoruri sunt relative, ca i metodele prin care sunt fixate, pentru c
pragurile nu dau socoteal de competena absolut a examinatului (cunotine, capaciti,
aptitudini).
b. Metodele absolute
Se bazeaz pe implicarea experilor care trebuie s se pronune privitor la bagajul
de cunotine, deprinderi, capaciti necesare cuiva pentru a promova testul n cauz.
Manualele consacrate construciei testelor accentueaz necesitatea ca scorurile prag i
caracteristicile psihometrice trebuie s fie uor de dovedit i eficace. Se bazeaz pe
judecile experilor n legtur cu performana ateptat de la persoana examinata de tip
borderline (acea persoan care are 50% anse s promiveze testul i 50% s eueze pe
baza scorului la test).
Metode de stabilire a pragurilor absolute:
1. Metoda Angoff (1971)
-Presupune fixarea unui prag pentru fiecare item al testului, pornind de la
supozitia ca fiecare item msoar un aspect al competenei respecztive
2. Metoda Ebel (1972)
-Presupune fixarea unor scoruri prag pentru mai muli itemi odat (seturi de itemi)
funcie de relevan i nivelul de dificultate
3. Metoda Hofstee (1983)
-presupune a solicita experilor s fixeze limita minim i maxim pentru fiecare
scor prag , precum i rata de eec la test.
4. Metoda grupurilor contrastante
Pragul la care diferena este semnificativ din punctul de vedre al testului.
Abaterea standard este semnificativ.

10. Raportarea (prezentarea rezultatelor)


Odat cu parcurgerea celor nou etape, se cumuleaz o mare mas de date, care
prelucrate i interpretate reprezint principala surs a dovezilor de validitate a
interpretrii rezultatelor la test.
Dei validitatea testului este asigurat, chiar exprimat printr-un indice zecimal
r>0, 5, anumite dificulti care nu au fost rezolvate de-a lungul celor nou etape pot s
afecteze validitatea general a testului, precum i validitatea interpretrii rezultatelor.
Cadrul n care sunt prezentate rezultatele construirii testului psihologic l
reprezint manualul testului, dar i articole i studii care familiarizeaz comunitatea
tiinific n legtur cu noul test.
Raportarea se refer i la modul n care a fost efectuat controlul calitii pe toat durata
construirii chestionarului, modalitate n care au fost fixate duratele testului/ subtestelor,
probleme legate de semnificaia atribuit scorurilor la test.

11. Banca de itemi


Banc de itemi= pstrarea i gestionarea itemilor n vederea reutilizrii acestora odat cu
construcia unor noi variante ale testului, sau a unor noi programe de testare, dac este
vorba de un test de cunotine.
ndeplinete trei funcii eseniale: stocarea, sortarea i recuperarea itemilor.
Pentru ndeplinirea funciilor sunt utilizate sisteme informatice hard i soft, variind
funcie de complexitatea bncii de itemi i de scopul ei. Ea permite construirea rapid de
alte teste.
Sortarea
- alegerea itemilor pentru a fi recuperai pe baza unuia sau mai multor criterii
simultane
-e cu att mai complex cu ct testul e mai sofisticat
Testele adaptative, unde itemul urmtor este sortat funcie de calitatea rspunsului la
itemul precedent, presupune operarea cu mai multe criterii, deci, un soft complicat.
Exemplu
Dac softul opereaz ntr-o scal Guttman, va alege itemul dup urmtoarele criterii,
simultan:
-nivel de dificultate superior, dar nu mai mare dect nivelul urmtor de dificultate
Item din aceeai categorie constituit pe criteriul tipului de abilitate, de funcie psihic, de
trstur msurat, etc.

Recuperarea
Se realizeaz din perspectiva urmtoarelor variabile:
-numr unic de identificare a itemului
-clasificarea itemilor dup coninut, nivel cognitiv, nivel de dificultate i de
discriminabilitate, parametrii IRT, istoricul utilizrii itemilor
Pe lng elasticitatea funciei de sortare i de recuperare, banca trebuie s fie n acelai
timp sigur.
securitatea= accesul, inclusiv al persoanelor sin staful care a participat la construcia
testului, reglementat n mod riguros.
Bree n sistemul de securitate al bncii de itemi pot duce la slbirea validitii sau
inutilitatea itemilor.
Din itemii scrii, editai, revizuii, pilotai, itemii cu cele mai bune caracteristici
psihometrice i de coninut vor fi testai n baca de itemi pentru a fi utilizai la o alt
versiune.
12. Raportul tehnic
Odat finalizat construcia, ntreaga munc trebuie prezentat ntr-un raport care
de obicei cuprinde toate aspectele importante (dezvoltarea, administrare, scorare, analiza
i evaluarea scorurilor).
Raiunea raportului este s furnizeze informaii despre toate aspectele care confer
testului validitate, care identific ameninrile posibile la adresa validitii i pe baza
crora pot fi fcute recomandri n vederea utilizrii valide i eficiente a testului.
Trebuie s existe un echilibru privitor la gradul de detalierea a raportului, astfel nct cel
care citete s-i formeze o imagine corect privitor la ct de adecvat a fost parcurs
fiecare etap de construcie i ct de valide au fost rezultatele obinute n fiecare etap.
Nivelul de detaliere poate s varieze de la o etap la alta, inclusiv funcie de preferinele
celui care realizeaz lucrarea.
O experien concret privind construcia unei variante a
GATB ( General Aptitude Test Batery)
Mellon, Duddgett Mitchel, Mc. Manus, Moritsch
Proiectul de cercetare a avut ca scop dezvoltarea unei forme alternative a GATB. Ca
rezultat al acestui program, o nou variant a GATB, sub o nou denumire, a fost
elaborat: Ability Profiler.
Fa de GATB, Ability Profiler nregistreaz urmtoarele mbuntiri:
1. Focalizarea pe raportarea unui profil al scorurilor n scopul consilierii n carier
(explorrii carierei)
2. mbuntiri de natur tehnic, cu rolul de a mbunti aspectul caracteristicilor
psihometrice

3. Poate fi utilizat n conjuncie cu alte instrumente, n vederea unei evaluri globale


a persoanei, n scopul consilierii n carier
Raportul final al autorilor enun urmtoarele etape parcurse n construcia acestei
variante:
1. Modificarea specificaiilor testului, privitor la lungimea i formatul unor subteste,
precum i privitor la materialele cu care opereaz aceste subteste
-n cadrul acestei etape au fost revizuite instructajele n virtutea crora subiectul
adopt strategia de a lucra n vitez, accelerat
-Au fost revizuite procedurile de scorare
-Au fost efectuate cercetri privind aspectele optime legate de estetica testului
(modalitatea de redactare a itemilor n pagin, prezentarea imaginilor care
nsoesc anumii itemi, etc.)
2. Au fost revizuii itemii existeni i au fost creai noi itemi ( a cuprins proceduri
specifice scrierii itemilor)
3. Probarea itemilor i trecerea n revist a unor parametrii specifici (verificarea)
4. Selecia itemilor pentru versiunea final
-Dou categorii de itemi:
a. Itemi consacrai msurtorii unor capaciti
b. Itemi consacrai aa-ziselor speedy-tests
5. n urmtoarele etape autorii au procedat la scorarea itemilor, analiza fidelitii, a
validitii i la redactarea raportului privind activitile implicate n dezvoltarea
noii versiuni
Power test: examinailor li se spune s lucreze cu mult precizie i ct de repede pot.
Cercetri privitoare la estetica testului
Scop: s mbunteasc aparena fizic a testului i s creasc modalitatea prin care
persoana se raporteaz la test.
Subproiectul a vizat:
-Interviuri cu profesionitii n testare pentru a identifica arii specifice care s fie
abordate
-Realizarea de focus-gupuri cu profesionitii din domeniul armatei, consiliere n
carier i reprezentani din cinci centre de evaluare i ocuparea a forei de
munc
-Sondaj de opinie n rndul organizaiilor care au avut contracte de administrare a
GATB.
Au rezultat mbuntiri ale instruciunilor i la formatul caietelor ( au fost mrite spaiile
albe, au schimbat fontul, a crescut utilizarea scrisului italic i boldat i a anumitor
sublinieri, etc.).

Graficele ataate unor itemi au fost aezate la baza paginii, acolo unde a permis
spaiul. Au fost efectuate multe schimbri care s mbunteasc aparena i s creasc
gradul de ocupare i la itemii aritmetici (au fost plasai n csue).
Foaia de rspuns a fost modificat (reducerea mrimii bulelor de rspuns, au fost
adugate linii orizontale care s creasc relevana variantelor de rspuns).
Itemii au trecut prin trei faze: faza de pretestare, faza de ncercare, faza
operaional.
Au avut loc reformulri tehnice ale manualului, care a fost redactat ntr-o manier care se
adreseaz n primul rnd utilizatorului (remprirea pe capitole, s-au eliminat
inconsecvenele, repetiiile, redundanele).
Au fost scrii peste 400 de itemi, mas suficient din care s fie selecionai cei cu putere
discriminativ i cu validitate, care cuprind: comparaia numelor, calcul elementar, spaiu
tridimensional, test de vocabular, raionament aritmetic, construire de obiecte.
Pilotarea testului
Testou pilot a fost realizat n colaborare cu trei servicii specializate. Au fost revizuite
materialele itemilor. Autorii furnizeaz date privitor la numrul de itemi care au fost
exclui din subtestele bateriei. Au realizate diverse grafice care sintetizeaz rezultatele
prelucrrii da
III.

ADAPTAREA MULTICULTURALA A TESTELOR PSIHOLOGICE

Datorita intensificarii schimburilor culturale intre tarile comunitatii europene,


occidentale, lumii contemporane, circulatia testelor atat psihologice cat si educationale, sa intensificat considerabil. Ratiunea acestei extinderi multiculturale a utilizatii testelor, o
constituie pe de o parte nevoia unei tari de a imprumuta astfel de instrumente si de a se
apropia astfel de nivelul unor tari cu traditie in domeniu, pe de alta parte nevoia si
interesul pe care comunitatea stiintifica de pretudindeni il manifesta in raport cu
comparatiile multiculturale.
Studiul diferentelor multiculturale are rolul atat de a surprinde specificul anumitor
culturi, dar si de a facilita o mai buna comunicare intre culturi.
Exemplu: cea de-a III-a Conferinta Internationala de Matematica a stabilit elaborarea
unor teste de stiinta si de matematica la nivelul a 45 de tari si a peste 35 de limbi
nationale.
Multa vreme adaptarea testelor psihologice a fost confundata cu traducerea acestora.
Adaptarea unui test psihologic include toate activitatile incepand cu decizia daca un test
ar putea masura acelasi construct intr-o limba si cultura diferita, la selectarea
traducatorilor, la decizia privind realizarea unor pregatiri prin care testul se doreste sa fie
utilizat intr-o a 2-a limba.
Dimpotriva, traducerea este doar unul din pasii procesului de adaptare. Chiar si in
cazul cand vorbim doar de traducere este mai potrivit termenul de adaptare intrucat
traducerea nu se face mecanic, ci presupune identificarea de concepte de cuvinte care din
punct de vedere cultural, psihologic si lingvistic sunt echivalente in a doua limba si

cultura. Prin urmare, o traducere literara a unui test, atunci cand aceasta este o etapa in
cadrul procesului mai amplu de adaptare, merge dincolo de simpla traducere literara.
Aceasta idee este intarita de faptul ca utilizarea unor constructe neechivalente reprezinta
o sursa de eroare in cercetarile crosculturale efectuate cu teste incorect sau insuficient
adaptate.
Exemplu: constructul calitatea vietii. Intr-o tara constructul ar putea include posesia
unor bunuri materiale (masini, case etc.), in timp ce intr-o alta cultura, acest construct ar
putea include putin mai mult decat necesarul de hrana pentru supravietuire si asistenta
medicala.
Cel care adapteaza un test trebuie sa-si puna problema daca un anumit construct poate
fi sensibil in a compara doua culturi diferite. Are constructul masurat un alt inteles in alta
cultura?. Pentru aceasta au fost propuse mai multe abordari:
Hamleton: prin intervievarea sau observarea oamenilor din cele doua culturi sau
intrebandu-i pe altii (experti) despre cele doua culturi. O astfel de abordare este
subiectiva si de aceea este nevoie de utilizarea unor multiple surse de dovezi ale
conceptului ce urmeaza a fi masurat.
Un bun exemplu privind implicatiile unui test ineficient de bine adaptat la noua
cultura in comparatie cu cultura de provenienta, il constituie o cercetare intreprinsa de
Richard Wolf (1990) pe studenti americani si pe studenti nevorbitori de limba engleza.
Studentii americani au fost solicitati sa identifice similaritatea sau nesimilaritatea unor
termeni- sanguinic/pesimist. La studentii vorbitori de limba engleza performanta a fost de
54%. La studentii nevorbitori de limba engleza performanta a fost de 98%. S-a constatat
ca tara nevorbitoare de limba engleza nu avea in uz cuvantul sanguin, el fiind interpretat
cu optimist. Acesta din urma, fiind interpretat mai usor, subliniaza pericolul in a trage
concluzii in lipsa unei evidente puternice ca procesul de adaptare a testului respectiv a
avut ca rezultat 2 teste echivalente.
Datorita importantei problematicii realizarii unor teste intru totul paralele, teoria si
metodologia adaptarii intr-o alta cultura a testelor psihologice, a cunoscut o crestere a
complexitatii considerabile in ultimele doua decenii.
Un rol important in partea teoretica metodologica a adaptarii testelor o ocupa
discutarea erorilor care pot sa apara in procesul de adaptare.
IV. DIFERENTELE CULTURALE SI DE LIMBAJ CARE POT AFECTA
SCORURILE LA TESTE
a)
Echivalenta constructelor.
Se refera la maniera in care constructul masurat este corect operationalizat in
fiecare limba sau cultura.
Ex: calitatea vietii (vezi mai sus)
b)
Administrarea testului.
Comunicarea dintre examinator si persoana examinata poate naste serioase amenintari
la adresa validitatii. Cele mai multe probleme apar atunci cand instructiunile care preced
testul nu sunt clar communicate. O cale de a elimina aceste probleme este de a ne asigura
ca instructiunile la un test sunt clare si suficient de explicative.
O problema importanta o constituie examinatorul insusi. Astfel:
- sa fie recrutat din comunitatile tinta;

-sa fie familiarizat cu cultura limba si dialectul;


-sa aiba experienta si aptitudini adecvate;
-sa fie constient de importanta intocmai a tuturor procedurilor prevazute in manual;
-sa se asigure un training adecvat personalului.
c)
Formatul testului.
Se refera la diferentele interculturale privitoare la formatul itemilor.
Exemplu: In SUA itemii cu alegere multipla au fost foarte extensiv utilizati. In alte
culturi, mai ales cele de limba engleza, nu se poate presupune ca exista o familiaritate
similara privitoare la itemii cu alegeri multiple. Aici s-a pus accent pe intrebarile cu
raspuns scurt si de tip eseu. Elevii si studentii din afara culturilor de acest tip sunt
dezavantajati, in comparatie cu cei din SUA. Solutia ar fi un format al itemilor familiar
celor doua culturi.
d)
Viteza de lucru la test.
Se presupune ca examinatorii vor lucra mai repede la testele cu timp impus decat la
cele cu timp liber. Este posibil ca in anumite culturi sa nu existe o suficienta experienta a
populatiei pentru testele cu timp impus.
Intr-un studiu (1990) pe populatia olandeza si pe populatia de culoare, s-a constatat ca
testele cu timp impus inregistrau scoruri deformate. Pe de alta parte este un fapt comun ca
in testele de aptitudini intalnim itemi rezolvati corect mai degraba la final decat la
inceput. Asta se datoreaza faptului ca unele persoane au performante mai scazute la citit
si din aceasta cauza fie raman in urma celorlalti, fie nu le finalizeaza. Cea mai buna
solutie este de a minimiza importanta vitezei de rezolvare a testului, acolo unde viteza nu
este o parte relevanta a constructului care este masurat.
Exemplu: in problemele de rationament analtic, viteza nu este o parte integranta. Aici
nu exista alta cale decat a explicita persoanelor testate ca trebuie sa lucreze foarte repede.
e)
Probleme tehnice de design si de metoda.
Exista 5 factori tehnici care pot influenta validitatea testelor adaptate pentru alta
limba sau cultura:
1) testul insusi;
2) translatorul (selectia si antrenamentul acestuia);
3) procesul de traducere;
4) designurile pentru adaptarea testelor;
5) modalitatea de colectare si de analiza a datelor pentru a stabili echivalenta formei
adaptate cu forma initiala.
1) testul insusi.
Anumite aspecte pot fi dificil de tradus, dar pot fi luate in considerare prin formularea
unor specificatii la nivelul instructajului sau chiar in redactarea itemilor.
Exemplu: intrebarile referitoare la bani ar trebui eliminate intrucat acestia difera de la
tara la tara si sunt greu de facut echivalente; hocheiul pe ghiata pentru tarile calde;
folosirea unor timpi ai verbelor fara echivalenta in cealalta limba; scalele inventarelor de
personaliate- trebuie alese situatii care vor fi adaptate usor (behavior poate sa nu aiba nici
un inteles in alta limba).
2) translatorii.
Procesul de traducere este o functie a calitatii traducatorului si a costului pe care
acesta il ridica. Este recomandata utilizarea mai multor traducatori pentru ca unul singur

aduce o anumita perspectiva pentru anumite expresii. Traducatorii ar trebui sa urmeze un


training in domeniul construirii testelor pentru a fi familiarizati cu principiile de baza ale
constructiei testelor.
3) procesul de traducere.
Probleme de traducere intervin mai ales atunci cand testul urmeaza sa fie tradus intrun dialect. Chiar si cand este vorba de 2 tari diferite ar trebui sa se tina seama de
frecventa cuvintelor in lima.
4) designul.
Sunt utilizate 2 designuri mai frecvente: traducerea si retroversiunea termenilor. In
cadrul designului un singur translator sau un grup de translatori adapteaza testul de la
limba sursa la limba tinta. Apoi echivalenta celor doua versiuni este judecata de un alt
grup de traducatori. Reviziile pot fi facute pentru a corecta problemele identificate uneori,
un pas final il constituie ca o alta persoana care nu este translator sa citeasca versiunea
adaptata a testului pentru a se face eventualele corecturi. Cel mai mare dezavantaj al
acestui design este ca aprecierile sunt facute cu echivalenta versiunii sursa si a celei tinta.
Validitatea judecatii poate fi marita utilizand un grup mai mic de persoane examinate care
vor furniza interpretarile lor.
Designul retroversiei este cel mai cunoscut design de evaluare. In cadrul acestuia unul
sau mai multi traducatori adapteaza un test din limba sursa in limba tinta. Alt traducator
va retraduce noua versiune din limba tinta in limba sursa. Atunci originalul si ultima
versiune vor fi comparate si judecate. In masura in care cele 2 versiuni sunt similare in
limba sursa se obtine o echivalenta intre acestea.
5) modalitatea de colectare a datelor.
Sunt utilizate 3 modalitati:
1) aceeasi subiecti primesc ambele versiuni (originala si adaptata) cu conditia sa fie
subiecti bilinguali. Avantajul este acela ca diferenta pe care ar putea sa o introduca
ca pe o variabila straina utilizarea unor grupuri diferite este eliminata.
2) Varianta originala sau varianta sursa este administrata unor subiecti din cultura
sursa. Lor li se administreaza intr-o a 2-a etapa versiunea retro. Prezinta avantaj
faptul ca atat varianta originala cat si varianta tinta, fiind administrate unor
subiecti ai culturii de origine, permite studiul diferentelor intre cele doua variante
din perspectiva versiunii originale.
3) Subiectilor din cultura de origine li se administreaza versiunea tinta, iar unor
subiecti din cultura tinta li se administreaza versiunea adaptata. Dificultatea
consta in a face echivalente cele doua grupuri.
f)
factori care afecteaza interpretarea rezultatelor
Interpretarea rezultatelor studiilor interculturale poate fi afectata de:
- curricula;
- politicile educationale;
- standardele de sanatate si de viata;
- valorile culturale ale celor 2 culturi, populatii.
Exemplu: similaritatea curriculei. In masura in care exista diferente in curricule,
performantele intre diferite culturi pot fi eronate daca nu se tine cont de aceste diferente.
Westburi (1992) observa ca, la studiul international pe domeniul matematicii, rezultatele
elevilor americani sunt mai slabe la fiecare clasa, la fiecare aspect al matematicii cuprins
la test, comparativ cu rezultatele elevilor japonezi la aceleasi teste. Acest lucru s-a datorat

diferentelor curriculare intre tari. Acolo unde nu existau diferente curriculare, rezultatele
erau asemanatoare. Motivatia studentilor/elevilor afecteaza si ea performanta rezultatelor.
Astfel pot fi multi studenti de culoare din Africa de Sud care au ca scop atingerea
minimului de scor pentru promovare.

INDRUMARI PRACTICE PENTRU ADAPTAREA TESTELOR


Urmatoarele indrumari au fost propuse de un comitet international si sunt citate de
Hamleton in opera citata in 1996.
1. Indrumari privind contextul adaptarii testelor la o cultura si limba diferite:
a) efectele diferentelor culturale care nu au o importanta covarsitoare pentru
scopurile principale ale adaptarii. Ar trebui totusi sa fie minimizate intr-o cat mai
mare masura. Ratiunea acestei recomandari rezida in faptul ca exista multi factori
care afecteaza comparatiile crosculturale, ei trebuind sa fie luati in considerare ori
de cate ori doua grupuri cu background lingvistic si cultural diferit sunt
comparate.
Caz special: dezvoltarea sau adaptarea unui test sau interpretarea scorurilor;
b) gradul de suprapunere a constructului masurat de test , masurat in cele doua
populatii (sursa si tinta) ar trebui sa fie evaluat. Ratiune: diferentele dintre culturi
si limbi diferite depind nu doar de traditii, norme, valori ci si de conceptii diferite
despre lume.
2. Indrumari privitoare la dezvoltarea si adaptarea testelor.
Editorii, ca si constructorii de teste, ar trebui sa se asigure daca procesul de adaptare
tine cont de diferentele culturale si lingvistice luate in considerare.
Ei ar trebui sa furnizeze dovezi ca limba utilizata in instructiunile, scorarea si itemii
testului sunt potrivite pentru toate populatiile culturale si lingvistice pentru care testul
este proiectat.
Ei ar trebui sa dovedeasca faptul ca alegerea tehnicilor de testare, a formatului
itemilor si a altor proceduri sunt cat de cat familiare celor doua populatii implicate in
procesul de constructie si adaptare.
Privitor la administarea testelor psihologice, exista recomandarea ca toate aspectele
care tin de mediu si care influenteaza administrarea unui test sa fie uniformizate in
ambele populatii (sursa si tinta).
Privitor la interpretarea scorurilor ar trebui efectuata o documentare privitoare la
schimbarile care pot sa apara impreuna cu dovada care sa sustina echivalenta versiunii
adaptate.
In vederea atingerii obiectivului ca in procesul de adaptare diferentele culturale si
lingvistice au fost luate in considerare de regula, trebuie urmate etapele:
a) asigurarea ca traducatorii au experienta si calificarea necesara;

b) cunoasterea de catre traducatori a problemelor de baza ale adaptarii testelor pentru


ca altfel, subtilitatile si nuantele adaptarii testelor nu ar putea fi reflectate in
procesele de traducere.
Un proiect de adaptare a unui test este mai bine realizat de catre o echipa de
specialisti decat de unul singur.
Un posibil design: utilizarea echipei de traducatori lucrand individual sau in grupuri
mici, apoi compararea traducerilor iar diferentele rezolvate in sensul unei singure
traduceri.
Editorii si constructorii testelor ar trebui sa dovedeasca atat din punct de vedere
lingvistic cat si psihologic ca procesul de adaptare a condus la versiuni echivalente ale
testelor.
Dezvoltatorii si editorii testelor ar trebui sa se asigure ca designul de colectare a
datelor permite utilizarea unor tehnici statistice adecvate care sa asigure echivalenta
versiunilor testului. Ei trebuie sa furnizeze informatii in manualul testului privitoare la
validitatea versiunii adaptate si dovezi statistice cu privire la echivalenta itemilor.
IV.

PROBLEME DE NATURA CONCEPTUALA SI METODOLOGICA IN


ADAPTAREA TESTELOR PSIHOLOGICE

Problema fundamentala o constituie asigurarea simultana a unei echivalente


lingvistice cat si a unei psihologii a itemilor. Din punct de vedere lingvistic, o versiune
echivalenta a testului sursa ar trebui sa reprezinte o traducere mot-a-mot a itemilor
testului sursa pentru ca numai astfel conceptul masurat de test e conservat si in limba
tinta.
Totusi, o astfel de traducere poate sa nu asigure echivalenta psihologica. Aceasta
echivalenta este la fel de necesara. Astfel, nu pot fi realizate instrumente inalt calitative in
limita tinta.
Una dintre problemele pe care le genereaza necesitatea unei echivalente simultane
este aceea privitoare la BIAS si echivalenta.
Termenii de BIAS si echivalenta au semnificatii diferite. BIAS este des asociat cu
prezenta unor factori nedoriti. O masura poate fi considerata a fi afectata (BIASED) daca
scorurile la test in versiunile din cele doua limbi sunt in mod diferit afectate de o sursa de
variatie nedorita.
Un exemplu il constituie traducerea din limba engleza a itemului de cunostinte
generale unde este mai probabil sa traiasca puiul cu pielita la degete?. Traducand in
suedeza pasare cu picioare inonatoare genereaza un indice mai puternic privitor la
solutia corecta comparativ cu limba engleza.
Un alt exemplu: sondajul european privitor la valori unde scorul spaniol la un item ce
masoara loialitatea are in spaniola o conotatie usor diferita (credincios sexual).
Echivalenta este asociata cu aspecte ale masuratorii implicate in comparatii etnice. Si
aceasta are consecinte contaminative. Un item sau un instrument care este BIASED va
genera scorul neechivalent si ca atare scorurile nu vor putea fi comparabile.
Cu toate acestea partinirea nu este o proprietate intrinseca a unui instrument intr-un
anumit scop si cu un anumit scop.
Exista 3 tipuri de BIAS (contaminare).

Desi pot rezulta dintr-o varietate de surse, exista 3 BIAS-uri principale ce trebuie
luate in considerare:
1) BIAS-ul de construct;
2) BIAS-ul de metode;
3) BIAS-ul de item (Van der Visner)
1) BIAS-ul de construct (deformarea de construct)
Se refera la diferentele care privesc un anumit construct la nivelul unor grupuri
culturale diferite.
De exemplu: elementele constitutive ale unui construct (comportamente, atitudini,
norme) nu pot fi identice in grupuri culturale diferite. Exemplu: Inteligenta. Cele mai
multe teste de inteligenta au o definitie implicita a acesteia ca fiind o gandire si o
capacitate de a gandi si relationa logic (Raven). Sau Weschler in scalele sale de
inteligenta: cunoasterea dobandita de un individ si memoria.
Aceste diferente sunt cel mai adesea constatate cand indivizii sunt pusi sa descrie
caracteristicile unei persoane inteligente.
Exemplu: studiile efectuate in alte culturi decat cele vestice au raportat faptul ca
conceptiile despre inteligenta sunt mult mai largi si includ in alte culturi si aspecte
sociale. (mamele din Kenya: un copil inteligent este acela care isi cunoaste locul in
familie, care cunoaste comportamentele asteptate din partea lui si maniera de a se adresa
altor oameni; Zambia: o persoana inteligenta merge dincolo domeniul scolar cu care
inteligenta e asociata in cultura occidentala).
Se pune problema esantionarii corecte a universului sensurilor pe care le implica un
concept, care este operationalizat intr-un instrument.
TRIANDIS, 1978 a pretins ca masuratorile efectuate in psihologie sufera de o
reprezentare slaba a constructelor operationalizate. Datorita unei operationalizari
restrictive a constructului masurat de test, in compararea a doua grupuri culturale intre
care exista o mare distanta pot sa apara serioase alterari.
2) BIAS-ul metodei (deformarea metodei)
Se refera atat la instrumentul de masurare, cat si la administrarea acestuia.
a) Privitor la instrument este vorba de acele proprietati ale acestuia care nu au fost
studiate indeajuns dar care pot induce diferente in scorurile la test.
Exemplu: gradul de familiarizare al subiectului cu stimulii si raspunsurile (formatul
raspunsului).
Serpel, 1979 a studiat atitudinile perceptive ale copiilor, figurile utilizate, metoda
creion-hartie, plastelina, prezenta mainilor si modelarea cu ajutorul unor fire de metal
(foarte populara in Zambia).
Copiii din Anglia i-au depasit pe cei din Zambia la probele creion-hartie, iar cei din
Zambia i-au depasit pe cei din Anglia la proba de modelare cu fire de metal. Aceasta
inseamna ca familiarizarea cu un anumit tip de raspuns constituie o deformare a
scorurilor la test.
Triandis, 1989 a gasit diferentele intre europeni, americani si hispanici privitoare la
utilizarea scalelor de evaluare cu 5 trepte si cea cu 10 trepte.
Exemplu: hispanicii tindeau sa utilizeze extremele la scalele cu 5 trepte, mai frecvent
decat euro-americanii. Nu se intampla la fel in scalele cu 10 trepte.
b)A 2-a categorie de BIAS de metoda se refera la administrarea testelor, mai exact
la instructajul sau probleme de comunicare intre examinator si persoana testata.

Acest lucru se intampla cand se utilizeaza alta limba decat cea materna. Lipsa
cunostintelor despre cultura persoanelor testate duce la violarea instructajelor testelor.
Este deja cunoscut in psihologie influenta deosebita pe care o are asupra
intervievatului caracteristicile intervievatorului: varsta, genul, etnia. Trebuie concluzionat
ca deformarile care tin de instrumente pot avea un efect larg asupra scorurilor la teste. De
asemenea, deformarile in educatie sau care tin de o expunere anterioara la acel test pot
afecta scorul la anumiti itemi cu continut legat de scoala.
3) BIAS-ul de itemi (deformari ale itemilor)
Se refera la amenintarile validitatii care afecteaza anumiti itemi in timp ce
deformarile constructorului si metodei afecteaza caracteristicile mai generale ale
instrumentului.
Afectarea itemilor a fost comentata pentru prima data in 1968 de Cleary si Hilton,
apoi a fost inlocuita cu termenul functionare diferentiala a itemilor.
Traducerea defectuoasa si conotatiile diferite acordate unor cuvinte:
Exemplu: agresivitatea explicata prin cearta, determinare si pregatire pentru conflict.
In dictionarul britanic agresivitatea reprezinta actul de a ataca fara provocare, de a incepe
o cearta.
In principiu, asa cum arata Holland si colaboratorii un item este considerat a fi
deformat daca are acelasi scor la general, la test are acelasi scor asteptat la un item
anume.
Pentru analiza surselor de deformare a itemilor se divizeaza cele 2 esantioane din cele
2 culturi intr-un numar de grupuri constituite pe nivele de scoruri.
Exemplu: in primul grup american introducem subiecti cu scorul egal cu unitatea. In
mod similar, in grupul olandez introducem persoanele cu scorul egal cu 1. Apoi
urmatoarele grupuri cuprind scorurile egale cu 2. Astfel putem compara scorurile
esantionului american cu cel olandez cu acelasi nivel de scor si nu comparam scorurile
medii. De exemplu, itemul despre presedintele? american va fi deformat daca subiectii
americani si olandezi cu acelsi scor la test nu vor avea acelasi scor mediu la acel item.
Mellenbergh, in 1982 a propus distinctia intre deformarea uniforma si neuniforma. Un
item este uniform deformat daca diferentele sunt mai mari sau mai mici, constante la
toate nivelele de performanta.
Deformari ale esantionului / incompatibilitatea esantioanelor implicate in
procesul de adaptare al testului la o alta cultura.
Este vorba de inegalitatile privitoare la reprezentativitatea esantionului pentru
culturile din care ele sunt extrase.
Exemplu: profesorii care isi fac studiile pe studenti (nu oricine poate intra la Harward)
V.

PROBLEME DE NATURA ETICA IN ADAPTAREA TESTELOR


PSIHOLOGICE

1) Autorii de teste pot dezvolta un test care ulterior va fi adaptat cu autorizarea lor.
Adaptarea poate fi realizata fie cu fie fara implicarea lor cu asistenta specializata;

2) Companiile care publica si distribuie testele care ulterior vor fi adaptate numai cu
autorizarea lor, pot fi implicate sau nu in adaptarea la o alta cultura a testului
respectiv;
3) Autorii unui test pot sau nu sa fie implicati in publicarea unei versiuni ulterioare a
unui test. Exemplu: editiile ulterioare ale WISC au 26 de adaptari oficiale dar este
utilizat in 34 de tari ceea ce conduce la idea existentei unor versiuni neautorizate;
4) In dezvoltarea testelor psihologice sunt antrenati profesionisti cu experienta care
apoi dezvolta asfel de teste in alte limbi si culturi. Exemplu: staff-ul Microsoft
produce peste 45 de teste anual in 16 limbi pentru utilizarea in peste 75 de tari;
5) O componenta importanta a sistemului de adaptare a testului la alta cultura o
constituie formatorii de specialisti in domeniul testelor;
6) In acelasi sistem trebuie implicate alte grupuri cum sunt cele ale consumatorilor
de teste psihologice. Persoanele si organizatiile ce consuma informatiile provenite
din aplicarea testelor in vederea luarii deciziilor.
Reglementarile si standardele etice se refera in general la urmatoarele probleme:
Standarde tehnice: au rolul de a promova bunele practici pentru adaptarea
testelor si determinarea echivalentei scorurilor la acestea;
Deprinderile si aptitudinile profesionale: categoria de standarde ce ia in
dezbatere calitatea persoanelor care utilizeaza teste adaptate;
Standarde morale: nevoia de a actiona intr-o maniera etica si profesionista
din partea celor care utilizeaza testele, responsabilitatea, asigurarea
materialelor necesare utilizarii testelor, confidentialitatea rezultatelor.
O serie de principii etice generale privesc urmatoarele domenii:
1) beneficiul si avantajul persoanelor testate;
2) fidelitate si responsabilitate;
3) integritate, justitie si respect pentru demnitatea oamenilor;
VI.

METODE STATISTICE FOLOSITE PENTRU IDENTIFICAREA


GRESELILOR IN PROCESUL DE ADAPTARE A TESTELOR

1) Tehnici statistice pentru evaluarea echivalentei constructelor


Cercetarile crosculturale pentru a evalua echivalenta constructelor operationalizate in
instrumente pot utiliza statistici inainte si dupa testarea esantioanelor.
a) Evaluarea echivalentei constructelor inainte de test
Este vorba de efectuarea acestei analize in absenta datelor rezultate din testare. Acest
lucru este posibil prin colectarea de date despre aceasta echivalenta de construct de la
experti care reprezinta diverse culturi si limbi (ex: engleza si romana).
Triandis, 1985 = mici esantioane de evaluatori au evaluat similaritatea intelesului
unor perechi de itemi utilizati intr-o anumita evaluare.
Autorii au utilizat scale multi-dimensionale pentru a desprinde caracteristicile pe care
expertii le-au utilizat in a evalua similaritatea.
Daca aceste caracteristici sunt prezente la toti evaluatorii, obtinem o dovada
preliminara a echivalentei constructelor. Daca experti apartinand unor culturi diferite
utilizeaza caracteristici diferite, atunci se poate folosi informatia pentru a modifica una
sau ambele versiuni ale evaluarii.

b) Evaluarea echivalentei dupa efectuarea testarii.


In acest caz exista cel putin 4 abordari:
Analiza factoriala exploratorie;
Analiza factoriala confirmatoare;
Scalarea multidimensionala;
Comparatii in retele normologice.
Analiza factoriala exploratorie este cea mai frecvent utilizata metoda statistica
pentru a evalua daca un construct este intalnit in aceeasi forma si cu aceeasi frecventa in
culturi diferite. Metoda consta in efectuarea analizei factoriale a scorurilor la itemi sau la
test separate pentru fiecare scop. Apoi se inspecteaza vizual cele 2 matrici care contin
incarcarile factorilor.
Desi aceasta abordare este intuitiva, prin intermediul urmatoarelor reguli de
decizie se poate aprecia daca cele 2 structuri sunt echivalente.
Analiza factoriala confirmatorie
Este avansata cu titlul de ipoteza o anumita structura apriorica examinarii datelor.
Structura presupusa este inglobata intr-un model matematic, o ecuatie si este constransa
sa fie aceeasi in cele 2 grupuri. Cu alte cuvinte, echivalarea constructului este confirmata
daca incarcarea factoriala este aceeasi in ambele grupuri.
Scalarea multidimensionala
La fel ca analiza factoriala exploratorie, scalarea multidimensionala nu necesita o
structura factoriala specifica aprioric. Totusi, asemenea analizei factoriale confirmate,
datele obtinute din cele 2 esantioane pot fi analizate simultan. Se utilizeaza un model
matematic de analiza. Se urmareste identificarea unei structuri comune in cele doua
grupuri. Ulterior, se urmareste modificarea structurii comune astfel incat aceasta sa se
muleze pe datele fiecarui grup.
Scalarea mutidimensionala furnizeaza mijloacele pentru a descoperi dimensiunea
care se afla la baza raspunsurilor subiectilor si pentru a evalua daca aceasta este aceeasi
in cele 2 grupuri (sursa si tinta).
Compararea unor retele normologice
Metodele trecute in revista anterior permit sa se verifice daca acelasi construct
psihologic este masurat in cele 2 colectii de rezultate la test, respectiv daca poate fi
identificata aceeasi structura a datelor (incarcarea factorilor) in cele 2 versiuni ale
instrumentelor. Totusi, similaritatea structurii nu implica in mod necesar echivalenta
constructului.
Echivalenta structurala este necesara, dar nu suficienta. De aceea multi cercetatori
au sugerat sa se mearga dincolo de aceasta si au propus necesitatea unei abordari mai
globale care implica investigarea relatiilor intre scorurile la test pe de o parte si anumite
variabile banuite a fi legate la constructul masurat.
Cronbach si Mill (1955) au introdus termenul de retea normologica pentru a
sublinia faptul ca un test nu poate fi validat folosind un singur criteriu.
Privitor la evaluarea crosculturala, interrelatiile existente intre scorurile la test si
alte variabile ar trebui sa fie aceleasi in ambele culturi si in ambele variante. Compararea
retelelor normologice in diferite versiuni ale testului reprezinta o evaluare riguroasa a
echivalentei constructului. Pentru a realiza acest lucru este necesar sa se identifice
variantele externe care influenteaza masuratorile.

VII.

STRATEGII STATISTICE PENTRU A EVALUA DEFORMARILE


METODEI

Wiswer si Tanter afirma ca exista 3 tipuri de deformari ale metodei:


1) Deformarea esantionului- se refera la diferenta dintre grupurile literare si cele
lingvistice;
2) Deformarea instrumentului deformarea intr-o masurare comparativ intre cele
2 grupuri (familiarizarea cu formatul testului);
3) Deformarea administrarii testului- se refera la problemele de administrare
(procedurile de standardizare a administrarii). Exemplu: administrarea gresita intrun grup datorita instructiunii incorect traduse sau intelese.
Analiza deformarii esantionului se realizeaza in scopul de a controla o serie de
variabile perturbatoare care pot oferi explicatii alternative, altele decat cele avansate in
ipoteza cercetarii, anume ca diferenta intre grupuri, intr-adevar se datoreaza nivelului
diferit al capacitatii sau caracterizarii masurate. In acest scop se utilizeaza urmatoarele
metode:
a) analiza de varianta;
b) utilizarea unor designuri sau blocuri randomizate;
c) analiza de regresie;
d) corelatia partiala;.
Evaluarea deformarilor instrumentului si administarea acestuia apeleaza la 3
strategii statistice:
1)
masurarea acelorasi trasaturi in toate grupurile implicate in cercetare. Daca
diferentele existente intre grupuri nu sunt constante de-a lungul variabilelor
testului, se poate incrimina existenta unei deformari;
2)
utilizarea unor informatii colaterale in vederea evaluarii deformarii
instrumentului sau a evaluarii. Analiza unei variabile aflate in legatura cu
constructul operationalizat in test. Daca diferentele observate in grupurile
implicate sunt inconsistente, neconcordanta cu diferentele observate la
scorurile la test conduce la deformarea instrumentului sau a administrarii.
VIII. TEHNICI STATISTICE
ITEMILOR

PENTRU

EVALUAREA

DEFORMARII

Stepen Sireci face distinctia intre impactul itemului si functia diferentiala a itemului
(DIF).
Impactul itemului conduce la o diferenta semnificativa intre grupurile implicate in
cercetare privitoare la un item.
Exemplu: un grup are o proportie mai mare de examinati care a raspuns corect la un
item decat celalalt, asfel ca impactul itemilor poate fi apreciat datorita diferentelor
existente sau sa se datoreze deformarilor suferite de acel item.
Analiza DIF incearca sa precizeze daca impactul itemului se datoreaza diferentierii de
performanta intre cele 2 grupuri sau se datoreaza deformarilor itemilor. Pentru aceasta
analiza, examinatorii sunt egalizati pe baza capacitatii, aptitudinii masurate de test.

Subiectii apartinand acestor 2 grupuri diferite, egale din punct de vedere al performantei,
ar trebui sa raspunda in mod similar. In caz contrar, itemul functioneaza diferit in cele 2
grupuri.
Analiza impactului itemului si DIF sunt elemente de natura statistica.
Analiza deformarii itemului este un demers calitativ.
Un item este deformat la nivelul unui grup daca subiectii din acel grup obtin rezultate
mai slabe decat grupul similar. De asemenea, ratiunea acestei performante mai slabe tine
de constructul operationalizat in instrumentul de masurare.
Pentru a afirma ca exista o deformare a itemului ar trebui identificata o caracteristica
a acestuia care este prezenta intr-un grup si nu este prezenta in celalalt.
Exemplu: un concept familiar pentru un singur grup.
Statisticile utilizate utilizate in deformarea itemilor cauta sa identifice itemii care
functioneaza diferit in grupurile considerate grupuri care trebuie egalizate din punct de
vedere al capacitatii caracteristicii masurate.
Odata ce itemii deformati au fost identificati, ei sunt supusi unor analize calitative in
scopul explicarii diferentei constatate. Atunci cand explicatiile acestei diferente par sa nu
aduca argumente ca itemii intr-adevar masoara caracteristica operationalizata, itemii sunt
catalogati ca fiind deformati.
IX.

1)
2)
3)
4)
5)

METODELE
UTILIZATE
IN
DIFERENTIATE A ITEMILOR:

ANALIZA

FUNCTIONARII

metoda delta plot (tabelul D);


metoda randomizarii;
metoda regresiei;
metoda Hi patrat (Lord);
teoria raspusurilor la itemi (TRI)

Metoda delta plot


Se aplica pentru itemii cu raspuns dihotomic.
In studiu sunt implicate 2 grupuri: unul provenind din cultura tinta, altul provenind
din cultura sursa. La nivelul ambelor se calculeaza valoarea P (proportia subiectilor care
au raspuns corect la item sau afirmativ daca este un test de capacitate). Se creeaza un
tabel cu dubla intare, unde pe ordonata se trec valorile lui P pentru un grup cultural, iar pe
abscisa valorile lui P pentru celalat grup cultural. Utilizand aceste 2 axe, fiecare item va fi
reprezentat ca un punct de intersectie a 2 valori (P dintr-o cultura si P din alta cultura).
Daca dificultatile itemilor sunt identice in cele 2 grupuri, atunci itemii, respectiv punctele
care ii reprezinta, se vor dispune pe o linie care este inclinata la 45 grade de linia
orizontala. Chiar in cazul cand itemii prezinta aceeasi dificultate, o anumita abatere de la
linia dreapta este de asteptat datorita unor erori de esantionare. Daca un item este mult
mai dificil sau daca anumite persoane sunt de acord cu propozitia respectiva, intr-un grup
acel item se va situa mai departe de linia dreapta. El va fi considerat ca avand un potential
de deformare.

Daca linia nu trece prin sistemul de origine al celor 2 axe, aceasta reflecta diferentele
fata de medie. Itemii care au fost identificati ca avand o functionare diferentiata, au fost
reprezentati cu puncte negre si se situeaza in afara liniilor drepte. Ei urmeaza sa faca
obiectul unor analize pentru a fi modificati sau indepartati.
Metoda indexului de standardizare
Indexul de standardizare a fost propus in 1986 de Dorans si Kulik. El se bazeaza
pe o valoare P conditionata. Aceasta valoare implica calcularea valorii P pentru fiecare
item, valoare care este pusa in relatie cu scorul total la test.
Exemplu: persoanele examinate prin versiuni lingvistice diferite ale aceluiasi item
ar putea fi egalizate din punct de vedere al scorului total la test. Apoi pentru subiectii cu
acelasi scor la test este calculata si comparata proportia de examinati care au raspuns
corect. Daca itemul nu are probleme ar trebui ca cele 2 grupuri sa performeze asemanator.
Acest proces este repetat pentru toate scorurile generale obtinute.
Metoda teoriei raspusurilor la itemi (TRI)
Si aceasta metoda se aplica in special itemilor cu raspuns dihotomic. Esentialul ei
este de a evalua daca poate fi utilizat un set comun de parametri ai itemului pentru a
descrie daca acel item functioneaza asemanator in grupurile culturale luate in considerare.
Utilizarea TRI pentru studiul comparabilitatii si echivalentei itemilor pentru
aptitudine scolara si a adapatarii sale pentru populatia spaniola.
In primul desen se observa ca in cele 2 grupuri itemul respectiv functioneaza
diferit. Paradoxal, performantele grupului latin sunt mai mari decat in grupul american ca
urmare a analizei itemilor. Curbele pentru cele 2 grupuri in al 2-lea desen sunt identice.
Aceasta arata ca indivizii de la toate nivelele trasaturii latente din ambele grupuri, au
aceeasi probabilitate de a da un raspuns corect la item. Ca atare el este comun celor 2
variante ale testului.
X.

UTILIZAREA
SUBIECTILOR
BILINGVI
IN
EVALUAREA
VERSIUNILOR CULTURALE DIFERITE ALE UNUI TEST

O alta metoda de evaluare a echivalentei a 2 versiuni diferite ale unui test, o constituie
administrarea versiunilor unui grup de subiecti care au competente egal dovedite in
ambele limbi. Ratiunea acestei metode este aceea ca utilizand un singur grup de subiecti
sunt eliminate efectele datorate diferentelor intre grupuri. Pe de alta parte se dobandeste o
echivalenta inalta a celor 2 masuratori. Exista asfel mult mai multe sanse ca diferentele
de performanta intre cele 2 grupuri sa se datoreze mai degraba testului insusi si nu
diverselor surse de deformare. De obicei subiectii bilingvi sunt selectionati cu ajutorul
unor teste speciale care evalueaza competenta intr-o limba sau alta. Dincolo de avantajele
reale ale acestei metode, exista si o serie de inconveniente.
Unul dintre dezavantaje este acela ca subiectii bilingvi vor performa mai bine in
limba materna decat in cealalta limba chiar daca cele 2 versiuni ale itemului sunt
echivalente.

Un al 2-lea dezavantaj il constituie faptul ca persoanele bilingve nu sunt totusi


identice din punct de vedere al atitudinilor lingvistice, al eficacitatii si al backgroundului.
In general, subiectii bilingvi sunt utilizati pentru a identifica itemii ancora. Ei sunt
implicati intr-un design de cercetare menit sa evalueze diferentele de limbaj. Se utilizeaza
un set de itemi care sunt considerati echivalenti in cele 2 limbi (itemii ancora). In cazul
acestor itemi, diferentele de performanta intre 2 grupuri pot fi utilizate in vederea ajustarii
scorurilor la una din cele 2 forme paralele ale testului. De asemenea, ei mai pot fi utilizati
in vederea realizarii unei scale comune celor 2 versiuni.
Exemplu: WAIS contra EIWA (testul WAIS adaptat pentru populatia hispanica in
SUA). Imediat de la aplicarea lui, psihologii au observat diferente notabile intre WAIS ai
EIWA. La EIWA se obtineau scoruri mai mari la anumite subteste. Dupa 20 de ani au fost
publicate diferentele inregistrate. Diferenta de scoruri a implicat si implica diverse opinii
privind sursa lor. Probabil aceste diferente ar putea reflecta senzitivitatea culturala a
hispanicilor, adica ar fi vorba de estimari mult mai valide a inteligentei decat altele facute
cu WAIS. Ar putea fi credibila pentru ca WAIS aplicat in alta limba ar putea inregistra tot
felul de deformari ceea ce ar determina ca EIWA sa fie credibil.
Pe de alta parte poate fi valabila si alternativa a IQ-urilor estimate. Se datoreaza
faptului ca sunt masurate caracteristici psihologice diferite intr-o anumita masura decat in
WAIS.
O a 3-a opinie contesta pretentiile de validitate ale lui EIWA. Este posibil ca EIWA sa
fi fost de la inceput supralicitata datorita faptului ca provenea dintr-o baterie cu o licitatie
deosebita ca WAIS.
ANALIZA MODULUI DE REALIZARE A ESANTIONULUI
Autorii suspicioneaza faptul ca ar putea exista probleme legate de standardizarea
esantionului, anume ca el a fost realizat in concordanta cu rezultatul recensamantului din
1960, spre deosebire de structura actuala a populatiei americane. In 1966-1967 esantionul
normativ a fost realizat prin stratificare, adica s-a introdus in mod proportional
urmatoarele criterii ale subiectilor hispanici: varsta, sex, regiune geografica, ocupatie,
educatie, rezidenta urbano-rurala.
Analiza gradului de suprapunere intre datele de recensamant (1960) si structura
esantionului (HI patrat) arata ca factorul sex a fost in mod adecvat respectat. Totusi, o
lucrare de disertatie (1969) a investigat relatia intre scorurile la EIWA si zona de
rezidenta in Puerto-Rico. S-a descoperit ca barbatii performau mai bine decat femeile,
subiectii din zona rurala performau mai bine decat cei din zona urbana. Cu cat nivelul de
educatie era mai mare, cu atat rezultatele erau mai bune (performanta la test ridicata).
Toate acestea arata ca pot fi incriminate anumite surse de BAES la nivelul de construct.
Un alt studiu arata ca, in ciuda diferentelor de continut intre EIWA si WAIS, exista o
inalta concordanta din punct de vedere psihometric. Dimensiunea intelectuala de baza din
WAIS este si in structura EIWA.
Alte studii au fost realizate pe persoane cu diverse afectiuni cum sunt starile anxioase.
Doi cercetatori, Martinez si Spilberger au administrat aceluiasi esantion de subiecti (40 de
pacienti psihiatrici) testul STAI. A fost confirmata predictia ca persoanele cu nivel ridicat
de anxietate vor performa mai slab la EIWA.

Cercetatorii Hambleton si Merenda au luat in considerare in analiza echivalentei celor


2 baterii de teste de inteligenta, teme privitoare la echivalenta traducerii si adaptarii
instrumentului precum si studierea validitatii concurente realizand o metaanaliza a celor 2
studii intreprinse in aceasta directie.
Lopez si Romero (1988) au realizat una dintre cele mai serioase examinari a structurii
EIWA. Obiectivul a fost acela de a identifica diferentele specifice intre EIWA si WAIS
privitoare la administrare, continut si scorare si la caracteristicile standardizate ale
esantionului. Cei doi autori au constatat ca exista doar 5 subteste in EIWA care au
proceduri de administrare identice ca si WAIS, restul difera (de exemplu nr de itemi de la
care se incepe proba sau numarul de esecuri de la care proba inceteaza sa fie
administrata).
Doar doua subteste sunt complet identice (DIGIT SPAN si subtestul de asamblare de
obiecte). Au fost gasite diferente majore cu privire la modalitatea de scorare.
Plecand de la aceste rezultate prezentate de diversi autori, a fost realizat un studiu
privitor la gradul de echivalenta intre cele 2 variante ale testului in ceea ce priveste
metodologia si procedurile utilizate de autori.
Exemplu: Un grup de subiecti cu varste intre 17 59 ani. Acestia erau persoane
normale, fara simptome psihiatrice. Principalul criteriu de selectie a fost cel referitor la
competente lingvistice. Ei au inclus in studiu persoane care aveau acelasi nivel de
competenta in limba engleza si limba spaniola.
Administrarea testului
Subiectii au fost examinati atat cu EIWA cat si cu WAIS R. designul experimental a
fost unul cu masuratori repetate. Pentru a contracara efectul de procentare s-a procedat
astfel: din lotul de subiecti a primit pentru testare EIWA, iar cealalta jumatate a primit
WAIS. Administarea s-a facut la un interval de 1-2 saptamani.
Rezultatele testarii
Rezultatele au fost supuse analizei factoriale prin metoda Hotelling. S-au constatat
diferente semnificative.
Concluziile testarii
Se repeta ideea ca scorurile mai mari la EIWA sunt datorate nivelului de motivare mai
mare la populatia hispanica. Diferentele apar datorita faptului ca cele 2 teste masoara
trasaturi psihologice diferite, concluzionand faptul ca exista probleme cu EIWA.
Standardizarea esantionului a prezentat diferente la nivelul regiunii, al educatiei si la cel
cultural. Au fost constatate probleme legate de standardizare si fidelizare.

S-ar putea să vă placă și