Documente Academic
Documente Profesional
Documente Cultură
I.
PROBLEMATICA
CONSTRUCTIEI
TESTELOR,
A
PARTICULARITAILOR ACESTEIA, FUNCTIE DE CATEGORIA
INSTRUMENTELOR DE TESTARE SI DE DOMENIUL IN CARE SE
APLICA
Soldaii care ar trebui s lucreze n buncrele care adpostesc armele nucleare ar trebui s
fie depistai, mai nti, cei instabili psihic sau care manifest trsturi psihopatice.
Un instrument realizat prin aceast metod va fi capabil s discrimineze
persoanele instabile i care manifest trsturi psihopate.
n diagnoza psihopatologic, datorit faptului c unele tratamente pot fi diferite n
cazul unor categorii de dezordini mentale, un test construit prin aceast metod va putea
discrimina un grup clinic de altul, fcnd astfel posibil mai buna compatibilizare a
tratamentului.
n consilierea vocaional practicienii, pe baza rezultatelor la un astfel de test,
vor putea stabili dac patternul de scoruri al unui subiect este asemntor unui anumit
grup ocupaional. Pe aceast baz va discuta posibilitatea formrii sau angajrii ntr-un
post din aceast categorie.
Dezavantaje:
-Dificultatea constituirii grupurilor criteriu ( n clinic i n psihiatrie clasificarea
n grupuri diagnostice este destul de dificil, ntruct itemii care discirmineaz
bine n faza de prob sunt mai puin discriminativi ntr-o etap ulterioar)
-MMPI- n afar de fidelitatea sczut, exist o clasificare psihiatric, un slab
acord n legtur cu conceptele, categoriile care ar trebui utilizate (utilizeaza o
nosologie elaborat de Kraepelin)
-Lipsa de semnificaie (neles psihologic)
Exemplu- MMPI:
Itemii consacrai scalei maniacale au fost selectai n msura n care au
putut discrimina maniacii de normali sau alte grupuri clinice
Maniacii nu difer printr-un singur lucru de celelalte categorii
nosologice, asa cum presupune utilizarea acestei metode.
De aceea, astfel de scale nu vor fi, aa cum ne-am dori, unifactoriale
Dei doi subieci ar avea acelai scor, ele nu sunt echivalente din punct
de vedere psihologic pentru ca nu putem ti ce msoar de fapt fiecare
dintre ele ,deoarece nu tim care variabile intervin in cele doua scoruri
( dac un subiect obine un scor x la scala maniacal, nu exist o
semnificaie atribuit acestui scor, ci faptul c scorul seamn cu cel al
grupului maniacal).
-Teste create prin acesata metoda sunt instrumente care opereaz dup o metod
oarb, fr semnificaie psihologic a rezultatelor, care doar discrimineaz
-n grupurile selecionate e greu s gseti un grup foarte slab (ei sunt deja
preselectai).
Pai n construcia testelor prin metoda bazat pe criteriu
1. Fixarea grupului/ grupurilor criteriu
-n alte situaii se fixeaz un scor la criteriu care are valoare difereniatoare
Exemplu: una din metodele de interpretare EPQ este aceea de a realiza un scor
unic pentru extraversie/introversie, un altul pentru neuroticism i un altul pentru
Paul Klein: unele diferente obinute nu reprezint dect artefacte (consecine ale itemilor
i nu diferene ntre sexe). Diferenele reale ar trebui testate prin metoda ipotezei de nul i
prin testul T al lui Spearman.
b. Analiza de itemi n construcia testelor psihologice
Are ca scop selecia itemilor nalt discriminativi (metoda de a corela fiecare item cu
scorul total la test n scopul de a produce un test unifactorial omogen). Fiecare item ar
trebui s msoare ceea ce msoar testul n ansamblu. Itemul este discriminativ dac
valoarea p este cuprins ntre 0,20 i 0,80.
Avantajele analizei de itemi:
-Nu este necesar s avem un esantion foarte mare de subieci (este suficient un
eantion de 100 de subieci)
-Nunnally- pilotarea itemilor se realizeaz pe un numr mai mic de subieci.
O alt metod de construcie, care nu se bazeaz pe teoria clasic a erorii de msurare
este Teoria Rspunsului la Itemi. Aceasta opereaz cu cel mult dou caracteristici ale
itemilor: puterea discriminativ i gradul de dificultate. Ca pretenie, aceast metod
presupune un numr mai mic de subieci cuprini n eantionul de calibrare. n realitate,
construcia scalei Rash presupune minim 1000 de subieci (Klein).
Problematica privind construcia i funcionarea testelor de tip tailored, a scalei
Guttman i a sclai Lykert este n general aceeai ca la analiza factorial i metoda bazat
pe criteriu.
12 pai de construcie a testelor psihologice
Sursa: Handbook Of Test Development, Steven M. Downing, Thomas M. Haladyna
Lawrence Erlbaum, 2006
Constructia testelor psihologice eprezint o abordare sistemic, bine organizat, pentru
a asigura suficiente dovezi privitoare la validitatea interpretrilor scorurilor la test,
interpretri care au o int pragmatic, cu implicaii dintre cele mai critice asupra
oamenilor.
Construcia testelor psihologice tinde s devin o specializare de sine stttoare a
psihologilor, care beneficiaz astzi de un cadru normativ (standards for educational and
psychological testing) i reglementeaz i ghideaz specialitii n construcia testelor
psihologice.
n aceast expunere, noiunea de test psihologic nglobeaz, nu ntotdeauna
justificat, i alte tipuri de teste, cum sunt cele de cunotine (achieffment tests) sau cele
pentru autorizarea sau certificarea specialitilor n diverse domenii de activitate.
Testele de cunotine sunt acele teste care evalueaz cunotinele dobndite de ctre
elevi sau studeni. Ele se deosebesc de skils tests, care msoar nivelul de competen al
unui specialist ntr-un domeniu (aa-zisul test de capacitate funcionreasc- clerical test
aptitude).
Este esenial ca indiferent de ce tip de tedt este vorba, toate trebuie s se
conformeze standardelor de natur tiinific, pe care comunitatea tiinific
internaional le respect.
Activitile asociate termenului de construcie a testelor psihologice se refer la
detalii i probleme a cror rezolvare intete realizarea unor instrumente care s se bizuie
pe un fundament solid n interpretarea i valorificarea scorurilor.
Autorii detaliaz procesualitatea stadial de construcie a testelor psihologice n 12 pai:
1. Stabilirea planului general
2. Definirea domeniului coninutului
3. Stabilirea specificaiilor testului
4. Elaborarea itemilor
5. Stabilirea designului testului
6. Producia testului
7. Administrarea testului (pentru validare, standardizare)
8. Stabilirea modalitilor de scorare a rspunsurilor
9. Stabilirea scorurilor de admisibilitate
10. Prezentarea rezultatelor
11. Banca de itemi
12. Raportul tehnic
1. Planul general
Stabilete cadrul general al tuturor activitilor implicate n construcia testului:
Construcia propriu-zis
Interpretare
Formatul testului
Identificarea surselor majore de validitate a testului
Inferenele ce urmeaz a fi efectuate
Stabilirea unor termene
Stabilirea elementelor de securitate
Controlul calitii
Face explicite cele mai multe decizii care vor fi luate pe parcursul construciei testului.
Fixeaz n mod realist termenele de finalizare ale fiecrei etape. Este definit clar i oncis
scopul testului. Operaionalizarea teoriei subiacente in itemii testului va influena toate
deciziile luate pe parcurs, privitor la validitatea instrumentului.
Definirea coninutului, delimitarea constructului teoretic (etapele urmtoare) sunt
strns dependente de modul n care a fost definit scopul testului.
Strns legate de definirea scopului sunt o serie de decizii fundamentale, pe tot parcursul
testului i n prima faz:
-Cine va scrie itemii
-Cine va verifica itemii
-Cine va selecta itemii
-Cine va fi productorul
-Cine va implementa pe PC (dac e cazul)
studiu, prin aceasta avnd loc o egalizare a aciunilor acestor variabile pentru
toi subiecii.
b. n administrarea testului, administratorul are urmtoarele responsabiliti:
S nu fixeze testarea la ore nepotrivite;
S nu programeze examenul imediat dup vacane sau dup
evenimente incitante;
Testarea s nu dureze mai mult de o or (pentru precolari nu mai mult
de 30 minute, iar pentru gimnaziu nu mai mult de 60 minute);
S informeze subiecii privitor la tipurile de sarcini pe care le vor
rezolva, ct de mult timp va fi alocat acestor sarcini;
n aplicarea anumitor tipuri de teste este nevoie de consimmntul
avizat al persoanei testate (cu ce scop este administrat testul, cine va
avea acces la rezultatele lui, cum vor fi folosite rezultatele).;
S fie familiarizat cu testul (trebuie s citeasc manualul i s-i
administreze testul siei nainte de a-l aplica altora); anumite ndrumri
specifice i proceduri trebuie revzute n ultimul timp, nainte ca testul
s nceap; s fie familiarizat cu procedurile de securitate (falsificarea
rspunsurilor, furnizarea de rspunsuri la ntmplare).
c. Privitor la persoana examinatorului, examinatorul trebuie:
S le ctige ncrederea (examinatul trebuie s cread c examinatorul
poate utiliza n interesul lui rezultatele testrii, c este capabil s
conduc n mod corect i fr eroare ntreaga procedur de aplicare a
testului
S aib urmtoarele trsturi: prietenos, obiectiv, autoritar, politicos,
inut potrivit i maniere adecvate.
d. Pe durata testului, examinatorul trebuie:
S rmn atent, pentru a preveni frauda
S fie pregtit pentru situaii speciale (cineva i-a uitat ochelarii acas,
sunt prezente persoane cu probleme medicale).
Administrarea testului constituie o etap n care echipa implicat n procesul de
construcie este preocupat de problemele de validare, de standardizare, teme legate de
securitatea testului i de fixare a duratelor cele mai potrivite, atunci cnd este vorba de un
test cu timp impus.
Exemplu: fixarea duratei de administrarea a unui test de aptitudini se realizeaz
asemntor aa numitelor speedy-test. Subiecilor li se d instructajul s lucreze ct pot
de repede, fr a neglija calitatea, preciznd c timpul este limitat. n momentul nceperii
testrii se pornete cronometrul. Pe msur ce subiecii anun finalizarea, se noteaz pe
protocol timpul realizat. Se procedeazo astfel pn ce ultimul subiect d testul. Se
consider ca fiind cel mai reprezentativ timp durata medie ntrunit de 80% dintre
subieci.
8. Scorarea rspunsurilor
Recuperarea
Se realizeaz din perspectiva urmtoarelor variabile:
-numr unic de identificare a itemului
-clasificarea itemilor dup coninut, nivel cognitiv, nivel de dificultate i de
discriminabilitate, parametrii IRT, istoricul utilizrii itemilor
Pe lng elasticitatea funciei de sortare i de recuperare, banca trebuie s fie n acelai
timp sigur.
securitatea= accesul, inclusiv al persoanelor sin staful care a participat la construcia
testului, reglementat n mod riguros.
Bree n sistemul de securitate al bncii de itemi pot duce la slbirea validitii sau
inutilitatea itemilor.
Din itemii scrii, editai, revizuii, pilotai, itemii cu cele mai bune caracteristici
psihometrice i de coninut vor fi testai n baca de itemi pentru a fi utilizai la o alt
versiune.
12. Raportul tehnic
Odat finalizat construcia, ntreaga munc trebuie prezentat ntr-un raport care
de obicei cuprinde toate aspectele importante (dezvoltarea, administrare, scorare, analiza
i evaluarea scorurilor).
Raiunea raportului este s furnizeze informaii despre toate aspectele care confer
testului validitate, care identific ameninrile posibile la adresa validitii i pe baza
crora pot fi fcute recomandri n vederea utilizrii valide i eficiente a testului.
Trebuie s existe un echilibru privitor la gradul de detalierea a raportului, astfel nct cel
care citete s-i formeze o imagine corect privitor la ct de adecvat a fost parcurs
fiecare etap de construcie i ct de valide au fost rezultatele obinute n fiecare etap.
Nivelul de detaliere poate s varieze de la o etap la alta, inclusiv funcie de preferinele
celui care realizeaz lucrarea.
O experien concret privind construcia unei variante a
GATB ( General Aptitude Test Batery)
Mellon, Duddgett Mitchel, Mc. Manus, Moritsch
Proiectul de cercetare a avut ca scop dezvoltarea unei forme alternative a GATB. Ca
rezultat al acestui program, o nou variant a GATB, sub o nou denumire, a fost
elaborat: Ability Profiler.
Fa de GATB, Ability Profiler nregistreaz urmtoarele mbuntiri:
1. Focalizarea pe raportarea unui profil al scorurilor n scopul consilierii n carier
(explorrii carierei)
2. mbuntiri de natur tehnic, cu rolul de a mbunti aspectul caracteristicilor
psihometrice
Graficele ataate unor itemi au fost aezate la baza paginii, acolo unde a permis
spaiul. Au fost efectuate multe schimbri care s mbunteasc aparena i s creasc
gradul de ocupare i la itemii aritmetici (au fost plasai n csue).
Foaia de rspuns a fost modificat (reducerea mrimii bulelor de rspuns, au fost
adugate linii orizontale care s creasc relevana variantelor de rspuns).
Itemii au trecut prin trei faze: faza de pretestare, faza de ncercare, faza
operaional.
Au avut loc reformulri tehnice ale manualului, care a fost redactat ntr-o manier care se
adreseaz n primul rnd utilizatorului (remprirea pe capitole, s-au eliminat
inconsecvenele, repetiiile, redundanele).
Au fost scrii peste 400 de itemi, mas suficient din care s fie selecionai cei cu putere
discriminativ i cu validitate, care cuprind: comparaia numelor, calcul elementar, spaiu
tridimensional, test de vocabular, raionament aritmetic, construire de obiecte.
Pilotarea testului
Testou pilot a fost realizat n colaborare cu trei servicii specializate. Au fost revizuite
materialele itemilor. Autorii furnizeaz date privitor la numrul de itemi care au fost
exclui din subtestele bateriei. Au realizate diverse grafice care sintetizeaz rezultatele
prelucrrii da
III.
cultura. Prin urmare, o traducere literara a unui test, atunci cand aceasta este o etapa in
cadrul procesului mai amplu de adaptare, merge dincolo de simpla traducere literara.
Aceasta idee este intarita de faptul ca utilizarea unor constructe neechivalente reprezinta
o sursa de eroare in cercetarile crosculturale efectuate cu teste incorect sau insuficient
adaptate.
Exemplu: constructul calitatea vietii. Intr-o tara constructul ar putea include posesia
unor bunuri materiale (masini, case etc.), in timp ce intr-o alta cultura, acest construct ar
putea include putin mai mult decat necesarul de hrana pentru supravietuire si asistenta
medicala.
Cel care adapteaza un test trebuie sa-si puna problema daca un anumit construct poate
fi sensibil in a compara doua culturi diferite. Are constructul masurat un alt inteles in alta
cultura?. Pentru aceasta au fost propuse mai multe abordari:
Hamleton: prin intervievarea sau observarea oamenilor din cele doua culturi sau
intrebandu-i pe altii (experti) despre cele doua culturi. O astfel de abordare este
subiectiva si de aceea este nevoie de utilizarea unor multiple surse de dovezi ale
conceptului ce urmeaza a fi masurat.
Un bun exemplu privind implicatiile unui test ineficient de bine adaptat la noua
cultura in comparatie cu cultura de provenienta, il constituie o cercetare intreprinsa de
Richard Wolf (1990) pe studenti americani si pe studenti nevorbitori de limba engleza.
Studentii americani au fost solicitati sa identifice similaritatea sau nesimilaritatea unor
termeni- sanguinic/pesimist. La studentii vorbitori de limba engleza performanta a fost de
54%. La studentii nevorbitori de limba engleza performanta a fost de 98%. S-a constatat
ca tara nevorbitoare de limba engleza nu avea in uz cuvantul sanguin, el fiind interpretat
cu optimist. Acesta din urma, fiind interpretat mai usor, subliniaza pericolul in a trage
concluzii in lipsa unei evidente puternice ca procesul de adaptare a testului respectiv a
avut ca rezultat 2 teste echivalente.
Datorita importantei problematicii realizarii unor teste intru totul paralele, teoria si
metodologia adaptarii intr-o alta cultura a testelor psihologice, a cunoscut o crestere a
complexitatii considerabile in ultimele doua decenii.
Un rol important in partea teoretica metodologica a adaptarii testelor o ocupa
discutarea erorilor care pot sa apara in procesul de adaptare.
IV. DIFERENTELE CULTURALE SI DE LIMBAJ CARE POT AFECTA
SCORURILE LA TESTE
a)
Echivalenta constructelor.
Se refera la maniera in care constructul masurat este corect operationalizat in
fiecare limba sau cultura.
Ex: calitatea vietii (vezi mai sus)
b)
Administrarea testului.
Comunicarea dintre examinator si persoana examinata poate naste serioase amenintari
la adresa validitatii. Cele mai multe probleme apar atunci cand instructiunile care preced
testul nu sunt clar communicate. O cale de a elimina aceste probleme este de a ne asigura
ca instructiunile la un test sunt clare si suficient de explicative.
O problema importanta o constituie examinatorul insusi. Astfel:
- sa fie recrutat din comunitatile tinta;
diferentelor curriculare intre tari. Acolo unde nu existau diferente curriculare, rezultatele
erau asemanatoare. Motivatia studentilor/elevilor afecteaza si ea performanta rezultatelor.
Astfel pot fi multi studenti de culoare din Africa de Sud care au ca scop atingerea
minimului de scor pentru promovare.
Desi pot rezulta dintr-o varietate de surse, exista 3 BIAS-uri principale ce trebuie
luate in considerare:
1) BIAS-ul de construct;
2) BIAS-ul de metode;
3) BIAS-ul de item (Van der Visner)
1) BIAS-ul de construct (deformarea de construct)
Se refera la diferentele care privesc un anumit construct la nivelul unor grupuri
culturale diferite.
De exemplu: elementele constitutive ale unui construct (comportamente, atitudini,
norme) nu pot fi identice in grupuri culturale diferite. Exemplu: Inteligenta. Cele mai
multe teste de inteligenta au o definitie implicita a acesteia ca fiind o gandire si o
capacitate de a gandi si relationa logic (Raven). Sau Weschler in scalele sale de
inteligenta: cunoasterea dobandita de un individ si memoria.
Aceste diferente sunt cel mai adesea constatate cand indivizii sunt pusi sa descrie
caracteristicile unei persoane inteligente.
Exemplu: studiile efectuate in alte culturi decat cele vestice au raportat faptul ca
conceptiile despre inteligenta sunt mult mai largi si includ in alte culturi si aspecte
sociale. (mamele din Kenya: un copil inteligent este acela care isi cunoaste locul in
familie, care cunoaste comportamentele asteptate din partea lui si maniera de a se adresa
altor oameni; Zambia: o persoana inteligenta merge dincolo domeniul scolar cu care
inteligenta e asociata in cultura occidentala).
Se pune problema esantionarii corecte a universului sensurilor pe care le implica un
concept, care este operationalizat intr-un instrument.
TRIANDIS, 1978 a pretins ca masuratorile efectuate in psihologie sufera de o
reprezentare slaba a constructelor operationalizate. Datorita unei operationalizari
restrictive a constructului masurat de test, in compararea a doua grupuri culturale intre
care exista o mare distanta pot sa apara serioase alterari.
2) BIAS-ul metodei (deformarea metodei)
Se refera atat la instrumentul de masurare, cat si la administrarea acestuia.
a) Privitor la instrument este vorba de acele proprietati ale acestuia care nu au fost
studiate indeajuns dar care pot induce diferente in scorurile la test.
Exemplu: gradul de familiarizare al subiectului cu stimulii si raspunsurile (formatul
raspunsului).
Serpel, 1979 a studiat atitudinile perceptive ale copiilor, figurile utilizate, metoda
creion-hartie, plastelina, prezenta mainilor si modelarea cu ajutorul unor fire de metal
(foarte populara in Zambia).
Copiii din Anglia i-au depasit pe cei din Zambia la probele creion-hartie, iar cei din
Zambia i-au depasit pe cei din Anglia la proba de modelare cu fire de metal. Aceasta
inseamna ca familiarizarea cu un anumit tip de raspuns constituie o deformare a
scorurilor la test.
Triandis, 1989 a gasit diferentele intre europeni, americani si hispanici privitoare la
utilizarea scalelor de evaluare cu 5 trepte si cea cu 10 trepte.
Exemplu: hispanicii tindeau sa utilizeze extremele la scalele cu 5 trepte, mai frecvent
decat euro-americanii. Nu se intampla la fel in scalele cu 10 trepte.
b)A 2-a categorie de BIAS de metoda se refera la administrarea testelor, mai exact
la instructajul sau probleme de comunicare intre examinator si persoana testata.
Acest lucru se intampla cand se utilizeaza alta limba decat cea materna. Lipsa
cunostintelor despre cultura persoanelor testate duce la violarea instructajelor testelor.
Este deja cunoscut in psihologie influenta deosebita pe care o are asupra
intervievatului caracteristicile intervievatorului: varsta, genul, etnia. Trebuie concluzionat
ca deformarile care tin de instrumente pot avea un efect larg asupra scorurilor la teste. De
asemenea, deformarile in educatie sau care tin de o expunere anterioara la acel test pot
afecta scorul la anumiti itemi cu continut legat de scoala.
3) BIAS-ul de itemi (deformari ale itemilor)
Se refera la amenintarile validitatii care afecteaza anumiti itemi in timp ce
deformarile constructorului si metodei afecteaza caracteristicile mai generale ale
instrumentului.
Afectarea itemilor a fost comentata pentru prima data in 1968 de Cleary si Hilton,
apoi a fost inlocuita cu termenul functionare diferentiala a itemilor.
Traducerea defectuoasa si conotatiile diferite acordate unor cuvinte:
Exemplu: agresivitatea explicata prin cearta, determinare si pregatire pentru conflict.
In dictionarul britanic agresivitatea reprezinta actul de a ataca fara provocare, de a incepe
o cearta.
In principiu, asa cum arata Holland si colaboratorii un item este considerat a fi
deformat daca are acelasi scor la general, la test are acelasi scor asteptat la un item
anume.
Pentru analiza surselor de deformare a itemilor se divizeaza cele 2 esantioane din cele
2 culturi intr-un numar de grupuri constituite pe nivele de scoruri.
Exemplu: in primul grup american introducem subiecti cu scorul egal cu unitatea. In
mod similar, in grupul olandez introducem persoanele cu scorul egal cu 1. Apoi
urmatoarele grupuri cuprind scorurile egale cu 2. Astfel putem compara scorurile
esantionului american cu cel olandez cu acelasi nivel de scor si nu comparam scorurile
medii. De exemplu, itemul despre presedintele? american va fi deformat daca subiectii
americani si olandezi cu acelsi scor la test nu vor avea acelasi scor mediu la acel item.
Mellenbergh, in 1982 a propus distinctia intre deformarea uniforma si neuniforma. Un
item este uniform deformat daca diferentele sunt mai mari sau mai mici, constante la
toate nivelele de performanta.
Deformari ale esantionului / incompatibilitatea esantioanelor implicate in
procesul de adaptare al testului la o alta cultura.
Este vorba de inegalitatile privitoare la reprezentativitatea esantionului pentru
culturile din care ele sunt extrase.
Exemplu: profesorii care isi fac studiile pe studenti (nu oricine poate intra la Harward)
V.
1) Autorii de teste pot dezvolta un test care ulterior va fi adaptat cu autorizarea lor.
Adaptarea poate fi realizata fie cu fie fara implicarea lor cu asistenta specializata;
2) Companiile care publica si distribuie testele care ulterior vor fi adaptate numai cu
autorizarea lor, pot fi implicate sau nu in adaptarea la o alta cultura a testului
respectiv;
3) Autorii unui test pot sau nu sa fie implicati in publicarea unei versiuni ulterioare a
unui test. Exemplu: editiile ulterioare ale WISC au 26 de adaptari oficiale dar este
utilizat in 34 de tari ceea ce conduce la idea existentei unor versiuni neautorizate;
4) In dezvoltarea testelor psihologice sunt antrenati profesionisti cu experienta care
apoi dezvolta asfel de teste in alte limbi si culturi. Exemplu: staff-ul Microsoft
produce peste 45 de teste anual in 16 limbi pentru utilizarea in peste 75 de tari;
5) O componenta importanta a sistemului de adaptare a testului la alta cultura o
constituie formatorii de specialisti in domeniul testelor;
6) In acelasi sistem trebuie implicate alte grupuri cum sunt cele ale consumatorilor
de teste psihologice. Persoanele si organizatiile ce consuma informatiile provenite
din aplicarea testelor in vederea luarii deciziilor.
Reglementarile si standardele etice se refera in general la urmatoarele probleme:
Standarde tehnice: au rolul de a promova bunele practici pentru adaptarea
testelor si determinarea echivalentei scorurilor la acestea;
Deprinderile si aptitudinile profesionale: categoria de standarde ce ia in
dezbatere calitatea persoanelor care utilizeaza teste adaptate;
Standarde morale: nevoia de a actiona intr-o maniera etica si profesionista
din partea celor care utilizeaza testele, responsabilitatea, asigurarea
materialelor necesare utilizarii testelor, confidentialitatea rezultatelor.
O serie de principii etice generale privesc urmatoarele domenii:
1) beneficiul si avantajul persoanelor testate;
2) fidelitate si responsabilitate;
3) integritate, justitie si respect pentru demnitatea oamenilor;
VI.
VII.
PENTRU
EVALUAREA
DEFORMARII
Stepen Sireci face distinctia intre impactul itemului si functia diferentiala a itemului
(DIF).
Impactul itemului conduce la o diferenta semnificativa intre grupurile implicate in
cercetare privitoare la un item.
Exemplu: un grup are o proportie mai mare de examinati care a raspuns corect la un
item decat celalalt, asfel ca impactul itemilor poate fi apreciat datorita diferentelor
existente sau sa se datoreze deformarilor suferite de acel item.
Analiza DIF incearca sa precizeze daca impactul itemului se datoreaza diferentierii de
performanta intre cele 2 grupuri sau se datoreaza deformarilor itemilor. Pentru aceasta
analiza, examinatorii sunt egalizati pe baza capacitatii, aptitudinii masurate de test.
Subiectii apartinand acestor 2 grupuri diferite, egale din punct de vedere al performantei,
ar trebui sa raspunda in mod similar. In caz contrar, itemul functioneaza diferit in cele 2
grupuri.
Analiza impactului itemului si DIF sunt elemente de natura statistica.
Analiza deformarii itemului este un demers calitativ.
Un item este deformat la nivelul unui grup daca subiectii din acel grup obtin rezultate
mai slabe decat grupul similar. De asemenea, ratiunea acestei performante mai slabe tine
de constructul operationalizat in instrumentul de masurare.
Pentru a afirma ca exista o deformare a itemului ar trebui identificata o caracteristica
a acestuia care este prezenta intr-un grup si nu este prezenta in celalalt.
Exemplu: un concept familiar pentru un singur grup.
Statisticile utilizate utilizate in deformarea itemilor cauta sa identifice itemii care
functioneaza diferit in grupurile considerate grupuri care trebuie egalizate din punct de
vedere al capacitatii caracteristicii masurate.
Odata ce itemii deformati au fost identificati, ei sunt supusi unor analize calitative in
scopul explicarii diferentei constatate. Atunci cand explicatiile acestei diferente par sa nu
aduca argumente ca itemii intr-adevar masoara caracteristica operationalizata, itemii sunt
catalogati ca fiind deformati.
IX.
1)
2)
3)
4)
5)
METODELE
UTILIZATE
IN
DIFERENTIATE A ITEMILOR:
ANALIZA
FUNCTIONARII
Daca linia nu trece prin sistemul de origine al celor 2 axe, aceasta reflecta diferentele
fata de medie. Itemii care au fost identificati ca avand o functionare diferentiata, au fost
reprezentati cu puncte negre si se situeaza in afara liniilor drepte. Ei urmeaza sa faca
obiectul unor analize pentru a fi modificati sau indepartati.
Metoda indexului de standardizare
Indexul de standardizare a fost propus in 1986 de Dorans si Kulik. El se bazeaza
pe o valoare P conditionata. Aceasta valoare implica calcularea valorii P pentru fiecare
item, valoare care este pusa in relatie cu scorul total la test.
Exemplu: persoanele examinate prin versiuni lingvistice diferite ale aceluiasi item
ar putea fi egalizate din punct de vedere al scorului total la test. Apoi pentru subiectii cu
acelasi scor la test este calculata si comparata proportia de examinati care au raspuns
corect. Daca itemul nu are probleme ar trebui ca cele 2 grupuri sa performeze asemanator.
Acest proces este repetat pentru toate scorurile generale obtinute.
Metoda teoriei raspusurilor la itemi (TRI)
Si aceasta metoda se aplica in special itemilor cu raspuns dihotomic. Esentialul ei
este de a evalua daca poate fi utilizat un set comun de parametri ai itemului pentru a
descrie daca acel item functioneaza asemanator in grupurile culturale luate in considerare.
Utilizarea TRI pentru studiul comparabilitatii si echivalentei itemilor pentru
aptitudine scolara si a adapatarii sale pentru populatia spaniola.
In primul desen se observa ca in cele 2 grupuri itemul respectiv functioneaza
diferit. Paradoxal, performantele grupului latin sunt mai mari decat in grupul american ca
urmare a analizei itemilor. Curbele pentru cele 2 grupuri in al 2-lea desen sunt identice.
Aceasta arata ca indivizii de la toate nivelele trasaturii latente din ambele grupuri, au
aceeasi probabilitate de a da un raspuns corect la item. Ca atare el este comun celor 2
variante ale testului.
X.
UTILIZAREA
SUBIECTILOR
BILINGVI
IN
EVALUAREA
VERSIUNILOR CULTURALE DIFERITE ALE UNUI TEST
O alta metoda de evaluare a echivalentei a 2 versiuni diferite ale unui test, o constituie
administrarea versiunilor unui grup de subiecti care au competente egal dovedite in
ambele limbi. Ratiunea acestei metode este aceea ca utilizand un singur grup de subiecti
sunt eliminate efectele datorate diferentelor intre grupuri. Pe de alta parte se dobandeste o
echivalenta inalta a celor 2 masuratori. Exista asfel mult mai multe sanse ca diferentele
de performanta intre cele 2 grupuri sa se datoreze mai degraba testului insusi si nu
diverselor surse de deformare. De obicei subiectii bilingvi sunt selectionati cu ajutorul
unor teste speciale care evalueaza competenta intr-o limba sau alta. Dincolo de avantajele
reale ale acestei metode, exista si o serie de inconveniente.
Unul dintre dezavantaje este acela ca subiectii bilingvi vor performa mai bine in
limba materna decat in cealalta limba chiar daca cele 2 versiuni ale itemului sunt
echivalente.