Teoria Si Constructia Instrumentelor de Investigatie Psihologica Curs

SCOPUL UNITII DE CURS: Familiarizarea cursanilor cu problemele principale ale teoriei testului psihologic; Informarea cursanilor asupra principalelor
or tipuri teste psihologice; Informarea cursanilor asupra direciilor de evoluie a testelor psihologice; Informarea cursanilor asupra specificului constructiv din domeniul testelor psihologice; Informarea cursanilor asupra problemelor de interpretare a rezultatelor testelor psihologice; Informarea cursanilor asupra limitelor interpretrii statistice a rezultatelor. OBIECTIVE OPERAIONALE: n urma studierii acestei uniti de curs, studenii trebuie s-i formeze urmtoarele deprinderi intelectuale: S opereze cu principalele concepte utilizate n teoria testelor psihologice; S precizeze principalele etape n dezvoltarea testului psihologic; S precizeze situaiile de aplicare a testelor psihologice; S precizeze specificul principalelor tipuri de scale normative folosite n exploatarea rezultatelor testelor psihologice; S precizeze sensuri i non-sensuri n interpretarea rezultatelor testelor. MODALITILE DE EVALUARE: Se va realiza n cadrul unui examen scris la sfritul semestrului. Pentru examen se vor stabili dou tipuri de subiecte: un tip referitor la teoria testului psihologic i un tip referitor la aplicarea n practic a cunotinelor dobndite. n cadrul activitilor tutoriale se vor exersa subiectele cu caracter practic i se va verifica realizarea exerciiilor de la sfritul capitolelor. Tipurile de subiecte pentru examen vor fi egal ponderate pentru nota final obinut la examen.
TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC
CONSIDERAII PRELIMINARE
Cuvntul test este de origine englez i nseamn prob. Verbul to test nseamn a proba, a supune unui examen. Acest termen nu este unul specific psihologic, adic nu se folosete doar n examinarea psihologic sau doar n domeniul psihologic. El este utilizat ntr-o diversitate de discipline tiinifice i de domenii practice. Majoritatea manualelor tiinifice au pregtite teste de cunotine Se vorbete de testarea motoarelor, a anumitor dispozitive tehnice, a capacitii fizice de efort, a ipotezelor tiinifice. Este cazul s prezentm semnificaia extins a acestui termen. n viziunea lui Gustav A. Lienert, testul este: Un procedeu de cercetare a unei caracteristici a personalitii; Procedeu de realizare a unei cercetri; Totalitatea rechizitelor necesare pentru realizarea cercetrii Orice cercetare, n msura n care are caracterul de prob prin sondaj; Anumite procedee de verificare statistic-matematice (de exemplu, testul chi ptrat, testul t a lui Student)1. Acest termen tiinific a fost folosit n psihologie de ctre James McKeen Cattell, profesor la Universitatea din Pennsylvania, ulterior la Columbia, care a publicat n anul 1890 articolul Mental Tests and Measurements n revista Mind. Dei a fost un nume tiinific prestigios i a avut realizri deosebite n psihologie, testele sale au avut o rspndire limitat, datorit succesului slab n aplicarea practic. Cu toate c a folosit pentru prima dat acest termen, James McKeen Cattell nu este unanim recunoscut ca printe al metodei testului n cercetarea psihologic. O serie de autori occidentali au publicat probe psihologic, fr s poarte numele de test, nainte de anul 1890, numele celebrului savant englez Francis Galton fiind cel mai frecvent invocat drept argument. Se poate vorbi de o faz presistematic a testului psihologic, n cadrul acesteia putnd fi evideniate ncercri de a crea diferite probe care s pun n eviden mai ales debilitatea mintal, utilitatea acestora fiind reclamat de nevoia crerii unor aezminte colare speciale, destinate copiilor care aveau probleme de retardare mintal. Evoluia vieii social-economice fcea necesar inventarea unor instrumente de investigaie care s se refere la caracteristicile vieii psihice, domeniile justiiei, industriei, activitii colare reclamnd cel mai frecvent astfel de instrumente. Testul psihologic n forma sa modern nu este dect produsul final al unei lungi perioade de cutri i ncercri.2 Satisfacerea exigenelor teoretice i practice fa de un instrument de investigaie psihologic a fost reuit de Scala metric a inteligenei, creat de medicii francezi Alfred Binet i Thodor Simon n anul 1905, cu perfecionri n anii 1908 i 1911. Recunoaterea scalei metrice a inteligenei, creat de cei doi medici francezi, ca prototip al testului psihologic, se datoreaz intersectrii unor acumulri tiinifice apreciabile cu nevoile instituionale, reflectate n comenzi adresate de ctre autoriti guvernamentale franceze, fapt care a fcut ca testul s intre n viaa practic a societii. Ca atare,
1 2
Vezi Gustav A. Lienert, Testaufbau und Testanalyse, Verlag Julius Beltz, Weinheim und Berlin, 1967, pag. 7. Vezi Aurel Stan Testul psihologic, Editura Polirom, Iai, 2002
AUREL STAN
paternitatea metodei testului psihologic este atribuit adesea lui Alfred Binet, personalitate strlucitoare a vieii tiinifice din Frana la sfritul secolului XIX i nceputul secolului XX3. Prin perfecionarea metodologiei de construcie i prin concepia realist privind menirea testului psihologic, Alfred Binet a reuit s introduc testul n viaa instituiilor sociale i s-l fac util pentru un mare numr de oameni. Practic, prin creaia lui Binet, testul psihologic a primit botezul social. Impresioneaz durabilitatea temporal a acestui instrument de psihodiagnostic, nefiind scos din uz nici pn n zile noastre, este adevrat prin intervenia unor adaptri fireti, cea mai cunoscut fiind forma Stanford-Binet. Spaiul restrns al acestui curs nu ne permite s realizm o istorie a testului psihologic, parte a tratrii testului psihologic care este considerat de noi ca fiind deosebit de interesant i instructiv. n aceast parte de istorie gsim informaii care ne permit o imagine complet a unui efort tiinific i practic-aplicativ de mare anvergur. Spaiul rezervat acestui curs nu permite dezvoltarea dimensiunii istorice a testului psihologic. Putem sintetiza dezvoltarea testului psihologic prin conturarea a dou tendine: Tendina extensiv de dezvoltare se caracterizeaz prin: Extinderea ariei geografice de rspndire; Mrirea amplitudinii vrstei de aplicare la cele dou limite, inferioar i superioar; Diversificarea formelor i complexitii solicitrilor; Creterea numrului domeniilor de aplicaie; Diversificarea categoriilor de populaie care beneficiaz de examinarea psihologic prin intermediul testelor. Tendina intensiv are urmtoarele direcii: Creterea obiectivitii n evaluare(o instrucie mai adecvat n evaluarea sarcinilor, punctarea mai adecvat a variantelor de rspuns); Perfecionarea teoriilor care stau la baza construciei testelor; Intervenia statisticii n construcia i exploatarea informaional a testului; Perfecionarea analizei itemilor; Creterea exigenelor cu privire la calitatea msurrii.
Prin aceast afirmaie nu se ignor contribuia lui Thodore Simon, dar considerm c cel mai mare merit i revine lui Binet
I. INTRODUCERE N TEORIA TESTULUI PSIHOLOGIC

I.1. TEORIA TESTULUI PSIHOLOGIC I.1.1. Precizri noionale. n orice studiu tiinific exist obligaia precizrii termenilor utilizai, fapt care implic detaarea denotaiilor de conotaii. Noiunea de test nu este folosit exclusiv n psihologie, ci i n alte discipline tiinifice, n consecin, testul este un termen nespecific psihologiei. Se vorbete de teste fizice, biologice, chimice etc. De asemenea se vorbete de teste medicale. Nu n rare cazuri auzim de testarea motoarelor, a instalaiilor i n teoriile tiinifice de testarea unor modele. Consultarea unor dicionare explicative generale reputate, nespecializate n psihologie, indic diferenieri ale domeniilor de utilizare a testului4. n sensul cel mai general cuvntul test nseamn procedeu de verificare care apeleaz, de cele mai multe ori, la forma chestionarului. Este mai ales cazul probelor de verificare a cunotinelor din diverse discipline tiinifice sau preocupri umane sistematizate. I.1.2. Definiii ale testului psihologic Definirea testului psihologic de ctre specialitii domeniului teoriei testelor difer mai puin n privina terminologiei utilizate, ct mai ales prin amploarea sau ngustimea referinelor. Vom prezenta cteva definiii de referin Asociaia Internaional de Psihotehnic d testului urmtoarea definiie :Este o prob definit, implicnd o sarcin de ndeplinit, identic pentru toi subiecii examinai, cu o tehnic precis pentru aprecierea succesului i a eecului, sau pentru notaia numeric a reuitei. Sarcina poate s comporte o punere n aplicare fie a cunotinelor achiziionate (teste pedagogice), fie a funciilor senzorial-motrice sau mentale (teste psychologice)5. Se observ din aceast definiie excluderea construciilor psihometrice destinate investigrii personalitii din rndul testelor. Astfel de puncte de vedere nu sunt singulare. Maurice Reuchlin d o definiie care surprinde aspecte eseniale ale testului psihologic: "Prob, utilizat mai ales n psihologia diferenial, care permite de a descrie comportamentul unui subiect ntr-o situaie definit cu precizie ("consemnul" testului) prin referin la comportamentul unui grup definit de subieci plasai n aceeai situaie"6. O definiie a testului psihologic de larg circulaie este dat de Pierre Pichot, folosind denumirea original cu care a fost lansat testul: Se numete test mental o situaie experimental standardizat servind de stimul la un comportament. Acest comportament este evaluat printr-o
4 Am consultat n aceast privin "Dicionarul explicativ al limbii romne", Editura Academiei, 1984, "Dictionnaire de la langue francaise", Hachette, 1994, "Le petite Larousse", Larousse, Paris 1992, "Webster"s Enciclopedic Unabridget Dictionnary of the English Language, Grammercy Books, New York, 1996, "Cambridge International Dictionary of English, Cambridge University, Press, 1996 5 dup Lussato, Ariane Les tests des reecrutement, Presses Universitaires, de France, Paris, 1998, pag.7. 6 Vezi "Grand dictionnaire de la psychologie", Larousse, Paris, 1992, pag.782. Definiia din dicionar aparine lui Maurice Reuchlin, membru al colectivului de autori care l-a elaborat.
AUREL STAN
comparaie statistic cu acela al altor indivizi plasai n aceiai situaie, permind astfel de a clasa subiectul examinat, fie cantitativ, fie tipologic7. Parcurgnd definiiile anterioare i analiznd deficienele acestora am elaborat urmtoarea definiie pentru testul psihologic: "Procedeu standardizat de investigaie psihodiagnostic care pune n eviden prin diferite modaliti de stimulare ale subiecilor comportamente relevant diagnostice, exploatabile informaional pe baza comparrii rezultatelor obinute cu cele ale unor eantioane reprezentative de persoane aflate ntr-o situaie de examinare identic i care folosete n descrierea i explicarea concluziilor termeni tiinifici specifici teoriei care stau la baza construciei sale". Din definiiile elaborate se pot detaa un ansamblu de trsturi de consens: testul psihologic este un instrument standardizat de investigaie; pentru aprecierea rezultatelor sale se face referin la rezultatele unui grup de referin; diagnosticul realizat prin folosirea testului psihologic se refer la un larg domeniu de comportamente considerate relevant diagnostice I.1.3.Prile componente ale unui test psihologic n calitate de procedeu standardizat de investigaie un test psihologic are o serie de componente care n ansamblu asigur funcionalitatea sa: a) Componenta static, material a testului, denumit uneori i partea de rechizite a testului, se subdivide n: 1. Manualul testului, n care sunt prezentate: descrierea, geneza constructiv, fundamentele tiinifice, indicaii privind punerea n aplicare i normele stabilite. Este sursa informaional principal pentru aprecierea ncrederii pe care trebuie s o avem ntr-un anumit test. Manualul trebuie s dea indicaii detaliate despre procedeele de evaluare i despre modul n care se redacteaz concluziile aplicrii unui test. ntre exigenele ideale i realitatea practic exist o anumit distan. Calitatea prezentrii poate lsa de dorit, n unele cazuri, prin omisiunea unor factori care ar putea folosi utilizatorului i prin ascunderea, omiterea unor aspecte dezavantajoase ale testului. L.J. Cronbach afirm c testele elaborate nainte de 1945 posedau foarte rar manuale complete i nu erau conforme celor mai noi standarde din domeniul examinrii prin intermediul testelor (elaborate de asociaii profesionale i internaionale)8. Producerea unui bun manual este o chestiune cu att mai dificil, cu ct mai multe rezultate s-au cumulat despre test. Manualul trebuie s fie redacta n aa fel, nct s fie foarte clar pentru profesioniti i s duc la recunoaterea de ctre non-profesioniti a faptului c ei nu posed o calificare n domeniu. Un important ajutor n redactarea manualelor l constituie recomandrile tehnicile editate de asociaiile profesionale internaionale i naionale (cele mai cunoscute sunt cele editate de Asociaia Psihologilor Americani (APA). Recomandrile tehnice ale asociaiilor profesionale indic ce trebuie s conin un bun manual. 2. Materialul testului const din diferite tipuri de aparate pentru evidenierea stimulrilor, caietul testului, foi de rspuns, materiale pentru prelucrare i pentru manipulare. Este partea care asigur stimularea comportamentelor de rspuns.
vezi Pichot, Pierre Les tests mentaux, Presses Universitaires de France, Paris, 1994, pag. 5. Cronbach, Lee, J., Validitt, n Psychologische Diagnostik (herausgegeben von Karl-Herman Wewetzer), Wissenschaftliche Buchgeselschaft, Darmstadt, 1979, pag.159-162
7 8
3. Auxiliare de evaluare precum grilele de corectur, abloane, folii cu orificii, aparate de msur; b) componenta dinamic, de realizare a, unui test se divizeaz metodologic i tehnologic, dup cum urmeaz: 1. Consemnul testului instruiete persoana profesional calificat n aplicarea testelor n privina condiiilor de realizare i evaluare a testelor i despre ceea ce le este pretins examinailor n timpul examinrii prin intermediul unui test. Informaii de acest gen pot fi cuprinse uneori n manualul testului. 2. Partea de realizare rezid ntr-o reacie motorie (exemplu, reacie senzorial-motorie sau verbal la stimuli simpli sau compleci, tapping), ntr-o percepie senzorial (exemplu tahistoscop), ntr-o activitate de rutin mental sau fizic (a nira perle, a calcula dup un algoritm, cum este cazul la testul Kraepelin), n rezolvarea unei probleme concrete abstracte (a construi pompa Schulze, a monta instalaia denumit Winkeltrieb a rezolva sarcina de gndire) sau n luarea n consideraie asupra unei ntrebri privind comportamentul, tririle sau dispoziiile. Sarcinile din cadrul unui test pot s aib un coninut simplu sau complex, dificultile lor putnd fi aproximativ egale sau foarte inegale. 3. Evaluarea poate s se realizeze intuitiv, regulat, schematic sau automatic. Prin evaluare, rezultatele realizrii testului sunt cunoscute prin intermediul unuia sau mai multor scoruri. Componentele testului suport condensri informaionale odat cu procesul de computerizare a testului psihologic. Practic, informaiile prii statistice sunt condensate pe o dischet care pot fi ilustrate prin intermediul diferitelor tipuri de computere. Testele computerizate vor avea consacrat un capitol aparte n lucrarea noastr. I.1.4. Clasificarea testelor psihologice Clasificarea este o operaie intelectual prin care obiectele dintr-o mulime dat sau un univers sunt mprite n clase n funcie de asemnrile i deosebirile dintre ele. Referitor la puterea informaional, menionm c o clasificare a testelor are fora informaional a cel mult unei scale ordinale, dar, de cele mai multe ori a celor nominal,e n care pot opera grupri i rafinri. Compararea obiectelor unui univers se face dintr-un anumit unghi de vedere, numit criteriu. Clasificarea poate fi numit natural, dac ea descrie clasele aa cum exist n realitate, sau artificial, n cazul n care clasele sunt formate dup anumite criterii convenionale funcie de utilitate. Clasificarea poate fi teoretic, n care avem nu numai clase reale, ci i clase posibile, i empiric, n care avem doar clase reale. Clasificarea poate fi fcut dup unul sau mai multe criterii. n funcie de natura obiectelor, ea poate fi exact sau inexact. O clasificare exact presupune c pentru orice obiect din universul supus clasificrii putem spune exact crei clase aparine. Pentru cazul testelor psihologice putem spune c avem o clasificare artificial, empiric i inexact. n mod tradiional, n clasificare se pornete de la tipul ideal de clasificare care are la baz supoziii referitoare la satisfacerea terului exclus pentru orice obiect din universul supus clasificrii n raport cu proprietile invocate, la faptul c o clasificare este complet, adic fiecare obiect din universul de clasificare face parte din una din clasele indicate i la faptul c n ansamblu clasele se exclud ntre ele, suma claselor identificndu-se cu universul. n realitate, aceste cerine nu sunt realizate dect imperfect datorit faptului c n practica clasificrii suntem confruntai adesea cu mulimile vagi; n unele cazuri cu mulimile infinite sau mulimi nedefinite. Universul testelor psihologice realizeaz
9
AUREL STAN
imperfect exigenele ideale ale clasificrii, deoarece se opereaz cu mulimi vagi (unele clasificri includ i testele de personalitate subiective, altele nu), care nu sunt finite (clasificrile actuale cuprind mai multe clase de testele dect cuprindeau cele de acum 50 de ani, deci numrul obiectelor universului de clasificare este n cretere cu o rat imprevizibil). Din analiza clasificrii testelor psihologice fcut de ctre diveri autori de specialitate putem afirma c nu exist o unitate de preri, dar ntre majoritatea criteriilor de clasificare utilizate exist o concordan apreciabil. n privina clasificrii testelor s-au pronunat personaliti de prim rang ale psihologiei aplicate. Astfel, enumerm n aceast privin autori ca H.J. Eysenck (1953), M. Irle (1956), G. Lienert (1969), L.J. Cronbach (1970), P. Horst (1971), R.L. Thorndike (1971), R. Meili i E. Steingruber (1978), Anna Anastasi, Rolf Brickenkamp (1997), D. Laveault i J. Gregoire (1994)9. n 1973 D. Speck i R. Speck introduc dou grupe de criterii de clasificare, preluate de majoritatea celor ce se ocup de clasificarea testelor. Autorii germani fac o diviziune utilitar-pragmatic a testelor, din punctul de vedere al coninutului i din punctul de vedere al formei. Cea mai mare concordan n sistemele de clasificare se afl n grupa celor ce adopt punctul de vedere formal. Aspectele clasificrii formale sunt: caracteristicile construciei testului, materialele pe care le utilizeaz testul, felul realizrii comportamentului revant diagnostic, felurile de reacie care sunt pretinse i modul de realizare a evalurii. Cronbach, Eysenck, Michel, Lienert, Ingekamp i Irle fac referiri asupra criteriilor de clasificare formale. Acest punct de vedere poate s fie important mai ales pentru practicieni, deoarece pentru acetia este foarte important s tie dac un test poate fi aplicat individual sau n grup, dac face apel la exprimarea verbal n efectuare, dac pretinde reacii motorii n rspuns. Clasificarea care adopt acest punct de vedere are un dezavantaj clar prin faptul c nu face nici o referire la scopul unui procedeu de examinare, deci nu se tie nimic despre ceea ce conine un test, despre ceea ce trebuie s msoare un test. Este, de asemenea, dificil s ne exprimm clar n privina domeniile de aplicaie ale unui test. Practic testele de inteligen se pot ncadra n oricare din clasificrile adoptnd punctul de vedere formal. Cele mai importante criterii de clasificare ale grupei de clasificare formal sunt: Dac lum n consideraie gradul de standardizare i cuantificare, testele se mpart n psihometrice (evaluarea se produce numeric i prin norme) i nepsihometrice (care fac apel n elaborarea concluziilor la virtuile clinice de exprimare). Acesta este un punct de vedere ntlnit n bibliografia de specialitate nu este mprtit de autorul acestei lucrri (care a definit anterior testul ca un procedeu de investigaie standardizat). Aceasta nu nseamn c putem ignora alte puncte de vedere exprimate de autori cu experien n domeniul teoriei i practicii aplicrii testelor psihologice. Diviziunea n teste standardizate (etalonate) i nestandardizate (informale) se ntlnete ntr-un tratat al crei autor este Gustav A. Lienert10. Dup concepia autorul amintit testele informale sunt destinate uzului personal al psihologilor i profesorilor, care i propun, de exemplu, s claseze doar membrii unei singure clase colare cu care lucreaz frecvent. Rezultatele testelor standardizate capt semnificaie cantitativ prin raportare la cele ale unui grup de referin, numit i grup normativ. n privina posibilitii de a examina simultan mai muli subieci distingem ntre teste individuale i teste colective sau teste de grup. Testul individual are dezavantajul care const n alocarea unui timp de aplicare crescut pentru un singur subiect, dar are avantajul c ofer posibilitatea de a
Anul care este trecut n parantez este cel al ntocmirii unor sisteme de clasificare de ctre autorii respectivi. Precizrile sunt realizate n limita bibliografiei parcurse. 10 Lienert, Gustav.A., "Testaufbau und Testanalyse", Verlag Julius Beltz, Weinheim/Berlin, 1967, pag.21
9
10
observa mai bine reaciile particulare n timpul examinrii. Testul colectiv are ca principal avantaj economia de timp a examinrii i ca dezavantaj observarea insuficient a subiectului. Clasele rezultate din operarea cu acest criteriu de diviziune interfereaz cu cele rezultate din aplicarea altor criterii de clasificare i sunt , de asemenea, interanjabile n interiorul aceluiai criteriu. Astfel, majoritatea testelor colective sunt teste creion-hrtie i majoritatea testelor individuale sunt teste aparative sau de prelucrare a materialelor. O tendin demn de luat n seam este aceea a transformrii testelor individuale n teste colective, prin computerizare Astfel testele care presupun evidenierea timpului de reacie, simplu sau complex, pot fi efectuate colectiv prin deservirea de ctre acelai computer a mai multor instalaii de examinare. Din punctul de vedere al medium-ului testului, care privete suportul informaional al testului, se poate vorbi de teste creion-hrtie, teste de reacie verbal, teste de manipulare i prelucrare materiale, teste imagini, teste care apar pe display-ul computerului, teste aparative. Clasele constituite prin activarea acestui criteriu sunt ntr-o interanjabilitate accentuat, fapt care face ca anumite clase s fie golite, aspirate de alte clase. Este cazul testelor creion-hrtie care sunt transformate, ntr-o proporie apreciabil, n teste computerizate. n funcie de utilizarea formei verbale de exprimare n producerea rspunsului la situaia problematic pe care o cuprinde testul, deosebim ntre teste verbale (care depind, de cele mai multe ori de nivelul de cultur al subiectului) i teste non-verbale (care nu depind de nivelul de cultur, create special pentru a contracara influena acestuia); n decursul istoriei exploatrii diagnostice a testelor psihologice s-a reproat deseori testelor c favorizeaz subiecii care provin din straturi sociale cultivate. Forma non-verbal de exprimare este parial sau total, adic poate aparine doar subiectului, cruia i se poate adresa pentru a nelege ce are de fcut, sau att subiectului ct i examinatorului, mai ales n examinarea surdo-muilor. Pentru exprimarea rspunsurilor acestei categorii de teste se poate folosi ntreaga gam a comunicrii paraverbale. n funcie de numrul dimensiunilor cuprinse n destinaia psihodiagnostic a testului, deosebim teste unidimensionale(exemplu MMQ aparinnd lui H.J. Eysenck, KLT, aparinnd lui H. Dker) i teste multidimensionale (IST, aparinnd lui R. Amthauer i PIT, aparinnd lui E. Mittennecker) Acest criteriu este exprimat i prin formularea de teste singulare (care posed o singur component) i baterii de teste. Testele singulare11 nu se confund cu testele individuale cu care pot doar interfera. Atributul de singular se refer la numrul componentelor testului, pe cnd cel individual la faptul c se poate aplica unui singur individ. Testul singular poate fi aplicat individual sau colectiv, iar testul individual poate fi unidimensional sau multidimensional. Exigenele n privina realizrii unidimensionalitii unui instrument de investigaie psihodiagnostic sunt foarte ridicate, deoarece faptul psihic este prin esena sa se afl n interdependen, i nu se realizeaz dect imperfect. Dac lum n consideraie gradul de structurare a configuraiei stimulilor care provoac comportamentul analizat facem separare ntre teste nalt structurate i teste slab structurate. Stimularea n cazul testelor slab structurate nu este dat sub forma unei solicitri ce presupune o form de rspuns dihotomic sau polihotomic, ci sub o form care impune un efort de structurare din partea subiectului.
11
Denumirea reprezint traducerea termenului german Einzeltest, ntlnit n Rolf Brickenkamp (hrsg.), "Handbuch psychologischer und padagogischer Tests", Hogreffe, Verlag fur Psychologie, Gottingen, Bern, Toronto, Seattle, 1997, pag.XV.
11
AUREL STAN
n funcie de felul comportamentului provocat sau comportamentului indus prin situaia de testare, avem teste care cer un comportament maximal, care presupun mobilizarea subiectului pentru atingerea unui nivel de randament ct mai nalt, i teste care provoac un comportament tipic, cum este cazul testelor de personalitate, la care rspunsul cuprinde opiuni bazate pe sistemul moral valoric al examinatului sau pe gusturile, nclinaiile, preferinele acestuia. Rspunsurile ce provoac un comportament tipic nu pot fi considerate bune sau rele, corecte sau incorecte. n funcie de limita de timp pentru efectuarea testului, deosebim doar n cadrul testelor ce provoac un comportament maximal teste de rapiditate (speed test) i teste de nivel (power test), ns n majoritatea situaiilor practice avem de-a face cu o mixtur ntre cele dou clase. Testele de rapiditate cuprind sarcini (itemi) de dificultate medie i uoar ntr-un asemenea numr nct nici un subiect nu poate s rspund la toate ntr-un anumit timp prestabilit. Un exemplu pentru testele de rapiditate este unul din cele mai vechi teste (din 1895), i anume testul Bourdon-Amfimov n care se cere subiectului de bara literele O i C n cadrul unor rnduri de litere diverse care le conin pe cele dou. Se pune accentul n aprecierea randamentului pe rapiditatea n rezolvarea sarcinilor. Testele de nivel (numite n literatura de specialitate de limb englez power test sau level test) cuprind sarcini care ridic continuu gradul de dificultate, nct ultimele sarcini abia sunt rezolvate, cu toate c limita de timp este generos acordat. O separare frecvent n spaiul cultural anglo-saxon i foarte redus n cel german este ntre "aptitude tests" i "achievement tests", cele din urm urmrind diagnosticarea cunotinelor i dexteritilor dobndite prin exerciiu i colarizare; O serie de autori, dintre care enumerm pe P. Horst (1971), J.P. Guilford (1954), R.B. Cattell (1962) i E. Todt (1968), deosebesc ntre teste normative i teste ipsative. n cadrul acestei distincii referirea se face la dou feluri de msurare: normativ i ipsativ. Am mai amintit faptul c, n cadrul opticii normative, aprecierea valoric a unui rezultat individual se face prin raportare la rezultatele unui grup, numit grup de referin. n cadrul unui instrument de msur ipsativ, valorile de punctaj pentru o anumit caracteristic supus msurrii nu sunt comparabile de la un subiect la altul, ci ele au semnificaie numai n relaie cu un singur subiect. deci suntem n prezena unui univers de apreciere strict personal; Dac lum drept criteriu libertatea posibilitii de reacie avem teste cu dispozitiv de rspuns creativ sau deschis i teste cu dispozitiv de rspuns legat sau nchis. La primul fel de dispozitiv de rspuns, subiectul are libertatea producerii rspunsului, iar la al doilea trebuie s aleag dintr-o serie de rspunsuri oferite; O separare similar cu cea anterioar distinge ntre testele formale i cele informale. Testele formale sunt testele n care forma de interpretare a rspunsului este strict condiionat de o terminologie prestabilit . Testele informale sunt cele care las un anumit grad de libertate n aceast privin. Revine, n aceast mprire dihotomic, problema standardizrii instrumentelor de msur, deoarece standardizarea este o exigen i pentru partea de interpretare a rspunsurilor; Un criteriu formal de clasificare a testelor este cel referitor la interpretare. Astfel, se deosebete ntre teste directe sau psihometrice i teste indirecte sau proiective. Cele proiective se mpart la rndul lor n realiste (exemplu TAT) i simbolice (exemplu Rorschach). De asemenea, un criteriu
12
care posed clase care interfereaz cu cele ale altor criterii. O parte din clasificatorii testelor psihologice utilizeaz denumirea de tehnici proiective, n loc de teste proiective; Deosebirea ntre teste psihometrice clasice i teste probabiliste se face n funcie de structurile sintactice i semantice ale modelului care se afl la baz construciei lor. Punctul de vedere formal este util pentru practicieni, deoarece este important de a ti dac un test poate fi aplicat n grup sau individual, dac are exigene speciale n privina nivelului verbal de exprimare, dac cere sau nu reacii motorii n privina rspunsului. Dezavantajul principal al clasificrii care adopt punctul de vedere formal const n faptul c acesta nu spune nimic despre scopul unui procedeu de investigaie psihodiagnostic, adic despre coninutul unui anumit test. Specialistul care se intereseaz de un test n scopul de a-l folosi, dorete n primul rnd s tie ce variabile sunt msurate i dup aceea sub ce modaliti formale se realizeaz cel mai bine. S-a tratat n primul rnd criteriile formale, deoarece n privina lor exist un mai mare acord ntre autorii de specialitate care au efectuat clasificri. Aspectele de coninut ale clasificrii, chiar cu dezacordurile care se manifest, sunt indispensabile pentru orientarea practic a psihologului i psihopedagogului. Prin aspectele de coninut s-ar putea nelege domeniile de aplicaie ale diverselor teste, dar, n acest caz, un test de inteligen sar putea plasa n aproape toate domeniile de aplicaie. Cel mai adesea, clasificarea de coninut a testelor psihologice rspunde la ntrebarea: Ce caracteristic examineaz, de fapt, respectivul procedeu de investigaie psihodiagnostic? Dei este un teren mai diversificat, cmpul clasificrilor de coninut posed o clasificare larg acceptat n teste de aptitudini (teste de inteligen i teste de randament), pe de o parte, i teste de personalitate, pe de alt parte. Este adevrat c dihotomia aptitudine (respectiv capacitate) i personalitate este destul de greu de acceptat. Practic noiunea de personalitate implic i aspecte de randament sau de capacitate. Ca atare, R.B. Cattel i F. Wurburton subsumeaz sub genul proxim "Teste de personalitate" procedee pentru cuprinderea att a aptitudinilor, ct i a aspectelor eseniale dinamic motivaionale i modalitilor temperamentale. n privina coninutului noiunii "teste de randament" exist un mai mare consens dect n cel al noiunii de "test de personalitate". De mare rspndire sunt clasificrile din punctul de vedere al coninutului, aparinnd lui L.J. Cronbach, A. Anastasi, M. Irle, R. Brickenkamp i G. Lienert. Redm aceste clasificri de coninut care au o mare circulaie: ANA ANASTASI (folosim i denumirile n limba englez, des uzitate n lucrrile de specialitate): 1. Test of general intellectual development (Teste de dezvoltare intelectual general) 2. Test of separate abilities (teste de aptitudini(capaciti) individuale) 2.1. Measuring multiple aptitude (msurarea aptitudinilor multiple) 2.2. Special aptitude test (teste de aptitudini speciale) 2.3. Educational tests (teste educaionale) 2.4. Occupational test (teste ocupaionale) 3. Personality tests (teste de personalitate) 3.1. Self-report inventories (inventare de autoraportare) 3.2. Measures of interests and atitudes (msurare a intereselor i atitudinilor) 3.3. Proiectives techniques (tehnici proiective) 3.4.Other techniques for personality assessement (alte tehnici pentru evaluarea personalitii)
13
AUREL STAN
CRONBACH 1. Tests of ability (tests of maximum performance) - teste de capacitate (teste de performane maxime) 1.1. Measure of general mental ability (msurarea capacitilor mentale generale) 1.2. Measure of special abilities (msurarea capacitilor speciale) 1.3. Aptitude tests (teste de aptitudini) 1.4. Achievement tests 1.5. Proficiency tests (teste de expertiz) 2. Tests of typical performance (teste de aptitudini tipice) 2.1. Behavior observations (observaii comportamentale) 2.2. Self report devices (procedee de autoraportare) Denumirile claselor sistemelor de clasificare sunt trecute n limba englez de majoritatea celor ce opereaz cu clasificri, din cauza unor ambiguiti de traducere a termenilor utilizai. Prin "general mental ability" se nelege (frecvent, dar nu exclusiv) capacitate general n care importante sunt activitile de gndire i nvare. La testele pentru examinarea capacitilor speciale i nzestrrilor se poate deosebi ntre teste care sunt direcionate pentru cuprinderea funciilor sau capacitilor psihice elementare i bateriilor de teste, care n spaiul lingvistic anglo-saxon sunt desemnate ca "multiple aptitude batteries" (care trebuie s serveasc examinrii unor capaciti empirice delimitabile una de alta). De la L.L. Thurstone i Thelma G. Thurstone avem denumirea "Tests of Primary Mental Abilities". La doi autori americani exist tendina, aflat n permanent progres n SUA, de a dezvolta baterii de teste pentru capaciti multiple care sunt fondate, de cele mai multe ori, pe analiz factorial. O parte din aceste teste sunt folosite ntr-un domeniu ngust (examinarea aptitudinii pentru anumite profesiuni, teste de selecie colar etc.), altele ntr-un domeniu mai larg. BRICKENKAMP 1. Teste de randament 1.1. Teste de dezvoltare 1.2. Teste de inteligen 1.3. Teste generale de randament 1.4. Teste colare 1.5. Teste pentru examinarea funciilor generale i teste de aptitudini 2. Teste psihometrice de personalitate 2.1. Teste de structur a personalitii 2.2. Teste de dispoziii i interese 2.3. Teste clinice 3. Procedee de desfurare a personalitii 3.1. Procedee de interpretare a formelor 3.2. Procedee verbal-tematice 3.3. Procedee grafice i de structurare n 1956, M. Irle ntocmete o clasificare n 4 grupe, clasificare aflat n legtur cu standardele
14
americane12: 1. Teste de inteligen general. 2. Teste de capacitate/teste de nzestrare. 3. Teste de cunotine/teste de randament. 4. Teste de personalitate. n 1961, Gustav Lienert ntocmete o clasificare de larg rspndire: 1. Teste de inteligen: a. teste de inteligen general b. teste speciale de inteligen sau teste de nzestrare 2. Teste de randament: a. teste de randament motric b. teste de randament senzorial c. teste de randament psihic 3. Teste de personalitate: a. teste de caracteristici b. teste de interese c. teste de dispoziii, d. teste de caracter e. teste de tip. Acestea sunt principalele sisteme de clasificare, care, ns, nu epuizeaz spectrul acestui domeniu. Punem punct aici ncercrilor de clasificare a testelor psihologice i sub ameninarea briciului lui Ockham, denumire a unui principiu atribuit lui W. Ockham i destinat s combat distinciile inutile sau multiplicarea inutil a entitilor n filosofia medieval, principiu care are formularea urmtoare: Entia non sunt multiplicanda praeter necessitatem (entitile nu trebuiesc nmulite peste necesiti). I.1.5 Clarificri necesare n continuare, ncercm s facem succint o serie de clarificri pentru anumite clase i subclase ale sistemelor de clasificare din punctul de vedere a coninutului, comune sau necomune sistemelor amintite anterior. Vom observa i aici clase ale sistemelor de clasificare ce se intersecteaz n coninut i clase care sunt acceptate doar parial ca fiind teste. O serie de subdiviziuni ale sistemului de clasificare le considerm de la sine clarificare, cum ar fi, de exemplu, testele de randament, n calitate de categorie de teste n care se pune accentul pe cantitatea de sarcini rezolvate corect. Vom ncepe comentariile noastre cu testele numite de dezvoltare. Referirea este la acele procedee de investigaie care trebuie s cuprind nivelul de dezvoltare a unui subiect. n 1964, G. Reinert face distincia ntre teste de dezvoltare primare i teste de dezvoltare secundare. Cele primare definesc cursul dezvoltrii i au ca obiectiv cuprinderea nivelului de dezvoltare a comportamentului, pe cnd la cele secundare obiectivul propriu-zis st n afara sistemului de referin de diagnoz a dezvoltrii. Astfel, testele generale de randament sunt normate pe un larg domeniu de vrste i las s se recunoasc anumite tendine de dezvoltare general. Denumirea cea mai frecvent folosit n legtur cu diagnosticare nivelului de dezvoltare este cea de scal sau scar de dezvoltare. Este necesar s facem o serie de precizri n privina noiunii de scal, a asemnrilor i deosebirilor dintre scal i test. Exist o tendin de a considera sinonimi termenii test i scal. Se folosete curent
12
Dup Michel, Lothar, "Allgemeine Grundlagen psychometrischer tests", n "Psychologische Diagnostik" (hrsg. Prof. dr. R. Heiss), Verlag fur Psychologie, Dr. C. Hogreffe, Gottingen, 1964.
15
AUREL STAN
expresia scala Binet Simon sau testul Binet-Simon, scala Terman-Merill sau testul Terman-Merill.13. De asemenea, exist tendina de a considera scala o grupare de itemi referitori la un acelai aspect, deci de a considera termenul scala rezervat construciilor psihodiagnostice unidimensionale. n cazul chestionarelor de personalitate aceast tendin este cea mai justificat. Dar exist i scale multidimensionale. WISC-ul lui Wechsler este o scal pentru diagnosticarea inteligenei la copil compus din mai multe componente psihodiagnostice difereniate. Instrumentul pe ansamblu poart denumirea de scal, iar componentele sale sunt denumite teste sau subscale. n bibliografia consultat am ntlnit expresia testele scalei Binet Simon. Iat, deci, cum o scal cuprinde mai multe teste. Cu toate acestea, noiunea de scal nu este supraordonat celei de test. Termenul de scal ca instrument de investigare psihodiagnostic este o form particular a scalei de msur n general care i propune s pun n eviden ansamblul modalitilor sau valorilor observabile ale unei variabile14. Prin scal de msurare psihologic se nelege un instrument de msur utilizat n psihologia aplicat care servete la ordonarea progresiv a unor niveluri. Fora informaional a scalelor este foarte difereniat. n domeniul psihometric prin scal se nelege un test sau o baterie de teste care-i permite de a clasa subiecii n diferite niveluri. Nota definitorie a unei scale considerm a fi capacitatea acesteia de a diferenia cel puin ordinal subiecii, de a-i plasa n funcie de un gradient al su, n funcie de rezultatul obinut. Obiectele evalurii pot fi niveluri de dezvoltare intelectual (unde opereaz predilect cu noiunile de vrst mental i I.Q), niveluri de dezvoltare motric, ct i niveluri de dezvoltare a personalitii. n psihologia diferenial scalele sunt n general probe constituite din itemi ordonai prin dificultate cresctoare, permind de a exprima niveluri adesea exprimate prin dificultate cresctoare. Cele mai cunoscute sunt: Scala Binet-Simon (dezvoltare a inteligenei), scala Alexander (inteligen ptratic, non-verbal), scala Brunet-Lzine (dezvoltare psihomotorie a primei copilrii sau de maturitate mental) scala Columbia (scala colectiv de nivel intelectual), scala Grace-Arthur (scal de inteligen non-verbal), scala Taylor (anxietate manifest), etc. Testele de aptitudini. La autorii englezi care ntocmesc clasificri ale testelor psihologice poate lua natere o ambiguitate n interpretare n privina termenului abilities, care se traduce prin aptitudine, dar i prin capacitate. Aceeai ambiguitate poate lua natere prin traducerea termenului german Fahigkeitstest. Ca atare, facem nc o dat precizarea c aptitudinea este o caracteristic subiacent, indirect observabil. Pe lng acest sens general, sunt de luat n seam trei conotaii: n primul rnd trebuie evideniat concepia lui L.L. Thurstone (n lucrarea sa Primary Mental Abilities, aprut n anul 1938) care consider aptitudinile drept caracteristici elementare fundamentale. n acest sens, testele de aptitudini furnizeaz o serie de caracteristici analitice, evideniate n aa-numitele profile psihologice, care se opun scalelor de inteligen de tipul BinetSimon care sunt exprimate n I.Q. sau vrst mental. Aceast concepie a fost susinut de o serie de cercetri de analiz factorial, nc de la nceputul dezvoltrii acestui model de cercetare. Cercetrile lui R.B. Cattell depesc opoziia pe care aceast concepie se fondeaz i propune o structur de aptitudini umane n form de arbore care se pune n aplicare ntr-un cmp din ce n ce mai ngust.
Ultima expresie este utilizat de Maurice Reuchlin n "Grand dictionnaire de la psychologie", Larousse, Paris, 1992, pag.254, n seciunea din dicionar rezevat precizrii termenilor de scal i scal de msur. 14 Aspectul general al scalei de msur este tratat detaliat n lucrarea: Clocotici, Valentin, Stan, Aurel Statistic aplicat n psihologie, Polirom, Iai, 2000
13
16
n al doilea rnd, aptitudinile pot fi considerate ca drept caracteristici cognitive responsabile de achiziia i de tratamentul informaiei. Ele se difereniaz de aceea a caracteristicilor motivaionale i temperamentale, asigurnd anumite scopuri i conferind un anumit stil de funcionare acestor mecanisme cognitive. Aceast distincie se reflect n separarea probelor de aptitudini de probele de personalitate. i aceast distincie sufer pe parcurs o anumit relativizare, printr-o personalizare a teoriilor cognitive (sintagm aparinnd lui Maurice Huteau). n al treilea rnd, aptitudinile pot fi definite prin caracterul lor constituional (determinat de ctre factori genetici). H. Piron este considerat principalul reprezentant al acestei optici tiinifice. n aceast abordare, testele de aptitudini se disting n special de testele de cunotine achiziionate, rezultatele lor nedepinznd de nici o cunotin specific prealabil. Deci, n optica acestei concepii., tendina a fost aceea de a de a construi, pe ct posibil, teste n care rezolvarea s nu depind de nivelul de cultur a subiectului. Ultima distincie ne amintete de disputa cercettorilor privind influena factorilor genetici i a celor ambientali n determinarea variabilitii interindividuale. Radicalismul unei astfel de opoziii este serios diluat de teoriile care pun accentul pe interaciunea celor dou tipuri de factori. Consideraiile anterioare constituie o tratare minimal a problemei aptitudinilor umane. Testele de inteligen sunt cele mai perfecionate realizri ale testelor de aptitudini. Este necesar s amintim faptul c, deocamdat, nu exist o definiie unitar a inteligenei, consecin fireasc a abordrilor teoretice din unghiuri diferite a unui proces psihic deosebit de complex. Revoluia cognitiv din cercetarea psihologic introduce un nou aparat conceptual, noi optici de abordare a fenomenelor de care trebuie s in seama i autorii unor astfel de teste, mult extins fa de ceea ce neleg n mod obinuit unii autori de teste prin inteligen. De aceea, este foarte important de a acorda o atenie deosebit precizrii termenilor utilizai n cadrul manualului testului. Testele colare i propun drept obiectiv diagnosticarea capacitilor i aptitudinilor elevilor. Denumirea de teste pedagogice considerm c ar fi mai potrivit pentru o parte din ele. Cuprind teste de calcul i de lectur, teste de ortografie, teste speciale de aptitudini colare, teste de nvare colar. O parte din ele nu au referin valoric normativ a rezultatelor, ci doar la clasa de elevi la care se aplic. O precizare necesar este cea n privina termenului de inventar de personalitate, considerat sinonim cu cel de chestionar de personalitate, instrument de investigaie (constituit sunt form de scal) referitor la ansamblul personalitii sau la diferite componente ale acesteia. Am amintit anterior faptul, c o parte din autorii care au ntocmit clasificri ale testelor psihologice contest acestora calitatea de teste, datorit naturii subiective a rspunsurilor obinute. Considerarea termenilor inventar de personalitate i chestionar de personalitate, pe de o parte, sinonimi cu cel de test de personalitate, pe de alt parte, este o forare de interpretare. n unele cazuri, pentru a stabili mai clar distincia, se folosete sintagma teste obiective de personalitate, coninutul rspunsurilor transpunnd un stil al personalitii, cu mare constan de manifestare, cum se ntmpl ,de exemplu, n testul miokinetic al lui Mira y Lopez. Ceea ce este denumit de obicei prin termenul de tehnici proiective n cmpul instrumentelor de investigaie psihodiagnostic constituie categoria cea mai exclus de la titlul de test psihologic, datorit dificultii deosebite de a asigura criteriile de validitate (mai ales validitatea) i datorit dozei mare de subiectivitate n interpretare. Se poate discuta, pe bun dreptate, dac denumirea de test, luat
17
AUREL STAN
n sens riguros psihometric se aplic cu adevrat la astfel de probe, n care standardizarea i etalonarea las adesea de dorit, n care sensibilitatea, fidelitatea i validitatea sunt dificil de estimat15. Un repro frecvent, care dovedete o bun doz de ignoran n privina acestor probe, este acela c fenomenul de proiecie se produce mai mult la examinator dect la candidat. Cele mai frecvente referiri la metodele de investigaie proiective se fac prin intermediul creaiilor din domeniu realizate de H. Rorschach, L. Szondi, M. Lscher, S. Rosenzweig, H. Murray. Denumirea de metod proiectiv aparine lui L.K. Frank i a fost folosit pentru prima dat ntr-un articol din anul 1939 aprut n revista tiinific american Journal of Psychology. Termenul a fost creat pentru a pune n evidenia rudenia dintre trei probe psihologice: testul de asociaie a lui Carl Gustav Jung, elaborat n anul 1904, testul petelor de cerneal a lui Herman Rorschach, elaborat n anul 1920, i Thematic Apperception Test, elaborat de Henry Murray. Tehnicile proiective se disting clar de testele de aptitudini prin ambiguitatea materialului prezentat subiectului i prin libertatea de rspuns care i este lsat acestuia. Baza lor teoretic, n centrul creia st noiunea de proiecie, este asigurat, n special, de psihologia dinamic i de psihanaliz. Termenul de proiecie are mai multe sensuri, dintre care amintim16: Un prim sens denot o aciune fizic de aruncare, de lansare a unui proiectil.. Trecnd pe plan psihic, Sigmund Freud consider n acest sens proiecia ca o aciune psihic specific strii de paranoia, care const n expulzarea din incontient a unor sentimente blamabile pentru a le atribui altuia; Al doilea sens este unul matematic, care apare n secolul XVII odat cu apariia geometriei proiective. Prin proiecie facem s corespund unui punct (sau unui ansamblu de puncte) din spaiu un punct (sau un ansamblu de puncte) unei drepte sau unei suprafee. n acest sens, proiecia poate fi oblic, ortogonal, cilindric, stereografic, ortogonal. Transpunnd n planul nostru de interes tiinific, testele proiective aduc subiectul n situaia de a produce un protocol de rspuns a crui structur corespunde structurii personalitii, caracteristicile fundamentale ale acesteia regsindu-se n aceast situaie; Originea celui de-al treilea sens se gsete ntr-un fenomen optic pus n eviden la sfritul secolului al XIX-lea, prin care, plecnd de la un focar de raze sau radiaii, se trimite o proiecia luminoas pe o suprafa. Astfel, proiecia fixeaz o imagine pe un ecran, aa cum se ntmpl n cinematografie. Sensul este adoptat i popularizat de ctre scriitorii sfritului de secol XIX, i, ulterior, n psihopatologie i n psihologie. Un test proiectiv, precum o raz X, traverseaz interiorul personalitii, fixeaz imaginea nucleului secret al acestuia pe un revelator (trecerea sau efectuarea testului) i permite astfel o lectur facil prin mrirea sau proiecia ngroat pe un ecran (interpretarea protocolului). Ceea ce era ascuns este pus n lumin, latentul devine manifest, interiorul este adus la suprafa, ceea ce este stabil n noi se dezvluie. Tehnicile proiective au rmas n practica psihodiagnostic (n ciuda reprourilor fcute) un domeniu rezervat specialitilor din domeniu clinic care un deosebit sim al nuanei n observaie i un rafinament deosebit n interpretare.
Anzieu, Didier., Chabert, Catherine Les mthodes projectives, Presses Universitaires de France, Paris,1997 (11e dition corrige), pag 14 16 apud. op.cit. pag 16
15vezi
18
I.2 TEORIA CLASIC A TESTULUI PSIHOLOGIC I.2.1. Precizri Atributul de clasic nu are, n cazul teoriei testului, o semnificaie depreciativ, de depit ,simplu, revolut sau conservator, ci una valorizatoare, de bine fundamentat, echilibrat, durabil. Acest atribut este justificat de faptul c principiile sale au fost stabilite de ntemeietorii stilului sistematic i organizat n cercetarea psihologic, adic de reprezentanii colii psihometrice engleze. Prezena acestei coli n crearea suportului statistic al cercetrilor experimentale n psihologie este o permanen. Baza sistemul de axiome sintactice de baz, cu tot eafodajul de formule i prescripii procedurale ce decurg din acesta, a fost creat de Ch. Spearman ntr-o serie de lucrri tiinifice publicate ntre 1904 i 1907 i a rmas aa pn la nceputul deceniului 6 al secolului nostru, cnd H. Gulliksen l prezint cuprinztor i-l dezvolt pe baza unor ipoteze formal logice. C.J. Kousropoulos (1962, 1964) i M.R. Novick (1966) au putut s arate ceva mai trziu c modelul teoriei clasice a testului psihologic poate fi explicat prin ipoteze mai puine i mai slabe, adic mai uor de ndeplinit. Critici accentuate i fac apariia chiar n timpul cizelrii sintaxei modelului clasic i a evidenierii problematicii relevanei sale pentru procesul de msurare psihologic care se reflect n modelul testului prin ipoteze ptrunztoare i totodat falsificabile. Ca orice realizare omeneasc i testul psihometric construit pe axiomele clasice este considerat perfectibil, cu att mai mult cu ct rezultatele din practic impun mbuntirea. Nu trebuie s uitm c fiecare teorie este un model simplificat al realitii, care se ajusteaz mai mult sau mai puin realitii pe care ncearc s o descrie. n multe cazuri din cercetarea psihologic, exist o puternic tentaie de a adapta datele la modele n loc de a adapta modelele la date. Raiunea de apariie a teoriei clasice a testului psihologic este aceea de a oferi un cadru conceptual n scopul de a aprecia valoarea rezultatelor de msur obinute prin intermediul acestui instrument de msur. Marea majoritate a testelor psihologice i prezint rezultatul brut sub forma unor scoruri compozite. Acestea sunt dobndite prin nsumarea valorilor numerice ale itemilor, adic a componentelor informaionale elementare, bazale ale unui test. Intereseaz n mod special cunoaterea modului n care variana scorului total a unui test este influenat de varianele diferiilor itemi. n funcie de mrimea varianei scorurilor totale ale unui test se poate face diferenierea cantitativ valoric a caracteristicilor persoanelor supuse examinrii psihologice. O varian egal cu 0 reprezint o contraindicaie absolut pentru folosirea unui test. Teoria clasic a scorurilor nu trateaz dect precizia valorii numerice. Chestiunile privitoare la calitatea i pertinena acestei valori sunt tratate separat prin intermediul studiului validitii. De altfel, atunci cnd vorbim de teoria testului putem s facem distincia clar n teorii structural-funcionale ale testelor psihologice i teorii cognitiv-semantice. Primele teorii se refer la structura i modul de funcionare a unui test, nu neaprat psihologic i secundele la coninutul i semnificaia psihologic ale denumirii trsturii psihice presupus a fi diagnosticat. Ceea ce este cunoscut sub numele de teoria clasic a testului psihologic poate fi denumit o teorie funcional, adic o teorie care ncearc s explice modul de funcionare a unui testul sub aspectul relevanei cantitativinformaionale.
19
AUREL STAN
I.2.2. Postulatele teoriei clasice a testului psihologic. n semnificaia sa general postulatul este o propoziie prim, adic nederivat din alte propoziii, care se prezint sub forma regulilor de definiie, axiomelor, metaxiomelor, schemelor de definiie, regulilor de interpretare i regulilor de deducie. Avnd n vedere faptul c postulatele se refer la sisteme, putem spune c postulatele sunt exigene ideale de funcionare a sistemelor. n cazul n care o realizare empiric a unui sistem teoretic nu satisface postulatele care stau la baza funcionrii sale, se practic procedura reformulrii postulatelor, care devin mai slabe, adic mai uor de satisfcut. Aceast nmuiere a postulatelor pentru astfel de cazuri nu poate fi considerat o abdicare de la spiritul tiinific. Fiecare lucrare care se consacr teoriei clasice a testului psihologic ncepe prin a prezenta postulatele de baz proprii acestei teorii. Diferite lucrri tiinifice consacrate postulatelor teoriei clasice a testului psihologic le prezint ntr-un numr variabile, desigur n urma unei operaii de condensare a acestora. Astfel, J. Guthke, H.R. Bttcher i L. Sprung prezint ntr-o lucrare consacrat psihodiagnosticului o grupare de 5 postulate17 ale teoriei clasice a testului, L. Michel i W. Conrad prezint un numr de 9 axiome18 iar W. Kristof un numr de 419. Redm parafrazat n continuare postulatele teoriei clasice a scorurilor, aa cum au fost concentrate ntr-o lucrare recent20 asupra teoriei testului: Postulatul 1. Scorul observat al unei persoane supus examinrii prin intermediul unui test psihologic (X), este compus din suma scorului adevrat (notat prin V, o constant) i o eroare de msur asociat acestui scor (notat prin E, o variabil aleatorie) X=V+E Deci, X este de asemenea o variabil aleatorie. Eroarea E poate avea valoarea 0, valori pozitive ct i valori negative, n aa fel nct dup un numr infinit de aplicri la aceeai persoan a aceluiai test rezultatele se distribuie normal (distribuie n care media este egal cu 0 i abaterea standard egal cu 1). Msurarea nu este nevoie s fie efectuat cu acelai test, ci i cu teste strict paralele, adic teste care, aplicate pe aceeai subieci, dau distribuii cu aceeai medie i aceeai varian (asupra noiunii de test paralel vom reveni la capitolul consacrat fidelitii. Folosind o exemplificare fictiv, situaia reaplicrilor aceluiai test sau a unor teste strict paralele la acelai individ s-ar prezenta astfel: Test 1 2 3 4 n
17
X 60 45 53 59 . 62
V 55 55 55 55 . 55
E 5 -10 -2 4 7
Guthke; Bottcher; Sprung (hrsg.), Psychodiagnostik", Band I, Deutscher Verlag der Wissenschaften, Berlin 1991., pag.133 18 Michel, Lothar; Conrad, Wolfgang, "Theoretische Grundlagen psychometrischer Tests" n "Grundlagen psychologischer Diagnostik", herausgegeben von Prof.Dr Karl-Josef Groffmann und Prod.Dr.Lothar Michel, Mannheim, Enzyklopedie der Psychologie, Band I, Verlag fur Psychologie, Dr C.J.Hogreffe, Gottingen, Toronto, Zurich, 1982., pag.17-19. 19 Kristof, Walther Klassische Testtheorie und Testkonstruktion, n Feger, Hubert.,Bredenkamp, Jrgen, Messen und Testen, Verlag fr Psychologie, Dr. C.J. Hogrefe, Gttingen, Toronto, Zrich,1983, pag. 545 - 547 20 vezi Laveault, D., Gregoire, J., "Introduction aux theories des tests en sciences humaines", De Boeck & Larcier .a. 1997, Paris, Bruxelles, pag. 132-134.
20
Postulatul 2. Valoarea ateptat pentru scorul observat este scorul adevrat ( X ) = V
Aceast formul art c scorul adevrat obinut de un subiect este sperana matematic a scorurilor observate. Precizia unui scor observat crete odat cu numrul de aplicri a testului. Dac se aplic de multe ori acelai test la acelai subiect, media rezultatului va fi egal cu scorul adevrat. Dispersia scorului observat X n jurul scorului adevrat V constituie eroarea de msur pentru ansamblul acestor aplicri. Postulatul 3. ntre eroarea de msur i scorul adevrat al unui subiect nu exist corelaie. (sau exist o corelaie nul). V = 0 Aceasta nseamn c eroarea ntmpltoare de msur nu va fi mai mare dac subiectul posed un scor adevrat ridicat, sau mai slab, dac el posed un scor adevrat slab. Postulatul 4. Erorile la dou teste diferite ( E1 i E 2 ) nu sunt corelate ntre ele
E E = 0
1 2
Postulatul 5. ntre eroarea de msur la un test i scorul adevrat la un alt test nu exist corelaie. E 1V 2 = 0 Postulatul 6. Dou teste X i X' sunt paralele dac, i numai dac, scorurile lor adevrate i erorile lor de msur sunt egale: V=V' E = E' Din cauza postulatului 1 care stipuleaz c scorul observat este suma unui scor adevrat i a unui scor de eroare aleatoare, decurge c dou teste paralele vor avea sensibil aceeai medie i aceeai varian a scorurilor observate. Postulatul 7. Un test este -echivalent (tau echivalent) cu un alt test, cnd scorurile lor adevrate difer printr-o constant aditiv k. V1 = V2 + k
Astfel dac 4 subieci obin notele 23, 45, 67, 55 la un test i 34, 56, 68, 66 la un alt test, constanta k are valoarea 11. Testele paralele satisfac exigena de -echivalente pe cnd reciproca nu este adevrat. Putem rezuma uor ansamblul celor 7 postulate a teoriei clasice a testului prin aseriunea c erorile aleatoare de msur trebuie s fie independente n orice circumstan. Ca atare,condiiile de examinare trebuie s fie pregtite n aa fel, nct s nu existe corelaie ntre scorurile adevrate ale unui subiect, eroarea de msur la un test i eroarea de msur la un alt test. Fr ndeplinirea unor condiii minimale, scorurile observate devin dificil interpretabile. Teoria clasic a scorurilor ia n consideraie o eroare strict ntmpltoare. Pentru un grup de subieci examinai cu un acelai test situaia rezultatelor scorurilor se poate prezenta n felul urmtor (date fictive): Subiect 1 2 3 4 5 6 7 8 9 10 11 12 Medie Varian Scor observat(X) 8 8 5 9 3 7 8 5 10 7 8 9 7,25 3,68 Scor adevrat(V) 9 9 5 8 5 8 6 5 8 7 8 9 7,25 2,35 Eroare(E) -1 -1 0 1 -2 -1 2 0 2 0 0 0 0,00 1,33 Tabelul 1. Cuprinde rubrici exemplificative ale raporturilor dintre scorul adevrat i scorul observat
21
AUREL STAN
Din tabel se observ c scorul observat este format din suma scorului adevrat i a erorii: X=V+E. n cazul unui scor compozit variana scorului total are urmtoarea formul: 2 2 2 SX = SV + SE + 2COVVE . Dac avem n vedere faptul c valoarea covarianei dintre V i E este
2 2 2 egal cu 0, atunci formula se transform n felul urmtor: S X = SV + SE . n cazul nostru concret 3,68 =
2,35 + 1,33. Adiia unui mare numr de astfel de erori care apar n stnga i n dreapta mediei duc la un rezultat nul. Dar exist i erori sistematice ale cror efect se manifest constant i, n acest caz, rezultatul adiiei nu mai este nul. Preocuparea pentru astfel de erori nu mai intr n sfera teoriei clasice a scorurilor, ci n cea a validrii rezultatelor (n cazul cnd o prob este prea uoar sau prea dificil apar astfel de erori). n acest caz, ecuaia de la postulatul 1 se poate rescrie n felul urmtor: X=V+ es + ea Scorul observat este egal cu suma unui scor adevrat, a unei erori aleatoare i a unei erori sistematice. Vom fi n faa unei astfel de situaii n cazul n cnd un examinator insist asupra unui aspect foarte facil al disciplinei sale i, n consecin, toi examinaii vor lua note maxime Eroarea aleatoare va fi cu totul i cu totul derizorie n comparaie cu cea sistematic. Noiunile de validitate i de fidelitate se pot reprezenta n funcie de proporia varianei scorurilor observate imputabil varianei 2 2 pertinente ( 2 v ) , varianei nepertinente ( v s ) sau varianei erorii ( ea ) . Un constructor de test are drept scop maximizarea prii scorului adevrat, care este pertinent la ceea ce dorete s msoare, i minimizarea erorii aleatoare de msur. Pentru a reui acest lucru este necesar ca variana scorului adevrat s ocupe o mare proporie din variana scorului observat i ca variana erorii sistematice s fie minimal. n practica aplicrii testelor psihologice, erorile pot aprea din urmtoarele direcii (surse): Din partea subiecilor care particip la examinare, prin lips de motivare n obinerea unui randament bun, concentrare deficitar, stare precar a sntii, oboseal accentuat. Erorile cauzate de factori de natur fiziologic sunt printre cele mai imprevizibile i mai individualizate. Deloc neglijabil este sursa de eroare datorat lipsei de experiene a subiecilor n efectuarea unui test. Postura de participant la testare este relativ nou pentru unii subiecii din ara noastr, fapt care le poate produce diminuarea randamentului. Trebuie s inem cont i de existena specialitilor care antreneaz o serie de subieci pentru situaia de testare psihologic. O specie aparte de erori din aceast categorie este aceea realizat de subieci care fac parte dintr-un subgrup i au o motivaie diferit de cea a ansamblului grupului care particip la testare, mai ales la testele care pretind un randament maximal. Din partea psihologilor care realizeaz testare psihologic (printr-o serie de omisiuni n instruciunile de aplicare, prin limbajul utilizat, ambiguitatea enunurilor) i a operatorilor implicai n examinarea psihologic prin explicaii insuficiente primite pentru corectarea probelor, prin erori de codificare i de corectare a rspunsurilor, erori n colectarea datelor (variantele computerizate anuleaz posibilitatea unor astfel de erori, n majoritatea cazurilor); Din partea testului nsui. Din aceast categorie de erori fac partea cele datorate eantionajului itemilor care pot duce la versiuni lipsite de identitate a unor teste ce se consider paralele, imprecizii de funcionare i nregistrare n cazul unor teste aparative, limitei improprii de timp date pentru efectuarea testului; Din cartea ambianei n care se desfoar testarea psihologic, care poate fi total improprie pentru o examinare.
22
Erorile datorate testului nsui sunt mai uor de prevenit, dar cele datorate subiecilor sunt dificil de evitat. R.L. Thorndike s-a ocupat special de inventarierea acestor erori. Aceast influenare diversificat a erorii face ca autorii care au contribuii de valoare n domeniul teoriei testului psihologic s formalizeze sursa erorilor, realiznd o descompunere a varianei erorii (Lord i Nowick, Gulliksen, Magnusson, Horst, Lienert, Bernier i Petrulewicz, Monica Albu i Horia Pitaru)21. Astfel H. Guliksen descompune variana total pentru nu import ce test(n care introduce i varianele erorii) n: S2X = variana total; S2V = variana adevrat; S2EM = variana de eroare datorat msurii; S2VEQ = variana adevrat specific; S2EA = variana de eroare datorat condiiilor de administrare a testului, S2EH = variana erorii datorat hazardului n rspunsuri. S2ES = variana erorii datorat subiectivitii n corecie.22 S2VF = variana datorat fluctuaiei n scorurile adevrate, de la o ocazie la alta. David Magnusson, caut s stabileasc direciile din care s-ar putea afecta variana scorului total n cazul unei a doua aplicri a testului. i expune urmtoarea ecuaie23: 2 2 s t2 = s T + s e2( m ) + s e2*adm ( + s e2( g ) + s e2( subj ) + sT ( f ) , n care
s t2 = variana total a testului;

2 = variana adevrat, care este tratat(considerat) ca atare sT
s e2( m ) = variana erorii care este atribuit efectelor amintirii.

s e2( adm ) = variana erorii care este atribuit diversitii modurilor de aplicare a testului s e2( g ) = variana erorii care este atribuit efectului explicaiilor date pentru efectuarea probei s e2( subj ) = variana erorii care este atribuit obiectivitii deficitare
2 sT ( fl ) = variana adevrat, care exprim fluctuaia valorilor adevrate
I.2.3. Teoria probabilist a testului psihologic n primul rnd, trebuie s specificm ce semnificaie are o teorie probabilist i care este semnificaia termenului probabilist. Teoria msurrii precizeaz clar c sensul procesului de msurare se bazeaz pe un model i trebuie s se raporteze la postulatele modelului. ntr-o form foarte general de clasificare, modelele de msurare se divid n deterministe i probabiliste. Un criteriu de clasificare foarte rspndit se refer la numrul dimensiunilor (dincolo de nivelul nominal rezultatele sunt dimensiuni), clasificarea rezultat distingnd ntre modele unidimensionale, care permit doar o dimensiune rezultant, i multidimensionale, care permit de a obine msurri pe mai multe dimensiuni. Unidimensionalitatea poate fi tratat ca un caz particular al multidimensionalitii. Teoria probabilist a testului psihologic se bazeaz pe un model probabilist de msurare.
Lucrarea noastr face referine insignifiante la demonstraii matematice ale formulelor utilizate, avnd ca justificare argumentul c este inutil s redemonstrm ceea ce a fost deja demonstrat. Cititorii care doresc s parcurg aceste demonstraii, le recomandm lucrrile autorilor enumerai n paranteza noastr. Vom utiliza, n cazul exemplificrilor, doar formulele finale ale unor astfel de demonstraii. 22 Dup Bernier, J.J.; Pietrulewicz, B., "La psychometrie", Gaetan Morin Editeur, Montreal, Paris, Casablanca, 1997, pag. 115 23 vezi Magnusson, David, "Testtheorie", Verlag Frank Deuticke Wien, 1969, pag.114.
21
23
AUREL STAN
Facem o exemplificare, pentru modelele deterministe, cu modelul creat de Leon Guttman, numit modelul ierarhic al lui Guttman sau modelului scalogramei multidimensionale. Prezentm un exemplu fictiv, cuprinznd rezultatele binare a 6 subieci (Si) la 5 itemi (Ij), la o prob de raionament deductiv (0-rspuns incorect,. 1 - rspuns corect).
MATRICE CU DATE OBSERVATE I1 0 0 0 1 0 0 ITEMI I2 I3 I4 0 1 0 0 0 0 0 1 1 1 1 1 1 1 1 0 0 0 I5 1 0 1 1 1 1 MATRICE CU DATE PERMUTATE I5 0 1 1 1 1 1 I3 0 0 1 1 1 1 ITEMI I4 0 0 0 1 1 1 I2 0 0 0 0 1 1 I1 0 0 0 0 0 1
S1 S2 S3 S4 S5 S6
S2 S6 S1 S3 S5 S4
SUBIECI
Tabelul 2. Cuprinde matricea cu date observate(stnga) i matricea cu date permutate dup exigenele scale Guttman (dreapta) La examinare se pornete de la premiza c subiecii au poteniale difereniate n privina raionamentului deductiv i c itemii nu au toi aceiai dificultate. Cercettorii i propun n urma acestei examinri de a ordona att itemii (dup dificultatea lor) ct i subiecii dup potenialul lor). Cerina este de a ordona subiecii n raport cu itemii i invers, n aa fel nct al doilea subiect plasat pe vertical s fie mai capabil dect primul, al treilea mai capabil dect al doilea, .a.m.d. ( i al doilea item pe orizontal d fie mai dificil dect primul, al treilea mai dificil dect al doilea). Din matricea permutat se observ clar c un subiect care rezolv corect un item trebuie s rezolve corect i itemii de dificultate mai mic. Realizarea acestui obiectiv presupune enunarea unor reguli de coresponden ntre rezultatele empirice i rezultatul vizat. Matricea permutat poate fi transpus geometric printr-un model al lui van der Ven, care indic faptul c dac o persoan a rspuns corect la un item, punctul care reprezint persoana pe o dreapt care traduce poziia persoanelor i a itemilor va fi la dreapta punctului care reprezint acest item. n cazul n care punctul va fi situat la stnga unui item acest fapt semnific faptul c nu a rezolvat corect itemul respectiv24. I5 I3 I4 I2 I1
S2 S6 S1 S3 S5 S4 Figura 1. Reprezentarea ordinii dificultii itemilor i ordinii capacitii persoanelor n exemplul nostru fictiv nu exist nici o derogare de la model i datele se conformeaz regulilor anunate. Un coeficient de reproductibilitate ne poate indica faptul dac un instrument de msur construit dup modelul Guttman satisface exigenele sale teoretice. Se admite o toleran de 5% pentru devierea de la model pentru a pretinde c un instrument de msur se revendic de la teoria lui Guttman. Rezultatul se consider a fi nregistrat pe un acelai continuum latent. Exemplificarea a fost fcut pe unul din cele mai simple i mai cunoscute modele (un model unidimensional, folosindu-se date dihotomice). Modelele mai complexe cuprind mai multe matrici de date n care se folosesc diferite
24
Adaptare dup Dick, P.; Tournois, Jocelyne; Flieler, Andre; Kop, Jean-Luc La Psychometrie, PUF, Paris, 1994, p.140.
24
SUBIECI
tipuri de date pentru diferite nivele de msur (nominal, ordinal etc.). Practic modelele sunt construite pe baza unor ipoteze de structurare a datelor i ofer proceduri de testate a postulatelor lor. Modelul lui Gutman este un model determinist i implic urmtoarea supoziie: dac subiectul domin itemul (expresia a domina nseamn c rspunde adecvat dificultii pe care o presupune, deci stpnete dificultatea respectiv), valoarea scalar a subiectului este superioar valorii scalare a itemului (ne referim la scala van der Ven). n schimb, n optica probabilist supoziia susine c dac subiectul domin itemul, este probabil ca valoarea sa de scal s fie superioar aceleia a itemului. Dac se ntocmesc curbe caracteristice ale itemilor (un graf al relaiei dintre un continuum laten pe care itemul este destinat de a-l msura i probabilitatea de a furniza un rspuns corect), optica determinist indic o trecere brusc de la 0 la 1 n cazul n care competena crete (funcia este discontinu), pe cnd cea probabilist indic o relaie monoton cresctoare). n cadrul opticii probabiliste rezolvarea unui item mai greu i euarea unuia mai uor nu constituie o violare a modelului. Trecerea de la optica determinist la cea probabilist nu nseamn pur i simplu tolerarea erorilor, ci gestionarea lor, adic nregistrarea i estimarea influenei acestora. Un model probabilist emite ipoteze asupra distribuiei erorilor pentru a le putea estima, operaiune care lipsete celor deterministe. n opoziie cu modelul clasic al testului psihologic, modelul probabilistic se edific pe ipoteza c trsturile psihice, n calitate de dimensiuni latente, nu pot s fie puse pe aceleai plan cu comportamentul observabil. Autorii principali care s-au dedicat acestei teme sunt: G. Rasch (1960), P.F. Lazarsfeld i N.W. Henry (1968), F.M. Lord i M.R. Novick (1968), J. Rost i H. Spada (1978), R.K. Hambleton i H. Swaminathan (1993)25. Valoarea observat a testului ndeplinete n calitate de msurare deviat funcia unui indicator privind starea parametrului "latent trit", n consecin valorile testului indic parametrul caracterului probabilist. Dezvoltarea unui test cu ajutorul cruia trebuie s fie stabilit fundamentul pozitiv rezidual pe un continuum latent al caracteristicii presupune o teorie psihologic, care se raporteaz la o lege general care guverneaz raportul ntre comportamentul manifest n test i o dimensiunea latent (i descrie procesul probabilistic care determin intervale de ncredere ale parametrului care se cere estimat). Testul, n calitate de instrument de investigaie, indiferent dac este psihologic sau nu, duce implicit la concluzii cu caracter probabilistic. Probabilismul exprimrii este o form adecvat de exprimare pentru studiile viznd domenii de cercetare caracterizate de complexitate i dinamism. Una din carenele analizei clasice a itemului este dat de faptul c proprietile metrice ale acestuia sunt relative. Aproape toi indicii pe care noi putem s-i calculm depind de eantionul de subieci utilizai, aceasta mai ales n domeniul cercetrilor de psihologie colar, unde problema relativitii valorii itemilor se pune cu acuitat, deoarece examinarea cu acelai test de achiziii colare (n momente diferite ale procesului de nvmnt) duce la oscilaii serioase ale indicelui de dificultate. Cercetrile noastre cu testul Matricea Progresiv Raven arat clare oscilaii ale indicilor de dificultate a itemilor prin trecerea examinrilor de la mediul urban la mediul rural, de la studii generale la studii medii i superioare. Crearea bncilor de itemi ntmpin, din acest motiv al oscilaiei indicelui de dificultate, serioase dificulti i problema care se pune este aceea de a crea itemi care s nu depind de grupul de subieci pe care s-a calculat dificultatea. Mai ales n domeniul educaiei se pune problema crerii unor scale absolute independente de un anumit grup de referin. Desigur aceasta pare o utopie, dar, prin perseverena unor cercettori, utopiile pot deveni realitate. Primele ncercri n vederea crerii unei
25
Cifra din parantez reprezint anul aparitiei lucrrii pe acest tem.
25
AUREL STAN
scale care s nu depinde de un grup de referin au fost fcute de Guttman la nceputul anilor 50, n scopul de a msura atitudinile. Modelul probabilist se sprijin pe postulatul dup care calitatea unui rspuns este determinat prin trstura msurat, dificultatea itemului i discriminarea itemului. Deci probabilitatea de a reui la un item este o funcie a caracteristicii a subiectului (trstura msurat) i a proprietilor metrice ale itemului (dificultatea i discriminarea sa). Psihometricienii au iniiat diverse modele de relaii funcionale ntre item i caracteristica msurat. Un element comun la aceste diverse modele este faptul c ele mprtesc postulatul c totalitatea itemilor unui test msoar aceeai caracteristic psihologic, dar c nivelul rspunsurilor la acest item poate fi afectat prin erori aleatoare. Obiectivul unor astfel de modele este acela de a permite o estimare a proprietilor metrice ale itemilor invariani pe suprafaa unei populaii i, pe de alt parte, o estimare de trsturi psihologice independente de itemii utilizai pentru a msura. Prin denumirea de MRI (Modele de Rspuns la Itemi) sunt reprezentate majoritatea modelelor probabiliste26.
I.3. CRITERIILE DE APRECIERE ALE UNUI TEST I.3.1. Consideraii preliminare. Controverse nainte ca datele obinute prin aplicarea unui test psihologic s poat fi folosite n activiti diferenial psihodiagnostice este necesar s precizm dac acestea ndeplinesc anumite condiii, printre care condiia de a fi semnificative i de a avea un sens. Trebuie s fim siguri c msurm cu precizie (dac valoarea indicat de instrumentul nostru de msur este reproductibil la a doua aplicare a testului la aceeai persoan) i c msurm trstura sau caracteristica precizat anterior folosirii testului i nu alta. ndeplinirea condiiilor de valabilitate a unui test trebuie stabilit n mare parte empiric, adic prin aplicri i reaplicri impuse de nevoi psihodiagnostice concrete. n privina stabilirii numrului acestor condiii sau criterii, menionm c nu exist unanimitate a punctelor de vedere, deosebirile referindu-se att la denumirile criteriilor, ordonarea i ierarhizarea lor. Exist optici restrnse i optici extinse de abordare a problematicii criteriilor de apreciere a testului psihologic. Prezentm, n continuare punctele de vedere ale unor autori de specialitate care au avut preocupri n acest domeniu. Serge Chamboulant, autor francez cu preocupri n domeniul psihologiei aplicate, indic calitile necesare ale testului, ca si ale oricrei msuri, n contextul msurtorilor n general, indiferent dac sunt fizice sau biometrice. Conform exigenelor exprimate de S. Chamboulant, un test trebuie s prezinte o noutate pentru subiect (exigen nu uor de satisfcut, mai ales n rile n care experiena testrii psihologice este curent), s fie interesant i rapid, obiectiv n aplicaie i corecie (deci, independent de calitile examinatorului), gradabil i sensibil pentru a putea msura cele mai infime diferene ntre indivizi, fidel, adic s dea ntotdeauna aceleai note sau unele foarte apropiate, i valid, adic s ndeplineasc rolul su de prognostic pentru succesul ntr-o anumit activitate27. Autorul englez David Bartram acord, ntr-un articol dintr-o cunoscut lucrare destinat construcie testului psihologic, o atenie aproape exclusiv fidelitii i validitii, abia amintind de
Informai suplimentare se gsesc n lucrrile Aurel Stan Testul psihologic, Editura Polirom, Iai, 2002 i Monica Albu Construirea i utilizarea testelor psihologice, Editura CLUSIUM.,1998 Cluj 27 vezi Chamboulant, Serge, "Manuel de Psychologie aplique", Payot, 1951, pag. 26.
26
26
existena altor criterii28. Autorul german Jurgen Guthke consider c printre calitile testului psihologic figureaz concordana interpersonal sau obiectivitatea, validitatea sau valabilitatea, fidelitatea sau precizia de msurare, sensibilitatea i, n final, normativitatea29. n binecunoscutul su tratat consacrat analizei i construciei testului psihologic Gustav Lienert ntocmete o clasificare n care grupeaz criteriile de apreciere (Gutenkriterien) n principale i secundare. Din cele principale fac parte obiectivitatea, fidelitatea (Reliabilitt) i validitatea, iar din cele secundare normativitatea, comparativitatea, economicitatea i utilitatea30. Considerm c acest gen de clasificare este pertinent pentru o cercetare sistematic a testului psihologic. Ursula chiopu apreciaz un numr redus de caliti, i anume validitatea, omogenitatea sau fidelitatea i sensibilitatea31. Identificarea omogenitii cu fidelitatea o apreciem ca o expresie a confuziei dintre parte i ntreg sau a unei proceduri cu un ansamblu procedural. Peter R. Hofstatter afirm c n faa testelor se ridic 3 exigene: a) de a diferenia subiecii unii de alii; b)de a face aceast difereniere n mod precis i c) de a o face ntr-un mod relevant diagnostic. Prima cerin desemneaz normativitatea sau standardizarea drept criteriu de apreciere, a doua fidelitatea, iar a treia validitatea sau valena diagnostic. Punerea semnului de identitate ntre normativitate i standardizare este, cu siguran, o forare n interpretarea acestor noiuni32. Aspectele la care se refer standardizarea sunt mai diverse dect cele n care se opereaz cu norme. Claude Duhamel este foarte succint n prezentarea calitilor testului, enumernd etalonarea, sensibilitatea i validitatea n una din lucrrile relativ moderne de prezentare a testelor care se folosesc n recrutarea personalului33. Wilhelm Hehlmann consider c valoarea diagnostic a unui test depinde de standardizarea sa, fidelitatea i validitatea sa34. n una din lucrrile de referin din literatura de specialitate romneasc asupra metodelor de psihodiagnostic, Mariana Roca descrie calitile testelor ca fiind standardizarea, etalonarea (care stau la baza construciei testelor), fidelitatea, validitatea i sensibilitatea35. ntr-o lucrare recent referitoare la testele de tip "screening", Nicolae Mitrofan prezint o serie de caracteristici ale acestora ca etalonarea, economicitatea, fidelitatea, validitatea, utilitatea i standardizarea. Autorul i sprijin afirmaiile pe autorii americani B.A. Wasik i J.S. Meisels din anul 1990. n cadrul prezentrii testelor pentru examinarea copilului mic se face referire mai ales la validitate i fidelitate36. Heiner Lagewie i Wolfram Ehlers consider "Gutenkriterien" obiectivitatea, fidelitatea i validitatea37.
Bartram, David, "Fidelit et Validit", n Beech, John R., Harding, Leonora, "Tests, mode d'emploi. Guide de psychometrie", ECPA, Paris, 1994. 29 Gurhke, Jurgen, "Testtheorie (Testmodelle)", n Guthke, Bottcher, Sprung, "Psychodiagnostik", VEB Deutscher Verlag der Wissenschaften, Berlin,1990. 30 Lienert, Gustav, "Testaufbau und Testtheorie", Verlag Juliusz Beltz, Weinheim/Berlin, 1967, pag.12. 31 vezi "Dicionar de Psihologie" (coordonator Ursula chiopu), Editura Babel, Bucureti, 1997, pag.692. 32 Hofstatter, Peter R., "Psychologie" ,S. Fischer Verlag, Frankfurt am Main, 1972, pag, 292. 33 v. Duhamel,Cl.,"Le choix des tests de recrutement. Guide du professionel", Les Ed.des Organisation, Paris, 1992, p.34-37. 34 v. Hehlmann, Wilhelm, "Worterbuch der Psychologie", Alfred Kroner Verlag, Stuttgart, 1968, pag. 580-581. 35 vezi Roca, Mariana, "Metode de Psihodiagnostic", Editura Didactic i Pedagogic, Bucureti, 1970, pag 22-28. 36 vezi Mitrofan, Nicolae, "Testarea psihologic a copilului mic", Edit. Press Mihaela, Bucureti, 1997, pag.20-21. 37 vezi Lagewie, H., Ehlers, W., "Kanurs Moderne Psychologie", Droeme, Knaur, Munchen, Zurich, 1978, pag. 20-21.
28
27
AUREL STAN
O foarte interesant prezentare a calitilor testului psihologic o fac Lothar i Helga Sprung ntr-o lucrare consacrat metodicii i metodologiei psihologice. Criteriile de apreciere care sunt atribuite testului fac parte i din sistemul metodicii psihologice n general, fiind enumerate validitatea, fidelitatea, concordana interpersonal sau obiectivitatea, normativitatea i utilitatea. Fiecare din aceste caliti suport efectul unei pedanterii taxonomice rar ntlnite (innd seama de informaia pe care o avem la dispoziie)38. Monica Albu i Horia Pitariu introduc ntre calitile testelor (cu referire special la testele de cunotine) pe lng validitate, fidelitate, obiectivitate, putere discriminativ, aplicabilitate i o serie de denumiri rar ntlnite la ali autori, i anume: caracterul reprezentativ al testului (cu referire la itemii alei pentru a compune un test); pertinena testului (gradul de respectare a criteriilor stabilite pentru selectarea ntrebrilor n aa fel nct acestea s se conformeze scopului instrumentului de msur); specificitatea testului (calitate care se dobndete n situaia n care un subiect care nu dispune de cunotine care fac obiectul verificrii va obine un scor egal cu cel pe care l-ar fi realizat dac ar fi rspuns la ntmplare)39. Un termen similar pentru fidelitate este cel de fiabilitate, termen folosit exclusiv n argumentaie de Dany Laveault i Jacques Gregoire, i ocazional de J.J. Bernier i B. Pietrulewicz. Sensul este, credem, o transpunere a celui din tehnic, adic probabilitate a bunei funcionri a unei componente sau a unui aparat ntr-o perioada de timp. Urmrind desfurarea de proceduri demonstrative i de argumentare teoretic a autorilor considerm c suntem n prezena unei extensii semantice binevenite a ceea ce era denumit pn acum fidelitate40. Nu am trecut n revist dect o parte din consideraiilor unor autori ( condiionai fiind de bibliografia parcurs), care au avut viziuni simplificante sau foarte extinse, considernd, totui, c am conturat ansamblul criteriilor de apreciere a testului psihologic. Vom cuta s abordm fiecare noiune care este considerat de autorii de specialitate drept criteriu de apreciere sau calitate a testului (nsumnd acel ansamblu de trsturi, care n subsidiar se sprijin pe un set clar precizat de proceduri statistico-matematice), satisfacerea sau ndeplinirea ansamblului format de acestea conferind identitate metodei testului. Variaiile numrului de caliti ale testului n abordrile diverilor autori au dou cauze: 1) extinderea semnificaiei denumirii de calitate sau criteriu de apreciere a testului asupra unor elemente contextuale i conjuncturale care influeneaz accidental, sporadic valorile rezultate dintr-o examinare i 2) preocuparea superficial pentru criteriile de apreciere a n lucrri care aveau n atenie alte aspecte ale testului. Autorii de notorietate care s-au ocupat de precizarea coninutului i fundamentarea criteriilor de apreciere a testelor psihologice au avut n vedere preponderent dou criterii de apreciere, considerate a fi cele mai importante: fidelitatea i validitatea. Dac aceste dou caliti nu sunt asigurate, nu are nici un rost s ne ocupm de modul de satisfacere a celorlalte (pentru care exist anumite tehnici constructive de ameliorare). Nici un fel de clasificare a criteriilor de valabilitate a testului
vezi Sprung, L.; Sprung, H., "Grundlagen der Methodologie + Metodik der Psychologie", VEB, Deutscher Verlag der Wissenschaft, Berlin, 1987, pag.147-210. 39 vezi Albu, Monica; Pitariu, Horia, "Proiectarea testelor de cunotine i examenul asistat pe calculator", Editura Casa Crii de tiin, Cluj, 1993, pag. 102-103. 40 vezi op.cit., pag 140-200.
38
28
psihologic nu omite fidelitatea i validitatea. Considerm c obiectivitatea este omis pe nedrept dintre cele mai importante criterii. Ca atare ncepem cu aceast calitate a testului psihologic. I.3.2 Obiectivitatea sau concordana interpersonal a testului psihologic Obiectivitatea sau concordana interpersonal este gradul n care rezultatele unui test psihologic sunt independente de persoana examinatorului care exploateaz psihodiagnostic acest instrument. Putem spune c un test este deplin obiectiv atunci cnd diveri examinatori obin aceleai rezultate la aceiai subieci. Desigur, n aplicrile practice se obine foarte rar strict acelai rezultat. Faptul de a aplica a doua oar acelai test influeneaz rezultatul, de aceea putem vorbi de oscilaii nesemnificative ale rezultatelor la folosirea testului pentru examinarea aceleai persoane de ctre alt examinator. Subiectivitate poate surveni n trei faze diferite ale derulrii a testrii psihologice, motiv pentru care vorbim de tot attea feluri de obiectivitate: obiectivitatea de realizare, obiectivitatea de evaluare i obiectivitatea de interpretare. n primul caz, modul de a administra testul al unui examinator nu ar trebui sa duca la obinerea unor rezultate semnificativ diferite la aceeai grup de subieci fa de cele obinute de un alt examinator. n mod firesc, condiiile de administrare a testului trebuie s fie ct mai asemntoare, dac se poate chiar identice, iar consemnul stabilit n caietul testului trebuie s fie respectat cu strictee. Obiectivitatea de evaluare este mai greu de atins fa de cea de realizare, iar cea de interpretare este mai greu de atins dect cea de evaluare. Testele sunt difereniate n ceea ce privete dificultatea asigurrii obiectivitii sau concordantei interpersonale. Asigurarea este mai simpl la testele creion-hrtie care posed, n cea mai mare parte, reguli clare de dare a rspunsului corect, de corectare i de evaluare i mult mai grea la testele proiective unde pregtirea psihologului pentru test este de durat i unde intervine un numr mai mare de criterii de evaluare i de interpretare. Metoda statistic folosit pentru calcularea indicelui de concordanta interpersonal este cea a corelaiilor simple i multiple. I. 3. 3 Fidelitatea testului Fidelitatea unui test este dat de precizia cu care un test msoar o anumit caracteristic, indiferent de faptul dac respectiva caracteristic este cea pe care pretinde c o msoar (care indic validitatea testului).Termenul englezesc utilizat pentru fidelitate este reliability, termen tiinific de larg circulaie. n spiritul concepiei teoriei clasice a testului se afirm c diferena dintre scorul observat sau msurat al unui test i scorul su adevrat trebuie s fie ct mai mic. Raportul dintre cele dou variane definesc practic fidelitatea unui test, ca atare fidelitatea =
2 var ianta scorului " ade var at" sT = 2 . Minimumul i maximumul teoretic al acestei valori sunt var iant scorului masurat sX
0,00 i +1,00. Rezultatul acestui raport poart numele de coeficient de fidelitate. Pentru a putea discuta problemele fidelitii trebuie s precizm noiunea de test paralel. Testele paralele sunt definite ca serii de operaii msurnd aceeai trstur n acelai grad. Maurice Reuchlin definete astfel paralelismul testelor: Testele paralele sunt probe care au itemi de aceeai
29
AUREL STAN
dificultate i aceeai natur41. Dac testul este un ansamblu de itemi i avem un test, de exemplu, de 100 de itemi, conceput pentru a msura aceeai trstur, i-l divizm n 2 teste de 50 de itemi, sau 4 teste de 25 de itemi, sau 10 teste de cte 10 itemi, atunci subansamblele respective de itemi se pot numi teste paralele dac satisfac urmtoarele condiii: toate aceste subansamble de itemi trebuie a aib aceiai medie i aceste medii trebuie s fie egale cu mediile scorurilor "adevrate"; ele trebuie s aib aceeai varian i aceste variane trebuie s fie egale varianei scorurilor "adevrate"; indicele de corelaia intre oricare pereche posibil de itemi trebuie s fie de aceeai valoare; subansamblele de itemi trebuie s prezinte toate aceeai corelaie cu orice alt variabil care nu face parte din respectivul ansamblu de itemi42. Condiiile ideale ale teoriei testului clasic nu se mplinesc aproape niciodat n practic. Formele strict paralele sunt constituite din teste n care mediile, varianele scorurilor observate i varianele erorii sunt identice pentru fiecare form i n situaia n care subiectul are acelai scor adevrat n toate formele. Pentru instrumentele psihologice clasice, aceste exigene sunt lipsite de realism. Se vorbete de forme paralele tau echivalente atunci cnd se admit diferene ntre varianele de eroare la dou forme i ntre varianele scorurilor observate, pe cnd mediile la cele dou scoruri adevrate sunt identice Formele esenial tau echivalente admit diferene ntre variane i mediile scorurilor. Scorul adevrat pe care-l obine un subiect ntr-o form f este egal cu scorul pe care-l obine ntr-o form g plus o constant. Constanta se raporteaz la form, nu la subieci. Dac Vpf exprim scorul adevrat pentru subiectul p la versiunea f i Vpg, scorul adevrat al subiectului p la versiunea g, atunci relaia liniar ntre cele dou scoruri adevrate este exprimat prin ecuaia urmtoare: Vpf = Vpg = Cfg Ne aflm n faa unei forme congenerice a paralelitii, atunci cnd se consider c scorurile adevrate ale celor dou versiuni sunt perfect corelate. Relaia liniar ntre scorurile adevrate ale subiectului p pentru versiunile f i g se exprim n forma urmtoare: Vpf = bfgX Vpg+Cfg, n care constantele bfg i Cfg nu depind dect de forme, nu de subieci. Se aplic mai ales atunci cnd numrul de itemi variaz de la o form la alta. Varianele scorurilor observate f i g nu difer numai din cauza eterogenitii varianei de eroare (ca n versiunea tau-echivalent), ci i din cauza eterogenitii scorurilor adevrate. Joreskog, n anul 1971, a artat c formele paralele i formele tau-echivalente pot fi considerate ca nite cazuri particulare ale formelor congenerice. Dac acceptm constituirea unei mulimi de teste paralele, plecnd de la eantioane de itemi extrai la ntmplare dintr-o populaie important de itemi posibili, atunci media fiecrui eantion de itemi astfel constituit, prezint variaii i abaterea standard a unor astfel de variaii va fi egal cu abaterea standard a populaiei de itemi divizat prin rdcina ptrat a numrului de itemi a fiecrui
41 42
vezi "Grand dictionnaire de la psychologie", Larousse, Paris, 1992, pag.543. vezi Bartram, David, "Fidelit et validit", n Beech, R., Harding, Leonora, "Tests, mode d'emploi. Guide de psychometrie", ECPA, 1994, pag. 68.
30
eantion, adic prin eroarea standard de msur a mediei. Avnd n vedere faptul c fidelitatea se pronun n primul rnd asupra preciziei msurrii, un rol important n teorie l joac eroarea standard de msur. Formula erorii standard de msur(SE) este urmtoarea: SE= s x x (1 rxx ) ; n care sX = eroarea standard a scorurilor variabilei X i r xx = indicele de fidelitate Cnd se utilizeaz un scor observat sau failibil (vulnerabil la eroare), eroarea standard a msurii d o indicaie asupra intervalului probabilist de ncredere n care se situeaz scorul "adevrat". Fr aceast informaie asupra preciziei estimrii un scor este practic inutilizabil. Ca atare media, variana i eroarea standard de msur sunt cei mai importani indici statistici n psihometrie. Cuantificarea fidelitii unui test are ca raiune obinerea estimaiei erorii standard de msur. Asociaia Psihologilor Americani a elaborat un document. (1985), intitulat "Standards for Educational and Psychological Testing", n care recomand constructorilor de teste de a comunica eroarea tip de msur pentru diferite nivele ale scorurilor. Maniera cea mai cunoscut de a asigura corelaia ntre dou forme paralele ale unui test este de administra aceluiai eantion de subieci, n dou reprize diferite, acelai test. Corelaia care rezult din dou treceri succesive ale aceluiai test se numete indice de fidelitate test-retest. Acelai test la dou treceri succesive constituie echivalentul a dou forme paralele, deoarece aceiai itemi sunt utilizai n timpul celor dou treceri succesive. Practic se msoar stabilitatea temporal a aceluiai test, motiv pentru care coeficientul de corelaie obinut se mai numete coeficient de stabilitate. Durata de timp ntre cele dou aplicri trebuie s fie o durat semnificativ, de obicei de ordinul lunilor, deoarece reaplicrile imediate ale unui test conin n rezultat mai multe influene favorizante. n acest caz este vorba de rezultatele la acelai test in momente temporale diferite. Se constant n general ca acest coeficient de stabilitate se diminueaz cu timpul i este indicat de a lua n seam timpul scurs de la efectuarea ultimelor calcule asupra fidelitii prin acest procedeu. Dac perioada de timp scurs este de ordinul anilor, atunci ne putem atepta ca un coeficient de stabilitate s scad de la 0,90 (o corelaie de bun nivel) pn la 0,60. R.B. Cattell vorbete de o fidelitate test-retest de scurt termen i una de lung termen, fiecare din ele furniznd informaii diferite. Cea de scurt termen (dou sptmni i chiar mai puin) mai este numit i coeficient de ncredere (dependability) i indic gradul de ncredere ce se poate acorda instrumentului utilizat. n acest timp nu se poate vorbi ntr-adevr de schimbri semnificative ale trsturii msurate. R.B. Cattell conserv termenul de stabilitate asupra coeficienilor test-retest care se realizeaz pe un interval temporar important, el susinnd c prin extragerea coeficientului de stabilitate din cel de ncredere se poate obine partea varianei care este datorat fluctuaiilor reale ale trsturii. n cazul n care perioada de timp este scurt la procedeul test-retest, prima efectuare poate influena rspunsurile la a doua efectuare, mai ales la teste de randament. Se consider c la acest fel de fidelitate exist tendina de supraestimare, prin manifestarea varianei reziduale specifice itemilor, care reprezint variana sistematic specific a acestora. n mediul constructorilor de teste exist tendina de a crea forme paralele ale aceluiai test. Chestionarul de personalitate 16 PF, creat de R.B. Cattell are pn n prezent 4 forme (A, B, C, D). Fiecare prob este compus din itemi diferii, ns i propune acelai scop psihodiagnostic. Dac prima dat s-a aplicat forma A, retestul se face cu forma B, corelaia dintre cele dou forme numindu-se
31
AUREL STAN
fidelitate a formelor paralele, iar coeficientul obinut coeficient de echivalen. Acest coeficient de fidelitate are, de obicei, o valoare mai mic dect cel de stabilitate. ns, de multe ori nu este posibil de a gsi nici un test paralele i nu avem la dispoziie sptmni sau luni pentru a atepta aplicarea aceluiai test, stndu-ne la dispoziie doar posibilitatea administrrii unei singure probe o singur dat. Itemii pot fi tratai ca aparinnd la dou teste paralele. Astfel, un test de 100 de itemi poate fi mprit n dou pri de cte 50 de itemi fiecare. Coeficientul obinut se aseamn cu cel de echivalen,. dar testul nu conine n acest caz dect jumtate din cantitatea de itemi folosit la alte forme. n asemenea situaii avem la dispoziie posibilitatea unei 2 xrxx corecii a coeficientului de corelaie, utiliznd formula Spearman-Brown. Astfel rxx ' = n care (1 + rxx ) rxx este corelaia ntre cele dou jumti ale testului, rxx estimarea fidelitii ansamblului testului. Aceast metod de mprite n dou a testului, care mai poart numele de metoda split-half, informeaz despre omogenitatea sau coerena itemilor. n cazul n care corelaiile ntre itemi sunt ridicate ne putem atepta ca i cele ntre dou jumti ale testului s fie ridicate. Media sumei corelaiilor tuturor variantelor de njumtire a testului este foarte apropiat de media tuturor corelaiilor interitemi. Dac cineva corijeaz media corelaiilor interitemi cu formula Spearman-Brown se obine un coeficient egal cu media corelaiilor corijate ntre toate perechile posibile de partaj prin njumtire. Coeficientul obinut se numete coeficient de consisten intern. Consistena intern =
k r 1 (k 1) * r
n care k = numr de itemi paraleli i r = media corelaiilor interitemi. Pentru a estima coerena intern trebuie s scindm ansamblul intemilor ntr-un mare numr de fraciuni, pe care trebuie s le corelm (sferturi, optimi, aisprezecimi de test). Un mod simplificat de a exprima simplificat consistena intern este exprimat prin formula a lui Cronbach. :
s i2 k = * 1 ( 2 ) (k 1) sX
n care k = nr. de itemi,
2 i
suma varianei itemilor i S 2 T = variana testului. Teoria clasic a testelor
strict paralele este conform cu urmtoarele supoziii (postulate): itemii msoar un factor sau o trstur i numai una; corelaiile interitemi sunt egale; itemii au variane egale; itemii sunt de dificultate identic. Formula a lui Cronbach presupune ca cel puin 3 prime condiii s fie verificate. J.F. Kuder i M.V. Richardson dezvolt un sistem de ecuaii pentru aprecierea fidelitii, care sunt uzitate i se dovedesc mai practice n utilizare. Aceste ecuaii, n denumire prescurtat, sunt: K-R 2, K-R 8, K-R 14, K-R 20 i K-R 21. Ecuaiile Kuder Richardson prezint dou forme: una n care se utilizeaz variana itemilor i alta pentru itemii cu rspuns dihotomic. Utilizarea lor este indicat n urmtoarele situaii: n cazul n care nici o supoziie nu este verificat (K-R 2), n cazul n care doar supoziia 1 este verificat (K-R 8),
32
n cazul n care primele dou supoziii sunt verificate (K-R 14), n cazul n care primele trei supoziii sunt verificate (K-R 20), n cazul n care toate cele patru supoziii sunt verificate (K-R 21)43. Pe plan formal, coeficientul a lui Cronbach este echivalentul ecuaiei K-R 20. Forma simplificat a ecuaiei Kuder-Richardson 20 este urmtoarea:
rxx =
pi * qi k * 1 2 (k 1) sX
n care pi este indicele de dificultate al itemului i qi este egal cu 1-p, k este numrul de itemi, s2x este variana rezultatului global al testului. n cazul n care una sau mai multe supoziiile prezentate anterior nu sunt verificate, atunci coeficientul obinut subestimeaz consistena intern. Dup trecerea n revist a diferitelor metode de calcul a coeficientului de fidelitate se poate concluziona c nu exist o identitate valoric a rezultatului dac folosim metode diferite. Este de presupus c surse diferite de eroare influeneaz difereniat fidelitatea unui test. Pot interveni situaii specifice n privina explicaiilor date pentru efectuarea testului, modul de administrare al acestuia i modul de corectare. Poate interveni chiar i lipsa de stabilitate a trsturii n sine. H.J. Eysenck insist asupra cercetrii fidelitii subiectului n privina unei anumite capaciti, nu doar asupra fidelitii probei psihologice. I.3.4 Validitatea testului psihologic Validitatea unui test este acea calitate a testului de a msura o caracteristic pe care pretinde c o msoar. n spiritul teoriei clasice a testului psihologic, Gustav Lienert considera c validitatea unui test d gradul de precizie cu care acest test msoar faptic acea caracteristic a personalitii sau acel mod de comportament pe care el trebuie s-l msoare sau pretinde s-l msoare44. Un test este deplin valid cnd rezultatele sale permit o concluzie nemijlocit i fr greeli asupra gradului de reliefare a caracteristicii comportamentale cercetate. Stabilirea validitii este principala sarcin a celor ce construiesc i vor s impun n practic folosirea unui anumit test psihologic. Spre deosebire de validitate, validarea este un ansamblu de proceduri cantitative i calitative care au drept finalitate asigurarea validitii. n sens general, validitatea este o proprietate a unui model, a unui enun, a unui concept, a unui indicator specific a unui test statistic de a corespunde intr-un mod apropiat destinaiei pentru care au fost create. Acest concept trimite la relaia care exist ntre teorie sau orice element teoretic (model, ipoteza, concept, instrument, test) i realitatea empiric pe care teoria consider c o reprezint. Noiunea de validitate are o legtur strns cu aceea de adevr. A spune despre un model ca este valid nseamn a afirma c entitile pe care le utilizeaz (exemplu procese, reprezentri, motivaii, stadii, complexe) au o anumit form de "realitate" i c enunurile pe care le conin sunt adevrate (exemple de enunuri - nivelul de motivaie modific rapiditatea proceselor de percepie sau complexul lui Oedip este un constitutiv al personalitii tuturor indivizilor). n teoria percepiei de vorbete despre validitate ecologic. Termenul este creat de Egon Brunswik pentru a desemna gradul n care stimuli distali i proximali covariaz. El s-a gndit la operaia de baz a percepiei, aceea de a nva s
Kline, Paul, "Fidelit et validit", n Beech, R., Harding, Leonora, "Tests, mode d'emploi. Guide de psychometrie", ECPA, Paris, 1994, pag.82. 44 vezi Lienert, Gustav, "Testaufbau und Testanalyse", Verlag Julius Beltz, Weinheim und Berlin, 1967, pag. 255.
43
33
AUREL STAN
estimm adevratul stimul (distal = fizic) pe baza valorilor variabile ale stimulului proximal care excit sistemele receptoare. Cu ct este mai mare validitatea ecologic a unui semn proximal pentru o proprietate a unui stimul distal, cu att e mai probabil ca acesta s fie nvat i folosit. Termenul e folosit n teoria percepiei directe a lui J.J. Gibson. Autorul sau utilizatorul unui model, n funcie de cadrul epistemologic n care se situeaz, este nevoit s respecte definiia termenilor teoretici i s fixeze n acelai timp condiiile pe care el pretinde c trebuie s dispun un model valid. Pentru testele psihologice condiiile standard de validitate sunt, n general, definite n termeni de valoare predictiv, adic, prin intermediul unei valori de corelaie cu ceea ce ele sunt investite de a diagnostica (inteligena, nivel de dezvoltare, trstura de personalitate, capacitate ntr-o sarcina sau ntr-o profesiune). Noiunea de validitate este central pentru psihologia tiinific, adic psihologia care caut s-i fundamenteze afirmaiile (aseriunile) prin intervenia procedurilor experimentale, la care se adaug un sistem statistic adecvat de verificare a rezultatelor. Nu este exagerat s se afirme c psihologii se divizeaz n dou categorii: 1. cei care se preocup de validitatea (afirmaiilor), a teoriilor, a modelelor, a conceptelor i instrumentelor pe care le folosesc; 2. cei care nu se preocup de acestea, ci se mulumesc cu aseriuni (afirmaii care nu sunt demonstrate). Noiunile teoretice sunt justificabile (fundamentate) printr-o procedur n care ele sunt confruntate cu datele. Reguli metodologice riguroase fixeaz pe baze raionale etapele pe care trebuie s le parcurg o validare sistematic. Elementele teoretice pot sa fie, in acest proces sunt sau respinse ca nonvalide, sau ameliorate, sau acceptate ca provizoriu valide (pn la o confirmare mai ampl). "American Psychological Association" i"American Educational Research Association" au publicat mpreun n anul 1985 "Standard for Educational and Psychological Testing" n care se pronun pentru integrarea diferitelor tipuri de validitate. n documentul amintit anterior, care constituie un punct de referin pentru psihometricienii americani, se afirm c validitatea este "un concept unitar care se refer nu la testul n sine, ci la inferenele fcute plecnd de la rezultatele acestuia"45. n aceast perspectiv este incorect s se vorbeasc despre validitatea unui test n general, deci se prefer a defini noiunea de validitate prin referina la intercorelarea care este realizat cu rezultatele unui test (sau a unui indicator oarecare al acestuia). n privina validitii exist 3 diviziuni fundamentale i o serie de diviziuni secundare: Facem consideraii, n primul rnd, asupra celor fundamentale. Validitatea de coninut. ntr-o viziune restrns asupra acestui gen de validitate, caracteristic mai ales domeniului aptitudinal, nsui coninutul testului prezint criteriu optimal pentru caracteristica personalitii care se cere reliefat. Un test de cunotine colare va fi valid n privina coninutului dac sarcinile sale prezint alegeri reprezentative din materia de nvmnt. Cel mai ilustrativ exemplu pentru acest tip de validitate este proba la maina de scris. n viziune strict, estimarea validitii unui instrument de testare este ntemeiat pe o examinare detaliat a coninuturilor itemilor testului. Evaluarea acestora este realizat analitic prin analiza atent a fiecrui item n vederea stabilirii potrivirii cu testul i examinarea coeziunii globale a
45
Dup Laveault, Dany, Gregoire, Jacques, "Introduction aux theorie des tests en sciences humaine", De Boeck Universit, Paris, Bruxelles, 1997, pag. 189-190.
34
itemilor testului. De exemplu, un test de abiliti matematice, pentru a avea un grad de validitate de coninut respectabil ar trebui s formuleze itemii ntr-un mod foarte clar pentru ca subiectul s poat nelege ceea ce e ntrebat. Mai mult, coninuturile ar trebui s fie astfel gndite nct toate aspectele testate s fie reprezentate adecvat. Testul nu trebuie s fie suprancrcat cu itemi despre nmulire n defavoarea itemilor despre adunare. Stabilirea validitii de coninut este o operaie subiectiv i se bazeaz pe evalurile experilior n ceea ce privete relevana materialelor utilizate. Este specific unei situaii i estimrile fcute ntr-o anumit situaie circumstanial pot s nu se aplice i altor sitaii. Un test de aptitudini aritmetice, construit i validat n privina coninutului pentru o coal tradiional, poate avea o validitate de coninut foarte sczut dac este aplicat ntr-o coal ce folosete aa-numita matematic nou. Validitatea de coninut, n viziune extins,. este conferit unui test, de regul, printr-un consiliu de experi, cruia i se cere s se pronune n ce msur sarcinile sunt reprezentative pentru un concept care constituie baza teoretic a testului. Itemilor li se cerceteaz toate faetele care converg spre identitatea noional a anxietii, depresiei, introversiunii etc. Reproul de subiectivitate poate fi contracarat prin crearea i respectarea unei metodologii foarte riguroase. Validitatea de coninut este direcionat n majoritatea cazurilor spre coninutul itemilor care nu se confund n multe cazuri cu coninutul testului. pentru evaluarea cruia se iau n consideraie i alte aspecte precum instruciunile date, modalitile de rspuns i de cotare, limita de timp. Merit de precizat faptul c termenul de concept psihodiagnostic desemneaz maniera generic de raportare a testului. Nici un test nu msoar direct o trstur, ci ntr-un mod mediat, prin intermediul unui model al conceptului. Neglijarea acestei precizri a dus la reificarea unor concepte n faza de nceput a testrii psihologice, cu consecine nefaste pentru aceasta. Astfel, inteligena era considerat ca avnd o realitate aproape de substan, care se localiza n creierul uman. Maurice Reuchlin spune n aceast privin: "Iluzia const n a crede c, deoarece un cuvnt exist n limb, acestuia i corespunde n mod necesar, fr ambiguitate, un obiect identificabil. Aceasta nseamn s uitm pluralitatea definiiilor posibile a fiecrui cuvnt a limbii, faptul interpretrii diverse a cuvintelor care compun definiiile, i c limba nu are rolul de a furniza procedee empirice permind de a ti n ce msur o anumit observaie corespunde unei anumite definiii (ea furnizeaz un cod, nu o metod de codaj)"46. Psihometricienii englezi utilizeaz termenul de "construct" pentru a desemna modelizarea unui concept. Validitatea de construct se rezum la un set de proceduri evaluare a validitii unui instrument de testare bazate pe determinarea gradului n care itemii testului cuprind trstura, constructul ipotetic pe care pretind c l msoar. Astfel, dac se presupune c un test msoar inteligena, ne putem ntreba: Ce trsturi sau caliti caracterizeaz inteligena? Itemii testului reflect ntr-adevr aceste constructe? Studiile iniiale ale construirii unui test sunt de obicei legate de validitatea de construct. Este de remarcat faptul c aceast validitate nu asigur o msurare cantitativ a validitii. Spre deosebire de o validitate care depinde de msurtorile de corelaie, aici nu exist baze matematice pentru determinarea validitii i spre deosebire de msurtorile care depind de structurile de comportament cunoscute (de exemplu validitatea legat de criterii), estimarea validitii construciei este ntotdeauna n
46
Vezi Reuchlin, Maurice, "Introduction la recherche en psychologie", Editions Nathan, Paris, 1992, pag.51-52.
35
AUREL STAN
schimbare odat cu acumularea mai multor dovezi despre trsturile i calitile care fundamenteaz constructul. Orice aciune de validare debuteaz printr-o definiie precis a caracteristicii investigate de test. Prezena unor elemente vagi n definiii mpiedic stabilirea corespunztoare a validitii. Asociaiile profesionale se preocup intens de concizia i de unitatea de sens a termenilor utilizai. n domeniul psihiatric i psihologic DSM-IV (Diagnostic and Statistical Manual of Mental Disorders), publicat de Asociaia Psihiatric American47, furnizeaz standarde ale conciziei n terminologia utilizat. Validitatea bazat pe un criteriu. Alt denumire pentru validitatea bazat pe un criteriu este validitatea extern. Validitatea unui instrument de testare evaluat prin determinarea relaiei dintre scorurile la test i un criteriu independent Validitatea simultan, convergent i validitatea predictiv sunt dou feluri diferite ale acestei diviziuni a validitii. Dac un test pretinde c msoar o anumit caracteristic psihic este firesc ca testul s coreleze cu un criteriu care msoar aceeai trstur sau una foarte apropiat. Cnd avem posibilitatea s comparm imediat valorile testului cu cele ale unei mrimi care are o validitate recunoscut, atunci suntem n prezena unei validiti concomitente sau concurente. Validitatea concurent este un fel de validitate bazata pe criterii corelate n care relaia dintre punctajul (scorul) testului i scorurile criterii se stabilete n acelai timp. Este denumit i validitate convergent, simultan sau de statut. O modalitate de a evalua validitatea unui test de abiliti de lucru la birou va fi s stabilim modul n care scorurile la test vor corela cu abilitile cunoscute ale unui grup de lucrtori la birou ale cror performane au fost evaluate n condiii de munc reale. Un alt exemplu: rezultatele subtestului de calcule aritmetice ale probei WISC pot fi imediat corelate cu rezultatele obinute la disciplina respectiv de un elev. n cazul n care performana cu care se compar rezultatele testului urmeaz s fie stabilit ulterior examinrii, atunci validitatea este predictiv. Dar criteriu poate fi o realitate complex i atunci va trebui s-l definim operaional, fapt care constituie una din cele mai importante etape practice n precizarea validitii. Un criteriu deficitar definit poate duce la compromiterea validitii unui bun instrument de msur. De asemenea, n joc intr o serie de factori care pot influena acest criteriu de apreciere a testului. Acetia sunt: fidelitatea predictorului i a criteriului. Criteriu este suficient de valid n msura in care este fidel, deci reproductibil.Ca atare, trebuie de demonstrat c la repetare, acelai criteriu produce rezultate relativ identice n corelaie; mrimea eantionului de subieci; tolerana fa de dispersia rezultatelor; Modificrile operate n rndul acestor factori de influenare pot afecta serios indicele de validitate. Dac un eantion are o valoare modest (sub 30), atunci afectarea validitii este de 25-30%. Validitatea teoretic sau conceptual. Este tipul de validitate care pretinde un efort de un rafinament deosebit, deoarece se refer la natura instrumentului de msur. n psihologie i n alte discipline, nelegerea unui fenomen progreseaz n armonie cu capacitatea noastr de a-l msura. Operaionalizarea variabilelor st n centrul ateniei n cazul validitii teoretice, ntreprindere tiinific care presupune o mare cantitate de informaii. n cazul n care o ipotez nu se verific i instrumentul de msur este bine operaionalizat, atunci teoria se cere schimbat sau ameliorat structural i funcional. Semnalul de alarm asupra calitii teoriilor psihologice nu este o chestiune recent, el fiind o
47
S-a consultat ediia din anul 1994.
36
preocupare constant a unor epistemologi de marc. Unul dintre acetia, Karl Popper, fcea urmtoarea remarc nc din anul 1934: "Pentru a putea clarifica aceast concepie (deductivist), este necesar s clarificm opoziia dintre psihologia empiric a cunoaterii, care opereaz cu fapte empirice, i logica cunoaterii, care nu se intereseaz dect de corelaii logice, cci prejudecile logice inductive sunt legate de confundarea problemelor psihologice cu cele epistemologice, ceea ce, n treact fie spus, are urmri neplcute nu numai pentru teoria cunoaterii, ci i pentru psihologie"48. Dac teoria este valid i instrumentul de cercetare dovedete o operaionalizare deficitar, atunci poate interveni schimbarea sau ameliorarea constructiv a instrumentului sau a procedurii de validare. Testul psihologic are o serie de validiti de importanta mai mic, dar care n anumite contexte pot sa joace un rol important, n condiiile cnd se asigura realizarea lor. Ele constituie, n mare parte, variante ale primelor trei sau proceduri simplificate determinate de contextul empiric49. Validitatea"a priori" este o estimare preliminar i intuitiv a validitii de coninut a unui test. Stabilete gradul in care itemii testului au o legtur intuitiv "a priori" cu acele comportamentele pe care se presupune c le testeaz. Se mai numete "validitate de sim comun". Validitatea congruenta este o metod de stabilire a validitii unui nou test prin corelarea scorurilor obinute la acest test cu altele, a cror validitate a fost stabilit anterior. Un caz tipic este dat de lumea testelor de inteligen, unde noile teste create sunt comparate cu testele recunoscute ca fiind validate, cum sunt Stanford-Binet sau diferite forme de teste create de David Wechsler. Validitate intern este o procedur intern de determinare a validitii unui test prin cercetarea fiecrei componente i evaluarea gradului n care i ndeplinete rolul in cadrul testului. Astfel se poate vorbi i de validitatea itemului, ca fiind gradul n care un singur item al unui test msoar ceea ce a fost gndit s msoare. Validitate reprezentativ (bazat pe un model) este o variant a validitii de coninut, bazata pe evaluarea ponderii n care diferite caracteristici presupuse a susine i fundament ceea ce se msoar sunt reprezentate n test. Este mai mult dect o procedur de control pentru a se evita subiectivismul n cadrul testului, i are drept obiectiv prevenirea defavorizrii adevratei msurri. Validitatea sintetic (syntethic validity)50 este validitatea unui instrument complex de testare sau a unei ntregi baterii de teste, i este bazat pe relaia dintre un scor compozit, care presupune reprezentarea diferiilor factori prezeni n test, i performana real. Termenul deriv din procedura sintetizrii mai multor factori ntr-o singur valoare. Validitate aparent (face validity) sau validitatea de faad este validitatea evaluata de ctre subieci (care au n aceast situaie calitatea de "experi"), care apreciaz coninutul unui test pentru a aprecia dac este potrivit, adecvat lor. Este o procedur destul de vag pentru validarea unui test, aceasta i datorit subiectivitii inerente, fiind tipic doar fazelor incipiente de construcie a testelor. Este de remarcat faptul c, n timp ce validitatea aparent pare, superficial vorbind, similar cu
Vezi Popper, Karl R., "Logica cercetrii", Editura tiinific i enciclopedic, Bucureti, 1981, pag.75. Aceste validiti ocup spaii modeste n manuale sau lucrri de specialitate. Pentru inventarierea lor am consultat urmtoarele dicionare: Heber, Arthur, "Dictionary of Psychology", Penguin Books, London, New York, 1985; "Grand Dictionnaire de la Psychologie", Larousse, Paris, 1992; Hehlmann, Wilhelm, "Worterbuch der Psychologie", Alfred Kroner Verlag, Stuttgart, 1968; chiopu, Ursula (coord), "Dicionar de Psihololgie", Editura Babel, Bucureti, 1997; Benesch, Hellmuth, "Atlas de la Psychologie", Libraire Generale Francaise, Paris, 1995; Mucchielli, A. et R., "Lexique de la Psychologie", Entreprise Moderne d'Edition, Editions Sociales Francaises, Paris, 1969. 50 n parantez este trecut forma sub care circul noiunea respectiv n terminologia englez de specialitate.
48 49
37
AUREL STAN
validitatea de coninut, procedurile sunt destul de diferite, ultima fiind o procedura sistematic, iar prima fiind mai apropiat de validitatea "a priori". Validitate de consens sau de prere general. Este realizat printr-o procedur informal de evaluare a validitii bazat pe noiunea de prere general. Aceasta pornete de la aseriunea c o afirmaie este cu att mai posibil s fie adevrat cu ct mai multe persoane sunt de acord n privina adevrului acesteia sau cu ct mai multe persoane sunt de acord n privina unei percepii cu att e mai posibil ca ea s fie adevrat. Termenul de validitate de consens este rar folosit n cercetarea ce utilizeaz teste i msurtori. Este un termen tipic pentru psihologia social i se conformeaz principiului conform cruia susinerea sistematic a unei anumite poziii i acord o mai mare acceptabilitate din partea celorlali.
I. 4. CRITERII SECUNDARE DE APRECIERE A UNUI TEST PSIHOLOGIC I.4.1. Normativitatea unui test Acest criteriu presupune ca exigen pentru unui test de a oferi informaii care s poat servi la ordonarea rezultatelor individuale ale testului n raport cu un sistem de referin i anume sistemul normativ. La testele unidimensionale decurge normarea firesc din faptul existenei tendinei de a stabili distribuia valorilor testului unei populaii de subieci, de a transforma aceast distribuie n una normal i de a o nzestra cu anumii parametri ai distribuiei (de exemplu la scala coeficienilor de inteligen cu o medie de 100 si o abatere standard de 15). Fiecare valoare brut a testului face parte dintr-un anumit nivel valoric al testului care fixeaz univoc poziia unui subiect pe o scal. Normarea poate s se realizeze pentru ntreaga populaie a unui areal (norme complete) sau pentru populaia unui anumit grup social (norme de grup). Se pot fixa norme dup grupe de vrst, dup sex, dup proveniena urban sau rural, dup nivelul de studii. De asemenea, se pot combina criteriile de diviziune ale testelor n vederea realizrii de norme. Exemplu, pentru grupe de vrsta 25-35 ani, studii generale, proveniena urban etc. Un test poate s ndeplineasc o serie de criterii dar, dac nu este normat, nu posed nici o utilitate diagnostic sau posed una foarte mic, cu toate c el apare indicat ca instrument de cercetare (unde este vorba, de regula, numai de comparaii ntre grupe). Procedeele de normare a rezultatelor obinute la teste de ctre grupele de referin le vom trata ntr-un capitol ulterior, cel care face referin la aspectele constructive. I.4.2. Standardizarea unui test ntr-o serie de lucrri consacrate teoriei i construciei testului se prevede standardizarea ca o cerin fundamental., deoarece nerespectarea acestei exigene ar duce la serioase pierderi de informaii sistematice. Eantioanele de informaii, dobndite de regul din comportamentul observat al examinatului, variaz n dependen de caracteristicile psihice ale examinatorului i de condiii necontrolate care apar sistematic sau nesistematic. n cazul ideal, standardizarea are n decursul procesului diagnostic rolul de invariant al condiiilor de examinare i face posibili indicatori nedeformai ai caracteristicii psihice n cauz. n practic stabilirea influenei sistematice asupra rezultatului testului este o realizare care se produce doar condiionat.
38
Standardizarea procesul diagnostic prin intermediul testului are loc n mai multe faze: provocarea stimulrii, nregistrarea rspunsului, evaluarea rezultatului i interpretarea acestuia. Aceast fracionare a procesului de diagnosticare prin test este o exigen teoretic, dar n examinarea concret fazele nu sunt separabile la fel de eficient la toate clasele de teste. n faza de provocare a stimulrii pe baza configuraiei de itemi se constat variaii nensemnate ale ordonrii experimentale, care pot s influeneze mai mult sau mai puin rezultatele testului. O serie de atenionri pot juca un rol benefic, i anume: a se pstra doar instruciunile de cercetare proiectate pentru test; a se utiliza materialele de cercetare recomandate pentru test, altfel rezultatele nu pot fi comparate; s fie create pentru toi participanii aceleai condiii, deoarece, pe lng materiale, sunt relevante i indicaiile date subiecilor pentru situaia de testare; condiiile i instruciunile nu au aceeai importan pentru toi candidaii, ci una diferenial pentru fiecare condiie; Un test trebuie s fie realizat la fel pentru toi candidaii, ntr-o ambian pe ct posibil neperturbat; Condiiile exterioare nu pot s fi identificate complet, deoarece ntr n calcul starea vremii, raportul spaial, starea instrumentului de scris, mirosuri indezirabile. idiosincrasii perceptive. Atenia pentru crearea unei situaii sterile n privina condiiilor de ambiant nu poate fi comparat cu cea din medicin. Mai greu de delimitat i normalizat sunt condiiile intraindividuale, proprii fiecrui subiect. Tragerea unor concluzii psihodiagnostice din rezultatele unui test presupune c subiectul se gsea, n momentul examenului, ntr-o dispoziie corporal i psihic normal. Perturbrile momentane ale strii de sntate, efectele farmacologice de timp scurt sau lung, tensiunile emoionale acute, grijile, gradul de nelinite, nesigurana, oscilaia dispoziiilor personale pot s influeneze n mai mare sau mai mic msur cantitatea i calitatea rspunsurilor. Atenie special trebuie acordat efectelor posibile care rezult din dispoziia personal, ateptrile personale ale examinatului fa de cercetarea prin test i consecinele presupuse ale acesteia Cercetri empirice indic faptul c determinani speciali precum motivaia efecturii testului, participarea eului, anxietatea fa de test. succesul sau insuccesul trit, caracterul stresului (presiunea examenului i a timpului) pot s influeneze negativ considerabil fundamentul diagnosticului. n sens mai larg strategiile de realizare, care variaz interindividual, nclinaii latente sau ascunse la colaborare, minciuna, exagerarea i afirmaiile neconvingtoare, ca i stilul de reacie general sau specific al candidatului fac parte din izvorul de perturbri intern psihice care pot s provoace rezultate neregulate ale testului. Provocarea comportamental ca situaie social, este prezent mai ales la examenul individual. la care particip i un complex semnificativ de condiii marginale. Printre acestea sunt caracteristicile ale randamentului la test, vrsta, sexul, statutul social, rudele, vestimentaia caracteristici presupuse sau ateptate ale examinatorului, mecanisme de interreacie condiionate (prezena sau absena examinatorului n spaiu de examinare, cunoaterea sau necunoaterea lui, intensitatea
39
AUREL STAN
observrii i a sprijinului, condiionri atmosferice, mimice, gestice sau verbale, ncurajarea sau descurajarea, lauda sau mustrare). Anna Anastasi spunea n 1968 c semnificaia variabilelor situaionale la examenul prin test are valoare diferenial n funcie de fiecare test. nregistrarea rspunsurilor. n privina nregistrrii rspunsurilor la test se poate spune c aceasta nu este niciodat deplin. Exist o diferena ntre nregistrarea rezultatelor i n observarea liber a datelor. nregistrarea cunoate forme multiple i presupune protocalarea verbal a rspunsului, depozitarea anumitor semnale prin ajutorarea de ctre mijloace tehnice-aparat fotografic, casetofon, instalaii video, aparate de nregistrare numerice i verbale, terminale ale computerelor, etc. nregistrarea standardizat a datelor trebuie realizat n msura n care aceasta nu se produce automatizat. n acest caz se stabilesc reguli clare, n aa fel nct fiecare conductor de testare s nregistreze aceeai cantitate de informaii. Evaluarea rspunsurilor la test. Prelucrarea rezultatelor nregistrate de la teste, precizarea frecvenei anumitor reacii-rspuns coerente se realizeaz parial cu diverse aparate de evaluat, mai ales ntr-un test de aptitudini. Teste cu rspuns creativ fac imposibil lucrul cu mainile de evaluat. elul evalurii datelor este obinerea unui extract din datele nregistrate, avnd ca rezultat unul sau mai muli indicatori. Valorile brute se preteaz la transformri pe baza raportrii la datelor grupurilor de referin. Evalurile sunt nsoite n unele cazuri de calcule vaste asupra sindroamelor i de prezentri grafice n profile pentru a face materialul mai uor de neles. n evaluare se fac simite efectele de informare precum i de halo, centrare, contrast i ancoraj. Interpretarea rezultatelor. Calitatea consecinele diagnostice pentru interpretare constituie obiectul de interes al obiectivitii. Dintr-un rezultat individual mai muli cercettori trebuie s trag aceleai concluzii. n timpul examenului ns se produc o serie de interaciuni ntre conductorul de examen i cel examinat. Cu ct regulile sunt mai puin formalizate, cu att mai mare este riscul efectelor de interpretare explicat prin ecuaia personal a conductorului de examen. Imperfeciunile sunt doar incomplet corijate. n faa exigenelor unei valorificri depline sunt obiecii mai mult sau mai puin ndreptite, datorate caracterului de "realitate deficitar" al variaiei condiiilor controlate empiric. Eantioane nereprezentative de subieci i metodele inadecvate de analiz a datelor i pun amprenta asupra calitii interpretrii. n practic este posibil doar aproximativ de a estima condiiile marginale care anormalizeaz situaiile de standardizare ale fazelor individuale ale procesului diagnostic. Ele sunt stabilite segmentat, chiar la testele construite i verificate cu grij. Pentru asigurarea unei bune interpretri sunt necesare, uneori, aplicri ale unor teste preliminare suplimentare care s limiteze efectele deformatoare (pentru stabilirea motivaiei testului sau scalele de minciuni). I.4.3.Comparabilitatea unui test Un test este comparabil dac: Exista unul sau mai multe forme de teste paralele; Sunt disponibile teste asemntoare n privina validitii. Forma paralel a unui test permite comparaia testului cu sine nsui. Ea face posibil un control intraindividual al fidelitii prin care se cerceteaz un anumit subiect cu o anumit form de test i se compar rezultatele. Testele asemntoare sau egal valide, examineaz aceeai caracteristic a personalitii sau una apropiat.
40
I.4.4.Economia unui test Un test este economic atunci cnd: cere un timp de realizare scurt; are nevoie de puin material; se aplica n mod simplu; este realizabil ca test de grup; este repede i comod evaluabil. Un test este foarte economic dac ndeplinete toate sau cele mai importante din aceste condiii El este foarte puin sau deloc economic, dac ndeplinete doar o parte sau nici una dintre exigenele enumerate. Nu am ntlnit n bibliografie un indice numrabil de cunoatere pentru economia unui test. I.4.5. Utilitatea unui test Un test este util dac el msoar o caracteristic a personalitii pentru a crei cercetare ia natere o necesitate practic. Un test are o nalt utilitate, daca el nu poate fi reprezentat n funcia sa printr-un alt test. El are o mic utilitate dac el examineaz o caracteristica a personalitii care ar putea sa fie la fel de bine cercetat cu o serie de alte teste. I. 4. 6. Relaiile reciproce ntre criteriile de apreciere a unui test psihologic Aceste relaii reciproce au constituit un interes constant pentru psihometricieni De respectarea acestora depinde posibilitatea utilizrii practice a unui test. Gustav Lienert51 indic urmtoarele raporturi ntre criteriile unui test psihologic: Fidelitatea test paralel sau retest poate s fie mai sczut dect consistena sa sau obiectivitatea sa. Indicatorii de validitate pot s fie mai mici dect cei de fidelitate. Un test cu o nalt validitate trebuie s posede in mod necesar i o nalt obiectivitate, consisten sau ncredere. Constatarea unei nalte validiti ne scutete ntr-o anumit msur de supraverificarea altor criteriilor de apreciere cunoscute. Un test cu o fidelitate redus se recomand, n cel mai bun caz, pentru comparaia grupelor n privina caracteristicii cercetate. Pentru acest scop, o fidelitate de 0,5 este suficient, nu ns i pentru o difereniere individual. Un test cu o validitate redus i cu o fidelitate nalt prezint o ncredere redus. Fr o prelucrare de coninut nu exist pentru acest test nici o posibilitate de mbuntire. Se recomand pentru diferenierea indivizilor, ns nu are nici o certitudine pe baza creia se produce aceasta difereniere. Un test cu o validitate redus i o fidelitate ngust este practic lipsit de valoare. Coeficientul de validitate nu poate depi rdcina ptrat a coeficientului de precizie (este vorba de indicele de precizie din procedura de stabilire a fidelitii). Astfel, validitatea este totdeauna limitat prin fidelitatea unui test.
51
Vezi Lienert, Gustav, "Testaufbau und Testanalyse", Verlag Julius Beltz, Weinheim/Berlin, 1967, pag.19-20.
41
AUREL STAN
II. ANALIZA DE ITEMI
II.1. ITEMII CA ELEMENTE ALE MSURRII PSIHOMETRICE Am amintit deja c procesul de msurare cu ajutorul testelor psihometrice se bazeaz pe informaii elementare provenite din domeniul itemilor n primul rnd considerm c intereseaz definiia itemului i precizarea faptului dac toate testele sunt compuse din itemi. O definiie clar a itemului este dat de Maurice Reuchlin: Element al unui test, constituind o situaie particular i jucnd rolul unui stimul la care subiectul nu poate da dect un rspuns dintre dou sau mai multe rspunsuri teoretice prevzute de test52. Itemul este deci o component de stimulare a unui test care beneficiaz de un dispozitiv de rspuns cu alegere multipl i care are menirea de a contribui la evidenierea unei trsturi, unei caracteristici psihice, pe care dorim s o diagnosticm. Cnd avem situaia unei singure variante de rspuns corecte, dintr-un numr de n oferite, atunci celelalte n-1 variante se numesc distractori. Pentru a-i ndeplini rolul funcional ntr-un sistem de rspuns cu mai multe variante, distractorul trebuie s prezinte verosimilitate (aceasta constituie o direcie de cercetare distinct n domeniul psihodiagnosticului). Numrul itemilor unui test este foarte variabil, dar limita inferioar nu scade sub cifra 10, considerat de ctre Paul Kline ca valoare limit pentru ca un ansamblu de itemi s se poat numi test53. Fiecare item posed un scor care adiionat cu cele ale celorlali itemi permite exploatarea cantitativ a informaiilor furnizate de test. Scorul este punctajul acordat rspunsului exprimat de ctre subiect. La probele de randament psihic, n special cognitiv, dac rspunsul subiectului la solicitarea unui item este corect scorul va fi egal cu 1 i dac acesta este incorect scorul va fi egal cu 0. n cazul aplicrii unui chestionar de personalitate, calitatea rspunsurilor nu se apreciaz prin termenii de corect i incorect. n acest caz, valoarea 1 este obinut de un rspuns care pune n eviden caracteristica investigat prin respectivul chestionar i valoarea 0 n situaia contrar. Itemii sunt caracteristici mai ales pentru testele din domeniul cognitiv, din cel al personalitii i din cel al cunotinelor, teste care se prezint n majoritatea cazurilor sub forma creion-hrtie. Pentru a fi considerat item o component a testului trebuie s posede individualitate informaional pertinent, adic s aduc o contribuie distinct, clar conturat la scorul total al testului. Bararea unei litere O sau C la testul Bourdon-Amfimov nu aduce o informaie care posed individualitate, dei aceast operaiune se puncteaz.. Ca atare, un asemenea rspuns nu constituie un item. La proba aparativ DM1 a lui Lahy, folosit intens n laboratoarele psihologice din domeniul transporturilor pentru diagnosticare asocierii i disocierea manual, nu poate fi vorba de itemi. Noiunea de item nu este unanim preluat de ctre autorii care se ocup de teoria testului psihologic. De exemplu, David Magnusson, un autor care nu i-a americanizat terminologia tiinific,
52 53
Vezi "Grand dictionnaire de la psychologie", Larousse, Paris, 1992. pag. 406 vezi Kline, Paul La construction des tests, n Beech, John R.; Harding, Leonora, "Tests-mode d'emploi", ECPA, Paris, 1994., pag.103
42
folosete noiunile de sarcini i analiz de sarcini n loc de itemi i analiz de itemi. 54, dei referirile sunt clare a ceea ce se numete analiz de itemi. Gustav Lienert nu folosete pe parcursul tratatului su asupra construciei testelor psihologice noiunea de item dect o singur dat, i atunci pentru a indica o procedur similar de analiz a discriminrii ntlnit la A.F. Vukovich55. Luat n sens general, analiza itemilor este o analiz detaliat a itemilor individuali ai unui test sau ai unui chestionar cu scopul de a evalua validitatea i sigurana, gradul de ncredere acordat fiecruia din itemi. n general disponibilitatea testului pentru aplicare practic. Sub aspect general, asemenea analize pot fi direcionate pe coninut i form sau pot fi realizate n mod cantitativ, observndu-se modul n care fiecare item contribuie la precizia msurrii i validitatea generala a testului. n sensul cel mai restrns, analiza de itemi este folosit prioritar mai ales pentru evaluarea modului efectiv n care fiecare item contribuie la validitatea general a testului. Aceast analiz nu se poate realiza dect pentru testele la care subiecii sunt lsai s parcurg toi itemii, deci este imposibil de realizat la aa-numitele teste de rapiditate (speed-test), adic teste care au o limit de timp i sunt construite n aa fel nct foarte puini subieci s termine de parcurs toate solicitrile n limita de timp fixat. Este adevrat c o serie de autori susin c la testele realizate incomplet de ctre subieci se pot prevedea restul rspunsurilor neefectuate prin studierea atent a modului n care subiectul a rspuns pn atunci. Considerm c o asemenea previziune ar aduce un plus de relativism n privina concluziilor, relativism care nu lipsete n interpretare nici fr aceast prognoz. n cazul cnd un mare numr de persoane nu au putut s rspund la item din lips de timp indicele de dificultate nu este exprimat cu adevrat. Analiza de itemi este diversificat, opiunea pentru o anumit categorie depinznd de scopul special pe care l urmrim n construcia unui anumit test. Caracteristicile valorilor brute ale ntregului test sau ale itemilor individuali nu sunt independente de caracteristicile eantioanelor care sunt msurate cu ajutorul testului. Acest aspect al eantionrii l vom trata n capitolul referitor la construcia testului. Un model teoretic ireproabil care s integreze perfect caracteristicile subiecilor n eantion i caracteristicile variabilelor msurate nu este disponibil. Creatorii de teste construite pe baza teoriei probabiliste a testului psihologic aspir la un model care s ofere parametri ai testului independent de eantioanele cercetate i independent chiar testele utilizate. n aceast lucrare vom face aprecieri prioritar referitoare la o metod de analiz pentru un singur eantion. Acest eantion trebuie s fie reprezentativ i pentru alte grupe la care testul trebuie s fie aplicat mai trziu. Abordarea pragmatic a metodei analizei de itemi o vom ncepe prin considerarea ctorva din scopurile sale cele mai importante. Se pot distinge dou feluri de analize de itemi, aceea la care n urma prelucrrii rezultatelor este extras un singur indice i aceea la care sunt extrai mai muli indici pentru selectarea i recomandarea unui anumit item. Cele mai frecvente analize sunt efectuate pentru cazul n care exist un anumit rspuns la item considerat corect. Realizarea unor exigene abstracte, bazate pe o puternic formalizare cantitativ, este o operaiune dificil i conduce, n cazul statisticilor neexhaustive, la o pierdere de informaii despre configuraii posibile ale categoriilor de itemi din care poate s rezulte valoarea sumei. Pe de alt parte, formalizarea i raportarea la modele este o procedur de neevitat, dar postulatele pot fi n unele cazuri slbite. Astfel, modelul teoriei clasice a testului ofer fundamentul pentru dobndirea valorilor fidele ale testului. Se poate concluziona c testele psihometrice se caracterizeaz prin aceea c multitudinea
Vezi Magnusson, David, "Testtheorie", Verlag Frank Deuticke Wien, 1969, pag.22-35 Lienert, Gustav.A., "Testaufbau und Testanalyse", Verlag Julius Beltz, Weinheim/Berlin, 1967, pag.93
54 55
43
AUREL STAN
de categorii de itemi posibile este ordonat i delimitat, fie pe calea avansrii unor categorii selective, fie prin categorizri ulterioare dup prescripii standardizate. La categoriile de itemi care sunt ordonate numerice, valorile numerice joase indic o reliefare sczut, iar cele mari una puternic a caracteristicii pus n discuie. n majoritatea cazurilor sunt preferate structuri informaionale binare, cu categorii de msurare 0 i 1, dar acest model nu este obligatoriu de urmat, existnd i alte posibiliti. Dac o valoare a unui test trebuie s indice sub form de msur caracteristica pus n discuie, atunci putem presupune c i valorile itemului indic relaii sistematice cu categoriile caracteristicii de msurat. Prezentarea sistematic a metodelor analizei itemului i cu aceast a tehnicilor de selecie se gsete n literatura standard despre construcia testului. Unul din scopul analizei de itemi este de a selecta dintr-o colecie mai mare de itemi (existent n faza preliminar a construciei unui test) una sau mai multe grupe de itemi, n aa fel nct punctajele corespunztoare ale testelor s satisfac diverse condiii prestabilite n relaie cu distribuia i anumite corelaii.. Ca tipuri de analize de itemi putem enumera analiza dificultii, a distractorilor, a omogenitii, a specificitii, a validitii, a excesului i a asimetriei. n construcia testelor psihologice se pleac de la un ansamblu de itemi mai numeros dect cel care se consider necesar, deoarece pe parcursul perioadei de elaborare a testelor o serie de itemi va fi eliminat, ca urmare a neconcordanei acesteia cu exigenele unor criterii de valabilitate. Structura de colectare a datelor necesare constituirii scorului testului n ansamblu a fost creat de William Stern n anul 1912, purtnd denumirea de matricea lui Stern. Exprimat n form generic, ea se prezint n felul urmtor: Item Subiect 1 2 3 4 i .. n tj 1 2 3 4 . j .. N
N
X11 X21 X31 X41 ... Xj1 .. XN1
X12 X22 X32 X42 .. Xj2 .. XN2
X13 X23 X33 X43 .. Xj3 . XN3
X14 X24 X34 X44 .. Xj4 . XN4
. .. ..
N
X1i X2i X3i X4i . Xji .. XNi
.. . .. .. .
N
X1n X2n X3n X4n . Xjn .. XNn
X
i =1 n
1i
X
i =1 n
2i
X
i =1 n
3i
X
i =1
4i
X
i =1 n
ji
X
i =1 n
Ni
X
i =1
Ni
fi
X j1
J =1
X j2
j =1
X j3
j =1
X j4
j =1
..
X ji
j =1
X jn
j =1
J =1 i =1
X ji
Tabelul 3. Cuprinde schema general a matricei subieci-itemi sau matricea Stern Valorile din coloane cuprind rezultatele subiecilor la un anumit item, cele din linii rezultatele unui anume subiect la totalitatea itemilor la care a rspuns. Cu fi am notat suma valorilor pozitive ale
44
itemului, adic a valorilor 1, care au semnificaia de rezolvare corect. Analiza dificultii este cel mai simplu, cel mai rspndit tip de analiz care poate s se realizeze la o serie de valori ale itemilor. Cu pi se noteaz obinuit indicele de dificultate a itemului, care f ne indic proporia subiecilor care au rezolvat corect itemul. Formula sa este urmtoarea pi = i , n N care fi reprezint suma valorilor obinute la un anumit item i N este numrul subiecilor care s-au raportat la itemul respectiv. Dac aceast proporie are o valoare apropiat de 1,00 ne indic un item uor, pe care l-au rezolvat majoritatea subiecilor, dac valoarea proporiei oscileaz n jurul valorii 0,50 ne indic un item de valoare mijlocie i dac are o valoare apropiat de 0 ne indic un item dificil sau foarte dificil. Cnd itemul este prea dificil sau prea uor distribuia acestuia devine asimetric. Itemii care sunt prea uori discrimineaz bine ntre subiecii slabi i itemii dificili printre subiecii buni. Dac un subiect nu rezolv un item care a fost rezolvat de 95% din totalul subiecilor, lucrul acesta este mai grav dect dac el ar fi realizat greeala la un item pe care l-ar fi rezolvat doar 20% din subiecii grupului de referin. Itemii cu indice de dificultate sczut, deci itemii dificili (pi = 0,1) au o asimetrie pozitiv, itemii cu dificultate medie (pi=0,5) sunt simetrici i itemii foarte uori (pi = 0,15) au o asimetrie negativ. Mai ales n cadrul probelor de randament, se recomand ca itemii foarte dificili, care nu-i rezolv aproape nici un subiect, i itemii foarte uori, pe care-i rezolv aproape toi subiecii s fie nlocuii. J.Guthke, H.R. Bttcher i L. Sprung fixeaz limita inferioar de acceptare a unui item ntr-un test de randament la 0,20 i limita superioar la 0,8056. Pentru acelai fel de teste, ali autori indic proporii care oscileaz uor n jurul valorilor indicate anterior. Aceste limite sunt racordate la logica teoriei clasice a testele psihologice, n cea probabilist exist practica integrrii n teste a itemilor rezolvai corect de un numr foarte mic sau foarte mare de subieci. n testele construite dup optica probabilist sunt admii itemi care pot fi rezolvai, de exemplu, de numai de 0,01% din subieci sau nerezolvai doar de acest procent. Fixarea unor limite de admitere la probele de personalitate devine mult mai problematic. Pentru aceste probe numele de indice de dificultate este inadecvat, un nume mai adecvat ar fi cel de indice de proeminen, deoarece prin el s-ar putea pune n eviden gradientul reliefrii unei anume segment rezultate din operaionalizarea unei trsturi de personalitate, de exemplu, un comportament tipic introvertit. Opticii clasice de analiz a testului i se reproeaz relativitatea proprietilor metrice ale itemului. Valoarea indicelui de dificultate calculat depinde particularitatea eantionului de subieci utilizat n cercetarea privind verificarea calitilor testului. Astfel, dac subiecii sunt slabi, itemul va fi considerat dificil. Din contr, dac subiecii posed un nivel de competen ridicat, itemul va fi considerat uor. Deci, reprezentanii opticii probabiliste de construcie a testului reproeaz clasicilor c aprecierea subiecilor depinde de itemi i aprecierea itemilor depinde de subieci. Oferim n continuare un exemplu cu valori fictive, cuprinznd rezultatele unui test efectuat de 11 subieci la 10 itemi nregistrate ntr-o matrice a lui Stern.
56
Guthke; Bottcher; Sprung (hrsg.), Psychodiagnostik", Band I, Deutscher Verlag der Wissenschaften, Berlin 1991, p.230.
45
AUREL STAN ITEMI 1 2 3 4 5 6 7 8 9 1 1 0 1 1 1 1 1 0 0 1 0 1 0 1 0 1 0 0 0 1 1 1 1 0 0 1 0 1 0 0 0 1 1 1 0 0 0 1 1 0 1 1 1 1 0 1 1 1 1 1 1 1 0 0 0 1 1 1 1 0 0 0 0 1 0 0 0 1 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 1 0 1 0 1 0 1 1 1 0 0 0 1 0 1 Prelucrare elemenetar a datelor cu stabilirea unor indicatori 5 8 4 9 6 6 3 7 0,45 0,73 0,36 0,82 0,55 0,55 0,27 0,64 0,55 0,27 0,64 0,18 0,45 0,45 0,73 0,36 0,25 0,20 0,23 0,15 0,25 0,25 0,20 0,23
Nr.crt. 1 2 3 4 5 6 7 8 9 10 11 fi pi qi si2 2 0,18 0,82 0,15
Subiect A.B. T.R. M.V. Z.D. A.T. N.F. U.J. L.E. U.I. D.R. T.A. 7 0,64 0,36 0,23
10 1 0 1 1 0 1 0 1 0 1 1
Total 8 4 6 5 6 8 4 3 3 4 6
Tabelul 4. Cuprinde o exemplificare pentru matricea Stern n partea inferioar a tabelului s-au realizat n linie cteva rubrici sintetizatoare. Semnificaia lor este urmtoarea: fi suma rezultatelor la un anumit item; pi proporia subiecilor care au rezolvat corect itemul sau, pentru chestionarul de personalitate, proporia celor care prin rspunsul lor au pus n eviden trstura investigat; qi proporia subiecilor care nu au rezolvat corect itemul sau, pentru chestionarul de personalitate, proporia celor care prin rspunsul lor nu au pus n eviden trstura investigat qi=1-pi ; si2 variana itemului sau dispersia itemului care poate fi considerat un indicator grosier al capacitii de discriminare a itemului. Formula varianei itemului este: s2i = pi*qi. Itemului i poate fi calculat, de asemenea, i indicatorul de asimetrie, la fel cum se calculeaz pentru rezultatele de ansamblu ale testului. Formula de calcul este urmtoarea: q p 3 = . pq
3 , simbolul care reprezint indicatorul de asimetrie pentru un item. Celelalte simboluri din formul au
fost prezentate anterior. Dac un item are p = 0,6 i q = 0,4 se obine urmtorul rezultat pentru coeficientul de asimetrie: 0,4 - 0,6 0,2 3 = = = 0,29 0,69 4*6 Formula de calcul pentru asimetrie este specific itemilor cu exprimare valoric binar( 0 i 1). Itemul analizat de noi are o asimetrie pozitiv, fiind cunoscut faptul c valoarea normal pentru asimetrie este 0. Asimetria este, deci, funcie a cotei parte a subiecilor care au rezolvat corect itemul sau care au dat un rspuns punctat prin 1 n cazul unor chestionare de personalitate. De asemenea, calculul excesului unui item cu exprimare numeric binar este o form
46
particular pentru calcularea excesului n general. 1 4 = 6 pq
4 , termenul necunoscut al acestei formule, reprezint indicele de exces sau indicele de kurtosis al
unui item cu exprimare binar a rezultatului. Aplicnd datele din exemplul anterior obinem: 1 1 4 = 6 = 6 = 0.6 * 0,4 0,24 4,16 6=-1,86 innd cont de faptul c valoarea normal a indicatorului de exces este 3,00, putem aprecia c acest item are o distribuie platicurtic. Prin indicele de dificultate se precizeaz ntr-o matrice a punctajelor itemilor vectorul mediei, deoarece este foarte clar c pi se confund cu media distribuiei valorilor itemilor. Aceast identitate a modului de calcul nu mai este valabil la matricile n care valorile itemilor nu mai sunt binare. Notaii diferite pentru itemi survin la inventarelor de interese, n care intensitatea rspunsului este mai fin difereniat, n marea majoritate a cazurilor nedepind valoarea 7, deci itemii primesc valori ntre 0 i 7, subiecii putnd obine oricare dintre valorile 0 i 7. Notri diferite de forma binar se ntlnesc i la probele de randament intelectual, i anume la WISC, prob la care unele scale de performan puncteaz i reuita parial. n cazul chestionarelor de interese sau de atitudini, cu ct cifra rspunsului la item este mai mare, cu att subiectul consider c un anumit interes sau o anumit atitudine, de exemplu, este mai intens O astfel de matrice se prezint astfel (date fictive): Nr.crt 1. 2 3 4 5 6 7 8 9 10 11 Subiect D.B. L.T/ P.R. M.D. F.T. O.P. E.T. D.P. S.H. Z.O. C.I. 1 1 2 6 3 4 5 2 7 3 1 1 2 2 3 4 2 3 5 2 6 4 3 4 3 2 1 1 4 3 1 1 1 1 2 1 4 2 7 5 6 3 4 2 3 5 4 2 ITEMI 5 7 7 5 7 6 7 6 7 6 5 7 6 5 4 4 5 4 3 5 4 4 3 4 7 3 4 2 4 3 4 6 4 3 4 3 8 1 7 7 2 7 4 6 5 4 3 3 9 5 4 3 6 7 5 6 4 6 5 6 10 1 2 1 1 1 1 2 1 1 2 1 Total 29 41 38 40 41 39 38 42 37 32 32
Prelucrare elemenetar a datelor cu stabilirea unor indicatori fi 35 38 18 43 70 45 40 49 57 14 409 pi 0,45 0,49 0,23 0,56 0,91 0,58 0,52 0,64 0,24 0,18 qi 0,55 0,51 0,77 0,44 0,09 0,42 0,48 0,36 0,76 0,82 X i 3,18 3,45 1,63 3,90 6,36 4,09 3,63 4,45 5,15 1,27 S2 4,36 1,67 1,05 2,89 0,65 0,49 1.05 4,42 1,36 0,21 Tabelul 5. Cuprinde date de exemplificare pentru matricea Stern. Cazul chestionarelor de atitudini cu rspunsuri polihotomice La aceast form polihotomic de exprimare a rezultatelor itemului, indicele de dificultate nu se mai confund cu media itemului i variana itemului nu se mai obine prin formula expus anterior. n acest caz, media nu permite de a aprecia dificultatea fiecrui item. Pentru calcularea indicelui de
47
AUREL STAN
dificultate se utilizeaz formula: pi =
fi , n care pi este indicele de dificultate, fi este suma valorilor f i max
obinute la un item de ctre ansamblul subiecilor (n cazul nostru 11 subieci), fi max este valoarea maxim pe care ar fi putut-o obine ansamblul subiecilor, dac fiecare ar fi obinut nota maxim. n exemplul nostru fi max este egal cu 77, valoare care rezult din nmulirea cifrei 7 (valoarea maxim pe care o poate obine un subiect la un item) cu valoarea 11, care reprezint numrul total de subieci. Valoarea pi = 0,45, indicele de dificultate al primului item se obine prin mprirea valorii 35 (fi) la 77 (fi 35 max). Astfel, pi = = 0,45 . Media itemului, notat de noi cu X i se obine prin mprirea valorii fi 77 (suma valorilor unui item) la N (numrul total de subieci care au efectuat itemul. Astfel, pentru calculul f 35 = 3,18 mediei primului item avem: X i = i = N 11 n unele cazuri se calculeaz dificultatea medie itemilor unui test, notat mp. n cazul
4,80 = 0,48 , n care pi este indicele de dificultate a itemilor i k 10 k numrul total de itemi, n cazul nostru k = 10. Aceast valoare este preferabil mediei testului pentru a exprima tendina central din cadrul ansamblului itemilor, deoarece aceasta este influenat prin sistemul de notare a rspunsurilor. Valoarea indicelui de dificultate poate fi influenat de doi factori, i anumite de probabilitate de reuit prin ntmplare i de numrul de itemi care sunt omii. Dei o serie de autori consider i itemii omii n calculul dificultii itemului57, noi considerm c analiza de itemi nu poate fi efectuat dect atunci cnd itemii sunt rezolvai n ntregime sau cnd subiecii omit foarte puine rspunsuri. n cazul n care dispozitivul de rspuns este cu alegere multipl, pot interveni rezolvri prin hazard, subiectul alegnd la ntmplare un anumit rspuns care poate fi cel corect. n cazul rspunsurilor de tip da/nu cota de hazard poate s ating 50%, n cazul cnd trei posibiliti de alegere, i doar una este corect, cota de hazard poate s ating 33%, iar cnd subiectul are ase posibiliti de alegere, dintre care doar una este corect, cota de hazard poate s ating 16%. Se consider util, n unele cazuri, calcularea unei corecii pentru a preveni deformarea rezultatelor. Redm n continuare un exemplu cu rezultate fictive pentru a exemplifica coreciile pentru cazul alegerii dintre mai multe variante de rspuns:
exemplificat de noi mp =
1=1
57
Vezi Laveault, D., Gregoire, J., op. cit. pag 225
48
TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC Numr de rspunsuri la alegere 2 4 6 8 1 1 0 1 0 1 1 1 1 1 1 0 1 1 0 1 0 0 1 0 1 1 0 1 0 0 1 1 1 0 1 0 0 1 0 1 1 0 1 1 0,60 0,60 0,60 0,70 0,20 0,47 0,52 0,66 0,40 0,13 0,08 0,04
1 pi 58 p'i=pi- M 1 n aceast formul p'i reprezint indicele de dificultate corectat; pi reprezint indicele de dificultate de plecare; M reprezint numrul de alegeri la acel item. Aceast corecie poate fi realizat doar n unele cazuri i nu ntr-un mod sistematic, deoarece este puin plauzibil situaia ca subiecii s efectueze la hazard itemii. Corecia operat nu schimb ordinea de clasare subiecilor. Vom face o serie de consideraii asupra varianei, noiune deosebit de important n analizele statistice descriptive i infereniale. Pentru calculul varianei itemilor se utilizeaz, n exemplul care urmeaz, formula de calcul anunat anterior59. i n cazul analizei de itemi variana este un indicator al dimensiunii capacitii de discriminare, care de fapt este menirea general a acestui indicator statistic. Dac un ir de valori ale unei variabile (rezultatele la un test sau la un item) prezint o valoare constant pentru toate valorile, atunci valoarea varianei este egal cu 0 i , n consecin, nu avem nimic de studiat la irul respectiv. n cercetrile psihologice i n cele care privesc testul psihologic variana joac un rol deosebit, deoarece n quasitotalitatea cazurilor ne intereseaz de a opera discriminri ntre subieci prin intermediul rezultatele acestora. Este, de aceea, interesant de a studia raporturile dintre varianele itemilor i variana rezultatelor testului n ntregime. Vom apela la un exemplu fictiv simplu, care prezint un numr redus de itemi i un numr redus de subieci.
Subieci 1 2 3 4 5 6 7 8 9 Media Variana Tabelul 7. Item 1 Item 2 Item 3 Item 4 Scor X Item 5 Item 6 X+5 X+6 1 1 1 1 4 1 1 5 5 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 1 1 1 1 4 1 1 5 5 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 1 1 1 1 4 1 1 5 5 1 1 1 1 4 1 1 5 5 0 0 0 0 0 1 0 1 0 0,44 0,44 0,44 0,44 1,77 1 0,44 2,77 2,22 0,278 0,278 0,278 0,278 4,44 0,00 0,278 4,44 6,94 Cuprinde date ilustrative pentru evidenierea raporturilor dintre variana itemilor i variana rezultatului global al testului. n tabelul cu rezultate prezentat observm c itemii 1,2,3,4 sunt rezolvai de 4 subieci din nou, aceeai de fiecare dat (subiecii 1,4,7,8 i rezolv i subiecii 2,3,5,6, i 9 nu i rezolv). Aceti
58 59
Subieci 1 2 3 4 5 6 7 8 9 10 Pi Pi diferena
Tabelul 6. Cuprinde exemplificarea modului de corecie n cazul rspunsurilor cu alegere multipl Formula pentru corectarea indicelui de dificultate n cazul rezolvrii prin efectul hazardului este urmtoarea:
Dup Laveault, D. i Gregoire J., op. cit., pag. 226. Am efectuat calculele cu ajutorul programului SPSS, care nu mparte la N, ci la N-1
49
AUREL STAN
itemi au aceeai medie i aceeai varian. Pot fi considerai omogeni, cel puin din punct de vedere formal. Scorul X constituie scorul compozit al itemilor 1- 4. Liniile terminale inferioare ale tabelului conin calculele mediilor i varianele scorurilor itemilor i a celui composit. Itemul 5 este reuit de toi subiecii. Scorul compozit (X+5) are, firesc, o medie mai mare cu 1 fa de scorurile compozite X, dar o abatere standard identic cu acestea (4,44). Itemul 6 are aceeai medie i aceeai varian ca fiecare din itemii 1-4. Scorul compozite X+6 este rezultat din adiia scorurilor compozite X i a scorurilor itemului 6. n mod firesc media scorurilor compozite (X+6) este mai mare cu media scorurilor compozite X cu 0,44, dar variana este aproape egal cu valoarea 2,50. Observm clar c variana scorului X este mult superioar sumei varianelor scorurilor de la itemii 1 la 4 (0,278+0,278+0,278+0,278<4,44), De asemenea observm c variana scorurilor (X+6) este mult mai mare dect suma varianei scorurilor(4,44+0,278 < 6,94). Se observ clar faptul c adugarea unui item omogen mrete capacitatea de discriminare a testului. Pentru a evidenia efectul schimbrii structurii rspunsurilor subiecilor la itemi, oferim, n continuare, un nou exemplu. Subieci Item 1 Item 2 Item 3 Item 4 Scor X Item 5 Item 6 X+5 X+6 1 1 0 1 0 2 1 0 3 2 2 0 1 1 0 2 1 0 3 2 3 0 0 1 0 1 1 0 2 1 4 1 0 0 0 1 1 0 2 1 5 0 1 0 1 2 1 1 3 3 6 1 0 1 0 2 1 0 3 2 7 0 1 0 1 1 1 1 2 2 8 1 0 0 1 2 1 1 3 3 9 0 1 0 1 2 1 1 3 3 Media 0,44 0,44 0,44 0,44 1,766 1,000 0,444 2,666 2,111 Variana 0,278 0.278 0,278 0,278 0,250 0,000 0,278 0,250 0,611 Tabelul 8. Cuprinde date ilustrative pentru evidenierea raporturilor dintre variana itemilor i variana rezultatului global al testului Observm la acest tabel o situaie complet schimbat n privina varianei testului, n ciuda faptului c itemii componeni au aceeai medie i aceeai varian. Explicaia acestei stri de fapt o gsim n examenul atent al relaiei care exist ntre itemii constituind testele. Astfel, variana scorurilor compozite X este mult mai mic dect fiecare din varianele itemilor testului (0,250<0,278). n tabelul anterior itemii sunt euai sau reuii simultan. n ultimul tabel informaia furnizat prin itemi este mai contradictorie, deoarece avem un ansamblu: format din itemi cu structuri (cu pattern-uri) eterogene. La un item reuit nu avem o situaie similar la alt item, considernd n ansamblu situaia. La o bun parte din cazuri, cnd un item este reuit, cellalt este euat i invers. La primul test itemii constituie structuri omogene, iar la al doilea test ei constituie structuri eterogene. Pentru a explica oscilaiile de valoare ale varianei totale fa de varianele itemilor vom constitui matricea varian covarian pentru itemi binari. Dac variana este un indicator care se refer la o singur serie de valori, covariana este un indicator care se obine prin prelucrarea a dou serii de valori i exprim cantitatea comun de variaie a acestora. n cazul cnd avem la dispoziie valorile acelorai subieci la itemii i i j, atunci formula covarianei este:
50
Covij = pij pi * pj n care pi este indicele de dificultate a itemului i, pj este indicele de dificultate a itemului j i pij este proporia subiecilor care au rezolvat concomitent itemul i i j. Item i Item j Coinciden de rezolvare concomitent 1 0 1 1 + 0 1 1 1 + 0 0 1 1 + 1 0 1 1 + 0 0 0 1 1 1 + fi = 7 fj = 7 fij = 5 pi = 0,63 pj = 0,63 pij= 0,45 Tabelul 9. Cuprinde ilustrarea etapelor de calcul pentru efectuarea calculului covarianei. Pentru a uura observarea ansamblul combinaiilor de concomitene i neconcomitene ale rezolvrilor corecte se ntocmete n analiza de itemi un aa-numit tabel al celor 4 cmpuri. Pentru cele dou serii de date de mai sus, tabelul celor 4 cmpuri se prezint n felul urmtor. Itemul j Rspuns corect Rspuns incorect a 5 b 2 d 2 c 2 7 4 Total 7 4 11 Nr. crt. 1 2 3 4 5 6 7 8 9 10 11
Item Rspuns corect i Rspuns incorect Total Tabelul 10. Tabelul celor 4 cmpuri.
Respectnd denumirea de tabel al celor 4 cmpuri, redm coninutul acestora: Cmpul a cuprinde numrul subiecilor care au rspuns corect att la itemul i ct i la itemul j (pattern 11); Cmpul b cuprinde numrul subiecilor care au rspuns corect la itemul i i incorect la itemul j (pattern 1-0); Cmpul c cuprinde numrul subiecilor care au rspuns incorect la itemul i i corect la itemul j (pattern 0-1) Cmpul d cuprinde numrul subiecilor care au rspuns incorect att la itemul i,ct i la itemul j (pattern 0 0) nsumarea cmpurilor a i b ne indic numrul subiecilor care au rspuns corect la itemul i; nsumarea cmpurilor c i d ne indic numrul subiecilor care au rspuns incorect la itemul i; nsumarea cmpurilor a i c ne indic numrul subiecilor care au rspuns corect la itemul j; nsumarea cmpurilor b i d ne indic numrul subiecilor care au rspuns incorect la itemul j. Punnd n aplicare formula pentru calcularea covarianei pentru cei doi itemi din tabelul, obinem urmtorul rezultat: Cij = pij pi*pj = 0,45 (0,63*0,63 ) = 0,45 0,40 = 0,05.
51
AUREL STAN
Pentru un chestionar n care rspunsurile sunt da i nu (care pot fi traduse numeric n 1 i 0), douard Friemel i Annick Weil-Barais sugereaz posibilitatea existenei unei structuri de date particulare n cadrul unui tabel, care fac posibile urmtoarele tipuri de relaii ntre rspunsurile la doi itemi60: Relaii de independen, n care toate celulele tabelului sunt completate cu o cifr care confirm existena unui anumit pattern de rspuns. Itemii sunt considerai independeni, n sensul c msoar caracteristici diferite;
Da Nu Itemul j Da Nu X X X X
Itemul i
n acest tabel gsim prezente pattern-urile: Da-Da, Da-Nu, Nu-Da i Nu-Nu, deci toate tipurile posibile. Relaii de echivalen, n situaia n care toi subiecii care rspuns Da la j rspund, de asemenea, Da la i i toi subiecii care rspund Nu la j, rspund Nu i la i.
Da Nu Itemul j Da Nu X 0 0 X
Itemul i
Relaia de echivalen presupune c cei doi itemi msoar acelai lucru Relaii de excludere, n situaia n care toi subiecii care rspund Da la j, rspund Nu la i i toi subiecii care rspund Nu la j rspund Da la i. Existena acestei relaii presupune c exist excludere ntre ceea ce msoar cei doi itemi.
Da Nu Itemul j Da Nu 0 X X 0
Itemul i
Relaii de ordine sau de implicare, n situaia n care subiecii care rspund Da la i rspund Da i la j, dar nu i invers, toate celelalte cazuri fiind posibile.
Da Nu Itemul j Da Nu X 0 X X
Itemul i
n acest caz se prezum o relaie de implicare ntre ceea ce msoar itemii (i implic j, dar nu i invers), deci o relaie de ordine ntre itemi. O variant a unei astfel de relaii este urmtoarea:
Da Nu Itemul j Da Nu X X 0 X
Itemul i
n acest caz, j implic i, dar nu i invers. Pentru a avea un tablou general al tendinelor de variaie a itemilor i a covariaiei acestora este util de a crea matricea varian covarian. Inspectnd aceast matrice ne putem face o impresie
60
n Weil-Barais, A (coordinatrice), Les Mthodes en Psychologie, Bral , Rosny, 1997, pag.200-201.
52
despre omogenitatea sau eterogenitatea structurii itemilor care compun un test. Variana unui test este egal cu suma varianei fiecrui item la care se adaug dublul sumei valorilor fiecrei covariane posibile n ansamblul itemilor componeni. Schema teoretic a matricei varian-covarian este urmtoarea (presupunem un ansamblu de 6 itemi):
ITEMI I T E M I 1 2 3 4 5 6 1 S21 C21 C31 C41 C51 C61 2 C12 S22 C32 C42 C52 C62 3 C13 C23 S23 C43 C53 C63 4 C14 C24 C34 S24 C54 C64 5 C15 C25 C35 C45 S25 C65 6 C16 C26 C36 C46 C56 S26
S2T =
Tabelul 11. Cuprinde exemplificarea modului de formare a varianei rezultatului global al unui test. Pentru cele dou tabele exemplificative pentru utilizarea itemilor omogeni i eterogeni rezult, dup efectuarea calculelor, urmtoarea situaie:
1 I 2 T 3 E 4 M I 5 6 1 0,28 0,28 0,28 0,28 0.00 0,28 2 0,28 0,28 0,28 0,28 0.00 0,28 ITEMI 3 4 0,28 0.28 0,28 0.28 0,28 0.28 0,28 0.28 0.00 0.00 0,28 0.28 5 0.00 0.00 0.00 0.00 0.00 0.00 6 0,28 0.28 0.28 0.28 0.00 0,28 1 I 2 T 3 E 4 M 5 I 6 1 0,25 -0,19 0,03 -0,08 0,00 -0,08 2 -0,19 0,25 -0,08 0,14 0,00 0,14 ITEMI 3 4 0,03 -0,08 -0.08 0,14 0,25 -0,19 -0,19 0,25 0,00 0,00 -0,19 0,25 5 0,00 0,00 0,00 0,00 0,00 0,00 6 -0,08 0,14 -0,19 0,25 0,00 0,25
Tabelul 12. Cuprinde dou exemplificri pentru varianele i covarianele itemilor omogeni(stnga) i eterogeni(dreapta) Observm clar n tabelul din dreapta o serie de valori negative care trag n jos valoarea de ansamblu a varianei, Valorile negativ exprim o lips de consonan a tendinelor de variaie. Cu ct asemenea valori negative se gsesc mai frecvent, cu att variana global a testului va fi mai sczut. Inspectarea matricei varian-covarian ne permite s observm rapid acele zone de itemi care ngusteaz mprtierea valorilor unui test i, implicit, capacitatea sa de discriminare. Tabelul din stnga ofer valori mari ale varianei, fapt cele mai mari, cu excepia itemului deosebit de facil, care prezint un rezultat uniform (doar valori 1). Vom face n continuare cteva consideraii asupra valorilor maximale pe care le pot lua anumii indicatori n cadrul operaiilor efectuate asupra itemilor. Indicatori maximali ai itemului Variana cea mai nalt posibil a unui item se obine atunci cnd media aritmetic (care se confund la itemii care se exprim binar cu indicele de dificultate a itemului) a punctajului itemului este 0,5. Deci valoarea maximal pe care o poate lua variana este 0,25, situaie n care jumtate din subieci au obinut nota 1 i jumtate nota 0. Valoarea lui p variaz n funcie de calitatea subiecilor existent ntr-un anumit eantion. Expunem 7 cazuri posibile de evoluie a valorilor varianei n funcie de valorile p i q.
Situaia Valoare pi Valoare qi Variana pi*qi a 0,00 1,00 0,00 b 0,20 0,80 0,16 c 0,40 0,60 0,24 d 0,50 0,50 0,25 e 0,60 0,40 0,24 f 0,80 0,20 0,16 g 1,00 0,00 0,00
Tabelul 13. Cuprinde exemplificarea diferenierii valorilor varianei n funcie de diferite valori ale coeficientului de dificultate.
53
AUREL STAN
Se observ clar c punctul maxim al varianei se produce atunci cnd pi atinge 0,5, dup care variana ncepe s scad. Exprimm grafic aceast situaie
0,3 0,25 0,2 0,15 0,1 0,05 0 a b c d e f g
Figura 2. Reprezentare grafic pentru diferite valori ale varianei itemilor. Covariana maximal rezult din formula anunat anterior a covarianei pentru dou iruri de valori binare. Mrimea covarianei depinde de cota parte a subiecilor care au rezolvat corect concomitent ambii itemi. Cota parte de subieci cu dou rezolvri corecte concomitente nu poate s fie mai mare dect cota parte a rezolvrilor corecte la itemul cu cea mai mic valoare a lui p din ambii itemi. De aceea, formula poate fi transpus n felul urmtor: Cmax = pj pipj, la care pjpi. Deci covarian maximal este dat de cota parte a subiecilor care au rezolvat corect itemul greu, i care micoreaz produsul valorilor celor 2 itemi. Dac, de exemplu, vom avea itemi cu dificultile 0,8 i 0,5, rezultatul maximal va fi 0,10. Deci covariana maximal ntre doi itemi poate fi exprimat i n felul urmtor: Cmax pjqi n consecin, covariana maximal este produsul cotelor parte a acelor subieci care au rezolvat corect cel mai greu item i fals pe cel mai slab. Cnd ambele cote pri sunt egale, rezult urmtoarea formul pentru covariana maximal: Cmax = pq. Se observ c valoarea maxim a covarianei este egal varianei maximale a punctajelor itemilor. Gradul relaiei ntre dou serii de itemi sau indicele de corelaie ntre doi itemi poate fi exprimat prin intermediul aa-numitului coeficient , care poate fi exprimat prin intermediul formulei: pij pi * p j = . Toi termenii formulei sunt cunoscui din explicaiile anterioare pentru p i pi2 * p j p 2 j itemii care prezint valori binare, 0 i 1. O formul similar pentru calcularea coeficientului de corelaie pij pi * p j pentru doi itemi care posed valori binare este: urmtoarea = . De asemenea pi * qi * p j * q j termenii au fost explicai anterior61.
61Formulele
sunt preluate din Paul Horst,op.cit.pag.112
54
Matricile de corelaii sunt necesare n cazul unor analize care urmresc stabilirea gradului de satisfacere a unor criterii de apreciere pentru anumii itemi sau pentru ansamblul lor. Exemplificm calculul unei corelaii pe datele folosite pentru exemplificarea calcului covarianei:
Nr. crt. 1 2 3 4 5 6 7 8 9 10 11 Item i 1 1 0 1 0 1 1 1 0 0 1 fi = 7 pi = 0,63 Item j 0 1 1 1 0 1 0 1 0 1 1 fj = 7 pj = 0,63 Coinciden de rezolvare concomitent + + + + + fij = 5 pij= 0,45
Tabelul 14. Cuprinde date ilustrative pentru calculul corelaiei dintre valorile a doi itemi 0,45 0,63 * 0,63 0,45 0,40 0,05 Astfel, = = = = 0,21 0,23 * 0,23 0,23 0,63 0,63 2 * 0,63 0,63 2 Datele organizate ntr-o matrice a lui Stern se pot transforma prin prelucrrile matematice corespunztoare ntr-o matrice de corelaii. Exemplificm prin urmtoarea matrice cu date binare, 6 itemi i 11 subieci62. Ca i n cazul seriilor de date continue sau discret polihotomice, coeficientul de corelaie a unei serii de date binare poate lua valori pozitive, nule i negative, avnd aceeai semnificaie. n exemplul dat nu au rezultat indici negativi de corelaie datorit particularitii de structurare a datelor. Coeficientul de corelaie joac un mare rol n psihometrie. Coeficientul de corelaie prin momentul produselor a lui Karl Pearson poate s ia cea mai mate valoare 1,00 i cea mai mic valoare 1,00. Aceste granie sunt atinse n cazuri speciale. La punctajele testelor care se compun din valori de msur binare, coeficientul de corelaie prin momentul produselor este n general mai mare dect 1,00 i mai mic dect 1,00. Coeficienii sunt funcii ale valorilor maxime care pot s le primeasc varianele i covarianele itemilor.
Subieci 1 2 3 4 5 6 7 8 9 10 11 1 1 0 0 1 1 1 0 1 0 1 0 2 1 1 0 1 1 0 1 1 0 1 1 ITEMI 3 4 1 1 0 0 0 1 0 0 0 1 1 1 1 1 1 1 0 1 1 0 0 1 5 0 0 1 1 1 0 0 0 0 1 0 6 0 1 0 1 0 1 0 1 1 0 0
1 I 2 T 3 E 4 M 5 I 6
1 1,00 0,44 0,15 0,66 0,35 0,77
2 0,44 1,00 0,66 0,26 0,91 0,44
3 0,15 0,66 1,00 0,66 0,35 0,77
ITEMI 4 0,66 0,26 0,66 1,00 0,24 0,44
5 0,35 0,91 0,35 0,24 1,00 0,35
6 0,77 0,44 0,77 0,44 0,35 1,00
Tabelul 15. Cuprinde date ilustrative pentru matricea de corelaii interitemi

62
Aceast matrice are date fictive i prezint doar o raiune exemplificativ.
55
AUREL STAN
Toate procedeele de corelare prezentate pn n prezent sunt variante ale r-ului lui Karl Pearson. n 1968 F.M. Lord i M.R, Nowick au demonstrat c un coeficient biserial obinut este cu 20% superior coeficientului de corelaie punct biserial. Urmtoarea ecuaie permite de a transforma o corelaie punct biserial n corelaie biserial:
pq * rpbis Y n cazul valorilor extreme ale lui p sau q, David Magnusson a demonstrat c o corelaie biserial poate fi pn la 4 ori superioar corelaiei punct biseriale, din cauza faptului c variana itemului poate afecta n mare msur valoarea maxim pe care o poate lua corelaia punct biserial, care este echivalentul algebric al r-ului lui Pearson. Din acest motiv este important, atunci cnd folosim un program de calcul computerizat, conceput pentru a calcula indicele de discriminare, s tim ce tip de corelaie este folosit pentru a calcula corelaia dintre rezultatul itemului i rezultatul total al testului. Pentru aprecierea calitilor itemilor se efectueaz corelaii ntre acetia i rezultatul global al testului sau, n cadrul operaiunii de validare, ntre itemi i rezultatelor unor criterii. Formulele pentru efectuarea corelaiilor se disting n funcie de faptul dac seria binare este dihotomic sau dihotomizat. Seria binar este considerat dihotomic n situaia n care mprirea n 0 i 1 este natural, de exemplu rspuns corect-rspuns incorect, i dihotomizat cnd ea traduce o situaie n care valorile sunt acordate prin convenie, situaie ntlnit prin traducerea binar a unor date biografice (exemplu cstorit necstorit, provenien din mediul urban provenien din mediul rural). n primul caz vorbim de o corelaie punct biserial i n al doilea caz de o corelaie biserial. Redm n continuare dou formule de calcul pentru corelaia punct biserial. Indicele de corelaie punct-biseriale se noteaz rpbis
rbis =
rpbis =
X p Xq sT
* p * q i rpbis =
X p XT sT
p , n care q
X p este media acelor valori ale rezultatului total al testului care au corespondent n seria
binar a rezultatelor itemilor valoarea 1; X q este media acelor valori ale rezultatului total care au corespondent n seria binar a
rezultatelor itemilor valoarea 0; X T este media ntregii serii de rezultate totale; ST este abaterea standard a seriei de rezultate totale; p i q sunt cunoscui din consideraiile anterioare, p fiind indicele de dificultate al seriei de date binare, iar q = 1- p X p XT p Coeficientul de corelaie biserial are urmtoarea formul: rbis = * , formul n ST care singura necunoscut este litera greceasc , care reprezint nlimea curbei normale n punctul y corespunznd unei densiti de probabilitate egal cu p. Oferim, n continuare, un exemplu:
56
TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC Nr.crt. 1 2 3 4 5 6 7 8 9 10 11 p q P*q Item 1 0 1 1 0 0 1 0 1 0 1 6 0,54 0,46 0,248 . . Rezultate total (X) 37 29 33 42 27 37 32 25 39 32 45 378 Xp 37 33 42 32 39 45 228 Xq 29 27 37 25 32 150
X T = 34,36
ST = 6,24 2 S T =38,93; ST = 6,24
X p = 38
X q = 30
Tabelul 16. Cuprinde date ilustrative pentru realizarea corelaiei dintre rezultatul unui item binar i rezultatul global al unui test n ultimele linii ale tabelului sunt trecute datele necesare calculrii formulelor corelaiilor. Valoarea pentru un p = 0,54 este egal cu 0,3958. Aplicnd prima formul pentru coeficientul de corelaie punct biserial, obinem: 38 30 8 rpbis = * 0,54 * 0,46 = * 0,2484 = 1,26 * 0,5 = 0,63 6,24 6,24 Aplicnd a doua formul pentru calcularea coeficientului de corelaie punct biserial, obinem
rpbis =
38 34,36 0,54 3,64 * = * 1,17 = 0,58 * 1,08 = 0,627 . Observm c prin cele dou 6,24 0,46 6,24
formule se obin practic rezultate identice (jocul aproximrilor face s existe o diferen de 0,003 ntre cele dou rezultate). Aplicnd la aceleai date formula pentru variabile dihotomizate obinem:
rbis =
38 34,36 0,54 3,64 * = * 1,36 = 0,58 * 1,16 = 0,672 . Observm la aplicarea acestei 6,24 0,3958 6,24
formule o uoar diferen. Analiza capacitii de discriminare a unui item. Am amintit faptul c variana este un indicator grosier al capacitii de discriminare a unui item. Aceast capacitate devine important atunci cnd dorim s difereniem ntre scorurile subiecilor. Din acest punct de vedere, un item apreciat este acela care va fi rezolvat de o mare proporie din subiecii care au obinut un scor ridicat la test n ansamblu, i nu de subiecii care au obinut un scor slab la rezultatul de ansamblu al testului. De asemenea, un astfel de item va prezenta o corelaie ridicat cu scorul de ansamblu al testului. Anterior am prezentat modul de realizare a corelaiei biseriale i a celei punct-biseriale, cu ajutorul crora se poate stabili puterea discriminatorie a unui test, urmnd logica corelaiilor, n general. La testele cu care dorim s efectum o msurare criterial, cerina de discriminare nu figureaz pe prim plan. Are importan dac depim sau nu valoarea-prag a unui criteriu stabilit anterior procesului de msurare propriu-zis. Se utilizeaz cu prioritate n evaluarea formativ. Un indice cunoscut de discriminare i frecvent folosit n practic psihometric este indicele de discriminare D, pus n circulaie de W.G. Findley n anul 1956, care realizeaz practic diferena dintre
57
AUREL STAN
indicele de dificultate a unui item pentru grupa de subieci considerat puternic dup rezultatele globale ale testului (notare p+) i indicele de dificultate pentru grupa considerat slab(notare p-). Indicele D poate lua orice valoare ntre 1 i + 1. Valoarea 0 semnific faptul c un item poate fi rezolvat la fel de bine de ctre un subiect care are un scor total ridicat i de ctre un subiect care are un scor total sczut. O valoare negativ semnific faptul c un item a fost reuit de o proporie mai mare de subieci care au un scor total slab la ansamblul testului Astfel de valori ridic semne de ntrebare asupra oportunitii utilizrii unui anumit item. ntr-un studiu din anul 1939 asupra seleciei grupurilor slabe i puternice n operaiunea de elecie a itemilor, T.L. Kelley consider c grupul puternic este format din acei subieci care au obinut un scor total care-i plaseaz valoric n primii 27% din subieci, iar grupul slab din subiecii care a obinut cele mai slabe 27% din ansamblul rezultatelor globale de la test.63 S presupunem c la examinarea a 30 de subieci rezultatele care aparin grupului puternic cuprind 8 subieci (uoar aproximare a procentului primilor 27% din subieci) i cele care aparin grupului slab, de asemenea, 8 subieci. Oferim un exemplu fictiv, cu rezultatele totale ale testului i rezultatul unui anumit item pentru primii i ultimii 8 subieci. 1+1+1+1+1+ 0 +1+ 0 6 0 +1+ 0 +1+ 0 + 0 + 0 + 0 p+ = = = 0,75 p = = 0,25 8 8 8
Nr.crt. 1 2 3 4 5 6 7 8 23 24 25 26 27 28 29 30 Rezultat test 65 59 57 55 53 50 49 47 24 23 21 20 19 17 16 14 Rezultat item 1 1 1 1 1 0 1 0 .. 0 1 0 1 0 0 0 0
Tabelul 17. Cuprinde date ilustrative pentru calcularea indicelui de discriminare D=0,75-0,25=0,50. R.L. Ebel a propus n 1965 o scal de repere pentru interpretarea valoric a indicelui de discriminare E: Interpretarea discriminrii Interval valoric al indicelui D 0,40 i mai mult discriminare foarte bun De la 0,30 la 0,39 discriminare bun De la 0,20 la 0,29 discriminare slab De la 0,10 la 0,19 discriminare limit Sub 0,10 fr utilitate Rezultatul obinut la exemplul nostru fictiv este foarte bun din punctul de vedere al reperelor propuse de Ebel.
proporia de 27% este stabilit ntr-un articol a lui T.L. Kelley din 1939, publicat n "Journal Of Educational Psychology" intitulat "Selection of upper and lower groups for the validation of test items".
63
58
III. CONSTRUCIA TESTULUI PSIHOLOGIC
III.1. CONSIDERAII PRELIMINARE n momentul n care un specialist i propune s construiasc un test psihologic acesta trebuie s aib, cu siguran, o motivaie care poate fi de ordin pragmatic sau de natur tiinific. Motivaia pragmatic decurge din nevoia folosirii unui instrument adecvat pentru detectarea unei caracteristici folositoare bunei ndepliniri a unei activiti, iar cea tiinific din nevoia gsirii unui instrument sensibil pentru punerea n eviden a diferenierii unei trsturi pe care autorul testului i propune s o studieze difereniat. Crearea testului psihologic impune s se urmeze ndeaproape scopul propus i, ca atare, constructorul testului trebuie s realizeze dac exigenele sale sunt satisfcute, iar n cazul cnd acest lucru nu se ntmpl, se impune operarea de schimbri n concepie i n planul experimental pentru a corecta deficienele sesizate. Paul Kline, un reputat specialist n domeniu susine ideea dup care construcia unui test psihologic presupune caliti care aparin att omului de tiin (exact, metodic) ct i artistului (dezinvolt, fantezist). Psihologul care i propune s construiasc un test nu este satisfcut de exemplarele care exist pn n momentul deciziei de a ntreprinde construcia unui nou instrument sau cele existente nu-i sunt accesibile datorit preului. Preurile unor teste oferite de firmele constructoare afirmate sunt uneori inaccesibile. O parte din marile corporaii care ntrein servicii psihologice cu personal de specialitate bine pregtit i construiesc propriile probe psihologice pentru folosin exclusiv (dup cum afirm Paul Horst, care a fost amintit anterior n lucrarea noastr). Profesionistul care i propune s construiasc un test psihologic trebuie s aib serioase disponibiliti n materie de practic experimental, deoarece lansarea n folosire a unei probe psihologice presupune examinarea unui mare numr de subieci i prelucrarea corespunztoare a datelor. n rile n care asociaiile profesioniste sunt puternice, exigenele fa de calitile unui test psihologic sunt deosebit de mari. Este cazul Asociaiei Psihologilor Americani (APA) care posed norme severe de acceptare a produselor metodologice, norme care sunt reevaluate periodic. Sub numele de teste psihologice se produc i o serie de creaii care satisfac nevoile consumului popular de divertisment (sub form de problematizri uoare) i care au un deosebit succes de pia64.
O serie de hibrizi ntre profesionism i amatorism a aprut i n ara noastr, dintre care amintim:Horst H, Siewert Cum s ne calculm coeficientul de inteligen, Gemma Press, Bucureti, 1998; dr. Gerti Senger, dr. Walter Hofmann Cum s ne calculm coeficientul de personalitate, Gemma Press, Bucureti, 1998; Philip Carter & Ken Russel Teste de inteligen, Aldo Press, Bucureti, 1998; Hans Jurgen Eysenck Teste de inteligen, Editura Queen, Bucureti, 1998.
64
59
AUREL STAN
Un procedeu mai practic de a lansa un nou test psihologic este acela de a modifica semnificativ sau a recombina creaiile deja existente. David Wechsler l-a practicat cu deosebit succes, dar a avut acceptul autorilor testelor (teste ale cror componente au fost combinate ntr-un mod foarte inteligent). n acest caz, este important proporia modificrii, deoarece, n majoritatea rilor din civilizaiile de tip occidental, protejarea dreptului de autor opereaz cu deosebit severitate. Construcia unui test psihologic cunoate o serie de etape care difer neesenial de la autor la autor. Dany Laveault i Jacques Gregoire disting 5 etape: 1. Determinarea utilizrilor prevzute de test. 2. Definiia a ceea ce se dorete a msura. 3. Crearea itemilor. 4. Evaluarea itemilor. 5. Determinarea proprietilor metrice ale testului definit. 65 Robert Gregory stabilete urmtoarele etape: definirea testului; stabilirea unei metode de scalare; construcia itemilor; testarea itemilor; revizia testului; publicarea testului66. A.F. Vukovici consider c, n cazul construciei testului, trebuiesc realizate o serie de prescripii de procedur referitoare la: populaia examinailor; materialul testului care trebuie s stimuleze examinatul spre un comportament specific; stabilirea indicaiilor testului prin care este expus problema cercetat sau este invitat subiectul la o anumit interaciune cu materialul testului; stabilirea diverselor condiii prin care sunt oferite instrucia i materialul testului; delimitarea comportamentelor ca re sunt considerate relevant diagnostice; stabilirea unor reguli de ordonare i scheme de clasificare n care diferitele moduri de comportament semnificative sunt mprite n categorii; calcularea frecvenelor claselor de valori brute; sistemul de norme i referine care servete interpretrii i comparrii valorilor brute67.
65 vezi Laveault, Dany-Gregoire, Jacques, Introductions aux theories des tests en sciences humaine, De Boeck&Larcier, Departament de Boech Universite, Paris, Bruxelles, 1997, pag 79-85. 66 vezi Gregory, Robert J., Psychological Testing, Allyn and Bacon, Boston, London, Toronto, Sydney, Tokyo, Singapore, 1996, pag. 129. 67 vezi Vukovich A. F., Die Konstruktion psychologischer Testen, n Psychologischee Diagnostik (hrsg R. Heiss), Verlag fur Psychologie Dr. C Hogrefe, Gottingen, 1964.
60
Paul Kline indic dou metode de abordare a construciei testelor: metoda bazat pe analiza itemilor sau metoda bazat pe analiza factorial; demersul empiric, care a fost pus la punct de creatorii testului clinic MMPI. n primul caz, se folosesc intens analize statistice care au drept scop crearea unui test unidimensional, ce i propune de a msura o dimensiune sau un factor. Dup punerea la punct a ansamblului de itemi, este permanent necesar demonstrarea validitii. Aceast prim manier de abordare a construciei testului are urmtoarele subetape: stabilirea numrului de itemi; stabilirea eantioanelor de ncercare; efectuarea testului de ctre subieci; analiza itemilor; selecia itemilor dup o prim analiz de itemi; rescrierea i validarea itemilor. A doua manier de abordare presupune depirea a dou probleme cruciale: compoziia grupului criteriu i stabilirea semnificaiei scalelor care sunt construite plecnd de la aceste criterii. J. J. Bernier i B. Petrulowicz stabilesc o cale de 8 etape, pe care o considerm un demers clar: specificarea scopului; expresia acestui scop n termeni discursivi; precizarea coninuturilor (care se subdivide n a) descrierea coninuturilor i a abilitilor; b) definirea unei trsturi i c) analiza muncii i definirea componentelor trsturii i a criteriilor) ; redactarea itemilor; punerea la ncercare a itemilor i analiza pretestului (discriminarea i dificultatea, pertinena altor posibiliti); compunerea formei finale a testului; standardizarea (administrare, limite de timp, moduri de corecie); analiza tehnic a testului (precizie validitate, norme)68. Dup aceast trecere n revist a unor etape n construcia testului ne permitem s facem cteva remarci, sperm judicioase: nu toi autorii stabilesc o ordine n etape a construciei testului (exemplu Lienert, Guthke, Magnusson, dar acestea sunt implicite). Etapele, odat fixate, au ceva din aerul rigid al unei construcii scolastice; construcia unui test nu este niciodat ncheiat. Elaborrile reputate din istoria testului psihologic au suferit repetate revizii, ncepnd cu scalele Binet Simon i Terman Merril. McKinley i Hathaway atrag atenia n manualul de prezentare MMPI c proba lor nu este terminat i c gruparea n scale poate continua dup alte criterii69. Probele lui David Wechsler a avut o elaborare de durat i multiple revizuiri. La fel s-a ntmplat cu 16 PF-ul lui R.B. Cattell. Matricele progresive Raven cunosc mbuntiri n scopul onorrii destinaiei psihodiagnostice; anumite etape ale construciei testului devin preocupri autonome. Exemplu: analiza de itemi (i chiar n cadrul acesteia analiza distractorilor). ntr-o lucrare de referin din domeniul psihometriei se afirm c o teorie a distractorilor rmne de construit70.
Bernier, J.J.; Pietrulewicz, B., La psychometrie Gaetan Morin Editeur, Montreal, Paris, Casablanca, 1997, pag.235. vezi MMPI Saarbrucken (bearbeitet von dr. phil o Spreen) , Verlag Hans Huber, Bern und Stuttgart, 1963. 70 vezi Dickes, Paul, Tournois, Jocelyne , Flieller, Andre, Kop, Jean-Luc, La psychometrie. Thorie et methode de la mesure, PUF, 1994, pag. 89.
68 69
61
AUREL STAN
Dintre aspectele care condiioneaz construcia unui bun test ne vom opri la concepia care st baza construciei testului, condiiile unui bun item i la eantioanele pe care se verific testul.
III.2. TEORIA CARE ST LA BAZA CONSTRUCIEI TESTULUI PSIHOLOGIC La baza construciei oricrui test psihologic se afl o teorie a personalitii sau o teorie despre natura caracteristicii investigate. Referindu-se la principiile metodologice dup care s-ar ordona metodele de evaluare n psihologie, Gordon Allport consider c n prim plan se afl teoriile care stau la baza unui instrument (dac deriv din psihanaliz, asociaionism, analiz factorial, psihologia genetic, behaviorism)71. Teoria care st la baza construciei unui test este implicit sau explicit. n unele cazuri, teoria are componente provenind din mai multe curente psihologice. Zena Helman, profesor de psihopatologie la Universitatea Lille III spune n aceast privin: Psihodiagnostik-ul pe care Rorschach l public n anul 1910 se gsete la o rspntie de drumuri. Acest volum dens i foarte bogat, dar n mare parte empiric-dup cum o recunoate chiar autorul-poart pecetea mai multor curente: psihologia asociaionist motenit din secolul al XIX-lea, psihanaliza care apruse prin opera lui Freud de circa un sfert de secol i psihopatologia structural care i are nceputul n acea epoc72. ntr-o parte din cazuri prii teoretice i se consacr un spaiu foarte restrns, dar n alta spaiul teoriei cuprinde lucrri n mai multe volume. Ne referim la baza teoretic a testelor proiective Rorschach, Luscher, Szondi. Der 4 Farben Mensch oder Weg zum Gleichgewicht a lui Max Luscher cuprinde n sute de pagini lungi excursuri despre specificul uman i echilibrul su intern, psihologia i filozofia celor 4 culori, normele etice fundamentale, tacticile de aprare contra agresivitii cromatice. Manualul testului Rorschach, prezentat de ctre M. Loosli-Usteri conine proceduri asemntoare (de dimensiuni mai reduse) despre studiul teoretic al interpretrilor culoare, studiul teoretic al interpretrilor clar-obscur, analiza interpretrii formelor umane i animale, etc. Testul proiectiv creat de Leopold Szondi (una din cele mai enigmatice figuri din istoria psihodiagnosticului) impresioneaz prin discrepana dintre teoria sa genetic a alelelor recesive, depit actualmente de evoluia tiinei biologice, i puzderia de formule pulsionale rezultnd din aceasta73. n general, o teorie este un corp sistematizat de aseriuni n legtur cu un domeniu al realitii, care rmne deschis confirmrii sau punerii n discuie. O ntreag sistematic opereaz n studiul teoriilor tiinifice. Karl Popper, n lucrarea amintit de noi anterior, susine c orice teorie este falsificabil, adic poate fi infirmat de evoluia investigaiilor tiinifice. Ca atare, teoria tiinific nu are statutul unui adevr tiinific definitiv. Prin celebra sa teorie a paradigmelor, Thomas Kuhn precizeaz foarte clar durata de via a teoriilor tiinifice n cadrul comunitii specialitilor dintr-un domeniu. Asimilarea de durat a termenilor unei teorii poate duna evoluiei tiinifice prin subordonarea metodei
vezi Allport, Gordon W., Structura i dezvoltarea personalitii, Editura didactic i Pedagogic, 1991, pag. 395. vezi Zena Helman,nnoirea Rorschach-ului i aportul su la psihopatologie din perspectiva curentului fenomenostructural, n Analele tiinifice ale Universitii Al. I. Cuza din Iai (serie nou) - Psihologie-tiinele Educaiei, Tom IV-V, 1995-1996, pag. 113. 73 vezi Legrand, Michel, Leopold Szondi, son test, sa doctrine, Pierre Mardaga, Editeur, Bruxelles, 1979.
71 72
62
de cercetare poziiei teoretice. Francoise Parot i Marc Richelle se exprim foarte plastic n aceast privin: Cnd omul de tiin i proclam supunerea n faa faptelor, el nu poate ignora c le privete, le nelege, le caut prin formulri teoretice ca printr-o lentil uor colorat care, chiar prin proprietile sale decupeaz i coloreaz realitatea ntr-un anumit mod74. Despre implicaiile categorizrii s-au scris lucrri care constituie subiect de interes pentru specialitii n metateorii. O teorie poate fi meninut artificial prin operarea cu anumite trucuri metodologice, dintre care amintim selectarea doar a faptelor care o confirm, ntreruperea cercetrii n momentul n care rezultatele sunt favorabile teoriei, etc. Investigarea prin intermediul testului psihologic nu permite examinarea unor concepte pure, ci doar a unor modele ale acestora. O excelent prezentare a modelelor psihologice de descriere a activitii aparine unui grup de autori francezi, format din Claude Bonnet, Christiane Kekenbosch, Anh Nguyen Xuan, J.F. Richard i Charles Tijus75. Conform concepiei lor modelele n discuie au cinci caracteristici majore: Un model este o particularizare a unei teorii de funcionare cognitiv. El se ataeaz unei teorii, dar se aplic la un tip de situaie particular i face ipoteze suplimentare n raport cu teoria a crui prelungire este. Un model este o formalizare i, ca atare, se exprim ntr-un limbaj formalizat. Acest gen de limbaj este fr ambiguitate i permite calcule, adic deducii automate. O bun perioad de timp limbajul logic i matematic erau singurele care permiteau calcule. ns informatica a permis dezvoltarea altor limbaje formalizate care fac posibile, pe lng calcule numerice, i calcule simbolice, adic deducii care se poart asupra cunotinelor i a semnificaiilor. Un model este schematic, adic este o simplificare a realitii care nu reine dect aspectele eseniale (acestea sunt aspectele care, n principiu, sunt suficiente pentru a prezice un comportament). Caracterul schematic este i o caracteristic a teoriilor, deci att modelele ct i teoriile revendic ideea dup care aceste simplificri conserv trsturile eseniale ale realitii prin raport la tipul de comportament pe care l explic. Un model furnizeaz predicii validabile prin date experimentale, deci el trebuie s reziste la o serie de provocri ale realitii. Un model psihologic conine o descriere a situaiei la care el se aplic (care nu reine dect un anumit numr de elemente pertinente). Modelele conin o descriere a mecanismelor de tratament informaional pentru acele tipuri de situaii prin care se poate deduce prin proceduri de calcul automatic (datorit faptului c descrierea este realizat printr-un limbaj formalizat) comportamentul pe care-l va avea un subiect care se comport precum modelul. Un astfel de procedeu de tratament informaional se numete simularea comportamentului. Investigarea prin intermediul unui model se realizeaz n proporii variabile. n multe cazuri, att modelele ct i teoriile sunt implicite i autorul testului nu insist prea mult asupra prii de fundamentare teoretic a instrumentului su. Tipul de solicitare pe care l presupune sarcina psihologic trebuie s fie exprimat n forme concrete, care s realizeze exigena teoretic. Practic, orice test aflat n construcie trebuie s verifice o ipotez. Pentru a pune o ipotez la
74 75
vezi Parot, Francoise, Richelle, Marc, Introducere n psihologie. Istorie i metod, Humanitas, 1995, pag. 195. Studiul se intituleaz Mesure et modelisation i este o component a volumului Cours de Psychologie (sous la direction de R. Ghiglione et J. F. Richard, Dunod, Paris, 1995, pag. 268-384.
63
AUREL STAN
proba faptelor este necesar s traducem noiunile prin operaii de msur sau observaii care le vor da un coninut empiric. Dac o experien face s intervin viteza de tratament a informaiei de ctre subieci, trebuie aleas o operaie permind a obine o msur a acestei viteze. ns, exist mai multe operaii, deja utilizate de diferii cercettori, pentru a efectua o msur. Aceste procedee diferite furnizeaz msuri n corelaii relativ slabe. Mijlocul de a defini care este cel mai bun, nu este evident. Pentru a avea certitudine trebuiesc sa fie toate comparate cu o msur adevrat a vitezei de tratament a informaiilor (n cazul cnd tim o msur adevrat nu trebuie s ne punem problema care este cel mai bun procedeu). n fapt, alegerea unei operaii se face n fiecare cercetare sub efectul ipotezelor, care sunt rar explicite. Se poate ajunge n situaia n care alegerea procedeelor diferite pentru a operaionaliza aceeai noiune s suscite diferene n rezultatele obinute prin cercettori diferii. Maurice Reauchlin ofer exemple foarte interesante pentru operaia realizrii diferite a unei aceleai noiuni76. Realizrile aparin mai multor cercettori care au studiat sarcinile n care viteza cu care subiectul trateaz informaia care i este furnizat intervine n rezultat. Procedeele poart numele autorilor lor. Paradigma lui T. Nethlebeck (timpul de inspecie): Dou linii verticale de lungimi puin diferite sunt prezentate subiectului ntr-un timp foarte scurt. El trebuie s semnaleze dac cea mai scurt se situeaz n dreapta sau n stnga. Se determin durata prezentrii care este necesar subiectului pentru ca el s furnizeze un procentaj de rspunsuri exacte (de exemplu, 95%). Paradigma lui W. Hick (a timpului de decizie): Subiectul trebuie s sting lumina chiar din momentul n care ea se aprinde, apsnd un buton. Becul care se aprinde poate fi singura surs de lumin care i este prezentat sau aceasta trebuie aleas la ntmplare de ctre experimentator (sau printr-un program care piloteaz experiena) ntr-o serie de 2, 4 sau 8 surse susceptibile de a se aprinde. Incertitudinea subiectului se mrete odat cu creterea numrului de surse luminoase. Timpul de reacie crete liniar n funcie de aceast msur de incertitudine. Panta dreptei care reprezint aceast cretere este un parametru reinut. Paradigma lui S. Sternberg (viteza de explorare a memoriei de scurt termen): Subiectul observ n timpul mai multor secunde o serie de cifre de la 2 la 7. Apoi seria dispare i o cifr este prezentat. Subiectul trebuie s semnalizeze cel mai rapid posibil, apsnd pe unul din cele dou butoane aflate la dispoziia sa, dac cifra figureaz sau nu n seria aprut. Parametrii reinui sunt ordonata la origine i panta dreptei reprezentnd creterea timpului n funcie de numrul de cifre n serie. Paradigma lui M. Posner (viteza de acces la memoria de lung termen). Se prezint subiectului cupluri de litere precum AA, Aa, Ab. Timpul de reacie este mai nti msurat cnd se cere subiectului de a semnala dup prezentarea fiecrei perechi dac cele dou litere sunt fizic diferite sau nu. Acest timp de reacie este mai lung dac subiectului i se cere apoi de a semnala dac cele dou litere sunt semantic diferite sau nu. Diferena dintre cei doi timpi este luat ca norm a timpului de acces la memoria de lung termen care intervine pentru a constata dac A i a sunt dou litere semantice identice, pe cnd el nu are de intervenit n constatarea unei identiti fizice (ntr-un cuplu AA, de exemplu).
76
vezi Reuchlin, Maurice Introduction a la recherche en psychologie, Nathan, Paris, 1992, pag. 33-34.
64
Viteza de tratament a informaiei pare s intervin n rezultatul celor 4 probe. Dar ea intervine concurent cu ali factori variind de la o sarcin la alta. Autorul poate s continue de a defini n cercetarea sa viteza de tratament a informaiei printr-una din aceste paradigme. III.3. FORMULAREA UNUI BUN ITEM n privina formulrii unui bun item, considerm important de a aminti c nu orice test se compune din itemi, n unele cazuri aflndu-ne n situaia unui continuum solicitativ (cum este cazul probelor pentru examinarea asocierii i disocierii manuale-DM, sinusoida Bonnardel). Itemul, n calitate de component informaional bazal, se ntlnete la chestionarele de personalitate, la teste de cunotine colare, testele verbale i nonverbale de inteligen. Exigenele n privina formulrii itemilor se afl n continu cretere, tot aa sunt i eforturile de cercetare privind selectarea unui bun item, specificul informaional al fiecrui tip de item, determinarea numrului optim de itemi care compun un test. Transferul preocuprilor tiinifice ctre aceti atomi ai testului se pare c este o mutaie deosebit de benefic pentru construirea unui instrument de msura progresiv adecvat domeniului psihodiagnosticului. Aceast analiz n amnunt a testului, pornind de la iruri de 0 i 1, aduce un spor informaional considerabil i de o mare diversificare. Pentru chestionarele de personalitate se recomand respectarea unor exigene formale de formulare a itemilor, pe lng cele de coninut77: evitarea folosirii unor termeni care sunt vdit social dezirabili sau indezirabili. Mai ales n cadrul unor examene de evaluare, se vor da acele rspunsuri care vor fi considerate apreciate de examinator; se impune, ca la o parte din itemi, sa se rspund cu da i la alt parte cu nu (rspunsul valorizat de chestionar), pentru a evita aa-numitul efect de aprobare; se impune, de asemenea, a redacta ct mai simplu posibil itemii care trimit mai curnd la comportamente, dect la sentimente sau la emoii; evitarea referinelor la frecvent, de obicei, adesea; fiecare item nu trebuie s conin dect un element de apreciat (nu se pot admite formulri de genul: mi place la fel de mult literatura i istoria); parte din autori nu recomand rspunsuri ntre da i nu, deoarece aceasta ar atrage indecizia. Considerm c doar ntr-o mic parte din ntrebrile unui chestionar de personalitate se poate rspunde prin da i nu, adevrat sau fals. Se poate, de asemenea, afirma c nu exist o form perfect de exprimare la item care s satisfac absolut toi constructorii de teste. Nu se poate afirma nici existena unei mrimi standard a testului, legat de numrul de itemi. Dac un criteriu de economicitate este presant, va trebui redus numrul itemilor, dar nu dincolo de limita unor valori minimale asiguratorii pentru criteriile de apreciere ale testului. Un numr mare de itemi cer testele care au ca exigen o mare fidelitate. Din literatura de specialitate parcurs, doar Paul Kline face referire la numrul minim de itemi pe care trebuie s-i conin un test, i anume minimum 10 itemi. Considerm cifra exagerat de mic, gndindu-ne la foarte slaba putere de discriminare a unei probe cu o amplitudine mic a distribuiei. n faza preliminar de construcie a testului se recomand, de ctre majoritatea autorilor de specialitate, ca
77
vezi Kline, P., La construction des tests, n Beech, John R., Harding, Leonora, Tests, mode d'emploi. Guide de psychometrie, ECPA, Paris, 1995, pag. 122-123.
65
AUREL STAN
numrul de itemi s fie mrit cu 15-30% n comparaie cu numrul proiectat pentru varianta final. Partea neartistic de construcie a testului, cea psihometric, va avea n vedere stabilirea unor indicatori i a unor corelaii: indice de dificultate, indice de segregare, de validitate, de fidelitate i corelaia itemului cu rezultatul total prin intermediul analizei punct biseriale (ilustrat de noi ntr-un capitol anterior). Specialistul care concepe un test psihologic este obligat de a proceda n funcie de accentul pus pe validitatea de coninut sau validitatea predictiv. n cazul cnd se decide pentru validitatea de coninut va proceda la un eantionaj de coninut n domeniul de interes. Seria procedural cuprinde calculul corelaiei punct biseriale, calculul consistenei interne, stabilirea frecvenei scorurilor totale i exemplificri grafice ale situaiilor. n cazul testelor de randament, Bogdan Pietrulewicz78 recomand efectuarea corelaiilor itemilor singulari cu scorul total. Indicele de dificultate este recomandat mai puin pentru selectarea itemilor. III.4. PROBLEMA EANTIONAJULUI Construcia unui test necesit examinarea unui numr apreciabil de subieci. La realizarea MMPI (Minnesota Multiphasic Personality Inventory) au fost examinai numai n faza de nceput 700 de subieci dintr-un eantion de locuitori ai statului Minnesota, 350 de aspirani la colegiu i 800 de pacieni ai spitalului din Minneapolis. Grupa de standardizare pentru spaiul lingvistic german a cuprins 365 de persoane. Pentru a se asigura contra posibilelor deformri ale sensului ntrebrilor prin traducere n german a MMPI, acest chestionar a fost aplicat pe un numr de 700 de bilingvi79. Eantionarea n psihologie se realizeaz mult mai greu dect in alte domenii. Spre deosebire de sociologi, psihologii nu gsesc subiecii pe strad i nu pot merge dect n rare cazuri la domiciliul lor pentru a face investigaii tiinifice. n marea majoritate a cazurilor examenul psihologic se desfoar n spaii special amenajate, cu respectarea anumitor etape. Chiar dac anumii subieci reuesc s rspund unei invitaii pentru a fi examinai la un laborator psihologic, nu putem fi siguri c au o motivaie corespunztoare pentru efectuarea examinrii. n ultima vreme, mai ales n ri nalt civilizate, se practic plata subiecilor, nct problemelor de eantionaj li se adaug unele noi, legate de dimensiunea financiar a unei examinri. Practic, subiecii care pot fi examinai n condiii de asigurare a ambianei specifice examinrii psihologice sunt cei selecionai prin intermediul unei instituii (pacienii spitalelor, elevii liceelor, persoanele care vin la centrele de evaluare sau la Laboratoarele unor mari ntreprinderi sau regii naionale. n momentul n care un subiect tie c de rezultatul examenului depinde viitorul su profesional avem o probabilitate mare de a rspunde motivat la solicitrile testului. Considerm c subiecii folosii la verificarea probelor psihologice sunt fatalmente selecionai. Constituirea unor eantioane complet aleatoare duce la complicaii mari de ordin metodologic. n privina eantionajului avem n fa dou situaii, distincte; eantionaj de persoane care efectueaz examinarea i eantionaj dintr-un anumit univers specific de itemi. n cazul primei situaii de eantionaj dintr-o anumit populaie suntem n prezena unei eantionri probabiliste (prin tragere la sori elementar, prin tragere la sori secvenial, prin grappes i stratificate) i a unei empirice (prin
78 79
vezi Bernier, J.J., Pietrulewicz, B., La psychometrie, Gaetan Morin Editeur, Montreal, Paris, Casablanca, 1997, pag. 240. Hathaway, S.R., Mckinley, J.C., MMPI Saarbrucken, Verlag Hans Huber, Bern und Stuttgart, 1963.
66
quote, prin uniti tip). n privina eantionajului itemilor avem eantionaj simplu, eantionaj stratificat, eantionaj prin grappes i eantionaj ierarhic. Chiar n situaia n care subiectul este condiionat instituional apar o serie de probleme, una dintre ele fiind compoziia unui grup criteriu. Dac la unele problema este simpl (cercetarea n psihologie colar, de exemplu), n psihologia patologic nu exist un adevrat acord ntre specialiti n materie de diagnostic. Existena unor nomenclatoare, de genul DSM IV, nu rezolv problema constituirii unor grupe de subieci criteriu. Paul Kline spune n aceast privin: Chiar dac este posibil de a-i seleciona plecnd de la un criteriu pentru a constitui un grup, subiecii afectai acestui grup criteriu pot s se diferenieze de subiecii grupului martor pe mai mult de o variabil. Nite subieci schizofreni (afectai grupului criteriu) pot s se diferenieze de subiecii grupului de control n domeniul personalitii, al funciei sociale i al aptitudinilor intelectuale, pentru a nu reine dect trei variabile importante80. n timpul primului rzboi mondial Robert Yerkes i colaboratorii si au putut s examineze n jur de 1,7 milioane de oameni, iar n al doilea rzboi mondial au examinat sute de mii de subieci n laboratoarele psihologice ale beligeranilor. n urma acestei experiene de rzboi, Germania a fost prima ar din lume care a definitivat juridic statutul psihologului n anul 1941. Cercetrile din domeniu militar se dovedesc a fi una din cele mai serioase surse de date pentru verificarea testelor. III.5.NORMELE I NORMAREA N PSIHOMETRIE Cuvntul norm are o arie extins i diversificat de utilizare, cuprinznd domeniile disciplinelor tiinifice i ale activitilor practice. Se vorbete de norme juridice, norme etice, norme deontologice, norme de circulaie, norme de consum, norme tehnologice, norme ecologice, norme de comportament, norme de reprezentare. Sensul general al termenului de norm n disciplinele psihologice aplicative (derivat n limba romn din termenul englez norm) este un ansamblu de date caracteristice unei populaii, pentru o sarcin de efectuat i un material determinat, pe care un cercettor l utilizeaz n momentul construciei unui plan experimental. Normele sunt totodat convenii care regleaz viaa social i trebuie s rezolve conflictele nainte ca acestea s izbucneasc. Normele de comportament, n calitate de prescripii nescrise constituite de fiecare grup sau fiecare societate, preocup mai ales psihologia social. Intereseaz, n special, caracteristicile, geneza i schimbarea normelor, sistemul normativ i deviana comportamental. Cel mai frecvent, cuvntul norm se folosete n domeniul psihometric, parte integrant a psihologiei difereniale, disciplin care se ocup cu teoria i tehnologia instrumentelor de msur n psihologie. Deseori, termenul de norm se folosete n strns legtur cu cel de etalon, iar cel de normare cu cel de etalonare. A etalona un test i a norma un test sunt considerate activiti identice. n definiia lui Maurice Reuchlin, personalitate tiinific de referin n domeniul utilizrii metodelor cantitative n cercetarea psihologic, etalonarea este stabilirea, ntr-o prob psihologic, a unei scale permind de a situa rezultatul obinut de un subiect prin raportare la rezultatele care au fost observate anterior ntr-o populaie de referin suficient de numeroas i omogen de subieci comparabili aceluia care a fost examinat81. Etalonul, n general , este o mrime standardizat servind de referin i de
Vezi Kline, Paul, La construcion des tests, n Beech, John R. , Harding, Leonora Tests, mode d'emploi. Guide de psychometrie, ECPA, Paris, 1995, pag. 120. 81 Vezi Grand dictionnaire de la psychologie, Larousse, Paris, 1992, pag. 284
80
67
AUREL STAN
msur ntre diverse obiecte. A etalona presupune fixarea gradaiilor pentru un instrument de msur, stabilirea gradaiilor pentru o scal. A norma nseamn a fixa pentru o mrime numrul de norme sau de etaloane care sunt cuprinse. Att etalonul ct i norma presupun o convenien ntre utilizatorii de msuri. Considerm c normarea presupune un grad de convenien crescut n comparaie cu etalonarea, operaiune care implic un interes crescut pentru asigurarea identitii semnificaiei unitii de msur. Atunci cnd efectum o operaiune de msurare suntem dependeni foarte mult n apreciere de puterea informaional pe care am dobndit-o n urma efecturii acesteia Nu ne este indiferent dac suntem n domeniul scalar nominal, ordinal, de log-interval, de interval, de raport sau absolut. Ignorarea acestui fapt duce la grave erori de aprecieri i la operaii statistice lipsite de sens. Problema normrii rezultatelor cantitative ale cercetrii psihologice a aprut odat cu dezvoltarea psihologiei experimentale i, mai ales, cu apariia testului psihologie, dar continu s creeze probleme tinerilor psihologi practicieni prin confuziile unor termeni i a unor tehnici folosite n realizare, fapt pentru care este nc apreciat drept una de actualitate. Aceast problem apare frecvent n interpretarea cantitativ a datelor provenind din aplicarea instrumentelor psihologice de investigaie i n docimologie, n general. Normarea poate fi aplicat pentru orice metod psihologic de investigaie ale crei rezultate pot fi exprimate mai ales cantitativ, dar, n special, n domeniul construciei i aplicrii testelor psihologice, care sunt instrumente standardizate. n general vorbind, standardizarea procedurilor este indispensabil comunicrii tiinifice a informaiilor care se prezint sub form cantitativ i oricrei ntreprinderi metodologice de comparare. Ea este inerent oricrui demers de observaie tiinific. III.5.1. Metode de etalonare a rezultatelor persoanelor Interpretarea scorurilor obinute la un anumit test psihologic se face n etape. Prima etap este transformarea scorurilor brute ntr-o scal care permite de a stabili o baz de comparaie. Orice subiect cruia i-a fost aplicat un instrument de investigaie psihologic obine un rezultat observabil, exprimat conform prescripiilor manualului de rspunsuri (n urma aplicrii grilei de corecie). Testul computerizat exclude existena unei grile de corecie ca material al testului, procednd automatizat, avnd precizie i rapiditate de necomparat cu modalitile tradiionale de corectare. Redarea automat a rezultatelor brute i a diferitelor feluri de transformri posibile nu exclude necesitatea nvrii modului de constituire a etaloanelor i a cunotinelor privind reconsiderarea i reevaluarea lor. Operaiile tehnice care stau la baza unei astfel de practici nu trebuie totui s fie uitate de ctre cercettori i practicieni. Mai ales testele de randament intelectual i pentru msurarea diferitelor abiliti psihomotorii au rspunsurile mprite n corecte i incorecte, n marea lor majoritate. Realizarea punctrii unui singur item este n concordan cu valoarea rspunsului, 0 puncte pentru rspuns incorect, 1 punct pentru rspunsul corect. La inventarele de personalitate i de interes rspunsurile nu se apreciaz n aceti termeni, ci n funcie de faptul dac pun n eviden sau nu caracteristica investigat sau, mai clar exprimat, atitudinea exprimat fa de coninutul aseriunii unui item. n marea majoritate a cazurilor rezultatele aplicrii unor instrumente de investigaie psihometric dobndesc consisten cantitativ prin operaiile de adiie realizate n cadrul unor matrici. Cel mai simplu i cel mai frecvent tip de matrice este matricea lui W. Stern. O astfel matrice de date care poate fi reprezentat sub dou dimensiuni: Liniile care reprezint rspunsurile unei aceleai persoane la itemi diferii
68
Coloanele, care cuprind rezultatele diferiilor subieci la un singur stimul. Deoarece elementele liniilor sunt constituite din rezultatele subiecilor la fiecare item, din analiza acestora putem trage concluzii asupra unor profile de rspuns ale subiecilor (crora li se spune i pattern-uri de rspuns). Din analiza coloanelor putem trage concluzii asupra calitii itemilor. Indici de similaritate i de distan pot fi calculai att pe liniile ct i pe coloanele aceleai matrici. n 1966, R.B. Cattel a propus o extensie a matricii lui W. Stern pentru veni n ntmpinarea unei practici curente a cercetrii, aceea care const n a aprecia stabilitatea temporal sau intersituaional. Dac se repet acelai chestionar n mai multe ocazii se obine o matrice subieci-itemi-ocazii. Ocaziile temporale vor ocupa o a treia intrare a unei structuri tridimensionale, numit curent cutia lui Cattel. O serie de teste psihologice de randament psihomotor nu sunt compuse din item, ci puncteaz diferite criterii de apreciere a ndeplinirii sarcinii prezentat sub forma unui continuum solicitativ (n acest caz punctarea este constituit prin numrul de erori, durata medie acestora, timpul de efectuare a probei etc.). Problema care const n a msura subiecii dup o trstur, o caracteristic sau o abilitate, se rezum la a nsuma rspunsurile unui anumit numr de itemi, n aa fel nct s se obin un rezultat care s fie fructul msurii pentru fiecare persoan. O asemenea nsumare d natere la un scor. Operaiunea de creare a unui scor este numit de specialitii psihometricieni scorare.82 Scorul realizat prin adiionarea valorilor obinute la itemi poart numele de scor compozit. Itemii se pot prezenta i mai diversificat dect notarea dihotomic, situaie care se ntlnete mai ales la inventarele de atitudini. Aproape totdeauna se pot reprezenta modele pentru a msura indivizii, trasnd o curb care face legtura dintre intensitatea caracteristicii i probabilitatea de a obine un rspuns corect. Chiar dac nu suntem niciodat sigur de faptul c msurm bine o anumit caracteristic, se poate aprecia c scorurile obinute, printr-o combinaie de itemi, se constituie ntr-o bun aproximare. Scorurile brute sunt acele scoruri care sunt obinute direct, imediat dup corectarea probei, fr nici o alt intervenie prealabil. Aceste variabile brute au amplitudini foarte diferite, fapt care face s nu ne putem orienta apreciativ n privina locului relativ al unui subiect ntr-un ansamblu de subieci care au efectuat o anumit prob. Scorul 75 la un test psihologic care poate obine note brute de 0 la 200 nu poate fi comparat cu cel de 178, obinut la un test la care se pot obine note ntre 0 i 380. Este nevoie de o serie de prelucrri matematice ale variabilelor brute, operaiune care le va face comparabile. Un scor brut nu are semnificaie psihodiagnostic dect dac este pus n legtur cu randamentul unui grup de respondeni comparabili. Grupul de referin se mai cheam i grup normativ. Primul element care trebuie luat n seam n cazul cnd dorim s aflm poziia relativ a unui subiect n interiorul unui grup este tabelul care prezint norme referitoare la ansamblul randamentelor individuale din grupul de referin. Utilizarea normelor este ghidat de anumite principii de interpretare a rezultatelor. Respondentul al crui scor este comparat cu norma sau etalonul trebuie s posede anumite caracteristici asemntoare acelora ale grupului de apartenen. Msurarea cu ajutorul unui test psihologic construit n spiritul teoretic clasic capt sens prin raportare.
82
O asemenea denumire este folosit frecvent de Constantin Mitrofan n cartea Testarea psihologic a copilului mic, Editura All, Bucureti, 1997
69
AUREL STAN
Alte elemente care trebuiesc luate n consideraie sunt validitatea i fidelitatea datelor, operaiuni strict specializate n psihometrie i a cror realizare cere un timp considerabil. Pentru a putea raporta valorile brute obinute de un subiect la valori de referin trebuiesc efectuate examinri pe grupuri de subieci posednd aceleai caracteristici. Este necesar de a face distincia dintre noiunea de populaie i cea de eantion. Populaia este constituit din ansamblul indivizilor (n domeniul psihologic, ansamblul subiecilor) care satisface exigenele unei anumite definiii. Grupul de referin poart numele de eantion doar n cazul n care selecia subiecilor s-a fcut prin respectarea rigorilor unor anumite reguli, fapt care-i confer acestuia reprezentativitate, adic calitatea care face posibil tragerea acelorai concluzii din analiza grupului ca i din analiza populaiei, admind anumite riscuri tolerabile de eroare. Procedura de etalonare a unui test cuprinde efectuarea acestuia de ctre cel puin un eantion din populaia de referin. Debutul procedurii trebuie s se fac printr-o definiie foarte clar a acestei populaii. Din punct de vedere statistic, populaia este ansamblul tuturor cazurilor care constituie obiectul de interes al cercettorului, clar precizat. Din punct de vedere teoretic ansamblul poate fi finit sau infinit, dar datele cu care se confrunt psihologul sunt n toate cazurile n numr finit. n cazul n care populaia este constituit dintr-un mic numr de cazuri, ea poate fi n ntregime msurat. Dar, colectarea exhaustiv de rspunsuri ale subiecilor din populaie este de cele mai multe ori imposibil. Trebuie s ne limitm la domeniul eantioanelor, adic la pri, subansambluri ale populaiei, plecnd de la care caracteristicile populaiei trebuie aproximate ntr-un mod satisfctor. n definirea populaiei trebuie s se in cont de o serie de caracteristici precizate de destinaia psihodiagnostic a testului. Dac testul este destinat a diagnostica tulburrile de dezvoltare senso-motorie a copilului mic (02 ani), populaia vizat va fi, desigur, aceea a copiilor n vrst de la 0 la 2 ani. Un chestionar care i propune s evalueze dezvoltarea social a handicapailor mentali, va avea ca populaie de referin aceast categorie demografic defavorizat. O recomandare general este ca populaia de referin s fie suficient de omogen, adic ca toi indivizii susceptibili de a fi evaluai cu ajutorul unui test s fac clar parte din ea. Cnd un test este dezvoltat de ctre un editor comercial, exist frecvent exigena ca normele s fie naionale Avantajul major de a se referi la o populaie naional este de a permite producia unui sistem unic de norme, valabil pentru un foarte mare numr de subieci. Interesul comercial i uurina de folosire sunt evidente. Referina la populaia naional nu implic ca normele diferitelor teste s fie ipso facto comparabile, deoarece aceast populaie nu este totdeauna definit cu aceeai rigoare de ctre cei care editeaz un instrument de investigaie. Neconcordanele survin cnd editorii nu se pun de acord n legtur cu includerea anumitor grupuri atipice n populaia de referin. Deficienii mentali, sunt cteodat inclui i, n alte cazuri, exclui din populaie. Ca atare, normele naionale sunt deficitare, datorit prea extinsei lor generaliti. De aceea, este mai adecvat pentru practicieni de a lua decizii sprijinindu-se pe norme specifice. Un psiholog care activeaz profesional n medii socioeconomice defavorizate va avea mai mare nevoie, n general, de norme elaborate pentru acest tip de populaie. Aceast raiune, alturi de cea financiar, este frecvent invocat ca justificare a practicii de a nu dezvolta dect norme locale. n acest caz, populaia de referin va fi mai bine circumscris. Ea va corespunde elevilor din colile unui ora sau pacienilor dintr-o instituie de recuperare psihomotorie. Normele vor avea referin la aceste populaii i vor servi, n mod obinuit, pentru obiective foarte precise: a ajuta la orientarea elevilor ctre diferite profesiuni, la constituirea de
70
grupuri omogene pentru nvare etc. Limitele folosirii normelor locale decurg din prea marea lor specificitate. n acest caz, pentru alte utilizri ale testului sau chestionarului va fi adesea necesar de a dezvolta noi norme, extinse n privina ariei de apartenen a populaiei. Din raiuni de economie, se procedeaz frecvent la o eantionare de convenien, deoarece este comod pentru practician, adic la utilizarea de subieci apropiai anturajului psihologului sau de persoane care se prezint voluntar ca urmare a unui anun. Aceast procedur trebuie respins, deoarece antreneaz serioase deformri sistematice n estimarea parametrilor populaiei. Lsarea la aprecierea practicianului nu conduce, n general, la constituirea unui eantion reprezentativ din populaie, deoarece erorile datorate unei lipse de sistematizare sunt foarte dificil de controlat. Mai mult, procedura nefiind aleatorie, nu este posibil de a evalua importana erorii de estimaie a parametrilor. n 1971, W.H. Angoff face remarca c, pentru testele cognitive folosirea eantionajului de convenien conduce n mod obinuit la o supraestimare a scorurilor populaiei. ntr-adevr, subiecii voluntari sau care aparin ambianei cercettorului constituie un subgrup sociocultural favorizat n rndul populaiei. III.5.2.Tipuri de scale normative n psihometrie n general, n psihometrie se face raportare la 5 categorii de scale83: - scale de coninut. - scale de dezvoltare; - scale care utilizeaz raporturi i coeficieni; - scale care se bazeaz pe cuantumuri procentuale sau cuantile, - scale care face apel la scoruri standardizate; III.5.2.1. Scalele normative de coninut Aceste scale permit de a compara randamentul unui respondent la un standard definit prin coninutul testului. Acest tip de scale se folosete mai ales la acele teste utilizate n activitatea de selecie profesional n care sarcina este foarte apropiat activitii reale pe care o va avea de efectuat candidatul n cazul n care va fi admis. Exemplul clasic este proba mainii de scris. n acest caz este stabilit clar un randament maximal, ideal, de care subiectul se poate apropia i, n cazuri excepionale, chiar realiza. Se compar deci un randament individual cu un randament ideal. Acest tip de scal nu se aplic dect la testele de randament maximal. Randamentul subiectului se calculeaz prin urmtoarea formul:
Numarul de raspunsuri corecte *100 . Numarul total de itemi

Dac subiectul poate realiza un randament maxim de 400 de puncte i nu a realizat dect 324 324 atunci se va face urmtorul calcul: * 100 = 81% . Scorurile derivate n acest mod sunt foarte 400 dependente de proprietile itemilor testului. Un scor de 81% va fi interpretat dup uurina sau dificultatea itemilor. Pentru doi respondeni este posibil de a obine acelai scor rspunznd corect la
O scal variaz dup postulatele subiacente la fiecare nivel de msur. Astfel, centilele sunt ranguri; scorurile standard sunt bazate de o unitate standard z i constituie o scal de intervale egale. Calculul coeficienilor nu este posibil dect plecnd de la scale de proporii.
83
71
AUREL STAN
itemi comportnd un grad de dificultate variabil. De exemplu, dac A i B obin amndoi 70% se poate spune c A a reuit itemii uori i c B a reuit itemi uori i dificili. Scalele de coninut pun o serie de probleme: validitatea trebuie s fie asigurat printr-o eantionare adecvat bazat pe o definiie precis a domeniului msurat; interpretarea scorurilor trebuie s fie n funcie de coninutul msurat i de itemi rezolvai prin respondent. Astfel de scale prezint avantajul c permit de a interpreta scorurile calculate n funcie de randament. Aceste scoruri indic gradul de abilitate pe care l posed n prezent un respondent, mai curnd dect poziia sa relativ ntr-un grup. Dezavantajele constau n dificultatea de a preciza coninutul i natura sarcinilor complexe i n dificultatea de a afirma c un respondent stpnete un nivel de dificultate dat pentru c el a reuit, probabil, att la itemi uori ct i la itemi dificili. Interpretarea unui scor este totdeauna aproximativ, deoarece noiunea de dificultate se raporteaz mai mult dect la un singur subiect. III.5.2.2. Scale normative de dezvoltare Exist dou tipuri de scale de dezvoltare: una este n funcie de vrst, alta n funcie de nivelul de colarizare. Principiul care st la baza construciei acestora este c anumite abiliti i caracteristici se dezvolt ntr-un mod sistematic. Se utilizeaz pentru a compara randamentul unui subiect cu randamentul mediu al altor subieci avnd atins un anumit nivel de dezvoltare. Postulatul fundamental al scalelor de dezvoltare mintal este c gradul prezenei unor abiliti sau caracteristici msurate se mrete sistematic cu vrsta. Dac o caracteristic nu se mrete sistematic cu vrsta, ea nu este adecvat pentru scopul propus. Dac procentul de schimbare variaz de la an la an, inegalitatea mrimii unitii complic interpretarea. n general, dezvoltarea mintal se stabilizeaz la adolescen. Rezultatele scalei de dezvoltare sunt tributare unui numr de factori, precum educaia, mediu social-economic, influenei culturale, stabilitii emotive. Aceast scal pare s convin pentru copiii care triesc ntr-un mediu tipic. Scale normative pe niveluri de vrst Dup vrst, Alfred Binet a considerat c dezvoltarea mintal se estimeaz prin compararea randamentului unui copil cu acela al copiilor de vrste diferite. El a selecionat sarcini intelectuale (itemi) care i permiteau de a discrimina copiii de vrste diferite. Exemplu: itemul 9 l efectueaz doar civa copii de 7 ani i majoritatea celor de 8 ani. Este recomandat pentru vrsta de cel puin 8 ani. Binet a realizat colecii de itemi pentru examinarea fiecrei vrste. Scorul reprezentativ este cel al eantionului reprezentativ. Vrst mental este termenul pe care-l folosete pentru prima dat Alfred Binet. Este vrsta corespunztoare performanelor realizate de ctre copiii normali de o anumit vrst, la anumite solicitri de natur intelectual. Este determinat prin nivelul probelor reuite de ctre un anumit copil. Probele create de Binet (i ulterior de Simon) constituie o scal ierarhic. Vrsta mental este nivelul de vrst pentru care toate rspunsurile specifice sunt corecte. n 1905, treizeci de probleme sunt prezentate n ordine cresctoare de ctre Alfred Binet i Thodule Simon. Acest nivel de dificultate a fost determinat empiric, administrnd probele la 50 de copii
72
normali n vrst de la 3 la 11 ani i la civa copii i aduli retardai. Nu este dat nici o metod de a ajunge la un scor total. n 1908, numrul probelor a crescut, unele din cele vechi au fost eliminate, i ele sunt regrupate prin nivelul de vrst mental n funcie de rezultatele obinute de ctre 300 de copii normali. Dup anul 1911 ,(an n care testul modificat comport 5 itemi pentru fiecare nivel de vrst), se calculeaz vrsta mental innd cont de reuita parial n vrstele superioare vrstei de baz. Astfel, un copil care a reuit toi itemii pentru 7 ani i 5 itemi reuii pe un nivel superior va avea o vrst mental avansat n funcie de reuita suplimentar. S-a constatat c un acelai numr de ani, de avans sau de ntrziere, nu are aceiai semnificaie pentru vrsta real. Un an de ntrziere la 4 ani nu are acelai sens ca un an de ntrziere la 11 ani. Pentru a ine cont de aceasta situaie, William Stern a introdus n 1912 noiunea de Q.I. care este un raport ntre vrsta mental i vrsta cronologic (sau vrsta real calculat n luni). Acest raport este multiplicat prin 100, ceea ce determin anularea numerelor zecimale. Un Q.I de 100 reprezint o performan potrivit cu vrsta real, unul inferior cifrei 100 indic o ntrziere n viteza de dezvoltare i un Q.I. mai mare 100 indic un avans n dezvoltare. Constituirea de scale pe niveluri de vrst se deruleaz n mai multe etape. 1. Sunt constituite eantioane de subieci pentru o anume vrst. O vrst este definit ca un interval mai mult sau mai puin extins dect vrsta n chestiune. 2. Este calculat un scor mediu la fiecare grup de vrst. 3. Eventual, scorurile diferitelor trane de vrst sunt estimate prin interpolare. Procedura se utilizeaz cnd anumite vrste nu au fost incluse n eantionul de etalonare i cnd se dorete a prezenta normele pe luni i nu numai pe ani. Procedura de interpolare rspunde la postulatul unei progresii liniare a caracteristicilor evaluate prin test. Ea const n a calcula valoarea intermediar ntre valorile inventariate prin eantionul de etalonare. Exemplu: dac scorul mediu obinut la test pentru copiii de 7 ani este de 14 puncte i cel obinut de copiii de 9 ani este de 18 puncte, se poate estima c scorurile medii ale copiilor de 8 ani este de 16 puncte. Scale dup nivelul colar. Se compar randamentul colar al unui subiect cu acela al unui cursant mediu din diverse niveluri colare. Exemplu: 7,6 este randamentul comparaiei cu nivelul mediu de 7 ani i 6 luni. Stabilirea acestei valori indic faptul c elevul are nivelul corespunztor de cunotine. Este vorba de o msur continua. Trstura trebuie s varieze sistematic cu nivelul colar. Efortul fcut pentru a determina i reevalua nivelurile colare este foarte mare i cercettorul se lovete de nenumrate dificulti pe care nu le poate depi dect stabilind o serie de convenii. III.5.2.3 .Scale bazate pe raporturi i coeficieni. Cel mai bun exemplu este msura coeficientului intelectual Q.I., care se obine prin compararea vrstei mentale cu vrsta cronologic. Specialitii au demonstrat c vrsta mental luat izolat nu d un indice suficient de precis al dezvoltrii mentale. Pentru calcul se utiliza formula: virsta mentala Q.I.= * 100 . Raportul se va numi coeficient de inteligen. Denumirea va face virsta crono log ica carier, fiind utilizat n varii domenii de activitate tiinific i practic. Q.I.-ul lui W. Stern, ca raport ntre vrsta mental i vrsta cronologic, nu trebuie confundat cu Q.I.-ul lui Wechsler, care n general, are valori mai nalte. Unui Q.I. de 115, n varianta Wechsler, i corespunde un clasament identic pentru subieci aparinnd la grupe de vrst diferite, pe cnd
73
AUREL STAN
semnificaia Q.I.-ului lui W. Stern variaz n funcie de vrst, deoarece abaterea standard a distribuiilor acestor Q.I.-uri nu este aceeai pentru toate vrstele. n funcie de problemele asociate abaterilor standard, neechilibrate i de faptul c dezvoltarea intelectual nu are o relaie liniar cu vrsta, raportul coeficientului creat de W. Stern nu mai este utilizat i nu mai prezint dect un interes istoric. n locul raportului de coeficient se utilizeaz scoruri standard bazate pe eantioane reprezentative ale populaiei de fiecare nivel. Aceste scoruri, numite i Q.I.-uri deviate, prezint o medie de 100 i o abatere standard de 15, pentru scala Wechsler, i egal cu 16 pentru scala Stanford-Binet (pentru fiecare categorie de vrst). III.5.2.4.Scale care se bazeaz pe cuantumuri procentuale sau cuantile Quantilul este un element al unei serii ordonate de elemente care va avea n faa lui (valori mai mari) un procentaj determinat al unui ansamblu de date. Practic, este o born numeric separnd dou cuantumuri procentuale al valorilor obinute de un grup de referin la o anumit examinare prin intermediul unui instrument psihometric. Separaia unui ansamblu de valori ale unei variabile n quantile constituie o form de etalonare. Ea permite de a situa un subiect, care a obinut un scor determinat, ntr-o anumit clas a subiecilor pentru care testul a fost etalonat. Se va vorbi de intercuantile (de interdecile, de exemplu) pentru a desemna n+1 zone de distribuie delimitate prin quantile. Uneori se utilizeaz termenul de interquantil n loc de quantil. Distincia clar se face prin precizarea c interqantilul este, n majoritatea cazurilor, un interval numeric, pe cnd quantilul este reprezentat de o singur valoarea numeric. Lucrrile se specialitate ale lui Maurice Reuchlin consacrate statisticii aplicate n psihologie fac clar aceast separaie de sensuri pentru cele dou noiuni.84 La nceputul procedurii de cuantilaj (form particular a etalonajului) se alege o metric, adic un numr de niveluri pe care scala permite de a le discrimina. Dac o scal cuprinde n niveluri i dac N . Scala n cuantile va efectivul total al unui eantion este N, efectivul fiecrui nivel va fi teoretic n corespunde, deci, unui model rectangular. Cele mai frecvente mpriri n cuantile se fac ntre 1 i 10 trepte, cu urmtoarele denumiri. Nr.crt. Nr. interquantile Nr. quantile Denumire tehnic 1 3 2 Trecil 2 4 3 Quartil 3 5 4 Quintil 4 6 5 Sextil 5 7 6 Septil 6 8 7 Octiil 7 9 8 Nonil 8 10 9 Decil 9 100 99 Centil Tabelul 18. Denumirile formelor de etalonare prin intermediul cuantilelor, gradiente de la 3 la 10. Pentru a construi un decilaj se procedeaz n aa fel ca toate clasele noii scale s conin fiecare un acelai numr de scoruri din eantionul de referin. Este vorba de o convenie care va face distribuia rectangular. Dac scala este constituit din 10 clase egale n efectiv, acest efectiv va trebui s aib 10% din numrul total al subiecilor. Interquantilul I corespunde primelor 10 % din notele brute,
84
Vezi Reuchlin, Maurice, Prcis de statistique, PUF, Paris, 1976, pp. 67-78
74
celor mai slabe din distribuie, interquantilul II 10% din rezultatele care urmeaz, i aa mai departe, pn la interquantilul X. Quantilul I va separa primii 10% din subieci de urmtorii 90%, quantilul II primii 20% din subieci de urmtorii 80 %, i aa mai departe pn la quantilul IX, care va separa primii 90% de urmtorii 10% . Oferim un exemplu imaginat n care un psiholog examineaz un numr de 360 de subieci cu un anumit test n vederea etalonrii acestuia. Aceast procedur se efectueaz n faza construirii unui instrument de investigaie psihologic sau n cazul reevalurii acestuia. Notele testului variaz ntre 0 i 35. Exemplu dat este unul imaginat i nu va conine primele 5 valori (1, 2, 3, 4, 5) i ultimele 3 (33, 34 i 35). De obicei, n examinare se obin foarte rar scorurile cele mai mici i scorurile cele mai mari. Dac datele ar fi fost reale ar fi trebuit s se fac o serie de precizri cu privire la constituirea eantionului de etalonaj, adic la proveniena subiecilor examinai, vrsta, nivelul de studii, sexul, etc. De asemenea, ar fi trebuit s se fac precizri cu privire la tehnicile folosite pentru selectarea subiecilor n eantion. naintea operaiunii de etalonare, datele se organizeaz cresctor n variante de variaie. Tabelul ntocmit n vederea stabilirii scalei de etaloane n 10 interquantile (sau n 10 clase) va arta n felul urmtor:
X 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 N 3 7 4 6 8 11 14 17 16 19 24 22 26 21 24 18 19 17 14 16 14 11 9 7 6 5 2
NC NCT
INTERDECIL
DECIL
NUMEROTARE
% INTERDECIL
SEPARAIE DECIL
3 10 14 20 28 39 53 70 86 105 129 151 177 198 222 240 259 276 290 306 320 331 340 347 353 358 360
36 72 108 144 180 216 252 288 324 331 340 347 353 358 360
0 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
11 13 15 17 18 20 22 24 26
I II III IV V VI VII VIII IX
10,88% 8,61% 9,72% 12,77% 7,22% 12,50% 10,27% 8,61% 8,33%
10,88%/89,12% 19,49%/80,51% 29,21%/70,79% 41,98%/58,02% 49,20%/50,80% 61,70%/38,30% 71,97%/28,03% 79,58%/20,42% 87,91%/12,09%
27-32
12,09%
Tabelul 19. Coloanele tabelului conin etape ale procedurii de etalonare prin metoda cuantilelor a rezultatelor obinute de un eantion de subieci la un test psihologic
75
AUREL STAN
Notaiile folosite n tabel: X: nota brut n: frecvena absolut a unei variante de variaie nc: frecvena cumulat absolut nct: frecvena cumulat absolut necesar teoretic pentru calcularea interquantilelor i quantilelor. Jocul frecvenelor cumulate absolute face s nu putem tia distribuia exact acolo unde trebuie. n acest caz, ne limitm n calcul la cele mai apropiate valori de cele teoretice. Astfel, la primul decil ar fi trebuit s ne oprim la valoarea 36. Valoarea 39 folosit de noi ca valoare delimitativ pentru primul decil este cea mai apropiat valoare de valoarea 36. Procednd n acest fel am realizat un compromis metodologic. Acceptabilitatea compromisului poate fi stabilit prin metoda chi-ului ptrat de ajustare.
ft 39 36 3 9 0,23 31 36 -5 25 0,81 35 36 -1 1 0,03 46 36 10 100 2,17 26 36 -10 100 3,85 45 36 9 81 1,80 37 36 1 1 0.03 31 36 -5 25 0,81 30 36 -6 36 1,20 40 36 4 16 0,40 Total 11,32 Tabelul 20. Coloanele tabelului indic desfurarea procedurii Chi ptrat de ajustare pentru calcularea distanei dintre efectivele teoretice necesare calculrii decilelor i cele observate practic. Coloana fo desemneaz efectivele observate, iar coloana ft efectivele teoretice
Pentru aceast valoare a lui chi ptrat gsim un p>0,10, ceea ce duce la acceptarea ipotezei de nul, constatare care arat c distana dintre cele dou serii de efective nu este semnificativ. Deci, utilizarea efectivelor observate poate fi considerat un compromis acceptabil n cazul cnd dorim s stabilim o scal n centile, avem la ndemn o procedur puin diferit. Pentru a pune n aplicare aceast procedur trebuie s avem distribuii ale cror amplitudini sunt de ordinul sutelor. Raiunea construirii scalelor care fac apel la centile este de a asigura o discriminare foarte fin a subiecilor dar, n cazul cnd amplitudinea distribuiei este sub 100, asigurm o fals finee a diferenierii. Redm, n continuare, un tabel ale crui coloane indic paii de urmat n procedura de calcul: Lum exemplu a 137 de subieci care au fost examinai cu un anumit test (exemplul este fictiv):
Nr.crt. 1. 2. 3. 4. 76 X 11 12 13 14 F 2 5 7 11 f% 1,57 3,94 5,51 8,68 fc 2 7 14 25 fc% 1,57 5,51 11,02 19,69 Percentila 0,79 3,54 8,27 15,35
fo
ft
fo- ft
( f o f t )2
( f o f t )2
TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC 5. 6. 7. 8. 9. 10. 11. 12. 15 16 17 18 19 20 21 22 19 26 18 15 11 7 4 2 14,96 20,47 14,17 11,81 8,66 5,51 3,15 1,57 44 70 88 103 114 121 125 127 34,65 55,12 69,29 81,10 89,76 95,28 98,43 100,00 27,17 44,89 62,21 74,50 85,43 92,52 96,85 99,22
Tabelul 21 Coloanele tabelului indic etapele necesare calculrii valorilor percentile. Avem n fa un exemplu simplu, deoarece n practic este foarte puin probabil s se gseasc un test la care s se poat obine doar 12 valori distincte. Procedura exemplificat de noi este folosit de autori reputai n domeniul psihometric ca David Magnusson85, J.J. Bernier i B. Pietrulewicz86. Prin aceast procedur se ncearc a se ameliora impreciziile metodei prezentate la calculul decilelor. Coloana notat cu X conine diferitele variante ale variabilei obinute n urma unei examinri cu un anumit test. A doua coloan, notat cu f, conine frecvenele diferitelor valori ale variabilei. n total, au fost cuprini n analiz 127 de rezultate ale subiecilor. Cu f% a fost notat frecvena simpl relativ, care se obine prin nmulirea cu 100 a rezultatului mpririi fiecrei frecvene simple la 127 (numrul total de subieci examinai). Cu fc a fost notat frecvena absolut cumulat ascendent, iar cu fc% frecvena relativ cumulat ascendent. Valorile din aceast coloan se obin prin nmulirea cu 100 a rezultatului mpririi fiecrei valori din coloana fc la 127. Ultima coloan conine transformarea n valori percentile a valorilor iniiale ale testului. Cum se obin aceste valori? Valoarea 13 este considerat mijlocul unui interval de clas care se ntinde de la 12,5 pn la 13,5. Ca atare, valoarea percentil este constituit din frecvena cumulat relativ anterioar valorii 13 i din adugarea din frecvena relativ din dreptul valorii 13. 5,51 8,56 8,27 = 5,51 + ; 15,35 = 11,2 + 2 2 Ce ne spune o valoare percentil? Ea ne spune, de exemplu, c sub valoarea 16 se gsesc aproximativ 45% din totalul subiecilor, iar peste aceast valoare se gsesc aproximativ 55 % din totalul subiecilor. III.5.2.5. Scale care fac apel la scoruri standardizate Printre transformrile curente pentru a face lizibile scorurile brute se numr i urmtoarele: Transformri liniare n scoruri standard, folosind media i abaterea standard a distribuiilor. Normalizarea, const n a transforma distribuia scorurilor ntr-o distribuie normal. Practic se divizeaz curba normal ntr-un numr de clase de lungimi egale, dup care este uor de a determina efectivele de subieci corespunznd fiecrei clase. Se pot ntocmi tabele care s furnizeze procentaje teoretice de efective de clas a unei distribuii normale n care se divizeaz ansamblul ordonat al valorilor n 7, 9, 11, etc. pri egale. Este suficient de a repartiza msurile originale ntr-un numr de clase, respectnd procentajele. Aceste transformri sunt nonliniare. Una dintre cele mai cunoscute transformri se refer la interpretarea msurilor de interval,
85 86
vezi Magnusson, David, Testtheorie, Verlag Fraanz Deutlicke Wien,1973, p. 252 vezi Bernier, J.J., Pietrulewicz, B., La psychometrie, Gaetan Morin Editeur, Montreal, Paris, Casablanca, 1997, pg.371-372
77
AUREL STAN
care poate fi facilitat efectund o simpl transformare liniar de forma: x2= ax1+b, n care x1 este msura original i x2 este msura transformat. a=
1 i b = m2 am1, m1 i 1 fiind media i abaterea standard a distribuiei msurilor originale, m2 2
i 2 fiind valorile corespunztoare pentru distribuia dorit. n transformarea n scoruri centrate reduse sau scoruri z avem formula: x2 = (x1-m1)/1. Astfel, msurile pot face obiectul unei interpretri mai directe. Dac aceste scoruri au o distribuie apropiat de legea normal Gauss-Laplace pentru a determina unde se situeaz rezultatul unui subiect prin raport cu rezultatele subiecilor unui grup de referin, aplicnd proprietile acestei legi de repartiie. De exemplu, despre un subiect care va obine un scor egal cu 2 ntr-o distribuie normal de medie 0 i o abatere standard egal cu 1 ,,vom putea spune c doar 2,3% din subiecii grupului referin obin un scor superior celui obinut de el. n schimb, utilizarea scorurilor z pentru a facilita interpretarea unui scor este jenat de faptul c aceste scoruri prezint valori negative, au o amplitudine foarte redus i se prezint sub form zecimal. Este motivul pentru care se utilizeaz adesea alte transformri liniare. Prezentm, n continuare, o serie de transformri liniare posibile:
Scor m Scor original 37,4 Scoruri z 0,00 Scoruri Stanford-Binet 100 Scoruri Wechsler 100 Scoruri H 50 Army General Clasification Test 100 Scala Wechsler (pentru subteste) 10 College Board Scholar Aptitude 500 Scoruri Stanine 5 Graduate Record Examination 500 Scoruri STEN 5,5 California Entrance Examination 500 Board Scoruri T 50 %>scor 6,5 1 16 15 14 20 3 100 2 100 2 100 10 Corespondene ntre diferite scoruri transformate liniar 19 25 43 36 29 48 - 2,83 - 1,91 0,86 - 0,22 - 1,29 1,63 54,71 64,48 113,78 96,56 79,32 126,09 57,54 74,38 112,92 96,77 86,62 124,46 10,37 23,29 62,06 46,98 31,91 72,83 43,38 61,85 117,23 95,68 74,15 132,62 1,51 4,28 12,58 9,35 6,12 14,89 216,92 309,29 586,15 478,46 370,77 663,08 - 0,66 1,18 6,72 4,57 2,42 8,76 216,92 309,29 586,15 478,46 370,77 663,08 - 0,16 1,68 7,22 5,07 2,92 8,76 216,92 309,29 586,15 478,46 370,77 663,08 21,89 30,92 99,76 97,20 58,82 19,50 47,85 59,70 37,08 90,15 66,31 5,26
Tabelul. 22 Conine 12 exemple de transformri liniare aplicate la 6 scoruri i procentajul de subieci care au un scor superior scorului considerat, n situaia n care scorurile se distribuie normal. Exemplul este imaginat pentru o distribuie care are o medie a scorurilor brute egal cu 37,4 i o abatere standard egal cu 6,5. Coloanele m i conin (cu excepia primelor valori) mediile i abaterile standard pentru distribuiile n care dorim s facem conversiunea scorurilor. n practic, decizia este luat n funcie de particularitile situaiei n care se afl cercettorul sau psihologul practician. X m Pentru obinerea scorurilor z folosim formula: z = . Pentru o valoare brut egal cu 19
(prima exemplificare n tabel) vom avea: z =
19 37,4 = 2,83 . Pentru obinerea scorurilor T 6,5
78
(introduse de McCall n 1922) vom folosi formula T=50 +
10
( X m).
Pentru obinerea scorurilor H (sau scoruri Hull), formula va fi foarte apropiat de cea 14 precedent, avnd o singur modificare: H = 50 + ( X m) .
Dac facem transformri ale unei distribuii observate care nu deviaz semnificativ de la exigenele curbei Gauss-Laplace obinem o nou distribuie n care quasitotalitatea valorilor variaz ntre 3 i +3, obinndu-se valori cu zecimale. Dac transformarea se face n variabile T, noile date obinute vor varia ntre 20 i 80, iar dac conversiunea se face n variabile H se vor observa valori care variaz ntre 0 i 100. Aceste note vor avea un plus de comoditate n utilizare. Optarea pentru un anumit tip de conversie a datelor nsemn i optarea pentru aceste limite de oscilaie, indiferent ce amplitudini au distribuiile notelor brute ale diferitelor teste aplicate pe diferite eantioane i indiferent ce medii i abateri standard utilizm. Am amintit anterior condiia ca aceste date brute s se distribuie apropiat de o distribuie normal. Denumirea frecvent a conversiunilor bazate pe utilizarea mediei i abaterii standard este de scoruri standard. n obinerea unor etaloane de bun calitate intervin constrngeri de reprezentativitate i de cost. Exist o nevoie justificat de a le reactualiza periodic, date fiind schimbrile temporare care se observ mai ales n randamentul la probele cognitive (autorii de specialitate vorbesc de o accelerare biologic i intelectual a dezvoltrii). Dup 1980 s-au produs teste psihologice computerizate care beneficiaz prin program de o reetalonare permanent, odat cu introducerea unor noi date n memoria calculatorului. Scorurile standard prezint avantajul de a prezerva forma distribuiei msurilor originale. Din nefericire, dac aceast distribuie nu este normal, interpretarea scorurilor nu este n nici un fel facilitat prin transformare. Un punctaj al unei distribuii de valori brute care a fost obinut prin transformare liniar are semnificaie statistic clar. Poziia relativ care este indicat de o anumit valoare standard a unei distribuii de valori nenormalizate depinde n ntregime de forma distribuiei. Cu ct mai mult o distribuie de scoruri se apropie ca de o distribuie normal Gauss, cu att mai sigur poate fi interpretat o valoare standard n distribuie. n scopul de a obine o semnificaie statistic clar a scorurilor individuale, este realizat adesea o normalizare a distribuiei. ntr-o distribuie normal Gauss, se tie exact cte procente de subieci exist deasupra, respectiv dedesubtul unei valori pe o scal de o anumit medie i o anumit unitate de msur. Aceast calitate este exploatat la prezentarea rezultatelor testelor psihologice n selecie i consiliere. Atenia nu este concentrat pe comparaia ntre diferite niveluri ale scalei, ci pe poziia relativ pe care un individ o ocup ntr-o distribuie ale crei proprieti sunt cunoscute. O normalizare poate s fie realizat i din alte motive. Cnd vrem s lucrm cu diferite diferene inter i intraindividuale trebuie s prezentm poziiile indivizilor n valori ale unei scale de interval. Nici o piedic insurmontabil nu poate s apar la construcia instrumentelor de msur, dac acestea trebuie s msoare variabile de randament, care ofer de regul distribuii normale. ns, la alte tipuri de variabile este mai greu de realizat o distribuie normal. Exemplu, acele variabile care sunt msurate cu ajutorul unui inventar de personalitate sau chestionar de atitudini. Chiar cnd acceptm
79
AUREL STAN
premisele teoretice ale distribuiei normale a variabilei cercetate pe un continuum ipotetic, obinem, de regul, puternice distribuii asimetrice. n acest caz, asimetria este semnificativ, n alte cazuri poate fi mai puin evident, ns noi nu putem s apreciem n aceast situaie, dac valorile brute indic poziia indivizilor pe o scal de interval. Cnd acceptarea distribuiei normale este ndreptit i cnd se obine o distribuie asimetric a valorilor brute, aceasta semnific c instrumentul de msur nu indic ndreptit poziia relativ. n astfel de cazuri putem s normalizm distribuia asimetric a valorilor obinute, aceasta nseamn transformarea formei distribuiei, nct s obinem o distribuie normal a valorilor. n cazul n care avem distribuii care deviaz semnificativ de la distribuia teoretic GaussLaplace, putem normaliza aceste distribuiii prin repartizarea variabilelor ordonate n limite impuse de procentele teoretice ale distribuiei amintite anterior. Prezentm un tabel cu rezultate care sunt normalizate:
Nr.crt 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 X 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Valoare brut f Fc 7 7 4 11 8 19 6 25 13 38 16 54 7 61 11 72 19 91 13 104 24 128 14 142 6 148 16 164 7 171 4 175 Fcpm 3,5 9 15 22 31,5 46 57,5 66,5 81,5 97,5 116 135 145 156 167,5 173 p 0,020 0,051 0,085 0,125 0,180 0,262 0,328 0,380 0,465 0,557 0,662 0,771 0,828 0,891 0,957 0,988 Valoare standard normalizat Z -2,05 -1,64 -1,37 -1,15 -0,91 -0,84 -0,45 -0,31 -0,09 0,14 0,42 0,61 0,95 1,23 1,72 2,25
Tabelul 23. Tabelul conine n coloanele sale datele necesare pentru a normaliza o distribuie. Semnificaia simbolurilor din capul coloanelor este urmtoarea: X variabila brut distribuit pe variante de variaie; f frecvena simpl absolut; fc frecvena cumulat absolut fcpm frecvena cumulat de punct mediu exprimat n valori absolute; P- proporie care se obine prin mprirea fiecrei valori din coloana fcpm la valoarea numrul total al subiecilor (175) z valoarea variabilei centrate reduse care separ ntr-o curb normal Gauss proporia respectiv de subiecii de valoarea complementar pn la 100. Valoarea z egal cu 2,05 separ primii 2% din subieci de restul 98% Indiferent de transformarea aleas trebuie s fim contieni de limitele acestora. Cuantilajele au meritul simplitii care conduce la a amplifica diferenele minime ntre subiecii din centrul distribuiei (acolo unde se gsesc cei mai muli dintre subieci) i de a atenua aceste diferene la extremitile
80
distribuiei (care nu comport dect foarte puini subieci). Normalizarea pare s posede numeroase avantaje: msurile transformate sunt de nivel de interval i se distribuie normal, ceea ce faciliteaz interpretarea i aplicarea de metode de analiz care cer normalitatea distribuiilor (analiz de varian, regresie multipl). Totui, nu trebuie uitat c aceast metod duce la schimbarea formei distribuiei, fr ca s aib totdeauna raiunea teoretic de a o face. Transformarea msurilor originare permite de a ameliora interpretarea care poate fi fcut unui scor. Transformrile normative sunt cele mai cunoscute i cele mai vechi. Ele sunt legate de interesul pentru diferenele interindividuale. Transformrile legate de cadrul de referin predictiv i mai ales la msurile de referin criterial sunt opuse, cteodat n manier ideologic msurilor normative (este vorba de a lupta contra ierarhizrii subiective care permit msuri normative). n practic, nu exist transformri bune i transformri rele. Diferitele metode aduc informaii de natur diferit. Nevoile concrete ale psihologului practician sau ale cercettorului sunt cele ce impun alegerea celei mai bune forme de transformare a notelor brute.
BIBLIOGRAFIE

Albu, Monica, 1998, Construirea i utilizarea testelor psihologice, Editura CLUSIUM.,1998 Cluj Bernier, J.J., Pietrulewicz, B., 1997, La psychometrie, Gaetan Morin Editeur, Montreal, Paris, Casablanca Botez, C., 1971, Utilizarea testelor pentru depistarea si aprecierea aptitudinilor profesionale, n "Revista de Psihologie", t.17, nr.1/1971, Editura Academiei, Bucureti Cosmovici, A., 1971, Aplicarea testelor pentru determinarea nivelului de dezvoltare intelectuala, n "Revista de Psihologie", t.17, nr.1, Editura Academiei, Bucuresti Guillevic, Ch.,Vautier, S., 1998, Diagnostic et tests psychologique, Nathan, Paris Holban, I., 1995, Testele de cunotine, Editura didactic i pedagogic, R.A., Bucureti Horst, P., 1971, Messung und Vorhersage.Eine Einfhrung in die psychologische Testtheorie, Verlag Julius Beltz, Weinheim, Berlin, Basel Huteau, M., Lautrey J., 1995, valuer lintelligence, Presses Universitaire de France, Paris Laveault, D., Gregoire, J., 1997, Introductions aux theories des tests en sciences humaine, De Boeck & Larcier, Departament de Boech Universite, Paris, Bruxelles Lienert, G.A., 1967, Testaufbau und Testanalyse, Verlag Julius Beltz, Weinheim/Berlin Lussato, Ariane, 1998, Les tests de recrutement, Presses Universitaires de France, Paris Magnusson, D., 1969, Testtheorie, Verlag Frank Deuticke Wien Miclea, M., 1994, Psihologie cognitiv, Casa de Editur Gloria S.R.L., Cluj-Napoca Mitrofan, N., 1998, Testarea psihologic a copilului mic , Editura All, Bucureti Radu, I., 1991, Metode de cercetare n psihologie, n Introducere n psihologia contemporan (coord. I. Radu), Editura Sincron, Cluj
81
AUREL STAN
Rost, J., Golombock, Susan, 1989, Modern Psychometrics. The science of psychological assessement, Routledge, London and New York Roca, Mariana, 1972, Metode de psihodiagnostic, Editura Didactic i pedagogic, Bucureti Stan, A., 2002, Testul psihologic, Editura Polirom, Iai Stan, A., Hvrneanu, C., 1989, Utilizarea calculatorului n examinarea psihologic n Revista de Psihologie, Editura Academiei, Bucureti Szamoskzi, ., 1997, Psihometria clasic i evaluarea formativ, n "Cogniie, creier, comportament", Volumul I, nr.2, iunie 1997, Cluj Napoca.
82

Teoria Si Constructia Instrumentelor de Investigatie Psihologica Curs

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Teoria Si Constructia Instrumentelor de Investigatie Psihologica Curs

Încărcat de

Drepturi de autor:

Formate disponibile

SCOPUL UNITII DE CURS: Familiarizarea cursanilor cu problemele principale ale teoriei testului psihologic; Informarea cursanilor asupra principalelor

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

I. INTRODUCERE N TEORIA TESTULUI PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

Postulatul 2. Valoarea ateptat pentru scorul observat este scorul adevrat ( X ) = V

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

s t2 = variana total a testului;

s e2( m ) = variana erorii care este atribuit efectelor amintirii.

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

Cifra din parantez reprezint anul aparitiei lucrrii pe acest tem.

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

suma varianei itemilor i S 2 T = variana testului. Teoria clasic a testelor

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

S-a consultat ediia din anul 1994.

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

II. ANALIZA DE ITEMI

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

X11 X21 X31 X41 ... Xj1 .. XN1

X12 X22 X32 X42 .. Xj2 .. XN2

X13 X23 X33 X43 .. Xj3 . XN3

X14 X24 X34 X44 .. Xj4 . XN4

X1i X2i X3i X4i . Xji .. XNi

X1n X2n X3n X4n . Xjn .. XNn

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

Nr.crt. 1 2 3 4 5 6 7 8 9 10 11 fi pi qi si2 2 0,18 0,82 0,15

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

particular pentru calcularea excesului n general. 1 4 = 6 pq

dificultate se utilizeaz formula: pi =

fi , n care pi este indicele de dificultate, fi este suma valorilor f i max

Vezi Laveault, D., Gregoire, J., op. cit. pag 225

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

n Weil-Barais, A (coordinatrice), Les Mthodes en Psychologie, Bral , Rosny, 1997, pag.200-201.

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

sunt preluate din Paul Horst,op.cit.pag.112

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

1 1,00 0,44 0,15 0,66 0,35 0,77

2 0,44 1,00 0,66 0,26 0,91 0,44

3 0,15 0,66 1,00 0,66 0,35 0,77

ITEMI 4 0,66 0,26 0,66 1,00 0,24 0,44

5 0,35 0,91 0,35 0,24 1,00 0,35

6 0,77 0,44 0,77 0,44 0,35 1,00

Tabelul 15. Cuprinde date ilustrative pentru matricea de corelaii interitemi

Aceast matrice are date fictive i prezint doar o raiune exemplificativ.

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

III. CONSTRUCIA TESTULUI PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

TEORIA I CONSTRUCIA INSTRUMENTELOR DE INVESTIGAIE PSIHOLOGIC

Numarul de raspunsuri corecte *100 . Numarul total de itemi