01.N Mitrofan Bazele Psihodiagnosticului

NICOLAE MITROFAN
BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE
UNIVERSITATEA DIN BUCURETI FACULTATEA DE PSIHOLOGIE I TIINELE EDUCAIEI DEPARTAMENTUL DE NVMNT LA DISTAN
BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE ANUL II
Prof. univ. dr. NICOLAE MITROFAN
Universitatea din Bucureti Editura CREDIS 2008
Copyright DEPARTAMENT ID 2008
NICOLAE MITROFAN
Acest material este destinat uzulului studenilor Universitii din Bucureti, forma de nvmnt la distan. Coninutul cursului este proprietatea intelectual a autorului/autorilor; designul, machetarea i transpunerea n format electronic aparin Departamentului de nvmnt la Distan al Universitii din Bucureti.
Universitatea din Bucureti Editura CREDIS Bd. Mihail Koglniceanu, Nr. 36-46, Corp C, Etaj I, Sector 5 Tel: (021) 315 80 95; (021) 311 09 37, 031 405 79 40, 0723 27 33 47 Fax: (021) 315 80 96 Email: credis@credis.ro Http://www.credis.ro
NICOLAE MITROFAN
Module:
Modulul 1 Situaia psihodiagnosticului n lume i n ara noastr Modulul 2 Testul psihologic ca mijloc de evaluare Modulul 3 - Caracteristicile psihometrice ale testului psihologic Modulul 4 - Analiza itemului Modulul 5 Etalonarea i standardizarea testelor Modulul 1 Situaia psihodiagnosticului n lume i n ara noastr Unitatea de nvare 1: Precizri prealabile privind evaluarea psihologic Unitatea de nvare 2: Contribuii la dezvoltarea psihodiagnosticului n secolul XX Unitatea de nvare 3: Tendine i direcii de dezvoltare a psihodiagnosticului la nceputul mileniului III. Unitatea de nvare 4. Situaia psihodiagnosticului din Romnia n perioada actual Modulul II Testul psihologic ca mijloc de evaluare Unitatea de nvare 1: Testul psihologic Unitatea de nvare 2: Clasificarea testelor psihologice Unitatea de nvare 3: Testul psihologic i Codul deontologic Modulul III Caracteristici psihometrice ale testului psihologic Unitatea de nvare 1: Ce sunt caracteristicile psihometrice ? Unitatea de nvare 2: Fidelitatea testului Unitatea de nvare 3: Validitatea testului Unitatea de nvare 4: Testul psihologic i selecia profesional Modulul IV Analiza itemului 2
NICOLAE MITROFAN
Unitatea de nvare 1: Ce este analiza itemului ? Unitatea de nvare 2: Gradul de dificultate al itemului Unitatea de nvare 3: Capacitatea de discriminare a itemului Modulul V Etalonarea i standardizarea testelor Unitatea de nvare 1: Definirea conceptelor i etapele construirii testului Unitatea de nvare 2: Modele de scale utilizate n etalonare i standardizare
NICOLAE MITROFAN
MODULUL I
SITUATIA PSIHODIAGNOSTICULUI N LUME SI N ARA NOASTR
NICOLAE MITROFAN
Bazele teoretice ale evalurii psihologice

Module:
Modulul 1 Situaia psihodiagnosticului n lume i n ara noastr Modulul 2 Testul psihologic ca mijloc de evaluare Modulul 3 - Caracteristicile psihometrice ale testului psihologic Modulul 4 - Analiza itemului Modulul 5 Etalonarea i standardizarea testelor Modulul 1 Situaia psihodiagnosticului n lume i n ara noastr Unitatea de nvare 1: Precizri prealabile privind evaluarea psihologic Unitatea de nvare 2: Contribuii la dezvoltarea psihodiagnosticului n secolul XX Unitatea de nvare 3: Tendine i direcii de dezvoltare a psihodiagnosticului la nceputul mileniului III. Unitatea de nvare 4. Situaia psihodiagnosticului din Romnia n perioada actual Modulul II Testul psihologic ca mijloc de evaluare Unitatea de nvare 1: Testul psihologic Unitatea de nvare 2: Clasificarea testelor psihologice Unitatea de nvare 3: Testul psihologic i Codul deontologic Modulul III Caracteristici psihometrice ale testului psihologic Unitatea de nvare 1: Ce sunt caracteristicile psihometrice ? Unitatea de nvare 2: Fidelitatea testului Unitatea de nvare 3: Validitatea testului
NICOLAE MITROFAN
Unitatea de nvare 4: Testul psihologic i selecia profesional Modulul IV Analiza itemului Unitatea de nvare 1: Teoria rspunsului la item Unitatea de nvare 2: Gradul de dificultate al itemului Unitatea de nvare 3: Capacitatea de discriminare a itemului Modulul V Etalonarea i standardizarea testelor Unitatea de nvare 1: Definirea conceptelor Unitatea de nvare 2: Etapele etalonrii i standardizrii testului psihologic Unitatea de nvare 3: Modele de scale utilizate n etalonare i standardizare
NICOLAE MITROFAN
Cteva precizri prealabile.... Iat, aadar, o nou disciplin cu care vei face cunotin nc de la nceputul anului II. Ea are un titlu tentant, desigur....evaluarea psihologic a individului uman....deci, vom putea s msurm pe cineva i s aflm cum st n legtur cu diferite componente ale personalitii. Vom ti ct este de inteligent, ct este de creativ, ct este de emotiv, ct este de sociabil, ct este de echilibrat, ce fel de temperament are, ce trsturi caracteriale are, ct de dezvoltate i sunt anumite aptitudini etc.,etc. Putem s ne pronunm asupra cuiva n legtur cu coeficientul de inteligen (QI), coeficientul de dezvoltare (QD), coeficientul de creativitate (QKre), coeficientul emoional (QE), coeficientul de personalitate (QP) etc. Pi, nu este formidabil s avem asemenea posibiliti noi psihologii ? Evident c da i pentru a face diverse evaluri putem apela la mai multe metode i mijloace, ns noi ne vom concentra , mai ales, asupra testelor psihologice. Nu exist sector al activitii umane n care s nu fie necesar realizarea evalurii psihologice cu ajutorul testelor. Acestea sunt extrem de multe (unii autori apreciaz c ar fi vorba de zeci de mii n lume), ns ele pot fi grupate n diferite categorii, n funcie, n special de obiectivul urmrit n evaluare. Exist ns i anumite pericole...dar nu dorim s speriem pe nimeni nc de la nceput. Un pericol ar fi cel legat de utilizarea necorespunztoare a testului. Ar fi ca i cum am folosi un cntar defect pentru a stabili greutatea cuiva. Fiind defect, ntr-o zi ar arta o anumit greutate, n alt zi, o greutate total diferit. Revenind n domeniul psihologiei, folosind, de exemplu, n mod greit un test de inteligen, s-ar putea ca, la o prim testare, subiectul s apar ca fiind genial i, la o alt testare, el s apar ca fiind deficient intelectual. Un alt pericol ar fi cel al, zicem noi, delegrii de rspundere, adic psihologul confer putere absolut testului, el neavnd niciun fel de implicare n analizarea i, mai ales, interpretarea rezultatelor. De aceea, un mare psiholog, pe nume L. Szondi, a prevenit pe toi psihologii, din toate domeniile aplicative, spunndu-le: face mai mult un psiholog fr teste, dect mai multe teste fr psiholog. Poate c nu nelegei exact ce a vrut s spun acest autor celebru, dar eu v rog mult s-i reinei spusele, deoarece, dac vei practica psihologia, va trebui, cu siguran, s vi le amintii mereu. Revenind la pericole, exit i multe altele, dar nu dorim s le expunem pe toate nc de pe acum. Ele vor reiei dup ce vei parcurge toate modulele i, mai ales, dup ce v vei ntlni direct cu diferite categorii de teste. Am mai avea, ns o mare rugminte. S nu dai uitrii ce ai nvat n anul I, mai ales la statistica aplicat n psihologie. tim, tim foarte bine c cei care vin spre domeniul psihologiei nu s-au manifestat prea pozitiv fa de matematic i, n general, fa de tiinele exacte. Din nefericire ns pentru ei, la psihologie, nc din anul I apare....statistica iar desprirea de ea este considerat de unii ca fiind pentru totdeauna. Evaluarea psihologic, psihodiagnosticul, mai ales, presupune cunoaterea i utilizarea unor elemente de statistic, aa c, rugm nc o dat s cutai sursele de informare i s v reactualizai cunotinele privind statistica aplicat n psihologie. i dac ne-am neles pn aici, v propunem s ne apropiem de modulele pe care le oferim, ncepnd, desigur, cu MODULUL I. V dorim mult succes !!!
NICOLAE MITROFAN
Modulul 1 Situaia psihodiagnosticului n lume i n ara noastr
Unitatea de nvare nr. 1 Precizri prealabile privind evaluarea psihologic Cuprins: 1.1. Delimitri conceptuale 1.2. De cnd a nceput, de fapt, evaluarea psihologic ? 1.3. Cine este considerat printele psihodiagnosticului ?
Obiective: La sfritul acestei uniti de nvare studenii vor fi capabili s: defineasc corect noiunea de evaluare psihologic s diferenieze evaluarea psihologic tiinific de cea empiric cunoasc ce criterii utilizm pentru a stabili marile perioade de evoluie a evalurii psihologice cunoasc unele dintre cele mai vechi preocupri privind evaluarea psihologic cunoasc cine este considerat printele psihodiagnosticului
1.1. Delimitri conceptuale Exist, ntr-adevr, mai multe concepte care sunt folosite pentru a evidenia posibilitatea de msurare i cunoatere a diferitelor aspecte i componente ale vieii psihice. Am putea enumera cteva: evaluarea psihologic, psihodiagnoza, msurarea psihologic, testarea psihologic. n literatura anglo-saxon, pe care noi, la aceast disciplin, ne bazm n cea mai mare msur, sunt frecvent utilizai termenii: psychological testing (testarea psihologic), psychological assessment (msurare psihologic) i, mult mai rar, psychological evaluation (evaluare psihologic). Desigur, nu sunt diferene foarte mari ntre nelesurile i sensurile acestor concepte. Ceea ce 8
NICOLAE MITROFAN
este comun pentru toate este faptul c actionm asupra individului (subiectului) cu anumite metode, mijloace, instrumente n vederea obinerii unor informaii privind diferite aspecte i componente ale psihismului. Psihodiagnoza este aciunea de aplicare a testelor, care, la rndul lor, au obiective foarte precise. Avem nevoie s cunoatem nivelul de dezvoltare intelectual, aplicm teste de inteligen, avem nevoie s cunoatem nivelul de dezvoltare a capacitilor mnezice, aplicm teste de memorie .a.m.d. Deci, noiunile de testare psihologic i de psihodiagnostic au cam acelai neles. Msurarea psihologic nseamn ceva mai mult dect testarea psihologic, deoarece ea se poate face folosind nu numai testele psihologice, ci i alte modaliti de msurare, cum este cazul diferitelor scale de msurare a opiniilor, atitudinilor etc. Evaluarea psihologic, cel puin dup prerea noastr, implic aciunile de testare i de msurare dar nu se rezum numai la acestea, ci, n mod obligatoriu, ea necesit aciunile de interpretare a rezultatelor, de integrare a lor ntr-un set de informaii care s descrie ct mai corect i ct mai exact situaia subiectului. Deci, dei nu n exclusivitate, testarea i msurarea psihologic se centreaz mai mult asupra aspectelor de ordin cantitativ, n timp ce evaluarea psihologic se centreaz mai mult asupra aspectelor de ordin calitativ. n general, evaluarea psihologic se finalizeaz cu un Raport n cadrul cruia regsim incluse rezultatele examinrii sau msurrii psihologice (de exemplu, coeficientul de inteligen - QI = 125) dar i: a) judeci apreciative privind starea subiectului (normal, anormal, deficitar etc.); b) conturarea unor cauze care au dus la apariia acelei stri; c) formularea unor recomandri privind aciunile ce se impun n legtur cu subiectul (aciuni educaional-recuperative, psihoterapeutice etc.). Aadar, dintre toate noiunile luate n discuie, evaluarea psihologic pare a avea sfera cea mai mare, dei, trebuie s recunoatem c, n literatura de specialitate, nu exist un consens referitor la utilizarea acestui concept. De altfel, nici noi, n cadrul acestei discipline, nu vom utiliza predominant noiunea de evaluare psihologic, deoarece interesul central al nostru va fi orientat ctre locul i rolul pe care l ocup testele psihologice n activitatea psihologului. S vedem acum ce diferene exist ntre alte dou noiuni pe care le ntlnim frecvent: psihodiagnostician i psihotehnician. Lucrurile nu sunt foarte complicate, important este s le nelegem bine. Psihodiagnosticianul este persoana abilitat s aplice testele i s elaboreze Raportul final de evaluare. Deci, psihodiagnosticianul este cel care face, de fapt, evaluare psihologic. El are, obligatoriu, pregtire academic (n cadrul departamentelor de psihologie), la care se adaug o ndelungat activitate practic. Sunt unele teste extrem de complexe, care necesit mult timp pentru formare, ceea ce nseamn c nu este suficient doar activitatea de familiarizare din timpul anilor de studenie. Este cazul, dup cum o s vedei, a unor teste de personalitate, a unor teste de inteligen, a unor teste proiective. Psihotehnicianul este cel care nva s aplice bine i corect anumite teste i, bineneles, este vorba tot despre testele complexe. Rezultatele obinute le nainteaz specialistului, psihodiagnosticianului,
NICOLAE MITROFAN
abinndu-se de la orice fel de prelucrare i, mai ales, interpretare. n practic, psihotehnicianul poate fi i o persoan care nu are pregtire n domeniul psihologiei, dar care a nvat s aplice un test sau mai multe teste respectnd strict cerinele din cadrul manualelor acestor instrumente psihodiagnostice. S mai spunem cteva cuvinte i n legtur cu noiunea de testare. Ea a cptat n ultimul timp o extindere foarte mare, fiind ntlnit n multe domenii, cu nelesul de verificare. De exemplu, n domeniul tehnic, vorbim de aciunea de testare a unor materiale, a unor motoare, a unor mijloace de transport etc. n domeniul medical-farmaceutic, vorbim de testarea unor medicamente, a unor substane, a unor instrumente etc. n domeniul aeronautic i cosmic vorbim de testarea unor aeronave, a unor rachete. Nu n ultimul rnd, n domeniul militar, se vorbete despre testarea unor arme noi, a unor noi mijloace de comunicare, de simulare etc. n domeniul psihologiei, aciunea de testare nu se rezum doar la cea de verificare, ci ea are un neles destul de diferit, dup cum, de altfel, am spus mai sus. De aceea, este bine ca s fie folosite permanent sintagmele test psihologic i testare psihologic, tocmai pentru a pstra specificul acestora i a le feri de unele confuzii sau limitri. Trebuie, de asemenea, s facem o difereniere clar a ceea ce nseamn evaluare psihologic empiric i evaluare psihologic tiinific. Cea empiric este de tip impresiv, ochiometric dup cum spun unii, adic se bazeaz pe rezultatele cunoaterii nemijlocite, directe, apelnd la simuri. Subiectul X este ceea ce vd c este sau ceea ce face. Multi printi spun, cu convingere, c i cunosc foarte bine proprii copii, cadrele didactice, de asemenea, vor afirma, cu trie, c i cunosc bine elevii cu care lucreaz. i nu au dreptate ? Ar fi nedrept din partea noastr s folosim un Nu categoric. Problema este c un asemenea mod de a cunoate i de a evalua prezint multe riscuri, deoarece, frecvent, intervine subiectivismul evaluatorului, adic, n actul evalurii intervin factori ce in de psihologia i de personalitatea acestuia. De regul, prinii au o imagine mult mai pozitiv despre copiii lor dect sunt acetia n realitate. n cazul lor, factorul principal care intervine ine de afectivitatea manifestat fa de copii (i nu trebuie s fie, neaprat, criticai pentru aceasta). Evaluarea psihologic tiinific are, nainte de toate, un caracter obiectiv, deoarece ea se bazeaz pe utilizarea unor mijloace tiinifice, cum este cazul testelor psihologice. Informaia recoltat cu ajutorul lor trebuie s aib prioritate n cunoaterea i evaluarea psihologic a subiectului. Numai cunoscnd adevrata realitate psihologic putem s ne pronunm asupra faptului dac aceasta este echilibrat, normal sau, dimpotriv, ea necesit intervenii de tip educaional, recuperator sau psihoterapeutic. Tem de reflecie/autoevaluare: Enumerai mai multe consecine posibile ale utilizrii exclusive de ctre cadrul didactic a evalurii psihologice empirice. 1.2. De cnd a nceput, de fapt, evaluarea psihologic ? Este greu de precizat exact, ns ea a nceput, sigur, cu foarte muli ani nainte
10
NICOLAE MITROFAN
de apariia psihologiei ca tiin. Evalurile psihologice erau fcute mai ales n scopuri juridice, adic de a determina dac cel nvinuit spune sau nu adevrul referitor la o anumit fapt. Mijloacele folosite (s zicem, pe post de teste) erau rudimentare i, uneori, extrem de dure i de agresive. Putem meniona cteva: - cel nvinuit trebuia s ating foarte repede cu limba un obiect nroit n foc. Dac rmneau urme, acestea constituiau dovada c respectivul este adevratul vinovat; - acuzatul trebuia s nghit foarte repede o anumit cantitate de orez fiert i dac reuea, era absolvit de vinovie; - mai muli suspeci erau pusi in linie i lsai mai mult timp s priveasc un acelai obiect i cel care se nroea cel mai mult la fa era considerat vinovat. Mai muli autori (Gregory, 1996; Stan, A., 2002) arat c unele forme rudimentare ale testrii psihologice le putem regsi n serviciile publice ale Chinei antice nc din anul 2200 .e.n. Funcionarii erau supui, la fiecare trei ani, unei forme de examinare, urmrindu-se gradul de potrivire al acestora cu cerinele postului pe care l ocupau. Pe msur ce trecea timpul se producea i o mbuntire a modului de examinare, astfel c, ncepnd cu anul 202 .e.n., pe timpul dinastiei Han a fost introdus un examen scris la mai multe materii i anume: legislaie civil, probleme militare, agricultura, fiscalitatea i geografia. Avnd n vedere vremurile la care se face trimitere, trebuie s apreciem, totui, ingeniozitatea celor care au creat un fel de sistem de selecie n trepte: a) examinarea preliminar, sarcina subiecilor fiind aceea de a compune un poem n baza unei teme oferite, fiind obligai s stea o zi i o noapte ntr-o camer relativ mic. Procentele de reuit se nscriau ntre 1 i 7; b) cei reuii n prima etap treceau la o nou faz, numit district de examinare; aici gradul de examinare i evaluare a candidailor era mult mai dificil, acetia fiind supui, timp de 3 zile i 3 nopi, la 3 sesiuni separate. i aici, procentul de reuit era destul de mic i anume, ntre 1 i 10; c) a treia i ultima faz avea loc la Pekin. 3% dintre candidai reueau s depeasc i aceast faz, primind titlul de mandarin, ceea ce nsemna c avea dreptul s fie ales pentru poziia de nalt funcionar public. Ce urmrea, de fapt, acest sistem de selecie profesional, dei aceast sintagm nu era folosit n acele vremuri ? In primul rnd, depistarea unor capaciti sau a unor aptitudini necesare pentru ocuparea unui post de funcionar public. Era vorba, mai ales, despre frumuseea scrisului i claritatea exprimrii, condiii de baz pentru a asigura o bun comunicare. Deci, pe baza acestor nsuiri se putea face predicii privind eficiena n exercitarea funciilor publice. Problema formelor de examinare i evaluare psihologic utilizate nainte ca psihologia s devin tiin a preocupat pe mai muli autori. Astfel, putem aminti exemplele oferite de ctre profesorul german Hofstter, P., 1971 (apud Stan, A., 2002): a) n riturile de iniiere ale societilor primitive erau folosite anumite probe prin intermediul crora se stabilea dac cei investigai, n special tinerii, erau n posesia unor capaciti necesare pentru asumarea responsabilitilor specifice adulilor, cum ar fi: curajul, stpnirea de sine, calitile raionamentului; b) n scrierile lui Platon, dedicate statului, se regsesc precizri privind modul n care erau recrutai rzboinicii n
11
NICOLAE MITROFAN
comunitatea ideal, acetia trebuind s dovedeasc, mai ales, autodisciplin, curaj, incoruptibilitate. Dei aceste prime forme de evaluare psihologic sunt departe de cerinele de ordin tiinific de care trebuie s in seama cei care se ocup de selecia profesional n zilele noastre, trebuie s apreciem faptul c ele i-au dovedit utilitatea n acele vremuri i, pe de alt parte, au influenat pe cei care, ulterior, s-au ocupat n mod serios de problema mijloacelor folosite. Dup cum vom vedea mai trziu, testul psihologic nu este echivalent cu punerea la ncercare a subiectului. n baza rezultatelor obinute se fac predicii n legtur cu comportamentul subiectului. Tem de reflecie/autoevaluare: Care ar fi consecinele dac i astzi s-ar utiliza n activitatea de evaluare psihologic numai proba punerii la ncercare a subiectului ?
1.3. Cine este considerat printele psihodiagnosticului ? Dei foarte muli psihodiagnosticieni l consider pe A. Binet printele psihometriei, n special datorit faptului c el a construit, n 1905, mpreun cu T. Simon, prima scal metric a inteligenei, n mai toate manualele i tratatele privind testarea psihologic anul de natere al psihodiagnozei este considerat a fi 1890. n acel an, James McKeen Cattell a publicat, n revista Mind, articolul Mental Tests and Measurements. Ar nsemna, normal, c acest autor ar fi printele testelor i, respectiv, al psihometriei. Dar asemenea preocupri privind paternitatea unor termeni nu prea i au rostul, deoarece psihometria are o istorie mult mai complex, nainte de sfritul secolului al XIX-lea i nceputul secolului XX muli autori avnd, prin activitatea intens desfurat, o parte de contribuie la crearea acestui domeniu extrem de important, dar i foarte controversat al tiinei psihologice. I-am putea aminti, n acest sens, pe Fr. Galton, Ernst Weber, Gustav Fechner, Herman Helmholtz .a. Desigur, nu-l putem uita pe Wilhelm Wundt, cel care a nfiinat primul laborator de psihologie experimental, la Leipzig, n 1879. El a folosit, de altfel, pentru prima dat termenul de psihometrie, publicnd articolul Psychometrics Experiments n revista Brain. James McKeen Cattell a fost studentul lui W. Wundt la Leipzig, ocupndu-se n cadrul tezei sale de doctorat, de diferenele individuale privind timpul de reacie. Dup terminarea tezei a predat la Bryn Mawr i la Universitatea din Pennsylvania, ntorcndu-se apoi n Europa pentru a preda la Universitatea din Cambridge. Aici l-a ntlnit pe Fr. Galton, ntlnire ce-l va marca pentru toat perioada de dup ntoarcerea sa n SUA, mai nti, la Universitatea din Pennsylvania i, apoi, la Universitatea Columbia. Meritele sale sunt multiple: pe lng faptul c a pus bazele mai multor publicaii, cum ar fi Psychological Review, Science, American Men of Science, James McKeen Cattell a fundat i celebra The Psychological Corporation. Printre studenii nscrii la docotorat sub conducerea sa exist i cteva nume celebre astzi: E.L. Thorndike (1898), care a avut mari contribuii la dezvoltarea teoriilor
12
NICOLAE MITROFAN
nvrii i, totodat, la dezvoltarea psihologiei educaionale; R.S. Woodworth (1899), care a publicat n 1938 unul dintre cele mai cunoscute i mai influente tratate de Psihologie experimental ; E.K.Strong (1911), autorul testului Vocational Interest Blank, rmas n uz i astzi, dup ce a fost revizuit. Un alt doctorand al su, dei din nefericire mai puin cunoscut, a fost Clark Wissler (1901), cel care, dup unii autori (Gregory, 1996), a avut o influen covritoare asupra istoriei timpurii a testrii psihologice. El a reuit s coreleze scorurile la un test mintal aplicat unui numr de peste 300 de studeni de la Columbia University i Barnard College cu rezultatele lor academice. Intenia lui era aceea de a demonstra c rezultatele la test pot fi folosite pentru prognozarea performanei academice, ns cercetrile efectuate nu au confirmat ateptrile sale. Odata cu publicarea, n 1901, a unor asemenea rezultate descurajatoare, psihologii experimentali au renunat la utilizarea timpului de reacie (RT) i a discriminrii senzoriale ca instrumente de msur a inteligenei. Dup cum o s vedei i la alte discipline, timpul de reacie este un indicator al manifestrilor temperamentale i nu al inteligenei. Printre studenii lui W. Wundt s-au numrat i alte nume sonore ale psihologiei universale i anume: Charles Spearman, Victor Henri, Emil Kraepelin, E.B. Titchener, G. Stanley Hall, Lightner Witmer. Spearman este creditat ca fiind cel ce a creat conceptul psihometric de fidelitate a testului (test reliability). Francezul Victor Henri a colaborat cu A. Binet, sugernd modul n care pot fi utilizate testele mintale pentru a msura procesele mintale nalte. E. Kraepelin, de formaie psihiatru, a fost primul experimentator al tehnicii asocierii verbale n calitate de test formal. Leightner Witmer, dup ce i-a luat doctoratul la Leipzig, rentors n SUA, a devenit succesorul lui James McKeen Cattell la postul de director al Laboratorului de psihologie din cadrul Universitii Pennsylvania. n 1897 el a nfiinat prima clinic psihologic din America, tot la Universitatea din Pennsylvania, iar n 1907 a scos revista Psychological clinic, n cadrul creia a publicat articolul Clinical Psychology. n felul acesta el a devenit printele psihologiei clinice, dei este puin cunoscut n aceast calitate (McReynolds, 1987). n afar de psihologi, cei care au contribuit foarte mult, chiar dac nu direct, la crearea psihometriei sunt filosofii. Este vorba de o serie de lucrri aprute n secolele XVII, XVIII i XIX, care cuprind idei ce vor influena foarte mult cercetrile i formulrile din domeniul tiinelor comportamentale (Gregory, 1996). Astfel, filosoful i matematicianul Rn Descartes s-a ocupat mult de problema modului n care sunt relaionate procesele mentale i procesele fizice. John Locke, n lucrarea An Essay Concerning Human Understanding, i expune punctul de vedere conform cruia cunotinele provin din experien, idee pe care o regsim i n lucrrile altor empirici britanici: A treatise Concerning the Principles of Human Knowledge (George Berkeley); A treatise on Human Nature (David Hume); Observations on Man, his Frame, his Duty and his Expectations (David Hartley). Christian von Wolff a publicat dou lucrri, Psychologica empirica (1732) i Psychologica rationalis (1734), prin intermediul crora lanseaz termenul psihologie. De
13
NICOLAE MITROFAN
asemenea, dup unii autori (Cohen et al., 1996), el este primul care concepe psihometria ca tiin. Indiferent ns de disputele privind paternitatea unei noiuni sau a alteia, putem afirma c, n perioada ultimelor dou secole ale mileniului II, s-a produs, n domeniul psihologiei, un salt extraordinar prin promovarea metodelor cantitative n tiina psihologic. Deci, fenomenele psihice, prin excelen subiective, pot fi msurate i evaluate matematic. S-a rspuns n felul acesta uneia dintre cele mai serioase acuze datorit creia psihologiei nu i s-a acceptat mult timp statutul de tiin. Nu tim, astzi, ct de mult au neles acest lucru contemporanii perioadei la care facem referire, ns noi, la mai bine de un secol de atunci, nu putem s nu ne exprimm recunotina fa de toi cei care au contribuit la realizarea acestei construcii extrem de importante pentru evoluia ulterioar a psihologiei: psihometria. Tem de reflecie/autoevaluare: De ce este dificil s susinem faptul c exist un singur printe al psihometriei sau a psihodiagnosticului ?
ntrebri de autoevaluare
1. Ce nelegem prin termenul de psihodiagnoz ? 2. Ce nelegem prin termenul de evaluare psihologic ? 3. Care sunt noiunile, ce se refer la evaluarea psihologic , vehiculate mai frecvent n literatura de specialitate ? 4. Prin ce se deosebete un psihodiagnostician de un psihotehnician ? 5. De ce psihologul trebuie s promoveze n mod consecvent evaluarea psihologic tiinific ? 6. Care sunt cele mai vechi forme ale testrii psihologice ? 7. Ce putem reproa celor care utilizau asemenea forme ? 8. Cui putem acorda paternitatea conceptului de psihometrie ? 9. Care sunt meritele principale ale lui A. Binet privind dezvoltarea psihometriei ? 10. Care sunt meritele principale ale lui James McKeen Cattell privind dezvoltarea psihometriei ? 11. Care sunt contribuiile lui W. Wundt i ale doctoranzilor si la dezvoltarea psihodiagnosticului ? 12. Cu ce au contribuit i unii filosofi la dezvoltarea psihometriei ? 13. Ai putea s precizai care este locul i rolul testelor n selecia profesional ? BIBLIOGRAFIE MINIMAL ALBU, M. (2000). Metode i instrumente de evaluare n psihologie, Cluj-Napoca: Argonaut. MITROFAN, N. (2001), Psihometria i direciile ei de dezvoltare la nceput de mileniu. n ZLATE M. (coord.), Psihologia la rspntia mileniilor. Iai: Polirom. SCHIOPU, U. (2003), Introducere n psihodiagnostic. Bucureti: Editura Pro-Humanitas. STAN, A. (2002). Testul psihologic.Evoluie, construcii, aplicaii. Iai: Polirom. GREGORY, R.J. (1996). Psychological testing. History, Principles, and Applications. Needham
14
NICOLAE MITROFAN
Heights: Allyn & Bacon. COHEN, R.J. et al. (1996). Psychological Testing and Assessment. An Introduction to Tests and Measurement. Mayfield Publishing Company, Mountain View, ed. a 3-a.
15
NICOLAE MITROFAN
Unitatea de nvare nr. 2 Contribuii la dezvoltarea psihodiagnosticului n secolul XX Cuprins: 2. 1. Testele de inteligen 2. 2. Testele de personalitate 2.3. Testele de aptitudini 2.4. Testele de achiziii 2.5. Modele de testare clinic
Obiective: La sfritul acestei uniti de nvare studenii vor fi capabili s: cunoasc principalele contribuii privind testele de inteligen cunoasc principalele contribuii privind testele de personalitate cunoasc principalele contribuii privind testele de aptitudini cunoasc principalele contribuii privind testele de achiziii cunoasc principalele contribuii privind testele folosite n clinic evalueze critic toate contribuiile privind psihodiagnoza de pn la sfritul sec. XX. 2.1. Testele de inteligen Printre primele teste care au aprut la nceputul secolului XX au fost testele de inteligen. Dup ce A. Binet i colaboratorul su, T. Simon, au creat prima scal metric a inteligenei, ce cuprindea 30 de itemi, destinat identificrii copiilor colari retardai mintal din Paris, s-a produs o intensificare fr precedent a interesului practicienilor pentru aceste instrumente. Ele vor fi aplicate n coli, nchisori, tribunale pentru copii etc. Testul lui Binet a fost supus unor multiple revizuiri i traduceri, att n Europa, ct i, mai ales, n America. Revizuirea fcut de L. Terman, n 1916, confer acestui test denumirea de Stanford-Binet Intelligence Scale (Scala de inteligen StanfordBinet). Testul lui Binet a fost un test individual, ns odat cu declanarea primului rzboi mondial a aprut cerina creerii unor teste care s poat fi aplicate pe grupuri mai mari de subieci i ntr-un timp mai scurt. Aa au aprut testele de grup pentru abilitile umane (the Army Alpha i the Army Betha), create de un colectiv de psihologi avndu-l n frunte pe Roberet Yerkes, care deinea i funcia de preedinte al Asociaiei Psihologilor Americani.
16
NICOLAE MITROFAN
Odat cu apariia testelor de grup, a crescut interesul i pentru alte categorii de teste, cum ar fi testele de aptitudini, testele de achiziii, testele de interese, testele de personalitate, dei distincia dintre ele nu era ntotdeauna uor de fcut. Cu puin nainte de declanarea celui de-al doilea rzboi mondial, mai exact n 1939, David Wechsler a publicat prima versiune a Scalelor de inteligen Wechsler, i anume, The Wechsler-Bellevue Intelligence Scale (WB), moment de cotitur n psihometrie, deoarece aducea unele nouti n ceea ce privete testarea inteligenei. Astfel, printre altele, spre deosebire de testul Stanford-Binet, care permitea calcularea doar a unui scor QI, acest nou instrument psihodiagnostic fcea posibil calcularea mai multor scoruri i, totodat, stabilirea profilului individual ca urmare a combinrii abilitilor. Ca o noutate absolut apare posibilitatea calculrii QI performan. Cele dou mari baterii de inteligen au fost supuse unor revizuiri repetate, fiecare dintre ele avnd ca obiectiv de baz mbuntirea caracteristicilor lor psihometrice. Ele s-au impus, n practica psihodiagnostic, ca cele mai de valoare teste, gradul de ncredere acordat rezultatelor obinute cu ajutorul lor fiind maximal. De altfel, ele au fost preluate, traduse i standardizate n foarte multe ri, inclusiv n ri din Europa. Tem de reflecie/autoevaluare: Care sunt asemnrile i care sunt deosebirile dintre cele dou mari baterii de inteligen: Stanford-Binet i Wechsler-Bellevue ? 2.2. Testele de personalitate Dup al doilea rzboi mondial ncep s prolifereze testele de personalitate, care i propun s msoare diferite trsturi considerate a fi dispoziii relativ de durat care difereniaz un individ de altul (Kaplan i Saccuzzo, 1993). De altfel, primul test de personalitate a fost elaborat n timpul primului rzboi mondial, purtnd numele de Woodworth Personal Data Sheet (Gregory, 1996). Fiind publicat n form final dup rzboi, acest test devine reprezentativ pentru categoria de teste structurate de grup gen creion-hrtie. Aceste teste erau prevzute cu rspunsuri de tip Adevrat/Fals sau cu rspunsuri multiple la alegere, ceea ce fcea ca ele s poat fi aplicate pe grupuri mari de subieci. Interesul pentru asemenea tipuri de teste a sczut mult pn n anii 30 40, pentru ca, dup cel de-al doilea rzboi mondial, s creasc din nou. n 1921, n Europa, mai exact n Elveia, Herman Rorschach a publicat testul ce-i poart numele, Testul Rorschach, deschiznd astfel calea pentru o nou categorie de teste i anume, testele proiective. Testul a fost introdus n America de ctre David Levy mult mai trziu, fiind primit cu mult circumspecie. Abia dup ce un student al lui Levy, Sam Beck i-a investigat tiinific proprietile i a comunicat rezultatele n cadrul tezei sale de doctorat, s-a produs o cretere rapid a intersului pentru acest test i, apoi, pentru testele proiective. Una dintre dovezi o constituie dezvoltarea, n 1953, de ctre Henry Murray i Christina Morgan a testului numit the Tematic Apperception Test (TAT), mult mai structurat dect testul Rorschach. n
17
NICOLAE MITROFAN
1928, A.F. Payne a propus tehnica completrii frazei, care consta, n principiu, n a oferi subiectului un nceput de fraz (o rdcin), de exemplu: Sunt foarte preocupat cnd, acesta vnd sarcina de a completa fraza respectiv. O alt contribuie remarcabil legat de categoria testelor proiective a avut-o F.L. Goodenough, care a ncercat s determine nu numai nivelul intelectual, ci i interesele i trsturile de personalitate ale copiilor pe baza analizei desenelor acestora. Dar o variant mult mai bine structurat i standardizat a testelor de desen a aprut n anul 1948, sub denumirea Testul House-Tree-Person i legat de numele lui J. Buck. n Europa testarea proiectiv era dominat de Testul Szondi, elaborate de L. Szondi, psihiatru elveian de origine maghiar. Referitor la coninutul testului, acesta consta din 48 de fotografii ale unor pacieni psihiatri, mprite n 6 seturi cuprinznd urmtoarele 8 tipuri: homosexual, epileptic, sadic, isteric, catatonic, paranoic, maniac i depresiv. In concepia autorului tulburrile psihiatrice majore sunt cauzate de gene recesive. Un alt autor, S. Deri a adus acest test in SUA ns a renunat la explicaiile lui Szondi. Dup opinia lui alegerea fotografiilor s-ar datora identificrii incontiente a subiectului cu caracteristicile pacienilor fotografiai. Un moment crucial n evoluia testelor de personalitate l reprezint dezvoltarea, n anul 1943, a Inventarului Multifazic de Personalitate Minnesota (Minnesota Multiphasic Personality Inventory MMPI). Spre deosebire de testele de personalitate structurate, de genul testului Woodworth, autorii testului MMPI au argumentat c nelesul rspunsurilor la test poate fi determinat prin cercetri empirice. Dup aproape o jumtate de secol de utilizare, MMPI va aprea ntr-o nou versiune, respective, MMPI-2 (Butcher, 1989, 1990). n toat aceast perioad el s-a impus ca unul dintre cele mai utilizate teste de personalitate, n legtur cu el fiind elaborate multe mii de lucrri. Un alt test de personalitate celebru, care a fost dezvoltat n acelai context al rspunderii pentru cercetarea empiric, a aprut n 1957, sub denumirea California Psychological Inventory (CPI). Deoarece variantele originale ale testelor MMPI i CPI se confruntau cu unele probleme psihometrice semnificative, revizuirea lor pentru MMPI, n 1986, iar pentru CPI, n 1987 a fcut ca aceste probleme s fie nlturate, testele cptnd o larg utilizare nu numai n SUA, ci n mai multe ri ale lumii. Tot cam n aceeai perioad cu MMPI a aprut i testul 16 PF Cattell (the Sixteen Personality Factor), dezvoltat de ctre R.B. Cattell i care rmne de.a lungul timpului un bun exemplu de test de personalitate bine strucuturat i care este bazat pe metoda analizei factoriale. O alt categorie de teste a fost creat pentru orientarea i consilierea persoanelor. Amintim, mai nti, Inventarul de interese, care i avea originea n studiul lui R.L. Thorndike (1912), efectuat pe un lot de 100 de studeni. n perioada 1919-1920 Yoakum a dezvoltat o baz de 1000 de itemi privind interesele din copilrie i pn la maturitatea timpurie (Dubois, 1970). O mare parte din aceti itemi au fost ncorporai n Carnegie Interest Inventory,
18
NICOLAE MITROFAN
test care a fost supus, de ctre K.M. Cowdery, timp de doi ani, respectiv, 1926-1927, la mai multe mbuntiri, cum ar fi, de exemplu: creterea numrului de itemi, compararea rspunsurilor a 3 grupe-criteriu (medici, ingineri i juriti) cu grupe de control cuprinznd neprofesioniti. Edward K. Strong a revizuit testul lui Cowdery i timp de 36 de ani s-a ocupat de un nou instrument destinat a msura interesele, cunoscut sub numele Strong Vocational Interest Blank (SVIB). Acesta va deveni unul dintre cele mai utilizate teste din toate timpurile, dei, a avut, mai mereu, un serios competitor testul ce purta denumirea de Kuder Preference Record, creat n anul 1934. Ceea ce era specific pentru acest test era faptul c el compara mai mult puterea relativ a intereselor la nivel individual dect rspunsurile individuale cu rspunsurile variatelor grupe profesionale. Deci, era un test ipsativ iar cele mai recente revizuiri ale acestui instrument psihodiagnostic include variantele Kuder Survey i Kuder Occupational Interest Survey (Zytowski, 1985). Teme de reflecie/autoevaluare: 1. Care este primul test de personalitate construit n timpul primului rzboi mondial ? Prin ce se caracterizeaz el ? 2. Care sunt cele mai importante teste proiective construite n prima jumtate a secolului XX ? 3. Prin ce se deosebete testul 16PF Cattell de testele MMPI i CPI ? 4. Care sunt testele de interese mai cunoscute ? Prin ce se caracterizeaz ele ?
2.3. Testele de aptitudini Dezvoltarea testelor de aptitudini a rmas oarecum n urma celei a testelor de inteligen, dei ele sunt instrumente de msur a abilitilor mult mai specifice i mai delimitate. i aceasta mai ales din dou motive: unul statistic i altul social (Gregory, J., 1996). Problema statistic inea de faptul c o nou tehnic i anume, analiza factorial, era necesar frecvent pentru a stabili care dintre aptitudini erau primare i, totodat, distincte una fa de alta. Analiza factorial i-a permis lui L.L.Thurstone s concluzioneze c exist factori specifici ai abilitilor mintale primare, cum ar fi: nelegerea verbal, abilitatea numeric, abilitatea spaial, memoria asociativ, viteza perceptual, raionamentul general. n concepia acestui autor, n structura aptitudinilor nu exist un singur factor general, aa cum susinuse Spearman, ci mai muli, respectiv, apte. n 1938 el construiete una dintre primele baterii de teste pentru aptitudini multiple, intitulat The PrimaryMental Abilities Test (PMA). Ulterior au fost dezvoltate alte baterii de aptitudini, care au fost aplicate anual pe milioane de subieci din SUA. Una dintre cele mai populare baterii de teste de aptitudini a fost realizat de ctre Bennet, Seashore i Wesman (1982, 1984) sub denumirea The Differential Aptitude Test (DAT). Prima versiune a aprut n anul 1947, fiind dedicat, iniial, orientrii vocaionale a elevilor din clasele VIII-XII i, apoi,
19
NICOLAE MITROFAN
consilierii vocaionale a adulilor tineri i seleciei angajailor. Referitor la coninut, aceast baterie cuprinde un numr de 8 teste independente, ceea ce nseamn c, n funcie de scopurile diagnostice, bateria poate fi aplicat i parial. O aciune de mare amploare a fost iniiat, n 1930, de ctre Departamentul muncii din SUA, constnd n crearea unor teste de aptitudini necesare pentru prognozarea performanei n munc pentru 100 de ocupaii specifice. Ulterior, mai exact n 1940, acest departament apeleaz la serviciile unor profesioniti n msurare i psihologie industrial-organizaional pentru a crea o baterie de teste pentru aptitudini multiple, capabil s msoare ocupaiile studiate mai nainte. Aa a luat natere General Aptitude Test Battery (GATB), prima baterie folosit pentru predicia performanei n munc. Referitor la coninut, aceast baterie cuprinde 8 teste creion-hrtie i 4 teste-aparate. Cele 12 teste pot fi aplicate n 2 ore i i permit calcularea scorurilor la 9 factori. Unul dintre cele mai folosite teste de aptitudini, tip creion-hrtie este ASVAB (The Armed Services Vocational Aptitude Battery). Anual el este aplicat pe un numr de peste 2 milioane persoane i cuprinde 10 subteste. 2.4. Testele de achiziii Din aceast categorie fac parte dou grupe de teste i anume: a) teste folosite pentru admiterea n instituiile de nvmnt; b) teste propriu-zis de achiziii (achievement tests). Din prima grup fac parte multe teste, ele avndui originea n testele de inteligen The Army Alpha i The Army Betha, folosite n timpul primului rzboi mondial i fiind destinate a msura inteligena subiecilor. Unul dintre cele mai vechi este The College Entrance Examination Board (CEEB). Dup introducerea mainii de scorare, n 1930, aceste teste au evoluat ctre College Board Tests, n particular The Scholastic Aptitude test, cunoscut n prezent sub numele de Scholastic Assessment Test. Funciile CEEB au fost subsumate ulterior la Educational Tests Service (ETS), care s-a preocupat de dezvoltarea, standardizarea i validarea unor teste folosite pentru admitere, devenite apoi foarte cunoscute, precum: The Graduate Record Examination, The Law School Admissions Test, Peace Corps Entrance Tests. Testele de achiziie au ca o trstur comun faptul c ele urmresc diagnosticarea, la nivel individual, a achiziiilor realizate de ctre cei inclui n procesul de nvmnt, fie acestea cunotine din diferite domenii, fie deprinderi i capaciti formate. Deci este vorba i de aspectul informaional (achiziionarea de cunotine) i de aspectul formativ (capacitatea de a opera, de a aciona). Toate acestea sunt teste standardizate, ceea ce nseamn c rezultatele obinute de un elev, de exemplu, sunt raportate la rezultatele obinute de ntreg lotul de subieci folosit pentru standardizare Tem de reflecie/autoevaluare: Care sunt elementele de asemnare i cele de diferen ntre testele de aptitudini i cele de achiziie ? 2.5. Modele de testare clinic Unii autori au ncercat s fac o evaluare a modului n care psihometria s-a implicat i a contribuit la rezolvarea problemelor specifice unui anumit
20
NICOLAE MITROFAN
domeniu al psihologiei aplicate. Astfel, de exemplu, S.J. Korchin i D. Schuldberg (1981) au identificat patru modele sau orientri privind testarea psihologic n clinic. Ele reflect diferenele profunde privind concepia despre natura uman, distresul psihologic i condiiile pentru schimbarea terapeutic efectiv: Primul model, de altfel i cel mai vechi este modelul psihometric i el are ca element central msurarea pe baz de teste. Scopul l reprezint predicia statistic a trsturilor i el reclam ca testele utilizate s fie valide i demne de ncredere. Obiectivitatea itemilor testului trebuie abordat prin obiectivitatea examinatorului. Al doilea model poart denumirea de tradiia clinic. n acord cu acest model evaluatorul clinic poate utiliza tehnici psihometrice, ns, spre deosebire de modelul psihometric, al crui scop era descrierea trsturilor, el se concentreaz asupra descrierii personalitii, incluznd arii multiple i niveluri de funcionare. Evaluatorul clinic, acionnd n acord cu tradiia clinic, pune mai mult accentul pe utilizarea raionamentului, inferenei i subiectivitii. Al treilea model msurarea comportamentului difer mult de modelele anterioare, att n concepie, ct i n practic. Evaluatorii comportamentului ocolesc concepiile asupra personalitii privind dispoziiile sau trsturile. Ei resping ideea conform creia personalitatea are legtur cu ceea ce un individ este sau are i pun accentul mai mult pe ceea ce individul face. De aceea, rolul testrii psihologice este minimizat. Criteriile psihometrice sunt n mare msur incompatibile cu presupunerile comportamentale. Al patrulea model l reprezint psihologia umanist, ai crei reprezentani se manifest predominant negativ fa de msurare. C. Rogers (1942) a avut o mare influen n aceast direcie, susinnd dezavantajele utilizrii testelor. n concepia lui clientul i nu terapeutul trebuie s fie diagnosticianul. Fcnd o sintez a mai multor puncte de vedere, A. Sugarman (1978) evideniaz urmtoarele argumente pentru afirmaia c msurarea psihologic nu este umanist: - msurarea este reducionist; msurarea este artificial; - msurarea nu acord atenie relaiei examinatorpacient; - msurarea judec pacientul; - msurarea este prea intelectual.
ntrebri de autoevaluare:
1. Care este contribuia lui A. Binet i a lui T. Simon la dezvoltarea psihodiagnozei ? 2. Ci itemi cuprinde prima scal metric a inteligenei ? 3. Care sunt primele teste de grup folosite pentru testarea abilitilor umane ? 4. Care este contribuia lui L. Terman privind dezvoltarea psihodiagnosticului ? 5. Dar a lui D. Wechsler ? 6. Care este cel mai vechi test de personalitate ? 7. Care sunt primele teste proiective create ? 8. Care sunt cele mai cunoscute i cel mai mult folosite chestionare de personalitate ? 9. Care este bateria de teste creat de L.L. Thurstone ? 10. Care este specificul testelor de achiziie ? 11. Care sunt diferenele de baz dintre cele 4 modele de testare clinic ?
21
NICOLAE MITROFAN
BIBLIOGRAFIE MINIMAL GREGORY, R.J. (1996). Psychological Testing. History, Principles, and Applications. Alyyn & Bacon, Needham Heights. HORGHIDAN, V. (1998), Metode de psihodiagnostic. Bucureti: Editura didactic i pedagpogic. MITROFAN, N. (2001), Psihometria i direciile ei de dezvoltare la nceput de mileniu. n M. Zlate (coord.), Psihologia la rspntia mileniilor. Iai: Polirom. SCHIOPU, U. (2003). Introducere n psihodiagnostic. Bucureti: Editura Pro-Humanitas. LECTURI SUPLIMENTARE ALBU, M. (2000). Metode i instrumente de evaluare n psihologie. Cluj-Napoca: Argonaut. EYSENCK, H.J. (1998). Teste de inteligen. Bucureti: Queen.
22
NICOLAE MITROFAN
Unitatea de nvare 3 Tendine i direcii de dezvoltare a psihodiagnosticului la nceptul mileniului III Cuprins: 3.1. Teoria testelor 3.2. Construcia i dezvoltarea unor noi teste 3.3. Computerizarea testelor 3.4. Predicii pentru viitorul apropiat Obiective: La sfritul acestei uniti de nvare, studenii vor fi capabili s: cunoasc diferenele dintre teoria clasic i teoria rspunsului la item cunoasc noile direcii de construcie i dezvoltare a unor teste evalueze critic utilizarea computerului n testarea psihologic cunoasc principalele predicii pentru viitorul apropiat
3.1.
Teoria testelor n planul teoriei, modelul clasic psihometric este nlocuit de un model nou i anume, IRT (Teoria rspunsului la item). Fcnd o sintez a mai multor puncte de vedere, M. Albu (1998) ajunge la concluzia c aceast teorie are la baz urmtoarele postulate: 1. Comportarea unui subiect la un item al unui test poate fi explicat (sau prezis) cu ajutorul unui set de factori, numii trsturi, trsturi latente sau abiliti. Orice construct inobservabil, presupus continuu, n privina cruia o teorie psihologic afirm c persoanele se deosebesc ntre ele poate fi privit ca factor. Fiecrui factor i se asociaz o variabil cu valori numerice cuprinse ntre - i + , continu, denumit variabil latent. 2. Se infereaz existena unui factor numai dac se observ c rspusnurile la itemi prin care se dorete msurarea constructurlui covariaz (variaz la fel). 3. Relaia dintre performna la item a subiecilor i fiecare dintre trsturile care au legtur cu performana poate fi descris prin cte o funcie cresctoare, denumit funcie caracteristic a itemului sau curb caracterisitic a itemului. Aceast funcie arat cum depinde probabilitatea de a rspunde corect (sau afirmativ) la item de nivelul trsturii. Cei care susin acest model caut s evidenieze i argumentele sau raiunile privind importana lui i anume: 1. IRT poate compara teste alctuite explicit din itemi diferii. n consecin, ea permite comparaii ntre diferite ocazii pentru acelai subiect, n raport cu care memoria pentru rspunsurile anterioare este o problem, chiar dac cele dou teste nu au itemi comuni. Aceasta este numit msurarea liber a testului i este important pentru testarea ajustat i pentru testarea adaptativ computerizat. 2. Subiecii cu
23
NICOLAE MITROFAN
acelai scor clasic pot s difere n ceea ce privete deprinderea msurat, depinznd de presupunerile fcute de modelul IRT. 3. Estimarea clasic a nivelului atributului (deprinderii) sau numrul corect la un test de abiliti nu este legat linear de forma deprinderii. n consecin, scala numrului corect nu este o scal de interval. 4. Estimrile clasice ale dificultii i discriminrii, cum ar fi probabilitatea unui rspuns corect, valoarea p i corelaia scor la item scor total (rit) nu sunt dependente una de alta aa cum sunt dependente de abilitile subiectului. Astfel, de exemplu, un item a crui valoare p n populaia general este 0,5 va avea o valoare mai sczut printre cei cu abiliti inferioare, dar psihometria clasic nu poate s prezic magnitudinea descreterii, ceea ce nu este cazul IRT. O alt teorie ce s-a impus n atenia psihodiagnosticienilor este teoria strilor i a trsturilor latente, care ncearc s dea rspuns la urmtoarele ntrebri (Albu, M., 1998): - cum putem afla dac rspunsurile date de un subiect la un chestionar care msoar o trstur de personalitate intervin sau nu efectele situaiei de msurare ? ; - dac exist efecte ale situaiei, ce relaie exist ntre scorul obinut la scal i trstura msurat ?; - ce relaie exist ntre stri i trsturi ? Dar ce este starea i ce este trstura ? Spre deosebire de disciplinele tradiionale ale psihologiei, care aveau n atenie fie numai diferenele interindividuale (cum este cazul psihologiei difereniale), fie diferenele intraindividuale (cum este cazul psihologiei generale), teoria strilor i trsturilor recunoate printre atributele psihologice existena att a deosebirilor dintre indivizi, stabile n timp, ct i a schimbrilor intraindividuale. Ea consider c fiecare atribut psihologic observat este afectat ntr-un anumit grad de: - caracteristici ale individului; - caracteristici ale situaiei i/sau influenelor care interacioneaz; - eroarea de msur. n consecin, rezultatul msurrii unei variabile observate se descompune n: 1. o component care nu depinde de situaie i/sau de efectele interaciunilor; 2. o component care depinde de situaie i/sau de efectele interaciunilor; 3. o eroare de msur. Prima component este denumit trstur, iar suma primelor dou componente este denumit stare. Existena acestor componente are implicaii extrem de importante asupra modului n care se face evaluarea psihologic (Albu, M., 1998).n construirea i utilizarea testelor este necesar s se cunoasc nu numai fidelitatea acestora, ci i ct de mult msoar aceste caracteristici stabile ale persoanelor i ct de mult sunt afectate ele de situaia n care se face msurarea. Cnd se urmrete msurarea trsturilor, rezultatele msurrilor trebuie s fie afectate ct mai puin de efectele specifice ocaziei de msurare. Cnd se evalueaz starea, instrumentul utilizat trebuie s fie sensibil la influenele situaiei. O alt tendin actual n psihodiagnostic i care se va accentua n anii urmtori este trecerea de la evaluarea psihometric la evaluarea potenialului de nvare (Havrneanu, C., 2000). Aceste dou sisteme de evaluare au fost percepute antagonist, iar explicaia rezid n apariia unei noi paradigme care se opune practicii tradiionale ndelung aplicate. Evaluarea potenialului de nvare ofer posibilitatea construirii i exersrii unei sarcini, urmrindu-se
24
NICOLAE MITROFAN
evoluia subiecilor n rezolvarea ei. Aceast metod de evaluare, spre deosebire de psihometrie, nu se bazeaz pe ceea ce subiecii au nvat nainte, ci propune sarcini de nvare specifice pentru a se cunoate profitul pe care ei pot s-l obin. Pentru evaluarea cantitativ i calitativ a potenialului de nvare se folosesc dou procedee: 1. Antrenamentul n timpul testului, procedeu care const n corectarea i antrenarea subiectului imediat dup o soluie greit. Dup aceast faz urmeaz evaluarea, n care se ofer subiectului un numr de itemi pe care trebuie s-i rezolve fr asisten. Ceeea ce este important n aceast procedur este faptul c subiectul poate s-i manifeste aptitudinea de a stpni i aplica principiile nvate n timpul evalurii; 2. Procedeul pre-test post-test, ce cuprinde trei faze: - faza pre-test, care const n obinerea unei evaluri de baz a funciilor actuale i care este asemntoare testului psihometric uzual; - faza nvrii, care const n a expune subiectului condiiile ce favorizeaz reuita sarcinii propuse. n aceast faz i se dau ajutoare ce-i permit s avanseze spre rezolvarea problemei, s nvee strategii de utilizat pentru rezolvare sau s-i corecteze comportamentul indecvat fa de problem; - faza post-test, care const n verificarea efectelor nvrii. De fapt, cele dou tendine nu se exclud, ci, dimpotriv, ele sunt complementare n examenul psihologic (Hvrneanu, C., 2000). Testele permit evaluarea a ceea ce un subiect este capabil s fac n momentul administrrii testului, iar evaluarea potenialului de nvare ne permite s estimm dac subiectul este capabil s nvee. Teme de reflecie/autoevaluare: 1. Ce aduce nou, n domeniul psihodiagnosticului, teoria rspunsului la item (IRT) ? 2. Ce aduce nou, n domeniul psihodiagnosticului, teoria strilor i trsturilor ? 3. n ce const evaluarea potenialului de nvare ? 3.2. Construcia i dezvoltarea unor noi teste Sute de noi teste sunt publicate n fiecare an i rata proliferrii lor va crete, pe de o parte, din nevoia de a rspunde unor cerine dinspre noi domenii (de exemplu, psihologia ecologic, psihologia comportamentului, psihologia clinic, psihologia familiei etc.), iar pe de alt parte, din nevoia de a nlocui testele mai vechi. Printre testele mai noi putem aminti: The Kaufman Assessment Battery for Children (K-ABC), Minnesota Multiphasic Personality Inventory, varianta 2 (MMPI-2) pentru aduli i varianta pentru adolesceni (MMPI-A), Personality Inventory for Children (PIC), Multidimensional Aptutude Battery (MAB) .a. Privitor la personalitate au fost construite mai multe teste bazate pe modelul celor 5 factori (BIG-FIVE). Dei diferii cercettori au folosit termeni diferii, aceti factori sunt (Minulescu, M., 1996): NevrotismulNeuroticism; ExtraversiuneaExtraversion; Deschiderea la experienOpenness to Experience; AgreabilitateaAgreeableness; Contiinciozitatea Conscientousness. Rearanjnd aceti factori se ajunge la un acronim simplu: OCEAN (Gregory, R.J., 1996).
25
NICOLAE MITROFAN
Plecnd de la acest model, P.T. Costa (1991) i R. McCrae (1989, 1992) au construit dou teste de personalitate: 1. The revised NEO Personality Inventory (NEO-PI-R), ce conine 240 de itemi. n afara celor 5 domenii majore ale personalitii, inventarul msoar 6 trsturi specifice, numite faete, n cadrul fiecrui domeniu; 2. The NEO Five-Factor inventory (NEO-FFI), ce cuprinde 60 de itemi i care este, de fapt, o versiune prescurtat a celuilalt. Oricum, noile teste i dovedesc superioritatea fie datorit unor caliti psihometrice superioare, fie datorit faptului c sunt mult mai specifice i mult mai potrivite pentru diferite probleme particulare. De asemenea, testele mai noi se dosebesc fundamental de cele tradiionale, deoarece ele sunt bazate pe concepte i teorii moderne din diferite ramuri ale psihologiei. Este suficient s amintim, de exemplu, impactul produs asupra construirii testelor de inteligen de teoria lui R. Sternberg (modelul triarhic) i de teoria lui H. Gradner (variante multiple ale inteligenei). De altfel, proliferarea testelor netradiionale este determinat de dou tendine existente n testarea psihologic: 1. testele netradiionale reflect creterea rspunsului tiinei psihologice la nevoile din ce n ce mai mari de aplicare n practic (Haynes, S.N.,1991). Chiar i cei mai nverunai adversari ai psihometriei pot s recunoasc faptul c noile teste constituie, nainte de orice, un rspuns la obiecii i o ncercare de perfecionare i de cretere a puterii (soundness) testului; 2. Se fac eforturi pentru a integra testele cu alte aspecte ale psihologiei aplicate. De exemplu, muli psihologi, orientai n special spre latura comportamental, au fost decepionai de relaia extrem de slab dintre msurarea clinic, testele tradiionale i interveniile pe linia tratamentului (Haynes, S.N., 1992). Cel mai de dorit ar fi nu testele ale cror rezultate au o legtur direct cu tratamentul, ci acelea care pot fi utilizate pentru msurarea eficacitii tratamentului.Un alt aspect al proliferrii instrumentelor psihodiagnostice l constituie construirea unor teste din categoria celor semistandardizate. Este vorba, de altfel, de ncercarea psihologilor de a scoate psihodiagnosticul de sub controlul exclusiv al experilor i de a oferi i altor utilizatori (cum este cazul prinilor, cadrelor didactice, personalului medical, asistenilor sociali .a.) unele instrumente psihodiagnostice care s-i ajute n activitatea lor. Aceste teste ar oferi informaii cu caracter orientativ (Mitrofan, N., 1997), iar n cazul n care sunt semnale c exist probleme mai serioase, trebuie s se apeleze la un psihodiagnstician expert. i dac ne gndim c asemenea culegeri de teste publicate poart pe coperi nume celebre, cum este cel al lui H.J. Eysenck (1998), putem s nelegem mai uor utilitatea lor. Cu toate acestea, considerm c sunt necesare serioase precauii, deoarece o asemenea intenie generoas poate fi contrabalansat de multiple efecte negative asupra psihodiagnozei autentice, tiinifice. Teme de reflecie/autoevaluare: 1. Care sunt cele mai noi teste create ? Ce trsturi au ele fa de cele create mai demult ? 2. De ce trebuie s manifestm precauie fa de testele semistandardizate ?
26
NICOLAE MITROFAN
3.3. Computerizarea testelor Desigur, un prim scop al utilizrii computerului n psihodiagnoz l reprezint scurtarea timpului de aplicare, incluznd toate etapele i, mai ales, scorarea i interpretarea rezultatelor. Unii autori ncearc s evidenieze i alte avantaje. Astfel, C. Havarneanu (2000) delimiteaz urmtoarele criterii care evideniaz avantajele utilizrii computerului n examinarea psihologic: 1. Criteriul timp. Fa de probele clasice, cele computerizate aduc o condensare temporal. Aceasta nu rezult din scurtarea timpului de solicitare, ci din modul rapid de prelucrare, afiare i tiprire a rezultatelor. Timpul ctigat poate fi alocat ntreinerii psihologice prelungite cu subiectul aflat n situaia de examinare. Computerul nu se interpune ntre examinat i examinator, el oferind posibilitatea prelungirii sensibile a contactului uman direct, att de necesar realizrii unui psihodiagnostic competent; 2. Criteriul mobilitii. Fa de unele probe de reactivitate senzorio-motorie utilizate, subiectul poate reaciona la stimuli n micare bidimensional. Posibilitatea utilizrii unor stimuli perturbatori are o gam mai larg de utilizare. Un avantaj cert este acela c exist posibilitatea subiectului de a comunica interactiv cu computerul, care posed largi distribuii ale posibilitilor de rspuns; 3. Criteriul particularizrii i individualizrii examenului. n formele tradiionale de examinare, operativitatea este sczut din cauza timpului practic limitat care se poate aloca pentru a culege un numr mare de date i pentru a face comparaii rapide ale acestora. n formele de examinare computerizat se pot efectua comparaii rapide, se pot nuana rezultatele, iar interaciunea datelor poate fi analizat n permanen; 4. Criteriul economic. O particularitate deloc neglijabil n capacitatea de investigare a unui laborator const n posibilitatea de dotare material. O prob de tip clasic presupune cheltuieli de achiziionare superioare costului unui computer pe care pot fi stocate un numr nelimitat de probe psihologice. Un alt mod de utilizare l reprezint testarea computerizat adaptativ. Diferitele seturi de ntrebri ale testului sunt administrate, cu ajutorul calculatorului, la diferii indivizi n funcie de statutul fiecruia dintre ei fa de trstura supus msurrii. n testarea abilitilor, de exemplu, computerul adapteaz nivelul de dificultate a itemului n funcie de rspunsul subiectului. Dac rspunsul este incorect, este oferit un item mai uor, iar dac este corect, poate fi selectat un item mai dificil. Un alt exemplu: un computer poate avea o banc de itemi pentru un test de achiziie, acetia prezentnd diferite niveluri de dificultate. Computerul poate fi programat: 1. s nu prezinte un item crescut de dificultate dac subiectul nu a rspuns corect la 2 itemi succesivi de un nivel de dificultate inferior; 2. s termine testarea cnd subiectul nu rspunde corect la 5 itemi consecutivi de un anumit nivel de dificultate. O alt direcie de utilizare a computerului este aceea n care el genereaz sarcini ce nu pot fi prezentate prin metode tradiionale. Prin intermediul calculatorului va fi posibil abordarea unei noi palete de abiliti ce nu au figurat n obiectivele unor teste tradiionale. n fiecare an sunt dezvoltate tot mai multe programe pentru scorarea testelor i pentru producerea unor rapoarte scrise. M. Albu (1998) enumer, n
27
NICOLAE MITROFAN
lucrarea sa, mult mai multe utiliti prezente i, mai ales, viitoare ale programelor folosite n domeniul testrii psihologice: a) pstrarea rezultatelor testrii psihologice, n fiiere sau n baze de date; b) calculul scorurilor la teste; asemenea programe sunt utile mai ales n cazul testelor compuse dintr-un numr mare de itemi, repartizai pe mai multe scale. Exist i teste care nu pot fi cotate dect cu ajutorul calculatorului (de exemplu, testul pentru capacitatea de organizare CO92); c) administrarea testelor, urmat, desigur, de calculul scorurilor; cu ajutorul calculatorului pot fi administrate teste prin care se msoar variabile psihice sau fiziologice care nu ar putea fi investigate n cazul administrrii de tip creion-hrtie (de exemplu, timpul de reacie, timpul de decizie, timpul de rspuns la fiecare item al unui chestionar etc.); d) identificarea protocoalelor invalide, n care rspunsurile subiectului nu sunt conforme cu realitatea. Un procedeu utilizat n acest scop aplic teste statistice asupra succesiunilor de rspunsuri date de subiect; e) verificarea unor ipoteze referitoare la persoana examinat, pe baza comparrii, prin teste statistice, a rezultatelor obinute de aceasta la examenul psihologic cu cele ale unui eantion extras din populaia creia i aparine subiectul; f) intervievarea subiectului; programele conin, alturi de ntrebrile posibile, i un algoritm de constituire a interviului n timpul examenului psihologic, n funcie de rspunsurile date de subiect. Interviurile administrate de calculator sunt contraindicate ns n cazul copiilor, al adulilor cu un nivel intelectual sczut i al celor cu simptome psihiatrice; g) interpretarea rezultatelor la un test psihologic, care are la baz transpunerea ntr-un program a unui set de reguli prespecificate, referitoare la un rspuns sau la un pattern de rspunsuri (un scor la un test sau un profil psihologic), ce permite analiza, interpretarea i evaluarea unor caliti ale persoanelor; h) redactarea raportului psihologic; uneori sunt formulate predicii referitoare la subiect, fie pe baza unor metode statistice (de exemplu, folosind regresia liniar), fie pe baza identificrii unor legturi ntre scorurile la test i unele caracteristici non-test, cum sunt datele biografice. Alteori, n urma comparrii profilului psihologic al subiectului cu rezultatele obinute la aceleai teste de diverse grupuri de persoane (de exemplu, grupuri care difer ntre ele prin profesie, prin performana n munc sau prin diagnosticul psihiatric) se determin populaia din care face parte persoana examinat; i) alegerea tratamentului (a terapiei, a programului de instruire etc.) cel mai potrivit pentru subiect; acesta reprezint cel mai nalt nivel de implicare a calculatorului n activitatea psihologului i este de ateptat ca numrul programelor de acest tip s creasc; j) construirea unui test psihologic. Dup unii autori (Cohen, Swerdlik i Phillips, 1996), programele pentru computer, destinate a facilita construcia, administrarea, scorarea i interpretarea unor teste, cum ar fi cazul testelor de achiziie dezvoltate de cadrele didactice, vor prolifera ntr-un mod impresionant. Asemenea programe, avnd denumiri de genul Make a test, Create a test, The Grand Inquisitor, The First National Item Bank and Criterion-References Scoring System, evideniaz dou avantaje majore ale testrii psihologice computerizate: 1. capacitatea de a stoca itemi n banca de itemi; 2.
28
NICOLAE MITROFAN
capacitatea de a individualiza testarea printr-o tehnic numit ramificarea itemului Tema de reflecie/autoevaluare: S presupunem c cineva manifest reticen privind utilitatea calculatorului n activitatea psihodiagnostic. Cu ce argumente l-ai putea convinge de contrariul ? 3.4. Predicii pentru viitorul apropiat Rferitor la tendinele de dezvoltare n viitor ale psihometriei, unii autori (Kaplan, R.M., Saccuzzo, D.P., 1993) au formulat o serie de predicii: Predicia 1: perspectivele sunt promitoare. Acest optimism este bazat pe rolul imens pe care l-a jucat testarea n dezvoltarea i recunoaterea psihologiei n general i a psihologiei profesionale, n particular. Poate c testele, aa cum sunt cunoscute ele astzi, vor fi retrase din scen, dar aceasta nu nseamn c psihometria i va nchide porile, ci, dimpotriv, ea va nflori n secolul urmtor; Predicia 2: proliferarea unor teste noi i mbuntite va continua cu i mai mare intensitate. Testele de inteligen, aa cum se prezint ele astzi, sunt departe de a fi perfecte, cu toate revizuirile fcute. Prin urmare, rolul dominant al bateriilor de teste Stanford-Binet i Wechsler nu este deloc sigur pentru viitor. Chiar dac multiplele revizuiri efectuate pn acum au condus la mbuntirea unor elemente de coninut i la unele caliti psihometrice noi, aceste teste nu difer n esen de caracteristicile i de concepia care a stat la baza construirii scalelor originale. Referitor la testele de personalitate, se pare c varianta recent (MMPI-2) a Inventarului Multifazic de Personalitate Minnesota va fi testul secolului XXI, iar n ceea ce privete categoria testelor proiective, testul Rorschach i va ctiga un nou nivel de acceptan i respectabilitate n secolul XXI. Predicia 3:schimbri revoluionare tip perestroika n testarea colar. Unii specialiti susin c, n secolul ce a nceput, se vor utiliza mai ales testele de achiziie standardizate la nivel naional, n timp ce alii resping aceast idee. De asemenea, se pare c, n anii urmtori, testele de performan ar putea nlocui testele standardizate cu rspunsuri multiple la alegere. Testele de performan reclam ca, n loc s ofere un rspuns verbal sau s completeze o foaie de rspuns, subiectul s fac ceva. Astfel, elevilor li s-ar cere s scrie eseuri, s ofere rspunsuri scrise la probleme specificate sau s rezolve probleme de matematic. Predicia 4: vor continua controversele, nenelegerile i schimbrile. Se pare c dezacordul i controversa reprezint cea de-a doua natur a psihologului. i nu este vorba numai de testarea psihologic, ci de orice. Desigur, motivul principal al controverselor dintre psihometricieni este legat de imperfeciunile instrumentelor psihodiagnostice; de aceea, schimbarea va fi o caracteristic constant n acest domeniu al psihologiei aplicate
29
NICOLAE MITROFAN
Tem de reflecie/autoevaluare: Analizai aceste predicii i stabilii dac viitorul activitii psihodiagnostice este de bun augur sau nu
1. Prin ce se caracterizeaz Teoria rspunsului la item (IRT) ? 2. Ce nseamn evaluarea potenialului de nvare ? 3. Care sunt cele mai importante teste mai nou construite ? 4. Ce avantaje prezint computerizarea testelor ? 5. Ce nseamn testarea computerizat adaptativ ? 6. Enumerai cteva programe pentru testarea computerizat. 7. Ce se ateapt n viitor privind activitatea psihodiagnostic ? BIBLIOGRAFIE MINIMAL ALBU, M. (1998), Construirea i utilizarea testelor psihologice. Cluj-Napoca: Clusium. ALBU, M., Pitariu, H. (1993). Proiectarea testelor de cunotine i examenul asistat de calculator. Cluj-Napoca: Casa crii de tiin. HAVRNEANU, C. (2000). Cunoaterea psihologic a persoanei. Iai: Polirom. KAPLAN, R.M., SACCUZZO, D.P. (1993). Psychological Testing. Principles, Applications, and Issues. Pacific Grove: Brooks/Cole Publishing Company. MINULESCU, M. (1996). Chestionarele de personalitate n evaluarea psihologic. Bucureti: Garell Publishing House.
30
NICOLAE MITROFAN
Unitatea de nvare nr. 4 Situaia psihodiagnosticului din Romnia n perioada actual Cuprins: Probleme mai vechi i mai noi cu care se confrunt psihodiagnosticienii Legea 213/2004 i Colegiul Psihologilor din Romnia S privim viitorul cu optimism
Obiective: La sfritul acestei uniti de nvare, studenii vor fi capabili s: cunoasc bine problemele cu care se confrunt psihologii ce folosesc teste; cunoasc cerinele legate de aplicarea i comercializarea testelor; cunoasc prevederile Legii 213/2004 privitoare la Crearea Colegiului Psihologilor din Romnia; identifice corect locul i rolul Comisiei metodologice; fie familiarizat cu realizrile romneti n domeniul psihodiagnosticului. 4.1. Probleme mai vechi i mai noi cu care se confrunt psihodiagnosticienii. Trebuie, mai nti, s subliniem faptul c, i nainte de 1989, chiar dac psihologia nu era apreciat de guvernanii de atunci, au existat preocupri ale psihologilor romni pentru dezvoltarea psihodiagnosticului. Putem aminti, n acest sens, nume precum: Gh. Zapan, U. Schiopu, P. Constantinescu, G. Bontil, I.M.Nestor, M. Roca, T. Kulcsar, I. Holban, A. Cosmovici .a. Din nefericire, mai ales dup 1977, aproape un sfert de secol pedepsele politice aplicate tiinelor sociale, dar mai ales psihologiei, au afectat grav i psihodiagnosticul. n perioada postdecembrist ns, psihologia romneasc a fost repus, n mare msur, n drepturile ei fireti. S-au renfiinat seciile de psihologie din cadrul universitilor, Institutul de psihologie, au aprut noi lucrri de valoare, reviste, s-au organizat manifestri tiinifice. A aprut, totodat, i nvmntul privat, aa c anual avem muli absolveni n psihologie, care doresc s activeze ca specialiti n coli, clinici, firme, bnci, armat, transporturi etc. n aproape orice domeniu sunt i trebuie s fie utilizate instrumente psihodiagnostice. Dar i pn la absolvire studenii folosesc teste pentru diferite lucrri, inclusiv pentru lucrarea de licen, pentru disertaia de masterat. Nu mai vorbim de cei care fac tot felul de investigaii, pe baz de teste, pentru elaborarea tezei de doctorat. Dar cum se prezint testele folosite n practic n ara noastr ? Am putea analiza situaia lor n funcie de mai multe aspecte: a) starea echipamentului testelor; b) aplicarea testelor; c) comercializarea testelor. Referitor la starea echipamentului testelor, trebuie s menionm faptul c, n marea lor majoritate, testele se prezentau ntr-o situaie
31
NICOLAE MITROFAN
necorespunztoare. Cele mai multe dintre teste erau vechi i foarte vechi, folosite i rsfolosite, multiplicate n fel i chip, ceea ce fcea ca multe pagini ale testelor s cuprind, pe lng coninutul itemilor, tot felul de semne i de pete, din cauza multiplicrii n condiii tehnice discutabile. Erau multe teste incomplete, fr manual, fr nicio surs privind istoricul, caracteristicile psihometrice, valoarea psihodiagnostic. i n ceea ce privete, s spunem, partea auxiliar a testelor, cum ar fi partea material, foile de rspuns, grilele etc., au existat mari probleme, n sensul c acestea ori nu au existat, ori erau confecionate ntr-o manier extrem de discutabil. Desigur, ntre timp lucrurile s-au mai mbuntit. Au fost create teste noi, respectndu-se riguros cerinele de ordin tiinific, au fost reetalonate i restandardizate teste ce erau folosite n practic, multe teste au fost computerizate etc. Activitatea de aplicare a testelor este serios i sever reglementat n rile n care grija pentru meninerea prestigiului tiinific al psihologului este permanent. Exist coduri, standarde etc. care precizeaz foarte clar cine utilizeaz testele psihologice, cum le aplic i cum sunt folosite rezultatele. La noi n ar, n perioada de dup Revoluie, nu au existat asemenea preocupri iar consecinele negative nu au ntrziat s apar. Multe teste puteau fi aplicate de oricine, fr nicio restricie. Unii psihologi au publicat chiar cri n care au inclus informaii complete privind aplicarea testelor, cum este cazul unor teste proiective. Ei au nclcat flagrant unele prevederi ale codului deontologic. Din nefericire, unele teste ajunseser n mna altor specialiti (ingineri, economiti, secretari etc.), fiind vorba de unele teste serioase i pretenioase n ceea ce privete aplicarea i interpretarea rezultatelor. Comercializarea testelor ridic cel puin dou ntrebri de baz: 1. de unde procur psihologul specialist testele de care are nevoie ? 2. cine se ocup n ara noastr de comercializarea testelor ? Ideal ar fi cam aa: un for naional asigur revizuirea testelor, le reetaloneaz i, prin intermediul unor firme, care trebuie s respecte strict anumite reguli de distribuire, le ofer solicitanilor, dar mai ales celor care satisfac cerinele de formare i de specializare. Pn la crearea Colegiului Psihologilor din Romnia, nimic din ce am menionat nu a existat n realitate, absolvenii de psihologie fiind obligai, dac nu i-au procurat din timpul facultii ceva teste prin multiplicare-copiere, s gseasc o cale strict personal pentru a ajunge la unii psihologi care folosesc teste. i iari multiplicare, cu toate consecinele sale, teste incomplete, etaloane inutile etc. n ultimul timp mai multe firme au preluat activitatea de comercializare a testelor, ele trebuind s aib acreditarea din partea Comisiei metodologice a Colegiului. Tem de reflecie/autoevaluare: Cu ce probleme s-au confruntat, i se mai confrunt nc, psihodiagnosticienii din ara noastr ? 4.2. Legea nr. 213/2004 i Colegiul Psihologilor din Romnia Desigur, necesitile apariiei acestei legi nu in numai de problemele legate de instrumentele psihodiagnostice. Ea a aprut n 2004 sub denumirea complet Legea nr. 213 din 27 mai 2004 privind exercitarea profesiei de
32
NICOLAE MITROFAN
psiholog cu drept de liber practic, nfiinarea, organizarea i funcionarea Colegiului Psihologilor din Romnia. Aceast lege trebuie s fie cunoscut de orice psiholog din Romnia, incluzndu-i i pe cei care se afl n proces de formare (studenii, masteranzii). n baza ei s-a nfiinat Colegiul Psihologilor din Romnia, iar n cadrul Colegiului funcioneaz 4 comisii aplicative, respectiv: a) Comisia de psihologie clinic, consiliere psihologic i psihoterapie; b) Comisia de psihologie a muncii, transporturilor i serviciilor; c) Comisia de psihologie educaional, consiliere colar i vocaional; d) Comisia de psihologie pentru aprare, ordine public i siguran naional. De asemenea, mai funcioneaz Comisia metodologic i Comisia de deontologie i disciplin. Mai legat de activitatea psihodiagnostic este Comisia metodologic. Ea a elaborat deja Normele de avizare a metodelor i tehnicilor de evaluare i asisten psihologic. Conform art.3 (1) Comisia Metodologic a Colegiului Psihologilor din Romnia, prin normele de avizare prezente, stabilete standardele de calitate i procedurile de avizare pentru metodele i tehnicile de evaluare i asisten psihologic. Pe de alt parte, conform art. 3(2) Comisiile aplicative din cadrul Colegiului Psihologilor din Romnia, prin normele de avizare specifice, atest competenele profesionale ale psihologilor de a utiliza metode i tehnici de evaluare i asisten psihologic. Toate comisiile de specialitate vor avea n vedere competenele generale de utilizare a testelor psihologice precizate n documentul de fa. De o mare importan sunt precizrile referitoare la dreptul de utilizare a testelor psihologice. Cei care folosesc testele trebuie s fie n posesia unor competene bine precizate i acestea se obin prin procesul de formare profesional, nsemnnd i anii de studiu i de practic din facultate, dar i procesul de formare postuniversitar. Categoriile majore de competene vizeaz urmtoarele aspecte etice n aplicarea testelor: a) adoptarea unei conduite profesioniste, n acord cu normele deontologice ale psihologului i cu respectarea legilor internaionale i naionale privind copyright-ul (legea drepturilor de autor i a drepturilor conexe nr. 8/1996); b) utilizarea doar a acestor teste pentru care au competena necesar; c) asumarea responsabilitii pentru modul de utilizare a testelor; d) asigurarea securitii pentru testele utilizate, astfel nct ele s nu-i piard calitile din cauza deconspirrii publice a coninutului ori a mecanismelor de cotare; e) asigurarea confidenialitii rezultatelor; f) acordul scris sau n form electronic de includere a rezultatelor n baza de date a utilizatorului probei psihologice. De asemenea, aceast comisie a elaborat o serie de norme referitoare i la modul de comercializare a testelor. Iat, aadar, c sunt create condiii pentru ca, i n ara noastr, activitatea psihodiagnostic s intre complet n normal. Tem de reflecie/autoevaluare: Facei o scurt analiz privind importana elaborrii Legii nr. 213/2004 pentru psihologia romneasc. 4.3. S privim viitorul cu optimism.
33
NICOLAE MITROFAN
Chiar dac n perioada postdecembrist au fost numeroase probleme cu care s-a confruntat psihologia romneasc, n general, i psihodiagnosticienii, n special, nc de la nceputul ei numeroi psihologi s-au angajat serios pe direcia recldirii din temelii a acestei profesii. i rezultatele nu au ntrziat s apar. Vom aminti n continuare cteva dintre cele mai importante realizri n domeniul psihodiagnosticului: a) apariia unor lucrri de mari proporii i de mare importan, n cadrul crora regsim preocupri privind mbuntirea metodologiei utilizate n cercetrile psihologice(de exemplu, Zlate, M., 2000; Radu, I., 1993; Neculau, A., 1996); b) publicarea unor lucrri romneti, dup 1990, adresate bazelor teoretice ale psihometriei (de exemplu: Minulescu, M., 1996 i 2004; Albu, M., Pitariu, H., 1993; Albu, M., 1998 i 2000; Havrneanu, C., 2000; Stan, A., 2001; Horghidan, V., 1997; Mitrofan, N., 1997; Mitrofan, N., Mitrofan, L., 2006; Schiopu, U., 2003; Dumitracu, N., 2005 .a.); c) stabilirea unor legturi cu specialiti din alte ri, fiind astfel posibil accesul la lucrri i informaii de mare valoare din psihodiagnosticul mondial; d) formarea unor specialiti n alte universiti din lume; noi nine am activat n cadrul a dou universiti americane de prestigiu, cte 6 luni. Este vorba de University of Southwestern Louisiana, unde am lucrat cu S. Hotard i University of Texas at El Paso from El Paso, avnd privilegiul de a lucra mpreun cu R. Whitworth; e) etalonarea unor teste pe populaie romneasc. Am aminti aici cazul testului american DENVER , care a fost etalonat n perioada 1993-1994, cu sprijinul material i mai ales financiar al Societii SORZ din Olanda (director Pieter G.J.M. Hermsen) i cu entuziasmul unor cadre didactice i studeni din mai multe centre universitare. Coordonarea general a parinut centrului universitar Bucureti (N. Mitrofan i G. Drilea), iar pentru celelalte centre universitare coordonarea a fost asigurat de urmtoarele cadre didactice; A. Munteanu (Timioara), C. Havrneanu (Iai), . Szamosckosy (Cluj-Napoca); f) ptrunderea n Romnia a unor teste noi, moderne, care sunt folosite n cadrul unor universiti n scop de familiarizare i de formare a psihologilor. Este cazul testelorWAIS-III; WISC-III; WISC-IIIUK; WPPSI-R, MMPI-2; MMPI-A; Scalele McCarthy pentru copii; Scalele de dezvoltare Bayley etc.; g) formarea unor specialiti n cadrul programelor de masterat i doctorat.
1. De ce credei c psihologia nu era susinut ca tiin de ctre autoriti nainte de 1989 ? 2. Enumerai civa psihologi care s-au ocupat de problemele psihometriei nainte de 1989 ? 3. Cum se prezenta situaia testelor imediat dup 1990 ? 4. Cum se prezint situaia testelor n zilele noastre ? 5. n ce msur Colegiul Psihologilor sprijin dezvoltarea psihodiagnosticului ? 6. Ce atribuii are Comisia metodologic ? 7. Care sunt cele mai importante realizri n domeniul psihodiagnosticului ? BIBLIOGRAFIE MINIMAL MITROFAN, N. (2001), Psihometria i direciile ei de dezvoltare la nceput de mileniu. n ZLATE, M., Psihologia la rspntia mileniilor. Iai: Polirom. COLEGIUL PSIHOLOGILOR DIN ROMNIA (2005 i 2006), Acte normative.
34
NICOLAE MITROFAN
Modulul II Testul psihologic ca mijloc de evaluare

Unitatea de nvare 1 Testul psihologic Cuprins: 2.1. Cum definim testul psihologic ? 2.2. Echipamentul testului psihologic 2.3. Funciile psihodiagnozei Obiective: La sfritul acestei uniti de nvare studenii vor fi capabili s: cunoasc mai multe definiii date testului psihologic selecteze elementele comune din mai multe definiii cunoasc ce nseamn echipamentul (Kit-ul) complet al testului cunoasc principalele funcii ale psihodiagnozei 2.1. Cum definim testul psihologic ? Mai nti, facem precizarea c termenul de test este legat de cel de diagnostic psihic, care, la rndul lui, provine de la cuvntul grecesc diagnosticos, nsemnnd apt de a recunoate. Pn la un anumit punct, diagnosticul psihic este similar cu diagnosticul medical, deoarece exist o multitudine de caracteristici specifice. Referitor la definiie, vom trece n revist mai multe definiii, oferite de autori strini (limba englez i francez) i romni: Cronbach (1966): Testul este o procedur sau o serie de probe, construite n scopul stabilirii prezenei (sau absenei) unui aspect psihic, a particularitilor de manifestare comportamental sau a gradului de dezvoltare psihic . Pierre Pichot: Testele sunt instrumente de lucru standardizate servind de stimuli pentru un comportament, care, la rndul lui, poate fi evaluat prin compararea statistic cu comportamentul altor subieci aflai n aceeai situaie. P. Olron: Testul este un instrument fundamental al psihologiei aplicate ce se caracterizeaz prin posibilitatea de a examina numeroi indivizi n situaii uniformizate. A. Rey: Testele psihologice sunt procedee standardizate, construite astfel nct s provoace la subiecii investigai reacii nregistrabile iar materialul obinut prin intermediul acestor teste se estimeaz prin referin la valorile etalon. M. Roca (1972): Testul este o prob sau o serie de probe, construite n scopul stabilirii prezenei (sau absenei) unui aspect psihic, a particularitilor de manifestare comportamental sau a gradului de dezvoltare psihic.
35
NICOLAE MITROFAN
Grand dictionnaire de la psychologie (1994): Testul este o prob, utilizat cu precdere n psihologia diferenial, care permite descrierea comportamentului unui subiect ntr-o situaie definit precis, prin raportare la comportamentul unui grup precis de subieci, plasai n aceeai situaie standard. Descrierile se fac de obicei sub form numeric. A. Anastasi (1992): Testul este o msur obiectiv i standardizat a unui eantion de comportament. S analizm mai amnunit ultima definiie, n cadrul creia am subliniat 3 concepte, considerate a fi concepte-cheie. Msur obiectiv nseamn, n principal, dou aspecte: a) administrarea, cotarea i interpretarea scorurilor sunt obiective n msura n care acestea sunt independente n raport cu judecile subiective ale examinatorului: b) obiectivitatea testului reiese din faptul c determinarea nivelului de dificultate al unui item ori a ntregului test se bazeaz pe proceduri empirice, obiective i nu pe nivelul de apreciere (deci, subiectivitate) a celui ce construiete un test. Al doilea concept, msur standardizat, nseamn, de asemenea, mai multe aspecte: a) standardizarea implic uniformitatea procedurii n administrarea, cotarea i evaluarea rezultatelor. Pentru ca scorurile diferitelor persoane s fie comparabile, condiiile de testare trebuie, n mod evident, s fie aceleai pentru toi. n vederea asigurrii acestei uniformiti a condiiilor testrii, constructorul testului are obligaia s ofere informaii i direcii detaliate pentru administrarea fiecrui test nou. De altfel, formularea acestor direcii este o parte major a standardizrii unui test nou, deoarece ele se refer la: - materialele folosite; instruciunile orale (instructajul); - demonstraiile preliminare; - modalitile de rspuns la ntrebrile i neclaritile ridicate de ctre subieci; - orice alte detalii privind situaia de testare; b) un alt pas important n standardizare este stabilirea normelor, a etalonului, la care raportm, dup aplicarea testului, rezultatele obinute de ctre subiect. Ceea ce obine concret la un test un subiect constituie scorul brut (raw score) i el poate s exprime numrul corect de itemi, timpul cerut pentru ndeplinirea unei sarcini, numrul erorilor sau alte modaliti de msurare potrivite coninutului testului. Acest scor nu spune nimic pn nu l raportm la norme sau la etalon. (Cuvntul norme este preluat din limba englez i el este echivalent cuvntului etalon din limba romn). n sfrit, conceptul eantion de comportament se refer la faptul c, n aciunea de testare, vizm o anumit secven a comportamentului sau un anumit tip de comportament, cum ar fi, de exemplu: comportament inteligent, comportament creativ, comportament motric, comportament verbal etc. S mai poposim puin i asupra altei definiii dat testului psihologic de ctre Robert Gregory: Testul psihologic este o procedur standardizat folosit pentru eantionarea comportamentului i descrierea lui cu ajutorul categoriilor sau scorurilor. Plecnd de la aceast definiie, putem deduce faptul c majoritatea testelor prezint urmtoarele caracteristici definitorii: a) procedura de standardizare; b) eantionul de comportament; c) scoruri sau categorii; d) norme sau standarde; e) predicia comportamentului netestat. Procedura de standardizare este trstura esenial a testului psihologic. Niciun examinator nu are voie s se abat de la setul de instruciuni i de
36
NICOLAE MITROFAN
precizrile privind modul de aplicare a testului existente n cadrul manualului. Acestea reprezint o garanie privind faptul c procedurile de administrare se aplic identic de ctre toi. Eantionul de comportament este de interes n msura n care el permite examinatorului s fac inferene asupra domeniului total al comportamentului. De exemplu, scopul unui test de vocabular, care cuprinde un numr determinat de cuvinte este, de fapt, de a msura cunoaterea general a vocabularului de ctre examinat. Pe de alt parte, un bun test trebuie s aib capacitatea de a-i permite examinatorului s prognozeze alte comportamente i nu pe cele reflectate de itemi. Dac, de exemplu, rspusnul Da la ntrebarea Beau foarte mult ap ? se ntmpl s ajute la prognozarea depresiei, atunci aceast ntrebare care pare a nu avea nicio legtur devine un index util al depresiei. Aplicarea testelor se finalizeaz cu derivarea de scoruri sau de categorii. ntru-ct se prezum c toi oamenii posed trstura sau caracteristica ce urmeaz a fi msurat ntr-o anumit cantitate, scopul testrii psihologice este de a estima tocmai aceast cantitate, exprimat numeric. De asemenea, un test psihologic trebuie s posede norme sau standarde. Rezultatele obinute de grupul de normare sau eantionul de standardizare sunt grupate pe mai multe clase, stabilindu-se performana medie i, totodat, ele servesc la indicarea frecvenei cu care diferite scoruri cu valoare mai mare sau mai mic sunt obinute. Teme de reflecie-autoevaluare: 1. Care sunt elementele de asemnare i cele de deosebire ce rezult n urma analizrii multiplelor definiii date testului psihologic ? 2. De fapt, ce este testul psihologic ?
2.2. Echipamentul testului psihologic Aa dup cum am precizat n Modulul I, din nefericire, mult timp testele au fost folosite n practic n variante complet necorespunztoare: fie nu se cunotea autorul testului, fie nu exista manual al testului, fie nu existau foi de rspuns standard etc. Orice student care i ncepe studiile n domeniul psihologiei trebuie s tie c fiecare test trebuie s aib un echipament (n limba englez i se spune kit) complet. Ce nseamn asta? nainte de orice, testul este oferit, ca orice marf, ntr-un fel de ambalaj (geant, serviet, traist, cutie de carton etc.) pe care este nscris titlul testului. n interior regsim dou categorii de componente, respectiv: a) testul propriu-zis, adic proba sau sarcina pe care o are de rezolvat subiectul, mpreun cu instructajul i, eventual, cu cteva exemple, pentru ca subiectul s neleag mai bine ce are de fcut. Sarcinile pot fi foarte diverse, n funcie de specificul testului: poate rspunde la unele ntrebri, poate efectua anumite desene, poate opera cu cuvinte sau propoziii, poate construi ceva, poate opera cu un material figural etc. De cele mai multe ori testul vizeaz anumite aspecte comportamentale ale subiectului i, n funcie de rezultate, ofer informaii asupra altor comportamente, considerate a fi comportamente
37
NICOLAE MITROFAN
netestate. Testul l poate ntreba pe subiect dac are prieteni sau nu, dac merge la petreceri sau la ntlniri, dac-i place s stea mai mult singur etc., rspunsurile primite msurnd comportamentul introvert sau extrovert; b) materiale auxiliare: b1 manual i, eventual manual tehnic, n care se prezint, n mod obligatoriu, urmtoarele: - ce urmrete s msoare testul, dei intenia poate s apar din titlu; - autorul sau autorii, reviziile efectuate, istoricul testului; - cui se adreseaz (categoria socio-profesional, vrst, sex etc.); - caracteristicile eantionului pe care a fost etalonat testul; - valoarea coeficientului de fidelitate (inclusiv procedurile n baza crora s-a calculat acest coeficient (forma test-retest, forma alternant, forma split-half etc.); - valoarea coeficientului de validitate (inclusiv procedurile n baza crora s-a calculat acest coeficient; tipul de criteriu folosit); - precizri privind timpul de rezolvare, precauii etc.; - instruciuni privind cotarea rezultatelor (puncte, bonificri, penalizri etc.); - norme sau etaloane, la care se raporteaz rspunsurile individuale. b2 partea material a testului, cum este cazul a testelor-aparte, a testelor de performan: - asamblri de obiecte; - aranjri de imagini; - construcii; cuburi etc.; b3 foi de rspuns, construite special, pentru a fi uor de cotat; ele poart numele de foi standard; b4 grila sau grilele de rspuns Desigur, n cazul n care testul este computerizat el apare pe CD i multe din componentele auxiliare ale testului sunt adaptate. Important este, ns, faptul c pentru multe teste exist ambele forme i forma fizic, s-i spunem, i forma electronic. Exist ns i teste care n-au cum s fie computerizate, cum este cazul marilor baterii de inteligen (Bateria Stanford-Binet, Bateriile Wechsler etc.), mai ales datorit subtestelor de performan ce presupun ca subiectul s fac ceva (s construiasc, s identifice n imagini, s completeze anumite lipsuri etc.). Tem de reflecie/autoevaluare: Dac dorim s cumprm un test ce msoar inteligena i constatm c vnztorul (firma ce vinde teste) are 2 asemenea teste, pe care l preferm ? Deci, n baza a cror criterii ? 2.3. Funciile psihodiagnozei A aplica teste pe un subiect nu poate fi un simplu scop n sine. Chiar dac o facem din curiozitate tot aflm ceva, deci tot ajungem la un rezultat, ceea ce nseamn, de cele mai multe ori, un diagnostic. n practica psihodiagnostic, ns, testele sunt folosite de ctre specialiti urmrindu-se scopuri foarte precise. De aceea, autorii (U.Schiopu, 2003) vorbete de existena mai multor funcii ale psihodiagnozei i anume:
38
NICOLAE MITROFAN
a) surprinderea ct mai corect i ct mai exact posibil a trsturilor i caracteristicilor psihice individuale sau, dac avem n vedere un grup de subieci, evidenierea variabilitii psihocomportamentale. Aplicnd un test de inteligen pe un grup de elevi (de exemplu, o clas) putem s scoatem n eviden diferenele dintre ei n ceea ce privete aceast aptitudine. Unii vor rezulta a fi foarte inteligeni, alii, cu o inteligen de nivel mediu i alii, cu un nivel de inteligen mai redus. i, tii care-i culmea ? Nu este obligatoriu ca cei cu un nivel de inteligen ridicat s aib i cele mai bune rezultate colare iar cei cu un nivel de inteligen sub medie s aib cele mai slabe performane colare. Revenind la funcia de care ne ocupm, putem spune c acest tip de psihodiagnostic este psihodiagnosticul diferenial; b) evidenierea cauzei sau cauzelor care au condus la conturarea unei realiti psihocomportamentale, mai ales n cazul unor destructurri, dezorganizri ale sistemului psihic, luat n ansamblul su sau ale unor subcomponente ale acestuia ( psihodiagnoz etiologic); un rol foarte important l au, n aceast direcie, testele proiective, mai ales testele de desen, cele care obin informaii despre subiect nu n manier direct, ci n una indirect, prin ceea ce deseneaz sau prin ceea ce vede n anumite desene, poze, plane etc. Dac un copil i deseneaz familia, punnd n centru pe tata, care apare supradimensionat, el ne spune indirect despre faptul c tatl su este hiperautoritar; c) formularea unui prognostic, anticiparea evoluiei psihocomportamentale n anumite situaii i contexte acionale i interacionale; de exemplu, se fac testri pentru admiterea n diferite forme i nivele de nvmnt, se angajeaz personal pentru diferite posturi de munc sau posturi de conducere etc. n baza rezultatelor la teste, desigur dac acestea sunt bune, se ofer anumite garanii n legtur cu integrarea optim ntr-o activitate viitoare. Dac admiterea la facultate s-ar face pe baz de teste (de exemplu, teste de aptitudini), n baza rezultatelor obinute, am putea anticipa c cei care au obinut scorurile cele mai mari, vor obine i performanele colare cele mai mari; d) sprijinirea sarcinilor pe linia consilierii colare i vocaionale; este vorba despre aciunile iniiate n rndul tinerilor n vederea orientrii lor ctre formele de colarizare i de pregtire profesional. Testele psihologice ajut la depistarea capacitilor, aptitudinilor, trsturilor de personalitate ale tinerilor. Toate la un loc constituie echipamentul psihologic individual i, n funcie de acesta, tnrul este orientat ctre aceste profesii i, mai nti, ctre acele forme de pregtire, n raport cu care tnrul posed capacitile sau nsuirile psihice solicitate. Ca s dm un exemplu simplu, dac la un tnr constatm c sunt bine dezvoltate aptitudinile de calcul matematic, l vom orienta ctre profesiile ce solicit asemnea nsuiri psihice; e) conturarea necesitilor privind acordarea asistenei psihologice n forma consilierii psihologice i psihoterapiei. De multe ori, specialitii apeleaz la diferite teste psihologice (forme obiective de msurare) pentru a preciza mai bine condiia psihic a subiectului (poate fi vorba de anumite stri accentuate de tensiune psihic, poate fi vorba de anumite tendine psihopatologice etc.). Apoi, se precizeaz tipul de intervenie, cum ar fi tratamentul psihoterapeutic i
39
NICOLAE MITROFAN
chiar psihofarmacologic. La sfritul programului de terapie i asisten se pot iari aplica teste psihologice pentru a se vedea dac s-au produs sau nu modificri, evident, n sens pozitiv. De exemplu, se poate constata c subiectul nu mai este la fel de depresiv sau la fel de anxios aa cum era la nceput; f) evidenierea cazurilor de abatere de la etalonul privind dezvoltarea normal psihointelectual i psihocomportamental. Specialitii n domeniul psihologiei dezvoltrii au elaborat anumite etaloane privind dezvoltarea psihic. De exemplu, pentru copiii mici, de o anumit vrst se tie cum trebuie s se prezinte ei din punct de vedere psihologic: cte cuvinte pot s foloseasc, ce tipuri de aciuni pot s fac, cum trebuie s se raporteze la cei din jur, cum trebuie s rspund la anumii stimuli afectogeni etc. Unii copii pot s in pasul cu cerinele etalonului, alii, ns, nu i aceasta din multiple motive: n-are cine s se ocupe de ei, nu frecventeaz instituiile precolare, stare de sntate precar, lipsuri materiale etc. Cu ajutorul testelor psihologice se poate stabili dac copilul prezint anumite rmneri n urm pe linia dezvoltrii i ct de grave sunt acestea. n funcie de rezultate se trece apoi la fundamentarea tiinific a unor programe corectiv-recuperative. g) evaluarea i validarea unor programe de nvare i formare profesional i, pe de alt parte, n baza rezultatelor, fundamentarea unor noi programe, realizarea unor corecii sau, dac este cazul, nlocuirea total a unor programe; h) formarea capacitilor de cunoatere i autocunoatere. Este cunoscut faptul c atunci cnd se pune problema s facem evaluri referitoare la propria noastr persoan sau n raport cu alte persoane, putem s greim din cauza subiectivismului. Astfel, putem s ne supraapreciem sau s ne subapreciem iar atunci cnd ne raportm la alt persoan, de asemenea, putem s o supraapreciem sau s o subapreciem. Or, testele psihologice, n calitatea lor de mijloace obiective de evaluare, ne ajut s surprindem realitatea aa cum este ea. Folosind mai des testarea psihologic, ne putem atepta i la realizarea unor corecii privind grilele de evaluare pe care le folosim n evaluarea altor persoane sau pentru autoevaluare. Tem de reflecie/autoevaluare: Ce credei c trebuie fcut dac, n urma testrii psihologice, constatm c un copil depete cu mult nivelul de dezvoltare psihic valabil pentru nivelul lui de vrst ?
1. De ce credei c exist mai multe definiii date testelor psihologice ? 2. Care sunt cele mai importante elemente de asemnare a multiplelor definiii formulate ? 3. Ce nseamn msur obiectiv a unui eantion de comportament ? 4. Ce nseamn msur standardizat a unui eantion de comportament ? 5. n ce const echipamentul complet al unui test psihologic ? 6. La ce ne folosete manualul testului ? 7. n raport cu ce elemnte putem stabili valoarea testului psihologic ? 8. Care sunt principalele funcii ale psihodiagnozei ? BIBLIOGRAFIE MINIMAL
40
NICOLAE MITROFAN
1. CLINCIU, AUREL, ION. 2005) Psihodiagnostic. Braov: Edit. Universitii din Braov. 2. ALBU, M (1998). Construirea i utilizarea testelor psihologice. Cluj-Napoca: Clusium. 3. SCHIOPU, U. (2003). Introducere n psihodiagnostic. Bucureti: Ed. Pro-Humanitas. Unitatea de nvare 2 Clasificarea testelor psihologice Cuprins: 2.1. Clasificarea realizat de U. Schiopu 2.2. Clasificarea realizat de H. Pitariu 2.3. Cum depim multiplele clasificri ? Obiective: La sfritul acestei uniti de nvare, studenii vor fi capabili s: cunoasc criteriile de clasificare a testelor propuse de U. Schiopu; cunoasc criteriile de clasificare a testelor propuse de H. Pitariu; stabileasc n ce msur unele criterii de clasificare sunt exclusive sau nu diferenieze i alte criterii de clasificare a testelor psihologice Clasificarea testelor realizat de U. Schiopu Mai nti, trebuie s precizm faptul c exist un numr impresionant de teste psihologice. Nimeni nu tie numrul lor exact, dar se vorbete de existena a mii de teste. n unele ri, cum este cazul, mai ales, a SUA, psihodiagnosticul este foarte bine dezvoltat i foarte bine reglementat. Sunt foarte multe studii efectuate pentru a se urmri calitile psihometrice i n ce msur ele sunt utile n practic. Avnd n vedere c exist extrem de multe teste, se ridic problema clasificrii lor i, legat de aceasta, a criteriilor de clasificare. Desigur, mai muli autori au ncercat s realizeze clasificri, ns noi ne vom referi la doi autori romni. U. Schiopu (2003) reuete s diferenieze urmtoarele tipuri de clasificri: a) clasificri ce se bazeaz pe sarcinile psihodiagnozei, adic pe structura obiectivelor ce caracterizeaz testele unui sistem de diagnoz; b) clasificri ce se bazeaz pe diferenele semnificative de strategie inclus n structura de ansamblu a bateriei; c) clasificri ce se bazeaz pe tipul de material administrat n teste i pe caracteristicile acestuia; d) clasificri ce se bazeaz pe diferene n ceea ce privete forma de administrare a testelor; e) clasificri ce se bazeaz pe caracteristicile tipurilor de rspunsuri solicitate; f) clasificri ce se bazeaz pe tipurile de rspunsuri primite. Clasificri n funcie de scopul urmrit. Putem diferenia: - teste de cunotine sau teste pedagogice; - teste de inteligen; - teste de aptitudini; - teste pentru msurarea unor abiliti senzorio-motorii;
41
NICOLAE MITROFAN
- teste de atenie; - teste de memorie; - teste de personalitate; - teste de sociabilitate; - teste de creativitate; - teste pentru msurarea temperamentului; - teste de interese; Unele dintre aceste categorii de teste, la rndul lor, sunt profilate mai precis, n funcie de obiectivul urmrit. Ex. 1 - testele de inteligen pot fi: - teste de inteligen general; - teste de inteligen tehnic; - teste de inteligen abstract; - teste de inteligen social; - teste de inteligen emoional; - teste de inteligen kinestezic. Ex. 2 testele de atenie pot fi teste care urmresc ca obiective: - concentrarea ateniei; - stabilitatea ateniei; - mobilitatea ateniei; - distributivitatea ateniei. Ex. 3 testele de memorie pot fi: - pentru memoria cifrelor, a figurilor; - pentru memoria topografic Ex. 4 testele de aptitudini pot fi: - pentru aptitudini tehnice; - pentru aptitudini numerice, matematice; - pentru aptitudini artistice; - pentru aptitudini verbale; - pentru aptitudini pedagogice; - pentru aptitudini organizatorice Clasificri ce se bazeaz pe diferenele semnificative de strategie inclus n structura de ansamblu a bateriei. Acest criteriu vizeaz, practic, nivelul de corelaie dintre diferite teste. n aceast privin pot s existe urmtoarele situaii: a) ntre dou teste poate s nu existe niciun fel de legtur (deci, nivel de corelaie = 0), ele urmrind s msoare n mod independent caracteristici psihice total diferite; b) ntre teste poate s existe o corelaie pozitiv, cu valoarea coeficientului de corelaie ce tinde ctre valoarea + 1, atunci, mai ales, cnd msoar aceeai nsuire psihic. Se poate da, ca exemplu, nivelul nalt de corelaie dintre dou baterii de inteligen, cum ar fi cazul Bateriilor StanfordBinet i Wechsler; c) ntre mai multe teste poate apare situaia intercorelrii unor factori, cum ar fi cazul factorilor de grup; de exemplu: factorul verbal, factorul
42
NICOLAE MITROFAN
numeric, factorul spaial. Mai multe teste pot fi saturate diferit n ceea ce privete fiecare dintre aceti factori. Clasificri n funcie de materialele i caracteristicile materialelor utilizate: a) trebuie difereniate, mai nti, testele creion-hrtie, denumire generic ce presupune rspunsul scris pe foi de rspuns, de testele- aparate, pe de o parte (de exemplu, pompa Schultz, strungul Lahy etc.) i testele ce folosesc diferite materiale, pe de alt parte (de exemplu, cuburile Kohs, asamblarea de imagini etc.); b) tot din perspectiva acestui criteriu, pot fi difereniate testele verbale i testele nonverbale, prima categorie bazndu-se pe utilizarea limbajului i pe comprehensiunea verbal. A doua categorie msoar o serie de capaciti psihice care nu sunt condiionate de limbaj i ele pot fi aplicate celor ce prezint unele handicapuri i celor care provin dintr-un mediu cultural modest sau dintr-un mediu cultural strin; Clasificri privind forma de administrare. n funcie de acest criteriu, testele pot fi: individuale sau colective. Chiar dup denumire, cele individuale se aplic exclusiv unui singur subiect; de exemplu, bateria de inteligen Stanford-Binet, testul Bayley pentru copiii mici, testele proiective etc.). Ele prezint marele avantaj c subiectul poate fi observat tot timpul ct i se aplic testul. Testele colective se aplic pe grupuri mai mari sau mai mici de subieci. Desigur ele se aplic i individual. Prezint avantajul c n timp scurt pot fi testai muli subieci; Clasificri n funcie de tipul de rspuns solicitat. n raport cu acest criteriu testele pot fi grupate astfel: a) teste cu rspuns la alegere; este cazul unor teste de personalitate, la care se alege un rspuns din dou posibiliti, de tipul Da, Nu sau se folosesc scale de rspuns, de tipul n foarte mare msur, n mare msur, n oarecare msur, n mic msur, n foarte mic msur; de asemenea, este cazul testelor de cunotine, la ai cror itemi exist mai multe rspunsuri la alegere, printre care exist i rspunsul corect; b) teste cu un singur rspuns bun, cum este cazul, mai ales, a testelor de inteligen i a testelor de aptitudini. Subiectul ofer ca rspuns fie un numr, fie un cuvnt, fie o figur sau o imagine etc. Rspunsul dat este corect sau nu; c) teste cu rspuns liber, cum este cazul, mai ales, a testelor proiective, i mai ales a celor pe baz de plane (de exemplu, testul Rorschach, Testul T.A.T), n cadrul crora subiectul este lsat liber s ofere rspunsul. n cazul acestor teste, ns, dificultile de cotare i de interpretare a rspunsurilor sunt mult mai mari, necesitnd o mare specializare din partea practicienilor; Clasificri n funcie de formele i tipurile de rezultate obinute. Plecnd de la acest criteriu, putem diferenia dou categorii de teste: a) teste sintetice, care, n urma aplicrii lor, ofer un rezultat global, de genul: QI coeficient de inteligen; QD coeficient de dezvoltare; Q.Kre coeficient de creativitate; Q.E. coeficient emoional; b) teste analitice, care, n urma aplicrii lor, permit conturarea profilului psihologic. Este cazul, mai ales, a testelor de
43
NICOLAE MITROFAN
personalitate, chestionare sau inventare de personalitate, care conin mai multe scale.
Teme de reflecie/autoevaluare: 1. Care sunt criteriile folosite de U. Schipou pentru clasificarea testelor ? n ce msur putem considera c aceste criterii sunt suficiente ? 2.2. Clasificarea realizat de H. Pitariu (1993) Aceast clasificare este fcut n funcie de elementele care dau testului calitatea de prob standardizat: coninutul, administrarea i cotarea. n funcie de coninut testele pot fi mprite n dou categorii: 1. dup sarcina i 2. dup modul de procesare Dup sarcina cu care trebuie s se confrunte persoana examinat, testele se pot mpri astfel: a) teste verbale, care, la rndul lor, pot fi orale sau scrise (cele de tip creionhrtie); b) teste nonverbale, care pot fi mprite n dou subcategorii: b1 cu manipulare de aparate i piese; b2 administrate cu ajutorul calculatorului; c) teste de performan (subiectului i se solicit s opereze la un aparat, s completeze unele figuri lacunare sau s reproduc diferite imagini cu ajutorul unor cuburi etc.). Dup modul de procesare implicat (adic la ce i se cere persoanei s fac pentru a da un rspuns), testele pot fi mprite n dou categorii: a) teste intelective, care, la rndul lor, pot fi mprite n urmtoarele subcategorii: a1 teste de performan; a2 teste de aptitudini; a3 teste de cunotine; a4 teste situaionale; b) teste nonintelective (chestionare/inventare de personalitate) Criteriul administrarea testelor. Dup modul n care sunt administrate, ele pot fi clasificate n termeni de eficacitate a examenului psihologic i n funcie de unele exigene legate de timpul de examinare. n funcie de eficacitate, testele pot fi mprite n dou grupe: a) teste individuale; b) teste de grup sau colective; n funcie de timp, testele pot fi grupate, de asemenea, n dou grupe, respectiv: a) teste de vitez- cu limit de timp; b) teste de randament, care pot fi: b1- cu limit de timp; b2 cu timp nelimitat. Tot n raport cu criteriul administrare, putem mpri testele n dou grupe: 1. teste standardizate; 2. teste nestandardizate. Criteriul cotarea testelor. Tehnica de cotare a unui test poate fi obiectiv sau subiectiv. De aceea, testele pot fi clasificate n dou categorii: a) teste obiective performana se apreciaz dup o procedur fix, impersonal, de ctre un simplu operator sau cu ajutorul unei maini de cotare; b) teste proiective (completare de fraze, pete de cerneal), cele care prezint n cotare o doz mare de subiectivism.
44
NICOLAE MITROFAN
Teme de reflecie/autoevaluare 1. Care sunt criteriile folosite de H. Pitariu pentru clasificarea testelor ? 2. n ce msur aceste criterii sunt suficiente pentru clasificarea testelor ? Care sunt elementele de asemnare i de diferen dintre clasificarea realizat de U. chiopu i cea realizat de H. Pitariu ?
Cum putem depi inconvenientul multiplelor clasificri ? Clasificrile realizate nu trebuie s fie privite n mod exclusivist. Interferenele pot fi considerate i n sens vertical. De exemplu, dac lum n analiz un anumit test de inteligen i urmrim clasificarea fcut de U. chiopu vom constata c l putem regsi n una din categoriile de la fiecare criteriu. Astfel, n funcie de: a) criteriul obiective el msoar inteligena general; b) criteriul strategie testul are un caracter eterogen; c) criteriul material administrat test verbal, de tip creion-hrtie; d) forma de administrare se aplic individual; e) rspunsuri solicitate un singur rspuns la fiecare item; f) tipul de rezultate valoarea Q.I., care este un rezultat sintetic. Mai trebuie s facem o precizare. n niciuna din clasificrile fcute nu sunt luate n atenie testele care sunt oferite nu neaprat psihologilor specialiti, ci nespecialitilor. De aceea, n funcie de gradul de standardizare, credem c putem diferenia 3 categorii de teste: a) teste standardizate, cele care pot fi aplicate numai de ctre psihologi; b) teste semistandardizate, cele care sunt destinate altor categorii de beneficiari, cum ar fi: cadrele didactice, prinii, personal medical, asisteni sociali etc. c) teste nestandardizate, cele care se folosesc mai mult pentru ocuparea timpului liber . n finalul acestei discuii privind clasificarea testelor subliniem faptul c activitatea de psihodiagnoz nu se reduce i nu trebuie s se reduc numai la aplicarea unui test sau a unui grup de teste. Aplicarea efectiv a unor instrumente psihodiagnostice este doar o etap n succesiunea de etape ale activitii de psihodiagnoz care ncepe cu cunoaterea subiectului prin intermediul observaiei conduitei, a anamnezei, a unei microanchete etc.
1. Ce criterii folosete U. Schiopu n clasificarea testelor psihologice ? 2. Cum sunt mprite testele n funcie de criteriul obiective urmrite ? 3. Ce criterii folosete H. Pitariu n clasificarea testelor psihologice ? 4. Dai un exemplu de test i ncercai s-l plasai n funcie de cerinele clasificrii realizate de U. chiopu. 5. Dai un exemplu de test i ncercai s-l plasai n funcie de cerinele clasificrii realizate de H. Pitariu.
45
NICOLAE MITROFAN
4. n ce msur utilizarea calculatorului n testarea psihologic afecteaz clasificarea fcut de U. Schiopu ? 4. Care sunt elementele de asemnare i de diferen dintre cele dou clasificri ? 5. Cum pot fi depite limitele impuse de multiplele clasificri ? 6. Ce sunt i ce rol joac testele semistandardizate ? 7. Ce sunt i ce rol joac testele nestandardizate ? BIBLIOGRAFIE MINIMAL ALBU, M., PITARIU, H. (1993), Proiectarea testelor de cunotine i examenul asistat de calCulator. Cluj-Napoca: Casa crii de tiin. CLINCIU, ION, AUREL (2005), Psihodiagnostic. Braov: Editura Universitii. SCHIOPU, URSULA (2003), Introducere n psihodiagnostic. Editura Pro-Humanitas. Unitatea de nvare 3 Testele psihologice i Codul deontologic Cuprins: 3.1. Standarde pentru testarea psihologic 3.2. Psihologia ca profesie i Codul deontologic Obiective: La sfritul acestei uniti de nvare, studenii vor fi capabili s: cunoasc preocuprile la nivel internaional privind crearea standardelor pentru activitatea psihodiagnostic; cunoasc cerinele privind calificrile psihologului care aplic anumite categorii de teste; interpreteze corect prevederile existente n cadrul Codului deontologic; cunoasc atribuiile Comisiei de deontologie din cadrul Colegiului Psihologilor din Romnia. 3.1. Standarde pentru testarea psihologic La nivel internaional au existat i exist n continuare preocupri privind elaborarea unor standarde ct mai nalte pentru testarea psihologic. Asemenea preocupri pot fi grupate n urmtoarele categorii: 1. Standarde nalte pentru constructorii i utilizatorii de teste. Trebuie, mai nti, subliniat faptul c, aproape paralel cu publicarea primelor teste i, prin urmare, cu naterea psihometriei, au aprut i primele preocupri privind protejarea activitii psihodiagnostice. nc din 1895 American Psychological Association (APA) a format primul su comitet ce urma s se ocupe de msurarea mintal i de modul n care se aplic testele noi. Un alt comitet APA a fost nfiinat n 1906, cu misiunea de a se ocupa de problemele de standardizare. n 1923 membrii APA resping recomandrile fcute de un comitet privind monitorizarea modului de utilizare a testelor de ctre nepsihologi. n 1954 APA public Technical Recommendations for Psychological Tests and Diagnostic Tests, document care stabilea standardele pentru testarea psihologic, precum i recomandrile tehnice. n anul imediat urmtor, o alt organizaie profesional The National Educational
46
NICOLAE MITROFAN
Association-, lucrnd n colaborare cu National Council on Measurement Used in Education (cunoscut n prezent sub numele The National Council on Measurement), a elaborat i publicat Technical Recommendations for Achievement Tests. De-a lungul anilor au aprut din ce n ce mai multe publicaii ale APA n care regsim serioase preocupri privind asigurarea unui nalt nivel de profesionalism n utilizarea testelor psihologice (Gregory, R.J., 1996). Iat unele dintre cele mai importante: - Standards for Educational and Psychological Tests and Manuals (1966); - Automated Test Scoring and Interpretation Practices (1966); - Standards for Educational and Psychological Tests (1974); - Principles for the Validation and Use of Personnel Selection Procedures (1980); - Speciality Guidelines for the Delivery of Services by Clinical Psychologists (1981); - Speciality Guidelines for the Delivery of Services by Industrial/Organizational Psychologists (1981); - Speciality Guidelines for the Delivery of Services by School Psychologists (1981); - Ethical Principles of Psychologists (1981, 1992); - Standards for Educational and Psychological Testing (1985); - Guidelines for Computers-Based Tests and Interpretations (1986); - Standards for Educational and Psychological Testing (1993). The National Association of School Psychologists (NASP) a adoptat, n 1984, Principles for Professsional Ethics, un ghid extrem de util pentru selecia, utilizarea i interpretarea testelor psihologice. Acesta a fost revizuit i adoptat n 1992. Asociaia Psihologilor Americani a manifestat ntotdeauna grij pentru ca testele s fie aplicate la un nivel nalt tiinific, dar numai de ctre cei calificai pentru aceasta. nc din 1950, un comitet al su pentru Ethical Standards for Psychology a publicat un raport, intitulat Ethical Standards for the Distribution of Psychological Tests and Diagnostic Aids. Printre altele, acest raport diferenia trei niveluri de calificare pentru utilizarea testelor i anume: - Nivelul A: teste care pot fi administrate, scorate i interpretate adecvat cu ajutorul manualului i al unei orientri generale (de exemplu, teste de achiziie); - Nivelul B: teste care reclam anumite cunotine tehnice privind construirea i utilizarea testelor, precum i cunotine din alte domenii ale psihologiei, precum: psihologia diferenial, statistica psihologic, psihologia personalului, psihologia adaptrii, orientarea vocaional (de exemplu, teste de aptitudini, inventare de adaptare aplicabile populaiei normale). - Nivelul C: teste care solicit cunotine de nalt nivel privind testarea i din alte domenii de suport, la care trebuie s se adauge supervizarea din partea unor specialiti n aceste domenii (de exemplu, teste proiective, teste de inteligen individuale). Acest raport a fost integrat apoi n publicaia APAs Ethical Standards of Psychologists (1953) i citat n Standards for Educational and Psychological Tests and Manuals (1966).
47
NICOLAE MITROFAN
n Ethical Principles of Psychologists (1992) sunt fcute precizri i mai clare privind calificrile utilizatorilor de teste. Astfel, Principiul A afirm c psihologii ofer numai acele servicii i utilizeaz numai acele tehnici pentru care sunt calificai prin educaie, formare sau experien. Standardul etic 2.02 adaug: psihologii se abin de la utilizarea necorespunztoare a tehnicilor de msurare i, totodat, iau msuri pentru a preveni ca alii s utilizeze defectuos informaia pe care o ofer aceste tehnici. Cu toate msurile luate s-a constatat c, n practic, se ntlnesc frecvente abateri. De aceea, APA, mpreun cu The American Research Association, The National Council on Measurement in Education i cu foarte multe edituri ce publicau teste, a nfiinat The Joint Committee on Testing Practice (JCTP). Acesta a adoptat, n 1988, The Code of Fair Testing Practices in Education, care descrie obligaiile celor care construiesc teste, precum i ale celor ce le aplic, n patru arii: a) dezvoltarea/selectarea testelor; b) interpretarea scorurilor; c) strdania pentru corectitudine; d) informarea subiecilor. 2. Creterea obiectivitii n aplicarea i interpretarea testelor. Dei n literatura psihodiagnostic apar lucrri favorabile testelor proiective, practicienii tind tot mai mult s se orienteze ctre testele obiective i, n special ctre chestionare i inventare de personalitate, avnd n frunte testul Minnesota Multiphasic Personality Inventory, varianta revizuit MMPI-2. Un indicator al acestei tendine l reprezint creterea numrului de referine favorabile acestui test fa de alte teste proiective i , mai ales, fa de testul Rorschach, aa cum apare n The Mental Measurement Yearbook i n alte surse (de exemplu, la Polyson, Peterson i Marshall, 1986). O alt tendin ctre creterea obiectivitii se manifest n continuarea cercetrilor privind testarea psihologic. Dei exist mii de studii publicate n legtur cu testul MMPI, respectiv, MMPI-2, interesul pentru investigare i cercetare nu numai c nu nceteaz, ci, dimpotriv, se accentueaz de la un an la altul i va crete cu siguran n viitor. n acest fel se prefigureaz o cretere substanial a orientrii practicienilor ctre testele de personalitate, n detrimentul unor teste proiective. Tem de reflecie/autoevaluare: Care ar fi consecinele absenei preocuprilor privind elaborarea unor standarde pentru activitatea psihodiagnostic ? 3.2. Psihologia ca profesie i Codul deontologic. Psihologia este o profesie foarte cutat, dovad fiind, nainte de orice, numrul mare de candidai ce se prezint la examenul de admitere la facultile de profil. Dup absolvire, psihologul poate lucra n diverse domenii, cum ar fi, instituii colare, firme, instituii militare, organizaii guvernamentale sau neguvernamentale, instituii medicale, n cadrul unor cabinete particulare etc. Mai peste tot el apeleaz la testul psihologic pentru a evalua subiectul. Aceast aciune de evaluare este de mare importan i ea ridic serioase probleme privind responsabilitatea specialistului. n baza rezultatelor la teste se stabilesc diagnostice i se iau decizii privind persoana subiectului. Dac acestea nu sunt corecte i
48
NICOLAE MITROFAN
concordante cu realitatea, cel care sufer este subiectul i nimeni nu are voie s se joace cu soarta acestuia. n urma evalurii psihologice se poate determina dac subiectul este apt sau nu pentru o anumit slujb, dac prezint un anumit nivel de anormalitate psihic, dac este sau nu n posesia unor capaciti i aptitudini etc. Dar n cazul n care diagnosticul este greit ce se ntmpl cu subiectul ? Haidei s ne gndim ce se ntmpl cu un copil precolar care, n urma testrii psihologice, este orientat ctre formele nvmntului special, dei, ulterior se poate constata c acest copil prezint numai nite rmneri n urm pe linia dezvoltrii psihice, uor recuperabile. Deci utilizarea testelor psihologice presupune mari rspunderi, de ordin profesional, de ordin moral i chiar de ordin juridic.Aa se explic de ce au existat i exist n continuare preocupri pentru elaborarea unor standarde i, respectiv, a unor coduri deontologice. n continuare noi vom face precizri mai ales n baza Codului deontologic al Asociaiei Psihologilor Americani (APA), intitulat Ethical Principles of Psychologists. (v. i Anastasi, A., 1996). i din acesta vom meniona n special ceea ce ine de Tehnicile de msurare (Assessment Techiques). Vom lua n atenie 3 categorii de probleme: a) legate de construcia i dezvoltarea testelor: - cei care construiesc teste i le pun n circuit au obligaia de a evita graba i superficialitatea lansndu-le n mod prematur pentru uzul general. Iar atunci cnd un test este distribuit numai n scopuri de cercetare, aceast condiie trebuie specificat foarte clar; - manualul trebuie s ofere informaii ct mai complete i mai corecte asupra testului, evitndu-se tendinele publicitare care s pun testul ntr-o lumin favorabil; - testele nu trebuie s fie publicate n ziare, magazine, cri populare, fie n scopuri descriptive, fie n scop de autoevaluare; - testarea prin pot sau telefonic este o practic contraindicat, deoarece, pe lng alte riscuri, este contraindicat a se interpreta rezultatele la test n absena altor informaii referitoare la subiectul examinat; - cumprarea, procurarea testelor este accesibil n mod strict numai psihologilor calificai. Fiecare catalog trebuie s cuprind, n mod obligatoriu, cerinele ce trebuie ndeplinite de ctre solicitant sau cumprtor. De exemplu, un student care are nevoie de un test particular pentru sarcini de nvare sau pentru cercetare trebuie s prezinte o comand de cumprare contrasemnat de ctre profesorul lor, care i asum responsabilitatea pentru corecta utilizare a testului. b) legate de protecia subiectului; un factor deosebit de relevant l constituie scopul urmrit de testarea psihologic, care poate fi: a) consilierea indivdual, cunoaterea i autocunoaterea unor probleme i aspecte psihice individuale; b) deciziile instituionale privind selecia i clasificarea subiecilor; c) cercetarea psihologic. Este evident faptul c, n raport cu scopul urmrit, subiectul se raporteaz diferit la testare i la examinator. Dac un subiect se prezint din proprie iniiativ la un cabinet particular, solicitnd ajutor pentru anumite probleme psihice cu care se confrunt, ei vor fi mult mai cooperani dect subiecii ce sunt solicitai instituional s accepte aciunea de testare. Indiferent ns de scopul urmrit de aciunea de testare, apare obligaia ca subiectul s fie informat (consimmntul
49
NICOLAE MITROFAN
informat) asupra: ce se urmrete prin aciunea de testare, tipul de informaii solicitate, modul de utilizare a rezultatelor. Consimmntul informat trebuie s fie obinut de la subiect personal sau de la reprezentantul su legal, existnd i unele excepii i anume: - cnd testarea fr consimmnt este reglementat de lege sau de unele dispoziii guvernamentale (de exemplu, programe de testare la nivel naional); - cnd testarea apare ca o component a activitii colare (de exemplu, testri n scop de evaluare sau de validare a unor programe educaionale la nivel instituional colar; - cnd consimmntul apare n mod implicit (de exemplu, testrile n vederea admiterii n unele instituii educaionale sau angajrii de personal. c) legate de confidenialitate; aici se pune ntrebarea cine are acces la rezultatele obinute n urma aplicrii testelor. Evident, n primul rnd, examinatorul, cel care a aplicat testul. Apoi subiectul are dreptul de a avea acces la rapoartele testrii, dei, n cazul minorilor, i prinii au dreptul la asemenea informaii. n cazul n care apar anumite conflicte ntre dreptul copilului de a fi protejat i dreptul printelui de a avea acces la rezultatele testrii, mai ales n cazul n care relaiile prini-copii pot fi principala cauz a unor probleme psihice cu care se confrunt copilul. Desigur, dac este vorba despre un drept el trebuie respectat, dar, n cazurile conflictuale foarte important este modul n care se face comunicarea unor informaii n aa fel nct aceasta s nu se soldeze cu efecte negative asupra copilului. O alt problem legat de pstrarea confidenialitii este cea privind accesul la rezultatele testrii psihologice a celei de-a treia persoan, alta dect examinatul (sau printele minorului) i examinatorul. n acest caz se aplic principiul general, conform cruia informaiile nu pot fi oferite celei de-a treia persoan fr consimmntul informat al subiectului. Aa dup cum am mai menionat, n cadrul Consiliului Psihologilor din Romnia activeaz, pe lng Comisia metodologic i comisiile aplicative, Comisia de deontologie. Aceasta a elaborat Codul deontologic al profesiei de psiholog cu drept de liber practic i Codul de procedur disciplinar. Codul deontologic cuprinde un set de principii, standarde etice generale, standarde specifice i dispoziii finale. Legat de problematica testrii psihologice, ne intereseaz, mai ales, standardele de competen, standardele cu privire la relaiile umane, standardele de confidenialitate, standardele de nregistrare, prelucrare i pstrare a datelor (din cadrul standardelor generale) i capitolul Evaluare i diagnoz (din cadrul standardelor specifice). Ceea ce este foarte important legat de coninutul acestui cod este precizarea i clarificarea unor noiuni i a unor sintagme. Astfel, ca s dm cteva exemple: 1. datele de evaluare/diagnoz pot fi scoruri brute i standardizate, rspunsurile subiectului la stimuli sau la ntrebrile la test, notele, nregistrrile i consemnrile psihologului, declaraiile i comportamentul clientului n timpul examinrii. Psihologii vor oferi datele obinute, sub form de rezultate clientului i, dac este cazul, unor teri numai cu consimmntul clientului, sau fr acordul acestuia n condiiile prevzute de lege; 2. materialele de evaluare/diagnoz cuprind manualul instrumentului, instrumentul propriu-zis, protocoale, ntrebrile sau stimulii utilizai, alte fie sau formulare necesare i nu includ datele de evaluare/diagnoz; 3. psihologii se vor
50
NICOLAE MITROFAN
asigura c n procesul de obinere a consimmntului informat urmtoarele puncte au fost nelese: scopul i natura activitii; responsabilitile mutuale; beneficiile i riscurile; alternativele; circumstanele unei ncetri a aciunii; opiunea de a refuza sau de a se retrage n orice moment, fr a suferi vreun prejudiciu; perioada de timp n care e valabil consimmntul; modul n care se poate retrage consimmntul dac se dorete acest lucru; 4. psihologii vor informa persoanele fr capacitate deplin de a-i da consimmntul i persoanele pentru care testarea este cerut de reglementrile legislative, cu privire la natura i scopul serviciilor de evaluare propuse, folosind un limbaj uor de neles pentru persoana care urmeaz s fie evaluat; 5. psihologii care folosesc serviciile unui traductor vor cere consimmntul clientului pentru a folosi serviciile acelui traductor, se vor asigura c se va menine confidenialitatea rezultatelor, securitatea instrumentelor, inclusiv a documentelor de evaluare/diagnoz. Orice psiholog format sau aflat n procesul de formare trebuie s cunoasc foarte bine coninutul celor dou coduri, ca, de altfel i celelalte acte normative aprobate de Colegiul Psihologilor din Romnia. Tem de reflecie/ autoevaluare ncercai s listai ct mai multe consecine negative posibile ale nonexistenei i nerespectrii prevederilor unui Cod deontologic.
1. Enumerai cteva tipuri de preocupri existente la nivel internaional privind elaborarea de standarde pentru testarea psihologic, 2. Ce credei c nseamn standarde ? 3. De ce se face diferenierea ntre 3 nivele de calificare pentru obinerea dreptului de a aplica anumite teste ? 4. Care este explicaia faptului c se prognozeaz o cretere a preferinei practicienilor pentru testele obiective (n special, testele de personalitate), n detrimentul testelor proiective ? 5. Enumerai cteva cerine etice privind construcia i dezvoltarea testelor. 6. Enumerai cteva cerine privind protecia subiectului, a celui examinat. 7. Ce tipuri de coduri a elaborat Comisia de deontologie i disciplin a Consiliului Psihologilor din Romnia ? BIBLIOGRAFIE MINIMAL ANASTASI, ANA. (1996). Psychological Testing (7th.ed.). New York: Macmillan. COLEGIUL PSIHOLOGILOR DIN ROMNIA (2006), Acte normative. Ediie adugit. MITROFAN, NICOLAE (2001), Psihometria i direciile ei de dezvoltare la nceput de mileniu. n M. Zlate (coord.), Psihologia la rspntia mileniilor. Iai: Polirom. CLINCIU, ION, AUREL (2005), Psihodiagnostic. Braov: Editura Universitii.
51
NICOLAE MITROFAN
Modulul III Caracteristicile psihometrice ale testelor

Unitatea de nvare 1 Ce sunt caracteristicile psihometrice ale testelor ? Cuprins: 1.1. Precizri conceptuale 1.2. Fidelitatea i validitatea, caractersitci psihometrice de baz 1.3. Alte caracteristici psihometrice Obiective: La sfritul acestei uniti de nvare, studenii vor fi capabili s: cunoasc ce sunt caracteristicile psihometrice ale testelor; evalueze puterea diagnostic a testelor, plecnd de la caracteristicile lor psihometrice; cunoasc obligaiile constructorilor de teste privind caracteristicile psihometrice.
1.1. Precizri conceptuale. Testele psihologice pot fi asemnate, pn la un punct, cu alte instrumente de msur, care pot fi evaluate n ceea ce privete calitatea i gradul lor de precizie. Marele psiholog Alfred Binet ne avertiza pe noi psihologii s nu considerm testul ca pe un simplu cntar, pe care dac te urci, afli imediat ce greutate ai.. Va trebui tot timpul s inem minte acest avertisment. Dar pentru discuia noastr, putem s facem aceast comparaie. Exist cntare de foarte mare precizie i de foarte bun calitate, exist cntare de proast calitate i cu un grad de precizie ndoielnic. Aa i testele. Unele msoar cu mare exactitate anumite capaciti i nsuiri psihice, altele, ns, nu sunt foarte precise, nivelul de credibilitate acordat rezultatelor obinute fiind mai redus. Un test foarte bun i foarte precis este un test sound, nsemnnd puternic, solid i prezint un foarte nalt grad de credibilitate. Revenind la comparaia cu cntarul, acesta este fcut pentru a msura greutatea cu el, deci nu poate fi folosit pentru a msura altceva, nlimea, de exemplu. i dac este construit s msoare greutatea, atunci trebuie s-i fac foarte bine datoria. Aa i cu testul psihologic. El este construit pentru a msura o anumit nsuire psihic i, este de ateptat ca s o fac foarte bine. Rezultatele obinute trebuie s reflecte ct mai bine realitatea. Fcnd toate combinaiile posibile, cel puin teoretic, putem ntlni urmtoarele situaii: a) testul msoar ceea ce i-a propus s msoare i msoar foarte bine (soundness la nivel maximal); b) testul nu msoar ceea ce i-a propus s msoare i msoar prost ceea ce msoar de fapt; c) testul msoar ceea ce i-a propus s msoare, dar msoar prost; d) testul nu msoar ceea ce i-a propus s msoare, dar msoar bine 52
NICOLAE MITROFAN
ceea ce msoar de fapt. Cea mai bun situaie este cea de tip a. Pentru a se menine n aceast categorie, testul trebuie s rspund pozitiv la ntrebarea privind caracteristicile sale psihometrice: Testul este fidel i valid? Definiie: caracteristicile psihometrice sunt acele nsuiri ale testelor care asigur un nalt grad de credibilitate rezultatelor obinute n urma utilizrii lor n activitatea psihodiagnostic. Cele mai importante sunt fidelitatea i validitatea. i foarte important este faptul c aceste nsuiri sunt msurabile i evaluabile. Dup cum o s vedem, ambele caracteristici psihometrice pot fi msurate i exprimate n valori numerice: 0.50, 0.65 etc. Pentru constructorii de teste apare obligaia de a include, n cadrul manualului, informaii privind valoarea celor dou caracteristici psihometrice. i atunci este clar c, n cazul n care avem de ales ntre dou teste care msoar acelai lucru (aceeai nsuire psihic), dar care prezint valori diferite pentru cele dou caracteristici psihometrice, l vom prefera pe cel care are valorile cele mai mari. Acesta este mult mai sigur n aciunea de msurare psihologic. i, de aici, mai apare o obligaie pentru cei care construiesc teste i anume, ei trebuie s acorde o mare atenie respectrii cerinelor privind cele dou caracteristici psihometrice nc din fazele de nceput ale activitii de elaborare i de construire a testelor. Realizai care sunt implicaiile a ce spunem asupra pieei psihodiagnostice ? Fiind preferate testele care stau foarte bine la cerinele privind fidelitatea i validitatea, cele care nu corespund vor iei imediat din competiie. i, ntradevr, n domeniul psihodiagnozei, mai ales a construirii de noi instrumente psihodiagnostice, trebuie s existe o serioas competiie. Tem de reflecie/autoevaluare: ncercai s gsii ct mai multe exemple de situaii n care s-ar folosi teste cu slabe caracteristici psihometrice i evideniai consecinele posibile. 1. 2. Fidelitatea i validitatea Definiii: a) Fidelitatea nseamn gradul n care testul manifest constan n msurare, adic dac el este capabil s ofere o aceeai informaie referitoare la subiectul testat n cazul n care acesta este supus unei noi aciuni de testare folosind acelai test; b) Validitatea se refer la capacitatea testului de a msura ntotdeauna ceea ce i-a propus s msoare. Acum s explicm puin. n cazul fidelitii, dac un subiect a obinut, de exemplu, ntr-o zi, n urma aplicrii unui test de inteligen, un Q.I. = 100 i, dup cteva zile, n urma reaplicrii aceluiai test, ar obine un Q.I. = 70 ar nsemna c, n primul moment el ar fi diagnosticat ca fiind normal, n ceea ce privete dezvoltarea psihointelectual, iar n momentul 2, ar fi considerat a avea deficiene mentale. Cine ar grei n acest caz ? Evident c testul folosit, care nu dovedete fidelitate. Realizai ce consecine grave ar avea utilizarea unui asemenea test ? n limba englez se folosete cuvntul reliability pentru a desemna fidelitatea testului, nsemnnd, mai ales, demn de ncredere. Pentru ambele caracteristici psihometrice se poate calcula valoarea unui coeficient, de aceea, putem vorbi despre coeficientul de fidelitate (rtt) i coeficientul de validitate (rxy). n cazul coeficientului de fidelitate, regsim dublat litera t, ceea ce nseamn c este vorba de aplicarea n dou momente a aceluiai test (este vorba de un singur instrument), iar n cazul coeficientului de validitate, avem dou litere, x i y, ceea ce nseamn c sunt folosite dou instrumente de msur. Este vorba despre testul aplicat n momentul 1 i
53
NICOLAE MITROFAN
alt instrument de msurare folosit n momentul 2, care este, de regul, la mai mare distan n timp folosit pentru a msura comportamentul anticipat n baza rezultatelor din momentul 1. Litera r nseamn coeficient de corelaie i, dei el poate fi calculat n mai multe moduri, cea mai utilizat procedur este cea a lui Pearson (Pearson Product-Moment Correlation Coefficient Coeficientul de corelaie moment-produs al lui Pearson). Se folosete urmtoarea formul: xy rxy = ----------------N(SDx) (SDy) n care: x = deviaia unei performane de la medie n proba x y = deviaia peformanei (corespunztoare lui x) de la medie n proba y Revenind la conceptul de fidelitate, trebuie s menionm faptul c el a cunoscut diverse accepiuni de-a lungul timpului. Astfel, ca s exemplificm, n Standardele APA din anii 1954 i 1966, fidelitatea nsemna consistena sau stabilitatea (Fidelitatea se refer la precizia consistena i stabilitatea msurrii realizate de test). n 1974, fidelitatea era definit ca fiind gradul n care rezultatele testrii pot fi atribuite surselor sistematice de varian. n Standardele de dup 1985, apare o nou schimbare n definirea fidelitii, aceasta aprnd ca fiind gradul n care scorurile testului sunt consistente sau repetabile, adic gradul n care ele sunt afectate de erorile de msur. Aadar, aa dup cum precizeaz i prof. H. Pitariu, termenii de consisten i stabilitate continu s fie utilizai, dar nu n sensul de consisten intern i stabilitate temporar a unui anumit comportament, ci, mai degrab, ca reproductibilitate a rezultatelor cercetrii tiinifice. Conceptul de fidelitate este utilizat pentru a acoperi mai multe aspecte ale consistenei scorului (Anastasi, A., 1996). n primul rnd, fidelitatea indic msura n care diferenele dintre subiecii testai, evideniate prin intermediul scorurilor obinute, se datoreaz diferenelor reale (adevrate) privind nsuirea psihic msurat i msura n care ele sunt atribuibile erorilor ansei. S explicm puin mai mult. n urma aplicrii testului, se obine un anumit scor, numit scor brut (raw score), care poate fi exprimat cifric. De exemplu, la un test de inteligen se obine scorul 120. n mod ideal, el ar trebui s reflecte exact realitatea, ns niciodatr nu se ntmpl aa, deoarece, pe parcursul activitii de testare pot interveni diveri factori care scap de sub controlul celui ce aplic testul. De aceea, niciodat scorul brut nu coincide cu scorul real al subiectului. Nu putem vorbi de utilizarea ecuaiei X = SR, X nsemnnd scorul brut iar SR, scorul real. n realitate ntlnim situaia evideniat de urmtoarea ecuaie: X = SR + E n care E = eroare Plecnd de la aceast ecuaie, putem spune: cu ct eroarea este mai mic, cu att este de ateptat mai mult ca scorul real s se apropie de scorul brut. Ce concluzie putem trage de aici ? Trebuie luate toate msurile posibile pentru ca eroarea s fie ct mai mic. Orice condiie, orice factor care este irelevant pentru scopul urmrit de un anumit test constituie o surs pentru variana erorii. Astfel, cnd examinatorii ncearc s menin uniforme condiiile testrii (respectnd ntocmai prevederile din cadrul manualului i controlnd
54
NICOLAE MITROFAN
factorii ambianei n care se face testarea), ei reduc variana erorii, ceea ce nseamn c fac mult mai sigure scorurile obinute. Apare, ns, o ntrebare: are examinatorul posibilitatea s controleze toi factorii care pot interveni n timpul aciunii de testare, cptnd statutul de factor irelevant? Rspunsul nu poate fi dect pozitiv, n practic existnd cel puin dou situaii: a) cnd controlul asupra factorilor irelevani tinde ctre maximum, ceea ce nseamn c scorul real se apropie pn la identitate de scorul brut; b) cnd controlul asupra factorilor irelevani tinde ctre minimum, ceea ce nseamn c scorul real se ndeprteaz foarte mult de scorul brut, eroarea n acest caz crescnd foarte mult. Dar care sunt aceti factori irelevani care pot s intervin n aciunea de testare ? Unii autori au ncercat s-i inventarieze. Astfel, de exemplu, fcnd o sintez a diferitelor lucrri de specialitate, H. Pitariu ne ofer urmtorul tablou al surselor posibile de variabilitate care pot afecta scorurile unui test. I. Particulariti durabile i generale ale persoanei (cu influen asupra rezolvrii mai multor teste: A. Nivelul unor deprinderi care pot influena modul de a opera cu o serie de teste (de exemplu, un rezolvitor de cuvinte ncruciate va fi avantajat n rezolvarea unor teste). B. Deprinderile i tehnicile generale solicitate n testare (de exemplu, test de excepie pentru profesioniti sau test pentru necunoscui). C. Abilitatea general de a nelege instruciunile de lucru cu testele (de exemplu, persoanele cu deficiene intelectuale vor nelege mai greu instruciunile de operare cu testul, la fel cele neobinuite cu examinri prin teste). II. Particulariti durabile dar specifice ale persoanei (cu influen numai asupra unui test anume): A. Specifice fa de testul luat ca ntreg 1. Nivelul individual de dezvoltare a abilitii msurate de acest test i care nu influeneaz rezolvarea altor teste (de exemplu, o persoan dominant va obine scoruri mari la scala de Dominan din cadrul testului CPI, dar nu i la scala de Responsabilitate. 2. Cunotine i deprinderi specifice formei particulare a testului. De exemplu, un programator va fi mai performant pe un test care solicit rezolvarea de scheme logice lacunare; sau, un ceasornicar va avea rezultate mai bune la un test de dexteritate digital care solicit operarea cu obiecte mici); 3. Pattern-uri de rspuns stabile (de exemplu, la un test cu rspunsuri Adevrat/Fals, tendina de a alege opiunea Adevrat n toate situaiile de indecizie). B. Specifice anumitor itemi ai testului: 1. ansa unei persoane n a cunoate rspunsul la un anumit fapt particular cerut de un item (de exemplu, la un test de cunotine tehnice, un item poate solicita o informaie pe care o cunosc doar subiecii care au citit o anumit lucrare). 2. Tipuri de itemi cu care diferii subieci sunt familiarizai inegal (de exemplu, existena unor itemi cu rspuns la alegere i poate ncurca pe cei nefamiliarizai cu stilul respectiv de lucru. III. Particulariti temporare, dar generale ale persoanei (este vorba de existena unor factori incidentali care pot afecta performanele n momentul n care este administrat testul n cauz: a) sntatea; b) oboseala; c) motivaia; d) tensiunea emoional; e) nivelul prea
55
NICOLAE MITROFAN
elevat al testului; f) nelegerea mecanismelor testrii n cauz; g) condiiile de administrare a testului, ca iluminat, cldur, umiditate, ventilaie etc. IV. Particulariti temporare i specifice ale persoanei (cu influen numai asupra acestui test): A. Specifice fa de testul luat ca ntreg: 1. nelegerea sarcinii specifice cerute de testul n cauz (de exemplu, la un test administrat de calculator, un subiect care nu a reinut modul de utilizare a tastaturii pentru formularea rspunsului poate obine un scor care nu l caracterizeaz). 2. Mici trucuri sau tehnici neortodoxe de rezolvare a testului (de exemplu, la un test de cunotine alctuit din itemi cu rspunsuri la alegere, care nu penalizeaz rspunsurile greite, marcarea tuturor rspunsurilor propuse la fiecare ntrebare conduce la obinerea unui scor nalt). 3. Nivelul de antrenare n rezolvarea unor sarcini specifice cerute de testul n cauz (intervine mai ales n operarea cu teste psihomotoare; de exemplu, la un test de vitez de reacie, administrat pe calculator, o persoan familiarizat cu tastatura calculatorului respective este avantajat). 4.Setul sau dispoziia momentan pentru rezolvarea testului (de exemplu, o persoan foarte ocupat n ziua testrii poate s i se par prea lung testul CPI, rspunznd, n consecin, la ntmplare). B. Specifice fa de unii itemi ai testului: 1. Fluctuaii i ideosincrazii ale memoriei umane (de exemplu, la un test de cunotine de geografie, unui elev cruia nu-i place s opereze cu numere, nu-i va aminti nlimile unor muni). 2. Fluctuaii neprevzute ale ateniei sau percepiei, suprapuse peste nivelul general de performan caracteristic unei persoane (de exemplu, la un test administrat de calculator, subiectul poate, din neatenie, s apese pe o tast greit i s nu observe acest lucru). V. Factori sistematici sau de noroc care afecteaz administrarea testului sau evaluarea performanelor la test: A. Condiiile de testare: utilizarea unui interval de timp fixat pentru testare, prezena unor factori de distragere a ateniei, claritatea instruciei etc. B. Efectul interaciunii personalitii, sexului sau rasei examinatorului cu persoana examinat, aceasta stimulnd sau inhibnd performana. C. Inconsecvena sau prtinirea n evaluarea performanelor VI. Variaii neexplicate A. Norocul n gsirea rspunsului corect, cnd subiectul l ghicete. B. Distragerea momentan a ateniei Teme de reflecie/autoevaluare: 1.Ce este fidelitatea i ce este validitatea unui test ? 2. Ce nseamn variana erorii i cui se datoreaz ea ? 1. 3. Alte caracteristici psihometrice ale testelor Aa dup cum am menionat deja, n literatura anglo-saxon singurele caracteristici psihometrice menionate sunt fidelitatea i validitatea. Unii autori, inclusiv autori romni (de exemplu, U. Schiopu, 1974) vorbesc i de o alt caracteristic psihometric, respectiv, fineea discriminativ. Aceasta s-ar referi, pe de o parte, la capacitatea testului de a
56
NICOLAE MITROFAN
scoate n eviden diferenele interindividuale i, pe de alt parte, la capacitatea testului de a msura exclusiv nsuirea psihic pentru care a fost construit. Ali autori vorbesc de existena unui numr mare de asemenea caracteristici psihometrice. De exemplu, E. Claparde ne ofer o adevrat list care cuprinde (desigur, el s-a referit, mai ales, la calitile ideale pentru unele teste de aptitudini): 1. s fie interesante; 2. s fie obiective n aplicaie; 3. s aib un instructaj clar; 4. s manifeste obiectivitate n apreciere (notare); 5. s exclud hazardul; 6. s fie gradabile; 7. s fie etalonate; 8. s prezinte o bun dispersie; 9. s fie univoce (adic s msoare un singur aspect odat); 10. s fie reprezentative; 11. s fie inedite; 12. s nu fac apel la cunotine colare; 13. s fie constante; 14. s se aplice la toate vrstele; 15. s permit s se alctuiasc forme echivalente; 16. s nu cear pe ct posibil aparatur; 17. s nu msoare dect o singur variabil (cantitate, rapiditate sau calitate). Tem de reflecie/ autoevaluare: Citii cu atenie cele 17 caliti ale testelor i stabilii dac pot fi asimilate la cele dou caracteristici psihometrice, respectiv, fidelitatea i validitatea.
1. Ce sunt caracteristicile psihometrice ale testelor ? 2. Ce obligaii au constructorii de teste n raport cu ele ? 3. Ce este fidelitatea testului ? 4. Ce este validitatea testului ? 5. Care sunt elementele de asemnare i de deosebire dintre fidelitate i validitate ? 6. Ce este scorul brut i ce este scorul real al subiectului ? 7. Ce este variana erorii n msurare? 8. Ce pericole prezint variana erorii ? 9. Ce trebuie fcut pentru reducerea varianei erorii ? 10. Enumerai ct mai muli factori irelevani ce pot interveni n aciunea de testare. 11. Ce trebuie fcut pentru ca s reducem ct mai mult din aciunea acestor factori irelevani ? 12. Ce putem spune despre controlul pe care trebuie s-l asigure cel ce aplic testul asupra factorilor irelevani ? BIBLIOGRAFIE MINIMAL ALBU, MONICA, PITARIU, HORIA (1993), Proiectarea testelor de cunotine i examenul asistat de calculator. Cluj-Napoca: Casa crii de tiin. ANASTASI, ANNE (1996), Psychological Testing (7th edition). New-York: Mcmillan. CLINCIU, ION, AUREL (2005), Psihodiagnostic. Braov: Editura Universitii Transilvania. STAN, AUREL (2002), Testul psihologic. Evoluie, construcie, aplicaie. Iai: Polirom. HORGHIDAN, VALENTINA (1998), Metode de psihodiagnostic. Bucureti: Editura didactic i pedagogic.
57
NICOLAE MITROFAN
Unitatea de nvare 2 Fidelitatea testului Cuprins: 2.1. Proceduri de calculare a fidelitii testelor 2.2. Eroarea standard a msurrii :
Obiective: La sfritul acestei uniti de nvare, studenii vor fi capabili s: cunoasc tipurile de fidelitate cunoasc procedurile de calcul a fidelitii interpreteze exact ce nseamn eroarea standard a msurrii dea exemple din practic
2.1. Proceduri de calculare a fidelitii testelor Mai nti, s le enumerm: a) fidelitatea test-retest; b) fidelitatea form alternant; c) fidelitatea half-split; d) fidelitatea Kuder-Richardson; e) fidelitatea coeficient alpha; f) fidelitatea privind personalitatea examinatorului. Dar de ce sunt aa de multe ? n primul rand, din cauz c, aa cum am vzut la clasificarea testelor, acestea sunt foarte diferite (de exemplu, un test de inteligen difer total de un chestionar de personalitate sau de un test proiectiv). Desigur, nu este exclus situaia n care pot fi utilizate mai multe proceduri pentru acelai test i atunci se pune problema calculrii fidelitii totale. a) fidelitatea test-retest. Din punct de vedere strict tehnic, aceast modalitate presupune aplicarea unui test, n momentul t1, pe un grup de subieci i apoi, reaplicarea lui, pe acelai grup de subieci, n momentul t2. n continuare se calculeaz valoarea lui rtt, adic a coeficientului de fidelitate, care arat la ce nivel coreleaz cele dou serii de rezultate. Distana dintre cele dou momente poate fi mai mic, de ordinul zilelor sau sptmnilor, sau poate fi mai mare, de ordinul lunilor sau chiar anilor. n urma multor ani de cercetri s-a constatat c intervalele de timp mai scurte asigur o valoare mai mare a fidelitii, n timp ce intervalele mari nu mai asigur aproape niciun fel de coresponden ntre cele dou serii de rezultate. Oricum, aplicarea testului n cele dou momente nseamn i aplicarea lui n condiii oarecum diferite. Pot interveni anumii factori irelevani (v mai amintii de ei, desigur !!) care scap de sub controlul experimentatorului, fcnd s creasc valoarea erorii n msurare. Aceti factori pot ine de ambiana n care se face msurarea (pot exista diferene de temperatur, surse de distragere a ateniei, diferene privind spaiul etc.) sau de persoana subiecilor (oboseal, experiene
58
NICOLAE MITROFAN
personale diferite, stri de dispoziie diferite etc). Deci, variana erorii corespunde fluctuaiilor ntmpltoare ale performanei de la o testare la alta. Cnd intervalul de timp este scurt sau foarte scurt (de ordinul zilelor, de exemplu) se poate ntmpla ca subiecii s fie puternic influenai de ceea ce nseamn recunoaterea principiului de construcie a testului. S lum, mai nti, cteva cazuri simple, pentru a nelege mai bine: Exemplul 1. Itemul testului apare n forma urmtoare: A R P duc un L D ? Sarcina subiectului este de a spune ce liter trebuie pus n locul semnului de ntrebare. Voi ce prere avei ? Exemplul 2. Itemul testului apare n forma urmtoare: COCOLO BALAMA VIINE PEPENE mas cobai praline oaie
Sarcina subiectului este de a stabili cu care dintre cuvintele scrise cu litere mici se asociaz cuvintele scrise cu litere mari. Exemplul 3. Itemul testului apare n forma urmtoare: LONDRA este oraul n care se gssesc 6 teatre, 4 stadioane i 24 de cinematografe MOSCOVA este oraul n care se gsesc 3 stadioane, 21 de cinematografe i 7 teatre PARIS, capitala Franei, este oraul n care se gsesc 25 de cinematografe, 5 teatre i 5 stadioane Sarcina subiectului: cte teatre are oraul ROMA ? Vom comenta acest ultim exemplu, lsndu-v bucuria de a descoperi singuri care este rspunsul la primele dou cazuri. Principiul de construcie al itemului const n asocierea dintre numrul de litere ce-l regsim n denumirea oraului i numrul de teatre. LONDRA are 6 teatre, pentru c are ase litere, MOSCOVA are 7 teatre, pentru c are 7 litere i Paris are 5 teatre, pentru c are 5 litere. Deci, ROMA are 4 teatre, deoarece are 4 litere. Celelalte elemente din structura itemului (numrul de stadioane i de cinematografe) sunt introduce pentru a face sarcina puin mai dificil pentru subiect. Acum ne dm seama ct de mult ar fi ajutat subiectul, cunoscnd principiul de construcie al testului, dac el ar trebui s fie reexaminat cu acelai instrument la un interval de timp scurt.
59
NICOLAE MITROFAN
Pe de alt parte, n cazul n care intervalul de timp este foarte mare, este greu de ignorat impactul pe care l are asupra subiectului experiena lui personal (noi achiziii n plan informaional-cognitiv, n plan comportamental etc.). n practica psihodiagnostic s-au conturat deja un fel de reguli sau recomandri i anume: - n general, pentru orice tip de persoan intervalul dintre cele dou momente de testare (test-retest) nu trebuie s depeasc, dect foarte rar, 6 luni; - pentru copiii mici i foarte mici, datorit schimbrilor accentuate ca urmare a dezvoltrii progresive, intervalul dintre cele dou momente ale testrii poate i trebuie s fie mai scurt dect n cazul adulilor. Dei aceast procedur de calculare a fidelitii este foarte mult folosit, exist, totui, recomandarea ca s se apeleze la ea, mai ales n cazul testelor care nu pot fi afectate de repetiie. n asemenea categorie ar intra unele teste de discriminare senzorial i unele teste psihomotorii (Anastasi, A., 1996). b) fidelitatea form alternant. n mod practic se procedeaz n felul urmtor: se aplic pe un grup de subieci un test i, apoi, dup un anumit interval de timp, care poate fi mai scurt sau mai lung, se aplic, pe acelai grup, un alt test dar care este obligatoriu echivalent cu primul. n final, se calculeaz valoarea coeficientului de fidelitate, respectiv, rtt. n cazul n care forma alternant a testului se aplic imediat dup ce s-a aplicat prima variant a lui, vorbim de fidelitate form alternant imediat iar, n cazul n care intervalul de timp este mai mare, vorbim de fidelitate form alternant ntrziat. n primul caz, sursa varianei erorii o constituie eantionarea coninutului i, n al doilea caz, sursa varianei erorii o constituie eantionarea coninutului dar i eantionarea timpului. n cadrul manualului testului trebuie s fie incluse, n mod obligatoriu, informaii privind lungimea intervalului de timp dintre cele dou momente de administrare i, n cazul n care acest interval este mai mare, informaii privind tipurile de experiene cu care s-au confruntat subiecii. Dar cea mai important problem pe care o ridic folosirea acestei proceduri se refer la modul n care se asigur ca cele dou variante ale testului s fie identice, deci se pune problema asemnrilor i deosebirilor. n practic este destul de dificil de realizat acest lucru, dar nu este imposibil, dovad c exist asemenea cazuri. Principala deosebire const n faptul c ele nu seamn atunci cnd sunt puse n faa subiecilor. Sunt alte figuri, alte exerciii, alte ntrebri etc. Asemnrile ns sunt mai multe i ele se refer la: obiectivul urmrit n aciunea de msurare este acelai; - privitor la coninut, exist un numr egal de itemi; - acelai tip de instructaj, acelai format al testului; - egalitate n ceea ce privete nivelul de dificultate al itemilor c) fidelitatea half-split, sau fidelitatea bazat pe divizarea testului n dou jumti. Din punct de vedere tehnic, testul este mprit n dou, cele dou jumti devenind un fel de teste independente, se aplic pe un grup de subieci i apoi se calculeaz valoarea coeficientului de fidelitate (rtt). Dar cum realizm cele dou jumti? Vom oferi dou modaliti: 1) mprirea pur i simplu a testului n dou pri, fiecare coninnd un numr egal de itemi. De exemplu, dac testul ntreg are 100 de itemi, cele dou jumti vor avea cte 50 de itemi. Se aplic testul pe grupul de subieci i, apoi, se calcueaz coeficientul de corelaie (respectiv, coeficientul de fidelitate) dintre cele dou serii de rezultate. Sunt ns unele teste pentru care aceast modalitate nu poate fi aplicat. Astfel, dac testul este construit pe principiul introducerii itemilor de la uor la greu, atunci prima jumtate va fi foarte uoar i cealalt jumtate va fi foarte grea. Sau, dac testul este foarte lung, are un
60
NICOLAE MITROFAN
numr mare de itemi, la aplicarea celei de-a doua jumti va interveni n mod sigur oboseala; 2) o procedur mai adecvat presupune mprirea testului n dou jumti, plecnd de la numrul de ordine al itemilor. n prima jumtate sunt reinui itemii cu so (2,4,6,8 .a.m.d.) i n a doua jumtate, itemii cu so (1,3,5,7 .a.m.d.). Astfel, sunt mai multe anse ca cele dou jumti s fie echivalente. Desigur, o semenea procedur nu se poate aplica n cazul n care mai muli itemi se refer la o aceeai problem, cum ar fi cazul unei situaii problematice. Dar indiferent de ce procedur folosim, valoarea coeficientului de corelaie vizeaz fidelitatea doar a unei jumti de test, or, pe noi ne intereseaz fidelitatea pentru ntregul test. O prim tentaie ar fi aceea de a dubla, pur i simplu, valoarea coeficientului de fidelitate. Dac am proceda aa, am ajunge la rezultate stranii. Gndii-v, de exemplu, dac valoarea lui rtt pentru jumtate de test ar fi 0,65, dublnd am ajunge la o valoare egal cu 1,30. Poate avea coeficientul de corelaie o asemenea valoare ? V-am rugat s v ntoarcei la ce ai studiat la Statistic. n realitate se aplic formula lui Spearman-Brown (Anastasi, A., 1988, 1996): 2rhh rtt = ------------n care: rtt = coeficientul de fidelitate 1 + rhh rhh = corelaia privind jumtatea de test S lum un exemplu: dac rhh = 0,50, aplicm formula i vom vedea care este valoarea coeficientului de fidelitate pentru ntregul test: 2 x (0,50) 1 rtt = ------------- = ------ = 0,66 1 + (0,50) 1,5 Acum voi trebuie s facei cteva exerciii i s vedei ce se ntmpl cu valoarea coeficientului de fidelitate, cnd crete sau scade valoarea coeficientului de fidelitate pentru jumtate de test: 1. rhh = 0,30; rhh = 0,80; rhh = 0,99. Efectul pe care creterea sau scderea numrului de itemi ai testului l are asupra valorii coeficientului de fidelitate poate fi calculat cu ajutorul altei formule Spearman-Brown: nrtt rnn = -------------n care: rnn = coeficientul estimat rtt = coeficientul de corelaie obinut 1 + (n-1) rtt n = numrul ce exprim de cte ori crete sau descrete dimensiunea testului S lum un exemplu: dac dorim ca numrul itemilor unui test, al crui coeficient de fidelitate are valoarea 0,50, s creasc de la 25 la 100, deci s creasc de 4 ori, aplicm formula: rnn 4 x (0,50) = --------------------- = 1 + (3 x 0,50) 2 --- = 0,80 2,5
61
NICOLAE MITROFAN
Deci, putem uor constata c, n cazul n care mrim dimensiunile unui test, valoarea coeficientului de fidelitate crete. i, de aici, o concluzie foarte important pentru practic: cu ct numrul itemilor unui test este mai mare, cu att nivelul de credibilitate acordat informaiilor obinute cu ajutorul lui va crete. Am putea folosi o comparaie: dac am asemna itemii cu ochii, cu ct sunt mai muli ochi cu att va fi vzut mai bine o anumit realitate. Pentru a vedea dac se confirm ceea ce spunem, ncercai s facei i voi unele exerciii i anume: care este valoarea lui rnn dac: 1. dorim s micorm dimensiunile unui test (rtt = 0,50) de 2 ori; 2. dorim s micorm dimensiunile unui test (rtt = 0,50) de 5 ori i de 10 ori. Se poate pune problema i aa: cunoatem valoarea actual a coeficientului de fidelitate a unui test (care, normal, are un numr determinat de itemi) i dorim ca aceast valoare s fie mbuntit, adic s ating o anumit valoare; avem nevoie s tim care va trebui s fie numrul itemilor pentru testul modificat. n acest caz, aplicm formula profeiei Spearman-Brown: rttd (1 rtto) N = -------------------- n care: rtto = coef. de fidelitate observat rtto (1 rttd) rttd = coef. de fidelitate dorit N = de cte ori va crete numrul itemilor S lum un exemplu: un test are 20 de itemi i rtto = 0,87; dac dorim ca rttd s aib valoarea 0,95, pn la ce nivel trebuie s creasc numrul itemilor ? Aplicm formula: 0,95 (1 0,87) N = ------------------- = 2,82 Apoi, 20 x 2,82 = 56,4, rotunjit, 56 0,87 (1 0,95) Deci, pentru ca valoarea coeficientului de fidelitate s ating nivelul de 0,95, numrul itemilor testului trebuie s ating nivelul de 56. Dar de ce este important ca valoarea fidelitii testului s fie ct mai mare ? Desigur, cazul ideal este ca valoarea lui rtt s fie egal cu +1,00. n realitate nu gsim asemenea cazuri, valoarea lui rtt fiind mai aproape sau mai departe de aceast valoare ideal. Testele existente n practic au valori diferite ale fidelitii, ridicndu-se problema seleciei lor n funcie de ce obiective urmrim s atingem folosind rezultatele obinute. n acest sens, unii autori fac urmtoarele recomandri (Kaplan, R., Saccuzzo, D., 1993): a) pentru cele mai multe din scopurile de cercetare, valoarea acceptat a fidelitii testelor folosite este de minimum 0,70; b) cnd testul este folosit pentru a lua o decizie important n legtur cu o persoan, rtt trebuie s aib o valoare mai mare de 0,95; c) n alte scopuri de testare, valoarea acceptat a fidelitii este de minimum 0,90. d) fidelitatea Kuder-Richardson. Aceast procedur este aplicabil mai ales pentru testele ale cror itemi sunt prevzui cu un sistem de rspuns de tip tot sau nimic. Este vorba de variantele disjunctive, de genul: Da Nu, Adevrat-Fals etc. Ceea ce este specific pentru aceast procedur este faptul c ea este bazat pe performana la fiecare item. Formula care se aplic este urmtoarea: n SDt2 - pq rtt = -------- x ------------------ , n care.
62
NICOLAE MITROFAN
(n 1)
SDt2
rtt = coeficientul de fidelitate al ntregului test n = numrul de itemi ai testului SDt = deviaia standard a scorurilor totale ale testului pq = suma produselor persoanelor care reuesc i a celor care nu reuesc la fiecare item Din punct de vedere practic, se aplic un test pe un grup de subieci, apoi produsul pq se calculeaz pentru fiecare item i apoi toate produsele sunt adunate, rezultnd pq. Se calculeaz SDt, se ridic la ptrat i se completeaz datele cerute de formul. S lum i noi un exemplu practic (Friedenberg, L., 1995): unui grup de studeni i s-a aplicat un test ce cuprinde 6 ntrebri. Rspunsul corect a fost marcat cu litera D iar rspunsul incorect, cu litera N. n rubrica scor total regsim numai numrul rspunsurilor corecte. ntrebare A B C D E p= q = pq = 1 D D D N N 0,6 0,4 0,24 2 D N N D D 0,6 0,4 0,24 3 D N N N N 0,2 0,8 0,16 4 D D D N N 0,6 0,4 0,24 5 N N N N D 0,2 0,8 0,16 6 D D N N D 0,6 0,4 0,24 Scor total 5 3 2 1 3
(p)(q) = 1,28
( X = 2,8; SD2 = 1,76; SD = 1,3266; n = 6; n = 5) Aplicnd formula: 6 (1,76) 1,28 0,48 KR-20 = -- (----------------) = (1,2) ------ = (1,2)(0,2727) = 0,33 5 (1,76) 1,76 e) coeficientul alpha. n cazul altor teste, cum ar fi testele de personalitate, rspunsul nu mai poate fi disjunctiv, de tipul Da Nu, ci subiectul trebuie s aleag dintre mai multe rspunsuri. De exemplu, la un item de genul Obinuii s consumai buturi alcoolice ?, subiectul trebuie s aleag din mai multe rspunsuri la alegere care sunt prezentate pe o scal cu 3 trepte, cu 5 trepte. Astfel, la ntrebarea de mai sus, scala cu 3 trepte ar fi aa : niciodat uneori mereu, iar scala cu 5 trepte ar arta aa: niciodat - foarte rar - uneori - foarte des - ntotdeauna Fiecare variant primete un anumit punctaj; legat de exemplul de mai sus, dac urmrim s vedem n ce msur subiectul este dependent de alcool, varianta de rspuns ntotdeauna va primi punctaj maxim, respectiv, 5 puncte i, apoi, n ordine descresctoare: foarte des 4 puncte; uneori 3 puncte; foarte rar 2 puncte; niciodat 1 punct.
63
NICOLAE MITROFAN
Pentru aceast categorie de instrumente psihodiagnostice formula generalizat i propus de Cronbach (1951), Kaiser i Michael (1975), Novik i Lewis (1967) ajut la calcularea coeficientului alpha, care este, dup cum am mai spus, coeficient de fidelitate. Formula care se poate folosi este urmtoarea: n (SDi)2 rxx (sau ) = ------- ( 1 - -------- ) n care: n1 SDx2 SDx2 = suma varianelor la scorurile ntregului test (SDi)2 = suma varianelor la scorurile fiecrui item al testului n = numrul de itemi ai testului Item Sub. 1 Sub. 2 Sub. 3 Sub. 4 Sub. 5 Sub. 6 1 3 4 2 4 3 3 2 4 3 3 4 2 2 3 4 4 3 5 4 3 4 3 3 2 3 3 2 5 5 3 3 4 3 3 Scor total 19 17 13 20 15 13
Deci, din punct de vedere practic, aceast procedur presupune gsirea varianei la scorurile subiecilor pentru fiecare item, apoi se face suma, ajungndu-se la (SDi)2. S lum i noi un exemplu practic (Friedenberg, L., 1995): unui grup de 6 elevi i s-a aplicat un test, tip eseu, alctuit din 5 ntrebri. La fiecare dintre ntrebri scorul maxim era de 5 puncte. SDi2 = .4722 .6667 .4722 .2222 .5833 ( X = 16.1667; SD2 = 7.4722; SD = 2.7335; n = 5; N = 6) Aplicm formula de mai sus: 5 .4722 + .6667 + 4722 + .2222 + .5833 = -- ( 1 - ----------------------------------------------) = 4 7.4722 2.4166 = (1.25) ( 1 - --------- ) = 1.25) (1 - .3234) = .84575 = .85 7.4722 f) fidelitatea legat de persoana celui care aplic testul. Din punct de vedere practic, dup ce se aplic un test, mai muli examinatori sunt pui s coteze rezultatele. Apoi se aplic procedurile uzuale de calculare a coeficientului de corelaie i ceea ce rezult este 64
NICOLAE MITROFAN
valoarea fidelitii examinatorului. Desigur, este vorba, mai ales, de acele teste care intr n categoria testelor subiective (v mai amintii de clasificarea testelor n teste obiective i teste subiective ?) i, mai exact este vorba de testele proiective, la care diferenele dintre modul de cotare a acelorai rezultate de ctre mai muli examinatori pot fi destul de mari. Iar dac, pentru un anumit test, se calculeaz valoarea acestui tip de coeficient de fidelitate, acest gen de informaie trebuie s fie inclus n cadrul manualului testului. Dup ce am trecut n revist mai multe forme ale fidelitii, s vedem, sintetic, care sunt sursele specifice ale varianei erorii pentru ele (Anastasi, A.,1988, 1996). Nr. crt. 1 2 3 4 5 6 Tipul de coefficient de fidelitate Fidelitate test-retest Fidelitate form alternant (imediat) Fidelitate form alternant (la un interval de timp Fidelitate half-split Kuder-Richardson i Coeficientul Alpha Fidelitate legat de examinatori Surse pentru variana erorii - eantionarea timpului - eantionarea coninutului - eantionarea timpului i coninutului - eantionarea coninutului eantionarea coninutului eterogenitatea coninutului - diferenele dintre examinatori
a i
Aa dup cum am mai precizat, valoarea coeficientului de fidelitate arat care este procentul din variana scorurilor la test ce depinde de variana real legat de trstura supus msurrii. De exemplu, dac rtt are valoarea 0,75, asta nseamn c 75% reprezint variana real i 25%, variana erorii. Tema de reflecie/autoevaluare Vi s-au recomandat s facei cteva exerciii. Ce ai putut constata n urma efecturii lor ? 2.2. Eroarea standard a msurrii. Este o alt form de msurare a fidelitii, dar care este folosit pentru a interpreta scorurile individuale. De aceea, mai este denumit i eroarea standard a scorului. Ca formul de calcul este folosit urmtoarea: n care: SDt = deviaia standard a scorurilor SEM = SDt 1 rtt testului rtt = coeficientul de fidelitate De exemplu, dac vom cunoate valoarea deviaiei standard, precum i a coeficientului de fidelitate, putem calcula uor valoarea lui SEM. Astfel, dac SDt = 10 i rtt = 0,80, valoarea lui SEM va fi 5. De regul, constructorul de test se ocup i de aceast problem iar valoarea obinut a lui SEM este inclus n cadrul manualului. Pe noi ne intereseaz mai mult s vedem ce reprezint aceast valoare i la ce ne folosete. Dup cum am mai afirmat, scorul obinut de un subiect la un test (scor observat), cuprinde scorul real (raw score) i eroarea. Un test este cu att mai valoros cu ct eroarea este mai mic. Datorit erorii, n cazul n care reaplicm testul pe un subiect, scorul va varia, va fi mai mare sau mai mic i ct de mult poate varia ne spune valoarea lui SEM.
65
NICOLAE MITROFAN
S lum un exemplu i mai concret din literatura de specialitate (Friedenberg, L., 1995), cu ajutorul cruia s ilustrm i mai bine conceptual de SEM. Un subiect este testat cu un test de inteligen de un numr mare de ori, prima dat el obinnd un QI = 120. Testarea se va realiza, desigur, la anumite intervale de timp, ceea ce nseamn c vor interveni, n mod sigur, o serie de factori irelevani (v mai amintii de ei ?), cum ar fi: condiii de testare diferite, starea subiectului diferit, poate fi mai oboist, poate fi mai necjit, fluctuaii ale capacitii de concentrare a ateniei etc. Deci, scorul poate fi mai mare sau mai mic i, n consecin, dac am avea 100 de testri, ne vom atepta ca jumtate dintre scoruri s fie mai mari i jumtate s fie mai mici. Apelnd la curba lui Gauss (dac nu tii despre ce este vorba, revedei de urgen ce ai nvat la statsitic !!!), vom fi pui n faa unei distribuii normale, avnd media = 120. SEM va reprezenta deviaia standard a acestei distribuii ateptate. n consecin: 34% din scorurile subiectului vor cdea ntre 120 i + 1 SEM (nsemnnd media i o deviaie standard) i alte 34% din scoruri vor cdea ntre 120 i - 1 SEM (nsemnnd media i - o deviaie standard). Luate mpreun, 68% din scorurile subiectului vor cdea n intervalul definit de 120 1 SEM. Deci, noi putem fi siguri c, n caz de reaplicare a testului, 68% din scorurile subiectului vor cdea n acest interval, numit interval de ncredere de 68% Pentru a obine un interval de ncredere de 95%, trebuie s determinm numrul de deviaii standard ce cuprind 95% din scorurile subiectului. Deci acest interval s-ar ntinde ntre 120 i 2 SEM. Deci, revenind la exemplul de mai sus, intervalul va fi ntre 120 + 10 i 120 10, respectiv, ntre 130 i 110. Mai departe, pentru a obine un interval de ncredere de 99%, trebuie s determinm numrul de deviaii standard ce curpind 99% din scorurile subiectului. i acest interval s-ar ntinde ntre 120 i 3 SEM, respectiv, n cazul concret, ntre 105 i 135. Deci formula pentru construirea intervalului de confiden este urmtoarea: X (scorul z) (SEM), n care: X + (scorul z) (SEM) = limita superioar a intervalului X - (scorul z) SEM = limita inferioar a intervalului Teme de reflecie/autoevaluare: 1. Care este utilitatea practic a cunoaterii valorii fidelitii i valorii erorii standard a msurrii (SEM) ? 2. Dai 3 exemple concrete de utilizare a erorii standard a msurrii.
1. 2. 3. 4. 5. 6. Care sunt procedurile de calculare a fidelitii testelor ? Care este specificul fidelitii test-retest ? Ce se ntmpl cnd intervalul dintre cele dou testri este prea mic sau este prea mare ? Care este specificul fidelitii form alternant ? Ce reguli trebuie respectate pentru a realiza teste echivalente ? Care este specificul fidelitii half-split ? Cum se procedeaz pentru a afla valoarea fidelitii pentru ntregul test ? 7. Care este specificul fidelitii Kuder-Richardosn i Coeficientul Alpha ? Care este deosebirea dintre ele ? 8. Care este specificul fidelitii legate de persoana examinatorului ? 9. Care sunt valorile fidelitii recomandate pentru anumite scopuri ale testrii ?
66
NICOLAE MITROFAN
10. Care sunt sursele varianei erorii pentru dintre procedurile de calcul a fidelitii ? 11. Ce reprezint eroarea standard a msurrii (SEM) ? 12. La ce ne ajut cunoaterea valorii lui SEM ? 13. Dai exemple privind utilizarea valorii lui SEM BIBLIOGRAFIE MINIMAL 1. MINULESCU, M. (2003), Teorie i practic n psihodiagnoz. Bucureti: Editura Fundaiei Romnia de mine. 2. STAN, A. (2002), Testul psihologic. Evoluie, construcie, aplicaii. Iai: Polirom. 3. CLINCIU, AUREL, ION (2005), Psihodiagnostic. Braov: Editura Universitii Transilvania. 4. KAPLAN, M. ROBERT (2005), Psychological Testing. Principles, Applications, And Issues. Wadsworth: Thompson. 5. FRIEDENBERG, L. (1995), Psychological Testing. Desigh, Analysis, and Use. Allyn & Bacon.
67
NICOLAE MITROFAN
Unitatea de nvare 3 Validitatea testului Cuprins 1. Validitatea de coninut 2. Validitatea de criteriu 3. Validitatea de construct Obiective: La sfritul acestei uniti de nvare, studenii vor fi capabili s: cunoasc noiunea de validitate de coninut; cunoasc noiunea de validitate de criteriu; exemplifice ct mai multe categorii de criterii; cunoasc noiunea de validitate de construct; interpreteze valoarea coeficientului de validitate; cunoasc procedurile de calculare a validitii
1. Validitatea de coninut. Se refer mai ales la categoria testelor de achiziie. Spunem c un test are validitate de coninut, dac el msoar ceea ce i-a propus s msoare i dac elementele sale de coninut (itemii) sunt expresia unui eantion reprezentativ pentru un anumit univers de itemi sau univers de sarcini. S ne explicm mai mult. S ne amintim de zilele cnd aveam de dat tez la o anumit disciplin. Pentru aceasta trebuia s citim (si s retinem !!!) 50 de pagini. Un elev s-a prezentat la tez cunoscnd 45 de pagini iar altul doar 5 pagini, respectiv, cele pe care nu le citise primul. La tez s-au dat subiecte din cele 5 pagini. Primul elev nu a luat not de trecere iar al doilea a luat o not mare. Dac aceast modalitate o asemnm cu un test de cunotine, este clar c el nu are validitate de coninut. Subiectele au fost extrase la ntmplare iar norocul l-a favorizat pe al doilea elev. Nota obinut de cei doi elevi nu reflect nivelul de achiziionare real al celor doi elevi. Dac testul ar fi fost alctuit inndu-se seama i de cerinele validitii de coninut, el ar fi trebuit s cuprind itemi referitor la ntreaga materie iar rspunsul dat de cei doi elevi ar fi reflectat corect nivelul de achiziionare a cunotinelor. Iat, aadar, c este extrem de important ca, atunci cnd construim un test de cunotine, s-i asigurm validitatea de coninut. Aceasta nseamn mai multe aspecte. n primul rnd, cei care fac o evaluare a programului educaional trebuie s fie experi n domeniu. Numai acetia au competena de a analiza i de a evalua elementele de coninut, formulnd un anumit univers de itemi. Acetia vor fi diferii n funcie de gradul de dificultate i, mai ales, n funcie de categoria de care aparin. Unii se pot referi la cunotine factuale, alii se pot referi ca cunoaterea unor principii, alii, la capacitatea de nelegere i de interpretare, alii, la capacitatea de evaluare etc. Deci, mai ntotdeauna se pleac de la obiectivele urmrite de ctre programul educaional. Acestea pot fi de natur informaional (elevul va cunoate, va ti....) i de natur operaional (elevul va avea capacitatea de a face ceva....). n structura testului vom gsi itemi care vor evalua achiziiile realizate pe cele dou direcii.
68
NICOLAE MITROFAN
In concluzie, n baza informaiilor recoltate de ctre experi privitoare la coninutul programelor educaionale (cursuri, manuale, programe etc.) se contureaz specificaiile testului, care trebuie s arate ariile de coninut sau subiectele ce trebuie s fie acoperite, obiectivele instrucionale (educaionale) sau procesele ce urmeaz a fi testate, precum i importana relativ a subiectelor i proceselor individuale. Pe aceast baz se stabilete numrul itemilor pentru fiecare tip de subiect, precum i punctele acordate pentru rspuns corect (Anastasi, A., 1988, 1996). Desigur, cei care construiesc noi teste de achiziie au obligaia de a include, n cadrul manualului testului, informaii privind procedurile utilizate, ariile de coninut, tipurile de achiziii (cunotine, deprinderi, capaciti) acoperite de test, categoriile de itemi i numrul de itemi pentru fiecare. Referitor la testele de achiziie am tot vorbit despre validitatea de coninut. Asta nu nseamn c i alte tipuri de validitate nu pot fi folosite i nu sunt relevante pentru aceste teste. Pe de alt parte, nu trebuie s se neleag faptul c validitatea de coninut este aplicabil numai pentru testele de achiziie. Astfel, n practica psihodiagnostic, acest tip de validitate este folosit n cazul testelor ocupaionale, care, la rndul lor, pot fi utilizate n activitatea de selecie profesional. i ar mai fi o problem legat de validitatea de coninut. n ce msur avem garania c experii (deci mai multe persoane) procedeaz identic n analiza i evaluarea elementelor de coninut ? De aceea, unii autori consider c este necesar s analizm calitatea judecii lor prin raportare la anumite repere (Stan, A., 2002). Sintetic se pot rezuma trei repere: 1. Coerena intern a judecilor stabilete persistena gradului de exigen a judectorului de-a lungul efecturii actului apreciativ. Un judector nu poate emite aprecieri foarte exigente doar pentru o parte din itemi, ci pentru ansamblul sarcinilor din testul supus analizei; 2. Variana judecilor: ntre judecile emise de diferii experi nu trebuie s existe o prea mare diferen; 3. Concordana judecilor: ntre judecile emise de diferii experi nu trebuie s existe o prea mare diferen; 3. Concordana judecilor se realizeaz n cazul n care acestea au tendina de a ordona itemii n aceeai manier, dup gradul lor de congruen cu faetele supuse msurrii. A. Stan menioneaz c mai muli autori au propus diferii indicatori de msurare a validitii de coninut. Astfel, Lawshe a propus urmtoarea formul pentru calcularea unui coeficient de validitate de coninut, CVR (iniialele, n limba englez, de la content validity ratio): N Ne - -2 CVR = ------------formul n care: N -2 Ne = numrul evaluatorilor (experilor) care consider testul, respectiv itemul, ca fiind reprezentativ; N = numrul total de evaluatori (experi) Tem de reflecie/autoevaluare: 1. n ce msur rezultatele (performanele) obinute la un test de cunotine sunt independente de influena variabilelor irelevante ? 2. Putei s explicai de ce validitatea de coninut este nepotrivit pentru testele de personalitate i testele de aptitudini ?
69
NICOLAE MITROFAN
2. Validitatea de criteriu Cnd am discutat despre funciile psihodiagnozei am artat c una dintre cele mai importante este cea prognostic, adic n baza rezultatelor la test putem s facem predicii privind conduita pe care o va adopta subiectul ntr-o activitate sau situaie viitoare. Rezultatele obinute de ctre subiec la test poart numele de predictori iar rezultatele (performanele) obinute n cadrul activitii (situaiei) n raport cu care s-au fcut prediciile poart numele de criteriu. Deci, aici este vorba despre dou mijloace de msurare, respectiv, testul, n baza cruia facem prediciile i criteriul, respectiv, mijlocul de msurare direct i independent a ceea ce a anticipat sau a prognosticat testul. Deci testul poate s anticipe corect conduita subiectului sau, dimpotriv, nu poate face acest lucru. Puterea lui de anticipare sau de predicie depinde de validitatea sa de criteriu, exprimat de coeficientul de validitate (rxy). Cu ct valoarea acestuia este mai mare, cu att devine mai sigur predicia privind comportamentul viitor al subiectului. Desigur, un test poate fi validat printr-un singur criteriu sau prin mai multe criterii. Legat de intervalul de timp dintre cele dou momente de msurare (test i criteriu), acesta poate fi mai mare sau, dimpotriv, mai mic, uneori att de mic nct msurarea criteriului se poate face n acelai timp cu msurarea fcut cu ajutorul testului. n consecin, putem diferenia dou forme de validitate, respectiv, validitate concurent i validitate predictiv. n cazul validitii concurente, dei aplicm un anumit test cu care msurm o anumit capacitate psihic (de exemplu, inteligena), rezultatele la criteriu le avem deja la ndemn, cum este cazul rezultatelor colare. n asemenea situaii validitatea concurent apare ca un substitut al validitii predictive, ea viznd n special statutul existent al subiecilor. Avnd la ndemn informaiile privind rezultatele la test exist pericolul influenrii celor care sunt implicai n evaluarea legat de criteriu. Acest fenomen este cunoscut sub numele de contaminare a criteriului. De exmplu, un cadru didactic, dac ar cunoate rezultatele la teste ar manifesta tendina (este real acest pericol !!!) de a evalua la criteriu (cum este cazul unui test de cunotine) n funcie de aceste rezultate. De aici se desprinde concluzia clar c este bine ca cei ce evalueaz la criteriu s nu aib acest la rezultatele la teste. Printre cele mai cunoscute criterii ce sunt utilizate n practica psihodiagnostic sunt urmtoarele (Anastasi, A., 1988, 1996): 1) Achiziiile academice, evideniate prin note, medii, evidenieri speciale, rezultate la concursuri, promovri, graduri, recompense, burse etc., sunt foarte frecvent folosite pentru validarea testelor de inteligen. De aceea, mai muli autori au considerat aceste teste ca fiind modaliti de msurare a aptitudinilor colare. De asemenea, achiziiile academice sunt folosite i pentru validarea testelor de msurare a personalitii i a testelor pentru msurarea aptitudinilor multiple; 2) Performana n cadrul unui domeniu de formare specializat este folosit n calitate de criteriu pentru validarea unor teste folosite pentru msurarea aptitudinilor speciale. Pot fi date ca exemple: - achiziiile finale n cadrul cursurilor de formare profesional special sunt folosite pentru validarea testelor ce msoar aptitudinile tehnice; - performana n anumite ramuri artistice pot fi folosite n vederea validrii testelor pentru msurarea aptitudinilor artistice; 3) Performana muncii (job performance) apare n calitate de criteriu folosit pentru validarea, n primul rnd, a testelor pentru aptitudini speciale. Totodat, ea este utilizat, dar
70
NICOLAE MITROFAN
n mai mic msur, pentru validarea testelor de inteligen general i a testelor de personalitate; 4) Diagnoza psihiatric este folosit n calitate de criteriu pentru evidenierea validitii testelor de personalitate, dac este bazat pe observarea prelungit i detaliat a cazului; 5) Corelaiile dintre un test nou i testele disponibile anterioare; de exemplu, validarea testelor de grup folosind bateria Stanford-Binet; 6) Metoda grupurilor contrastante, ce implic un criteriu compozit. De exemplu, validitatea unor teste de aptitudini muzicale sau a unor teste de aptitudini tehnice pot fi verificate prin compararea scorurilor obinute de studenii admii n instituiile de art sau de inginerie cu scorurile obinute de cei respini la examenele de selecie. Tem de reflecie/autoevaluare: Dac notele colare ridic multe probleme privind modul n care ele reflect achiziiile reale ale elevilor, n ce msur pot fi acceptate ca o form de validare a unor teste de inteligen ? 3. Validitatea de construct (construct-related validation). Aceast form de validitate vizeaz msura n care un test are capacitatea de a msura un anumit construct teoretic. Fiecare test i propune s msoare o anumit nsuire sau trstur psihic, cum ar fi, de exemplu: aptitudine colar, apreciere spaial, inteligen, comprehensiune verbal, fluen verbal, coordonare motorie, nevrozism, dominan, anxietate, responsabilitate, intro-extroversie, timiditate etc. Fiecare dintre aceti termini reprezint o abstracie i el reflect o anumit parte a comportamentului uman. Pentru a-l putea msura este necesar s inventariem ct mai multe dintre actele comportamentale care sunt observabile i msurabile. De exemplu, ce nseamn c un individ este introvertit ? Alctuim o list de acte comportamentale, ceea ce nseamn c operaionalizm conceptual de introversie, care va cuprinde: - nu-i place s vorbeasc prea mult cu alii; - nu are prieteni; - stabilete greu relaii cu alte persoane; - nu rspunde dac nu este ntrebat; - nu-i place s atrag atenia altora asupra lui; - i place s stea mai izolat; - i place s-i analizeze propriile gnduri; nu dorete s mearg la petreceri etc. Validarea de construct cuprinde mai multe etape, care sunt diferite de la un autor la altul, dar care n final atinge acelai obiectiv. Astfel, Cronbach, 1979 (apud Stan, A., 2002) ia n considerare 3 etape: 1. Lansarea ipotezei n privina constructului care elucideaz comportamentul la test. Acesta este un act de reprezentare, care se bazeaz pe observarea comportamentului la test i pe cercetarea logic a testului; 2. Deducia ipotezelor verificabile din teoriile localizate n construct. Aceasta este o operaie pur logic; 3. Realizarea unei cercetri empirice pentru verificarea acestor ipoteze. Ali autori, respectiv, Guthke, Bttcher i Sprung, 1991 (apud Stan, A., 2002) consider c demersul pentru validare este constituit din patru trepte i anume: 1. Colectarea din fundamentele teoriilor asupra obiectului diagnosticului (de exemplu, anxietate, introversiune) a unei serii de aseriuni, cum a r fi: a) despre relaiile presupus pozitive ale constructului implicat n test i alte constructe; b) despre neconcordanele presupuse de relaia dintre constructele cercetate i alte constructe; c) despre relaia dintre constructele cercetate i anumite variabile observate (moduri de comportament, produse ale activitii etc.);
71
NICOLAE MITROFAN
2. Alegerea, mai ales pentru dezvoltarea unor teste, a acelora care apar adaptate pentru constructele indicate la a i b; 3. Formularea unei serii de ipoteze care se refer la msurarea constructelor corespunztoare (tipul a se refer la validitatea convergent, tipul b la cea discriminant, iar tipul c la validarea criteriului; 4. Verificarea sau falsificarea, respectiv modificarea ipotezelor anterioare, pe baza cercetrii. Printre modalitile de evideniere a validitii constructului menionm urmtoarele: 1. Diferenierea vrstei, criteriu folosit pentru validarea mai ales a testelor de inteligen. De exemplu, n cazul bateriei Stanford-Binet, este folosit vrsta cronologic pentru a se evidenia dac scorurile obinute arat o cretere progresiv odat cu creterea nvrst a subiectului; 2. Corelaiile cu alte teste similare anterioare, care msoar acelai tip de comportament. Un test nou de inteligen nou este declarat valid dac el coreleaz cu un alt test de inteligen a crui validitate a fost deja verificat; 3. Analiza factorial, ce ne apare n calitate de tehnic statistic rafinat pentru analizarea interrelaiilor datelor comportamentale. Scopul major al analizei factoriale este de a simplifica descrierea comportamentului supus msurrii, reducnd numrul mare de variabile luate n atenie la civa factori sau trsturi comune. 4. Analiza consistenei interne, folosit mai ales pentru categoria testelor de personalitate, n raport cu care criteriul nu este altceva dect scorul total al testului nsui. 5. Matrice multi-trsturi - multi-metode (multi-trait - multimethod matrix). Aceast ultim modalitate o vom detalia mai mult, pentru c ea este prezentat practic n toate tratatele de psihodiagnostic (Anastasi, A., 1988, 1996) i pentru c este una dintre cele mai utile. Este vorba despre un proiect experimental propus de ctre Campbell i Fiske (1959). Ei difereniaz dou tipuri de validitate, respectiv, validitatea convergent i validitatea discriminatorie. Validitatea convergent se refer la faptul c un test coreleaz la nivel nalt cu alte variabile cu care teoretic trebuie s coreleze. De exemplu, rezultatele unui elev la un test pentru msurarea aptitudinilor matematice coreleaz cu rezultatele sale colare la matematic (validitate convergent). Pe de alt parte, este de ateptat ca performanele la acelai test s nu coreleze cu rezultatele lui colare la literatur (validitate discriminatorie). Revenind la proiectul experimental propus de Campbell i Fiske, menionm c procedura folosit solicit msurarea a dou sau mai multe trsturi prin dou sau mai multe metode. Concret, n proiectul lor: - cele trei trsturi sunt trsturi de personalitate, respectiv: A (dominana); B (sociabilitatea); C (motivaia achiziionrii); - cele trei metode sunt: 1) inventar de personalitate; 2) test proiectiv; 3) clasificarea n perechi. Pot rezulta urmtoarele combinaii posibile: A1, A2, A3 = dominana la testele 1, 2, 3; B1, B2, B3 = sociabilitatea la testele 1, 2, 3; C1, C2, C3 = motivaia achiziionrii la testele 1, 2, 3. Se alctuiete un table cu dubl intrare, n cadrul cruia regsim urmtoarele tipuri de informaii: - valoarea coeficienilor de fidelitate; - valoarea coeficienilor de validitate, rezultai n urma corelrii scorurilor obinute pentru aceeai trstur prin diferite metode; - corelaiile dintre diferite trsturi msurate cu aceeai metod;
72
NICOLAE MITROFAN
- corelaiile dintre diferite trsturi msurate cu diferite metode. n urma analizei datelor din table au rezultat urmtoarele concluzii: a) pentru ca validitatea constructului s fie satisfctoare, valoarea coeficienilor de validitate trebuie s fie mai mare dect valoarea corelaiilor dintre trsturile diferite msurate cu metode diferite; b) valoarea coeficienilor de validitate trebuie s fie mai mare dect valoarea corelaiilor dintre trsturi diferite msurate cu aceeai metod. i acum ntrebarea: ct de mare poate fi valoarea coeficientului de validitate ? Nu exist un rspuns acceptat unanim de ctre autori. Desigur, ca o cerin general, cu ct valoarea este mai mare cu att mai valid este testul respectiv. S nu uitm ns, c absolut ntotdeauna valoarea coeficientului de validitate al unui test este mai mic dect valoarea coeficientului de fidelitate al aceluiai test. Unii autori (Anastasi, A., 1988, 1996) susin c valoarea coeficientului validitii trebuie s fie destul de mare pentru a fi statistic semnificativ la un nivel acceptabil, cum ar fi 0.01 sau 0.05. Ali autori, cum este cazul lui M. Smith (apud Stan, A., 2002), propun o gradare a semnificaiilor unui indice de validitate: a) peste 0,50 - excelent; b) ntre 0,40 i 0,49 - bun; c) ntre 0,30 i 0,39 - acceptabil; d) sub 0,30 - slab. A. Stan atenioneaz ns c un coeficient de validitate mai mare de 0,70 este excepional i c el merit o examinare atent cnd este raportat. Tem de reflecie/autoevaluare: 1. ncercai s operaionalizai constructele: timiditate i anxietate 2. De ce ntotdeauna valoarea coeficientului de validitate al unui test este mai mic dect valoarea coeficientului de fidelitate ?
1. De ce validitatea de coninut nu este valabil pentru testele de personalitate i testele de aptitudini ? 2. n afar de testele de cunotine pentru ce categorii de teste mai este valabil validitatea de coninut ? 3. Ce cuprind specificaiile testului ? 4. La ce ne ajut formula lui Lawshe ? 5. Care este specificul validitii de criteriu ? 6. Care este deosebirea dintre predictori i criteriu ? 7. Prin ce se deosebete validitatea concurent de validitatea predictiv ? 8. n ce const fenomenul de contaminare a criteriului i cum poate fi el contracarat ? 9. Care sunt cele mai cunoscute criterii utilizate n practica psihodiagnostic ? 10. n ce const validitatea privitoare la construct ? 11. Care este poziia diferiilor autori privind etapele parcurse pentru evidenierea validitii de construct ? 12. Care sunt principalele modaliti de evideniere a validitii de construct ? 13. Prin ce se deosebete validitatea convergent de validitatea discriminatorie ? 14. n ce const i la ce folosete proiectul experimental propus de ctre Campbell i Fiske ? 15. Ce putem spune despre valoarea coeficientului de validitate ?
73
NICOLAE MITROFAN
16. De ce ntotdeauna valoarea coeficientului de validitate este mai mic dect valoarea coeficientului de fidelitate ? BIBLIOGRAFIE MINIMAL 1. ANASTASI, A. (1988, 1996). Psychological testing. New York: Macmillan. 2. COHEN, R.J., SWERDLIK, M.E. (2005). Psychological Testing and Assessment. An Introduction to Tests and Assessment. McGraw-Hill International Edition. 2. CLINCIU, A.I. (2005). Psihodiagnostic. Braov: Editura Universitii Transilvania. 3. MINULESCU, M. (2003). Teorie i practic n psihodiagnosz. Bucureti: Editura Fundaiei Romnia de Mine. 4. STAN, A. (2002). Testul psihologic. Evoluie, construcie, aplicaie. Iai: Polirom.
74
NICOLAE MITROFAN
Unitatea de nvare 4 Testul psihologic i selecia profesional Cuprins: 1. Eroarea standard a estimrii 2. Criterii de selectare a testelor 3. Locul i rolul testului n selecia profesional Obiective: La sfritul acestei uniti de nvare, studenii vor fi capabili s: cunoasc n ce const eroarea standard a estimrii; poat s dea exemple opernd cu SEE; identifice criteriile n baza crora selectm testele pentru a le folosi n practic; foloseasc tabelele Taylor-Russell; determine capacitatea de selecie a unor teste.
1.
Eroarea standard a estimrii (Standard Error of Estimation SEE). Este foarte asemntoare cu eroarea standard a msurrii (SEM), numai c aceasta nu mai are legtur cu fidelitatea, ci cu validitatea. SEM ajut la determinarea mrimii erorii ce poate fi ateptat ca urmare a faptului c scorul unui subiect este rezultatul nonfidelitii testului. La rndul ei, SEE ajut la determinarea erorii ce poate fi ateptat privitor la scorul prognozat al subiectului la un criteriu, ca rezultat al validitii imperfecte a testului. Aa dup cum deja cunoatem, n baza rezultatelor obinute la un test folosit pentru selectarea subiecilor, anticipm poziia sau chiar scorul unui subiect la criteriu. n cazul n care testul ar fi perfect valid, de cte ori am aplica testul am anticipa exact acelai scor la criteriu, ceea ce n realitate este imposibil. Datorit valorii relativ reduse a validitii testului (v amintii c valoarea coeficientului de validitate este ntotdeauna mai mic dect valoarea coeficientului de fidelitate ?), poziia anticipat a subiectului la criteriu va oscila ntre anumite limite, care pot fi precizate cu ajutorul lui SEE. Formula de calcul este urmtoarea: SEE = SDy 1 rxy2 n care: SDy = deviaia standard la scorurile la criteriu; rxy2 = ptratul coeficientului de validitate S vedem ce se ntmpl n cazul n care valoarea coeficientului de validitate = 1.00, adic testul ar fi perfect valid. nlocuim n formul i vom constata c valoarea lui SEE ar fi zero, deci precizia anticiprii scorului subiectului la criteriu ar fi maxim. n cazul n care, ns, coeficientul de validitate ar avea valoarea zero, nlocuind n formul, vom constata c mrimea erorii standard a estimrii ar fi att ct este deviaia standard. Deci, predicia nu ar mai avea nicio precizie, ea fiind total ntmpltoare. Inutil s mai spunem c valoarea predictiv a testului ar fi practic nul. Desigur, calcularea valorii lui SEE intr n obligaia constructorului testului iar informaiile privind acest tip de eroare trebuie s fie incluse n manualul testului.
75
NICOLAE MITROFAN
Cunosc\nd valoarea lui SEE noi putem s anticipm ntre ce limite se va ncadra scorul subiectului prognozat la criteriu. S presupunem c scorul prognozat este 100. Dac reaplicm testul de 100 de ori, scorul prognozat va oscila n jurul scorului egal cu 100, respectiv, jumtate dintre ele vor fi mai mari i jumtate vor fi mai mici. Apelnd la curba lui Gauss, vom fi pui n faa unei distribuii normale, avnd media = 100. SEE va reprezenta deviaia standard a acestei distribuii. Drept urmare: 34% din scorurile subiectului vor cdea ntre 100 i + 1 SEE (nsemnnd media i plus o deviaie standard) i alte 34% din scoruri vor cdea ntre 100 i - 1 SEE (nsemnnd media i minus o deviaie standard). Luate mpreun, 68% din scorurile subiectului vor cdea n intervalul definit de 100 1 SEE. Deci, dac valoarea lui SEE ar fi 10, noi putem fi siguri c, n caz de reaplicare a testului n vederea anticiprii scorului la criteriu, acesta din urm va cdea n intervalul 90 i 110, la un nivel de ncredere de 68%. La un nivel de ncredere de 95%, scorul prognozat ar cdea n intervalul 100 2 SEE, respectiv, pentru exemplul dat, n intervalul 80 i 120. La un nivel de ncredere de 99%, scorul prognozat ar cdea n intervalul 100 3 SEE, respectiv, pentru exemplul nostru, n intervalul 70 i 130. Exact ca i n cazul erorii standard a msurrii, formula pentru construirea intervalului de ncredere este urmtoarea: X (scorul z) (SEE), n care: X + (scorul z) (SEE) = limita superioar a intervalului X - (scorul z) (SEE) = limita inferioar a intervalului. Aa dup cum am precizat de mai multe ori, valoarea coeficientului de validitate al testelor este relativ mic, ceea ce nseamn c, de regul, eroarea scorurilor prognozate este considerabil. De aceea, n realitate, cele mai multe teste sunt folosite nu pentru a prevedea exact scorul unui subiect la criteriu, ci mai mult pentru a determina dac el va depi un standard minim al performanei sau o linie de demarcaie ntre succes-eec (Anastasi, A., 1988, 1996). Tem de reflecie/autoevaluare: 1. Ce este eroarea standard a estimrii (SEE)i care este relaia sa cu validitatea testului ? 2. Dac valoarea lui SEE este 5 i scorul prognozat al subiectului n baza rezultatelor la un test aplicat este 120, ntre ce limite se va ntinde scorul prognozat, la un nivel de ncredere de 99%, n caz de reaplicare a testului ? 3. Criterii de selectare a testelor. n practica psihgodiagnostic exist foarte multe teste, de aceea, se pune problema selectrii lor, att n funcie de caracteristicile psihometrice, ct i n funcie de scopul aciunii de msurare. Desigur, trebuie evitat pe ct posibil utilizarea unui singur test, mai ales atunci cnd trebuie luat o decizie important pentru subiect. Unele teste sunt deja foarte cunoscute, ele fiind aplicate de foarte muli psihologi. n unele ri, cum este cazul S.U.A. s-au realizat chiar ierarhizri ale testelor n funcie de preferina manifestat de practicieni. Teste precum MMPI, CPI, WAIS, WISC, WPPSI, Rorschach, TAT etc. s-au impus mai demult n partea de nceput a acestor ierarhizri. Cu toate acestea, selectarea testelor pe care trebuie s le aplice psihologul nu este o sarcin uoar, el trebuind s dovedeasc mult flexibilitate i mult rspundere n acest sens.
76
NICOLAE MITROFAN
Printre factorii care trebuie s fie luai n consideraie n selectarea testelor pot fi inclui urmtorii: - motivul pentru care subiectul a fost trimis la psiholog pentru msurarea i evaluarea psihologic; - vrsta subiectului; - probleme prezentate de subiect de ordin snzorial (vz, auz) sau de ordin motor; - perioada de timp disponibil pentru testare; - disponibilitatea anumitor teste; - abilitatea subiectului de a citi (pentru cazurile n care vom folosi teste de personalitate sau anumite inventare de interese vocaionale); - mediul socio-cultural din care provine subiectul. n continuare vom prezenta cteva exemple (Bishop, E., 1992) de modul n care se pot combina testele, inndu-se seam de scopul trimiterii spre examinare i de vrsta subiecilor. Exemplul 1: pentru un adult care este trimis pentru o examinare psihologic complet n vederea stabilirii exacte a diagnosticului i planificrii tratamentului, fiind suspectat c are probleme psihiatrice, cum ar fi, depresia sau anxietatea se poate folosi urmtoarea baterie de teste. Testele sunt prezentate n ordinea aplicrii lor: - Scala de inteligen pentru aduli a lui Wechsler (WAIS III); - Inventarul multifazic de personalitate Minnesota (MMPI 2); - Testul Bender Gestalt; - Testul tematic de apercepie (TAT); - Testul completrii de fraze (Incomplete Sentence Blank). Acest grup de teste, att obiective, ct i proiective vor oferi informaii privind abilitile cognitive i funcionarea personalitii. Exemplul 2: pentru copiii ce urmeaz a fi evaluai pentru plasarea lor ntr-o instituie pentru educaie special, se poate folosi urmtoarea baterie de teste: - Scala de inteligen a lui Wechsler pentru copii (WISC-III); - Testul pentru achiziii colare Woodcock-Johnson (Woodcock-Johnson Achievement Test Revised); - Testul Bender-Gestalt; - Testul de dezvoltare a integrrii vizual-motorii (The Developmental Test of Visual-Motor Integration); - The Draw a Person (DAP) sau House-Tree-Person (HTP). Deci aceast baterie vizeaz mai multe aspecte, respectiv, nivelul de dezvoltare intelectual, nivelul i tipurile de achiziii colare, nivelul de funcionare cognitiv, nivelul de funcionare a personalitii. Dac este necesar confirmarea unui diagnostic posibil privind retardarea mental, trebuie s fie adugate alte instrumente de msurare a comportamentului adaptativ, cum este cazul Scalelor Vineland pentru Comportamentul Adaptativ (Vineland Adaptative Behavior Scales). Aceste scale sunt foarte necesare deoarece diagnoza retardrii mentale presupune evidenierea unor ntrzieri semnificative att n ceea ce privete funcionarea cognitiv, ct i n ceea ce privete comportamentul adaptativ. Exemplul 3. Dac un adolescent este evaluat pentru posibile servicii de reabilitare vocaional, bateria folosit ar trebui s cuprind: teste pentru abiliti cognitive, teste de
77
NICOLAE MITROFAN
achiziii colare, teste pentru planificare i organizare, teste pentru interese vocaionale i teste de personalitate. Concret, aceast baterie ar cuprinde: - Scala de inteligen a lui Wechsler pentru aduli (WAIS-III); - Wide Range Achievement Test- Revised; - Strong Vocational Interst Blank; - Incomplete Sentences Blank. Exemplul 4. Pentru evaluarea unui copil mic i foarte mic, n vederea beneficierii de un suport financiar datorit unor dizabiliti, se poate utiliza o baterie care s cuprind: - Testele Bayley ale dezvoltrii copilului (Bayley Tests of Infant Development; - Scalele Vineland pentru comportamentul adaptativ (The Vineland Adaptive behavior Scales; - Observarea interaciunii mam-copil. O grij deosebit trebuie acordat selectrii testelor potrivite pentru evalurile judiciare (forensic evaluations). Exemplul 5. n cazul stabilirii custodiei pentru un copil, testele de evaluare sunt aplicate i pe copii i pe prini, la care se adaug interviul clinic i observarea interaciunii printecopil. Ca teste pentru copii pot fi folosite urmtoarele: - Testul Aperceptiv Robert pentru Copii (Roberts Apperception for Children); - Testul vocabular n imagini Peabody (Peabody Picture Vocabulary Test- Revised); - Desenul kinetic al familiei (Kinetic Family Drawing); - Completare de propoziii (Incomplete Sentences Blank). Pentru aduli se aplic testele: - Inventarul multifazic de personalitate Minnesota (MMPI-2); - Completare de propoziii (Incomplete Sentences Blank); - Indexul stresului parental (Parenting Stress Index). Teme de reflecie/autoevaluare: 1. De ce credei c este necesar, precum n exemplele de mai sus, s fie incluse ntr-o baterie de testare mai multe teste ? 2. Care sunt cele mai importante criterii ce se iau n atenie n selectarea unor teste folosite n aciunile de msurare psihologic ? 3. Locul i rolul testului n selecia profesional. Testul este foarte frecvent folosit n aciunile de selecie profesional. n urma aplicrii lui rezult dou categorii de subieci: a) cei care reuesc la test; b) cei care nu reuesc la test. Primii mai sunt denumii subieci admii iar ceilali sunt denumii subieci respini. Cei care organizeaz examenul de selecie trebuie s stabileasc linia de demarcaie (cut-off score) dintre subiecii admii i cei respini. Aceast linie poate fi foarte apropiat de partea de nceput a listei candidailor (de exemplu, dac se pot obine maximum de 100 de puncte la test, vor fi declarai reuii numai cei ce obin peste 95 de puncte) sau, dimpotriv, poate fi foarte mult ndeprtat de partea de nceput (n cadrul exemplului dat pot fi declarai admii cei ce obin cel puin 25 de puncte). Este clar c, n primul caz, interesul organizatorului examenului este de a face o selecie foarte sever, iar n al doilea caz, interesul este de a accepta ct mai muli candidai. Dac testul psihologic folosit pentru selecie ar fi un instrument perfect (coeficientul de fidelitate = 1,00 i coeficientul de validitate = 1,00) atunci, n cadrul aciunii de selecie, ar fi sigur departajai subiecii buni (admii) de cei slabi (respini). Deci nu ar exista nicio greeal, n sensul c pot fi admii candidai slabi i respini candidai buni.
78
NICOLAE MITROFAN
Cum ns, n realitate, testul psihologic nu este un instrument de msurare perfect (niciodat valoarea coeficientului de fidelitate i a coeficientului de validitate nu este 1,00), el poate grei, n sensul c, pe lng subiecii admii pe drept pot fi inclui i subieci care ar trebui s fie respini. De asemenea, n categoria subiecilor respini pe drept, el poate include i unii subieci, care ar trebui s fie, de fapt, admii. Iat, aadar, c, n realitate, n urma examenului de selecie rezult nu doar dou categorii, ci patru: admii, respini, fals admii, fals respini. Desigur, ultimile dou categorii ridic probleme serioase n cazul n care procentul celor ce le aparin este mare. Falii admii sunt cei care nu au capaciti i aptitudini pentru activitatea n raport cu care sa fcut selecia i meninerea lor n aciunile de formare (training) vor necesita costuri mari inutile, deoarece ei oricum vor eua cnd vor fi evaluai la criteriu. Falii respini nseamn, candidai buni pierdui, care, dac ar fi fost admii, ar fi reuit sigur cnd ar fi fost evaluai la criteriu. Cum ar trebui s procedeze organizatorul examenului pentru a reduce numarul falilor pozitivi (cei admii pe nedrept) ? O msur simpl ar fi s ridice linia de demarcaie, scorul de departajare (cut-off score) ct mai aproape de partea de nceput a listei candidadailor. Cei care obin scoruri foarte mari este greu de presupus c ei vor aparine grupului falilor pozitivi. i invers, dac organizatorul examenului de selecie nu dorete s-i piard pe cei care au capacitile i aptitudinile msurate de test (s nu-i piard pe falii negativi), poate cobor linia de demercaie (cut-off score) ct mai jos posibil. Iat, aadar, c se pune problema n ce msur testul psihologic folosit n selecia candidailor are capacitatea de a face o predicie corect. Mai nti, vorbim despre rata de selecie a cestuia (hit rate), ce se refer la proporia cazurilor n care el anticip corect succesul sau eecul. Pe de alt parte, avnd n vedere rezultatele la criteriu, se poate determina rata de baz (base rate), care este proporia celor care reuesc i a celor care nu reuesc la criteriu. S lum i noi un exemplu concret (Kaplan, M.R., Saccuzzo, P. Dennis, 1993). Este vorba despre un test cu 83% precizie predictiv i 80% precizie a detectrii. Rezultate la testul psihologic Afeciune neurologic Normal Total Afeciune A B neurologic 8 2 10 Actual Normal Total C 15 D 75 90
23 77 100 Citind datele din tabel, rezult c, n urma testrii psihologice a 100 de subieci, a rezultat c 23 au afeciune neurologic i c 77 dintre ei nu au o asemenea afeciune. Pe de alt parte, tot din tabel reiese c, n urma efectrii diagnosticului medical, a reieit c 10 subieci au afeciune neurologic iar ceilali 90 sunt normali. Ce rezult de aici ? n tabel exist dou tipuri de preziceri corecte: a) din 10 subieci cu afeciune neurologic, testul detecteaz 8, ceea ce nseamn c rata de detecie este de 80%; b) testul arat c 75 dintre subieci sunt normali, fiind n total acord cu rezultatul examenului medical. Deci, din 100 de subieci, testul stabilete corect diagnosticul pentru 83 dintre ei. Putem spune, n consecin, c acest instrument psihodiagnostic prezint un procent de 83%
79
NICOLAE MITROFAN
a acurateei sau preciziei predictive. Totodat, ns, exist i dou tipuri de eecuri n predicie. Astfel, exist dou cazuri considerate, n baza testului, ca neavnd afeciune neurologic, n realitate nefiind aa. De asemenea, conform datelor obinute la test, 15 cazuri prezint o afeciune neurologic, situaie neconfirmat de examenul medical. Aadar, din tabelul de mai sus reies urmtoarele tipuri de informaii: - A i D = predicie corect a testului - B = fals negativi - C = fals pozitivi - A/(A + B) = rata de detecie - D/(C + D) = specificitate - (A + D)/(A + B + C + D) = rata acurateei sau preciziei predictive Concluzia principal este aceea c acest test este relativ bun n detectarea afeciunilor neurologice, deoarece 10% din toi subiecii au asemenea afeciuni iar testul detecteaz 80% din cazuri. Pentru a cunoate ct de mult ne poate ajuta un test psihologic n aciunile de selecie, Taylor i Russell au oferit o metod pentru evaluarea validitii n relaie cu cantitatea de informaie cu care testul contribuie dincolo de rata de baz. Aceast metod a msurrii valorii testelor este prezentat ntr-o serie de tabele, cunoscute sub numele de tabele Taylor-Russell (Kaplan, M.R., Saccuzzo, P.D., 1993). Cel care dorete s utilizeze aceste tabele trebuie s dispun de urmtoarele informaii: 1. Definirea succesului i precizarea ct mai clar a limtei de demarcaie ntre cele dou categorii de subieci (admii-respini); 2. Determinarea ratei de baz, adic procentul persoanelor care vor reui n condiiile n care nu se folosete niciun test; 3. Definirea ratei de selecie: procentul candidailor selectai sau admii; 4. Determinarea coeficientului de validitate. Acesta, de regul, vizeaz corelaia dintre rezultatele la test i rezultatele la criteriu. Tabelele Taylor-Russell ofer probabilitatea ca o persoan selectat pe baza scorului la test s reueasc la criteriu. Exist cte un tabel diferit pentru fiecare rat de baz. Tabelul care este cel mai cunoscut i care poate fi regsit apropate n toate tratatele de psihodiagnostic este cel cu o rat de baz: 0,60. Pentru a utiliza tabelul se ia n atenie irul ce cuprinde valorile validitii testului ce urmeaz a fi utilizat pentru selecie. Apoi se gsete coloana asociat procentului celor ce vor fi selectai. Numrul gsit la intersectarea irului i coloanei ne ofer o estimare a celor ce vor reui n cazul n care vor fi selectai pe baz de test. Iat un exemplu concret (Kaplan, M.R., Saccuzzo, P.D., 1993). S presupunem c avem n calitate de criteriu notele (mediile) obinute de elevi dup terminarea unui an colar. Avnd n vedere c limita de demarcaie (cutt-off score) este 5,00, 60% dintre ei sunt declarai reuii. Deci rata de baz = 60%. Apoi, considerm c vom utiliza pentru selecia elevilor un test de inteligen. Rata de selecie va fi 60%, deoarece avem numai attea locuri. Valoarea coeficientului de corelaie dintre acest test i criteriu este deja cunoscut: 0,30. Pentru a estima ci candidai vor reui dac ei sunt selectai n baza testului de inteligen folosim tabelul Taylor-Russell. Vom gsi procentul de .66 sau 66%. Deci, diferena este doar de 6% fa de selecia bazat pe ntmplare. Dac valoarea coeficientului de validitate ar fi fost 0,50, atunci procentul ar fi fost de 73%, ceea ce nseamn o diferen de 13% fa de selecia bazat pe ntmplare.
80
NICOLAE MITROFAN
Tabelul Taylor-Russell pentru rata de baz = 60% ________________________________________________________________________ Rata de selecie ____________________________________________________________ Validitatea 0.5 0,10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 0.95 ________________________________________________________________________ .00 .60 .60 .60 .60 .60 .60 .60 .60 .60 .60 .60 .05 .64 .63 .63 .62 .62 .62 .61 .61 .61 .60 .60 .10 .68 .67 .65 .64 .64 .63 .63 .62 .61 .61 .60 .15 .71 .70 .68 .67 .66 .65 .64 .63 .62 .61 .61 .20 .75 .73 .71 .69 .67 .66 .65 .64 .63 .62 .61 .25 .78 .76 .73 .71 .69 .68 .66 .65 .63 .62 .61 .30 .82 .79 .76 .73 .71 .69 .68 .66 .64 .62 .61 .35 .85 .82 .78 .75 .73 .71 .69 .67 .65 .63 .62 .40 .88 .85 .81 .78 .75 .73 .70 .68 .66 .63 .62 .45 .90 .87 .83 .80 .77 .74 .72 .69 .66 .64 .62 .50 .93 .90 .86 .82 .79 .76 .73 .70 .67 .64 .62 .55 .95 .92 .88 .84 .81 .78 .75 .71 .68 .64 .62 .60 .96 .94 .90 .87 .83 .80 .76 .73 .69 .65 .63 .65 .98 .96 .92 .89 .85 .82 .78 .74 .70 .65 .63 .70 .99 .97 .94 .91 .87 .84 .80 .75 .71 .66 .63 .75 .99 .99 .96 .93 .90 .86 .81 .77 .71 .66 .63 .80 1.00 .99 .98 .95 .92 .88 .83 .78 .72 .66 .63 .85 1.00 1.00 .99 .97 .95 .91 .86 .80 .73 .66 .63 .90 1.00 1.00 1.00 .99 .97 .94 .88 .82 .74 .67 .63 .95 1.00 1.00 1.00 1.00 .99 .97 .92 .84 .75 .67 .63 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 .86 .75 .67 .63 Dup cum am afirmat mai nainte, n urma examenului de selecie, este posibil ca unii candidai, dei valoroi, s nu fie selectai. De aceea, se ridic problema existenei unei modaliti de estimare a proporiei candidailor declarai admii care vor confirma la criteriu i procentul celor care ar fi reuit la criteriu dac ar fi fost selectati. De exemplu (Kaplan, M.R., Saccuzzo, P.D.), s presupunem c un ef de personal la o companie dorete s selecteze 30 de subieci dintr-un numr de 100 de candidai. Se va folosi un test cu validitatea = .70. Rata de baz este 60%. Utiliznd tabelul Taylor-Russell pentru o rat de baz de 60%, vom gsi procentul de .91, ceea ce nseamn c 91% din candidaii selectai vor reui la criteriu (91% x 30 = 27,3, deci, 27. Apoi, fcnd diferena (30 27 = 3) rezult c 3 candidai nu vor reui la criteriu. Dac eful de personal s-a hotrt s angajeze 30 de candidai din 100 prezentati la concurs, nseamn c nu va angaja 70 dintre ei. Asta nu nseamn, ns, c toi cei respini, adic toi cei 70 de candidai, dac ar fi fost angajai, ar fi euat la criteriu. Situaia este reflectat de tabelul de mai jos. Test ____________________________ Admii Respini Total
81
NICOLAE MITROFAN
Succes Criteriu Eec Total
27
33
60
3 37 40 ____________________________ 30 70 100
Ce se poate observa din acest tabel ? Din cei 60 de candidai care ar reui la criteriu sunt selectai, cu ajutorul testului, doar 27, ceea ce nseamn c 33 de candidai, care ar reui la criteriu, nu sunt selectai. Totui, din cei 40 de candidai, care ar eua la criteriu, 37 au fost bine diagnosticai. n concluzie, 90% (27/30) dintre candidaii selectai cu ajutorul testului vor reui la criteriu iar 47% (33/70) dintre cei respini ar fi reuit la criteriu. Procedura poate fi declarat a fi bun, deoarece procentul celor ce vor reui dintre cei selectai este mult mai mare. Teme de reflecie/autoevaluare: 1. Analiznd tabelul Taylor-Russell, ce putem spune despre testele ce au validitatea mai mare iar rata de selecie este mai mic ? Dar despre testele care au validitatea mai mic iar rata de selecie este mai mare ?
Intrebri de autoevaluare:
1. Ce reprezint eroarea standard a estimrii (SEE) ? 2. Care este formula de calcul a erorii standard a estimrii ? 3. Ce asemnri i ce deosebiri sunt ntre eroarea standard a msurrii (SEM) i eroarea standard a estimrii (SEE) ? 4. Cine se ocup de calcularea celor dou forme de erori ? 5. Dai cel puin 2 exemple concrete privind utilizarea valorii lui SEE. 6. Care sunt cele mai importante criterii folosite n selectarea testelor ? 7. Dai cteva exemple de modul n care se pot combina testele ntr-o baterie de teste. 8. De ce trebuie s includem mai multe teste n aciunile de msurare i evaluare psihologic ? 9. Cnd folosim teste psihologice pentru selecia de personal, cte categorii reale de candidai avem ? 10. Ce nseamn rata de detecie a testelor ? 11. Ce nseamn rata acurateei sau a preciziei predictive a testelor ? 12. Care sunt paii parcuri cnd folosim tabelele Taylor-Russell ? BIBLIOGRAFIE 1. BISHOP, E. (1992). Selection of psychological tests for different purposes: children, adolescents, and adults. 50th International Convention of ICP, Olanda. 2. COHEN, J.R., SEWRDLIK; E:M: (2005). Psychological Testing and Assessment. An Introduction to Tests and Measurement. McGraw-Hill International Edition. 3. CLINCIU, A. (2005). Psihodiagnostic. Braov: Ed. Universitii Transilvania. 4. KAPLAN, M. R., SACCUZZO, P.D. (1993). Psychological Testing. Brooks/Cole Publishing Company. 5. STAN, A. (2003). Testul psihologic. Evoluie, construcie, aplicaii. Iai: Polirom.
82
NICOLAE MITROFAN
MODULUL IV ANALIZA ITEMULUI

Unitatea de nvare 1: Ce este analiza itemului ? Cuprins: 1. Relaia itemului cu testul 2. Tipuri de analiz a itemului Obiective La sfritul acestei uniti de nvare, studenii vor fi capabili s: defineasc itemul ca element component al testului; cunoasc relaia dintre itemi i testul luat ca ntreg; cunoasc funciile ndeplinite de item n cadrul testului; evalueze diferite tipuri de analize a itemului
1. Relaia itemului cu testul Am vorbit destul de mult despre caracteristicile psihometrice ale testelor, respectiv, despre fidelitate i validitate. Acum vom vedea n ce msur acestea depind de caracteristicile elementelor componente ale testelor, mai exact ale itemilor. Testul cuprinde un anumit numr de itemi i urmrete s msoare o anumit nsuire sau o anumit caracteristic psihic. Obiectivul va fi atins, ns, dac fiecare dintre itemi va urmri i va avea puterea s msoare aceeai nsuire sau caracteristic psihic. Sunt i autori care nu folosesc noiunea de item (apud Stan, A., 2002). De exemplu, David Magnusson, 1975, folosete noiunile de sarcini i analiz de sarcini n loc de itemi i analiz de itemi. Gustav Lienert (1967) folosete, n cadrul tratatului su o singur dat noiunea de item. S presupunem c, n cadrul unui test care conine 25 de itemi, la 5 dintre ei nu rspunde corect niciun subiect iar la ali 5 dintre ei, rspund corect toi subiecii. Este clar c cei 10 itemi, dei sunt inclui n structura testului, sunt inutili, n sensul c ei nu contribuie cu nimic la scoaterea n eviden a diferenelor interindividuale. i dac aceti itemi sunt neputincioi, atunci lungimea testului (numrul real de itemi) este, n realitate, mai mic cu 10 itemi. i dac reducem lungimea testului (v mai aducei aminte ce se ntmpl ?) va scdea automat valoarea fidelitii, ct i a validitii. n cazul exemplului nostru este bine ca itemii foarte dificili i cei foarte uori s fie eliminai din structura testului. Dar ce este, de fapt, un item ? Cum l putem defini ? n ce relaie se afl el cu testul luat ca ntreg ? Vom oferi rspunsul la aceste ntrebri, ncepnd cu o definiie. i am preferat definiia dat de M. Reuchlin, n lucrarea Grand dictionnaire de la psychologie (1992): 83
NICOLAE MITROFAN
itemul este un element al unui test, constituind o situaie particular i jucnd rolul unui stimul la care subiectul nu poate da dect un rspuns dintre dou sau mai multe rspunsuri teoretice prevzute de test. Ce reiese din aceast definiie ? n primul rnd, faptul c itemul este o secven, o component a testului, un fel de mintest care are o anumit individualitate. n al doilea rnd, faptul c itemul apare ca un stimul pentru subiect. n sfrit, n al treilea rnd, faptul c subiectul ofer un rspuns, care poate fi corect sau nu. Desigur, legat de formele de rspuns, lucrurile se prezint difereniat n funcie de categoria testelor. De exemplu, la testele de performan, rspunsul la item poate fi corect (subiectului i se acord 1 punct) sau incorect (subiectului nu i se acord niciun punct sau subiectului i se acord 0 puncte). n cazul testelor de personalitate, dac se folosesc scale cu mai multe variante de rspuns, subiectul poate obine un numr variabil de puncte, adic obine attea puncte cte sunt acordate treptei de rspuns pe care a ales-o subiectul. Pentru a fi considerat item o component a testului trebuie s aib individualitate informaional pertinent, adic s contribuie distinct, clar i conturat, la scorul total al testului (Stan, A., 2002). Un exemplu oferit de autor, care nu constituie item, este bararea unei litere, O sau C, la testul de atenie Bourdon-Amfimov. S-a pus i ntrebarea: ci itemi trebuie s aib un test ? Privind spre practic, putem ntlni i teste cu mai puini itemi i teste cu foarte muli itemi, cum este cazul chestionarelor i inventarelor de personalitate care au sute de itemi. Noi ne reamintim faptul c un test este de ateptat s fie mai fidel i mai valid cu ct are mai muli itemi. Referitor la cel mai mic numr de itemi pe care poate s-l aib un anumit test, Paul Kline, o autoritate n domeniul psihodiagnosticului, susine c acesta nu poate fi mai mic de 10. Deci, niciun test i niciun chestionar nu poate fi acceptat n calitate de instrument psihodiagnostic dac nu are cel puin 10 itemi. Un alt aspect important este cel legat de modul n care se formuleaz itemii. Sarcina nu este deloc uoar iar unii autori (DeVellis, 1991) a elaborat un fel de ghid ce cuprinde mai multe recomandri din care Kaplan, K.R. i Saccuzzo, D. (2005) rein urmtoarele ase: 1. Definii clar ceea ce vrei s msurai. Pentru aceasta utilizai teoria substantivului n calitate de ghid i ncercai s facei itemii att de specifici ct este posibil; 2. Creai o banc de itemi. Teoretic, toi itemii sunt alei ntmpltor dintr-un univers de coninut al itemilor. n practic, totui, grija n selectarea i dezvoltarea itemilor este valabil. Evitai itemii redundani. n fazele iniiale poate dorii s scriei 3 sau 4 variante pentru fiecare item ce urmeaz a fi utilizat n structura noului test; 3. Evitai, pe ct posibil, itemii cu lungime mare, deoarece acetia sunt buni foarte rar; 4. Meninei nivelul de dificultate al lecturii i nelegerii ct mai potrivit pentru cei care vor rspunde la test; 5. Evitai itemii cu un caracter echivoc, adic cei care conduc la dou sau mai multe idei n acelai timp. De exemplu, s ne referim la un item care solicit respondentului s rspund cu acord sau dezacord la afirmaia Votez democraii deoarece sprijin programe sociale. Aici sunt, de fapt, dou afirmaii n raport cu care respondentul trebuie s-i exprime acordul: Votez democraii i Eu sprijin programele sociale; 6. Combinai itemii formulai pozitiv i negativ. Uneori, respondenii dezvolt aa-numitul set al rspunsului ncuviinat. Aceasta nseamn c respondenii vor tinde s rspund cu sunt de acord la majoritatea itemilor. Or, pentru a evita o asemenea tendin, trebuie s includei i itemi care sunt formulai n direcie opus. De exemplu, ntr-un test ce msoar
84
NICOLAE MITROFAN
depresia, regsim i itemi formulai pozitiv, de genul M-am simit deprimat dar i itemi formulai n direcie opus, de genul M-am simit plin de speran privind viitorul. Teme de reflecie/autoevaluare: 1. Care credei c sunt avantajele i dezavantajele n cazul n care testul este foarte scurt i n cazul n care testul este foarte lung. 2. La ce categorii de instrumente psihodiagnostice se aplic cel mai bine ghidul lui DeVellis ?
2. Tipuri de analiz de itemi Pentru a nelege mai bine ce nseamn analiza itemului vom apela la o comparaie extrem de util i de interesant oferit de D. Laveault i J. Gregoire, 1997 (apud Stan, A., 2002). Aceti autori compar analiza itemilor cu repetiia unei orchestre n care instrumentele trebuie s cnte armonios i s intervin ntr-un mod foarte precis. Totul trebuie s produc o senzaie muzical aparte corespunznd inteniilor compozitorului i ale dirijorului. Analiza itemului apare ca fiind necesar atunci cnd construim un test nou i atunci cnd dorim s facem o nou revizie a unui test care a fost folosit o anumit perioad de timp dar care d semne c unii itemi nu mai sunt valizi. Analiza itemului presupune o analiz cantitativ, ct i una calitativ. Cea cantitativ presupune utilizarea unor procedee statistice pentru calcularea unor indici, precum, de exemplu, indexul dificultii itemului i indexul discriminrii itemului. Analiza calitativ vizeaz, pe de o parte, coninutul i, pe de alt parte, formatul itemilor. Criteriile folosite pentru a selecta itemii depind foarte mult de obiectivele urmrite de ctre constructorul de test. De exemplu (Cohen, J.R., Swerdlik, E.M., 2005) un constructor de teste poate considera ca fiind cei mai buni itemi cei care contribuie n mod optim la fidelitatea intern a testului, n timp ce alt constructor de teste poate dori s proiecteze un nou test cu cea mai mare valoare posibil a validitii referitoare la criteriu. Printre mijloacele pe care le poate folosi pentru analiza itemului pot fi menionate urmtoarele: a) un index al dificultii itemului; b) un index al discriminrii itemului; c) un index al fidelitii itemului; d) un index al validitii itemului. Noi ne vom ocupa, n capitolele urmtoare, mai ales de primele dou forme de index. Analiza calitativ a itemului presupune utilizarea unor variate proceduri nonstatistice (deoarece nu poate fi vorba despre o abordare numeric) de analiz, dup cum am mai afirmat i mai sus, a coninutului i formatului. Trebuie gsit cea mai bun formulare a itemului. De aceea trebuie iniiate cercetri n aceast direcie, n sensul c cei care rspund la un test nou sunt rugai s rspund la unele ntrebri de genul celor prezentate n tabelul urmtor (Cohen, J.R., Swerdlik, E.M., 2005):
_____________________________________________________________ 85
NICOLAE MITROFAN
Problema Exemplu de ntrebare _____________________________________________________________ Sensilibilitatea cultural Ai simit c unii itemi au fost discriminatori n raport cu anumite grupuri de subieci. Dac da, de ce ? Validitatea de faad Pare testul c msoar ceea ce ateptai s msoare ? Dac nu, ce este contrar ateptrilor ? Aplicantul testului V-a afectat n vreun fel conduita aplicantului testului performanele dvs. ? Dac, da, cum ? Mediul de aplicare A afectat n vreun fel condiiile din sala de testare performana dvs. la test ? Dac da, cum ? Corectitudinea testului Credei c testul este corect n raport cu ceea este considerat c msoar ? De ce sau de ce nu ? Limbajul testului n raport cu care dintre instruciuni sau alte aspecte scrise ale testului ai avut dificulti de nelegere ? Lungimea testului Ce ai simit, referitor la lungimea testului, n privina: a) timpul necesar pentru completare; b) numrul de itemi ? Ghicitul rspunsului Ai ghicit la vreunul dintre itemii testului ? Care credei c este procentul itemilor la care ai ghicit ? Ai utilizat o strategie particular pentru a ghici sau ai ghicit la ntmplare ? Integritatea subiectului Credei c s-a putut tria la acest test ? Dac da, descriei metodele ce credei c au fost utilizate. Starea mental i fizic a Cum ai descrie starea dvs. mental la ncepusubiectului tul testrii ? Credei c aceast stare a afectat n vreun fel rezultatele obinute ? Dac da, cum ? Cum descriei starea dvs. fizic la nceputul testrii ? Credei c aceast stare a afectat n vreun fel rezultatele obinute ? Dac da, cum ? Starea mental i fizic a Cum ai descrie starea dvs. mental pe parcursbiectului sul testrii ? Credei c aceast stare a afectat n vreun fel rezultatele obinute ? Dac da, cum ? Cum ai descrie starea dvs. fizic pe parcursul testrii ? Credei c aceast stare a afectat n vreun fel rezultatele obinute ? Dac da, cum ? Impresia general a Care este impresia dvs. general privind acest subiectului test ? Ce sugestii ai oferi constructorului de tes pentru mbunire ?
86
NICOLAE MITROFAN
Ai gsit vreuna din prile testului ca avnd un efect educaional, distractiv sau n alt fel recompensator ? Ce v-a plcut i ce nu v-a plcut n mod special la acest test ? Ai gsit vreuna din prile testului care s provoace anxietate, condescenden sau s supere n alt fel ? De ce ? Pregtirea subiectului Cum v-ai pregtit pentru acest test ? Dac ar fi s sftuii pe alii cum s se pregteasc pentru test, ce i-ai spune ? _________________________________________________________________ ntrebrile pot fi prezentate fie n oral, fie n scris. n plus, n funcie de obiectivele urmrite de utilizatorul de test, ntrebrile pot fi prevzute cu mai multe modaliti de rspuns, cum ar fi, rspuns dihotomic, de tipul Adevrat-fals sau cu mai multe variante de rspuns. De asemenea, pentru mai mult siguran este recomandabil ca s se asigure confidenialitatea rspunsurilor subiecilor. Teme de reflecie/autoevaluare 1. De ce este necesar analiza cantitativ a itemului? 2. De ce este necesar analiza cantitativ a itemului ?
Preferinele subiectului
1. Ce este, de fapt, itemul unui test ? 2. Ce forme alternative exist pentru itemi i analiza de itemi ? 3. Ce efecte poate avea scurtarea lungimii unui test ? 4. Ce efecte poate avea mrirea dimensiunii testului ? 5. Ci itemi poate avea un test? 6. De cine depinde numrul itemilor ? 7. Cum se poate construi un nou test ? 8. n ce const analiza cantitativ a itemilor ? 9. n ce const analiza calitativ a itemilor ? 10. Ce tipuri de index pot fi calculate ? 11. Cum se poate asigura feed-back-ul pentru constructorul de test referitor la aspectele calitative ale noului test ? 12. De ce este bine ca, atunci cnd verificm aspectele calitative ale unui test nou, s pstrm confidenialitatea rspunsurilor ? BIBLIOGRAFIE: 1. COHEN, J.R., Swerdlik, E.M. (2005). Psychological Tesing and Assessment.An Introduction to Tests and Measurement. McGraw-Hill International Edition. 2. CLINCIU, A. I. (2005). Psihodiagnostic. Braov: Ed. Universitii Tansilvania. 3. FRIEDENBERG, L. (1995). Psychological testing. Design, Analysis, and use. Allyn & Bacon. 4. KAPLAN, M.R., SACCUZZO, P.D. (2005). Psychological Testing. Principles, Applications, and Issues. Thomson Wadsworth. 5. MINULESCU, M. (2003). Teorie i practic n psihodiagnoz. Testarea intelectului. Bucureti: Editura Fundaiei Romnia de Mine.
87
NICOLAE MITROFAN
6. STAN, A. (2002). Testul psihologic.Evoluie, construcie, aplicaii. Iai: Polirom.
88
NICOLAE MITROFAN
Unitatea de nvare nr. 2 Gradul de dificultate al itemului Cuprins: 1. La ce se refer gradul de dificultate al itemului ? 2. Cum se calculeaz dificultatea itemului Obiective: La sfritul acestei uniti de nvare studenii vor fi capabili s: explice n ce const gradul de dificultate al unui item; cunoasc ce se ntmpl n cazul n care itemii sunt foarte uori sau foarte dificili; neleag de ce valoarea cea mai bun a nivelului de dificultate este p = 0,50; poat calcula nivelul de dificultate al unui item i, respectiv, al unui test 1. La ce se refer gradul de dificultate al unui item ? Trebuie s recunoatem c ntrebarea nu este prea dificil. Un rspuns l putem oferi imediat, adic se pune problema ct de greu sau ct de uor este itemul pentru subieci. Da, dar subiecii sunt destul de diferii n ceea ce privete nsuirea sau trstura psihic pe care vrea s o msoare testul. i testul tocmai asta urmrete i anume, s scoat n eviden diferenele interindividuale. Un item poate fi dificil datorit faptului c niciunul dintre subiecii pe care se aplic nu l poate rezolva. Iat, de exemplu, dac ne-am adresa cu un test unui grup de 100 de studeni la psihologie, din care face parte un item de genul: Ct fac 456.932 x 297465 ? n mod sigur nu va putea rspunde nimeni corect, ceea ce nseamn c itemul este foarte dificil. n acest caz, p = 0, p nsemnnd procentul celor care rspund la test. Dar dac, n cadrul testului, exist i un item de genul Ct fac 4 x 2 ? Evident c, n acest caz, toi studenii vor rspunde correct, deoarece la o asemenea ntrebare rspund corect i elevi din ciclul primar. Aici p = 100 i asta nseamn c toi subiecii rspund correct. n ambele cazuri, itemii sunt nefolositori, deoarece ei nu ne ofer niciun fel de informaie referitoare la deprinderile de calcul ale subiecilor. S presupunem acum c, n caz de aplicare a testului, avem un item la care rspund corect doar 10 subieci (caz n care p = 10). Acest item prezint un nivel nalt de dificultate. i n cazul n care ar rspunde 90 de subieci, itemul ar avea un nivel redus de dificultate. Dac avem n vedere mijlocul scalei, respectiv, p = 50, cu ct valoarea lui p va crete, cu att nivelul de dificultate al itemului va scdea i, invers, cu ct valoarea lui p va fi mai mic, cu
89
NICOLAE MITROFAN
att nivelul de dificultate al itemului va crete. Deci, ar rezulta, chiar i la o analiz mai superficial, c valoarea optim a nivelului de dificultate al unui item este 0.50. Dar pot fi aduse dovezi mai serioase. Astfel, dac la un test aplicat pe 100 de subieci, reuesc 50 dintre ei, nseamn c, firesc, ceilali 50 nu reuesc. n felul acesta, putem s comparam pe fiecare subiect din grupul de 50, care au reuit la item, cu fiecare dintre cei 50 de subieci care nu au reuit la item. Avem, astfel, 50 x 50 sau 2500 comparaii perechi sau bii ai informaiei difereniale (Anastasi, A., 1988). Oricare alt combinaie nu conduce la o asemenea valoare. Pentru mai mult siguran verificai tabelul de mai jos: __________________ 0 x 100 = 0 10 x 90 = 900 20 x 80 = 1600 30 x 70 = 2100 40 x 60 = 2400 50 x 50 = 2500 60 x 40 = 2400 70 x 30 = 2100 80 x 20 = 1600 90 x 10 = 900 100 x 0 = 0 ___________________ Tem de reflecie/autoevaluare Alctuii un test care s cuprind mai muli itemi, fiecare dintre ei avnd un nivel de dificultate diferit, dar, pe ansamblu, nivelul de dificultate al testului s fie 0,50.
2. Cum se calculeaz dificultatea itemului. Analiznd tabelul de mai sus, am putea trage o concluzie foarte simpl i anume, testul cel mai bun este cel care este trecut de 50 % dintre subieci, adic fiecare dintre itemii si are nivelul de dificultate, p = 50. A. Anastasi recomand, ns, ca s fie selectai itemii cu nivele de dificultate diferite dar a cror medie a dificultii s fie 0,50. Totodat, aceast autoare vorbete de utilitatea unor scale de interval pentru determinarea nivelului de dificultate al unui item (Anastasi, A., 1988, 1996). Dac presupunem o distribuie normal a unei trsturi psihice msurat de un anumit item, nivelul de dificultate al itemului poate fi exprimat n funcie de o scal cu uniti de interval egale prin referirea la o tabl a frecvenelor curbei normale. tim c aproximativ 34% din cazuri ntr-o distribuie normal cad ntre medie i distana de 1 n oricare direcie. Dac, de exemplu, un item a fost trecut de 84% dintre subieci, nseamn c acest procent cuprinde 50% din partea superioar a distribuiei i 34% din partea inferioar a acesteia. Deci, n concluzie, acest item cade n 1 sub medie.
90
NICOLAE MITROFAN
Un item trecut de 16% din cazuri va cdea n 1 deasupra mediei, pentru c, deasupra acestui punct, exist 16% sin cazuri (50 34 = 16). Iar un item la care au reuit 50% din cazuri, cade exact pe medie i ar avea, astfel, valoarea 0 pe aceast scal. Deoarece dificultatea itemului exprimat n funcie de curba normal, ce presupune deviaia standard ca distan, implic valori negative i zecimale, ele sunt convertite ntr-o scal uor de mnuit i care este desemnat prin litera greceasc delta . Relaia dintre i curba normal distanele (valori z) este urmtoarea: = 13 + 4z n aceast formul 13 i 4 sunt constante alese pentru a oferi o scal care s elimine valorile negative i zecimalele. Un item trecut de aproape 100% din subieci (99,87%), cznd n - 3, ar avea o valoare a lui = 1 (aa cum reiese din formul: 13 + (4)(-3) = 1) La cealalt extrem, un item care a fost trecut de mai puin de 1% din subieci (0,13%), ar cdea n + 3 i ar avea valoarea lui = 25 (aa cum apare din formul: 13 + (4) (3) = 25). i, n sfrit, un item ce ar cdea pe medie va avea valoarea lui = 0 (aa cum reiese din formul: 13 + (4) (0) = 25. Se poate trage concluzia c este o scal n care, practic, toi itemii cad, n ceea ce privete nivelul de dificultate, ntre valorile 1 i 25, cu o medie = 13. Referitor la calcularea nivelului de dificultate al unui item mai este o problem extrem de important. La un item se poate rspunde corect i din ntmplare sau, cum se mai spune mai simplu, ghicind rspunsul. De exemplu, dac la un item se rspunde dihotomic, prin Da sau Nu, Adevrat sau Fals, subiectul poate ghici 50 % din rspunsurile corecte. Sau, dac la un item, exist 4 variante de rspuns, printre care i cel correct, subiectul poate ghici rspunsul corect n procent de 25%. Nivelul de dificultate optim al itemilor se afl la jumtatea diferenei dintre numrul maxim de subieci ce rspund correct (100%) i nivelul reuitei bazat numai pe ans (noroc). Astfel, nivelul optim de dificultate al unui item prevzut cu patru variante de rspuns, printre care i cel corect este de aproximativ 0,625: Pentru a se ajunge la aceast valoare, se parcurg urmtorii pai (Kaplan, M.R., Saccuzzo, P.D., 2005): 1. Gsii jumtate din diferena dintre 100% succes i performana pe baz de ans 100 - 0,25 0,75 --------------- = ----- = 0,375 2 2 2. Adugai aceast valoare probabilitii de a obine rspunsul corect pe baz de ans 0,375 + 0,25 = 0,625 O metod mai simpl pentru obinerea aceluiai rezultat este de a aduga 1,00 la probabilitatea de a reui pe baz de ans i apoi de a divide la 2. Astfel: 1,00 + 0,25 ----------------- = 0,625
Tem de reflecie/autoevaluare:
91
NICOLAE MITROFAN
Pentru un item exist dou variante de rspuns. Avnd n vedere probabilitatea de a raspunde corect pe baz de ans, care ar trebui s fie nivelul de dificultate al acestui item ?
1. Ce nseamn c un item este prea dificil ? 2. Ce i se poate imputa unui asemenea item ? 3. Ce nseamn c un item este prea uor ? 4. Ce i se poate imputa unui asemenea item ? 5. Cum se poate pune n eviden nivelul de dificultate al unui item ? 6. Care este valoarea optim a nivelului de dificultate al unui item ? 7. La ce se refer sintagma bii ai informaiei difereniale ? 8. Care este utilitatea unei scale de interval ? 9. Care sunt principalele valori ale unei scale de interval ? 10. Care sunt paii ce trebuie parcuri pentru a calcula exact nivelul de dificultate al unui item ?
BIBLIOGRAFIE: 1. ALBU, M. (1998). Construirea i utilizarea testelor psihologice. Cluj: Editura Clusium. 2. ALBU, M., PITARIU, H. (1993). Proiectarea testelor de cunotine i examenul asistat de calculator. Cluj-Napoca: Editura Casa crii de tiin. 3. COHEN, J.R., SWERDLIK, E.M. (2005). Psychological Testing and Assessment. An Introduction to Tests and Measurement. McGraw-Hill International Edition. 4. CLINCIU, A.I. (2005). Psihodiagnostic. Braov: Ed. Universitii Transilvania 5. FRIEDENBERG, L. (1995). Psychological Testing. Design, Analzsis, and use. Allyn & Bacon. 6. KAPLAN, M.R., SACCUZZO, P.D. (2005). Psychological Testing. Principles, Applications, and Issues. Thomson Wadsworth. 7. MINULESCU, M. (2003). Teorie i practic n psihodiagnoz. Testarea intelectului. Bucureti: Editura Fundaiei Romnia de Mine. 8. STAN, A. (2002). Testul psihologic.Evoluie, consatrucie, aplicaii. Iai: Polirom.
92
NICOLAE MITROFAN
Unitatea de nvare nr. 3 Capacitatea de discriminare a itemului Cuprins: 1. Ce este analiza discriminrii itemului ? 2. Cum se calculeaz indexul de discriminare al itemului Obiective: La sfritul acestei uniti de nvare, studenii vor fi capabili s: cunoasc n ce const capacitatea de discriminare a itemului; neleag ce legturi exist cu nivelul de dificultate al itemului; cunoasc modalitile de calcul a indexului de discriminare a itemului poat exemplifica uor 1. Ce este analiza discriminrii itemului ? Dac nivelul de dificultate al unui item arat ct de uor sau ct de dificil este un item, nivelul de discriminare arat n ce msur subiecii, care obin rezultate bune la ntregul test, reuesc i la acest item i, pe de alt parte, n ce msur subiecii, care obin rezultate slabe la ntregul test, nu reuesc la acest item. Dup cum deja tii, fiecare test msoar o anumit nsuire sau caracteristic psihic i fiecare item din structura sa trebuie s msoare acelai lucru. Deci, la subiecii care obin scoruri mari la ntregul test, nseamn c la ei nivelul de dezvoltare i de funcionalitate al acelei nsuiri sau capaciti psihice este foarte nalt. Iar la subiecii care obin scoruri mici la ntregul test, acest nivel este sczut. Aceast difereniere o vor realiza i itemii, deoarece fiecare dintre ei msoar acelai lucru precum testul luat n ntregul su. Deci, pentru cei care au un nivel ridicat de dezvoltare i de funcionalitate al unei nsuiri sau capaciti psihice scorurile la ntregul test vor fi mari i ei vor reui, n general, i la itemii testului. Invers, la subiecii la care nivelul de dezvoltare i de funcionalitate al aceleiai nsuiri sau capaciti psihice supuse msurrii este redus, vom regri scoruri slabe la ntregul test i eecuri la itemii ce l alctuiesc. i, dac tot nu s-a neles, s apelm la o comparaie, care, desigur, este contraindicat. Cntrim o persoan cu un cntar mare i vedem c are 100 de kg. Apoi l cntrim cu mai multe cntare mici. Vom constata c persoana respectiv va avea tot 100 de kg. Rugm o alt persoan s accepte s fie cntrit i constatm c va avea 40 de kg. Apoi, folosind mai multe cntare mici, o s vedem c persoana respectiv va avea tot 40 de kg. Deci i cntarul mare i cntarele mici au capacitatea de a discrimina persoanele n funcie de greutate. Revenind la test, n cazul n care un test este foarte bine construit, subiectul bun, dotat, va avea un scor mare la test i va reui la toi itemii iar un subiect slab, nedotat, va avea un scor foarte slab la test i nu va reui aproape la toi itemii. Testul, ns, aa dup cum am spus de attea ori, prezint anumite imperfeciuni, care, se rsfrng, desigur, i asupra unor itemi. De aceea, practic, nu ntlnim situaia n care toi subiecii buni s rspund corect la toi itemii i subiecii slabi s nu rspund corect la niciun item. Pe de alt
93
NICOLAE MITROFAN
parte, nici subiecii buni i nici subiecii slabi nu au exact acelai nivel de dezvoltare al nsuirii sau capacitii psihice supuse msurrii. De aceea, testul trebuie s evidenieze ct mai exact posibil acest nivel de dezvoltare. i atunci, subiecii, dei se afl ntr-un anumit registru de dezvoltare al nsuirii sau capacitii psihice respective (nalt sau sczut), vor trebui s fie i ei difereniai sau, ca s fim consecveni cu terminologia, discriminai. Aceasta nseamn c cei buni, dar nu exceleni, vor mai grei la unii itemi i, pe de alt parte, cei slabi, dar nu extrem de slabi, vor reui la unii itemi. Pot s apar i anumite paradoxuri. Cei foarte buni s nu reueasc la un anumit item i cei slabi s reueasc la acesta. Putem nelege uor c, n asemenea cazuri, este ceva n neregul cu itemii respectivi, ceea ce ne oblig la o reevaluare a acestora. Ei nu pot s rmn aa cum sunt n structura testului, deoarece s-ar putea ca ei s msoare ceva ce nu are legtur cu testul din care fac parte. Tem de reflecie/autoevaluare: Nivelul de dificultate optim al unui item este 0,50. Ce putem spune n legtur cu capacitatea lui de discriminare?
2. Indexul de discriminare al itemului n practic exist foarte multe proceduri ce pot fi folosite pentru calcularea indexului de discriminare al itemului. Cea mai frecvent utilizat este cea care ia n atenie 3 grupe de subieci, care, la rndul lor, alctuiesc numrul total al subiecilor ce rspund la un test (N): a) grupul celor care au obinut rspunsuri bune la test; b) grupul celor care au obinut rspunsuri mediocre la test; c) grupul celor care au obinut rezultate slabe la test. Primul grup poate fi notat cu U (de la Upper), al doilea, cu M (de la Middle) i, al treilea, cu L (de la Lower). Dup ali autori, ns, este suficient s lum n atenie numai grupul subiecilor care au rspuns mai bine la test (U) i grupul subiecilor care au obinut rezultate slabe la test (L). n acest caz se vorbete de metoda grupelor extreme (Friedenberg, L., 1995) i ea este utilizat cel mai frecvent pe testele de abiliti, testele de personalitate, testele de interese i testele de atitudini. S lum, mai nti, un exemplu oferit de A. Anastasi (1988, 1996). n urma aplicrii unui test unui grup de 60 de studeni, i mprim, n funcie de rezultate, n cele 3 grupuri, fiecare cuprinznd cte 20 de studeni, respectiv, 33%. (Trebuie s menionm, n aceast parantez c, dup ali autori, procentul subiecilor ce aparin grupelor U i L poate fi 25% sau 27%. n aceast privin, n 1979, Allen, M.J. i Yen W.M., apud, Cohen, J.R., Swerdlik, E.M., 2005, ne asigur c, pentru cele mai multe aplicaii, orice procentaj ntre 25 i 27 va produce estimri similare). Apoi nregistrm rspunsurile corecte pentru fiecare item oferite de ctre studenii ce aparin celor trei grupe. Se alctuiete un tabel n felul urmtor: Item 1 2 U 15 20 M 9 20 L 7 16 Dificultate U+M+L 31 56* Discriminare U - L 8 4
94
NICOLAE MITROFAN
3 4 5 6 7
19 10 11 16 5
18 11 13 14 0
9 16 11 9 0
46 37 35 39 5*
10 - 6* 0* 7 5
n acest tabel sunt prezentate rezultatele pentru numai 7 itemi din cadrul testului. Dup cum se poate observa, nivelul de dificultate al itemului se afl nsumnd numrul subiecilor din cele 3 grupe care rspund corect la toi itemii. Pe de alt parte, valoarea discriminativ a fiecrui item poate fi aflat fcnd diferena dintre numrul subiecilor care rspund corect n grupul U i numrul subiecilor care rspund corect n grupul L. Itemii ce prezint probleme sunt cei care sunt prevzui cu stelu. Astfel, itemii 2 i 7 fac not discordant fa de ceilali itemi, n sensul c itemul 2 este prea uor (56 de subieci rspund corect) iar itemul 7 este prea greu (numai 5 subieci rspund corect). n ultima coloan itemii 4 i 5 prezint probleme, n sensul c, dei satisfctori n ceea ce privete nivelul de dificultate, itemul 4 prezint o valoare discriminativ negativ iar itemul 5 prezint o valoare discriminativ egal cu zero. Aceti itemi nu pot s rmn aa n structura testului existent sau nou construit, deoarece ei, practic, nu prezint niciun fel de utilitate. Este clar c trebuie s fie supui unor serioase aciuni de analiz i evaluare sau, pur i simplu, pot fi scoi definitiv din componena testului. A. Anastasi arat c, n cazul n care numrul subiecilor care reuesc la fiecare item din grupele U i L este exprimat n procente, indexul discriminrii poate fi calculat prin diferena dintre cele dou procentaje, precum n tabelul urmtor: Item 1 2 3 4 5 6 7 Procent reuit U grup 75 100 95 50 55 80 25 Procent reuit L grup 35 80 45 80 55 45 0 Indicele discriminrii U - L 40 20 50 - 30* 0* 35 25
Dup cum se poate observa din tabel, aceeai itemi prezint probleme, respectiv itemii 4 i 5. Acetia trebuie s fie renalizai pentru a se vedea dac mai rmn n structura testului. Deci i n cazul procentajului diferena dintre U i L constituie valoarea indexului discriminrii pentru fiecare item. Acesta poate fi evideniat n mai multe forme, precum: UL, ULI, ULD, D sau d. Analiznd datele din ambele tabele de mai sus, constatm c, n afar de itemii care ridic probleme privind valoarea lor discriminativ, pentru ceilali itemi valorile sunt diferite, de aceea apare ntrebarea care dintre ele este cea mai bun ? Referitor la metoda utilizrii procentajelor, R.L. Ebel (apud Stan, A., 2002) a propus, n 1965, o scal de repere pentru interpretarea valoric a indicelui de discriminare D: ___________________________________________________________ 95
NICOLAE MITROFAN
Interval valoric al lui D Interpretarea discriminrii ___________________________________________________________ 0,40 i mai mult discriminare foarte bun de la 0,30 la 0,39 discriminare bun de la 0,20 la 0,29 discriminare slab de la 0,10 la 0,19 discriminare de limit sub 0,10 fr utilitate ___________________________________________________________ Atunci, ns, cnd se folosete metoda efecturii diferenei dintre numrul rspunsurilor corecte oferite de subiecii ce aparin celor dou grupe, unii autori (Anastasi, A., 1988, 1996) fac urmtoarele precizri: a) itemii cu valoare discriminativ sczut sunt cei care au o valoare a diferenei de la 3 n jos (diferena dintre U i L) i asta cnd grupurile comparate au aceeai dimensiune; b) cu ct grupurile sunt mai mari, ne ateptm ca s apar diferene mai mari, datorate ansei legate de un item nediscriminativ. Pentru a nelege i mai bine utilitatea calculrii valorii indexului discriminrii itemului vom lua i un alt exemplu (Cohen, J.R., Sewrdlik, E.M., 2005). A fost aplicat un test de cunotine pe un numr de 119 studeni. n urma rezultatelor obinute au fost alctuite cele dou grupe, U i L, fiecare dintre ele cuprinznd 27%, respectiv, 32 de studeni. O secven viznd primii 5 itemi este prezentat n tabelul de mai jos. Item U L UL n d = U - L/n _____________________________________________________ 1 20 16 4 32 0,13 2 30 10 20 32 0,63 3 32 0 32 32 1,00 4 20 20 0 32 0,00 5 0 32 -32 32 - 1.00 _____________________________________________________ n primul rnd trebuie menionat faptul c valoarea indicelui discriminprii testului se ntinde ntre 1,00 i + 1,00. Valoarea de 1,00 indic faptul c toi subiecii ce aparin grupului U nu reuesc la test i toi subiecii care aparin grupului L reuesc la test. Este o situaie paradoxal ce solicit de urgen revizia sau eliminarea itemului din cadrul testului. Valoarea de + 1,00 arat c toi subiecii ce aparin grupului U reuesc la test i toi subiecii care aparin grupului U nu reuesc la test. Cnd o aceeai proporie a reuitei o regsim la ambele grupe (U i L) valoarea discriminativ a testului este egal cu zero. n acest caz itemul nu discrimineaz deloc ntre subieci, de aceea este inutil. Din aceste exemple reiese clar faptul c exist o strns legtur ntre nivelul de dificultate al itemului i capacitatea lui de discriminare. A. Anastasi (1988, 1996), ne ofer un tabel care evideniaz relaia dintre nivelul de dificultate al itemului i valoarea maxim a indexului discriminrii. ___________________________________________________ Procentul subiecilor Valoarea maxim ce reuesc la item a lui D ____________________________________________________
96
NICOLAE MITROFAN
100 0 90 20 80 40 70 60 60 80 50 100 40 80 30 60 20 40 10 20 0 0 _____________________________________________________ Cum de apar asemenea valori ale lui D ? Cnd toi subiecii din grupul U reuesc la item (50/50 = 100%) i toi subiecii din grupul L reuesc la acest item (0/50 = 0), atunci valoarea lui D (U L) = 0. Cnd niciun subiect din grupul U (0/50 = 0) i niciun subiect din grupul L (0/50 = L) nu reuete la un item, atunci valoarea lui D este tot 0. Cnd toi subiecii din grupul U (50/50 = 100%) i niciun subiect din grupul L (0/50 = 0 %) atunci valoarea lui D = 100. i aceasta este cea mai mare valoare a lui D. Dac reuesc la item 90 % din subieci, asta nseamn c au reuit toi din grupul U (50/50 = 100%) i 40 din grupul L (40/50 = 80%). n consecin, valoarea lui D (U L) va fi 20. Dac reuesc la item 80% din subieci, asta nseamn c toi subiecii din grupul U (50/50 = 100%) i numai 30 (30/50 = 60) din grupul L reuesc la item. Fcnd diferena vom constata c valoarea lui D = 40. .a.m.d. Teme de reflecie/autoevaluare: 1. Care este explicaia situaiei n care valoarea lui D (indicele de discriminare al itemului) este negativ ? 2. De ce itemul al crui nivel de dificultate este 0,50 are cea mai mare valoare a indicelui de discriminare ?
ntrebri de autoevaluare: 1. Ce este analiza discriminrii itemului ? 2. Ce proceduri de calculare a indexului discriminrii cunoatei ? 3. Care este procedura recomandat de A. Anastasi ? 4. n ce const metoda grupurilor extreme ? 5. Care este procentul subiecilor din grupurile U i L recomandat de autori ? 6. Ce trebuie fcut cu itemii ai cror valoare discriminativ este foarte sczut ? 7. Care sunt simbolurile recomandate pentru indexul discriminrii itemului ? 8. Care este opinia lui R.L. Ebel privind intervalul valoric al lui D ? 9. Dar a lui A. Anastasi ? 10. Explicai ce se ntmpl atunci cnd valoarea lui D este 1,00 i + 1,00
BIBLIOGRAFIE:
97
NICOLAE MITROFAN
1. ALBU, M. (1998). Construirea i utilizarea testelor psihologice. Cluj: Editura Clusium. 2. ALBU, M., PITARIU, H. (1993). Proiectarea testelor de cunotine i examenul asistat de calculator. Cluj-Napoca: Editura Casa crii de tiin. 3. COHEN, J.R., SWERDLIK, E.M. (2005). Psychological Testing and Assessment. An Introduction to Tests and Measurement. McGraw-Hill International Edition. 4. CLINCIU, A.I. (2005). Psihodiagnostic. Braov: Ed. Universitii Transilvania 5. FRIEDENBERG, L. (1995). Psychological Testing. Design, Analysis, and use. Allyn & Bacon. 6. KAPLAN, M.R., SACCUZZO, P.D. (2005). Psychological Testing. Principles, Applications, and Issues. Thomson Wadsworth. 7. MINULESCU, M. (2003). Teorie i practic n psihodiagnoz. Testarea intelectului. Bucureti: Editura Fundaiei Romnia de Mine. 9. STAN, A. (2002). Testul psihologic.Evoluie, consatrucie, aplicaii. Iai: Polirom.
98
NICOLAE MITROFAN
MODULUL V ETALONAREA I STANDARDIZAREA TESTELOR Unitatea de nvare nr. 1 Etapele etalonrii i standardizrii testelor Cuprins: 1. Definirea conceptelor i etapele construirii testelor 2. Modele de scale utilizate n etalonare i standardizare Obiective: La sfritul acestei uniti de nvare studenii vor fi capabili s: defineasc corect concepte precum: construcia testului, etalonare, standardizare; precizeze care sunt etapele parcurse n vederea etalonrii unor noi teste; difereneze ntre aciunea de etalonare i cea de reetalonare a testelor; neleag bine ce nseamn reprezentaivitatea eantionului.
1. conceptelor
Definirea
De ce trebuie s fie testele etalonate i standardizate ? S presupunem c vom construi un nou test de inteligen pentru studenii din Romnia i numai un singur student nu l includem n lot. Toate rezultatele obinute le vom grupa n mai multe clase sau categorii, plecnd de la cele mai bune i ajungnd la cele mai slabe. Desigur, vor exista muli studeni care vor obine acelai rezultat, de aceea trebuie s lum n consideraie i frecvena rspunsurilor. Deci se face un fel de clasament, pe primele locuri fiind rezultatele cele mai bune i, pe ultimile locuri, rezultatele cele mai slabe. Singurului subiect care nu a fost inclus n lot i aplicm noul test de inteligen creat i, apoi, rezultatul pe care l obine l raportm la clasamentul rezultatelor obinute de toi subiecii inclui n lot. Vom vedea dac studentul respectiv se plaseaz pe o poziie mai spre vrful clasamentului, mai spre mijloc sau mai spre baza acestuia. Deci comparm rezultatul subiectului cu rezultatele ntregului lot. Pornind de la acest exemplu, trebuie s deosebim ntre situaia n care un test deja exist i cea n care se construiete un test nou. Pentru testul deja existent nu se pune problema etalonrii lui, presupunnd c exist un etalon, ci, eventual, a reetalonrii lui, n cazul n care etalonul nu mai corespunde. De asemenea, dac testul provine din alt ar, dei el are un etalon (n limba englez se folosete termenul de norme norms - n loc de etalon), trebuie s fie re-etalonat, trecnd, mai nti, prin faza traducerii i adaptrii. De aici putem trage concluzia conform creia construirea unui test nou presupune automat i etalonarea lui ns etalonarea nu presupune automat i construirea testului, deoarece acesta poate exista deja (construit de alii) sau este luat din alt parte.
99
NICOLAE MITROFAN
O alt noiune care trebuie s o lum n atenie este cea de revizie a testelor. Mai nti, s dm exemple. Bateria Stanford-Binet, care actualmente, este folosit sub denumirea de Stanford-Binet Intelligence Scale (fifth edition) a trecut prin urmtoarele etape de revizuire: 1905 Scala de inteligen a lui A. Binet i T. Simon; 1908 prima revizie a Scalei de inteligen Binet-Simon; 1911 a doua revizie a Scalei de inteligen Binet-Simon; 1916 apare versiunea Stanford-Binet Intelligence Scale, sub ngrijirea lui L. Terman; 1937 prima revizie a variantei lui Terman; 1960 a doua revizie; 1972 - a treia revizie; 1985 a patra revizie (sub ndrumarea lui R.L. Thorndike, E. Hagen i J. Sattler); 2003 a cincea revizie, sub ndrumarea lui G. Roid. Bateria WAIS III, respectiv, Scala de inteligen a lui Wechsler pentru aduli a parcurs, de asemenea, mai multe etape de revizie. Prima variant a aprut n anul 1939, sub denumirea Wechsler-Bellevue Intelligence Scale I. A doua a aprut n 1942, sub denumirea de The Army Wechsler iar a treia, n 1946, sub denumirea Wechsler Bellvue Intelligence Scale II. n 1955 apare, de fapt, prima variant a Scalei Wechsler de inteligen pentru aduli (WAIS). Aceast variant este revizuit n 1981, devenind, WAIS R i, apoi, din nou, n 1997, variant care exist i n prezent, cunoscut sub denumirea WAIS III (Scala de inteligen Wechsler pentru aduli III). Revizia este o aciune foarte ampl, care poate dura mult timp (de exemplu, revizia Bateriei Stanford-Binet, fourth edition, a durat ntre 6 i 8 ani) i ea presupune re-analizarea i re-evaluarea testului din mai multe puncte de vedere: coninut, norme, direcii de administrare i cotare etc. Prile testului care sunt mai sensibile la schimbare sunt cele ce presupun folosirea limbajului. Un test preluat din America, de exemplu, trebuie tradus i adaptat, deoarece acesta poate cuprinde informaii care nu sunt specifice i nu sunt cunoscute de ctre populaia romneasc. Astfel, sunt unele aspecte legate de istorie, de literatur, de obiceiuri, de tradiii, de preocupri etc. De exemplu, fotbalul american este un sport foarte dur, foarte agresiv fa de fotbalul european. Deci, rspunsul pozitiv la ntrebarea i place fotbalul ? nseamn cu totul altceva pentru un subiect romn dect pentru un subiect american. Sau dac unii itemi presupun operarea cu sistemul de msurare american, pentru subiecii romni trebuie neaprat s fie transpus n sistemul de msurare folosit n Romnia. La ntrebarea Cnd se impune revizuirea unui test ? putem apela la sugestiile fcute de Asociaia Psihologilor Americani APA (1996, Standard 3.18): un test poate fi meninut n forma actual atta timp ct este folositor i el trebuie s fie revizuit atunci cnd apar schimbri semnificative n domeniul reprezentat sau cnd condiiile noi pentru utilizare i interpretare fac testul s fie nepotrivit pentru ceea ce intenioneaz s msoare. n opinia altor autori ns, testele trebuie s fie revizuite atunci cnd exist oricare din urmtoarele condiii (Cohen, R.J., Swerdlik, E.M., 2005): 1. Materialele stimul par a fi demodate i subiecii nu se pot raporta la ele; 2. Coninutul verbal al testului, incluznd instruciunile pentru administrare i itemii testului, conin un vocabular depit, care nu este imediat neles de ctre subieci; 3. ntruct cultura popular se schimb i cuvintele capt noi nelesuri, anumite cuvinte sau expresii din coninutul itemilor sau din direciile de administrare pot fi percepute ca nepotrivite sau chiar ofensatorii pentru un anumit grup particular, de aceea ele trebuie s fie schimbate; 4. Normele testului nu mai sunt adecvate datorit schimbrilor n populaia subiecilor poteniali;
100
NICOLAE MITROFAN
5. Normele testului nu mai sunt adecvate datorit schimbrilor pe linia abilitilor msurate i datorit extinderii lor (n sus sau n jos) dac acest lucru devine necesar; 6. Fidelitatea sau validitatea testului, precum i eficacitatea itemilor individuali, pot fi semnificativ mbuntite printr-o revizie. 7. Teoria ce a stat la baza testului original a fost mbuntit semnificativ i schimbrile trebuie s fie reflectate n design-ul i coninutul testului. Privitor la elaborarea i construirea unui test nou, trebuie s precizm faptul c este obligatoriu s fie parcurse mai multe etape: 1. Analiza ct mai corect, ct mai clar a constructului, a nsuirii sau caracteristicii psihice care urmeaz a fi testat cu instrumentul psihodiagnostic nou. Trebuie definit foarte clar conceptul i, apoi, operaionalizat, adic descris din perspectiv comportamental, actele comportamentale fiind evaluabile i msurabile. Trebuie rspuns, ct mai clar, la ntrebri de genul: - ce nseamn a fi sau a nu fi inteligent ? ce nseamn a fi sau a nu fi anxios ? ce nseamn a avea sa a nu avea memorie logic ? ce nseamn a fi sau a nu fi sociabil ? Am mai vorbit despre asta, dac v mai amintii, la validitatea privitoare la construct. 2. Imaginarea modalitilor de simulare a situaiilor reale n raport cu care subiectul i exteriorizeaz i i obiectiveaz capacitile, trsturile sale psihice. n aceast privin, un rol foarte important l are imaginaia constructorului de test. El trebuie s dea dovad de inventivitate i ingeniozitate. Uneori testele impresioneaz prin forma extrem de original a itemilor, ns numai aceasta nu asigur automat i o bun fidelitate i validitate a testului. De aceea, constructorul de test nu trebuie s acorde mai mare importan formei itemilor, n detrimentul caracteristicilor psihometrice ale testelor. Elaborarea testului presupune, de altfel, respectarea mai multor cerine i anume: a) alegerea, selectarea materialului utilizat n cadrul testului (cuvinte, propoziii, numere, figuri, expresii, cuburi, analogii, situaii problematice, ntrebri, evaluri, autoevaluri etc.); b) formularea instructajului i a exemplelor pentru familiarizarea subiecilor cu principiul de construcie al itemilor testului; c) precizarea tipului de rspuns (un singur rspuns, mai multe rspunsuri la alegere, sarcin de executat, rezolvarea problemei, exerciiu logic etc.; d) elaborarea foii de rspuns, care trebuie s fie folosit numai n form original; e) precizarea modului de cotare (puncte, procente, calificative), precum i a grilelor ce pot fi folosite; f) precizarea, dac este necesar, a timpului ct s dureze testarea, precum i a faptului dac este vorba despre un test individual sau test colectiv; 3. Odat construit, testul nou se aplic n forma unei probe oarbe pe un eantion mai mic, deoarece este o prim verificare a acestuia. Se acord atenie unor probleme precum: nivelul de dificultate al itemilor, capacitatea lor de discriminare, dimensiunea testului, dac este bine formulat i dac este suficient instructajul, reaciile subiectului la test etc.). n funcie de rezultate, se fac modificrile necesare; 4. Etalonarea, etap ce vizeaz utilizarea unui ansamblu de procedee statistice pe baza crora pot fi difereniai i clasificai subiecii inclui n eantionul folosit n funcie de rezultatele lor obinute la un anumit test. n urma unor calcule statistice (trebuie s recunoatem c, actualmente, acestea se pot realiza uor folosind calculatorul) rezultatele obinute de membrii eantionului sunt grupate n forma unor norme sau etaloane, care, ulterior, sunt folosite drept cadre de referin la care raportm rezultatele unui anumit subiect.
101
NICOLAE MITROFAN
n alegerea eantionului trebuie s respectm cteva cerine obligatorii, mai importante fiind dou: a) reprezentativitatea eantionului; un eantion este reprezentativ atunci cnd el reflect fidel caracteristicile populaiei de referin. Fiecare membru al eantionului reprezint un subgrup din populaia de referin. Procedeele de selectare a eantionului sunt mai multe, cum ar fi, de exemplu, pasul statistic, alegerea la ntmplare etc. Deci eantionul este o fraciune din populaia de referin. De exemplu, dac noi construim un test de inteligen pentru elevii de liceu (populaia de referin), putem s-l aplicm n vederea elaborrii normelor (etalonului) pe un grup mult mai restrns (eantionul), care ns trebuie s fie reprezentativ pentru toat populaia de referin. Dac numrul real al elevilor de liceu este 1.000.000, eantionul reprezentativ, stabilit n baza pasului statistic (1/1000), ar cuprinde 1000 de elevi. Este ca i cum am realiza o coloan de 1.000.000 de elevi i apoi i selectm pe cei de pe poziiile 1, 1001, 2001, 3001, 4001 .a.m.d. Fiecare membru al eantionului reprezint cte 1000 de elevi din populaia de referin; b) eantionul trebuie s fie eterogen n ceea ce privete nsuirea sau caracteristica psihic msurat i, pe de alt parte, s fie ct mai omogen posibil referitor la alte variabile, n afara celei testate, cum ar fi: vrsta, sexul, pregtire socio-profesional, nivel socio-cultural etc. Revenind la exemplul de mai sus, eantionul ar trebui s cuprind 500 de fete i 500 de biei, cte 250 de elevi pentru fiecare an al ciclului liceal i, de asemenea, membrii eantionului trebuie s provin din toate profilele liceelor din ar.
Teme de reflecie/ autoevaluare: 1. Care ar fi consecinele, n cazul n care eantionul ar cuprinde elevii numai dintr-o anumit zon geografic a rii ? 2. Care ar fi consecinele, n cazul n care eantionul ar cuprinde elevi numai de la un anumit profil liceal ? 2. Modele de scale folosite n etalonare i standardizare Cotele brute (raw score) nu spun nimic n sine, cel mult ele pot fi raportate la media grupului de referin. Notele la tez la un anumit obiect de nvmnt la o anumit clas aparin practic, tuturor nivelelor, adic vor fi de la 4 (notele sub 4 nseamn acelai lucru, adic tot czut) la 10. La fel se vor ntmpla lucrurile i la o alt clas, de la un liceu dintr-o alt localitate. Vom putea spune c, n interiorul acestei clase, elevul Ionescu a obinut o not mai mare dect elevul Popescu (primul a obinut 9 i al doilea, 7). n cealalt clas, va fi, de asemenea, un elev, s-i spunem Albu, care va obine nota 9 i un alt elev, Vasiliu, care va obine nota 7. Avnd n vedere notele obinute, elevul Ionescu este echivalent cu elevul Albu i elevul Popescu este echivalent cu elevul Vasiliu. Referior la achiziiile realizate de elevi respectivi nu este obligatoriu ca notele obinute s le reflecte n mod corect. n cazul n care am avea un test de achiziie standardizat i l-am aplica pe elevii notri nu este exclus ca s apar situaii care ni s-ar prea paradoxale, respectiv, elevii cu bote mai mici la teze s se plaseze pe poziii mai bune n ceea ce privete rezultatele la testul standardizat dect elevii
102
NICOLAE MITROFAN
care au obinut note mari la tez. Pe de alt parte, dei notele la tez au fost identice pentru doi elevi, n urma aplicrii testului standardizat s-ar putea s nu mai rmn niciun fel de echivalen. Din acest exemplu reiese clar necesitatea construirii unor teste care trebuie s efie etalonate i standardizate. n procesul etalonrii, cotele brute sunt transformate n valori numerice, acestea permind raportarea scorului individual al unui subiect, obinut n urma aplicrii testului, la gruparea sau distribuirea rezultatelor obinute de eantion. Etalonarea presupune, n principiu, dou operaii (Radu, I., 1991): a) alctuirea sistemuluide norme sau a tabelului de norme pentru grupul de referin sau eantionul de subieci (gruparea sau distribuirea n clase a cotelor brute); b) alctuirea unui sistem de notare standard n care se convertesc cotele brute ale testului. n practica psihodiagnostic ntlnim mai ales dou categorii de cote transformate, respectiv: a) cote exprimate, la rndul lor, n decile, centile i cuartile; b) cote standardizate, cele care se bazeaz pe abaterea standard. Prezentm, mai nti, prima categorie de cote transformate. Sistemul decilajului presupune mprirea scorurilor sau a datelor brute n 10 grupe sau clase, fiecare dintre ele cuprinznd 10% din efectivul total de subieci, exprimat, de regul, prin litera N. Deci, dac numrul total al subiecilor inclui n eantion este de 1000, o decil va cuprinde 10%, respectiv, 100 de subieci. Sistemul centilajului, extrem de asemntor cu sistemul decilajului, presupune mprirea n 100 de grupe sau clase, fiecare cuprinznd 1% din efectivul total al subiecilor ce au fost inclui n eantion (N). Este de la sine neles c acest sistem se poate aplica n cazul n care valoarea lui N este foarte mare. Sistemul cuartilelor presupune mprirea n 4 clase sau 4 cuartile, fiecare din ele cuprinznd 25% din N, deci din efectivul total al eantionului. Cele 4 cvartile sunt urmtoarele (M = 50% din N): a) cuartilul superior; b) cuartilul mediu superior c) cuartilul mediu inferior d) cuartilul inferior Folosirea tuturor celor 3 sisteme presupune parcurgerea unor etape asemntoare, respectiv: 1. aplicarea testului pe ntreg eantionul (N); 2. ordonarea scorurilor sau rezultatelor, de la valoarea cea mai mare sau cea mai mic a performanelor; 3. stabilirea frecvenelor, adic a numrului de subieci care obin aceeai performan (fa); 4. stabilirea frecvenelor cumulate sau nsumate (fc), nct fc = N. Vom ncerca s exemplificm folosind rezultatele obinute la testul Raven Standard, aplicat pe 448 de candidai de la un examen de admitere (Clinciu, A.I., 2005). Rezultatele obinute sunt incluse, mai nti, n tabelul de mai jos: x 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 fa 0 0 1 0 1 3 0 0 1 0 1 0 0 1 0 3 1 fc 0 0 1 1 2 5 5 5 6 6 7 7 7 8 8 11 12 35 2 14
103
NICOLAE MITROFAN
x fa fc x fa fc x fa fc
36 3 17 46 20 133 56 22 426
37 4 21 47 28 161 57 13 439
38 7 28 48 28 189 58 4 443
39 3 31 49 36 225 59 5 448
40 2 33 50 37 262 60 0 448
41 11 44 51 32 294
42 12 56 52 29 323
43 15 71 53 35 358
44 18 89 54 23 381
45 24 113 55 28 404
Vom proceda, n continuare, folosind rezultatele incluse n acest tabel, la alctuirea etaloanelor n cuartile i decile (etalonul n centile, aa dup cum am mai precizat, este foarte asemntor cu etalonul n decile. Etalonul n cuartile. Fiecare cuartil cuprinde 25% din N. Deci primul cuartil (cel inferior) are naintea sa 25% din subieci, adic 112 (448 x 25/100). Cutm pe irul frecvenelor cumulate (fc) cea mai apropiat valoare de 112. Aceasta corespunde cotei brute x = 45. n consecin, acest cuartil va cuprinde valorile lui x de la 0 la 45. Cuartilul 2 (mediu inferior) mparte pe din dou efectivul, deci are naintea sa 50% din efectivul subiecilor (N), adic 224 (448 x 50/100). Valoarea cea mai apropiat de aceasta este 225 i ea corespunde cotei brute = 49. Drept urmare, cuartilul 2 va cuprinde valorile lui x ntre 46 i 49. Cuartilul 3 (mediu superior) are naintea sa 75% din N, adic 336 (448 x 75/100). Valoarea cea mai apropiat este 353 i ea corespunde cotei brute = 53. Deci cuartilul 3 va cuprinde valorile lui x ntre 50 i 53 . n sfrit, prin diferen, cuartiul 4 x ntre 54 i 60. Finalmente, etalonul n patru clase (sau cuartile) va arta n felul urmtor: Cuartilul Cuartilul 1 Cuartilul 2 Cuartilul 3 Cuartilul 4 Clase 0 - 45 46 - 49 50 - 53 54 - 60 Procente Teoretice Cumulate 25 25 25 50 25 75 25 100
Etalonul n decile. Vor fi folosite tot datele rezultate n urma aplicrii testului Raven. Primul decil are 10 % din N naintea sa, deci, 44,8 (448 x 10/100). n urma rotunjirii, se obine 45. Cutnd pe irul frecvenelor cumulate vom gsi valoarea cea mai apropiat, care este 44 i care corespunde cotei brute, respectiv, valorii lui x = 41. Asta nseamn c primul decil va cuprinde valori ale lui x ntre 0 i 41. Al doilea decil are 20% din efectivul total al subiecilor (N) naintea sa, ceea ce nseamn 89,6 (448 x 20/100) i rotunjit, 90. Urmrind pe irul frecvenelor cumulate, vom vedea c valoarea cea mai apropiat este 89 i ei i corespunde o valoare a lui x = 44. deci, al doilea decil va cuprinde valori ale lui x ntre 42 i 44. Aa se procedeaz i pentru celelalte decile iar, n final, etalonul n decile va arta n felul urmtor:
104
NICOLAE MITROFAN
Decilul 1 2 3 4 5 6 7 8 9 10
Clase 0 - 41 42 - 44 45 - 46 47 - 48 49 50 51 - 52 53 54 - 55 56 - 60
Procente Teoretice Cumulate 10 10 10 20 10 30 10 40 10 50 10 60 10 70 10 80 10 90 10 100
Al doilea sistem de cote transformate presupune cotele standardizate (Radu, I., 1991), care nseamn tot mprirea n clase dar clase normalizate. Este vorba tot de un calcul procentual, ns efectivul total al eantionului nu se mparte n clase sucesive egale (10%, 20% etc.), ci n clase care cuprind procente conturate plecnd de la frecvenele distribuiei normale. Regula este ca numrul claselor s fie un numr impar: 5, 7, sau 9 clase, procentele fiind, desigur, diferite de la un sistem la altul i anume: a) pentru 5 clase: 6,7%; 24,2%; 38,2%; 24,2%; 6,7%; b) pentru 7 clase: 4,8%; 11,1%; 21,2%; 25,8%; 21,2%; 11,1%; 4,8%; c) pentru 9 clase: 4,0%; 6,6%; 12,1%; 17,5%; 19,6%; 17,5%; 12,1%; 6,6%; 4,0%. n practic sistemul stanine este cel mai des folosit, de aceea l vom prezenta i noi mai n detaliu. Vom face trimitere tot la rezultatele obinute n urma aplicrii testului Raven (Clinciu, A., 2005). Stanina 1 are sub ea 4% din efectiv, deci 17,92 (448 x 4/100), deci, rotunjit, 18. Cutnd pe irul frecvenelor cumulate vom constata c valoarea cea mai apropiat este 17 i acesteia i corespunde cota brut (valoarea lui x) = 36. Stanina 2 are naintea ei 10,6 procente din efectiv (4,0% + 6,6%), adic 47,468 (448 x 10,6), ceea ce nseamn, rotunjit, 47. Cutnd pe irul frecveelor cumulate, constatm c cea mai apropiat valoare este 44, creia i corespunde cota brut = 41. Stanina 3 are naintea sa 22,7 procente din efectiv (10,6 + 12,1), adic 101,696 (448 x 22,7/100) i, deci, rotunjit, 102. Cutnd pe irul frecveelor cumulate, constatm c cea mai apropiat valoare este 113, creia i corespunde cota brut = 45. .a.m.d. n final, etalonul va arta n felul urmtor: Stanina 1 2 3 4 5 6 7 8 9 Clase 0 - 36 37 - 41 42 - 45 46 - 48 49 - 50 51 - 53 54 - 55 56 57 - 70 105 Teoretice 4,0 6,6 12,1 17,5 19,6 17,5 12,1 6,6 4,0 Procente Cumulate 4,0 10,6 22,7 40,2 59,8 77,3 89,4 96,0 100,0
NICOLAE MITROFAN
Teme de reflecie/autoevaluare: 1. Artai cum va arta etalonul, n cazul n care folosii o scal cu 5 trepte; 2. Artai cum va arta etalonul n cazul n care folosii o scal cu 7 trepte. Pentru ambele ntrebri vei face apel tot la rezultatele obinute n urma aplicrii testului Raven.
1. Ce nseamn revizia testelor ? 2. Prin cte revizii a trecut Bateria de inteligen Stanford-Binet ? 3. Prin cte revizii a trecut Bateria de inteligen WAIS ? 4. Cnd se impune revizia unui test ? 5. Care sunt etapele elaborrii i construirii unui test nou ? 6. Care sunt principalele cerine n elaborarea unui test nou ? 7. Ce nseamn reprezentativitatea eantionului ? 8. Cte categorii de cote transformate cunoatei ? 9. Care este diferena dintre sistemul decilelor i sistemul centilelor ? 10. Care este specificul sistemului cuartilelor ? 11. Care sunt principalele etape ce trebuie parcurse cnd folosim oricare dintre cele 3 sisteme ? 12. Ce nseamn cote standardizate ? 13. Care este specificul sistemului stanine ? 14. De ce etaloanele bazate pe cote standardizate au un numr impar de clase ? 15. Care este relaia dintre frecvena absolut i frecvena cumulat ? BIBLIOGRAFIE: 1. ALBU, M. (1998). Construirea i utilizarea testelor psihologice. Cluj: Editura Clusium. 2. ALBU, M., PITARIU, H. (1993). Proiectarea testelor de cunotine i examenul asistat de calculator. Cluj-Napoca: Editura Casa crii de tiin. 3. COHEN, J.R., SWERDLIK, E.M. (2005). Psychological Testing and Assessment. An Introduction to Tests and Measurement. McGraw-Hill International Edition. 4. CLINCIU, A.I. (2005). Psihodiagnostic. Braov: Ed. Universitii Transilvania 5. FRIEDENBERG, L. (1995). Psychological Testing. Design, Analysis, and use. Allyn & Bacon. 6. KAPLAN, M.R., SACCUZZO, P.D. (2005). Psychological Testing. Principles, Applications, and Issues. Thomson Wadsworth. 7. MINULESCU, M. (2003). Teorie i practic n psihodiagnoz. Testarea intelectului. Bucureti: Editura Fundaiei Romnia de Mine. 8. RADU, I. (coord.) (1991). Metodologie psihologic de analiz a datelor. Cluj-Napoca: Editura Sincron. 10. STAN, A. (2002). Testul psihologic.Evoluie, consatrucie, aplicaii. Iai: Polirom.
106

01.N Mitrofan Bazele Psihodiagnosticului

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

01.N Mitrofan Bazele Psihodiagnosticului

Încărcat de

Drepturi de autor:

Formate disponibile

NICOLAE MITROFAN

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE ANUL II

Prof. univ. dr. NICOLAE MITROFAN

Universitatea din Bucureti Editura CREDIS 2008

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

SITUATIA PSIHODIAGNOSTICULUI N LUME SI N ARA NOASTR

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Bazele teoretice ale evalurii psihologice

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Modulul 1 Situaia psihodiagnosticului n lume i n ara noastr

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE

Copyright DEPARTAMENT ID 2008

BAZELE TEORETICE ALE EVALUARII PSIHOLOGICE