Sunteți pe pagina 1din 65

1. Delimitări conceptuale (27.

02)

Delimitări conceptuale

 testare
 aplicarea unor teste
 un eșantion este testat, evaluat și scorat prin proceduri standard
 măsurare
 mai complexă
 nu doar teste, ci și alte mijloace de măsurare
 scale
 inventare
 chestionare
 evaluare psihologică
 cel mai complex
 implică
 testare
 măsurare
 interpretare (esențial)
 aspecte calitative, nu doar cantitative, ca la primele 2
 raport
 rezultatele examinării
 judecăți apreciative, cu privire la starea subiectului
o normală
o anormală
o deficitară
 identificarea unor cauze cu privire la stările respective
 recomandări ale psihologului, în urma cărora subiectul poate fi trimis către acțiuni
ameliorative, intervenții terapeutice etc.
 predicții
Repere istorice

 înainte de sec. 20
 Wundt
 studii pe timpul de reacție în plan senzorial și perceptiv
 Rădulescu-Motru
 laboratorul de psihologie experimentală, București
 Thorndike
 teoriile învățării
 Spearman
 fidelitatea testului
 Cattell
 "Testele mentale și măsurarea"
 baterie de 10 teste
o forță
o viteză motrică
o discriminare senzorială
o senzorială
o judecată perceptuală x 3
o timp de reacție
o viteză
o memorie imediată
 actualmente considerat părintele psihodiagnozei
 Galton
 1865
 test de inteligență
 salt evolutiv prin promovarea metodelor cantitative
 sec. 20
 testele de inteligență
 Pearson
o corelație
 Binet & Simon
o prima scală metrică a inteligenței
o pentru identificarea copiilor cu retard mental
o revizuită în Stanford-Binet
 Yerkes
o testări colective
o army alpha
 direcții orale
 memoria cifrelor
 propoziții dezorganizate
 probleme aritmetice
 informații
 sinonime-antonime
 judecată practică
 completarea seriei de numere
 analogii
 compararea numerelor
o army beta (analfabeți)
 labirinturi
 analiza cubului
 serii
 număr-simbol
 verificarea numerelor
 completarea imaginii
 construcții geometrice
 Stern
o formula de calcul a QI
 QI = VM / VC
 VM = vârsta mentală
 VC = vârsta cronologică
 Wechsler
o prima versiune a scalelor de inteligență Wechsler: Wechsler-Bellevue
o plus
 mai multe scoruri QI
 verbal
 performanță
 global
 profil individual
 trilogia Wechsler
o WAIS (W adult intelligence scale)
o WISC (W intelligence scale for children)
o WPPSI (W preschool and primary scale of intelligence)
 teste de personalitate
 "Woodworth personal data sheet"
 Rorschach
 Payne
o tehnica completării frazei
 "the tematic apperception test" (TAT)
 Koch
o testul arborelui
 Szondi
o testul Szondi
o poze cu pacienți cu tulburări psihiatrice
o gene recesive
o preferințele subiectului pot evidenția anumite tipare psihiatrice
o analiza destinului
 inventarul mutlifazic de personalitate Minnesota (MMPI)
 California psychological inventory (CPI)
 Cattell (altul)
o 16PF (factori de personalitate)
 teste de aptitudini
 bazate pe analiza factorială => factori primari și distincți
 Thurstone
o factori specifici ai abilităților mentale primare
 înțelergerea verbală
 abilitatea numerică
 abilitate spațială
 memoria asociativă
 viteza pereceptuală
 raționamentul general
o opus lui Spearman, care susținea un singur factor
 primary mental abilities test
 Bennet, Seashore & Wesman
o "the differential aptitude test" (DAT)
o orientarea vocațională a elevilor cls. 8-12
o consilierea vocațională a tinerilor
o selecția angajaților
 [solicitare din partea departamentului muncii din SUA]
 "general aptitude test battery" (GATB)
o prima pentru analiza și predicția performanței în muncă
o 12 subteste
 8 creion-hârtie
 4 teste-aparate
 teste de achiziții
 tipuri
o pentru admiterea în instituțiile de învățământ
o teste de achiziții propriu-zise ("achievment tests")
 exemple
o "scholastic aptitude test"
o "graduate record examination"
 finalitate
o aspectul cantitativ-informațional
 cunoștințe
o aspectul calitativ-formativ
 abilități
 standardizate
o bareme
 testarea clinică
 modelele Korchin & Schuldberg
o psihometric
 măsurare prin descrierea trăsăturilor
 exemple
 scala de depresie
 scala de anxietate
o clinic tradițional
 descrierea personalității prin
 interviu
 observare
o măsurării comportamentului
o umanist
 relația directă cu clientul

Concluzii

 progresele psihometriei prin atingerea de standarde științifice


 saltul de la evaluarea psihometrică la evaluarea potențialului uman
 apariția de noi teste, bazate pe teoriile moderne ale psihologiei
 computerizarea testelor
 revizii continue
Situația psihodiagnosticului în țară și în lume

 înainte de '89
 puține preocupări
 promotori
 Zapan
 U. Șchiopu
 G. Bontilă
 I.M. Nestor
 T. Kulcsar
 Holban
 după '89
 reînființarea secției de psiho
 starea echipamentelor
 aplicarea testelor
 coduri și standarde
 cine
 cum se aplică
 cum se interpretează
 comercializarea testelor
 COPSI, Cimisia de metodologie
 legea 213/2004
 modalități de exercitare
 cabinet individual
 societăți civile profesionale
 cabinete asociate
 structuri
o birou
o laborator
o comisie
o secție
o serviciu
o centru
o departament
 tipuri de activități
 studiul comportamentului și al proceselor mintale
 soluționarea problemelor
 elaborarea și aplicarea testelor
 testarea psihologică
 interpretarea
 structura COPSI
 comisii
o aplicative
 clinică și psihoterapie
 muncii, transporturilor și serviciilor
 educațională, consiliere școlară și vocațională
 pentru apărare, ordine publică și siguranță națională
o de deontologie și disciplină
o de metodologie
 avizarea tehnicilor de testare

2. Scale, teste (06.03)

A măsura

 a atribui numere unor caracteristici/însușiri, fizice sau psihice


 nu persoane, ci atributele lor
Scale

 proprietăți
 magnitudinea
 presupune comparații, în funcție de o caracteristică
 intervale egale
 ...
 zero absolut
 poziția în care acea caracteristică nu există
 tipuri
 cele 4
 de raport, singura cu toate cele 3 proprietăți

Teste

 definiții
 Cronbach
 procedură sau o serie de probe, construite în scopul stabilirii prezenței/absenței
unui aspect psihic, a particularităților de manifestare comportamentală sau a
gradului de dezvoltare psihică
 Oleron
 instrument fundamental al psihologiei aplicate, ce se caracterizează prin posibilitatea
de a examina numeroși inidivizi în situații uniformizate
 Annastasi
 măsură obiectivă și standardizată a unui eșantion de comportament
 măsură obiectivă
 administrarea, cotarea, interpretarea sunt obiective, independente de judecățile
subiective ale examinatorului
 determinarea nivelului de dificultate a unui item / întregului test se bazează pe
proceduri obiective, nu pe nivelul de apreciere al celui care construiește un test
 măsură standardizată
 uniformitatea procedurii în administrarea, cotarea și evaluarea rezultatelor
 comparația, posibilă dacă condițiile de testare sunt aceleași
 stabilirea normelor, a etaloanelor, la care raportăm rezultatele
 scor brut= ce a obținut subiectul
 timpul
 nr. corect de itemi
 nr. de erori
 eșantion de comportament
 decupaj comportamental pe care îl testăm
 inteligent, verbal etc.
 Gregory
 procedură standardizată folosită pt eșantionarea comportamentului și descrierea lui cu
ajutorul categoriilor sau scorurilor
 aspecte
 procedura de standardizare
 eșantionul de comportament
 scoruri sau categorii
 norme sau standarde
 predicția comportamentului netestat
 echipament
 testul propriu-zis
 sarcină
 instructaj
 exemple
 manualul testului
 ce măsoară testul
 autorul/autorii, reviziile, istoricul
 cui i se adresează
 caracteristicile eșantionului pe care a fost etalonat testul
 coeficientul de fidelitate (+ proceduri)
 coeficientul de validitate (+ procedurile, tipul de criteriu)
 precizări privind timpul de rezolvare, precauții etc.
 instrucțiuni privind cotarea rezultatelor (puncte, bonificări, penalizări etc.)
 norme sau etaloane, la care se raportează răspunsurile individuale materiale auxiliare
 partea materială a testului, pentru testele pe aparate ori de performanță
o asamblări de obiecte
o aranjări de imagini
o construcții
o cuburi
 foi de răspuns
 grile de răspuns

Psihodiagnostic

 Șchiopu
 măsurarea directă a unor însușiri, caracteristici psihice
 surprinderea cât mai corect și cât mai exact a trăsăturilor și caracteristicilor psihice
individuale/de grup, în vederea stabilirii variabilității psihocomportamentale
 psihodiagnostic diferențial
 evidențierea cauzelor care au dus la conturarea unei realități psihologice
 psihodiagnostic etiologic
 prognostic, anticiparea evoluției ulterioare a subiectului în plan
 comportamental
 acțional
 interacțional
 consilierea școlară și vocațională
 depistarea capacităților, aptitudinilor, în funcție de care persoana poate fi orientată
către o anumită profesie sau formă de pregătire
 acordarea asistenței psihologice în forma consilierii psihologice și psihoterapiei
 se precizează tipul de intervenție
o psihoterapeutic
o psihofarmacologic
 la sfârșit, se pot aplica din nou aceleași probe pentru evidențierea modificărilor
 evidențierea cazurilor de abatere de la normalitate
 evaluarea și validarea unor programe de învățare și formare profesională
 formarea capacităților de cunoaștere și autocunoaștere
 depășirea subiectivismului - sub-/supraapreciere
 cerințe și reguli
 funcția prognostică
 corelarea între 2 momente diferite de testare
o T1: rezultatele predictori
o T2: rezultatele criterii
 cu cât nr. factorilor controlabili e mai mare, cu atât va crește valoarea
coeficientului de corelație predictori-criterii

3. (13.03)

U Șchiopu

 după sarcinile psihodiagnozei


 inteligență
 generală
 tehnică
 abstractă
 socială
 emoțională
 kinestezică
 aptitudini
 tehnice
 numerice, matematice
 artistice
 verbale
 pedagogice
 organizatorice
 măsurarea unor abilități senzorio-motorii
 atenție
 concentrare
 stabilitate
 mobilitate
 distributivitate
 memorie
 personalitate
 sociabilitate
 creativitate
 măsurarea temperamentului
 interese
 după corelația dintre diferite teste
 corelație 0
 măsurarea independentă a unor constructe psihologice diferite
 corelație pozitivă
 aceeași însușire psihică
o exemplu: Stanford-Binet și Wechsler
 intercorelarea unor factori
o exemplu: verbal, numeric, spațial
 după materialele utilizate sau după caracteristicile lor
 prima
 creion-hârtie
 aparate
 materiale (cuburi, imagini etc.)
 a doua
 verbale
o utilizarea limbajului
o comprehensiunea verbală
 nonverbale
o măsoară anumite capacități psihice, care nu sunt neapăratncondiționate de
limbaj
o pt persoanele
 cu handicap
 dintr-un mediu modest
 străine, cu dificultăți de adaptare la limbă
 după forma de administrare
 individuale
 singur subiect
 exemplu
o Stanford-Binet
o Bayley
o proiective
 avantaj
o subiectul, observat în timpul testării
 psihologie clinică
 colective
 pe un grup
 avantaj
o timp
o numărul mare de subiecți
 după tipul de răspuns solicitat
 la alegere
 de personalitate
o răspuns dihotomic (da/nu)
o cu scale de răspuns (în foarte mare măsură ... în foarte mică măs)
 de cunoștințe
o mai multe variante
 cu un singur răspuns corect
 de inteligență
 de aptitudini
 cu răspuns liber
o proiective
 după formele și tipurile de rezultate finale
 sintetice
 rezultat global
 exemple
o QI
o coef. de dezvoltare
o coef. de creativitate
o coef. emoțional
 analitice
 se pot realiza profiluri psihologice, în funcție de scalele incluse în instrument
 exemple
o teste, chestionare sau inventare de personalitate
o 16PF, CPI

H. Pitariu

 după conținut (sarcină și mod de procesare)


 după sarcină
 verbale
o orale
o scrise
 nonverbale
o aparate
 de performanță
o să completeze figuri lacunare
 după modul de procesare
 intelective
o performanță
o aptitudini
o cunoștințe
o situaționale
 nonintelective
o chestionare/inventare de personalitate
 după administrare
 după eficiența examenului psihologic
 individuale
 colective
 după timpul de examinare
 viteză
o cu limită de timp
 randament
o cu limită de timp
o timp nelimitat
 după gradul de standardizare
 standardizate
o utilizate de psihologi
o etalon realizat pe un eșantion reprezentativ
o protejate prin lege
 semistandardizate
o valoare orientativă
o nu permit desfășurarea unei activități psihodiagnostice adecvate
o etaloane realizate pe eșantioane mai reduse
o nu posedă licență
 nestandardizate
o ocuparea timpului liber
 după cotarea rezultatelor
 obiective
 procedură fixă, impersonală
 operator uman sau calculator
 subiective
 interpretare la latitudinea examinatorului
 teste proiective

Standarde pentru testarea psihologică

niveluri de calificare în activitatea de testare

 A
 cu ajutorul manualului
 administrate
 scorate
 interpretate
 B
 necesită anumite cunoștințe
 tehnice pt
o construcție
o caracteristicile psihometrice
 din alte domenii ale psihologiei
o diferențială
o statistică
o orientarea vocațională
 C
 solicită
 cunoștințe de nivel înalt privind testarea
 supervizarea din partea unor specialiști
 anumite teste proiective
 Rorschach
 Szondi

creșterea obiectivității în aplicarea și interpretarea testelor


 evitarea subiectivismului itemilor
 eliminarea intervenției necontrolate a examinatorului (fidelitatea interevaluator)
 corelarea probelor
 teste proiective cu obiective
 strategii mixte
 teste corelate cu
 analiza produselor activității
 observația
 interviul
 anamneza

codul deontologic APA

 construcția și dezvoltarea testelor


 evitarea grabei și a superficialității
 nelansat pe piață înaintea demonstrării validității
 specificat f clar dacă scopul este doar cercetarea
 manualul să aibă informații cât mai detaliate
 testele să nu fie publicate în reviste neștiințifice
 testarea prin poștă/telefon este contraindicată
 cumpărare și procurare accesibile strict psihologilor calificați
 protecția subiectului
 consilierea
 (auto)cunoașterea unor probleme
 decizii instituționale privind selecția și clasificarea subiecților
 cercetarea psihologică
 consimțământ informat
 acord scris, semnat
 se obține
o direct de la subiect
o de la susținătorul legal
 excepții
o când testarea este reglementată de lege
exemplu: clasa 0, la nivel național
o când testarea apare ca o componentă a activității școlare
validarea unor programe
 formare
 dezvoltare
 dobândirea unor competențe
o când consimțământul apare în mod implicit
admitere în instituții educaționale
angajare de personal
 confidențialitatea
 cine are acces
 examinatorul
 subiectul
 părinții, în cazul minorilor

4. Caracteristicile psihometrice ale testelor (20.03)

Situații FIDEL VALID

 testul măsoară ce și-a propus să măsoare X X


 grad înalt de credibilitate a rezultatelor
 testul NU măsoară ce și-a propus să măsoare
 testul măsoară ce și-a propus să măsoare, dar o face PROST
 testul NU măsoară ce și-a propus să măsoare, dar o face bine

Fidelitate și validitate
 caracteristici
 măsurabile
 evaluabile
 dacă avem de ales între 2 teste care măsoară același construct psihologic, îl preferăm pe
cel cu valorile
 fidelitate
 gradul în care testul manifestă constanță în măsurare
 coeficientul de fidelitate
 rtt
 un singur instrument
 măsura în care diferențele dintre subiecți (scorurile) se datorează diferențelor reale
privind însușirea psihică măsurată, și măsura în care ele se datorează unor erori
(erorile șansei)
 în urma aplicării testului: scor brut (raw)
 nu reflectă niciodată scorul real
 în realitate: X (scor brut) = SR (scor real) + E (eroare)
 cu cât eroarea este mai mică, cu atât este de așteptat ca scorul real să se apropie
mai mult de scorul brut
 orice factor irelevant pt scopul urmărit reprezintă o sursă pt varianța erorii
 situații
 când controlul asupra factorilor irelevanți tinde către maximum, scorul real se
apropie tot mai mult de cel brut
 când controlul asupra factorilor irelevanți tinde către minimum, scorul real se
îndepărtează tot mai mult de cel brut
 validitate
 capacitatea testului de a măsura întotdeauna ceea ce-și propune să măsoare
 coeficientul de validitate
 rxy
 două instrumente
o t1: un test
o t2: test echivalent
măsoară comportamentul anticipat

Surse ale variabilității (Pitariu)

 particularități durabile și generale ale persoanei


 deprinderile ce influențează modul de a opera cu testele
 deprinderile și tehnicile generale solicitate în testare
 abilitatea de a înțelege instrucțiunile de lucru
 particularități durabile dar specifice ale persoanei
 specifice față de testul luat ca întreg
 nivelul individual de dezvoltare a abilității măsurate de test și care nu influențează
rezolvarea altor teste
 exemplu: o persoană dominantă obține scor mare la scala de dominanță, dar
nu și de responsabilitate
 cunoștințe și deprinderi formei particulare a testului
 exemplu: un ceasornicar va avea rezultate mai bune la un test de dexteritate
digitală
 pattern-uri de răspuns stabile
 exemplu: la un test A/F, tendința de a alege opțiunea A în toate situațiile de
indecizie
 specifice pentru anumiți itemi ai testului
 șansa unei persoane de a cunoaște răspunsul de dinainte
 tipuri de itemi cu care diferiți subiecți sunt familiarizați inegal
 particularități temporare, dar generale
 sănătatea
 oboseala
 motivația
 tensiunea emoțională
 nivelul prea elevat al testului
 înțelegerea mecanismelor testării
 condițiile de administrare a testului
 particularități temporare, dar specifice
 pentru testul luat ca întreg
 înțelegerea sarcinii specifice cerute de test
 exemplu: la un test pe calculator, un subiect nu a înțeles modul de utilizare a
tastaturii
 „trucuri” de rezolvare a testului
 exemplu: la un test cu răspunsuri la alegere, și care nu penalizează
răspunsurile greșite, marcarea tuturor răspnunsurilor propuse la fiecare
întrebare sporește scorul
 nivelul de antrenare în rezolvarea unor sarcini specific cerute de test
 exemplu: la un test de viteză de reacție, administrat pe calculator, o persoană
familiarizată cu tastatura este avantajată
 dispoziția momentană
 exemplu: unei persoane f ocupate poate să i se pare f lung răspunzând la
întâmplare
 specifice pentru anumiți itemi
 fluctuații și idiosincrazii ale memoriei
 exemplu: test de cunoștințe de geografie, un elev căruia nu-i place sp opereze
cu nr., nu-și va aminti înălțimile
 fluctuații neprevăzute ale atenției/percepției, suprapuse peste nivelul general de
performanță
 exemplu: la un test pe calculator, subiectul poate apăsa o tastă greșită, fără să-
și dea seama
 factori sistematici sau de noroc
 condițiile de testare
 timpul
 factori de distragere a atenției
 claritatea instructajului
 efectul interacțiunii personalității, sexului, rasei examinatorului cu persoana
examinată
 incoscvența sau părtinirea în evaluarea performanțelor
 variații neexplicate
 norocul în găsirea răspunsului corect
 distragerea momentană a atenției

Alte caracteristici psihometrice (Șchiopu)

 finețea discriminativă
 capacitatea testului de a
 scoate în evidență diferențele interindividuale
 măsura exclusiv însușirea psihică pt care a fost conceput
 Claparede
 interesante
 obiective în aplicare
 instructaj clar
 obiectivitate în apreciere
 excluderea hazardului
 gradabile
 etalonate
 bună dispersie
 univoce (un singur aspect o dată)
 reprezentative
 inedite
 să nu facă apel la cunoștințe școlare
 constante
 aplicabile la toate vârstele
 să permită să se alcătuiască forme echivalente
 să nu ceară pe cât posibil aparatură
 să măsoare o singură variabilă

Fidelitate
 coeficientul rtt
 gradul în care testul manifestă constanță în măsurare
 oferă aceeași informație referitoare la subiectul testat în cazul în care acesta este supus
unei noi acțiuni de testare, folosind același test
 proceduri de calcul
 test-retest
 formă alternantă
 half-split
 Kuder-Richardson
 coeficient alfa
 privind personalitatea examinatorului

Fidelitatea test-retest

 metoda
 aplicarea unui test la t1
 reaplicarea lui la t2, pe același grup de subiecți
 se calculează rtt, care arată la ce nivel *corelează* cele două serii
 distanța dintre cele 2 momente poate fi mai mică sau mai mare
 intervalele mai scurte asigură un coeficient rtt mai mare
 intervalele mari nu asigură aproape niciun fel de corespondență între cele 2 serii de
rezultate
 când intervalul e prea scurt, se poate întâmpla ca subiecții să fie puternic influențați
de principiul de construcție a testului
 când intervalul e prea mare, apar alți factori, achiziții etc., ce pot influența rezultatele
 reguli
 în general, intervalul nu trebuie să depășească 6 luni
 pentru copii, datorită vitezei mari de achiziție, intervalul trebuie să fie mai *mic*
decât la adulți
 factori irelevanți
 scapă de sub controlul experimentatorului
 cresc erorile
 pentru teste care nu pot fi afectate de repetiție

5. <continuare> (27.03)

Fidelitatea formă alternantă

 se aplică pe un grup de subiecți un anumit test, și, după un interval de timp, se aplică pe
același grup de subiecți, un alt test, care trebuie să fie obligatoriu echivalent cu primul
 situații
 dacă forma alternantă se aplică imediat: fidelitate formă alternantă *imediată*
 sursa varianței erorii o constituie eșantionarea conținutului
 dacă aplicăm după un interval de timp mai mare: fidelitate formă alternană
*întârziată*
 sursa varianței
o eșantionare
o timp
 variantele identice
 nu se aseamănă atunci când sunt puse în fața subiecților (alte figuri etc.)
 ci la
 obiectivul urmărit
 conținut
o număr egal de itemi
 același tip de instructaj
 același format al testului
 nivelul de dificultate a itemilor

Fidelitatea half-split
 divizarea testului în 2 jumătăți
 fiecare jumătate funcționează ca test independent
 se aplică pe subiecți, apoi se calculează valoarea
 modalități de înjumătățire
 număr egal de itemi
 același nr. de subiecți
 se calculează coeficientul de corelație pentru cele 2 jumătăți
 Spearman-Brown

𝟐 𝒓𝒉𝒉
𝒓𝒕𝒕 =
𝟏 + 𝒓𝒉𝒉

rhh = corelația privind jumătatea de test

 situații
 pentru a anticipa valoarea coeficientului de fidelitate, dacă modificăm lungimea
testului, în sensul creșterii sau scăderii nr. de itemi

𝒏 𝒓𝒕𝒕
𝒓𝒏𝒏 =
𝟏 + (𝒏 − 𝟏)𝒓𝒕𝒕

rnn = coeficientul estimat

n = de câte ori se modifică dimensiunea testului

 dacă mărim dimensiunile unui test, crește și valoarea rtt


 cu cât numărul itemilor dintr-un test este mai mare, cu atât nivelul de credibilitate
acordat rezultatelor obținute crește
 când cunoaștem valoarea actuală a rtt și dorim ca această valoare să fie îmbunătățită,
avem nevoie să știm care va trebui să fie nr. itemilor pentru testul modificat

𝒓𝒕𝒕𝒅( 𝟏 − 𝒓𝒕𝒕𝒐 )
𝑵=
𝒓𝒕𝒕𝒐( 𝟏 − 𝒓𝒕𝒕𝒅 )

rrto = observat

rttd = dorit

N = de câte ori va crește nr. itemilor

 cazul ideal: rtt = 1


 pentru cele mai multe scopuri de cercetare, acceptat: rtt > 0.7
 pentru o decizie importantă: rtt > 0.95
 alte scopuri: rtt > 0.9

Fidelitatea Kuder-Richardson

 testele da/nu, adevărat/fals


 bazată pe performanța la item

𝒏 𝑺𝑫𝒕𝟐 − 𝑺𝑼𝑴𝑨 𝒑𝒒
𝒓𝒕𝒕 =
𝒏 − 𝟏 𝑺𝑫𝒕𝟐
SDt = deviația standard a scorurilor totale ale testului
SUMA pq = suma produselor persoanelor care reușesc (p) și a celor care nu reușesc (q) la
fiecare item

 pq se calculează pentru fiecare item

Coeficientul alfa

 Cronbach
 pentru testele de personalitate, cu răspunsuri pe scale, dintre care subiectul trebuie să
aleagă
 3 trepte: nicioadată - uneori - mereu
 5 trepte: niciodată - f rar - uneori - f des - întotdeauna

𝒓𝒙𝒙 𝒏 𝑺𝑼𝑴𝑨 𝑺𝑫𝒊𝟐


= (𝟏 − )
𝒓 𝒂𝒍𝒇𝒂 𝒏 − 𝟏 𝑺𝑫𝒙𝟐

SDx^2 = suma varianțelor la scorurile întregului test

SDi^2 = suma varianțelor la scorurile fiecărui item

Fidelitatea legată de persoana examinatorului

 pentru testele subiective (proiective, clinice), la care diferențele dintre modul de cotare a
acelorași rezultate de către mai mulți examinatori pot fi destul de mari
 măsura fidelității examinatorului = calcularea coeficientului de corelație între două sau
mai multe rezultate ale evaluării

Surse ale varianței erorii


Tipul de coeficient de fidelitate Surse

test-retest eșantionarea timpului


formă alternantă imediată eșantionarea conținutului
formă alternantă întârziată eșantionarea timpului și conținutului
half-split eșantionarea conținututlui
Kuder-Richardson & Coef alfa eșantionarea și eterogenitatea
conținutului
legată de examinatori diferențele dintre examinatori

 valoarea coeficientului de fidelitate arată care este procentul din varianța scorurilor, ce
depinde de varianța reală legată de trăsătura măsurată

Eroarea standard a măsurării (SEM)

 altă procedură de măsurare a fidelității, pentru a interpreta scorurile *individuale*


(eroarea standard a scorurilor)

𝑺𝑬𝑴 = 𝑺𝑫𝒕 √𝟏 − 𝒓𝒕𝒕

 un test e cu atât mai valoros, cu cât eroarea este mai mică


 datorită erorii, în cazul în care reaplicăm testul pe un subiect, scorul va varia
 cât de mult poate varia = scorul SEM
 68% din scoruri între MEDIE +/- 1 SEM
 95% 2
 99% 3

6. Validitate (03.04)

Validitate

 capacitatea testului de a măsura întotdeauna ceea ce și-a propus să măsoare


 rxy
 două instrumente de măsură
 testul aplicat în momentul 1
 alt instrument la momentul 2
 formula

𝑺𝑼𝑴𝑨 𝒙𝒚
𝒓𝒙𝒚 =
𝑵 𝑺𝑫𝒙 𝑺𝒅𝒚

x = deviația unei performanțe de la media în proba x

y = deviația unei performanțe de la media în proba y

 tipuri
I. de conținut
II. de criteriu
III. de construct

Validitatea de conținut
 testele de achiziție și ocupaționale
 capacitatea testului de a acoperi un eșantion reprezentativ al domeniului comportamental
ce urmează a fi măsurat
 modul de formulare a itemilor
 a se acoperi integral conținutul materiei
 să fie de încredere
 un nr. cât mai mare de itemi
 scorare obiectivă
 să fie valizi
 aspecte
o informaționale
o operaționale
 abilități
 deprinderi
 capacități
 condiții pt un bun test de achiziție
 nr. mare de itemi, care să acopere întregul domeniu vizat
 prin consultarea unui nr. cât mai mare de experți
 itemii să fie selectați după criterii obiective
 itemi cu diferite niveluri de dificultate
 proceduri obiective de scorare
 standardizare științifică
 clasificarea itemilor după criteriul obiectivității
 obiectivi
 cu alegere multiplă
o întrebare/problemă (rădăcina)
o un set de răspunsuri, distractori și cel corect
o de precizat câte sunt corecte
o recomandări
 problema să fie clar formulată
 conținutul itemului să fie detaliat, iar răspunsurile să fie clare, la obiect
 conținutul să fie detaliat, însă doar cu informații relevante
 a se utiliza cât mai puțin negativul
 informațiile din item să fie noi, recente, relevante
 să existe un singur răspuns clar și corect
 răspunsurile greșite să fie plauzibile
 să nu se ofere neintenționat indici pt rezolvarea corectă
 a se utiliza "niciuna din cele de mai sus" doar atunci când răspunsul cheie
poate fi clasificat neunivoc ca fiind corect/incoret
 a se evita varianta "toate cele de mai sus"
 de asociere (potrivire de perechi)
o două liste
o recomandări
 setul de informații să reprezinte un singur exercițiu de potrivire
 setul să fie relativ scurt (~ 5-6 afirmații)
 afirmații cât mai scurte
 un titlu pentru fiecare coloană (stimul-răspuns)
 mai multe variante de răspuns decât stimulii
 a se evita ambiguitatea
 de completare
 semiobiectivi
 cu răspuns scurt
 întrebări structurate
 subiectivi
 rezolvare de probleme
 eseu structurat/nestructurat
o răspuns elaborat de către subiect
o vizează capacitățile, mai puțin informațiile
o tipuri
 carte deschisă
 pentru acasă
 întrebări de studiu
 foaie înșelătoare
o recomandări
 să se stabilească ce procese mentale dorim să măsurăm
nu cunoștințe, ci capacități
 material nou, original
 cuvinte de tipul
„comparați”
„explicați”
„realizați o analiză critică”
 sarcina să fie lipsită de ambiguitate
 în cazul subiectelor controversate, se evaluează argumentele subiectului,
nu poziția luată
 adaptarea complexității la nivelul subiectului
 itemi adevărat/fals
o A/F diferit de corect/greșit!
o chestionarele de personalitate
o afirmații despre propria personalitate sau propriul comportament
o recomndări
 itemul să fie neunivoc A/F
 evitarea determinanților care induc generalizări ("toți", "întotdeauna" etc.)
 evitarea negațiilor și a negațiilor duble
 itemul să cuprindă o singură idee
 lungime egală a itemilor A și F
 un nr. egal de itemi A și F
 manual
 indiferent de tipul testului
 standardizate
 alcătuite de profesor
 trebuie incluse
 procedurile utilizate
 ariile de conținut
 tipurile de achiziții pe care le vizăm
 categoriile de itemi
 nr. de itemi
 judecata experților
 coerența internă
 același grad de exigență a unui expert
 varianța
 să nu existe diferențe f mari între judecățile experților
 concordanța judecăților
 să analizeze itemii în aceeași manieră
 formula
 Lawshe (1975)

𝑁
𝑁𝑒
𝐶𝑉𝑅 = 2
𝑁
2
CVR = content validity ratio

Ne = nr evalutorilor care consideră testul/itemul ca fiind reprezentativ

N = nr total de evaluatori

 se calculează pt fiecare item


 dacă punerea de acord a experților are mai mult de 5% șanse să apară datorită
întâmplării, itemul trebuie *eliminat*

Validitatea de criteriu
 predictori = rezultatele la test
 criterii = performanțele obținute în cadrul activității în raport cu care s-au făcut
predicțiile
 puterea de predicție a testului depinde de validitatea de criteriu, exprimată de coeficientul
de validitate (rxy)
 regulă: cu cât valoarea rxy este mai mare, cu atât predicția este mai sigură
 intervalul de timp dintre cele două momente poate fi mai mare/mic
 uneori, atât de mic, încât cele două momente se suprapun
 două forme
 concurentă
 deși aplicăm un test cu care măsurăm o capacitate psihică (ex.: inteligența),
rezultatele la criteriu le avem deja (la școală)
 validitatea concurentă apare ca substitut al validității predictive, deoarece vizează
statutul deja existent al subiectului
 pericolul influențării, „contaminarea criteriului”
o profesorul se uită în catalog la alte materii, înainte de a nota
 criterii (Anastasi)
o achizițiile academic ca
 note
 medii
 burse
pt testele de
 inteligență
 personalitate
 aptitudini multiple
o performanța într-un domeniu specializat
în cazul testelor de aptitudini speciale
o performanța muncii
teste de aptitudini speciale
teste de inteligență generală
teste de personalitate
o diagnoza psihiatrică
teste de personalitate
o corelația dintre testul nou și cele disponibile anterior
o metoda grupurilor contrastante
implică un criteriu compozit
exemplu
 validitatea unor teste de aptitudini muzicale
 compararea scorurilor obținute de studenții admiși și respinși
 predictivă

Validitatea de construct

 măsura în care testul măsoară un anumit construct/concept


 prin traducerea în comportamente observabile, măsurabile, prin operaționalizarea
conceptelor
 TEMĂ
 operaționalizarea conceptului de introversie
 modalități de evidențiere a validității constructului
 diferențierea vârstei
 pentru validarea testelor de inteligență
 corelațiile cu alte teste similare, care măsoară același tip de comportament
 analiza factorială
 analiza consistenței interne
 matricea multi-trăsături multi-metodă

7. <continuare> (10.04)

Matricea multitrăsături multi-metodă

 Campbell & Fiske


 2 tipuri de validitate
 convergentă
 dacă un test corelează la un nivel înalt cu alte tipuri de variabile cu care teoretic
trebuie să coreleze
 exemplu
o rezultatele unui elev la un test pt măsurarea aptitudinilor matematice corelează
cu rezultatele lui la matematică
 discriminatorie
 exemplu
o rezultatele unui elev la un test pt măsurarea aptitudinilor matematice sunt de
așteptat să nu coreleze cu rezultatele lui la literatură
 procedura
 măsurarea a două sau mai multe trăsături prin două sau mai multe metode
 trăsături
 dominanța
 sociabilitatea
 motivația achiziționării
 metode
 inventar de personalitate
 test proiectiv
 clasificarea în perechi
 rezultă un tabel cu dublă intrare
 valorile fidelității (rtt)
 valorile validității (rxy), care rezultă în urma corelațiilor obținute pentru aceeași
trăsătură cu metode diferite
 corelațiile dintre diferite trăsături măsurate cu aceeași metodă
 corelațiile dintre diferite trăsături cu diferite metode
 grafic, pag. 121 din carte
 concluzii
 rxy trebuie să fie mai mare decât valoarea corelațiilor dintre trăsăturile diferite
măsurate cu metode diferite
 rxy trebuie să fie mai mare decât valoarea corelațiilor dintre trăsăturile diferite
măsurate cu aceeași metodă
 cu cât valoarea este mai mare, cu atât testul este mai valid
 întotdeauna, rxy < rtt
 Anasatasi
 valoarea lui rxy trebuie să fie destul de mare pentru a fi statistic semnificativă la
un nivel acceptabil
 Smith
 > 0,5: excelent
 0,4 - 0,49: bun
 0,3 - 0,39: acceptabil
 < 0,3: slab
 Stan
 peste 0,7

Eroarea standard a estimării (SEE)

 determinarea erorii ce poate fi așteptată privitor la scorul prognozat al unui subiect, ca


rezultat al validității imperfecte a testului
 rxy < rtt => poziția anticipată a subiectului la criteriu va oscila între anumite limite, care
se stabilesc cu ajutorul SEE
 formula

𝑺𝑬𝑬 = 𝑺𝑫𝒚 × √𝟏 − 𝒓𝒙𝒚𝟐

SDy = deviația standard la scorurile de criteriu

 formula pentru construirea intervalului de încredere


𝑿 ± ( 𝒔𝒄𝒐𝒓𝒖𝒍 𝒛 ) × 𝑺𝑬𝑬

 rxy = 1 (validitate perfectă) => SEE = 0 (precizie maximă a anticipării)


 rxy = 0 => SEE = SD (predicție nulă)
 problemă
 SEE = 5
 scorul prognozat al subiectului în baza rezultatului la test = 120
 între ce limite se va întinde scorul prognozat, la un nivel de încerere de 99%

Selecția testelor

 factori
 motivul pt care subiectul a ajuns pe mâna noastră
 vârsta subiectului
 eventuale probleme pe care le-ar putea prezenta subiectul
 senzoriale
 motorii
 perioada de timp disponibilă pt testare
 disponibilitatea anumitor teste
 mediul socio-cultural din care provine subiectul

Locul și rolul testului în selecția profesională

 2 categorii de subiecți
 admiși
 respinși
 trebuie să se stabilească o linie de demarcație (cut-off score) între ei
 foarte apropiată de partea de început a listei candidaților
 exemplu
o maxim 100 de puncte
o admiși peste 95
 foarte mult îndepărtată de partea de început
 exemplu
o admiși peste 25 de puncte
 dacă testul psihologic utilizat pentru selecție ar fi un instrument perfect (rtt = rxy = 1),
atunci, în cadrul acțiunii de selecție, ar fi sigur departajați subiecții buni de cei slabi
 în realitate, testul nu este perfect (rtt, rxy < 1)
 pe lângă subiecții admiși pe drept, pot fi incluși și subiecți care ar fi trebuit respinși
 pe lângă cei respinși pe drept, pot fi și subiecți care ar fi trebuit să fie admiși
 rezultă 4 categorii
 admiși (adevărat pozitiv)
 respinși (adevărat negativ)
 fals admiși (fals pozitiv)
o nu au capacități și aptitudini pt activitatea în raport cu care se face selecția
o menținerea lor va necesita costuri mari, inutile (ei oricum vor eșua)
 fals adminși (fals negativ)
 buni, „pierduți”, care, dacă ar fi fost admiși, ar fi reușit sigur când ar fi fost
evaluați la criteriu
 cum se poate compensa
 ridicarea liniei de demarcație
o scorul ar trebui să fie cât mai aproape de scorul maxim
o este greu de presupus că cei cu scoruri f mari vor fi fals pozitivi
 coborârea liniei de demarcație
o pentru a nu-i pierde pe cei buni
 în ce măsură testul folosit în selecție poate face predicție corectă?
 rata de selecție
 proporția în care el anticipează corect succesul sau eșecul
 rata de bază
 având în vedere rezutatele la criteriu, se poate determina proporția celor care
reușesc și care nu reușesc la criteriu
 tabelele Taylor-Russel
 metodă pentru evaluarea validității în legătură cu cantitatea de informație cu care
testul contribuie dincolo de rata de bază
 oferă probabilitatea ca o persoană selectată în baza scorului la test să reușească la
criteriu
 problemă
 patronul unei firme dorește să angajeze un număr de 40 de candidați din 100
prezentați la concurs
 serviciul psihologic al firmei utilizează un test cu o validitate de 0,75
 rata de bază: 0,6
 câți candidați vor reuși și nu vor reuși la criteriu?

8. Analiza de item (24.04)

Relația itemului cu testul

 testul măsoară o anumită caracteristică psihologică dacă fiecare item are „puterea” să
măsoare acea caracteristică
 Reuchlin
 item = element al unui test, situație particulară cu rol de stimul, la care subiectul
nupoate da decât un răspuns dintre două sau mai multe răspunsuri teoretice prevăzute
de test
 caracteristici
 secvență cu o anumită individualitate
 stimul pentru subiect
 subiectul oferă un răspuns, care poate fi corect sau nu
 individualitatea itemului
 un item contribuie în mod distinct la scorul global
 fără acel item, testul nu ar putea fi considerat un instrument de măsurare bun
 nr de itemi
 teste cu f mulți itemi
 sute, la testele de personalitate
 teste cu foarte puțini item
 atenție
 minim
 10
 modul de formulare
1. definire clară a ceea ce măsurăm
2. bancă de itemi
 itemi de rezervă
 mai multe variante pentru același item
3. evitarea itemilor lungi
4. nivel de dificultate potrivit
5. evitarea itemilor cu caracter echivoc
6. combinarea itemilor formulați pozitiv și negativ

Tipuri de analiză de item

 situații
 când construim un test nou
 când realizăm o revizie a unui test existent
 analiză
 cantitativă
 procedee statistice pentru calcularea a doi indecși
o de dificultate a itemului
o de discriminare a itemului
 calitativă
 prin
o conținut
o format
 aspecte
o sensibilitatea culturală
o mediul de aplicare
o limbajul testului
o ghicitul răspunsului

Gradul de dificultate a itemului

 cât de greu/ușor este itemul pentru subiect


 situații în care itemii sunt nefolositori
 niciunul dintre subiecți nu răspunde corect
 procentul celor care răspund este 0
 toți subiecții răspund corect
 procentul celor care răspund este 100
 în cazul în care testul se reaplică, un item la care răspund corect p = 10% din subiecți se
consideră cu un nivel înalt de dificultate
 pentru 90%, nivel redus
 cu cât crește valoarea lui p, cu atât scade nivelul de dificultate și invers
 valoarea optimă: p = 50%
 exemplu
 la un test aplicat pe 100 de subiecți, 50 reușesc, 50 nu
 comparăm pe fiecare subiect din primul grup cu fiecare din subiect din al doilea grup
 rezultă 2500 comparații perechi / biți ai informației diferențiale
 calcularea dificultății itemului
 pentru testele cu răspunsuri corect/incorect

𝒏𝒓 𝒓𝒂𝒔𝒑𝒖𝒏𝒔𝒖𝒓𝒊 𝒄𝒐𝒓𝒆𝒄𝒕𝒆 𝒍𝒂 𝒊𝒕𝒆𝒎


𝑷=
𝑵
P = indexul de dificultate

N = nr total al subiecților care au răspuns


 testul cel mai bun este cel trecut de 50% dintre subiecți (fiecare dintre itemii săi are
nivelul de dificultate p = 50)
 recomandări (Anastasi)
 să fie selectați itemii cu nivele de dificultate diferită, dar cu media dificultății 0,5
 scale de interval pentru determinarea nivelului de dificultate
 dificultatea este exprimată în funcție de curba normală, cu deviația standard ca distanță
 valorile sunt convertite într-o scală desemnată prin ∆(Delta)
 relația dintre ∆ și curba normală:

∆= 𝟏𝟑 + 𝟒𝒛

13, 4 - constante stabilite pentru a evita valorile negative și zecimale

 Delta este o scală în care toți itemii cad, în ceea ce privește nivelul de dificultate, între
valorile 1 și 25, cu media 13
 nivelul de dificultate optim
 la jumătatea distanței dintre
 numărul maxim de subiecți care răspund corect
 nivelul reușitei bazată pe șansă

Analiza puterii distractorului

 forme
 f apropiați de răsp. corect
 f îndepărtați ...
 dacă unii distractori sunt f ușor de identificat
 crește probabilitatea ghicirii răspunsului
 cresc riscurile privind rtt și rxy
 în funcție de nr. distractorilor, se poate calcula șansa de ghicire a răspunsului corect
 distractorii trebuie eliminați atunci când sunt aleși de
 niciun subiect
 prea mulți subiecți
 putere
 așteptată
 actuală

𝒏𝒓 𝒔𝒖𝒃𝒊𝒆𝒄𝒕𝒊𝒍𝒐𝒓 𝒄𝒂𝒓𝒆 𝒓𝒂𝒔𝒖𝒑𝒖𝒏𝒅 𝒊𝒏𝒄𝒐𝒓𝒆𝒄𝒕 𝒍𝒂 𝒊𝒕𝒆𝒎


𝑷𝑫𝑨 =
𝒏𝒓 𝒅𝒆 𝒅𝒊𝒔𝒕𝒓𝒂𝒄𝒕𝒐𝒓𝒊

PDA = puterea așteptată

 PAD
 nr de subiecți care aleg fiecare câte un distractor

Capacitatea de discriminare a itemului

 în ce măsură subiecții care obțin rezultate bune la întregul test reușesc la item
 în ce măsură subiecții cu rezultate slabe la întregul test nu reușesc la item
 diferențierea între subiecții care obțin scoruri mari la întregul test (nivel înalt al
capacității psihice) și subiecții care obțin scoruri mici la întregul test (nivel scăzut)
 subiecții trebuie să fie discriminați
 cei buni, dar nu excelenți, vor greși la unii itemi
 cei slabi, dar nu extremi de slabi, vor reuși la unii itemi
 cei f buni pot să nu reușească la un anumit item și cei slabi pot să reușească la acesta
 evaluarea capacității de discriminare a itemilor
 indexul discriminării itemului
 teste cu răsp. corect/incorect
 corelația scor item - scor total al testului
 teste cu răsp. multiplu sau liber
 indexul de discriminare
 procedura 1
 împărțim subiecții în 3 grupe
o răsp. bune (upper, U)
o răsp. mediocre (middle, M)
o răsp. slabe (lower, L)
 procedura 2
 metoda grupurilor extreme
o U
o L
 teste
o abilități
o personalitate
o interese
o atitudini
 formula

𝑫 = 𝒑𝑼𝒑 − 𝒑𝑳𝒐

D = indexul de discriminare a itemului

pUp = procentul răspunsurilor corecte în grupa U

pLo = procentul răspunsurilor corecte în grupa L


 nivelul de dificultate = U + M + L
 gradul de discriminare a itemului = U - L
 Anastasi
 relația dintre dificultatea itemului și gradul de discriminare
 situații
1. dacă toți U reușesc și toți L reușesc, D = 0
2. dacă niciunul dintre U și L nu reușește, D = 0
3. dacă toți U reușesc și niciun L nu reușește, D = 100
4. dacă 100% U reușesc și 80% L, D = 20
 corelația scor item - scor total al testului
 valoarea D acceptabilă
 de la 0,3 în sus
 cât de mare poate fi D?
 corelația Pearson

𝑼𝑴𝑨𝒙𝒚 ÷ 𝑵 − 𝑿𝒀
𝑹𝒙𝒚 =
𝑺𝑫𝒙 𝑺𝑫𝒚

x - scorurile la item

y - scorurile la întregul test

X - media scorurilor la item

Y - media scorurilor la test

SDx - deviația standard a scorurilor la item


SDy - deviația standard a scorurilor la test

9. Etalonarea și standardizarea testelor (08.05)

Situații

I. testul deja există


 etalonul există, dar nu mai corespunde
 exemplu: testul este din altă țară
 este necesară reetalonarea
 traducerea
 adaptarea
 etalonarea

pe populația vizată

II. nu există testul


 trebuie construit

Revizia

 reanalizarea și reevaluarea testului din mai multe puncte de vedere


 conținut
 norme
 administrare
 cotare
 exemplu
 specificul limbajului
 istorie
 obiceiuri
 mentalități
 exemplu
 bateria Stanford-Binet
 în prezent, Stanford-Binet Intelligence Scale (ed. 5)
 WAIS
 când se impune revizuirea (APA)
 apar modificări semnificative în domeniul reprezentat
 condițiile noi pentru utilizare și interpretare fac testul să fie nepotrivit pt ceea ce
intenționează să măsoare
 alte condiții de revizuire
1. materiale stimul demodate
2. instrucțiuni și itemi cu vocabular depășit
3. cuvinte/expresii nepotrivite, ofensatorii
4. norme inadecvate ale testului, datorită schimbărilor în populația subiecților potențiali
5. norme inadecvate testului datorită schimbărilor pe linia abilităților măsurate
6. fidelitatea/validitatea testului pot fi îmbunătățite
7. teoria ce a stat la baza testului original a fost îmbunătățită
 valabilitatea testului
 Tulsky și colab.
 15-20 ani
 după, noi etaloane, pentru a contracara efectul Flynn
 efectul Flynn
 creșterea QI o dată cu timpul
 cauze
o îmbunătățirea condițiilor de viață
o creșterea nivelului de instruire
o nivelul de tehnologizare
o accesul la resurse
o fluctuația demografică
 QI crește cu
o 0.3 puncte/an
o 3-9 puncte/10 ani
 recomandări
1. revizii la intervale mai mici
 mai ales la testele de inteligență
2. utilizarea testului normat recent
 etalonare pe același nr de variabile
3. să se țină cont de modul de potrivire a variabilelor
 în caz de etalonare pe variabile diferite

Etapele construcției unui test

1. analiza de construct
 cât mai clar și corect
 construct = orice trăsătură psihologică, pe care vrem să o măsurăm
 timiditate
 anxietate
 inteligență
 pași
 definirea conceptului
 operaționalizarea lui
 exemplu
 „ce înseamnă a (nu) fi anxios?”
2. imaginarea modalităților de simulare a situațiilor reale în raport cu care subiectul își
exteriorizează trăsăturile psihice aplicarea lor în forma unei probe oarbe pe un eșantion
mai mic
 atenție la
 nivelul de dificultate a itemilor
 dimensiunea testului
 formularea instructajului
 reacțiile subiectului la test
 în funcție de rezultate, se fac modificările necesare
3. etalonarea
 utilizarea unui ansamblu de procedee statistice pt a diferenția și clasifica subiecții
după rezultate
 rezultatele obținute de membrii eșantionului sunt grupate în forma unor norme sau
etaloane, folosite drept cadre de referință, la care raportăm rezultatele unui anumit
subiect

Cerințe în alegerea eșantionului

A. reprezentativitate
 să reflecte cât mai fidel caracteristicile populației de referință
 eșantionul este o fracțiune din populația de referință
 exemplu
 populația: 1 000 000 elevi
 eșantion: 1 000
B. în același timp
 eterogen în privința caracteristicii măsurate
 omogen cu privire la alte variabile, în afara celei testate
 vârsta
 sexul
 pregătire socio-profesională
 nivel socio-cultural
 exemplu
 500 fete, 500 băieți
 câte 250 din fiecare an
 ...

Tipuri de scale

 etalonarea presupune
 alcătuirea sistemului de norme pt grupul de referință/eșantionul de subiecți, prin
gruparea/distribuirea în clase a cotelor brute
 alcătuirea unui sistem de notare standard, în care se convertesc cotele brute
 categorii de code transformate
 exprimate în
 decile
 centile
 cuartile
 standardizate
 bazate pe abatarea standard
 sisteme
 decilajului
 împărțirea scorurilor în 10 clase, fiecare cuprinzând 10% din efectivul total de
subiecți
 centilajului
 100 clase, 1%
 în practică, când avem un nr f mare de subiecți
 cuartilelor
 4 clase, 25%
 cuartil
o superior
o mediu superior
o mediu inferior
o inferior
 cote standardizate
 caracteristici
 împărțirea în clase normalizate
 un calcul procentual
 numărul claselor trebuie să fie impar: 5/7/9
 sisteme
 pt 5 clase
o clasa 1: 6.7%
o clasa 2: 24.2%
o clasa 3: 38.2%
o clasa 4: 24.2%
o clasa 5: 6.7%
 pt 7 clase
o clasa 1: 4.8%
o clasa 2: 11.1%
o clasa 3: 21.2%
o clasa 4: 25.8%
o clasa 5: 21.2%
o clasa 6: 11.1%
o clasa 7: 4.8%
 pt 9 clase (standard nine, stanine)
o clasa 1: 4.0%
o clasa 2: 6.6%
o clasa 3: 12.1%
o clasa 4: 17.5%
o clasa 5: 19.6%
o clasa 6: 17.5%
o clasa 7: 12.1%
o clasa 8: 6.6%
o clasa 9: 4.0%
 exemplu
 unui grup de 100 de subiecți i se aplică un test de aptitudini, la care rezultatele se
înscriu între 1-100
 frecvența absolută a răspunsurilor este 1, ceea ce înseamnă că fiecare subiect obține
un rezultat diferit față de ceilalți
 alcătuiți etalonul, folosind sistemele
 decilelor
 centilelor
 cuartilelor
 stanine
 de predat în ziua examenului !!!

10. Teoria răspunsului la item (IRT) (22.05)

Teoria clasică a testării (CTT)

 (SEM = SEE) pentru toți subiecții, indiferent de nivelul capacității psihice


 însă, răspunsul subiectului depinde de
 gradul de dificultate a itemului
 nivelul de dezvoltare a capacității măsurate
 situații
A. nivel înalt al capacității + nivel înalt al dificultății
B. înalt scăzut
C. scăzut înalt
D. scăzut scăzut

Caracteristici

 explică și analizează relația dintre


 caracteristicile individului
 răspunsurile la item
 pune accentul pe modul de rezolvare a itemului, nu doar pe scorul la test
 model alternativ la CTT
 „teoria trăsăturilor latente”
 trăsătură latentă = capacitatea psihică pe care o măsurăm
 abilități
 trăsătură de personalitate

Elemente fundamentale

a) funcțiile răspunsului la item


 relația dintre
 „cantitatea” de trăsătură latentă
 probabilitatea subiectului de a răspunde la item
 exemple
 aptitudini
 inteligență
 trăsături de personalitate
 se stabilesc pentru
 fiecare item: funcția răspunsului la item (IRF)
 întregul test: nr de IRF = nr de itemi
b) funcțiile informării
 capacitatea de a-i diferenția pe subiecți
 un item oferă un nivel diferit de informație pentru fiecare nivel al trăsăturii
supuse măsurării => o funcție informațională a fiecărui item
 funcțiile informaționale ale itemilor, cumulate => funcția informațională a
întregului instrument
c) invarianța IRT
 poziția unui subiect pe un continuum al trăsăturii latente (scor obținut) poate fi
estimată din răspunsurile la oricare set de itemi IRF cunoscute
 aceste funcții nu depind de caracteristicile unui anumite populații

Analiză comparativă CTT-IRT


1. SEM
 CTT
 SEM este constantă pentru toate scorurile obținute de un eșantion specific
 IRT
 SEM diferă în funcție de scoruri, dar se aplică populației generale
2. lungimea testului și rtt
 CTT
 testele mai lungi sunt mai fidele decât cele mai scurte
 IRT
 testele mai scurte pot fi mai de încredere decât cele lungi
 testele adaptive, cu itemi selectați pentru fiecare subiect, care să se potrivească
nivelului abilității
3. compararea scorurilor la formele multiple ale testului
 CTT
 compararea scorurilor la mai multe teste este optimă când formele sunt paralele
(același nivel de dificultate)
 IRT
 compararea este optimă când nivelele de dificultate ale testului variază între
persoane
4. măsurarea nebiasată a proprietăților itemului
 CTT
 depinde de reprezentativitatea eșantioanelor
 gradul de dificultate (p) = proporția subiecților care reușesc la item
 gradul de discrimare al itemului = corelația dintre răspunsurile la
o item
o test
 IRT
 se poate obține și din eșantioane nereprezentative
5. stabilirea semnificației scorurilor obținute
 CTT
 scorurile devin semnificative prin compararea poziției lor în cadrul grupului de
normare
 IRT
 semnificația scorurilor se poate obțin și prin compararea la distanță de itemi
 nivelele trăsăturii psihice măsurate pot fi comparate cu itemii
 diferența dintre
o nivelul trăsăturii
o dificultatea itemului
6. stabilirea proprietăților scalei
 CTT
 prin distribuțiile normale ale scorurilor
 distanțele relative dintre scoruri nu sunt constante
 IRT
 prin aplicarea unor modele de măsurare
 selecția itemilor
 normalizarea scorurilor (scale de interval/raport)
7. amestecul itemilor cu format diferit (imagini, numere, figuri)
 CTT
 impact neechilibrat asupra scorurilor totale
 IRT
 pot produce scoruri optime
 totuși, nu foarte mare eterogenitatea
8. semnificația înțelesurilor scorurilor schimbate
 CTT
 scorurile schimbate nu pot fi comparate când nivelul scorurilor inițiale diferă
 IRT
 pot fi comparate scorurile aceluiași subiect în sistem
 pre-test
 post-test
 exemplu
 pre-test
o test de memorie/atenție
 training
 post-test
o același instrument ca în prima etapă
9. analiza factorială a itemilor binari (validitatea de construct)
 CTT
 produce mai multe artefacte decât factori
 analiza factorială - procedură de grupare a unor itemi
 artefacte = falși factori
o nu se produce o ierarhizare autentică
 IRT
 produce o analiză factorială completă
10. importanța cracteristicilor itemului ca stimul
 CTT
 neimportante comparativ cu caracteristicile psihometrice
 IRT
 direct relaționate

Modele

 clasificare
 în funcție de nr de trăsături latente
 unidimensionale
 multidimensionale
 în funcție de nr de parametri
 bazate pe 1 parametru
 dificultatea itemului
o VD: răspunsul dihotomic la item
o VI: scorul la trăsătura latentă și dificultatea itemului
 bazate pe 2 parametri
o dificultate
o discriminare
 bazate pe 3 parametri
o dificultate
o discriminare
o ghicit
 care este mai util?
 dacă itemii au încărcătură egală și dorim să evidențiem mai degrabă proprietățile
scalei
 modelul 1 parametru
 dacă se urmăresc strict parametrii
 modelul 2/3 parametri
 pentru teste care nu au răspuns dihotomic
 modele politomice
o scală în trepte
o răspuns gradat
o răspuns nominal

Aplicații

 construcția de teste
 revizia de teste
 testele computerizate (programul selectează itemii în funcție de răspunsurile la itemii
anteriori)
 măsurarea de constructe psihologice

Examen

 dacă avem un test în baza căruia să luăm o decizie importantă, coeficientul de fidelitate
 enumerați procedurile de calcul ale fidelității
 pentru ce tip de test este potrivită o anumită metodă de calcul
Tema!!!

11. Raportul de evaluare psihologică (29.05)

Trăsături

 completat de psihologul evaluator


 cu drept de liberă practică
 conține informațiile rezultate informațiile rezultatelor în urma acțiunilor de măsurare și
evaluare
 are un caracter necesar, obligatoriu, util și legal
 probleme frecvente
1. utilizarea exagerată a jargonului
2. concentrarea mai mult pe rezultate decât pe individ
3. utilizarea insuficientă a rezultatelor la teste
4. slaba organizare a raportului
5. neluarea de poziție
6. slabe deprinderi gramaticale
7. terminologie dificilă
8. nu oferă recomandări utile
 recomandări
 scop clar formulat
 vocabular inteligibil
 organizare
 recomandări / solicitări explicite
Tipuri de raport psihologic

 după mijloacele de evaluare


a) simplu
 un singur instrument
 un rezultat sintetic (QI, QD, QIE)
b) complex
 mai multe metode și instrumente
 după specificul locației
a) psihologic
 în clinică
b) psihoeducațional
 cabinete de consiliere școlară
c) vocațional
 școli
 locul de muncă
 după modul de organizare și elaborare
a) centrat pe teorie
 surprinde mai degrabă teoria
b) centrat pe test
 accent pe instrumentele utilizate
c) centrat pe problemă
 depresie etc.
d) centrat pe persoană
 surprinde capacitățile înalt și slab dezvoltate ale subiectului
e) centrat pe eul psihologic
 nevoile, resursele subiectului, în legătură cu problemele de viață

Conținut

 raportul psihologic
a) informații de identificare
b) instrumente de măsurare
c) motivul trimiterii
d) informații de bază
e) motivul trimiterii
f) rezultatele evaluării și impresii clinice
 „tendințe de ...”
g) recomandări
 „în urma constatărilor, recomandăm ...”
h) rezumat
i) semnătură
 raportul neuropsihologic
a) informații de identificare
b) motivul trimiterii
c) istoria relevantă
d) rezumatul rapoartelor anterioare
e) interese curente
f) raportul sursă de informație
g) observații în timpul evaluării
h) rezultate
 intelect
 achiziții
 atenție
 memorie
 limbaj
 execuție
 deprinderi
 vizual-spațiale
 motricitate
 senzorial
 psihosocial
 rezumat și opinii
 recomandări
 anexe
 teste administrate
 secțiuni în raport
 informații demografice
 documentele analizate
 metodele de măsurare
 problemele/întrebările din biletul de trimitere
 informații de bază
 observații
 comportamentul în timpul testării
 descrierea rezultatelor
 integrarea informațiilor
 diagnoza
 recomandări privind intervenția
 semnătura
 anexe
 detalii
 date de identificare
 nume, prenume
 data nașterii
 vârstă
 școală, clasă, studii
 data examinării
 data întocmirii raportului
 instrumente utilizate
 teste
 motivul trimiterii
 instituția
 motivul solicitării
 probleme specifice, simptome
 căi de utilizare a rezultatelor
 informații de bază
 de la
o părinți
o cadre didactice
o dosare
 informații demografice
 probleme curente
 istoria dezvoltării
 familia de apartenență
 observarea în timpul măsurării
 conduita în timpul testării
 alte conduite
o acasă
o școală
 aspect
 reacții
 stilul limbajului
 dispoziție
 reacția la încurajare
 deprinderi
 rezultatele măsurării și impresii clinice
 factorii care au influențat rezultatele
o starea de oboseală
o starea de boală
 testele utilizate
 scorurile
 identificarea capacităților înalt, respectiv slab dezvoltate
 răspunsuri ilustrative
 semne de patologie
 excepționalități
o supradotare
o dizabilități
 interrelații între rezultate
 implicații între rezultate
 impresii diagnostice
 recomandări
 intervnții
 plasament
 tratament
 reabilitare
 lungimea raportului
 5-7 pag.
 judiciar: 7-10-20 pag.
 neuropsihologic: 7 pag.
 clinic: 1-30 pag.