Documente Academic
Documente Profesional
Documente Cultură
Tematica
Conceptele de măsurare, evaluare in psihologie.
Istoric al evaluării psihologice. Definiţii ale testului psihologic.
Tipuri de teste psihologice. Scopuri ale evaluării psihologice.
Evaluarea psihologică: indici statistici de măsurare/evaluare.
Scale de măsură. Standardizarea.
Etalonarea testelor. Tipuri de norme utilizate in evaluarea psihologica si
semnificaţia acestora.
Fidelitatea testului psihologic. Definiţia fidelităţii. Tipuri de fidelitate.
Validitatea testului psihologic. Definiţia validităţii. Tipuri de validitate: de
conţinut (analiza de itemi - analiza diferiţilor indici), de criteriu, de
construct. Modalităţi de influenţare a validităţii unui test.
Utilitatea diagnostică a unui test psihologic. Sensibilitatatea unui test
psihologic. Specificitatea unui test psihologic. Puterea de predicţie a unui
test psihologic.
Adaptarea testelor psihologice
EVALUARE VS. TESTARE
PSIHOLOGICA
TESTUL PSIHOLOGIC
4
Testarea psihologica
• Testarea psihologica - procesul de administrare,
cotare si interpretarea a rezultatelor unui
instrument (de obicei test) psihologic.
• Testul psihologic ca instrument de evaluare.
• Predictiile pe care le facem pe baza unui test
iau in considerare doar o singura sursa si
anume testul respectiv.
• Predictiile pe care le facem pe baza unei
evaluări psihologice ţin seama de o multitudine
de surse de informaţie (incluzând bineinteles si
testarea psihologica)
6
Diagnostic
• Diagnostic – „termenul
medical pentru clasificare”
(Guze, 1978)
• Ex. categoriile nosologice
clinice
7
Diagnostic - exemplu
8
Instrumente de evaluare/diagnostic
• Metode multiple
• Psihometrice vs. nepsihometrice
• Instrumente de evaluare?
12
Instrumente de evaluare
• Testul psihologic
• Scale, inventare
• Interviul
• Observatia
• Portofoliul
• Teste situationale
• Case study
13
Testul psihologic
Testul psihologic
• Testul reprezintă o măsură obiectivă şi
standardizată a unui eşantion de comportament
(A. Anastasi, 1976).
• instrument de evaluare;
• vizează un eşantion de comportament;
• implică o procedură standard privind
administrarea, cotarea şi interpretarea
rezultatelor
16
Sumarizare
• Testare psihologica
• Evaluare psihologica
• Diagnostic – tulburari mentale
Evaluarea psihologica
• Ce este
• Scop si intrebare de referinta
• Metode/tehnici
Asumptia 1
Trasaturile psihologice exista
Diferente culturale
Diferente biologice
Sisteme de clasificare Diferente psihologice
……
21
Metoda
Teorii ale inteligenţei,
testelor
personalităţii, psihopatologiei
etc..
Asumptia 2
Asumptia 3
Pe baza rezultatelor la test se fac inferenţe despre
comportamentele „non-test”.
comportamente prezente
comportamente viitoare
Generalizarea
Validitatea
25
Asumptia 4
Instrumentele de evaluare psihologica au calitati si limite
• Cunoasterea acestora
• Utilitatea diferitelor metode de evaluare ale unui construct
26
Asumptia 4
Utilitatea diferitelor metode de evaluare ale unui construct
1. Au la baza teorii psihologice diferite
2. Pot sa vizeze dimensiuni diferite ale constructului
3. Pot sa fie destinate a fi aplicate in medii diferite/populatii
diferite
4. Pot sa aiba scopuri diferite
27
Rorschach’s “Ink
blot test”
Asumptia 4.1 - exemplu
Asumptia 4.1 - exemplu
• Critici ale testelor proiective:
• Consistenta interna scazuta, fidelitate test-retest mica
diagnosticul
Asumptia 5
Orice instrument de evaluare isi asuma o anumita eroare
• Fidelitatea testelor poate oferi informatii despre erorile asociate
unei masuratori
• Care sunt implicatiile erorilor ?
40
Asumptia 6
Testarea/evaluarea pot fi realizate intr-o maniera corecta
(fair/unbiased)
• Studiile de validitate
41
Asumptia 7
Testarea si evaluarea pot sa ofere informatii utile
pentru societate
Testul psihologic
• Testul reprezintă o măsură obiectivă şi standardizată a
unui eşantion de comportament (A. Anastasi, 1976).
• instrument de evaluare;
• implică o procedură standard privind administrarea, cotarea şi
interpretarea rezultatelor
• eşantion de posibile manifestări sau expresii ale constructului latent
44
Testul psihologic
The Job Satisfaction Survey (Spector, 1998):
• Consider că sunt plătit(ă) corect pentru munca pe
care o fac. (itemul 1)
• Superiorul meu este competent în munca pe care
o depune. (itemul 3)
• Îmi plac oamenii cu care lucrez. (itemul 7)
• Sunt mândru de munca pe care o fac. (itemul 27)
Considerarea concomitentă a mai multor itemi
relevanţi pentru respectivul construct.
45
Testul psihologic
Colectie de itemi
•Item = stimul specific care determină un anumit
comportament ce poate fi cotat şi evaluat independent
46
Persoanele evaluate
• Drepturi ale persoanei evaluate
• Dreptul de a alege testarea ca procedura de evaluare
• Dreptul de a cunoaste rezultatele
• Respectarea intimitatii
• Dreptul de a nu fi stigmatizat
• Dreptul la confidentialitate
Incotro?
• Proliferarea de noi teste
• Standarde mai înalte
• Tehnologie îmbunătățită
• Testare computerizată
• Testare pe internet
• Utilizarea realității virtuale
61
• Inferenta
• Esantion Populatie
• Necesitatea existentei usor esantioane
reprezentative pe baza unor variabile
relevante pentru instrument
• Cum sunt acestea stabilite?
• Caracteristicile populatiei (vezi definirea acesteia) cât
si de caracteristicile constructului măsurat de test.
• Exemple
1. Definirea populaţiei
400
300
200
Frequency
100 Std. Dev = 10.04
Mean = 28.3
0 N = 2473.00
0.0 10.0 20.0 30.0 40.0 50.0 60.0
5.0 15.0 25.0 35.0 45.0 55.0
• z=(x-media)/ab. std
• x=scorul brut la test
Tipuri de scoruri
• Transformările scorurilor pot fi liniare sau non-liniare.
(1) Transformările liniare implică utilizarea mediilor şi
abaterilor standard şi a scorurilor brute
(2) Transformările non-liniare sunt acelea care alterează
forma distribuţiei şi, implicit corelaţiile constructelor
măsurate cu alte dimensiuni sau criterii externe.
Cu excepţia scorurilor standardizate, toate celelalte
categorii de scoruri sunt bazate pe transformări
non-liniare (Allen & Yen, 2002).
96
Transformările liniare
• Au la bază distribuția normală a datelor
• Utilizează scorul z și derivatele sale
97
Transformările non-liniare
• Alterează forma distribuţiei şi, implicit corelaţiile
constructelor măsurate cu alte dimensiuni sau criterii
externe.
98
Centilele/Percentile
• Centilele sunt scoruri standardizate – adică sunt obţinute
prin raportarea la un etalon – dar nu sunt obţinute prin
transformare liniară.
• Sunt obţinute prin raportarea scorului brut la o ierarhie
ipotetică de 100 clase egale.
99
Centilele/Percentile
• Scoruri procentuale
• Rangurile percentile
• Indica procentul din populatie care se afla sub un anumit
scor
• Percentile 100 de clase egale
• Decile 10 clase egale
• Quartile 4 clase egale
100
Rangul percentil
• Ranguri sau pozitii in grupul de subiecti
• Cate persoane s-ar afla in urma unui subiect daca
acesta ar face parte dintr-un grup de 100 de subiecti
• Valori intre 1 si 99
• P95 = 95% din subiecti au scoruri mai mici decat tine
• P30 = 30%din subiecti au scoruri mai mici decat tine
101
Calcul percentile
50, 65, 70, 72, 72, 78, 80, 82, 84, 84, 85, 86, 88, 88, 90, 94,
96, 98, 98, 99.
Gasiti percentilul pentru scorul 84 din test.
• Ordonare; localizare valoare 84.
• Formula: (n+0.5*e)/N*100
(8+0.5*2)/20*100=9/20=45%
Scorului 84 ii corespunde percentilul 45
45% dintre subiecti au avut scoruri mai mici decat 84
102
103
Scorurile procentuale
• Rangurile percentile
• Indica procentul din populatie care se afla sub un anumit
scor
• Percentile 100 de clase egale - Cate persoane s-ar afla in urma
unui subiect daca acesta ar face parte dintr-un grup de 100 de
subiecti
• Decile 10 clase egale
• Quartile 4 clase egale
104
Decile
• 10 clase
• Decil 1 – 1-10 %
• Decil 2 – 11-20%
• Decil 3…9
• Decil 10 – 91-100%
105
Quartile
• 4 clase
• Quartil 1 – 1-25 %
• Quartil 2 – 26-50%
• Quartil 3 – 51-75%
• Quartil 4 – 76-100%
106
Rang
Scor Scor
ID Scor T Perce
brut Z
ntil
1 45 0.806 58.1 P 79
2 36 -0.645 43.5 P 26
3 38 -0.323 46.8 P 37t
4 42 0.323 53.2 P 63
5 41 0.161 51.6 P 56t
6 46 0.968 59.7 P 83
7 38 -0.323 46.8 P 37
8 25 -2.419 25.8 P1
9 49 1.452 64.5 P 93
107
108
Clasele normalizate
• Modifica procentul de subiecti care intra in fiecare
clasa astfel:
• 5 clase: 7%, 24%, 38%, 24%, 7%
• 7 clase: 5, 11%, 21%, 26%, 21%, 11%, 5%,
• 9 clase (stanine):
• 4%, 7%, 12%, 17%, 20%, 17%, 12%, 7%, 4%,
110
Staninele
111
Scoruri stanine
112
Scoruri stanine
113
Calcul stanine
Pasi:
1. se ordoneaza scorurile;
2. se stabileste frecventa pentru fiecare scor;
3. se stabileste frecventa cumulata;
4. se calculează procentul fiecărei clase;
5. se face corespondenta scor + procent din distributia de
frecventă cumulată;
Exemplu – se va realiza la seminar
Să presupunem că un test a fost aplicat la 325 de subiecţi.
Scorul maxim al testului este 42 iar scorul minim este
2.
114
115
7 clase normalizate
26%
21% 21%
11%
5% 11%
5%
116
Metode de etalonare/normare
• Analiza modului in care sunt organizate datele
• Tipul distributiei
400
300
200
Frequency
100 Std. Dev = 10.04
Mean = 28.3
0 N = 2473.00
0.0 10.0 20.0 30.0 40.0 50.0 60.0
5.0 15.0 25.0 35.0 45.0 55.0
Tipul distributiei
• Teste/chestionare care au la baza distributii normale
• Simplifică interpretarea scorurilor individuale la un test.
• In cazul distributiei normale media, mediana sşi modul au aceeasi
valoare
Metode de etalonare/normare
• 1. Norme – interpretarea testului in raport cu
norma/grupul din care face parte subiectul.
(1) Transformările liniare implică utilizarea mediilor şi abaterilor standard şi a
scorurilor brute
(2) Transformările non-liniare sunt acelea care alterează forma distribuţiei şi,
implicit corelaţiile constructelor măsurate cu alte dimensiuni sau criterii externe.
Scoruri criteriale
• Scoruri criteriale bazate pe convenţii diagnostice (analiza
itemilor critici)
• Scoruri criteriale bazate pe teorie
120
TESTELOR
PSIHOLOGICE
Măsurarea în științe
The meter (m) is the Si unit of length and is defined as the
length of the path traveled by light in vacuum during the
time interval of 1/299 792 458 of a second.
This replaces the two previous definitions of the meter: the
original adopted by CGPM in 1889 based on a platinum-
iridium prototype bar, and a definition adopted in 1960
based on a krypton-86 radiation from an electrical
discharge lamp. In each case, the change in definition
achieved not only an increase in accuracy, but also
progress toward the goal of using fundamental physical
quantities as standards, in particular, the quantum
mechanical characteristics of atomic systems.
• - Taylor,1991.
Ce este fidelitatea
• Proprietate fundamentala a scorurilor de instrumentele de
evaluare
• “Incredere”
• Lipsa erorilor
Scorul la test
• Orice scor la un test psihologic este rezultatul scorului
real şi al unei erori de măsură:
Xobservat = Xreal + e
(e = eroarea de măsură)
• Deviaţii (+/-) de la performanţa reală a subiectului
• Erori aleatoare vs. erori constante
Surse de eroare
• Reflectie:
• Care ar putea fi sursele care determina erori in rezultatul la test?
• Reamintiti-va un test pe care l-ati parcurs recent si identificati cat
din rezultat este datorat abilitatii reale si cat este datorat altor surse
Surse de eroare
• Continutul testului
• Administrarea testului (mediu, persoana examinata,
evaluator)
• Cotarea si interpretarea rezultatelor la test
Tipuri de fidelitate şi metode de calcul a
fidelităţii unui test
• Metoda consistenţei interne
• coeficientul de consistenţă internă
• Fidelitate test-retest
• coeficient de stabilitate
• Metoda formelor paralele
• coeficient de echivalenţă
• Metoda fidelităţii interevaluatori
• coeficient interevaluatori
Metoda consistenţei interne
Intrebarea la care raspunde
CAT DE OMOGEN ESTE UN INSTRUMENT?
Exemple:
Consistenta interna - omogenitate
• Item 1 – Reactualizati 2, 7, 9
• Item 2 - Reactualizati 1, 8, 2, 4
• Item 3- Reactualizati 6, 5, 9, 3, 8
• Item 4 - Reactualizati 7, 3, 6, 2, 1
• Item 5 – Vă place să realizați proiecte de grup?
Reliability
• Metodă utilizată pentru a determina gradul în care toţi itemii
unui test măsoară aceeaşi variabilă
• Un coeficient de consistenţă ridicat exprimă faptul că toţi itemii
testului se referă la aceeaşi variabilă
• Valori intre 0 si 1
• Presupune o singură aplicare a testului
• Coeficienţii de consistenţă internă cei mai des utilizaţi:
• Alpha Cronbach (α) pentru testele cu orice tip de itemi; cel
mai des utilizat pentru evaluări obiective
• λ3 Guttman;
• ρ20 şi ρ21 Kuder Richardson (dacă itemii testului sunt
binari).
Alpha Cronbach - valoare
Valoarea minima acceptata a coeficientilor de
consistenta interna este 0.60
Alpha Cronbach scazut – de ce?
• Măsoară aspecte diferite – constructe diferite/dimensiuni
diferite ale constructului
Alpha Cronbach scazut – de ce?
• Formularea itemilor – itemii formulați neclar/general
• Exemplu
• 1. Este insuportabil să eşuez în lucruri importante şi nu suport să
nu reuşesc să le fac.
• 2. Nu pot suporta lipsa de consideraţia din partea altor persoane şi
nu pot tolera ideea că ar putea fi incorecţi.
• 3. Este de nesuportat să mă simt inconfortabil(ă), tensionat(ă) sau
nervos (nervoasă) şi nu suport să fiu aşa atunci când sunt.
• Itemi foarte grei/foarte ușori
• Ghicirea răspunsurilor
• Numărul mic de itemi
Alpha Cronbach
• Se calculeaza cu programe statistice
• Ex, SPSS
• Exemplu SPSS
Alpha Cronbach - discutii
• Teste cu mai multe subscale
• Subscala 1
• Subscala 2 …
INTERVALELE DE
INCREDERE
Fidelitatea
• Fidelitatea reprezintă tradiţional: “precizia, consistenţa
şi stabilitatea măsurării realizate de test".
• Repetabilitate a rezultatelor măsurării.
• “Gradul în care scorurile testului sunt consistente
sau repetabile, adică gradul în care ele nu sunt
afectate de erorile de măsură“ (Standards for
Educational and Psychological Tests, 1985)
• Scopul măsurării este de a găsi scorul real al persoanei şi
a reduce eroarea de măsurare
Scorul la test
• Orice scor la un test psihologic este rezultatul scorului
real şi al unei erori de măsură:
Xobservat = Xreal + e
(e = eroarea de măsură)
• Deviaţii (+/-) de la performanţa reală a subiectului
• Erori aleatoare vs. erori constante
Erorile aleatoare
• Random error
IC = Xobservat + z*SEm
Eroarea standard de masura
• Este abaterea standard a unui scor obţinut referitor la scorul real
• Ce este: abaterea standard a scorurilor obținute o persoană la
aplicări repetate ale testului, fără a memora, fără a învăța
răspunsurile
• Cu cât e mai mică eroarea standard de măsură, cu atât e mai fidel
testul
(1 − r )
SEm = SD*
• SEm= eroarea standard de măsură
• SD= abaterea standard a scorurilor la test;
• r = coeficientul de fidelitate al testului
Calculul intervalului de încredere (IC)
IC = Xobservat + z*SEm
Observaţii practice:
• Fidelitatea chestionarelor de personalitate şi a celor de interese
tinde să fie mai mică decât cea a testelor cognitive (de cunoştinţe, de
inteligenţă, de aptitudini speciale, Aiken, 1994).
• În general, se întâlnesc de obicei coeficienţi de fidelitate
cuprinşi între 0.70 şi 0.98 (Guilford, 1965).
• Testele cotate obiectiv care măsoară aptitudini cognitive pot
furniza, în loturi eterogene de persoane, coeficienţi de fidelitate mai
mari decât 0.8.
Interpretarea coeficienţilor de fidelitate
Testele cotate subiectiv care măsoară aptitudini, testele
de cunoştinţe şi cele care evaluează performanţe tipice
(de exemplu chestionare de personalitate) au, adesea,
coeficienţi de fidelitate mai mici decât 0.80 (Traub, 1994).
• Testele standardizate de cunoştinţe au, în general, o
fidelitate mare spre moderată.
• Testele cu alegere multiplă pot avea o fidelitate mai
scăzută. Coeficientul lor de fidelitate este apropiat de
0.75.
• În practică se folosesc adesea teste care sunt
valide pentru populaţia şi situaţia în care sunt
administrate, dar care nu au coeficienţi de fidelitate
foarte mari.
VALIDITATEA TESTELOR
PSIHOLOGICE
Definiţia validităţii
• validitate de criteriu
• validitate de conţinut
• validitate de construct
(Anastasi, 1976; Cohen, et. all, 2000)
• Validarea de criteriu
• Validitate concurenta
• Validitate predictivă
• Validitate incrementala
• Studii de validare
A. Validitatea de criteriu (validitate empirică)
Indică măsura în care testul este un bun predictor pentru
un eşantion de comportamente
• Compararea scorurilor la test cu alte criterii cantitative
definite
• Testul poate sau nu să măsoare acelaşi construct
• Performanţa la un test (predictor) trebuie raportată la o
altă performanţă pe care o numim criteriu
Criteriul este definit ca standardul la care este raportată
performanţa la un test.
Un test psihologic este adecvat dacă este relaţionat cu un
criteriu şi deci poate fi considerat un bun substitut al
criteriului - testul este predictor pentru criteriul respectiv
Caracteristicile unui criteriu
1. Validitatea predictivă
= acurateţea cu care putem estima în ce măsură o anumită
caracteristică sau aptitudine a unei persoane se va manifesta în viitor
pe baza măsurii în care persoana posedă o serie de caracteristici sau
aptitudini curente
2. Validitatea concurentă
= rezultatele predictorului (testului) sunt obţinute simultan
cu rezultatele la criteriu
• Exprimă în ce măsură scorurile la test pot fi utilizate
pentru a estima performanţa actuală a unei persoane la
un anumit criteriu
Tipuri de validitate de criteriu
• https://www.youtube.com/watch?v=N2J4sLntcww
Concluzii
• Ce este validitatea?
• Validarea de criteriu
• Validitate concurenta
• Validitate predictivă
• Validitate incrementala
• Studii de validare
• Concepte:
• predictor (testul pe car doresc sa il validez),
• criteriu (standardul la care raportez predictorul)
VALIDITATEA DE CRITERIU
UTILITATEA DIAGNOSTICA
Validitatea de criteriu
• Ce este?
• Validarea de criteriu
• Validitate concurenta
• Validitate predictivă
• Validitate incrementala
• Studii de validare
• Concepte:
• predictor (testul pe car doresc sa il validez),
• criteriu (standardul la care raportez predictorul)
Diagnostic
• Abordarea continua vs. categoriala a criteriului
• Exemple?
• Abordarea categoriala
• Prezent vs. absent
Validarea de criteriu pentru teste diagnostice
Prezent AP FN
(da) (Adevărat pozitiv) (Fals negativ)
(Hit) a (Miss) c
Criteriu
Diagnostic
FP AN
Absent (Alarme false) (Adevărat negativ)
(nu) (False Alarm) (True Negative)
b d
Utilitatea diagnostică
CONCEPTE:
• Adevăraţi pozitivi (Hits) - AP
• Adevăraţi negativi - AN
• Falşi pozitivi (false alarm) - FP
• Falşi negativi (Miss) - FN
• Utilitatea diagnostică
Sensibilitatea
• Proportia de cazuri adevarat pozitive identificate de test
• The proportion of people who have the disorder who test
positive
• a/(a+c)
• Ce proporţie de depresivi diagnostichează instrumentul
nostru din cazurile de depresivi reale - identificate de
criteriu (DSM)?
• O sensibilitate de 0.88 sau 88% ne indică faptul în 12%
din cazuri testul nostru nu identifică depresia când ea
există – dacă luăm criteriul diagnostic DSM - Cat la suta
dintre cei depresivi sunt diagnosticaţi de testul nostru ca
având depresie?
Rezultatul la un test pe care dorim sa il
validam
Pozitiv Negativ
Prezent AP FN
(da) (Adevărat pozitiv) (Fals negativ)
(Hit) a (Miss) c
Criteriu
Diagnostic
FP AN
Absent (Alarme false) (Adevărat negativ)
(nu) (False Alarm) (True Negative)
b d
Instrument foarte sensibil
Sensibilitatea = AP/(AP+FN)= 1
Test
Da Nu
Criteriu
Da 80 0
Nu
10 20
Instrument putin sensibil
la nivelul sansei!
Sensibilitatea =AP/(AP+FN)= 0,5
Test
Da Nu
Criteriu
Da 50 50
Nu
0 0
Specificitatea
• Proportia de persoane care nu au tulburarea si au rezultat
negativ la test
• The proportion of people who do not have the disorder
who test negative
• d/(b+d)
Prezent AP FN
(da) (Adevărat pozitiv) (Fals negativ)
(Hit) a (Miss) c
Criteriu
Diagnostic
FP AN
Absent (Alarme false) (Adevărat negativ)
(nu) (False Alarm) (True Negative)
b d
SPECIFICITATEA
Specificitatea =AN/(AN+FP)= 1
Test
Da Nu
Criteriu
Da 20 0
Nu
0 80
Puterea de predicţie pozitivă (PPP)
• Exprimă probabilitatea unui diagnostic pe baza unui
rezultat pozitiv la un test
• O PPP de 0.64 indică faptul că testul supraestimează
cazurile de depresie reale.
Rezultatul la un test pe care dorim sa il
validam
Pozitiv Negativ
Prezent AP FN
(da) (Adevărat pozitiv) (Fals negativ)
(Hit) a (Miss) c
Criteriu
Diagnostic
FP AN
Absent (Alarme false) (Adevărat negativ)
(nu) (False Alarm) (True Negative)
b d
PUTEREA DE PREDICŢIE POZITIVĂ
PPP =AP/(AP+FP)= 1
Test
Da Nu
Criteriu
Da 80 10
Nu
0 20
Puterea de predicţie negativă (PPN)
• probabilitatea unui diagnostic pe baza unui rezultat
negativ la test
Rezultatul la un test pe care dorim sa il
validam
Pozitiv Negativ
Prezent AP FN
(da) (Adevărat pozitiv) (Fals negativ)
(Hit) a (Miss) c
Criteriu
Diagnostic
FP AN
Absent (Alarme false) (Adevărat negativ)
(nu) (False Alarm) (True Negative)
b d
PUTEREA DE PREDICŢIE NEGATIVĂ
PPN =AN/(AN+FN)= 1
Test
Da Nu
Criteriu
Da 15 0
Nu
15 10
Utilitatea diagnostica
• Proporţia celor corect clasificaţi (AP+AN) raportată la
numărul total de cazuri (AP+AN+FP+FN).
• O utilitate diagnostică de 0.81 indică faptul că în 81% din
cazuri testul face un diagnostic bun, şi greşeşte în 19%
din cazuri.
Prevalenta
• Proportia de persoane care are in mod real tulburarea
• (a+c)/(a+b+c+d)
Rezultatul la un test pe care dorim sa il
validam
Pozitiv Negativ
Prezent AP FN
(da) (Adevărat pozitiv) (Fals negativ)
(Hit) a (Miss) c
Criteriu
Diagnostic
FP AN
Absent (Alarme false) (Adevărat negativ)
(nu) (False Alarm) (True Negative)
b d
UTILITATEA TESTULUI
UTILITATEA =AP + AN/ N = 0,62
Test
Da Nu
Criteriu
Da 15 0
Nu
15 10
Prag de decizie diagnostica
• Cum se stabilieste care este scorul la care putem decide
daca subiectul are sau nu un diagnostic? (da nu)
• Care este pragul la care vom decide?
• Verificarea utilitatii pragului se face pe baza teoriei
detectarii semnalului
• Relatia dintre sensibilitate si specificitate
Analiza ROC
• ROC = Receiver Operating Characteristic
Exemplu specific
Fara Cu
tulburare tulburare
Rezultatul la test
Pragul
Rezultatul la test
Categorii
Adevarati
pozitivi
Rezultatul la
test
Fara diagnostic
Cu diagnostic
Numim acestia “negativi” Numim acestia “pozitivi”
Rezultatul la Falsi
test Pozitivi
Fara dg
Cu dg
Numim acestia “negativi” Numim acestia “pozitivi”
Adevarati
negativi
Rezultatul la test
Fara diagnostic
Cu diagnostic
Numim acestia “negativi” Numim acestia “pozitivi”
Falsi
negativi
Rezultatul la test
Fara diagnostic
Cu diagnostic
Mutarea pragului : dreapta
‘‘-
‘‘-’’ ‘‘+’’
Rezultatul la test
Fara diagnostic
Cu diagnostic
Mutarea pragului : stanga
‘‘-
‘‘-’’ ‘‘+’’
Rezultat la test
Fara diagnostic
Cu diagnostic
ROC curve
100%
True Positive Rate
(sensitivity)
0%
0% 100%
False Positive Rate
(1-specificity)
Comparatii curbe ROC
100% 100%
True Positive Rate
True Positive
Rate
0
0 %
% 0 100
0 100 False Positive %
False Positive % %
% Rate
Rate
• Forme:
• Validitate predictiva
• Validitate concurenta
Sarcini de invatare
• Bibliografie obligatorie:
• Hajian-Tilaki, K. (2013). Receiver operating characteristic (ROC)
curve analysis for medical diagnostic test evaluation. Caspian
journal of internal medicine, 4(2), 627.
• Propuneti diferite modalitati prin care puteti evidentia
validitatea de criteriu testelor psihologice care măsoară
simptome clinice
Validitatea de construct
Validitatea de construct
• "the truth, the whole truth and nothing but the truth."
1. CONCEPTE ŞI DEFINIRE
2. OBIECTIVE
3. ALGORITM
AFE îşi propune studiul ordinii şi structurii unei colecţii de date
numeroase
DOMENIU POPULAŢIE
(larg sau restrâns)
- se aleg variabilele care - selecţia
trebuie măsurate = eşantionului pt. AF
ATRIBUTE DE
SUPRAFAŢĂ
Erorile de măsură
• asociate observării AS
Atribute interne sau factori
Factor unic =
Factor specific + factor determinat de ERM
• Atribute de suprafaţă
• Atribute interne sau factori
• Factor comun
• Factor specific
• Factor determinat de ERM
• Factor unic
Factori şi varianţa atributelor de suprafaţă
Atribute de suprafaţă
Factori specifici
(atribute interne)
Factori ERM
OBIECTIVELE ANALIZEI
FACTORIALE
• Identificarea factorilor adiacenţi variabilelor de
suprafaţă;
• Screeningul variabilelor;
• Sumarizarea datelor;
• Selecţia variabilelor;
Cum se realizează AFE?
1. Colecţia de date – matricea originală.
2. Matricea de corelaţie.
3. Matricea factorială.
1. Colecţia de date – matricea originală
Variabile
Observaţii
V1 V2 V3 ...... Vk
O1
O2
O3
Date observaţionale
...
On
2. Matricea de corelaţie
Variabile
Variabile
V1 V2 V3 ...... Vk
V1
V2
V3
Coeficienţi de
...
corelaţie
Vk
3. Matricea factorială
Factori
Variabile
F1 F2 ...... Fm
V1
V2
V3
Încărcare factorială
...
Vk
Matricea de intercorelaţie
Variabile
Variabile
Lovire Viteză Apucare Citire
Lovire --
Viteză .78 --
Lovire --
Viteză .78 --
Lovire --
Viteză .78 --
F2: aptitudinea
.65
Apucare .77 -- academică
• Alcohol myopia theory conceptualizes the ability of alcohol to narrow attention and
how this demand on mental resources produces the impairments of self-
inflation, relief, and excess.
• http://psycnet.apa.org/fulltext/2013-15695-001.html
Proceduri de estimare
• Analiza factoriala
• Metoda trasaturi multiple metode multiple
Metoda trasaturi multiple metode
multiple
1. Validitate convergentă = evaluează aceleaşi constructe
ca şi alte teste, adică dacă între scorurile sale şi
scorurile altor teste există o relaţie funcţională
a. a dărui
b. a privi
c. a păstra
d. a încasa
e. a strivi
f. a surprinde
c. Scala Likert
• 5 sau 7 gradatii
Contexte?
ITC - cerinte
18 cerinte
- Preconditii (3)
- Administrarea (2)