Documente Academic
Documente Profesional
Documente Cultură
M. Popa
cuprins
Introducere
Similitudini cu regresia liniar
Caracteristici specifice regresiei logistice
Volumul eantionului
regresia logistic
Model de predicie n care VD (criteriu), este de natur
categorial
Mai multe VI
VD
dihotomic
RL
binomial simpl
RL
binomial multipl
VD
mai mult de dou categorii
RL
multinomial simpl
RL
multinomial multipl
Putem utiliza:
un singur predictor (regresie logistic simpl)
mai muli predictori (regresie logistic multipl).
avantaje
nu este condiionat de multe din restriciile
impuse de regresia liniar
Nu presupune existena unei relaii liniare ntre
criteriu i predictori.
VD (criteriul) nu trebuie s aib o distribuie normal
VD nu trebuie s aib o variabilitate omogen
(homoscedasticitate) n raport cu valorile variabilelor
independente.
Nu presupune distribuia normal a valorilor reziduale
Suport predictori msurai pe orice tip de scal
Atenie
interpretarea rezultatelor regresiei logistice
trebuie fcut cu reinere
modelul de predicie este limitat la predictorii
utilizai, dar pot exista i predictori care au fost,
voluntar sau nu, ignorai
capacitatea predictiv a modelului nu
funcioneaz dect n limitele de variaie a datelor
existente
predicia este nesigur pentru valori ale predictorilor
care nu au fost incluse n model
Volumul eantionului
n mod necesar, mare
minim 50 de subieci pentru fiecare predictor
sau 20-30 subieci/predictor n cazul unui eantion de
peste 300 de subieci (Wright, apud Sava, 2004);
cel puin 10 subieci/predictor, dar nu mai puin de 100 de
subieci n total (Long, apud DeMaris, 2003);
cel puin 150 de subieci (Braunstein, 2007)
pentru un nivel alfa 0.05, o mrime medie a efectului i o
putere de 0.80: un eantion de 300 subieci (Hsieh, Block,
& Larsen, 1998)
se poate ajunge chiar i la necesitatea unui eantion de
1000 de subieci pentru a se atinge o putere de 0.80
(Braunstein, 2007)
Numrul predictorilor
n general, mai puini dect n regresia liniar
multipl
pt. c VD exprimat categorial, conine mai puin
informaie
maxim o VI pentru fiecare 10 cazuri din eantion
dac exist VI categoriale, numrul VI va lua drept
referin numrul cazurilor aferente celei mai slab
reprezentate categorii
dac eantionul cuprinde 100 de brbai i 50 de femei, numrul
femeilor va fi luat drept referin
potrivit regulii 1/10, nu vom putea utiliza mai mult de 5 predictori
probabilitatea _ de _ aparitie
odds _ ratio
probabilitate _ de _ neaparitie
cuantific impactul predictorului asupra criteriului
De ex.:
eantion de 100 de delincveni minori
70 provin din familii dezorganizate (probabilitate=0.70)
30 provin din familii structurate (probabilitate=0.30)
TOTAL
Brbai
(odds)
Femei
(odds)
Raport ansa
odds ratio M/F
Odds ratio F/M
0.8/0.2=4.0
Accident
40
10
50
40/50=0.8
10/50=0.20
0.2/0.8=0.25
Non-accident
15
30
45
15/45=0.33
30/45=0.66
0.33/0.66=0.5
0.66/0.33=2
INSUCCES
90%
10%
10%
90%
SUCCES
0.20
0.50
0.80
1.28
1.87
2.68
Alegerea predictorilor
interesul principal:
predictori care au o ct mai mare for de predicie asupra criteriului
p
ln
1 p
eb0 b1 X
P(Y )
1 eb0 b1 X
e b0 b1 X 1 b2 X 2 bk X k
P(Y )
1 e b0 b1 X 1 b2 X 2 bk X k
eb0 b1 X
P(Y )
1 eb0 b1 X
Tema sptmnal
Cutai cel puin doua cercetri n care este utilizat
regresia logistic binomial