Explorați Cărți electronice
Categorii
Explorați Cărți audio
Categorii
Explorați Reviste
Categorii
Explorați Documente
Categorii
M. Popa
cuprins
Introducere
Similitudini cu regresia liniar Caracteristici specifice regresiei logistice Volumul eantionului
regresia logistic
Model de predicie n care VD (criteriu), este de natur categorial
Mai multe VI
RL binomial multipl RL multinomial multipl
a ctigat mult n popularitate n afara domeniului medical util cu precdere dac distribuia valorilor VD este neliniar n raport cu mai multe VI
atunci cnd valorile VI au o pondere diferit asupra VD De ex.: probabilitatea de a pica la un examen poate fi afectat n mai mic msur de o diferen de 2 uniti QI n cazul candidailor cu QI ridicat, dect n cazul celor cu QI mai sczut
2) Identificarea variabilelor care nu difereniaz ntre aceste grupuri 3) Efectuarea de predicii cu privire la probabilitatea ca un anumit individ (caz) s fac parte dintr-un grup sau altul
Predictorii categoriali trebuie declarai ca atare Impactul VI asupra VD este evaluat individual
dar este posibil i evaluarea efectului combinat a unor predictori asupra criteriului
regresia logistic estimeaz probabilitatea ca fiecare caz s fie inclus ntr-una sau alta din categoriile definite de VD (regresia liniar vizeaz predicia valorilor VD)
dac tim greutatea i nlimea unor persoane putem calcula probabilitatea ca fiecare dintre acestea s fie brbat sau femeie
nu se bazeaz pe minimalizarea sumei ptratelor, ci pe maximizarea ansei de apartenen a fiecrui caz la una sau alta din categoriile VD. Modelul grafic de predicie are o form special, care decurge din natura logaritmic a relaiei dintre valorile VI i VD
avantaje
nu este condiionat de multe din restriciile impuse de regresia liniar
Nu presupune existena unei relaii liniare ntre criteriu i predictori. VD (criteriul) nu trebuie s aib o distribuie normal. VD nu trebuie s aib o variabilitate omogen (homoscedasticitate) n raport cu valorile variabilelor independente. Nu presupune distribuia normal a valorilor reziduale. Suport predictori msurai pe orice tip de scal
Atenie
interpretarea rezultatelor regresiei logistice trebuie fcut cu reinere
modelul de predicie este limitat la predictorii utilizai, dar pot exista i predictori care au fost, voluntar sau nu, ignorai capacitatea predictiv a modelului nu funcioneaz dect n limitele de variaie a datelor existente
predicia fiind nesigur pentru valori ale predictorilor care nu au fost incluse n model
Volumul eantionului
Impune un volum mai mare al eantionului minim 50 de subieci pentru fiecare predictor sau 20-30 subieci/predictor n cazul unui eantion de peste 300 de subieci (Wright, apud Sava, 2004); cel puin 10 subieci/predictor, dar nu mai puin de 100 de subieci n total (Long, apud DeMaris, 2003); cel puin 150 de subieci (Braunstein, 2007) pentru un nivel alfa 0.05, o mrime medie a efectului i o putere de 0.80: un eantion de 300 subieci (Hsieh, Block, & Larsen, 1998) se poate ajunge chiar i la necesitatea unui eantion de 1000 de subieci pentru a se atinge o putere de 0.80 (Braunstein, 2007)
Numrul predictorilor
trebuie s fie mai mic dect n regresia liniar
pt. c VD exprimat categorial, conine mai puin informaie maxim o VI pentru fiecare 10 cazuri din eantion dac exist VI categoriale, numrul VI se va lua drept referin numrul cazurilor aferente celei mai slab reprezentate categorii
dac eantionul cuprinde 100 de brbai i 50 de femei, numrul femeilor va fi luat drept referin potrivit regulii 1/10, nu vom putea utiliza mai mult de 5 predictori
M 40 15
F 10 30
TOTAL 50 45
Brbai
40/(40+10)=0.8 (80%)
Femei
10/(40+10)=0.20 (20%)
Accident
Nonaccident
15/(15+30)=0.3 3 (33%)
30/(15+30)=0.66 (66%)
Brbaii, comparativ cu femeile, au de 4 ori mai multe anse s fac accident n primul an
PROBABILITATEA DE ACCIDENT PENTRU BRBAI:
Odds/(1+0dds)=4/(1+4)=0.80
Brbaii, comparativ cu femeile, au de 0.5 ori mai puine anse s nu fac accident n primul an
PROBABILITATEA DE NON-ACCIDENT PENTRU BRBAI:
Odds ratio/(1+0dds ratio)=0.5/(1+0.5)=0.33
INSUCCES
90% 70% 50% 30% 10%
10%
90%
SUCCES
la fel ca i coeficientul R2 din regresia liniar, coeficienii R2 din regresia logistic pot fi interpretai ca procentul varianei VD ce este explicat de variana VI SPSS calculeaz doi coeficieni de mrime a efectului:
R2 al lui Cox & Snell R2 al lui Nagelkerke
Coeficienii odds ratio au semnificaia unor indici de mrime a efectului pentru fiecare predictor n parte:
d Cohen
0.50 1.87
0.80 2.68
Alegerea predictorilor
interesul principal:
predictori care au o ct mai mare for de predicie asupra criteriului
invocarea unor argumente teoretice, sprijinul pe rezultate ale unor cercetri anterioare sau statistici bivariate ntre VD i fiecare VI n parte (testul t, chi-ptrat, .a.) Intuiie interaciunea predictorilor este un fapt nedorit
Totui, se pot introduce n model i interaciuni ntre predictori metod utilizat cu precauie
p ln 1 p
Tema sptmnal
Cutai cel puin doua cercetri n care este utilizat regresia logistic binomial.