Modelos de probabilidad lineal, logit y probit para analizar el consumo de cigarrillos en mujeres embarazadas

ECONOMETRIA 2 - ECON 3301 - SEMESTRE II - 08
Profesor: Ramón Rosales; rrosales@uniandes.edu.co

Profesor Taller: William Delgado; w-delgad@uniandes.edu.co
Profesor Taller: Juan Carlos Vasquez; jvasquez@uniandes.edu.co
Profesor Taller: Diego Marino; dmarino@uniandes.edu.co
Monitor: Alejandro Urrego; j-urrego@uniandes.edu.co
Monitor: Juan Sebastián Sánchez; jua-sanc@uniandes.edu.co
Monitor: Francisco Correa; fr-corre@uniandes.edu.co
Monitor: Carlos Morales; and-mora@uniandes.edu.co
EJC 16C: PROBABILIDAD LINEAL-LOGIT-PROBIT.

Wooldridge,
Considere una muestra de 1388 observaciones relacionada con el consumo de

cigarrillo en mujeres embarazadas. Mediante este ejercicio se desea analizar si
características socioeconómicas tales como la educación de la madre, la raza y el
ingreso familiar, inciden o ayudan a determinar la probabilidad de que una mujer
fume durante su embarazo. Para ello se estimarán los modelos de probabilidad
lineal, logit y probit.
Descripción de los datos

>emplos\MPL, logit, Probit\BWGHT.DTA
obs: 1,388
vars: 14
size: 55,520 (99.5% of memory free)
-------------------------------------------------------------------------------
storage display value
variable name type format label variable label
-------------------------------------------------------------------------------
faminc float %9.0g 1988 family income, $1000s
cigtax float %9.0g cig. tax in home state, 1988
cigprice float %9.0g cig. price in home state, 1988
bwght int %8.0g birth weight, ounces
fatheduc byte %8.0g father's yrs of educ
motheduc byte %8.0g mother's yrs of educ
parity byte %8.0g birth order of child
male byte %8.0g =1 if male child
white byte %8.0g =1 if white
cigs byte %8.0g cigs smked per day while preg
lbwght float %9.0g log of bwght
bwghtlbs float %9.0g birth weight, pounds
packs float %9.0g packs smked per day while preg
lfaminc float %9.0g log(faminc)
-------------------------------------------------------------------------------
Sorted by:
Se tiene la variable cualitativa si la mujer fumaba o no durante el embarazo. En este caso si fuma
se asigna 1 y cero en caso contrario.
El Modelo de Probabilidad lineal
. reg smokes motheduc white lfaminc
Source | SS df MS Number of obs = 1387

-------------+------------------------------ F( 3, 1383) = 31.05
Model | 11.3314741 3 3.77715803 Prob > F = 0.0000
Residual | 168.264777 1383 .121666505 R-squared = 0.0631
-------------+------------------------------ Adj R-squared = 0.0611
Total | 179.596251 1386 .129578825 Root MSE = .34881
1
------------------------------------------------------------------------------
smokes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
motheduc | -.0293207 .0043342 -6.76 0.000 -.0378229 -.0208184
white | .048364 .0243837 1.98 0.048 .0005309 .096197
lfaminc | -.0427425 .0119231 -3.58 0.000 -.0661318 -.0193532
_cons | .6255033 .0537477 11.64 0.000 .5200675 .730939
------------------------------------------------------------------------------
Uno de los problemas con el modelo de probabilidad lineal es que las probabilidades predichas
pueden ser menores que cero o mayores que uno y que los efectos marginales son constantes.
Predicción de las probabilidades del Modelo de probabilidad lineal.
. predict smo1
(option xb assumed; fitted values)
(1 missing value generated)
. sum smokes smo1
Variable | Obs Mean Std. Dev. Min Max

-------------+--------------------------------------------------------
smokes | 1388 .1527378 .3598642 0 1
smo1 | 1387 .1528479 .0904194 -.0806922 .615532
Note en este caso que existen probabilidades predichas por debajo de cero
El Modelo logit
. logit smokes motheduc white lfaminc
Iteration 0: log likelihood = -593.10529

Logistic regression Number of obs = 1387

LR chi2(3) = 88.74
Prob > chi2 = 0.0000
Log likelihood = -548.73367 Pseudo R2 = 0.0748
------------------------------------------------------------------------------
smokes | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
motheduc | -.2518731 .0372045 -6.77 0.000 -.3247925 -.1789536
white | .3438842 .2002178 1.72 0.086 -.0485355 .7363038
lfaminc | -.2962299 .0866347 -3.42 0.001 -.4660308 -.1264289
_cons | 2.012535 .4474219 4.50 0.000 1.135604 2.889466
------------------------------------------------------------------------------
Predicción de las probabilidades del Modelo logit.
. predict smo2
(option p assumed; Pr(smokes))
. sum smokes smo1 smo2
2
-------------+--------------------------------------------------------
smokes | 1388 .1527378 .3598642 0 1
smo1 | 1387 .1528479 .0904194 -.0806922 .615532
smo2 | 1387 .1528479 .0950377 .0228038 .8588936
Ahora las probabilidades predichas están entre cero y uno.
Graficando la función de probabilidad del modelo Logit.
Primero se genera en vector X por BETA

. gen xbeta=2.012535-.2518731*motheduc+.3438842*white-.2962299*lfaminc
Luego se genera la función de probabilidad.

. gen fxbeta=exp(xbeta)/(1+(exp(xbeta)))
Se ordena la variable xbeta para posteriormente graficar la función de distribución de probabilidad

versus xbeta.
. sort xbeta
. twoway connected fxbeta xbeta
Los efectos marginales debido a un cambio en xbeta no son constantes. El efecto parcial es más
grande cuando xbeta es cero y más pequeño a medida que xbeta se acerca a – infinito y a +
infinito.
Efectos marginales del modelo logit

. mfx
Marginal effects after logit

y = Pr(smokes) (predict)
= .13170934
3
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
motheduc | -.0288047 .00401 -7.18 0.000 -.03667 -.02094 12.9358
white*| .0366196 .01981 1.85 0.065 -.002205 .075444 .784427
lfaminc | -.0338774 .00984 -3.44 0.001 -.053173 -.014582 3.07203
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1
El Modelo probit
. probit smokes motheduc white lfaminc

Probit regression Number of obs = 1387

LR chi2(3) = 92.67
Prob > chi2 = 0.0000
Log likelihood = -546.76991 Pseudo R2 = 0.0781
------------------------------------------------------------------------------
smokes | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
motheduc | -.1450599 .0207899 -6.98 0.000 -.1858074 -.1043124
white | .1896765 .1098804 1.73 0.084 -.0256852 .4050382
lfaminc | -.1669109 .0498894 -3.35 0.001 -.2646923 -.0691296
_cons | 1.126276 .2504608 4.50 0.000 .6353822 1.617171
------------------------------------------------------------------------------
Predicción de las probabilidades del Modelo probit.
. predict smohat
(option p assumed; Pr(smokes))
. sum smokes smo1 smo2 smohat

-------------+--------------------------------------------------------
smokes | 1388 .1527378 .3598642 0 1
smo1 | 1387 .1528479 .0904194 -.0806922 .615532
smo2 | 1387 .1528479 .0950377 .0228038 .8588936
smohat | 1387 .152034 .0962422 .0145713 .8404884
Las probabilidades predichas están entre cero y uno.
Efectos marginales del modelo probit

. mfx
Marginal effects after probit

y = Pr(smokes) (predict)
= .13260473
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
motheduc | -.03111 .0043 -7.24 0.000 -.039531 -.022689 12.9358
white*| .0382706 .02081 1.84 0.066 -.002522 .079063 .784427
lfaminc | -.0357962 .01069 -3.35 0.001 -.05675 -.014842 3.07203
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1
4
Porcentaje de pronósticos correctos en el modelo probit
. gen py=smohat>0.5
. table py smokes, contents( freq )
------------------------
| smokes
py | 0 1
----------+-------------
0 | 1,166 210
1 | 10 2
------------------------
El porcentaje de pronósticos correctos es la suma de los elementos de la diagonal de esta tabla

sobre el total de observaciones.
.
.
.
end of do-file

Modelos de probabilidad lineal, logit y probit para analizar el consumo de cigarrillos en mujeres embarazadas

Încărcat de

Informații document

Descriere originală:

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Modelos de probabilidad lineal, logit y probit para analizar el consumo de cigarrillos en mujeres embarazadas

Încărcat de

Drepturi de autor:

Formate disponibile

ECONOMETRIA 2 - ECON 3301 - SEMESTRE II - 08

Profesor: Ramón Rosales; rrosales@uniandes.edu.co

EJC 16C: PROBABILIDAD LINEAL-LOGIT-PROBIT.

Considere una muestra de 1388 observaciones relacionada con el consumo de

Descripción de los datos

El Modelo de Probabilidad lineal

. reg smokes motheduc white lfaminc

Source | SS df MS Number of obs = 1387

Predicción de las probabilidades del Modelo de probabilidad lineal.

. sum smokes smo1

Variable | Obs Mean Std. Dev. Min Max

Iteration 0: log likelihood = -593.10529

Logistic regression Number of obs = 1387

Predicción de las probabilidades del Modelo logit.

. sum smokes smo1 smo2

Ahora las probabilidades predichas están entre cero y uno.

Graficando la función de probabilidad del modelo Logit.

Primero se genera en vector X por BETA

Luego se genera la función de probabilidad.

Se ordena la variable xbeta para posteriormente graficar la función de distribución de probabilidad

. twoway connected fxbeta xbeta

Efectos marginales del modelo logit

Marginal effects after logit

. probit smokes motheduc white lfaminc

Iteration 0: log likelihood = -593.10529

Probit regression Number of obs = 1387

Predicción de las probabilidades del Modelo probit.

. sum smokes smo1 smo2 smohat

Variable | Obs Mean Std. Dev. Min Max

Las probabilidades predichas están entre cero y uno.

Efectos marginales del modelo probit

Marginal effects after probit

. table py smokes, contents( freq )

El porcentaje de pronósticos correctos es la suma de los elementos de la diagonal de esta tabla

S-ar putea să vă placă și