Sunteți pe pagina 1din 30

Modelos con variables dictomas o

binarias dependientes
1) En estos modelos la variable dependiente o endgena es una
variable dictoma o binaria , esta variable requiere de una
respuesta de tipo si o no
2) Sea el modelo:
Y= B1+ B2 X2i+ B3 X3i + B4 X4i +t
Donde Y= 1(Si un individuo tiene automvil propio)
0( Si no tiene automvil propio)
x2i
x3i
x4i Son atributos o caractersticas del individuo
4) La variable dependiente Yi depende de ciertas atributos o caractersticas
del individuo que en este caso son:
X2i = ingreso personal
X3i = 1( si tiene trabajo estable)
0(si no tiene trabajo estable)
X4i = 1( si el individuo es soltero)
0( sin el individuo no es soltero)
5) En estos modelos el individuo puede ser una persona, una familia, un
pas, una ciudad, una empresa etc.
Ejemplos de variables dictomas que pueden ser
variables dependientes
a) Una familia tiene casa propia o no
b) Una persona tiene automvil propio o no
c) Una familia tiene seguro de invalidez o no
d) Una empresa esta calificado para recibir prestamos o no
e) Una persona esta calificado para recibir prestamos o no
f) Una familia tiene computadora o no
g) Una familia tienen internet o no
h) Una familia tiene TV cable o no
i) Una empresa produce productos de exportacin o no
Especificar una ecuacin para cada variable haciendo depender de sus
atributos principales
Los modelos en el cual la variable dependiente
es una variable de eleccin binaria que
estudiaremos son los siguientes:
I. El modelo de probabilidad lineal ( MPL)
II. El modelo Logit
III. El modelo Probit
IV. El modelo Tobit
El modelo MPL
Este modelo lo estudiaremos a travs del siguiente ejemplo:
1) Yi = B0 + B1 Xi + i
donde Y = 1( si la familia tiene casa propia)
0( si la familia no tiene casa propia)
Xi = ingreso familiar; i = termino de error
2) Tomando valor esperado en (1)
E(Yi )= E(B0 )+ E(B1 Xi )+ E(i )
E(Yi )= B0 + B1 Xi + 0
E(Yi )= B0 + B1 Xi
3)Si Pi es la probabilidad de que Yi= 1( es decir que
el evento ocurra, que la familia tenga casa
propia)
(1-Pi) La probabilidad de que Yi = 0( que el evento
no ocurra, la familia no tenga casa propia)
4) => la variable Yi tiene la siguiente distribucin de probabilidad

Yi Probabilidad
1 Pi
0 1- Pi
5) Hallando el valor esperado de Yi tenemos:
E(Yi )=1( Pi )+ 0(1- Pi )
E( Yi ) = Pi => El valor esperado de Yi es la probabilidad de que
el evento ocurra
6) Reemplazando (5) en (2) tenemos: Pi = B0 + B1 Xi + i
=>En el caso del modelo de probabilidad lineal, el valor
ajustado de Y es una probabilidad, es decir, no se ajusta un
valor de Y sino que el modelo predice una probabilidad
Estimacin del modelo MPL
Cuando se estima el modelo MPL por el MCO se
presentan los siguientes problemas:
I. No normalidad de las perturbaciones o errores
II. Varianzas heteroscedasticas de las perturbaciones (ui )
III. No cumplimiento de: 0 E(y)1
IV. Valor cuestionable de R2 como medida de la bondad de ajuste
No normalidad de los errores (ui)
a) Para aplicar el MCO en un modelo se requiere
que las perturbaciones o errores estn
normalmente distribuidos, para los fines de que
las pruebas de hiptesis T-student y F sean
validas
b) En el modelo MPL, las perturbaciones (i )
tienen solo dos valores:
Yi = B0 + B1 Xi + i
Si : Y = 1 => i = 1 - B0 - B1 Xi
Si: Y = 0=> i = -B0 - B1 Xi
Por lo cual ui tiene una distribucin binomial
c) Sin embargo a medida que la muestra aumenta
indefinidamente se puede demostrar que los
estimadores MCO tienden por lo general a tener
una distribucin normal. Por ello las pruebas de
hipotesis T-student y F en el modelo MPL seguir
el procedimiento usual bajo el supuesto de
normalidad( puesto que en los trabajos de
investigacin prcticos, estos modelos se
estiman con datos de encuestas que siempre son
muestras grandes)
Varianzas heteroscedasticas de Ui
1) En el modelo MPL: Yi = B0 + B1 Xi + i, donde (
Yi =1, Yi =0),
2) La Var( ui ) = E( u2 ) = 2i ,es variable, es decir
no es constante; es decir adolece del problema
de heteroscedasticidad.

DEMOSTRACION
a) La distribucin de probabilidad de ( i ) es:
i Probabilidad
1- B0 - B0 Xi Pi
-B0 B1 Xi 1- Pi
b) Var(ui ) = E( ui2 )
c) E( ui2 ) = Pi (1 - B0 - B1 Xi )2 +(1-Pi)(- B0 - B1 Xi )2
= Pi [1 (B0 + B1 Xi )]2 +(1-Pi)[- (B0 + B1 Xi )]2
= Pi (1 Pi )2 +(1-Pi)(- Pi)2
=.
= Pi( 1- Pi )
=> Var( u) = E( ui2 ) = Pi( 1- Pi )
Pero tenemos que : Pi = B0 + B1 Xi + i
Como Pi depende de Xi => habr una varianza
de ui para cada Xi
Por lo tanto la varianza de ui no es constante,
por ende la Var(u) es heteroscedastica
Corrigiendo la hereroscedasticidad
1) El modelo original MPL: Yi = B0 + B1 Xi + i ,
donde ui tiene heteroscedasticidad
2) La Var(ui) = 2i = Pi( 1- Pi ) => i = Pi( 1- Pi )
= wi
3) Dividiendo el modelo original entre wi
4) Yi/ wi = B0/ wi + B1 Xi/ wi + i/ wi

5) Yi/ wi = B0/ wi + B1 Xi/ wi + vi


6) Var(vi) es homoscedastico
No cumplimiento de 0 E(Y/X ) 1
1) En el modelo MPL:Yi = B0 + B1 Xi + i
Donde : Yi = 1
0

2) Tenemos que: E(Yi /Xi )= B0 + B1 Xi


3) y Pi = B0 + B1 X
=> E(Yi /Xi )= Pi
y sabemos que la probabilidad Pi puede ser Pi = 1 o Pi = 0, o
estar entre dichos valores por lo cual debe cumplirse la
siguiente expresin:
0 E(Y/X ) 1
Sin embargo al estimarse el modelo MPL
algunos valores de Yi estimado son mayores que
uno o son menores que cero. En estas
situaciones, para darle solucin al problema, se
consideran en el primer caso como uno y en el
segundo como cero.
En los modelos Logit y Probit que luego
estudiaremos los valores estimados de Yi
siempre se encuentran entre cero y uno
Valor cuestionable de R2
1) El R2 en los modelos de respuesta binaria tiene un
valor limitado como medida de la bondad de ajuste
del modelo, esto es debido a que todos los valores
de Xi se encontraran en el eje de las Xi ( abscisas y
en la lnea correspondiente a (1)
2) La suma de los cuadrados de los residuos ( e2i ) es ms grande
de lo habitual debido a la forma especfica en que se distribuye la nube
de puntos de una variable dicotmica. Dado que el clculo del
coeficiente de determinacin R2 se ve afectado por ( e2i ) el R2
calculado en la estimacin por MCO es ms pequeo de lo que
realmente debera ser.
2) R2 = 1- e2i
( Yi- Y)2

3) En la mayora de las aplicaciones practicas el


R2 se encontrara dentro del rango de 0.2 a 0.6

3) Cuando la dispersin observada de las Xs se


encuentra bastante concentrados alrededor de
los puntos A y B de la grafica siguiente, el valor
de R2 ser aproximadamente
Y

1 ----------- - ------ ---


-

R2 = 0.2 a 0.6

------------------- X
Y
A
1 ------

R2 = 0.8

B
-------
X
Ejemplo de aplicacin
1) En el modelo: Yi = B0 +B1 IFi + B2 HUi + B3 PPi + ui
2) Donde:Y =(1 si la familia tiene una PC en su casa; 0: si la
familia no tiene una PC en su casa)
3) Variables explicativas:
IF: ingreso familiar
HU=(1: tienen hijos universitarios,0: si no tiene hijos
universitarios)
PP=( 1: si los padres son profesionales, 0: si los padres no
son profesionales)
4) El modelo estimado por MCO:
Yi =-0.146758 + 0.0000418IFi +0.546452HUi +0.355749PPi
SB =>(0.144209) (2.3E-05) (0.101141) (0.099349)
SB : desviacin estndar de los parmetros estimados
R2 = 0.44, DW= 1.31; N=60
1) Probar que la variable hijos universitarios influye
(HU) o no en la variable Yi para un 5% de
significacin
2) Cul es la probabilidad de tener PC en su
hogar, para las familias cuyo ingreso mensual
sea de 4000, tengan hijos universitarios y los
padres sean profesionales?
Solucin
1) Se tiene que hacer la prueba hiptesis T-student para el
parmetro B2:
a) H0 : B2 = 0
HA: B2 0
b) t= B2 / SB = 0.546452/0.101141= 5.4029
c) Para 5% de significacin y (N-k) grados de libertad o sea
(60-4)= 56GL, se tienen un T0.975= T0.025 = 2.000
d) Como t= 5.403 > T= 2.000 (critico) => se rechaza la H0 y
se acepta la HA: lo que significa que la variable hijos
universitarios (HU) influye en la variable Yi
b)
Yi =-0.146758 +4.18E-05I(4000)+0.546452(1)+0.355749(1)
Y = 0.9226= 92.26%

S-ar putea să vă placă și