Sunteți pe pagina 1din 67

UNIVERSIDAD NACIONAL DEL ALTIPLANO

FACULTAD DE INGENIERIA ECONOMICA


CURSO:
ECONOMETRIA
TEMA:
MODELOS DE ELECCION BINARIA
Prof.: William Gilmer Parillo Mamani
Introduccin.
Consideremos un modelo en la cual deseamos
averiguar cuales son las variables que afectan al
desempleo. Se puede construir una variable explicada
cualitativa como el siguiente:


Las variables explicativas como la edad, el estado
civil, el nivel educativo, la experiencia laboral, etc. La
denominamos X. Por lo tanto, el modelo lo
expresamos de la siguiente forma:


En trminos compactos:
Donde:
Y
i
= Variable dependiente binaria(0/1).
Xi = Variables independientes: X1 es la edad, X2 es el estado
civil, X3 es el nivel educativo y X4 es la experiencia laboral, etc..
i ni n i i i i i
u X .... X X X X Y + + + + + + = | | | | | |
5 5 4 4 3 3 2 1 1

=
o desemplead est i individuo el Si 0
trabaja i individuo el Si 1
,
,
Y
i
i i i
u X Y + = |
Modelos de eleccin binaria
Sea el modelo:
i i
*
i
u X Y +
'
= |
La variable dicotmica se muestra de la
siguiente forma:

>
s
=
0 y* Si 1
0 y* Si 0
i
Y
Donde se distribuye como una distribucin de probabilidad
acumulada.
i
u
La probabilidad de obtener 1, esta dado por:
| | | | 0 > = = * Y ob Pr 1 Y ob Pr
i
..(1)
..(2)
..(3)
Modelos de eleccin binaria
Reemplazando la (1) en (3):

| | | | |
i i i
X u ob Pr 1 Y ob Pr
'
> = =
La probabilidad de observar un valor de uno es:
| | ) X F( X u ob Pr ) X | 1 Pr(Y
i i i i i
| | |
'
=
'
> = =
..(4)
..(5)
Donde, = F(-) es la funcin de distribucin(o densidad)
acumulada del error, u, que es una funcin estrictamente creciente
y continua. Y el vector de parmetros | refleja el impacto que X
tiene sobre la probabilidad.
) X F(
i
| '
0
u
|
i
X' |
i
X'
Grfico 01: Intervalos de la funcin (5)
Modelos de eleccin binaria
Usando el grfico anterior podemos, obtener
la funcin en trminos de integrales,
asumiendo la simetra de la distribucin.
) X ( F
i
| '
| | | |
}
'
=
'
> =
'
= =
o
|
| |
i
X
i i i i
du ) u ( f X u ob Pr ) X ( F 1 Y ob Pr
De la funcin de distribucin acumulada se obtiene
algunos modelos como:
1. El modelo lineal de probabilidad ( distribucin
uniforme).
2. El modelo Logit (distribucin logstica)
3. El modelo Probit (Distribucin normal estndar)
..(5)
EL MODELO LOGIT
Consideremos el ejemplo de propiedad de vivienda:
i i i i
X Y X Y E Pi
2 1
) | 1 ( | | + = = = =
Donde: X = Ingreso familiar (S/.)
Y = 1, Si la familia posee una casa
= 0, Otro caso: si la familia no posee
una casa
La funcin logstica es:
) (
2 1
1
1
) | 1 (
i
X
i i
e
X Y E Pi
| | +
+
= = =
Donde: e = 2.71828
Prob. de
poseer
una casa
..(3)
..(4)
El modelo Logit relaciona la variable Yi con las
variables X
2i
,., X
ki
atraves de la siguiente ecuacin:
Donde:
ki k i i i
X X Z X | | | | + + + = =
'
...
2 2 1
A medida que Z
i
+, e
-Zi
tiende a ceroP
i
1
A medida que Z
i
-, e
-Zi
tiende a infinitoP
i
0
Los estimadores obtenidos por el proceos de maxima verosimilitud son
consistenes y asintoticamente eficientes.
Observaciones:
..(5)
i
X
i
X
X
i i i i
u
e
u
e
e
X Y E X F Y
i i
i
+
+
= +
+
= = =
'
=
' '
'
| |
|
|
1
1
1
) | 1 ( ) (
EFECTOS MARGINALES
(Interpretacin de los parmetros)
La derivada parcial del modelo logit, respecto
a la variable X
ki
si es derivable, es igual a:
i
X
X
i
u
e
e
Y
i
i
+
+
=
'
'
|
|
1
( )
( )
| | |
|
|
* ) (
1
2
i k
X
X
ki
i
X f
e
e
X
Y
i
i
'
=
+
=
c
c
'
'
| |
2
) 1 (
|
|
|
i
i
X
X
i
e
e
X f
'
'
+
= '
Donde:
= Factor de escala en el modelo Logit.
Permite analizar los efectos de las variables explicativas sobre la
probabilidad. Para calcular los efectos marginales, una posibilidad es
evaluar las expresiones obtenidas tomando como X las medias
muestrales de los datos; otra posibilidad es evaluar los efectos
marginales en cada observacin con las expresiones dadas y calcular
despus la media muestral de los efectos marginales individuales.
EFECTOS MARGINALES
(Interpretacin de los parmetros)
En el caso de que la variable X
ki
sea
dicotmica, entonces el anlisis del
efecto de una variacin de la variable
X
ki
sobre el regresando se calcula a
travs de la diferencia entre los
valores proporcionados por:
E(Y
i
/X
ki
=1) y E(Y
i
/X
ki
= 0)

VALIDACION Y CONTRASTE DE HIPOTESIS
1. Pruebas estadsticas basadas en la
funcin de verosimilitud y en el
logaritmo de la funcin de
verosimilitud ( Log likelihood)
A partir de la funcin de verosimilitud estimada de
los residuos o bien de su logaritmo:
| |

= =
2
2
2 2 2
)) ( (
2
1

2
2
2
) , ( ) , (
i i
Ln
x F y Ln
I
Ln
I
L Ln |
o
o t o | o |
Se pueden construir distintos contrastes de hiptesis.
CRITERIO PARA ELEGIR ENTRE DISTINTOS MODELOS:
Se prefiere aquel modelo que presente un valor de la
funcion de verosimilitud mayor
I = Tamao de muestra
La razn de verosimilitud
Ho: Modelo con restricciones.
Ha: Modelo sin restricciones.
La razn de verosimilitud es:
) ( 2 2 ) ( 2
SR CR
SR
CR
LnL LnL
L
L
Ln Ln LR =
|
|
.
|

\
|
= =
Donde:
L
CR
= Funcin de verosimilitud restringida.
L
SR
= Funcin de verosimilitud sin restringir.
El estadstico -2Ln() se distribuye segn una X
2

con un nmero de grados de libertad igual al
nmero de restricciones.
Akaike
Akaike propone una correccin a los estadsticos
anteriores por el nmero de parmetros del
modelo (coeficientes de regresin). La expresin
del estadstico de Akaike(AIC) es:
I I
k
AIC
2 2
=
Sirve para comparar la bondad del ajuste
entre dos modelos.
CRITERIO PARA ELEGIR ENTRE DISTINTOS
MODELOS:
Es preferible aquel modelo que presente
un valor de AIC menor.
Akaike y y Hannan Quinn
El criterio de schwarz se define como:
I I
LnI K
Schwarz SC
2 *
= =
Ambos criterios sirven para comparar la
bondad del ajuste entre dos modelos.
CRITERIO PARA ELEGIR ENTRE DISTINTOS
MODELOS:
Es preferible aquel modelo que presente un
valor de SC y H-Q menor.
El criterio de Hannan Quinn se define como:
I I
LnI Ln K
n HannanQuin Q H
2 ) ( * * 2
= =
2. Medidas de Bondad de ajuste
McFadden R-squared:(R
2
propuesto por McFadden).
Se define como:
CR
SR
LnL
LnL
McFadden R =1
2
Donde:
LnL
CR
es el logaritmo de la funcin de verosimilitud
del modelo restringido( con restricciones).
Ho:
0 ...
3 2
= = = =
k
| | |
Toma el valor de 1 cuando la prediccin es perfecta, es decir, la
probabilidad estimada de que se produzca el evento es uno cuando este
efectivamente se produzca y cero cuando no se produzca el evento.
El estadstico LR(LR-statistic)
Si tenemos con L
SR
el valor de la funcin de
verosimilitud respecto a todos los parmetros
y L
CR
es la funcin de verosimilitud que se
obtiene bajo la hiptesis nula (o modelo con
restricciones):
0 :
3 2 0
= = = = = =
K k
H | | | |
| | | |
SR CR
2 1 ln 2
ln
ln
2 = = =
SR CR
SR
CR
nL L
L
L
LR
Se puede definir el estadstico:
que se distribuye como una x
2
(ji: cuadrado)
con (K-1) grado de libertad.
__
Ejemplo:
Se desea estimar el siguiente modelo, donde se
quiere determinar los factores determinantes de la
Disposicin a pagar(DAP) por mejorar la calidad
ambiental de un paisaje:
PRSI: Variable dependiente binaria que representa la
probabilidad de responder SI(=1) a DAP, o NO(=0)
de otra manera.
PH: Precio hipottico asignado aleatoriamente a cada
visitante, sobre la que compara su DAP.
ING: Ingreso familiar mensual.
Variables socioeconmicas:
EDUC: Educacin superior(=1) del entrevistado y
(=0) si no tiene.
PREO: Inters por mejorar la calidad del agua de la
laguna(=1) y (=0) si no le interesa la mejora
ambiental, independientemente de los precios
hipotticos ofertados.
PRSI PH ING EDUC PREO
1 1 8000 2500000 1 1
2 0 5000 300000 0 0
3 1 3000 620000 0 1
4 1 5000 2500000 1 0
5 1 4000 1500000 0 1
6 0 8000 800000 0 1
7 1 500 150000 0 1
8 0 5000 1000000 1 0
9 1 4000 1150000 1 1
10 1 2000 500000 1 0
11 1 500 170000 0 0
12 1 2000 600000 0 0
13 1 1000 300000 1 1
14 1 2000 300000 1 1
15 1 3000 300000 0 0
PRSI PH ING EDUC PREO
16 1 3000 800000 0 1
17 0 5000 1000000 1 0
18 0 8000 1300000 0 0
19 1 5000 2000000 1 1
20 0 4000 300000 0 1
21 1 2000 300000 0 1
22 1 3000 600000 1 1
23 1 3000 700000 1 1
24 1 1000 280000 0 1
25 1 1000 300000 0 1
26 1 2000 900000 1 1
27 1 2000 400000 0 0
28 1 3000 770000 1 0
29 1 2000 700000 1 0
30 1 500 200000 1 1
31 1 1000 220000 0 1
32 1 2000 490000 1 1
PRSI PH ING EDUC PREO
33 1 3000 500000 0 1
34 0 1000 250000 1 1
35 1 1000 230000 1 1
36 1 500 200000 0 1
37 1 500 600000 1 1
38 0 500 170000 0 0
39 1 500 190000 0 1
40 1 4000 600000 0 0
41 1 4000 450000 1 1
42 1 4000 600000 0 1
43 1 4000 380000 0 1
44 1 5000 800000 0 1
45 0 8000 250000 0 0
46 1 5000 1200000 0 1
47 0 8000 350000 0 1
48 1 8000 800000 1 1
49 0 8000 830000 0 0
ESTIMACION DEL MODELO
LOGIT PRSI ING PH PERO C
Dependent Variable: PRSI
Method: ML - Binary Logit (Quadratic hill climbing)
Date: 08/25/06 Time: 08:29
Sample: 1 49
Included observations: 49
Convergence achieved after 10 iterations
Covariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
ING 3.37E-06 2.04E-06 1.649820 0.0990
PH -0.000859 0.000287 -2.996363 0.0027
PREO 2.161587 1.030391 2.097833 0.0359
C 1.253749 1.145596 1.094408 0.2738
Mean dependent var 0.775510 S.D. dependent var 0.421570
S.E. of regression 0.315309 Akaike info criterion 0.764018
Sum squared resid 4.473877 Schwarz criterion 0.918452
Log likelihood -14.71844 Hannan-Quinn criter. 0.822610
Restr. log likelihood -26.09407 Avg. log likelihood -0.300376
LR statistic (3 df) 22.75126 McFadden R-squared 0.435947
Probability(LR stat) 4.55E-05
Obs with Dep=0 11 Total obs 49
Obs with Dep=1 38

| |
PREO PH ING
PREO PH ING
e
e
X F PRSI ob
i i
3 2 1 0
3 2 1 0
1
) ( 1 Pr
| | | |
| | | |
|
+ + +
+ + +
+
= ' = =
El modelo estimado es:
RESULTADOS DEL EVIEWS
Reemplazando los coeficientes
estimados tenemos el modelo Logit
estimado:

| |
PREO PH ING
PREO PH ING
e
e
X F PRSI ob
i i
* 161587 . 2 * 000859 . 0 * 00000337 . 0 253749 . 1
* 161587 . 2 * 000859 . 0 * 00000337 . 0 253749 . 1
1
) ( 1 Pr
+ +
+ +
+
=
'
= = |
En E-views:
Estimation Command:
=====================
BINARY(D=L) PRSI ING PH PREO C

Estimation Equation:
=====================
PRSI = 1-@LOGIT(-(C(1)*ING + C(2)*PH + C(3)*PREO + C(4)))

Substituted Coefficients:
=====================
PRSI = 1-@LOGIT(-(3.367907926e-06*ING - 0.0008593319692*PH + 2.161586887*PREO +
1.253748881))
INTERPRETACION DE SIGNOS
En modelos Logit tambin se pueden interpretar los
signos de los coeficientes estimados:
PH se relaciona inversamente a PRSI, esto implica si
el costo por la mejora del humedal (PH) aumenta, la
probabilidad de la disposicin a pagar (DAP) por el
uso del recurso disminuye.
ING tiene relacin positiva con PRSI, esto significa si
el ingreso de los beneficiarios (ING) se incrementa, la
probabilidad de la disposicin a pagar (DAP) por el
uso del recurso aumenta.
S los encuestados muestran preocupacin por la
mejora del recurso (PERO=1), la probabilidad de la
disposicin a pagar es mayor, de lo contrario es
menor.
EFECTOS MARGINALES
Para obtener los efectos marginales
primero calculamos el factor de escala
dado por la ecuacin:
2
) 1 (
) (
|
|
|
i
i
X
X
i
e
e
X f
'
'
+
=
'
2
* 161587 . 2 * 000859 . 0 * 00000337 . 0 253749 . 1
* 161587 . 2 * 000859 . 0 * 00000337 . 0 253749 . 1
1
) (
|
.
|

\
|
+
=
'
+ +
+ +
PREO PH ING
PREO PH ING
e
e
X f
i
|
Los promedios de las familias encuestadas son:
PRSI ING PH PREO
Mean 0.775510 660204.1 3377.551 0.673469
Median 1.000000 500000.0 3000.000 1.000000
Maximum 1.000000 2500000. 8000.000 1.000000
Minimum 0.000000 150000.0 500.0000 0.000000

EFECTOS MARGINALES
Reemplazando los promedios en la
ecuacin anterior tenemos:
2
673469 . 0 * 161587 . 2 551 . 3377 * 000859 . 0 1 . 660204 * 00000337 . 0 253749 . 1
673469 . 0 * 161587 . 2 551 . 3377 * 000859 . 0 1 . 660204 * 00000337 . 0 253749 . 1
1
) (
|
.
|

\
|
+
= '
+ +
+ +
e
e
X f
i
|
88422699 . 0 ) ( = '|
i
X f
El efecto marginal(impactos) en el modelo logit
dado en la ecuacin es:
|
|
|
2
1 ) e (
e
x
Pi
i
i
X
X
'
'
+
=
c
c
| | | |
)
1
)( (
) (
/
, ), )( (
) (
/
j i
j i
i i
j i
j i
i i
X f
X
X Y E
luego X F
X
X Y E
| |
|
| |
|
=
c
c
=
c
c
Efecto marginal respecto a la variacin del
ingreso (ING):
| |
) )( (
) (
/
j
j
X f
ING
X PRSI E
| |
|
=
c
c
, j = coeficiente asociado al ING.
| |
44956 0000029798 . 0 ) 00000337 . 0 ( * 88422699 . 0
) (
/
= =
c
c
j
ING
X PRSI E |
Esto implica que un incremento en el
ingreso en una unidad monetaria
entonces la probabilidad de la
disposicin a pagar por preservar el
recurso aumenta en 0.00029798%.
Efecto marginal respecto al precio hipottico
(PH):
| |
) )( (
) (
/
j
j
X f
PH
X PRSI E
| |
|
=
c
c
, j = coeficiente asociado al PH.
| |
844 0007595509 . 0 ) 000859 . 0 ( 88422699 . 0
) (
/
= =
c
c
j
PH
X PRSI E |
Esto implica que el incremento en el
precio hipottico en una unidad
monetaria, disminuye la probabilidad
de la disposicin a pagar por
preservar el recurso en 0.075955%.
Efecto de la variable preocupacin (PERO)
sobre las probabilidades:
Si la variable independiente binaria es
PREO, el efecto marginal es:
| | | | 0 Pr , | 1 Pr 1 Pr , | 1 Pr = = = = = eo X Mejora ob eo X Mejora ob EM
En Eviews:
genr m0=1-@LOGIT(-(C(1)*660204.1 + C(2)*3377.551 + C(3)*0 + C(4)))

genr m1=1-@LOGIT(-(C(1)*660204.1 + C(2)*3377.551 + C(3)*1 + C(4)))
Con los comandos anteriores se obtiene:
| | 939141 . 0 1 Pr , | 1 Pr = = = eo X Mejora ob
| | 639874 . 0 0 Pr , | 1 Pr = = = eo X Mejora ob
El efecto Marginal es:
299267 . 0 639874 . 0 939141 . 0 = = EM
Efecto de la variable preocupacin (PERO)
sobre las probabilidades:
Luego generamos las series en E-views:
genr PRSI0=1-@LOGIT(-(C(1)*ING+C(2)*3377.551+C(3)*0+C(4)))

0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
0 1000000 2000000 3000000
ING
PRSI1
PRSI0
660204
En el grafico muestra la diferencia de dos funciones
de distribucin de probabilidad, cuando la variable
preocupacin (PREO) toma valores de 0 y 1, en todo
rango del ingreso. Esto significa que la probabilidad
de la disposicin a pagar aumenta si el encuestado
muestra preocupacin por preservar el recurso, que
en aquellos que no muestran preocupacin, esta
diferencia es aproximadamente en 0.2992, evaluado
en el valor promedio del ingreso.
Se puede apreciar tambin, que para ingresos
mayores la diferencia entre las probabilidades con
preocupacin y si preocupacin disminuye. Adems,
la probabilidad para ambos casos de la disposicin a
pagar es mayor, esto implica que cuanto mayor es el
ingreso de los agentes, la probabilidad de la DAP es
mayor independientemente del nivel de preocupacin.

Bibliografia.











Ejemplo:
Spector y Mazzeo(1980) reportaron el
anlisis de un modelo de un cierto
programa de educacin. Utilizando los
datos de la tabla siguiente para analizar si
una nueva metodologa didctica resulta
eficaz en la enseanza de la economa. En
un estudio, la variable dependiente es
mejora, variable que indica si mejor o no
la nota del alumno tras un periodo de
aprendizaje. El resto de variables son CM,
media de las calificaciones pasadas del
alumno; NP nota del alumno en un examen
previo al periodo de aprendizaje; y PSI,
variable binaria que indica si en el periodo
de aprendizaje el alumno estudio con el
nuevo mtodo didctico o no.
obs CM NP PSI MEJORA
1 2.66 20 0 0
2 2.89 22 0 0
3 3.28 24 0 0
4 2.92 12 0 0
5 4.00 21 0 1
6 2.86 17 0 0
7 2.76 17 0 0
8 2.87 21 0 0
9 3.03 25 0 0
10 3.92 29 0 1
11 2.63 20 0 0
12 3.32 23 0 0
13 3.57 23 0 0
14 3.26 25 0 1
15 3.53 26 0 0
16 2.74 19 0 0
obs CM NP PSI MEJORA
17 2.75 25 0 0
18 2.83 19 0 0
19 3.12 23 1 0
20 3.16 25 1 1
21 2.06 22 1 0
22 3.62 28 1 1
23 2.89 14 1 0
24 3.51 26 1 0
25 3.54 24 1 1
26 2.83 27 1 1
27 3.39 17 1 1
28 2.67 24 1 0
29 3.65 21 1 1
30 4.00 23 1 1
31 3.10 21 1 0
32 2.39 19 1 1
Donde:
Mejora:
1:mejor, 0: no mejor
CM = Media de las calificaciones
pasadas del alumno.
NP = Nota del alumno en un examen
previo al periodo de aprendizaje
PSI = variable binaria que indica si en
el periodo de aprendizaje el alumno
estudio con el nuevo mtodo
didctico(=1) o no(=0).
Estimacin del Modelo en E-views.
LOGIT MEJORA C CM NP PSI
Dependent Variable: MEJORA
Method: ML - Binary Logit (Quadratic hill climbing)
Date: 08/25/06 Time: 07:37
Sample: 1 32
Included observations: 32
Convergence achieved after 5 iterations
Covariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C -13.02135 4.931317 -2.640541 0.0083
CM 2.826113 1.262940 2.237725 0.0252
NP 0.095158 0.141554 0.672235 0.5014
PSI 2.378688 1.064563 2.234426 0.0255
Mean dependent var 0.343750 S.D. dependent var 0.482559
S.E. of regression 0.384716 Akaike info criterion 1.055602
Sum squared resid 4.144171 Schwarz criterion 1.238819
Log likelihood -12.88963 Hannan-Quinn criter. 1.116333
Restr. log likelihood -20.59173 Avg. log likelihood -0.402801
LR statistic (3 df) 15.40419 McFadden R-squared 0.374038
Probability(LR stat) 0.001502

El modelo estimado es:
| |
PSI NP CM
PSI NP CM
e
e
X F Mejora ob
i i
3 2 1 0
3 2 1 0
1
) ( 1 Pr
| | | |
| | | |
|
+ + +
+ + +
+
= ' = =
| |
PSI NP CM
PSI NP CM
e
e
X F Mejora ob
i i
* 378687596 . 2 * 0951576567 . 0 * 826112525 . 2 02134648 . 13
* 378687596 . 2 * 0951576567 . 0 * 826112525 . 2 02134648 . 13
1
) ( 1 Pr
+ + +
+ + +
+
= ' = = |
Interpretacin de signos
CM tiene una relacin positiva con MEJORA,
esto significa que si las calificaciones
pasadas del alumno(CM) se incrementa, la
probabilidad de que sus notas mejoren
aumenta.
PSI tiene una relacin positiva con MEJORA,
esto nos indica que si en periodo de
aprendizaje el alumno estudio con el nuevo
mtodo(PSI=1) la probabilidad de que
mejoren las notas es mayor, de lo contrario
es menor.
Efectos Marginales
En el programa Limdep los efectos marginales se
obtienen en forma directa.
+-------------------------------------------+
| Partial derivatives of probabilities with |
| respect to the vector of characteristics. |
| They are computed at the means of the Xs. |
| Observations used for means are All Obs. |
+-------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Marginal effects on Prob[Y = 1]
Constant -2.459760743 .81771031 -3.008 .0026
CM .5338588183 .23703797 2.252 .0243 3.1171875
NP .1797548884E-01 .26236909E-01 .685 .4933 21.937500
PSI .4493392735 .19676264 2.284 .0224 .43750000
( )
( )
| | |
|
|
* ) (
1
) 1 ( Pr
2
i k
X
X
ki ki
i
X f
e
e
X
Yi ob
X
Y
i
i
'
=
+
=
c
= c
=
c
c
'
'
Efectos Marginales
El impacto de un cambio en la media
de las calificaciones pasadas del
alumno es:
533858813 . 0 826112525 . 2 * 188902178 . 0 * ) (
) 1 ( Pr
1
= = ' =
c
= c
| |
i
X f
CM
Yi ob
Esto implica que un incremento en las calificaciones pasadas
del alumno en una unidad(1 punto), entonces la probabilidad
de que mejore la nota del alumno aumenta en 53.38%.
Efectos Marginales
EFECTO MARGINAL PARA UNA VARIABLE INDEPENDIENTE
BINARIA(PSI).
44933929 0 378687596 2 188902178 0
1
3
. . * . * ) X ( f
PSI
) Yi ( ob Pr
i
= = ' =
c
= c
| |





Proporcin de predicciones correctas
(expectacin-prediccin)
Se puede representar, tambin, una medida de la
bondad del ajuste al considerar el porcentaje de
predicciones correctas que proporcionan la
estimacin. Para ello, consideramos un verdadero
de Y
i
y el obtenido a partir de la estimacin o
prediccin
i
,de forma que:
I
I I
I I I I
I I
22 11
21 12 22 11
22 11
+
=
+ + +
+
=








MODELO PROBIT
Se usa una funcion de distribucion
acumulativa normal(FDA).
En el ejemplode propiedad de vivienda
Supongase que la decisin de la i-sima
familia de poseer una casa o de no poseer
depende de un ndice de conveniencia no
observable Ii que esta determinado por
Xi:

i i
X I
2 1
| | + =
3. EL MODELO PROBIT
Sea Y una variable Dummy o dictomica:
1 = Si posee una casa
0 = No la posee
}


[
= = s = = =
Ti
t
dt e Ii F Ii Ii Y Pi
2 /
2
2
1
) ( ) * Pr( ) 1 Pr(
}
+


[
= = =
i
X
t
dt e Y Pi
2 1
2
2 /
2
1
) 1 Pr(
| |
Supuesto:
Para cada familia hay un nivel crtico o umbral del
ndice I*
i
Si Ii>I*
i
la familia poseer una casa, de lo contrario
no lo har.
3. EL MODELO PROBIT
Donde t es una variable normal estandarizada
MODELOS POISSON
Donde:
Yi = 0, 1,2,3,4,...=Nmero de vistas
por periodo y la media de la
distribucin de probabilidad es:


|
) ( Pr
i
Y
i
Y
e
Yi ob
i
i

i
X
i
e
|
=

S-ar putea să vă placă și