Sunteți pe pagina 1din 92

UNIVERSIDAD NACIONAL DEL ALTIPLANO

ESCUELA DE POST GRADO


MAESTRIA EN ECONOMIA: PROYECTOS DE INVERSIN
METODOS CUANTITATIVOS

Puno, octubre de 2011
Alfredo Pelayo Calatayud Mendoza
Puno, octubre de 2011
1
SILABO
1. Informacin General:
Maestra : Economa
Especialidad : Proyectos de Inversin
Curso : Mtodos Cuantitativos
Semestre . Primero
Crditos : 04
Aula : Facultad de Ingeniera Econmica Aula N 201
Duracin : Del 08 a 30 de octubre de 2011
Horario : Sbados de 8:30 a.m. a 01:00 p.m. y de 02:00 a 05:00 p.m.
Domingos de 8:30 a.m. a 01:00 p.m. y de 02:00 a 06:00 p.m.
Profesor : Alfredo Pelayo Calatayud Mendoza
Correo : alfredopelayo@yahoo.com
2. Objetivos:
Al finalizar el curso el alumno ser capaz de:
Estimar modelos econmicos previo planteamiento de hiptesis de investigacin
complementando con un conjunto de herramientas estadsticas.
Evaluar modelos econmicos en concordancia con las hiptesis planteadas en la investigacin
sin dejar de lado sus implicancias de poltica.
3. Metodologa
Las sesiones se desarrollarn en base a clases magistrales, participacin de los alumnos en forma
activa, y desarrollo de casos prcticos. Los participantes planetaran un proyecto de investigacin a
nivel de perfil poniendo nfasis en el planteamiento del problema objeto de investigacin, objetivos,
revisin bibliogrfica, marco terico, formulacin de hiptesis, metodologa y resultados. Al final
del curso los alumnos deben presentar su exposicin.
4. Contenido y Cronograma de actividades
08 de octubre de 2011
[1] Tipos de graficos, Estadstica Descriptiva, tipos de distribucin de probabilidad, Funcin de
densidad de probabilidad (fdp) y Funcin de Distribucin Acumulada (FDA) Introduccin a
Econometra. Planteamiento de Hiptesis en los trabajos de investigacin. Estadstica Descriptiva.
Diagrama de dispersin. Tipos de variables. Tipos de base de datos. Correlaciones. Modelo de
Regresin lineal clsico por Mnimos Cuadrados Ordinarios (MCO) y Mxima Verosimilitud (MV).
Test de normailidad. Aplicacin N 1: Funcin de produccin de quinua con datos de corte
transversal.
09 de octubre de 2011
[2] Violacin de supuestos del modelo de regresin lineal clsico. Test de estabilidad. Mtodo de
Estimacin MCO y MV. Aplicacin N 2.
15 de abril de 2011
[3] Modelo de Ecuaciones Simultaneas, Supuesto de ortogonalidad. Estimacin por Mnimos
Cuadrados en dos etapas (MC2E) y el Mtodo de Momentos Generalizado (MMG). Aplicacin N
3: Modelo de ecuaciones simultanes (MES).
2
16 de octubre de 2011
[4] Estacionariedad, Cointegracin y Modelo de Correcin de Errores. Tratamiento de las series no
estacionarias. Aplicacin N 4.
22 de octubre de 2011
[5] Modelos de regresin con variables dependientes discretas: Estimacin de los modelos Probit,
Logit y Poisson por Mxima Verosimilitud (MV). Aplicacin N 5: El mtodo de valoracin
contingente. Modelo de efectos de tratamientos.
23 de octubre de 2001
[5] Presentacin de casos y absolucin de consultas
29 de octubre de 2011
Examen Final 08:30 a.m.
30 de octubre de 2011
Exposicin y discusin de proyectos de investigacin
5. EVALUACION
La asistencia es obligatoria, para aprobar se requiere 90% de asistencia. Los componentes de la
evaluacin son:
Examen escrtio final (50%)
Practicas calificadas (30%)
Exposicin del proyecto de investigacin (20%)
6. BIBLIOGRAFIA
GUJARATI, DAMODAR (1999): Econometria Bsica, 4ta edicin, McGraw-Hill. Bogot
Colombia.
GREEN, WILLIAM (2002) Econometric Analysis, 5ta edicin, Prentice-Hall.
AZQUETA D. (1994) Valoracin Econmica de la calidad ambiental, Primera edici
McGrawHill Colombia.
ENDERS, WALTER (1995): Applied Econometrics Time Series, Wiley Series in Probability and
Mathematical Statistics.
JHONSTON, JACK:(1975): Mtodos de Econometra, Ed. Vicens Universidad Espaa.
HAMILTON, JAMES (1994): Time Series Anlisis, Princeton University Press, Princeton, NY.
MUN JOHNATHAN (2006) Simulador de Riesgo en www.realoptionsvaluation.com
3
Sesin 1: Estadstica Descriptiva e introduccin a mtodos
cuantitativos
Tipo de Graficos en Excel: Actualmente los graficos se pueden realizar en muchos porgramas o
graficadores, sea:
Cuadro 1: Poblacin por sexo y edad.
Cuadro 2: Estructura de la poblacin
por sexo y edad.
Juliaca. Ao 1972 Juliaca. Ao 1972
Edad
Poblacin
Edad
Sexo
Total Varones Mujeres Varones Mujeres
Total 50,859 26,177 24,682
0-4 8,726 4,480 4,246 0-4 8.8 8.3
5-9 7,364 3,834 3,530 5-9 7.5 6.9
10-14 6,489 3,427 3,062 10-14 6.7 6.0
15-19 5,899 3,231 2,668 15-19 6.4 5.2
20-24 4,659 2,421 2,238 20-24 4.8 4.4
25-29 3,613 1,801 1,812 25-29 3.5 3.6
30-34 2,887 1,438 1,449 30-34 2.8 2.8
35-39 2,871 1,417 1,454 35-39 2.8 2.9
40-44 2,388 1,233 1,155 40-44 2.4 2.3
45-49 1,710 827 883 45-49 1.6 1.7
50-54 1,235 657 578 50-54 1.3 1.1
55-59 823 430 393 55-59 0.8 0.8
60-64 693 319 374 60-64 0.6 0.7
65-69 455 205 250 65-69 0.4 0.5
70-74 401 167 234 70-74 0.3 0.5
75-79 646 290 356 75-79 0.6 0.7
80 y + 80 y + 0.0 0.0
Grafique la pirmide de edades por sexo y grupos de edad.
4
Grafique la funcin de produccin de quinua en 3D. Donde Y denota la produccin en TM
NP P N P N Y 2344 . 0 3823 . 0 3338 . 0 1904 . 29 5900 . 42 4785 . 688

2 2
+ + +
Nitrogeno (N)
10 30 50 70 90 110 130 150
F

s
f
o
r
o

(
P
)
10 1358 1990 2354 2452 2282 1846 1142 172
30 1683 2408 2867 3058 2982 2640 2030 1153
50 1702 2521 3073 3358 3376 3127 2611 1828
70 1415 2328 2974 3353 3465 3309 2887 2198
90 822 1829 2569 3041 3247 3185 2857 2261
110 -76 1024 1858 2424 2723 2756 2521 2019
130 -1280 -86 841 1501 1894 2020 1879 1471
150 -2791 -1503 -482 272 759 979 932 617
5
Estadisctrica Descriptiva
1. esviacin estndar (DS)
La desviacin estndar es la medida de la dispersin de los valores respecto a la media (valor promedio).
1
2
_

,
_

n
x x
DS
i
2. Curtosis:
La curtosis caracteriza la elevacin o el achatamiento relativo de una distribucin, comparada con la
distribucin normal. Una curtosis positiva indica una distribucin relativamente elevada, mientras que una
curtosis negativa indica una distribucin relativamente plana.

,
_

) 3 )( 2 (
) 1 ( 3
) 3 )( 2 )( 1 (
) 1 (
2
4
_
n n
n
s
x x
n n n
n n
K
i
Donde s es la desviacin estndar de la muestra.
3. Coeficiente de asimetra:
Esta funcin caracteriza el grado de asimetra de una distribucin con respecto a su media. La asimetra
positiva indica una distribucin unilateral que se extiende hacia valores ms positivos. La asimetra negativa
indica una distribucin unilateral que se extiende hacia valores ms negativos.

,
_

3
_
) 2 )( 1 ( s
x x
n n
n
A
i
4.

Mediana:
Es el nmero intermedio de un grupo de nmeros; es decir, la mitad de los nmeros son superiores a la
mediana y la mitad de los nmeros tienen valores menores que la mediana.
La mediana es el nmero que se encuentra en medio de un conjunto de nmeros. Si la cantidad de nmeros
en el conjunto es par, la mediana es el promedio de los nmeros centrales.
Para una distribucin simtrica de un grupo de nmeros, estas tres medidas de tendencia central son iguales.
Para una distribucin sesgada de un grupo de nmeros, las medidas pueden ser distintas.
5. Percentil
Esta funcin permite establecer un umbral de aceptacin. Por ejemplo, podr examinar a los alumnos cuya
calificacin sea superior al nonagsimo percentil.
K es el valor de percentil en el intervalo de 0 a 1, inclusive.
Si k es < 0 o si k > 1, PERCENTIL devuelve el valor de error #NUM!
6. Cuartil
Por ejemplo, puede utilizar la funcin CUARTIL para determinar el 25 por ciento de ingresos ms altos en
una poblacin. Los cuartiles se usan con frecuencia en los datos de ventas y encuestas para dividir las
poblaciones en grupos.
Si cuartil < 0 o si cuartil > 4, CUARTIL devuelve el valor de error #NUM!
Las funciones MIN, MEDIANA y MAX devuelven el mismo valor que CUARTIL cuando el
argumento cuartil es igual a 0 (cero), 2 y 4 re1
6
Si cuartil es igual a La funcin CUARTIL devuelve
0 Valor mnimo
1 El primer cuartil (percentil 25)
2 El valor de la mediana (percentil
50)
3 El tercer cuartil (percentil 75)
4 Valor mximo
DISTRIBUCIONES DE PROBABILIDAD
Estudiar sus parmetros y su utilidad en Finanzas de las siguientes distribuciones:
7
Sea la funcin de densidad de probabilidad de Weibull.
8
Introduccin a Econometra, regresin Lienal Clsico por
Mnimos Cuadrados y Mxima Verosimilitud.
Introduccin a Econometra.
No existe una definicin nica. La Econometra apareci en la dcada del 30 para estudiar
esencialmente problemas de ciclos econmicos (en la gran depresin). Literalmente, econometra
significa medicin econmica
Gerhard Tintner (1968)
La econometra es resultado de cierta perspectiva sobre el papel que juega la economa,
consiste en la aplicacin de la estadstica matemtica a la informacin econmica para dar soporte
emprico a los modelos construidos por la economa matemtica y obtener resultados econmicos.
P.A. Samuelson (1954)
La econometra puede ser definida como el anlisis cuantitativo de fenmenos econmicos reales,
basados en el desarrollo simultaneo de la teora y la observacin, relacionados mediante mtodos
apropiados de inferencia.
Introduccin a modelos economtricos
1. La teora econmica postula una serie de relaciones causales entre diversas magnitudes.
Ejemplo: S=f(Y), C=g(Y,R,r)
0< dC/dR < 1
2. Pero la teora econmica no precisa cul es el valor
C=+R
3. Al plantear un modelo econmico, en una primera fase, se formulan las relaciones causales
entre las variables objeto de estudio (hiptesis derivado de la teora econmica).
Para cuantificar una relacin es necesario disponer de datos numricos de las variables.
Los modelos puede formularse como un modelo lineal.
C=+R
S el consumo creciera exponencialmente con la renta:
C=e

R
O que estuviese relacionado mediante la expresin:
C=+
1
R+
2
R
2
,
4. El proceso de estimacin de un modelo previamente especificado consiste en la estimacin de
los parmetros (,,
1
,
2
) que intervienen en le modelo.
9
En todos los casos, estos modelos econmicos no representan formas exactas, existe una
discrepancia o error perturbacin aleatoria .
C=+R+
C=e

R
+
La perturbacin incorpora el efecto agregado de las restantes variables econmicas (adems
de la renta) que influyen en el consumo, que no han sido incluidos en el modelo.
ELEMENTOS DE UN MODELO ECONOMETRICO
5. Un modelo economtrico est formado por una o varias ecuaciones en las que la variable
explicada o endgena depende de una o varias variables explicativas.
Ejemplo: Modelo multiecuacional
C
t
=+
0
Y
t
+
1
Y
t-1
+
1
I
t
=

Y
t
+
2
Y
t
=C
t
+I
t
+G
t
Ejemplo: Modelo uniecuacional
V
t
=+
1
IAE
t
+
2
P
t
+
t
Donde: V
t
=Ventas de una empresa
IAE
t
=Indice de la actividad econmica general
P
t
=Inversin en publicidad.
Por lo tanto, un modelo economtrico est formado por:
- Una o varias ecuaciones o relaciones estructurales
- Las variables explicativas y explicadas
- Los parmetros ( y ) a estimar
- Un conjunto de observaciones o datos necesarios para el proceso de estimacin.
6. En funcin del nmero de ecuaciones, un modelo economtrico puede ser:
- Uniecuacional
- Multiecuacional
7. En cada ecuacin, la variable explicada se denomina endgena y representa con la letra Y. las
variables explicativas se denominan exgenas (X
1,
X
2
, X
3
,..X
k
)
8. En definitiva, el carcter exgeno o endgeno de una variable depende del modelo en el que
interviene, y se establece en funcin de consideraciones econmicas sobre las relaciones
causa-efecto especificadas en el modelo.
10
9. Los parmetros o coeficientes a estimar en un modelo se denominan estructurales porque
representan el efecto directo o estructural de cada variable explicativa (predeterminada o
endgena, en los modelos multiecuacionales) sobre cada variable endgena o explicada.
10. Las perturbaciones aleatorias () son trminos que se introducen en cada ecuacin estructural
(salvo en las identidades) para tener en cuenta la no exactitud del modelo.
11. Los datos o informacin estadstica sobre las variables del modelo se usan para estimar los
coeficientes o parmetros estructurales.
12. Las variables que intervienen en un modelo economtrico pueden ser:
- numricas
- categricas (0 y 1), s la variable dependiente es (0 y 1)Modelos: Logit, Probit, Tobit.
13. S los valores se toman en distintos momentos de tiempo Dinmicos o de Series de Tiempo.
(Ejm. PBI, Inflacin, Crecimiento del dinero, etc.)
S los valores de toman en un mismo instante Estticos o de corte transversal, por ejemplo
las encuestas.
FASES EN LA CONSTRUCCION DE UN MODELO
14. En la elaboracin de un modelo se distingue tres fases:
- Especificacin del modelo: Planteamiento de la Hiptesis Econmica
- Estimacin del modelo
- Contrates diagnsticos o de validacin (inferencia estadstica)
15. En la fase de especificacin se formula el modelo estructural. Seleccionar las variables de las
ecuaciones del modelo y se formula la forma funcional (lineal o no lineal) Varios modelos
alternativos hasta lograr el modelo definitivo.
16. La fase de estimacin de los parmetros estructurales, el mtodo depende del tipo de modelo:
si son modelos uniecuacionales: (MCO, MCG, MV). En caso de modelos multiecuacionales:
(MC2E, MVIL, MC3E, MVIC)
11
17. En la fase de contrates diagnsticos o de validacin del modelo. Para ello se formulan una
serie de hiptesis por ejemplo sobre los coeficientes:
Ho: =0
H
1
: 0
Con el objeto de confirmar la influencia de una variable explicativa, o de eliminarla en el
modelo.
18. Si en la fase de contrastes de validacin el modelo no se considera adecuado (total o
parcialmente), es necesario volver a la especificacin inicial y modificarla, iniciando de nuevo
el proceso.
19. La estimacin de un modelo se realizar para estudiar la variacin conjunta de dos o ms
variables y para predecir.
12
Base de datos N 01
Archivo: Basedatos_1
obs Y X X
2
YX
Fitted
^
) (
t
Y
Resid
) (
^
t

resid2
) (
^
2
t

HPTREND_Y HPTREND_X
2
_
) ( Y Y
t

1990Q1 2072 1660 2755600 3439520 1869.64 202.36 40949.37 1977.13 2002.11 1041250.17
1990Q2 2077 1926 3709476 4000302 2065.64 11.36 129.04 2021.81 2074.99 1031071.01
1990Q3 2078 2181 4756761 4532118 2253.53 -175.53 30812.51 2066.55 2147.66 1029041.17
1990Q4 2043 1897 3598609 3875571 2044.27 -1.27 1.62 2111.45 2219.80 1101275.34
1991Q1 2062 1695 2873025 3495090 1895.43 166.57 27745.58 2156.60 2291.14 1061758.51
1991Q2 2067 1705 2907025 3524235 1902.80 164.20 26962.18 2202.06 2361.18 1051479.34
1991Q3 1964 1731 2996361 3399684 1921.96 42.04 1767.68 2247.83 2429.07 1273324.17
1991Q4 1981 2151 4626801 4261131 2231.43 -250.43 62715.02 2293.83 2493.53 1235247.01
1992Q1 1914 2556 6533136 4892184 2529.85 -615.85 379271.80 2339.79 2552.86 1388665.84
1992Q2 1991 3152 9935104 6275632 2969.01 -978.01 956499.64 2385.26 2605.14 1213118.67
1992Q3 2129 3763 14160169 8011427 3419.22 -1290.22 1664662.87 2429.50 2648.44 928171.67
1992Q4 2309 3903 15233409 9012027 3522.38 -1213.38 1472281.21 2471.56 2681.20 613741.67
1993Q1 2614 3912 15303744 10225968 3529.01 -915.01 837238.78 2510.26 2702.52 228882.51
1993Q2 2896 3571 12752041 10341616 3277.74 -381.74 145728.93 2544.36 2712.30 38579.51
1993Q3 3058 3199 10233601 9782542 3003.64 54.36 2955.06 2572.65 2711.17 1184.51
1993Q4 3309 3262 10640644 10793958 3050.06 258.94 67049.63 2594.17 2700.31 46908.34
1994Q1 3446 3476 12082576 11978296 3207.74 238.26 56765.62 2608.23 2681.19 125021.17
1994Q2 3466 2993 8958049 10373738 2851.85 614.15 377179.97 2614.61 2655.66 139564.51
1994Q3 3435 2262 5116644 7769970 2313.22 1121.78 1258392.45 2613.61 2626.03 117363.34
1994Q4 3183 2011 4044121 6401013 2128.27 1054.73 1112451.45 2606.06 2594.85 8205.34
1995Q1 2697 1511 2283121 4075167 1759.85 937.15 878248.03 2593.31 2564.43 156354.34
1995Q2 2338 1631 2660161 3813278 1848.27 489.73 239833.42 2577.05 2536.71 569144.51
1995Q3 2140 1990 3960100 4258600 2112.80 27.20 739.94 2559.06 2512.99 907097.51
1995Q4 2012 1993 3972049 4009916 2115.01 -103.01 10610.80 2540.96 2493.98 1167300.17
1996Q1 2071 2520 6350400 5218920 2503.32 -432.32 186904.19 2524.10 2480.09 1043292.01
1996Q2 2192 2804 7862416 6146368 2712.59 -520.59 271010.99 2509.51 2471.39 810750.17
1996Q3 2240 2919 8520561 6538560 2797.32 -557.32 310609.96 2497.94 2467.99 726614.17
1996Q4 2421 3024 9144576 7321104 2874.69 -453.69 205836.69 2489.93 2470.21 450800.34
1997Q1 2639 2725 7425625 7191275 2654.38 -15.38 236.44 2485.86 2478.64 205586.67
1997Q2 2733 2321 5387041 6343293 2356.69 376.31 141607.17 2486.08 2494.23 129180.34
1997Q3 2721 2131 4541161 5798451 2216.69 504.31 254325.71 2491.02 2518.07 137950.34
1997Q4 2640 2552 6512704 6737280 2526.90 113.10 12790.91 2501.28 2551.16 204680.84
1998Q1 2513 2234 4990756 5614042 2292.59 220.41 48581.66 2517.59 2594.23 335723.67
1998Q2 2448 2282 5207524 5586336 2327.96 120.04 14410.58 2540.76 2648.05 415272.84
1998Q3 2429 2533 6416089 6152657 2512.90 -83.90 7039.73 2571.63 2713.12 440121.67
1998Q4 2516 2517 6335289 6332772 2501.11 14.89 221.60 2610.94 2789.74 332256.17
1999Q1 2534 2772 7683984 7024248 2689.01 -155.01 24027.55 2659.38 2878.10 311829.17
1999Q2 2494 2380 5664400 5935720 2400.17 93.83 8804.75 2717.55 2978.20 358102.51
1999Q3 2596 2568 6594624 6666528 2538.69 57.31 3284.14 2785.99 3089.99 246429.51
1999Q4 2572 2944 8667136 7571968 2815.74 -243.74 59411.61 2865.09 3213.04 270833.51
2000Q1 2601 2629 6911641 6838029 2583.64 17.36 301.37 2955.13 3346.60 241490.34
2000Q2 2648 3133 9815689 8296184 2955.01 -307.01 94253.92 3056.20 3489.73 197506.17
2000Q3 2840 3449 11895601 9795160 3187.85 -347.85 120999.57 3168.17 3641.07 63714.17
2000Q4 2937 3764 14167696 11054868 3419.95 -482.95 233245.52 3290.65 3799.01 24154.34
2001Q1 3136 3983 15864289 12490688 3581.32 -445.32 198312.82 3423.07 3961.86 1899.51
2001Q2 3299 4381 19193161 14452919 3874.59 -575.59 331299.46 3564.60 4127.86 42676.67
2001Q3 3514 4786 22905796 16818004 4173.01 -659.01 434290.21 3714.25 4295.29 177732.51
2001Q4 3815 4094 16760836 15618610 3663.11 151.89 23069.76 3870.88 4462.60 522126.67
2002Q1 4093 4870 23716900 19932910 4234.90 -141.90 20136.08 4033.20 4628.51 1001167.01
2002Q2 4262 5344 28558336 22776128 4584.16 -322.16 103789.99 4199.90 4791.53 1367925.17
2002Q3 4531 5433 29517489 24616923 4649.74 -118.74 14100.00 4369.69 4950.34 2069522.01
2002Q4 4825 5911 34939921 28520575 5001.95 -176.95 31312.60 4541.33 5103.93 3001845.01
2003Q1 5160 6109 37319881 31522440 5147.85 12.15 147.66 4713.70 5251.62 4274900.84
2003Q2 5319 6542 42797764 34796898 5466.90 -147.90 21874.60 4885.82 5393.22 4957673.34
2003Q3 5574 5785 33466225 32245590 4909.11 664.89 442076.54 5057.02 5529.06 6158255.84
2003Q4 5749 5707 32569849 32809543 4851.64 897.36 805258.56 5226.88 5660.24 7057435.01
2004Q1 5715 5412 29289744 30929580 4634.27 1080.73 1167977.85 5395.31 5787.95 6877943.34
2004Q2 5637 5465 29866225 30806205 4673.32 963.68 928674.60 5562.55 5913.48 6474904.34
2004Q3 5383 5550 30802500 29875650 4735.95 647.05 418668.67 5729.04 6037.82 5246772.01
2004Q4 5467 5465 29866225 29877155 4673.32 793.68 629924.20 5895.27 6161.73 5638646.01
Suma 185545
1991
69
77362238
1
6987965
64 185545 0.00
17219810.2
7
78291464.5
8
Prome
dio 3092 3319 3092.417 0.00
Anlisis de una Serie:
13
Antes de iniciar el anlisis economtrico, siempre resulta conveniente observar las grficas y algunas
estadsticas relacionadas con las variables en estudio. Algunos de los comandos para realizar esta tarea son
los siguientes:
Informacin Descriptiva de las Variables: Para observar las principales estadsticas descriptivas de las
variables, se debe seguir la siguiente rutina QUICK/GROUP STATISTICS/DESCRIPTIVE STATISTICS.
Luego se colocan las series que se quieren analizar, y el E-Views arrojar una pantalla con la media,
mediana, kurtosis, etc. de cada una variables requeridas. Si esta pantalla se desea grabar en el archivo, se
debe presionar el cono de NAME y colocar el nombre con el que se quiere guardar.
Asimismo si se quiere la matriz de varianzas y covarianzas de las variables se debe seguir la siguiente
rutina: QUICK/GROUP STATISTICS/COVARIANCES y para la matriz de correlaciones,
QUICK/GROUP STATISTICS/CORRELATIONS.
Grfico de las Variables:
14
Para poder observar tanto los valores de una serie como sus grficos, se debe de hacer doble click sobre la
serie que se desea observar. En ese momento aparece la hoja con los datos de la variable, si se quiere ver un
grfico de la variable, se debe presionar el cono de VIEW y luego la opcin de LINE GRAPH. En caso de
que se quiera ver en simultneo ms de una, se deben marcar varias a la vez (este procedimiento se hace con
el botn derecho del mouse) y luego hacer doble click sobre el grupo, luego escoger la opcin de OPEN
GROUP. En ese momento aparece la hoja con los datos de las variables, se debe presionar el cono de
VIEW y luego la opcin de GRAPH
Flitro de Hodrick-Prescott
Propuesto en 1980 por Robert J. Hodrick y Edward C. Prescott. Descompone la serie observada en dos
componentes, uno tendencial y otro cclico. El ajuste de sensibilidad de la tendencia a las fluctuaciones a
corto plazo es obtenido modificando un multiplicaodr . Es actualmente una de las tcnicas ms
ampliamente utilizada en las investigaciones sobre ciclos econmicos para calcular la tendencia de las series
de tiempo, pues brinda resultados ms consistentes con los datos observados que otros mtodos.
La serie para denota los logaritmos de una serie variable. est conformada por un
componente tendencial, representado por y un componente cclico, representado por tales que
. Dado un valor positivo , adecuadamente escogido, se calcula el componente tendencial
resolviendo el siguiente problema:
Mn
Segn Hodrick y Prescott el componente tendencia de una serie es el que minimiza tal ecuacin.
15
Siempre:
es decir, que la tendencia calculada pasa por el "centro" de la serie bsica.
Las variables X e Y tiene una tendencia (trend) similar entre 1990 y 2004. Sin embargo, el componente
cclico es diferente en ambas variables. Debemos recordar que una serie de tiempo tiene cuatro
componentes: Uno tendencial (T), cclico(C), aleatorio(A) y estacional (E).
El Mtodo de promedios mviles - X11
Es comn encontrar en variables econmicas el fenmeno de estacionalidad, es decir, el movimiento
intraanual sistemtico -aunque no necesariamente regular- de la serie de tiempo que representa una variable
econmica (Hylleberg, 1992).
16
Existe un largo, y an inconcluso, debate sobre la conveniencia de modelar la economa usando variables
originales o desestacionalizadas. Hansen y Sargent (1993) defienden la idea de que los agentes racionales
toman decisiones en base a datos sin desestacionalizar y que remover la estacionalidad implica, en el mejor
de los casos, eliminar informacin que podra ser til para estimar los parmetros de un modelo. Sims
(1993), por el contrario, apoya la idea opuesta; resulta preferible usar datos desestacionalizados, por cuanto
en el proceso de ajustar un modelo a los datos originales se corre el riesgo de darle demasiada importancia a
capturar efectos estacionales -que en s son secundarios- en desmedro de una mejor parametrizacin de las
caractersticas principales del modelo.
A pesar de lo importante que resulta este debate, la mayora de los investigadores prefiere usar datos
desestacionalizados. La justificacin sera que, si bien estos movimientos son anticipables, tpicamente
stos no estn directamente relacionados al objetivo del estudio y, por lo tanto, no resulta necesario
modelarlos explcitamente. Por ejemplo, al estudiar los determinantes de la produccin agrcola se incluyen
variables que representen las condiciones climticas, pero no se hace un modelo que explique la
variabilidad en el clima.
Entre los mtodos ms comunes para remover la estacionalidad estn el uso de variables mudas estacionales
y el mtodo de promedios mviles, que incluye desde la "variacin en x-perodos" hasta el ARIMA X11.
Esta ltima es la metodologa ms popular tanto porque su nivel de desarrollo analtico es superior, como
porque viene implementada como una opcin sencilla de usar en muchos programas economtricos.
Editar X11 en la ventana de comando de E-Views
17
El ms conocido de los mtodos de promedios mviles es el X11 (y su versin ms moderna, el
ARIMA X-12) popularizado por el U.S. Bureau of the Census. El punto de partida de la
metodologa es el teorema de Wold, que demuestra que cualquier serie de tiempo estacionaria
puede ser descompuesta en tres componentes bsicos: una tendencia determinstica, un
componente estacional y un conjunto de innovaciones (Hamilton, 1994).
Base de datos N 02
obs Z HPTREND_Z ZSA
1990Q1 1.5 4.703 4.148
18
1990Q2 3 5.111 4.423
1990Q3 1.5 5.518 3.353
1990Q4 22 5.919 8.785
1991Q1 1.8 6.309 4.913
1991Q2 3.6 6.692 5.238
1991Q3 2.6 7.069 5.680
1991Q4 18 7.441 7.296
1992Q1 2.7 7.803 7.148
1992Q2 5 8.159 7.052
1992Q3 3.4 8.509 7.102
1992Q4 21 8.851 8.749
1993Q1 3.7 9.180 9.277
1993Q2 8 9.498 10.868
1993Q3 5.5 9.805 10.775
1993Q4 25 10.099 10.816
1994Q1 6 10.375 14.097
1994Q2 8.5 10.638 11.043
1994Q3 6 10.890 11.032
1994Q4 24 11.132 10.835
1995Q1 5.1 11.361 11.172
1995Q2 9.5 11.583 11.877
1995Q3 7 11.800 12.240
1995Q4 24 12.012 11.262
1996Q1 5.9 12.217 12.165
1996Q2 10 12.420 12.105
1996Q3 8 12.622 13.536
1996Q4 26 12.821 12.604
1997Q1 6.7 13.016 13.104
1997Q2 11 13.211 12.975
1997Q3 7.1 13.406 11.777
1997Q4 28 13.601 13.954
1998Q1 7.5 13.792 14.002
1998Q2 12.5 13.983 14.398
1998Q3 7.9 14.176 12.968
1998Q4 29 14.369 14.814
1999Q1 8.3 14.558 14.841
1999Q2 13 14.749 14.661
1999Q3 10 14.943 16.279
1999Q4 30 15.139 15.693
2000Q1 9.1 15.334 15.605
2000Q2 14.5 15.534 16.082
2000Q3 9.5 15.743 15.302
2000Q4 28 15.960 14.981
2001Q1 9.9 16.185 16.360
2001Q2 15 16.421 16.416
2001Q3 10.3 16.671 16.363
2001Q4 27 16.935 14.761
2002Q1 13 17.209 20.805
2002Q2 16 17.497 17.345
2002Q3 11.1 17.797 17.486
2002Q4 32 18.110 17.739
2003Q1 13 18.429 20.406
2003Q2 17.5 18.760 18.859
2003Q3 11.9 19.102 18.643
2003Q4 34 19.454 19.004
2004Q1 12.3 19.812 19.104
2004Q2 18 20.179 19.366
2004Q3 12.7 20.555 19.849
2004Q4 32 20.938 17.947
Matriz de coeficientes de correlacin
19



Modelo de Regresin Lineal Clsico
20
Sea:
Y=variable dependiente
X=variables independientes
=parametros del modelo
Entonces:
1 1 1 nx kx nxk nx
X y +
Tambin podemos representarlo haciendo explicitas las matrices observa las dimensiones de los vectores y
el nmero de columnas X

1
1
1
1
]
1

+
1
1
1
1
]
1

1
1
1
1
1
]
1

1
1
1
1
]
1

n k
k
n n n
k
k
n
x x x
x x x
x x x
y
y
y

2
1
2
1
2 1
2
2
2
1
2
1
2
1
1
1
2
1
El estimador es:
y X X X ' ) ' (
1
^


Efectos Marginales
El vector contiene contiene los efectos marginales de cada variable dependiente sobre la variable
dependiente.
k
k
x
y
x
y
x
y

2
2
1
1
Como podemos observar dichos efectos marginales son constantes, no vara entre los datos de la muestra.
Esto es obvio porque se trata de un modelo lineal (lineal con respecto a los parmetros),
21
Supuestos del modelo:
El orden de las caractersticas que se detallan a continuacin es de acuerdo a su importancia
1. La media de los errores debe ser igual cero E()=0
2. Ortogonalidad entre las variables explicativas y los errores. Las variables explicativas o
independientes no pueden tener correlacin alguna con los errores. Matematicamente esta idea tiene
la siguiente notracin:
E[X]=0
Si en un modelo economtrico las variables explicitas o alguna de ellas tienen correlacin con los
errores, en ese caso ser una muestra que los errores contienen informacin til para la estimacin.
Por ello, es necesario especificar bien el modelo para extraer toda la informacin posible
1
.

3. Los errores se caracterizan por poseer una varianza constante (homoscedasticidad). La idea es que
los errores no pueden presentar ningn comportamiento definido, solo deben estar alrededor de cero
y con una variabilidad que se pueda controlar (varianza constante)
4. Los errores no deben estar correlacionados: Cov (
t
,
t-k
) = 0 ; por ejemplo, el error de hoy no
tiene que ver nada con el error del maana.
5. La no multicolinealidad de las variables explicativas. En la matriz de X no podemos tener dos o ms
variables que posean el mismo comportamiento, de ser el caso estaramos incrementado el nmero
de variables explicativas sin sentido. Matemticamente, decimos que el rango de la matriz X es
igual a k.
6. La distribucin de los errores () condicional a X es conjuntamente normal. Matemticamente
podemos expresar esta idea de la siguiente manera:

/X

N(0,

2
I
n
)
7. El modelo es lineal con respecto a los parmetros.
8. Las variables del modelo tiene que ser variables estacionarias o al menos los errores tienen que ser
estacionarios
2
1
En este contexto de series de tiempo, la idea ser que las variables explicativas son ortogonales a los errores en el pasado,
presente y futuro.
2
Supuesto que se incluye para hacer inferencia estadstica.
22
Mtodo de Mnimos Cuadrados Ordinarios
El mtodo de mnimos Cuadrados Ordinarios (MCO) es el ms utilizado para la estimacin de los modelos
lineales. El mtodo consiste es minimizar la suma de los residuos al cuadrado:
) ( )' ( ' min
^ ^
X y X y e e
Propiedades del estimador MCO
La idea de esta seccin es mostrar las caractersticas de la distribucin del estimador de MCO para muestra
de tamao n.
1. El Teorema Gauss-Markov nos dice que el estimador de MCO es eficiente (su varianza es la ms
pequea que cualquier otro estimador).
2. El estimador de MCO es una funcin de la mesutra (y,X) si dichas variables son aleatorios entonces
el estimador tambin lo ser. Si fijamos X y tenemos todas las posibles realizaciones de y tomamos
el promedio de los
MCO
^

y dicho promedio ser igual al verdadero valor


3. Eficiencia del estimador MCO. Si calculamos el
MCO
^


para las diferentes muestras, el promedio de
dichos estimadores coincidir con el valor verdadero.
Estimar el modelo:
t t t t
Z X Y + + +
1 1 0
Dependent Variable: Y
Method: Least Squares
Date: 03/12/10 Time: 20:33
Sample: 1990Q1 2004Q4
Included observations: 60
Y=C(1)+C(2)*X+C(3)*Z
Coefficient Std. Error t-Statistic Prob.
C(1) 598.1962 189.2736 3.160483 0.0025
C(2) 0.714629 0.055096 12.97055 0.0000
C(3) 9.313313 8.447915 1.102439 0.2749
R-squared 0.784647 Mean dependent var 3092.417
Adjusted R-squared 0.777091 S.D. dependent var 1151.944
S.E. of regression 543.8703 Akaike info criterion 15.48401
Sum squared resid 16860309 Schwarz criterion 15.58872
Log likelihood -461.5202 Hannan-Quinn criter. 15.52497
F-statistic 103.8408 Durbin-Watson stat 0.344440
Prob(F-statistic) 0.000000
23
Pasos para analizar la validez de una estimacin por MCO:
a. Analizar los efectos marginales, es decir, que el sigo de los parmetros coincida con las hiptesis de
trabajo (teora econmica)
b. Contrastar el grado de significancia de los parmetros estimados. Regla prctica: La probabilidad
debe ser menor a 0.05. Esto significa que la probabilidad de equivocarse al rechazar la hiptesis nula
es muy baja.
c. Una vez que los pasos a) y b) fueron exitosamente evaluados, el siguiente paso es verificar el poder
de explicacin del modelo. El modelo debe pasar con xito la prueba F y poseer R
2
alto segn
nuestros objetivos.
d. Evaluar si el modelo cumple con los supuestos principales del modelo de regresin lineal clsico.
Regresin espuria
El paso previo para estimar un modelo de series de tiempo es probar la presencia o ausencia de raz unitaria
I(1) de las variables del modelo
3
, a no ser que los errores de la regresin sean estacionarios I(0), caso
contrario se puede caer en regresiones espurias. A continuacin asumiremos que las variables X e Y son
estacionarias (no tienen raz unitaria).
Cuando las series no son estacionarias, representa un problema para el modelo economtrico.
Los resultados no son confiables, debido a que las series presentan un comportamiento similar en el tiempo.
Los valores de los coeficientes no pueden ser utilizados para realizar pronstico y anlisis econmico.
Consecuencias de la regresin espuria sobre la significancia estadstica de los estimadores
La probabilidad de obtener estimadores distintos de cero es muy alta. Debido a que el estadstico t
calculado es bastante elevado.
El estadstico F calculado tambin es bastante elevado indicando que la relacin entre las variables es
estadsticamente significativa.
Los valores de los estimadores pueden sealar una relacin significativa entre las variables.
Segunda observacin sobre el problema de la regresin espuria. Se presenta una R2 cercana a uno.
Tercera observacin sobre el problema de la regresin espuria. El estadstico Durbin-Watson presenta un
valor cercano a cero, debido a que la serie es camino aleatorio los errores presentan un fuerte proceso de
autocorrelacin.
Problemas de la regresin espuria
1) Los estimadores son estadsticamente significativos, presentando estadsticos t y F elevados, que
rechazan la hiptesis nula.
2) El valor de la R
2
es muy cercano al valor de 1, indicando que el modelo es adecuado
3
Para verificar la presencia de raz unitaria se puede analizar por ejemplo el correlograma, el
test de Dickey Fluller Aumentado (DFA), el test de Phillips-Perron (PP), etc.
24
3) El estadstico DW tiende a cero
Una regla para determinar si la regresin es falsa DW < R
2
Ahora veamos, excluyendo la variable Z:
t t t
X Y + +
1 0
Dependent Variable: Y
Method: Least Squares
Date: 03/12/10 Time: 18:00
Sample: 1990Q1 2004Q4
Included observations: 60
Y=C(1)+C(2)*X
Coefficient Std. Error t-Statistic Prob.
C(1) 646.4836 184.4775 3.504405 0.0009
C(2) 0.736841 0.051375 14.34233 0.0000
R-squared 0.780055 Mean dependent var 3092.417
Adjusted R-squared 0.776263 S.D. dependent var 1151.944
S.E. of regression 544.8791 Akaike info criterion 15.47177
Sum squared resid 17219810 Schwarz criterion 15.54158
Log likelihood -462.1531 Hannan-Quinn criter. 15.49908
F-statistic 205.7024 Durbin-Watson stat 0.286683
Prob(F-statistic) 0.000000
Lnea de regresin lineal
25
Efectos Marginales:
7368 . 0
1

t
t
X
Y
Por un lado,
1
es mayor a cero, esto significa que existe una relacin positiva entre X e Y, es el signo
esperado? Por otro lado, significa que s aumenta la variable X en una unidad la variable Y aumentar en
0.7368 en promedio. En modelos lineales (lineales en los parmetros) los efectos marginales son constantes,
no vara entre los datos de la muestra.
y X X X ' ) ' (
1
^


Para estimar el siguinete modelo sera:
1
]
1

1
]
1

1
1
]
1


i i
i
i i
i
x y
y
x x
x n
1
2 ^
1
^
0

Reemplazando valores:
1
]
1

1
]
1

1
1
]
1


698796564
185545
773622381 199169
199169 60
1
^
1
^
0

1
]
1

1
]
1

1
1
]
1

698796564
185545
09 89014 . 8 05 95107 . 2
05 95107 . 2 114626817 . 0
^
1
^
0
E E
E

1
]
1

1
1
]
1

736841 . 0
4836 . 646
^
1
^
0

Por consiguiente:
t t t
X Y + + 736841 . 0 4836 . 646
t t
X Y 736841 . 0 4836 . 646
^
+
26
Por lo que el trmino error estimado (resid) ser:
^ ^
t t t
Y Y
A continuacin se tiene el grafico de los trminos de error estimados al cuadrado (resid2=
2
^
t

).
Precisamente, el objetivo del MCO es minimizar la distancia entre entre cero y
2
^
t

.
Matriz de Varianza-Covarianza
1
^
2
^
) ' ( ) (

X X


1
]
1


) var( ) , cov(
) , cov( ) var(
) cov(
1 0 1
1 0 0
^


Var
C X
C 34031.93 -8.761517
X -8.761517 0.002639
1
^
773622381 199169
199169 60
296893.28 ) cov(

1
]
1

Var
1
]
1


002639 . 0 761517 . 8
761517 . 8 93 . 34031
) cov(
^
Var
27
05137 . 0 ) ( . ; 002639 . 0 ) var(
477 . 184 ) ( . ; 93 . 34031 ) var(
1 1
0 0




Error Std
Error Std
En el modelo estimado por MCO:
t t
X Y 736841 . 0 4836 . 646
^
+
No sabemos si las variables X e Y presentan raz unitaria, en efecto asumiremos que las variables X e Y
son estacionarias, para realizar la inferencia estadstica;
t-statistic: Es una prueba se significancia individual. Se examina la hiptesis nula (Ho) de que el paramtro
(
k
=0). S p-value es menor a cero se rechaza la Ho.
El Ecometric Views en la ltima columna muestra el nivel de significancia de dos colas ("2-TAIL SIG."), este
valor equivale a (nivel de significancia) de manera que usted no requiere utilizar las tablas estadsticas de t de
student.
Qu nivel de significancia es recomendable?, sabemos que si (nivel de significancia) es muy pequeo,
entonces la prueba es muy estricta o muy rigurosa y por lo general estamos propensos a cometer el ERROR
TIPO II, es decir, rechazamos la hiptesis nula en lugar de aceptar. Pues lo recomendable es que sea un
valor pequeo, pero depender mucho de la naturaleza de la investigacin, as si el tamao de la muestra es
pequea convendra ampliar el valor de , dado que si la muestra es pequea, entonces se corre el riesgo de que
el estimador no es lo ideal por lo tanto podemos asumir que la probabilidad de cometer el error sea mayor, el
asunto es cunto?, generalmente 5%.
H
o
:
i
= 0 El parmetro; por lo tanto la variable no es importante en el modelo
Para nuestro ejemplo, se puede utilizar: = 5% y n-k = 60 -2 =58 grados de libertad
Coeficiente de determinacin(S-squared R
2
): Mide el grado de ajuste del modelo de regresin estimado,
se puede decir si el modelo es o no satisfactorio. Si el valor del R
2
es razonablemente alto o cercano a 1,
entonces el modelo tiene buen ajuste. Sin embargo este criterio no se debe ponderar demasiado, puesto es
posible aumentar el R
2
agregando al modelo variables explicativas adicionales. De hecho para datos de corte
transversal con varios cientos de observaciones se puede obtener valores muy bajos para R
2
.
28
780055 . 0
58 . 78291464
17219810
) ( )' (
' '
1
2
2




y y y y
e e
y
e e
R
i i
i
780055 . 0
58 . 78291464
17219810
1
2
R
Media de la variable dependiente, es el promedio aritmtico de la variable dependiente
417 . 3092
60
185545
1

T
y
y
n
t
t
Adjusted R-squared (R
2
ajustado)
k T
T
R R

1
) 1 ( 1
2
2
Reemplazando valores:
776 . 0
2 60
1 60
) 78 . 0 1 ( 1
2
2

R
R
Varianza del error
8791 . 544
28 . 296893
2 60
36 . 17219810
'
^
2
^
2
^

e
e
k n
SRC
k n
e e
Log likelihood (LnL) : Es el valor de la funcin de Mxima Verosimilitud. Cabe sealar que MV reporta
los mismos estimadores de MCO
1
]
1

,
_

+ +
T
SCR T
ln ) 2 ln( 1
2
(LnL) likelihood - log
Reemplazando:
T = 60 (Tamao de muestra); SRC = ee=17219810.27; = 3.141592
Reemplazando valores:
29
( )
-462.1531
60
27 . 17219810
log ) 141592 . 3 ( 2 log 1
2
60
likelihood - Log

1
]
1

,
_

+ +
likelihood Log
Criterio de Akaike (AIC): Sirve para seleccionar modelos:
T
k
T
LnL 2 2
AIC +
Reemplazando:
47 . 15 criterion info Akaike
60
) 2 ( 2
60
) 1531 . 462 ( 2
criterion info Akaike


Criterio de Schwarz (SC):
Se usa para seleccionar modelos
T
T k
T
LnL ) ln( 2
SC + Reemplazando sus valores correspondientes tenemos:
54 . 15 SC
60
)) 60 (ln( 2
60
) 1531 . 462 ( 2
SC


F-statistic: Es el valor de la F, es una prueba de significancia global, la hiptesis nula es
Ho:
1
=
2
=
3
=.=
k
=0 (excepto el intercepto)
Si p-value(prob) es menor a 0.05 se rechaza Ho.
) /( ) 1 (
) 1 /(
2
2
) , 1 (
k T R
k R
F
k T k


Reemplazando sus valores tenemos:
70 . 205
) 2 60 /( ) 78005 . 0 1 (
) 1 2 /( 78005 . 0
) , 1 (
) , 1 (



k T k
k T k
F
F
30
Desviacin estandar de la variable dependiente:
94 . 1151
06 . 1326974
1 60
6 . 78291469
1
) (
2
2
2



y
y
t
y
T
Y Y

Durbin-Watson
2866 . 0
26 . 17219810
01 . 4936621
DW
2866 . 0
26 . 17219810
01 . 4936621
DW
Normalidad de las perturbaciones
El supuesto de normalidad de las perturbaciones es importante por cuanto dependiendo de la validez de
dicho supuesto, podremos hacer inferencia estadstica sobre los parmetros y cualquier prueba de hiptesis.
El contraste de normalidad es el test de Jarque-Bera (JB), se basa en los coeficientes de asimetra
(skewness) y kurtosis (k) aplicado a los residuos del modelo.
Ho: Existe normalidad de los residuos (perturbaciones)
El estadistco Jarque-Bera se calcula del siguiente modo:
( )
1
]
1

+
2
2
3
24
1
6
K
S
T JB
Para muestras grandes JB se distribuye con chi-cuadrado con 2 g.l. Si el coeficiente de asimetra es cero y la
kurtosis es de 3, entonces el valor de JB ser cero, en otras palabras los residuos tendrn una distribucin
normal..
El procedimiento para detectar la normalidad de las perturbaciones es el siguiente:
Regresionar el modelo original por MCO
31
Ingresar a VIEW/RESIDUAL TESTS
Optar por HISTOGRAM-NORMALITY TEST
En este caso, S=0.075901 ; K=3.022697
Reemplazando:
( ) 05889 . 0 3 022697 . 3
24
1
6
) 075901 . 0 (
60
2
2

1
]
1

+ JB
En los resultados de E-Views prob<0.05 de JB, por lo tanto no se rechaza la Ho. En otras palabras, los
residuos tienen una distribucin normal.
32
Mnimos Cuadrados Ordinarios en SOLVER (MCO)
SOLVER es una herramienta de Excel, con Solver, puede buscarse el valor ptimo para una formula de
una celda, denominada celda objetivo, en una hoja de clculo. Ms concretamente Solver resuelve
problemas de maximizacin y minimizacin. Solver trabaja con el grupo de celdas que estn relacionadas,
directa o indirectamente, con la frmula de la celda objetivo. Solver ajusta los valores de las celdas
variables que se especifiquen, denominadas celdas ajustables, para obtener el resultado especificado en la
frmula de la celda objetivo.
Pueden aplicarse restricciones para restringir los valores que puede utilizar Solver en el modelo y las
restricciones pueden hacer referencia a otras celdas a las que afecte la frmula de la celda objetivo.
t Y
t
X
t
2
) * 5 . 0 ( X Y
t

2
) * 6 . 0 ( X Y
t

2
) * 7 . 0 ( X Y
t

2
) * 8 . 0 ( X Y
t

2
) * 9 . 0 ( X Y
t

2
) * 1 ( X Y
t

2
) * 1 . 1 ( X Y
t

2
) * 2 . 1 ( X Y
t

1 2 2 1.0000 0.6400 0.3600 0.1600 0.0400 0.0000 0.0400 0.1600
2 3 4 1.0000 0.3600 0.0400 0.0400 0.3600 1.0000 1.9600 3.2400
3 4 5 2.2500 1.0000 0.2500 0.0000 0.2500 1.0000 2.2500 4.0000
4 5 2 16.0000 14.4400 12.9600 11.5600 10.2400 9.0000 7.8400 6.7600
5 2 6 1.0000 2.5600 4.8400 7.8400 11.5600
16.000
0 21.1600 27.0400
6 6 2 25.0000 23.0400 21.1600 19.3600 17.6400
16.000
0 14.4400 12.9600
7 7 9 6.2500 2.5600 0.4900 0.0400 1.2100 4.0000 8.4100 14.4400
8 8 7 20.2500 14.4400 9.6100 5.7600 2.8900 1.0000 0.0900 0.1600
e'e 72.75 59.04 49.71 44.76 44.19 48 56.19 68.76

MC
O 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2
El objetivo de Mnimos Cuadrados Ordinarios (MCO) es buscar el vector de parmetros que minimice la
suma de los residuos al cuadrado (ee), en este ejemplo existe un solo parmetro, el parmetro que minimiza
(ee) se encuentra entre 0.8 y 0.9 como se puede apreciar en el grafico siguiente.
33
A continuacin se minimiza en E-Views.
Dependent Variable: Y
Method: Least Squares
Date: 03/06/10 Time: 08:51
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
X 0.863014 0.169205 5.100397 0.0014
R-squared -0.223426 Mean dependent var 4.625000
Adjusted R-squared -0.223426 S.D. dependent var 2.263846
S.E. of regression 2.504009 Akaike info criterion 4.790131
Sum squared resid 43.89041 Schwarz criterion 4.800062
Log likelihood -18.16053 Hannan-Quinn criter. 4.723156
Durbin-Watson stat 3.267983
En el siguiente cuadro, se muestra los residuos (residual) que fueron minimizados.
34
Aplicacin N 01
Tema: Estimacin de una funcin de produccin de quinua
La fuente de la base de datos que se muestran a continuacin corresponden al Instituto
Nacional de Investigacin Agraraia INIA Puno.
Producto
res
Producc
in kg/
Ha
(Q)
Mano de
Obra
Hrs/Ha
(MO)
Maquinaria
Hrs/Ha
(T)
Fertilizante
s kg/Ha
(F)
Insecticidas
kg/Ha
(I)
Semilla
kg/Ha
(S)
1 1450 50 19 100 0.5 12
2 1556 56 21 105 0.6 13
3 1496 53 20 101 0.5 13
4 1096 44 18 97 0.3 11
5 2000 66 26 115 0.9 15
6 1750 55 23 96 0.7 14
7 983 41 16 93 0.3 10
8 1390 47 19 101 0.4 13
9 1763 56 22 102 0.5 14
10 1210 48 18 96 0.3 12
11 1329 46 16 101 0.6 13
12 1933 54 20 106 0.5 13
13 1893 57 23 112 0.8 14
14 1324 46 21 102 0.5 13
15 950 40 13 90 0.3 10
16 1399 49 19 99 0.4 12
17 1050 43 18 98 0.3 11
18 1732 55 23 99 0.6 13
19 965 41 17 91 0.3 10
20 1633 532 21 106 0.6 13
21 1948 60 25 112 0.8 14
22 1975 64 26 113 0.8 14
23 1763 56 23 106 0.7 13
24 1206 47 20 95 0.3 12
35
25 1421 51 18 99 0.5 13
26 1376 49 21 100 0.4 13
27 1113 44 16 96 0.4 11
28 976 42 15 93 0.3 10
29 1297 48 20 96 0.4 12
30 1378 46 22 101 0.5 12
31 1246 45 20 96 0.4 12
32 1560 54 21 98 0.5 13
33 987 43 15 91 0.3 11
34 1962 60 23 110 0.7 14
35 1572 55 20 107 0.5 13
36 1859 56 24 106 0.6 12
37 1455 50 18 100 0.5 11
Fuente: INIA-ILLPA-2003
La funcin de produccin de tipo Cobb Douglas como un modelo economtrico es:
i i
u
k
e X X X AX Q

........
3 2 1
3 2 1

Donde Q = Produccin; A=tecnologa; X


1
, X
2
,.., X
k
son los factores de produccin
Dependent Variable: LOG(Q)
Method: Least Squares
Simple: 1 37
Included observations: 37
Coefficient Std. Error t-Statistic Prob.
C 2.330287 1.826987 1.275481 0.2116
LOG(MO) 0.011172 0.032890 0.339676 0.7364
LOG(T) 0.375995 0.145928 2.576577 0.0150
LOG(F) 0.592243 0.414616 1.428414 0.1632
LOG(S) 0.487291 0.234512 2.077893 0.0461
LOG(I) 0.256175 0.082241 3.114917 0.0039
R-squared 0.913270 Mean dependent var 7.260159
Adjusted R-squared 0.899282 S.D. dependent var 0.231802
S.E. of regression 0.073565 Akaike info criterion
-
2.233899
Sum squared resid 0.167766 Schwarz criterion
-
1.972669
Log likelihood 47.32714 Hannan-Quinn criter.
-
2.141803
F-statistic 65.28643 Durbin-Watson stat 2.124790
Prob(F-statistic) 0.000000
Nota: Log indica logaritmo natural de base e=2.7182..
La funcin de produccin de tipo Cobb-Douglas con todas las variables es:
2561 . 0 487 . 0 592 . 0 375 . 0 011 . 0
^
28 . 10 I S F T MO Q
En forma individual los parmetros asociados a las variables MO y F no son estadsticamente
significativos por lo se excluir de la especificacin del modelo, as:
Dependent Variable: LOG(Q)
Method: Least Squares
Sample: 1 37
Included observations: 37
Coefficient Std. Error t-Statistic Prob.
36
C 4.858994 0.583459 8.327915 0.0000
LOG(T) 0.434055 0.141151 3.075099 0.0042
LOG(S) 0.535959 0.233497 2.295354 0.0282
LOG(I) 0.321599 0.070499 4.561734 0.0001
R-squared 0.906736 Mean dependent var 7.260159
Adjusted R-squared 0.898257 S.D. dependent var 0.231802
S.E. of regresin 0.073938 Akaike info criterion
-
2.269369
Sum squared resid 0.180406 Schwarz criterion
-
2.095215
Log likelihood 45.98332 Hannan-Quinn criter.
-
2.207972
F-statistic 106.9446 Durbin-Watson stat 1.912691
Prob(F-statistic) 0.000000
Finalmente la funcin de produccin de tipo Cobb-Douglas representativo es:
5359 . 0 3215 . 0 434 . 0
^
89 . 128 S I T Q
En este caso existen rendimientos crecientes a escala
Sesin 2:
Violacin de supuestos del modelo de regresin lineal clsico.
Autocorrelacin
Uno de los supuestos de la estimacin por MCO es la ausencia de autocorrelacin de la perturbacin (resid),
es decir que la perturbacin no se encuentra correlacionada significativamente con sus rezagos. En caso de
que la perturbacin est autocorrelacionada, si estimamos los parmetros por MCO, entonces los
estimadores no sern eficientes, pues la varianza de los estimadores no ser mnima.
Para detectar la autocorrelacin, podemos usar el Test de Bresch-Godfrey (LM Multiplicadores de
Lagrange), el cual consiste en regresionar los residuos por MCO sobre p rezagos de los residuos y las
variables explicativas del modelo lineal original. Luego, el estadstico TR
2
se compara con el tabular de la
distribucin chi-cuadrado con p grados de libertad. Intuitivamente, R
2
tender acero en la medida que los
rezagos y las dems variables explicativas no expliquen el comportamiento de los residuos.
El procedimiento que debemos seguir es el siguiente:
Regresionar el modelo original por MCO.
Ingresar VIEW/RESIDUAL TESTS
Optar por SERIAL CORRELATION LM TEST
Indicar el nmero de rezagos de los residuos que sern tomados en cuenta.
37
Ho: No hay autocorrelacin de orden p
Con la base de datos N 01 de la pgina N 08, el modelo a estimar es:
t t t
X Y + +
1 0
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 61.35060 Prob. F(3,55) 0.0000
Obs*R-squared 46.19546 Prob. Chi-Square(3) 0.0000
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 03/08/10 Time: 23:53
Sample: 1990Q1 2004Q4
Included observations: 60
Presample missing value lagged residuals set to zero.
Variable Coefficient Std. Error t-Statistic Prob.
C -45.58760 91.97126 -0.495672 0.6221
X 0.014701 0.025829 0.569156 0.5716
RESID(-1) 1.051194 0.132860 7.912040 0.0000
RESID(-2) -0.041741 0.197779 -0.211048 0.8336
RESID(-3) -0.241856 0.138602 -1.744973 0.0866
R-squared 0.769924 Mean dependent var -1.17E-13
Adjusted R-squared 0.753192 S.D. dependent var 540.2418
S.E. of regression 268.3911 Akaike info criterion 14.10242
Sum squared resid 3961859. Schwarz criterion 14.27695
Log likelihood -418.0727 Hannan-Quinn criter. 14.17069
F-statistic 46.01295 Durbin-Watson stat 2.075143
Prob(F-statistic) 0.000000
En este caso, se rechaza la hiptesis nula porque el p-value es menor a 0.05.
Por consiguiente existe autocorrelacin de orden 3 en los residuos.
Para corregir la autocorrelacin, se puede usar la opcin AR que debe ser considerada al correr la regresin
del modelo original. Si se detect que el modelo tena autocorrelacin de orden 3, entonces, deber
incorporar AR(1), AR(2) y AR(3) en la regresin inicial adems de las variables explicativas originales.
Heteroscedasticidad
La heteroscedasticidad es otro problema que pueden presentar las perturbaciones y est referido a que las
varianzas de las perturbaciones no son constantes a lo largo del tiempo. Es decir, se incumple el supuesto de
homogeneidad de varianzas de la perturbacin a lo largo del tiempo. En tal caso, si se corre la regresin sin
considerar dicho problema, entonces los estimadores de los parmetros no sern eficientes pues la varianza
de los estimadores no ser mnima.
38
Para detectar la heteroscedasticidad, podemos usar el test de White, el cual consiste en regresionar los
residuos MCO al cuadrado (proxy de la varianza de los residuos) sobre las variables explicativas y, si se
desea, los productos de ellas. Luego el estadistico TR
2
se compara con el valor tabular de la distribucin
chi-cuadrado con p-1 grados de libertad, donde k es el nmero de parmetros de la regresin auxiliar.
Intuitivamente, R
2
tender a cero en la medida que las variables explicativas y sus productos no expliquen el
comportamiento de los residuos al cuadrado.
Ho: No hay heteroscedasticidad en los residuos
El procedimiento que debemos seguir para detectar heterocedasticidad es el siguiente:
COMO DETECTAR LA HETEROCEDASTICIDAD?
Regresionar el modelo original por MCO
Ingresar a VIEW/RESIDUAL TESTS
Optar por WHITE HETEROSKEDASTICITY (no cross terms) o WHITE
HETEROSKEDASTICITY (cross terms)
Heteroskedasticity Test: White
F-statistic 1.821090 Prob. F(2,57) 0.1711
Obs*R-squared 3.603610 Prob. Chi-Square(2) 0.1650
Scaled explained SS 3.405587 Prob. Chi-Square(2) 0.1822
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 03/08/10 Time: 23:56
Sample: 1990Q1 2004Q4
Included observations: 60
Variable Coefficient Std. Error t-Statistic Prob.
C -326528.9 413592.8 -0.789494 0.4331
X 312.5712 241.6872 1.293288 0.2011
X^2 -0.032888 0.031183 -1.054673 0.2960
R-squared 0.060060 Mean dependent var 286996.8
Adjusted R-squared 0.027080 S.D. dependent var 411615.9
S.E. of regression 406004.4 Akaike info criterion 28.71482
Sum squared resid 9.40E+12 Schwarz criterion 28.81954
Log likelihood -858.4447 Hannan-Quinn criter. 28.75578
F-statistic 1.821090 Durbin-Watson stat 0.479201
Prob(F-statistic) 0.171140
En el ejemplo se rechaza Ho porque el p-value es menor a 0.05, en otras palabras existe heteroscedasticidad
en los residuos.
39
COMO CORREGIR LA HETEROSCEDASTICIDAD?
Detectar cul es la variable que ms explica a los residuos al cuadrado.
Correr una regresin de los residuos al cuadrado sobre dicha variable y una constante.
Obtener el estimado de la variable (de los residuos al cuadrado) al que llamaremos Trans
Regresionar el modelo original indicando en la estimacin, dentro del men de OPTIONS en
Weighted LS / Ts es la inversa de la raz cuadrada de Trans.
Estabilidad del modelo
Test de CUSUM cuadrado
La estabilidad de los parmetros es uno de los supuestos de la estimacin MCO. Por medio de los test de
estabilidad, tratamos de determinar si los estimadores MCO de una ecuacin son estables a lo largo del
tiempo. Podemos usar el test de CUSUM y CUSUM cuadrado. La hiptesis nula (Ho) es:
Ho: Estabilidad de los parmetros
El procedimiento que debemos seguir para detectar inestabilidad de parmetros es el siguiente:
Regresionar el modelo original por MCO
Ingresar VIEW/STABILITY TEST/RECURSIVE ESTIMATION
Optar por CUSUM Test o CUSUM of Squares Test, e indicar los coeficientes cuya estabilidad ser
contrastada.
El E-Views reporta un grfico, conteniendo la evolucin de un estadstico llamado residuos cuadrados
normalizados (s
t
)), as como las bandas al 5% de nivel de significancia. S el estadstico se encuentra dentro
de las bandas, podemos decir con un 95% de confianza que no existe evidencia necesaria para rechazar la
hiptesis nula de estabilidad de parmetros (en trminos prcticos, concluimos que los parmetros son
estables a lo largo del tiempo).
Cusum cuadrado
40
El estadstico S
t
se sale de las bandas de confianza desde el tercer trimestre del 1998 hasta el tercer trimestre
del ao 2003, se puede inferir que los parmetros no son estables en este perodo.
La lnea no debe salirse del intervalo de confianza mostrado (lneas punteadas). Si se sale, se rechaza la
hiptesis nula de estabilidad. Es decir, puede haber existido un cambio estrutural en el perodo de la
muestra. Posibles soluciones: buscar otro modelo, en caso de que la inestabilidad se pueda deber a una mala
especificacin; eliminar posibles outliers (observaciones atpicas); modelar el o los quiebres(s)
estructural(es) permitiendo interceptos y pendientes diferentes.
Tests de estimadores recursivos
Este test se basa en la secuenica de estimadores recursivos:
T T t Y X X X
t t t t t
,....., ) (
0
' 1 '
^

Bajo la hiptesis nula, es constante a lo largo de la muestra, y la nica fuente de variacin en los
^

proviene del aumento en el tamao de la muestra.


E-Views grafica grafica la evolucin de cada
k
^

a lo largo de la muestra con una banda de 2 errores


estndar.
Ho: Estabilidad de los parmetros
41
Criterio de estabilidad de los
- La banda tiene que ir disminuyendo de tamao a travs del tiempo
- La banda no debe tener una tendencia hacia arriba o hacia abajo
- El ltimo valor del estadgrafo debe estar dentro del intervalo de confianza de la observacin inicial
en el grfico
En el caso de que no se cumplen estos criterios, se rechaza la hiptesis nula de estabilidad.
Sesin 3:
Modelo de Ecuaciones simultaneas, Estimacin por MC2E y
MCG
Sea el modelo de ecuaciones simultaneas:
(1)
1 1 0 i i i
x y + +
) 2 (
2 1 0 i i i
z x + +
Variable endgenas: y
i
x
i
(M=2)
Variables predeterminadas (variables instrumentales): 1, z
i
(K=2)
Nota: 1=constante
Aplicacin N 3
Archivo: basedatos_3
Obs y
i
x
i
z
i
z
i
2
x
i
z
i
1 2 2 1 1 2
2 3 4 2 4 8
3 4 5 4 16 20
4 5 2 1 1 2
5 2 6 5 25 30
42
6 6 2 7 49 14
7 7 9 4 16 36
8 8 7 5 25 35
Suma 37 37 29 137 147
Realice la identificacin de las ecuaciones del modelo por condicin de orden y rango, luego las ecuaciones
por los mtodos de:
1. Mnimos Cuadrados Ordinarios (MCO)
2. Mnimos Cuadrados de 2 etapas (MC2E)
3. Mtodo de Momentos Generalizado (MMG)
Pautas de Solucin
Comparacin de resultados por mtodos de estimacin
MCO MC2E MMG

0

2.8981 -0.7184 -0.7184



1

0.3733 1.1553 1.1553


2
R 0.1860 -0.6299 -0.6299
0


3.1607 3.1607 3.1607

1

0.4039 0.4039 0.4039



2
R 0.1086 0.1086 0.1086
1. Mnimos Cuadrados Ordinarios (MCO)
Ecuacin (1)
(1)
1 1 0 i i i
x y + +
En E-Views
Dependent Variable: Y
Method: Least Squares
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
C 2.898172 1.668193 1.737313 0.1330
X 0.373368 0.318837 1.171030 0.2860
R-squared 0.186034 Mean dependent var 4.625000
Adjusted R-squared 0.050373 S.D. dependent var 2.263846
S.E. of regression 2.206092 Akaike info criterion 4.632640
Sum squared resid 29.20104 Schwarz criterion 4.652500
Log likelihood -16.53056 Hannan-Quinn criter. 4.498690
F-statistic 1.371312 Durbin-Watson stat 2.088141
Prob(F-statistic) 0.285984
43
Ecuacin (2)
) 2 (
2 1 0 i i i
z x + +
En E-Views
Dependent Variable: X
Method: Least Squares
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
C 3.160784 1.954784 1.616948 0.1570
Z 0.403922 0.472371 0.855093 0.4253
R-squared 0.108626 Mean dependent var 4.625000
Adjusted R-squared -0.039936 S.D. dependent var 2.615203
S.E. of regression 2.666912 Akaike info criterion 5.012037
Sum squared resid 42.67451 Schwarz criterion 5.031898
Log likelihood -18.04815 Hannan-Quinn criter. 4.878087
F-statistic 0.731185 Durbin-Watson stat 2.525967
Prob(F-statistic) 0.425321
2. Mnimos Cuadrados de 2 etapas (MC2E)
El objetivo del mtodo es estimar los parmetros que cumplan con las propiedades de grandes muestras. Por
ejemplo, en una regresin lineal la condicin de ortogonalidad E[X]=0 es indispensable para garantizar
la insesgadez asinttica del parmetro estimado. El mtodo es empleado en varios estudios
microeconmicos y macroeconmicos.
Ecuacin (1)
(1)
1 1 0 i i i
x y + +
En Views.
44
Dependent Variable: Y
Method: Two-Stage Least Squares
Date: 03/05/10 Time: 19:30
Sample: 1 8
Included observations: 8
Instrument list: C Z
Variable Coefficient Std. Error t-Statistic Prob.
C -0.718447 6.426911 -0.111787 0.9146
X 1.155340 1.368957 0.843956 0.4310
R-squared -0.629983 Mean dependent var 4.625000
Adjusted R-squared -0.901647 S.D. dependent var 2.263846
S.E. of regression 3.121849 Sum squared resid 58.47563
F-statistic 0.712262 Durbin-Watson stat 3.681736
Prob(F-statistic) 0.431050 Second-Stage SSR 28.93333
En Excel:
Primera etapa
i
i
i
i
X Z Z Z Z X
X Z Z Z
Z X
' ) ' (
' ) ' (
1
^
1
^


1
]
1

1
]
1

1
]
1

1
]
1

147
37
137 29
29 8
1
1
2
^
i i
i
i i
i
MCO
z x
x
z z
z n

45
1
]
1

1
]
1

1
]
1

40392157 . 0
16078431 . 3
147
37
03137255 . 0 11372549 . 0
11372549 . 0 5372549 . 0
^
MCO

i
i z x 40392 . 0 16078431 . 3
^
+
En Views:
Dependent Variable: X
Method: Least Squares
Date: 03/05/10 Time: 20:09
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
C 3.160784 1.954784 1.616948 0.1570
Z 0.403922 0.472371 0.855093 0.4253
R-squared 0.108626 Mean dependent var 4.625000
Adjusted R-squared -0.039936 S.D. dependent var 2.615203
S.E. of regression 2.666912 Akaike info criterion 5.012037
Sum squared resid 42.67451 Schwarz criterion 5.031898
Log likelihood -18.04815 Hannan-Quinn criter. 4.878087
F-statistic 0.731185 Durbin-Watson stat 2.525967
Prob(F-statistic) 0.425321
Segunda etapa:
y Z Z Z Z X X Z Z Z Z X y X X X
E MC
' ) ' ( ' ) ' ) ' ( ' ( '
1 1 1
^
1
^ ^ ^
2

,
_


1
]
1

1
]
1

1
1
]
1

1
1
1
]
1

133 . 177
37
32549 . 176 37
37 8
1
^
1
2
^ ^
^
2
^
i i
i
i i
i
E MC
x y
y
x x
x n

1
]
1

15534 . 1
718447 . 0
2E MC

Por tanto:
i
E MC
i
x y 15534 . 1 718447 . 0
2
^
+
Ecuacin (2)
) 2 (
2 1 0 i i i
z x + +
En Views:
46
Dependent Variable: X
Method: Two-Stage Least Squares
Date: 03/15/10 Time: 09:45
Sample: 1 8
Included observations: 8
Instrument list: C Z
Variable Coefficient Std. Error t-Statistic Prob.
C 3.160784 1.954784 1.616948 0.1570
Z 0.403922 0.472371 0.855093 0.4253
R-squared 0.108626 Mean dependent var 4.625000
Adjusted R-squared -0.039936 S.D. dependent var 2.615203
S.E. of regression 2.666912 Sum squared resid 42.67451
F-statistic 0.731185 Durbin-Watson stat 2.525967
Prob(F-statistic) 0.425321 Second-Stage SSR 42.67451
i
E MC
i
z x 4039 . 0 1607 . 3
2
^
+
3. Mtodo de Momentos Generalizado (MMG)
Este mtodo es empleado en varios estudios macroeconmicos. Las virtudes de su popularidad radican en lo
siguiente:
- Provee una alternativa simple cuando se desconoce la funcin de distribucin de las variables
aleatorias, es decir, sustituye el mtodo de mxima verosimilitud.
47
- Vincula varios estimadores y provee un til marco terico para su comparacin y evaluacin.
En el caso especifico del estimador de variables instrumentales estndar, ste puede ser visto como un caso
especial del estimador de MMG. EL supuesto que las variables instrumentales son exgenos pueden
expresarse de la siguiente manera E[Z]=0. Las K variables instrumentales se convierten en K
condiciones de momentos. Finalmente, las condiciones o restricciones pueden expresarse:
0 '
1
)) ' ( '
n
1
^
Z
n
X y Z
En el caso que el nmero de variables instrumentales sea igual al nmero de parmetros a estimar, entonces
el estimador de variables instrumentales ser el mismo que el MMG. En caso contrario, el nmero de
instrumentos sea mayor que el nmero de parmetros a estimar, entonces la ecuacin estar sobre
identificada.
La funcin objetiva de MMG es:
1
]
1

1
]
1

) ( ' ) ( ' ) (
^ ^
MMG MMG
X y Z W X y Z n J Mn
Donde:
y ZWZ X X ZWZ X
MMG
' ' ) ' ' (
1
^


Ecuacin (1):
(1)
1 1 0 i i i
x y + +
En Views:
Dependent Variable: Y
Method: Generalized Method of Moments
Date: 03/05/10 Time: 18:04
Sample: 1 8
Included observations: 8
White Covariance
Simultaneous weighting matrix & coefficient iteration
48
Convergence achieved after: 1 weight matrix, 2 total coef iterations
Instrument list: C Z
Variable Coefficient Std. Error t-Statistic Prob.
C -0.718447 6.267987 -0.114622 0.9125
X 1.155340 1.432388 0.806583 0.4507
R-squared -0.629983 Mean dependent var 4.625000
Adjusted R-squared -0.901647 S.D. dependent var 2.263846
S.E. of regression 3.121849 Sum squared resid 58.47563
Durbin-Watson stat 3.681736 J-statistic 1.67E-30
Por consiguiente:
i
MMG
i
x y 15534 . 1 718447 . 0
^
+
En Excel:
Obs y
i
x
i
z
i
resid=
i
x
i
2

i
2
(
i
2
)(x
i
2
) x
i
z
i
y
i
z
i
1 2 2 1 -1.644909 4 2.70572 10.8229 2 2
2 3 4 2 -1.391645 16 1.93668 30.98681 8 6
3 4 5 4 -0.765013 25 0.58524 14.63112 20 16
4 5 2 1 1.3550914 4 1.83627 7.345091 2 5
5 2 6 5 -3.138381 36 9.84944 354.5797 30 10
6 6 2 7 2.3550914 4 5.54646 22.18582 14 42
7 7 9 4 0.7415144 81 0.54984 44.53733 36 28
8 8 7 5 2.4882507 49 6.19139 303.3782 35 40
Suma 37 37 29 0.000 219 So 788.467 147 149
Paso 1:
) ( )' ( '
^ ^
X y X y Mn
y X X X
MCO
' ) ' (
1
^


Calcular:
^
1
X y
i i

Nota:
i
=
1i
En Views:
Dependent Variable: Y
Method: Least Squares
Date: 03/05/10 Time: 19:24
Sample: 1 8
Included observations: 8
49
Variable Coefficient Std. Error t-Statistic Prob.
C 2.898172 1.668193 1.737313 0.1330
X 0.373368 0.318837 1.171030 0.2860
R-squared 0.186034 Mean dependent var 4.625000
Adjusted R-squared 0.050373 S.D. dependent var 2.263846
S.E. of regression 2.206092 Akaike info criterion 4.632640
Sum squared resid 29.20104 Schwarz criterion 4.652500
Log likelihood -16.53056 Hannan-Quinn criter. 4.498690
F-statistic 1.371312 Durbin-Watson stat 2.088141
Prob(F-statistic) 0.285984
Paso 2:
1
]
1

1
]
1

) ( ' ) ( ' ) (
^ ^
MMG MMG
X y Z W X y Z n J Mn
Donde:
y ZWZ X X ZWZ X
MMG
' ' ) ' ' (
1
^


1
]
1

1
]
1

219 37
37 8
'
2
i i
i
x x
x n
X X
1
]
1

02088773 . 0 09660574 . 0
09660574 . 0 57180157 . 0
) ' (
1
X X

'
0
^
'
i i i i
x x S
En nuestro ejemplo tenemos una sola variable explicativa, entonces:

467 . 788
2 2
0
^
i i
x S
Por tanto, la covarianza de White es:
1
0
^
1
^
) ' ( ) ' (

X X S X X n W
50
1
]
1


1
]
1

02088773 . 0 09660574 . 0
09660574 . 0 57180157 . 0
467 . 788
02088773 . 0 09660574 . 0
09660574 . 0 57180157 . 0
8
^
W
1
]
1

6201 . 61 1632 . 361


1632 . 361 2265 . 2121
^
W
1
]
1

1
]
1

147 37
29 8
'
i i i
i
z x x
z n
Z X
1
]
1

1
]
1

147 29
37 8
'
i i i
i
x z z
x n
X Z
1
]
1

1
]
1

149
37
'
i i
i
z y
y
y Z
y ZWZ X X ZWZ X
MMG
' ' ) ' ' (
1
^


1
]
1

1
]
1

1
]
1

1
]
1

1
]
1

1
]
1

1
]
1

149
37
6201 . 61 1632 . 361
1632 . 361 2265 . 2121
147 37
29 8
147 29
37 8
6201 . 61 1632 . 361
1632 . 361 2265 . 2121
147 37
29 8
1
^
MMG

1
]
1

155340 . 1
718447 . 0
^
MMG

Por consiguiente:
i
MMG
i
x y 15534 . 1 718447 . 0
^
+
Ecuacin (2)
) 2 (
2 1 0 i i i
z x + +
51
Dependent Variable: X
Method: Generalized Method of Moments
Date: 03/15/10 Time: 09:55
Sample: 1 8
Included observations: 8
Kernel: Bartlett, Bandwidth: Fixed (2), No prewhitening
Simultaneous weighting matrix & coefficient iteration
Convergence achieved after: 1 weight matrix, 2 total coef iterations
Instrument list: C Z
Variable Coefficient Std. Error t-Statistic Prob.
C 3.160784 1.403614 2.251891 0.0653
Z 0.403922 0.357676 1.129295 0.3019
R-squared 0.108626 Mean dependent var 4.625000
Adjusted R-squared -0.039936 S.D. dependent var 2.615203
S.E. of regression 2.666912 Sum squared resid 42.67451
Durbin-Watson stat 2.525967 J-statistic 3.53E-32
i
MMG
i z x 4039 . 0 1607 . 3
^
+
Sesin 4:
Estacionariedad, Cointegracin y Modelo de Correccin de Errores.
52
Estacionariedad e integrabilidad: Una gran cantidad de los trabajos (sobre todo empricos) que se venan
realizando en el mbito de la Econometra estaban basados en el supuesto de que las variables utilizadas
eran estacionarias, es decir, que su distribucin de probabilidad no dependa del tiempo. Por otro lado,
Nelson y Plosser (1982) mostraron que un amplio conjunto de variables econmicas a lo largo de este siglo,
estas variables en la mayora de las economas han sufrido variaciones tanto en su media como,
frecuentemente, en su varianza. Es decir, no presentan momentos de primer (media) y segundo (varianza)
orden constantes, siendo stos, en muchas ocasiones, funcin del tiempo. As, se observa que muchas de
estas variables presentan una tendencia a crecer a lo largo del tiempo, a la vez que la variabilidad de las
mismas tiende a acentuarse.
La no-consideracin de este fenmeno puede llevar al investigador a cometer errores tanto en la
modelizacin econmica, al aceptar como vlidas relaciones de tipo espurio, como en el proceso de
inferencia, al analizar las caractersticas de las estimaciones obtenidas. La solucin clsica dada a este
problema ha sido diferenciar las variables para eliminar el componente no estacionario. Sin embargo, esta
medida ha sido criticada porque mediante este procedimiento se est eliminando la informacin de largo
plazo existente en los niveles de las magnitudes econmicas.
El concepto de estacionariedad es, pues, clave que para todo nuestro anlisis posterior. A lo largo de este
documento utilizaremos el concepto de estacionariedad en sentido dbil, o de segundo orden, y nos
referimos a la misma simplemente como estacionariedad. Considerando una serie temporal como la
realizacin de un proceso estocstico, diremos que ste es estacionario en sentido dbil si tiene momentos
de primer y segundo orden finitos y que no varan en funcin del tiempo.
Base de datos N 4
obs Y X
1990Q1 2072 1660
1990Q2 2077 1926
1990Q3 2078 2181
1990Q4 2043 1897
1991Q1 2062 1695
1991Q2 2067 1705
1991Q3 1964 1731
1991Q4 1981 2151
1992Q1 1914 2556
1992Q2 1991 3152
1992Q3 2129 3763
1992Q4 2309 3903
1993Q1 2614 3912
1993Q2 2896 3571
1993Q3 3058 3199
1993Q4 3309 3262
1994Q1 3446 3476
1994Q2 3466 2993
1994Q3 3435 2262
1994Q4 3183 2011
1995Q1 2697 1511
1995Q2 2338 1631
1995Q3 2140 1990
1995Q4 2012 1993
1996Q1 2071 2520
1996Q2 2192 2804
1996Q3 2240 2919
1996Q4 2421 3024
1997Q1 2639 2725
53
1997Q2 2733 2321
1997Q3 2721 2131
1997Q4 2640 2552
1998Q1 2513 2234
1998Q2 2448 2282
1998Q3 2429 2533
1998Q4 2516 2517
1999Q1 2534 2772
1999Q2 2494 2380
1999Q3 2596 2568
1999Q4 2572 2944
2000Q1 2601 2629
2000Q2 2648 3133
2000Q3 2840 3449
2000Q4 2937 3764
2001Q1 3136 3983
2001Q2 3299 4381
2001Q3 3514 4786
2001Q4 3815 4094
2002Q1 4093 4870
2002Q2 4262 5344
2002Q3 4531 5433
2002Q4 4825 5911
2003Q1 5160 6109
2003Q2 5319 6542
2003Q3 5574 5785
2003Q4 5749 5707
2004Q1 5715 5412
2004Q2 5637 5465
2004Q3 5383 5550
2004Q4 5467 5465
Estimar el siguiente modelo con la base de datos N 4:
t t t
u X Y + +
2 1

Es una regresin espuria?:
Dependent Variable: Y
Method: Least Squares
Date: 03/27/10 Time: 06:14
Sample: 1990Q1 2004Q4
Included observations: 60
Variable Coefficient Std. Error t-Statistic Prob.
C 646.4836 184.4775 3.504405 0.0009
X 0.736841 0.051375 14.34233 0.0000
R-squared 0.780055 Mean dependent var 3092.417
Adjusted R-squared 0.776263 S.D. dependent var 1151.944
S.E. of regression 544.8791 Akaike info criterion 15.47177
Sum squared resid 17219810 Schwarz criterion 15.54158
Log likelihood -462.1531 Hannan-Quinn criter. 15.49908
F-statistic 205.7024 Durbin-Watson stat 0.286683
Prob(F-statistic) 0.000000
t t
X Y 7368 . 0 4836 . 646
^
+
Los coeficientes estimados del modelo son estadsticamente diferentes a cero (ver estadstico t y F), el
modelo tiene un buen ajuste (ver R
2
). Es una regresin espuria? Una regla prctica para saber si estamos
ante una regresin espuria es comparar el R
2
con el valor del Durbin-Watson (DW), s R
2
>DW entonces el
54
modelo es posiblemente espurio, en el ejemplo R
2
>DW, posiblemente estamos ante un modelo espurio.
Veamos grficamente las dos variables:
Luego, sub dividiendo la muestra total:
Sub muestra N 1: 1990.1 2000.4
Sub muestra N 2: 2001.1 2004.4
Vemos claramente que la media y la varianza (std. Dev)
2
de las variables Y e X son funciones del tiempo,
es evidente el cambio en la media y la varianza.
Test de raz unitaria
El E-Views tiene las pruebas ms usadas para la deteccin de raz unitaria: el test de
Dickey-Fuller Aumentado (DFA) y el Test de Phillips-Perron (PP). El
procedimiento para realizar cualquiera de estos es el siguiente:
QUICK/SERIES STATICS/UNIT ORUOT TEST
Una vez en esta opcin, se debe elegir entre los dos test.
55
Test de Dickey- Fuller Aumentado: Para contrastar la presencia de una raz unitaria, se debe realizar la
prueba con la variable en niveles. Entre las opciones del lado derecho de la tabla, se recomienda iniciar con
intercepto y tendencia. Luego de realizar la prueba, se van quitando las variables que no son significativos
(ya sean rezagos o la tendencia) hasta llegar a un modelo en que todas las variables sean significativas. En
ese momento, se contrasta la hiptesis nula que es Existe una Raiz Unitaria comparando los valores
crticos con el valor de la prueba (ADF).
Ho: la variable tiene una raz unitaria
Null Hypothesis: X has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 0 (Automatic based on SIC, MAXLAG=10)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -1.461460 0.8317
Test critical values: 1% level -4.121303
5% level -3.487845
10% level -3.172314
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(X)
Method: Least Squares
Date: 03/26/10 Time: 20:01
Sample (adjusted): 1990Q2 2004Q4
Included observations: 59 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
X(-1) -0.074992 0.051313 -1.461460 0.1495
C 152.5295 122.0603 1.249625 0.2166
@TREND(1990Q1) 5.272335 4.073043 1.294446 0.2008
R-squared 0.038353 Mean dependent var 64.49153
Adjusted R-squared 0.004009 S.D. dependent var 357.5605
S.E. of regression 356.8431 Akaike info criterion 14.64198
Sum squared resid 7130870. Schwarz criterion 14.74762
Log likelihood -428.9384 Hannan-Quinn criter. 14.68321
F-statistic 1.116724 Durbin-Watson stat 1.602801
Prob(F-statistic) 0.334530
En este caso, a un nivel de significancia de 5%, no se rechaza la hiptesis nula, es decir, la variable X tiene
raz una unitaria.
Ahora, tomando la primera diferencia de la variable de X.
Null Hypothesis: D(X) has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 0 (Automatic based on SIC, MAXLAG=10)
56
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -6.298772 0.0000
Test critical values: 1% level -4.124265
5% level -3.489228
10% level -3.173114
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(X,2)
Method: Least Squares
Date: 03/26/10 Time: 20:09
Sample (adjusted): 1990Q3 2004Q4
Included observations: 58 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
D(X(-1)) -0.836609 0.132821 -6.298772 0.0000
C 17.36705 98.49105 0.176331 0.8607
@TREND(1990Q1) 1.071859 2.832543 0.378409 0.7066
R-squared 0.419069 Mean dependent var -6.051724
Adjusted R-squared 0.397944 S.D. dependent var 464.7210
S.E. of regression 360.5875 Akaike info criterion 14.66368
Sum squared resid 7151282. Schwarz criterion 14.77026
Log likelihood -422.2469 Hannan-Quinn criter. 14.70520
F-statistic 19.83782 Durbin-Watson stat 2.036664
Prob(F-statistic) 0.000000
Al tomar la primera diferencia, la variable X ya no tiene una raz unitaria. Sin embargo, se pierde
informacin de largo plazo.
Test de Phillips-Perron: Esta es una prueba de raz unitaria similar a la anterior, pero a diferencia del test
de Dickey-Fuller no se incluyen rezagos. En lugar de esto, la ecuacin se realiza por simple MCO
corrigiendo la correlacin serial a travs del procedimiento de Newey West. Al igual que en el caso anterior
se recomienda iniciar el proceso con media e intercepto, pero el nmero de rezagos para el truncamiento
debe ser el que indica la prueba por defecto. Una vez corrida la regresin, al igual que en el caso anterior,
se deben ir eliminando las variables que no resulten significativas, y finalmente contrastar los valores
crticos obtenidos con el valor estadstico del test.
Ho: la variable tiene una raz unitaria
Null Hypothesis: X has a unit root
Exogenous: Constant, Linear Trend
Bandwidth: 4 (Newey-West using Bartlett kernel)
Adj. t-Stat Prob.*
Phillips-Perron test statistic -1.825132 0.6799
Test critical values: 1% level -4.121303
5% level -3.487845
10% level -3.172314
57
*MacKinnon (1996) one-sided p-values.
Residual variance (no correction) 120862.2
HAC corrected variance (Bartlett kernel) 187287.2
Phillips-Perron Test Equation
Dependent Variable: D(X)
Method: Least Squares
Date: 03/26/10 Time: 20:17
Sample (adjusted): 1990Q2 2004Q4
Included observations: 59 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
X(-1) -0.074992 0.051313 -1.461460 0.1495
C 152.5295 122.0603 1.249625 0.2166
@TREND(1990Q1) 5.272335 4.073043 1.294446 0.2008
R-squared 0.038353 Mean dependent var 64.49153
Adjusted R-squared 0.004009 S.D. dependent var 357.5605
S.E. of regression 356.8431 Akaike info criterion 14.64198
Sum squared resid 7130870. Schwarz criterion 14.74762
Log likelihood -428.9384 Hannan-Quinn criter. 14.68321
F-statistic 1.116724 Durbin-Watson stat 1.602801
Prob(F-statistic) 0.334530
En este caso, a un nivel de significancia de 5%, no se rechaza la hiptesis nula, es decir, la variable X tiene
raz una unitaria.
Ahora, tomando la primera diferencia de la variable de X.
Null Hypothesis: D(X) has a unit root
Exogenous: Constant, Linear Trend
Bandwidth: 3 (Newey-West using Bartlett kernel)
Adj. t-Stat Prob.*
Phillips-Perron test statistic -6.381514 0.0000
Test critical values: 1% level -4.124265
5% level -3.489228
10% level -3.173114
*MacKinnon (1996) one-sided p-values.
Residual variance (no correction) 123298.0
HAC corrected variance (Bartlett kernel) 138874.0
Phillips-Perron Test Equation
Dependent Variable: D(X,2)
Method: Least Squares
58
Date: 03/26/10 Time: 20:18
Sample (adjusted): 1990Q3 2004Q4
Included observations: 58 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
D(X(-1)) -0.836609 0.132821 -6.298772 0.0000
C 17.36705 98.49105 0.176331 0.8607
@TREND(1990Q1) 1.071859 2.832543 0.378409 0.7066
R-squared 0.419069 Mean dependent var -6.051724
Adjusted R-squared 0.397944 S.D. dependent var 464.7210
S.E. of regression 360.5875 Akaike info criterion 14.66368
Sum squared resid 7151282. Schwarz criterion 14.77026
Log likelihood -422.2469 Hannan-Quinn criter. 14.70520
F-statistic 19.83782 Durbin-Watson stat 2.036664
Prob(F-statistic) 0.000000
Nuevamente la variable X al tomar su primera diferencia es estacionaria.
En resumen, el modelo estimado anteriormente:
t t
X Y 7368 . 0 4836 . 646
^
+
No tena sentido hacer inferencia estadstica porque hemos comprobado que las variables Y e X son series
no estacionarias (presentan una raz unitaria). Sin embargo, es posible que ambas variables cointegren, es
decir, exista una relacin de largo entre las dos variables. Para ello, las variables tienen que tener el mismo
orden de integracin. En nuestro ejemplo las variables son I(1), ambas tienen una raz unitaria.

Cointegracin a lo Engle-Granger
Para ver si dos series cointegran, es decir, si guardan una relacin de largo plazo, en el sentido de Granger,
stas deben tener el mismo orden de integracin (mismo nmero de races unitarias). El procedimiento a
seguir es el siguiente:
Correr una regresin entre las dos variables. (LS Y C X)
Guardar el error de la regresin (Genr ERROR=RESID)
Aplicar el Test de raz unitaria al error.
Si el error no presenta raz unitaria, las variables cointegran, de lo contrario la cointegracin no existe.
Dependent Variable: Y
59
Method: Least Squares
Date: 03/26/10 Time: 21:08
Sample: 1990Q1 2004Q4
Included observations: 60
Variable Coefficient Std. Error t-Statistic Prob.
C 646.4836 184.4775 3.504405 0.0009
X 0.736841 0.051375 14.34233 0.0000
R-squared 0.780055 Mean dependent var 3092.417
Adjusted R-squared 0.776263 S.D. dependent var 1151.944
S.E. of regression 544.8791 Akaike info criterion 15.47177
Sum squared resid 17219810 Schwarz criterion 15.54158
Log likelihood -462.1531 Hannan-Quinn criter. 15.49908
F-statistic 205.7024 Durbin-Watson stat 0.286683
Prob(F-statistic) 0.000000
Prueba de Engle-Granger
Null Hypothesis: ERROR has a unit root
Exogenous: None
Lag Length: 0 (Automatic based on SIC, MAXLAG=10)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -1.884549 0.0572
Test critical values: 1% level -2.604746
5% level -1.946447
10% level -1.613238
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(ERROR)
Method: Least Squares
Date: 03/26/10 Time: 21:21
Sample (adjusted): 1990Q2 2004Q4
Included observations: 59 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
ERROR(-1) -0.131033 0.069530 -1.884549 0.0645
R-squared 0.056567 Mean dependent var 10.02234
Adjusted R-squared 0.056567 S.D. dependent var 291.5684
S.E. of regression 283.2017 Akaike info criterion 14.14700
Sum squared resid 4651785. Schwarz criterion 14.18221
Log likelihood -416.3365 Hannan-Quinn criter. 14.16074
Durbin-Watson stat 1.426899
A un nivel de significancia de 10% de nivel de significancia se rechaza la hiptesis de existencia de raz
unitaria en los residuos estimado, por lo que ERROR es estacionario (es decir, no tiene raz unitaria), y por
consiguiente Y y X estn cointegradas.
60
En este caso, la ecuacin cointegra, por lo que se puede modelar como un modelo de correccin de errores
(MCE).
Modelo de Correccin de Errores (MCE)
Se acaba de demostrar que las variables Y y X estn cointegradas, es decir, hay una relacin de equilibrio
de largo plazo entra las dos. Por su supuesto, en el corto plazo, puede haber desequilibrio. En consecuencia,
se puede tratar el trmino de error como el error de equilibrio. Y se puede utilizar este trmino de error
para atar el comportamiento de corto plazo de Y con su valor de largo plazo. El Modelo de Correccin de
Errores (MCE) popularizado por Engle y Granger, corrige el desequilibrio.

El procedimiento para la estimacin de este modelo es el siguiente:
Correr una regresin donde la variable endgena es la diferencia de una variable (DY) y las exgenas, una
constante, as como de la otra variable en estudio (DX). Asimismo se debe incluir el primer rezago del error
entre las dos variables en estudio (error del proceso de cointegracin).
LS D(Y) C D(X) ERROR(-1)
Las diferencias captan la relacin de corto plazo de las variables, y el error de largo plazo se incluye como
variable explicativa en el modelo para ir ajustando y acercarnos al equilibrio de largo plazo. En este sentido,
el resultado de la regresin para que exista una relacin de largo plazo entre las variables, el coeficiente
asociado al rezago del error tiene que ser significativo y negativo.
Dependent Variable: D(Y)
Method: Least Squares
Date: 03/26/10 Time: 21:37
Sample (adjusted): 1990Q2 2004Q4
Included observations: 59 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 53.94356 16.38270 3.292715 0.0017
D(X) 0.011050 0.046159 0.239391 0.8117
ERROR(-1) -0.214551 0.030870 -6.950079 0.0000
R-squared 0.473901 Mean dependent var 57.54237
Adjusted R-squared 0.455111 S.D. dependent var 167.7181
S.E. of regression 123.8038 Akaike info criterion 12.52478
Sum squared resid 858332.7 Schwarz criterion 12.63042
Log likelihood -366.4811 Hannan-Quinn criter. 12.56602
F-statistic 25.22187 Durbin-Watson stat 0.733811
Prob(F-statistic) 0.000000
El modelo de correccin de errores queda del siguiente modo:
61
1
^ ^
2145 . 0 01105 . 0 9435 . 53 + t
t t
u X Y
Los signos son correctos. Estos resultados muestran que los cambios de corto plazo en la variable X tiene
efectos positivos pero no significativos en la variable Y. Por otro lado, en alrededor de 0.214 de la
discrepancia entre el valor de la variable de Y actual y el valor de largo plazo o de equilibrio es eliminado o
corregido en cada trimestre.
Sesin 5: Modelo de regresin con variables dependiente discreta.
Sea el modelo latente:
) ...( .......... X ' * Y 1 +
;

'

>

) ' ....( .......... * Y S ,


) .....( .......... * Y S ,
Y
2 0 0
2 0 1
62
Una de las tcnicas adecuadas para este propsito son los modelos de probabilidad: Probit y Logit, por lo
que se usar esta tcnica para identificar las variables que influyen a la probabilidad de xito.
Modelo Probit
La probabilidad de emigrar en funcin de los factores que influyen (X) est dado por:
) .........( ) , X ( ) * Y ( ob Pr 3 0 >
Luego, la probabilidad conjunta, o funcin de verosimilitud, de un modelo con probabilidad de xito
) X ' (
y n observaciones independientes ser:
[ ] [ ]
} {
) .( .......... ) X ' ( ) X ' ( L . Max
i i
Y
i
Y
i
n
i
obit Pr

4 1
1
1
( ) [ ]
} {
) ' ...( .......... . ) X ' ( Ln ) Y ( ) X ' ( Ln Y LnL . Max
n
i
i i i i obit Pr

4 1 1
1
Donde es la funcin de distribucin acumulada normal con media cero y varianza uno. Finalmente
el efecto marginal de los factores (X) que influyen sobre la probabilidad de emigrar est dado por:
[ ]
( ) ) ( .......... X '
X
X / Y E
5

Modelo Logit
La probabilidad de emigrar en funcin de los factores que influyen (X) est dado por:
( ) ) .( .......... X '
e
e
) * Y ( ob Pr
i
i
X '
X '
6
1
0
+
>

Luego, la probabilidad conjunta, o funcin de verosimilitud, de un modelo con probabilidad de xito


( ) X ' y n observaciones independientes ser:
[ ] [ ]
} {
) ..( .......... ) X ' ( ) X ' ( L . Max
i i
Y
i
Y
i
n
i
Logit

7 1
1
1
63
( ) [ ]
} {
) ' ...( .......... . ) X ' ( Ln ) Y ( ) X ' ( Ln Y LnL . Max
n
i
i i i i Logit

7 1 1
1
Donde: ( ) X ' es la funcin de distribucin logstica. Finalmente el efecto marginal de los factores (X)
que influyen sobre la probabilidad de emigrar est dado por:
[ ]
( ) ( ) [ ] ) ........( X ' X '
X
X / Y E
8 1

Los modelos expuestos (4) y (7) se estimarn por el mtodo de mxima verosimilitud (ML).
Sea la base de datos:
Y X
1 14 -0.539 -0.451 -0.374 -0.307 -0.249 -0.200 -0.159 -0.124
0 4 -0.742 -0.776 -0.811 -0.847 -0.884 -0.923 -0.962 -1.003
1 15 -0.529 -0.437 -0.356 -0.287 -0.229 -0.180 -0.140 -0.107
1 18 -0.500 -0.395 -0.307 -0.234 -0.176 -0.129 -0.093 -0.065
0 6 -0.768 -0.820 -0.875 -0.932 -0.992 -1.055 -1.120 -1.187
0 7 -0.780 -0.843 -0.908 -0.977 -1.049 -1.125 -1.205 -1.288
1 16 -0.519 -0.422 -0.339 -0.269 -0.210 -0.162 -0.122 -0.091
1 15 -0.529 -0.437 -0.356 -0.287 -0.229 -0.180 -0.140 -0.107
1 17 -0.510 -0.409 -0.323 -0.251 -0.192 -0.145 -0.107 -0.077
0 15 -0.889 -1.039 -1.205 -1.387 -1.586 -1.803 -2.038 -2.291
LnL -6.307 -6.029 -5.855 -5.780 -5.798 -5.901 -6.084 -6.340

MV
0.015 0.025 0.035 0.045 0.055 0.065 0.075 0.085
A continuacin se muestra la funcin de mxima verosimilitud, la idea central es encontrar el vector de
parmetros (
MV
) que maximice la funcin de verosimilitud, en este caso existe un solo parmetro (
MV
), en
efecto el parmetro que maximiza est entre 0.045 y 0.055, como se puede apreciar la funcin de mxima
verosimilitud es globalmente cncava.

64
Modelo Logit en E-Views y SOLVER
65
Dependent Variable: Y
Method: ML - Binary Probit (Quadratic hill climbing)
Date: 03/06/10 Time: 18:40
Sample: 1 10
Included observations: 10
Convergence achieved after 3 iterations
Covariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
X 0.048017 0.033240 1.444561 0.1486
Mean dependent var 0.600000 S.D. dependent var 0.516398
S.E. of regression 0.470767 Akaike info criterion 1.355227
Sum squared resid 1.994590 Schwarz criterion 1.385485
Log likelihood -5.776133 Hannan-Quinn criter. 1.322033
Avg. log likelihood -0.577613
Obs with Dep=0 4 Total obs 10
Obs with Dep=1 6
Por lo que el modelo Probit estimado sin constante quedara del siguiente modo:
) 048017 . 0 ( ) / 1 Pr(
^
x x y
66
Dependent Variable: Y
Method: ML - Binary Logit (Quadratic hill climbing)
Sample: 1 10
Included observations: 10
Convergence achieved after 6 iterations
Covariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C -10.51644 12.44828 -0.844810 0.3982
X 0.802893 0.833352 0.963450 0.3353
McFadden R-squared 0.602055 Mean dependent var 0.600000
S.D. dependent var 0.516398 S.E. of regression 0.326972
Akaike info criterion 0.935643 Sum squared resid 0.855288
Schwarz criterion 0.996160 Log likelihood -2.678215
Hannan-Quinn criter. 0.869256 Restr. log likelihood -6.730117
LR statistic 8.103803 Avg. log likelihood -0.267821
Prob(LR statistic) 0.004417
Obs with Dep=0 4 Total obs 10
Obs with Dep=1 6
Mtodo de Mxima Verosimilitud con SOLVER
Solver tambin puede resolver el mtodo de la maximizacin de la Funcin Verosimilitud, el objetivo es
construir la cela objetivo en base a los parmetros iniciales valores semilla de ser posible prximos a la
solucin final.
Estimar el modelo Logit con la herramienta SOLVER
) ( ) / 1 Pr(
1 0
x x y +
67
68
Por consiguiente el modelo Probit estimado quedara del siguiente modo:
) 8028 . 0 5164 . 10 ( ) / 1 Pr(
^
x x y +
Aplicacin N 05
Archivo: basedatos_5
Valoracin Contingente
El mtodo ha sido aplicado para valorar numerosos y diversos bienes pblicos ambientales como la
calidad del agua, la existencia de especies silvestres, la preservacin del paisaje, los daos
ambientales y, sobre todo, la estimacin del valor de uso recreativo y de conservacin de espacios
naturales.
El enfoque de la valuacin contingente se basa en encuestas a los consumidores para determinar su
voluntad de pagar para obtener un bien ambiental. Se le puede pedir al consumidor que diga el
monto que est dispuesto a pagar, o se le puede ofrecer un rango de montos o un monto
determinado. O se plantea el interrogante de si los individuos estaran realmente dispuestos a pagar
las cantidades declaradas en el escenario hipottico presentado en la encuesta. La principal funcin
del cuestionario en el mtodo de la valoracin contingente es la de simular el papel de un hipottico
mercado libre, en el que el vendedor, o persona entrevistada, intenta conseguir el precio ms alto del
comprador, o persona encuestada. De esta manera se puede obtener una valoracin de los beneficios
del bien en cuestin, susceptible de se utilizada en un anlisis de coste-beneficio posterior.
Se basa en mercados hipotticos indirectos combinando la valoracin potencial de las mejoras
en calidad de un bien publico por el usuario frente a los precios hipotticos ofertados con respuestas
de SI/NO. Esto genera una mxima disposicin a pagar(DAP
4
) por el cambio de bienestar.
Siguiendo a Haneman y Park et.al(1996), se supone que el usuario tiene una funcin de utilidad
indirecta que depende del ingreso(ING) y de variables socioeconmicas individuales(S) y la calidad
del recurso a ser valorado(Q):
V(Q, ING, S) (1)
Donde, Q=1 es el acceso al lugar si se dispone de agua de buena calidad y Q=0 de otra manera
4
Disposicin a pagar es la suma que una persona est dispuesta a desembolsar para adquirir un bien o
servicio, independientemente si tiene un precio corriente de mercado o es gratuito.
La respuesta a la DAP es la variacin compensada que determina la mxima suma de dinero que el usuario
pagara por tener el Humedal con aguas limpias aptas para actividades de recreacin.
69
El entrevistado pagar el aumento en el precio hipottico(PH) para usar el recurso si:
V(1, ING-PH, S)+ e1 V(0, ING, S)+ e0 (2)
Donde; e1 y e0 es una variable aleatoria(trmino de error)
Es importante que el usuario valore mas su bienestar con calidad de agua
mejorada(descontando el precio hipottico(S/. PH)para tener acceso al lugar), que su bienestar
obtenido sin calidad de agua(no acceso al lugar).
El modelo incremental de utilidad(V) genera una especificacin de modelo logit cuando la
probabilidad de una respuesta SI es especificada como la funcin de distribucin acumulada
logstica de los errores, es decir:
Pr(SI) = Pr(V ) = F(V) (3)
Donde, F(V) es la funcin de probabilidad acumulada de =e0-e1. Una respuesta SI es
observada cuando V 0(incremento de la utilidad), mientras que una respuesta NO a valoracin
referndum es observada cuando V<0(empeora la utilidad).
El cambio de bienestar del recreacionista esta dado por la diferencia en reas existentes entre la
curva de demanda compensada y el eje de precios para la situacin con mejora de Q y sin mejora.
Esto es:
) , ( ) , , ( ) , , (
1 0
*
0
*
1
Q Q C P Q U P V P Q U P V S W
Pv
Pv
h
Pv
Pv
h v v v v


(3)
El individuo responder SI a la pregunta de valoracin de la poltica del referndum, si el
beneficio individual de dicha politica(C para obtener un cambio en calidad ambiental), sea mayor
que el costo individual de tal poltica(pago de precios S/. PH), esto es de (3):
Pr(SI) = Pr(C PH) = 1-Gc(PH) (4)
Donde, Gc(PH) es la funcin de probabilidad acumulada de C evaluada en PH. Se verifica
entonces que; F(V)= 1-Gc(PH).
70
Si la DAP representada por C est restringida a ser una variable aleatoria no negativa, entonces
su media(C) a partir del modelo incremental es calculada como:
[ ]


0
) ( 1 PH PH Gc S C
(5)
Asumiendo una distribucin logstica estndar de los errores, se obtiene el modelo Logit:
V
e
V F Pi

+

1
1
) (
(6)
Para medir la mxima DAP se usa la mediana(C*)
5
de la distribucin de probabilidad de modo
que la probabilidad de una respuesta afirmativa al valor C sea 50%. Es decir, al valor mediano el
encuestado estara indiferente entre rechazar o aceptar el valor hipottico que refleja el cambio en
calidad. Tambin a partir de esta distribucin se puede calcular la media de la mxima DAP
representado C.
El incremento de la utilidad indirecta(V) depende de S/. PH segn la forma funcional asumida
para V, que puede ser:
i) Lineal en el ingreso
ii) No lineal en el ingreso
i) lineal en el ingreso
V(Q, ING, S) = (Q)+ING; >0 (7)
Donde, la utilidad marginal del ingreso() es constante y donde se ignora de momento S.
Aplicando (2) se obtiene:
V = - PH (8)
donde; =(1) -(0)
5
A diferencia de otras medidas del bienestar tales como la media de la DAP, la mediana es estadsticamente la
mas robusta por que es menos sensible a cambios en la distribucin del ingreso. Sin embargo, en el rea del
bienestar niega la valoracin mxima que la gente puede asignar al espacio natural, sugiriendo su aplicacin
con cautela.
71
Se observa que es positivo, pues el valor esperado de la utilidad(V) aumenta con el
ingreso(ING). Esto implica que cuanto mas alto sea PH en la encuesta, menor ser V y por tanto
menor la probabilidad de obtener la respuesta SI.
Asimismo , representa el cambio de utilidad por mejora en la calidad de agua.
Consecuentemente, el pago que dejara indiferente al usuario(V=0) es igual al cambio en
utilidad() dividido por la utilidad marginal del ingreso().
Entonces por (6), F(V) queda expresada por:
) (
1
1
) , ( ) (
PH
e
F V F Pi



+

(9)
Para obtener estimadores insesgados y de varianza mnima se pueden aplicar procedimientos
de mxima verosimilitud para estimar los parmetros (,). Los datos requeridos son los precios
hipotticos enfrentados a los encuestados y las respuestas obtenidas en trminos de variable
dummy(0,1).
Si el encuestado est indiferente entre aceptar la mejora en la calidad del agua o no(V=0),
entonces F(,)=0.5, la cual permite obtener la mediana de los precios hipotticos que a la vez
representa la mediana de la valoracin compensada(C*), es decir:

* * C PH
(10)
Mientras que el valor de la media de C restringido a valores positivos(Ardila 1993) est dado
por:
[ ]

e
C PH
+

1 log

(11)
En la mayora de las aplicaciones de valoracin contingente se emplea una regresin economtrica
entre la disposicin al pago declarada y una serie de variables explicativas que, al menos
tericamente, se consideran determinantes. La validez se juzga en funcin del cumplimiento de los
signos esperados, de la significancia estadstica de los coeficientes estimados y de algn criterio de
72
bondad de ajuste (por ejemplo, R
2
o funcin de mxima verosimilitud y chi-cuadrado). Por tanto, el
planteamiento economtrico y, en concreto, el definir y descubrir una estructura funcional adecuada
se presenta como una cuestin de suma relevancia a la hora de contrastar la validez terica. Adems,
la estimacin de la disposicin al pago puede ser muy sensible a la forma funcional seleccionada
(Hanemann y Kaninnen (1999)).
Base de Datos N 5
Archivo: basedatos_5
Obs dap ph edad
gener
o edu Ing Pr resid
c_medi
a
c_media
na
73
1 0 3 27 0 0 830 0.18617
-
0.682
1
2.3906
99
2.37079
9
2 1 1 28 1 1 2500 0.74805
0.017
79
7.5467
39
7.62579
4
3 1 2 29 0 1 1600 0.748
0.113
39
5.5303
57 5.58002
4 1 3 50 1 0 2500 0.74797
0.145
78
6.0882
06
6.16684
6
5 1 3 51 0 1 1500 0.74784
0.239
16
5.3065
23
5.35271
2
6 1 1 52 0 1 1400 0.74802
0.140
96
5.0827
87
5.12540
4
7 1 3 53 1 1 1150 0.74754
0.387
96
4.5240
88
4.55713
3
8 1 1 54 1 0 500 0.7468
0.685
63
1.7140
44
1.62068
2
9 1 1 55 0 0 680 0.74718
0.534
61
2.0768
61
2.02983
7
10 1 1 56 0 0 1600 0.74796
0.149
89
4.0762
24
4.12107
2
11 1 1 57 1 1 1400 0.74802
0.140
96
5.0827
87
5.12540
4
12 1 1 58 1 1 1400 0.74802
0.140
96
5.0827
87
5.12540
4
13 1 2 59 0 0 1200 0.74732
0.478
6
3.1909
95
3.21183
9
14 1 2 60 0 1 800 0.74764
-
1.821
7
3.7449
25
3.76155
4
15 1 3 61 1 1 2000 0.74799
0.119
82
6.4262
72
6.48925
3
16 1 1 45 0 1 600 0.74782
0.347
76
3.3028
86
3.30693
8
17 1 2 50 1 1 600 0.74738
0.451
7
3.3028
86
3.30693
8
18 1 2 55 1 1 700 0.74752
0.393
39
3.5234
88
3.53424
6
19 1 0 48 0 1 600 0.74798
0.133
87
3.3028
86
3.30693
8
20 1 1 42 0 1 520 0.74777
0.274
65
3.1271
72
3.12509
1
21 0 2 45 0 0 800 0.74645 -1.202
2.3272
74
2.30260
6
22 0 2 50 0 1 800 0.74764
-
1.821
7
3.7449
25
3.76155
4
23 0 3 48 1 0 900 0.18625
-
1.062
6
2.5397
61
2.52991
5
24 0 3 50 1 0 900 0.18625
-
1.062
6
2.5397
61
2.52991
5
25 0 4 52 0 0 850 0.18556 -
0.381
2.4331
42
2.41626
74
7
26 0 3 47 0 1 600 0.74645
-
0.265
5
3.3028
86
3.30693
8
27 0 1 54 1 1 650 0.74785
-
4.357
7
3.4130
69
3.42059
2
28 0 1 52 0 0 370 0.74648
-
1.218
6
1.4650
34
1.32518
1
29 0 4 45 0 0 460 0.04621
-
0.222
7
1.6360
83
1.52975
8
30 0 4 34 0 1 850 0.18645
-
0.926
9
3.8558
93
3.87520
9
31 1 1 46 1 1 600 0.74782
0.347
76
3.3028
86
3.30693
8
32 1 2 43 0 1 1280 0.74793
0.176
46
4.8144
73
4.85263
4
33 1 3 44 0 0 600 0.18583
2.014
85
1.9134
2 1.84799
34 1 3 45 1 1 450 0.1865
1.020
92
2.9741
18
2.96597
6
35 1 3 46 0 1 600 0.74645
-
0.265
5
3.3028
86
3.30693
8
36 1 3 47 0 1 1200 0.74759
0.512
02
4.6357
33
4.67078
7
37 1 3 48 0 1 800 0.74694
0.629
34
3.7449
25
3.76155
4
38 1 3 49 0 1 1200 0.74759
0.512
02
4.6357
33
4.67078
7
39 1 4 50 1 1 1500 0.74741
0.439
31
5.3065
23
5.35271
2
40 1 1 51 1 1 900 0.74795
0.162
43
3.9670
01
3.98886
3
41 1 1 52 0 0 400 0.74655
0.787
26
1.5213
36
1.39337
3
42 1 2 53 1 0 770 0.74637
0.867
16
2.2641
54
2.23441
4
43 1 1 54 1 0 1700 0.74798
0.130
54
4.2989
86
4.34838
1
44 1 1 55 1 1 780 0.74791
0.191
74
3.7005
81
3.71609
3
45 1 1 56 0 1 1500 0.74803
0.070
88
5.3065
23
5.35271
2
46 1 1 57 1 1 490 0.74775
0.286
28
3.0614
91
3.05689
9
47 1 2 58 0 1 500 0.74722
0.518
66
3.0833
71 3.07963
48 1 1 59 1 1 480 0.74774
0.290
27
3.0396
25
3.03416
8

Variable dependiente:
75
DAP: Variable dependiente binaria que representa la probabilidad de responder si (=1) a DAP, No (=0).
Variables Independientes:
ING: ingreso familiar mensual en Nuevos Soles
PH: Precio hipottico en Nuevos Soles
Variables socioeconmicas:
EDAD: Edad del jefe de familia medido en aos.
EDU: Educacin superior (=1) del entrevistado y (=0) si no tiene.
GENERO: Varn (=1) y Mujer (=0)
Estadstica Descriptiva
. summarize
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
dap | 48 .7708333 .4247444 0 1
ing | 48 979.375 516.7921 370 2500
ph | 48 2.020833 1.061704 0 4
edu | 48 .6666667 .4763931 0 1
edad | 48 49.58333 7.792067 27 61
-------------+--------------------------------------------------------
genero | 48 .4375 .501328 0 1
El 77.08% de los entrevistados est dispuesto a pagar por descontaminar la baha del Lago
Titicaca, el promedio del precio hipottico es de S/. 2.02.
0
.
2
.
4
.
6
.
8
1
d
a
p
500 1000 1500 2000 2500
ing
Disposicin a pagar (DAP) e ingreso
Regresiones auxiliares:
76
Se sugiere realizar regresiones auxiliares, para ver la relacin entre la variable dependiente (dap) y cada una
de las variables explicativas, en efecto, veamos:
. logit dap ing
Logistic regression Number of obs = 48
LR chi2(1) = 4.37
Prob > chi2 = 0.0366
Log likelihood = -23.653364 Pseudo R2 = 0.0845
------------------------------------------------------------------------------
dap | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
ing | .0018737 .0010708 1.75 0.080 -.000225 .0039723
_cons | -.4019236 .8971913 -0.45 0.654 -2.160386 1.356539
------------------------------------------------------------------------------
.
6
.
7
.
8
.
9
1
P
r
(
d
a
p
)
500 1000 1500 2000 2500
ing
Disposicin a pagar (DAP) e ingreso
Existe una relacin positiva entre el ingreso familiar y la probabilidad de estar dispuesto a pagar alguna
suma de dinero por descontaminar la baha del lago. Familias con ingresos ms altos tienen mayor
disposicin a pagar.
. logit dap ph
Logistic regression Number of obs = 48
LR chi2(1) = 6.60
Prob > chi2 = 0.0102
Log likelihood = -22.535956 Pseudo R2 = 0.1278
------------------------------------------------------------------------------
dap | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
77
ph | -.8919459 .3774701 -2.36 0.018 -1.631774 -.152118
_cons | 3.23816 1.011183 3.20 0.001 1.256279 5.220042
------------------------------------------------------------------------------
.
4
.
6
.
8
1
P
r
(
d
a
p
)
0 1 2 3 4
ph
Probabilidad de DAP y precios hipteticos (ph)
Del grafico anterior se puede desprender que existe una relacin inversa entre el precio hipottico (ph) y la
probabilidad de estar dispuesto a pagar (dap), es decir, si el precio hipottico aumentan entonces la
probabilidad de estar dispuesto a pagar alguna suma de dinero se reduce.
Seleccin del modelo ganador
Para estimar el modelo de probabilidad de DAP se ha realizado una encuesta econmica, el tipo de
muestreo fue aleatorio. A continuacin, se explora los determinantes de la probabilidad de estar dispuesto a
pagar.
Con el objeto de determinar qu variables afectan a la decisin de pagar, se han ensayado varias
especificaciones.
Modelo 1:
En el modelo 1 se incluye casi toda la informacin sobre las caractersticas del individuo como variables
explicativas, el coeficiente del ingreso familiar, precio hipotetico y nivel de educacin son significativos al
10% de nivel de significancia. Sin embargo, los coeficientes de las variables: edad y genero no son
significativos, estadsticamente.
78
. logit dap ing ph edu edad genero
Logistic regression Number of obs = 48
LR chi2(5) = 19.02
Prob > chi2 = 0.0019
Log likelihood = -16.327164 Pseudo R2 = 0.3681
------------------------------------------------------------------------------
dap | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
ing | .002516 .0014911 1.69 0.092 -.0004065 .0054384
ph | -.9389872 .5094312 -1.84 0.065 -1.937454 .0594797
edu | 1.811965 .920366 1.97 0.049 .0080805 3.615849
edad | .0815422 .0808213 1.01 0.313 -.0768647 .239949
genero | .1647329 .961246 0.17 0.864 -1.719275 2.04874
_cons | -3.915695 4.555154 -0.86 0.390 -12.84363 5.012243
------------------------------------------------------------------------------
Modelo 2:
En el modelo 2 se excluye a partir del modelo 1, el genero. En este caso, el ingreso, precio hipotetico y
nivel de educacin al 10% de nivel de significancia siguen siendo significativos. El coeficiente de la
variable edad no es significativo.
. logit dap ing ph edu edad
Logistic regression Number of obs = 48
LR chi2(4) = 18.99
Prob > chi2 = 0.0008
Log likelihood = -16.341882 Pseudo R2 = 0.3675
------------------------------------------------------------------------------
dap | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
ing | .0025349 .0014843 1.71 0.088 -.0003744 .0054442
ph | -.9333189 .5047709 -1.85 0.064 -1.922652 .0560138
edu | 1.810794 .9186444 1.97 0.049 .010284 3.611304
edad | .0853008 .0780906 1.09 0.275 -.067754 .2383556
_cons | -4.064285 4.482806 -0.91 0.365 -12.85042 4.721854
------------------------------------------------------------------------------
Modelo 3:
Finalmente en el modelo 3 se encuentra consistencia y tiene signos esperados, es ms, este modelo ofrece
un ajuste aceptable en trminos de nivel de significancia individual (estadstico Z), significancia global
(razn de verosimilitud LR). El coeficiente de Pseudo R
2
ofrece un buen ajuste con un valor de 34.28%,
como se puede observar en los siguientes resultados:
. logit dap ing ph edu
. logit dap ing ph edu
Iteration 0: log likelihood = -25.836838
Iteration 1: log likelihood = -18.273434
Iteration 2: log likelihood = -17.148696
Iteration 3: log likelihood = -16.988266
79
Iteration 4: log likelihood = -16.98057
Iteration 5: log likelihood = -16.980544
Logistic regression Number of obs = 48
LR chi2(3) = 17.71
Prob > chi2 = 0.0005
Log likelihood = -16.980544 Pseudo R2 = 0.3428
------------------------------------------------------------------------------
dap | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
ing | .0027645 .0015352 1.80 0.072 -.0002446 .0057735
ph | -1.21619 .4962032 -2.45 0.014 -2.18873 -.2436494
edu | 1.774358 .8896505 1.99 0.046 .0306752 3.518041
_cons | .5888069 1.354129 0.43 0.664 -2.065236 3.24285
------------------------------------------------------------------------------
0
.
2
.
4
.
6
.
8
1
P
r
(
d
a
p
)
500 1000 1500 2000 2500
ing
Probabilidad de DAP e ingreso
80
-
4
-
2
0
2
P
e
a
r
s
o
n

r
e
s
i
d
u
a
l
500 1000 1500 2000 2500
Ing
Residuos e ingreso familiar
En el siguiente cuadro se muestra el resumen de los modelos estimados:
Portafolio de Modelos
Variables Modelo 1 Modelo 2 Modelo 3
constante -3.91
(-0.39)
-4.064
(0.365)
0.588
(0.664)
Ing 0.0025
(0.092)
0.0025
(0.008)
0.00272
(0.072)
Ph -0.938
(0.065)
-0.933
(0.064)
-1.216
(0.014)
Edu 1.811
(0.049)
1.8107
(0.049)
1.774
(0.046)
Edad 0.0815
(0.049)
0.0853
(0.275)
Genero 0.1647
(0.864)
Log-Likelihood -16.32 -16.34 -16.98
LR (Ji-Cuadrado) 19.02
(0.0019)
18.99
(0.0008)
17.71
(0.005)
R
2
Mc Fadden 0.3681 0.3675 0.3428
Tamao de muestra 48 48 48
Nota: Los valores entre parntesis corresponden al p-value (prob)
81
La validez del mejor modelo modelo ganador se juzga en funcin del cumplimiento de los signos
esperados, de la significancia estadstica de los coeficientes estimados en forma individual y global y de
algn criterio de bondad de ajuste (por ejemplo, R
2
de Mc Fadden). En ese sentido, el modelo 3, cumple con
estas caractersticas. Veamos a continuacin, cada uno de ellos.
Prueba de Z-Statistic
Es un contraste similar a la prueba t, sirve para ver el nivel de significancia individual de los coeficientes,
bajo la hiptesis nula:
Ho:
i
= 0 (el coeficiente no es estadsticamente significativo en el modelo)
Del modelo 3, se puede desprender que los coeficientes de ing, ph y edu son diferentes de cero (se rechaza
la Ho al p-value de 0.10). En cambio, la constante no es estadsticamente significativo (no se rechaza la Ho
al p-value de 0.05).
Test de Razn de verosimilitud (LR)
Esta prueba contrasta la hiptesis nula de que los coeficientes del modelo son todos iguales a cero (excepto
la constante), es decir, no son significativos. El test de LR constituye otra manera de llevar a cabo la
hiptesis acerca de parmetros, es anlogo a la prueba F. El estadstico LR se distribuye como una X
2
con q
grados de libertad.
Ho:
1
=
2
=
3
=..
q
=0 (los coeficientes no son estadsticamente significativos)
El estadstico se calcula con la siguiente formula:
) LnL LnL ( ) q ( Chi LR
I R
2 2
Del modelo 3, reemplazando tenemos:
71 . 17 ) 9805 . 16 8368 . 25 ( 2 ) 3 ( 2 + Chi LR
Por lo tanto, se rechaza Ho con un p-value=0.05. En consecuencia los coeficientes del modelo Logit en
forma global son significativos en trminos estadsticos.
R
2
de Mc Fadden (Pseudo R
2
)
Este estadstico toma valores entre 0 y 1 y puede ser ledo como el R
2
de los modelos lineales. La forma
de construir el estadstico es simple pues se trata de una relacin entre el modelo actual (irrestricto) y un
modelo que sea ms simple, el que provee menos informacin (restricto). En este modelo, el modelo
restricto ser aquel que solo contenga como variable explicativa la constante. Por tanto, las restricciones en
nuestro ejemplo sern 3 que corresponden a los 3 parmetros.
La formula para calcular el R
2
de McFadden en este caso del modelo 3 es:
3428 . 0
9368 . 25
9805 . 16
1 1
2
2


R
I
LnL
LnL
R
McFadden
Un aspecto importante es que dicha lectura del R
2
de Mc Fadden es menos exigente que la lectura de R
2
de
los modelos lineales. Por ejemplo, un R
2
mayor a 0.5 estamos ante un muy buen modelo, valores entre 0.3 y
0.5 estamos ante un buen modelo. Mientras que valores menores a 0.1 indican que el modelo analizado no
es bueno para clasificar a los individuos. En el modelo 3, el valor de obtenido es 0.3428, lo que nos indica
que el modelo tiene una efectividad buena al momento de la clasificacin.
82
Tabla de prediccin
Otra aproximacin de la prediccin del modelo es calculando la tabla de prediccin. Para ello es necesario
establecer un punto de corte, generalmente es 0.5. Como mencionamos, el modelo arroja valores entre 0 y 1,
y al establecer un punto de corte de 0.5 estamos afirmando que toda la probabilidad menor a 0.5 es muy
pequea y el individuo con esa probabilidad estimada ser clasificado entre los individuos que eligieron
el valor 0 de la variable dependiente. Si la probabilidad es mayor o igual a 0.5 entonces la probabilidad ser
grande y clasificaremos a esos individuos como los que eligieron la opcin 1 de la variable dependiente.
. lstat
Logistic model for dap
-------- True --------
Classified | D ~D | Total
-----------+--------------------------+-----------
+ | 35 5 | 40
- | 2 6 | 8
-----------+--------------------------+-----------
Total | 37 11 | 48
Classified + if predicted Pr(D) >= .5
True D defined as dap != 0
--------------------------------------------------
Sensitivity Pr( +| D) 94.59%
Specificity Pr( -|~D) 54.55%
Positive predictive value Pr( D| +) 87.50%
Negative predictive value Pr(~D| -) 75.00%
--------------------------------------------------
False + rate for true ~D Pr( +|~D) 45.45%
False - rate for true D Pr( -| D) 5.41%
False + rate for classified + Pr(~D| +) 12.50%
False - rate for classified - Pr( D| -) 25.00%
--------------------------------------------------
Correctly classified 85.42%
--------------------------------------------------
El porcentaje global de aciertos del modelo es 85.42%, monto que sera considerado aceptable. Sin
embargo, este porcentaje se distribuye en 94.59% de acierto de clasificar a los encuestados en la opcin 1
(DAP=1) y en 54.55% de acierto al clasificar a los encuestados en la opcin 0.
Efectos Marginales del modelo 3 modelo ganador.
Los efectos marginales en los modelos no lineales no son constantes debido a esto estimaremos un efecto
marginal promedio relacionado a cada variable, tambin los efectos marginales se pueden calcular para un
valor especifico. A continuacin calculamos los efectos marginales para el modelo 3.
. mfx compute
Marginal effects after logit
y = Pr(dap) (predict)
= .88302927
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
ing | .0002855 .00013 2.24 0.025 .000036 .000535 979.375
ph | -.1256185 .05551 -2.26 0.024 -.234419 -.016818 2.02083
83
edu*| .233531 .14791 1.58 0.114 -.056363 .523425 .666667
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1
Como podemos observar la probabilidad de estar dispuesto a pagar por descontaminar la baha del Lago
Titicaca de la ciudad de Puno, se incrementa en 0.0002855 s el ingreso mensual de la familia se
incrementa en 1 Nuevo Sol. Asimismo, la probabilidad de estar dispuesto a pagar se reduce en 0.1256
aproximadamente, s el precio hipottico se incrementa en 1 Nuevo Sol. Finalmente, la probabilidad de estar
dispuesto a pagar es mayor en 0.2335 para los individuos que cuentan con estudios superiores con los que
no cuentan.
Disposicin a pagar (DAP)
Media (C) Mediana (C*)
[ ]

e Ln
C
+

1

* C
1
3
2 0

+ +

k
i
S Ing
Donde Ln=Logaritmo natural
El modelo estimado Logit es:
) 774358 . 1 21619 . 1 0027645 . 0 5888069 . 0 ( ) 1 Pr(
^
edu ph Ing DAP + +
Para calcular la media y la mediana trabajar en lo posible con todos los decimales.
El modelo estimado para la media es:
( )
21619 . 1
) 1 ( 1
774358 . 1 002726 . 0 5588069 . 0

+

+

+ + edu Ing
e Ln e Ln
C

En STATA
-(ln(1+exp(0.5888069+0.002726*ing+1.774358*edu)))/(-1.21619)
84
El modelo estimado para la mediana es:
21619 . 1
) 774358 . 1 0027645 . 0 5888069 . 0 (
*

+ +

edu Ing
C

-((0.5888069+0.0027645*ing+1.774358*edu))/(-1.21619)
85
. summarize
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
dap | 48 .7708333 .4247444 0 1
ph | 48 2.020833 1.061704 0 4
edad | 48 49.58333 7.792067 27 61
genero | 48 .4375 .501328 0 1
edu | 48 .6666667 .4763931 0 1
-------------+--------------------------------------------------------
ing | 48 979.375 516.7921 370 2500
c_media | 48 3.678233 1.353809 1.465034 7.546739
c_mediana | 48 3.682973 1.396101 1.325181 7.625794
Por lo tanto, la mediana de dap es de S/. 3.68 por mes, es decir la disposicin a pagar es de S/ 3.68 por mes.
Si se conoce la poblacin usuaria (poblacin beneficiaria) se puede calcular el beneficio econmico anual
del proyecto.
Modelo de Regresin Poisson
El modelo de regresin Poisson supone que cada y
i
es una realizacin de una variable aleatoria con
distribucin Poisson de parmetro
i
y que este parmetro est relacionado con los regresores x
i.
La
ecuacin bsica del modelo es:
! y
e
) y Y Pr(
i
y
i
i i
i i



El modelo Poisson es un modelo de regresin no lineal, la funcin de verosimilitud logartmica es:
[ ]

+
n
i
i i i i
Lny x y LnL
1
! '
Donde:
i
x
i
e
'

Las condiciones de primer orden para estimar el modelo de Poisson son:

n
i
i i i
x y
LnL
1
0 ) (

Mientras la matriz Hessiano es:


86

n
i
i i i
x x
LnL
1
'
2
'


El Hessiano es una matriz definida negativa, dado que la funcin de verosimilitud es una funcin
globalmente cncava.
El Riesgo Crediticio
La clasificacin de una deuda es un juicio emitido con la capacidad de crdito de un deudor, el riesgo
creditico se basa en la probabilidad que tenga la empresa o deudor de dejar de cumplir sus obligaciones y
en la proteccin que se dar a los acreedores en caso de incumplimiento.
Aplicacin.
La base de datos corresponde a la historia crediticia de una cartera 32 prestatarios durante el ao 2010 de
una entidad financiera local cuyos clientes son los comerciantes de los Mercados de abasto de la ciudad de
Puno.
Variable dependiente:
Y=Nmero de veces que incumple el prestatario en el pago de sus cuotas por ao.
El incumplimiento implica que el prestatario no paga puntualmente sus cuotas, es decir, se retrasa al menos
en un da con relacin a la fecha de vencimiento de la cuota.
Variables Independientes:
i= ingreso en Nuevos Soles por mes
e=Nivel de educacin del prestatario en aos de estudio
f=1 si es formal (con RUC) y 0=si es informal (sin RUC)
s=1 si el prestatario es varn y 0=mujer
prestatari
os Y I e f s
1 1 490 16 1 0
2 0 900 6 0 1
3 0 1900 11 1 1
4 0 800 16 0 1
5 1 500 6 1 0
6 0 1500 11 0 0
7 4 450 11 1 0
8 0 900 6 0 0
9 0 1200 5 1 1
10 0 800 16 0 0
11 1 500 6 1 0
12 0 2500 11 0 1
13 0 1500 11 1 1
14 0 900 11 1 0
15 0 800 5 1 1
16 0 1000 16 0 1
17 7 500 6 1 1
18 0 3330 11 0 1
19 0 1500 11 1 0
20 0 900 6 0 0
87
21 0 700 5 1 1
22 0 800 16 0 0
23 6 500 6 1 1
24 0 2700 11 0 1
25 0 1500 11 1 1
26 0 900 6 1 1
27 0 1200 5 1 0
28 0 800 16 0 1
29 0 900 6 0 0
30 0 1400 11 0 1
31 0 1500 11 1 0
32 0 1200 11 0 1
Graficando en STATA
0
2
4
6
8
N

m
e
r
o

d
e

v
e
c
e
s

q
u
e

i
n
c
u
m
p
l
e

p
o
r

a

o
0 1000 2000 3000 4000
Ingresos declarados
88
0
1
2
3
4
5
N

m
e
r
o

d
e

v
e
c
e
s

q
u
e

i
n
c
u
m
p
l
e

p
o
r

a

o
0 .2 .4 .6 .8 1
1=si es varn ; 0=si es mujer
Del grafico se puede inferir que los prestatarios con altos ingresos son ms cumplidos
en el pago de sus cuotas.
0
2
4
6
8
N

m
e
r
o

d
e

v
e
c
e
s

q
u
e

i
n
c
u
m
p
l
e

p
o
r

a

o
5 10 15
Nivel de educacin
89
. poisson y i e f s
Iteration 0: log likelihood = -18.380243
Iteration 1: log likelihood = -11.313759
Iteration 2: log likelihood = -9.4712713
Iteration 3: log likelihood = -8.5135478
Iteration 4: log likelihood = -8.4191351
Iteration 5: log likelihood = -8.4177781
Iteration 6: log likelihood = -8.4175493
Iteration 7: log likelihood = -8.4175115
Iteration 8: log likelihood = -8.4175024
Iteration 9: log likelihood = -8.4175005
Iteration 10: log likelihood = -8.4175
Poisson regression Number of obs = 32
LR chi2(4) = 78.53
Prob > chi2 = 0.0000
Log likelihood = -8.4175 Pseudo R2 = 0.8235
------------------------------------------------------------------------------
y | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
i | -.0315963 .0163717 -1.93 0.054 -.0636843 .0004917
e | -.0328644 .128543 -0.26 0.798 -.284804 .2190753
f | 9.037078 3137.036 0.00 0.998 -6139.44 6157.514
s | 1.885781 .7554629 2.50 0.013 .4051006 3.366461
_cons | 6.943312 3137.061 0.00 0.998 -6141.584 6155.47
------------------------------------------------------------------------------
Los coeficientes de las variables: nivel de educacin, formalizacin y la constante del modelo
no son estadsticamente significativos a un nivel de 10%.
En seguida se excluyen las variables que no son significativos, por lo que se considera
nicamente dos variables en el modelo de Poisson.
. poisson y i s
Iteration 0: log likelihood = -20.202071
Iteration 1: log likelihood = -10.450627
Iteration 2: log likelihood = -8.8841559
Iteration 3: log likelihood = -8.4675708
Iteration 4: log likelihood = -8.4533473
Iteration 5: log likelihood = -8.4533022
Iteration 6: log likelihood = -8.4533022
Poisson regression Number of obs = 32
LR chi2(2) = 78.46
Prob > chi2 = 0.0000
Log likelihood = -8.4533022 Pseudo R2 = 0.8227
------------------------------------------------------------------------------
y | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
i | -.030373 .0148947 -2.04 0.041 -.0595661 -.00118
s | 1.994116 .6559697 3.04 0.002 .7084392 3.279793
_cons | 15.06289 7.002912 2.15 0.031 1.337435 28.78835
------------------------------------------------------------------------------
90
Los coeficientes del modelo estimado ya sea individualmente y globalmente son significativos a un nivel de
5%, adems el modelo presenta un ajuste de 82.27%.
Si los prestatarios cuentan con mayores ingresos menores sern el nmero de veces que incumplan con el
pago de sus deudas. Si los prestatarios son varones mayores sern el nmero de veces que incumplan con
sus obligaciones. Estos resultados sealan que los deudores con mayores ingresos y si son mujeres tienen
menor riesgo crediticio, en otras palabras tendran problemas para cancelar su deuda los prestatarios
varones con menores ingresos.
En Excel:
Sintaxis
POISSON(x;media;acumulado)
X es el nmero de eventos.
Media es el valor numrico esperado.
Acumulado es un valor lgico que determina la forma de la distribucin de probabilidad devuelta. Si el
argumento acumulado es VERDADERO, POISSON devuelve la probabilidad de Poisson de que un evento
aleatorio ocurra un nmero de veces comprendido entre 0 y x inclusive; si el argumento acumulado es
FALSO, la funcin devuelve la probabilidad de Poisson de que un evento ocurra exactamente x veces.
91
prestatari
os y i e f s landa Pr
1 1 490 16 1 0 1.197 0.362
2 0 900 6 0 1 0.000 1.000
3 0 1900 11 1 1 0.000 1.000
4 0 800 16 0 1 0.001 0.999
5 1 500 6 1 0 0.884 0.365
6 0 1500 11 0 0 0.000 1.000
7 4 450 11 1 0 4.035 0.195
8 0 900 6 0 0 0.000 1.000
9 0 1200 5 1 1 0.000 1.000
10 0 800 16 0 0 0.000 1.000
11 1 500 6 1 0 0.884 0.365
12 0 2500 11 0 1 0.000 1.000
13 0 1500 11 1 1 0.000 1.000
14 0 900 11 1 0 0.000 1.000
15 0 800 5 1 1 0.001 0.999
16 0 1000 16 0 1 0.000 1.000
17 7 500 6 1 1 6.491 0.146
18 0 3330 11 0 1 0.000 1.000
19 0 1500 11 1 0 0.000 1.000
20 0 900 6 0 0 0.000 1.000
21 0 700 5 1 1 0.015 0.985
22 0 800 16 0 0 0.000 1.000
23 6 500 6 1 1 6.491 0.158
24 0 2700 11 0 1 0.000 1.000
25 0 1500 11 1 1 0.000 1.000
26 0 900 6 1 1 0.000 1.000
27 0 1200 5 1 0 0.000 1.000
28 0 800 16 0 1 0.001 0.999
29 0 900 6 0 0 0.000 1.000
30 0 1400 11 0 1 0.000 1.000
31 0 1500 11 1 0 0.000 1.000
32 0 1200 11 0 1 0.000 1.000
En Excel:
Pr= poisson(y;landa;falso)
En la ltima columna se muestra la probabilidad de que el evento ocurra y veces, es decir, la probabilidad
del nmero de veces que incumplan los prestatarios en el pago de sus deudas por ao. El modelo predice
las probabilidades con una efectividad de 75%.
92

S-ar putea să vă placă și