Documente Academic
Documente Profesional
Documente Cultură
ECONOMETRA
AVISO LEGAL
Derechos Reservados 2012, por RED TERCER MILENIO S.C.
Viveros de Ass 96, Col. Viveros de la Loma, Tlalnepantla, C.P. 54080, Estado de Mxico.
Prohibida la reproduccin parcial o total por cualquier medio, sin la autorizacin por escrito del titular de
los derechos.
Datos para catalogacin bibliogrfica
Elsa Norma Elizalde ngeles
Econometra
ISBN 978-607-733-100-1
Primera edicin: 2012
Revisin pedaggica: Den Stincer Gmez
Revisin editorial: Eduardo Durn Valdivieso
DIRECTORIO
NDICE
Introduccin
Mapa conceptual
Mapa conceptual
Introduccin
10
1.1 Datos
11
1.2 Relaciones
15
1.3 Variables
16
1.4 Qu es la econometra?
19
Autoevaluacin
24
27
Mapa conceptual
28
Introduccin
29
30
2.2 Supuestos
38
2.3 Estimadores
42
60
2.5 Prediccin
73
Autoevaluacin
78
Unidad 3. Heterocedasticidad
80
Mapa conceptual
81
Introduccin
82
83
86
91
2
Autoevaluacin
96
Unidad 4. Autocorrelacin
98
Mapa conceptual
99
Introduccin
100
4.1 Causas
101
104
107
Autoevaluacin
112
114
Mapa conceptual
115
Introduccin
116
117
119
Autoevaluacin
130
133
Mapa conceptual
134
Introduccin
135
136
6.2 Estimacin
140
6.3 Prediccin
144
Autoevaluacin
149
Bibliografa
152
Glosario
153
INTRODUCCIN
El concepto econometra surge en la segunda dcada del siglo XX, para hacer
referencia a estudios econmicos con apoyo de mtodos estadsticos. Es con la
econometra moderna que se proponen formulaciones que sirven de apoyo para
contradecir los planteamientos hechos por la teora econmica.
La econometra es considerada una disciplina, la cual se mueve entre
dos teoras: la teora econmica y la teora estadstica. De ah que se d en
cierta forma un grado de complejidad al tratar de analizar una diversidad de
posiciones en torno a la teora econmica, y demostrar sus planteamientos; en
tanto, en la teora estadstica se encuentra una gran variedad de tcnicas y
mtodos, en los cuales se pueden encontrar limitaciones.
El presente libro de econometra cuenta con seis unidades en donde se
introducen una serie de aplicaciones y formulaciones para determinar cul es el
comportamiento que muestra un modelo planteado.
Una advertencia que se hace es que a partir de la Unidad tres y hasta la
seis, se utilice paquetera especial para la solucin de modelos economtricos,
debido al alto grado de complejidad de los planteamientos y formulaciones
establecidas. En este caso, el ms recomendable es E views, debido a que es
uno de los ms completos, existen otros como Shazam, que tambin puede
ayudar a dar solucin al anlisis de todas las tcnicas vistas en el presente
libro.
Este libro es un curso introductorio de econometra dirigido a estudiantes
de comercio internacional, el cual les proporciona las herramientas necesarias
para el anlisis de modelos de regresin.
Al finalizar el estudio de la econometra, el estudiante podr aplicar
mtodos economtricos que le permitan evaluar alguna teora econmica o bien
para poner en prctica un proyecto comercial. De igual modo, puede hacer
pronsticos de variables macroeconmicas o variables relacionadas con el
comercio internacional. Es importante mencionar que la econometra es una
herramienta fundamental que el estudiante podr utilizar en su vida profesional.
MAPA CONCEPTUAL
Econometra
1. Introduccin
Metodolgica
3. Heterocedasticidad
2. Modelo De
Regresin Lineal
Clsico
4. Autocorrelacin
5. Variables artificiales o
cualitativas
6. Series temporales
UNIDAD 1
INTRODUCCIN METODOLGICA
OBJETIVO
El estudiante identificar los tipos de datos que se observan en la economa
para llevar a cabo un anlisis emprico y distinguir las diferentes relaciones hay
al establecer un modelo. Diferenciar las variables que se aplican en un modelo
economtrico y analizar la conformacin de la econometra con otras ciencias.
TEMARIO
1.1 DATOS
1.2 RELACIONES
1.3 VARIABLES
1.4 QU ES LA ECONOMETRA?
MAPA CONCEPTUAL
1. Introduccin
metodolgica
1.1 Datos
1.2 Relaciones
1.4 Qu es la
econometra?
1.3 Variables
INTRODUCCIN
Para la elaboracin de un modelo economtrico es necesaria la aplicacin de
mtodos estadsticos a datos econmicos, de igual forma se debe tener
conocimiento de la teora econmica.
De los mtodos estadsticos y la teora econmica ya se tiene nocin de
cursos previos.
En la primera parte de de esta Unidad se determina cules son la fuentes
de informacin para obtener datos estadsticos acerca del comportamiento de la
economa y aplicar estos datos a un modelo economtrico planteado. Por lo que
se establecen los diferentes tipos de datos que se observan en la economa.
La econometra aborda el problema de elaborar modelos que midan las
relaciones causales entre variables econmicas, por lo que se verifican este tipo
de relaciones. Asimismo se analiza que en todo modelo economtrico se
utilizan dos tipos de variables, mismas que se ocupan para representar una
relacin de causalidad entre dos variables.
Por ltimo, se menciona una serie de definiciones acerca de qu es la
econometra, haciendo referencia a algunos autores. Tambin se indica cmo a
partir de la econometra se puede comprobar el grado de validez de los
modelos econmicos y se logra usar para explicar el comportamiento de la
economa.
10
1.1 DATOS
El anlisis economtrico consiste en la aplicacin de mtodos estadsticos a
datos econmicos. Uno de los problemas con los cuales se puede enfrentar el
econometrista es la escasa calidad de los datos. Esto se refleja en una
disociacin, en algunos casos, entre la informacin disponible y la requerida
para comprobar la validez de los modelos tericos. Esta separacin se debe a
que ambas actividades las realizan diferentes personas.
Las fuentes de informacin para obtener datos econmicos corresponden
a empresas u oficinas de estadstica gubernamentales, donde la recoleccin de
informacin est a cargo, en la mayora de las veces, de personas que no son
especialistas, teniendo con esto imprecisiones en tal informacin.
Para el caso de Mxico, la recoleccin de informacin corresponde al
Instituto Nacional de Geografa e Informtica (INEGI) y al Banco de Mxico
(Banxico), la Secretaria de Trabajo, entre otras entidades, mostrando con esto
los datos un alto grado de heterogeneidad. Frente a esto, en la actualidad se
observa un flujo creciente de informacin estadstica.
Los datos recolectados por las diversas entidades son de tipo no
experimental, lo que implica que no estn sujetos al control del investigador,
bajo estas circunstancias, lo que se debe hacer es tratar de obtener la mayor
informacin posible de datos imperfectos y reconocer que los resultados de los
anlisis dependen de los datos, incurriendo con esto en posibles errores de
observacin, por omisin o por comisin.
Un caso particular son las encuestas que realiza el INEGI, cuando se
efecta el censo poblacional se presentan situaciones en las que los
cuestionarios llegan a no tener respuesta, o bien, que slo se cuente con 50%
de las respuestas a las preguntas, sobre todo, que no sean contestadas las de
tipo financiero, ocasionando con ello un sesgo en los resultados.
Los datos econmicos, por lo general, estn disponibles con un nivel de
agregacin muy alto, como es el caso de las variables macroeconmicas, como
el PIB (Producto Interno Bruto), el desempleo, la inflacin, etctera, donde este
11
Observacin
Sueldo
Educacin
Sexo
Edo. Civil
2.10
11
3.00
13
4.08
4.24
12
5.07
12
6.03
14
5.07
13
6.03
11
11.12
16
10
9.08
14
12
con
movimientos
simultneamente.
Pueden
ascendentes
ser
datos
anuales,
descendentes,
semestrales,
2.1
II
2.5
III
1.3
IV
-1.0
2009 (TRIMESTRAL)
-7.4
II
-9.6
III
-5.5
IV
-2.0
2010 (TRIMESTRAL)
4.1
II
7.6
III
5.1
IV
4.4
13
Observacin
Ciudad
Aos
Poblacin
Vivienda
Educacin
Propia
1
2005
8,605,239
71.1
9.4
2010
8,851,080
66.7
10.5
2005
13,096,686
79.0
7.9
2010
15,175,862
73.6
9.1
2005
3,834,141
80.7
8.5
2010
4,653,458
79.6
9.8
2005
6,322,002
69.3
7.4
2010
7,350,682
65.4
8.8
2005
6,908,975
79.9
6.4
10
2010
7,963,194
80.8
7.9
ACTIVIDAD DE APRENDIZAJE
Elaborar una tabla de serie longitudinal con 30 observaciones, con dos periodos
de tiempo y 4 variables (cuantitativas y cualitativas). Utilizar datos estadsticos
de INEGI y Banxico. Entregar a computadora en la siguiente sesin.
14
1.2 RELACIONES
En econometra se tiene que especificar el modelo matemtico con el cual se va
a trabajar, una vez que se ha determinado bajo qu teora econmica se va a
llevar a cabo el anlisis emprico.
Un modelo es simplemente un conjunto de ecuaciones matemticas. La
teora econmica postula una serie de relaciones causales entre diversas
magnitudes econmicas. La econometra aborda el problema de elaborar
modelos que midan las relaciones causales entre variables econmicas. Estas
relaciones son de tres tipos:
1) Las uniecuacionales constan de una sola ecuacin en la que hay una
variable dependiente (o determinada) que viene establecida por una o
ms independientes (o determinantes) o explicativa. Por ejemplo
cuando se dice que el consumo (C) depende del nivel de precios (P) y
del ingreso disponible (Yd) se expresa como: C = f (P, Yd). C es la
variable dependiente, mientras que P y Yd son las variables
independientes. Cualquier alteracin en los niveles de P y Yd
determinarn las variaciones en el consumo (C).
2) Las multiecuacionales parten de un conjunto de ecuaciones. Por
ejemplo, si se considera el consumo nuevamente, el gasto que se
efecta para realizarlo es en bienes de consumo inmediato, bienes de
uso duradero y en servicios. Cada uno de ellos podran ser una funcin
del ingreso y la riqueza. De esta manera, se tiene un sistema de
ecuaciones Ci, Cd y Cs que estn en funcin del ingreso y de la riqueza.
Este conjunto de ecuaciones se pueden tratar separadamente como
relaciones uniecuacionales o de manera conjunta.
3) Las simultneas son cuando dos o ms variables vienen determinadas
simultneamente por un cierto nmero de variables explicativas. Por
ejemplo, si se considera el ingreso (Y) y el consumo (C) de la totalidad
del mercado, se debe tener en cuenta que los precios y las cantidades
vienen determinados simultneamente por las condiciones de oferta y
15
ACTIVIDAD DE APRENDIZAJE
Establecer un modelo multiecuacional e indicar cul es la variable dependiente
y cules las independientes. Sustentar el modelo bajo una teora econmica.
Entregar a computadora en la siguiente sesin.
1.3 VARIABLES
La terminologa utilizada en econometra es la variable que se entiende como el
concepto econmico que se quiere analizar. Normalmente se utilizan variables
cuantitativas, es decir, cuyos valores vienen expresados de forma numrica; por
ejemplo, como los niveles de precios, el ingreso nacional. Tambin existe la
posibilidad de incluir en el modelo economtrico variables cualitativas que se
puedan determinar de manera cuantitativa (por ejemplo, hombre, mujer, casado
o soltero).
Todo modelo economtrico hace uso de variables dependientes y
variables independientes, y se utilizan para representar una relacin de
causalidad entre dos variables, mismas que reciben la siguiente terminologa:
16
Variable dependiente
Variable independiente
Variable explicada
Variable explicativa
Variable de respuesta
Predicha
Predictor
Regresada
Regresor
Variable endgena
Variable exgena
ACTIVIDAD DE APRENDIZAJE
En la siguiente tabla se presentan cifras de tasas de crecimiento anual de
desocupacin abierta en reas urbanas (porcentaje con respecto a la Poblacin
Econmicamente Activa, PEA) en Mxico durante el periodo de enero a
diciembre del 2004.
Tasas de crecimiento anual de desocupacin abierta
en reas urbanas, enero a diciembre del 2004.
Mes
Ciudad de
Guadalajara
Monterrey
Mxico
Enero
31.43
73.91
41.18
Febrero
34.29
56.52
20.59
Marzo
42.86
4.35
20.59
Abril
25.71
17.39
11.76
Mayo
20.00
52.17
5.88
Junio
40.00
4.35
17.65
Julio
28.57
52.17
14.71
Agosto
65.71
56.52
32.35
Septiembre
51.43
43.48
50.59
Octubre
17.14
91.30
17.65
Noviembre
48.57
13.04
14.71
diciembre
2.86
0.00
32.35
Fuente: Instituto Nacional de Estadstica, Geografa e Informtica: las cifras desestacionalizadas y de tendencia
corresponden a procesos elaborados por el Banco de Mxico, Encuesta Nacional de Empleo Urbano.
18
1.4 QU ES LA ECONOMETRA?
La econometra tiene su origen a principios de los aos de 1930, teniendo como
objetivo medir los ciclos de los negocios debido a la frecuente presencia de las
fases recesivas observadas desde finales del siglo
XIX.
La econometra
XX
y que
19
20
de
ste.
Este
es
un
principio
econmico
del
21
ACTIVIDAD DE APRENDIZAJE
Elaborar un esquema de la divisin de la econometra e indicar a qu se refiere
cada concepto.
22
23
AUTOEVALUACIN
) Variable endgena
) Estadstica econmica
manera tabular.
) Modelo
) Econometra
econometra
) Series de corte
que
le
permiten
recopilar, (
conclusiones
en
algunos (
problemas planteados.
) Estadstica matemtica
) Modelo economtrico
) Mtodo de
) Series de temporales
) Relacin
Es
simplemente
un
conjunto
de
ecuaciones matemticas.
9. Son las que se recolectan sobre unidades
individuales en un momento del tiempo.
24
muy
cortos
ascendentes
con
movimientos
descendentes,
simultneamente.
Respuestas
1. Se encarga de recopilar, clasificar y hace ( 5 ) Variable endgena
una
descripcin
de
la
( 3 ) Econometra
conclusiones
en
problemas planteados.
( 4 ) Mtodo de
validez
general
al
satisfacer
( 7 ) Relacin
se construye.
multiecuacional
25
Es
simplemente
un
conjunto
de
ecuaciones matemticas.
9. Son las que se recolectan sobre
unidades individuales en un momento del
tiempo.
10. Es informacin que se recopila durante
un determinado tiempo, se recolecta en
intervalos muy cortos con movimientos
ascendentes y descendentes,
simultneamente.
26
UNIDAD 2
TEMARIO
2.1 MNIMOS CUADRADOS ORDINARIOS (MCO)
2.2 SUPUESTOS
2.3 ESTIMADORES
2.4 PRUEBAS DE HIPTESIS
2.5 PREDICCIN
27
MAPA CONCEPTUAL
2. Modelo de
regresin lineal
clsico
2.1 Mnimos
cuadrados ordinarios
2.5 Prediccin
2.4 Pruebas de
hiptesis
2.2 Supuestos
2.3 Estimadores
28
INTRODUCCIN
Debe tenerse en cuenta que el modelo de regresin lineal clsico es una
abstraccin o construccin terica, pues los supuestos que lo fundamentan
pueden llegar a ser considerados rigurosos o poco realistas, pero en la medida
en que se progrese en conocimientos, estos supuestos pueden llegar a ser
modificados sobre la marcha.
Por medio del enfoque de mnimos cuadrados se efecta el anlisis de
regresin, el cual bajo ciertos supuestos produce estimadores lineales
insesgados, incluso algunos de esos estimadores presentan varianza mnima.
Se realiza el anlisis del problema de estimacin puntual de los
coeficientes de regresin, se considera la precisin del estimador con la
medicin del error estndar. Se aplica con esto inferencias acerca de los
parmetros (poblacionales) y la aplicacin de las pruebas de hiptesis de
dichos parmetros.
Un tema a tratar es el problema de la bondad de ajuste de la regresin
muestral, el cual se mide por medio del coeficiente de determinacin r2, mismo
que ser calculado.
Asimismo, se verifica cmo las perturbaciones poblacionales tienen una
distribucin normal y cmo bajo este supuesto los estimadores del modelo de
mnimos cuadrados ordinarios siguen distribuciones probabilsticas conocidas.
Por ltimo, se analizan dos ramas de la estadstica clsica como son la
estimacin y las pruebas de hiptesis, para ello se aplican los intervalos de
confianza y la prueba de significancia. Tambin se demuestra cmo la lnea de
regresin muestral que se obtiene de los datos, puede utilizarse para la
prediccin o proyeccin.
29
Figura 2.1
30
Alumno
No. de faltas
10
(x)
Calificacin
(y)
CALIFICACIN
12
10
8
6
4
2
0
0
8
FALTAS
Figura 2.2
Figura 2.3
y = mx + b
Donde:
m representa la pendiente de la recta.
b es el punto donde la recta intercepta al eje y.
32
m=
cov(x , y )
var (x)
Dado que la recta de regresin pasa por el punto en que se encuentra los
puntos coordenados ( x , y ) que son las medias correspondientes de y y x, por
lo cual esta satisface la ecuacin de la recta
y = mx + b
b = y - mx
cov( x, y ) =
( x i - x)(y - y)
i
n
var( x ) =
( x i - x) 2
n
10
10
x = 4.25
y =8
(xi - x)
(y i - y)
(y i - y) (xi - x)
(xi - x)2
-2.25
5.0625
10
3.75
7.5
14.0625
-1.25
-1
1.25
1.5625
-3.25
-3
9.75
10.5625
-0.25
-0.25
0.0625
0.75
0.5625
1.75
1.75
3.0625
-1.25
-1
1.25
1.5625
-2.25
-2
4.5
5.0625
-0.25
0.0625
10
3.75
7.5
14.0625
0.75
0.75
0.5625
34
51
96
34.00
( x i - x) 2
n
var( x ) =
56.25
12
var( x ) = 4.6875
cov( x, y ) =
( x i - x)(y - y)
i
n
cov( x, y ) =
34
12
cov( x, y ) = 2.8333
m=
m=
cov(x , y )
var (x)
2.8333
4.6875
m = 0.6044
El valor de b es:
b = y - mx
b = 8 - 0.6044(4.25)
b = 5.4311
35
y = mx + b
Para x = 0
y = 0.6044x + 5.4311
y = 0.6044(0)+ 5.4311
y = 5.4311
Para x = 6.5
y = 0.6044x + 5.4311
y = 0.6044(6.5)+ 5.4311
y = 9.3597
Para x = 9
y = 0.6044x + 5.4311
y = 0.6044(9)+ 5.4311
y = 10.8707
36
Observaciones generales:
ACTIVIDAD DE APRENDIZAJE
a) Trazar un diagrama de dispersin del conjunto de datos proporcionados
en la siguiente tabla:
x
12
11
10 11
13 12 14
10
10
10
11
b) Sera justificado utilizar las tcnicas de regresin lineal con estos datos
para encontrar la lnea de mejor ajuste? Explicar la respuesta.
37
2.2 SUPUESTOS
El anlisis de regresin ms sencillo para el caso de dos variables, tambin se
le conoce como modelo de regresin simple, modelo de regresin bivariada o
como modelo de regresin de dos variables. Este modelo no es de uso amplio
en la econometra aplicada, pero sirve para ilustrar las ideas bsicas del mismo.
El anlisis de regresin simple permite estimar o predecir el valor medio
o promedio (poblacional) de la variable dependiente y con base en los valores
fijos o conocidos de la variable explicativa x. Una ecuacin simple que relacione
a Y con X y que dispone de n observaciones es:
Yi = 0 + 1Xi + ui
2.1
38
2.2
2.3
2.4
39
se
suponen normalmente
distribuidos,
y una
media condicional
Media condicional
E(Y|Xi) = 0 + 1 xi
X1
X2
X3
Figura 2.4
Yi = 0 + 1 X i
2.5
Donde:
40
Yi = 0 + 1 X i + e i
2.6
Yi = 0 + 1 X i + u i
2.1
Yi = 0 + 1 X i + e i
2.6
41
Hasta
el
momento,
slo
se
han
considerado
algunas
ideas
ACTIVIDAD DE APRENDIZAJE
En la siguiente tabla se presenta la cotizacin (X) y el rendimiento al
vencimiento Y (%) de 50 bonos, donde la cotizacin se mide en tres niveles: X =
1 (AAA), X = 2 (AA) y X = 3 (A). Cada uno de estos bonos contiene cierto nivel
de riesgo, donde AAA significan bonos de alto riesgo, mientras que AA tienen
un riego intermedio y A es de bajo riesgo.
1
X AAA
AA
Total
8.5
13
18
11.5
14
18
17.5
13
14
Total
15
20
15
50
Yi = 0 + 1 X i + u i
2.1
42
Yi = 0 + 1 X i + e i
2.6
= Yi + e i
2.7
= Yi - 0 - 1 X i
2.8
En este caso ei son los residuos, es decir, las diferencias entre los
valores reales y los estimados de Y. Dados N pares de observaciones de Y y X
se debe de determinar la funcin de regresin muestral de tal modo que est
tan cerca como sea posible del Y real. A partir de esto se adopta el siguiente
criterio ei = ( Yi i), de tal manera que la suma de los residuos resulte ser
tan pequea como sea posible. A partir de este razonamiento se desprende el
diagrama hipottico que se muestra en la figura 2.5.
Y
e5
Yi = 0 + 1Xi
e3
e2
e4
e1
X1
X2
X3
X4
X5
= (Yi - 0 - 1 X i )2
2.9
resulte ser tan pequea como sea posible y en donde ei2 representan los
residuos al cuadrado. Al elevar los residuos ei al cuadrado, se le asigna mayor
peso a los residuos que se encuentran ms alejados de la recta, tal es el caso
de los residuos e1 y e4 que se encuentran en la figura 2.5, es importante
destacar que cuanto ms grandes sean los ei (en valores absolutos), mayor
ser ei2.
Retomando la ecuacin (2.8), se tienen dos parmetros desconocidos
que estimar, por lo que se esperara obtener de esta ecuacin, buenos
estimadores de 0 y 1. Dada una muestra, se eligen como estimadores 0 y
1 , y determinando la media de Y y X se tiene Y y X , respectivamente. De esta
Y = 0 + 1 X
2.10
Y -Y = (X
- X)+ ei
1
y i = 1x i + e i
2.11
Yi = N0 + 1X i
Yi X i = 0 X i + 1X i2
2.12
2.13
xiyi
1 =
xi2
0 = Y - 1X
2.14
2.15
xiyi
1 =
xi2
=
x iYi
X i2 - NX 2
X i y i
=
X i2 - NX 2
2.16
45
2.17
2.1
2.17
46
E (Yi X i ) 0 1 X i
-u3
+u2
-u1
X1
X2
X3
5.
Hay
independencia
no
autocorrelacin
entre
las
perturbaciones (u).
47
cov(ui ,u j ) = E( ui ,u j ) = 0
2.19
cov(ui , X i ) = E( ui , X i ) = 0
2.20
Var(u X) = 2
2.21
48
f(u)
X1
X2
E(Yi|Xi) = 0 + 1 xi
Xi
X
Var(ui X i ) = i2
2.22
49
f(u)
X1
X2
E(Yi|Xi) = 0 + 1 xi
Xi
X
50
Var (1 ) =
xi2
se(1 ) =
xi2
X i2 2
Var (0 ) =
Nxi2
se(0 ) =
2.23
X i2
Nxi2
2.24
2.25
2.26
2 =
ei2
2.27
N-2
2.28
51
ei2 = y i2 -
( x i y i )2
xi2
2.29
ei2
2.30
N-2
= - X 2
xi
2.31
52
53
1 y de 1* .
2.7
o en forma de desviacin
54
y i = y i + e i
2.32
= y i2 + ei2
= 12 xi2 + ei2
2.33
r2 =
y i2
y i2
12 xi2
y i2
x 2
= 12 i2
y i
2.34
r2 =
( x i y i )2
xi2 y i2
2.35
55
Una
cantidad
muy
estrechamente
relacionada
r2,
pero
2.36
r = r2
o a partir de su definicin
xiyi
r=
xi2
n
y i2
n
xi y i
x y
2.37
Yi
Xi
64
20
61
84
X i - X i = xi Yi -Yi = y i xi y i
Yi
ei
ei2
y i2 xi2
X i2
16
36,1634504
64
9,16400574
48,5249664
-4
-12
48
144
16
-8
-15
120
225
34
10
80
64
70
23
-1
-6
36
20,2806238
88
27
12
36
144
56,4031653
56
92
32
16
128
256
72
18
-6
-4
24
16
77
22
-2
608
192
-2
440
886
16,2184275
36
24,7963349
15,9456245
294 4902
608
227,496599
Tabla 2.1.
var(0 ) = 79.0241
var( ) = 0.1289
cov(0 ,1 ) = -3.0952
2 = 37.9162
r 2 = 0.7432
r = 0.8621
se(0 ) = 8.8895
se( ) = 0.3591
1
g de l = 6
2.38
57
Figura
normal (0,
58
importante
mencionar
como
conocimiento
no
as
como
ACTIVIDAD DE APRENDIZAJE
A partir de la informacin proporcionada en la siguiente tabla, aplicar los
conceptos bsicos de la teora economtrica y determinar su anlisis una vez
obtenidos los resultados. La columna Y hace referencia a la tasa salarial, en
tanto que la columna X hace referencia a la tasa de desempleo, los datos son
hipotticos.
Y
1.3
6.2
1.2
7.8
1.4
5.8
1.4
5.7
1.5
1.9
2.6
3.2
2.3
3.6
2.5
3.3
2.7
3.3
2.1
5.6
1.8
6.8
2.2
5.6
59
60
Pr( - 1 + )= 1 -
1
2.39
61
t=
- 1
=
se( )
1
- 1
x 2
i
2.40
Pr(-t / 2 t t / 2 ) =1-
2.41
/2
1 - 1
Pr -t / 2
t / 2 =1 -
se( 1 )
2.42
62
=1-
Pr 1 - t / 2se(1 )
1 1 t / 2se(1 )
2.43
t / 2se( )
1
2.44
2.45
O bien, brevemente
0 t / 2 se(0 )
2.46
0.6178 1 2.3754
2.47
63
1.4966 2.447(0.3591)
es decir,
1.4966 0.8788
2.48
18.3289 0 61.8343
2.49
O utilizando 2.46
40.0816 (2.447)(8.8896)
es decir,
40.0816 21.7527
2.50
64
Este intervalo indica que de cada cien casos de intervalos como 2.49
contendrn el verdadero valor de 0 ; la probabilidad de que este determinado
intervalo fijo incluya el verdadero valor de 0 es 1 o 0.
Corresponde ahora determinar el intervalo de confianza para 2 bajo el
supuesto de normalidad.
2 =(N - 2)
2
2
2.51
Pr 1-2 / 2 2 2/ 2 =1 -
2.52
Pr (N
- 2)
2
2
2
(N
2)
2/ 2
1-2 / 2
=1 -
2.53
0.025
2
=14.4494 , y 0.975
=1.2373 . Estos valores muestran que la probabilidad de
que un valor ji cuadrado exceda de 14.4497 es del 2.5% y que, sea mayor de
1.2373 es de 97.5%. De esta manera, el intervalo entre estos dos valores
corresponde a un intervalo de confianza de 95% para 2 esto se muestra en la
65
c 2 (6 g de l).
15.7443 2 183.8584
2.54
t=
- 1
=
se( )
1
- 1
x 2
i
2.40
1 1*
Pr -t / 2
t / 2 = 1 -
se( 1 )
2.50
2.51
Figura
2.52
t=
1.4966 - 2.7
= -3.35
0.3591
2.53
70
Ho:
H1: hiptesis
Reglas de
hiptesis
hiptesis
alterna
decisin: rechazar
nula
la Ho
De dos colas
1 = 1*
1 1*
t / 2
Cola derecha
1 1*
1*
t ,
Cola izquierda
1 1*
1*
t , g de l
, g de l
g de l
Tabla 2.2
2 =(N - 2)
2
2
2.51
12 xi2
ei2 ( N 2)
2 x2
1 2 i
2.54
72
H0 : 1 = 0 . Hay que
ACTIVIDAD DE APRENDIZAJE
De acuerdo con el ejercicio que realiz en la actividad de la sesin 2.3, tasa
salarial-tasa de desempleo, determinar las pruebas de significancia t, ji
cuadrada
H1 : 1
1*
la
distribucin
F.
Asimismo,
postular
H0 : 1 1* 0.1
2.5 PREDICCIN
En la mayora de los casos, si la relacin est bien especificada, no se podr
obtener informacin suplementaria sobre el modelo, de modo que slo se debe
conformar con un conjunto de estimaciones de los parmetros poco fiables. No
obstante, la informacin estimada sigue siendo satisfactoria para propsitos de
prediccin. La prediccin puede ser individual o media.
Con base en los datos muestrales de la tabla 2.1 se obtiene de la
regresin muestral.
Yi = 40.0816 +1.4966X i
2.38
73
Y0 = 0 + 1 X0
= 40.0816 +1.4966(10)
= 55.0476
2.55
1 (X - X)2
var(Y0 ) = 2 + 0 2
xi
N
2.56
t=
Y0 (0 + 1 X 0 )
se(Y )
2.57
2.58
74
1 (10 - 24)2
var(Y0 ) = 37.9162 +
294
8
= 30.0169
se(Y0 ) = 5.4788
As,
el
intervalo
de
confianza
de
95%
para
el
verdadero
es decir,
41.6409 E(Y
X0 = 10) 68.4542
2.59
75
1 (X - X)2
var(Y0 ) = 2 1+ + 0 2
xi
N
2.60
34.6455 E(Y
X0 = 10) 75.4497
2.61
r 2 = 0.7432
(8.8895)
(0.3591)
g de l = 6
t = (4.5088)
(4.1674)
F1,6 =17.37
2.62
76
ACTIVIDAD DE APRENDIZAJE
De acuerdo con la informacin proporcionada en la tabla, de la actividad de
aprendizaje de la sesin 2.3, efectuar la prediccin individual y media. Asimismo
efectuar un informe de los resultados obtenidos del anlisis de regresin.
77
AUTOEVALUACIN
Con base en los datos hipotticos que se presentan en la siguiente tabla,
efectuar los clculos de los estimadores y determinar la lnea de regresin
estimada. Asimismo, establecer los intervalos de confianza para 0 , 1 y 2 .
Calcular la prueba t, ji-cuadrada y la distribucin F con un nivel de significancia
del 5%.
Yi X i
2.8
21
3.4
24
26
3.5
27
3.6
29
25
2.7
25
3.7
30
X i - X i = xi Yi -Yi = y i xi y i y i2 xi2
X i2 Yi ei
ei2
Respuesta
Yi X i
X i - X i = xi Yi -Yi = y i
-0,4125
xi y i
xi2 X i2
y i2
Yi
ei
ei2
2.8
21
-4,875
3.4
24
-1,875
3,515625
26
0,125
0,015625
3.5
27
1,125
0,2875
0,3234375 0,08265625
1,265625
0,0507487
3.6
29
3,125
0,3875
1,2109375 0,15015625
9,765625
25
-0,875
-0,2125
0,1859375 0,04515625
0,765625
2.7
25
-0,875
-0,5125
0,4484375 0,26265625
0,765625
3.7
30
4,125
0,4875
0 = 0.5681
= 0.1022
1
1,02875
56,875 5413
var(0 ) = 0.8619
var( ) = 0.0013
1
25,7
0,0043473
0,43472527
se(0 ) = 0.9284
se( ) = 0.3569
1
78
cov(0 ,1 ) = -0.0329
2 = 0.7245
g de l = 6
r 2 = 0.5774
r = 0.7599
Yi = 0.5681+ 0.1022X i
79
UNIDAD 3
HETEROCEDASTICIDAD
OBJETIVO
El Estudiante distinguir
cules
son algunas de
las
causas de
la
TEMARIO
3.1 CAUSAS DE LA HETEROCEDASTICIDAD
3.2 ESTIMACIN DE MCO CON HETEROCESASTICIDAD
3.3 MTODOS DE CORRECCIN
80
MAPA CONCEPTUAL
3. Heterocedasticidad
3.3 Mtodos de
correccin
3.1 Causas de la
heterocedasticidad
3.2 Estimacin de
MCO con
heterocedasticidad
81
INTRODUCCIN
El modelo clsico de regresin lineal es en el que los trminos de perturbacin
ui tienen todos la misma varianza. Si no se cumple este supuesto, se presenta
el fenmeno de heterocedasticidad.
En el apartado 3.1 se analizan algunas de las causas de la
heterocedasticidad en el modelo de mnimos cuadrados ordinarios, los cuales
en el modelo original muestran varianzas constantes.
Bajo los estimadores originales del modelo de MCO se hace una
transformacin del modelo en presencia de heterocedasticidad, en la que se
aplica el mtodo de mnimos cuadrados generalizados que es equivalente al
mtodo de cuadrados ponderados, a los cuales se les considera que son MELI.
Por ltimo, para la deteccin y correccin de la heterocedasticidad se
verifican dos mtodos, informal y formal, el grfico y el de Goldfeld-Quandt.
82
sta
quedar
parcialmente
recogida
en
el
proponer
para
este
modelo
perturbaciones
perturbaciones
pueden
ser
gustos,
caractersticas
84
85
ACTIVIDAD DE APRENDIZAJE
Investigar otras causas de la presencia de heterocedasticidad en los modelos
de regresin lineal, explicar cada una, en hojas blancas para entregar en la
siguiente sesin.
Yi = 0 + 1 X i + ui
Donde el estimador de MCO para 1 es igual a:
xiyi
1 =
xi2
=
x iYi
X i2 - NX 2
X i y i
=
X i2 - NX 2
3.1
86
xi2 i2
Var (1 ) =
2
(xi2 )
3.2
Var (1 ) =
xi2
3.3
Debido a que i2 = 2 para cada i, por lo que las dos frmulas son
idnticas.
Recordando, se tiene que 1 es el mejor estimador lineal insesgado si se
cumplen los supuestos del modelo clsico, incluyendo el de homocedasticidad.
Cuando se elimina el supuesto de homocedasticidad por el supuesto de
heterocedasticidad 1 no contina siendo el mejor estimador y la varianza
mnima no est dada por 3.2, por lo que surge la conveniencia de buscar
estimadores alternativos que verifiquen mejores propiedades que los de MCO.
Este es el caso de los estimadores de mnimos cuadrados generalizados
(MCG). Para ver cmo se logra esto, se contina con el ya conocido modelo de
dos variables.
Yi = 0 + 1 X i + ui
3.4
Yi = 0 X0i + 1 X i + ui
3.5
87
X
Yi
= 0 0i
i
i
Xi
+ 1
ui
+
i
3.6
3.7
var u = E u
*
i
* 2
i
u
=E i
i
1
E ui2 dado i2 se conoce
2
i
1
2 dado E ui2 = i2
2 i
i
3.8
=1
se tiene que es una constante, por lo que la varianza del trmino de
perturbacin transformado ui* es ahora homocedstica, lo que indica que si se
debe de aplicar el mtodo de MCO al modelo transformado 3.6 y as obtener
estimadores que sean MELI. De igual forma los 0* y 1* estimados sern ahora
MELI, a pesar de que los estimadores de MCO 0 y 1 no lo sean.
El procedimiento de transformar las variables originales para que se
satisfagan los supuestos del modelo clsico y de aplicar a continuacin MCO se
conoce como el mtodo de mnimos cuadrados generalizados (MCG), as los
88
Yi * X 0i
= 0
i
i
* Xi
+ 1
ei
+
i
3.9
3.10
o bien
e Y
X
i = i - 0* 0i
i i
i
* X i
- 1
3.11
bajo ciertas tcnicas de clculo que se aplican para obtener 3.11, el estimador
de MCG para 1* es
3.12
var(1* ) =
(w i )
(w i )(w i X i2 ) - (w i X i )2
3.13
89
donde w i =1 / i2 .
3.13
3.14
ACTIVIDAD DE APRENDIZAJE
Mencionar qu otra paquetera hay, adems de la ya mencionada en la
introduccin del libro, y que es la apropiada para la deteccin y estimacin de
90
91
Figura 3.1.
Diagrama de dispersin de los residuos estimados.
ei2 y la variable X.
92
93
F=
SRC2 / m2 - k2
SRC1 / m1 - k1
ACTIVIDAD DE APRENDIZAJE
Investigar otras pruebas de correccin de la heterocedasticidad y explicar cada
una de ellas, Entregar en hojas blancas en la siguiente sesin.
95
AUTOEVALUACIN
I. Relacionar las siguientes columnas e indicar en el parntesis la respuesta que
corresponde a la afirmacin.
1. Si la heterocedasticidad se origina en la combinacin lineal
de todas o de algunas de las variables incluidas, donde el (
ensayo ser insuficiente, no podr ser detectada.
Series
econmicas
) Deteccin de
hetereocedasticidad
) MCP
regresin lineal.
) Mtodo formal
) Prueba
Goldfeld
) Causa de
heterocedasticidad
) Supuesto de
homocedasticidad
) MCG
96
Respuestas
I. Relacionar las siguientes columnas e indicar en el parntesis la respuesta que
corresponde a la afirmacin.
1. Si la heterocedasticidad se origina en la combinacin lineal
de todas o de algunas de las variables incluidas, donde el
ensayo ser insuficiente, no podr ser detectada.
(10)
Series
( 3 ) Deteccin de
( 9 ) MCP
Heterocedasticidad
grfica
) Goldfeld y
( 4 ) Causa de
( 8 ) Supuesto de
( 2 ) MCG
97
UNIDAD 4
AUTOCORRELACIN
OBJETIVO
El estudiante distinguir cules son algunas de las causas de la autocorrelacin
en los modelos de MCO, identificar su deteccin y correccin.
TEMARIO
4.1 CAUSAS DE LA AUTOCORRELACIN
4.2 ESTIMACIN DE MCO CON AUTOCORRELACIN
4.3 MTODOS DE CORRECCIN
98
MAPA CONCEPTUAL
4. Autocorrelacin
4.3 Mtodos de
correccin
4.1 Causas de la
autocorrelacin
4.2 Estimacin de
MCO con
autocorrelacin
99
INTRODUCCIN
En el modelo clsico de regresin lineal en el que los errores y perturbaciones
ui entran en la funcin de regresin poblacional, se encuentran bajo el supuesto
de que son aleatorios o no correlacionados, cuando se viola este supuesto es
porque existe autocorrelacin o correlacin serial.
En la presente Unidad se verifican cules son las causas de la
autocorrelacin y los nombres que recibe sta, de acuerdo con la serie de datos
que se utilicen, pueden ser datos de corte transversal, o los ms usuales que
son las series temporales.
Asimismo, se analiza la estimacin de mnimos cuadrados ordinarios,
pues a pesar de que estos estimadores continan siendo insesgados y
consistentes, dejan de ser eficientes en presencia de autocorrelacin. Puesto
que las perturbaciones no se pueden observar, en la prctica se asume que
pueden ser generadas por algn mecanismo factible, por lo que se utiliza el
esquema autorregresivo de primer orden de Markov, el cul se plantea en la
segunda parte de la Unidad.
Por ltimo, se examina una prueba de contraste para detectar la
autocorrelacin, el estadstico Durbin-Watson, para modelar el comportamiento
de las perturbaciones. Lo cual exige un conjunto de suposiciones para el
modelo lineal clsico y se hace nfasis en sus limitaciones.
100
E( ui ,u j ) = 0
i j
2.19
101
102
Figura 4.1.
Autocorrelacin positiva y negativa.
103
ACTIVIDAD DE APRENDIZAJE
Investigar otras causas de la presencia de autocorrelacin en los modelos de
regresin lineal, explicar cada una, en hojas blancas para entregar en la
siguiente sesin.
las
ideas
bsicas
del
presente
anlisis,
considerando
periodo t, en este caso se utilizan series de tiempo, tema que se tratar con
mayor profundidad en la Unidad 6, pero que, por el momento, sirve para
explicar la autocorrelacin.
Como una aproximacin se puede asumir que las perturbaciones se
generan de la siguiente manera:
ut = ut -1 + t
4.1
var(t ) = 2
cov(t ,t+s ) = 0
s 0
4.2
que el parmetro no sea mayor que uno en valor absoluto garantiza que ut
es estacionario.
El estimador de mnimos cuadrados ordinarios para 1 que generalmente
se ha empleado est dado por:
x y
1 = t 2 t
xt
4.3
x
x
xx
t
t+1
2 t=1
2 t=1 t t+2
N-1 x1 xN
var(1 )AR1 = 2 + 2 N
+
+ ...+ N
N
2
2
xt xt
xt
xt
xt2
t=1
t=1
t=1
4.4
2
var ( 1 ) = 2
xt
4.5
105
(xt - xt -1 )(y t - y t -1 )
1MCG = t=2
4.6
(xt - xt -1 )
t=2
var
MCG
1
2
N
(xt - xt -1 )2
4.7
t=2
ACTIVIDAD DE APRENDIZAJE
Mencionar qu otra paquetera hay, adems de la ya mencionada en la
introduccin del libro, E views, y que es la apropiada para la deteccin y
estimacin de los MCO, en presencia de autocorrelacin. Dar una explicacin a
lo obtenido. Entregar en hojas blancas en la siguiente sesin.
106
t=N
( et - et -1 )2
d = t=2
t=N
4.8
t=1
2
t
107
Estadstico d de Durbin-Watson
Figura 4.2
108
Esto es,
Si
Hiptesis nula
Decisin
0 < d < dL
Rechazar Ho
esquema AR (1)
dL d du
No existe autocorrelacin
No hay decisin
positiva
4 - dL < d < 4
Rechazar Ho
un esquema AR (1)
4 du d 4 dL
No existe autocorrelacin
No hay decisin
negativa
dU < d < 4 - du
No existe autocorrelacin
No rechazar Ho
Tabla 4.1
Reglas de decisin
d=
4.9
e e
2 1 - t 2t -1
et
).
4.10
109
et et -1
et2
4.10
2 1-
4.10
4.11
Si =1 y d
Si = -1 y d
110
contraste
Durbin-Watson
tiene
el
inconveniente
de
no
ser
determinante, es por ello que se deben considerar otros criterios que sean
decisivos al considerar si hay, o no, autocorrelacin. Como se puede apreciar
en la figura 4.1, si el estadstico de prueba, d, cae en la zona de
indeterminacin, no se puede concluir nada y menos an si aparecen
regresores estocticos en el modelo, por lo que el estadstico Durbin-Watson
presenta sesgo hacia el 2.
ACTIVIDAD DE APRENDIZAJE
Investigar otras pruebas de correccin de la autocorrelacin y explicar cada una
de ellas. Entregar en hojas blancas en la siguiente sesin.
111
AUTOEVALUACIN
I. Relacionar las siguientes columnas e indicar en el parntesis la respuesta que
corresponde a la afirmacin.
1. Su efecto es que invalida uno de los supuestos que
fundamentan el procedimiento de mnimos cuadrados (
ordinarios.
) Autocorrelacin
2. Cuando = 0 y d
2 indica
) Causa de correlacin
) Autocorrelacin
) Durbin-Watson
( et - et -1 )2
) d = t=2
t=N
et2
t=1
) Correlacin nula
) Correlacin espacial
) Autocorrelacin
9.
Se
presenta
cuando
los
residuos
) =
) var ( 1 ) =
son
et et -1
et2
2
xt2
112
Respuestas
I. Relacionar las siguientes columnas e indicar en el parntesis la respuesta que
corresponde a la afirmacin.
1. Su efecto es que invalida uno de los supuestos que
fundamentan el procedimiento de mnimos cuadrados ( 3 ) Autocorrelacin
ordinarios.
2. Cuando = 0 y d
2 indica
( 8 ) Causa de correlacin
( 1 ) Autocorrelacin
( et - et -1 )2
t=N
t=1
et2
) Correlacin nula
Se
presenta
cuando
los
residuos
son
) =
et et -1
et2
( 10 ) var ( 1 ) =
2
xt2
113
UNIDAD 5
TEMARIO
5.1 VARIABLES CUALITATIVAS
5.2 APLICACIN DE LAS VARIABLES CUALITATIVAS
114
MAPA CONCEPTUAL
5. Variables artificiales o
cualitativas
115
INTRODUCCIN
En un modelo de regresin lineal se introducen variables cuantitativas, de las
cuales se puede obtener informacin de alguna base de datos, de esta manera,
se tienen datos acerca de la variable dependiente e independiente.
En la presente Unidad se puede ver cmo la variable dependiente no
slo se encuentra influenciada por una variable cuantitativa, sino que tambin
est determinada por variables cualitativas. Esta variable cualitativa, llamada
tambin variable artificial, indica la presencia o ausencia de una cualidad o
atributo, por lo que adoptan valores cuantitativos, que pueden ser 0 o 1.
En la segunda sesin se analiza la aplicacin de un modelo en el que
slo se incluyen variables artificiales, en las variables explicativas, y que recibe
el nombre de ANOVA. De igual modo, se verifica un modelo en que las
variables explicativas se conforman tanto de variables cualitativas y
cuantitativas, llamado ANCOVA.
Por ltimo, se puede verificar que al dividir un modelo en diferentes
subgrupos se puede obtener una serie de regresiones que pueden mostrar
diferentes tendencias, mismas que se reflejan en la interseccin y en sus
pendientes.
116
117
la variable sexo incluye dos posibilidades, hombre y mujer, por lo que se tiene
que atribuir un valor cuantitativo a cada uno de estos dos casos, de manera que
cuando se trate de un trabajador hombre la variable ficticia tome un valor y
cuando se determine un trabajador mujer se le asigne un valor diferente.
Otro ejemplo puede ser si el nivel educativo alcanzado por un trabajador,
si tiene algn efecto sobre el salario, distinguindose los casos desde primaria o
menos, secundaria, preparatoria, universidad o postgrado. Siendo cada uno de
estos casos identificados de manera cuantitativa.
Los valores numricos que se pueden atribuir son completamente
arbitrarios y no tienen ms efecto que establecer un cdigo que permita
distinguir numricamente cada caso de los dems. As, la variable dummy se
define sin ms que atribuir un nmero diferente a cada uno de los casos
posibles en el factor que se considere.
Las variables cualitativas son construidas artificialmente y, generalmente,
indican la presencia o ausencia de una cualidad o atributo, una manera de
cuantificar tales atributos consiste en asignarle valores de 1 o 0, donde 0 indica
la ausencia de un atributo y 1 la presencia de ese atributo. Por ejemplo, el sexo
de una persona, mujer puede ser 1, y del hombre 0; qu persona tiene estudios
profesionales se indica con 1, o que no cuenta con estudios profesionales, con
0, y as sucesivamente.
El hecho de que se utilice 0 y 1 es porque son valores arbitrarios, igual
puede ser cualquier otro valor, slo que en la captura de informacin cualitativa,
de un modelo de regresin, el 0 y el 1 lleva a que los parmetros tengan
interpretaciones naturales.
Las variables ficticias pueden incluirse tanto en modelos temporales
como en modelos de corte transversal. Los paquetes computacionales realizan
la transformacin de las variables categricas en las variables dummy
necesarias automticamente, y no se requiere efectuar todo el proceso
manualmente, nicamente debe identificarse, en el programa computacional
que se utilice, cul es el nombre de las variables que requieren este tipo de
transformacin.
118
ACTIVIDAD DE APRENDIZAJE
Plantear de forma terica un modelo econmetrico y determinar en l las
variables cualitativas y de qu manera afectan al modelo inicial, en el cual
determine variables cualitativas, especificando por qu es 0 y por qu 1, e
indicar de qu manera pueden afectar al modelo. Hacer un anlisis de por lo
menos una cuartilla. Entregar en hojas blancas en la siguiente sesin.
Se debe plantear un modelo, el cual contiene variables que son
medibles, por ejemplo, con ingreso y consumo a partir de estas variables, se
determinan las cualitativas que pueden ser profesionista o no profesionista.
Yi = + Di + ui
5.1
119
Di = 1 si el ingeniero es hombre
= 0 si el ingeniero es mujer
La expresin 5.1 es similar a los modelos de regresin en dos variables,
excepto porque en lugar de tener X, ahora tiene a D que es la variable
dicotmica (la literal D identificar en adelante a una variable dicotmica).
La expresin 5.1 permite averiguar si el sexo tiene alguna incidencia
sobre el salario de los ingenieros, manteniendo contante otras variables como
edad, aos de experiencia o grados universitarios alcanzados. Cmo se
interpreta esta expresin?, mide el valor medio de la variable dependiente de
la categora base o de referencia, es decir, para la que la variable dummy
asume el valor 0; mide la diferencia del punto de corte entre las dos
categoras y se le llama coeficiente del punto de corte diferencial. Suponiendo
que las perturbaciones satisfacen los supuestos del modelo clsico de regresin
lineal, a partir de la 5.1 se obtiene:
E(Yi Di = 0) =
E(Yi Di =1) = +
5.2
Yi = 1 + 2 Di + X i + ui
5.3
X i = aos de experiencia
Di = 1 si es hombre
= 0 si no lo es
Este modelo contiene una variable cuantitativa que son los aos
de experiencia, y una variable cualitativa que es el sexo, la cual posee
dos niveles, hombre o mujer.
Por tanto, el salario promedio de un ingeniero mujer es
E(Yi X i ,Di = 0) =1 + X i
5.4
5.5
diferente del salario promedio del ingeniero mujer (en 2 ), pero la tasa
de cambio en el salario anual promedio por aos de experiencia es la
misma para ambos sexos. Esto se puede verificar en la siguiente figura
5.1.
Figura 5.1
Salario anual y aos de experiencia de los ingenieros.
122
Yi = 1 + 2 D2i + 3 D3i + X i + ui
5.6
123
X i = ingreso anual
D2 = 1 si se ha culminado la educacin preparatoria
= 0 los dems casos
E(Yi D2 = 0, D3 = 0, X i ) =1 + X i
E(Yi D2 =1, D3 = 0, X i ) =(1 + 2 )+ X i
5.7
5.8
5.9
124
Figura 5.2
Gastos en educacin en relacin a los ingresos para tres niveles de educacin.
125
Yi = 1 + 2 D2i + 3 D3i + X i + ui
5.10
X i = aos de experiencia
D2 = 1 si es hombre
= 0 los dems casos
D3 = 1 si es blanco
= 0 los dems casos
Yi = 1 + 2 D2i + 3 D3i + X i + ui
5.11
5.12
126
5.13
5.14
127
128
Figura 5.3
Posibles regresiones entre consumo-ingreso
ACTIVIDAD DE APRENDIZAJE
Plantear dos modelos, el primer modelo que sea de tipo ANOVA, y el segundo
de forma ANCOVA. Dar una explicacin terica de cada uno de los modelos
establecidos. Entregar en hojas blancas en la siguiente sesin.
129
AUTOEVALUACIN
I. Relacionar las siguientes columnas e indicar en el parntesis la respuesta que
corresponde a la afirmacin.
1. Los factores cualitativos recogen efectos diferenciales,
qu tipo de forma adoptan.
(
) ANOVA
) Datos binarios
variables.
(
) ANCOVA
) Variable dummy
cualitativos de inters.
(
) Coincidente
) Cuantitativas
perfecta
) Presencia o
ausencia
) Multicolinialidad
) Corte transversal
y temporal.
pendientes.
(
) Dismil
130
Respuestas
I. Relacionar las siguientes columnas e indicar en el parntesis la respuesta que
corresponde a la afirmacin.
1.
Los
factores
cualitativos
recogen
efectos
( 2 ) Cuantitativas
explicativas.
( 10 ) Presencia o ausencia
6. Si en un modelo no se introduce m -1 variables
dicotmicas se puede darse la existencia de
( 4 ) Corte transversal y
temporal.
131
132
UNIDAD 6
SERIES TEMPORALES
OBJETIVO
El estudiante identificar series de tiempo econmicas en un modelo de
regresin y comprender su estimacin mediante un modelo de rezagos
distribuidos. Distinguir las etapas de prediccin de series de tiempo mediante
el modelo ARIMA.
TEMARIO
6.1 MODELO DE REGRESIN CON SERIES DE TIEMPO
6.2 ESTIMACIN
6.3 PREDICCIN
133
MAPA CONCEPTUAL
6. Series temporales
6.3 Prediccin
6.2 Estimacin
134
INTRODUCCIN
Una de las categoras ms importantes de los modelos de regresin lineal es la
estimacin de series de tiempo, las cuales son principalmente aplicables en
series econmicas.
En la presente Unidad se analizar qu es una serie de tiempo y cul es
su comportamiento o tendencia de forma grfica. En el anlisis de regresin
que contiene series de tiempo, no slo se incluye valores actuales sino tambin
valores rezagados (pasados).
Se verifica la estimacin de mnimos cuadrados ordinarios mediante el
mtodo de rezagos distribuidos, esto se produce con la aplicacin de
expresiones matemticas.
Por ltimo, se estudia el modelo de prediccin para series de tiempo
estacionarias desarrollado por Box y Jenkins, tal modelo de regresin con
variables independientes es denominado ARIMA.
135
Figura 6.1
Tendencia
Figura 6.2
Variaciones cclicas
Figura 6.3
Irregulares
137
AO
INFLACIN
1999
12,32
2000
8,96
2001
4,4
2002
5,7
2003
3,98
2004
5,19
2005
3,33
2006
4,05
2007
3,76
2008
6,53
2009
3,57
2010
4,4
Tabla 6.1
Tabla de porcentaje de inflacin en Mxico 1999-2010
14
Inflacin
12
10
8
6
4
2
0
1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Ao
Figura 6.4
Porcentaje de inflacin anual desde 1999 hasta 2010
138
ACTIVIDAD DE APRENDIZAJE
Graficar una serie de tiempo respecto al comportamiento del Producto Nacional
Bruto desde 1989 al 2010 a precios constantes, hacer un anlisis de su
139
6.2 ESTIMACIN
Los modelos de series de tiempo son tiles en el anlisis emprico, y se estiman
con facilidad mediante mnimos cuadrados ordinarios, son diversos los mtodos
que se pueden emplear para la estimacin de series de tiempo, de manera
particular se atiende en la siguiente sesin el de rezagos distribuidos.
Un modelo de rezagos distribuidos se representa mediante la siguiente
expresin:
Yt = + 0 X t + 1 X t -1 + 2 X t - 2 + ut
6.1
Yt = + X t + Yt -1 + ut
6.2
Yt = + 0 X t + 1 X t -1 + 2 X t - 2 + ...+ k X t -k ut
6.3
i = 0 + 1 + 2 + ...+ k =
6.4
i =0
i* =
= i
i
6.5
Yt = + 0 Xt + 1 Xt -1 + 2 Xt -2 + ...+ ut
6.6
141
k = 0 k
donde es: 0
k = 0,1,...
6.7
1
k = 0
k=0
1 -
6.8
142
6.9
6.10
Yt -1 = + 0 Xt -1 + 0 2 Xt -2 + 0 3 Xt -3 + ...+ ut -1
6.11
6.12
Yt = (1- )+ 0 Xt + Yt -1 +v t
6.13
143
ACTIVIDAD DE APRENDIZAJE
Investigar otros procesos estocsticos y realizar un cuadro en que se diferencie
cada uno. Entregar en hojas blancas en la siguiente clase.
6.3 PREDICCIN
La informacin presente y pasada permite hacer una estimacin acerca del
futuro, a esto se le llama prediccin. En el campo de la economa es
ampliamente utilizada, mediante series temporales, pues permite planificar o
prever el comportamiento de una variable explicativa.
Una categora de mtodos de prediccin en los valores previamente
observados en la serie de tiempo, y que se ocupan como variables
independientes en los modelos de regresin, es el modelo autorregresivo
integrado de promedios mvil (ARIMA). El mtodo ms amplio para el uso de
esta categora fue desarrollado por Box y Jenkins, llamndosele mtodo de
Box-Jenkins.
As, el modelo general de series de tiempo que describe el componente
estocstico se modela de la siguiente manera:
AR que significa autorregresivo, queda definido como sigue
Yt - = 1 Yt -1 - + ut
6.14
donde es la media de Y.
Yt tiene un proceso estocstico autorregresivo de primer orden AR(1), es
decir, el valor de Y en el tiempo t depende de su valor en el periodo anterior y
un trmino aleatorio ( 1 ), este proceso se presenta debido a que ut es el
trmino de perturbacin no correlacionado con media cero y varianza constante.
144
Yt - = 1 Yt -1 - + 2 Yt -2 - + ut
6.15
Yt - = 1 Yt -1 - + 2 Yt -2 - + ...+ p Yt -p - + ut
6.16
Yt = + 0ut + 1ut -1
6.17
6.18
6.19
6.20
elegir
es
aquel
cuya
funcin
de
autocorrelacin
terica
147
ACTIVIDAD DE APRENDIZAJE
Consultar y describir otros enfoques de prediccin econmica basados en las
series de tiempo, determinar las ventajas y desventajas que presentan.
Entregar en hojas blancas la siguiente sesin.
148
AUTOEVALUACIN
I. Relacionar las siguientes columnas e indicar en el parntesis la respuesta
que corresponde a la afirmacin.
) Modelo de series de
tiempo
parcial
(FACP),
as
como
Representan
el
nmero
irregulares
los
3.
de
) Fluctuaciones
trminos (
) p, q
) Mnimos cuadrados
) Estocstico estacionario
Respuestas
I. Relacionar las siguientes columnas e indicar en el parntesis la respuesta
que corresponde a la afirmacin.
1. Los modelos de series de tiempo han sido de ( 2 ) Modelo de series de
utilidad en el anlisis emprico y se estiman con
tiempo
parcial
(FACP),
as
como
los
3.
Representan
el
nmero
irregulares
( 3 ) p, q
de
estacionario
150
3. Cuando en una serie de tiempo hay ausencia de cualquier tipo de variabilidad hay
presencia de ____ Estacionariedad_____
4. El ________anlisis de serie de tiempo_____consiste en el examen del patrn
histrico generado por el evento en observacin con la esperanza.
5. Se le llama estimacin ___ ad hoc_____a aquella que supone que la variable
explicativa Xt es no estocstica, as como Xt-1, Xt-2 y as sucesivamente.
151
BIBLIOGRAFA
Gallastegui, Fernndez, Alonso, Econometra, Mxico, Pearson, 2005.
Goldberger, Arthur S., Econometric Theory, John Wiley & Sons, Inc., New York,
1964.
Theil, H., Principles of Econometrics, John Wiley & Sons, Inc., New York, 1971.
Tintner, Gerhard, Econometrics, John Wiley & Sons, Inc., New York, 1965.
152
GLOSARIO
Anlisis de regresin: Tipo de anlisis utilizado para describir la estimacin y
la inferencia en el modelo de regresin.
Anlisis emprico: Estudio que utiliza datos en un anlisis economtrico formal
para probar una teora, estimar una relacin o determinar la eficiencia de un
proyecto establecido.
Anlisis residual: Anlisis que estudia el signo y magnitud de los residuos de
determinadas observaciones despus de estimar el modelo de regresin.
Aleatorio: Se da en un experimento repetido indefinidamente presenta siempre
resultados totalmente impredecibles.
Asimetra: Es cuando los datos pierden su simetra respecto a la media.
Autorregresivo: Una variable o conjunto de variables se explican al menos en
parte, en funcin del pasado de la misma variable.
Ceteris paribus: Todos los dems factores relevantes se mantienen fijos.
Coeficiente de correlacin: Es el cociente de dividir la covarianza de una
distribucin
bidimensional
entre
las
desviaciones
tpicas
de
respectivamente.
Coeficiente de determinacin: Es el cociente entre la varianza explicada y la
total en un ajuste a la recta de regresin.
Covarianza: Es la varianza conjunta en una distribucin en la que se
encuentran dos variables X, Y. Es el cociente del producto de la diferencia de la
media de X con los Xi, con la media de Y y Yi, entre el nmero de
observaciones X-Y.
Correlacin: Es la relacin que existe entre dos variables X, Y. Su valor est
entre -1 y 1. Al observase un valor negativo significa que mientras una variable
crece, la otra tiende a decrecer, representa que hay una relacin inversa. Si el
valor es positivo hay una relacin directa entre las variable, es decir, ambas (X,
Y) van en la misma direccin.
Dato: Es el valor cuantitativo o cualitativo que representa un atributo o medida
en la poblacin.
153
154
155
157