Documente Academic
Documente Profesional
Documente Cultură
Suponga que el consumo (Y) y el ingreso (X) para los últimos 4 años (en millones de pesos) son los
siguientes:
Se desea probar la hipótesis de que el consumo en México depende de las variaciones que
experimenta el ingreso, los pasos son los siguientes:
∑ Y = na + b ∑ X
∑ XY = a ∑ X + b ∑ X 2
aˆ =
∑ X 2∑ Y − ∑ X∑ XY
= a = Y − bX
n∑ X 2 − (∑ X )
2
“y”
n∑ XY − ∑ X∑ Y
bˆ =
n∑ X − (∑ X )
2 2
Observaciones: A menudo para simplificar operaciones se desvían los valores de x e y con respecto a
X e Y para obtener b ; y las literales xi e yi se usan para:
xi = X i − X e yi = Yi − Y
b =
∑ xy i i
=
11
= 11
.
∑ x 2
i 10
= 5 − (11
a = Y − bX . )7 = − 2.7
Obsérvese que b tiene signo positivo, lo cual es bueno por que corrobora la teoría económica de que
a medida que aumenta el ingreso (X) también aumenta el consumo (Y).
Var.a = σ 2 ∑ X i
2
n∑ x
u 2
donde σ u
i
es la varianza residual
1
Var .b = σ 2
∑ xi2
u
S = σ =
2 2 ∑ ei2
u
n− k
n = número de observaciones
k = número de parámetros estimados
S =2 ∑ ei2∑ X i
2
k n∑ x
a
n− 2
i
S =2 ∑ ei2
1
b
n − k ∑ xi2
Derivado de lo anterior podemos decir en general que S aˆ y Sbˆ son los errores estándar de los
estimadores. Como U i tiene distribución normal, Yi , a , b también se distribuyen normalmente, y
como la muestra n = 4 es decir, menor que 30, usamos t con n - k grados de libertad para probar la
hipótesis y construir intervalos de confianza para a y b . Para ello, a partir de los datos de la tabla
anterior, se requiere hacer adicionalmente los siguientes cálculos.
Puesto que:
yˆ i = aˆ + bˆX i
.sustituimos
yˆ1 = − 2.7 + 1.1(5) = 2.8
yˆ 2 = − 2.7 + 1.1(6) = 3.9
yˆ 3 = − 2.7 + 1.1(8) = 6.1
yˆ 4 = − 2.7 + 1.1(9) = 7.2
Gráficamente:
8 yˆ = − 2.7 + 1.1X i
y
7
6
5
4
Consumo
3
2
1
0
-1 0 2 4 6 8 10
-2 x
-3
Ingreso
S aˆ2 =
∑ ei2 ∑ X i
2
=
1.9 206 391.4
= = 4.8925
n− k n∑ x i
2
(4 − 2) 4(10) 80
S aˆ = 2.2118
Calculamos:
S =2 ∑ ei2
=
1.9
=
1.9
= 0.0950
bˆ
( n − k )∑ x 2
i (4 − 2)(10) 20
Sbˆ = 0.3082
Así, las hipótesis nulas ( Ho) y alternativas ( Ha) se plantean de la siguiente manera:
Ho: a = 0 Ho: b = 0
Ha: a ≠ 0 Ha: b ≠ 0
aˆ − a − 2.7 − 0 bˆ − b 1.1 − 0
ta = = = − 1.2207 tb = = = 3.5691
S aˆ 2.2118 Sbˆ 0.3082
real debería ser significativamente diferente de cero y por ser la ordenada al origen indicaría el
consumo mínimo que se realiza, independientemente de las variaciones en X, ingreso.
Gráficamente:
H 0 : b=0
Ha=b ≠0
Aceptamos
RechazamosHH
a o Aceptamos Ha
Rechazamos Ho Rechazamos Ho
-2.920 b +2.920 tα
Usando Eviews y si consideramos que SER01 es Y y que SER02 es X, los resultados son:
Observamos que los valores de los parámetros (coeficientes) como los de sus errores estándar y las
de sus t´s correspondientes son los mismos que obtuvimos manualmente. Aquí es conveniente decir
que al usar Eviews, para probar hipótesis el programa por default usa un nivel de significación
( alfa) igual a 5%, que es la probabilidad de cometer error tipo I: rechazar una hipótesis que es cierta.
Lo anterior, al usar E-views, indicaría en la última columna del cuadro que aparece en la pantalla del
monitor, que Prob debería ser igual a cero si rechazaramos Ho o cuando mucho ser igual a
0.05; sin embargo vemos que Prob toma el valor de 0.0703, es decir, 7.03%, lo cual indica que
aceptamos Ho, en otras palabras, rechazamos Ha y decimos que b no es significativamente diferente
de cero X y concluimos diciendo que con un nivel de significación ( alfa) del 5% y con 2 grados de
libertad que X no explica a Y.
Comentarios: Estos últimos resultados indican que no se corrobora la teoría económica de que el
ingreso determina el consumo. ¿ Podemos aceptar lo anterior ? en términos económicos no es
posible aceptarlo y se sugiere acudir a otra opción: aumentar el tamaño de la muestra ( cuatro datos
son pocos) y usar datos reales y no hipotéticos como éstos que sólo sirvieron para ilustrar el método
y algoritmo correspondiente para probar la hipótesis.
Ahora bien, regresando a los primeros resultados en que si aceptamos Ha con un nivel de
significación de 10% y 2 grados de libertad para tα , con el fin de continuar exponiendo el
método y algoritmo, nos preguntamos ¿En qué magnitud, qué porcentaje de los cambios en Y son
explicados por los cambios en la variable X? La respuesta se obtiene calculando R2 que es el
coeficiente de determinación y cuya formula es:
R = 2 ∑ yi2
= 1−
∑ ei2
∑ yi2 ∑ yi2
Donde: ∑ yi2 = ∑ (Y i − Yi ) 2
En nuestro ejemplo: R = 1 −
2 ∑ ei2
= 1−
1.9
= 1 − 0.1357 ≅ 0.8642 ≅ 86.42%
∑ y 2
i 14
En este sentido el coeficiente de correlación r = R 2 = .8642 = 0.9296 o 92.96% indica que existe
una alta correlación de carácter positivo entre X e Y; el cual es positivo por que b es positivo.
dY
El estimador b = = 11
. es la pendiente de la línea de regresión estimada que mide la
dX
proporción marginal al consumo PMC o el cambio en el consumo que produce el cambio en
una unidad adicional en el ingreso disponible.
Derivado de b̂ se puede obtener la elasticidad ingreso del consumo E que mide el cambio porcentual
en el consumo como resultado de un cambio porcentual en el ingreso disponible y cuya formula es:
X 7
E = bˆ = 1.1 = 1.54
Y 5
b = b ± t α Sb
donde:
b = parámetro de la población. Con dos grados de libertad y con: ∝ = 5% tenemos ξ = nivel de
confianza = 95% se busca el valor de t∝ en el apéndice IV y se halla que t∝ = ± 4.303
Luego el intervalo de confianza al 95% para b esta dado por:
b = bˆ ± tα Sbˆ
= 1.1 ± (4.303)(0.3082) = 1.1 ± 1.3261
De tal manera que b se halla entre -0.2261 y 2.4261 por lo que -.0.2261< b< 2.4261 con una
confianza o seguridad del 95% y una probabilidad de 5% de que no esté en dicho intervalo.
Recuérdese que las ecuaciones para las relaciones verdaderas (en la población) y estimadas (con la
muestra) entre X e Y son respectivamente:
Yi = a + bX i + µ i
“y”
+ e
y i = a + bX i i
Las ecuaciones para las regresiones verdadera (población) y la estimada (con la muestra) entre X e Y
son respectivamente:
E (Yi ) = a + bX i
“y”
y = a + bX i
y = − 2.71 + 11
. Xi
2
R = 0.8642
r = 0.9296
Supóngase ahora que el Consumo (Y) depende del ingreso y de la inversión (Z), tal que:
Y = f ( X , Z )
∑ yi = na + b ∑ xi + c ∑ zi
∑ yi xi = a ∑ xi + b ∑ xi2 + c ∑ xi zi
∑ yi zi = a ∑ zi + b ∑ xi zi + c ∑ zi2
( ∑ xi yi )( ∑ zi2 ) − ( ∑ zi yi )( ∑ xi zi )
b=
( ∑ xi2 )( ∑ zi2 ) − ( ∑ xi zi ) 2
( ∑ zi yi )( ∑ xi2 ) − ( ∑ xi i yi )( ∑ xi zi )
c =
( ∑ xi2 )( ∑ zi2 ) − ( ∑ xi zi ) 2
− cZ
a = Y − bX i
i
Y = 5; X = 7; Z = 2
yi = Yi − Y ; xi = X i − X ; zi = Zi − Z
Sustituyendo:
(11)(2) − ( 2)(3) 22 + 6 16
bˆ = = = = 1.4545
(10)(2) − (3) 2 20 − 9 11
(2)(10) − (11)(3) 20 − 33 − 13
cˆ = = = = − 1.1818
(10)(2) − (3) 2 20 − 9 11
aˆ = (5) − (1.4545)(7) − [ − 1.1818(2)] = 5 − 10.1815 + 2.3636 = − 2.8182
Año Y X Z y i e e2 y i2
1 3 5 1 3.2727 -0.2727 0.0744 4
2 4 6 2 3.5455 0.4545 0.2066 1
3 5 8 3 5.2727 -0.2727 0.0744 0
4 8 9 2 7.9091 0.0909 0.0083 9
n=4 20 28 8 20 0 0.3636 14
Varbˆ = σ 2 ∑ zi2
∑ xi2 ∑ zi2 − (∑ xi zi ) 2
u
Varcˆ = σ 2 ∑ xi2
∑ xi2 ∑ zi2 − (∑ xi zi ) 2
u
S = σ =
2 2 ∑ ei2
u
n− k
donde:
n = número de años
k = número de estimaciones, de parámetros estimados
S =
2 ∑ ei2 ∑ zi2
; Sb = Sb2
b
n− k ∑x∑
i
2
z − (∑ xi zi )
i
2 2
S =
2 ∑ ei2 ∑ xi2
; Sc = Sc2
∑x∑ z − (∑ xi zi )
c
n− k i
2
i
2 2
donde:
Sustituyendo tenemos:
Planteamos: también:
Ho: b = 0 Ho: c = 0
Ha: b ≠ 0 Ha: c ≠ 0
luego:
bˆ − b cˆ − c
tb = = tc = =
Sbˆ Scˆ
1.4545 − 0 − 1.1818 − 0
= = 5.6595 = = − 2.0556
0.2570 0.5749
Así, ahora buscamos en el Apéndice que trae los valores “teóricos” de t, vemos que
el valor de t ∝ con ∝=5% y un grado de libertad, es t ∝ =± 12.706. Como t b , t c no
exceden t ∝ decimos que b, c no son estadísticamente significativos, es decir, se
rechaza H a y en este caso, se concluye diciendo que se acepta H o , lo que indica que
no hay relación de Y con X e Z.
Gráficamente para b
H 0 : b=0
Ha=b ≠0
Aceptamos Ha Aceptamos Ha
Rechazamos Ho Rechazamos Ho
-12.706 b +12.706 tα
Gráficamente para c
H 0 : c=0
Ha=c ≠0
Aceptamos Ha Aceptamos Ha
Rechazamos Ho Rechazamos Ho
-12.706 c +12.706 tα
Por otra parte, también se usa la ESTADÍSTICA JARQUE-BERA (JB) para probar el
comportamiento normal de la hipótesis o supuestos establecidos cuando usamos el método de
mínimos cuadrados ordinarios para estimar los valores poblacionales, basados en los momentos de
una variable (Sánchez Barajas. 2005:98). El algoritmo para su cálculo involucra a la asimetría con
respecto a la media aritmética y a la kurtosis, señalándose que para que el modelo de regresión sea
normal se requiere que la asimetría sea igual a cero y que la kurtosis sea igual a 3. Ello significa que
la prueba de JB es una prueba conjunta de los coeficientes de asimetría (cero) y de kurtosis ( 3). Se
espera que el valor estadístico JB sea igual a cero y si está cercano a cero se espera encontrar un
comportamiento normal de los residuos de la variable endógena. Una vez obtenido el coeficiente
JB se compara su valor con el histograma de los residuos ( en el eje de las x´s) derivados del
número de observaciones ( en el eje de las y´s) para fundamentar gráficamente la congruencia de su
valor con los valores de los coeficientes de asimetría y de kurtosis. Su aplicación es adecuada en
muestras grandes para demostrar la asintoticidad de los residuos ( obtenidos con MCO) de la
variable aleatoria( variable dependiente) .
n 2 ( K − 3)
2
JB = S +
6 4
Donde:
n = Tamaño de la muestra.
S = Coeficiente de asimetría.
K = Coeficiente de kúrtosis.
24 ( 2.165576 − 3)
2
( 0.232445) +
2
JB = = 0.912386
6 4
H0= JB=0 Supone que los residuos (e) de la variable aleatoria se distribuyen normalmente
Ha= JB≠ 0 Supone que no hay normalidad en la distribución de los residuos (e) de la variable
aleatoria
Ahora bien, cuando se usa Eviews, si E-views indica que el valor de JB es menor que el valor de χ
2
(chi-cuadrada, estadística con la que se compara por corresponder a la estadística no paramétrica,
pero sobre todo porque estos dos autores demostraron que su estadístico JB, de residuos o término
n 2 ( K − 3)
2
Lo anterior dicho en términos del concepto “probabilidad” que también Eview muestra, es que
cuando la probabilidad de JB es mayor que el nivel de significación, α=5%, se acepta la Ho porque
en ese caso JB es cercano a cero. Dicho en otras palabras, cuando la “probabilidad” es menor que
5%, entonces se acepta Ha porque JB difiere significativamente de cero.
Comentarios: considero que con el enfoque tradicional del método de momentos con respecto a la
media aritmética se detecta con mayor exactitud el comportamiento normal o no normal de la
variable endógena, además de que no tiene la restricción de que la muestra sea grande.
La prueba LM
Es parte de una serie de instrumentos alternativos que podemos usar con Eviews para contrastar las
autocorrelación serial, usando los errores residuales y las variables explicativas, a las que una vez
que se ha calculado la ecuación de regresión, se puede acceder desde la ventana “View”/residual
test / correlogram Q –statistics) y concretamente, está en el test de correlación serial de Breusch-
Godfrey ( Serial Correlation LM test).
Dado que hace mucho más sentido ver el autocorrelograma y la estadística Q posteriormente en
series de tiempo. Ahora nos centraremos en el uso de LM para continuar analizando la bondad del
Modelo, i.e., verificar si es bueno, si está bien estructurado para luego hacer pronósticos.
Referencias: E-views en una serie de tiempo también calcula estadísticas para probar la correlación
serial o autocorrelación, con la prueba LM. La correlación serial o autocorrelación emerge cuando se
viola el supuesto básico del Modelo clásico de Regresión lineal de que las ei. obtenidas en el
cálculo de la ecuación de regresión, de que son aleatorias, independientes o no correlacionadas,
situación que provoca que las pruebas t, F, χ 2 , aplicadas para probar hipótesis no producen
resultados contundentes para tomar decisiones al perderse algunas de las propiedades de los
estimadores; por ejemplo, cuando se identifica que hay autocorrelación serial, los estimadores MCO
dejan de ser eficientes, aun cuando continúan distribuyéndose asintótica y normalmente, además de
que aun son insesgados y consistentes.
como se verá más adelante, la autocorrelación serial puede emanar en una serie de tiempo de: a).- la
inercia de los términos u observaciones de las series temporales, b).- del sesgo que surge cuando no
se incluye una variable explicativa relevante para la teoría económica en verificación; c).- del uso de
una forma funcional inapropiada; d).- de la transformación inadecuada de datos, etc.
En este contexto diremos que la prueba LM verifica el grado de asociación entre la(s) variable(s)
exógena(s) y el residual rezagado (ei) en ciertos periodos (Pulido, et al: 155), es decir, con esta
prueba los errores residuales del modelo se explican con un modelo auxiliar por sus propios rezagos
o retardos conjuntamente con las variables exógenas del modelo que explica la teoría económica.
Así, si el modelo resulta significativo estadísticamente, se dice que existe autocorrelación serial y
que debe corregirse por las razones arriba señaladas.
Con Eviews partimos de que ya existe la base de datos y de que ya establecimos la teoría
económica, de forma que al ir a Quick/ estímate equation/ ok obtenemos el cuadro que contiene la
ecuación de regresión y que contiene la pestaña “view”/residual test/serial Correlation LM test/
aparece la ventana en que automáticamente nos sugiere 2 como el número de “lags”: retardos a
considerar para hacer la prueba sobre la autocorrelación serial. Al respecto, ese número de retardos o
rezagos se corresponde con el orden más alto de la autocorelación que se pretende identificar, ergo,
1 si es anual, 2 si es semestral, 4 si es trimestral etc.
Así suponiendo el siguiente caso para un modelo anual Eviews propuso en automático el número 2
de lags y aparece la siguiente tabla:
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 09/22/09 Time: 02:18
Presample missing value lagged residuals set to zero.
Comentarios: En la parte superior aparecen sombrados los datos básicos para aceptar o rechazar la
hipótesis nula: la prueba F de nulidad conjunta de todos los coeficientes asociados a los residuos
desplazados ( rezagados o retardados), en concordancia con un contraste de validación global del
modelo (Obs* R-squared), en tanto que en la parte inferior se describe la estimación del modelo
auxiliar utilizado para arribar a la prueba de la hipótesis nula de autocorrelación.
Interpretación: Decimos que con la prueba Breusch-Godfrey Serial Correlation LM test, se rechaza
la hipótesis nula, que dice Ho: no hay autocorrelación de cualquier orden inferior a ρ ( donde
ahora ρ es el número de retardos seleccionados, Pulido et al: 156), siempre y cuando la
“probabilidad” de ocurrencia de estas dos estadísticas sea menor que 5%. Se aceptará la Ha que
dice : si hay autocorrelación, siempre y cuando la probabilidad sea mayor que 5%. Luego como en
ambos estadísticas la probabilidad de que ocurran es mayor que 5%, decimos que existe
autocorrelación serial, lo que se comprueba con el valor 1.86 de la estadística Durbin-Watson ( que
debería ser 2) y por consiguiente debemos eliminarla usando cualesquiera de los procedimientos
arriba señalados.
R2 = 1−
∑ ei2
= 1−
0.3636
= 0.9740
∑ y2
i 14
n− 1
R 2 = 1 − ( 1 − R2 )
n− k
4− 1
R 2 = 1 − (1 − 0.9740) = 1 − 0.078 = 0.9220
4− 3
Ahora bien, cuando un modelo de regresión sólo incluye variables explicativas que
son cualitativas se denominan modelos de análisis de varianza, ANOVA. Así, por
ejemplo, sirven para probar si estadísticamente dos o más promedios difieren
significativamente y por esa razón son una extensión de la prueba t que prueba
dicha diferencia estadística sólo para dos promedios.
Ejemplo: la Empresa “ Arriba Juárez” desea calcular los costos de calefacción (Y)
durante el invierno pasado y verificar si tienen dichos costos relación con la
temperatura (X 1 ), el aislamiento térmico (X 2 ), y la existencia de un “garage” en las
casas (X 3 ). Así, la variable independiente “garage” es cualitativa y se define con 0
cuando las casas no tengan garage y con 1 cuando lo tengan. Para ello toma una
muestra de 20 casas y encuentra que:
Y= 443.21-4.38X1-14.64X2+51.71X3
Donde 443.21=a ; 4.38=b ; 14.64=c ; 51.71=d
Dado que :
Dependent Variable: Y
Method: Least Squares
Date: 09/18/08 Time: 13:50
Sample: 2001 2020
Included observations: 20
Con estas referencias, entonces digamos por ejemplo, que se tienen dos casas
iguales, una junto a la otra, en Ciudad Juárez, una tiene garage y la otra no; ambas
tienen 3 pulgadas de aislamiento térmico y la temperatura media en enero fue de 20
grados farengheit. Para la casa sin garage, X3 se sustituye por 0 en la ecuación de
regresión. Así, el costo estimado de calefacción es de $280.90/mes, ya que
Y= 443.21-3.9628(20)-11.334(3)+51.71(0)= $ 311.69/mes
Para la casa con garaje, X3=1, luego
Y= 443.21-3.9628(20)-11.334(3)+51.71(1)= $ 363.40/mes
Su diferencia es 363.40-311.69= $51.71, luego se estima que el costo de calentar
una casa con garage es $51.71 mayor que el costo de una casa equivalente sin
garage. Pero ¿es significativa estadísticamente esta diferencia?
Ho: d=0 ;
Ha: d ≠ 0
Respuestas:
Con los siguientes datos:
6∑ D 2
a) r ' = 1 −
n(n 2 − 1)
donde
D= diferencia entre rangos de pares correspondientes de las dos variables (en orden
ascendente o descendente, con el rango medio asignado a observaciones del mismo
valor).
n= número de observaciones.
6∑ D 2 6(10.50) 63
r' = 1− = 1− = 1− ≅ 0.94
n(n − 1)
2
10(99) 990
∑ D2 = 10.5
b) La correlación por rangos se usa con datos cualitativos tales como profesión,
educación, sexo, etc. cuando, por la ausencia de valores numéricos, no se puede
encontrar el coeficiente de correlación. La correlación por rangos también se usa
cuando no se tienen disponibles valores precisos para todas o algunas de las
variables (así que, una vez más, no se puede encontrar el coeficiente de
correlación). Aún más, con un gran número de observaciones de valores grandes, r’
se puede hallar como una estimación de r con el fin de evitar cálculos muy
dispendiosos (sin embargo, el fácil acceso a las computadoras ha eliminado esta
razón para usar r’).
donde:
a= 2.30, b=0.86
S a = 7.17, S b =0.05
Preguntas:
1. ¿Cuál es el significado de a y de b?
El estimador a=2.30 es la ordenada al origen y el valor del consumo total cuando el
ingreso disponible es cero. Como a>0 se confirma que siempre habrá un consumo
dY
básico. El estimador b = = 0.86 es la pendiente de la línea de regresión estimada.
dX
Mide la propensión marginal al consumo o el cambio que experimenta el consumo
con el cambio en una unidad adicional en el ingreso. Como 0<b<1 confirma la
teoría del consumo de que las personas incrementan sus gastos de consumo cuando
aumenta el ingreso disponible, pero en menor proporción que este.
X
2. Sabiendo que η = b
Y
Donde:
η = Elasticidad ingreso del consumo
X = 145
Y = 127
Calcule e interprete η
X 145
Tenemos η = b= * 0.86 = 0.98
Y 127
Interpretación: η mide el cambio porcentual en consumo derivado de un cambio
porcentual en el ingreso disponible.
Como se supone que Ui tiene una distribución normal, Yi también tiene una
distribución normal (dado que se supone que Xi es fija). Como resultado a y b
también tienen distribución normal.
Yi Miles de Xi Tasa de
pesos interés
6 9
8 10
8 8
7 7
7 10
12 4
9 5
8 5
9 6
10 8
10 7
11 4
9 9
10 5
11 8
9. Con los datos anteriores probar con un nivel de significación del 5%, la significación
estadística de los parámetros α y β .
10. Hallar e interpretar R2 y R 2
Suponga que la teoría económica establece que la rentabilidad de la inversión (Y) depende de la tasa de interés (X) y de
la inflación (Z), tal que:
Y = f ( X , Z )
Añ o Yi Xi Zi
1 7 9 1
2 8 8 2
3 7 9 3
4 8 7 2
Preguntas:
1.- Obtenga la ecuación de regresión: Y = a + bX i + cZi
2.- Encuentre el valor para cada yi donde i=1,2,3,4:
3.- Encuentre el valor del error residual
4.- Pruebe la hipótesis nula de que la rentabilidad de la inversión depende de la
tasa de interés y de inflación, con un nivel de significación del 5% e interprete los
resultados.
5.-Calcule R, R2, R 2 y junto con t,F, y con el error estándar de estimación interprete sus resultados.
Requisitos para resolver el examen: Traer sus tablas estadísticas, calculadoras y demás
instrumentos que les ayuden a hacerlo correctamente y con eficiencia en el tiempo de dos horas.
Observaciones: la respuesta a cada pregunta vale 20 puntos. Se puede usar la calculadora, las tablas
estadísticas y los formularios de cada tema.
Con el fin de ilustrar el uso de este instrumental en el desarrollo de una teoría económica a
continuación se presenta un caso. Hasta el momento hemos visto como se construye
matemáticamente la relación entre una variable dependiente (Y) y las independientes: X 1, X2, en
esta ocasión, aprovechando la exposición anterior, también aplicaremos la regresión múltiple
considerando el factor tiempo. Este factor es muy importante por que además de que permite
conocer el dinamismo del fenómeno bajo estudio (Y), permite predecirlo, es decir, estimar su valor
futuro.
La predicción es muy importante en economía por que permite visualizar, con cierta seguridad, cual
será el comportamiento de una variable (Y) en el futuro, en función de las variables independientes:
X1, X2 .
Con base en este enfoque a continuación se expone un ejercicio que permitirá ilustrar:
a) Como se prueba la teoría económica de que el consumo (Y) depende del ingreso disponible
(después de impuestos) (X1) y de la inflación (X2); de X1 en forma positiva y de X2 en forma
negativa.
b) Su comportamiento futuro
Así, para desarrollar el primer punto diremos que los datos en los últimos 10 años están expresados
en millones de pesos para Y, X1 y en porcentajes para X2 . De esta manera la ecuación de regresión
que servirá para probar la teoría económica quedará planteada de la siguiente manera:
yˆ = aˆ + bˆX i + cˆX 2 + ui
donde:
y = Y calculada o estimada
ui expresa que no hay una relación exacta de Y con respecto a X1 “y” X2 por lo que
ui es conocido como el complemento residual
Así, para encontrar y se requiere conocer los valores de a, b , c mismos que se determinan con las
tres ecuaciones normales siguientes:
∑ Y = na + b∑ X 1 + c∑ X 2 .
∑ ∑ 1 ∑ 1 ∑ 1 2
= a X + b X 2 + c X X
YX 1
∑ ∑ 2 ∑ 1 2 ∑ 2
= a X + b X X + c X 2
YX 2
Cuando se expresan en forma de desviaciones con respecto a la media aritmética se pueden resolver
simultáneamente para b y c , así:
− cX
a = Y − bX 2
1
∈( b ) = b parámetro de la población
∈( c ) = c parámetro de la población
∈ es el símbolo de la esperanza matemática.
En una regresión múltiple b , c son estimadores parciales de y .
Una vez establecidos tanto la teoría económica como la metodología para probarla, con los datos que
aparecen en la tabla 1, hacemos los siguientes cálculos para obtener a, b , c .
Tabla 1: Relación del consumo (Y) con el ingreso (X1) y la inflación (X2) (del año 1 al 10)
Años Y X1 X2 y x1 x2 yx1 x12 x22 x1 x2 x2 y
1 3 1 8 -3.1 -4.65 +0.9 14.415 21.623 0.81 -4.185 -2.79
2 2 2 15 -4.1 -3.65 +7.9 14.965 13.323 62.41 -28.835 -32.39
3 4 2.5 10 -2.1 -3.15 +2.9 6.615 9.923 8.41 -9.135 -6.09
4 5 3 9 -1.1 -2.65 +1.9 2.915 7.023 3.61 -5.035 -2.09
5 5 4 7 -1.1 -1.65 -0.1 1.815 2.723 0.01 +0.165 +0.11
6 7 5 6 +0.9 -0.65 -1.1 -0.585 0.423 1.21 +0.715 -0.99
7 6 7 8 -0.1 +1.35 +0.9 -0.135 1.823 0.81 +1.215 -0.09
8 8 8 4 +1.9 +2.35 -3.1 4.465 5.523 9.61 -7.285 -5.89
9 9 9 3 +2.9 +3.35 -4.1 9.715 11.223 16.81 -13.735 -11.89
10 12 15 1 +5.9 +9.35 -6.1 55.165 87.423 37.21 -57.035 -35.99
n=10 61 56.5 71 0 0 0 109.34 161.03 140.9 -123.15 -98.10
9
Nota: Y, X1,X2 son los valores originales, en tanto que y,x1 y x2 son minúsculas e indican las desviaciones de los
términos con respecto a sus medias respectivas.
Y = 6.1
X 1 = 5.65
X 2 = 7.1
Sustituyendo tenemos:
Observamos que b = 0.4379 tiene signo positivo y c = -0.3152 tiene signo negativo. Estos resultados
confirman la teoría económica, motivo por el cual podemos continuar probando la relación que tiene
el consumo (Y) con el ingreso (X1) y la inflación (X2). Por consiguiente, la ecuación de regresión
múltiple es:
Dependent Variable: Y
Method: Least Squares
Sample: 1993 2002
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 5.800837 0.976443 5.940785 0.0006
X1 0.442193 0.076017 5.817014 0.0007
X2 -0.309751 0.081265 -3.811615 0.0066
R-squared 0.973305 Mean dependent var 6.100000
Adjusted R-squared 0.965678 S.D. dependent var 2.998148
S.E. of regression 0.555441 Akaike info criterion 1.905216
Sum squared resid 2.159601 Schwarz criterion 1.995991
Log likelihood -6.526078 F-statistic 127.6122
Durbin-Watson stat 2.464587 Prob(F-statistic) 0.000003
Ahora bien en virtud de que no hay una relación lineal exacta de Y con X1 y X2, necesitamos
calcular la relación residual que se expresa con ui; misma que no conocemos porque pertenece al
universo, razón por la cual es estimada mediante ei , cuyo cuadrado ei2 , minimiza la suma de
cuadrados de todos los residuos: ∑ ei
2
Para obtener ei (donde (i) = 1,2,3... ...8,9,10), antes necesitamos determinar yi para cada uno de los
10 años. Así:
Nota: estos resultados están ”redondeados”; la computadora ofrece más decimales; por ello las cifras no
coinciden exactamente con las que se obtienen al correr los datos en computadora
Continuación... ...Tabla 1:
Relación del consumo (Y) con el ingreso (X1) y la inflación (X2) (del año 1 al 10)
Años yi e =Y - yi e2 2
y
1 3.7800 -0.7800 0.6084 9.61
2 2.0115 -0.0115 0.0001 16.81
3 3.8065 0.1936 0.0375 4.41
4 4.3406 0.6594 0.4348 1.21
5 5.4089 -0.4089 0.1672 1.21
6 6.1620 0.8380 0.7022 0.81
7 6.4074 -0.4074 0.1660 0.01
8 8.1061 -0.1061 0.0113 3.61
9 8.8592 0.1408 0.0198 8.41
10 12.1170 -0.1170 0.0137 34.81
∑ 61.0000 0.0000* 2.1610 80.9
* Existen pequeñas diferencias debido a la magnitud de los decimales. La suma técnicamente da cero
∑ e2 = 2.1610
Con estos valores podemos probar la significación estadística de los parámetros poblacionales b, c,
calculando primero las varianzas de los estimadores. Las fórmulas de las varianzas son:
Var b = σ 2 ∑ x22
∑ x12 ∑ x22 − ( ∑ x1 x2 )2
u
∑
2
x1
Var c = σ 2
∑ x12 ∑ x22 − ( ∑ x1 x2 )2
u
No se acostumbra calcular la varianza de a (pendiente al origen) por que no ayuda a probar la teoría
económica, ya que yi = a cuando X1 = 0; X2 = 0 puesto que lo que se desea es probar las
variaciones de yi en función de las variaciones de X1 , X2 .
Por otra parte, como σ 2u es desconocida por que es del universo, se estima con S2 , como una
estimación insesgada, es decir, E (S2) = σ 2u .
Con estas referencias, las estimaciones insesgadas de las varianzas de b , c tendrán las siguientes
fórmulas:
S = Var( b ) =
2 ∑ ei2 ∑ x 22
; Sb = Sb2
b
n− k ∑ x 2
1 ∑ x − ( ∑ x1 x 2 )
2
2
2
∑ ∑
2
ei2 x1
S = Var( c ) =
2
; S c = S c2
∑ x12 ∑ x 22 − ( ∑ x1 x 2 )2
c
n− k
Sb2 , S c2 son los errores estándar de b , c con los que se pueden probar las hipótesis sobre b, c,
relativos a que hay o no hay relación de Y con respecto a X1, X2, con la estadística t de Student
porque n < 30 términos:
Para b: Para c:
Ho: b = 0 Ho: c = 0
Ha: b ≠ 0 Ha: c ≠ 0
b − b c − c
tb = t c =
Sb S c
Estas t`s “empíricas” u observadas se confrontan con las t`s ”teóricas” o de tablas. Estas últimas se
denotan con las literales t∝ , donde ∝ = nivel de significación que junto con los grados de libertad (n-
k) determinan los puntos “críticos” donde se toma la decisión de aceptar o rechazar Ho.
2
Así, para probar Ho primero calculamos Sb , S c2 ; sustituyendo los valores de las tablas en las
fórmulas originales:
S = Var (bˆ) =
2 ∑ ei2 ∑ x22
=
2.1610 140.9
=
bˆ
n− k ∑ x∑ 2
1 x − (∑ x1 x2 )
2
2
2
10 − 3 (161.0250)(140.9) − (− 123.15) 2
140.9 140.9
= 0.3087 = = 0.3087(0.0187) = 0.0058
22,688.4225 − 15,165.9225 7,522.5
también
∑ ∑
2
ei2 x1 2.1610 161.0250
S = Var (cˆ) =
2
=
∑ x∑ x − (∑
cˆ
n− k 2
1
2
2 x1 x2 ) 10 − 3 (161.0250)(140.9) − (− 123.15) 2
2
161.03 161.03
= 0.3087 = = 0.3087(0.0214) = 0.0066
22,688.4225 − 15,165.9225 7,522.5
bˆ − b 0.4379 − 0 cˆ − c − 0.3087 − 0
tb = = = 5.7542 tcˆ = = = − 3.8017
Sbˆ 0.0761 Scˆ 0.0812
Interpretación económica: Sí hay relación del consumo (Y) con el ingreso (X1) y la inflación (X2);
luego entonces se sigue confirmando nuestra teoría.
VIII.3 Determinación del Grado (o porcentaje) de la Relación que Existe entre Y y las Variables
Explicativas X1, X2
Para llevar a cabo la determinación del grado de la relación que existe entre la variable dependiente
o explicada y las variables independientes o explicativas primero se determina el Coeficiente de
Determinación Múltiple.
R2 = 1 −
∑ ei2
= 1−
2.1610
= 1 − 0.0267
∑ y2
i 80.9
R 2 = 0.9733 o 97.33%
Interpretación: El ingreso y la inflación determinan el 97.33% de los cambios que experimenta el
consumo.
n− 1 10 − 1
R 2 = 1 − (1 − R 2 ) = 1 − (1 − 0.9733)
n− k 10 − 3
= 1 − (1 − 0.9733)(1.2857)
= 1 − (0.0267)(1.2857) = 1 − 0.0343
R 2 = 0.9656
En este caso la hipótesis nula se prueba con F, estadística que se refiere al análisis de varianza que es
el cociente de dividir la varianza explicada entre la varianza no explicada. Su formula es:
∑ yi2 R2
( k − 1) k−1
Fk − 1,n − k = =
∑ ie 2
(1 − R 2
)
(n − k )
(n − k )
donde:
(k-1) son los grados de libertad de la varianza explicada
(n-k) los grados de libertad de la varianza no explicada
(ya es conocido el significado de n y k)
Como en el caso anterior - cuando usamos t - se requiere encontrar en tablas la “F teórica” con un
cierto valor de ∝ para confrontarla con la “F empírica”. Así, primero calculamos la F empírica:
0.9733
F2, 7 = 2 = 0.4866 = 128.0526
1 − 0.9733 0.0038
7
Si decimos que ∝ = 1%, buscamos F∝ en tablas con 2 grados de libertad para el numerador
(varianza explicada) y 7 grados de libertad para el denominador, vemos que F∝ = 9.55.
Como F2,7 = 128.0526 > F∝ = 9.55 decimos que se acepta la hipótesis alternativa (se rechaza la
hipótesis nula) de que b y c, y R2 son significativamente diferentes de cero.
Lo anterior indica que a través de una sola estadística se confirma la hipótesis que hemos venido
desarrollando de que: Y = f(X1,X2).
Este coeficiente es útil por que mide la correlación neta entre la variable dependiente (Y) y una
variable independiente (sea X1 o X2) después de excluir la influencia que sobre ellas ejerce la(s)
otra(s) variable(s) independiente(s) en el modelo uniecuacional.
ry x1 =
∑ yx1 = 109.35 = 109.35 = 109.35 = 0.959
∑ x12 ∑ y 2 16103 . 80.9 ( 12.68 )( 8.99 ) 113.99
ry x2 =
∑ yx2
=
− 981
.
=
− 981
.
=
− 981
.
= − 0.919
∑ x22 ∑ y2 140.9 80.9 ( 1187
. )( 8.99 ) 106.71
rx1 x 2 =
∑ x1 x2
=
− 12315
.
=
− 12315
.
=
− 12315
.
= − 0.818
∑ x22 ∑ x12 140.9 16103
. ( 1187
. )( 12.68 ) 150.51
Sustituyendo:
ry x1 , x2 = 0.936 o 93.6%
t a m b i én
ry x2 − ry x1 rx1 , x2 (− 0.919) − (0.959)(− 0.818)
ry x2 , x1 = = =
1− r 2
x1 , x 2 1− r 2
y x2
0.33 0.08
− 0.919 + 0.784 − 0.135
= = = − 0.838
(0.574)(0.282) 0.161
Se dice que el ingreso (X1) es más importante explicando las variaciones del consumo (Y) que la
inflación (X2); obviamente en sentido inverso, como lo indica la teoría económica.
Con Wviews: Vamos a Quick/Group Statistics/Correlations/ aparece en pantalla “Series List” y
escibimos Y X1 X2/ ok aparecen coeficienten de correlación parcial name/Group 02/ok. Para
graficar: Quick/graph/line graph/ series list: Y X1 X2/ok y aparece la gráfica.
Se acostumbra presentar en forma resumida los resultados estadísticos, mismos que en computadora
suelen aparecer así:
calculado tablas
t1 = 5.817014 2.36
t2 = -3.811620 2.36
F = 124.7400 6.54
Por otra parte, si deseamos conocer gráfica y numéricamente las relaciones de Y con X1, X2, se
expresan así:
VIII.6 Predicción
Usando Eviews 5, suponga que se desea proyectar a los años 2011 y 2012, para ello se requiere de
los siguientes pasos:
1.- Nos colocamos en el Workfile (archivo) que muestra el RANGE y SAMPLE con datos de 2001 a
2010 y por eso dice 10 obs. Necesitamos modificarlos haciendo clic en RANGE y SAMPLE/
aparece “ workfile structure, ahí cambiamos el RANGE y el SMPL/ ahora escribimos en “Dated-
regular frequency”: start date: 2001 y en end date: 2012/aparece la leyenda: “Resize involves
inserting 2 observatios Continue?/yes. Aparece la siguiente tabla con las dos observaciones
adicionales:
2.- En la línea de comando se escribe: DATA X1 X2. Aparecerán las dos celdas en blanco, mismas
que hay que llenar con los datos de X1 y X2 para los años 11 y 12 respectivamente.
3. Regresamos a goup01 que muestra los 10 datos originales de Y,X1,X2 con las celdas de los años
2011 y 2012 en blanco. Las llenamos escribiendo para el año 2011 para X1= 15.5, X2= 1.3 y para el
2012: X1= 16, X2= 1.5
4.- Nuevamente vamos a workfile y localizamos el cuadro que contiene la ecuación de regresión,
mismo que contiene la ventana Forecast/clic/ por default aparecen y los conservamos : a).- forecast
name:yf; b).- forecast simple: 2001-2012; en output c).- forecast graph y d).- forecast
evaluation/ok/aparece la grafica con su “banda de confianza”( para los 12 años) y las estadísticas que
evalúan la predicción.
5.- Se regresa a workfile/show/ escribimos en la caja: y yf/ok/ aparecen las dos variables, la primera
con datos de 2001 a 2010 y la segunda ( la pronosticada) de 2001 a 2012.
Evaluación de la capacidad predictiva del modelo. Son cuatro las estadísticas que el programa Eviews
proporciona para evaluar dicha capacidad predictiva: 1.- La raíz del error cuadrático medio( Root mean
squared error); 2.- error absoluto medio( Mean absolute error); 3.- Error absoluto medio del porcentaje de
error( Mean absolute percent error) y 4.- el coeficiente de desigualdad de Theil( Theil inequality
coeficiente).Todos ellos aparecen a un lado de la gráfica que muestra yf con su “banda de confianza”
( construida con yf mas y menos dos errores estándar) asociada. Mientras más se acerque su valor a cero,
mejor es la capacidad de predicción del modelo. En este sentido vale decir que el valor del coeficiente de
desigualdad de Theil oscila entre 0 y 1, por lo que mientras más se acerque a 0, mejor será la
predicciónrealizada con la ecuación de regresión.
VIII.7.1La Elasticidad Ingreso del Consumo: Mide el cambio porcentual en los niveles del
consumo como consecuencia de un cambio porcentual en el ingreso disponible (después de
impuestos). Es importante señalar que la elasticidad no es constante, es decir, cambia en cada
uno de los puntos de la función de regresión. Su cálculo puede hacerse con la formula:
X 5.65
E ib = b 1 = 0.44 = 0.44( 0.92 ) = 0.40
Y 61
.
VIII.7.2 De manera similar se puede obtener la Elasticidad Precio de la Demanda Cuya
interpretación es similar a la elasticidad ingreso, pero ahora referida a los precios. Como no
hay datos, conceptualmente se mide con:
Ep = Parámetro estimado multiplicado por el cociente que resulta de dividir la media de los
precios entre la media de la demanda o consumo
VIII.7.3 Con base en lo anterior podemos obtener la Elasticidad Inflación del Consumo así:
X 7.1
E ic = c 2 = − 0.31 = − 0.31( 116
. ) = − 0.36
Y 61
.
Tema: Marco teórico de la expresión matemática de una teoría económica y de su verificación estadística.
I.-Conteste con una “X” en SI cuando la afirmación sea verdadera y también con una “X” en NO cuando la afirmación
sea falsa:
2.-Una variable dicotómica puede tomar más de dos valores: Si_____; No________
3.-Para predecir la variable dependiente es necesario que antes se conozcan los valores proyectados de las variables
explicativas en el tiempo: SI:_______; NO:___________
4.- Cuando se verifica la hipótesis de la relación entre la variable dependiente con las independientes, se espera que
idealmente el valor del coeficientes de correlación múltiple no sea semejante a los valores de los coeficientes de
correlación parcial: SI:__; NO__.
5.- Cuando se verifica con la estadística F que las variables independientes si explican a la variable dependiente,
teóricamente se debe de verificar con la prueba t de Student que cada una de las variables independientes también
explican a la dependiente: SI___; NO____.
6.- Al correr la regresión, cuando los signos de los coeficientes obtenidos de las variables regresoras no coinciden con la
concepción teórica de su relación con la variable regresada, se debe cambiar de variable regresora: SI____; NO______:
7.- Al probar una hipótesis nula con la t de Student, si la t real o calculada es mayor que la t teórica o de tablas, se
acepta dicha hipótesis nula: SI____;NO_____.
8.- Cuando F real o calculada es menor que F teórica o de tablas rechazamos la hipótesis nula: SI_____; NO____.
:
9.- en una regresión múltiple si al probar una hipótesis nula con ciertos grados de libertad y nivel de significación,
cuando los valores de t no son estadísticamente significativos pero F si lo es, se dice que posiblemente se violó algún de
los supuestos del modelo de estimación: SI____; NO______.
10.-Conocido el valor del coeficiente de la variable explicativa X, su media aritmética como la de la variable explicada
Y
Y, la elasticidad se calcula as E = bˆ : SI__;NO___.
X
Observaciones: Cada una de las respuestas correctas vale 10 puntos en escala de 0 a 100. No se puede usar la
calculadora, ni las tablas estadísticas ni la bibliografía correspondiente a cada tema.
IX.1 Propósito
En economía existen fenómenos que no siempre tienen un comportamiento lineal, digamos como el
comportamiento del valor de las acciones de cualquier empresa en el mercado bursátil. Este
comportamiento se detecta al graficar los valores del fenómeno y obtener un diagrama de dispersión
en forma de “sierras”; también ello se comprueba cuando cierta teoría económica así lo establece,
digamos el valor de la producción en función de los insumos de mano de obra y de capital.
Comenta el profesor Salvatore (1991, p. 136) que la teoría económica puede a veces sugerir la forma
funcional de una relación económica; también, que la dispersión de los valores observados puede
sugerir la forma funcional apropiada en una relación de dos variables, y que cuando ninguna teoría
ni dispersión de puntos es de ayuda, la función lineal se trata usualmente primero debido a la
simplicidad.
Algunas de las transformaciones de funciones no lineales a lineales más útiles y comunes son las
funciones logaritmo doble o doble-log, recíproca, y la polinomial. Una de las ventajas de la forma
doble-log es que las pendientes representan elasticidades. La función semilog es apropiada cuando la
variable dependiente crece en el tiempo a un ritmo relativamente constante, como en el caso de la
fuerza laboral y de la población. Las funciones recíprocas y polinomial son apropiadas para estimar
curvas de costo medio y costo total.
La estimación de una función doble-log transformada por el método de MCO arroja estimadores de
pendiente insesgados. Sin ambago b0=antilo b0* es un estimador sesgado pero consistente de b0. El
hecho de que b0 sea sesgado no es de mucha importancia, porque la constante no muestra un interés
especial en economía. En las otras funciones transformadas b0 también es insesgado.
1.- Estas “nuevas” pendientes aparte de ser estimadores lineales en los logaritmos de las variables Y
e X, son insesgadas y su valor es igual a la elasticidad de la variable dependiente con respecto a la
independiente o explicativa, como es el caso de la forma funcional doble logarítmica, también
expresada por motivos prácticos log log ;
2.- Con la forma funcional lin log la pendiente de la variable independiente, X, también es lineales
en su logaritmo y mide una tasa de crecimiento, es decir, mide el cambio porcentual constante de
la variable dependiente, Y, provocado por el cambio unitario absoluto que experimente la variable
independiente, que debe ser la variable tiempo ;
3.- Con la forma funcional log lin la pendiente de la variable independiente, X, mide el cambio
absoluto en la variables dependiente, Y, originado en un cambio porcentual en X;
4.- El modelo o forma funcional recíproco ( en X) aun cuando no es lineal ( Gujarati, 1991) en X
puesto que entra inversamente o de manera reciproca, es lineal en sus parámetros y en consecuencia,
por esa razón es un “modelo de regresión lineal”. Su connotación principal es que a medida que X
aumenta indefinidamente, su coeficiente se acerca a cero y la variable dependiente Y se aproxima al
valor límite o asintótico, que es el valor de la ordenada al origen. En otras palabras, este modelo es
útil porque expresa relaciones asimétricas o inversas entre Y e X porque muestra que cuando X
aumenta Y disminuye hasta un punto cuyo valor es la ordenada al origen.
A continuación se desarrollan estos modelos y se explican los significados que tienen el coeficiente
o pendiente de la variable independiente, según sea al caso de los cuatro antes descritos.
La forma funcional
be se puede transformar en la doble logarítmica
u
Y = aX
log Y = log a + b log X + log e u . La función exponencial Y = ab x se transforma en
log Y = log a + log bX que es semilogaritmica por que sólo transforma Y, etc.
Como se recordará los logaritmos comunes tienen base 10 y los naturales base e = 2.718 de manera
tal que la relación entre logaritmos naturales y comunes es:
Ejemplo:
Cuando:
X = 240; su ln = 2.3026 (2.380211) = 5.48064
X = 1480; su ln = 2.3026 (3.170262) = 7.29986
X = 410; su ln = 2.3026 (2.612784) = 6.01616
X = 450; su ln = 2.3026 (2.653223) = 6.10925
X = 3; su ln = 2.3026 (0.477100) = 1.09857
X = 2; su ln = 2.3026 (0.301000) = 0.69308
X = 8; su ln = 2.3026 (0.903100) = 2.07947
X = 1; su ln = 2.3026 (0.000000) = 0.00000
Es el investigador quien decide si trabaja con logaritmos de base 10, base e o cualquier otra base;
para evitar confusiones basta pues con especificar con que base de logaritmos se trabaja.
A partir de los datos de la tabla 1 hacemos los siguientes cálculos que aparecen en la tabla 2
Continuación... ...Tabla 2:
Función del Consumo Transformada a Forma Lineal Doble Logarítmica
Años y2 =(lnY-Med lnY)2 x1 = lnX1-Med lnX1 x2 = lnX2-Med lnX2 yx1 yx2
1 0.34928681 -1.463440894 0.320509619 0.864900762 -0.18942276
2 0.99295251 -0.770293713 0.949118279 0.767574595 -0.94576791
3 0.09200475 -0.547150162 0.543653171 0.165963143 -0.16490243
4 0.00642872 -0.364828605 0.438292655 0.029251699 -0.03514199
5 0.00642872 -0.077146533 0.186978227 0.006185554 -0.01499178
6 0.06568607 0.145997018 0.032827547 0.037418006 0.008413469
7 0.01043304 0.482469255 0.320509619 0.049280502 0.032737578
8 0.15196301 0.616000648 -0.372637561 0.240132044 -0.14526319
9 0.25766525 0.733783683 -0.660319634 0.372474008 -0.33518311
10 0.6324853 1.244609307 -1.758931922 0.989824645 -1.39885999
Σ 2.56533418 -8.881178 1.3227 3.52300496 -3.18838213
Continuación... ...Tabla 2:
Función del Consumo Transformada a Forma Lineal Doble Logarítmica
Años x1 x2 lnYc 2 2
x12 x22 e = ln(Y-Yc)
1 -0.46904688 2.141659251 0.102726416 1.028971137 0.00484989
2 -0.73109984 0.593352406 0.900825507 1.126587505 0.187870515
3 -0.29745992 0.299373300 0.295558770 1.325695683 0.003672200
4 -0.15990170 0.133099912 0.192100451 1.426051934 0.033630417
5 -0.01442472 0.005951588 0.034960857 1.607870043 2.458210000
6 0.004792724 0.021315129 0.001077648 1.737648052 0.043373101
7 0.154636037 0.232776582 0.102726416 1.789850745 3.643230000
8 -0.22954498 0.379456797 0.138858752 2.033282166 0.002130688
9 -0.48453177 0.538438493 0.436022019 2.158699993 0.001484144
10 -2.18918304 1.549052326 3.093841507 2.661514784 0.031190433
Σ -4.41576410 5.894475785 5.298698344 16.89617204 0.308207489
Como puede observarse en la tabla 2, los pasos fueron:
b) Obtener las “desviaciones” de esos logaritmos con respecto a las medias aritméticas
Y , X 1 , X 2 . En el caso del consumo: para el primer término, log Y1- Y ; para el último término log
Y10- Y . Un procedimiento análogo se hizo para las desviaciones de los logaritmos de X1, X2 con
respecto a sus X 1 , X 2 .
Como se recordará las “desviaciones” se representan con letras minúsculas, ello con el objeto de
aplicar las fórmulas ya conocidas para obtener a ,b , c; que son:
(∑ x1 y )(∑ x 22 ) − (∑ x 2 y )(∑ x1 x 2 )
ln bˆ =
(∑ x12 )(∑ x 22 ) − (∑ x1 x 2 ) 2
e) Para determinar la ∑ ei2 relación residual primero obtenemos las Y`s calculados o
estimadas así::
f) Luego que se tiene Y, Yc se obtiene ei = yi - Yc, misma que se eleva al cuadrado (ei)2
y se obtiene su suma que de acuerdo con la tabla 2 tenemos ∑ ei =0.30
2
S = Var( b ) =
2 ∑ ei2 ∑ x 22
= 0.000395; S b = 0.019
b
n− k ∑ x12 ∑ x 22 − ( ∑ x1 x 2 )2
∑ ∑
2
ei2 x1
S = Var( c ) =
2
= 0.000489; S c = 0.022
∑ x12 ∑ x 22 − ( ∑ x1 x 2 )2
c
n− k
Para b Para c
Ho: b = 0 Ho: c = 0
HA: b ≠ 0 HA: c ≠ 0
0.39 − 0.27
tb = = 20.5 tc = = − 12.27
0.019 0.022
h) Ahora calculamos:
R = 1−
2 ∑ ei2
= 0.879 o 87 .9%
∑ yi2
luego r = R2 = 0.87 = 0.932 o 93.2%
n− 1
la R 2 = 1 − ( 1 − R 2 ) = 0.845 o 84 .5%
n− k
R2
k−1
Fk − 1,n − k = = 25.63
(1 − R ) 2
(n − k )
Con α = 5% y 2 y 7 grados de libertad Fα = 4.74 , luego como Fα = 4.74∠ F2,7 = 25.63 ,
2
decimos que se acepta la hipótesis alternativa de que b, c, R son significativamente diferentes de
cero, decimos que hay bondad de ajuste, que la variable endógena si es explicada suficientemente
por las variables exógenas.
j) Cálculo de la elasticidad: Como se indicó previamente, las pendientes en esta
forma funcional doble logarítmica, equivalen a las elasticidades ingreso e inflación del
consumo, es decir, su valor es el valor de la elasticidad correspondiente. Como b = 0.39 =
elasticidad respecto del ingreso; c = − 0.27 = elasticidad respecto de la inflación. Nótese que estos
valores son similares a los obtenidos previamente en el punto VIII.7.1 y VIII.7.3,
donde Ei =0.40 y Ein = -0.36. Su diferencia se explica por el número de decimales utilizados.
También comenta el profesor Dominick Salvatore que cuando la suma los coeficientes estimados
(elasticidades) de las variables independientes ( cuando son factores de la producción, digamos
mano de obra y capital) es mayor que uno, hay economías de escala. En este sentido el profesor
Gujarati (1990 , p.153) complementa diciendo que cuando la elasticidad o pendiente de la variable
independiente es menor que uno, se debe interpretar como que hay inelasticidad de la variable
dependiente con respecto a la dependiente. Esto se ilustra en ejemplos subsecuentes.
Y
1.098612
0.69314
7
1.386294
1.609438
1.609438
1.945910
1.791759
2.079442
2.197225
2.484907
X1
0.000000
0.693147
0.916291
1.098612
1.386294
1.609438
1.945910
2.079442
2.197225
2.708050
X2
2.079441541
67984
2.708050201
10221
2.302585092
99405
2.197224577
33622
1.945910149
05531
1.791759469
22805
2.079441541
67984
1.386294361
11989
1.098612288
66811
0
Dependent Variable: LY
Con los siguientes datos y siguiendo los mismos pasos del ejemplo anterior obtenga: a). La ecuación
de regresión, b). las elasticidades (economías de escala) y c). el error estándar de estimación. Así, si
especificamos en el modelo uniecuacional que Y=f(X1,X2)
Una vez que los datos fueron convertidos a logaritmos obtenemos las “desviaciones” de los valores
originales con respecto a sus medias, con objeto de ir calculando los valores necesarios para estimar
los parámetros de la ecuación de regresión que facilite el cálculo de las elasticidades y del error
estándar de estimación. Las desviaciones se expresan con minúsculas así:
Esos resultados se sustituyen en las ecuaciones que necesitamos para obtener el valor de los
coeficientes estimados. Luego si
Sustituyendo
b=(0.0375)-(0.0437)/0.0943 – 0.0859
b=-0.0062/0.0084
b= - 0.708
c=0.0348/0.0084
c=4.19
finalmente para a
a= - 7.71
b). Las elasticidades son: Elasticidad de Y con respecto a X1= -0.708; de Y con respecto a X2=
+4.19, de manera que si 4.19+ (-0.708)= 3.482 ≥ 1, decimos que si hay economías de escala.
c). Para calcular el error estándar de estimación tabulamos a partir de la ecuación de regresión
LnY3c= -7.71-0.708(1.09)+4.19(2.30)=1-1600
LnY4c= -7.71-0.708(1.39)+4.19(2.48)=1.6960
Tabulando tenemos
∑ 0.000 0.1549
∑ ( E) 2
Luego el error estándar de estimación es σ YX 1 X 2 = = 0.1549 / 1 = 0.3935
n− k
Con Evi ew s s e obt i enen l os mismos result ados . Si gui endo l os mismos pas os del ej em pl o ant eri or
s e arri b a al si gui ent e cuadro:
Dependent Variable: LY
Method: Least Squares
Date: 09/30/08 Time: 20:47
Sample: 2001 2004
Included observations: 4
Comentarios: Los valores que toman las “probabilidades” de las t´s y F indican que se acepta la hipótesis
nula, es decir, que los coeficientes de las variables regresoras no son estadísticamente diferentes de cero, lo
que significa que X1 e X2 no explican a Y; R cuadrada corrobora lo anterior con un valor bajo: 0.646394. Lo
anterior en mucho se debe a que son datos inventados para ilustrar el algoritmo de cálculo y que la muestra
es muy pequeña, entre otros factores que influyen significativamente en los resultados.
IX.3.3 Función de Consumo Exponencial Transformada a Forma Lineal Semilogarítmica:log-lin, que sirve
para calcular la tasa de crecimiento de Y en función de las variaciones de X .La tasa de
crecimiento viene expresada por el valor del coeficiente de X , donde X es la variable tiempo.
Este modelo es útil cuando queremos conoce el cambios relativo en Y ante un cambio absoluto
en X1.
Así, recordando que una función es semilogaritmica cuando una de las variables se convierte o se
transforma en logaritmos, sea X o Y. En este sentido, si se establece que sea Y la que se exprese en
logaritmos, a partir de una función exponencial, ello gráficamente se expresa mediante una línea
recta cuando la función se traza en una gráfica semilogaritmica; será una curva cuando se trace una
gráfica con escalas ordinarias.
Así, si la función es Yc = abx tomando logaritmos se trasforma en una función lineal dada por logYc
= log a + log b (x). Nota: Este ejemplo se trabaja con logaritmos comunes, de base 10.
Para simplificar operaciones hacemos Σx = 0. Aplicando el método de mínimos cuadrados, las dos
constantes desconocidas (log a, log b) se calculan con:
log a =
∑ (log Y )
;log b =
∑ ( X log Y )
n ∑ X2
Tabla 3:
Transformación de la Función Consumo de una Función Exponencial
en Semilogarítmica:
Años en Consumo
Año Unidades X Y log Y XlogY X2 logYc Yc
1 -5 3 0.4771 -2.3856 25 0.36 2.3
2 -4 2 0.3010 -1.2041 16 0.44 2.7
3 -3 4 0.6021 -1.8062 9 0.52 3.3
4 -2 5 0.6990 -1.3979 4 0.60 3.9
5 -1 5 0.6990 -0.6990 1 0.68 4.8
6 0 7 0.8451 0.0000 0 0.76 5.7
7 +1 6 0.7782 0.7782 1 0.84 6.9
8 +2 8 0.9031 1.8062 4 0.92 8.3
9 +3 9 0.9542 2.8627 9 1.00 10
10 +4 12 1.0792 4.3167 16 1.08 12
11 +5 13 1.1139 5.5697 25 1.16 14.4
Σ 0 74 8.4519 7.8407 92 8.36 74.3
Sustituyendo:
log a =
∑ (log Y )
=
8.4519
= 0.76
n 11
log b =
∑ ( X log Y )
=
7.8405
= 0.08
∑ X 2
92
Luego la ecuación de regresión transformada en logaritmos es:
Los valores de cada Yci , donde (i) = 1,2,3... ...8,9,10,11; así se obtienen:
Con estos resultados se pueden hacer en forma análoga los ejercicios anteriores:
a) La prueba de significación estadística de los parámetros estimados
b) El cálculo de R2, r, R
c) La prueba de la significación global con F
IX.3.3.1. Otro ejemplo, usando los datos del primer caso con diez observaciones para cada
variable, tenemos que para calcular la tasa de crecimiento en el periodo de Y se hace la
siguiente corrida de regresión, considerando que X1 es la variable tiempo:
Dependent Variable: LY
Method: Least Squares
Date: 09/30/08 Time: 23:38
Sample: 2001 2010
Included observations: 10
Para los años 1,2,3,4 y 5 el consumo (Y) como el ingreso (X) expresados en miles de millones de
pesos es:
Tabla 4:
Transformación de la Función Consumo e Ingreso de la Forma Lineal a
Semilogarítmica usando Logaritmos Naturales
_
Año Y X lnY _ xi = X-X ln yixi X2
ln yi = LnY-LnY xi2
1 7 9 1.9459 -0.2751 -2.2 0.6053 81 4.84
2 8 10 2.0794 -0.1416 -1.2 0.1699 100 1.44
3 9 10 2.1972 -0.0239 -1.2 0.0286 100 1.44
4 11 13 2.3979 0.1768 1.8 0.3182 169 3.24
5 12 14 2.4849 0.2638 2.8 0.7387 196 7.84
Σ 47 56 11.1053 0 0 1.8609 646 18.8
11.1053
ln Y = = 2.22
5
56
ln X = = 11.2
5
Con esa información sustituimos en las fórmulas de los estimadores de los parámetros y
encontramos:
ln bˆ =
∑ xi ln y i
=
1.8609
= 0.0989
∑ x 2
i 18.8
ln aˆ = log Y − bˆX = 2.22 − 0.0988(11.2) = 1.1124
Para ello primero se debe obtener ln y , luego e, ∑ ei2 , S 2 , Sb , Sa cuyos cálculos son:
Continuación... ...Tabla 4:
Transformación de la Función Consumo e Ingreso de la Forma Lineal a
Semilogarítmica usando Logaritmos Naturales
luego: S aˆ =
∑ ei2 ∑ X 2
(649)
= 0.0043 = 0.0299
2
n− k n∑ x 2
1 5(18.8)
también:
S =
2 ∑ ei21 1
= 0.0043 = 0.0023
n − k ∑ xi 18.8
b 2
a − a 11124
. − 0 b − b 0.0989 − 0
ta = = = 6.4293 =tb = = 6.5179
S a 01730
. Sb 0.0151
Con α =5% y 3 grados de libertad hallamos t α = ± 3182. que es menor que ta, tb, por lo que decimos
que a, b son significativamente diferentes de cero, es decir que se acepta la hipótesis alternativa; ello
indica que si hay relación entre el consumo (Y) y el ingreso (X).
c) Obtener R2, r:
R = 1−
2 ∑ ei2
= 1−
0.0130
= 0.934 o 93.4%
∑ y i
2
01972
.
Lo anterior indica que X explica el 93.4% de los cambios que suceden en Y. En seguida obtenemos:
r= R2 = 0.934 = 0.9664
Lo cual significa que hay una alta correlación positiva entre X e Y, es decir, a medida que aumenta
X, también lo hace Y de acuerdo con el valor de la pendiente b .
d) Predicción: Digamos que para 6 la variable X = 16 y se desea estimar el valor de Y para ese
año. Sustituimos:
lnYc = 1.1124 + 0.0989 (16) = 2.6962, cuyo antilogaritmo es 14.8, que es el valor estimado del
consumo Y en el año 6.
e) Límites de Confianza: Si se desea calcular el intervalo dentro del cual se halla contenido el valor
real de Y con cierta probabilidad para el año 6, aplicamos la siguiente fórmula:
Y = Yc ± t α S f
donde:
Sf = error de predicción
(Yc − X ) 2
1 2 1 (14.8 − 11.2) 2 12.96
S f = S 1 + +
2 2
= S 1 + + = 0.0043 1 + 0.2 + =
n ∑ (X1 − X ) 2
5 (18.8) 2
353.44
tenemos:
Y = Yc ± t α S f
Y = 14.8 ± 3182
. ( 0.07 )
Y = 14.8 ± 0.22
Interpretación: El valor real de Y para 1997 está en el intervalo de confianza 14.8 ± 0.22, con una
probabilidad del 95%, cuyo limite inferior es 14.58 y el superior es 15.02.
Comentarios: El ajuste con la función semilogarítmica es mejor que el ajuste con las formas lineales
y polinomiales.
IX.3.5 Modelo semi logarítmico lin log es aquel por medio del cual el coeficiente de X1 mide el
cambio absoluto constante en Y ante un cambio relativo o proporcional dado en X1 (Gujarati,
1991:155). Así, sea el siguiente ejemplo:
Dependent Variable: Y
Method: Least Squares
Date: 10/01/08 Time: 00:20
Sample: 2001 2010
Included observations: 10
A pesar de que este modelo es no lineal en la variable X porque entra inversamente o en forma
recíproca, el modelo es lineal en β1 y β2 y, por consiguiente, es un modelo de regresión lineal. 1
Este modelo tiene las siguientes características: a medida que X aumenta indefinidamente, el
término β2 (1/X) se acerca a cero (nota: β 2 es una constante) y Y se aproxima al valor límite o
asintótico β 1. Por consiguiente, modelos tales como este contienen un valor asintótico o límite
que tomará la variable dependiente cuando el valor de la variable X aumente
indefinidamente.2
1
1
Si se define que X i* = (1/X), entonces Yi = β 1 + β 2 + µ i es lineal en los parámetros al igual que en las
Xi
variables Yi y X i*
1
2
La pendiente de Yi = β 1 + β 2 + µ i es: dY/dX = -β2 (1/X2), e implica que si β2 es positivo, la pendiente siempre
Xi
es negativa y si β2 es negativa, la pendiente es positiva. Véase su ilustración en las siguientes gráficas del modelo
1
recíproco: Yi = β 1 + β 2 + µ i .
X
i
Se trabaja principalmente con modelos que son lineales en los parámetros, los cuales pueden ser o
no lineales en las variables. Se consideraran algunos modelos de regresión más comúnmente
útilizados, que pueden ser no lineales en las variables pero que son lineales en los parámetros o que
pueden serlo mediante transformaciones apropiadas de las variables. En particular, se analizarán los
siguientes modelos de regresión:
1. El modelo log-lineal
2. Modelos semilogarítmicos
3. Modelos recíprocos
4. El modelo logarítmico recíproco
Se analizan las características especiales de cada modelo, los casos en los cuales su uso es apropiado y la forma como
éstos son estimados.
Yi = β i X iβ 2 e µ i 1
Ejemplo con Eviews: Supongamos que Y es el consumo y X2 es la tasa de interés; sus datos
originales están comprendidos en el punto VIII; dado que son datos hipotéticos usados para ilustrar
el uso de la metodología y el algoritmo de cálculo, digamos que sus valores están expresados en
miles de millones de pesos. Al respecto, se empieza estableciendo la teoría económica indicando
que Y e X2 tienen una relación inversa: a medida que aumenta la tasa de interés disminuye el
consumo nacional. Para medir qué tanto afecta el aumento en la tasa de interés al consumo de un
país vamos a transformar la variable X2 en su recíproca, para ello vamos a Quick/generate series/
en la ventana escribimos RecX2=1/X2/ok. Una vez que le hemos dado un nombre vamos a Quick/
donde In = logaritmo natural (es decir, logaritmo en base e y donde e = 2.718). Si se escribe (2)
como
ln Yi = α + β 2 ln X i + µ i 3
donde α = In β1 este modelo es lineal en los parámetros α y β2, lineal en los logaritmos de las
variables Y y X y puede ser estimado por regresión MCO. Debido a esta linealidad, tales modelos se
denominan modelos log-log, doble-Iog, o log-lineales. .
donde Yi = In Yi y X i = In Xi'. Los estimadores MCO obtenidos, αˆ y βˆ2 serán los mejores
* *
Dependent variable Y:Method: Least SquaresDate: 10/02/08 Time: 14:47Sample: 2001 2010Included
observations: 10
3
El coeficiente de la elasticidad, en la notación de cálculo, se define como (dY/Y)/(dX/X) = [(dY/ dX)(X/Y)].
Nota técnica: Se observa que d(ln X)/dX = 1/X o d(ln X) = dX/X, es decir, para cambios infinitesimalmente pequeños
(obsérvese el operador diferencial d), un cambio en In X es igual al cambio relativo o proporcional en X. En la práctica,
sin embargo, si el cambio en X es pequeño, esta relación puede escribirse como: cambio en In X ≅ cambio relativo en
X, donde ≅ significa aproximadamente. Así, para cambios pequeños,
(In Xt - In Xt-1) ≅ (Xt – Xt-1)/Xt-1 = cambio relativo en X
A propósito, se deberá observar estos términos, a los que se hace referencia frecuentemente:
1) cambio absoluto,
2) cambio relativo o proporcional y
3) cambio porcentual o tasa de crecimiento porcentual.
Así, (Xt – Xt-1) representa un cambio absoluto, (Xt – Xt-1)/Xt-1 = (Xt/Xt-1-1) es un cambio relativo o proporcional y [(Xt –
Xt-1)/Xt-1]IOO es el cambio porcentual, o la tasa de crecimiento. Xt y Xt-1 son los valores actual y anterior de la
variable X, respectivamente.
Pueden observarse dos características especiales del modelo log-lineal: el modelo supone que el
coeficiente de la elasticidad entre Y y X, β2 permanece constante a través del tiempo (¿por qué?) de
aquí su nombre alterno modelo de elasticidad constante4. En otras palabras, como lo indica la
figura b, el cambio en In Y por unidad de cambio en In X (es decir, la elasticidad, β2; permanece
igual sin importar en cuál ln X se mide la elasticidad. Otro aspecto del modelo es que a pesar de que
αˆ y βˆ2 son estimadores insesgados de α y β2, β1 (el parámetro del modelo original) al ser estimado
como βˆ1 = antilog ( αˆ ) es, de por sí, un estimador sesgado. En la mayor parte de los problemas
prácticos, sin embargo, el término intersección es de importancia secundaria y no es necesario
preocuparse por obtener este estimador insesgado.
En el modelo de dos variables, la forma más simple de decidir si el modelo log-lineal se ajusta a
los datos es graficar el diagrama de dispersión de In Yi frente a In Xi y ver si las observaciones caen
aproximadamente sobre una línea recta como en la figura b.
EJEMPLO 1:
GASTO EN BIENES DURADEROS RESPECTO AL GASTO DE CONSUMO PERSONAL
TOTAL
La tabla 1 muestra los datos sobre el gasto de consumo personal total (GCPERT), el gasto en
bienes duraderos (GASBD), el gasto en bienes perecederos (GASBPER) y el gasto en servicios
(GASERV), todos medidos en millones de dólares de 1992.2
Supóngase que se desea calcular la elasticidad del gasto en bienes durables respecto al gasto de
consumo personal total. Al graficar el logaritmo del gasto en bienes durables en comparación con
el logaritmo del gasto de consumo personal total, se observará que la relación entre las dos
variables es lineal. Por tanto, el modelo del doble logaritmo podría resultar adecuado. Los
resultados de la regresión son:
4
Un modelo de elasticidad constante permitirá obtener un cambio en el ingreso total constante ante un cambio
porcentual dado en precios sin importar el nivel absoluto del precio. Se debe contrastar este resultado con las
condiciones de elasticidad implicadas en una función de demanda lineal simple. Yi = β i + β 2 X i + µ i . Sin embargo,
una función lineal simple permite obtener un cambio constante en la cantidad generado por un cambio unitario en el
precio. Confronte esto con le que implica el modelo log-lineal para un cambio dado en el precio del dólar.
donde r es tasa de crecimiento compuesta de Y (es decir, a través del tiempo). Tomando el logaritmo
natural de (5), podemos escribir
ln Yt = ln Y0 + t ln(1 + r ) 6
Ahora sea
β 1 = lnY0 7
β 2 = ln(1 + r ) 8
ln Yt = β 1 + β 2 t 9
Agregando el término de perturbación a (9), se obtiene5
ln Yt = β 1 + β 2t + µ t 10
Este modelo es igual a cualquier otro modelo de regresión lineal en el sentido de que los parámetros
β1 y β2, son lineales. La única diferencia es que la variable dependiente o regresada es el logaritmo de
Y y el regresor o variable explicativa es el "tiempo", que adquiere valores de 1,2,3, etc.
Modelos como (10) se denominan modelos semilog porque solamente una variable (en este caso la
dependiente) aparece en forma logarítmica. Para fines descriptivos, un modelo en el cual la variable
regresada es logarítmica se denominará modelo log-lin. Antes de presentar los resultados de la
regresión, examínense las propiedades del modelo (9). En este modelo el coeficiente de la
pendiente mide el cambio proporcional constante o relativo en Y para un cambio absoluto
dado en el valor de la variable independiente (en este caso la variable t), es decir,6
5
Se agrega el término error porque la fórmula de interés compuesto no se cumple exactamente.
6
Utilizando cálculo diferencial. se puede demostrar que β 2 = d(ln Y)ldX = (1/Y)(dYldX) = (dYIY)ldX, que no
es otra cosa que (11). Para cambios pequeños en Y y en X, esta relación puede aproximarse mediante
Si se multiplica el cambio relativo en Y por 100, (11) dará entonces el cambio porcentual, o la tasa
de crecimiento, en Y ocasionada por un cambio absoluto en X, la variable independiente. Es decir,
100 por β2 da como resultado la tasa de crecimiento en Y; 100 por β2 se conoce en la literatura
como la semielasticidad de Y respecto a X.
Para ilustrar el modelo de crecimiento (10), considere los datos sobre el gasto en servicios
proporcionados en la tabla 1. Los resultados de la regresión son los siguientes:
Nota: GASER significa gasto en servicios y el asterisco (*) denota que el valor p es
extremadamente pequeño.
La interpretación de la ecuación es que durante un periodo de un trimestre (del primero al tercero
de 1993), el gasto en servicios se incrementó a una tasa (trimestral) de 0.743%. Aproximadamente
esto es igual a un crecimiento anual de 2.972%. Puesto que 7.7890 = log de GES al comienzo del
periodo de análisis, si se toma su antilogaritmo se tiene 2.41390 (billones de dólares), como el
valor inicial de GES (es decir, el valor al final del último trimestre de 1992). La recta de regresión
obtenida mediante la ecuación del ejemplo 2, se ilustra en la figura c.
Figura c
( Yt − Yt − 1 ) / Yt − 1
( Xt − Xt− 1)
Nota: aquí X = t.
Yt = β 1 + β 2 t + µ t 12
Es decir, en lugar de hacer la regresión para el log de Y sobre el tiempo, lo hacen para Y sobre el
tiempo. Un modelo de este tipo se denomina modelo de tendencia lineal y la variable tiempo t se
conoce como la variable de tendencia. Si el coeficiente de la pendiente en (12) es positivo, existe
una tendencia creciente en Y, mientras que si es negativa, existe una tendencia decreciente en Y.
Para los datos concernientes con el gasto en servicios que se analizaron antes, los resultados de
ajustar el modelo de tendencia lineal (12) son los siguientes:
Ejemplo 3 de la Tabla 1
GASERt = 2 405.848 + 19.6920t
t = (322.9855) (36.2479)
R2= 0.9843
"En contraste con la ecuación anterior, la interpretación es la siguiente: durante el periodo
trimestral (del primero al tercero de 1993), en promedio, el gasto en servicios se incrementó a
una tasa absoluta (nota: no relativa) de casi 20 mil millones de dólares por trimestre. Es decir,
hubo una tendencia creciente en el gasto en servicios.
La elección entre el modelo de crecimiento del ejemplo 2 y el modelo de tendencia lineal del
ejemplo 3, dependerá de si se está interesado en el cambio relativo o absoluto en el gasto en
servicios aunque, para propósitos de comparación, es el cambio relativo el que tiene mayor
importancia. Es necesario observar que no se puede comparar los valores de R2 de los modelos de
los ejemplos 2 y 3 porque las variables dependientes son diferentes en los dos modelos.
El modelo Lin-Log
A diferencia del modelo de crecimiento recién estudiado, en el cual se estaba interesado en encontrar
Yi = β i + β 2 ln X i + µ i 13
Para fines descriptivos, llamamos a este modelo un modelo lin-log. Interprétese el coeficiente de la
pendiente β2.7 Como es usual,
cambio en Y cambio en Y
β2= o β2=
cambio en ln X cambio relativo en X
El segundo paso se basa en el hecho de que un cambio en el log de un número es un cambio
relativo.
Simbólicamente, se tiene
∆Y
β2= 14
∆X/X
donde, como es usual, ∆ denota un cambio pequeño. La ecuación anterior puede ser escrita en forma
equivalente así:
∆Y =β2(∆X/X) 15
Esta ecuación plantea que el cambio absoluto en Y (= ∆Y) es igual a la pendiente multiplicada
por el cambio relativo en X. Si este último es multiplicado por 100, entonces (∆Y =β2(∆X/X)) da
el cambio absoluto en Y ocasionado por un cambio porcentual en X.
Así, si ∆X/X cambia en 0.01 unidades (o 1 %), el cambio absoluto en Y es 0.01(β2). Por tanto, si en
una aplicación se encuentra que β2 = 500, entonces el cambio absoluto en Y es (0.01)(500), o 5.0.
Por consiguiente, cuando se utiliza MCO para estimar regresiones como en (13), se debe multiplicar
el valor del coeficiente de la pendiente estimado, β2 por 0.01 o, lo que es lo mismo, dividido entre
100. Si no se tiene lo anterior presente, la interpretación en una aplicación será muy equivocada.
La pregunta práctica es: ¿cuándo resulta útil un modelo lin-log como el (13)? Se ha encontrado una
interesante aplicación en los así conocidos modelos de gasto Engel. Postuló que "el gasto total que
se dedica a los alimentos tiende a incrementarse en progresión aritmética, mientras que el gasto total
aumenta en progresión geométrica" .
EJEMPLO 4:
dY ∆Y
dY 1 β2= = β2=
7
Nuevamente, utilizando cálculo diferencial, se tiene = β 2 Por consiguiente, dX ∆X/X
dX X
x
Los datos para el modelo lin-log, se observan en la tabla 2 además si se grafican estos, se obtiene
la gráfica de la figura d. Tal y como esta figura sugiere, el gasto alimenticio se incrementa en
forma más lenta, conforme el gasto total aumenta, lo cual quizá proporcione sustento a la ley de
Engels. Los resultados de ajustar el modelo lin-Iog a los datos son los siguientes:
Interpretado de la forma antes descrita, el coeficiente de la pendiente, que vale casi 257, significa
que un incremento en el gasto total en alimentos de 1 %, en promedio, propicia un incremento de
casi 2.57 rupias en el gasto en alimento de las 55 familias incluidas en la muestra. (Nota: se
dividió el coeficiente estimado de la pendiente entre 100.)
Antes de seguir, obsérvese que si se desea calcular el coeficiente de elasticidad para los modelos
lin-Iog o log-lin, se puede hacer a partir de la definición del coeficiente de elasticidad dada antes, a
saber:
dY X
Elasticidad =
dX Y
En la práctica, una vez que se conoce la forma funcional de un modelo, se pueden calcular las
elasticidades aplicando la anterior definición.
Figura d
1
Yi = β 1 + β 2 + µ i 16
Xi
A pesar de que este modelo es no lineal en la variable X porque entra inversamente o en forma
recíproca, el modelo es lineal en β1 y β2 y, por consiguiente, es un modelo de regresión lineal. 8
Este modelo tiene las siguientes características: a medida que X aumenta indefinidamente, el
término β2 (1/X) se acerca a cero (nota: β 2 es una constante) y Y se aproxima al valor límite o
asintótico β 1. Por consiguiente, modelos tales como (16) contienen un valor asintótico o límite
que tomará la variable dependiente cuando el valor de la variable X aumente
indefinidamente.9
1
Figura Modelo Recíproco: Yi = β 1 + β 2 + µ i e
Xi
Éstos son datos representativos de 64 países respecto a la mortalidad infantil y a otras variables. Por
el momento, hay que concentrarse en las variables de mortalidad infantil (MI) y PIB percápita
(PIBPC), mismas que se grafican en la figura h.
1
8
Si se define que X i* = (1/X), entonces Yi = β 1 + β 2 + µ i es lineal en los parámetros al igual que en las
X
i
variables Yi y X i*
1
9
La pendiente de Yi = β 1 + β 2 + µ i es: dY/dX = -β2 (1/X2), e implica que si β2 es positivo, la pendiente siempre
X
i
es negativa y si β2 es negativa, la pendiente es positiva. Véanse figuras e y g, respectivamente.
Figura h
1
Figura Modelo Recíproco: Yi = β 1 + β 2 + µ i f y g
Xi
Como puede observarse, esta figura se parece a la figura a conforme el PIB per cápita se
incrementa, se esperaría que la mortalidad infantil disminuyera, debido a que las personas pueden
gastar más en el cuidado de la salud, si se supone que los otros factores permanecen constantes. Pero
la relación no da como resultado una recta: conforme el PIB per cápita se incrementa, al principio
existe una disminución drástica en la MI, pero ésta va disminuyendo en la medida que el PIB per
cápita sigue aumentando.
Si se trata de ajustar el modelo recíproco (16), se obtienen los siguientes resultados:
Ejemplo 5 de la Tabla 3
1
MIi = 81.79436 + 27 237.17
PIBPCi
ee = (10.8321) (3759.999)
t = (7.5511) (7.2535)
R2 = 0.4590
Como lo muestra la figura siguiente, existe asimetría en la respuesta de los cambios salariales al
nivel de desempleo: si la tasa de desempleo está por debajo de U" (denominada por los economistas
como tasa natural de desempleo) por cada unidad de cambio en el desempleo, los salarios aumentan
con mayor rapidez de lo que caen debido a un cambio equivalente cuando la tasa de desempleo está
por encima del nivel natural, β1 indicando la base asintótica para el cambio salarial. Este hecho
particular de la curva de Phillips puede deberse a factores institucionales, tales como el poder de
negociación de los sindicatos, los salarios mínimos, compensaciones por desempleo, etc.
Desde la publicación del artículo de Phillips, se ha llevado a cabo una muy extensa investigación
sobre la curva de Phillips tanto a nivel teórico como empírico. La curva de Phillips ha
experimentado diversas encarnaciones. Una formulación comparativamente reciente la proporciona
Olivier Blanchard, denota la tasa de inflación en el tiempo t, misma que se define como el cambio
porcentual en el nivel de precios, medido por un índice de precios representativo, como el Índice de
Precios al Consumidor (IPC), y si UNt denota la tasa de desempleo en el tiempo t, entonces la
moderna versión de la curva de Phillips se expresa bajo el siguiente formato:
πt−π t
e
= β 2 (UN t − U n ) + µ t 17
donde:
π t = tasa real de inflación en el tiempo t.
π te = tasa real de inflación esperada en el tiempo t, donde la expectativa se forma en el año (t - 1)
UNt = tasa real de desempleo que prevalece en el tiempo t
Un = tasa natural de desempleo en el tiempo t
µt = término error estocástico
Puesto que π
e
t no se puede observar de manera directa, como punto de partida se puede
simplificar suponiendo que π t = π t − 1 ; es decir, la inflación esperada este año es la tasa de inflación
e
que prevaleció el año anterior; por supuesto, se pueden hacer suposiciones más complicadas respecto
a la formación de expectativas, en los modelos de retraso distribuido.
donde β1 = -β2 Un. La ecuación anterior establece que el cambio en la tasa de inflación entre los dos
periodos está linealmente relacionado con la tasa de desempleo real. A priori, se espera que β2 sea
negativa (¿por qué?) y β1 positiva (esto se debe a que β2 es negativa y Un es positiva).
A propósito, la relación Phillips dada en (17) se conoce en la literatura como la curva de Phillips
modificada, la curva de Phillips de expectativas aumentadas (para indicar que π t − 1 significa la
inflación esperada), o la curva de Phillips aceleradora (para sugerir que una baja tasa de desempleo
propicia un incremento en la tasa de inflación y por consiguiente provoca una aceleración del nivel
de precios).
A manera de ilustración de la curva de Phillips modificada, en la tabla 4 se presentan datos sobre
la inflación medida por el porcentaje anual en el Índice de Precios al Consumidor (IPCon inflación)
y la tasa de desempleo para el periodo 1960-1998. La tasa de desempleo representa la tasa de
desempleo civil. A partir de estos datos se obtuvo el cambio en la tasa de inflación ( π t − π t − 1 ) y se
graficó respecto a la tasa de desempleo civil; se está utilizando el IPC como una medida de la
inflación. La gráfica resultante aparece en la figura j.
Como se esperaba, la relación entre el cambio en la tasa de inflación y la tasa de desempleo es
negativa (un desempleo bajo provoca un incremento en la tasa de inflación y por consiguiente una
aceleración del nivel de precios, de ahí el nombre de curva aceleradora de Phillips).
Al observar la figura j, no resulta obvio si un modelo de regresión lineal (una recta) o un modelo
recíproco sea el que se ajuste con los datos; tal vez haya una relación curvilínea entre las dos
variables. Sin embargo, hay que tener presente que para el modelo recíproco se espera que sea
negativo el término intersección y la pendiente positiva, como se hizo énfasis en la nota 6.
Figura Curva de Phillips Modificada j
Ejemplo 6 de la Tabla 4:
Modelo lineal: ( π t − π t − 1 ) = 4.1781 - 0.6895 UNt
t = (3.9521) (-4.0692)
R = 0.3150 2
Ejemplo 7 de la Tabla 4
1
(π t − π t− 1 ) = -3.2514 + 18.5508
UN t
t = (-2.9715) (3.0625)
R2 = 0.2067
Todos los coeficientes estimados en ambos modelos son significativos estadística e individualmente,
además todos los valores de p son menores que el nivel 0.005.
El modelo del ejemplo 6 muestra que si la tasa de desempleo baja un punto porcentual, en promedio,
el cambio en la tasa de inflación aumenta 0.7 puntos porcentuales, y viceversa. El modelo del
ejemplo 7 revela que incluso si la tasa de desempleo se incrementara de manera indefinida, el
máximo cambio en la tasa de inflación bajaría y sería de 3.25 puntos porcentuales. A propósito, de la
ecuación del modelo 6, se puede calcular la tasa de desempleo natural subyacente, de la siguiente
forma:
βˆ1 4.1781
Un = = = 6.0596 19
ˆ
− β 2 0.6895
Es decir, la tasa de desempleo natural es de casi 6.06%. Los economistas sitúan la tasa natural entre
el 5 y el 6%, aunque en años recientes la tasa real de desempleo para Estados Unidos ha sido mucho
más baja.
Su forma se ilustra en la figura k. Se muestra al principio Y se incrementa a una tasa creciente (es
decir, la curva es convexa al inicio) y luego aumenta a una tasa decreciente (la curva se convierte en
cóncava).10 20 Por consiguiente, este modelo sería apropiado para representar una función de
producción a corto plazo. Recuerde que los cursos de microeconomía que si el trabajo y el capital
son insumos en una función de producción y si se mantiene constante el insumo capital pero se
incrementa el insumo trabajo, la relación entre producto y trabajo a corto plazo se parecerá a la
figura k.
Se analizaron las distintas formas funcionales que un modelo empírico puede tomar, incluso dentro
de los confines de los modelos de regresión lineal en el parámetro. La elección de una forma
funcional particular puede ser relativamente fácil para el caso de dos variables, ya que se pueden
graficar las variables y tener así una ligera idea respecto al modelo apropiado. La elección se vuelve
mucho más complicada cuando se considera el modelo de regresión múltiple que involucra más de
una variable independiente.
1. Es una buena práctica calcular la tasa de cambio (es decir, la pendiente) de la regresada, con
respecto a la regresora, así como conocer la elasticidad de la regresada con respecto a la regresara.
Para los diversos modelos estudiados en este capítulo, se proporcionan en la tabla 5 las fórmulas
d 1 1 d 1 dY
10
Del cálculo, se puede demostrar que (ln Y ) = − β 2 − 2 = β 2 2 Pero (ln Y ) =
dX X X dX Y dX
dY Y
Al sustituir, se obtiene = β2 2 que es la pendiente de Y respecto a X.
dX X
X
Lineal Y = β i + β 2X β2 β 2
Y
Y
Log-lineal o log-Iog ln Y = β i + β 2 ln X β 2 β2
X
Log-lin ln Y = β i + β 2 X β2(Y) β2(Y)
1 1
Lin-Iog Y = β i + β 2 ln X β 2 β 2
X Y
1 1 1
Recíproco Y = β i + β 2 − β 2 2 − β 2
X X XY
1 Y 1
Log recíproco ln Y = β i − β 2 β 2 β 2
X X X
Tabla 1
obs GASER GASBD GASBPER GCPERT
1993.I 2445.3 504 1337.5 4286.8
1993.II 2455.9 519.3 1347.8 4322.8
1993.III 2480 529.9 1356.8 4366.6
1993.IV 2494.4 542.1 1361.8 4398
1994.I 2510.9 550.7 1378.4 4439.4
1994.II 2531.4 558.8 1385.5 4472.2
1994.III 2543.8 561.7 1393.2 4498.2
1994.IV 2555.9 576.6 1402.5 4534.1
1995.I 2570.4 575.2 1410.4 4555.3
1995.II 2594.8 583.5 1415.9 4593.6
1995.III 2610.3 595.3 1418.5 4623.4
1995.IV 2622.9 602.4 1425.6 4650
1996.I 2648.5 611 1433.5 4692.1
1996.II 2668.4 629.5 1450.4 4746.6
1996.III 2688.1 626.5 1454.7 4768.3
1996.IV 2701.7 637.5 1465.1 4802.6
1997.I 2722.1 656.3 1477.9 4853.4
1997.II 2743.6 653.8 1477.1 4872.7
1997.III 2775.4 679.6 1495.7 4947
1997.IV 2804.8 648.8 1494.3 4981
1998.I 2829.3 710.3 1521.2 5055.1
1998.II 2866.8 729.4 1540.9 5130.2
1998.III 2904.8 733.7 1549.1 5181.8
Tabla 2
obs GASAL GASTOT obs GASAL GASTOT
1 217 382 31 470 663
2 196 388 32 322 677
3 303 391 33 540 680
4 270 415 34 433 690
5 325 456 35 295 695
6 260 460 36 340 695
7 300 472 37 500 695
8 325 478 38 450 720
9 336 494 39 415 721
10 345 516 40 540 730
11 325 525 41 360 731
12 362 554 42 450 733
13 315 575 43 395 745
14 355 579 44 430 751
15 325 585 45 332 752
16 370 586 46 397 752
17 390 590 47 446 769
18 420 608 48 480 773
19 410 610 49 352 773
20 383 616 50 410 775
21 315 618 51 380 785
22 267 623 52 610 788
23 420 627 53 530 790
24 300 630 54 360 795
25 410 635 55 305 801
26 220 640
27 403 648 GASAL= Gasto en Alimentos
28 350 650 GASTOT= Gasto Total
29 390 655
30 385 662
Tabla 3
Fertilidad y otros datos para 64 paises
Obs MI TAF PIBPC TFT Obs MI TAF PIBPC TFT
1 128 37 1870 6.66 36 41 66 1620 3.91
2 204 22 130 6.15 37 312 11 190 6.7
3 202 16 310 7 38 77 88 2090 4.2
4 197 65 570 6.25 39 142 22 900 5.43
5 96 76 2050 3.81 40 262 22 230 6.5
6 209 26 200 6.44 41 215 12 140 6.25
7 170 45 670 6.19 42 246 9 330 7.1
8 240 29 300 5.89 43 191 31 1010 7.1
9 241 11 120 5.89 44 182 19 300 7
10 55 55 290 2.36 45 37 88 1730 3.46
11 75 87 1180 3.93 46 103 35 780 5.66
12 129 55 900 5.99 47 67 85 1300 4.82
13 24 93 1730 3.5 48 143 78 930 5
14 165 31 1150 7.41 49 83 85 690 4.74
15 94 77 1160 4.21 50 223 33 200 8.49
16 96 80 1270 5 51 240 19 450 6.5
17 148 30 580 5.27 52 312 21 280 6.5
18 98 69 660 5.21 53 12 79 4430 1.69
19 161 43 420 6.5 54 52 83 270 3.25
20 118 47 1080 6.12 55 79 43 1340 7.17
21 269 17 290 6.19 56 61 88 670 3.52
22 189 35 270 5.05 57 168 28 410 6.09
23 126 58 560 6.16 58 28 95 4370 2.86
24 12 81 4240 1.8 59 121 41 1310 4.88
25 167 29 240 4.75 60 115 62 1470 3.89
26 135 65 430 4.1 61 186 45 300 6.9
27 107 87 3020 6.66 62 47 85 3630 4.1
28 72 63 1420 7.28 63 178 45 220 6.09
29 128 49 420 8.12 64 142 67 560 7.2
30 27 63 19830 5.23
31 152 84 420 5.79 MI = Mortalidad Infantil
32 224 23 530 6.5 TAF = Tasa de alfabetismo femenina
33 142 50 8640 7.17 PIBPC =Pib per capita en 1980
34 104 62 350 6.6 TFT = Tasa de fertilidad total
35 287 31 230 7
Dependent Variable: MI
Method: Least Squares
Sample: 1 64
Included observations: 64
Variable Coefficient Std. Error t-Statistic Prob.
C 81.79436 10.83206 7.551136 0.0000
1/PIBPC 27273.17 3759.999 7.253503 0.0000
R-squared 0.459051 Mean dependent var 141.5000
Adjusted R-squared 0.450326 S.D. dependent var 75.97807
S.E. of regression 56.33016 Akaike info criterion 10.93109
Sum squared resid 196731.4 Schwarz criterion 10.99855
Log likelihood -347.7948 F-statistic 52.61330
Durbin-Watson stat 1.959368 Prob(F-statistic) 0.000000
Tabla 4
Tasas de inflación y de desempleo para USA, 1960-1998
Año TSINF TSDES Año TSINF TSDES
1960 1.7 5.5 1985 3.6 7.2
1961 1 6.7 1986 1.9 7
1962 1 5.5 1987 3.6 6.2
1963 1.3 5.7 1988 4.1 5.5
1964 1.3 5.2 1989 4.8 5.3
1965 1.6 4.5 1990 5.4 5.6
1966 2.9 3.8 1991 4.2 6.8
1967 3.1 3.8 1992 3 7.5
1968 4.2 3.6 1993 3 6.9
1969 5.5 3.5 1994 2.6 6.1
1970 5.7 4.9 1995 2.8 5.6
1971 4.4 5.9 1996 3 5.4
1972 3.2 5.6 1997 2.3 4.9
1973 6.2 4.9 1998 1.6 4.5
1974 11 5.6
1975 9.1 8.5 TSINF=Tasa de inflación
1976 5.8 7.7 TSDES=Tasa de desempleo
1977 6.5 7.1
1978 7.6 6.1
1979 11.3 5.8
1980 13.5 7.1
1981 10.3 7.6
1982 6.2 9.7
1983 3.2 9.6
1984 4.3 7.5
1.-La elasticidad y R2 no ayudan a seleccionar la forma funcional adecuada para transformar la no lineal: Si___;
No____.
2.- El especialista Dominick salvadores dice que “Cuando ninguna teoría de la dispersión de puntos es de ayuda, la
función lineal se trata usualmente primero debido a su simplicidad”: SI_____;NO_____.
3.-Las transformaciones de funciones no lineales a lineales mas útiles y comunes son la log-log,log-lin,lin-log, reciproca
y polinomial: Si_____; No________
5.-Al usar la log-log la elasticidad de la variable regresada se obtiene directamente de los valores de las pendientes de
las regresoras: SI:__; NO__.
6.-Al usar la log-log con las pendientes de las variables regresoras no siempre se obtienen economías de escala: SI___;
NO____.
7.-Al usar la log-log si las variables regresoras son factores de la producción, con sus pendientes se pueden obtener
economías de escala cuando la su suma es mayor que 1: SI____; NO______:
8.-Con la forma funcional semilogarítmica se puede calcular la tasa de crecimiento de la variable regresada con la
pendiente de la regresora: SI____;NO_____.
9.- Con la forma funcional recíproca no se puede calcular la curva de Phillips: SI_____; NO____.
:
1
10.- La siguiente es la fórmula de la elasticidad del modelo log recíproco: β 2 : SI____; NO______.
X
B. Observaciones: Cada una de las respuestas correctas vale 10 puntos en escala de 0 a 100.