4 Econometrias

Introducción a la Econometría
VII. MODELO LINEAL SIMPLE, MLS: EJERCICIOS RESUELTOS:9

ANÁLISIS DE REGRESIÓN Y CORRELACIÓN APLICADO A LA ECONOMÍA MEXICANA,
CON MÉTODOS COMPLEMENTARIOS Y/O DIFERENTES9
VII.1 Ejemplos Referidos a la Regresión Simple
Suponga que el consumo (Y) y el ingreso (X) para los últimos 4 años (en millones de pesos) son los
siguientes:
Año (Yi) (Xi) yi xi xi yi xi2

1 3 5 -2 -2 4 4
2 4 6 -1 -1 1 1
3 5 8 0 +1 0 1
4 8 9 +3 +2 6 4
n=4 20 28 0 0 11 10
Y = 20/4=5 X = 28/4=7
Se desea probar la hipótesis de que el consumo en México depende de las variaciones que
experimenta el ingreso, los pasos son los siguientes:
1. Se establece la relación económica entre ambas variables a través de la ecuación de regresión:

 +e
y = a + bX
Donde:
y es el consumo estimado en la muestra del consumo real
a , b son los estimadores de los parámetros reales: a y b
e = y - y residuo o diferencia
Para encontrar los valores de a y b se usan las ecuaciones normales siguientes:
∑ Y = na + b ∑ X
∑ XY = a ∑ X + b ∑ X 2
Cuya solución nos permite obtener:
aˆ =
∑ X 2∑ Y − ∑ X∑ XY
= a = Y − bX

n∑ X 2 − (∑ X )
2
“y”
Profesor Genaro Sánc hez Barajas 73

n∑ XY − ∑ X∑ Y
bˆ =
n∑ X − (∑ X )
2 2
Observaciones: A menudo para simplificar operaciones se desvían los valores de x e y con respecto a
X e Y para obtener b ; y las literales xi e yi se usan para:
xi = X i − X e yi = Yi − Y
Por lo tanto, el cálculo de los estimadores es:
b =
∑ xy i i
=
11
= 11
.
∑ x 2
i 10
 = 5 − (11
a = Y − bX . )7 = − 2.7
Así, la ecuación de regresión estimada es: y = − 2.7 + 11

. Xi
Obsérvese que b tiene signo positivo, lo cual es bueno por que corrobora la teoría económica de que
a medida que aumenta el ingreso (X) también aumenta el consumo (Y).
2. Una vez obtenidos los parámetros a y b , se prueba su significación estadística, es decir, se

verifica si hay o no relación entre el ingreso (X) y el consumo (Y). Para ello se requieren las
varianzas de los dos:
Var.a = σ 2 ∑ X i
2
n∑ x
u 2
donde σ u
i
es la varianza residual
1
Var .b = σ 2
∑ xi2
u
Como generalmente se desconoce σ 2

u , la varianza residual, se estima con S2 que es un estimador
insesgado de σ 2u , cuya formula es:
S = σ =
2 2 ∑ ei2
u
n− k
n = número de observaciones
k = número de parámetros estimados
Así, los estimadores insesgados de las varianzas de a y b son:
74 Profesor Genaro Sánc hez Barajas

S =2 ∑ ei2∑ X i
2
k n∑ x
a
n− 2
i
S =2 ∑ ei2
1
b
n − k ∑ xi2
Derivado de lo anterior podemos decir en general que S aˆ y Sbˆ son los errores estándar de los
estimadores. Como U i tiene distribución normal, Yi , a , b también se distribuyen normalmente, y
como la muestra n = 4 es decir, menor que 30, usamos t con n - k grados de libertad para probar la
hipótesis y construir intervalos de confianza para a y b . Para ello, a partir de los datos de la tabla
anterior, se requiere hacer adicionalmente los siguientes cálculos.
Año yi ei = Yi − y i ei2 Xi2 xi2 yi2

1 2.8 +0.2 0.04 25 4 4
2 3.9 +0.1 0.01 36 1 1
3 6.1 -1.1 1.21 64 1 0
4 7.2 +0.8 0.64 81 4 9
n=4 20 0 1.9 206 10 14
Puesto que:
yˆ i = aˆ + bˆX i
.sustituimos
yˆ1 = − 2.7 + 1.1(5) = 2.8
yˆ 2 = − 2.7 + 1.1(6) = 3.9
yˆ 3 = − 2.7 + 1.1(8) = 6.1
yˆ 4 = − 2.7 + 1.1(9) = 7.2

Gráficamente:
8 yˆ = − 2.7 + 1.1X i
y
7
6
5
4
Consumo
3
2
1
0
-1 0 2 4 6 8 10
-2 x
-3
Ingreso
con estos datos ahora calculamos
S aˆ2 =
∑ ei2 ∑ X i
2
=
1.9 206 391.4
= = 4.8925
n− k n∑ x i
2
(4 − 2) 4(10) 80
S aˆ = 2.2118
Calculamos:
S =2 ∑ ei2
=
1.9
=
1.9
= 0.0950
bˆ
( n − k )∑ x 2
i (4 − 2)(10) 20
Sbˆ = 0.3082
Así, las hipótesis nulas ( Ho) y alternativas ( Ha) se plantean de la siguiente manera:
Ho: a = 0 Ho: b = 0
Ha: a ≠ 0 Ha: b ≠ 0
aˆ − a − 2.7 − 0 bˆ − b 1.1 − 0
ta = = = − 1.2207 tb = = = 3.5691
S aˆ 2.2118 Sbˆ 0.3082
Como se recordará, en el análisis de regresión se espera rechazar Ho y aceptar Ha , es decir que a y b

sean diferentes de cero y por consiguiente, decir que hay relación de Y con X. Ahora bien, puesto
que tα con un nivel de significación del 10% y 2 grados de libertad, es igual a +− 2.910 en tablas
(Apéndice IV) decimos que t∝ = +− 2.920 < tb =3.5691; Luego b es significativo, de tal manera que
aceptamos Ha. Concluimos señalando que si hay relación lineal entre X e Y. También decimos que
a no es significativo lo cual, sin embargo, no preocupa por que no se usa para estos fines. En la vida

real debería ser significativamente diferente de cero y por ser la ordenada al origen indicaría el
consumo mínimo que se realiza, independientemente de las variaciones en X, ingreso.
Gráficamente:
H 0 : b=0
Ha=b ≠0
Aceptamos
RechazamosHH
a o Aceptamos Ha
Rechazamos Ho Rechazamos Ho
-2.920 b +2.920 tα
Como tα < t bˆ rechazamos H0.
Usando Eviews y si consideramos que SER01 es Y y que SER02 es X, los resultados son:
Dependent Variable: SER01

Method: Least Squares
Date: 09/23/08 Time: 21:04
Sample: 2001 2004
Included observations: 4
Variable Coefficient Std. Error t-Statistic Prob.
C -2.700000 2.211900 -1.220670 0.3466

SER02 1.100000 0.308221 3.568871 0.0703
R-squared 0.864286 Mean dependent var 5.000000

Adjusted R-squared 0.796429 S.D. dependent var 2.160247
S.E. of regression 0.974679 Akaike info criterion 3.093437
Sum squared resid 1.900000 Schwarz criterion 2.786584
Log likelihood -4.186873 F-statistic 12.73684
Durbin-Watson stat 2.663158 Prob(F-statistic) 0.070330
Observamos que los valores de los parámetros (coeficientes) como los de sus errores estándar y las
de sus t´s correspondientes son los mismos que obtuvimos manualmente. Aquí es conveniente decir
que al usar Eviews, para probar hipótesis el programa por default usa un nivel de significación
( alfa) igual a 5%, que es la probabilidad de cometer error tipo I: rechazar una hipótesis que es cierta.
Lo anterior, al usar E-views, indicaría en la última columna del cuadro que aparece en la pantalla del
monitor, que Prob debería ser igual a cero si rechazaramos Ho o cuando mucho ser igual a

0.05; sin embargo vemos que Prob toma el valor de 0.0703, es decir, 7.03%, lo cual indica que
aceptamos Ho, en otras palabras, rechazamos Ha y decimos que b no es significativamente diferente
de cero X y concluimos diciendo que con un nivel de significación ( alfa) del 5% y con 2 grados de
libertad que X no explica a Y.
Comentarios: Estos últimos resultados indican que no se corrobora la teoría económica de que el
ingreso determina el consumo. ¿ Podemos aceptar lo anterior ? en términos económicos no es
posible aceptarlo y se sugiere acudir a otra opción: aumentar el tamaño de la muestra ( cuatro datos
son pocos) y usar datos reales y no hipotéticos como éstos que sólo sirvieron para ilustrar el método
y algoritmo correspondiente para probar la hipótesis.
Ahora bien, regresando a los primeros resultados en que si aceptamos Ha con un nivel de
significación de 10% y 2 grados de libertad para tα , con el fin de continuar exponiendo el
método y algoritmo, nos preguntamos ¿En qué magnitud, qué porcentaje de los cambios en Y son
explicados por los cambios en la variable X? La respuesta se obtiene calculando R2 que es el
coeficiente de determinación y cuya formula es:
R = 2 ∑ yi2
= 1−
∑ ei2
∑ yi2 ∑ yi2
Donde: ∑ yi2 = ∑ (Y i − Yi ) 2
En nuestro ejemplo: R = 1 −
2 ∑ ei2
= 1−
1.9
= 1 − 0.1357 ≅ 0.8642 ≅ 86.42%
∑ y 2
i 14
En este sentido el coeficiente de correlación r = R 2 = .8642 = 0.9296 o 92.96% indica que existe
una alta correlación de carácter positivo entre X e Y; el cual es positivo por que b es positivo.
Estos indicadores se interpretan así:
El estimador a = -2.7 es la ordenada al origen Y, o el valor del consumo total cuando el

ingreso disponible es cero.
dY
El estimador b = = 11
. es la pendiente de la línea de regresión estimada que mide la
dX
proporción marginal al consumo PMC o el cambio en el consumo que produce el cambio en
una unidad adicional en el ingreso disponible.
Derivado de b̂ se puede obtener la elasticidad ingreso del consumo E que mide el cambio porcentual
en el consumo como resultado de un cambio porcentual en el ingreso disponible y cuya formula es:

X 7
E = bˆ = 1.1 = 1.54
Y 5
También se puede construir el intervalo de confianza para a y b .; en la practica se determina sólo

para la pendiente, es decir, para b con la formula:
b = b ± t α Sb
donde:
b = parámetro de la población. Con dos grados de libertad y con: ∝ = 5% tenemos ξ = nivel de
confianza = 95% se busca el valor de t∝ en el apéndice IV y se halla que t∝ = ± 4.303
Luego el intervalo de confianza al 95% para b esta dado por:
b = bˆ ± tα Sbˆ
= 1.1 ± (4.303)(0.3082) = 1.1 ± 1.3261
De tal manera que b se halla entre -0.2261 y 2.4261 por lo que -.0.2261< b< 2.4261 con una
confianza o seguridad del 95% y una probabilidad de 5% de que no esté en dicho intervalo.
Recuérdese que las ecuaciones para las relaciones verdaderas (en la población) y estimadas (con la
muestra) entre X e Y son respectivamente:
Yi = a + bX i + µ i
“y”
 + e
y i = a + bX i i
Las ecuaciones para las regresiones verdadera (población) y la estimada (con la muestra) entre X e Y
son respectivamente:
E (Yi ) = a + bX i
“y”

y = a + bX i
Se acostumbra presentar en forma resumida los resultados de la siguiente manera:
y = − 2.71 + 11
. Xi
2
R = 0.8642
r = 0.9296

VII.2 Ejemplos Referidos a la Regresión y Correlación Múltiples
Supóngase ahora que el Consumo (Y) depende del ingreso y de la inversión (Z), tal que:
Y = f ( X , Z )
Cuya ecuación de regresión es Y = a + bX i + cZi
Para encontrar los valores de a, b y c se necesitan las siguientes ecuaciones

normales:
∑ yi = na + b ∑ xi + c ∑ zi
∑ yi xi = a ∑ xi + b ∑ xi2 + c ∑ xi zi
∑ yi zi = a ∑ zi + b ∑ xi zi + c ∑ zi2
Resolviendo este sistema de ecuaciones simultáneas, tenemos:
 ( ∑ xi yi )( ∑ zi2 ) − ( ∑ zi yi )( ∑ xi zi )
b=
( ∑ xi2 )( ∑ zi2 ) − ( ∑ xi zi ) 2
( ∑ zi yi )( ∑ xi2 ) − ( ∑ xi i yi )( ∑ xi zi )
c =
( ∑ xi2 )( ∑ zi2 ) − ( ∑ xi zi ) 2
 − cZ
a = Y − bX  i
i
Aquí a también es la ordenada al origen; b y c se denominan coeficientes de

regresión parciales por que b , por ejemplo, mide el cambio en Y por variaciones
unitarias en X i (el ingreso), mientras se mantiene constante la inversión (Z i );
igualmente, c mide los cambios en Y como resultado de cambios unitarios en la
inversión (Z i ), mientras el ingreso (X i ) se mantiene constante. Así, tomando como
referencia los datos anteriores para Y i , X i , les agregamos los de Z i y tenemos.
Año Yi Xi Zi yi xi zi xiyi ziyi xizi x2 z2 i i
1 3 5 1 -2 -2 -1 4 2 2 4 1
2 4 6 2 -1 -1 0 1 0 0 1 0
3 5 8 3 0 +1 +1 0 0 1 1 1
4 8 9 2 +3 +2 0 6 0 0 4 0
N=4 20 28 8 0 0 0 11 2 3 10 2

Y = 5; X = 7; Z = 2
yi = Yi − Y ; xi = X i − X ; zi = Zi − Z
Sustituyendo:
(11)(2) − ( 2)(3) 22 + 6 16
bˆ = = = = 1.4545
(10)(2) − (3) 2 20 − 9 11
(2)(10) − (11)(3) 20 − 33 − 13
cˆ = = = = − 1.1818
(10)(2) − (3) 2 20 − 9 11
aˆ = (5) − (1.4545)(7) − [ − 1.1818(2)] = 5 − 10.1815 + 2.3636 = − 2.8182
La ecuación de regresión será: yˆ i = − 2.8182 + 1.4545 X i − 1.1818Z i
Para encontrar cada yi sustituimos los valores de X i e Z i :
yˆ1 = − 2.8182 + 1.4545(5) − 1.1818(1) = − 2.8182 + 7.2727 − 1.1818 = 3.2727

yˆ 2 = − 2.8182 + 1.4545(6) − 1.1818(2) = − 2.8182 + 8.7272 − 2.3636 = 3.5455
yˆ3 = − 2.8182 + 1.4545(8) − 1.1818(3) = − 2.8182 + 11.6364 − 3.5455 = 5.2727
yˆ 4 = − 2.8182 + 1.4545(9) − 1.1818(2) = − 2.8182 + 13.0909 − 2.3636 = 7.9091
Para probar la significación de los parámetros a, b , c hacemos los siguientes

cálculos a partir de la tabla anterior:
Año Y X Z y i e e2 y i2
1 3 5 1 3.2727 -0.2727 0.0744 4
2 4 6 2 3.5455 0.4545 0.2066 1
3 5 8 3 5.2727 -0.2727 0.0744 0
4 8 9 2 7.9091 0.0909 0.0083 9
n=4 20 28 8 20 0 0.3636 14
Sabiendo que para probar la significación estadística de los parámetros a, b , c se

requiere conocer sus varianzas que vienen dadas por:
Como dijimos antes a no es de interés primordial, luego:
Varbˆ = σ 2 ∑ zi2
∑ xi2 ∑ zi2 − (∑ xi zi ) 2
u
Varcˆ = σ 2 ∑ xi2
∑ xi2 ∑ zi2 − (∑ xi zi ) 2
u

Ahora bien, como no conocemos σ 2u , usamos S 2 , la varianza residual, como su

estimador insesgado, es decir E (S 2 ) = : σ 2u
S = σ =
2 2 ∑ ei2
u
n− k
donde:
n = número de años
k = número de estimaciones, de parámetros estimados
Así, los estimadores insesgados de la varianza de b , c , serán:
S =
2 ∑ ei2 ∑ zi2
; Sb = Sb2
b
n− k ∑x∑
i
2
z − (∑ xi zi )
i
2 2
S =
2 ∑ ei2 ∑ xi2
; Sc = Sc2
∑x∑ z − (∑ xi zi )
c
n− k i
2
i
2 2
donde:
Sb , Sc son los errores estándar de los estimadores
Sustituyendo tenemos:
0.3636 2 0.3636 2 0.7272

Sb2ˆ = = = * = = 0.0661; Sbˆ = 0.2570
4− 3 (10)(2) − (3) 2
1 11 11
0.3636 10 0.3636 10 3.6360
Scˆ2 = = = * = = 0.3305; Scˆ = 0.5749
4− 3 (10)(2) − (3) 2
1 11 11
VII.2.1 Prueba de hipótesis con t, F, X 2 , LM y Jarque-Bera
Para probar las hipótesis nulas
Planteamos: también:
Ho: b = 0 Ho: c = 0
Ha: b ≠ 0 Ha: c ≠ 0
luego:
bˆ − b cˆ − c
tb = = tc = =
Sbˆ Scˆ
1.4545 − 0 − 1.1818 − 0
= = 5.6595 = = − 2.0556
0.2570 0.5749

Así, ahora buscamos en el Apéndice que trae los valores “teóricos” de t, vemos que
el valor de t ∝ con ∝=5% y un grado de libertad, es t ∝ =± 12.706. Como t b , t c no
exceden t ∝ decimos que b, c no son estadísticamente significativos, es decir, se
rechaza H a y en este caso, se concluye diciendo que se acepta H o , lo que indica que
no hay relación de Y con X e Z.
Gráficamente para b
H 0 : b=0
Ha=b ≠0
Aceptamos Ha Aceptamos Ha
-12.706 b +12.706 tα
Gráficamente para c
H 0 : c=0
Ha=c ≠0
Aceptamos Ha Aceptamos Ha
-12.706 c +12.706 tα
Como tα > tbˆ y que tc , aceptamos H0 es decir no hay relación de Y con X e Z.

Igualmente, al usar E-views, la columna “probabilidad”, en este caso debe mostrar una probabilidad
diferente de cero, lo cual indica que b̂ y ĉ no son estadísticamente significativas.
La estadística Jarque- Bera
Por otra parte, también se usa la ESTADÍSTICA JARQUE-BERA (JB) para probar el
comportamiento normal de la hipótesis o supuestos establecidos cuando usamos el método de
mínimos cuadrados ordinarios para estimar los valores poblacionales, basados en los momentos de
una variable (Sánchez Barajas. 2005:98). El algoritmo para su cálculo involucra a la asimetría con

respecto a la media aritmética y a la kurtosis, señalándose que para que el modelo de regresión sea
normal se requiere que la asimetría sea igual a cero y que la kurtosis sea igual a 3. Ello significa que
la prueba de JB es una prueba conjunta de los coeficientes de asimetría (cero) y de kurtosis ( 3). Se
espera que el valor estadístico JB sea igual a cero y si está cercano a cero se espera encontrar un
comportamiento normal de los residuos de la variable endógena. Una vez obtenido el coeficiente
JB se compara su valor con el histograma de los residuos ( en el eje de las x´s) derivados del
número de observaciones ( en el eje de las y´s) para fundamentar gráficamente la congruencia de su
valor con los valores de los coeficientes de asimetría y de kurtosis. Su aplicación es adecuada en
muestras grandes para demostrar la asintoticidad de los residuos ( obtenidos con MCO) de la
variable aleatoria( variable dependiente) .
La formula de la estadística Jarque – Bera (JB) es:
n  2 ( K − 3) 
2
JB =  S + 
6 4 
Donde:
n = Tamaño de la muestra.
S = Coeficiente de asimetría.
K = Coeficiente de kúrtosis.
Sabemos que cuando la variable se distribuye normalmente S = 0 y K = 3, por lo que la prueba JB de

normalidad en realidad es una prueba de hipótesis conjunta de que S y K son 0 y 3, respectivamente.
Cuando sucede así, el valor de JB es igual a cero.
Ejemplo hipotético: Si S = 0.232445, K = 2.165576 y n = 24, entonces:
24  ( 2.165576 − 3) 
2
 ( 0.232445) +
2
JB =  = 0.912386
6  4 
La hipótesis de normalidad del modelo se plantea así:
H0= JB=0 Supone que los residuos (e) de la variable aleatoria se distribuyen normalmente
Ha= JB≠ 0 Supone que no hay normalidad en la distribución de los residuos (e) de la variable
aleatoria
Ahora bien, cuando se usa Eviews, si E-views indica que el valor de JB es menor que el valor de χ
2
(chi-cuadrada, estadística con la que se compara por corresponder a la estadística no paramétrica,
pero sobre todo porque estos dos autores demostraron que su estadístico JB, de residuos o término
n  2 ( K − 3) 
2
de error, se distribuye asintóticamente, i.e., JB =  S +  sigue la distribución de χ 2 ,

6 4 
es decir que la variable no tiene un comportamiento normal), entonces aceptamos H0 porque revela
que el modelo tiende a la normalidad; aceptamos la hipótesis nula.

Lo anterior dicho en términos del concepto “probabilidad” que también Eview muestra, es que
cuando la probabilidad de JB es mayor que el nivel de significación, α=5%, se acepta la Ho porque
en ese caso JB es cercano a cero. Dicho en otras palabras, cuando la “probabilidad” es menor que
5%, entonces se acepta Ha porque JB difiere significativamente de cero.
Comentarios: considero que con el enfoque tradicional del método de momentos con respecto a la
media aritmética se detecta con mayor exactitud el comportamiento normal o no normal de la
variable endógena, además de que no tiene la restricción de que la muestra sea grande.
La prueba LM
Es parte de una serie de instrumentos alternativos que podemos usar con Eviews para contrastar las
autocorrelación serial, usando los errores residuales y las variables explicativas, a las que una vez
que se ha calculado la ecuación de regresión, se puede acceder desde la ventana “View”/residual
test / correlogram Q –statistics) y concretamente, está en el test de correlación serial de Breusch-
Godfrey ( Serial Correlation LM test).
Dado que hace mucho más sentido ver el autocorrelograma y la estadística Q posteriormente en
series de tiempo. Ahora nos centraremos en el uso de LM para continuar analizando la bondad del
Modelo, i.e., verificar si es bueno, si está bien estructurado para luego hacer pronósticos.
Referencias: E-views en una serie de tiempo también calcula estadísticas para probar la correlación
serial o autocorrelación, con la prueba LM. La correlación serial o autocorrelación emerge cuando se
viola el supuesto básico del Modelo clásico de Regresión lineal de que las ei. obtenidas en el
cálculo de la ecuación de regresión, de que son aleatorias, independientes o no correlacionadas,
situación que provoca que las pruebas t, F, χ 2 , aplicadas para probar hipótesis no producen
resultados contundentes para tomar decisiones al perderse algunas de las propiedades de los
estimadores; por ejemplo, cuando se identifica que hay autocorrelación serial, los estimadores MCO
dejan de ser eficientes, aun cuando continúan distribuyéndose asintótica y normalmente, además de
que aun son insesgados y consistentes.
como se verá más adelante, la autocorrelación serial puede emanar en una serie de tiempo de: a).- la
inercia de los términos u observaciones de las series temporales, b).- del sesgo que surge cuando no
se incluye una variable explicativa relevante para la teoría económica en verificación; c).- del uso de
una forma funcional inapropiada; d).- de la transformación inadecuada de datos, etc.
De lo anterior se intuye la importancia de distinguir entre una autocorrelación “pura” y una

“inducida”, que puede derivarse de alguna de estas fuentes mencionadas. Para distinguirla en la
práctica se parte o usa el mecanismo o esquema autorregresivo de primer orden de Markov, que
según Gujarati ( 2003) “que supone que la perturbación en el tiempo actual está linealmente
relacionada con el término de perturbación en el tiempo anterior”, por lo que en este caso ei se le
conoce como residuo rezagado. Así, la identificación de la naturaleza u origen de interdependencia
de las ei ayuda a corregir la correlación serial. Dicha interdependencia se mide con el coeficiente
de aautocorrelación (ρ). Luego al conocerse (ρ) la autocorrelación serial puede corregirse o
eliminarse, por ejemplo, transformando los datos “diferenciándolos en cierto orden” , como se verá
más adelante cuando se estudien las series de tiempo.

Terminaremos diciendo ahora que el método de diferenciación generalizado basado en el

conocimiento de (ρ) es muy importante además, porque con él también se pueden obtener los
parámetros de la ecuación de regresión transformada mediante MCO, y que a este método de
estimación se le llama “factible o estimado”, que es muy útil cuando se trabaja con muestras grandes
porque asegura las propiedades básicas de los estimadores pero, cuando ρ ≤ 0.3 o cuando las
muestras son pequeñas, se aconseja mejor usar MCO para estimar los parámetros del modelo. En
resumen este método al trabajar con muestras grandes es muy útil porque además de corregir la
correlación serial o autocorrelación, también elimina la heteroscedasticidad cuando existe.
En este contexto diremos que la prueba LM verifica el grado de asociación entre la(s) variable(s)
exógena(s) y el residual rezagado (ei) en ciertos periodos (Pulido, et al: 155), es decir, con esta
prueba los errores residuales del modelo se explican con un modelo auxiliar por sus propios rezagos
o retardos conjuntamente con las variables exógenas del modelo que explica la teoría económica.
Así, si el modelo resulta significativo estadísticamente, se dice que existe autocorrelación serial y
que debe corregirse por las razones arriba señaladas.
Con Eviews partimos de que ya existe la base de datos y de que ya establecimos la teoría
económica, de forma que al ir a Quick/ estímate equation/ ok obtenemos el cuadro que contiene la
ecuación de regresión y que contiene la pestaña “view”/residual test/serial Correlation LM test/
aparece la ventana en que automáticamente nos sugiere 2 como el número de “lags”: retardos a
considerar para hacer la prueba sobre la autocorrelación serial. Al respecto, ese número de retardos o
rezagos se corresponde con el orden más alto de la autocorelación que se pretende identificar, ergo,
1 si es anual, 2 si es semestral, 4 si es trimestral etc.
Así suponiendo el siguiente caso para un modelo anual Eviews propuso en automático el número 2
de lags y aparece la siguiente tabla:
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 2.721286 Probability 0.098100

Obs*R-squared 5.058506 Probability 0.079719
Test Equation:
Dependent Variable: RESID
Date: 09/22/09 Time: 02:18
Presample missing value lagged residuals set to zero.
C -1827.532 49633.56 -0.036820 0.9711

IMPORTACIONES 0.020746 0.096828 0.214257 0.8332
RESID(-1) 0.568199 0.289518 1.962572 0.0685
RESID(-2) -0.072421 0.304288 -0.238000 0.8151

R-squared 0.266237 Mean dependent var 1.29E-10

Sum squared resid 4.41E+11 Schwarz criterion 27.32451
Comentarios: En la parte superior aparecen sombrados los datos básicos para aceptar o rechazar la
hipótesis nula: la prueba F de nulidad conjunta de todos los coeficientes asociados a los residuos
desplazados ( rezagados o retardados), en concordancia con un contraste de validación global del
modelo (Obs* R-squared), en tanto que en la parte inferior se describe la estimación del modelo
auxiliar utilizado para arribar a la prueba de la hipótesis nula de autocorrelación.
Interpretación: Decimos que con la prueba Breusch-Godfrey Serial Correlation LM test, se rechaza
la hipótesis nula, que dice Ho: no hay autocorrelación de cualquier orden inferior a ρ ( donde
ahora ρ es el número de retardos seleccionados, Pulido et al: 156), siempre y cuando la
“probabilidad” de ocurrencia de estas dos estadísticas sea menor que 5%. Se aceptará la Ha que
dice : si hay autocorrelación, siempre y cuando la probabilidad sea mayor que 5%. Luego como en
ambos estadísticas la probabilidad de que ocurran es mayor que 5%, decimos que existe
autocorrelación serial, lo que se comprueba con el valor 1.86 de la estadística Durbin-Watson ( que
debería ser 2) y por consiguiente debemos eliminarla usando cualesquiera de los procedimientos
arriba señalados.
En seguida se calcula R 2 , que en regresión múltiple se determina así:
R2 = 1−
∑ ei2
= 1−
0.3636
= 0.9740
∑ y2
i 14
Al respecto como se recordará, el valor de R 2 oscila entre 0 y 1. Es cero cuando la

ecuación de regresión no explica nada de la relación de X con Y; es 1 cuando si
explica todo y por ello todos los puntos se ubican sobre la línea de regresión. En
este caso vemos que R 2 tiene un valor muy cercano a 1, se dice que X e Z i sí
explican a Y.
Sí R 2 hubiera resultado cercana a 0, se diría que X e Z i no explicaban a Y por lo

tanto no tiene caso calcular r , coeficiente de correlación.
Por otra parte cuando se toma en cuanta la reducción de grados de libertad a

medida que se agregan variables independientes, como en este caso, se calcula R 2 ,
que es R 2 ajustado, y cuya fórmula es:
n− 1
R 2 = 1 − ( 1 − R2 )
n− k

Con nuestros datos sería:
4− 1
R 2 = 1 − (1 − 0.9740) = 1 − 0.078 = 0.9220
4− 3
VII.3. El uso de variables ficticias como variables explicativas en la regresión y

correlación múltiple.
Comenta el Profesor Mason ( 2001, 480) que en ocasiones es conveniente usar

variables cualitativas, denominadas ficticias, dicotómicas, binarias, categóricas o
dummy (en inglés), para explicar mejor la variable dependiente, también llamada
regresada, endógena o explicada. Ahora bien, hasta el momento hemos usado
variables cuantitativas como variables exógenas; sin embargo, una vez que se toma
la decisión de también incluir variables cualitativas ( ficticias ), por ejemplo el
sexo, religión, ocupación, grado de estudios, etc. éstas sólo tienen dos resultados,
que se codifican como 1 y 0, es decir al describir una cualidad, se codifican con 1
si la tienen y 0 cuando no la tienen.
Derivado de lo anterior, en opinión de Gujarati (2003) las variables dicotómicas

son un recurso para clasificar datos en categorías mutuamente excluyentes, como
digamos el sexo se clasifica en dos categorías: femenino y masculino.
Ahora bien, cuando un modelo de regresión sólo incluye variables explicativas que
son cualitativas se denominan modelos de análisis de varianza, ANOVA. Así, por
ejemplo, sirven para probar si estadísticamente dos o más promedios difieren
significativamente y por esa razón son una extensión de la prueba t que prueba
dicha diferencia estadística sólo para dos promedios.
Cuando el modelo contiene variables explicativas que son cualitativas y

cuantitativas, se llama modelo de análisis de covarianza , ANCOVA, que como
puede intuirse, es una generalización de un modelo ANOVA, y en el que sus
variables cuantitativas se denominan covariantes.
Lo anterior visto en el contexto de la regresión lineal indica que los modelos

ANOVA se usan para evaluar la significación estadística de la relación entre una
variable dependiente, que es cuantitativa, con una o varias independientes, que son
cualitativas, en tanto que un modelo ANCOVA se usa para evaluar la significación
estadística de la relación entre una variable dependiente, que es cuantitativa, con
varias independientes, en que al menos una de ellas es cuantitativa o covariante.
Ejemplo: la Empresa “ Arriba Juárez” desea calcular los costos de calefacción (Y)
durante el invierno pasado y verificar si tienen dichos costos relación con la
temperatura (X 1 ), el aislamiento térmico (X 2 ), y la existencia de un “garage” en las
casas (X 3 ). Así, la variable independiente “garage” es cualitativa y se define con 0

cuando las casas no tengan garage y con 1 cuando lo tengan. Para ello toma una
muestra de 20 casas y encuentra que:
Casa Y= costo X 1 =Temperatura X 2 =aislamiento X 3 = garage

calefacción. grados, Farenhait pulgadas de
protección:
1 $250 35 3 0
2 360 29 4 1
3 165 36 7 0
4 43 60 6 0
5 92 65 5 0
6 200 30 5 0
7 355 10 6 1
8 290 7 10 1
9 230 21 9 0
10 120 55 2 0
11 73 54 12 0
12 205 48 5 1
13 400 20 5 1
14 320 39 4 0
15 72 60 8 0
16 272 20 5 1
17 94 58 7 0
18 191 40 8 1
19 235 21 9 0
20 139 30 9 0
Resolviendo el modelo por MINIMOS CUADRADOS ORDINARIOS con el

software EVIEWS se encontró la siguiente ecuación de regresión múltiple:
Y= 443.21-4.38X1-14.64X2+51.71X3
Donde 443.21=a ; 4.38=b ; 14.64=c ; 51.71=d
Dado que :
Dependent Variable: Y
Date: 09/18/08 Time: 13:50
Sample: 2001 2020
C 443.2091 47.98605 9.236208 0.0000

X1 -4.378694 0.716168 -6.114056 0.0000

X2 -14.64111 4.279506 -3.421215 0.0035
X3 51.71378 25.69781 2.012381 0.0613

Al analizar los signos de los coeficientes o parámetros se observa que la teoría

económica se cumple porque efectivamente hay una relación inversa entre Y e X1,
como también existe con X2, pero en cambio, es positiva con X3. Lo anterior es un
buen indicio que indica que podemos hacer el análisis deseado.
Con estas referencias, entonces digamos por ejemplo, que se tienen dos casas
iguales, una junto a la otra, en Ciudad Juárez, una tiene garage y la otra no; ambas
tienen 3 pulgadas de aislamiento térmico y la temperatura media en enero fue de 20
grados farengheit. Para la casa sin garage, X3 se sustituye por 0 en la ecuación de
regresión. Así, el costo estimado de calefacción es de $280.90/mes, ya que
Y= 443.21-3.9628(20)-11.334(3)+51.71(0)= $ 311.69/mes
Para la casa con garaje, X3=1, luego
Y= 443.21-3.9628(20)-11.334(3)+51.71(1)= $ 363.40/mes
Su diferencia es 363.40-311.69= $51.71, luego se estima que el costo de calentar
una casa con garage es $51.71 mayor que el costo de una casa equivalente sin
garage. Pero ¿es significativa estadísticamente esta diferencia?
La respuesta se obtiene probando la hipótesis nula siguiente.
Ho: d=0 ;
Ha: d ≠ 0
Con α = 5% se prueba la hipótesis usando la estadística t como en los ejemplos

anteriores, tal que se obtiene la t calculada (también llamada empìrica) igual a
3.40, misma que se compara con la t de tablas (también llamada teórica), la cual
con α = 5% y n-k= 20-4 = 16 grados de libertad resultó ser igual a 2.21. Como la t
empírica resultó estar fuera de la zona de aceptación de la t “teórica”, es decir,
está en la zona de rechazo de que d=0, entonces vemos que el coeficiente de
regresión d no es cero, aceptamos la Ha, de manera que concluimos indicando que
el garage si es una variable explicativa de los costos de calefacción en las casas,
por lo que $ 77.40 es una diferencia significativa en el costo de calentar una casa

en invierno en Ciudad Juárez. Luego entonces si es conveniente incluir la variable

independiente X3 en el análisis de costos de calefacción.
VII.3.1 El coeficiente de correlación de Spearman.

Dominick Salvatore (1993:105) presenta el siguiente ejemplo ilustrativo sobre
cómo medir la asociación que existe entre dos variables cualitativas.
Dados los siguientes datos

a) Hallar el rango o coeficiente de correlación de Spearman entre la nota de
mitad de curso y el rango del CI (coeficiente de inteligencia) de una muestra
aleatoria de 10 estudiantes de una gran clase, tal como la de la tabla
siguiente.
b) ¿Cuándo se usa la correlación por rango?
Respuestas:
Con los siguientes datos:
Nota de mitad de curso y rangos de CI

Estudiante 1 2 3 4 5 6 7 8 9 10
Nota de mitad de curso 77 78 65 84 84 88 67 92 68 96
Grado de CI 7 6 8 5 4 3 9 1 10 2
6∑ D 2
a) r ' = 1 −
n(n 2 − 1)
donde
D= diferencia entre rangos de pares correspondientes de las dos variables (en orden
ascendente o descendente, con el rango medio asignado a observaciones del mismo
valor).
n= número de observaciones.
6∑ D 2 6(10.50) 63
r' = 1− = 1− = 1− ≅ 0.94
n(n − 1)
2
10(99) 990

Cálculos para hallar el coeficiente de correlación por rangos

Nota de mitad Rango sobre
n Grado de CI D D2
de ciclo medio ciclo
1 96 1 2 -1 1
2 92 2 1 1 1
3 88 3 3 0 0
4 84 4.5 4 0.5 0.25
5 84 4.5 5 -0.5 0.25
6 78 6 6 0 0
7 77 7 7 0 0
8 68 8 10 -2 4
9 67 9 9 0 0
10 65 10 8 2 4
∑ D2 = 10.5
b) La correlación por rangos se usa con datos cualitativos tales como profesión,
educación, sexo, etc. cuando, por la ausencia de valores numéricos, no se puede
encontrar el coeficiente de correlación. La correlación por rangos también se usa
cuando no se tienen disponibles valores precisos para todas o algunas de las
variables (así que, una vez más, no se puede encontrar el coeficiente de
correlación). Aún más, con un gran número de observaciones de valores grandes, r’
se puede hallar como una estimación de r con el fin de evitar cálculos muy
dispendiosos (sin embargo, el fácil acceso a las computadoras ha eliminado esta
razón para usar r’).
VII.4.- Preparación de exámenes sobre regresión y correlación
EJERCICIO CON RESPUESTAS : REGRESIÓN Y CORRECCIÓN SIMPLE.
Nombre del alumno:____________________________________________________
Planteamiento: La teoría económica establece que el consumo, Y i , es función del

ingreso, X i , relación que en los últimos años es:
Años Yi Xi
1 102 114
2 100 118
3 108 126
4 110 130
5 122 136
6 124 140
7 128 148
8 130 156
9 142 160
10 148 164
11 150 170
12 154 178

Se estima la regresión y se hallan los siguientes resultados:

Ŷi = 2.30+0.86X i
donde:
a= 2.30, b=0.86
S a = 7.17, S b =0.05
Preguntas:
1. ¿Cuál es el significado de a y de b?
El estimador a=2.30 es la ordenada al origen y el valor del consumo total cuando el
ingreso disponible es cero. Como a>0 se confirma que siempre habrá un consumo
dY
básico. El estimador b = = 0.86 es la pendiente de la línea de regresión estimada.
dX
Mide la propensión marginal al consumo o el cambio que experimenta el consumo
con el cambio en una unidad adicional en el ingreso. Como 0<b<1 confirma la
teoría del consumo de que las personas incrementan sus gastos de consumo cuando
aumenta el ingreso disponible, pero en menor proporción que este.
X
2. Sabiendo que η = b
Y
Donde:
η = Elasticidad ingreso del consumo
X = 145
Y = 127
Calcule e interprete η
X 145
Tenemos η = b= * 0.86 = 0.98
Y 127
Interpretación: η mide el cambio porcentual en consumo derivado de un cambio
porcentual en el ingreso disponible.
3. Describa las hipótesis nula y alternativa para probar la

significancia estadística de los parámetros de la ecuación de regresión
estimada.
Para probar la significación estadística de los parámetros poblacionales α y β con
los muestrales a y b establecemos:
Hipótesis nula: H o : α =0 versus H A : α ≠ 0
H o : β =0 versus H A : β ≠ 0
Al investigador le interesa rechazar H o y aceptar H A , es decir que α y β ≠0 con una
prueba de dos colas, por lo general salvo planteamientos específicos.
4. ¿Cuál es la forma de la distribución muestral de a y b?.

Como se supone que Ui tiene una distribución normal, Yi también tiene una
distribución normal (dado que se supone que Xi es fija). Como resultado a y b
también tienen distribución normal.
5. ¿Qué distribución se usa para probar la significación

estadística de α y β ?.
Se establece usar la distribución t de student porque α y β tienen distribución normal, pero se
desconocen, y n<30.
6. ¿Para que sirven los grados de libertad y cuántos son?

Los grados de libertad sirven para mejorar la exactitud o bondad de ajuste de los
estimadores a y b. Se calculan con n-k =12-2=10
7. Con α =5% pruebe si α y β son estadísticamente significativos.

Interprete los resultados.
aˆ − a 2.30 − 0
ta = = = 0.32 . Dado que tα = ± 2.228 en una prueba de dos colas decimos
S aˆ 7.17
que no es significativa estadísticamente: no rechazamos Ho:
bˆ − b 0.86 − 0
Igualmente si tb = = = 17.2 . Como t b >t a decidimos aceptar H A y decimos
Sbˆ 0.05
que β es estadísticamente significativa, que X i si explica a Y i . Observación si
hubiéramos aceptado H o , no se cumpliría la relación hipotética de Y i con X i , mismo
que debemos modificar y reestimar hasta lograr una relación estimada de consumo
satisfactoria.
8. Construya la banda de confianza al 95% para α y β .

La banda o intervalo de confianza se construye así: α = a ± tα S a = 2.30 ± 2.228(7.17) = 2.30 ± 15.97
Tal que α está entre –13.67 y 18.27 con confianza del 95%. Como dice Salvatore
(1991:103) el intervalo es más amplio (e insensato), lo cual es consecuencia de que
altamente insignificativa.
Para β tenemos β = b ± tα Sb = 0.86 ± 2.228(0.05) = 0.860 ± 0.11 , decimos que β está entre 0.75 y
0.97, en otras palabras 0.75< β <0.97 con 95% de confianza. Al no incluir este intervalo de
confianza el cero podemos decir que Xi si explica a Yi.
9. ¿Cuántos usos tiene el error estándar de S a y S b ?

Aquí son 2: probar hipótesis y para la banda de confianza pero también sirve para
obtener matemáticamente el tamaño de la muestra.
10. Encontrar R2 con cualquiera de los métodos conocidos e

interprételo.
Tenemos R 2 =0.9687 ó 96.87% indica que la variable dependiente es explicada en un
96.87% por las variables independientes.

PRACTICA A RESOLVER : REGRESIÓN Y CORRECCIÓN SIMPLE.
Nombre del alumno:____________________________________________________
1. ¿Porqué es mejor el método de mínimos cuadrados para estimar parámetros

muestrales de los parámetros de la población?
2. Explique las propiedades de los estimadores obtenidos con el método de
mínimos cuadrados.
3. ¿Qué es un estimador insesgado?
4. ¿Qué es un estimador consistente?
5. ¿Qué es un estimador suficiente?
6. ¿Qué es un estimador eficiente?
7. Explica las hipótesis de supuestos básicos del modelo de regresión lineal
clásico.
8. Con los datos de Y i : inversión en miles de pesos, X i : tasa de interés en
porcientos, estime la ecuación de regresión de Y i sobre X i .
Yi Miles de Xi Tasa de
pesos interés
6 9
8 10
8 8
7 7
7 10
12 4
9 5
8 5
9 6
10 8
10 7
11 4
9 9
10 5
11 8
9. Con los datos anteriores probar con un nivel de significación del 5%, la significación
estadística de los parámetros α y β .
10. Hallar e interpretar R2 y R 2

Curso de introducción a la econometría: Facultad de Economía de la UNAM

Dr. Genaro Sánchez Barajas : Segundo examen parcial.
Nombre del alumno………………………………………………………calif_______
Regresión y Correlación Múltiples
Suponga que la teoría económica establece que la rentabilidad de la inversión (Y) depende de la tasa de interés (X) y de
la inflación (Z), tal que:
Y = f ( X , Z )
T om ando como refer enci a l os dat os para Y i , X i , Z i y si t enemos.
Añ o Yi Xi Zi
1 7 9 1
2 8 8 2
3 7 9 3
4 8 7 2
Preguntas:
1.- Obtenga la ecuación de regresión: Y = a + bX i + cZi
2.- Encuentre el valor para cada yi donde i=1,2,3,4:
3.- Encuentre el valor del error residual
4.- Pruebe la hipótesis nula de que la rentabilidad de la inversión depende de la
tasa de interés y de inflación, con un nivel de significación del 5% e interprete los
resultados.
5.-Calcule R, R2, R 2 y junto con t,F, y con el error estándar de estimación interprete sus resultados.
Requisitos para resolver el examen: Traer sus tablas estadísticas, calculadoras y demás
instrumentos que les ayuden a hacerlo correctamente y con eficiencia en el tiempo de dos horas.
Observaciones: la respuesta a cada pregunta vale 20 puntos. Se puede usar la calculadora, las tablas
estadísticas y los formularios de cada tema.

VIII. MODELO LINEAL GENERAL O MÚLTIPLE, MLG: REGRESIÓN Y CORRELACIÓN

MÚLTIPLE APLICADA A LA VERIFICACIÓN DE UNA TEORÍA ECONÓMICA
Con el fin de ilustrar el uso de este instrumental en el desarrollo de una teoría económica a
continuación se presenta un caso. Hasta el momento hemos visto como se construye
matemáticamente la relación entre una variable dependiente (Y) y las independientes: X 1, X2, en
esta ocasión, aprovechando la exposición anterior, también aplicaremos la regresión múltiple
considerando el factor tiempo. Este factor es muy importante por que además de que permite
conocer el dinamismo del fenómeno bajo estudio (Y), permite predecirlo, es decir, estimar su valor
futuro.
La predicción es muy importante en economía por que permite visualizar, con cierta seguridad, cual
será el comportamiento de una variable (Y) en el futuro, en función de las variables independientes:
X1, X2 .
VIII.1 Ecuación de Regresión Múltiple
Con base en este enfoque a continuación se expone un ejercicio que permitirá ilustrar:
a) Como se prueba la teoría económica de que el consumo (Y) depende del ingreso disponible
(después de impuestos) (X1) y de la inflación (X2); de X1 en forma positiva y de X2 en forma
negativa.
b) Su comportamiento futuro
Así, para desarrollar el primer punto diremos que los datos en los últimos 10 años están expresados
en millones de pesos para Y, X1 y en porcentajes para X2 . De esta manera la ecuación de regresión
que servirá para probar la teoría económica quedará planteada de la siguiente manera:
yˆ = aˆ + bˆX i + cˆX 2 + ui
donde:
y = Y calculada o estimada
ui expresa que no hay una relación exacta de Y con respecto a X1 “y” X2 por lo que
ui es conocido como el complemento residual
Así, para encontrar y se requiere conocer los valores de a, b , c mismos que se determinan con las
tres ecuaciones normales siguientes:
∑ Y = na + b∑ X 1 + c∑ X 2 .
∑ ∑ 1 ∑ 1 ∑ 1 2
 = a X + b X 2 + c X X
YX 1
∑ ∑ 2 ∑ 1 2 ∑ 2
 = a X + b X X + c X 2
YX 2

Cuando se expresan en forma de desviaciones con respecto a la media aritmética se pueden resolver
simultáneamente para b y c , así:
( ∑ x1 y)( ∑ x22 ) − ( ∑ x2 y)( ∑ x1 x2 )

b =
( ∑ x12 )( ∑ x22 ) − ( ∑ x1 x2 ) 2
( ∑ x2 y)( ∑ x12 ) − ( ∑ x1 y)( ∑ x1 x2 )

c =
( ∑ x12 )( ∑ x22 ) − ( ∑ x1 x2 ) 2
tal que:
 − cX
a = Y − bX  2
1
Se dice que b y c son estimadores óptimos lineales insesgados, es decir:
∈( b ) = b parámetro de la población
∈( c ) = c parámetro de la población
∈ es el símbolo de la esperanza matemática.
En una regresión múltiple b , c son estimadores parciales de y .
Una vez establecidos tanto la teoría económica como la metodología para probarla, con los datos que
aparecen en la tabla 1, hacemos los siguientes cálculos para obtener a, b , c .
Tabla 1: Relación del consumo (Y) con el ingreso (X1) y la inflación (X2) (del año 1 al 10)
Años Y X1 X2 y x1 x2 yx1 x12 x22 x1 x2 x2 y
1 3 1 8 -3.1 -4.65 +0.9 14.415 21.623 0.81 -4.185 -2.79
2 2 2 15 -4.1 -3.65 +7.9 14.965 13.323 62.41 -28.835 -32.39
3 4 2.5 10 -2.1 -3.15 +2.9 6.615 9.923 8.41 -9.135 -6.09
4 5 3 9 -1.1 -2.65 +1.9 2.915 7.023 3.61 -5.035 -2.09
5 5 4 7 -1.1 -1.65 -0.1 1.815 2.723 0.01 +0.165 +0.11
6 7 5 6 +0.9 -0.65 -1.1 -0.585 0.423 1.21 +0.715 -0.99
7 6 7 8 -0.1 +1.35 +0.9 -0.135 1.823 0.81 +1.215 -0.09
8 8 8 4 +1.9 +2.35 -3.1 4.465 5.523 9.61 -7.285 -5.89
9 9 9 3 +2.9 +3.35 -4.1 9.715 11.223 16.81 -13.735 -11.89
10 12 15 1 +5.9 +9.35 -6.1 55.165 87.423 37.21 -57.035 -35.99
n=10 61 56.5 71 0 0 0 109.34 161.03 140.9 -123.15 -98.10
9
Nota: Y, X1,X2 son los valores originales, en tanto que y,x1 y x2 son minúsculas e indican las desviaciones de los
términos con respecto a sus medias respectivas.
Cuyas medias son:

Y = 6.1
X 1 = 5.65
X 2 = 7.1
Sustituyendo tenemos:
(109.349)(140.09) − (− 98.10)(− 123.15) 15.318.7 − 12,081.01 3,237.69

bˆ = = = = 0.4379
(161.03)(140.09) − (− 123.15) 2 22,558.69 − 15,165.93 7,392.77
(− 98.1)(161.03) − (109.349)(− 123.15) − 15,797.04 + 13,466.33 − 2,330.71

cˆ = = = = − 0.3152
(161.03)(140.09) − (123.15) 2 22,558.69 − 15,165.92 7,392.77
aˆ = 6.1 − (0.4379)(5.65) − (− 0.3152)(7.1) = 6.1 − 2.4741 + 2.2379 = 5.8638
Observamos que b = 0.4379 tiene signo positivo y c = -0.3152 tiene signo negativo. Estos resultados
confirman la teoría económica, motivo por el cual podemos continuar probando la relación que tiene
el consumo (Y) con el ingreso (X1) y la inflación (X2). Por consiguiente, la ecuación de regresión
múltiple es:
y = 5.8638 + 0.4379X1- 0.3152X2

Con Eviews file/new/workfile/workfile Range/Undated or irregular/ escribimos en start date 1 y en
end date 10/ok vamos al menu de Quick Empty Group (edit series)/click y escribimos los datos de
Y, X1, X2 /name group 01/ok/ salimos haciendo clic en la “celda roja” /Quick/Estimate Equation
aparece la pantalla y escribimos Y C X1 X2/ok/ y aparece la ecuación de regresión Y=5.8+.4X1-
0.39X2/name/eq01/ok.
Sample: 1993 2002
C 5.800837 0.976443 5.940785 0.0006
X1 0.442193 0.076017 5.817014 0.0007
X2 -0.309751 0.081265 -3.811615 0.0066
Ahora bien en virtud de que no hay una relación lineal exacta de Y con X1 y X2, necesitamos
calcular la relación residual que se expresa con ui; misma que no conocemos porque pertenece al

universo, razón por la cual es estimada mediante ei , cuyo cuadrado ei2 , minimiza la suma de
cuadrados de todos los residuos: ∑ ei
2
Para obtener ei (donde (i) = 1,2,3... ...8,9,10), antes necesitamos determinar yi para cada uno de los
10 años. Así:
yˆ1 = 5.8637 + 0.4379(1) − 0.3152(8) = 3.7800

yˆ 2 = 5.8637 + 0.4379(2) − 0.3152(15) = 2.0115
yˆ3 = 5.8637 + 0.4379(2.5) − 0.3152(10) = 3.8065
yˆ 4 = 5.8637 + 0.4379(3) − 0.3152(9) = 4.3406
yˆ5 = 5.8637 + 0.4379(4) − 0.3152(7) = 5.4089
yˆ 6 = 5.8637 + 0.4379(5) − 0.3152(6) = 6.1620
yˆ 7 = 5.8637 + 0.4379(7) − 0.3152(8) = 6.4074
yˆ8 = 5.8637 + 0.4379(8) − 0.3152(4) = 8.1061
yˆ9 = 5.8637 + 0.4379(9) − 0.3152(3) = 8.8592
yˆ10 = 5.8637 + 0.4379(15) − 0.3152(1) = 12.1170
Nota: estos resultados están ”redondeados”; la computadora ofrece más decimales; por ello las cifras no
coinciden exactamente con las que se obtienen al correr los datos en computadora
Estos resultados aparecen en la continuación de la tabla 1 en la columna integrada por Ŷi .
Continuación... ...Tabla 1:
Relación del consumo (Y) con el ingreso (X1) y la inflación (X2) (del año 1 al 10)
Años yi e =Y - yi e2 2
y
1 3.7800 -0.7800 0.6084 9.61
2 2.0115 -0.0115 0.0001 16.81
3 3.8065 0.1936 0.0375 4.41
4 4.3406 0.6594 0.4348 1.21
5 5.4089 -0.4089 0.1672 1.21
6 6.1620 0.8380 0.7022 0.81
7 6.4074 -0.4074 0.1660 0.01
8 8.1061 -0.1061 0.0113 3.61
9 8.8592 0.1408 0.0198 8.41
10 12.1170 -0.1170 0.0137 34.81
∑ 61.0000 0.0000* 2.1610 80.9
* Existen pequeñas diferencias debido a la magnitud de los decimales. La suma técnicamente da cero

Observe que la suma de ∑ yi = 61 es la misma que ∑ Y = 61 y por ello la suma de ∑ e= Y− yˆ = 0

; sin embargo, para probar que su suma es un mínimo elevados al cuadrado: ∑ e2 = 2.1610, que en
cuadro de arriba de EVIEWS se le llama Sum squared residuals .
VIII.2 Significación Estadística de b y c
Con base en los cálculos anteriores es posible obtener ei = Y − yˆ y la ∑ e 2 = (Y − yˆ ) 2

= 2.1610 en
la forma que aparecen en las columnas correspondientes en la continuación de la tabla 1.
2
Como se observa la ∑ (Y − y
ˆ ) = 0 , mientras que ∑ (Y − yˆ ) = 2.1610 esto proviene de la
solución de:
e1 = 3 − 3.7800 = − 0.7800;e12 = 0.6084
e2 = 2 − 2.0115 = − 0.0115;e12 = 0.0001
e3 = 4 − 3.8065 = 0.1936;e12 = 0.0375
e4 = 5 − 4.3406 = 0.6594;e12 = 0.4348
e5 = 5 − 5.4089 = − 0.4089;e12 = 0.1672
e6 = 7 − 6.1620 = + 0.8380;e12 = 0.7022
e7 = 6 − 6.4074 = − 0.4074;e12 = 0.1660
e8 = 8 − 8.1016 = − 0.10160;e12 = 0.0113
e9 = 9 − 8.8592 = + 0.1408;e12 = 0.0198
e10 = 12 − 12.1170 = − 0.1170; e12 = 0.0137
∑ e2 = 2.1610
Con estos valores podemos probar la significación estadística de los parámetros poblacionales b, c,
calculando primero las varianzas de los estimadores. Las fórmulas de las varianzas son:
Var b = σ 2 ∑ x22
∑ x12 ∑ x22 − ( ∑ x1 x2 )2
u
∑
2
x1
Var c = σ 2
∑ x12 ∑ x22 − ( ∑ x1 x2 )2
u
No se acostumbra calcular la varianza de a (pendiente al origen) por que no ayuda a probar la teoría
económica, ya que yi = a cuando X1 = 0; X2 = 0 puesto que lo que se desea es probar las
variaciones de yi en función de las variaciones de X1 , X2 .

Por otra parte, como σ 2u es desconocida por que es del universo, se estima con S2 , como una
estimación insesgada, es decir, E (S2) = σ 2u .
Su formula es: S 2 = σ 2u = ∑ ei2

n− k
donde:
n = número de términos (10 en este ejemplo)
k = número de parámetros estimados (3 en este ejemplo)
Por lo que el numero de los grados de libertad es de: 10 - 3 = 7
Con estas referencias, las estimaciones insesgadas de las varianzas de b , c tendrán las siguientes
fórmulas:
S = Var( b ) =
2 ∑ ei2 ∑ x 22
; Sb = Sb2
b
n− k ∑ x 2
1 ∑ x − ( ∑ x1 x 2 )
2
2
2
∑ ∑
2
ei2 x1
S = Var( c ) =
2
; S c = S c2
∑ x12 ∑ x 22 − ( ∑ x1 x 2 )2
c
n− k
Sb2 , S c2 son los errores estándar de b , c con los que se pueden probar las hipótesis sobre b, c,
relativos a que hay o no hay relación de Y con respecto a X1, X2, con la estadística t de Student
porque n < 30 términos:
Para b: Para c:
Ho: b = 0 Ho: c = 0
Ha: b ≠ 0 Ha: c ≠ 0
b − b c − c
tb = t c =
Sb S c
Estas t`s “empíricas” u observadas se confrontan con las t`s ”teóricas” o de tablas. Estas últimas se
denotan con las literales t∝ , donde ∝ = nivel de significación que junto con los grados de libertad (n-
k) determinan los puntos “críticos” donde se toma la decisión de aceptar o rechazar Ho.

2
Así, para probar Ho primero calculamos Sb , S c2 ; sustituyendo los valores de las tablas en las
fórmulas originales:
S = Var (bˆ) =
2 ∑ ei2 ∑ x22
=
2.1610 140.9
=
bˆ
n− k ∑ x∑ 2
1 x − (∑ x1 x2 )
2
2
2
10 − 3 (161.0250)(140.9) − (− 123.15) 2
140.9 140.9
= 0.3087 = = 0.3087(0.0187) = 0.0058
22,688.4225 − 15,165.9225 7,522.5
; Sb2ˆ = 0.0058; Sbˆ = 0.0058 = 0.0761
también
∑ ∑
2
ei2 x1 2.1610 161.0250
S = Var (cˆ) =
2
=
∑ x∑ x − (∑
cˆ
n− k 2
1
2
2 x1 x2 ) 10 − 3 (161.0250)(140.9) − (− 123.15) 2
2
161.03 161.03
= 0.3087 = = 0.3087(0.0214) = 0.0066
22,688.4225 − 15,165.9225 7,522.5
; Scˆ2 = 0.0066; Scˆ = 0.0066 = 0.0812

Por lo tanto las t`s empíricas serán:
bˆ − b 0.4379 − 0 cˆ − c − 0.3087 − 0
tb = = = 5.7542 tcˆ = = = − 3.8017
Sbˆ 0.0761 Scˆ 0.0812
Ahora se determina con ∝ = 5% y 7 grados de libertad (n-k), el valor en tablas de t α = ± 2.365 .

Vemos que b, y c estadísticamente son significativamente diferentes de cero.
Interpretación económica: Sí hay relación del consumo (Y) con el ingreso (X1) y la inflación (X2);
luego entonces se sigue confirmando nuestra teoría.
VIII.3 Determinación del Grado (o porcentaje) de la Relación que Existe entre Y y las Variables
Explicativas X1, X2
Para llevar a cabo la determinación del grado de la relación que existe entre la variable dependiente
o explicada y las variables independientes o explicativas primero se determina el Coeficiente de
Determinación Múltiple.
La formula y el cálculo del coeficiente puede plantearse de la siguiente manera:

R2 = 1 −
∑ ei2
= 1−
2.1610
= 1 − 0.0267
∑ y2
i 80.9
R 2 = 0.9733 o 97.33%
Interpretación: El ingreso y la inflación determinan el 97.33% de los cambios que experimenta el
consumo.
Si tomamos en cuenta la reducción en los grados de libertad conforme aumenta el número de

variables independientes (aquí se supone que antes el consumo sólo era función del ingreso
-regresión simple y ahora hemos agregado la inflación como variable explicativa adicional),
entonces se debe calcular el R2 ajustado o R 2 , cuya formula es:
n− 1 10 − 1
R 2 = 1 − (1 − R 2 ) = 1 − (1 − 0.9733)
n− k 10 − 3
= 1 − (1 − 0.9733)(1.2857)
= 1 − (0.0267)(1.2857) = 1 − 0.0343
R 2 = 0.9656
Interpretación: R 2 es un indicador más exacto que R2
VIII.4 Prueba de la Significación Global de la Regresión Múltiple9
En este caso la hipótesis nula se prueba con F, estadística que se refiere al análisis de varianza que es
el cociente de dividir la varianza explicada entre la varianza no explicada. Su formula es:
∑ yi2 R2
( k − 1) k−1
Fk − 1,n − k = =
∑ ie 2
(1 − R 2
)
(n − k )
(n − k )
donde:
(k-1) son los grados de libertad de la varianza explicada
(n-k) los grados de libertad de la varianza no explicada
(ya es conocido el significado de n y k)
Como en el caso anterior - cuando usamos t - se requiere encontrar en tablas la “F teórica” con un
cierto valor de ∝ para confrontarla con la “F empírica”. Así, primero calculamos la F empírica:
0.9733
F2, 7 = 2 = 0.4866 = 128.0526
1 − 0.9733 0.0038
7
Si decimos que ∝ = 1%, buscamos F∝ en tablas con 2 grados de libertad para el numerador
(varianza explicada) y 7 grados de libertad para el denominador, vemos que F∝ = 9.55.
Como F2,7 = 128.0526 > F∝ = 9.55 decimos que se acepta la hipótesis alternativa (se rechaza la
hipótesis nula) de que b y c, y R2 son significativamente diferentes de cero.

Lo anterior indica que a través de una sola estadística se confirma la hipótesis que hemos venido
desarrollando de que: Y = f(X1,X2).
VIII.5 Coeficiente de Correlación Parcial
Este coeficiente es útil por que mide la correlación neta entre la variable dependiente (Y) y una
variable independiente (sea X1 o X2) después de excluir la influencia que sobre ellas ejerce la(s)
otra(s) variable(s) independiente(s) en el modelo uniecuacional.
Notación: ry x1 ,x2 es la correlación parcial entre X1 e Y después de eliminar el impacto de X2

sobre Y e X1. Sus fórmulas son:
ry x1 − ry x2 r x1 ,x2
ry x1 ,x2 =
1 − r 2 x1 ,x2 1 − ry2x2
En forma análoga:
ry x2 − ry x1 r x1 ,x2
ry x2 ,x1 =
1 − r 2 x1 ,x2 1 − ry2x2
Para ello necesitamos hacer los siguientes cálculos a partir de la tabla 1:
ry x1 =
∑ yx1 = 109.35 = 109.35 = 109.35 = 0.959
∑ x12 ∑ y 2 16103 . 80.9 ( 12.68 )( 8.99 ) 113.99
ry x2 =
∑ yx2
=
− 981
.
=
− 981
.
=
− 981
.
= − 0.919
∑ x22 ∑ y2 140.9 80.9 ( 1187
. )( 8.99 ) 106.71
rx1 x 2 =
∑ x1 x2
=
− 12315
.
=
− 12315
.
=
− 12315
.
= − 0.818
∑ x22 ∑ x12 140.9 16103
. ( 1187
. )( 12.68 ) 150.51
Sustituyendo:

ry x1 − ry x2 rx1 , x2 (0.959) − (− 0.919)(− 0.818)

ry x1 , x2 = = =
1− r 2
x1 , x 2 1− r 2
y x2
0.33 0.15
(0.959) − (0.751) 0.208
= = =
(0.574)(0.387) 0.222
ry x1 , x2 = 0.936 o 93.6%
t a m b i én
ry x2 − ry x1 rx1 , x2 (− 0.919) − (0.959)(− 0.818)
ry x2 , x1 = = =
1− r 2
x1 , x 2 1− r 2
y x2
0.33 0.08
− 0.919 + 0.784 − 0.135
= = = − 0.838
(0.574)(0.282) 0.161
luego ry x2 , x1 = − 0.838 o 83.8%
Como ry x1 ,x 2 = 0.936 " y" ry x 2 ,x1 = − 0.838
Se dice que el ingreso (X1) es más importante explicando las variaciones del consumo (Y) que la
inflación (X2); obviamente en sentido inverso, como lo indica la teoría económica.
Con Wviews: Vamos a Quick/Group Statistics/Correlations/ aparece en pantalla “Series List” y
escibimos Y X1 X2/ ok aparecen coeficienten de correlación parcial name/Group 02/ok. Para
graficar: Quick/graph/line graph/ series list: Y X1 X2/ok y aparece la gráfica.
Se acostumbra presentar en forma resumida los resultados estadísticos, mismos que en computadora
suelen aparecer así:
bo = 5.80083749 Sḃ2˙ = 0.005779 Sḃ˙ = 0.076

2
b1 = 0.44219342 S = 0.006604
c Sc = 0.081
b2 =-0.3097507
R2 = 0.97330500
R2ajus = 0.965678
calculado tablas
t1 = 5.817014 2.36
t2 = -3.811620 2.36
F = 124.7400 6.54

Por otra parte, si deseamos conocer gráfica y numéricamente las relaciones de Y con X1, X2, se
expresan así:
Actual Ajustado Residual

Gráficamente
1.0986122886 1.0289711374 0.0696411512 | . |* . |
0.6931471805 1.12658750472 -0.433440324 |* . | . |
1.3862943611 1.32569568282 0.0605986783 | . |* . |
1.6094379124 1.42605193427 0.1833859781 | . | *. |
1.6094379124 1.60787004333 0.0015678691 | . * . |
1.9459101490 1.7376480515 0.2082620975 | . | * |
1.7917594692 1.78985074501 0.0019087242 | . * . |
2.0794415416 2.03328216598 0.0461593757 | . |* . |
2.1972245773 2.15869999287 0.0385245844 | . |* . |
2.4849066497 2.66151478441 -0.176608134 | .* | . |
VIII.6 Predicción
Usando Eviews 5, suponga que se desea proyectar a los años 2011 y 2012, para ello se requiere de
los siguientes pasos:
1.- Nos colocamos en el Workfile (archivo) que muestra el RANGE y SAMPLE con datos de 2001 a
2010 y por eso dice 10 obs. Necesitamos modificarlos haciendo clic en RANGE y SAMPLE/
aparece “ workfile structure, ahí cambiamos el RANGE y el SMPL/ ahora escribimos en “Dated-
regular frequency”: start date: 2001 y en end date: 2012/aparece la leyenda: “Resize involves
inserting 2 observatios Continue?/yes. Aparece la siguiente tabla con las dos observaciones
adicionales:

2.- En la línea de comando se escribe: DATA X1 X2. Aparecerán las dos celdas en blanco, mismas
que hay que llenar con los datos de X1 y X2 para los años 11 y 12 respectivamente.
3. Regresamos a goup01 que muestra los 10 datos originales de Y,X1,X2 con las celdas de los años
2011 y 2012 en blanco. Las llenamos escribiendo para el año 2011 para X1= 15.5, X2= 1.3 y para el
2012: X1= 16, X2= 1.5
4.- Nuevamente vamos a workfile y localizamos el cuadro que contiene la ecuación de regresión,
mismo que contiene la ventana Forecast/clic/ por default aparecen y los conservamos : a).- forecast

name:yf; b).- forecast simple: 2001-2012; en output c).- forecast graph y d).- forecast
evaluation/ok/aparece la grafica con su “banda de confianza”( para los 12 años) y las estadísticas que
evalúan la predicción.
5.- Se regresa a workfile/show/ escribimos en la caja: y yf/ok/ aparecen las dos variables, la primera
con datos de 2001 a 2010 y la segunda ( la pronosticada) de 2001 a 2012.

Evaluación de la capacidad predictiva del modelo. Son cuatro las estadísticas que el programa Eviews
proporciona para evaluar dicha capacidad predictiva: 1.- La raíz del error cuadrático medio( Root mean
squared error); 2.- error absoluto medio( Mean absolute error); 3.- Error absoluto medio del porcentaje de
error( Mean absolute percent error) y 4.- el coeficiente de desigualdad de Theil( Theil inequality
coeficiente).Todos ellos aparecen a un lado de la gráfica que muestra yf con su “banda de confianza”
( construida con yf mas y menos dos errores estándar) asociada. Mientras más se acerque su valor a cero,
mejor es la capacidad de predicción del modelo. En este sentido vale decir que el valor del coeficiente de
desigualdad de Theil oscila entre 0 y 1, por lo que mientras más se acerque a 0, mejor será la
predicciónrealizada con la ecuación de regresión.
VIII.7 Cálculo de la Elasticidad
Con base en la información anterior se puede obtener:
VIII.7.1La Elasticidad Ingreso del Consumo: Mide el cambio porcentual en los niveles del
consumo como consecuencia de un cambio porcentual en el ingreso disponible (después de
impuestos). Es importante señalar que la elasticidad no es constante, es decir, cambia en cada
uno de los puntos de la función de regresión. Su cálculo puede hacerse con la formula:
X 5.65
E ib = b 1 = 0.44 = 0.44( 0.92 ) = 0.40
Y 61
.
VIII.7.2 De manera similar se puede obtener la Elasticidad Precio de la Demanda Cuya
interpretación es similar a la elasticidad ingreso, pero ahora referida a los precios. Como no
hay datos, conceptualmente se mide con:

Ep = Parámetro estimado multiplicado por el cociente que resulta de dividir la media de los
precios entre la media de la demanda o consumo
VIII.7.3 Con base en lo anterior podemos obtener la Elasticidad Inflación del Consumo así:
X 7.1
E ic = c 2 = − 0.31 = − 0.31( 116
. ) = − 0.36
Y 61
.


Dr. Genaro Sánchez Barajas : Tercer examen parcial.
Tema: Marco teórico de la expresión matemática de una teoría económica y de su verificación estadística.
I.-Conteste con una “X” en SI cuando la afirmación sea verdadera y también con una “X” en NO cuando la afirmación
sea falsa:
1.- Una variable cualitativa no se puede expresar cuantitativamente: Si___; No____.
2.-Una variable dicotómica puede tomar más de dos valores: Si_____; No________
3.-Para predecir la variable dependiente es necesario que antes se conozcan los valores proyectados de las variables
explicativas en el tiempo: SI:_______; NO:___________
4.- Cuando se verifica la hipótesis de la relación entre la variable dependiente con las independientes, se espera que
idealmente el valor del coeficientes de correlación múltiple no sea semejante a los valores de los coeficientes de
correlación parcial: SI:__; NO__.
5.- Cuando se verifica con la estadística F que las variables independientes si explican a la variable dependiente,
teóricamente se debe de verificar con la prueba t de Student que cada una de las variables independientes también
explican a la dependiente: SI___; NO____.
6.- Al correr la regresión, cuando los signos de los coeficientes obtenidos de las variables regresoras no coinciden con la
concepción teórica de su relación con la variable regresada, se debe cambiar de variable regresora: SI____; NO______:
7.- Al probar una hipótesis nula con la t de Student, si la t real o calculada es mayor que la t teórica o de tablas, se
acepta dicha hipótesis nula: SI____;NO_____.
8.- Cuando F real o calculada es menor que F teórica o de tablas rechazamos la hipótesis nula: SI_____; NO____.
:
9.- en una regresión múltiple si al probar una hipótesis nula con ciertos grados de libertad y nivel de significación,
cuando los valores de t no son estadísticamente significativos pero F si lo es, se dice que posiblemente se violó algún de
los supuestos del modelo de estimación: SI____; NO______.
10.-Conocido el valor del coeficiente de la variable explicativa X, su media aritmética como la de la variable explicada
Y
Y, la elasticidad se calcula as E = bˆ : SI__;NO___.
X
Observaciones: Cada una de las respuestas correctas vale 10 puntos en escala de 0 a 100. No se puede usar la
calculadora, ni las tablas estadísticas ni la bibliografía correspondiente a cada tema.

IX. TRANSFORMACIONES DE FORMAS FUNCIONALES NO LINEALES

EN LINEALES
IX.1 Propósito
En economía existen fenómenos que no siempre tienen un comportamiento lineal, digamos como el
comportamiento del valor de las acciones de cualquier empresa en el mercado bursátil. Este
comportamiento se detecta al graficar los valores del fenómeno y obtener un diagrama de dispersión
en forma de “sierras”; también ello se comprueba cuando cierta teoría económica así lo establece,
digamos el valor de la producción en función de los insumos de mano de obra y de capital.
Comenta el profesor Salvatore (1991, p. 136) que la teoría económica puede a veces sugerir la forma
funcional de una relación económica; también, que la dispersión de los valores observados puede
sugerir la forma funcional apropiada en una relación de dos variables, y que cuando ninguna teoría
ni dispersión de puntos es de ayuda, la función lineal se trata usualmente primero debido a la
simplicidad.
Algunas de las transformaciones de funciones no lineales a lineales más útiles y comunes son las
funciones logaritmo doble o doble-log, recíproca, y la polinomial. Una de las ventajas de la forma
doble-log es que las pendientes representan elasticidades. La función semilog es apropiada cuando la
variable dependiente crece en el tiempo a un ritmo relativamente constante, como en el caso de la
fuerza laboral y de la población. Las funciones recíprocas y polinomial son apropiadas para estimar
curvas de costo medio y costo total.
La estimación de una función doble-log transformada por el método de MCO arroja estimadores de
pendiente insesgados. Sin ambago b0=antilo b0* es un estimador sesgado pero consistente de b0. El
hecho de que b0 sea sesgado no es de mucha importancia, porque la constante no muestra un interés
especial en economía. En las otras funciones transformadas b0 también es insesgado.
Se recomienda trasformar estas “formas funcionales” no lineales en lineales cuando se aplica el

análisis de regresión con el objeto de que al utilizar el método de mínimos cuadrados, se obtengan
funciones lineales trasformadas cuyas pendientes sean estimadores insesgados.
Beneficios de las transformaciones:
1.- Estas “nuevas” pendientes aparte de ser estimadores lineales en los logaritmos de las variables Y
e X, son insesgadas y su valor es igual a la elasticidad de la variable dependiente con respecto a la
independiente o explicativa, como es el caso de la forma funcional doble logarítmica, también
expresada por motivos prácticos log log ;
2.- Con la forma funcional lin log la pendiente de la variable independiente, X, también es lineales
en su logaritmo y mide una tasa de crecimiento, es decir, mide el cambio porcentual constante de
la variable dependiente, Y, provocado por el cambio unitario absoluto que experimente la variable
independiente, que debe ser la variable tiempo ;
3.- Con la forma funcional log lin la pendiente de la variable independiente, X, mide el cambio
absoluto en la variables dependiente, Y, originado en un cambio porcentual en X;
4.- El modelo o forma funcional recíproco ( en X) aun cuando no es lineal ( Gujarati, 1991) en X
puesto que entra inversamente o de manera reciproca, es lineal en sus parámetros y en consecuencia,

por esa razón es un “modelo de regresión lineal”. Su connotación principal es que a medida que X
aumenta indefinidamente, su coeficiente se acerca a cero y la variable dependiente Y se aproxima al
valor límite o asintótico, que es el valor de la ordenada al origen. En otras palabras, este modelo es
útil porque expresa relaciones asimétricas o inversas entre Y e X porque muestra que cuando X
aumenta Y disminuye hasta un punto cuyo valor es la ordenada al origen.
A continuación se desarrollan estos modelos y se explican los significados que tienen el coeficiente
o pendiente de la variable independiente, según sea al caso de los cuatro antes descritos.
IX.2 Formas Funcionales Transformadas más usadas en Economía: Doble Logarítmica,

Exponencial, Semilogarítmica, Recíproca y Polinomial
La forma funcional 
 be se puede transformar en la doble logarítmica
u
Y = aX
log Y = log a + b log X + log e u . La función exponencial Y = ab x se transforma en
log Y = log a + log bX que es semilogaritmica por que sólo transforma Y, etc.
IX.2.1 Logaritmos Comunes y Naturales
Como se recordará los logaritmos comunes tienen base 10 y los naturales base e = 2.718 de manera
tal que la relación entre logaritmos naturales y comunes es:
logaritmo natural (ln) de X = 2.3026*logaritmo común (lc) de X
Ejemplo:
Cuando:
X = 240; su ln = 2.3026 (2.380211) = 5.48064
X = 1480; su ln = 2.3026 (3.170262) = 7.29986
X = 410; su ln = 2.3026 (2.612784) = 6.01616
X = 450; su ln = 2.3026 (2.653223) = 6.10925
X = 3; su ln = 2.3026 (0.477100) = 1.09857
X = 2; su ln = 2.3026 (0.301000) = 0.69308
X = 8; su ln = 2.3026 (0.903100) = 2.07947
X = 1; su ln = 2.3026 (0.000000) = 0.00000
Es el investigador quien decide si trabaja con logaritmos de base 10, base e o cualquier otra base;
para evitar confusiones basta pues con especificar con que base de logaritmos se trabaja.
IX.3 Ejemplos Aplicando el Método de Mínimos Cuadrados Ordinarios
IX.3.1 Función de Consumo Transformada a Forma Lineal Doble Logarítmica
A partir de los datos de la tabla 1 hacemos los siguientes cálculos que aparecen en la tabla 2

Tabla 2: Función del Consumo Transformada a Forma Lineal Doble Logarítmica

Años Y X1 X2 lnY 2 ln X1 lnX2 y = lnY-Med lnY
lnY
1 3 1 8 1.098612289 1.20694896 0 2.079441542 -0.591004916
2 2 2 15 0.693147181 0.48045301 0.693147181 2.708050201 -0.996470024
3 4 2.5 10 1.386294361 1.92181206 0.916290732 2.302585093 -0.303322843
4 5 3 9 1.609437912 2.59029039 1.098612289 2.197224577 -0.080179292
5 5 4 7 1.609437912 2.59029039 1.386294361 1.945910149 -0.080179292
6 7 5 6 1.945910149 3.78656631 1.609437912 1.791759469 0.256292945
7 6 7 8 1.791759469 3.21040199 1.945910149 2.079441542 0.102142265
8 8 8 4 2.079441542 4.32407713 2.079441542 1.386294361 0.389824337
9 9 9 3 2.197224577 4.82779584 2.197224577 1.098612289 0.507607373
10 12 15 1 2.48490665 6.17476106 2.708050201 0 0.795289446
Σ 61 57 71 16.89617204 31.1133971 14.63440894 17.58931922 2.22045
Med 6.1 5.7 7.1 1.689617204 3.11133971 1.463440894 1.758931922
Función del Consumo Transformada a Forma Lineal Doble Logarítmica
Años y2 =(lnY-Med lnY)2 x1 = lnX1-Med lnX1 x2 = lnX2-Med lnX2 yx1 yx2
1 0.34928681 -1.463440894 0.320509619 0.864900762 -0.18942276
2 0.99295251 -0.770293713 0.949118279 0.767574595 -0.94576791
3 0.09200475 -0.547150162 0.543653171 0.165963143 -0.16490243
4 0.00642872 -0.364828605 0.438292655 0.029251699 -0.03514199
5 0.00642872 -0.077146533 0.186978227 0.006185554 -0.01499178
6 0.06568607 0.145997018 0.032827547 0.037418006 0.008413469
7 0.01043304 0.482469255 0.320509619 0.049280502 0.032737578
8 0.15196301 0.616000648 -0.372637561 0.240132044 -0.14526319
9 0.25766525 0.733783683 -0.660319634 0.372474008 -0.33518311
10 0.6324853 1.244609307 -1.758931922 0.989824645 -1.39885999
Σ 2.56533418 -8.881178 1.3227 3.52300496 -3.18838213
Función del Consumo Transformada a Forma Lineal Doble Logarítmica
Años x1 x2 lnYc 2 2
x12 x22 e = ln(Y-Yc)
1 -0.46904688 2.141659251 0.102726416 1.028971137 0.00484989
2 -0.73109984 0.593352406 0.900825507 1.126587505 0.187870515
3 -0.29745992 0.299373300 0.295558770 1.325695683 0.003672200
4 -0.15990170 0.133099912 0.192100451 1.426051934 0.033630417
5 -0.01442472 0.005951588 0.034960857 1.607870043 2.458210000
6 0.004792724 0.021315129 0.001077648 1.737648052 0.043373101
7 0.154636037 0.232776582 0.102726416 1.789850745 3.643230000
8 -0.22954498 0.379456797 0.138858752 2.033282166 0.002130688
9 -0.48453177 0.538438493 0.436022019 2.158699993 0.001484144
10 -2.18918304 1.549052326 3.093841507 2.661514784 0.031190433
Σ -4.41576410 5.894475785 5.298698344 16.89617204 0.308207489
Como puede observarse en la tabla 2, los pasos fueron:
a) Convertir los valores de Y, X1, X2 a logaritmos naturales (ly, lx1, lx2)
b) Obtener las “desviaciones” de esos logaritmos con respecto a las medias aritméticas
Y , X 1 , X 2 . En el caso del consumo: para el primer término, log Y1- Y ; para el último término log
Y10- Y . Un procedimiento análogo se hizo para las desviaciones de los logaritmos de X1, X2 con
respecto a sus X 1 , X 2 .

Como se recordará las “desviaciones” se representan con letras minúsculas, ello con el objeto de
aplicar las fórmulas ya conocidas para obtener a ,b , c; que son:
(∑ x1 y )(∑ x 22 ) − (∑ x 2 y )(∑ x1 x 2 )
ln bˆ =
(∑ x12 )(∑ x 22 ) − (∑ x1 x 2 ) 2
(∑ x 2 y )(∑ x12 ) − (∑ x1 y )(∑ x1 x 2 )

ln cˆ =
(∑ x12 )(∑ x 22 ) − (∑ x1 x 2 ) 2
ln aˆ = LogY − bˆLogX 1 − cˆLogX 2
c) Sustituyendo en las fórmulas los datos de la tabla 2 tenemos:
(3.52)(5.3) − (− 3.19)(− 4.42) 18.66 − 14.10 4.56

ln bˆ = = = = 0.39
(5.89)(5.29) − (− 4.42) 2 31.16 − 19.53 11.63
( − 3.19)(5.89) − (3.52)(− 4.42) − 18.79 + 15.56 − 3.23

ln cˆ = = = = − 0.27
(5.89)(5.29) − (− 4.42) 2
(5.89)(5.29) − (− 4.42) 2
11.61
ln aˆ = 1.68 − (0.39)(1.46) − (− 0.27)(1.76) = 1.69 − 0.57 + 0.47 = 1.6

d) La ecuación de regresión será :
log Yc = 1.6 + 0.39 logX1-0.27 logX2
e) Para determinar la ∑ ei2 relación residual primero obtenemos las Y`s calculados o
estimadas así::
ln Y1 = 1.6 + 0.39 (0) - 0.27 (2.07) = 1.6 - 0.55 = 1.05

ln Y2 = 1.6 + 0.39 (0.69) - 0.27 (2.70) = 1.6 + 0.27- 0.72 = 1.15
*
*
*
*
ln Y5 = 1.6 + 0.39 (1.39) - 0.27 (1.94) = 1.6 + 0.54- 0.52 = 1.62
*
*
*
ln Y10 = 1.6 + 0.39 (2.70) - 0.27 (0) = 1.6 + 1.05 = 2.65
Nota: a cada uno de estos diez valores de Yc, se le saca el antilogaritmo

f) Luego que se tiene Y, Yc se obtiene ei = yi - Yc, misma que se eleva al cuadrado (ei)2
y se obtiene su suma que de acuerdo con la tabla 2 tenemos ∑ ei =0.30
2
g) En seguida se prueba la significación estadística de b y c para ello obtenemos:
S = Var( b ) =
2 ∑ ei2 ∑ x 22
= 0.000395; S b = 0.019
b
n− k ∑ x12 ∑ x 22 − ( ∑ x1 x 2 )2
∑ ∑
2
ei2 x1
S = Var( c ) =
2
= 0.000489; S c = 0.022
∑ x12 ∑ x 22 − ( ∑ x1 x 2 )2
c
n− k
Con ello probamos Ho:
Para b Para c
Ho: b = 0 Ho: c = 0
HA: b ≠ 0 HA: c ≠ 0
0.39 − 0.27
tb = = 20.5 tc = = − 12.27
0.019 0.022
Con α = 1% y 7 grados de libertad tα = ± 3.499 luego b y c son estadísticamente

significativos, indicando que si hay relación del consumo con el ingreso y la inflación.
h) Ahora calculamos:
R = 1−
2 ∑ ei2
= 0.879 o 87 .9%
∑ yi2
luego r = R2 = 0.87 = 0.932 o 93.2%
n− 1
la R 2 = 1 − ( 1 − R 2 ) = 0.845 o 84 .5%
n− k
i) La prueba de la significación global se hace con:
Ho: b1 = b2 = ... ...bx = 0

HA: ninguna bi es cero
R2
k−1
Fk − 1,n − k = = 25.63
(1 − R ) 2
(n − k )
Con α = 5% y 2 y 7 grados de libertad Fα = 4.74 , luego como Fα = 4.74∠ F2,7 = 25.63 ,
2
decimos que se acepta la hipótesis alternativa de que b, c, R son significativamente diferentes de

cero, decimos que hay bondad de ajuste, que la variable endógena si es explicada suficientemente
por las variables exógenas.
j) Cálculo de la elasticidad: Como se indicó previamente, las pendientes en esta
forma funcional doble logarítmica, equivalen a las elasticidades ingreso e inflación del

consumo, es decir, su valor es el valor de la elasticidad correspondiente. Como b = 0.39 =
elasticidad respecto del ingreso; c = − 0.27 = elasticidad respecto de la inflación. Nótese que estos
valores son similares a los obtenidos previamente en el punto VIII.7.1 y VIII.7.3,
donde Ei =0.40 y Ein = -0.36. Su diferencia se explica por el número de decimales utilizados.
También comenta el profesor Dominick Salvatore que cuando la suma los coeficientes estimados
(elasticidades) de las variables independientes ( cuando son factores de la producción, digamos
mano de obra y capital) es mayor que uno, hay economías de escala. En este sentido el profesor
Gujarati (1990 , p.153) complementa diciendo que cuando la elasticidad o pendiente de la variable
independiente es menor que uno, se debe interpretar como que hay inelasticidad de la variable
dependiente con respecto a la dependiente. Esto se ilustra en ejemplos subsecuentes.
Trabajando con Eviews, los pasos son los siguientes:

1.- Crear la base de datos:
File/new/ Start:1 y end:10/ok /quick/Empty series group/ escribimos cada uno de los datos y así tenemos la
base de datos, que le llamaremos(name) group 01
obs Y X1 X2
2001 3 1 8
2002 2 2 15
2003 4 2.5 10
2004 5 3 9
2005 5 4 7
2006 7 5 6
2007 6 7 8
2008 8 8 4
2009 9 9 3
2010 12 15 1
2.- Transformar las variables y, x1, x2 a logaritmos:

Vamos a Generate series y en la ventana escribimos para cada variable: ly=log(y)/ok , luego para
lx1=log(x1)/ok y finalmente para lx2=log(x2) y aparecen sus datos en logaritmos.
Y
1.098612
0.69314
7
1.386294
1.609438
1.609438
1.945910
1.791759
2.079442

2.197225
2.484907
X1
0.000000
0.693147
0.916291
1.098612
1.386294
1.609438
1.945910
2.079442
2.197225
2.708050
X2
2.079441541
67984
2.708050201
10221
2.302585092
99405
2.197224577
33622
1.945910149
05531
1.791759469
22805
2.079441541
67984
1.386294361
11989
1.098612288
66811
0
3.- Correr la ecuación:

Vamos a Quick/estímate equation/ en la ventana escribimos: ly c lx1 lx2/ok y aparece el siguiente
cuadro, cuyos valores son los mismos para los coeficientes, sus signos, para y estimada, e cuadrada,
r cuadrada, r cuadrada ajustada, F pero diferentes para los errores estándar de los coeficientes y para
las t´s correspondientes. Esta última diferencia posiblemente se deba al redondeo de los datos.
Observaciones. Las elasticidades ( valores y signos de los coeficientes de las variables regresoras)
toman los mismos valores que los obtenidos manualmente, situación que corrobora en ambos
sentidos que los cálculos están bien hechos.
Dependent Variable: LY


Date: 09/30/08 Time: 20:00
Sample: 2001 2010
C 1.602627 0.448011 3.577201 0.0090

LX1 0.391015 0.141004 2.773068 0.0276
LX2 -0.275870 0.148720 -1.854958 0.1060

S.E. of regression 0.209832 Akaike info criterion -0.041690
Log likelihood 3.208450 F-statistic 25.63190
Interpretación de las elasticidades: La elasticidad de Y respecto de X1 es de 0.391915, lo que significa que

si X1 aumenta 1%, en promedio, Y se incrementa en 0.391015%; en lo que se refiere a la elasticidad de Y
con respecto a X2, ésta es de -0.275870, lo que indica que si X2, por ejemplo aumenta 1%, en promedio, Y
disminuye en 0.275870%.
IX.3.2 Ejemplo adicional de ecuación doble logarítmica
Transformación en forma lineal doble logarítmica
Con los siguientes datos y siguiendo los mismos pasos del ejemplo anterior obtenga: a). La ecuación
de regresión, b). las elasticidades (economías de escala) y c). el error estándar de estimación. Así, si
especificamos en el modelo uniecuacional que Y=f(X1,X2)
Año Y X1 X2 LnY LnX1 LnX2 LnY al cuadrado
2000 3 1 8 1.09 0.00 2.08 1.19
2001 2 2 9 0.69 0.69 2.19 0.48
2002 4 3 10 1.39 1.09 2.30 1.93

2003 5 4 12 1.60 1.39 2.48 2.56
Suma 14 10 39 4.77 3.17 9.05 6.16
Media 3.5 2.5 9.8 1.19 0.77 2.26 1.56
Una vez que los datos fueron convertidos a logaritmos obtenemos las “desviaciones” de los valores
originales con respecto a sus medias, con objeto de ir calculando los valores necesarios para estimar
los parámetros de la ecuación de regresión que facilite el cálculo de las elasticidades y del error
estándar de estimación. Las desviaciones se expresan con minúsculas así:
y=LnY- y al x1=LnX1- x2=LnX2- yx1 yx2 x1x2 x12 x22

media de cuadrado media de media de
LnY LnX1 LnX2
-0.1 0.01 -0.79 -0.18 0.079 0.018 0.1422 0.6241 0.0324
-0.5 0.25 -0.10 -0.07 0.05 0.035 0.0070 0.0100 0.0049
0.2 0.04 0.30 0.04 0.06 0.008 0.0120 0.0900 0.0016
0.4 0.16 0.60 0.22 0.24 0.088 0.1320 0.3600 0.0484
0.0 0.46 0.00 0.00 0.43 0.149 0.2932 1-080 0.0873
Esos resultados se sustituyen en las ecuaciones que necesitamos para obtener el valor de los
coeficientes estimados. Luego si
(∑ x1 y )(∑ x22 ) − (∑ x2 y )(∑ x1 x2 )

bˆ =
(∑ x12 )(∑ x22 ) − (∑ x1 x2 ) 2
(∑ x2 y )(∑ x12 ) − (∑ x1 y )(∑ x1 x2 )

cˆ =
(∑ x12 )(∑ x22 ) − (∑ x1 x2 ) 2
aˆ = LogY − bˆLogX 1 − cˆLogX 2
Sustituyendo
b=(0.43)(1.0873) – (0.149)(0.2932)/(1.08)(0..873) – (0.2932) al cuadrado

b=(0.0375)-(0.0437)/0.0943 – 0.0859
b=-0.0062/0.0084
b= - 0.708
hacemos lo mismo para c
c=0.149(1.08) – 0.43(0.2932)/1.08(0.0873) – (0.2932) al cuadrado
c=0.1609 – 0.1261/0.0943 – 0.0860
c=0.0348/0.0084
c=4.19
finalmente para a
a=1.19 – (-0.708)(0.79) – 4.19(2.26)
a=1.19 + 0.56 – 9.46
a= - 7.71
a). Así la ecuación de regresión es LnYc=-7.71 – 0.708lnX1 +4.19LnX2
b). Las elasticidades son: Elasticidad de Y con respecto a X1= -0.708; de Y con respecto a X2=
+4.19, de manera que si 4.19+ (-0.708)= 3.482 ≥ 1, decimos que si hay economías de escala.
c). Para calcular el error estándar de estimación tabulamos a partir de la ecuación de regresión
LnY1c= -7.71-0.708(0) + 4.19(2.08)=1.0000
lnY2c= -7.71- 0.708(0.69)+4.19(2.19)=0.9810
LnY3c= -7.71-0.708(1.09)+4.19(2.30)=1-1600
LnY4c= -7.71-0.708(1.39)+4.19(2.48)=1.6960
Tabulando tenemos
LnY LnYc Є=LnY-LnYc Є al cuadrado
1.09 1.000 +0.090 0.0081
0.69 0.981 -0.291 0.0847

1.39 1.160 +0.230 0.0529
1.60 1.696 -0.096 0.0092
∑ 0.000 0.1549
∑ ( E) 2
Luego el error estándar de estimación es σ YX 1 X 2 = = 0.1549 / 1 = 0.3935
n− k
Con Evi ew s s e obt i enen l os mismos result ados . Si gui endo l os mismos pas os del ej em pl o ant eri or
s e arri b a al si gui ent e cuadro:
Date: 09/30/08 Time: 20:47
Sample: 2001 2004
C -7.421588 9.310352 -0.797133 0.5716

LX1 -0.708217 1.299158 -0.545135 0.6823
LX2 4.051628 4.539724 0.892483 0.5361

Adjusted R-squared -0.060818 S.D. dependent var 0.395595
Comentarios: Los valores que toman las “probabilidades” de las t´s y F indican que se acepta la hipótesis
nula, es decir, que los coeficientes de las variables regresoras no son estadísticamente diferentes de cero, lo
que significa que X1 e X2 no explican a Y; R cuadrada corrobora lo anterior con un valor bajo: 0.646394. Lo
anterior en mucho se debe a que son datos inventados para ilustrar el algoritmo de cálculo y que la muestra
es muy pequeña, entre otros factores que influyen significativamente en los resultados.
Independientemente de lo anterior, la interpretación de los coeficientes de X1 e X2 como elasticidades es la

siguiente: en el caso de Y respecto de X1, su elasticidad es de -0.708217, lo que sugiere que si X1aumenta
1% en promedio, Y disminuye en 0.708217%. En lo que se refiere a Y con respecto a X2, su elasticidad es de
4.051628, situación que indica por ejemplo que si X2 aumenta en 1% en promedio, Y se incrementa en
4.051628%.
IX.3.3 Función de Consumo Exponencial Transformada a Forma Lineal Semilogarítmica:log-lin, que sirve
para calcular la tasa de crecimiento de Y en función de las variaciones de X .La tasa de
crecimiento viene expresada por el valor del coeficiente de X , donde X es la variable tiempo.

Este modelo es útil cuando queremos conoce el cambios relativo en Y ante un cambio absoluto
en X1.
Así, recordando que una función es semilogaritmica cuando una de las variables se convierte o se
transforma en logaritmos, sea X o Y. En este sentido, si se establece que sea Y la que se exprese en
logaritmos, a partir de una función exponencial, ello gráficamente se expresa mediante una línea
recta cuando la función se traza en una gráfica semilogaritmica; será una curva cuando se trace una
gráfica con escalas ordinarias.
Así, si la función es Yc = abx tomando logaritmos se trasforma en una función lineal dada por logYc
= log a + log b (x). Nota: Este ejemplo se trabaja con logaritmos comunes, de base 10.
Para simplificar operaciones hacemos Σx = 0. Aplicando el método de mínimos cuadrados, las dos
constantes desconocidas (log a, log b) se calculan con:
log a =
∑ (log Y )
;log b =
∑ ( X log Y )
n ∑ X2
Tabla 3:
Transformación de la Función Consumo de una Función Exponencial
en Semilogarítmica:
Años en Consumo
Año Unidades X Y log Y XlogY X2 logYc Yc
1 -5 3 0.4771 -2.3856 25 0.36 2.3
2 -4 2 0.3010 -1.2041 16 0.44 2.7
3 -3 4 0.6021 -1.8062 9 0.52 3.3
4 -2 5 0.6990 -1.3979 4 0.60 3.9
5 -1 5 0.6990 -0.6990 1 0.68 4.8
6 0 7 0.8451 0.0000 0 0.76 5.7
7 +1 6 0.7782 0.7782 1 0.84 6.9
8 +2 8 0.9031 1.8062 4 0.92 8.3
9 +3 9 0.9542 2.8627 9 1.00 10
10 +4 12 1.0792 4.3167 16 1.08 12
11 +5 13 1.1139 5.5697 25 1.16 14.4
Σ 0 74 8.4519 7.8407 92 8.36 74.3
Sustituyendo:

log a =
∑ (log Y )
=
8.4519
= 0.76
n 11
log b =
∑ ( X log Y )
=
7.8405
= 0.08
∑ X 2
92
Luego la ecuación de regresión transformada en logaritmos es:
log Yc = 0.76 + 0.08 X
Interpretación (Gujarati, 1999: 123) de la ecuación: durante el periodo de análisis Y se

incrementó a una tasa de 8% anualmente.
Los valores de cada Yci , donde (i) = 1,2,3... ...8,9,10,11; así se obtienen:
lnYc1 = 0.76 + 0.08 (-5) = 0.76 - 0.4 = 0.36 ; su antilogaritmo es = 2.3

lnYc6 = 0.76 + 0.08 (0) = 0.76 - 0 = 0.76 ; su antilogaritmo es = 5.7
lnYc7 = 0.76 + 0.08 (1) = 0.76 + 0.08 = 0.84 ; su antilogaritmo es =6.9
lnYc8 = 0.76 + 0.08 (2) = 0.76 + 0.16 = 0.92 ; su antilogaritmo es = 8.3
lnYc9 = 0.76 + 0.08 (3) = 0.76 + 0.24 = 1.00 ; su antilogaritmo es = 10
lnYc10 = 0.76 + 0.08 (4) = 0.76 + 0.32 = 1.08 ; su antilogaritmo es = 12
lnYc11 = 0.76 + 0.08 (5) = 0.76 + 0.40 = 1.16 ; su antilogaritmo es = 14.4
Con estos resultados se pueden hacer en forma análoga los ejercicios anteriores:
a) La prueba de significación estadística de los parámetros estimados
b) El cálculo de R2, r, R
c) La prueba de la significación global con F
IX.3.3.1. Otro ejemplo, usando los datos del primer caso con diez observaciones para cada
variable, tenemos que para calcular la tasa de crecimiento en el periodo de Y se hace la
siguiente corrida de regresión, considerando que X1 es la variable tiempo:
Date: 09/30/08 Time: 23:38
Sample: 2001 2010

C 1.068236 0.151748 7.039538 0.0001

X1 0.109979 0.021897 5.022500 0.0010

Interpretación del coeficiente de la variable regresora:0.109979 es la tasa de crecimiento e indica

que Y se incrementó en el periodo a una tasa promedio anual de 10.9979%.
IX.3.4 Función de Consumo Transformada a Forma Lineal Semilogarítmica, Usando

Logaritmos Naturales
Para los años 1,2,3,4 y 5 el consumo (Y) como el ingreso (X) expresados en miles de millones de
pesos es:
Tabla 4:
Transformación de la Función Consumo e Ingreso de la Forma Lineal a
Semilogarítmica usando Logaritmos Naturales
_
Año Y X lnY _ xi = X-X ln yixi X2
ln yi = LnY-LnY xi2
1 7 9 1.9459 -0.2751 -2.2 0.6053 81 4.84
2 8 10 2.0794 -0.1416 -1.2 0.1699 100 1.44
3 9 10 2.1972 -0.0239 -1.2 0.0286 100 1.44
4 11 13 2.3979 0.1768 1.8 0.3182 169 3.24
5 12 14 2.4849 0.2638 2.8 0.7387 196 7.84
Σ 47 56 11.1053 0 0 1.8609 646 18.8
Las respectivas medias están dadas por:
11.1053
ln Y = = 2.22
5
56
ln X = = 11.2
5
a) Encontrar la ecuación de regresión con y = f (x)
Con esa información sustituimos en las fórmulas de los estimadores de los parámetros y
encontramos:

ln bˆ =
∑ xi ln y i
=
1.8609
= 0.0989
∑ x 2
i 18.8
ln aˆ = log Y − bˆX = 2.22 − 0.0988(11.2) = 1.1124
Luego entonces la ecuación de regresión será: ln Yc = 1.1124 + 0.0989X

b) Probar la significación estadística de los parámetros estimados.
Para ello primero se debe obtener ln y , luego e, ∑ ei2 , S 2 , Sb , Sa cuyos cálculos son:
ln Yc1 = 1.1124 + 0.0989 (9) = 2.003

*
*
*
ln Yc5 = 1.1124 + 0.0989 (14) = 2.498
Transformación de la Función Consumo e Ingreso de la Forma Lineal a
Semilogarítmica usando Logaritmos Naturales
Años lnYc e=lnY-lnYc ei2 Lnyi2

1 2.0033 -0.0575 0.0032 0.0756
2 2.1022 -0.0228 0.0005 0.0201
3 2.1022 0.0949 0.0090 0.0015
4 2.3992 -0.0013 0.0001 0.03125
5 2.4982 -0.0133 0.0002 0.0695
Σ 0 0.013 0.1972
Primero calculamos: S = 2 ∑ ei2

=
0.013
= 0.0043
n− k 5− 2
luego: S aˆ =
∑ ei2 ∑ X 2
 (649) 
= 0.0043  = 0.0299
2
n− k n∑ x 2
1  5(18.8) 
por consiguiente S a = S a2 = 0.0299 = 01730

.
también:

S =
2 ∑ ei21  1 
= 0.0043 = 0.0023
n − k ∑ xi  18.8 
b 2
Sb = Sb2 = 0.00023 = 0.0151
Con ello establecemos:

Ho: a = 0 Ho: b = 0
HA: a ≠ 0 HA: b ≠ 0
a − a 11124
. − 0 b − b 0.0989 − 0
ta = = = 6.4293 =tb = = 6.5179
S a 01730
. Sb 0.0151
Con α =5% y 3 grados de libertad hallamos t α = ± 3182. que es menor que ta, tb, por lo que decimos
que a, b son significativamente diferentes de cero, es decir que se acepta la hipótesis alternativa; ello
indica que si hay relación entre el consumo (Y) y el ingreso (X).
c) Obtener R2, r:
R = 1−
2 ∑ ei2
= 1−
0.0130
= 0.934 o 93.4%
∑ y i
2
01972
.
Lo anterior indica que X explica el 93.4% de los cambios que suceden en Y. En seguida obtenemos:
r= R2 = 0.934 = 0.9664
Lo cual significa que hay una alta correlación positiva entre X e Y, es decir, a medida que aumenta
X, también lo hace Y de acuerdo con el valor de la pendiente b .
d) Predicción: Digamos que para 6 la variable X = 16 y se desea estimar el valor de Y para ese
año. Sustituimos:
lnYc = 1.1124 + 0.0989 (16) = 2.6962, cuyo antilogaritmo es 14.8, que es el valor estimado del
consumo Y en el año 6.
e) Límites de Confianza: Si se desea calcular el intervalo dentro del cual se halla contenido el valor
real de Y con cierta probabilidad para el año 6, aplicamos la siguiente fórmula:
Y = Yc ± t α S f
donde:
Sf = error de predicción
 (Yc − X ) 2 
1 2 1 (14.8 − 11.2) 2   12.96 
S f = S 1 + +
2 2
 = S 1 + +  = 0.0043 1 + 0.2 + =
 n ∑ (X1 − X )  2
 5 (18.8) 2
  353.44 

= 0.0043(1 + 0.23) = 0.005

luego S f = 0.07 y si α = 5%; t α = ± 3182
. y n-k =3

tenemos:
Y = Yc ± t α S f
Y = 14.8 ± 3182
. ( 0.07 )
Y = 14.8 ± 0.22
Interpretación: El valor real de Y para 1997 está en el intervalo de confianza 14.8 ± 0.22, con una
probabilidad del 95%, cuyo limite inferior es 14.58 y el superior es 15.02.
Comentarios: El ajuste con la función semilogarítmica es mejor que el ajuste con las formas lineales
y polinomiales.
IX.3.5 Modelo semi logarítmico lin log es aquel por medio del cual el coeficiente de X1 mide el
cambio absoluto constante en Y ante un cambio relativo o proporcional dado en X1 (Gujarati,
1991:155). Así, sea el siguiente ejemplo:
Date: 10/01/08 Time: 00:20
Sample: 2001 2010
C 12.64536 0.802140 15.76452 0.0000

LX2 -3.721211 0.421380 -8.831021 0.0000

Interpretación del coeficiente: la pendiente de X2 que vale 3.721211 indica que un

incremento en X2 de 1% produce un cambio absoluto en Y de menos 3.721211.
IX.3.6 Modelos Reciprocos (Gujarati, 1991)

Los modelos del siguiente tipo se conocen como modelos recíprocos.
 1 
Yi = β 1 + β 2   + µ i
 Xi 

A pesar de que este modelo es no lineal en la variable X porque entra inversamente o en forma
recíproca, el modelo es lineal en β1 y β2 y, por consiguiente, es un modelo de regresión lineal. 1
Este modelo tiene las siguientes características: a medida que X aumenta indefinidamente, el
término β2 (1/X) se acerca a cero (nota: β 2 es una constante) y Y se aproxima al valor límite o
asintótico β 1. Por consiguiente, modelos tales como este contienen un valor asintótico o límite
que tomará la variable dependiente cuando el valor de la variable X aumente
indefinidamente.2
C 3.892139 0.730942 5.324828 0.0007

RECX2 9.120999 2.043174 4.464131 0.0021

Interpretación: Conforme se incrementa indefinidamente la inflación, X2, el consumo nacional se

acerca a su valor asintótico de un poco más de 3.8 miles de millones. Como se indicó en el pie de
nota 2, el valor positivo del coeficiente de 1/X2 implica que la tasa de cambio de Y con respecto a
X2 es negativa.
 1 
1
Si se define que X i* = (1/X), entonces Yi = β 1 + β 2   + µ i es lineal en los parámetros al igual que en las
 Xi 
variables Yi y X i*
 1 
2
La pendiente de Yi = β 1 + β 2   + µ i es: dY/dX = -β2 (1/X2), e implica que si β2 es positivo, la pendiente siempre
 Xi 
es negativa y si β2 es negativa, la pendiente es positiva. Véase su ilustración en las siguientes gráficas del modelo
 1 
recíproco: Yi = β 1 + β 2   + µ i .
X
 i

IX.4 Aplicación de Formas Funcionales en los Modelos de Regresión
Se trabaja principalmente con modelos que son lineales en los parámetros, los cuales pueden ser o
no lineales en las variables. Se consideraran algunos modelos de regresión más comúnmente
útilizados, que pueden ser no lineales en las variables pero que son lineales en los parámetros o que
pueden serlo mediante transformaciones apropiadas de las variables. En particular, se analizarán los
siguientes modelos de regresión:
1. El modelo log-lineal
2. Modelos semilogarítmicos
3. Modelos recíprocos
4. El modelo logarítmico recíproco
Se analizan las características especiales de cada modelo, los casos en los cuales su uso es apropiado y la forma como
éstos son estimados.
1.- Cómo Medir la Elasticidad: modelo log-lineal
Considérese el siguiente modelo, conocido como el modelo de regresión exponencial:

Yi = β i X iβ 2 e µ i 1
el cual puede ser expresado alternativamente como:

ln Yi = ln β i + β 2 ln X i + µ i 2
Obsérvense estas propiedades de los logaritmos:

1) In(AB) = In A + In B,
2) In(A/B) = In A - In B y
3) In(Ak) = k In A, suponiendo que A y B son positivos y donde k es alguna constante.
Ejemplo con Eviews: Supongamos que Y es el consumo y X2 es la tasa de interés; sus datos
originales están comprendidos en el punto VIII; dado que son datos hipotéticos usados para ilustrar
el uso de la metodología y el algoritmo de cálculo, digamos que sus valores están expresados en
miles de millones de pesos. Al respecto, se empieza estableciendo la teoría económica indicando
que Y e X2 tienen una relación inversa: a medida que aumenta la tasa de interés disminuye el
consumo nacional. Para medir qué tanto afecta el aumento en la tasa de interés al consumo de un
país vamos a transformar la variable X2 en su recíproca, para ello vamos a Quick/generate series/
en la ventana escribimos RecX2=1/X2/ok. Una vez que le hemos dado un nombre vamos a Quick/

donde In = logaritmo natural (es decir, logaritmo en base e y donde e = 2.718). Si se escribe (2)
como
ln Yi = α + β 2 ln X i + µ i 3
donde α = In β1 este modelo es lineal en los parámetros α y β2, lineal en los logaritmos de las
variables Y y X y puede ser estimado por regresión MCO. Debido a esta linealidad, tales modelos se
denominan modelos log-log, doble-Iog, o log-lineales. .
Si los supuestos del modelo clásico de regresión lineal se cumplen, los

parámetros de (3) pueden ser estimados por el método MCO considerando que
Yi* = α + β 2 X i* + µ i 4
donde Yi = In Yi y X i = In Xi'. Los estimadores MCO obtenidos, αˆ y βˆ2 serán los mejores
* *
estimadores lineales insesgados de α y β2 respectivamente.

Una característica importante del modelo log-log, que lo ha hecho muy popular en el trabajo
empírico, es que el coeficiente de la pendiente β2 mide la elasticidad de Y con respecto a X, es
decir, el cambio porcentual en Y ante un pequeño cambio porcentual en X dado3. Así, si Y
representa la cantidad demandada de un bien y X su precio unitario, 2 mide la elasticidad-precio de
la demanda, un parámetro de gran interés en economía. Si la relación entre la cantidad demandada y
el precio es como se muestra en la figura a, la transformación doble-Iog presentada en la figura b
dará entonces la estimación de la elasticidad-precio (-β2).
Figura Modelo de Elasticidad Constante. (a) y (b)
estímate equation/ en la ventana escribimos Y c recX2/ok y sale el siguiente cuadro:
Dependent variable Y:Method: Least SquaresDate: 10/02/08 Time: 14:47Sample: 2001 2010Included
observations: 10
3
El coeficiente de la elasticidad, en la notación de cálculo, se define como (dY/Y)/(dX/X) = [(dY/ dX)(X/Y)].
Nota técnica: Se observa que d(ln X)/dX = 1/X o d(ln X) = dX/X, es decir, para cambios infinitesimalmente pequeños
(obsérvese el operador diferencial d), un cambio en In X es igual al cambio relativo o proporcional en X. En la práctica,
sin embargo, si el cambio en X es pequeño, esta relación puede escribirse como: cambio en In X ≅ cambio relativo en
X, donde ≅ significa aproximadamente. Así, para cambios pequeños,
(In Xt - In Xt-1) ≅ (Xt – Xt-1)/Xt-1 = cambio relativo en X
A propósito, se deberá observar estos términos, a los que se hace referencia frecuentemente:
1) cambio absoluto,
2) cambio relativo o proporcional y
3) cambio porcentual o tasa de crecimiento porcentual.
Así, (Xt – Xt-1) representa un cambio absoluto, (Xt – Xt-1)/Xt-1 = (Xt/Xt-1-1) es un cambio relativo o proporcional y [(Xt –
Xt-1)/Xt-1]IOO es el cambio porcentual, o la tasa de crecimiento. Xt y Xt-1 son los valores actual y anterior de la
variable X, respectivamente.

Pueden observarse dos características especiales del modelo log-lineal: el modelo supone que el
coeficiente de la elasticidad entre Y y X, β2 permanece constante a través del tiempo (¿por qué?) de
aquí su nombre alterno modelo de elasticidad constante4. En otras palabras, como lo indica la
figura b, el cambio en In Y por unidad de cambio en In X (es decir, la elasticidad, β2; permanece
igual sin importar en cuál ln X se mide la elasticidad. Otro aspecto del modelo es que a pesar de que
αˆ y βˆ2 son estimadores insesgados de α y β2, β1 (el parámetro del modelo original) al ser estimado
como βˆ1 = antilog ( αˆ ) es, de por sí, un estimador sesgado. En la mayor parte de los problemas
prácticos, sin embargo, el término intersección es de importancia secundaria y no es necesario
preocuparse por obtener este estimador insesgado.
En el modelo de dos variables, la forma más simple de decidir si el modelo log-lineal se ajusta a
los datos es graficar el diagrama de dispersión de In Yi frente a In Xi y ver si las observaciones caen
aproximadamente sobre una línea recta como en la figura b.
EJEMPLO 1:
GASTO EN BIENES DURADEROS RESPECTO AL GASTO DE CONSUMO PERSONAL
TOTAL
La tabla 1 muestra los datos sobre el gasto de consumo personal total (GCPERT), el gasto en
bienes duraderos (GASBD), el gasto en bienes perecederos (GASBPER) y el gasto en servicios
(GASERV), todos medidos en millones de dólares de 1992.2
Supóngase que se desea calcular la elasticidad del gasto en bienes durables respecto al gasto de
consumo personal total. Al graficar el logaritmo del gasto en bienes durables en comparación con
el logaritmo del gasto de consumo personal total, se observará que la relación entre las dos
variables es lineal. Por tanto, el modelo del doble logaritmo podría resultar adecuado. Los
resultados de la regresión son:
ln GASBDt = -936971 + 1.9056 lnGCPERTt

ee = (0.4341) (0.0514)
t = (-22.3370)* (37.0962)*
R2 = 0.9849
donde * indica que el valor p es extremadamente pequeño,

Todos estos resultados muestran que la elasticidad de GASBD respecto a GCPERT es de casi
1.90, lo que sugiere que si el gasto personal total aumenta 1%, en promedio, el gasto en bienes
duraderos se incrementa casi 1.90%, En consecuencia, el gasto en bienes duraderos es muy
sensible a los cambios en el gasto de consumo personal. Ésta es una razón por la que los
productores de bienes duraderos siguen muy de cerca los cambios en el ingreso personal y el gasto
de consumo personal.
4
Un modelo de elasticidad constante permitirá obtener un cambio en el ingreso total constante ante un cambio
porcentual dado en precios sin importar el nivel absoluto del precio. Se debe contrastar este resultado con las
condiciones de elasticidad implicadas en una función de demanda lineal simple. Yi = β i + β 2 X i + µ i . Sin embargo,
una función lineal simple permite obtener un cambio constante en la cantidad generado por un cambio unitario en el
precio. Confronte esto con le que implica el modelo log-lineal para un cambio dado en el precio del dólar.

2.- Modelos Semilogarítmicos: log-lin y lin-log
Cómo medir la tasa de crecimiento: Modelo Log-Lin

Los economistas, la gente de negocios y los gobiernos frecuentemente están interesados en encontrar
la tasa de crecimiento de ciertas variables económicas, tales como población, PIB, oferta monetaria,
empleo, productividad, déficit comercial, etc.
Supóngase que se desea saber la tasa de crecimiento del gasto de consumo personal en servicios
para los siguientes datos (ver tabla 1). Sea Yt el gasto real en servicios en el tiempo t, y Yo el valor
inicial del gasto en servicios (es decir, el valor al final del cuarto trimestre de 1992). Se ha de
recordar la fórmula del interés compuesto.
Yt = Y0 (1 + r )t 5
donde r es tasa de crecimiento compuesta de Y (es decir, a través del tiempo). Tomando el logaritmo
natural de (5), podemos escribir
ln Yt = ln Y0 + t ln(1 + r ) 6
Ahora sea
β 1 = lnY0 7
β 2 = ln(1 + r ) 8
Se puede escribir (5) así
ln Yt = β 1 + β 2 t 9
Agregando el término de perturbación a (9), se obtiene5
ln Yt = β 1 + β 2t + µ t 10
Este modelo es igual a cualquier otro modelo de regresión lineal en el sentido de que los parámetros
β1 y β2, son lineales. La única diferencia es que la variable dependiente o regresada es el logaritmo de
Y y el regresor o variable explicativa es el "tiempo", que adquiere valores de 1,2,3, etc.
Modelos como (10) se denominan modelos semilog porque solamente una variable (en este caso la
dependiente) aparece en forma logarítmica. Para fines descriptivos, un modelo en el cual la variable
regresada es logarítmica se denominará modelo log-lin. Antes de presentar los resultados de la
regresión, examínense las propiedades del modelo (9). En este modelo el coeficiente de la
pendiente mide el cambio proporcional constante o relativo en Y para un cambio absoluto
dado en el valor de la variable independiente (en este caso la variable t), es decir,6
5
Se agrega el término error porque la fórmula de interés compuesto no se cumple exactamente.
6
Utilizando cálculo diferencial. se puede demostrar que β 2 = d(ln Y)ldX = (1/Y)(dYldX) = (dYIY)ldX, que no
es otra cosa que (11). Para cambios pequeños en Y y en X, esta relación puede aproximarse mediante

cambio relativo en la var iable dependiente

β 2 = 11
cambio relativo absoluto en la var iable independiente
Si se multiplica el cambio relativo en Y por 100, (11) dará entonces el cambio porcentual, o la tasa
de crecimiento, en Y ocasionada por un cambio absoluto en X, la variable independiente. Es decir,
100 por β2 da como resultado la tasa de crecimiento en Y; 100 por β2 se conoce en la literatura
como la semielasticidad de Y respecto a X.
EJEMPLO 2: LA TASA DE CRECIMIENTO DEL GASTO EN SERVICIOS
Para ilustrar el modelo de crecimiento (10), considere los datos sobre el gasto en servicios
proporcionados en la tabla 1. Los resultados de la regresión son los siguientes:
In GASER, = 7.7890 + 0.00743t

ee = (0.0023) (0.00017)
t = (3387.619)* (44.2826)*
R2 = 0.9894
Nota: GASER significa gasto en servicios y el asterisco (*) denota que el valor p es
extremadamente pequeño.
La interpretación de la ecuación es que durante un periodo de un trimestre (del primero al tercero
de 1993), el gasto en servicios se incrementó a una tasa (trimestral) de 0.743%. Aproximadamente
esto es igual a un crecimiento anual de 2.972%. Puesto que 7.7890 = log de GES al comienzo del
periodo de análisis, si se toma su antilogaritmo se tiene 2.41390 (billones de dólares), como el
valor inicial de GES (es decir, el valor al final del último trimestre de 1992). La recta de regresión
obtenida mediante la ecuación del ejemplo 2, se ilustra en la figura c.
Figura c
( Yt − Yt − 1 ) / Yt − 1
( Xt − Xt− 1)
Nota: aquí X = t.

Tasa de crecimiento instantánea vs. compuesta. El coeficiente da la tasa de crecimieto instantánea

(en un punto del tiempo) y no la compuesta (durante un periodo). Pero esta última puede encontrarse
a partir de (8): obtener el antilogaritmo de la β2 estimada, restarle 1 y multiplicar la diferencia por
100. Por tanto, para el ejemplo, el coeficiente de la pendiente estimado es 0.00743. Así pues,
[antilog(0.00743) - 1] = 0.00746 o 0.746%. En consecuencia, en el ejemplo ilustrativo la tasa
compuesta de crecimiento de gastos en servicios fue de casi 0.746% por trimestre, lo cual es un poco
mayor que la tasa de crecimiento instantánea de 0.743%. Lo anterior se debe, por supuesto, al efecto
compuesto.
Modelo de tendencia lineal En lugar de estimar el modelo (10), los investigadores algunas
veces estiman el siguiente modelo:
Yt = β 1 + β 2 t + µ t 12
Es decir, en lugar de hacer la regresión para el log de Y sobre el tiempo, lo hacen para Y sobre el
tiempo. Un modelo de este tipo se denomina modelo de tendencia lineal y la variable tiempo t se
conoce como la variable de tendencia. Si el coeficiente de la pendiente en (12) es positivo, existe
una tendencia creciente en Y, mientras que si es negativa, existe una tendencia decreciente en Y.
Para los datos concernientes con el gasto en servicios que se analizaron antes, los resultados de
ajustar el modelo de tendencia lineal (12) son los siguientes:
Ejemplo 3 de la Tabla 1
GASERt = 2 405.848 + 19.6920t
t = (322.9855) (36.2479)
R2= 0.9843
"En contraste con la ecuación anterior, la interpretación es la siguiente: durante el periodo
trimestral (del primero al tercero de 1993), en promedio, el gasto en servicios se incrementó a
una tasa absoluta (nota: no relativa) de casi 20 mil millones de dólares por trimestre. Es decir,
hubo una tendencia creciente en el gasto en servicios.
La elección entre el modelo de crecimiento del ejemplo 2 y el modelo de tendencia lineal del
ejemplo 3, dependerá de si se está interesado en el cambio relativo o absoluto en el gasto en
servicios aunque, para propósitos de comparación, es el cambio relativo el que tiene mayor
importancia. Es necesario observar que no se puede comparar los valores de R2 de los modelos de
los ejemplos 2 y 3 porque las variables dependientes son diferentes en los dos modelos.
El modelo Lin-Log
A diferencia del modelo de crecimiento recién estudiado, en el cual se estaba interesado en encontrar

el crecimiento porcentual en Y, ante un cambio unitario absoluto en X, ahora hay interés en

encontrar el cambio absoluto en Y debido a un cambio porcentual en X. Un modelo que puede
lograr este propósito puede escribirse como
Yi = β i + β 2 ln X i + µ i 13
Para fines descriptivos, llamamos a este modelo un modelo lin-log. Interprétese el coeficiente de la
pendiente β2.7 Como es usual,
cambio en Y cambio en Y
β2= o β2=
cambio en ln X cambio relativo en X
El segundo paso se basa en el hecho de que un cambio en el log de un número es un cambio
relativo.
Simbólicamente, se tiene
∆Y
β2= 14
∆X/X
donde, como es usual, ∆ denota un cambio pequeño. La ecuación anterior puede ser escrita en forma
equivalente así:
∆Y =β2(∆X/X) 15
Esta ecuación plantea que el cambio absoluto en Y (= ∆Y) es igual a la pendiente multiplicada
por el cambio relativo en X. Si este último es multiplicado por 100, entonces (∆Y =β2(∆X/X)) da
el cambio absoluto en Y ocasionado por un cambio porcentual en X.
Así, si ∆X/X cambia en 0.01 unidades (o 1 %), el cambio absoluto en Y es 0.01(β2). Por tanto, si en
una aplicación se encuentra que β2 = 500, entonces el cambio absoluto en Y es (0.01)(500), o 5.0.
Por consiguiente, cuando se utiliza MCO para estimar regresiones como en (13), se debe multiplicar
el valor del coeficiente de la pendiente estimado, β2 por 0.01 o, lo que es lo mismo, dividido entre
100. Si no se tiene lo anterior presente, la interpretación en una aplicación será muy equivocada.
La pregunta práctica es: ¿cuándo resulta útil un modelo lin-log como el (13)? Se ha encontrado una
interesante aplicación en los así conocidos modelos de gasto Engel. Postuló que "el gasto total que
se dedica a los alimentos tiende a incrementarse en progresión aritmética, mientras que el gasto total
aumenta en progresión geométrica" .
EJEMPLO 4:
dY ∆Y
dY  1 β2= = β2=
7
Nuevamente, utilizando cálculo diferencial, se tiene = β 2  Por consiguiente, dX ∆X/X
dX  X
x

Los datos para el modelo lin-log, se observan en la tabla 2 además si se grafican estos, se obtiene
la gráfica de la figura d. Tal y como esta figura sugiere, el gasto alimenticio se incrementa en
forma más lenta, conforme el gasto total aumenta, lo cual quizá proporcione sustento a la ley de
Engels. Los resultados de ajustar el modelo lin-Iog a los datos son los siguientes:
GASALi= -1283.912 + 257.2700 In GASTOTi

t= (-4.3848)* (5.6625)*
R2 = 0.3769
Nota: (*) denota un valor p extremadamente pequeño.
Interpretado de la forma antes descrita, el coeficiente de la pendiente, que vale casi 257, significa
que un incremento en el gasto total en alimentos de 1 %, en promedio, propicia un incremento de
casi 2.57 rupias en el gasto en alimento de las 55 familias incluidas en la muestra. (Nota: se
dividió el coeficiente estimado de la pendiente entre 100.)
Antes de seguir, obsérvese que si se desea calcular el coeficiente de elasticidad para los modelos
lin-Iog o log-lin, se puede hacer a partir de la definición del coeficiente de elasticidad dada antes, a
saber:
dY X
Elasticidad =
dX Y
En la práctica, una vez que se conoce la forma funcional de un modelo, se pueden calcular las
elasticidades aplicando la anterior definición.
Figura d
3.- Modelos Reciprocos

Los modelos del siguiente tipo se conocen como modelos recíprocos.

 1 
Yi = β 1 + β 2   + µ i 16
 Xi 
A pesar de que este modelo es no lineal en la variable X porque entra inversamente o en forma
recíproca, el modelo es lineal en β1 y β2 y, por consiguiente, es un modelo de regresión lineal. 8
Este modelo tiene las siguientes características: a medida que X aumenta indefinidamente, el
término β2 (1/X) se acerca a cero (nota: β 2 es una constante) y Y se aproxima al valor límite o
asintótico β 1. Por consiguiente, modelos tales como (16) contienen un valor asintótico o límite
que tomará la variable dependiente cuando el valor de la variable X aumente
indefinidamente.9
Algunas formas probables de la curva correspondiente a (16) se muestran a continuación. Como

un ejemplo de la figura e, considérense los datos proporcionados en la tabla 3.
 1 
Figura Modelo Recíproco: Yi = β 1 + β 2   + µ i e
 Xi 
Éstos son datos representativos de 64 países respecto a la mortalidad infantil y a otras variables. Por
el momento, hay que concentrarse en las variables de mortalidad infantil (MI) y PIB percápita
(PIBPC), mismas que se grafican en la figura h.
 1 
8
Si se define que X i* = (1/X), entonces Yi = β 1 + β 2   + µ i es lineal en los parámetros al igual que en las
X
 i
variables Yi y X i*
 1 
9
La pendiente de Yi = β 1 + β 2   + µ i es: dY/dX = -β2 (1/X2), e implica que si β2 es positivo, la pendiente siempre
X
 i
es negativa y si β2 es negativa, la pendiente es positiva. Véanse figuras e y g, respectivamente.

Figura h
 1 
Figura Modelo Recíproco: Yi = β 1 + β 2   + µ i f y g
 Xi 

Como puede observarse, esta figura se parece a la figura a conforme el PIB per cápita se
incrementa, se esperaría que la mortalidad infantil disminuyera, debido a que las personas pueden
gastar más en el cuidado de la salud, si se supone que los otros factores permanecen constantes. Pero
la relación no da como resultado una recta: conforme el PIB per cápita se incrementa, al principio
existe una disminución drástica en la MI, pero ésta va disminuyendo en la medida que el PIB per
cápita sigue aumentando.
Si se trata de ajustar el modelo recíproco (16), se obtienen los siguientes resultados:
 1 
MIi = 81.79436 + 27 237.17  
 PIBPCi 
ee = (10.8321) (3759.999)
t = (7.5511) (7.2535)
R2 = 0.4590
Conforme el PIB per cápita se incrementa indefinidamente, la mortalidad infantil se acerca a su

valor asintótico de casi 82 muertes por cada millar. Como se explicó en la nota 6, el valor positivo
del coeficiente de (1/PIBPCi) implica que la tasa de cambio de la MI con respecto al PIBPC es
negativa.
Una de las aplicaciones importantes de la figura f es la conocida curva de Phillips de

macroeconomía. Con base en los datos de tasa de cambio porcentual de los salarios nominales (Y) y
la tasa porcentual de desempleo (X) para el Reino Unido durante el periodo 1861 a 1957. Phillips
obtuvo una curva cuya forma general se parece a la figura f y es reproducida en la figura i.
Como lo muestra la figura siguiente, existe asimetría en la respuesta de los cambios salariales al
nivel de desempleo: si la tasa de desempleo está por debajo de U" (denominada por los economistas
como tasa natural de desempleo) por cada unidad de cambio en el desempleo, los salarios aumentan
con mayor rapidez de lo que caen debido a un cambio equivalente cuando la tasa de desempleo está
por encima del nivel natural, β1 indicando la base asintótica para el cambio salarial. Este hecho
particular de la curva de Phillips puede deberse a factores institucionales, tales como el poder de
negociación de los sindicatos, los salarios mínimos, compensaciones por desempleo, etc.

Figura Curva de Phillips i
Desde la publicación del artículo de Phillips, se ha llevado a cabo una muy extensa investigación
sobre la curva de Phillips tanto a nivel teórico como empírico. La curva de Phillips ha
experimentado diversas encarnaciones. Una formulación comparativamente reciente la proporciona
Olivier Blanchard, denota la tasa de inflación en el tiempo t, misma que se define como el cambio
porcentual en el nivel de precios, medido por un índice de precios representativo, como el Índice de
Precios al Consumidor (IPC), y si UNt denota la tasa de desempleo en el tiempo t, entonces la
moderna versión de la curva de Phillips se expresa bajo el siguiente formato:
πt−π t
e
= β 2 (UN t − U n ) + µ t 17
donde:
π t = tasa real de inflación en el tiempo t.
π te = tasa real de inflación esperada en el tiempo t, donde la expectativa se forma en el año (t - 1)
UNt = tasa real de desempleo que prevalece en el tiempo t
Un = tasa natural de desempleo en el tiempo t
µt = término error estocástico

Puesto que π
e
t no se puede observar de manera directa, como punto de partida se puede
simplificar suponiendo que π t = π t − 1 ; es decir, la inflación esperada este año es la tasa de inflación
e
que prevaleció el año anterior; por supuesto, se pueden hacer suposiciones más complicadas respecto
a la formación de expectativas, en los modelos de retraso distribuido.
Al sustituir esta suposición en (17) y escribir el modelo de regresión en la forma estándar, se

obtiene la siguiente ecuación de estimación:
π t − π t − 1 = β 1 + β 2UNt + µ t 18
donde β1 = -β2 Un. La ecuación anterior establece que el cambio en la tasa de inflación entre los dos
periodos está linealmente relacionado con la tasa de desempleo real. A priori, se espera que β2 sea
negativa (¿por qué?) y β1 positiva (esto se debe a que β2 es negativa y Un es positiva).
A propósito, la relación Phillips dada en (17) se conoce en la literatura como la curva de Phillips
modificada, la curva de Phillips de expectativas aumentadas (para indicar que π t − 1 significa la
inflación esperada), o la curva de Phillips aceleradora (para sugerir que una baja tasa de desempleo
propicia un incremento en la tasa de inflación y por consiguiente provoca una aceleración del nivel
de precios).
A manera de ilustración de la curva de Phillips modificada, en la tabla 4 se presentan datos sobre
la inflación medida por el porcentaje anual en el Índice de Precios al Consumidor (IPCon inflación)
y la tasa de desempleo para el periodo 1960-1998. La tasa de desempleo representa la tasa de
desempleo civil. A partir de estos datos se obtuvo el cambio en la tasa de inflación ( π t − π t − 1 ) y se
graficó respecto a la tasa de desempleo civil; se está utilizando el IPC como una medida de la
inflación. La gráfica resultante aparece en la figura j.
Como se esperaba, la relación entre el cambio en la tasa de inflación y la tasa de desempleo es
negativa (un desempleo bajo provoca un incremento en la tasa de inflación y por consiguiente una
aceleración del nivel de precios, de ahí el nombre de curva aceleradora de Phillips).
Al observar la figura j, no resulta obvio si un modelo de regresión lineal (una recta) o un modelo
recíproco sea el que se ajuste con los datos; tal vez haya una relación curvilínea entre las dos
variables. Sin embargo, hay que tener presente que para el modelo recíproco se espera que sea
negativo el término intersección y la pendiente positiva, como se hizo énfasis en la nota 6.
Figura Curva de Phillips Modificada j

Ejemplo 6 de la Tabla 4:
Modelo lineal: ( π t − π t − 1 ) = 4.1781 - 0.6895 UNt
t = (3.9521) (-4.0692)
R = 0.3150 2
Para el modelo recíproco:
 1 
(π t − π t− 1 ) = -3.2514 + 18.5508  
 UN t 
t = (-2.9715) (3.0625)
R2 = 0.2067
Todos los coeficientes estimados en ambos modelos son significativos estadística e individualmente,
además todos los valores de p son menores que el nivel 0.005.
El modelo del ejemplo 6 muestra que si la tasa de desempleo baja un punto porcentual, en promedio,
el cambio en la tasa de inflación aumenta 0.7 puntos porcentuales, y viceversa. El modelo del
ejemplo 7 revela que incluso si la tasa de desempleo se incrementara de manera indefinida, el
máximo cambio en la tasa de inflación bajaría y sería de 3.25 puntos porcentuales. A propósito, de la
ecuación del modelo 6, se puede calcular la tasa de desempleo natural subyacente, de la siguiente
forma:
βˆ1 4.1781
Un = = = 6.0596 19
ˆ
− β 2 0.6895
Es decir, la tasa de desempleo natural es de casi 6.06%. Los economistas sitúan la tasa natural entre
el 5 y el 6%, aunque en años recientes la tasa real de desempleo para Estados Unidos ha sido mucho
más baja.
4.- Modelo log hipérbola o recíproco logarítmico

Se concluye este análisis de los modelos recíprocos, estudiando el modelo
recíproco logarítmico, que toma la siguiente forma:
 1 
ln Yi = β 1 − β 2   + µ i 20
 Xi 

Su forma se ilustra en la figura k. Se muestra al principio Y se incrementa a una tasa creciente (es
decir, la curva es convexa al inicio) y luego aumenta a una tasa decreciente (la curva se convierte en
cóncava).10 20 Por consiguiente, este modelo sería apropiado para representar una función de
producción a corto plazo. Recuerde que los cursos de microeconomía que si el trabajo y el capital
son insumos en una función de producción y si se mantiene constante el insumo capital pero se
incrementa el insumo trabajo, la relación entre producto y trabajo a corto plazo se parecerá a la
figura k.
ELECCIÓN DE LA FORMA FUNCIONAL
Se analizaron las distintas formas funcionales que un modelo empírico puede tomar, incluso dentro
de los confines de los modelos de regresión lineal en el parámetro. La elección de una forma
funcional particular puede ser relativamente fácil para el caso de dos variables, ya que se pueden
graficar las variables y tener así una ligera idea respecto al modelo apropiado. La elección se vuelve
mucho más complicada cuando se considera el modelo de regresión múltiple que involucra más de
una variable independiente.
1. Es una buena práctica calcular la tasa de cambio (es decir, la pendiente) de la regresada, con
respecto a la regresora, así como conocer la elasticidad de la regresada con respecto a la regresara.
Para los diversos modelos estudiados en este capítulo, se proporcionan en la tabla 5 las fórmulas
d  1   1  d 1 dY
10
Del cálculo, se puede demostrar que (ln Y ) = − β 2  − 2  = β 2  2  Pero (ln Y ) =
dX  X   X  dX Y dX
dY Y
Al sustituir, se obtiene = β2 2 que es la pendiente de Y respecto a X.
dX X

necesarias para los coeficientes de la pendiente y de la elasticidad de los distintos modelos. El

conocimiento de tales fórmulas ayudarán a comparar los diversos modelos.
2. Los coeficientes del modelo escogido deberán satisfacer determinadas expectativas a priori. Por
ejemplo, si se está considerando la demanda de automóviles como una función del precio y de otras
variables, se deberá esperar un coeficiente negativo para la variable precio.
3. Algunas veces tal vez más de un modelo se ajuste razonablemente bien a un determinado conjunto
de datos dados. En la curva de Phillips modificada, un modelo lineal y otro recíproco se ajustaron a
los datos. En ambos casos, los coeficientes resultaron adecuados para las expectativas previas y
fueron estadísticamente significativos. Una gran diferencia fue que el valor R2 del modelo lineal fue
mayor que el del modelo recíproco. Por tanto, se podría tener una ligera preferencia por el modelo
lineal en comparación con el recíproco. Pero se debe asegurar de que al comparar dos valores de R2
la variable dependiente (o regresada) de los dos modelos sea la misma; la(s) regresor(as) pueden
tomar cualquier forma.
4. En general no se debe sobrevaluar la medición de R2 en el sentido de creer que mientras más alta
sea r mejor será el modelo. Si R2 se incrementa conforme se añaden más regresoras al modelo. Lo
que reviste mayor importancia es la justificación teórica del modelo elegido, los signos de los
coeficientes estimados y su importancia estadística. Si un modelo es bueno bajo estos criterios,
entonces quizá resulte aceptable un modelo con una R2 menor.
Tabla 5
Elasticidad
 dY 
Modelo Ecuación Pendiente  =   dY X 
 dX  = 
 dX Y 
 X
Lineal Y = β i + β 2X β2 β 2 
 Y 
 Y 
Log-lineal o log-Iog ln Y = β i + β 2 ln X β 2  β2
 X
Log-lin ln Y = β i + β 2 X β2(Y) β2(Y)
 1  1
Lin-Iog Y = β i + β 2 ln X β 2  β 2 
 X Y
 1  1   1 
Recíproco Y = β i + β 2  − β 2 2  − β 2 
 X  X   XY 
 1  Y   1
Log recíproco ln Y = β i − β 2   β 2  β 2 
 X  X   X

TABULACIONES NECESARIAS PARA LLEGAR A LOS RESULTADOS DESEADOS
Tabla 1
obs GASER GASBD GASBPER GCPERT
1993.I 2445.3 504 1337.5 4286.8
1993.II 2455.9 519.3 1347.8 4322.8
1993.III 2480 529.9 1356.8 4366.6
1993.IV 2494.4 542.1 1361.8 4398
1994.I 2510.9 550.7 1378.4 4439.4
1994.II 2531.4 558.8 1385.5 4472.2
1994.III 2543.8 561.7 1393.2 4498.2
1994.IV 2555.9 576.6 1402.5 4534.1
1995.I 2570.4 575.2 1410.4 4555.3
1995.II 2594.8 583.5 1415.9 4593.6
1995.III 2610.3 595.3 1418.5 4623.4
1995.IV 2622.9 602.4 1425.6 4650
1996.I 2648.5 611 1433.5 4692.1
1996.II 2668.4 629.5 1450.4 4746.6
1996.III 2688.1 626.5 1454.7 4768.3
1996.IV 2701.7 637.5 1465.1 4802.6
1997.I 2722.1 656.3 1477.9 4853.4
1997.II 2743.6 653.8 1477.1 4872.7
1997.III 2775.4 679.6 1495.7 4947
1997.IV 2804.8 648.8 1494.3 4981
1998.I 2829.3 710.3 1521.2 5055.1
1998.II 2866.8 729.4 1540.9 5130.2
1998.III 2904.8 733.7 1549.1 5181.8
GASER = Gasto en servicios

GASBD = Gasto en bienes duraderos
GASBPER = Gasto en bienes perecederos
GCPERT = Gasto de consumo personal
Dependent Variable: LNGASBD

Sample: 1993:1 1998:3


C -9.697098 0.434127 -22.33702 0.0000
LNGCPERT 1.905633 0.051370 37.09622 0.0000
Sum squared resid 0.003727 Schwarz criterion -5.617155
Dependent Variable: LNGASER

Sample: 1993:1 1998:3
C 7.789009 0.002299 3387.619 0.0000
TIEMPO 0.007426 0.000168 44.28262 0.0000
Sum squared resid 0.000598 Schwarz criterion -7.447539
Dependent Variable: GASER

Sample: 1993:1 1998:3
C 2405.848 7.448782 322.9855 0.0000
TIEMPO 19.69200 0.543258 36.24795 0.0000

Tabla 2
obs GASAL GASTOT obs GASAL GASTOT
1 217 382 31 470 663
2 196 388 32 322 677
3 303 391 33 540 680
4 270 415 34 433 690
5 325 456 35 295 695
6 260 460 36 340 695
7 300 472 37 500 695
8 325 478 38 450 720
9 336 494 39 415 721
10 345 516 40 540 730
11 325 525 41 360 731
12 362 554 42 450 733
13 315 575 43 395 745
14 355 579 44 430 751
15 325 585 45 332 752
16 370 586 46 397 752
17 390 590 47 446 769
18 420 608 48 480 773
19 410 610 49 352 773
20 383 616 50 410 775
21 315 618 51 380 785
22 267 623 52 610 788
23 420 627 53 530 790
24 300 630 54 360 795
25 410 635 55 305 801
26 220 640
27 403 648 GASAL= Gasto en Alimentos
28 350 650 GASTOT= Gasto Total
29 390 655
30 385 662
Dependent Variable: GASAL

Sample: 1 55
C -1283.912 292.8105 -4.384788 0.0001
LNGASTOT 257.2700 45.43413 5.662484 0.0000


Tabla 3
Fertilidad y otros datos para 64 paises
Obs MI TAF PIBPC TFT Obs MI TAF PIBPC TFT
1 128 37 1870 6.66 36 41 66 1620 3.91
2 204 22 130 6.15 37 312 11 190 6.7
3 202 16 310 7 38 77 88 2090 4.2
4 197 65 570 6.25 39 142 22 900 5.43
5 96 76 2050 3.81 40 262 22 230 6.5
6 209 26 200 6.44 41 215 12 140 6.25
7 170 45 670 6.19 42 246 9 330 7.1
8 240 29 300 5.89 43 191 31 1010 7.1
9 241 11 120 5.89 44 182 19 300 7
10 55 55 290 2.36 45 37 88 1730 3.46
11 75 87 1180 3.93 46 103 35 780 5.66
12 129 55 900 5.99 47 67 85 1300 4.82
13 24 93 1730 3.5 48 143 78 930 5
14 165 31 1150 7.41 49 83 85 690 4.74
15 94 77 1160 4.21 50 223 33 200 8.49
16 96 80 1270 5 51 240 19 450 6.5
17 148 30 580 5.27 52 312 21 280 6.5
18 98 69 660 5.21 53 12 79 4430 1.69
19 161 43 420 6.5 54 52 83 270 3.25
20 118 47 1080 6.12 55 79 43 1340 7.17
21 269 17 290 6.19 56 61 88 670 3.52
22 189 35 270 5.05 57 168 28 410 6.09
23 126 58 560 6.16 58 28 95 4370 2.86
24 12 81 4240 1.8 59 121 41 1310 4.88
25 167 29 240 4.75 60 115 62 1470 3.89
26 135 65 430 4.1 61 186 45 300 6.9
27 107 87 3020 6.66 62 47 85 3630 4.1
28 72 63 1420 7.28 63 178 45 220 6.09
29 128 49 420 8.12 64 142 67 560 7.2
30 27 63 19830 5.23
31 152 84 420 5.79 MI = Mortalidad Infantil
32 224 23 530 6.5 TAF = Tasa de alfabetismo femenina
33 142 50 8640 7.17 PIBPC =Pib per capita en 1980
34 104 62 350 6.6 TFT = Tasa de fertilidad total
35 287 31 230 7

Dependent Variable: MI
Sample: 1 64
C 81.79436 10.83206 7.551136 0.0000
1/PIBPC 27273.17 3759.999 7.253503 0.0000
Tabla 4
Tasas de inflación y de desempleo para USA, 1960-1998
Año TSINF TSDES Año TSINF TSDES
1960 1.7 5.5 1985 3.6 7.2
1961 1 6.7 1986 1.9 7
1962 1 5.5 1987 3.6 6.2
1963 1.3 5.7 1988 4.1 5.5
1964 1.3 5.2 1989 4.8 5.3
1965 1.6 4.5 1990 5.4 5.6
1966 2.9 3.8 1991 4.2 6.8
1967 3.1 3.8 1992 3 7.5
1968 4.2 3.6 1993 3 6.9
1969 5.5 3.5 1994 2.6 6.1
1970 5.7 4.9 1995 2.8 5.6
1971 4.4 5.9 1996 3 5.4
1972 3.2 5.6 1997 2.3 4.9
1973 6.2 4.9 1998 1.6 4.5
1974 11 5.6
1975 9.1 8.5 TSINF=Tasa de inflación
1976 5.8 7.7 TSDES=Tasa de desempleo
1977 6.5 7.1
1978 7.6 6.1
1979 11.3 5.8
1980 13.5 7.1
1981 10.3 7.6
1982 6.2 9.7
1983 3.2 9.6
1984 4.3 7.5


Dr. Genaro Sánchez Barajas : Cuarto examen parcial.
Tema: Marco teórico de la transformación de formas funcionales no lineales en lineales

A.-Conteste con una “X” en SI cuando la afirmación sea verdadera y también con una “X” en NO cuando la afirmación
sea falsa:
1.-La elasticidad y R2 no ayudan a seleccionar la forma funcional adecuada para transformar la no lineal: Si___;
No____.
2.- El especialista Dominick salvadores dice que “Cuando ninguna teoría de la dispersión de puntos es de ayuda, la
función lineal se trata usualmente primero debido a su simplicidad”: SI_____;NO_____.
3.-Las transformaciones de funciones no lineales a lineales mas útiles y comunes son la log-log,log-lin,lin-log, reciproca
y polinomial: Si_____; No________
4.- Al usar la log-log el coeficiente de la variable independiente es un estimador insesgado : SI:_______;

NO:___________
5.-Al usar la log-log la elasticidad de la variable regresada se obtiene directamente de los valores de las pendientes de
las regresoras: SI:__; NO__.
6.-Al usar la log-log con las pendientes de las variables regresoras no siempre se obtienen economías de escala: SI___;
NO____.
7.-Al usar la log-log si las variables regresoras son factores de la producción, con sus pendientes se pueden obtener
economías de escala cuando la su suma es mayor que 1: SI____; NO______:
8.-Con la forma funcional semilogarítmica se puede calcular la tasa de crecimiento de la variable regresada con la
pendiente de la regresora: SI____;NO_____.
9.- Con la forma funcional recíproca no se puede calcular la curva de Phillips: SI_____; NO____.
:
 1
10.- La siguiente es la fórmula de la elasticidad del modelo log recíproco: β 2  : SI____; NO______.
 X
B. Observaciones: Cada una de las respuestas correctas vale 10 puntos en escala de 0 a 100.

4 Econometrias

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

4 Econometrias

Încărcat de

Drepturi de autor:

Formate disponibile

Introducción a la Econometría

VII. MODELO LINEAL SIMPLE, MLS: EJERCICIOS RESUELTOS:9

VII.1 Ejemplos Referidos a la Regresión Simple

Año (Yi) (Xi) yi xi xi yi xi2

1. Se establece la relación económica entre ambas variables a través de la ecuación de regresión:

Para encontrar los valores de a y b se usan las ecuaciones normales siguientes:

Cuya solución nos permite obtener:

Profesor Genaro Sánc hez Barajas 73

Por lo tanto, el cálculo de los estimadores es:

Así, la ecuación de regresión estimada es: y = − 2.7 + 11

2. Una vez obtenidos los parámetros a y b , se prueba su significación estadística, es decir, se

Como generalmente se desconoce σ 2

Así, los estimadores insesgados de las varianzas de a y b son:

74 Profesor Genaro Sánc hez Barajas

Año yi ei = Yi − y i ei2 Xi2 xi2 yi2

Profesor Genaro Sánc hez Barajas 75

con estos datos ahora calculamos

Como se recordará, en el análisis de regresión se espera rechazar Ho y aceptar Ha , es decir que a y b

76 Profesor Genaro Sánc hez Barajas

Como tα < t bˆ rechazamos H0.

Dependent Variable: SER01

Variable Coefficient Std. Error t-Statistic Prob.

C -2.700000 2.211900 -1.220670 0.3466

R-squared 0.864286 Mean dependent var 5.000000

Profesor Genaro Sánc hez Barajas 77

Estos indicadores se interpretan así:

El estimador a = -2.7 es la ordenada al origen Y, o el valor del consumo total cuando el

78 Profesor Genaro Sánc hez Barajas

También se puede construir el intervalo de confianza para a y b .; en la practica se determina sólo

Se acostumbra presentar en forma resumida los resultados de la siguiente manera:

Profesor Genaro Sánc hez Barajas 79

VII.2 Ejemplos Referidos a la Regresión y Correlación Múltiples

Cuya ecuación de regresión es Y = a + bX i + cZi

Para encontrar los valores de a, b y c se necesitan las siguientes ecuaciones

Resolviendo este sistema de ecuaciones simultáneas, tenemos:

Aquí a también es la ordenada al origen; b y c se denominan coeficientes de

80 Profesor Genaro Sánc hez Barajas

La ecuación de regresión será: yˆ i = − 2.8182 + 1.4545 X i − 1.1818Z i

Para encontrar cada yi sustituimos los valores de X i e Z i :

yˆ1 = − 2.8182 + 1.4545(5) − 1.1818(1) = − 2.8182 + 7.2727 − 1.1818 = 3.2727

Para probar la significación de los parámetros a, b , c hacemos los siguientes

Sabiendo que para probar la significación estadística de los parámetros a, b , c se

Profesor Genaro Sánc hez Barajas 81

Ahora bien, como no conocemos σ 2u , usamos S 2 , la varianza residual, como su

Así, los estimadores insesgados de la varianza de b , c , serán:

Sb , Sc son los errores estándar de los estimadores

0.3636 2 0.3636 2 0.7272

VII.2.1 Prueba de hipótesis con t, F, X 2 , LM y Jarque-Bera

Para probar las hipótesis nulas

82 Profesor Genaro Sánc hez Barajas

Como tα > tbˆ y que tc , aceptamos H0 es decir no hay relación de Y con X e Z.

La estadística Jarque- Bera

Profesor Genaro Sánc hez Barajas 83

La formula de la estadística Jarque – Bera (JB) es:

Sabemos que cuando la variable se distribuye normalmente S = 0 y K = 3, por lo que la prueba JB de

Ejemplo hipotético: Si S = 0.232445, K = 2.165576 y n = 24, entonces:

La hipótesis de normalidad del modelo se plantea así:

de error, se distribuye asintóticamente, i.e., JB =  S +  sigue la distribución de χ 2 ,

84 Profesor Genaro Sánc hez Barajas

De lo anterior se intuye la importancia de distinguir entre una autocorrelación “pura” y una

Profesor Genaro Sánc hez Barajas 85

Terminaremos diciendo ahora que el método de diferenciación generalizado basado en el

Breusch-Godfrey Serial Correlation LM Test: