Documente Academic
Documente Profesional
Documente Cultură
Suponga que el consumo (Y) y el ingreso (X) para los últimos 4 años (en millones de pesos) son los
siguientes:
S e desea probar la hipótesis de que el consumo en M éxico depende de las variaciones que
experimenta el ingreso, los pasos son los siguientes:
∑ Y = na$ + b$ ∑ X
∑ XY = a$∑ X + b$∑ X 2
aˆ = ∑ X ∑Y − ∑ X ∑ XY = a$ = Y − bX
2
$
n∑ X − (∑ X )
2 2
“y”
n∑ XY − ∑ X ∑Y
bˆ =
n∑ X − (∑ X )
2 2
Observaciones: A menudo para simplificar operaciones se desvían los valores de x e y con respecto a
X e Y para obtener b$ ; y las literales xi e yi se usan para:
xi = X i − X e yi = Yi − Y
b$ =
∑x y i i
=
11
= 11
.
∑x 2
i
10
$ = 5 − (11
a$ = Y − bX . )7 = − 2.7
Obsérvese que b$ tiene signo positivo, lo cual es bueno por que corrobora la teoría económica de que
a medida que aumenta el ingreso (X) también aumenta el consumo (Y).
Var.a$ = σ 2u
∑X i
2
n∑ x 2
i
donde σ u es la varianza residual
1
Var.b$ = σ 2
∑x
u 2
i
S = σ$ 2u =
2 ∑e i
2
n− k
n = número de observaciones
k = número de parámetros estimados
S a2$ =
∑e ∑ X 2
i i
2
n − k n∑ x i
2
Sb2$ =
∑e 1 2
i
n− k ∑ x i
2
Derivado de lo anterior podemos decir en general que S aˆ y Sbˆ son los errores estándar de los
estimadores. Como U i tiene distribución normal, Yi , a$ , b$ también se distribuyen normalmente, y
como la muestra n = 4 es decir, menor que 30, usamos t con n - k grados de libertad para probar la
hipótesis y construir intervalos de confianza para a$ y b$ . Para ello, a partir de los datos de la tabla
anterior, se requiere hacer adicionalmente los siguientes cálculos.
Puesto que:
yˆi = aˆ + bˆX i
.sustituimos
yˆ1 = − 2.7 + 1.1(5) = 2.8
yˆ2 = − 2.7 + 1.1(6) = 3.9
yˆ3 = − 2.7 + 1.1(8) = 6.1
yˆ4 = − 2.7 + 1.1(9) = 7.2
Gráficamente:
8
yˆ = −2.7 + 1.1X i
y 7
6
5
4
Consumo
3
2
1
0
-1 0 2 4 6 8 10
-2 x
-3
Ingreso
Así, las hipótesis nulas ( Ho) y alternativas ( Ha) se plantean de la siguiente manera:
Ho: a = 0 Ho: b = 0
Ha: a ≠ 0 Ha: b ≠ 0
aˆ − a − 2.7 − 0 bˆ − b 1.1 − 0
ta = = = − 1.2207 tb = = = 3.5691
Saˆ 2.2118 Sbˆ 0.3082
Gráficamente:
H0: b= 0
Ha =b ≠0
Aceptamos Ha Aceptamos Ha
Rechazamos
-2.920 b +2.920 tα
Con base en lo anterior: Se corrobora la teoría económica de que el ingreso determina el consumo.
Pero ¿En que magnitud, que porcentaje de los cambios en Y son explicados por los cambios en la
variable X? La respuesta se obtiene calculando R2 que es igual al coeficiente de determinación cuya
formula es:
R =
2 ∑ y$i2 = 1 − ∑ ei2
∑ yi2 ∑ yi2
Donde: ∑ y i2 = ∑ (Yi − Y i ) 2
En nuestro ejemplo: R2 = 1 − ∑
ei2 1.9
=1 − = 1 − 0.1357 ≅ 0.8642 ≅ 86.42%
∑y 2
i 14
En este sentido el coeficiente de correlación r = R2 = .8642 = 0.9296 o 92.96% indica que existe
una alta correlación de carácter positivo entre X e Y; el cual es positivo por que b$ es positivo.
dY
El estimador b$ = = 11
. es la pendiente de la línea de regresión estimada que mide la
dX
proporción marginal al consumo PMC o el cambio en el consumo que produce el cambio en
una unidad adicional en el ingreso disponible.
Derivado de b̂ se puede obtener la elasticidad ingreso del consumo E que mide el cambio porcentual
en el consumo como resultado de un cambio porcentual en el ingreso disponible y cuya formula es:
X 5
E = bˆ = 1.1 = 0.7857
Y 7
b = b$ ± t α S b$
donde:
b = parámetro de la población. Con dos grados de libertad y con: ∝ = 5% tenemos ξ = nivel de
confianza = 95% se busca el valor de t∝ en el apéndice IV y se halla que t∝ = ± 4.303
Luego el intervalo de confianza al 95% para b esta dado por:
b = bˆ ± tα Sbˆ
= 1.1 ± (4.303)(0.3082) = 1.1 ± 1.3261
De tal manera que b se halla entre -0.2261 y 2.4261 por lo que -.0.2261< b< 2.4261 con una
confianza o seguridad del 95% y una probabilidad de 5% de que no esté en dicho intervalo.
Recuérdese que las ecuaciones para las relaciones verdaderas (en la población) y estimadas (con la
muestra) entre X e Y son respectivamente:
Yi = a + bXi + µi
“y”
$ +e
y$i = a$ + bX i i
Las ecuaciones para las regresiones verdadera (población) y la estimada (con la muestra) entre X e Y
son respectivamente:
E(Yi ) = a + bX i
“y”
$
y$ = a$ + bXi
y$ = −2.71 + 11
. Xi
R2 = 0.8642
r = 0.9296
Supóngase ahora que el Consumo (Y) depende del ingreso y de la inversión (Z), tal que:
Y$ = f ( X , Z )
$ (∑ xi yi )(∑ zi2 ) − (∑ zi yi )( ∑ xi zi )
b=
( ∑ xi2 )(∑ zi2 ) − (∑ xi zi ) 2
( ∑ zi yi )(∑ xi ) − (∑ x ii yi )(∑ xi zi )
2
c$ =
(∑ xi2 )(∑ zi2 ) − (∑ xi zi ) 2
$ − cZ
a$ = Y − bX $ i
i
Y = 5; X = 7; Z = 2
yi = Yi − Y ; xi = Xi − X ; zi = Zi − Z
Sus t it uy endo:
(11)( 2) − ( 2)(3) 22 + 6 16
bˆ = = = = 1.4545
(10)( 2) − (3)2 20 − 9 11
(2)(10) − (11)(3) 20 − 33 − 13
cˆ = = = = −1.1818
(10)( 2) − (3)2 20 − 9 11
aˆ = (5) − (1.4545)(7) − [− 1.1818( 2)] = 5 − 10.1815 + 2.3636 = − 2.8182
P ara p robar la s ignificación de los p arámet ros a$ ,b$, c$ hacemos los s iguient es cálculos
a p art ir de la t abla ant erior:
Añ o Y X Z y$i e e2 y i2
1 3 5 1 3.2727 -0.2727 0.0744 4
2 4 6 2 3.5455 0.4545 0.2066 1
3 5 8 3 5.2727 -0.2727 0.0744 0
4 8 9 2 7.9091 0.0909 0.0083 9
n =4 20 28 8 20 0 0.3636 14
Sabiendo que p ara p robar la s ignificación es t adís t ica de los p arámet ros a$ ,b$, c$ s e
requiere conocer s us varianz as que vienen dadas p or:
Como dijimos ant es a$ no es de int erés p rimordial, luego:
Varbˆ = σ u2
∑ zi2
∑ xi2 ∑ zi2 − ( ∑ xi zi ) 2
Varcˆ = σ u2 ∑ xi2
∑ xi2∑ zi2 − (∑ xi zi ) 2
A hora bien, como no conocemos σ 2u , us amos S2 , la varianz a res idual, como s u
es t imador ins es gado, es decir E (S2 ) = : σ 2u
S = σ$ =
2 2 ∑ ei2
u
n− k
donde:
n = número de años
k = número de es t imaciones , de p arámet ros es t imados
S 2
=
∑ ei2 ∑ zi2 ; Sb$ = Sb2$
b$
n− k ∑ xi2 ∑ zi2 − (∑ xi zi )2
S 2
=
∑ ei2 ∑ xi2 ; Sc$ = Sc$2
∑ xi2 ∑ zi2 − (∑ xi zi )2
c$
n− k
donde:
Pl an te amos : t ambién:
H o: b = 0 H o: c = 0
Ha: b ≠ 0 Ha: c ≠ 0
luego:
bˆ − b cˆ − c
tb = = tc = =
Sbˆ Scˆ
1.4545 − 0 − 1.1818 − 0
= = 5.6595 = = − 2.0556
0.2570 0.5749
A s í, ahora bus camos en el A p éndice que t rae los valores “ t eóricos ” de t , vemos que
el valor de t ∝ con ∝= 5% y un grado de libert ad, es t ∝ = ± 12.706. Como t b , t c no
exceden t ∝ decimos que b, c no s on es t adís t icament e s ignificat ivos , es decir, s e
rechaz a H a y en es t e cas o, s e concluy e diciendo que s e acep t a H o , lo que indica que
no hay relación de Y con X e Z .
G ráficament e p ara b
H 0 : b= 0
Ha =b ≠0
Aceptamos Ha Aceptamos Ha
Rechazamos
-12.706 b +12.706 tα
Gráficamente para c
H 0 : c= 0
Ha =c ≠0
Aceptamos Ha Aceptamos Ha
Rechazamos
-12.706 c +12.706 tα
Por otra parte, E-views también usa la ESTADÍSTICA JARQUE-BERA (JB) para probar el
comportamiento de la hipótesis o supuestos establecidos cuando usamos el método de mínimos
cuadrados ordinarios para estimar los valores poblacionales, basados en los momentos de una variable
(Sánchez Barajas. 2005:98).
Se plantea:
Si E-views indica que el valor de JB es menor que el valor de χ 2 (chi-cuadrada), estadística con la que
se compara por corresponder a la estadística no paramétrica, es decir que la variable no tiene un
comportamiento normal (con simetría respecto a la media aritmética), entonces aceptamos H0 porque
revela que el modelo tiende a la normalidad; aceptamos las 7 hipótesis. M ientras JB más se aproxime
a cero, mayor será el comportamiento lineal del modelo.
E-views también calcula estadísticas para probar la correlación serial, con la prueba LM , mismo que
verifica el grado de asociación entre la variable endógena y el residual rezagado (n) en ciertos
periodos. Cuando el residual rezagado digamos, para uno o dos periodos es mayor que cero, se dice
que hay cierto grado de asociación con la variable endógena y que existe correlación en el modelo.
Como se verá posteriormente, lo anterior no siempre es bueno porque en los estudios sobre series de
tiempo, se dice que hay correlación parcial cuando los errores asociados con las observaciones en
cierto momento son llevadas a periodos futuros; por el momento digamos que nos interesa ver si hay
correlación de Y con ei .
n −1
R 2 = 1 − ( 1 − R2 )
n−k
4 −1
R 2 = 1 − (1 − 0.9740) = 1 − 0.078 = 0.9220
4 −3
VI I .3. El u so de vari abl es fi cti ci as como vari abl es expl i cati vas en l a regresi ón y
correl aci ón mú l ti pl e.
Ejemp lo: la Emp res a “ A rriba J uárez ” des ea calcular los cos t os de calefacción (Y)
durant e el invierno p as ado y verificar s i t ienen dichos cos t os relación con la
t emp erat ura (X 1 ), el ais lamient o t érmico (X 2 ), y la exis t encia de un “ garage” en las
cas as (X 3 ). A s í, la variable indep endient e “ garage” es cualit at iva y s e define con 0
cuando las cas as no t engan garage y con 1 cuando lo t engan. P ara ello t oma una
mues t ra de 20 cas as y encuent ra que:
16 272 20 5 1
17 94 58 7 0
18 191 40 8 1
19 235 21 9 0
20 139 30 9 0
A l analiz ar los s ignos de los coeficient es o p arámet ros s e obs erva que la t eoría
económica s e cump le p orque efect ivament e hay una relación invers a ent re Y e X 1,
como t ambién exis t e con X 2, p ero en cambio, es p os it iva con X 3. Lo ant erior es un
buen indicio que indica que podemos hacer el análisis deseado .
Con es t as referencias , ent onces digamos p or ejemp lo, que s e t ienen dos cas as
iguales , una junt o a la ot ra, en Ciudad J uárez , una t iene garage y la ot ra no; ambas
t ienen 3 p ulgadas de ais lamient o t érmico y la t emp erat ura media en enero fue de 20
grados farengheit . P ara la cas a s in garage, X 3 s e s us t it uy e p or 0 en la ecuación de
regres ión. A s í, el cos t o es t imado de calefacción es de $280.90/mes , y a que
H o: d= 0 ;
H a: d ≠ 0
Con α = 5% s e p rueba la hip ót es is us ando la es t adís t ica t como en los ejemp los
ant eriores , t al que s e obt iene la t calculada (t ambién llamada emp ìrica) igual a 3.40,
mis ma que s e comp ara con la t de t ablas (t ambién llamada t eórica), la cual con α =
5% y n-k= 20-4 = 16 grados de libert ad res ult ó s er igual a 2.21. Como la t emp írica
Re s pu e s tas :
Con los s iguient es dat os :
6∑D
2
a) r = 1 −
'
n(n 2 − 1)
donde
D = diferencia ent re rangos de p ares corres p ondient es de las dos variables (en orden
as cendent e o des cendent e, con el rango medio as ignado a obs ervaciones del mis mo
valor).
N = número de obs ervaciones .
6∑ D2 6(10.50) 63
r =1 −
'
2
= 1− = 1− ≅ 0.94
n(n − 1) 10(99) 990
b) La correlación p or rangos s e us a con dat os cualit at ivos t ales como p rofes ión,
educación, s exo, et c. cuando, p or la aus encia de valores numéricos , no s e p uede
encont rar el coeficient e de correlación. La correlación p or rangos t ambién s e us a
cuando no s e t ienen dis p onibles valores p recis os p ara t odas o algunas de las
variables (as í que, una vez más , no s e p uede encont rar el coeficient e de correlación).
A ún más , con un gran número de obs ervaciones de valores grandes , r’ s e p uede
hallar como una es t imación de r con el fin de evit ar cálculos muy dis p endios os (s in
embargo, el fácil acces o a las comp ut adoras ha eliminado es t a raz ón p ara us ar r’).
P lant eamient o: La t eoría económica es t ablece que el cons umo, Yi , es función del
ingres o, X i , relación que en los últ imos años es :
Años Yi Xi
1 102 114
2 100 118
3 108 126
4 110 130
5 122 136
6 124 140
7 128 148
8 130 156
9 142 160
10 148 164
11 150 170
12 154 178
Se es t ima la regres ión y s e hallan los s iguient es res ult ados :
Ŷi = 2.30+ 0.86X i
donde:
a= 2.30, b= 0.86
Sa = 7.17, Sb = 0.05
P regunt as :
1. ¿Cuál es el s ignificado de a y de b?
El es t imador a= 2.30 es la ordenada al origen y el valor del cons umo t ot al cuando el
ingres o dis p onible es cero. Como a> 0 s e confirma que s iemp re habrá un cons umo
dY
bás ico. El es t imador b = = 0.86 es la p endient e de la línea de regres ión es t imada.
dX
M ide la p rop ens ión marginal al cons umo o el cambio que exp eriment a el cons umo
con el cambio en una unidad adicional en el ingres o. Como 0< b< 1 confirma la t eoría
del cons umo de que las p ers onas increment an s us gas t os de cons umo cuando
aument a el ingres o dis p onible, p ero en menor p rop orción que es t e.
X
2. Sabiendo que η = b
Y
D onde:
η = Elas t icidad ingres o del cons umo
X = 145
Y = 127
Calcule e int erp ret e η
X 145
T enemos η = b= * 0.86 = 0.98
Y 127
Int erp ret ación: η mide el cambio p orcent ual en cons umo derivado de un cambio
p orcent ual en el ingres o dis p onible.
3. D es criba las hip ót es is nula y alt ernat iva p ara p robar la s ignificancia es t adís t ica
de los p arámet ros de la ecuación de regres ión es t imada.
P ara p robar la s ignificación es t adís t ica de los p arámet ros p oblacionales α y β con
los mues t rales a y b es t ablecemos :
H ip ót es is nula: H o : α = 0 vers us H A : α 0
H o : β ≠ 0 vers us H A : β ≠ 0
A l inves t igador le int eres a rechaz ar H o y acep t ar H A , es decir que α y β ≠ 0 con una
p rueba de dos colas , p or lo general s alvo p lant eamient os es p ecíficos .
7. Con α = 5% p ruebe s i α y β s on es t adís t icament e s ignificat ivos . Int erp ret e los
res ult ados .
aˆ − a 2.30 − 0
ta = = = 0.32 . D ado que tα = ± 2.228 en una p rueba de dos colas decimos
S aˆ 7.17
que no es s ignificat iva es t adís t icament e: no rechaz amos H o:
bˆ − b 0.86 − 0
Igualment e s i t b = = = 17.2 . Como t b > t a decidimos acep t ar H A y decimos
Sbˆ 0.05
que β es es t adís t icament e s ignificat iva, que X i s i exp lica a Yi . O bs ervación s i
hubiéramos acep t ado H o , no s e cump liría la relación hip ot ét ica de Yi con X i , mis mo
que debemos modificar y rees t imar has t a lograr una relación es t imada de cons umo
s at is fact oria.
T al que α es t á ent re –13.67 y 18.27 con confianz a del 95%. Como dice Salvat ore
(1991:103) el int ervalo es más amp lio (e ins ens at o), lo cual es cons ecuencia de que
alt ament e ins ignificat iva.
Para β t enemos β = b ± tα Sb = 0.86 ± 2.228(0.05) = 0.860 ± 0.11 , decimos que β está entre 0.75 y
0.97, en otras palabras 0.75< β <0.97 con 95% de confianza. Al no incluir este intervalo de
confianza el cero podemos decir que Xi si explica a Yi.
10.Encont rar R2 con cualquiera de los mét odos conocidos e int erp rét elo.
T enemos R 2 = 0.9687 ó 96.87% indica que la variable dep endient e es exp licada en un
96.87% p or las variables indep endient es .
1. ¿P orqué es mejor el mét odo de mínimos cuadrados p ara es t imar p arámet ros
mues t rales de los p arámet ros de la p oblación?
2. Exp lique las p rop iedades de los es t imadores obt enidos con el mét odo de
mínimos cuadrados .
3. ¿Q ué es un es t imador ins es gado?
4. ¿Q ué es un es t imador cons is t ent e?
5. ¿Q ué es un es t imador s uficient e?
6. ¿Q ué es un es t imador eficient e?
7. Exp lica las hip ót es is de s up ues t os bás icos del modelo de regres ión lineal
clás ico.
8. Con los dat os de Yi : invers ión en miles de p es os , X i : t as a de int erés en
p orcient os , es t ime la ecuación de regres ión de Yi s obre X i .
Y i Miles de X i Tasa de
pesos interés
6 9
8 10
8 8
7 7
7 10
12 4
9 5
8 5
9 6
10 8
10 7
11 4
9 9
10 5
11 8
9. Con los datos anteriores probar con un nivel de significación del 5%, la significación
estadística de los parámetros α y β .
10. Hallar e interpretar R2 y R 2
Suponga que la teoría económica establece que la rentabilidad de la inversión (Y) depende de la tasa de interés (X) y de
la inflación (Z), tal que:
Y$ = f ( X , Z )
Año Yi Xi Zi
1 7 9 1
2 8 8 2
3 7 9 3
4 8 7 2
Pre gu n tas :
Observaciones: la respuesta a cada pregunta vale 20 puntos. Se puede usar la calculadora, las tablas
estadísticas y los formularios de cada tema.
Con el fin de ilustrar el uso de este instrumental en el desarrollo de una teoría económica a
continuación se presenta un caso. Hasta el momento hemos visto como se construye
matemáticamente la relación entre una variable dependiente (Y) y las independientes: X1, X2, en esta
ocasión, aprovechando la exposición anterior, también aplicaremos la regresión múltiple considerando
el factor tiempo. Este factor es muy importante por que además de que permite conocer el
dinamismo del fenómeno bajo estudio (Y), permite predecirlo, es decir, estimar su valor futuro.
La predicción es muy importante en economía por que permite visualizar, con cierta seguridad, cual
será el comportamiento de una variable (Y) en el futuro, en función de las variables independientes:
X1, X2 .
Con base en este enfoque a continuación se expone un ejercicio que permitirá ilustrar:
a) Como se prueba la teoría económica de que el consumo (Y) depende del ingreso disponible
(después de impuestos) (X1) y de la inflación (X2); de X1 en forma positiva y de X2 en forma
negativa.
b) Su comportamiento futuro
Así, para desarrollar el primer punto diremos que los datos en los últimos 10 años están expresados
en millones de pesos para Y, X1 y en porcentajes para X2 . De esta manera la ecuación de regresión
que servirá para probar la teoría económica quedará planteada de la siguiente manera:
yˆ = aˆ + bˆX i + cˆX 2 + ui
donde:
y$ = Y calculada o estimada
ui expresa que no hay una relación exacta de Y con respecto a X1 “y” X2 por lo
que ui es conocido como el complemento residual
Así, para encontrar y$ se requiere conocer los valores de a$ ,b$, c$ mismos que se determinan con las
tres ecuaciones normales siguientes:
∑ Y$ = na$ + b$ ∑ X1 + c$ ∑ X2 .
∑ YX
$ 1 = a$ ∑ X1 + b$ ∑ X12 + c$∑ X1X 2
∑ YX
$ 2 = a$ ∑ X 2 + b$ ∑ X1 X2 + c$ ∑ X22
Cuando se expresan en forma de desviaciones con respecto a la media aritmética se pueden resolver
simultáneamente para b$ y c$ , así:
$ 1 − cX
a$ = Y − bX $ 2
∈( b$ ) = b parámetro de la población
∈( c$ ) = c parámetro de la población
∈ es el símbolo de la esperanza matemática.
En una regresión múltiple b$ , c$ son estimadores parciales de y$ .
Una vez establecidos tanto la teoría económica como la metodología para probarla, con los datos que
aparecen en la tabla 1, hacemos los siguientes cálculos para obtener a$ ,b$, c$ .
Tabla 1: Relación del consumo (Y) con el ingreso (X1) y la inflación (X2) (del año 1 al 10)
Años Y X1 X2 y x1 x2 yx1 x 12 x 22 x1 x2 x2 y
1 3 1 8 -3.1 -4.65 +0.9 14.415 21.623 0.81 -4.185 -2.79
2 2 2 15 -4.1 -3.65 +7.9 14.965 13.323 62.41 -28.835 -32.39
3 4 2.5 10 -2.1 -3.15 +2.9 6.615 9.923 8.41 -9.135 -6.09
4 5 3 9 -1.1 -2.65 +1.9 2.915 7.023 3.61 -5.035 -2.09
5 5 4 7 -1.1 -1.65 -0.1 1.815 2.723 0.01 +0.165 +0.11
6 7 5 6 +0.9 -0.65 -1.1 -0.585 0.423 1.21 +0.715 -0.99
7 6 7 8 -0.1 +1.35 +0.9 -0.135 1.823 0.81 +1.215 -0.09
8 8 8 4 +1.9 +2.35 -3.1 4.465 5.523 9.61 -7.285 -5.89
9 9 9 3 +2.9 +3.35 -4.1 9.715 11.223 16.81 -13.735 -11.89
10 12 15 1 +5.9 +9.35 -6.1 55.165 87.423 37.21 -57.035 -35.99
n=10 61 56.5 71 0 0 0 109.349 161.03 140.9 -123.15 -98.10
Nota: Y, X1,X2 son los valores originales, en tanto que y,x 1 y x 2 son minúsculas e indican las desviaciones de los
términos con respecto a sus medias respectivas.
Y = 61
.
X 1 = 565
.
X 2 = 7.1
Sustituyendo tenemos:
Observamos que b$ = 0.4379 tiene signo positivo y c$ = -0.3152 tiene signo negativo. Estos resultados
confirman la teoría económica, motivo por el cual podemos continuar probando la relación que tiene
el consumo (Y) con el ingreso (X1) y la inflación (X2). Por consiguiente, la ecuación de regresión
múltiple es:
Ahora bien en virtud de que no hay una relación lineal exacta de Y con X1 y X2, necesitamos calcular
la relación residual que se expresa con ui; misma que no conocemos porque pertenece al universo,
razón por la cual es estimada mediante ei , cuyo cuadrado ei2 , minimiza la suma de cuadrados de
todos los residuos: ∑ ei2
Para obtener ei (donde (i) = 1,2,3... ...8,9,10), antes necesitamos determinar y$i para cada uno de los
10 años. Así:
Nota: estos resultados están ”redondeados”; la computadora ofrece más decimales; por ello las cifras no
coinciden exactamente con las que se obtienen al correr los datos en computadora
Continuación... ...Tabla 1:
Relación del consumo (Y) con el ingreso (X1) y la inflación (X2) (del año 1 al 10)
Años y$i e =Y - y$i e2 2
y
1 3.7800 -0.7800 0.6084 9.61
2 2.0115 -0.0115 0.0001 16.81
3 3.8065 0.1936 0.0375 4.41
4 4.3406 0.6594 0.4348 1.21
5 5.4089 -0.4089 0.1672 1.21
6 6.1620 0.8380 0.7022 0.81
7 6.4074 -0.4074 0.1660 0.01
8 8.1061 -0.1061 0.0113 3.61
9 8.8592 0.1408 0.0198 8.41
10 12.1170 -0.1170 0.0137 34.81
∑ 61.0000 0.0000* 2.1610 80.9
* Existen pequeñas dif erencias debido a la magnitud de los decimales. La suma técnicamente da cero
∑ e2 = 2.1610
Con estos valores podemos probar la significación estadística de los parámetros poblacionales b, c,
calculando primero las varianzas de los estimadores. Las fórmulas de las varianzas son:
Var b$ = σ 2u
∑ x22
∑ x12∑ x22 − ( ∑ x1x2 )2
∑ x1
2
Var c$ = σ 2
No se acostumbra calcular la varianza de a$ (pendiente al origen) por que no ayuda a probar la teoría
económica, ya que y$i = a$ cuando X1 = 0; X2 = 0 puesto que lo que se desea es probar las
variaciones de y$i en función de las variaciones de X1 , X2 .
Por otra parte, como σ 2u es desconocida por que es del universo, se estima con S2 , como una
estimación insesgada, es decir, E (S2) = σ 2u .
Su formula es: S = σ$
2 2
=
∑ ei2
u
n− k
donde:
n = número de términos (10 en este ejemplo)
k = número de parámetros estimados (3 en este ejemplo)
Con estas referencias, las estimaciones insesgadas de las varianzas de b , c tendrán las siguientes
fórmulas:
S = Var( b$ ) =
2 ∑ ei2 ∑ x22 ; Sb$ = Sb$2
b$
n− k ∑x ∑x
2
1
2
2 − ( ∑ x1 x 2 ) 2
∑ ei2 ∑ x1
2
S 2
= Var( c$ ) = ; S c$ = S c$2
∑x ∑x − ( ∑ x 1x 2 )
c$
n−k 2
1
2
2
2
Sb2$ , S c$2 son los errores estándar de b$, c$ con los que se pueden probar las hipótesis sobre b, c,
relativos a que hay o no hay relación de Y con respecto a X1, X2, con la estadística t de Student
porque n < 30 términos:
Para b: Para c:
Ho: b = 0 Ho: c = 0
H a: b ≠ 0 H a: c ≠ 0
b$ − b c$ − c
tb = t c$ =
Sb$ S c$
Estas t`s “empíricas” u observadas se confrontan con las t`s ”teóricas” o de tablas. Estas últimas se
denotan con las literales t∝ , donde ∝ = nivel de significación que junto con los grados de libertad (n-
k) determinan los puntos “críticos” donde se toma la decisión de aceptar o rechazar Ho.
Así, para probar Ho primero calculamos Sb2$ , S c$2 ; sustituyendo los valores de las tablas en las
fórmulas originales:
S = Var(bˆ) =
2 ∑ ei2 ∑ x22 =
2.1610 140.9
=
bˆ
n − k ∑ x1 ∑ x2 − (∑ x1x2)
2 2 2
10 − 3 (161.0250)(140.9) − (−123.15) 2
140.9 140.9
= 0.3087 = = 0.3087(0.0187) = 0.0058
22,688.4225 − 15,165.9225 7,522.5
también
∑ ∑ x1
2
ei2 2.1610 161.0250
S 2
= Var(cˆ ) = =
n − k ∑ x ∑ x − (∑ x1x2 ) 10 − 3 (161.0250)(140.9) − ( −123.15)2
cˆ 2 2 2
1 2
161.03 161.03
= 0.3087 = = 0.3087(0.0214) = 0.0066
22,688.4225 − 15,165.9225 7,522.5
2
; Scˆ = 0.0066; Scˆ = 0.0066 = 0.0812
Por lo tanto las t`s empíricas serán:
bˆ − b 0.4379 − 0 cˆ − c − 0.3087 − 0
tb = = = 5.7542 t cˆ = = = −3.8017
Sbˆ 0.0761 Scˆ 0.0812
Interpretación económica: Sí hay relación del consumo (Y) con el ingreso (X1) y la inflación (X2);
luego entonces se sigue confirmando nuestra teoría.
VIII.3 Determinación del Grado (o porcentaje) de la Relación que Existe entre Y y las Variables
Explicativas X1, X2
Para llevar a cabo la determinación del grado de la relación que existe entre la variable dependiente o
explicada y las variables independientes o explicativas primero se determina el Coeficiente de
Determinación Múltiple.
R 2
= 1−
∑ ei2
=1 −
2.1610
= 1 − 0.0267
∑ yi2
80.9
R2 = 0.9733 o 97.33%
Interpretación: El ingreso y la inflación determinan el 97.33% de los cambios que experimenta el
consumo.
Si tomamos en cuenta la reducción en los grados de libertad conforme aumenta el número de variables
independientes (aquí se supone que antes el consumo sólo era función del ingreso -regresión simple-
y ahora hemos agregado la inflación como variable explicativa adicional), entonces se debe calcular el
R2 ajustado o R 2 , cuya formula es:
n −1 10 − 1
R 2 = 1 − (1 − R2 ) = 1 − (1 − 0.9733)
n− k 10 − 3
= 1 − (1 − 0.9733)(1.2857)
= 1 − (0.0267 )(1.2857) = 1 − 0.0343
R 2 = 0.9656
En este caso la hipótesis nula se prueba con F, estadística que se refiere al análisis de varianza que es
el cociente de dividir la varianza explicada entre la varianza no explicada. Su formula es:
∑ y$i2 R2
( k − 1) k −1
Fk −1,n− k = =
∑e 2
i (1 − R )
2
( n − k)
(n − k )
donde:
(k-1) son los grados de libertad de la varianza explicada
(n-k) los grados de libertad de la varianza no explicada
(ya es conocido el significado de n y k)
Como en el caso anterior - cuando usamos t - se requiere encontrar en tablas la “F teórica” con un
cierto valor de ∝ para confrontarla con la “F empírica”. Así, primero calculamos la F empírica:
0.9733
F2, 7 = 2 = 0.4866 = 128.0526
1 − 0.9733 0.0038
7
Si decimos que ∝ = 1%, buscamos F∝ en tablas con 2 grados de libertad para el numerador (varianza
explicada) y 7 grados de libertad para el denominador, vemos que F∝ = 9.55.
Como F2,7 = 128.0526 > F∝ = 9.55 decimos que se acepta la hipótesis alternativa (se rechaza la
hipótesis nula) de que b y c, y R2 son significativamente diferentes de cero.
Lo anterior indica que a través de una sola estadística se confirma la hipótesis que hemos venido
desarrollando de que: Y = f(X1,X2).
Este coeficiente es útil por que mide la correlación neta entre la variable dependiente (Y) y una
variable independiente (sea X1 o X2) después de excluir la influencia que sobre ellas ejerce la(s)
otra(s) variable(s) independiente(s) en el modelo uniecuacional.
ryx1 =
∑ yx1 = 109 .35 = 109.35 = 109.35 = 0959 .
∑ x12 ∑ y 2 16103 . 80.9 ( 12.68 )( 8.99 ) 11399 .
rx x = ∑ x1x2 = − 12315
.
=
−12315
.
=
−12315
.
= − 0.818
∑ x22 ∑ x12 140.9 16103
. ( 1187
. )( 12.68 ) 150.51
1 2
Sustituyendo:
ry x1 ,x 2 = 0.936 o 93.6%
t a mb i én
ry x 2 − ry x1 rx1 ,x 2 (−0.919) − (0 .959)(−0.818)
ry x 2 ,x1 = = =
1 − r 2 x1 ,x 2 1 − ry2x 2 0 .33 0.08
− 0.919 + 0.784 − 0.135
= = = −0.838
( 0.574)(0.282) 0.161
Se dice que el ingreso (X1) es más importante explicando las variaciones del consumo (Y) que la
inflación (X2); obviamente en sentido inverso, como lo indica la teoría económica.
Se acostumbra presentar en forma resumida los resultados estadísticos, mismos que en computadora
suelen aparecer así:
calculado tablas
t1 = 5.817014 2.36
t2 = -3.811620 2.36
F = 124.7400 6.54
VIII.6 Predicción
Para conocer el consumo, por ejemplo en el año 12, suponemos que el ingreso en ese año será de 16 y
la inflación 1.5 sustituimos en la ecuación de regresión y encontramos:
16
Forecast: YF
14 Actual: Y
Forecast sample: 1 12
12 Included observations: 10
10
Root Mean Squared Error 0.464715
8 Mean Absolute Error 0.369380
Mean Abs. Percent Error 7.645546
6 Theil Inequality Coefficient
0.034564
Bias Proportion 0.000000
4 Variance Proportion0.006764
Covariance Proportion0.993236
2
0
1 2 3 4 5 6 7 8 9 10 11 12
YF ± 2 S.E.
obs Y YF
1 3 3.76502492522
2 2 2.03896311067
3 4 3.80881355932
4 5 4.33966101695
5 5 5.4013559322
6 7 6.1533000997
7 6 6.41818544367
8 8 8.09938185444
9 9 8.85132602193
10 12 12.1239880359
11 7.25770687936
12 12.4113060818
VIII.7.1La Elasticidad Ingreso del Consumo: Mide el cambio porcentual en los niveles del consumo
como consecuencia de un cambio porcentual en el ingreso disponible (después de impuestos).
Es importante señalar que la elasticidad no es constante, es decir, cambia en cada uno de los
puntos de la función de regresión. Su cálculo puede hacerse con la formula:
X 565
.
Eib$ = b$ 1 = 0.44 = 0.44( 0.92 ) = 0.40
Y 6.1
Ep = Parámetro estimado multiplicado por el cociente que resulta de dividir la media de los
precios entre la media de la demanda o consumo
VIII.7.3 Con base en lo anterior podemos obtener la Elasticidad Inflación del Consumo así:
X2 71
.
Eic$ = c$ = −0.31 = −0.31(116
. ) = −0.36
Y 61
.
Tema: Marco teórico de la expresión matemática de una teoría económica y de su verificación estadística.
I.-Conteste con una “ X” en SI cuando la afirmación sea verdadera y también con una “ X” en NO cuando la afirmación
sea falsa:
2.-Una variable dicotómica puede tomar más de dos valores: Si_____; No________
3.-Para predecir la variable dependiente es necesario que antes se conozcan los valores proyectados de las variables
explicativas en el tiempo: SI:_______; NO:___________
4.- Cuando se verifica la hipótesis de la relación entre la variable dependiente con las independientes, se espera que
idealmente el valor del coeficientes de correlación múltiple no sea semejante a los valores de los coeficientes de
correlación parcial: SI:__; NO__.
5.- Cuando se verifica con la estadística F que las variables independientes si explican a la variable dependiente,
teóricamente se debe de verificar con la prueba t de Student que cada una de las variables independientes también
explican a la dependiente: SI___; NO____.
6.- Al correr la regresión, cuando los signos de los coeficientes obtenidos de las variables regresoras no coinciden con la
concepción teórica de su relación con la variable regresada, se debe cambiar de variable regresora: SI____; NO______:
7.- Al probar una hipótesis nula con la t de Student, si la t real o calculada es mayor que la t teórica o de tablas, se
acepta dicha hipótesis nula: SI____;NO_____.
8.- Cuando F real o calculada es menor que F teórica o de tablas rechazamos la hipótesis nula: SI_____; NO____.
:
9.- en una regresión múltiple si al probar una hipótesis nula con ciertos grados de libertad y nivel de significación,
cuando los valores de t no son estadísticamente significativos pero F si lo es, se dice que posiblemente se violó algún
de los supuestos del modelo de estimación: SI____; NO______.
10.-Conocido el valor del coeficiente de la variable explicativa X, su media aritmética como la de la variable explicada
Y
Y, la elasticidad se calcula as E = bˆ : SI__;NO___.
X
Observaciones: Cada una de las respuestas correctas vale 10 puntos en escala de 0 a 100. No se puede usar la
calculadora, ni las tablas estadísticas ni la bibliografía correspondiente a cada tema.
IX.1 Propósito
En economía existen fenómenos que no siempre tienen un comportamiento lineal, digamos como el
comportamiento del valor de las acciones de cualquier empresa en el mercado bursátil. Este
comportamiento se detecta al graficar los valores del fenómeno y obtener un diagrama de dispersión
en forma de “sierras”; también ello se comprueba cuando cierta teoría económica así lo establece,
digamos el valor de la producción en función de los insumos de mano de obra y de capital.
Comenta el profesor Salvatore (1991, p. 136) que la teoría económica puede a veces sugerir la forma
funcional de una relación económica; también, que la dispersión de los valores observados puede
sugerir la forma funcional apropiada en una relación de dos variables, y que cuando ninguna teoría ni
dispersión de puntos es de ayuda, la función lineal se trata usualmente primero debido a la
simplicidad.
Algunas de las transformaciones de funciones no lineales a lineales más útiles y comunes son las
funciones logaritmo doble o doble-log, recíproca, y la polinomial. Una de las ventajas de la forma
doble-log es que las pendientes representan elasticidades. La función semilog es apropiada cuando la
variable dependiente crece en el tiempo a un ritmo relativamente constante, como en el caso de la
fuerza laboral y de la población. Las funciones recíprocas y polinomial son apropiadas para estimar
curvas de costo medio y costo total.
La estimación de una función doble-log transformada por el método de MCO arroja estimadores de
pendiente insesgados. Sin ambago b0=antilo b0* es un estimador sesgado pero consistente de b0. El
hecho de que b0 sea sesgado no es de mucha importancia, porque la constante no muestra un interés
especial en economía. En las otras funciones transformadas b0 también es insesgado.
La forma funcional Y = aX
$ u
$ be se puede transformar en la doble logarítmica
log Y = log a + b$ log X + log eu . La función exponencial Y = ab x se transforma en
log Y = log a + log bX que es semilogaritmica por que sólo transforma Y, etc.
Como se recordará los logaritmos comunes tienen base 10 y los naturales base e = 2.718 de manera
tal que la relación entre logaritmos naturales y comunes es:
Ejemplo:
Cuando:
X = 240; su ln = 2.3026 (2.380211) = 5.48064
X = 1480; su ln = 2.3026 (3.170262) = 7.29986
X = 410; su ln = 2.3026 (2.612784) = 6.01616
X = 450; su ln = 2.3026 (2.653223) = 6.10925
X = 3; su ln = 2.3026 (0.477100) = 1.09857
X = 2; su ln = 2.3026 (0.301000) = 0.69308
X = 8; su ln = 2.3026 (0.903100) = 2.07947
X = 1; su ln = 2.3026 (0.000000) = 0.00000
Es el investigador quien decide si trabaja con logaritmos de base 10, base e o cualquier otra base;
para evitar confusiones basta pues con especificar con que base de logaritmos se trabaja.
A partir de los datos de la tabla 1 hacemos los siguientes cálculos que aparecen en la tabla 2
Continuación... ...Tabla 2:
Función del Consumo Transformada a Forma Lineal Doble Logarítmica
Continuación... ...Tabla 2:
Función del Consumo Transformada a Forma Lineal Doble Logarítmica
Años x1 x2 lnYc 2 2
x12 x 22 e = ln(Y-Yc)
b) Obtener las “desviaciones” de esos logaritmos con respecto a las medias aritméticas
Y , X1 , X 2 . En el caso del consumo: para el primer término, log Y1-Y ; para el último término log Y10-
Y . Un procedimiento análogo se hizo para las desviaciones de los logaritmos de X1, X2 con respecto
a sus X 1 , X 2 .
Como se recordará las “desviaciones” se representan con letras minúsculas, ello con el objeto de
aplicar las fórmulas ya conocidas para obtener a$,b$, c$ ; que son:
e) Para determinar la ∑ ei2 relación residual primero obtenemos las Y`s calculados o estimadas
así::
f) Luego que se tiene Y, Yc se obtiene ei = y i - Yc, misma que se eleva al cuadrado (ei)2 y
se obtiene su suma que de acuerdo con la tabla 2 tenemos ∑ ei2 =0.30
g) En seguida se prueba la significación estadística de b y c para ello obtenemos:
S = Var( b$ ) =
2 ∑ ei2 ∑ x22 = 0.000395; S b$ = 0.019
b$
n− k ∑ x12 ∑ x22 − ( ∑ x1 x2 ) 2
∑ ei2 ∑ x1
2
S 2
= Var( c$ ) = = 0.000489; S c$ = 0.022
∑ x12 ∑ x22 − ( ∑ x1x2 )2
c$
n −k
Para b Para c
Ho: b = 0 Ho: c = 0
HA: b ≠ 0 HA: c ≠ 0
0.39 −0.27
tb = = 205
. tc = = −12.27
0.019 0.022
h) Ahora calculamos:
R 2
=1−
∑ ei2
= 0 .879 o 87.9%
∑ yi2
luego r = R2 = 087 . = 0.932 o 932
.%
n −1
la R 2 = 1 − ( 1 − R2 ) = 0845
. o 84 .5%
n −k
R2
Fk −1,n− k = k −1 = 2563
.
(1 − R 2 )
(n−k )
También comenta el profesor Dominick Salvatore que cuando la suma los coeficientes estimados
(elasticidades) de las variables independientes ( cuando son factores de la producción, digamos mano
de obra y capital) es mayor que uno, hay economías de escala. En este sentido el profesor Gujarati
(1990 , p.153) complementa diciendo que cuando la elasticidad o pendiente de la variable
independiente es menor que uno, se debe interpretar como que hay inelasticidad de la variable
dependiente con respecto a la dependiente. Esto se ilustra en ejemplos subsecuentes.
Con los siguientes datos y siguiendo los mismos pasos del ejemplo anterior obtenga: a). La ecuación
de regresión, b). las elasticidades (economías de escala) y c). el error estándar de estimación. Así, si
especificamos en el modelo uniecuacional que Y=f(X1,X2)
Una vez que los datos fueron convertidos a logaritmos obtenemos las “desviaciones” de los valores
originales con respecto a sus medias, con objeto de ir calculando los valores necesarios para estimar
los parámetros de la ecuación de regresión que facilite el cálculo de las elasticidades y del error
estándar de estimación. Las desviaciones se expresan con minúsculas así:
Esos resultados se sustituyen en las ecuaciones que necesitamos para obtener el valor de los
coeficientes estimados. Luego si
Sustituyendo
b=(0.0375)-(0.0437)/0.0943 – 0.0859
b=-0.0062/0.0084
b= - 0.708
c=0.0348/0.0084
c=4.19
finalmente para a
a= - 7.71
b). Las elasticidades son: Elasticidad de Y con respecto a X1= -0.708; de Y con respecto a X2=
+4.19, de manera que si 4.19+ (-0.708)= 3.482 ≥ 1, decimos que si hay economías de escala.
c). Para calcular el error estándar de estimación tabulamos a partir de la ecuación de regresión
LnY3c= -7.71-0.708(1.09)+4.19(2.30)=1-1600
LnY4c= -7.71-0.708(1.39)+4.19(2.48)=1.6960
Tabulando tenemos
∑ 0.000 0.1549
Así, si la función es Yc = abx tomando logaritmos se trasforma en una función lineal dada por logYc
= log a + log b (x). Nota: Este ejemplo se trabaja con logaritmos comunes, de base 10.
Para simplificar operaciones hacemos Σx = 0. Aplicando el método de mínimos cuadrados, las dos
constantes desconocidas (log a, log b) se calculan con:
log a =
∑ (log Y ) ;log b = ∑ ( X log Y )
n ∑ X2
Tabla 3:
Transformación de la Función Consumo de una Función Exponencial
en Semilogarítmica
Años en Consumo
Sustituyendo:
log a =
∑ (log Y ) = 84519
.
= 0.76
n 11
log b =
∑ ( X log Y ) = 78405
.
= 0.08
∑ X 2
92
Luego la ecuación de regresión transformada en logaritmos es:
Los valores de cada Yci , donde (i) = 1,2,3... ...8,9,10,11; así se obtienen:
Con estos resultados se pueden hacer en forma análoga los ejercicios anteriores:
a) La prueba de significación estadística de los parámetros estimados
b) El cálculo de R2, r, R
c) La prueba de la significación global con F
Para los años 1,2,3,4 y 5 el consumo (Y) como el ingreso (X) expresados en miles de millones de
pesos es:
Tabla 4:
Transformación de la Función Consumo e Ingreso de la Forma Lineal a
Semilogarítmica usando Logaritmos Naturales
_ _
Año Y X lnY ln yi = LnY-LnY xi = X-X ln yixi X2
x i2
1 7 9 1.9459 -0.2751 -2.2 0.6053 81 4.84
2 8 10 2.0794 -0.1416 -1.2 0.1699 100 1.44
3 9 10 2.1972 -0.0239 -1.2 0.0286 100 1.44
4 11 13 2.3979 0.1768 1.8 0.3182 169 3.24
5 12 14 2.4849 0.2638 2.8 0.7387 196 7.84
Σ 47 56 11.1053 0 0 1.8609 646 18.8
11.1053
lnY = = 2.22
5
56
ln X = = 11.2
5
Con esa información sustituimos en las fórmulas de los estimadores de los parámetros y
encontramos:
ln bˆ = ∑
xi ln yi 1.8609
= = 0.0989
∑ xi2 18.8
ln aˆ = logY − bˆX = 2.22 − 0.0988(11.2) = 1.1124
Para ello primero se debe obtener ln y$ , luego e, ∑ ei2, S2 , Sb , Sa cuyos cálculos son:
$ $
Continuación... ...Tabla 4:
Transformación de la Función Consumo e Ingreso de la Forma Lineal a
Semilogarítmica usando Logaritmos Naturales
Años lnYc e=lnY-lnYc e i2 Lnyi2
1 2.0033 -0.0575 0.0032 0.0756
2 2.1022 -0.0228 0.0005 0.0201
3 2.1022 0.0949 0.0090 0.0015
4 2.3992 -0.0013 0.0001 0.03125
5 2.4982 -0.0133 0.0002 0.0695
Σ 0 0.013 0.1972
Primero calculamos: S 2
=
∑ ei2 0.013
= = 0.0043
n− k 5−2
luego: S a2ˆ =
∑ e2i ∑ X 2 = 0.0043 (649) = 0.0299
n − k n∑ x12 5(18.8)
también:
S 2
=
∑ ei2 1 1
= 0.0043 = 0.0023
b$
n − k ∑ xi
2
.
188
Sb$ = S b2$ = 0.00023 = 00151
.
a$ − a 11124
. −0 b$ − b 0.0989 − 0
ta = = = 6.4293 tb = = = 6.5179
Sa$ 01730
. Sb$ 0.0151
Con α =5% y 3 grados de libertad hallamos tα = ±3182 . que es menor que ta, tb, por lo que decimos
que a, b son significativamente diferentes de cero, es decir que se acepta la hipótesis alternativa; ello
indica que si hay relación entre el consumo (Y) y el ingreso (X).
c) Obtener R2, r:
R 2
=1−
∑ ei2
=1−
0.0130
= 0.934 o 934
.%
∑ yi2
01972
.
Lo anterior indica que X explica el 93.4% de los cambios que suceden en Y. En seguida obtenemos:
r = R2 = 0934 . = 0.9664
Lo cual significa que hay una alta correlación positiva entre X e Y, es decir, a medida que aumenta X,
también lo hace Y de acuerdo con el valor de la pendiente b$ .
d) Predicción: Digamos que para 6 la variable X = 16 y se desea estimar el valor de Y para ese
año. Sustituimos:
lnYc = 1.1124 + 0.0989 (16) = 2.6962, cuyo antilogaritmo es 14.8, que es el valor estimado del
consumo Y en el año 6.
e) Límites de Confianza: Si se desea calcular el intervalo dentro del cual se halla contenido el valor
real de Y con cierta probabilidad para el año 6, aplicamos la siguiente fórmula:
Y = Yc ± t α S f
donde:
Sf = error de predicción
1 (Yc − X ) 2 2 1 (14.8 −11.2) 2 12.96
2
Sf S= 2
1 + + = S 1 + + = 0.00431 + 0.2 + =
n ∑ ( X 1 − X )
2 2
5 (18 .8) 353.44
tenemos:
Y = Yc ± t α S f
Y = 14.8 ± 3182
. ( 007
. )
Y = 14.8 ± 0.22
Interpretación: El valor real de Y para 1997 está en el intervalo de confianza 14.8 ± 0.22, con una
probabilidad del 95%, cuyo limite inferior es 14.58 y el superior es 15.02.
Comentarios: El ajuste con la función semilogarítmica es mejor que el ajuste con las formas lineales y
polinomiales.
Se trabaja principalmente con modelos que son lineales en los parámetros, los cuales pueden ser o no
lineales en las variables. Se consideraran algunos modelos de regresión más comúnmente útilizados,
que pueden ser no lineales en las variables pero que son lineales en los parámetros o que pueden serlo
mediante transformaciones apropiadas de las variables. En particular, se analizarán los siguientes
modelos de regresión:
1. El modelo log-lineal
2. Modelos semilogarítmicos
3. Modelos recíprocos
4. El modelo logarítmico recíproco
Se analizan las características especiales de cada modelo, los casos en los cuales su uso es apropiado y la forma como
éstos son estimados.
Yi = βi X iβ 2 eµi
1
donde In = logaritmo natural (es decir, logaritmo en base e y donde e = 2.718). Si se escribe (2) como
lnYi = α + β2 ln X i + µi 3
donde α = In β1 este modelo es lineal en los parámetros α y β2, lineal en los logaritmos de las
variables Y y X y puede ser estimado por regresión MCO. Debido a esta linealidad, tales modelos se
denominan modelos log-log, doble-Iog, o log-lineales. .
donde Yi* = In Yi y Xi* = In Xi'. Los estimadores MCO obtenidos, α̂ y β̂ 2 serán los mejores
estimadores lineales insesgados de α y β2 respectivamente.
Una característica importante del modelo log-log, que lo ha hecho muy popular en el trabajo
empírico, es que el coeficiente de la pendiente β2 mide la elasticidad de Y con respecto a X, es
decir, el cambio porcentual en Y ante un pequeño cambio porcentual en X dado1. Así, si Y
representa la cantidad demandada de un bien y X su precio unitario, 2 mide la elasticidad-precio de
la demanda, un parámetro de gran interés en economía. Si la relación entre la cantidad demandada y el
precio es como se muestra en la figura a, la transformación doble-Iog presentada en la figura b dará
entonces la estimación de la elasticidad-precio (-β2).
Pueden observarse dos características especiales del modelo log-lineal: el modelo supone que el
coeficiente de la elasticidad entre Y y X, β2 permanece constante a través del tiempo (¿por qué?) de
1
El coef iciente de la elasticidad, en la notación de cálculo, se def ine como (dY/Y)/(dX/X) = [(dY/ dX)(X/Y)].
Nota técnica: Se observa que d(ln X)/dX = 1/X o d(ln X) = dX/X, es decir, para cambios inf initesimalmente pequeños
(obsérvese el operador dif erencial d), un cambio en In X es igual al cambio relativ o o proporcional en X. En la
práctica, sin embargo, si el cambio en X es pequeño, esta relación puede escribirse como: cambio en In X ≅
cambio relativ o en X, donde ≅ signif ica aproximadamente. Así, para cambios pequeños,
(In Xt - In Xt-1) ≅ (Xt – Xt-1)/Xt-1 = cambio relativ o en X
A propósito, se deberá observar estos términos, a los que se hace referencia frecuentemente:
1) cambio absoluto,
2) cambio relativ o o proporcional y
3) cambio porcentual o tasa de crecimiento porcentual.
Así, (Xt – Xt-1) representa un cambio absoluto, (Xt – Xt-1)/Xt-1 = (Xt /Xt-1-1) es un cambio relativ o o proporcional y
[(Xt – Xt-1)/Xt-1]IOO es el cambio porcentual, o la tasa de crecimiento. Xt y Xt-1 son los v alores actual y anterior
de la v ariable X, respectiv amente.
aquí su nombre alterno modelo de elasticidad constante 2. En otras palabras, como lo indica la
figura b, el cambio en In Y por unidad de cambio en In X (es decir, la elasticidad, β2; permanece igual
sin importar en cuál ln X se mide la elasticidad. Otro aspecto del modelo es que a pesar de que α̂ y
β̂ 2 son estimadores insesgados de α y β2, β1 (el parámetro del modelo original) al ser estimado como
β̂1 = antilog ( α̂ ) es, de por sí, un estimador sesgado. En la mayor parte de los problemas prácticos,
sin embargo, el término intersección es de importancia secundaria y no es necesario preocuparse por
obtener este estimador insesgado.
En el modelo de dos variables, la forma más simple de decidir si el modelo log-lineal se ajusta a
los datos es graficar el diagrama de dispersión de In Yi frente a In Xi y ver si las observaciones caen
aproximadamente sobre una línea recta como en la figura b.
EJEMPLO 1:
GASTO EN BIENES DURADEROS RESPECTO AL GASTO DE CONSUMO PERSONAL
TOTAL
La tabla 1 muestra los datos sobre el gasto de consumo personal total (GCPERT), el gasto en bienes
duraderos (GASBD), el gasto en bienes perecederos (GASBPER) y el gasto en servicios (GASERV),
todos medidos en millones de dólares de 1992.2
Supóngase que se desea calcular la elasticidad del gasto en bienes durables respecto al gasto de
consumo personal total. Al graficar el logaritmo del gasto en bienes durables en comparación con el
logaritmo del gasto de consumo personal total, se observará que la relación entre las dos variables es
lineal. Por tanto, el modelo del doble logaritmo podría resultar adecuado. Los resultados de la
regresión son:
los cambios en el gasto de consumo personal. Ésta es una razón por la que los productores de bienes
duraderos siguen muy de cerca los cambios en el ingreso personal y el gasto de consumo personal.
Los economistas, la gente de negocios y los gobiernos frecuentemente están interesados en encontrar
la tasa de crecimiento de ciertas variables económicas, tales como población, PIB, oferta monetaria,
empleo, productividad, déficit comercial, etc.
Supóngase que se desea saber la tasa de crecimiento del gasto de consumo personal en servicios
para los siguientes datos (ver tabla 1). Sea Yt el gasto real en servicios en el tiempo t, y Yo el valor
inicial del gasto en servicios (es decir, el valor al final del cuarto trimestre de 1992). Se ha de recordar
la fórmula del interés compuesto.
Yt = Y0(1 + r)t 5
donde r es tasa de crecimiento compuesta de Y (es decir, a través del tiempo). Tomando el logaritmo
natural de (5), podemos escribir
Ahora sea
β1 = lnY0 7
β 2 = ln(1 + r) 8
ln Yt = β1 + β2 t 9
Agregando el término de perturbación a (9), se obtiene3
ln Yt = β1 + β 2 + µt t 10
Este modelo es igual a cualquier otro modelo de regresión lineal en el sentido de que los parámetros β1
y β2, son lineales. La única diferencia es que la variable dependiente o regresada es el logaritmo de Y y
el regresor o variable explicativa es el "tiempo", que adquiere valores de 1,2,3, etc.
Modelos como (10) se denominan modelos semilog porque solamente una variable (en este caso la
dependiente) aparece en forma logarítmica. Para fines descriptivos, un modelo en el cual la variable
regresada es logarítmica se denominará modelo log-lin. Antes de presentar los resultados de la
3
Se agrega el término error porque la f órmula de interés compuesto no se cumple exactamente.
regresión, examínense las propiedades del modelo (9). En este modelo el coeficiente de la
pendiente mide el cambio proporcional constante o relativo en Y para un cambio absoluto
dado en el valor de la variable independiente (en este caso la variable t), es decir,4
Si se multiplica el cambio relativo en Y por 100, (11) dará entonces el cambio porcentual, o la tasa de
crecimiento, en Y ocasionada por un cambio absoluto en X, la variable independiente. Es decir, 100
por β2 da como resultado la tasa de crecimiento en Y; 100 por β2 se conoce en la literatura como la
semielasticidad de Y respecto a X.
Para ilustrar el modelo de crecimiento (10), considere los datos sobre el gasto en servicios
proporcionados en la tabla 1. Los resultados de la regresión son los siguientes:
Nota: GASER significa gasto en servicios y el asterisco (*) denota que el valor p es extremadamente
pequeño.
La interpretación de la ecuación es que durante un periodo de un trimestre (del primero al tercero de
1993), el gasto en servicios se incrementó a una tasa (trimestral) de 0.743%. Aproximadamente esto
es igual a un crecimiento anual de 2.972%. Puesto que 7.7890 = log de GES al comienzo del periodo
de análisis, si se toma su antilogaritmo se tiene 2.41390 (billones de dólares), como el valor inicial de
GES (es decir, el valor al final del último trimestre de 1992). La recta de regresión obtenida mediante
la ecuación del ejemplo 2, se ilustra en la figura c.
Figura c
4
Utilizando cálculo diferencial. se puede demostrar que β 2 = d(ln Y)ldX = (1/Y)(dYldX) = (dYIY)ldX,
que no es otra cosa que (11). Para cambios pequeños en Y y en X, esta relación puede aproximarse
mediante
(Yt − Yt −1) /Yt −1
(X t − X t −1 )
Nota: aquí X = t.
Tasa de crecimiento instantánea vs. compuesta. El coeficiente da la tasa de crecimieto instantánea (en
un punto del tiempo) y no la compuesta (durante un periodo). Pero esta última puede encontrarse a
partir de (8): obtener el antilogaritmo de la β2 estimada, restarle 1 y multiplicar la diferencia por 100.
Por tanto, para el ejemplo, el coeficiente de la pendiente estimado es 0.00743. Así pues,
[antilog(0.00743) - 1] = 0.00746 o 0.746%. En consecuencia, en el ejemplo ilustrativo la tasa
compuesta de crecimiento de gastos en servicios fue de casi 0.746% por trimestre, lo cual es un poco
mayor que la tasa de crecimiento instantánea de 0.743%. Lo anterior se debe, por supuesto, al efecto
compuesto.
Modelo de tendencia lineal En lugar de estimar el modelo (10), los investigadores algunas veces
estiman el siguiente modelo:
Yt = β1 + β2 + µt
t 12
Es decir, en lugar de hacer la regresión para el log de Y sobre el tiempo, lo hacen para Y sobre el
tiempo. Un modelo de este tipo se denomina modelo de tendencia lineal y la variable tiempo t se
conoce como la variable de tendencia. Si el coeficiente de la pendiente en (12) es positivo, existe una
tendencia creciente en Y, mientras que si es negativa, existe una tendencia decreciente en Y.
Para los datos concernientes con el gasto en servicios que se analizaron antes, los resultados de
ajustar el modelo de tendencia lineal (12) son los siguientes:
Ejemplo 3 de la Tabla 1
GASERt = 2 405.848 + 19.6920t
t = (322.9855) (36.2479)
R2= 0.9843
"En contraste con la ecuación anterior, la interpretación es la siguiente: durante el periodo
trimestral (del primero al tercero de 1993), en promedio, el gasto en servicios se incrementó
a una tasa absoluta (nota: no relativa) de casi 20 mil millones de dólares por trimestre . Es
decir, hubo una tendencia creciente en el gasto en servicios.
La elección entre el modelo de crecimiento del ejemplo 2 y el modelo de tendencia lineal del ejemplo
3, dependerá de si se está interesado en el cambio relativo o absoluto en el gasto en servicios aunque,
para propósitos de comparación, es el cambio relativo el que tiene mayor importancia. Es necesario
observar que no se puede comparar los valores de R2 de los modelos de los ejemplos 2 y 3 porque las
variables dependientes son diferentes en los dos modelos.
El modelo Lin-Log
A diferencia del modelo de crecimiento recién estudiado, en el cual se estaba interesado en encontrar
el crecimiento porcentual en Y, ante un cambio unitario absoluto en X, ahora hay interés en
encontrar el cambio absoluto en Y debido a un cambio porcentual en X. Un modelo que puede
lograr este propósito puede escribirse como
Yi = βi + β2 ln Xi + µi 13
Para fines descriptivos, llamamos a este modelo un modelo lin-log. Interprétese el coeficiente de la
pendiente β2.5 Como es usual,
cambio en Y cambio en Y
β2 = o β2 =
cambio en ln X cambio relativo en X
El segundo paso se basa en el hecho de que un cambio en el log de un número es un cambio relativo.
Simbólicamente, se tiene
∆Y
β2 = 14
∆X / X
donde, como es usual, ∆ denota un cambio pequeño. La ecuación anterior puede ser escrita en forma
equivalente así:
∆Y =β2(∆X/X) 15
Así, si ∆X/X cambia en 0.01 unidades (o 1 %), el cambio absoluto en Y es 0.01(β2). Por tanto, si en
una aplicación se encuentra que β2 = 500, entonces el cambio absoluto en Y es (0.01)(500), o 5.0. Por
consiguiente, cuando se utiliza MCO para estimar regresiones como en (13), se debe multiplicar el
valor del coeficiente de la pendiente estimado, β2 por 0.01 o, lo que es lo mismo, dividido entre 100.
Si no se tiene lo anterior presente, la interpretación en una aplicación será muy equivocada.
dY 1
5
Nuev amente, utilizando cálculo dif erencial, se tiene = β2 Por consiguiente,
dX X
dY ∆Y
β2 = = β2 =
dX ∆X / X
x
La pregunta práctica es: ¿cuándo resulta útil un modelo lin-log como el (13)? Se ha encontrado una
interesante aplicación en los así conocidos modelos de gasto Engel . Postuló que "el gasto total que
se dedica a los alimentos tiende a incrementarse en progresión aritmética, mientras que el gasto total
aumenta en progresión geométrica" .
EJEMPLO 4:
Los datos para el modelo lin-log, se observan en la tabla 2 además si se grafican estos, se obtiene la
gráfica de la figura d. Tal y como esta figura sugiere, el gasto alimenticio se incrementa en forma más
lenta, conforme el gasto total aumenta, lo cual quizá proporcione sustento a la ley de Engels. Los
resultados de ajustar el modelo lin-Iog a los datos son los siguientes:
Interpretado de la forma antes descrita, el coeficiente de la pendiente, que vale casi 257, significa que
un incremento en el gasto total en alimentos de 1 %, en promedio, propicia un incremento de casi
2.57 rupias en el gasto en alimento de las 55 familias incluidas en la muestra. (Nota: se dividió el
coeficiente estimado de la pendiente entre 100.)
Antes de seguir, obsérvese que si se desea calcular el coeficiente de elasticidad para los modelos lin-
Iog o log-lin, se puede hacer a partir de la definición del coeficiente de elasticidad dada antes, a saber:
dY X
Elasticidad =
dX Y
En la práctica, una vez que se conoce la forma funcional de un modelo, se pueden calcular las
elasticidades aplicando la anterior definición.
Figura d
Este modelo tiene las siguientes características: a medida que X aumenta indefinidamente, el
término β 2 (1/X) se acerca a cero (nota: β 2 es una constante) y Y se aproxima al valor límite
o asintótico β 1. Por consiguiente, modelos tales como (16) contienen un valor asintótico o
límite que tomará la variable dependiente cuando el valor de la variable X aumente
indefinidamente .7
1
Figura Modelo Recíproco: Yi = β1 + β2 + µi e
Xi
1
6
Si se def ine que Xi* = (1/X), entonces Yi = β1 + β2 + µi es lineal en los parámetros al igual que en las
Xi
v ariables Yi y Xi*
1
7
La pendiente de Yi = β1 + β2 + µi es: dY/dX = -β2 (1/X2), e implica que si β2 es positiv o, la pendiente
Xi
siempre es negativ a y si β2 es negativ a, la pendiente es positiv a. Véanse f iguras e y g, respectiv amente.
Éstos son datos representativos de 64 países respecto a la mortalidad infantil y a otras variables. Por
el momento, hay que concentrarse en las variables de mortalidad infantil (MI) y PIB percápita
(PIBPC), mismas que se grafican en la figura h.
Figura h
1
Figura Modelo Recíproco: Yi = β1 + β2 + µi f y g
X
i
Como puede observarse, esta figura se parece a la figura a conforme el PIB per cápita se
incrementa, se esperaría que la mortalidad infantil disminuyera, debido a que las personas pueden
gastar más en el cuidado de la salud, si se supone que los otros factores permanecen constantes. Pero
la relación no da como resultado una recta: conforme el PIB per cápita se incrementa, al principio
existe una disminución drástica en la MI, pero ésta va disminuyendo en la medida que el PIB per
cápita sigue aumentando.
Si se trata de ajustar el modelo recíproco (16), se obtienen los siguientes resultados:
Ejemplo 5 de la Tabla 3
1
MIi = 81.79436 + 27 237.17
PIBPCi
ee = (10.8321) (3759.999)
t = (7.5511) (7.2535)
R2 = 0.4590
Conforme el PIB per cápita se incrementa indefinidamente, la mortalidad infantil se acerca a su valor
asintótico de casi 82 muertes por cada millar. Como se explicó en la nota 6, el valor positivo del
coeficiente de (1/PIBPCi) implica que la tasa de cambio de la MI con respecto al PIBPC es negativa.
Como lo muestra la figura siguiente, existe asimetría en la respuesta de los cambios salariales al nivel
de desempleo: si la tasa de desempleo está por debajo de U" (denominada por los economistas como
tasa natural de desempleo) por cada unidad de cambio en el desempleo, los salarios aumentan con
mayor rapidez de lo que caen debido a un cambio equivalente cuando la tasa de desempleo está por
encima del nivel natural, β1 indicando la base asintótica para el cambio salarial. Este hecho particular
de la curva de Phillips puede deberse a factores institucionales, tales como el poder de negociación de
los sindicatos, los salarios mínimos, compensaciones por desempleo, etc.
Desde la publicación del artículo de Phillips, se ha llevado a cabo una muy extensa investigación
sobre la curva de Phillips tanto a nivel teórico como empírico. La curva de Phillips ha experimentado
diversas encarnaciones. Una formulación comparativamente reciente la proporciona Olivier
Blanchard, denota la tasa de inflación en el tiempo t, misma que se define como el cambio porcentual
en el nivel de precios, medido por un índice de precios representativo, como el Índice de Precios al
Consumidor (IPC), y si UNt denota la tasa de desempleo en el tiempo t, entonces la moderna versión
de la curva de Phillips se expresa bajo el siguiente formato:
π t − π te = β2 (UNt − U n ) + µt 17
donde:
π t = tasa real de inflación en el tiempo t.
π te = tasa real de inflación esperada en el tiempo t, donde la expectativa se forma en el año (t - 1)
UNt = tasa real de desempleo que prevalece en el tiempo t
Un = tasa natural de desempleo en el tiempo t
µt = término error estocástico
Puesto que π te no se puede observar de manera directa, como punto de partida se puede
simplificar suponiendo que π te = π t −1 ; es decir, la inflación esperada este año es la tasa de inflación
que prevaleció el año anterior; por supuesto, se pueden hacer suposiciones más complicadas respecto
a la formación de expectativas, en los modelos de retraso distribuido.
donde β1 = -β2 Un. La ecuación anterior establece que el cambio en la tasa de inflación entre los dos
periodos está linealmente relacionado con la tasa de desempleo real. A priori, se espera que β2 sea
negativa (¿por qué?) y β1 positiva (esto se debe a que β2 es negativa y Un es positiva).
A propósito, la relación Phillips dada en (17) se conoce en la literatura como la curva de Phillips
modificada, la curva de Phillips de expectativas aumentadas (para indicar que π t −1 significa la
inflación esperada), o la curva de Phillips aceleradora (para sugerir que una baja tasa de desempleo
propicia un incremento en la tasa de inflación y por consiguiente provoca una aceleración del nivel de
precios).
A manera de ilustración de la curva de Phillips modificada, en la tabla 4 se presentan datos sobre
la inflación medida por el porcentaje anual en el Índice de Precios al Consumidor (IPCon inflación) y
la tasa de desempleo para el periodo 1960-1998. La tasa de desempleo representa la tasa de
desempleo civil. A partir de estos datos se obtuvo el cambio en la tasa de inflación ( π t − π t −1 ) y se
graficó respecto a la tasa de desempleo civil; se está utilizando el IPC como una medida de la
inflación. La gráfica resultante aparece en la figura j.
Como se esperaba, la relación entre el cambio en la tasa de inflación y la tasa de desempleo es
negativa (un desempleo bajo provoca un incremento en la tasa de inflación y por consiguiente una
aceleración del nivel de precios, de ahí el nombre de curva aceleradora de Phillips).
Al observar la figura j, no resulta obvio si un modelo de regresión lineal (una recta) o un modelo
recíproco sea el que se ajuste con los datos; tal vez haya una relación curvilínea entre las dos
variables. Sin embargo, hay que tener presente que para el modelo recíproco se espera que sea
negativo el término intersección y la pendiente positiva, como se hizo énfasis en la nota 6.
Figura Curva de Phillips Modificada j
Ejemplo 6 de la Tabla 4:
Modelo lineal: ( π t − π t −1 ) = 4.1781 - 0.6895 UNt
t = (3.9521) (-4.0692)
2
R = 0.3150
Para el modelo recíproco:
Ejemplo 7 de la Tabla 4
1
( π t − π t −1 ) = -3.2514 + 18.5508
UNt
t = (-2.9715) (3.0625)
R2 = 0.2067
Todos los coeficientes estimados en ambos modelos son significativos estadística e individualmente,
además todos los valores de p son menores que el nivel 0.005.
El modelo del ejemplo 6 muestra que si la tasa de desempleo baja un punto porcentual, en promedio,
el cambio en la tasa de inflación aumenta 0.7 puntos porcentuales, y viceversa. El modelo del ejemplo
7 revela que incluso si la tasa de desempleo se incrementara de manera indefinida, el máximo cambio
en la tasa de inflación bajaría y sería de 3.25 puntos porcentuales. A propósito, de la ecuación del
modelo 6, se puede calcular la tasa de desempleo natural subyacente, de la siguiente forma:
βˆ 4.1781
Un = 1 = = 6.0596 19
− βˆ2 0.6895
Es decir, la tasa de desempleo natural es de casi 6.06%. Los economistas sitúan la tasa natural entre el
5 y el 6%, aunque en años recientes la tasa real de desempleo para Estados Unidos ha sido mucho
más baja.
Se concluy e est e análisis de los modelos recíp rocos, est udiando el modelo recíp roco
logarít mico, que t oma la siguient e forma:
1
lnYi = β1 − β2 + µi 20
Xi
Su forma se ilustra en la figura k. Se muestra al principio Y se incrementa a una tasa creciente (es
decir, la curva es convexa al inicio) y luego aumenta a una tasa decreciente (la curva se convierte en
cóncava).8 20 Por consiguiente, este modelo sería apropiado para representar una función de
d 1 1 d 1 dY
8
Del cálculo, se puede demostrar que (lnY ) = −β2 − 2 = β2 2 Pero (lnY ) =
dX X X dX Y dX
producción a corto plazo. Recuerde que los cursos de microeconomía que si el trabajo y el capital son
insumos en una función de producción y si se mantiene constante el insumo capital pero se
incrementa el insumo trabajo, la relación entre producto y trabajo a corto plazo se parecerá a la figura
k.
Se analizaron las distintas formas funcionales que un modelo empírico puede tomar, incluso dentro de
los confines de los modelos de regresión lineal en el parámetro. La elección de una forma funcional
particular puede ser relativamente fácil para el caso de dos variables, ya que se pueden graficar las
variables y tener así una ligera idea respecto al modelo apropiado. La elección se vuelve mucho más
complicada cuando se considera el modelo de regresión múltiple que involucra más de una variable
independiente.
1. Es una buena práctica calcular la tasa de cambio (es decir, la pendiente) de la regresada, con
respecto a la regresora, así como conocer la elasticidad de la regresada con respecto a la regresara. Para
los diversos modelos estudiados en este capítulo, se proporcionan en la tabla 5 las fórmulas
necesarias para los coeficientes de la pendiente y de la elasticidad de los distintos modelos. El
conocimiento de tales fórmulas ayudarán a comparar los diversos modelos.
2. Los coeficientes del modelo escogido deberán satisfacer determinadas expectativas a priori. Por
ejemplo, si se está considerando la demanda de automóviles como una función del precio y de otras
variables, se deberá esperar un coeficiente negativo para la variable precio.
3. Algunas veces tal vez más de un modelo se ajuste razonablemente bien a un determinado conjunto
de datos dados. En la curva de Phillips modificada, un modelo lineal y otro recíproco se ajustaron a
dY Y
Al sustituir, se obtiene = β2 2 que es la pendiente de Y respecto a X.
dX X
los datos. En ambos casos, los coeficientes resultaron adecuados para las expectativas previas y
fueron estadísticamente significativos. Una gran diferencia fue que el valor R2 del modelo lineal fue
mayor que el del modelo recíproco. Por tanto, se podría tener una ligera preferencia por el modelo
lineal en comparación con el recíproco. Pero se debe asegurar de que al comparar dos valores de R2 la
variable dependiente (o regresada) de los dos modelos sea la misma; la(s) regresor(as) pueden tomar
cualquier forma.
4. En general no se debe sobrevaluar la medición de R2 en el sentido de creer que mientras más alta sea
r mejor será el modelo. Si R2 se incrementa conforme se añaden más regresoras al modelo. Lo que
reviste mayor importancia es la justificación teórica del modelo elegido, los signos de los coeficientes
estimados y su importancia estadística. Si un modelo es bueno bajo estos criterios, entonces quizá
resulte aceptable un modelo con una R2 menor.
Tabla 5
Elasticidad
dY
Modelo Ecuación Pendiente = dY X
dX =
dX Y
X
Lineal Y = βi + β2 X β2 β2
Y
Y
Log-lineal o log-Iog ln Y = β i + β 2 ln X β 2 β2
X
Log-lin ln Y = β i + β 2 X β2(Y) β2(Y)
1 1
Lin-Iog Y = β i + β 2 ln X β2 β2
X Y
1 1 1
Recíproco Y = βi + β2 − β2 2 − β2
X X XY
1 Y 1
Log recíproco ln Y = β i − β 2 β2 β2
X X X
Tabla 1
obs GASER GASBD GASBPER GCPERT
1993.I 2445.3 504 1337.5 4286.8
1993.II 2455.9 519.3 1347.8 4322.8
1993.III 2480 529.9 1356.8 4366.6
1993.IV 2494.4 542.1 1361.8 4398
1994.I 2510.9 550.7 1378.4 4439.4
1994.II 2531.4 558.8 1385.5 4472.2
1994.III 2543.8 561.7 1393.2 4498.2
1994.IV 2555.9 576.6 1402.5 4534.1
1995.I 2570.4 575.2 1410.4 4555.3
1995.II 2594.8 583.5 1415.9 4593.6
1995.III 2610.3 595.3 1418.5 4623.4
1995.IV 2622.9 602.4 1425.6 4650
1996.I 2648.5 611 1433.5 4692.1
1996.II 2668.4 629.5 1450.4 4746.6
1996.III 2688.1 626.5 1454.7 4768.3
1996.IV 2701.7 637.5 1465.1 4802.6
1997.I 2722.1 656.3 1477.9 4853.4
1997.II 2743.6 653.8 1477.1 4872.7
1997.III 2775.4 679.6 1495.7 4947
1997.IV 2804.8 648.8 1494.3 4981
1998.I 2829.3 710.3 1521.2 5055.1
1998.II 2866.8 729.4 1540.9 5130.2
1998.III 2904.8 733.7 1549.1 5181.8
Tabla 2
obs GASAL GASTOT obs GASAL GASTOT
1 217 382 31 470 663
2 196 388 32 322 677
3 303 391 33 540 680
4 270 415 34 433 690
5 325 456 35 295 695
6 260 460 36 340 695
7 300 472 37 500 695
8 325 478 38 450 720
9 336 494 39 415 721
10 345 516 40 540 730
11 325 525 41 360 731
12 362 554 42 450 733
13 315 575 43 395 745
14 355 579 44 430 751
15 325 585 45 332 752
16 370 586 46 397 752
17 390 590 47 446 769
18 420 608 48 480 773
19 410 610 49 352 773
20 383 616 50 410 775
21 315 618 51 380 785
22 267 623 52 610 788
23 420 627 53 530 790
24 300 630 54 360 795
25 410 635 55 305 801
26 220 640
27 403 648 GASAL= Gasto en Alimentos
28 350 650 GASTOT= Gasto Total
29 390 655
30 385 662
Tabla 3
Fertilidad y otros datos para 64 paises
Obs MI TAF PIBPC TFT Obs MI TAF PIBPC TFT
1 128 37 1870 6.66 36 41 66 1620 3.91
2 204 22 130 6.15 37 312 11 190 6.7
3 202 16 310 7 38 77 88 2090 4.2
4 197 65 570 6.25 39 142 22 900 5.43
5 96 76 2050 3.81 40 262 22 230 6.5
6 209 26 200 6.44 41 215 12 140 6.25
7 170 45 670 6.19 42 246 9 330 7.1
8 240 29 300 5.89 43 191 31 1010 7.1
9 241 11 120 5.89 44 182 19 300 7
10 55 55 290 2.36 45 37 88 1730 3.46
11 75 87 1180 3.93 46 103 35 780 5.66
12 129 55 900 5.99 47 67 85 1300 4.82
13 24 93 1730 3.5 48 143 78 930 5
14 165 31 1150 7.41 49 83 85 690 4.74
15 94 77 1160 4.21 50 223 33 200 8.49
16 96 80 1270 5 51 240 19 450 6.5
17 148 30 580 5.27 52 312 21 280 6.5
18 98 69 660 5.21 53 12 79 4430 1.69
19 161 43 420 6.5 54 52 83 270 3.25
20 118 47 1080 6.12 55 79 43 1340 7.17
21 269 17 290 6.19 56 61 88 670 3.52
22 189 35 270 5.05 57 168 28 410 6.09
23 126 58 560 6.16 58 28 95 4370 2.86
24 12 81 4240 1.8 59 121 41 1310 4.88
25 167 29 240 4.75 60 115 62 1470 3.89
26 135 65 430 4.1 61 186 45 300 6.9
27 107 87 3020 6.66 62 47 85 3630 4.1
28 72 63 1420 7.28 63 178 45 220 6.09
29 128 49 420 8.12 64 142 67 560 7.2
30 27 63 19830 5.23
31 152 84 420 5.79 MI = Mortalidad Infantil
32 224 23 530 6.5 TAF = Tasa de alf abetismo femenina
33 142 50 8640 7.17 PIBPC =Pib per capita en 1980
34 104 62 350 6.6 TFT = Tasa de f ertilidad total
35 287 31 230 7
Dependent Variable: MI
Method: Least Squares
Sample: 1 64
Included observations: 64
Variable Coefficient Std. Error t-Statistic Prob.
C 81.79436 10.83206 7.551136 0.0000
1/PIBPC 27273.17 3759.999 7.253503 0.0000
R-squared 0.459051 Mean dependent var 141.5000
Adjusted R-squared 0.450326 S.D. dependent var 75.97807
S.E. of regression 56.33016 Akaike info criterion 10.93109
Sum squared resid 196731.4 Schwarz criterion 10.99855
Log likelihood -347.7948 F-statistic 52.61330
Durbin-Watson stat 1.959368 Prob(F-statistic) 0.000000
Tabla 4
Tasas de inflación y de desempleo para USA, 1960-1998
Año TSINF TSDES Año TSINF TSDES
1960 1.7 5.5 1985 3.6 7.2
1961 1 6.7 1986 1.9 7
1962 1 5.5 1987 3.6 6.2
1963 1.3 5.7 1988 4.1 5.5
1964 1.3 5.2 1989 4.8 5.3
1965 1.6 4.5 1990 5.4 5.6
1966 2.9 3.8 1991 4.2 6.8
1967 3.1 3.8 1992 3 7.5
1968 4.2 3.6 1993 3 6.9
1969 5.5 3.5 1994 2.6 6.1
1970 5.7 4.9 1995 2.8 5.6
1971 4.4 5.9 1996 3 5.4
1972 3.2 5.6 1997 2.3 4.9
1973 6.2 4.9 1998 1.6 4.5
1974 11 5.6
1975 9.1 8.5 TSINF=Tasa de inflación
1976 5.8 7.7 TSDES=Tasa de desempleo
1977 6.5 7.1
1978 7.6 6.1
1979 11.3 5.8
1980 13.5 7.1
1981 10.3 7.6
1982 6.2 9.7
1983 3.2 9.6
1984 4.3 7.5
1.-El diagrama de dispersión, la elasticidad y R2 no ayudan a seleccionar la forma funcional adecuada para transformar la
no lineal: Si___; No____.
2.- El especialista Dominick salvadores dice que “ Cuando ninguna teoría de la dispersión de puntos es de ayuda, la
función lineal se trata usualmente primero debido a su simplicidad”: SI_____;NO_____.
3.-Las transformaciones de funciones no lineales a lineales mas útiles y comunes son la log-log,log-lin,lin-log, reciproca
y polinomial: Si_____; No________
5.-Al usar la log-log la elasticidad de la variable regresada se obtiene directamente de los valores de las pendientes de
las regresoras: SI:__; NO__.
6.-Al usar la log-log con las pendientes de las variables regresoras no siempre se obtienen economías de escala: SI___;
NO____.
7.-Al usar la log-log si las variables regresoras son factores de la producción, con sus pendientes se pueden obtener
economías de escala cuando la su suma es mayor que 1: SI____; NO______:
8.-Con la forma funcional semilogarítmica se puede calcular la tasa de crecimiento de la variable regresada con la
pendiente de la regresora: SI____;NO_____.
9.- Con la forma funcional recíproca no se puede calcular la curva de Phillips: SI_____; NO____.
:
1
10.- La siguiente es la fórmula de la elasticidad del modelo log recíproco: β2 : SI____; NO______.
X
B. Observaciones: Cada una de las respuestas correctas vale 10 puntos en escala de 0 a 100. No se puede usar la
calculadora, ni las tablas estadísticas ni la bibliografía correspondiente a cada tema.