Sunteți pe pagina 1din 18

Pg.

1/18
BREVE APUNTE SOBRE LA ESTIMACIN DE LOS PARMETROS MCO Y
MXIMA VEROSIMILITUD

Ramn Maha Rafael de Arce
Noviembre 2011

I.- Planteamiento

Sea el Modelo Bsico de Regresin Lineal (MBRL) definido como:

i ki k i i i
U x x x y + + + + + = | | | | ........
3 3 2 2 1


donde los parmetros cuantifican la relacin parcial de cada variable exgena X con
la endgena Y.

Partimos de que se ha completado la etapa de especificacin del modelo
economtrico y son conocidos por tanto los valores de la Y y las X para la muestra
temporal o transversal seleccionada. Se plantea ahora la siguiente pregunta cmo
obtener una buena estimacin de esos parmetros a partir de los datos disponibles
para Y y para cada una de las X?

II.- Estimador de Mnimos Cuadrados Ordinarios

Uno de los procedimientos ms conocidos es el denominado Estimador de Mnimos
Cuadrados Ordinarios (MCO). Este procedimiento plantea utilizar, como estimacin de
los parmetros, aquella combinacin de 1, 2, k que minimice los errores que el
modelo cometer. Qu significa esto?. Est claro que, si dispusiramos a priori de los
parmetros estimados podramos escribir el MBRL NO como:

i ki k i i i
U x x x y + + + + + = | | | | ........
3 3 2 2 1


sino como:

ki k i i i
x x x y | | | |

........

3 3 2 2 1
+ + + + =

y, por tanto, podramos computar el error o residuo que el modelo comete en la
estimacin de cada valor de la endgena comparando, de forma inmediata, el valor
real de la endgena en cada observacin con el valor estimado:

)

........

(

3 3 2 2 1 ki k i i i
i i i
x x x y
y y e
| | | | + + + + =
= =


Este error dependera, evidentemente, del valor asignado a las estimaciones de los
parmetros ; pues bien, el mtodo de MCO sugiere utilizar aquella combinacin de
parmetros estimados que minimice la suma al cuadrado de todos los errores
cometidos para las n observaciones disponibles:
Pg.2/18

( )

=
=
n
i
i MCO
e S
1
2
min ) min(

|

Para obtener algebraicamente una expresin de clculo operativa para los estimadores
MCO, procedemos de la siguiente forma:

Desarrollo 1:

Derivacin NO MATRICIAL de la expresin de los estimadores MCO

- La expresin a minimizar es:

( ) ( )

= =
= =
n
i
ki k i i i
n
i
i
x x x y e S
1
2
3 3 2 2 1
1
2

........

) ( | | | |

- Para obtener los valores de cada uno de los k parmetros
j
|

que
minimizan esta expresin derivamos con respecto a cada uno de ellos e
igualamos a cero, obteniendo k expresiones del tipo:

( ) ( )

=
= =
c
c
n
i
ji ki k i i i
j
x x x x y
S
1
3 3 2 2 1
0

........

2

) (
| | | |
|



- Estas expresiones, se denominan ecuaciones normales. En este sistema
de las ecuaciones normales las incgnitas son los parmetros
j
|

a estimar
y los valores conocidos son los datos muestrales recogidos de la y y de las
x.

- Observadas una a una, para cada parmetro, las expresiones de las
ecuaciones normales son:



= = = = =
+ + + + =
n
i
n
i
i ki k
n
i
i i
n
i
i i
n
i
i i i i
x x x x x x x x x y
1 1
1
1
1 3 3
1
1 2 2
1
1 1 1 1

........

| | | |

= = = = =
+ + + + =
n
i
n
i
i ki k
n
i
i i
n
i
i i
n
i
i i i i
x x x x x x x x x y
1 1
2
1
2 3 3
1
2 2 2
1
2 1 1 2

........

| | | |

= = = = =
+ + + + =
n
i
n
i
i ki k
n
i
i i
n
i
i i
n
i
i i i i
x x x x x x x x x y
1 1
3
1
3 3 3
1
3 2 2
1
3 1 1 3

........

| | | |

=
+ + + + + +
n
i 1
....... .......... ........ ........ ........ ........

= = = = =
+ + + + =
n
i
n
i
ki ki k
n
i
ki i
n
i
ki i
n
i
ki i ki i
x x x x x x x x x y
1 1 1
3 3
1
2 2
1
1 1

........

| | | |

Pg.3/18
- Lo que, teniendo en cuenta las expresiones matriciales del vector endgeno
Y y de la matriz de variables exgenas X, puede expresarse
matricialmente como:

|

' ' X X Y X =

- De donde se obtiene fcilmente (despejando) la expresin final matricial
1

del vector de parmetros estimados |

:

( ) ( )
( ) Y X X X
X X X X Y X X X
X X Y X
' '


' ' ' '

' '
1
1 1


=
=
=
|
|
|


Desarrollo 2:

Derivacin MATRICIAL de la expresin de los estimadores MCO


Puede comprobarse cmo podramos haber planteado el desarrollo de la expresin de
los estimadores la estimacin utilizando exclusivamente lgebra matricial.
Efectivamente, la minimizacin de residuos puede plantearse a partir del vector de
residuos e como:

( ) ( ) ( ) ( ) | | | | | |

' '

' '

' ' min

'

min ) ' min( X X Y X X Y Y Y X Y X Y e e + = =




( ) ( ) ( ) ( )
( ) | | |
| | | | | |

' '

' '

2 ' min

' '

' '

' ' min

'

min ) ' min(


X X Y X Y Y
X X Y X X Y Y Y X Y X Y e e
+ =
+ = =


Obsrvese cmo los productos matriciales |

' X Y y Y X' '

| son en realidad el mismo e


iguales a un escalar: efectivamente, la primera expresin es la transpuesta de la
segunda y dado que el orden de cada una de ellas es (1x1), es decir, un escalar,
estamos viendo en realidad dos expresiones equivalentes del mismo nmero (escalar).
As pues, podemos escribir |

' X Y + Y X' '

| como |

' 2 X Y bien cmo Y X' '

2| de
modo que tenemos:

( ) | | |

' '

' '

2 ' min ) ' min( X X Y X Y Y e e + =




Ara resolver ahora la minimizacin, recurrimos de nuevo al concepto de derivada
(necesariamente parcial) para lo que, en el caso de las matrices, debemos recordar una
propiedad de utilidad: para cualquier par de matrices A y B se cumple que:




Pg.4/18
( )
B A BA
A
BA A
' 2 2
'
= =
c
c


En nuestro caso, debemos derivar respecto a |

( '

| ) tres sumandos, y es para el


tercero de ellos ( | |

' '

X X ) para dnde debemos recordar la propiedad matricial


anterior (en nuestro caso, A es la matriz |

y B es la matriz XX).

( )
0

' 2 ' 2 0 0


' '

' '

2 '
0

) ' (
) ' min( = + =
c
+ c
=
c
c
= |
|
| | |
|
X X Y X
X X Y X Y Y e e
e e


de donde nuevamente obtenemos:

( ) Y X X X ' '

1
= |


III.- Estimador Mximo Verosmil

Una segunda aproximacin consiste en utilizar lo que se conoce como planteamiento
de estimacin mximo verosmil.

La idea del estimador mximo verosmil es sencilla de intuir. Un estimador MV de un
parmetro desconocido es aquel valor que maximizara la probabilidad de observar
una determinada muestra obtenida suponiendo una serie de hiptesis de partida.

As, por ejemplo:

1.- Si obtenemos una muestra de la altura de 150 personas y suponemos (esto es
importante) que la altura se distribuye conforme a una distribucin normal, la media
muestral es un estimador mximo verosmil del verdadero valor de la media
poblacional de la altura: si se extraen 150 datos de una poblacin normal, el valor ms
probable de la media muestral es el valor de la media poblacional.

2.- Cmo se determina (aproxima) el nmero de peces que pueblan un lago?.

Suponiendo que la distribucin de los peces es uniforme a lo largo del lago (y que los
peces no tienen memoria y por tanto pueden picar una y otra vez)

- Se pescan 100 peces del lago
- Se marcan y sueltan
- Se vuelven a pescar otros 100 peces inmediatamente
- Tomando entonces la frecuencia muestral de peces marcados en la segunda
pesca, el nmero de peces (ms verosmil) en el estanque es

|
.
|

\
|
=
100
100
dos PecesMarca
es PecesTotal
Pg.5/18


Para determinar un estimador MV debemos ser capaces de:

1. Determinar con claridad las hiptesis relativas a la distribucin terica del
parmetro en la poblacin
2. Expresar matemticamente la probabilidad de obtener una determinada
muestra, en funcin de las hiptesis asumidas, de modo que esa expresin sea
matemticamente maximizable en funcin del parmetro muestral de
inters.

En nuestro caso, este planteamiento propone utilizar como estimadores de los
parmetros aquel conjunto de parmetros poblacionales que hara ms probable
observar una muestra de errores como los que nos hemos propuesto: normales, con
media nula y varianza constante. Es decir, un conjunto de errores que van a
distribuirse conforme a una determinada funcin de densidad conjunta con una
determinada media y desviacin tpica.

Entre las hiptesis bsicas formuladas para el MBRL establecimos que nuestros errores
U seguiran una distribucin normal con media nula y varianza constante, es decir:

( )
2
,o o N u
i


o bien para todo el vector de perturbaciones aleatorias:

( ) I o N U
2
,o

As pues, la funcin de densidad de cada uno de los errores ser:

( )
|
|
.
|

\
|
=
2
2
2
2
1
exp
2
1 1
o
t
o
i
i
u
u f

Por lo que, tomando la funcin de densidad conjunta para cualquier normal
multivariante tenemos que
2
:


2
En realidad, la expresin genrica correcta para esta funcin es:

( ) ( )
|
|
|
|
.
|

\
|
E = = =

[
=

=
2
1
2
2 /
2 /
1
2
1
exp 2 ) (
o
t
n
i
i
n
n
n
i
i
u
u f u f L

donde es la matriz de varianzas y covarianzas de las variables aleatorias normales
multivariantes. No obstante, y a pesar de la prdida de precisin de la notacin, se mantiene la
referencia a
2
por sencillez expositiva y porque, evidentemente, no afecta al resultado final
que se pretende ilustrar.
Pg.6/18
( ) ( ) ( )
|
|
|
|
.
|

\
|
= = =

[
=

=
2
1
2
2 /
2 2 /
1
2
1
exp 2 ) (
o
o t
n
i
i
n
n
n
i
i
u
u f u f L

Se trata, por tanto, de obtener el conjunto de parmetros |

que hacen mxima la


funcin (probabilidad) de densidad conjunta:

( ) ( )
|
|
|
|
|
.
|

\
|
|
|
|
|
.
|

\
|
= =

[
=

=
2
1
2
2 /
2 2 /
1
2
1
exp 2 ) ( max ) max(
o
o t
n
i
i
n
n
n
i
i
u
u f L

Con el fin de computar la derivada parcial de esa expresin L con respecto a los
parmetros estimados, linealizamos la expresin obteniendo:


( ) U U
n n
L Ln '
2
1
ln
2
2 ln
2
) (
2
2
o
o t

=

o lo que es igual, considerando ahora errores muestrales y no las perturbaciones
aleatorias poblacionales:

( ) e e
n n
L Ln '
2
1
ln
2
2 ln
2
) (
2
2
o
o t

=
( ) ( ) ( ) | |
o
o t

'

2
1
ln
2
2 ln
2
) (
2
2
X y X y
n n
L Ln

=

Es evidente que maximizar esta probabilidad con respecto a |

implica minimizar el
ltimo de los sumandos, esto es:

| | ( ) ( ) | | | |

'

min ) ( max X y X y L Ln

Que como se ve, es lo mismo que plantear el estimador de Mnimos Cuadrados
Ordinarios revisado anteriormente. Es decir, el estimador Mximo Verosmil va a
coincidir para el Modelo Bsico de Regresin Lineal con el estimador de Mnimos
Cuadrados Ordinarios.

IV.- Interpretacin intuitiva de los estimadores MCO en la regresin mltiple

La interpretacin del significado de los estimadores MCO es mucho ms interesante
que los detalles tcnicos sobre su derivacin. Qu representa un parmetro estimado
j
|

?

Pg.7/18
Si imaginamos una ecuacin estimada con dos variables exgenas ms un trmino
independiente, el modelo estimado sera:

i i i
x x y
3 3 2 2 1

| | | + + =

Imaginemos una muestra temporal donde i representa el paso del tiempo. Si
expresamos ahora el modelo en diferencias, es decir, si al valor estimado de y en el
perodo i (
i
y ) le restamos el valor estimado de y en el perodo i-1 (
1

i
y ) tenemos
que:

( ) ( )
i i i
i i i i i i
x x y
x x x x y y
3 3 2 2
1 3 3 1 2 2 1 3 3 2 2 1 1



A + A = A
+ + + + =

| |
| | | | | |


Qu representa por tanto
2

| ?. Una forma simple de expresar


2

| es:

2
2
3

0 | =
A
A
= A
i
i
i
x
y
x

Es decir,
2

| permite computar el cambio obtenido en y producido por un cambio en


x2 mantenindose x3 constante. Es decir: los coeficientes de la regresin mltiple
son coeficientes ceteris paribus o, ms propiamente dicho, coeficientes de correlacin
parcial.

El punto clave, como seala Wooldridge
3
, es que la estimacin de estos coeficientes
parciales (o cteris paribus) se obtiene an cundo los datos no se hayan observado o
recogido en esas condiciones. Es decir, la regresin mltiple nos permite imitar () lo
que los cientficos hacen en los entornos (experimentales) controlados de laboratorio:
conservar fijos otros factores.

Imaginemos, por ejemplo, el resultado obtenido en la estimacin de una regresin
que relaciona las ventas mensuales de nuestra empresa con los cambios en los precios
y en la publicidad:

i i i
Pub V 3 , 1 Pr 5 , 0 2

+ =

Si las ventas y la publicidad estn medidas en millones de euros y los precios en euros
por unidad:

- El parmetro -0.5 de los precios indicara que por cada incremento de un euro
en el precio unitario, nuestras ventas se reduciran en medio milln de euros
siempre y cuando se mantuviese constante el presupuesto en publicidad.

3
Introduccin a la econometra. Un enfoque moderno. Ed. Thomson.
Pg.8/18
- El coeficiente de 1.3, positivo, indica que, si no variamos el precio de venta, un
incremento de 1 milln de euros en publicidad genera un incremento de ventas
de 1.3 millones.

Evidentemente, la empresa nunca movi slo los precios o slo la publicidad, sino que
todos los aos hizo, probablemente, ambas cosas: sin embargo, la regresin mltiple
permite aislar ambos efectos.

Una observacin de inters es: qu sucede si slo utilizamos una de las dos variables
en la regresin?. En ese caso, puede observarse que los resultados de las dos
regresiones individuales son:

i i
V Pr 38 , 0 9 , 1

=
i i
Pub V 9 , 3 6 , 1

=

Los resultados de la regresin sobre el precio son similares a los obtenidos en la
regresin mltiple pero qu ha sucedido con los resultados de la regresin sobre la
publicidad?. Utilizando los mismos datos, el signo de la Publicidad en su relacin con
las ventas es ahora negativo cmo podemos explicar esto?. Observemos la evolucin
de las ventas, los precios y la publicidad en los aos utilizados para la estimacin.


-2
-1
0
1
2
3
4
5
6
7
8
9
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
ventas
precio
publicidad



Cuando tomamos slo los datos de la publicidad y las ventas, observamos que,
efectivamente, a lo largo de los ltimos 15 aos la publicidad se ha incrementado
notablemente pero, sin embargo, las ventas han disminuido; sin embargo, durante
este mismo perodo, los precios han crecido tambin de forma muy significativa, de
modo que el efecto tericamente positivo de la publicidad se ha visto anulado por un
incremento descontrolado de los precios. Si slo observamos la relacin entre ventas
y publicidad, subestimamos clamorosamente el efecto de la publicidad; del mismo
modo, si slo observamos la relacin entre ventas y precios, subestimamos tambin el
efecto negativo de un alza en los precios (la realidad es que, si no hubisemos elevado
la publicidad a lo largo de estos 15 aos, la cada de las ventas ante tal incremento de
los precios hubiera sido algo mayor).
Pg.9/18

La anterior exposicin nos obliga a plantearnos algunas preguntas:

- Si slo estamos interesados en el efecto de una variable explicativa en su
relacin con la endgena (y) Es necesario incluir en la regresin mltiple
otras variables que son potencialmente relevantes para observar
adecuadamente ese nico parmetro de inters?

As es, el ejemplo anterior demuestra que, aunque nuestro inters se centre en
una variable exgena, debemos recoger informacin de las dems variables
que han podido variar durante el perodo muestral, de otro modo, no
podemos aislar, distinguir del resto, los efectos de la variable que nos
interesa. Este es, sin duda, el precio a pagar en la regresin a cambio de evitar
diseos experimentales ceteris paribus.

Tcnicamente esto resultaba previsible si recordamos las condiciones ideales
supuestas en el Modelo Bsico de Regresin Lineal para derivar la insesgadez
del estimador MCO. Esas dos condiciones era, la nulidad en media de la
perturbacin aleatoria U y la ausencia de relacin entre los regresores X y
las perturbaciones aleatorias U.

De hecho, partiendo de esta segunda condicin (formulada a partir de la
covarianza), tenemos:


Cov(u, x) = 0 Cov(y o |x, x) = 0
Cov(y, x) cova(o, x) |cova(x, x) = 0
Cov(y, x) |V(x) = 0 | =
Cov(x, y)
V(x)


Es decir, el parmetro | de una regresin simple puede obtenerse a partir de
la covarianza (x,y) slo s asumimos 0 ) , ( = x u Cov . En caso de que la
0 ) , ( = x u Cov ocurre que el parmetro | ya no puede aproximarse slo por la
covarianza (x,y) dado que en realidad es:

) ( ) (
) , (
) ( ) , (
) , ( ) , (
x V x V
y x Cov
x V x y Cov
x x y Cov x u Cov
p

| |
| o
+ = =
= =



- Existe alguna excepcin a lo anterior? Es decir, es posible obtener
resultados correctos (no subestimados ni sobreestimados) en las regresiones
individuales?

Si. El problema reside, en realidad, en la existencia de correlacin entre las
variables explicativas utilizadas en el ejemplo. Por qu?. El problema de una
Pg.10/18
muestra en la que existe correlacin alta entre las explicativas (positiva o
negativa) es que la muestra no permite aislar el efecto de cada una sobre la
endgena, porque, imaginando que la correlacin fuera positiva, cada vez que
una creci (respecto a su media), la otra tambin lo hizo. Digamos que la
muestra es lo contrario al tipo ceteris paribus que necesitaramos para
observar el efecto individual de las exgenas. Ahora bien, si en nuestra muestra
podemos encontrar crecimientos de una exgena que se hayan combinado con
incrementos y disminuciones de la otra de modo que entre ambas no exista
una correlacin sistemtica, la muestra es ideal para observar los efectos de
forma individual (sin recurrir a la regresin mltiple) porque los efectos de
subestimacin y sobreestimacin en esas estimaciones individuales aparecern
compensados, resultando nulos o poco significativos.

En trminos tcnicos, lo que sucede cuando no existe relacin ntrela variable
incluida y la omitida, es que no existe tampoco relacin entre esa variable
incluida y la perturbacin aleatoria (u) que aglutina las variables omitidas, de
modo que vuelve a verificarse 0 ) , ( = x u Cov
p


- Si la regresin mltiple permite separar sin sesgos los efectos de las
distintas variables an cuando las muestras no sean ceteris paribus. Por
qu es importante que no exista correlacin muestral entre las exgenas?
Por qu se formula la hiptesis de ausencia de multicolinealidad?

Efectivamente, la regresin mltiple permite separar los efectos de cada
exgena sin cometer sesgos de sobre o subestimacin an cuando las muestras
sean desfavorables en ese sentido (es decir, an cuando las exgenas estn
muy relacionadas). Sin embargo, la existencia de multicolinealidad implica un
precio a pagar inevitable: una menor precisin en la estimacin de los
parmetros (una mayor varianza en la estimacin). Esto puede entenderse
intuitivamente: si las variaciones de una variable X2 se ven sistemticamente
acompaadas de la variacin de otra variable X3 resulta difcil separar con
precisin qu parte de los efectos sobre Y se deben a los movimientos de X2 y
que parte a los de X3.

Adems de la explicacin intuitiva veremos en el tema de la Multicolinealidad
como tcnicamente, la varianza de un parmetro depende de tres factores y
uno de ellos es, precisamente, el grado de correlacin que existe entre cada
variable exgena y el resto: a mayor relacin, menor precisin en la estimacin.

V.- Interpretacin intuitiva de la expresin de los estimadores MCO

Visto todo lo anterior, una pregunta razonable es: cmo se las ingenia el mtodo de
estimacin MCO para separar los efectos parciales de dos o ms explicativas?.

Imaginemos el caso de dos explicativas (ms un trmino independiente):

i i i
x x y
3 3 2 2 1

| | | + + =

Pg.11/18

El parmetro para la variable
2

| deber medir los cambios en Y ante variaciones en X2


mantenindose X3 constante. Si slo conocisemos la regresin simple (no mltiple)
cmo podramos estimar este parmetro?

Un punto de partida razonable ser estimar cul es el grado de relacin entre X2 y X3
dado que al fin y al cabo, slo si existe un alto grado de relacin tenemos necesidad de
estimaciones parciales. Una forma de calcular el grado de relacin es, precisamente,
realizar un anlisis de regresin entre X2 y X3:

i i i
w x x + =
3 1 2
o

El residuo de esta regresin (w) contendra, precisamente, aquella parte de X2 que no
puede explicarse observando X3;

( )
i i i i i
x x x x w
3 1 2 2 2
o = =

de hecho, si X2 y X3 no tuviesen ningn tipo de correlacin, el coeficiente estimado
para 1 sera nulo y el residuo de la regresin contendra an toda la informacin de
X2.

Por tanto, si
i
w contiene toda la informacin de X2 que no covara con X3 tenemos
ahora en
i
w una muestra depurada (cteris paribus) de X2. Si hacemos entonces
ahora la regresin original sobre Yi usando slo como explicativa esa nueva versin
(
i
w ) de X2, tendremos entonces el coeficiente de correlacin parcial entre Y y X2.

i i i
u w y + =
2
|

Este es, efectivamente, el mecanismo tcnico que se esconde en la expresin
matricial del estimador de MCO:

( ) Y X X X ' '

1
= |

La matriz ( )
1
'

X X permite tener en cuenta no slo la cuanta de la varianza de cada
una de las variables explicativas X (en la diagonal principal) sino la intensidad de la
relacin entre cada par de explicativas X (fuera de la diagonal principal). De ese
modo, cada uno de los coeficientes
j
|

estimados, no se calculan slo como en el


caso de la regresin univariante:

i i i
u x y + + = | o

donde:
( )
( ) x Var
x y Cov ,
= |
Pg.12/18

Sino que en el clculo se implica tambin la covarianza entre las propias variables
explicativas.

VI.- Interpretacin de los parmetros cuando en el modelo intervienen variables en
logaritmos

En muchas ocasiones, las variables implicadas en el modelo (exgenas, endgena o
ambas) vienen expresadas en logaritmos, lo que puede ser debido, entre otras, a las
siguientes causas:

a) Algunas veces, el modelo terico original es una forma no lineal, que se
convierte fcilmente en lineal escribiendo la expresin en logaritmos. Es el
clsico ejemplo de una funcin de produccin, en la que la expresin lgica
(debido a la ley de rendimientos decrecientes) es una funcin potencial:

) ( ) ( ) ( ) ln( * *
2 1
2 1
i i i i i i i i
u Ln K Ln L Ln P u K L P + + = = | |
| |


Otro ejemplo habitual de este caso sera el de los llamados modelos de
gravitacin basados en la expresin de Newton de la Gravedad: la fuerza que
atrae dos cuerpos es directamente proporcional a la diferencia de sus masas e
inversamente proporcional a la distancia al cuadrado que los separa.

Esta expresin se traslada en economa para representar, por ejemplo, flujos
comerciales entre dos puntos geogrficos, midiendo la masa de los cuerpos
como la renta de cada uno de los lugares y la distancia entre ellos, bien en
trminos fsicos (km) o en funcin de otras variables que representen distancia
econmica (impedimentos a los flujos, como por ejemplo lo sera la presencia
de aranceles, o la existencia o no de un buen modo de transporte). En este
modelo, tendramos:

) ( ) ln(Re ) ln(Re ) ln(
Re Re
2
3 2 1 2 i ij j i ij i
ij
j i
ij
W d Ln nta nta Flujo U
d
nta nta
Flujo + + + =

= | | |

b) En otras ocasiones, la fuerte volatilidad de alguna de las variables (explicativas
o explicada) hace recomendable escribir sta en logaritmos para observar
mejor su relacin en el modelo (como es bien sabido, la transformacin
logartmica alisa el comportamiento de una variable, reduciendo su varianza).
Valga como ejemplo un modelo de previsin de ventas en un negocio en el que
se utilizara como variable explicativa la evolucin del IBEX-35, entendiendo que
este podra marcar las expectativas en los prximos meses. La ecuacin podra
escribirse del siguiente modo:

t t t
u IBEX Ln Ventas + + =

) 35 (
1 2 1
| |

Pg.13/18
La forma en la que se introducen las variables en el modelo modifica el modo en el que
se interpretan sus parmetros asociados debido al cambio de unidades que se est
produciendo.

Matemticamente, la diferencia de logaritmos es muy similar, para cambios pequeos,
a la tasa de crecimiento entre dos momentos determinados.

Cuando ambas variables (endgena y exgena) estn escritas en logaritmos, la
interpretacin es la clsica en teora econmica: los parmetros representan la
elasticidad entre ambas variables o, dicho de otro modo, el cambio porcentual en y
cuando se produce un aumento del 1% en la variable x
4
.

) log( * log(y) *
*
2 2
2 2 /
x
x
x
y
y
x
x
y
y
x
x
y
y
d Elasticida
x y
| |
| |
= ~
A
=
A
A
=
A

A
A
= =


En los casos en los que slo una de las partes ha sido transformada con logaritmos, la
interpretacin como cambio porcentual en sta es similar. A modo de resumen, en la
siguiente tabla se expresa cmo se hara la interpretacin:


Especificacin Expresin
Interpretacin
2
|


Nivel-Nivel
i i i
u x y + + =
2 2 1
| |
Incremento en y cuando
aumenta 1 unidad X (ambas en
sus unidades de medida
originales)
Log-nivel
i i i
u x y + + =
2 2 1
) log( | |
100 *
2
|

, incremento
porcentual de y cuando
aumenta una unidad X

Nivel-log
i i i
u x y + + = ) log(
2 2 1
| |
100 /
2
|

Incremento en
unidades de y cuando
aumenta un 1% X

Log-Log
i i i
u x y + + = ) log( ) log(
2 2 1
| |
Incremento porcentual de y
cuando aumenta un 1% X


VII.- Interpretabilidad del trmino constante

En un modelo economtrico es siempre recomendable incluir un trmino constante
tanto para lograr un mejor ajuste en la curva de regresin estimada como para
obtener una mejor interpretabilidad de indicadores de ajuste como, por ejemplo, la R
cuadrado.

4
Ver Wooldrigge, 2009: Introduccin a la Econometra: un enfoque moderno. Ed. Paraninfo Pg. 765-
770 con mayor detalle sobre el efecto de las transformaciones logartmicas.
Pg.14/18

Matemticamente, la inclusin del trmino constante nos permite que el origen de la
curva de ajuste no parta necesariamente del punto (0,0) en los ejes de coordenadas, lo
que casi siempre dar lugar a un mejor ajuste.



En el grfico se puede observar una serie (roja) a estimar. La estimacin de la lnea
negra continua es una regresin de una recta con constante y la discontinua azul es
una estimacin sin constante (obligada a partir del punto 0,0). El ajuste de la segunda
es claramente peor que el de la primera, ya que la serie de inters (la roja) claramente
no parte de este punto (0,0).

En defintiva, la inclusin de la constante en muchas ocasiones slo es un artificio
matemtico para lograr un mejor ajuste, sin que sea posible darle una interpretacin
econmica.

Slo en el caso en el que todas las variables explicativas pudieran tomar el valor cero (y
en la muestra elegida para realizar la estimacin de hecho tomaran este valor al mismo
tiempo en alguna ocasin) tendra sentido interpretar el parmetro que acompaa a la
constante como el valor de la endgena cuando no toman valor el resto de las
exgenas.

Por ejemplo, en el clsico modelo de consumo terico de Keynes, este autor denomina
al trmino constante consumo autnomo o de subsistencia o aquel que se producira
cuando la renta del individuo y los precios son cero; entendiendo que, en teora, esta
circunstancia podra darse. En la prctica, cuando se estima este modelo, en la muestra
de datos utilizada no figurar ningn caso en el que los precios (y seguramente
tampoco la renta) valgan cero, por lo que el resultado del trmino constante no ser
interpretable (pudiendo tener, por ejemplo, un signo negativo, lo que en principio
sera incompatible con la lgica si es que fuera interpretable).

VIII.- Interpretacin de los parmetros cuando en el modelo slo intervienen
variables dicotmicas e interacciones

En ciencias de la salud, donde se puede controlar de forma cuasi-exacta el valor de
variables relevantes no incluidas en el modelo modificando la muestra a utilizar, es
frecuente utilizar algunos modelos en los que slo intervienen variables dicotmicas.
Pg.15/18
En estos, todos los parmetros tienen una interpretacin muy concreta (incluido el de
la constante)
5
. En ADE y Economa son menos frecuentes, pero, para muestras muy
concretas en las que se agrupan observaciones con iguales caractersticas para el resto
de las caractersticas relevantes, se podra plantear, por ejemplo, un modelo del
siguiente tipo:

i i i i
u jornada sexo salario + + + =
3 2 1
| | |

Donde sexo es una variable dicotmica con valor cero para los hombres y uno para las
mujeres y, jornada, es tambin una variable con dos valores: cero para jornada a
tiempo parcial y uno para jornada a tiempo completo. Supongamos que los datos para
los que se realiza el modelo corresponden todos a la misma empresa, slo para
trabajadores con contrato indefinido, con edades y antigedad similares y todos
licenciados
6
.

En este modelo, todas las variables pueden tomar valor cero y todos los parmetros
tienen un significado exacto y fcilmente interpretable:

Sexo \ Tipo jornada Tiempo parcial Tiempo completo
Hombre
1
| =
i
salario

3 1
| | + =
i
salario

Mujer
2 1
| | + =
i
salario

3 2 1
| | | + + =
i
salario


En definitiva, el salario del hombre con contrato a tiempo parcial se puede asociar
directamente con el valor del parmetro constante y, adems, se convierte en el valor
de referencia sobre el que se puede comparar con el resto de los casos. Beta 2 es la
diferencia en el salario entre la mujer con contrato parcial y el hombre con contrato
del mismo tipo, etc.

Tal y como se ha planteado este modelo, se est suponiendo que las diferencias entre
hombres a tiempo parcial y completo son las mismas que entre las mujeres a tiempo
parcial y completo. En este tipo de modelos, para contrastar si estas diferencias no son
las mismas, se suele incluir una variable explicativa ms que recibe el nombre de
interaccin y que se especificara del siguiente modo:

i i i i i i
u jornada sexo jornada sexo salario + + + + =
4 3 2 1
| | | |


El parmetro beta cuatro, en caso de resultar significativamente distinto de cero
cuando se realice la estimacin, nos permitira contrastar la diferencia adicional en el
salario en el caso de una mujer a tiempo completo. Ahora, la tabla para la
interpretacin de los parmetros quedara del siguiente modo:


5
Recurdese lo visto respecto a la interpretacin de los parmetros cuando se omiten variables
relevantes en el modelo en el punto I de este documento.
6
Al tomar esta muestra tan concreta, todas esas variables lgicamente relevantes para determinar el
salario seran iguales para todos los sujetos; luego no debern incluirse en el modelo porque no
varan, no marcan diferencias entre las observaciones (empleados).
Pg.16/18

Sexo \ Tipo jornada Tiempo parcial Tiempo completo
Hombre
1
| =
i
salario

3 1
| | + =
i
salario

Mujer
2 1
| | + =
i
salario

4 3 2 1
| | | | + + + =
i
salario


Es frecuente que en modelos economtricos de ciencias sociales aparezcan variables
dicotmicas mezcladas con variables continuas. En este caso, no podremos interpretar
el valor del trmino constante en la mayora de los casos, pero los parmetros de las
variables dicotmicas (valiendo stas 0 y 1) s sern interpretables cmo en cuntas
unidades se incrementa la endgena cuando se da el caso en el que toman valor 1.
Pg.17/18
Apndice tcnico: la matriz de Informacin

Partiendo de las ecuaciones normales del modelo (i=1n)

i ki k i i i
u x x x y + + + + + = | | | | ...
3 3 2 2 1


Si sumamos las n expresiones de este tipo, obtendramos una expresin del modelo
matemticamente equivalente que sera:


+ + + + + =
i ki k i i i
u x x x y | | | | ...
3 3 2 2 1


Sabiendo que la suma de las Ues es cero (por hiptesis bsica se sabe que la media de
U es cero) y dividiendo ambos lados de la igualdad por n, obtendramos:

k k
x x x y | | | | + + + + = ...
3 3 2 2 1


Y, restando a la primera ecuacin esta ltima (llamada el modelo para la media):

i k ki k i i i
u x x x x x x y y + + + + + = ) ( ... ) ( ) ( ) (
3 3 3 2 2 2 1
| | | |


En definitiva, llegamos a una expresin equivalente del modelo en la que, en vez de
utilizar las variables originales, se utilizan las variables en desviaciones a la media, sin
que el valor de los parmetros cambie.

Matemticamente, es fcil que comprobar que, dichas variables en desviaciones a la
media, tienen media cero y, la varianza, es la misma que las de las originales, pues slo
se ha realizado un cambio de origen de dichas variables.

Volviendo ahora a la expresin matricial de clculo de los parmetros estimados para
este modelo en desviaciones a la media, interviene la matriz XX, tambin llamada
matriz de informacin. Sabiendo que, en su forma matricial, el modelo asigna a la
matriz X las k variables explicativas en columnas para cada una de las n
observaciones en filas, el resultado del producto XX sera:

Pg.18/18
(
(
(
(
(
(

=
(
(
(
(
(

(
(
(
(
(

=




2
2 3 3
2
2 2
2
2
23
2 22
1 21
2 1
3 32 31
2 21 21
...
...
...
...
...
...
... ...
... ...
...
'
... 1
.
..
..
...
.. .
1
... 1
... 1
...
... ...
...
... ...
...
1 ... 1 1
'
ki ki
i i i
i i
ki i
kn n
k
k
kn n k
n
n
x x
x x x
x x
x x n
X X
x x
x
x x
x x
x x x
x x x
x x x
X X


Observando la expresin de XX, es fcil deducir que, simplemente dividiendo todos los
valores por el nmero de datos n, tendramos:

- En la diagonal principal, las varianzas de cada una de las variables implicadas en
el modelo (recurdese que, al estar en desviaciones a la media, su media es
cero, luego su suma al cuadrado es directamente la varianza).
- En la primera fila y en la primera columna, estaran las medias de cada variable.
- En el resto de celdas de la matriz, estaran las covarianzas entre cada par de
variables del modelo (nuevamente recurdese que las medias son cero).

En conclusin, cuando se emplea la frmula de estimacin de los parmetros MCO:

| | Y X X X ' '

= |


Es fcil observar que, para cada parmetro, se est dividiendo la covarianza entre
dicha variable explicativa y la endgena entre su varianza y las covarianzas con el resto
de las variables Xs que intervienen en el modelo, eliminando o controlando as su
efecto.

S-ar putea să vă placă și