Sunteți pe pagina 1din 63

NOTAS DE CLASE

INTRODUCCIN
A LA ECONOMETRA
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

FACULTAD DE ECONOMIA

PROGRAMA DE ECONOMETRIA

Profesor: PhD.Eco.Jorge Edwing Del Carpio Gonzales1


Correo Electrnico: JDICAPRIOG@hotmail.com

Correo Electrnico: JDICAPRIOG@Yahoo.com

1. INTRODUCCIN

El curso de Econometra hace parte del rea de mtodos cuantitativos en


economa y se constituye en una herramienta importante en la investigacin
econmica, diseo y anlisis de poltica. El contenido y el desarrollo del curso son
a nivel introductorio y su inters es la aplicacin de los conceptos tericos.

2. OBJETIVOS

- Proporcionar al estudiante las bases iniciales para el manejo de los mtodos y


modelos economtricos.

- Familiarizar al estudiante sobre la aplicacin de modelos que permitan


entender el comportamiento de los agentes econmicos, y en la estimacin de
parmetros para el anlisis y evaluacin de medidas de poltica.

- Suministrar los elementos necesarios para el manejo de la informacin, anlisis


de resultados e interpretacin de salidas del computador que hagan ms
eficiente la labor de investigacin.

1
Ph.D. en Economa mencion en Analisis Econometrico para el Crecimiento y Desarrollo Economico
.

2
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

3. METODOLOGA

El curso se desarrollar mediante sesiones de clases en las que se expondrn los


conceptos tericos, con ejemplos ilustrativos y la realizacin de ejercicios. Se
desarrollarn talleres con la aplicacin del paquete economtrico EVIEWS, con el
propsito de ilustrar la utilidad de los conceptos tericos y ganar destreza en el
manejo del instrumental analtico.

4. CONTENIDO

CAPITULO 1. INTRODUCCIN

1.1 Mtodos cuantitativos de la economa.


1.2 Definiciones de la econometra.
1.3 Objetivos de la econometra.
1.4 Divisiones de la econometra.
1.5 Modelo.
1.6 Modelo econmico.
1.7 Modelo economtrico.
1.8 Componentes del modelo.
1.9 Clasificacin de las variables.
1.10 Clasificacin de las ecuaciones.
1.11 Clasificacin de los modelos.

CAPITULO 2. ORGANIZACIN DE DATOS Y ESTADISTICA DESCRIPTIVA

2.1 Objetivos de la estadstica


2.2 Divisiones de la estadstica
2.3 Tipos de variables
2.4 Poblacin y muestra
2.5 Parmetros poblacionales y estadsticos muestrales
2.6 Medidas de tendencia central
2.7 Medidas de dispersin
2.8 Mtodos y diagnsticos grficos
2.9 Ejercicios e interpretacin salidas de computador

CAPITULO 3. ANALISIS DE CORRELACION

3.1 Diagrama de Dispersin


3.2 Coeficiente de Correlacin Lineal Simple (r)

3
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

3.3 Prueba de hiptesis


3.4 Interpretacin salidas de computador EVIEWS

CAPITULO 4. REGRESION SIMPLE LINEAL Y NO LINEAL

4.1 Objetivo del anlisis de regresin


4.2 Funcin de regresin muestral y poblacional
4.3 Supuestos del modelo de regresin
4.4 Mtodo de estimacin de mnimos cuadrados ordinarios
4.5 Varianzas y errores estndar de los estimadores
4.6 Intervalos de confianza
4.7 Pruebas de hiptesis
4.8 Prediccin
4.9 Modelos de regresin simple no lineal
4.10 Interpretacin salidas de computador

CAPITULO 5. REGRESION MULTIPLE LINEAL Y NO LINEAL

5.1 Expresin del modelo en forma matricial


5.2 Supuestos del modelo
5.3 Mtodo de estimacin de mnimos cuadrados ordinarios
5.4 Matriz de varianzas y covarianzas de los estimadores
5.5 Pruebas de hiptesis
5.6 Coeficiente de determinacin ajustado
5.7 Intervalos de confianza.
5.8 Modelos de regresin mltiple no lineal
5.9 Interpretacin salidas del computador.

CAPITULO 6. INCUMPLIMIENTO SUPUESTOS DEL MODELO

6.1 Multicolinealidad
6.2 Heteroscedasticidad
6.3 Autocorrelacin
6.4 Interpretacin salidas del computador.

CAPITULO 7. ANLISIS TRANSVERSAL

7.1. Regresin con variables independientes cualitativas


7.2. Regresin con variable dependiente cualitativa

4
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

5. BIBLIOGRAFA

TEXTO GUIA:

Gujarati, Damodar. 1997. Econometra. Mc Graw Hill.


Greene Analisis Econometrico
Pindyck Rubinfeld Econometria , Modelos y Pronosticos

TEXTOS ADICIONALES

Mason y Lind. 2001. Estadstica para Administracin y Economa. Editorial


Alfaomega.

Novales, Alfonso . 1997. Econometra, McGraw Hill, Bogot.

Manual de EVIEWS.

Pulido A Modelos Econometricos


Kennedy Introduccion a la Econometria
Maddala GS Introduccion a la Econometria

5
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

CAPITULO 1. INTRODUCCION

1.1. Mtodos Cuantitativos de la Economa.

Los mtodos cuantitativos de la economa comprenden tres reas: a) Anlisis


Matemtico y Algebra Lineal; b)Programacin Lineal y Anlisis de Insumo-Producto y
c) Econometra.

La investigacin economtrica se inici con el anlisis estadstico de la Demanda por


Cournout (1838) y Marshall (1890). Posteriormente Tinbergen en 1939 hizo su
aporte a la econometra mediante el estudio del anlisis de los ciclos econmicos.
Sin embargo, es en el periodo de 1943-1950 cuando la econometra comienza su
desarrollo con los trabajos de la Comisin Cowles. La hiptesis bsica es la de que
"los datos econmicos se generan por sistemas de relaciones que son, en general
estocsticos, dinmicos y simultneos".

La econometra hoy en da es una herramienta muy importante para el economista


en el anlisis y comportamiento de los fenmenos econmicos. Su desarrollo ha
sido acelerado debido a la dinmica que han mostrado los adelantos en anlisis
matemtico, en mtodos estadsticos y en mtodos de computacin.

1.2. Definiciones de Econometra

Dado que en la econometra se asocian la Teora Econmica, las Matemticas y la


Estadstica, se tiene entonces que diferentes autores dan definiciones en las cuales
se trata de relacionar estas tres reas del conocimiento.

G. Tintner: la econometra consiste en la aplicacin de la teora econmica


matemtica y de los mtodos estadsticos a los datos econmicos para establecer
resultados numricos en el campo de la economa y verificar los teoremas
econmicos.

W.C. Hood y T.C. Koopmans: la econometra es una rama de la economa en que la


teora econmica y los mtodos estadsticos se fusionan en el anlisis de los datos
numricos e institucionales.

6
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

T. Havellmo: el mtodo de la investigacin economtrica intenta, esencialmente, unir


la teora econmica y las mediciones reales, empleando la teora y la tcnica de la
inferencia estadstica como un puente.

Estas tres definiciones nos indican que la econometra es cuantitativa y que est en
estrecho contacto con la realidad.

R. Frisch: la econometra a pesar de nutrirse de la Teora Econmica, de las


Matemticas y de la Teora Estadstica, no es ni "Estadstica Econmica", ni "Teora
Econmica", ni "Economa Matemtica".

Oskar Lange, en la prctica le da al trmino Econometra un significado distinto. En


su libro Introduccin a la Econometra incluye los anlisis de Insumo-Producto y
Programacin Lineal, a un nivel en el que no se hace uso de trminos estocsticos.
Por otra parte, Lange coincide con las definiciones dadas anteriormente.

O. Lange: la econometra es la ciencia que trata de la determinacin, por mtodos


estadsticos, de leyes cuantitativas concretas que rigen la vida econmica. La
Econometra combina la Teora Econmica con la Estadstica Econmica y trata, por
mtodos matemticos y estadsticos, de dar una expresin cuantitativa y concreta a
las leyes esquemticas generales establecidas por la teora econmica.

1.3. Objetivo de la Econometra

El objetivo de la econometra es el de expresar las teoras econmicas en trminos


matemticos para verificarlas por mtodos estadsticos y para medir el impacto de
una variable sobre otra, as como para poder predecir los sucesos futuros o
aconsejar la poltica econmica que debe seguirse cuando se desea un resultado
determinado.

1.4. Divisiones de la Econometra

Las principales divisiones de la econometra son las siguientes:


1. Especificacin (uso de la Teora Econmica)
2. Estimacin (uso de Mtodos Estadsticos)
3. Verificacin (Interpretacin Econmica y Pruebas Estadsticas)
4. Prediccin (Aplicacin: Nuevos resultados tericos, implicaciones de poltica,
predicciones).

A.G. Barbancho le da a la econometra un objetivo de poltica econmica, al


establecer que en la econometra se distinguen cuatro fases:

7
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

1. Toma de la Teora Econmica aquellas "teoras" leyes o hiptesis particulares que


se desean investigar.
2. Utiliza, como instrumentos auxiliares, las matemticas y la estadstica para su
especificacin en forma de modelos matemticos, su estimacin y su verificacin.
3. Vuelve de nuevo a la Teora Econmica para utilizar adecuadamente la expresin
cuantificada de la teora o modelo particular.
4. Se convierte en un instrumento de poltica econmica.

En resumen, se puede decir que las teoras econmicas se desarrollan para definir
las relaciones que se establecen entre variables econmicas. El objetivo de estas
teoras es el de entender la organizacin que existe entre los diversos agentes
econmicos. En base a este entendimiento es posible disear mejores polticas
econmicas que afectan tanto a la actividad econmica, como al bienestar
econmico de la sociedad. Para ello es necesario verificar estas teoras para que
as ellas sean tiles en lograr sus objetivos.

1.5. Modelo

Se puede decir que modelo es una representacin simplificada de la realidad. Los


investigadores y los profesionales de diferentes reas trabajan con modelos
simplificados que representan un fenmeno de inters y que permite estudiar su
comportamiento.

A. Rosenblueth, con respecto a los modelos cientficos, dice que "la construccin de
modelos de los fenmenos naturales es una de las tareas esenciales de la labor
cientfica. Mas an, se puede decir que toda la ciencia no es sino la elaboracin de
un modelo de la naturaleza. La intencin de la ciencia y el resultado de la
investigacin cientfica, son el obtener conocimientos y el control de alguna parte del
Universo".

1.6. Modelo Econmico

Se puede designar como modelo econmico a cualquier conjunto de supuestos que


describen una economa o parte de una economa. En este sentido la teora
econmica es la formulacin y anlisis de modelos. Dado que un modelo no es sino
una representacin simplificada de la realidad, entonces se deben precisar las
interrelaciones que se establecen entre las diferentes variables que intervienen en el
fenmeno a analizar.

Las caractersticas mnimas que debe satisfacer un modelo econmico son las
siguientes:
1. Que represente un fenmeno econmico real.
2. Que la representacin sea simplificada y

8
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

3. Que se haga en forma matemtica.

Al definir un modelo econmico como un conjunto de relaciones matemticas


(usualmente ecuaciones) que expresan una teora econmica, no se exige
necesariamente la especificacin concreta del tipo de funcin que relaciona las
variables involucradas.

Una especificacin de un modelo econmico podra ser:

Y = f (X1, X2, ......, Xk) (1)

donde Y = cantidad producida; Xi = cantidad del i-esimo insumo.

Como puede verse esta ecuacin (funcin de produccin) no es muy especifica, pero
la relacin si expresa que existe una relacin entre el producto y los insumos, y que
las cantidades utilizadas de insumos determinan la cantidad producida, y no a la
inversa.

Para ser ms especifico se necesita determinar que tipo de relacin es la que existe
entre las variables econmicas, como por ejemplo una relacin lineal:

Y = Bo + B1 X1 + B2 X2 + .....+ Bk Xk (2)

Ntese que est relacin puede ser correcta, aunque puede tambin estar en error
en cuanto a especificacin, ya que no sabemos si el insumo X2 es determinante en
esta forma del producto Y. Tambin se debe resaltar que este modelo pone nfasis
en un nmero relativamente pequeo de variables importantes cuya interrelacin se
puede expresar ms adecuadamente en un modelo matemtico que en una
explicacin escrita.

2.1. Modelo Economtrico

Se puede decir que un modelo economtrico es un modelo econmico que contiene


las especificaciones necesarias para su validacin emprica.

Es usual pensar en el modelo economtrico como un modelo conformado por una


parte matemtica y una parte aleatoria o trmino de error. El modelo economtrico
para el modelo expuesto en la ecuacin (2) seria entonces:

Y = Bo + B1 X1 + B2 X2 + .....+ Bk Xk + E (3)

en donde Bo + B1 X1 + B2 X2 + ...+ Bk Xk es la parte matemtica y E es el termino


de error o variable aleatoria.

9
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

Los modelos economtricos por considerar una parte de error o trmino aleatorio en
su conformacin, hacen parte de los modelos probabilisticos.

Una diferencia fundamental entre los modelos econmicos y los modelos


economtricos, es la de que los modelos econmicos son modelos tericos validos
siempre, dado que han sido establecidos por la teora econmica, es decir solo
persiguen la expresin de una determinada teora. Por otro lado, los modelos
economtricos, reflejan el estado de las cosas o de una situacin y aunque tiene sus
bases econmicas puede cambiar con el estudio que se este haciendo.

Los modelos economtricos se prueban a travs del uso sistemtico de la


informacin estadstica. Un modelo economtrico permite la inferencia estadstica a
partir de los datos que se estudien, por lo cual el modelo economtrico debe
especificar los elementos aleatorios que se suponen intervienen en la determinacin
de las observaciones, de modo que estas ltimas pueden considerarse como una
muestra.

A diferencia de los modelos determinsticos, en los que el margen de error en


determinar el valor de la variable dependiente dado cambios en las independientes
es casi nulo, en los modelos economtricos es muy difcil de que se de.

Existen diferentes razones por las cuales los modelos economtricos deben de
considerar el termino de error, destacndose como las ms importantes las
siguientes:

a) datos: la economa hace parte de las ciencias sociales, el grado de control que se
puede tener sobre las variables es difcil. A pesar de que se busca obtener los
verdaderos valores de las variables, se debe aceptar que hay cierto error en la
medicin.

Un ejemplo tpico es cuando se introduce la variable ingreso en un estudio y al


preguntar por su valor, las personas por diferentes motivos tienden a dar un dato
diferente al que realmente es. Otra situacin es cuando se le pregunta al agricultor
la cantidad de fertilizante que aplic por hectrea al cultivo en la cosecha pasada y el
trata de dar un dato aproximado porque no se acuerda o sencillamente por que la
cantidad que el aplica no es exacta, sino al tanteo.

b) nmero de variables: el investigador no puede colocar todas las variables que


estn explicando un fenmeno; por lo tanto trata de incluir aquellas variables ms
relevantes, dejando por fuera del modelo aquellas que explican muy poco. Sin
embargo el investigador es consciente de que al no poder incluir todas las variables
en el modelo esta incurriendo en cierto margen de error.

10
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

c) Disponibilidad de la informacin: muchas veces a pesar de que el investigador


quiere incluir una variable en el modelo por que la considera importante, se
encuentra con el problema de cmo cuantificarla. Un ejemplo de sta situacin es la
variable clima, la cual se sabe afecta el comportamiento de la oferta; sin embargo,
generalmente el investigador tiene que conformarse con incluir una variable o una
informacin que se asemeje, pero que no la refleja exactamente.

d) forma funcional: el investigador puede postular que la relacin entre las variables
es de tipo lineal; sin embargo, para otro investigador la forma funcional puede ser
cuadratica. Esta es otra fuente de error en la formulacin del modelo, por que no se
puede tener la certeza total sobre la forma funcional del modelo.

Finalmente, la formulacin de un modelo economtrico requiere los siguientes pasos:


1. Delimitar el fenmeno que se va a estudiar; 2. Seleccionar las variables
relevantes; 3. Establecer las relaciones entre las variables y 4. Tener una idea
definida de la finalidad que ha de cubrir el modelo, lo que influye en la especificacin,
seleccin de las variables y en el nmero y forma de relaciones

2.2. Elementos que Componen el Modelo

Los elementos que componen el modelos son las variables, las ecuaciones y los
parmetros.

Una variable es una entidad que puede tomar cualquier valor, sin embargo, interesan
solo aquellos valores que tienen un significado econmico, es decir los valores
factibles que definen su correspondiente dominio o recorrido. As por ejemplo para
las variables precio, produccin, ingreso, cantidad de insumo utilizado solo tienen
sentido econmico valores positivos.

Una ecuacin es una expresin matemtica que establece una relacin entre
variables. Los parmetros son otra categora matemtica. Estos son los factores de
ponderacin correspondiente a cada variable explicativa y miden el efecto de las
fluctuaciones de estas variables sobre la variable dependiente. Los parmetros son
importantes en los modelos, ya que sobre estos se formulan las pruebas de
hiptesis. El parmetro que no acompaa ninguna variable independiente se le
conoce como constante parametrica (intercepto); su interpretacin puede tener
sentido econmico dependiendo del modelo que se este considerando. Los valores
de los parmetros cambian de una situacin a otra.

Los elementos que conforman un modelo se pueden clasificar desde diferentes


puntos de vista; sin embargo para el curso interesa principalmente la clasificacin
desde el punto de vista econmico.

11
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

2.3. Clasificacin de las Variables

Desde el punto de vista econmico las variables se pueden clasificar como variables
endgenas y variable exgenas. Las variables endgenas son aquellas cuyos
valores estn determinados dentro del modelo. Las variables exgenas son aquellas
cuyos valores estn determinados fuera del modelo. Un grupo adicional de
clasificacin se conoce como variables predeterminadas que comprende las
exgenas con o sin retardo y las endgenas con retardo. Otro tipo, son las variables
esperadas o de expectativas de gran aplicacin.

Existen otras clasificaciones de las variables. Estadsticamente se habla de


variables continuas y variables discretas al igual que de variables aleatorias. En
trminos de funcin matemtica se establecen variables dependientes e
independientes.

2.4. Clasificacin de las Ecuaciones

Desde el punto de vista econmico las ecuaciones se pueden clasificar de la


siguiente forma:

a) Ecuaciones de comportamiento: Son aquellas que reflejan el comportamiento de


los distintos agentes econmicos (consumidores, productores, inversionistas, etc).
Las ecuaciones de comportamiento son las que mayor aporte terico le hacen a los
modelos. Ejemplos de ecuaciones de comportamiento son las de demanda, oferta,
inversin, consumo, ahorro, etc.

b) Ecuaciones Tecnolgicas: El ejemplo tpico de una ecuacin tecnolgica es la


funcin de produccin, la cual refleja el estado de la tecnologa de un sector de un
pas.

c) Ecuaciones Institucionales: Reflejan un mandato o voluntad del Gobierno o de los


estamentos que toman las decisiones en un pas. Ejemplo de ecuaciones
institucionales son la de impuestos, subsidios, oferta monetaria, etc.

d) Ecuaciones de Definicin: son ecuaciones o identidades vlidas siempre por


definicin. Generalmente son relaciones contables y la mayora de los ejemplos de
este tipo de ecuaciones se encuentran en las cuentas macroeconmicas. Una
ecuacin de definicin es la de que activo = pasivo + capital. O la ecuacin de
identidad del Producto Nacional Bruto para una economa de tres sectores en
macroeconoma.

12
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

e) Ecuaciones de equilibrio: estas garantizan que el modelo tenga solucin. Ejemplo


de estas ecuaciones es la de que la oferta debe ser igual a la demanda para una
situacin de equilibrio; o la de que ahorro es igual a la inversin.

2.5. Clasificacin de los Modelos

Desde el punto de vista de la cobertura se puede hablar de modelos


microeconmicos o modelos macroeconmicos. Segn el numero de variables
independientes se establecen modelos simples y modelos mltiples. Si se considera
el nmero de ecuaciones se tienen modelos uniecuacionales y modelos
multiecuacionales. Al tratar de capturar el efecto del tiempo en el modelo se puede
tener modelos estticos y modelos dinmicos. Relacionando el nmero de variables
endgenas con el nmero de ecuaciones se tienen modelos completos y modelos
incompletos. Finalmente, segn la expresin matemtica se puede hablar de
modelos algebraicos y modelos no algebraicos.

13
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

CAPITULO 2. ORGANIZACIN DE DATOS Y ESTADSTICA


DESCRIPTIVA

2.1. Objetivos de la Estadstica

La estadstica es el lenguaje universal de la ciencia, tanto en sus ramas fsicas como


sociales. La estadstica es un instrumento formal que utilizado de manera rigurosa y
con precisin, permite describir resultados y adoptar decisiones respecto a lo que
estos evidencian empricamente. La estadstica en su aplicacin sigue el mtodo
cientfico y se define como la ciencia de recolectar, clasificar, describir e interpretar
datos numricos, es el lenguaje universal de la ciencia y el estudio de los
fenmenos aleatorios. Dentro de sus objetivos fundamentales se encuentra la
estimacin de una o ms caractersticas desconocidas de una poblacin, la
realizacin de inferencias y las pruebas de hiptesis.

Se considera fundador de la estadstica a Godofredo Achenwall, economista


alemn (1719-1772), quien siendo profesor de la universidad de Leipzig, escribi
sobre el descubrimiento de una nueva ciencia que llam estadstica (palabra
derivada de Staat que significa gobierno) y que defini como el conocimiento
profundo de la situacin respectiva y comparativa de cada estado. Desde su
aparicin la estadstica se ha enriquecido continuamente con los aportes de
matemticos, filsofos y cientficos.

La teora general de la estadstica es aplicable a cualquier campo cientfico en el


cual se toman observaciones. El estudio y aplicacin de los mtodos estadsticos
son necesarios en todos los campos del saber, sean estos de nivel tcnico o
cientfico. Las primeras aplicaciones de la estadstica fueron los temas de
gobierno, luego las utilizaron las compaas de seguros y los empresarios de
juegos de azar; a los anteriores siguieron los comerciantes, los industriales, los
educadores, etc. En la actualidad resulta difcil indicar profesiones que no utilicen
la estadstica.

2.2. Divisiones de la Estadstica

El campo de la estadstica puede dividirse ampliamente en dos reas: estadstica


descriptiva o deductiva y estadstica inferencial o inductiva. La estadstica

14
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

descriptiva es aquella en la que piensa la mayora de la gente cuando se escucha la


palabra "estadstica", consiste en el rea de estadstica dedicada a la recoleccin,
presentacin, descripcin de datos numricos, y cuyas conclusiones sobre los
mismos no sobrepasan el conjunto de conocimientos que estos proporcionan. Por
otro lado, la estadstica inductiva, o simplemente inferencia estadstica es el
mtodo y conjunto de tcnicas que se utilizan para obtener conclusiones ms all
de los lmites del conocimiento aportado por los datos, en otras palabras, busca
obtener informacin de una poblacin a partir de los datos de una muestra.

2.3. Tipos de Variables

En estadstica cuando se recopila informacin, sta es registrada por medio de la


observacin o medicin de una variable aleatoria que proviene de la realizacin de
un experimento. Se llama variable aleatoria, debido a que los valores que toma la
variable corresponden a los distintos resultados posibles de un experimento, en ese
sentido que sta tome un valor particular es un evento aleatorio.

An, cuando las observaciones resultantes no siempre son numricas en algunos


experimentos, estas pueden cuantificarse asignndoles nmeros que indiquen o
representen una categorizacin. Por esta razn, el inters se centra generalmente
en variables que pueden representarse numricamente.

Existen dos tipos de variables aleatorias: discretas y continuas. Las primeras pueden
tomar valores como los nmeros enteros, mientras las segundas toman valores
dentro de un intervalo. Si se tienen dos variables aleatorias, por ejemplo: el nmero
de habitantes en una localidad y el consumo de energa elctrica; la primera, se
encuentra dentro del grupo de variables aleatorias discretas, y la segunda, dentro del
conjunto de variables aleatorias continuas.

2.4. Poblacin y Muestra

El concepto de poblacin y muestra es muy importante en la ciencia estadstica, por


lo que es conveniente presentar su definicin:

Poblacin: Es la coleccin completa de individuos, objetos o medidas que tienen


una caracterstica en comn. La poblacin debe definirse cuidadosamente en cada
estudio cientfico de acuerdo con el inters y objetivo de la investigacin.
Muestra: Es un subconjunto de la poblacin; es decir, ella se compone de algunos
de los individuos, objetos o medidas de una poblacin. La muestra es obtenida con
el propsito de investigar, a partir del conocimiento de sus caractersticas
particulares, las propiedades de toda la poblacin, en este sentido, es importante la
seleccin de una muestra que sea representativa de la poblacin. Es necesario
formalmente enfatizar en la aleatoriedad de la muestra, lo cul se refiere a la manera

15
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

de seleccionar los elementos de la poblacin que conformarn la muestra. La


palabra aleatoriedad para este caso consiste en garantizar que cada elemento de
la poblacin tenga la misma probabilidad de ser elegido. Se considera que una
muestra es ms eficiente, cuando proporciona la mayor informacin til al menor
costo.

Los conceptos anteriores pueden tratarse en el siguiente ejemplo: Suponga que se


desea conocer el consumo promedio por hogar de energa elctrica en la ciudad de
Bogot. Para este caso, la poblacin corresponde a todos los hogares de la ciudad,
mientras que la muestra estar constituida por aquellos hogares que pueden ser
seleccionados de manera aleatoria, como un grupo representativo de todos los que
habitan en Bogot.

2.5. Parmetros Poblacionales y Estadsticos Muestrales

El trmino parmetro es utilizado en la estadstica para referirse a la


caracterstica desconocida de la poblacin que desea estimarse o evaluarse a
travs de una prueba de hiptesis. Por otro lado, el concepto estadstico se usa
para tratar una medida obtenida de una muestra para una caracterstica
poblacional no conocida. Cabe anotar que los estadsticos son fundamentales en
la realizacin de inferencias. El valor promedio y la varianza son ejemplos de tales
medidas.

2.6. Medidas de Tendencia Central

Las medidas de tendencia central se encuentran dentro de las medidas numricas


que se emplean comnmente para describir conjuntos de datos. La tendencia
central de un conjunto de datos es la disposicin de stos para agruparse, ya sea
alrededor del centro o de ciertos valores numricos. A este grupo de medidas
pertenecen la media, la mediana y la moda.

2.7. Medidas de dispersin

Existen otro tipo de medidas numricas cuyo objetivo es explorar la variabilidad de


los datos. Esta variabilidad se entiende como la dispersin de las observaciones
en un conjunto de datos. Dentro de estas medidas se encuentran: la varianza, la
desviacin media, la desviacin mediana, el recorrido o rango, entre otras.

2.8. Mtodos y Diagnsticos Grficos.

Los datos en los experimentos son recopilados inicialmente sin agrupar, para
luego, segn el inters del investigador presentarlos agrupados, en forma de
clases o intervalos. Es importante tener en cuenta que las fuentes de informacin

16
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

primaria y secundaria almacenan sus datos sin agrupar o como datos


agrupados. Con base en lo anterior, es relevante conocer el procedimiento de
clculo de las medidas numricas para ambos casos. Las expresiones
algebraicas que describen la forma de obtener las medidas de tendencia central y
de dispersin se muestran en la Tabla No. 1.

Por otro lado, con los datos agrupados de una variable aleatoria es posible
construir histogramas de frecuencias, los cuales pueden ser comparados con las
representaciones grficas de distribuciones de probabilidad ya conocidas de
variables aleatorias. En la mayora de los casos, estos histogramas se comparan
con la distribucin normal, donde por inspeccin es posible identificar sesgos o
apuntamientos en la distribucin.

Tabla No. 1. Medidas de Tendencia central y de Dispersin.

Medida Numrica Datos sin agrupar Datos agrupados


n k k
Media x= xi n x=
i =1
f i xi
n
, donde n= fi
i =1
i =1
Mediana Valor central de la distribucin (el Mediana = L + c( j f m )
50% de los datos se encuentran
por encima de este valor).
Punto medio de la clase
con frecuencia ms alta.
El promedio de los puntos
medios de las clases
Moda Valor ms frecuente consecutivas con frecuencias
iguales ms altas.
Puntos medios de las
clases no consecutivas con
frecuencias iguales ms altas.

2
k
n f i x i
s 2 = ( x i x )2 ( n 1 ) k
f i x i2 i =1
Varianza i =1
n
i =1
s2 =
n 1
n k

xi x f i xi x
Desviacin Media i =1
DM = i =1 DM = k
n fi
i =1
n k

xi Md f i x i Md
i =1
Desviacin Mediana i =1 DM =
DM = k

n fi
i =1
Recorrido Max - min.

17
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

2.9. Ejercicios e Interpretacin Salidas de Computador

Considrese el siguiente conjunto de datos hipotticos de un estudio de demanda

Tabla No. 2. Datos hipotticos en el estudio de demanda del bien X.

obs DX PX PZ PW I
1 37 7 5 7 6
2 38 6 7 5 8
3 18 10 3 13 3
4 50 4 9 4 18
5 22 9 3 11 3
6 55 2 12 3 21
7 42 8 5 8 2
8 29 8 5 9 19
9 63 2 18 3 20
10 13 12 2 15 6
11 60 3 9 5 12
12 62 3 10 5 5
13 36 6 5 6 26

ESTADSTICAS DESCRIPTIVAS

MEDIDAS DE TENDENCIA CENTRAL, DE DISPERSION Y NORMALIDAD

DX PX PZ PW I E
Mean 40,3846 6,1538 7,1538 7,2308 11,4615 1,8462
Median 38 6 5 6 8 2
Maximum 63 12 18 15 26 3
Minimum 13 2 2 3 2 1
Std. Dev. 16,8994 3,2106 4,4318 3,8113 8,2726 0,8987
Skewness -0,1141 0,2015 1,1012 0,7836 0,3946 0,3012
Kurtosis 1,8010 1,9467 3,7131 2,4772 1,6434 1,4070
Jarque-Bera 0,8069 0,6888 2,9030 1,4786 1,3342 1,5711
Probability 0,6680 0,7086 0,2342 0,4775 0,5132 0,4559
Sum 525 80 93 94 149 24
Sum Sq. Dev. 3427,0769 123,6923 235,6923 174,3077 821,2308 9,6923
Observations 13 13 13 13 13 13

18
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

CAPITULO 3. ANALISIS DE CORRELACION

3.1. Diagrama de Dispersin

Una primera aproximacin con el fin de detectar algn tipo de relacin entre dos
variables ( X y Y), consiste en ubicar los pares de valores de en un plano cartesiano
hasta conformar la nube de puntos. Un diagrama de dispersin es la representacin
grfica de todos los pares de valores en sistema de ejes de coordenadas.

El diagrama de dispersin no es un mtodo estadstico como tal, ms bien estara


dentro de los llamados mtodos de "ojmetro", sin embargo, es una manera fcil de
visualizar si se puede presentar alguna posible relacin entre las variables.

El diagrama de dispersin puede presentar diferentes formas, tales como los que se
presentan en las figuras siguientes:

19
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

La figura a) estara mostrando una posible relacin lineal entre las variables; en
tanto, que la figura b) tambin presentara una relacin lineal pero en este caso sera
inversa. Las figura c) y d) mostraran una posible relacin cuadrtica entre las
variables, pero en para el caso de la c) se podra representar un mximo en tanto
que para la d) sera un mnimo. La figura e) mostrara una tendencia de tipo cbico
entre las variables, en tanto que la d) en la que la pendiente de la lnea para cada
punto es positiva pero va decreciendo sin llegar a cero, podra indicar una relacin
de tipo exponencial entre las variables. La figura f) sera el caso en el cul no se
puede establecer ningn tipo de relacin entre las variables porque aparentemente
no existe.

3.2. Coeficiente de Correlacin Lineal (r)

Si bien es cierto que el diagrama de dispersin nos permite visualizar si existe o no


una posible relacin lineal entre las variables, el investigador debe siempre buscar
soportar sus conclusiones en trminos de alguna medida estadstica.

El coeficiente de correlacin lineal, r, es una medida sobre el tipo de relacin (signo)


y la fuerza (magnitud del coeficiente) en que estara relacionadas linealmente dos
variables. Usualmente el coeficiente de correlacin lineal se representa por la letra r,
indicando que es un estimador muestral (estadstico) y bajo las condiciones de una
muestra ideal este coeficiente debe ser una buena representacin del coeficiente de
correlacin poblacional (p). La formula para calcular r es la siguiente:

rXY =
( xi x )( yi y )
( xi x )2 ( yi y )
2

( xi )( yi )
x i yi n
rXY =

xi
2 ( xi )
2
yi
2 ( yi )
2



n
n

rXY =
x i y i n( x y )
[ xi 2 n( x )2 ][ yi 2 n( y )2 ]
Al examinar la frmula de r, se observa que el denominador es positivo debido a que
en el se encuentran sumas de cuadrados, en tanto, que en el numerador aparece la
covarianza de las variables. Lo anterior indica que el numerador es el que est
definiendo el signo del coeficiente de correlacin.

20
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

El coeficiente de correlacin no tiene unidades y puede tomar valores entre -1 y +1


( 1 < rXY < 1) Su interpretacin depende del signo y la magnitud que tome. Si r
tiende a +1 como seria el caso de la figura a) estara indicando una relacin lineal
positiva o positiva entre las variables. Si r tiende a -1, existira una relacin lineal
negativa o inversa entre las variables. En caso de que el r tienda a cero no existira
relacin lineal entre las variables.

Los casos extremos de interpretacin de r serian: 1. cuando r=1, en esta situacin se


presenta una relacin lineal positiva perfecta entre las variables, siendo posible
ajustar todos los puntos a travs de una lnea recta con pendiente positiva (figura g).
2. r = -1, en este caso se presenta una relacin lineal negativa perfecta entre las
variables, siendo posible ajustar todos los puntos a travs de una lnea recta con
pendiente negativa (figura h). 3. si r=0 no existira relacin lineal entre las variables y
una lnea recta con pendiente cero estara representando todos los pares de valores
(figura i).

Las ventajas principales del coeficiente de correlacin lineal son las de que es fcil
de calcular y fcil de interpretar; adems de que es un paso superior al del diagrama
de dispersin.

La principal desventaja del coeficiente de correlacin es la de que solo puede medir


relacin lineal entre las variables; sin embargo las variables pueden presentar algn
otro tipo de relacin que no sea la lineal. En el caso de que existan ms de dos
variables que estn muy relacionadas simultneamente, el coeficiente de correlacin
podra presentar problemas ya que solamente mide la relacin entre dos variables.

A continuacin se presentan una serie de propiedades del coeficiente de correlacin:

1. Es de naturaleza simtrica, lo anterior indica que el coeficiente de correlacin


entre X y Y es igual al coeficiente de correlacin entre Y y X .

21
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

2. Es independiente del origen y de la escala; si definimos X*i = aXi + c y Y*i =


bYi + d, donde a>0, b>0, y c y d son constantes, entonces r entre X* y Y*
(variables transformadas) es igual a r entre X y Y (variables originales).

Una de las condiciones para que el coeficiente de correlacin se pueda aplicar es el


de que las variables deben de ser continuas y con distribucin normal. En caso de
que esto no se cumpla como es el caso de variables discretas se debe buscar otra
medida estadstica para establecer algn tipo de relacin entre las variables.

3.3. Pruebas de Hiptesis

Si el investigador cree que existe una relacin lineal fuerte entre las variables, pero
no esta seguro del tipo de relacin (negativa o positiva), el planteamiento de la
hiptesis y el procedimiento para probarla es de la forma siguiente:

Paso 1: Ho: =0

Paso 2: Ha: 0

Paso 3: alpha ( ) : Nivel de significancia.

Este es establecido o definido por el investigador. Los valores de significancia con


los cuales se trabajan pueden cambiar de una disciplina o ciencia a otra. Bajo
situaciones donde los experimentos tienen una lato grado de control, usualmente se
trabaja con niveles del 1% y 5%, (altamente significativo y significativo
respectivamente). En las investigaciones de las ciencias sociales, los investigadores
son un poco ms tolerantes dado el limitado grado de control que se tienen sobre las
variables, y en algunas ocasiones se encuentran estudios que reportan significancias
estadsticas hasta con un 20%.

Paso 4: Definir el estadstico de prueba

Para el caso de correlacin lineal simple, el estadstico de prueba se define como:

tC =
(r )
n 2
~. t 2, n 2
2
1 r

donde res el coeficiente de correlacin lineal; n es el tamao de la muestra; n-2 son


los grados de libertad y es el valor al cual se iguala el parmetro poblacional en
la hiptesis nula. En este caso toma el valor de cero, pero en otra prueba puede
ser un valor distinto de cero, entre los lmites 1 y +1.

22
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

Paso 5: Regiones de decisin

Dado que la hiptesis alterna tiene el signo de diferente, se esta trabajando con
los dos lados de la distribucin. Por lo tanto, la regin de rechazo se encuentra
repartida alpha medios a cada lado. El valor de los lmites derecho e izquierdo con
que comienzan las regiones de rechazo se determina mediante la tabla t, teniendo
en cuenta si la prueba es de un lado o dos lados y los grados de libertad. La figura
j muestra la regin de rechazo y aceptacin de la hiptesis nula de esta prueba:

Paso 6: Contraste y criterio de decisin

Se debe comparar el estadstico calculado (tC ) contra el estadstico tabulado


( )
t 2 , n 2 . El criterio de decisin esta basado en lo siguiente: 1) si el t calculado es
mayor que el t de tablas positivo, cae en la regin de rechazo del lado derecho de
la distribucin y la decisin que se debe tomar es rechazar la hiptesis nula. 2) si
el t calculado es menor que el t de tablas negativo, el t calculado cae en la regin
de rechazo del lado izquierdo y por lo tanto la decisin tambin es rechazar la
hiptesis nula. 3) si el t calculado es mayor que el -t de las tablas y menor que +t
de las tablas, el t calculado cae en la regin de aceptacin y por lo tanto, la
decisin es no rechazar la hiptesis nula.

Paso 7: Conclusin del investigador

El investigador basado en el criterio de decisin concluye la prueba en trminos de


la hiptesis alterna o hiptesis del investigador y procede posteriormente a dar las
recomendaciones del caso.

Es importante aclarar que las hiptesis se plantean en trminos de los parmetros


poblacionales. Se usan los estadsticos para encontrar el estadstico de prueba, en
este caso r, que es el coeficiente de correlacin lineal, el cual se encuentra a partir
de los datos de la muestra, se utiliza para encontrar el valor de t calculado, pero la

23
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

hiptesis sobre la asociacin lineal entre las variables se plantean sobre el


coeficiente de correlacin lineal para la poblacin ( ) .

La decisin sobre la significancia estadstica de el coeficiente de correlacin en la


prueba de hiptesis se afecta por el tamao de la muestra (n) o mejor an por los
grados de libertad (gl), lgicamente a mayor tamao de muestra (mayor gl) el valor
de r tiene mayor confiabilidad. Si n es grande se pueden encontrar valores de r
relativamente bajos pero que pueden dar significativos al comparar el estadstico de
prueba con el de las tablas; alternativamente se pueden encontrar r altos pero con
no significativos estadsticamente debido a que n es muy pequeo y por consiguiente
el nmero de grados de libertad (gl) es bajo.

3.4. Interpretacin Salidas de Computador E-VIEWS

Continuando con el ejemplo de datos hipotticos del estudio de demanda planteado


en el captulo anterior:

MATRIZ DE COVARIANZAS

DX PX I PZ PW
DX 263,621302 -47,982249 47,899408 60,017751 -53,781065
PX -47,982249 9,514793 -12,994083 -11,639053 10,733728
I 47,899408 -12,994083 63,171598 16,698225 -16,183432
PZ 60,017751 -11,639053 16,698225 18,130178 -12,650888
PW -53,781065 10,733728 -16,183432 -12,650888 13,408284

MATRIZ DE CORRELACION

DX PX I PZ PW
DX 1 -0,95805552 0,37117521 0,86813735 -0,9045916
PX -0,95805552 1 -0,53001118 -0,88616982 0,95030783
I 0,37117521 -0,53001118 1 0,49341045 -0,55606184
PZ 0,86813735 -0,88616982 0,49341045 1 -0,81139694
PW -0,9045916 0,95030783 -0,55606184 -0,81139694 1

24
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

CAPITULO 4. REGRESION SIMPLE LINEAL Y NO LINEAL

4.1. Objetivo del anlisis de regresin

El objetivo fundamental del anlisis de regresin es el estudio de la dependencia


de una variable, la variable explicada, con una o ms variables llamadas variables
explicativas. El anlisis de regresin se apoya en el concepto matemtico de
funcin, en la que se tiene una variable dependiente (variable explicada ) y un
conjunto de variables independientes (variables explicativas) para estimar los
coeficientes y parmetros de dicha funcin (ejemplo marginalidades y
elasticidades) y tambin para predecir (encontrar el valor esperado de la variable
dependiente cuando se construyen escenarios reflejados en los valores que toman
las independientes).

Todo procedimiento economtrico sigue los siguientes pasos: la especificacin, la


estimacin, la verificacin y la prediccin. A continuacin se presenta una breve
descripcin de cada etapa:

Especificacin: corresponde a la etapa en que el investigador define la forma


funcional del modelo que desea utilizar para explicar la variable dependiente
siguiendo los lineamientos de la teora econmica.

Estimacin: durante esta se calculan los valores numricos de los coeficientes o


parmetros del modelo; para ello es necesario apoyarse en los mtodos de
estimacin y la aplicacin de rutinas de computador con paquetes estadsticos (E-
views).

Verificacin: consiste en corroborar la validez terica y estadstica del modelo, es


decir, evaluar si los signos obtenidos para los coeficientes estimados son los
esperados y si el modelo cuenta con propiedades estadsticas adecuadas (buen
ajuste, alta relevancia y dependencia).

Prediccin: muchas veces los modelos elaborados por los economistas no tienen
solo como objeto mostrar la relacin entre variables y la magnitud de dicha
relacin entre estas a travs de una forma funcional, sino que adems los modelos
tienen implicaciones en trminos de prediccin. As puede encontrarse el efecto

25
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

esperado sobre la variable dependiente para diversos valores de las variables


independientes fuera del rango muestral. En este procedimiento la inferencia
estadstica juega un papel importante.

4.2. Funcin de regresin muestral y poblacional

La lnea de regresin E (Y / X i ) = 1 + 2 X i es la unin de los puntos que


representan los valores esperados de variable dependiente Y dado los valores de
las variables independientes Xs. Esta lnea se puede construir a partir del
diagrama de dispersin conformado por los datos poblaciones; en este caso la
lnea de regresin se conoce como la funcin de regresin poblacional.

A continuacin se presenta una grfica de la lnea de regresin poblacional


cuando el gasto en consumo de un hogar se desea explicar por el ingreso.

Por otro lado, cuando la lnea de regresin es construida con los datos muestrales
recibe el nombre de funcin de regresin muestral. Como todo procedimiento de
inferencia estadstica, lo que se pretende es que la muestra sea una buena
representacin de la poblacin. En este sentido, la funcin de regresin muestral
constituye una representacin de la funcin de regresin poblacional. A s mismo,
en la prctica, las muestras de variables aleatorias son usadas para inferir sobre
las caractersticas de la poblacin.

26
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

La siguiente grfica presenta un ejemplo de dos lneas de regresin muestral para


el gasto en consumo de semanal de un hogar versus el ingreso de la familia.

4.3. Supuestos del modelo de regresin

Los supuestos del modelo junto con los mtodos de estimacin caracterizan los
resultados obtenidos de la regresin (coeficientes, pruebas de hiptesis, intervalos
de confianza, prediccin, etc). En particular, los supuestos ms importantes del
modelo recaen sobre el trmino del error. Teniendo en cuenta que la funcin de
regresin poblacional puede expresarse tambin de la forma Yi = 1 + 2 X i+ ui , el
modelo de regresin lineal cuenta con los siguientes supuestos:

Supuesto 1. (El valor medio o promedio de ui es igual a cero)

E (ui / X i ) = 0

Supuesto 2. (No existe autocorrelacin entre las u )

( ) [ ( )] ( )
Cov ui , u j = E [ui E (ui )] u j E u j = E ui , u j = 0 i j

Supuesto 3. (Homocedasticidad o igual varianza para u i )

Var (u i / X i ) = E [u i E (u i )] = E u i
2
( )=
2 2

27
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

Supuesto 4. (Cero covarianza entre u i y X i )

Cov (u i , X i ) = E [u i E (u i )][X i E ( X i )] = E [u i ( X i E ( X i ))]


= E (u i X i ) E ( X i )E (u i ) = E (u i X i ) = 0
Supuesto 5. El modelo de regresin esta correctamente especificado (no existen
sesgos ni errores de especificacin).

Cuando el modelo de regresin cumple con los anteriores supuestos se le conoce


como modelo de regresin clsico y tiene las siguientes propiedades: los
estimadores son MELI (mejores estimadores lineales insesgados), los intervalos
de confianza, las predicciones y las pruebas de hiptesis tienen validez
estadstica.

4.4. Mtodo de estimacin de mnimos cuadrados ordinarios

El objetivo principal de la etapa de estimacin es encontrar los valores de los


parmetros muestrales. El mtodo de estimacin ms popular recibe el nombre de
mnimos cuadrados ordinarios (MCO). El objetivo de este mtodo consiste en
proporcionar estimadores de los parmetros que minimicen la suma de los
cuadrados de los errores. Operativamente el proceso es construir una funcin
objetivo en trminos de la suma de los cuadrados de los errores y mediante un
procedimiento matemtico de optimizacin (condiciones de primer orden C.P.O., y
condiciones de segundo orden C.S.O.) obtener las frmulas de los estimadores de
MCO.

Debido a que la funcin de regresin poblacional no se puede observar


directamente, los estimadores de mnimos cuadrados ordinarios se obtienen a
partir de la funcin de regresin muestral (FRM):

La funcin de regresin muestral es :


Y i = 1 + 2 X i + e i
Y = Y + e
i i i

La suma del cuadrado de los errores puede expresarse como sigue:

e i2 = (Y i Yi ) = (Yi 1 2 X i )
2 2

De acuerdo con el principio de mnimos cuadrados ordinarios:


( )
2
min
e 2 = min
i Y Xi 1 2 i

28
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

Luego derivando la anterior expresin con respecto a 1 y 2 , e igualando a cero,


respectivamente, y resolviendo las ecuaciones normales pueden encontrarse los
estimadores de los parmetros de la regresin:

n X Y ( X )( Y )
2 = i i 2 i 2 i
n X i ( X i )

1 = Y 2 X

4.5. Varianzas y errores estndar de los estimadores

As como existen medidas de dispersin para las variables tambin las hay para
los estimadores, por lo tanto, es necesario siempre presentar una medida de
precisin de los estimadores de los parmetros del modelo. Esta medida es el
error estndar e indica la confiabilidad de las estimaciones (si son pequeas dejan
ver que los parmetros muestrales van a ser muy parecidos a los poblacionales).
La principal utilidad de los errores estndar de los estimadores es la construccin
de intervalos de confianza y prueba de hiptesis. A continuacin se presenta la
forma de calcular la varianza y error estndar de cada estimador del modelo de
regresin lineal simple:


( )
Var 1 =
X i2 2 ( )
se 1 = X i2

n (X i X ) n ( X i X )2
2

y

( )
( )
2
Var 2 = se 2 =
(X i X ) (X i X )
2 2

4.6. Intervalos de confianza

En estadstica es comn efectuar inferencias basadas en estimaciones puntuales


y en intervalos. Estas ltimas son menos riesgosas debido a que se encuentran
dentro de un rango con cierto margen de error o confiabilidad. En particular,
pueden construirse intervalos de confianza para los parmetros del modelo de
regresin as como para las predicciones.

Un intervalo de confianza para el estimador 2 puede presentarse como sigue:

29
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

[
Pr 2 t 2 ( )
se 2 2 2 + t 2 ( )]
se 2 = 1

donde es el nivel de significancia estadstica. Esta expresin muestra el


intervalo de confianza del 100(1 ) por ciento para 2 . Dicha ecuacin
2 ( )
expresndola brevemente: t se . De la misma forma para :
2 2 1

[
Pr 1 t 2 ( )
se 1 1 1 + t 2 ( )]
se 1 = 1
1 t 2 se 1 ( )
Por ejemplo si es 0.05, la interpretacin del intervalo de confianza para 2 es:
dado un nivel de confianza del 95%, en el largo plazo, en 95 de cada 100 casos el
( ( ) ( ))
intervalo 2 t 2 se 2 , 2 + t 2 se 2 contendr el verdadero valor de 2 .

4.7. Pruebas de hiptesis

En todo modelo de regresin se deben probar hiptesis para evaluar la validez


estadstica de los resultados. Entre la variedad de pruebas de hiptesis que se
pueden efectuar, las pruebas de dependencia y relevancia son las ms
importantes.

Prueba de relevancia: la prueba de relevancia consiste en evaluar


estadsticamente qu tan significativo es un parmetro del modelo, de esta
manera puede identificarse si la variable independiente ( X ) aporta informacin
importante al modelo de regresin. Siguiendo la estructura presentada en el
captulo 2, pero para cada estimador i :

Paso 1: Ho: i = 0
Paso 2: Ha: i 0
Paso 3: alpha ( ) : Nivel de significancia

Paso 4: El estadstico de prueba: para el caso de la prueba de relevancia en el


modelo de regresin, el estadstico de prueba se define como:

i
tC = ~. t
se ( i )
2, n 2

Paso 5: Regiones de decisin: La siguiente grfica muestra la regiones de


rechazo y aceptacin de la hiptesis nula.

30
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

Paso 6: Contraste y criterio de decisin: Si t C >t 2, n 2 se rechaza la


hiptesis nula.

Paso 7: Conclusin del investigador: De acuerdo con lo anterior, si la


hiptesis nula es rechazada se concluye que X i es estadsticamente relevante al
nivel de significancia. Por otro lado, mientras no sea posible rechazar la
hiptesis nula, se concluye que al nivel de significancia no existe evidencia
estadstica para afirmar que X i sea relevante.

Prueba de dependencia: esta prueba ser efecta para evaluar si en un modelo de


regresin la variables independientes explican estadsticamente en su conjunto la
variable dependiente con un nivel de significancia definido por el investigador.
Se desea que en un modelo de regresin exista una alta dependencia ocasionada
por las variables explicativas. Esta prueba de hiptesis como cualquier otra debe
seguir una estructura similar a la presentada en el captulo 2. La hiptesis nula de
esta prueba hace referencia a la no existencia de dependencia en el modelo,
mientras la hiptesis alternativa argumenta lo contrario. El estadstico de prueba
para el caso de un modelo de regresin lineal simple es FC = (t n 2 ) ~. F1, n 2 , donde
2

FC es el estadstico calculado, que sigue una distribucin F con 1 grado de libertad


en el numerador y n-2 grados de libertad en el denominador; y t es el estadstico t
calculado en la prueba de relevancia para 2 . Finalmente, la hiptesis nula es
rechazada cuando FC > F1, n 2 .

4.8. Prediccin

Una aplicacin del modelo de regresin es predecir o pronosticar el valor de la


variable dependiente, de acuerdo con unos valores dados de las variables
independientes. Hay dos tipos de predicciones: la prediccin media y la prediccin
individual. A continuacin se presentan estos dos casos.

31
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

Prediccin media: es la prediccin del valor medio condicional de Y,


correspondiente a un determinado valor de X, que puede ser denotado como X0, el
cual es un punto sobre la lnea de regresin poblacional.

Si se desea predecir E (Y / X 0 ) , la estimacin puntual de la prediccin media es

( )


2 1
Y0 = 1 + 2 X 0 y la varianza de Y0 : Var Y0 = +
( X0 X )
2
.
n (X i X )
2

Prediccin individual: es la prediccin de un valor individual de Y, correspondiente


a un determinado valor de X. Si se desea predecir Y0 / X 0 , de igual forma que en
la prediccin media la estimacin puntual es Y = + X , sin embargo la
0 1 2 0
manera de calcular la varianza de Y0 es:

1 (X X )2
Var (Y0 ) = 2 1 + + 0 .
n (X i X )
2

Es importante mencionar que cuando un modelo de regresin es construido con el


objeto de predecir, al investigador le interesa encontrar una medida de la bondad
de ajuste de los resultados del modelo. Una medida muy comn de esta bondad
de ajuste es el coeficiente de determinacin o R 2 , la cual proporciona informacin
respecto a que tan bien la lnea de regresin muestral se ajusta a los datos. Para
el caso de un modelo de regresin lineal simple se denota como r 2 y se calcula:
r 2 = (r ) , donde r es el coeficiente de correlacin lineal entre las variables Y y
2

X . Debido a que el r 2 bajo los supuestos de modelo de regresin clsico se


encuentra entre 0 y 1, la manera de interpretarlo es en porcentaje,
argumentndose que dicho valor refleja la magnitud porcentual en que la variable
Y es explicada por la variable X.

4.9. Modelos de regresin simple no lineal

En algunos casos el investigador requiere estimar otro tipo de modelos en los que
las variables independientes no sean lineales, como por ejemplo variables
transformadas en trminos logartmicos, cuadrticos, raz cuadrada, cbicos, etc.
Las razones para estimar estos nuevos modelos pueden ser: mejorar los
resultados en trminos de bondad de ajuste, obtener elasticidades directamente
de la regresin, o en algunos casos porque la teora econmica lo sugiere. Un
ejemplo del modelo no lineal es el conocido como Cobb-Douglas, cuya forma
funcional es la siguiente:

32
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________


Y i = AX i 2 e u i
Para estimar el modelo se efecta una linealizacin del modelo transformando en
logaritmos. De esta manera:
LnYi = LnA + 2 LnX i + ui
Puede notarse que las variables dependiente e independiente se encuentran
transformadas en logaritmos y el trmino LnA es el intercepto de la regresin. As,
con el deseo de obtener los coeficientes de la regresin puede efectuarse la
siguiente sustitucin:

Sea YT = LnYi , 1 = LnA y XTi = LnX i , luego el modelo a estimar toma la forma:
YTi = 1 + 2 XTi + ui , y los coeficientes del modelo transformado pueden ser
obtenidos por el mtodo de mnimos cuadrados ordinarios usando las ecuaciones
para los estimadores 1 y 2 presentadas en el numeral 3.4.

Tericamente un modelo Cobb-Douglas es una funcin con elasticidad constante


a lo largo de todo su dominio; siendo esto diferente a lo que sucede en el caso de
una funcin lineal, donde la elasticidad depende especialmente de la observacin
X i . En este sentido, el modelo Cobb-Douglas permite obtener las elasticidades
directamente. Para el caso del modelo de regresin simple el coeficiente 2
representa la elasticidad de Y respecto a X, y se interpreta como el aumento
(cuando el valor de la elasticidad es mayor que cero) o disminucin (cuando el
valor de la elasticidad es menor que cero ) porcentual en la variable Y, ocasionada
por el incremento en un 1% de la variable X.

4.10. Interpretacin Salidas de Computador

Continuando con el ejemplo de datos hipotticos del estudio de demanda:


MODELO DE REGRESION LINEAL SIMPLE

Dependent Variable: DX
Method: Least Squares
Date: 03/23/04 Time: 11:12
Sample: 1 13
Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 71,417910 3,130854 22,810998 0,000000
PX -5,042910 0,454825 -11,087588 0,000000
R-squared 0,917870 Mean dependent var 40,384615
Adjusted R-squared 0,910404 S.D. dependent var 16,899401
S.E. of regression 5,058427 Akaike info criterion 6,220627
Sum squared resid 281,464552 Schwarz criterion 6,307542
Log likelihood -38,434072 F-statistic 122,934614
Durbin-Watson stat 2,267643 Prob(F-statistic) 0,000000

33
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

CAPITULO 5. REGRESION MULTIPLE LINEAL Y NO LINEAL

5.1. Expresin del modelo en forma matricial

Ahora para el caso de la regresin mltiple se supone que las variaciones de Yi


que se pretenden explicar son debidas a K variables independientes, es decir X1,
X2, .., XK y como en la realidad no pueden presentarse relaciones
determinsticas por completo se considera la inclusin del trmino de perturbacin
.

Resulta conveniente analizar el modelo clsico de regresin lineal usando el


enfoque matricial. Supngase un modelo lineal de la forma:

Y = 1 + 2 x2 + 3 x3 + L + k xk +

Si se tienen n observaciones independientes y1 , y2 ,K, yn de Y, podemos escribir


y i como:
yi = 1 + 2 xi 2 + 3 xi 3 + L + k xi k + i

Donde x i j es el valor de la j-sima variable independiente para la i-sima


observacin, i = 1,2,3, K , n . Ahora defnanse las matrices siguientes, con x1 = 1 :

y1 x11 x12 L x1k 1 1



y x x22 L x2 k
Y = 2 , X = 21 , = 2 , = 2
M M M M M

yn xn1 xn 2 L xnk k n

Por lo tanto las n ecuaciones que representan y i como funcin de las x , los y
se pueden escribir simultneamente como:

Y = X +

34
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

5.2. Supuestos del modelo

A1. Y = X + (Linealidad en los parmetros).


A2. X es de tamao n x k con rango k.
A3. E ( X) = 0 E (Y / X) = X
A4. E (' ) = 2 I Cov( i j ) = 0 , i j .
A5. X es no estocstica.
A6. ( X ) N (0, 2 I )

5.3. Mtodo de estimacin de mnimos cuadrados ordinarios


Se desea obtener un estimador de un vector de parmetros desconocido que
minimiza la suma del cuadrado de los errores S = ( 2
)
= ' .


Entonces, S = ' = (Y X ) ' (Y X ) y luego minimizando S con respecto a se
tiene que el estimador de OLS es:

OLS = (X ' X ) (X ' Y )
1

5.4. Matriz de varianzas y covarianzas de los estimadores

Para obtener la matriz de varianza-covarianza de los estimadores es necesario


calcular previamente la suma de cuadrados de los errores y la varianza del
modelo:

1. Suma de cuadrados de los errores. Puede ser calculada as:


SCE = Y' Y ' X' Y .

2. Varianza del modelo. Dado que en la mayora de los casos la varianza es


desconocida, se utiliza la informacin de la muestra para obtener un

estimador de la misma: 2 = (Y' Y ' X' Y) (n k ) = SCE (n k ) .

Cabe anotar que la matriz de varianza-covarianza de los estimadores es relevante


en la determinacin de los errores estndar de los coeficientes y en la ejecucin
de pruebas de hiptesis. La forma de calcular esta matriz es:


Matriz var cov . = 2 ( X' X ) 1 .

35
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

5.5. Pruebas de hiptesis

Para efectuar pruebas de hiptesis debe obtenerse el error estndar de cada uno
de los estimadores. Esta medida de dispersin corresponde a la raz cuadrada de
cada uno de los elementos de la diagonal principal de la matriz de varianza
covarianza. A continuacin se presentan los aspectos ms importantes para
efectuar las pruebas de relevancia y dependencia en un modelo de regresin
mltiple:

Pruebas de relevancia: En estas pruebas se utilizan los t estadsticos calculados


de los estimadores con su respectivo p-valor. A continuacin se presenta la forma
de obtenerlos:

1. t estadsticos. Los valores de t son calculados efectuando el cociente


entre el coeficiente estimado y el error estndar respectivo.

2. p-valores. Arroja la probabilidad exacta de obtener un valor de t mayor que


el valor absoluto de t obtenido para cada coeficiente. Tambin es conocido
como el nivel mnimo de significancia para rechazar la hiptesis nula. Para
obtener dicha probabilidad es necesario el valor de t, el nmero de grados
de libertad (n k ) y el nmero de colas de la prueba (en este caso dos).

Prueba de dependencia: Como se mencion en el captulo anterior el estadstico


utilizado para esta prueba es el F.

1. F estadstico. Mide la dependencia conjunta en el modelo respecto a las


variables explicativas. Puede ser obtenido en la forma matricial de la
[ ]
siguiente manera: F = (' X' Y nY 2 )(n k ) [(Y' Y ' X' Y)(k 1)] .

2. p valor. Arroja el nivel mnimo de significancia para rechazar la hiptesis


nula. En el procedimiento se requiere el valor obtenido de F, los grados de
libertad del numerador (k 1) y grados de libertad del denominador (n k ) .

5.6. Coeficiente de determinacin ajustado R 2 ( )


El trmino ajustado se refiere a que es corregido por los correspondientes grados
de libertad. El R 2 mide la bondad de ajuste del modelo de regresin (porcentaje
de explicacin de la variable dependiente por las variables independientes), as
como lo hace el R 2 convencional, sin embargo el pero R 2 tiene la particularidad
de que permite comparar modelos de regresin mltiple en los que se incluyen

36
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

variables adicionales. La forma de calcularlo se presenta a continuacin:


(
R 2 = 1 1 R2
nk
)
n 1
.

5.7. Intervalos de confianza.

Un intervalo de confianza para el estimador k , k = 1,2, K , K , tiene la forma:


[ ( ) ( )]
Pr k t 2 se k k k + t 2 se k = 1
t se
k 2 ( )k

donde es el nivel de significancia estadstica y se k = ( ) ( X ' X )kk1 . Puede


notarse, que este intervalo de confianza corresponde a una expresin matemtica
similar a la presentada en el captulo anterior.

5.8. Modelos de regresin mltiple no lineal

En este numeral, se extender el caso de la funcin tipo Cobb-Douglas


desarrollado en el numeral 3.9 del captulo anterior al caso de regresin no lineal
mltiple. Considrense ms variables independientes Xs que pueden explicar la
variable Y, por lo tanto, el modelo Cobb-Douglas toma la forma:

Yi = AX i 2 2 X i 3 3 K X ik k e ui

Luego transformando el modelo en logaritmos:

LnYi = LnA + 2 LnX i 2+ 3 LnX i 3+ L + k LnX ik + ui

De acuerdo con la sustitucin: sea YT = LnYi , 1 = LnA , XTi 2 = LnX i 2 , ... ,


XTik = LnX ik , el modelo a estimar es:

YTi = 1 + 2 XTi 2 + 3 XTi 3 + L + k XTik + ui

Posteriormente, usando el esquema matricial presentado en el numeral 4.3, los


coeficientes del modelo transformado por el mtodo de mnimos cuadrados
ordinarios pueden ser obtenidos. El coeficiente k , k = 2 ,3,K , K representa las
elasticidad de Y respecto a Xk y tiene la misma interpretacin que en el caso de
regresin no lineal simple. Lo anterior quiere decir que se tendrn
k 1 elasticidades en regresin mltiple al estimarse una funcin tipo Cobb-
Douglas. Por otro lado, cabe destacar que ejercicios de estimacin para modelos

37
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

diferentes al Cobb-Douglas no permiten obtener directamente las elasticidades. En


este sentido, es necesario tener en cuenta la forma que toman las variables en el
modelo transformado antes de efectuar interpretaciones relacionadas con los
coeficientes.

5.9 Interpretacin Salidas del Computador.

Continuando con el ejemplo de datos hipotticos del estudio de demanda:

A. REGRESIN LINEAL MLTIPLE

Dependent Variable: DX
Method: Least Squares
Date: 03/27/04 Time: 15:27
Sample: 1 13
Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 72,733515 10,832882 6,714142 0,000150
PX -4,588739 1,778623 -2,579939 0,032619
PZ 0,471929 0,688867 0,685080 0,512650
PW -0,386460 1,214240 -0,318273 0,758428
I -0,409388 0,201019 -2,036558 0,076079
R-squared 0,947105 Mean dependent var 40,384615
Adjusted R-squared 0,920657 S.D. dependent var 16,899401
S.E. of regression 4,760208 Akaike info criterion 6,242183
Sum squared resid 181,276661 Schwarz criterion 6,459471
Log likelihood -35,574189 F-statistic 35,810459
Durbin-Watson stat 1,436480 Prob(F-statistic) 0,000037

MATRIZ DE VARIANZAS Y COVARIANZAS DE LOS ESTIMADORES

C PX PZ PW I
C 117,351340 -11,562329 -6,616478 1,349073 -0,600013
PX -11,562329 3,163501 0,777287 -1,826424 -0,022642
PZ -6,616478 0,777287 0,474538 -0,192430 -0,014848
PW 1,349073 -1,826424 -0,192430 1,474379 0,052888
I -0,600013 -0,022642 -0,014848 0,052888 0,040409

38
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

TABLA DE VALORES OBSERVADOS, ESTIMADOS Y RESIDUALES

Obs Actual Fitted Residual Residual Plot


1 37 37,810443 -0,810443 | . *| . |
2 38 43,297184 -5,297184 | * | . |
3 18 22,009771 -4,009771 | . * | . |
4 50 49,711104 0,288896 | . * . |
5 22 27,371430 -5,371430 | *. | . |
6 55 59,462667 -4,462667 | .* | . |
7 42 34,472794 7,527206 | . | . *|
8 29 27,126744 1,873256 | . | * . |
9 63 62,703630 0,296370 | . |* . |
10 13 10,359281 2,640719 | . | * . |
11 60 56,369710 3,630290 | . | *. |
12 62 59,707353 2,292647 | . | * . |
13 36 34,597888 1,402112 | . |* . |

Ahora considere la siguiente informacin para construir una funcin de costos


cbica en el nivel de producto:

Tabla No. 3. Costos segn el nivel de produccin.


Obs. Q CT
1 0 5
2 1 14
3 2 23
4 3 28
5 4 33
6 5 36
7 6 41
8 7 45
9 8 48
10 9 50
11 10 55
12 11 61
13 12 66
14 13 72
15 14 77
16 15 86
17 16 97
18 17 110
19 18 127
20 19 147
21 20 169

Donde:

CT: Costo total de produccin


Q: Nivel de producto

39
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

ESTADISTICAS DESCRIPTIVAS

Q Q2 Q3 CT
Mean 10 136,6667 2100 66,19048
Median 10 100 1000 55
Maximum 20 400 8000 169
Minimum 0 0 0 5
Std. Dev. 6,204837 128,5365 2488,431 43,49899
Skewness 0 0,660405 1,078772 0,842139
Kurtosis 1,794545 2,158009 2,933702 2,972036
Jarque-Bera 1,271481 2,146804 4,076968 2,482876
Probability 0,529543 0,341844 0,130226 0,288968
Observations 21 21 21 21

B. REGRESION NO LINEAL MULTIPLE

Dependent Variable: CT
Method: Least Squares
Date: 27/03/04 Time: 21:48
Sample: 1 21
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 4,586862 0,962089 4,767605 0,000200
Q 10,450570 0,427013 24,473660 0,000000
Q2 -0,974658 0,050336 -19,363000 0,000000
Q3 0,043001 0,001653 26,020450 0,000000
R-squared 0,999236 Mean dependent var 66,19048
Adjusted R-squared 0,999101 S.D. dependent var 43,49899
S.E. of regression 1,304364 Akaike info criterion 3,538952
Sum squared resid 28,92322 Schwarz criterion 3,737908
Log likelihood -33,15899 F-statistic 7408,618
Durbin-Watson stat 0,882959 Prob(F-statistic) 0

MATRIZ DE VARIANZAS Y COVARIANZAS DE LOS ESTIMADORES

C Q Q2 Q3
C 0,925616 -0,336905 0,032823 -0,000934
Q -0,336905 0,182340 -0,020705 0,000640
Q2 0,032823 -0,020705 0,002534 -0,000082
Q3 -0,000934 0,000640 -0,000082 0,000003

40
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

CAPITULO 6. INCUMPLIMIENTO DE LOS SUPUESTOS


DEL MODELO

El cumplimiento de los supuestos del modelo clsico de regresin garantiza que


los k obtenidos a travs del mtodo de mnimos cuadrados ordinarios sean los
mejores estimadores lineales insesgados. Por otro lado, cuando tales supuestos
son violados, se empiezan a generar problemas en los resultados de la regresin,
haciendo que los parmetros obtenidos no cumplan con algunas de las
propiedades deseables de un estimador (eficiencia y consistencia). A continuacin
se describen de manera general los conceptos de multicolinealidad,
heteroscedaticidad y autocorrelacin, la forma de detectar tales problemas en el
modelo estimado y las posibles soluciones a la violacin de los supuestos de
mnimos cuadrados ordinarios.

6.1. Multicolinealidad

La multicolinealidad tiene que ver con la relacin lineal entre algn conjunto de
variables independientes en un modelo de regresin. Supngase el siguiente
modelo con cuatro variables independientes:

Cualquier relacin lineal entre las variables independientes de este modelo, por
ejemplo X2 con X3, o X2 con X5 y X4 puede generar problemas de multicolinealidad
en el modelo. Por lo general, existen dos tipos de multicolinealidad:

1. Multicolinealidad Perfecta: Para entender el concepto de multicolinealidad


perfecta es necesario expresar las variables independientes del modelo en
trminos de una combinacin lineal cuya suma algebraica sea igual a cero.
Para el modelo presentado la combinacin lineal sera:

41
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

Los valores de pueden ser positivos o negativos y formar muchas


combinaciones, sin embargo, nunca simultneamente pueden ser cero.
Cuando la suma algebraica para todas las observaciones de la muestra es
cero se dice que existe multicolinealidad perfecta.

2. Multicolinealidad Alta: Cuando la colinealidad que existe entre variables


independientes es muy fuerte pero no perfecta.

La multicolinealidad se presenta debido a la tendencia definida de ciertas variables


a lo largo de la muestra o a travs del tiempo. Tendencias o patrones de
comportamiento similares de las variables independientes en un modelo de
regresin sustentan la multicolinealidad. La multicolinealidad se puede presentar
en datos provenientes de series de tiempo y es comn encontrarla al
regresar3 variables que tienen que ver con la representacin de ciclos econmicos
en general. Debido a esto es importante antes de efectuar la regresin elaborar
diagramas de dispersin entre las variables independientes con el objetivo de
analizar el comportamiento tendencial de estas.

El problema de multicolinealidad es un problema ocasionado por las


observaciones en los datos recopilados de la muestra. La presencia de
multicolinealidad afecta directamente la estimacin de los parmetros del modelo.
De acuerdo con el estimador por mnimos cuadrados ordinarios:


= (X' X ) (X' Y )
1

donde la matriz (X' X ) puede obtenerse de la siguiente manera:


1

1
(X' X )1 = Adj (X' X )
X' X

Cuando existe multicolinealidad entre las variables independientes de un modelo


de regresin, el determinante de la matriz X' X tiende a cero. Cuando esto ocurre

se corre con el riesgo de no poder estimar . En presencia de alta

multicolinealidad se genera una ampliacin del error estndar de , por lo que el
valor de los estadsticos "t" para cada uno de los parmetros del modelo sern
mucho menores que en ausencia de multicolinealidad, aumentndose la
probabilidad de cometer error de tipo II, es decir, que acepte Ho no siendo
verdadera. Por consiguiente, el modelo no tiene validez para realizar pruebas de
relevancia.

3
Trmino comnmente utilizado para sealar que se esta efectuando una regresin lineal.

42
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

6.1.1. Deteccin de Multicolinealidad

La deteccin de multicolinealidad en un modelo puede hacerse por medio de la


visualizacin de contradicciones en los estadsticos que juzgan la bondad del
ajuste (R2), dependencia (Fc) y los estadsticos que permiten evaluar la relevancia
de las variables en el modelo (tc). Otro mtodo de deteccin es la estimacin de
X'X; si el valor obtenido de X'X es muy cercano a cero, puede concluirse que
es muy probable la existencia de multicolinealidad.

No obstante, se encuentran otras pruebas mucho ms formales en trminos


estadsticos. Una de ellas es estimar coeficientes de correlacin entre pares de
variables independientes y formular pruebas de hiptesis sobre los coeficientes de
correlacin estimados para comprobar la significancia de la relacin lineal en
trminos estadsticos. Por ejemplo, una vez calculado el coeficiente de correlacin
lineal entre X2 y X3, puede proponerse la siguiente prueba de hiptesis4:

Ho: x2,x3 = 0 (No existe relacin lineal entre X2 y X3)

Ho: x2,x3 0 (Si existe relacin lineal entre X2 y X3)

El estadstico de prueba es:

tC =
(rX 2,X 3 n 2 ) ~. t 2, n 2
1 (rX 2 , X 3 )2

Si tC > t 2, n2 a un nivel de significancia determinado, se rechaza Ho,


confirmando la existencia de relacin lineal entre X2 y X3, es decir el modelo de
regresin mostrar multicolinealidad.

El otro mtodo formal consiste en la estimacin de regresiones auxiliares que


ayudan a evaluar la relacin lineal existente entre un conjunto de variables
independientes. Se ejecuta una regresin entre las variables independientes del
modelo, por ejemplo X2 versus (X3, X4, X4, X5) y luego se analizan los estadsticos
resultantes de esta. Para que halla relacin lineal entre estas variables el R2 y el
Fc de la regresin auxiliar deben se altos y as como el tc que acompaa a cada
variable independiente de la regresin auxiliar. Las pruebas de hiptesis sobre
relevancia y dependencia estadstica en la regresin auxiliar determinan si existe o
no multicolinealidad. Es importante tener en cuenta que deben estimarse todas las
posibles regresiones auxiliares resultantes de las combinaciones entre las
variables independientes o regresores del modelo original. El mtodo de
regresiones auxiliares es el ms utilizado y el ms recomendado por su

4
Corresponde a la misma prueba presentada en el captulo 2.

43
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

sustentacin estadstica y que permite evaluar la multicolinealidad ocasionada


simultneamente por la relacin lineal entre ms de dos variables independientes.

6.1.2. Correccin de Multicolinealidad

La correccin de multicolinealidad en un modelo puede ejecutarse mediante varios


mtodos:

1. Eliminacin de Variables: Esta tcnica propone la eliminacin de una de las


variables independientes relacionadas linealmente. El problema de aplicar
esta tcnica es que se pueden eliminar variables importantes que
tericamente explican la variable dependiente, presentndose posiblemente
sesgo de especificacin por omisin de variables.

2. Utilizacin de Informacin a priori: La informacin a priori comnmente


proviene de estudios anteriores que pueden brindar alguna informacin
sobre el valor de algn parmetro correspondiente a una de las variables
independientes incluida en la ecuacin de regresin. Operativamente, el
valor a priori del parmetro es reemplazado en el modelo original. Luego se
proceder a estimar el modelo resultante.

3. Transformacin de Variables: Esta tcnica plantea una transformacin de


las variables del modelo original. El ms conocido es la transformacin en
primeras diferencias. Al trabajar con un modelo que incluye datos
organizados en series de tiempo se presenta la posibilidad de construir una
ecuacin de primeras diferencias, asumiendo que con un rezago de cada
una de las variables del modelo se elimina la relacin lineal que puede
existir entre las variables independientes. El modelo original en el periodo t:

Luego la ecuacin en diferencias es:

Donde t* = t - t-1. Debe tenerse en cuenta que al estimar este nuevo


modelo, la interpretacin de los coeficientes estimados no es la misma que
en el modelo original, debido a que estos ahora representan cambios o
diferencias de las variables entre los periodos t y t-1.

4. Mtodo de Componentes Principales: Este mtodo consiste en ampliar la


muestra o conjunto de datos utilizados para estimar el modelo. Esta es un
solucin plausible dado que el problema de multicolinealidad es ocasionado
fundamentalmente por las observaciones en la muestra. Sin embargo, en

44
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

muchos casos no es posible adquirir ms informacin u observaciones de


las variables debido a restricciones fsicas, tcnicas y econmicas.

Finalmente, se recomienda que el investigador una vez utilice alguno de estos


mtodos verifique si el problema de multicolinealidad fue corregido. Es claro que
los mtodos anteriores constituyen un conjunto de alternativas de solucin al
problema de multicolinealidad, no obstante, puede ocurrir que luego aplicar alguna
de estas medidas la multicolinealidad no desaparezca.

6.2. Heteroscedasticidad

El problema de heteroscedasticidad en un modelo de regresin tiene que ver con


la relacin entre una de las variables independientes del modelo y el cuadrado de
los errores estimados a partir de la regresin. Este problema se manifiesta en un
crecimiento o decrecimiento de la varianza del modelo. El problema de
heteroscedasticidad se presenta cuando el supuesto de que las perturbaciones o
los errores de la funcin de regresin poblacional tienen varianza constante es
violado.

La presencia de heteroscedasticidad es muy comn en regresiones estimadas a


partir de datos de corte transversal. Por ejemplo, cuando se recolectan datos
provenientes de estratos, de regiones, por tamaos de familias o por tipos de
empresas. En general, puede presentarse en anlisis en los que se incluyen
grupos que tienden a presentar diferentes comportamientos a lo largo de toda la
muestra, como por ejemplo el ingreso monetario de un hogar segn el estrato (se
puede pensar que la varianza del ingreso monetario del grupo de alta riqueza es
ms alta que la del grupo de escasos recursos).

El problema de heteroscedasticidad repercute directamente sobre la estimacin de


los parmetros de la regresin. El efecto del aumento de las varianzas de las
variables independientes en el tiempo causa la subestimacin de la varianza del
modelo de regresin, por lo tanto el valor del error estndar de los parmetros
ser mucho menor de lo que sera en ausencia de heteroscedasticidad. La
subestimacin de los errores estndar genera la sobreestimacin de cada tc ,
incrementndose la probabilidad de cometer error de tipo I. En este sentido, la
presencia de heteroscedasticidad en el modelo de regresin hace que las pruebas
de hiptesis no tengan validez estadstica.

6.2.1. Deteccin de la heteroscedasticidad

A continuacin se presentan los mtodos para detectar la existencia de


heteroscedaticidad:

45
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

1. Anlisis de residuales: Este mtodo permite evaluar grficamente si existe


heteroscedasticidad causada por una variable independiente en particular o
por todo el conjunto de variables independientes. Para el primer caso se
elabora un diagrama de dispersin entre Xt y et (trmino de error) donde Xt
es el regresor que el investigador supone genera la heteroscedaticidad. En
el segundo caso, se construye el diagrama de dispersin entre Yt estimado
y et . Si estas grficas muestran alguna tendencia especfica, puede
afirmarse que existe heteroscedasticidad en el modelo de regresin.

2. Anlisis de regresin: Es la utilizacin de una o ms regresiones auxiliares.


El procedimiento es similar al planteado para detectar multicolinealidad, con
la salvedad de que ahora la regresin no se estima entre las variables
independientes, sino entre el cuadrado del trmino de error y el conjunto de
regresores del modelo original. Dentro de este mtodo se encuentra la
prueba de Park, la prueba de Glejser, la prueba de White y la prueba de
Golfeld Quandt. A continuacin se presenta el procedimiento general para
efectuar la prueba de White:

Si se tiene el siguiente modelo original:

Una vez estimado el modelo por el mtodo de mnimos cuadrados


ordinarios (MCO), el investigador debe calcular el cuadrado de los errores:
(
2 = Y Y
t t t )
2 , luego estimar por MCO el siguiente modelo:

2 2
t2 = 0 + 1X1t + 2 X 2t + 3 X1t + 4 X 2t + 5 X1t X 2t + t

La prueba de hiptesis relacionada con el modelo anterior es:

Ho: 1 = 2 = 3 = 4 = 5 = 0 (No hay heteroscedasticidad)


Ha: 1 2 3 4 5 0 (Si hay heteroscedasticidad)

2
El estadstico de prueba: nR 2 ~
. 5 . En este caso el nmero de grados de
libertad es cinco, pero en modelos con ms variables explicativas, los
grados de libertad para la prueba ser el nmero de regresores
2
presentados en la prueba. Si nR 2 > g.l la hiptesis nula es rechazada, por
lo tanto, existe heteroscedasticidad en el modelo original.

46
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

6.2.2. Correccin de heteroscedasticidad

Las medidas correctivas principalmente incluyen dos enfoques: El primero cuando


2 es conocida y el segundo cuando el valor de este parmetro no se conoce.

1. Cuando se conoce 2 . En este caso se utiliza el mtodo de mnimos


cuadrados ponderados (M.C.P) para realizar una transformacin de las
variables del modelo. Este mtodo supone la siguiente transformacin:

Donde 2 es la desviacin estndar del modelo. Se supone que esta


transformacin permite que el modelo quede libre de heteroscedasticidad.
No obstante, para asegurarse de esto puede efectuarse cualquiera de las
pruebas de deteccin presentadas anteriormente.

2. Cuando no se conoce 2 : Por lo regular es muy difcil tener conocimiento


previo de 2 . De acuerdo con esto, si se desea utilizar el mtodo de
mnimos cuadrados ponderados debe recurrirse a supuestos ad hoc, con
cierto grado de razonabilidad sobre 2 para luego proceder a la
transformacin de la regresin original, de tal manera, que el nuevo modelo
cumpla con el supuesto de homocedasticidad. Considrese el siguiente
modelo:

El investigador piensa que la varianza de los errores tiene la siguiente


forma:
2
( )
E U t = 2 Xt2

Esta expresin es planteada cuando se cree que la varianza de los errores


es proporcional al cuadrado de la variable explicativa, bajo este supuesto el
modelo transformado puede presentarse como sigue:

Ut
Donde v t = . Puede verificarse que:
Xt
E (v t ) = E(U t Xt ) = (1 Xt )E(U t ) = 0

47
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

y adems que el modelo transformado es ahora tericamente


( ) [
2 2
] ( )( )
homocedstico: E v t = E (U t Xt ) = 1 Xt2 E U t = 2 . Es conveniente
2

verificar si empricamente el problema de heteroscedasticidad fue corregido.

6.3. Autocorrelacin

El problema de autocorrelacin se presenta en una regresin cuando los errores


de las diferentes observaciones estn relacionados en el tiempo. Esto indica que
el efecto de los errores en el tiempo no es instantneo sino por el contrario es
persistente en el tiempo. La autocorrelacin es ms comn en series ordenadas
en el tiempo que en informacin proveniente de encuestas en un tiempo fijo
(seccin cruzada). La autocorrelacin puede estar relacionada con los ciclos
econmicos, generalmente se presenta en modelo con variables
macroeconmicas donde en el tiempo ocurre un evidente comportamiento
tendencial.

Otra causa de la autocorrelacin es la presencia de sesgo de especificacin en el


modelo; principalmente por omisin de variables importantes, las cuales pasan a
formar parte del error de la regresin. La autocorrelacin puede ser tambin
generada en casos donde se usa una forma funcional incorrecta del modelo, esto
hace que los datos se ajusten a una forma funcional que no es la ms adecuada.

Se argumenta, que la manipulacin de informacin puede generar autocorrelacin.


Un caso tpico se presenta en la cuentas nacionales, donde muchos datos son
obtenidos a partir de otros, aplicando tcnicas de interpolacin o extrapolacin.
Por ejemplo, cuando se convierten datos diarios a semanales. Finalmente,
modelos especiales como los de rezagos distribuidos y los autoregresivos pueden
originar autocorrelacin.

Entre las consecuencias de la autocorrelacin se tiene la sobreestimacin de los


estadsticos t que juzgan la significancia de las variables independientes en el
modelo. Aunque los estimadores siguen siendo insesgados, las varianzas
obtenidas son subestimadas. En este sentido se incrementar la probabilidad de
cometer el error de tipo I (rechazar Ho cuando esta es verdadera).

6.3.1. Deteccin de la autocorrelacin

Los mtodos ms comunes para detectar autocorrelacin son:

1. Anlisis de residuales: este mtodo plantea la construccin de diagramas


de dispersin para los errores en funcin de tiempo o en funcin de un
perodo inmediatamente anterior. El primer paso es estimar el modelo

48
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

original por MCO, luego los errores estimados de la regresin son


graficados en un eje de coordenadas para identificar si existe alguna
tendencia en el tiempo de los mismos o si estos con su primer rezago se
encuentran relacionados.

2. El estadstico de Durbin Watson (d): Esta prueba es vlida para aplicar en


errores que se modelan como un proceso autoregresivo de orden 1 "AR(1)"
como el mostrado a continuacin:

El estadstico "d" oscila entre 0 y 4. Si este se aproxima a 0, se dice que


existe autocorrelacin positiva (relacin directa entre los errores), por el
contrario si d se aproxima a 4, existe autocorrelacin negativa (relacin
inversa entre los errores). El Durbin-Watson (d) se estima de la siguiente
manera:

Donde es el coeficiente de autocorrelacin de orden 1, el cual puede


despejarse directamente d:

La hiptesis planteada es:

Ho: ut,ut -1 = 0 (no existe autocorrelacin entre los errores)


Ha: ut,ut-1 0 (si existe autocorrelacin entre los errores)

El estadstico Durbin- Watson puede ser comparado con su respectivo


tabulado, teniendo en cuenta el nmero de observaciones contenidas en la
muestra y el nmero de regresores.

3. Prueba de Breusch-Godfrey. Esta es una prueba similar a la prueba de


White. Se diferencia de esta en que la variable dependiente de la regresin
auxiliar es el trmino de error t y las variables independientes son sus
respectivos rezagos hasta el orden deseado por el investigador.
Adicionalmente son incluidos los regresores usados en el modelo original.

49
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

6.3.2. Correccin de la autocorrelacin

La correccin del problema de autocorrelacin incluye diferentes tcnicas que


persiguen principalmente la transformacin de las variables del modelo con el
objetivo de eliminar el patrn tendencial que siguen los errores.

1. Cuando se conoce el coeficiente de autocorrelacin: la transformacin


recomendada sugiere rezagar un perodo las variables del modelo y
estimar una ecuacin de primeras diferencias. Para esto el modelo original
debe ser transformado hasta tomar la forma:

Esta ecuacin es estimada y se propone cualquiera de las tcnicas de


deteccin de autocorrelacin para averiguar si el problema de
autocorrelacin fue corregido.

2. Cuando no se conoce el coeficiente de autocorrelacin: En la mayora de


los casos a nivel emprico el coeficiente de autocorrelacin no se conoce.
Debido a esto el coeficiente de correlacin debe ser estimado u obtenido
mediante la suposicin de un determinado valor para .

Una de estos mtodos es el procedimiento Cochrane Occurt: este


consiste en la estimacin de modelos con sucesivas transformaciones. Es
un mtodo iterativo representado en un algoritmo que evala durante el
proceso la tendencia que sigue el estimado de regresiones sucesivas.
Cuando la diferencia de entre un modelo estimado actual y su antecesor
es 0.01 se afirma que el coeficiente ha convergido y por consiguiente la
tendencia de crecimiento de este se ha eliminado.

Por otro lado existe el mtodo de correccin a travs del Durbin Watson.
Mediante esta tcnica, aunque no se conoce , este es posible estimarlo a
partir del estadstico d de la regresin del modelo original. Una vez
obtenido el valor de , las variables son transformadas para posteriormente
estimar la siguiente ecuacin de primeras diferencias:

Despus de aplicar alguno de estos mtodos es necesario evaluar de


nuevo la presencia de autocorrelacin.

50
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

6.4 Interpretacin Salidas del Computador.

A. Multicolinealidad.

Considere que se desea estimar la demanda de pollo (DP) como una funcin de
su propio precio (PRPOLLO) , el ingreso per. cpita (INGPER), y el precio de la
carne de cerdo (PRCERDO). El modelo estimado es el siguiente:

Dependent Variable: DP
Method: Least Squares
Date: 27/03/04 Time: 13:35
Sample: 1960 1982
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 38,647195 3,649601 10,589431 0,000000
PRPOLLO -0,541084 0,157970 -3,425242 0,002838
INGPER 0,010876 0,002381 4,567423 0,000210
PRCERDO 0,174055 0,062531 2,783507 0,011841
R-squared 0,936653 Mean dependent var 39,669565
Adjusted R-squared 0,926651 S.D. dependent var 7,372950
S.E. of regression 1,996820 Akaike info criterion 4,377760
Sum squared resid 75,758546 Schwarz criterion 4,575237
Log likelihood -46,344242 F-statistic 93,645026
Durbin-Watson stat 0,882813 Prob(F-statistic) 0,000000

MATRIZ DE CORRELACION

DP PRPOLLO INGPER PRCERDO


DP 1,000000 0,839958 0,947171 0,912392
PRPOLLO 0,839958 1,000000 0,931681 0,970112
INGPER 0,947171 0,931681 1,000000 0,957131
PRCERDO 0,912392 0,970112 0,957131 1,000000

Se construye una regresin auxiliar con el fin de evaluar si existe Multicolinealidad.


A continuacin se presenta la respectiva estimacin:

REGRESION AUXILIAR

Dependent Variable: PRPOLLO


Method: Least Squares
Date: 27/03/04 Time: 13:38
Sample: 1960 1982
Included observations: 23

51
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

Variable Coefficient Std. Error t-Statistic Prob.


C 20,643361 2,319572 8,899644 0,000000
INGPER 0,000677 0,003367 0,201053 0,842688
PRCERDO 0,294818 0,059064 4,991495 0,000070
R-squared 0,941235 Mean dependent var 47,995652
Adjusted R-squared 0,935359 S.D. dependent var 11,117205
S.E. of regression 2,826508 Akaike info criterion 5,037069
Sum squared resid 159,782990 Schwarz criterion 5,185177
Log likelihood -54,926294 F-statistic 160,170151
Durbin-Watson stat 1,156275 Prob(F-statistic) 0,000000

B. Heteroscedasticidad

Para 30 hogares de una localidad se tiene el consumo (Y) y el ingreso (X) de un


bien en particular.

Tabla No. 4. Consumo e ingreso para treinta familias.


FAMILIA Y CONSUMO X INGRESO
1 55 80
2 70 85
3 75 90
4 65 100
5 74 105
6 80 110
7 84 115
8 79 120
9 90 125
10 98 130
11 95 140
12 108 145
13 113 150
14 110 160
15 125 165
16 115 180
17 130 185
18 135 190
19 120 200
20 140 205
21 144 210
22 152 220
23 140 225
24 137 230
25 145 240
26 175 245
27 189 250
28 180 260
29 178 265
30 191 270

Se desea estimar el consumo como una funcin del ingreso. La estimacin de


modelo es la siguiente:

52
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

Dependent Variable: Y
Method: Least Squares
Date: 27/03/04 Time:
12:15
Sample: 1 30
Included observations: 30
Variable Coefficient Std. Error t-Statistic Prob.
C 9,290307 5,231386 1,775879 0,086623
X 0,637785 0,028617 22,287177 0,000000
R-squared 0,946638 Mean dependent var 119,733333
Adjusted R-squared 0,944732 S.D. dependent var 39,061343
S.E. of regression 9,182968 Akaike info criterion 7,336918
Sum squared resid 2361,153250 Schwarz criterion 7,430332
Log likelihood -108,053777 F-statistic 496,718278
Durbin-Watson stat 1,590347 Prob(F-statistic) 0,000000

Con el objeto de verificar si los errores del modelo tienen varianza constante se
desarrolla la prueba de Heteroscedasticidad de White:

WHITE HETEROKEDASTICITY TEST

F-statistic 2,917301 Probability 0,071274


Obs*R-squared 5,330902 Probability 0,069568
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 27/03/04 Time: 12:31
Sample: 1 30
Included observations: 30
Variable Coefficient Std. Error t-Statistic Prob.
C -12,296205 191,773111 -0,064119 0,949348
X 0,197385 2,368760 0,083329 0,934205
X^2 0,001700 0,006707 0,253503 0,801800
R-squared 0,177697 Mean dependent var 78,705108
S.E. of regression 105,804280 Akaike info criterion 12,255699
Log likelihood -180,835478 F-statistic 2,917301
Durbin-Watson stat 1,856573 Prob(F-statistic) 0,071274

C. Autocorrelacin

Teniendo en cuenta el modelo de consumo de hogares descrito en el literal


anterior, ahora para treinta y dos hogares de otra localidad, se desea verificar si
existe autocorrelacin. El modelo estimado se presenta a continuacin y se
efecta la prueba de correlacin serial LM:

Dependent Variable: Y
Method: Least Squares
Date: 27/03/04 Time: 14:20
Sample: 1960 1991
Included observations: 32

53
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

Variable Coefficient Std. Error t-Statistic Prob.


C -16,162683 4,783937 -3,378532 0,002035
X 1,169317 0,050759 23,036847 0,000000
R-squared 0,946495 Mean dependent var 93,300000
Adjusted R-squared 0,944712 S.D. dependent var 13,352033
S.E. of regression 3,139528 Akaike info criterion 5,186484
Sum squared resid 295,699101 Schwarz criterion 5,278092
Log likelihood -80,983737 F-statistic 530,696328
Durbin-Watson stat 0,130648 Prob(F-statistic) 0,000000

BREUSCH-GODFREY SERIAL CORRELATION LM TEST

F-statistic 94,371224 Probability 0,000000


Obs*R-squared 27,866061 Probability 0,000001
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 27/03/04 Time: 14:34
Variable Coefficient Std. Error t-Statistic Prob.
C -0,740829 1,796997 -0,412259 0,683289
X 0,009174 0,019129 0,479570 0,635258
RESID(-1) 1,101681 0,187855 5,864521 0,000003
RESID(-2) -0,148736 0,199654 -0,744968 0,462499
R-squared 0,870814 Mean dependent var 0,000000
Adjusted R-squared 0,856973 S.D. dependent var 3,088475
S.E. of regression 1,168027 Akaike info criterion 3,264978
Sum squared resid 38,200061 Schwarz criterion 3,448195
Log likelihood -48,239653 F-statistic 62,914150
Durbin-Watson stat 1,929549 Prob(F-statistic) 0,000000

54
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

CAPITULO 7. ANLISIS TRANSVERSAL

7.1. Regresin con variables independientes cualitativas

En algunos casos ciertas caractersticas tomadas de una poblacin y recopiladas


a travs de una muestra pueden no corresponder a variables cuantitativas, por
ejemplo, si se esta encuestando a un conjunto de personas, se les puede
preguntar informacin respecto a su sexo, la raza, la regin de origen, estado civil,
el estrato econmico, etc. Estas variables son denominadas variables cualitativas
y su tratamiento o anlisis en modelos economtricos tiene una connotacin
diferente a las variables cuantitativas.

Por medio de asignaciones numricas especficas, de escala ordinal o cardinal la


variables cualitativas pueden ser registradas en un modelo economtrico. Un
ejemplo de escala cardinal es la variable sexo, donde el investigador puede
asignar a esta variable en una serie de observaciones numricas como se
describe a continuacin:
1 Si es hom bre
SEXO =
0 Si es mujer

En este sentido, a todas las observaciones correspondientes al sexo femenino le


ser asignado el nmero cero y a las de sexo masculino el nmero 1. Esta nueva
variable recibe el nombre de variable dummy, debido particularmente a que solo
podr tomar dos valores el uno o el cero.

Por otro lado, un ejemplo de una variable que puede ser representada en escala
ordinal es el estrato econmico. El nombre de ordinal se refiere a que en la
estructura de registro el orden tiene gran relevancia. El investigador puede
conformar la variable de la siguiente manera:

1 Si el hogar pertenece al estrato 1


2 Si el hogar pertenece al estrato 2

ESTRATO = 3 Si el hogar pertenece al estrato 3
4 Si el hogar pertenece al estrato 4

5 Si el hogar pertenece al estrato 5

55
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

Cuando la variable puede construirse de esta manera recibe el nombre de variable


categrica ordenada. Considrese el siguiente modelo de regresin lineal para un
conjunto de hogares:

TRABAJOt = 1 + 2SALARIOt + 3SEXO3 + 4ESTRATO t + t

Donde:

TRABAJO: Nmero de horas trabajadas al mes


SALARIO: Ingreso laboral
SEXO: Sexo del jefe de familia
ESTRATO: Nivel de estrato del hogar.

Si el coeficiente 3 es positivo se interpreta como el nmero de horas de trabajo


mensual adicionales que ofrece el hogar cuando el jefe de familia es hombre. Por
otro lado, en cuanto al coeficiente de la variable estrato, cuando 4 es positivo,
este manifiesta que hogares con un nivel de estrato ms alto ofrecen al mercado
laboral ms horas de trabajo al mes.

7.2. Regresin con variable dependiente cualitativa

Existen otra clase de modelos en econometra llamados modelos de variable


dependiente cualitativa. Estos se dividen en dos clases los modelos de
probabilidad y los modelos de eleccin discreta para ms de dos alternativas.

En los modelos de probabilidad, la variable dependiente solo puede tomar dos


valores cero o uno, por ejemplo, cuando se le pregunta a un conjunto de personas,
que representan una muestra aleatoria de la poblacin, si se encuentran tienen
empleo o no, as la variable ESTA EMPLEADO? toma el valor de uno si tiene
trabajo o cero en caso contrario. Existe tres formas generales de estimar este tipo
de modelos: por mnimos cuadrados ordinarios, el cual es conocido como el
modelo de probabilidad lineal, siendo el menos utilizado por no cumplir en la
mayora de los casos con la propiedades de la probabilidad; tambin se encuentra
el modelo logit, donde la funcin de distribucin que siguen los errores es log-
normal; y finalmente el modelo probit, cuando las perturbaciones se asume tienen
distribucin normal.

Dentro de los modelos de eleccin discreta con ms de dos alternativas, se


encuentran: el modelo logit multinomial, el modelo probit multinomial y el modelo
nested logit. En cada uno de estos, la variable dependiente es categrica, pero a
diferencia de los anteriores modelos, esta puede tomar ms de dos valores u
organizarse en especie de ramas o brazos. Por ejemplo, en un anlisis de medios
de transporte a un investigador le puede interesar el tipo de transporte que las

56
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

personas utilizan para llegar a su lugar de trabajo: bus, automvil, taxi,


transmilenio, bicicleta, etc.

La forma funcional de los modelos con variable dependiente cualitativa y su


interpretacin, resulta ser ms compleja que la de los modelos con variables
independientes cualitativas. Finalmente, cabe anotar, que todos los modelos de
este tipo, a excepcin del modelo de probabilidad lineal son no lineales en los
parmetros y se estiman por el mtodo de mxima verosimilitud.

57
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

ANEXOS

58
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

ANEXO 1.
REGRESIN LINEAL MLTIPLE EN EL PAQUETE
ESTADSTICO E-VIEWS

Ejemplo

De acuerdo con la siguiente base de datos, presente en el archivo dem1.xls:

Tabla No. 5. Variables para la estimacin de la demanda lineal del bien X.


Obs. DX I PW PX PZ
1980 22 10 8 3 9
1981 20 11 9 5 9
1982 19 13 12 6 8
1983 18 14 13 8 7
1984 16 16 15 9 6
1985 14 17 17 10 5
1986 13 18 19 11 4
1987 11 19 21 13 3
1988 9 20 23 15 2
1989 7 21 24 17 2
1990 6 23 25 18 1
1991 5 25 27 20 1

Estime la funcin de demanda del bien X, teniendo en cuenta la siguiente


especificacin del modelo:

Dx = 0 + 1 I + 2 Pw + 3 Px + 4 Pz + U
Donde:

Dx: Cantidad demandada del bien X.


I: Ingreso.
Pw: Precio del bien W.
Px: Precio del bien X.
Pz: Precio del bien Z.
U: Trmino de error

59
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

Desarrollo

Este ejercicio ser desarrollado en el paquete estadstico Econometrics Views 4.1.


A continuacin se muestra todo el procedimiento para estimar el modelo de
demanda lineal siguiendo los supuestos del modelo clsico de regresin lineal
normal.

A. Importar la base de datos.

Este paquete estadstico puede importar datos en hoja electrnica guardados


con extensin wks, wk1 y Excel. Una vez se inicia la sesin en E-views se
debe generar un nuevo archivo de trabajo.

El programa requiere que se seleccione el tipo de frecuencia que


caracterizan los datos.

Debido a que los datos


presentan una frecuencia
anual se elige la opcin
Annual: indicando el periodo
inicial y final.

Posteriormente el procedimiento es importar los datos que se encuentran en


hoja electrnica (Excel).

60
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

Se selecciona el archivo a
importar; en este caso
corresponde a dem1.xls
del subdirectorio donde se
haya almacenado.

Las variables deben ser


incluidas en el orden que
se encuentran en la base
de datos separadas por
espacios y con sus
nombres correspondientes.
Por ejemplo: Dx, I, Pw, Px
y Pz.

Cuando los datos son importados el programa muestra la siguiente ventana


con el respectivo nombre de las variables:

61
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

De esta manera la base de


datos ha sido importada con
todas sus variables. Las
observaciones pueden ser
vistas al seleccionar las
columnas deseadas y
pulsando el link show.

B. Estimacin del modelo

Usando el link quick y Estimate Equation es arrojada una ventana donde la


ecuacin del modelo debe ser incorporada.

En dicha ventana las variables pueden introducirse separadas por espacios


empezando por la variable dependiente y luego las independientes incluyendo
la constante cuando no se efecta regresin al origen.

En esta ventana tambin el modelo puede introducirse escribiendo la ecuacin


con los smbolos (= , * , + ) nombrando los coeficientes como C(1), C(2), ...,
C(n).

62
Introduccin a la Econometra
PhD.Eco.Jorge Edwing Del Carpio Gonzales
________________________________________________________________________________________

Aplicando O.K. de acuerdo con la primera modalidad de estimacin, el


resultado de es el siguiente:

63

S-ar putea să vă placă și