Sunteți pe pagina 1din 146

Sesin 01

GENERALIDADES
Eco. SEGUNDO AGURTO
MORAN

Sesin 01

ESTADISTICA Y TEORIA
ECONOMICA

Mtodos Cuantitativos de la Economa.


Los mtodos cuantitativos de la economa
comprenden tres reas:
a) Anlisis Matemtico y lgebra Lineal;
b) Programacin Lineal y Anlisis de
Insumo-Producto y
c) Econometra

Anlisis estadstico

I. Revisin Estadstica: Estadstica


Economa y Econometra.
II. Regresin Simple

I. Mtodos Cuantitativos de la Economa


Mtodos Cuantitativos
Los mtodos cuantitativos de la economa
comprenden tres reas:
a) Anlisis Matemtico y lgebra Lineal;
b) Programacin Lineal y Anlisis de InsumoProducto y
c) Econometra

Anlisis estadstico
En un sentido amplio, se refiere a estudiar todos
los mtodos que describen las relaciones que se
dan entre diversas variables o dimensiones de
variacin.

I. Conceptos bsicos.
Estadstica
Es la ciencia que proporciona un conjunto de

mtodos que se utilizan para; recolectar, resumir,


clasificar, analizar e interpretar el comportamiento
de los datos con respecto a una caracterstica
materia de estudio o investigacin.
Tambin es el conjunto de tcnicas que, partiendo
de la observacin de fenmenos, permiten al
investigador obtener conclusiones tiles sobre ellos.
Estadstica ayuda en la incertidumbre, trabaja con
ella y nos orienta para tomar las decisiones con un
determinado grado de confianza.

Divisin de Estadstica
Estadstica Descriptiva.- es el conjunto de
mtodos que implican la recoleccin,
presentacin y caracterizacin de un conjunto
de datos a fin de describir en forma apropiada
las diversas caractersticas de stas.
Estadstica
Inferencial.o
estadstica
matemtica; es el conjunto de mtodos o
tcnicas que posibilitan la generalizacin o
toma de las decisiones de una informacin
parcial mediante tcnicas.

Estadstica Inferencial
Se define como aquella que desarrolla modelos tericos que se
ajusten a una determinada realidad con cierto grado de
confianza.
Es el conjunto de tcnicas que permiten dar un valor
aproximado de un parmetro de una poblacin a partir de los
datos proporcionados por una muestra.
La Estadstica Matemtica o Inferencial se usa esencialmente
para determinar la probabilidad de que una conclusin
obtenida a partir de los datos de una muestra sea cierto para la
poblacin bajo estudio.
Las poblaciones de estudio a las que hacemos referencia pueden
ser; ventas, personal de una empresa, consumidores de un
producto, productos de la empresa, clientes de la empresa, etc.

Alcances de las inferencias a partir de una


muestra
Los mtodos de la Inferencia Estadstica permiten generalizar los
resultados de la muestra slo a los individuos que componen la
poblacin muestreada.
Cmo debe ser seleccionada la muestra?
Importante: Debe ser objetiva e insesgada
Mecanismo: Seleccin (aleatoria) probabilstica.

Alcances de las inferencias a partir de una


muestra
Poblacin Objetivo: Poblacin que se desea analizar. Por
ejemplo, se requiere conocer la proporcin de personas que
consumen un determinado producto en una regin.
Poblacin Muestreada: Cuando no es posible obtener la
muestra a partir de los individuos que definen la poblacin
objetivo, sino slo a partir de una subpoblacin accesible para
el investigador. Ejemplo poblacin respondiente, muy comn
en encuestas.

Foco de la Inferencia Estadstica


La inferencia estadstica requiere utilizar las reglas de probabilidad y
distintas distribuciones (modelos) de probabilidad, en particular, las
distribuciones normal, t-student, chi-cuadrado.
La inferencia estadstica involucra dos reas principales:

Estimacin de parmetros

Pruebas de hiptesis

En conclusin: Un estudio estadstico se


considera inferencial cuando se pretende
inferir o predecir conclusiones que a
ataen a toda la fuente de informacin
de donde proviene los datos.
Toda prediccin debe contener cierto
grado de confianza, y esta se mide por
el clculo de
probabilidades piedra
angular de la I.E.

Trminos bsicos
Datos: observaciones realizadas de los

individuos o grupos de individuos


Escalas de medida: no mtricas (nominales y
ordinales) y mtricas (intervalos y de razn)
Diseos: estrategias de recogida de datos
Estrategia del diseo: transversal o longitudinal
Modelos de anlisis: sistemas o ecuaciones que
permiten inferir el tipo de relacin entre los
datos
Clases de relaciones: asociativas y causales

Poblacin y Muestra
Poblacin.- es la coleccin de todos los
individuos, objetos u observaciones que
poseen al menos una caracterstica comn.
Muestra.- es una parte o un subconjunto
representativo de la poblacin. Al proceso de
obtener la muestra se llama muestreo.
Parmetro.- es una medida resumen que
describe
una caracterstica de toda la
poblacin.
La media poblacin:
Proporcin poblacional
Desviacin tpica poblacional

Definiciones
Parmetro Poblacional: Valor de una caracterstica de inters
medida sobre todos los individuos de la poblacin.
Ejemplo1: Edad media de las mujeres de una regin que usan

determinado servicio (o compran un determinado producto).

Ejemplo2: Proporcin de compradores de un producto en Stgo.

Estimador: Valor de una caracterstica medida sobre los individuos


que componen la muestra. Un estimador toma diferentes valores
para cada muestra seleccionada.
Ejemplo1: Edad media obtenida con una muestra de mujeres.

Ejemplo2: Proporcin de compradores con una muestra de


clientes.

Definiciones

Estimacin: El valor que toma un estimador para una particular


muestra se denomina estimacin del parmetro poblacional.
Ejemplo1: Edad media= 31 aos.
Ejemplo2: Proporcin de compradores= 5%.

Smbolos de Parmetros y Estimadores

Distribucin Muestral
Interrogantes: Cmo es posible que con una muestra se
pueda llega a tener una medida del parmetro desconocido
que buscamos.?
Qu tan buena es la estimacin obtenida?
Se puede concluir que el parmetro de la poblacin es

idntico al estadstico de la muestra o es posible que exista


algn error?.
Si es as Qu tan grande es dicho error?

Distribucin Muestral
Objetivo: Conocer un parmetro de la poblacin
(media, proporcin, coeficiente de correlacin, etc)
Solucin: Obtener una muestra de tamao n y
conseguir una estimacin del parmetro usando un
estimador

Distribucin Muestral
Respuestas: Para responder a estas preguntas se debe
comparar los resultados obtenidos a partir de las muestras
con los resultados esperados.
Los resultados esperados surgen a partir de la distribucin
muestral del estadstico, de aqu su importancia.

Distribucin Muestral
Si la variable de estudio se distribuye normal

N ( , 2 )

y seleccionamos una muestra aleatoria de tamao n de esta


poblacin, entonces la media muestral de la variable de estudio sigue
una distribucin normal

N ( , )
n
2

y la transformacin Z ( y ) /

se distribuye

N(0,1)

Teorema Central del Lmite:


Independiente de la distribucin de la variable aleatoria Y,
siempre que tenga media y varianzas finitas, al hacer el tamao
de la muestra n suficientemente grande (n>=30), entonces la
media muestral de la variable aleatoria Y sigue una distribucin
aproximadamente normal

N ( ,

De manera que el estadstico

2
n

Z (y ) /

media 0 y varianza 1, es decir, N(0,1)

es normal con

LOS MODELOS ECONMICOS


Elaboracin de Teoras y modelos:
Economa

Explicacin
Prediccin

FENOMENOS
OBSERVADOS EN EL
MUNDO REAL

SON
COMPLEJOS

TEORIAS QUE DESARROLLAN UN CONJUNTO


DE REGLAS Y SUPUESTOS BASICOS Y SON
LA BASE PARA REALIZAR PREDICCIONES

Se pueden representar a travs de modelos, los cuales pueden ser


verbales, matemticos, grficos, economtricos, etc.
EJEMPLO: MODELO DE LA DEMANDA

MODELO

DADO QUE LOS


HECHOS SON

ABSTRACCIONE
S

COMPLEJOS

SIMPLIFICACIONES
SUPOSICIONES

Cuando se desarrolla un modelo se trata de conservar la ESENCIA DEL


PROBLEMA (o funcionamiento del hecho que se desea estudiar) y se dejan de
lado los detalles que no son muy relevantes.
Cmo explicar el comportamiento de miles de consumidores? O miles de empresas?
El trayecto para un viaje?

Una representacin simplificada de la realidad.

UN MODELO

Descripciones tericas simples que captan la esencia

del funcionamiento de la economa


Una descripcin desde el punto de vista del economista

de cmo funcionan las cosas en el mundo real

ELABORACIN DE TEORAS Y MODELOS:

La economa como cualquier otra ciencia se ocupa de la


explicacin y prediccin de fenmenos observados, esto lo
hace basndose en teoras que desarrollan un conjunto de
reglas y supuestos y son la base para realizar predicciones.
Luego mediante tcnicas estadsticas y economtricas se
pueden utilizar para construir modelos.
Quien observe el mundo real de los fenmenos econmicos se
enfrentar a un conjunto de datos que por lo menos a simple
vista, carecen de sentido. Para descubrir un orden en esa
masa que informe de hechos y arreglarlos en alguna forma
inteligible se requiere elaborar teoras que EXPLIQUEN
VARIOS ASPECTOS DEL COMPORTAMIENTO HUMANO.
Pero en este proceso el analista debe cuidarse de conservar
las caractersticas esenciales del problema del mundo real del
cual se ocupa. Es decir la simplificacin es necesaria pero al
mismo tiempo requiere que UNA TEORIA CAPTE LA ESENCIA
DEL PROBLEMA ECONMICO FUNDAMENTAL QUE DEBE
RESOLVER.

Dado

que sera imposible describir exhaustivamente las


caractersticas de una economa, los economistas han decidido hacer
abstracciones de las inmensas complejidades del mundo real y
elaborar modelos bastante sencillos para recoger lo esencial. Recogen
rasgos comunes a todas las actividades econmicas. De la misma
manera que un MAPA de carreteras resulta til, an cuando no recojan
todas y cada una de las casas, estaciones de servicio, etc. Los
modelos econmicos del mercado resultan tiles an cuando no
recojan todos y cada uno de los mnimos detalles de la economa.

Los economistas tratan de abordar su disciplina con la objetividad del

cientfico, enfocan el estudio de la economa de una forma muy


parecida como el fsico enfoca el estudio de la materia y el bilogo el
estudio de la vida: elaboran teoras y recogen datos para tratar de
verificarlas o refutarlas.

METODOS DE VERIFICACION DE LOS MODELOS


MODELO 2

MODELO 1

Uno de los objetivos importantes de la investigacin cientfica ES DISTINGUIR


ENTRE LOS MODELOS BUENOS Y LOS MALOS
Dos mtodos se han utilizado
para verificar los modelos

MTODO DIRECTO

MTODO
INDIRECTO

METODO DIRECTO:

METODO INDIRECTO:

Trata de AVERIGUAR LA
VALIDEZ DE LOS
SUPUESTOS BSICOS
en los que se basa el
modelo

Intenta confirmar la validez


de un modelo a travs de
sus PREDICCIONES

EJEMPLO: Modelo de empresas maximizadoras de


beneficio

Pretenden realmente las


empresas obtener los mximos
beneficios posibles? No considera
el hecho de que puedan haber
otros intereses, es decir que las
empresas tal vez persiguen
incrementar sus ventas, motivos
personales

Enviar a los
directivos de las
empresas
cuestionarios
preguntndoles
qu objetivo
persiguen

El modelo de maximizacin de los


beneficios podra contrastarse
tratando de predecir las conductas
de las empresas en el mundo real
suponiendo que estas se
comportan como maximizadoras.
SI SE PREDICE DE ACUERDO
CON LA REALIDAD SE ACEPTA
EL MODELO

CARACTERISTICAS DE LOS MODELOS


Los supuestos especficos empleados y el grado de detalle varan extraordinariamente dependiendo
del problema abordado. Sin EMBARGO CASI TODOS LOS MODELOS TIENEN TRES
ELEMENTOS COMUNES:

1) EL SUPUESTO CETERIS
PARIBUS: Todo lo dems
permanece constante. Ejemplo:
Modelo de la Oferta y la Demanda
No se supone que las otras variables
no afectan a la variable estudiada sino
que no varan durante el perodo en
estudio.
Permite estudiar en
un contexto
simplificado el
hecho de inters, por
lo cual es posible
comprender CMO
FUNCIONAN LAS
FUERZAS
ESPECFICAS

Plantea
PROBLEMAS
DE
VERIFICACION
DEL MODELO
en el mundo real

2) SUPUESTO DE QUE TODOS


LOS AGENTES QUE TOMAN
DECISIONES ECONMICAS
TRATAN DE OPTIMIZAR ALGO.
Los agentes econmicos
PERSIGUEN UN OBJETIVO.
Suponen que los agentes son
RACIONALES.
Constituyen un PUNTO DE PARTIDA
para el desarrollo de modelos. Es un
marco de referencia, que le permite
elaborar un anlisis sistemtico de la
conducta econmica individual

Dos MOTIVOS DE ACEPTACIN:


Son PRODUCTIVOS
GENERAN MODELOS
PRECISOS Y
SOLUBLES. Debido a la
capacidad de recurrir a
toda una variedad de
TCNICAS
MATMATICAS.

APARENTE validez
emprica. Parecen
ser bastante buenos
para explicar la
realidad

3) Se CENTRAN
EN EL ANALISIS
POSITIVO, pues
tratan de explicar
un fenmeno.

Teora Econmica, Estadstica y Econometra

La T.E. hace afirmaciones o formula


hiptesis de naturaleza cualitativa.
La economa matemtica expresa la teora
econmica en forma matemtica o
ecuaciones sin la verificacin emprica de
la teora.
La estadstica econmica se centra en
recoleccin, procesamiento y presentacin
de cifras en forma de grficos y tablas

Los datos recogidos por la estadstica es


la materia prima del econometrista sin
embargo el trabajo del estadstico
econmico no va mas all de la
recoleccin pues no le concierne la
validacin o refutacin de teoras
econmicas.
El econometrista propone estimaciones
numricas por lo que la econometra se
ocupa de dar contenido o verificacin
emprica a las teoras econmicas.

Los datos y su manejo


Como se obtienen datos econmicos?
No proceden de experimentos controlados
sino que los economistas al igual que otros
investigadores del campo de las Ciencias
Sociales obtienen los datos de la
observacin de la realidad.
En un experimento controlado, como los
realizados en laboratorios, el investigador
tiene control sobre las condiciones del
estudio.

Los datos obtenidos de experimentos


controlados son tpicos de las Ciencias
Naturales y se conocen como datos
experimentales.
Los datos que son resultado de un proceso
que tiene lugar en la sociedad, y que no es
controlable por una o varias personas, se
conocen como datos no experimentales.
Esta caracterstica ha sido un factor importante
en el desarrollo de las tcnicas economtricas
y debemos tenerlo en cuenta en la
interpretacin de los resultados.

Fuentes de informacin
Corte

transversal
Series de tiempo
Datos panel

Base de datos de corte


tranversal
Consiste en una muestra de

individuos,
hogares, empresas, ciudades, estados pases u
otras unidades, tomadas en algn punto en el
tiempo.

Series

de tiempo

Consiste de las observaciones de una o varias


variables a lo largo del tiempo. Ejemplo. PIB,
IPC, Precios de Bienes y Consumo, Salarios

Datos panel

Combinacin de series de tiempo y corte


transversal

Corte Transversal
Departamentos

Viviendas Censo 2005

EMNV 2005

Jinotega

67,197

391

0.58%

Madriz

28,330

368

1.30%

Chinandega

84,095

335

0.40%

Len

82,994

306

0.37%

Matagalpa

100,584

370

0.37%

Boaco

32,877

387

1.18%

Managua

271,534

554

0.20%

Base de datos-Series de
Tiempo

Datos panel

Taller de Anlisis
Economtrico
Sesin 02

GENERALIDADES DE
ECONOMETRIA

ASPECTOS BASICOS DE ECONOMETRIA


DEFINICION
Literalmente significa medicin econmica
Es la ciencia social la cual mediante las
herramientas
de:
teora
econmica,
las
matemticas y la estadstica se aplican al anlisis
de los fenmenos econmicos.
En trminos ms generales, la econometra se
ocupa de:
(1) estimar relaciones econmicas,
(2) contrastar la teora econmica con los datos e
hiptesis relativas al comportamiento econmico, y
(3) predecir el comportamiento de variables
econmicas.

DEFICION DE ECONOMETRIA: Literalmente, econometra significa medicin


econmica (derivada de econo, economa y metra, medicin).
El alcance de esta disciplina es mucho ms amplio, como puede deducirse de las
siguientes citas:
La econometra, es el resultado de cierta perspectiva sobre el papel que juega la
economa, consiste en la aplicacin de la estadstica matemtica a la informacin
econmica para dar soporte emprico a los modelos construidos por la economa
matemtica y obtener resultados.
La econometra puede ser definida como el anlisis cuantitativo de fenmenos
econmicos reales, basado en el desarrollo simultaneo de teora y observaciones,
y relacionado por mtodos apropiados de inferencia.
La econometra puede ser definida como la ciencia social en la cual las
herramientas de la teora econmica, las matemticas y la inferencia estadstica
son aplicadas al anlisis de los fenmenos econmicos.
La econometra tiene que ver con la determinacin emprica de las leyes
econmicas.
El arte del econometra consiste en encontrar el conjunto de supuestos que sean
suficientemente especficos y realistas, de tal forma que le permitan aprovechar de
la mejor manera los datos que tiene a su disposicin.

Naturaleza de la econometra.
La econometra es un amalgama o
mezcla de la matemticas, inferencia,
muestreo y teora econmica; su estudio
esta
naturalmente
basado
en
proporcionar estimaciones numricas,
cuantitativas o de dar contenido emprico
a la mayora de las teoras econmicas
ya que esta realiza afirmaciones o
formula hiptesis principalmente de
naturaleza cualitativa.

Tipos de Econometra.Se puede dividir en las siguientes ramas:


a.- Econometra terica.- le concierne el
desarrollo de mtodos apropiados para
medir las relaciones econmicas
determinados por los modelos
economtricos. Es preocupacin de esta
rama de aclarar los supuestos de la
aplicacin de los mtodos economtricos
utilizados as como sus propiedades y la
manera como se afectan dichas
propiedades.

Econometra aplicada.- es aquella que usa


las herramientas de la econometra terica
para estudiar algunos campos especiales de
la economa.
Funciones de la Econometra
La econometra cumple tres funciones :
Probar las Teoras Econmicas o hiptesis
Estimacin numrica de los coeficientes de
las relaciones econmicas.
La prediccin de los sucesos econmicos

El objetivo de la Econometra
El objetivo de un estudio economtrico
es:
Expresar la teora econmica en trminos

matemticos, verificar dicha teora por


mtodos estadsticos, medir el impacto de una
variable sobre otra, predecir los sucesos
futuros, o proveer recomendaciones de la
poltica econmica.
El instrumento bsico es el modelo, que ayuda
a entender las relaciones entre variables
econmicas y sirve para evaluar los efectos de
distintas medidas o polticas econmicas.

Metodologa de la Econometra.Todo procedimiento economtrico sigue los siguientes pasos: la especificacin, la


estimacin, la verificacin y la prediccin. A continuacin se presenta una breve
descripcin de cada etapa:
1. Especificacin: corresponde a la etapa en que el investigador define la forma
funcional del modelo que desea utilizar para explicar la variable dependiente
siguiendo los lineamientos de la teora econmica.
2. Estimacin: durante esta se calculan los valores numricos de los coeficientes
o parmetros del modelo; para ello es necesario apoyarse en los mtodos de
estimacin y la aplicacin de rutinas de computador usando paquetes
estadsticos (Eviews).
3. Verificacin: consiste en corroborar la validez terica y estadstica del modelo,
es decir, evaluar si los signos obtenidos para los coeficientes estimados son
los esperados y si el modelo cuenta con propiedades estadsticas adecuadas
(buen ajuste, alta relevancia y dependencia).
4. Prediccin: muchas veces los modelos elaborados por los economistas no
tienen solo como objeto mostrar la relacin entre variables y la magnitud de
dicha relacin entre estas a travs de una forma funcional, sino que adems
los modelos tienen implicaciones en trminos de prediccin.

Metodologa de la Econometra.Sigue la siguiente metodologa:


1.-Teora econmica y/o establecimiento de
relaciones funcionales
2.- Modelo economtrico de la teora o
agrupamiento de relaciones
3.- Recoleccin de cifras apropiadas
4.- Estimacin de los parmetros del modelo
5.- Inferencia Estadstica
6.- Prediccin si los datos son compatibles con
la teora
7.- Rechazar la teora si las cifras no son
compatibles con la teora
8.- Revisin de la teora

CAMPO DE LA ECONOMETRIA
MINIMOS CUADRADOS ORDINARIOS

ECUACION SINGULAR

METODOS

MINIMO CUADRADO GENERALIZADO

ECUACIONES SIMULTANEAS

ESTIMACION
VERIFICACION
PREDICCION
VARIABLES FICTICIAS
RESTRICCION LINEALES
AGRUPAMIET DE VARIB
ERROR DEE SPECIFICA
MULTICOLINEALIDAD
VARABLES RETARDADAS
ERROR EN VARIABLES
AUTORRELACION
HETEROSCEDASTICIDAD

IDENTIFICACION
MINIMOS CUADRADOS EN DOS ETAPAS
MINIMOS CUADRADOS EN TRES ETAPAS
ESTIMACION
MAXIMA VEROSIMILITUD
INFORMACION LIMITADA

MODELOS DE LA ECONOMIA NACIONAL

AGREGADOS
MENOS AGREGADOS
ALTAMENTE AGREGADOS

APLICACIONES

MODELOS SECTORIALES

COMPORTAMIENTO DEL CONSUMIDOR


EMPRESAS E INDUSTRIAS
COMERCIO EXTERIOR

Sesin 03

Regresin Lineal Simple

Qu vamos a estudiar?

Vamos a buscar la mejor


estimacin del modelo de
Regresin Lineal

Yi x i i

errores casuales
Parmetros

Error
Residual

errores de medicin
deficiencias del modelo

i es la parte de yi que no est


explicada por la regresin lineal
de Y sobre xi .

Introduccin
En esta sesin consideraremos la
situacin en la que nos interesa
establecer estadsticamente:
Si existe una relacin entre dos variables
En caso afirmativo, calcular una ecuacin que
plasme dicha relacin

Introduccin
Ejemplos:
Existe una relacin entre lo que gasta un hotel y
su volumen de ocupacin durante un ao?
Se puede calcular el costo de la calefaccin de
una oficina con base en el rea de la recepcin?
Hay alguna relacin entre la antigedad en el
trabajo de un empleado y de produccin y el
nmero de unidades que elabora?

Introduccin
Nuestro inters por saber si hay una
relacin entre las variables y en tal caso
determinar cmo se debe a que existe una
variable que nos interesa medir, a la cual
llamamos variable dependiente,
explicada, predecida, regresada o variable
respuesta (y la representamos como Y)
Ocurre que Y es difcil o costosa de medir

Introduccin
Existe otra variable que por s misma no
nos interesa, a la cual llamamos variable
independiente, explicatoria, regresor, de
control o variable explicativa (y
representamos por X)
Esta variable X es ms fcil o menos
costosa de medir que Y, adems de que
sospechamos existe una relacin funcional
entre ambas variables

Introduccin
A los modelos estadsticos que nos permiten
predecir valores de una variable, digamos Y, con
base en otra, por ejemplo X, se les llama mtodos
de regresin
A la relacin funcional que se expresa las relaciones
entre variables, se le llama modelo de regresin
Aquella tcnica multivariable que tienen como fin
determinar la causa y efecto de los valores de Y (sin
medirlos) a partir de valores de X (los cuales s
medimos) se conoce como Anlisis de regresin
Esto se hace con base en una muestra

REGRESION
Est referida a expresar la relacin de
dependencia de una variable
dependiente, explicada por una o ms
variables explicatorias,
objeto de estimar o predecir la media o
valor promedio (poblacional) de la variable
dependiente con base en los valores
conocidos o fijados ( en muestra repetidas
) de las variables explicatorias o
independientes.

Tipos de Regresin
Al hablarse de anlisis de regresin se
puede diferenciar dos tipos de anlisis de
regresin:
regresin simple; es cuando se estudia la
dependencia de una variable mediante el
uso de una variable explicitara o
independiente;
y es regresin mltiple cuando la
dependencia de una variable est en funcin
en ms de una variable exploratoria.

Independencia - Dependencia
Cuando se estudian dos caractersticas simultneamente sobre una
muestra, se puede considerar que una de ellas influye sobre la otra de
alguna manera. Por ejemplo la altura y el peso o las horas de estudio y la
calificacin en un examen.
El objetivo principal de la regresin es descubrir el modo en que se
relacionan.
Dos variables pueden considerarse:
Variables independientes No tienen relacin (una de ellas no sirve para
explicar los movimientos de la otra)
Dependencia funcional Y=f (x) se ocupa de variables no aleatorias ni
estocsticas.
Dependencia estadstica Y=f (x) + e; maneja variables aleatorias o las
que tienen distribucin de probabilidad.

Dependencia estadstica

Dependencia
estadstica

Dependencia funcional

Grado de asociacin entre dos variables

Variables aleatoria

Tambin se les conoce como variable


estocstica y son aquellas que pueden
tomar cualquier conjunto de valores +/- e
incluyen variables que no pueden
explicar a la variable respuesta o
dependiente por lo que se les conoce
como variable error (e)

Regresin y causalidad

Aunque la regresin se ocupa de


dependencia de una variable en relacin
con otra variable independiente, no
necesariamente implica ello dependencia.
Una relacin estadstica por ms fuerte
que sea, no puede nunca establecer una
conexin causal; las ideas de causalidad
vienen de fuera de la estadstica, es decir
de otra teora que impliquen
consideraciones apriorsticas.

Regresin vs correlacin

El anlisis de correlacin es conceptualmente


muy distinto del anlisis de regresin ya que su
objetivo es medir la fuerza o grado de
asociacin lineal entre dos variables en cambio
el anlisis de regresin trata de estimar o
predecir el valor promedio de una variable con
base en valores fijos de otra.
En el anlisis correlacional se basa en el
supuesto de aleatoriedad de las variables,
mientras que la mayor parte de la teora de
regresin est condicionada por el supuesto
de que la variable dependiente es estocstica
o aleatoria, mientras que las variables
explicatorias son fijas o no estocsticas.

GRFICOS DE DISPERSIN: Permite ver si hay


asociacin
Dadas dos variables X y Y tomadas sobre el mismo
elemento de la poblacin, el diagrama de dispersin es
simplemente un grfico de dos dimensiones, donde en un
eje (la abscisa) se sita una variable, y en el otro eje (la
ordenada) se sita la otra variable. Si las variables estn
correlacionadas, el grfico mostrara algn nivel de
correlacin (tendencia) entre las dos variables. Si no hay
ninguna correlacin, el grfico presentara una figura sin
forma, una nube de puntos dispersos en el grfico.
Asociacin
positiva. Si
aumenta X
aumenta Y

GRFICOS DE DISPERSIN / RECTA DE


REGRESIN

La relacin entre dos variables mtricas puede ser


representada mediante la lnea de mejor ajuste a los
datos. Esta recta se le denomina recta de regresin,
regresin
que puede ser negativa o positiva, la primera con
tendencia decreciente y la segunda creciente.

GRFICOS DE DISPERSIN / RECTA DE


REGRESIN
Para el clculo de la
recta de regresin se aplica el
mtodo de mnimos cuadrados entre dos variables.
Esta lnea es la que hace mnima la suma de los
cuadrados de los residuos, es decir, es aquella recta en
la que las diferencias elevadas al cuadrado entre los
valores calculados por la ecuacin de la recta y los
valores reales de la serie, son las menores posibles.

y=a+
bx

Modelo de regresin lineal simple


La forma ms sencilla de relacin entre dos
variables es una lnea recta
Cuando se supone que la relacin entre las
variables se puede expresar como una recta, se
dice que se tiene un modelo de regresin lineal
Cuando se tiene solamente una variable
explicativa, se dice que se trata de un modelo de
regresin simple
Por tanto, si se cuenta con solamente una
variable explicativa y se supone que la relacin
de esta con la variable respuesta est dada por
una lnea recta, se dice que tenemos un modelo
de regresin lineal simple (RLS)

Modelo de regresin lineal simple

Cuando la relacin entre dos variables es una


lnea recta, basta con dos valores para
determinar cul es dicha recta
La ordenada al origen: Es el valor que nos
indica en qu punto del eje Y pasa la recta
Pendiente: Es una medida de la inclinacin de
la recta. Si la pendiente es
Negativa, la recta est inclinada hacia abajo
(vindola de izquierda a derecha)
Cero, la recta es horizontal
Positiva, la recta est inclinada hacia arriba
(vindola de izquierda a derecha)

Recta con pendiente negativa

Tipos de
pendiente

Recta con pendiente cero

Recta con pendiente positiva

Eje Y

Recta
y = a + bx

Ordenada
al origen

La pendiente es la
tangente del ngulo
g:
b = tan(g)

Eje X

Recta de regresin

Pendiente

yn

yi

yn 1

y3

u3

yi
y1

ui
yi

y2

Intercepto

x1

x2

x3

xi

xn 1

yi a bxi ui

xn

ui yi yi
Error

Fundamentos Basicos del MRL

El Modelo de Gauss, modelo clsico de


regresin lineal, plantea siete supuestos:
Linealidad
Homogeneidad
Homoscedasticidad
Independencia
Normalidad
Negatividad de correlacin
Incompatibilidad de parmetro y
observaciones

1. El trmino de Error es una variable aleatoria con media cero: E ( i ) 0


2
Var
(

i
2. Homocedasticidad: la varianza del trmino de error es constante:

3. Los errores se distribuyen normalmente: i N (0, 2 )


4. Los errores son independientes entre s.
Las hiptesis anteriores pueden formularse de manera equivalente
en trminos de la variable criterio. As,
E )/(XYi Xi

E( Y / Xi ) X i

ar
V
Y
X

)/(

1. La media de Y depende linealmente de


X:
2. La varianza de Y es constante:

E (Y / X i ) X i

3. La distribucin de Y es normal para cada X:

Var (Y / X i ) 2
Y / X i N ( X i , 2 )

4. Las observaciones Yi son independientes entre s.

Condicin de linealidad
Significado del trmino Lineal
Se interpreta de dos maneras:
- Linealidad en las variables se da cuando
geomtricamente la curva de regresin es una
lnea recta o cuando sus variables explicatoria
aparecen con potencia igual a la unidad y no
est multiplicada ni dividida por otra variable;
como: Yi = + 1Xk
- Linealidad en los parmetros se da cuando
dichos parmetros aparecen con potencia de 1 y
no se encuentran multiplicados ni divididos por
otra variable, como: E(Y/Xi) = + 1 X2.

CONDICION DE MOMOCEDASTICIDAD
La varianza de ui para cada Xi e un
numero positivo constante e igual a 2 ,
Es decir que la Yi poblacionales que corresponden a
varios valores de X tienen la misma varianza.

Var(ui/Xi) =

Homoscedasticidad
y
f(y|x)

.
x1

.E(y|x) = + x
0

x2
80

Heteroscedasticidad
y

f(y|x)

.
x1

x2

x3

E(y|x) = 0 + 1x

x
81

Resumen grfico de las hiptesis bsicas


formuladas en trminos de la variable criterio
y2 / x y2 / x y2 / x y2 / x
1

Distribucin Normal

X1,

X2,

X3,

X4

Resumen grfico de las hiptesis bsicas


formuladas en trminos de los residuos

X1,

X2,

X3,

X4

Notacin economtrica
En lo sucesivo, utilizaremos la letra
griega para representar los
coeficientes del modelo de regresin
lineal
0 para la ordenada al origen
1 para la pendiente
Y = + 1Xi + e .
As que la grfica anterior queda como
sigue

Concepto de la Funcin de Regresin


Poblacional ( FRP ).-

conocida tambin como funcin de


regresin lineal poblacional, modelo de
regresin lineal poblacional o ecuacin
de regresin lineal poblacional.
Obviamente regresin, ecuacin de
regresin y modelo de regresin son
sinnimos.

La FRP conocida tambin como lnea de


regresin de Y sobre X, es simplemente
el lugar geomtrico de las medias
condicionales, expectativas
condicionales E(YlX) o valor promedio e
la variable dependiente para valores fijos
de las variables explicatorias, se expresa
como:
E ( Yl Xi ) = f (Xi ) = + 1Xi.
Expresa que la media (poblacional) de la
distribucin de Y dado Xi esta
funcionalmente relacionada con Xi

Cuando los puntos o medias


condicionales no caen sobre una lnea
recta de la ecuacin Y = + 1Xi; esta
debe ser modificada para incluir una
variable de perturbacin aleatoria error o
termino estocstico y se vuelva como: Yi
= + 1Xi + ei .
Donde:
; 1 son coeficientes de regresin,
es el intercepto y 1 la pendiente

Especificacin estocstica de la FRP

El termino estocstico est relacionado


con lo que se conoce en estadstica error
estadstico o perturbacin estocstica
expresada por el trmino e en la
funcin:
Yi = E(Y/Xi)+ e, o tambin
Yi = + 1 Xk + ei
ei = Yi - E(Y/Xi)

Funcin de Regresin Muestral


( FRM )
Considerando que en la practica lo que se tiene al
alcance como datos no es mas que muestras de
valores de Y que corresponden a valores fijo de X, por
lo que se requiere estimar la FRP con base en
informacin muestral.
se puede estimar la FRP a partir de lo datos de la
muestra?.
Se desarrolla encontrando un estimador o estadstico
muestral que es una formula o mtodo para estimar el
parmetro poblacional a partir de la informacin de la
muestra disponible, la cual e denota como:

Funcin de Regresin Muestral

Al igual que la FRP en la cual se basa la lnea de


regresin poblacional, se desarrolla el concepto de
funcin de regresin muestral (FRM) para
representar la lnea de regresin muestral. La cual
se puede escribirse como:

ESTIMACION DE LA FRP
En el anlisis de regresin interesa estimar una FRP,
es decir estimar los valores de las incgnitas o
parmetro a y b ( , 1 ) con base en las
observaciones de Y y x; dada la siguiente funcin:
Y=f(X)
Yi = + 1 Xk
E( Y/Xi ) = f(Xi )
Dnde: f(Xi ); denota una funcin de la variable
explicatoria Xi y la E( Y/Xi ) es una funcin lineal de Xi
y representa a la FRP de dos variables expresada por:
E(Y/Xi) = + 1Xi

Las poblaciones son descriptas mediante sus


parmetros y su distribucin de
probabilidades.
Para variables cuantitativas, las
poblaciones son descriptas mediante y
Para

variables cualitativas, las poblaciones


son descriptas mediante p.
Si los valores de los parmetros son
desconocidos, podemos estimarlos en base a
muestras y esperamos que sean una buena
aproximacin al valor exacto

Estimacin de Parmetros: puntual y por


intervalos
Como ya hemos visto, a partir de los estadsticos que hemos
obtenido en la/s muestra/s queremos obtener una idea de
los valores de los parmetros en la poblacin.
Se trata de emplear los estadsticos para estimar los
parmetros.
Veremos DOS tipos de estimadores:
1) Estimacin puntual. Aqu obtendremos un punto, un valor,

como estimacin del parmetro.


2) Estimacin por intervalos. Aqu obtendremos un intervalo

dentro del cual estimamos (bajo cierta probabilidad) estar


el parmetro.

Se trata de emplear los estadsticos para estimar los


parmetros.
Veremos DOS tipos de estimadores:
1).Estimacin puntual. Aqu obtendremos un
punto, un valor, como estimacin del parmetro.
Un estimador puntual es simplemente un
estadstico (media aritmtica, varianza, etc.) que
se emplea para estimar parmetros (media
poblacional, varianza poblacional, etc.).
Es decir, cuando obtenemos una media
aritmtica a partir de una muestra, tal valor
puede ser empleado como un estimador para el
1 n
valor de la media poblacional.
X
X
n

i 1

ESTIMACION POR INTERVALO


2). Estimacin por intervalos. Cuando en
vez de un solo valor colocamos dos
valores, uno inferior y otro superior y
suponemos que en medio de esos dos
esta el valor que deseamos estimar,
entonces hacemos una estimacin por
intervalo.
Los estimadores se calculan tras dos
nmeros para crear un rango de valores que
se espera contenga al parmetro con una
cierta probabilidad o nivel de confianza

La estimacin por intervalo establece un


intervalo dentro del cual es muy probable que
se encuentre el parmetro poblacional .
El coeficiente de confianza se usa para indicar
la probabilidad de que una estimacin por
intervalo contenga al parmetro poblacional.
El nivel de confianza es el coeficiente de
confianza expresado como un porcentaje.
97

Propiedades deseables en los


estimadores
Veremos CUATRO propiedades:

1. Ausencia de sesgo
2. Consistencia
3. Eficiencia
4. Suficiencia

Insesgado: Un estimador es insesgado cuando la


esperanza del estimador es igual al valor del
parmetro que se desea estimar. Ej: E( x ) =

Consistente: A medida que el tamao de la


muestra aumenta el estimador debe tender al
valor del parmetro y su variancia debe tender a
cero
Eficiente: Un estimador es eficiente cuando tiene
variancia mnima.
Suficiente: El estimador es suficiente cuando
aprovecha toda la informacin existente en la
99
muestra

Error muestral: es la distancia entre el


estimador puntual y el verdadero valor del
parmetro
Pero si el valor del parmetro se desconoce
cmo podemos cuantificar el error
muestral?
Para eso es til conocer la distribucin de
probabilidades (distribucin muestral) del
estimador

Propiedades deseables en los estimadores (1)


Un estimador es insesgado cuando la esperanza del estimador
es igual al valor del parmetro que se desea estimar.
)

)
1.-Ser insesgado. Diremos que el
si la esperanza de

un estimador insesgado
del parmetro
)
es igual a su
Es decir,E ( )

La media muestral es un estimador insesgado de la media


poblacional. Por el contrario, el estimador se dice viciado si su
esperanza es distinta al parmetro.

Pero la varianza muestral NO es un estimador insesgado de la


varianza poblacional, pero s lo es en cambio la cuasivarianza.

Propiedades deseables en los


estimadores (2)
A medida que el tamao de la muestra aumenta el estimador debe tender al
valor del parmetro y su variancia debe tender a cero

2. Consistencia. Se dice )que un estimador es consistente si se cumple


lim P 0
que
n

Esta expresin indica que a medida que se incrementa el tamao muestral, la


diferencia entre el estimador y el parmetro ser menos que cualquier nmero
().
A diferencia de la ausencia de sesgo que se define para valores finitos de n, la
consistencia es una propiedad asinttica.
Tanto la media muestral como la cuasivarianza son estimadores consistentes.
Nota: la varianza muestral ES un estimador consistente de la varianza
poblacional, dado que a medida que el tamao muestral se incrementa, el sesgo
disminuye y disminuye.

Propiedades deseables en los


estimadores (3)
)
1

3. Eficiencia. Se emplea para COMPARAR estimadores.

) )
1 2

Si tenemos dos estimadores


y de un mismo
parmetro
, diremos que
)
)
)
1
2 si tenemos que var()<var()
2
es ms eficiente que
Se puede comprobar que la varianza muestral es ms eficiente que la
)
cuasivarianza muestral
a la hora de estimar la varianza poblacional. (An

as, se prefiere la cuasivarianza muestral como estimador de la varianza


poblacional por ser un estimador insesgado.)
2

Propiedades deseables en los


estimadores (4)
)

es un estimadorsuficiente del parmetro


si dicho estimador basta por s solo para estimar

4. Suficiencia. Diremos que

METODOS DE ESTIMACION DE LA FRP


Existen varios mtodos para estimar la
funcin de regresin poblacional (FRP)en
base a la FRM para el anlisis de
regresin:
Mtodo de los cuadrados mnimos
ordinarios (CMO)
Mtodo de mxima verosimilitud (MMV)
Mtodo de los Momentos

El criterio de estimacin mnimo-cuadrtico

Dados el modelo y una muestra, debemos


decidir cmo obtener la funcin de regresin
muestral (FRM), es decir, cmo calcular las
estimaciones y a partir de los datos.
Un mtodo muy utilizado por su sencillez y
buenas propiedades es el mtodo de
mnimos cuadrados ordinarios. El estimador
de Mnimos Cuadrados Ordinarios, o
MCO, de los parmetros y se obtiene de
minimizar la suma de los residuos al
cuadrado:

Mtodo de los Mnimos Cuadrados Ordinarios.


(MCO)
La regresin lineal es una de las tcnicas ms
utilizadas en el trabajo economtrico. Mediante dicha
tcnica tratamos de determinar o ajustar relaciones de
dependencia de tipo lineal entre una variable
dependiente o endgena, Y, respecto de una o varias
variables explicativas o exgenas Xi de forma ptima.
En este epgrafe comenzaremos el estudio del caso de
una nica ecuacin de tipo lineal con una variable
dependiente y una independiente, partiendo de la
Minimizacin la suma de los cuadrados de las
desviaciones entre los puntos y la lnea.

MTODO DE LOS MNIMOS CUADRADOS


ORDINARIOS (MCO)
Tcnica adecuada para obtener un ajuste optimo de
una lnea recta a una serie de datos u observaciones
XY.
Min ( Yi i )
Donde: Yi son observaciones reales y i valores
ajustados as ( Yi i ) = ui es el residuo.
La recta ajustada por el MCO es la recta del mejor
ajuste, es decir se indica que de esta manera resulta
minimizada
la suma
de cuadrados de las
desviaciones de los dato respecto a la recta.
Para dicha tcnica e utiliza las ecuaciones normales.

MTODO DE LOS MNIMOS CUADRADOS


ORDINARIOS (MCO)

Recuerde que la FRP de dos variables es:


Yi = 1 + 2 Xi + ui
Sin embargo, la FRP no es observable
directamente. Se calcula a partir de la
FRM:
Yi = 1 + 2 Xi + ui
Yi +u
Donde: Yi es el valor estimado (media
condicional) de Yi.
Y cmo se determina la FRM?

Mnimos Cuadrados Ordinarios

Llamemos a e perturbacin o error, siendo la diferencia que hay entre el


valor observado de la variable exgena (y) y el valor estimado que
obtendremos a travs de la recta de regresin yi .

y i a bxi
La metodologa para la obtencin de la recta ser hacer MNIMA la suma de
los CUADRADOS de las perturbaciones. Por qu se elevan al cuadrado?

Min ( Yi )
n

2
u
i

u ( yi yi ) 2
2
i

i 1

(
y

y
)
i i
i 1

min
u ( yi y i ) yi aq bpxi
q, p
i 1
i 1
i 1

2
i

Un enfoque alternativo:
Minimizar residuales al cuadrado

Siguiendo la idea de ajustar una lnea de


regresin, podemos plantear un problema de
minimizacin.
Es decir, buscar parmetros tales que
minimicen la siguiente expresin:

ui
i 1

yi 0 1 xi
i 1

112

Sobre el estimador MCO de 1

1, es la covarianza muestral entre x y y,


dividida entre la varianza muestral de x.
Si x y y estn correlacionados positivamente,
1 ser positivo (pues la varianza del
denominador siempre es positiva).
Si x y y estn correlacionados negativamente,
1 ser negativo.
Si x y y no tienen correlacin alguna, 1 no
ser estadsticamente distinto de cero
(volveremos a esto ms tarde).
Obviamente, requerimos que x tenga cierta
varianza en la muestra.
113

Intuitivamente, MCO ajusta una lnea a


travs de los datos muestrale, de modo
que la suma de residuales al cuadrado
(SSR) sea la mnima posible: de ah el
trmino mnimos cuadrados.
El residual, , es un estimado del
trmino de error entre lo observado y lo
predicho, es decir, la diferencia entre la
lnea de regresin (fitted line) y el dato
observado.
Ver grfica...
114

Determinacin matemtica de los Parmetros

Donde: Yi son las observaciones o datos


reales (DR) y las i son los datos
ajustados o pronosticado (DP) ; y las ui
errores lo que nos conduce a determinar:
Y i = n + 1 Xi
XiYi = Xi + 1 Xi
1) = Y - 1 X 2) 1 = xi yi / x
_
_
donde: xi = Xi X ; yi = Yi - Y

Estimador MCO / OLS: intercepto

Dada la definicin de media muestral y las


propiedades de la sumatorias, podemos
reescribir la primera restriccin como sigue:

y 0 1 x ,

i 1

x 0

0
1 i

o bien
y x
0

116

Derivacin de MCO / OLS


Y ahora, sustituyendo 0 en la segunda restriccin, tenemos:

i 1

x 0
x
y

i i 0 1i

x x 0
x
y

i i
1
1 i
i 1
n

x
y

i i
1 xi xi x

Aqui
hay
1 un paso mgico ver apndice A.7i y 1A.8.

i 1

i 1

xi x yi y 1 xi x

117

estimador MCO / OLS: pendiente

i 1

i 1

1 xi x xi x yi y
n

x x y
i

i 1

x x
i 1

y
2

cov( x, y )

var( x)

toda vez que x tenga varianza :

x x
i 1

0
118

MTODO DE LOS MNIMOS CUADRADOS


ORDINARIOS (MCO)

MTODO DE LOS MNIMOS CUADRADOS


ORDINARIOS (MCO)

Los estimadores obtenidos antes se


conocen
como
estimadores
de
mnimos cuadrados, pues se derivan
del principio de mnimos cuadrados.
Observe las siguientes propiedades
numricas
de
los
estimadores
obtenidos con el mtodo de MCO:
Propiedades numricas son las que se
mantienen como consecuencia del uso
de mnimos cuadrados ordinarios, sin
considerar la forma como se generaron
los datos

Precisin de lo Estimadores
En estadstica , la precisin de un valor
estimado se mide por u error estndar
(ee) lo que se pueden obtener de la
forma siguiente:

Propiedades algebraicas de MCO / OLS

Al minimizar los residuales cuadrados:


La suma de los residuales de MCO ser igual a
cero.
Por ende, la media muestral de los residuales
ser cero tambin.
La covarianza muestral entre las variables
explicativas y los residuales ser cero.
La lnea de regresin de MCO siempre cruzar
la media de la muestra, ie, la media de x y la
media de y.
124

Mediada de Bondad de Ajuste


El coeciente de determinacin r (caso
de dos variables) o R (regresin
mltiple) es una medida comprendida
que dice cun bien se ajusta la lnea de
regresin muestral a los datos.

Estimadores de mnimos
cuadrados
Utilizando procedimientos de clculo
vectorial (que estn fuera del alcance de
este curso), se puede ver que las
expresiones para los estimadores de
mnimos cuadrados para el modelo de
regresin lineal simple son:
S xy
1
S xx

0 y 1 x

Ejemplo
Suponga que se quiere establecer una
relacin entre el nmero de artculos que
adquiere una persona en una tienda de
autoservicio (X) y el tiempo que toma
atenderle en la caja registradora (Y)
Supongamos que podemos asumir que
dicha relacin es lineal (mientras ms cosas
compre, ms se tardar en cobrarle)
Si la relacin fuera perfectamente lineal, la
expresin que relaciona a X con Y sera
Y 0 1 X

Ejemplo
Sin embargo, no es realista pensar que la
relacin sea perfectamente lineal
Existen otros factores que podran influir en
el tiempo que no estamos tomando en
cuenta:

El tipo de artculos (no solamente la cantidad)


Caractersticas de la persona que compra
Caractersticas de la cajera que atiende
La hora del da
La fecha del ao
Etc

Ejemplo
Por tanto, cada observacin que hagamos del
tiempo (Y), estar determinada en parte por la
cantidad de artculos (X), pero tambin tendr un
componente de error
La expresin que relaciona a Y con X es entonces
Y 0 1 X

Donde el trmino de error contiene todas las


variaciones debidas a todos los factores que
influyen en Y y nuestro modelo no toma en cuenta
A fin de cuentas, lo expresamos como
Porque como tenemos
una muestra,
x
yi solamente
0
1 i
tendremos estimaciones de los parmetros 0 y 1

Ejemplo
Supongamos que
X
tomamos datos y
(Artculos)
obtuvimos lo
8
siguiente
28
Lo primero que
18
podemos hacer es
elaborar una grfica
5
de dispersin de los
15
datos

Y
(Tiempo)
6
7
3
2
4

Recta de regresin
Un primer problema que observamos es
que habra varias formas de hacer pasar
una recta por entre los puntos
Cul de todas ellas deberamos elegir?

Qu recta
empleamos?

Recta de regresin
Para poder escoger una recta, se
impone una restriccin:
Escogeremos aquella recta que est lo
ms cerca posible de todos los puntos
Matemticamente, esto se expresa como
la recta que minimice las distancias de
los puntos a la recta

Recta de regresin

A estas distancias, se les denomina


errores y se les calcula ecomo

i y y
Estas distancias se toman al cuadrado,
por lo que a la recta resultante se le
llama de mnimos cuadrados
Recordemos que tenemos solamente
una muestra, por tanto, la expresin que
calculemos para la recta es una
aproximacin mediante estimadores

Error
e2

Error
e4

Estimadores de mnimos
cuadrados
Utilizando procedimientos de clculo
vectorial (que estn fuera del alcance de
este curso), se puede ver que las
expresiones para los estimadores de
mnimos cuadrados para el modelo de
regresin lineal simple son:
S xy
1
S xx

0 y 1 x

Estimadores de mnimos
cuadrados
Donde
1
x
n
i 1
n

S xx

2
i

1
xi yi
n
i 1
n

S xy

xi

i 1
n

1
y
n
i 1
n

S yy

xi

i 1
n

2
i

y
i 1

yi

i 1
n

Supuestos bsicos del modelo de regresin lineal simple

Relacin entre X y Y
Existe una relacin entre X y Y que es lineal, ms un
componente de aleatoriedad, al que llamamos error
Es decir, hay una relacin entre las variables que se
puede expresar como Y = 0 + 1X +

Distribucin de los errores,


Para cada valor de X, los errores se distribuyen
N(0,2)
Los errores son independientes entre s
Los errores son independientes del valor de X

Supuestos bsicos del modelo


de RLS
El que los errores se distribuyan N(0,2)
tiene como consecuencia que la variable
Y se distribuya N(0 + 1X, 2)
Esto es importante, porque para que
tenga sentido la aplicacin de un modelo
de RLS, se requiere que la variable Y sea
normal, o al menos continua y simtrica
Si Y no es continua se requiere utilizar
otros modelos de regresin que no son
lineales (por ejemplo, logstica

Ajuste de un modelo de RLS


Para ajustar un modelo de RLS se
requiere que a partir de una muestra de
pares de observaciones del tipo (x,y), se
calculen estimaciones para los
parmetros 0 y 1
El criterio que se usa para la estimacin
se llama de mnimos cuadrados porque
minimiza la suma de los cuadrados de los
n
n
errores
2
2

e y y
i 1

i 1

Ajuste de un modelo de RLS


Se obtiene entonces una recta estimada
x
yi
0
1 i

Se requiere verificar que los datos cumplan los


supuestos del modelo, examinando grficas y
realizando contrastes de hiptesis
Si existen violaciones a dichos supuestos,
debemos identificarlas
En caso de que sea posible, corrija las
violaciones a los supuestos haciendo
transformaciones a los datos (esto no lo
haremos en este curso)

Ajuste de un modelo de RLS

Se requiere determinar si hay


observaciones influyentes o
discrepantes, e identificarlas. En casos
extremos, puede existir la necesidad de
eliminarlas del conjunto de datos
Una vez concluido todo lo anterior, se
puede hacer uso del modelo para
pronosticar valores de Y con base en
valores de X

Verificacin de la validez del modelo


La relacin entre X y Y existe y es lineal:
Grfico de dispersin
Coeficiente de correlacin lineal
Coeficiente de determinacin

Los errores se distribuyen normal, con media


cero, con la misma varianza:
Normalidad: Grfico de probabilidad normal,
Histograma de residuos
Media cero: Grfico de residuos contra la
variable independiente o contra los valores
predichos
Varianzas iguales: dem

Otras consideraciones

Si ocurre una o ms de las siguientes


situaciones:

La relacin entre las variables no es lineal


Los errores no se distribuyen normal
Los errores no tienen la misma varianza

Entonces se puede hacer una


transformacin de variables
En este caso, llame a un especialista en
estadstica

Referencias
Hildebrand, David K. & Ott, Lymann
(1998) Probabilidad y estadstica
aplicadas a la administracin. Addison
Wesley Iberoamericana. Mxico
Mendenhall, W. & Sincich, T. (1997)
Probabilidad y estadstica para ingeniera
y ciencias. Prentice Hall
Hispanoamericana, S. A. Mxico

S-ar putea să vă placă și