Sunteți pe pagina 1din 52

Universidad Autnoma de Tamaulipas

Facultad de Comercio y Administracin Victoria



Daniel Alejandro Gonzlez Bandala
Catedrtico

Nadia Lizeth Ziga Esquivel
Alumna



Cd. Victoria, Tam. Enero Mayo
2013
ECONOMETRA



INDICE
ECONOMETRA. 1
METODOLOGA DE LA ECONOMETRA. 1
1. PLANTEAMIENTO DE LA TEORA O HIPTESIS. 2
2. ESPECIFICACIN DEL MODELO MATEMTICO. 2
3. ESPECIFICACIN DEL MODELO ECONOMTRICO DE CONSUMO. 2
4. OBTENCIN DE DATOS (INFORMACIN). 3
5. ESTIMACIN DE LOS PARMETROS DE MODELO ECONOMTRICO. 5
6. PRUEBA DE HIPTESIS. 6
7. PRONSTICO O PRODICIN. 6
8. USO DEL MODELO PARA FINES DE CONTROL O POLTICA. 7
TIPOS DE ECONOMETRA. 8
EL PAPEL DE LA COMPUTADORA. 9
MODELOS DE REGRESION UNIECUACIONALES. 10
NATURALEZA DEL ANLISIS DE REGRESIN. 10
INTERPRETACIN MODERNA DE LA REGRESIN. 10
EJEMPLO DE REGRESIN LINEAL UNIECUACIONAL. 11
RELACIONES ESTADSTICAS CONTRA RELACIONES DETERMINSTICAS. 14
REGRESIN CONTRA CASUALIDAD. 14
REGRESIN CONTRA CORRELACIN. 14
TIPOS DE DATOS. 15
DATOS LONGITUDINALES DE PANEL O MICROPANEL. 16
ESCALA DE MEDICIN DE VARIABLES. 16
ESCALA DE PROPORCIN. 16
ESCALA DE INTERVALO. 16
ESCALA ORDINAL. 16
ESCALA NOMINAL. 16
ANALISIS DE REGRESION CON DOS VARIABLES. 17


EJEMPLO HIPOTTICO. 17
FUNCIN DE REGRESIN POBLACIONAL (FRP). 19
ANLISIS DE REGRESIN LINEAL. 19
FUNCIN DE REGRESIN MUESTRAL (FRM). 20
EJERCICIO DE REPASO. 23
MODELO DE REGRESIN CON DOS VARIABLES. 26
PROBLEMAS DE ESTIMACIN. 26
MTODO DE MNIMOS CUADRADOS ORDINARIOS. 26
PRECISIN O ERRORES ESTNDAR DE LOS MNIMOS CUADRADOS ESTIMADOS. 28
COEFICIENTE DE DETERMINACIN R. 29
EJEMPLO NUMRICO. 30
TAREAS. 33
PRIMER PARCIAL. 33
SEGUNDO PARCIAL. 44








Econometra.
1

ECONOMETRA.
Definicin de econometra: Literalmente significa medicin econmica sin embargo el
alcance de esta disciplina es mucho ms amplio como puede deducirse de las siguientes citas.
a) La econometra consiste en la aplicacin de la estadstica matemtica a la informacin
econmica para dar soporte emprico a los modelos construidos por la economa
matemtica y obtener resultados numricos.
b) La econometra puede ser definida como el anlisis cuantitativo de fenmenos
econmicos reales basados en el desarrollo simultaneo de la teora y la observacin
relacionada mediante mtodos apropiados de inferencia.
c) La econometra puede ser definida como la ciencia social en la cual las herramientas
de la teora econmica, las matemticas y la inferencia estadstica son aplicadas al
anlisis de los fenmenos econmicos.

El arte del economista consiste encontrar el conjunto de supuestos que sean
suficientemente especficas y realista de tal forma que permiten aprovechar de la mejor
manera los datos que tienen a su disposicin.
METODOLOGA DE LA ECONOMETRA.
Aunque existen diversas escuelas de pensamiento sobre economa economtrica
durante este curso utilizaremos la metodologa tradicional o clsica que predomina en la
investigacin emprica en econometra y en las ciencias sociales y del comportamiento.
En trminos generales la metodologa es la siguiente:
1. Planteamiento de la teora o de la hiptesis.
2. Especificacin del modelo economtrico o estadstico de la teora.
3. Especificacin del modelo economtrico o estadstico de la teora.
4. Obtencin de datos.
5. Estimacin de los parmetros del modelo economtrico.
6. Prueba de hiptesis.
7. Pronstico o prediccin.
8. Utilizacin del modelo para fines de poltica o de control.

Para ilustrar los datos anteriores se considera la teora de Keynesiana de consumo.
Econometra.
2

1. Planteamiento de la Teora o Hiptesis.
Keynes plantea:
La ley psicologa fundamental consiste en que los hombres y mujeres como regla general,
y en promedio estn dispuestos a incrementar su consumo a medida que su ingreso aumenta
pero no en la misma cuanta en el aumento de su ingreso en pocas palabras Keynes postula
que la propensin marginal a consumir (PMC) es decir la tasa de cambio del consumo
generado por una unidad (por ejemplo el dlar) de cambio de ingreso es mayor que 0 pero
menor que uno.
PMC O 1 PMC
2. Especificacin del Modelo Matemtico.
A pesar de haber postulado una relacin positiva entre consumo e ingreso Keynes no
especifica la forma precisa de la relacin funcional de las 2 por simplicidad un economista
matemtico podra sugerir la siguiente forma de la funcin Keynesiana del consumo.
y = + x 0 2 1
Donde y es el gasto de consumo, x es el ingreso y donde + se conocen como
parmetros del modelo y representan los coeficientes de la intercesin y de pendiente
respectivamente.
El coeficiente de la pendiente 2 mide la PMC. Un modelo es un conjunto de ecuaciones si
el modelo tiene una sola ecuacin se le llama modelo uniecuacional si tiene ms de uno se
conoce como modelo multiecuacional.
3. Especificacin del Modelo Economtrico de Consumo.
El modelo matemtico de la funcin de consumo es de inters limitado para el
econometrista ya que supone que existe una relacin exacta o determinista entre el consumo
y el ingreso pero las relaciones entre las variables generalmente son inexactas.
Para dar cabida o relaciones inexactas entre variables econmicas el econometrista
modificara la funcin determinista del consumo de la siguiente manera.
y = + x + u
Donde conocida como termino de perturbacin o error en una variable aleatoria
(estocstica) que tiene probabilidades estocsticas claramente definidas, el trmino de
perturbacin puede representar claramente todos aquellos factores que afectan al consumo
pero que no son considerados en el modelo de forma explcita.
Econometra.
3

La ecuacin es un ejemplo de un modelo economtrico ms tcnicamente dicha
ecuacin es un modelo de regresin lineal.
El modelo economtrico de la funcin de consumo puede representarse grficamente como
aparece en la siguiente figura.

4. Obtencin de Datos (informacin).
Para estimar el modelo economtrico dado en la ecuacin es decir para obtener los
valores numricos de 1 y 2 necesitamos datos, ms adelante hablaremos de la importancia
crucial de los datos para el anlisis econmico por ahorra cifras relacionadas a la economa
E.U.A para el periodo 82 al 96 dados en la tabla uno.
Tabla 1. Informacin sobre gastos de consumo personal (y) y producto interno bruto(x)
de 1982 a 1996 en miles de millones de dlares 1992.
AO Y X
1982 3081.5 4620.3
1983 3240.6 4803.7
1984 3407.6 5140.1
1985 3566.5 5323.5
1986 3708.7 5487.7
1987 3822.3 5649.5
1988 3972.7 5865.2
1989 4064.6 6062.0
1990 4132.2 6136.3
1991 4105.8 6079.4
1992 4219.8 6244.4
1993 4343.6 6389.6
1994 4486.0 6610.7
1995 4595.3 6742.1
1996 4714.1 6928.4

0
1
2
3
4
5
6
0 2 4 6 8
c
o
n
s
u
m
o

ingreso
Econometra.
4

La variable y es el gasto de consumo personal agregado x producto interno bruto
ambos medidos en miles de millones de dlares 1992 por lo tanto los datos estn en trminos
reales pues han sido medidos en precios constantes.


3000.00
3200.00
3400.00
3600.00
3800.00
4000.00
4200.00
4400.00
4600.00
4800.00
5000.00
4500.00 5000.00 5500.00 6000.00 6500.00 7000.00
Consumo Personal
Consumo
3000.00
3200.00
3400.00
3600.00
3800.00
4000.00
4200.00
4400.00
4600.00
4800.00
5000.00
4500.00 5000.00 5500.00 6000.00 6500.00 7000.00
Consumo Estimada
Consumo Estimada
Econometra.
5

5. Estimacin de los Parmetros de Modelo Economtrico.
El siguiente para estimar los parmetros para la funcin de consumo la tcnica estadstica,
conocida como regresin lineal o anlisis de regresin es la herramienta principal para lograr
esta meta. Al utilizar esta tcnica sobre la informacin de la tabla uno se obtuvieron los
siguientes valores estimados 1=-184.08 y 2 =.7064 por lo tanto la funcin de consumo
estimada es:
= -184.08+ 0.04x
El acento circunflejo sobre y indica que su valor estimado. La funcin en consumo
estimado se muestra en la ecuacin .
AO Y X
1982 3081.50 4620.30 3079.70 1.80
1983 3240.60 4803.70 3209.25 31.35
1984 3407.60 5140.10 3446.89 -39.29
1985 3566.50 5323.50 3576.44 -9.94
1986 3708.70 5487.70 3692.43 16.27
1987 3822.30 5649.50 3806.73 15.57
1988 3972.70 5865.20 3959.10 13.60
1989 4064.60 6062.00 4098.12 -33.52
1990 4132.20 6136.30 4150.60 -18.40
1991 4105.80 6079.40 4110.41 -4.61
1992 4219.80 6244.40 4226.96 -7.16
1993 4343.60 6389.60 4329.53 14.07
1994 4486.00 6610.70 4485.72 0.28
1995 4595.30 6742.10 4578.54 16.76
1996 4714.10 6928.40 4710.14 3.96

Al observar la recta de regresin se puede notar que se ajusta bien a los datos ya que los
puntos que representan datos estn muy cercanos a ella.
De la grfica vemos que el coeficiente de la pendiente PMC fue alrededor de .70
sugiriendo que para el periodo maestral un incremento de un dlar en el ingreso ocasiona en
promedio un incremento de .70 centavos en el gasto del consumo real.
Se dice en promedio por que la relacin entre consumo e ingreso es inexacta como se
puede ver en la grfica no todos los puntos que representan datos estn exactamente en la
recta de regresin.
Econometra.
6

6. Prueba de Hiptesis.
Suponiendo que el modelo ajustado es una aproximacin razonablemente buena de la
realidad se tienen que desarrollar criterios desarrollados para encontrar si los valores
estimados concuerdan con las exceptivas de la teora que est siendo probada. Segn Milton
Friedman una teora o hiptesis que no es verificable por la evidencia emprica no puede ser
admisible como parte de la investigacin cientfica.
Como se nota anteriormente Keynes que la PMC fuera positiva pero menos que 1. En
nuestro ejemplo de PMC est cerca de.70, pero antes de aceptar esto como una confirmacin
de la teora debemos averiguar si este estimativo est suficientemente por debajo de la unidad
como para convencernos de que no se trata de un suceso al azar o de una peculiaridad de la
informacin que hemos utilizado en otras palabras Es .70estadisticamente menor que uno?
Si lo fuera puede apoyar la teora de keynes.
Esta confirmacin o refutacin de las teoras econmicas con base en evidencia
maestral est basada en una rama de la teora estadstica conocida como inferencia estadstica
(prueba de hiptesis).
7. Pronstico o Prodicin.
Si el modelo confirma la hiptesis este se puede utilizar para predecir valores de
pronsticos con base al futuro conocido o esperado de la variable x o explicativa o
predictora.
Para ilustrarlo suponga que queremos predecir la medida del gasto para 1999 el valor de
PIB para 1997 fue de 7.2698 billones de dlares PIB poniendo en el miembro derecho de la
ecuacin se obtiene.
= -184.08 + 0.7064 (7269.8)
= 4951.31
Por lo tanto dado el valor PIB la media o promedio de gasto consumo previsto es casi
4951 billones de dlares el valor real de gasto de consumo de 1997 fue de 4.9135 billones de
dlares.
u = 37.8
Por lo tanto nuestro modelo estimado de la ecuacin se excedi en la prediccin por
casi 37.8 miles de millones de dlares o que representa el 0.76% del valor real del PIB para
1997. Vale la pena notar tales errores de prediccin dada la naturaleza estadstica de nuestro
anlisis.
Econometra.
7

Existe otro uso para el modelo estimado ecuacin 3. Suponga que el presidente decide
proponer un impuesto sobre el ingreso. Cul sera el efecto sobre el ingreso y por
consecuencia sobre el gasto de consumo y al final de cuentas sobre el empleo?
Suponga que como resultado estos cambios el gasto de inv.se incrementa Cul ser el
efecto sobre la economa? De acuerdo con la teora macroeconmica era el cambio en el
ingreso generado por un cambio equivalente a un dlar en gastos de inv. Estn dado por el
multiplicador de ingreso (M) el cual est definido como:
M = ____1_____
1 - PMC
Si se utiliza la PMC de .70 obtenida de la ecuacin este multiplicado se convierte en:
M = 1/(1-.70) = 3.33
Esto es un aumento en el dlar finalmente llevara a un incremento arriba de 3 veces
mayor en el ingreso advierta que el multiplicador demora un tiempo de actuar.
El valor crtico es la PMC y a que M depende de esta y el valor estimado de la PMC se
obtiene de modelos de regresin tales como la ecuacin 3 as un valor estimado cuantitativo
de la PMC proporciona valiosa informacin para fines de poltica conociendo la PMC podemos
predecir el curso futuro del ingreso del gasto de consumo y del empleo que sigue un cambio
en las polticas fiscales de gobierno.
8. Uso del Modelo para Fines de Control o Poltica.
Suponga que tenemos la funcin Keynesiana consumo estimado de la ecuacin, suponga
adems que el gobierno considera que un nivel de gasto de 499 miles de millones de dlares
mantendr la tasa de desempleo en su nivel actual ser del 4.2. Cul nivel de ingreso
garantiza la cantidad de gasto o de consumo fijado como meta?
4900 = -184.08 + 0.7064x
4900 + 184.08 = 0.7064x
4900 + 184.08 = x = 7,197.17
0.7064
Esto es un nivel de ingreso 7197miles de millones de dlares dada una PMC.70 producir
un gasto de 4900 miles de millones de dlares.
Un modelo estimado puede ser utilizado para fines de control o poltica mediante una
mezcla apropiada poltica fiscal y monetaria. El gobierno puede manejar la variable de control
x para producir el nivel deseado de la variable objetivo y.

Econometra.
8

La siguiente figura resume la anatoma de la elaboracin de los modelos economtricos
clsicos.

TIPOS DE ECONOMETRA.

Uso del Modelo para Fines de Control o de Poltica
Pronstico o Prediccin
Prueba de Hipotesis
Estimacin del Modelo Economtrico
Datos
Modelo Economtrico
Modelo Matemtico
Teora Econmica
Econometra
Terica
Clsica Bayesiana
Aplicada
Clsica Bayesiana
Econometra.
9

La econometra puede dividirse en dos amplias categoras la econometra terica y la
econometra aplicada en cada categora se puede enfocar la materia en la tradicin clsica o
bayesiana durante el curso se har nfasis en el enfoque clsico.
Econometra Terica: Se relaciona con el desarrollo de mtodos apropiados para medir las
relaciones economtricas en esta categora la econometra se apoya en gran medida de la
estadstica matemtica. La economa terica debe expresar los supuestos de este mtodo, sus
propiedades y lo que sucede a estas cuando uno o ms de los supuestos no se cumplen.
Econometra Aplicada: Utiliza la herramienta de la teora terica para estudiar algunos
campos especiales de la econometra y lo negocios tales como la funcin de produccin,
inversin, funciones de demanda y oferta, la teora de portafolio etc.
Durante el curso estamos ms enfocados a la parte terica y utilizando el enfoque clsico.
EL PAPEL DE LA COMPUTADORA.

El anlisis de regresin (la herramienta de uso diario de la econometra) no sera
posible hoy en da sin la computadora y algn acceso al software estadstico.
Afortunadamente existen muchos paquetes de regresin disponibles. Algunos de estos
software de regresin son: EP, LIMDEP, SHAZAM, MICRO TSP, MINITAB, SAS, SPSS, BMD,
STATA, Microfit, PC Give. Estos tienen la mayora de las tcnicas economtricas y las pruebas
analizadas en este curso.













Econometra.
10

MODELOS DE REGRESION UNIECUACIONALES.
Naturaleza del Anlisis de Regresin.
El termino regresin fue introducido por Francis Galton. En un famoso artculo Galton
planteo que a pesar de la presencia de una tendencia en la que los padres de estatura alta
tenan hijos altos y los padres de estatura baja tenan hijos bajos, la estatura promedio de los
nios nacidos de padres de una estatura dada tendan a moverse o regresar hacia la estatura
promedio de la poblacin total. En otras palabras la estatura de los hijos inusualmente altos o
de padres inusualmente bajos tiende a moverse hacia la estatura promedio de la poblacin. La
ley de regresin universal de Galton fue confirmada por su amigo Karl Pearson quien reuni
ms de 1000 registros de estaturas de miembros de grupos familiares y encontr que la
estatura promedio de los hijos de un grupo de padres de estatura alta era menos que la
estatura de sus padres y la estatura promedio de los hijos de un grupo de padres de estatura
baja era mayor que la estatura de sus padres generndose un fenmeno mediante el cual los
hijos altos e hijos bajos regresaban por igual hacia la estatura promedio de todos los hombres,
en palabras de Galton se trataba de una regresin hacia la mediocridad.
Interpretacin Moderna de la Regresin.
Su interpretacin moderna es algo diferente en trminos generales seria: el anlisis de
regresin trata del estudio de la variable dependiente (Y) y su dependencia con respecto a
una o ms variables explicativas (x, x, etc) con el objetivo de estimar y/o predecir la media o
valor promedio poblacional de la primera (y) en trminos de los valores conocidos o fijos de
las ultimas (x, x, etc).









Econometra.
11

Ejemplo de Regresin Lineal Uniecuacional.
En un proceso de extraccin de una fbrica se estudia la relacin entre el tiempo de
extraccin y rendimiento, algunos datos reales se muestran en la siguiente tabla:
TIEMPO (MIN)
(x)
RENDIMIENTO (%)
(y)
10 64.0
15 81.7
20 76.2
8 68.5
12 66.6
13 77.9
15 82.2
12 74.2
14 70.0
20 76.0
19 83.2
18 85.3

A) Cul es la variable independiente y cual la dependiente?
El tiempo de extraccin seria la variable independiente (X) y el rendimiento como la
variable dependiente (Y), dado que el rendimiento siempre va a variar conforme el tiempo.

B) Grafica en un diagrama de dispersin y analizar. Qu relacin se observa entre las
variables y cules son algunos casos especiales?

64
66
68
70
72
74
76
78
80
82
84
86
88
90
7 9 11 13 15 17 19 21
Y RENDIMIENTO (%)
Y RENDIMIENTO (%)
Econometra.
12

Existe correlacin lineal positiva ya que conforme aumenta el tiempo, aumenta el
rendimiento, es razonable suponer que la relacin entre estas variables la explique un modelo
de regresin lineal simple.

C) Hacer un anlisis de regresin (ajustar una lnea recta a estos datos).
PASO 1: CALCULAR PROMEDIO.
x = xi = 176 = 14.67
n 12

= yi = 905.8 = 75.48
n 12

PASO 2: CALCULO DE .
= Sxy = 203.94 = 1.1949
Sxx 170.67

Sxy =

- [(

)(

)/n]

Sxx =

- [(

)/n]

Sxy = 13489 13285.06 = 203.94

= (10)(64) + (15)(81.7) + (20)(76.2) + (8)(68.5) + (12)(66.6) +


(13)(77.9) + (15)(82.2) + (12)(74.2) + (14)(70) + (20)(76) + (19)(83.2) +
(18)(85.3) = 640 + 1225.5 + 1524 + 548 + 799.2 + 1012.7 + 1233 + 890.4 + 980 +
1520 + 1580.8 + 1535.4 = 13489

[(

)(

)/n] = (176)(905.8) / 12 = 13285.06



Sxx = 2752 2581.33 = 170.67

= 10 + 15 + 20 + 8 + 12 + 13 + 15 + 12 + 14 + 20 + 19 + 18 =
2752

[(

)/n] = (176) / 12 = 2581.33



PASO 3: CALCULAR .
- x
= 75.48 (1.1949)(14.67) = 75.48 17.52 = 57.95

PASO 4: .
= 57.95 + (1.1949)x


Econometra.
13

x y u u
10 64.0 69.90 -5.90 34.80
15 81.7 75.87 5.83 33.95
20 76.2 81.85 -5.65 31.90
8 68.5 67.51 0.99 0.98
12 66.6 72.29 -5.69 32.36
13 77.9 73.48 4.42 19.50
15 82.2 75.87 6.33 40.02
12 74.2 72.29 1.91 3.65
14 70.0 74.68 -4.68 21.89
20 76.0 81.85 -5.85 34.20
19 83.2 80.65 2.55 6.49
18 85.3 79.46 5.84 34.13
176 905.80 905.70 293.87




CONCLUSIN:
Se concluye que el mtodo es significativo dada la variabilidad de la relacin
entre las variables aunque la intensidad de esta relacin no es muy fuerte.

Para poder entender mejor el concepto y uso de la regresin lineal es necesario hacer
una comparacin con otros trminos similares.
62.0
64.0
66.0
68.0
70.0
72.0
74.0
76.0
78.0
80.0
82.0
84.0
86.0
8 10 12 14 16 18 20 22
R
e
n
d
i
m
i
e
n
t
o

(
%
)

Tiempo (min)
Proceso de extraccin
Econometra.
14

Relaciones estadsticas contra relaciones determinsticas.
En el anlisis de regresin lo que interesa es la dependencia estadstica entre variables
pero no la funcional o la determinstica propia de la fsica clsica.
En las relaciones estadsticas entre las variables tratamos esencialmente con variables
aleatorias o estocsticas es decir variables que tienen distribuciones de probabilidad a
diferencia de la dependencia funcional o determinstica donde tambin manejamos variables
pero estas no son aleatorias o estocsticas.
La dependencia del producto de una cosecha respecto a la temperatura ambiente la
lluvia, el sol y los fertilizantes es de naturaleza estadstica en el sentido que las variables
explicativas aunque imp. No permitirn el agrnomo predecir en forma exacta el producto de
la cosecha debido a los errores involucrados en la medicin de estas variables y en razn de
otra serie de factores (variables) que afectan colectivamente la produccin pero puedan ser
difciles de identificar individualmente. De esta manera habr alguna variabilidad intrnseca o
aleatoria en la variable dependiente producto de la cosecha que no puede ser explicada a su
totalidad sin importar cuantas variables explicativas consideremos.
Regresin contra casualidad.
A pesar de que el anlisis de regresin tiene que ver con la dependencia de una
variable con respecto a otras esto no implica casualidad necesariamente. En palabras de
Kendall y Stuart una relacin estadstica sin importar que tan fuerte y sugestiva nunca podr
establecer una conexin causal: nuestras ideas de casualidad debe de venir de estadsticas
externas o de alguna teora.
En el ejemplo de producto de una cosecha no hay una razn estadstica para suponer
que a lluvia no depende del producto de la cosecha.
El sentido comn sugiere que la relacin no puede revertirse ya que no podemos controlar la
lluvia modificando la produccin de la cosecha.
Regresin contra correlacin.
El anlisis de correlacin est muy relacionado con el de regresin pero sus conceptos
son muy distintos el anlisis de correlacin, el objetivo principal es media la fuerza o grado de
asociacin lineal entre dos variables. El anlisis de regresin se trata de estimar o predecir el
valor promedio de una variable sobre los valores fijos de otras variables.

Econometra.
15

TIPOS DE DATOS.
Existen 3 tipos de datos utilizados para el anlisis emprico:
Series de tiempo.
Series de corte transversal.
Informacin combinada (combinacin de series de tiempo y series de corte
transversal).
Tabla de series de tiempo.
N
observacin
Ao Mes
Tasa de
cambio
Tasa de
inters
1 1990 1 1.32 7.35
2 1990 2 1.30 7.30
3 1990 3 1.29 7.32

Tabla de corte transversal.
Datos de 1976
N
observacin
Salario
Aos de
educacin
Aos de
experiencia
Indicador
de mujer
Indicador
de casado
1 3.10 11 2 1 0
2 3.24 12 22 1 1
3 3.00 11 2 0 0

526 3.50 14 5 1 0

Tabla de informacin combinada.
Estado
Produccin
1990
Produccin
1991
Precio x
docena
1990
Precio x
docena
1991
AL 2,206 2,186 92.7 91.4
AK 0.7 0.7 151.0 149.0
AZ 73 74 61.0 56.0

Econometra.
16

DATOS LONGITUDINALES DE PANEL O MICROPANEL.
En este tipo de datos agrupados la misma unidad de corte transversal, por ejemplo
una familia es encuestada atreves del tiempo. Por ejemplo el departamento de comercio de
EUA realiza un censo de vivienda e intervalos peridicos. Para cada encuesta se entrevista a
una misma unidad familiar para encontrar si ha habido algn cambio en las condiciones de
vivienda o financieras de esta unidad familiar desde la ltima encuesta. La entrevista
peridica a una misma unidad familiar, es decir la informacin de panel proporciona
informacin muy til sobre la dinmica del comportamiento de las unidades familiares.
Escala de medicin de variables.
Las variables se pueden clasificar en 4 categoras generales: escala de proporcin,
escala de intervalo, escalas ordinales, y escalas nominales.
Escala de proporcin.
Para la variable X al tomar 2 valores (x y x) la proporcin x/x y la distancia x-x
son cantidades que tiene sentido a si mismo existe un ordenamiento natural de los valores a lo
largo de la escala. (Ascendente o descendente). Por tanto comparaciones como xx o xx
tiene sentido. La mayora de las variables econmicas pertenecen a esta categora. Ejemplo:
resulta sensato preguntar cual grande es el PIB de este ao en comparacin con el ao
anterior.
Escala de intervalo.
Una variable de esta escala satisface las dos ltimas propiedades de la variable, escala
de proporcin, pero no la primera. Por tanto la distancia entre dos periodos, digamos 2000-
1995, es significativa pero no la proporcin entre dichos periodos (2000/1995).
Escala ordinal.
Una variable de esta categora, solo satisface la tercera propiedad de la escala de
proporcin, es decir el orden natural. Algunos ejemplos son sistemas de calificaciones (A, B, C)
o clases de ingresos (alto, mediano, bajo). Existe el orden pero las distancias entre los valores
no pueden cuantificarse.
Escala nominal.
Las variables de esta categora no tienen ninguna de las caractersticas de las variables
de las variables de escala de proporcin. Variables como el gnero (masculino, femenino) y el
estado civil (casado, soltero, divorciado, separado), simplemente denotan categoras.

Econometra.
17

ANALISIS DE REGRESION CON DOS VARIABLES.
Y \ X
80 100 120 140 160 180 200 220 240 260
Consum
o
familiar
semanal
y, $
55 65 79 80 102 110 120 135 137 150
60 70 84 93 107 115 136 137 145 152
65 74 90 95 110 120 140 140 155 175
70 80 94 103 116 130 144 152 165 178
75 85 98 108 118 135 145 157 175 180
- 88 - 113 125 140 - 160 189 185
- - - 115 - - - 162 - 191
Total 325 462 445 707 678 750 685 1043 966 1211
Media
condicio
nal de Y,
E (E/X)
65 77 89 101 113 125 137 149 161 173

Ejemplo hipottico.
El anlisis de regresin se relaciona grandemente con la estimacin y/o prediccin de
la media de la poblacin o valor promedio de la variable dependiente con base en los valores
conocidos o fijos de las variables explicativas (x) consideremos los datos de la tabla anterior
que se refiere a la poblacin total de 60 familias de una cierta comunidad, as como a su
ingreso semanal (x) y a su gasto de consumo semanal (y) dados en dlares, las 60 familias se
dividen en 10 grupos de ingresos, as mismo los gastos semanales de c/familia se muestra
enlistados en los diversos grupos como se muestra en la tabla.
Por tanto se tienen 10 valores fijos de X y los correspondientes valores Y para c/u de
los valores de X as que hay 10 subpoblaciones. Existe una variacin considerable en el gasto
de consumo semanal para c/u de los grupos de ingreso, lo cual se puede apreciar al graficar la
informacin.
Econometra.
18



El panorama general que se presenta es que a pesar de la variabilidad del gasto de
consumo semanal por cada ingreso considerado en promedio el consumo semanal se
incrementa en la misma medida que el ingreso.
En total tenemos 10 valores medios para las 10 subpoblaciones de Y a estos valores se
les conoce como valores esperados condicionales porque dependen de los valores dados de la
variable condicional X. De manera simblica esto se representa (YX) el valor esperado de
Y dado el valor de X.
Es importante distinguir entre estos valores y el valor esperado incondicional del
gasto del consumo semanal. (Y) el valor esperado de Y es incondicional porque hace caso
omiso de los niveles de ingreso de las familias, es decir, de las (X).
Si graficramos los valores condicionales de Y dados c/u de los valores de X y unimos
esos calores de las medias condicionales obtendremos la recta de regresin poblacional (RRP)
o de forma ms general la curva de regresin poblacional (CRP) en trminos sencillos la
regresin de Y sobre X. El adjetivo poblacional se debe al hecho de que la poblacin total es
de 60 familias. En la realidad una poblacin comn tendra ms familias.


50
70
90
110
130
150
170
190
60 80 100 120 140 160 180 200 220 240 260 280
Econometra.
19

Funcin de regresin poblacional (FRP).
De lo anterior podemos concluir que cada medida condicional (YX) es una funcin
de X donde X es un valor dado del conjunto X, es decir cada una de las x es un individuo de la
tabla.
(YX) (X)
Donde (X) denota alguna funcin de la variable explicativa X.
La forma de la funcin (X) es importante porque en una situacin real normalmente
no se dispone de la totalidad de la poblacin para ejemplo de anlisis, la forma de la (FRP) es
entonces una cuestin emprica aunque ciertos casos la teora puede tener algo que decir: un
economista podra plantear que el gasto de consumo est relacionado linealmente con el
ingreso. Por tanto podramos suponer que la FRP (YX) es una funcin lineal de X:(YX)=
+X donde y son parmetros fijos no conocidos.
El anlisis de regresin se encarga de estimar las FRP, es decir estimar los valores de
y con base en las observaciones de Y y X.
Anlisis de Regresin Lineal.
PASO 1: CALCULAR PROMEDIO.
x = 10420 = 173.67
60

= 7272 = 121.20
60

PASO 2: CALCULO DE .
= Sxy = 118316 = 0.60
Sxx 197193.33

Sxy = 1381220 1262904 = 118316

= 26000 + 46200 + 53400 + 98980 + 108480 + 135000 + 137000 +


229460 + 231840 + 314860 = 1381220

[(

)(

)/n] = (10420)(7272) / 60 = 1262904



Sxx = 2006800 1809606.67 = 197193.33

= 32000 + 60000+ 72000 + 137200 + 153600 + 194400 + 200000+


338800 + 345600 + 473200 = 2006800

[(

)/n] = (10420) / 60 = 1809606.67


Econometra.
20


PASO 3: CALCULAR .
= 121.20 (0.60)(173.67) = 121.20 104.20 = 17

PASO 4: .
= 17 + (0.60)x

Funcin de Regresin Muestral (FRM).
Hasta ahora hemos utilizado valores poblacionales de y correspondientes a valores
fijos de x, pero ya que en la prctica normalmente solo se disponen de una muestra de
valores de y que corresponden a algunos valores fijos de x es necesario estimar la FRP con
base en informacin muestral. Tenemos como ejemplo dos distintas muestras de 10 familias
de la tabla anterior para obtener de cada una su FRM.
M1 M2
x y x y
80 75 80 55
100 80 100 70
120 79 120 84
140 108 140 80
160 107 160 102
180 115 180 140
200 136 200 120
220 152 220 152
240 137 240 145
260 150 260 178
M1.
PASO 1: CALCULAR PROMEDIO.
x = 1700 = 170
10

= 1139 = 113.9
10

PASO 2: CALCULO DE .
= Sxy = 15310 = 0.4639
Sxx 33000

Econometra.
21

Sxy = 208940 193630 = 15310

= 6000 + 8000 + 9480 + 15120 + 17120 + 20700 + 27200 + 33440 +


32880 + 39000 = 208940

[(

)(

)/n] = (1700)(1139) / 10 = 193630



Sxx = 322000 289000 = 33000

= 322000

[(

)/n] = (1700) / 10 = 289000



PASO 3: CALCULAR .
= 113.9 (0.4639)(170) = 113.9 78.86 = 35.04

PASO 4: .
= 35.04 + (0.4639)x


M2.
PASO 1: CALCULAR PROMEDIO.
x = 1700 = 170
10

= 1126 = 112.6
10

PASO 2: CALCULO DE .
= Sxy = 21300 = 0.6454
Sxx 33000

Sxy = 212720 191420 = 21300

= 4400 + 7000 + 10080 + 11200 + 16320 + 25200 + 24000 + 33440 +


34800 + 46280 = 212720

[(

)(

)/n] = (1700)(1126) / 10 = 191420



Sxx = 322000 289000 = 33000

= 322000

[(

)/n] = (1700) / 10 = 289000


Econometra.
22


PASO 3: CALCULAR .
= 112.6 (0.6454)(170) = 112.6 109.71 = 2.89

PASO 4: .
= 2.89 + (0.6454)x

x y

u u

u u
80 75 72.149 2.851 8128 54.512 20.488 419.758
80 55 72.149 -17.149 294.088 54.512 0.488 0.238
100 80 81.427 -1.427 2.036 67.42 12.58 158.256
100 70 81.427 -11.427 130.57 67.42 2.58 6.656
120 79 90.705 -11.705 137.007 80.328 -1.328 1.763
120 84 90.705 -6.705 44.95 80.328 3.672 13.483
140 108 99.983 8.017 64.272 93.236 14.764 217.975
140 80 99.983 -19.983 399.32 93.236 -13.236 175.191
160 107 109.261 -2.261 5.112 106.144 0.856 0.732
160 102 109.261 -7.261 52.722 106.144 -4.144 17.172
180 115 118.539 -3.539 12.524 119.052 -4.052 16.418
180 140 118.539 21.461 460.574 119.052 20.948 438.818
200 136 127.817 8.183 66.961 131.96 4.04 16.321
200 120 127.817 -7.817 61.105 131.96 -11.96 143.041
220 152 137.095 14.905 222.159 144.868 7.132 50.865
220 152 137.095 14.905 222.159 144.868 7.132 50.865
240 137 146.373 -9.373 87.853 157.776 -20.776 131.642
240 145 146.373 -1.373 1.885 157.776 -12.176 163.226
260 150 155.651 -5.651 31.933 170.684 -20.684 427.827
260 178 155.651 22.349 499.477 170.684 7.316 53.523
2804.784 2803.777

CONCLUSIN:
Dado los datos del ingreso y el consumo de 20 familias, despus de sus anlisis, se
lleg a la conclusin de que la funcin que es mejor es = 2.89 + (0.6454) x.



Econometra.
23

La diferencia entre calcular la recta de regresin de una poblacin o de una muestra es
que se debe encontrar la FRP a partir de solo una pequea muestra de la poblacin o al menos
una funcin de regresin muestral que se asemeje a al FRP.
Si graficamos las dos funciones de regresin muestral obtenidas obtendramos 2
rectas de regresin que supuestamente representan a la recta de regresin poblacional pero
debido a fluctuaciones mustrales pueden ser consideradas solo como una aproximacin de
la verdadera regresin poblacional. En general se pueden obtener M funciones de regresin
muestral diferentes para N muestras diferentes y una de estas necesariamente igual a otra.
Ejercicio de repaso.
La siguiente tabla proporciona informacin respecto al nivel de estudios, el salario
promedio por hora devengado por las personas respecto a cada nivel de escolaridad y el
nmero de gente en el nivel de estudios dado.
SALARIO PROMEDIO POR HORA SEGN LA ESCOLARIDAD.
AOS DE
ESCOLARIDAD
SALARIO
PROMEDIO
NUMERO DE
PERSONAS
6 4.4567 3
7 5.7700 5
8 5.9787 15
9 7.3317 12
10 7.3182 17
11 6.5844 27
12 7.8182 218
13 7.8351 37
14 11.1223 56
15 10.6738 13
16 10.8361 70
17 13.6150 24
18 13.5310 31
528

Al graficar el salario promedio en funcin del grado de escolaridad se obtendr la
siguiente grafica o figura
Qu demuestra la curva de regresin o que podemos concluir de la relacin entre aos de
escolaridad y salarios promedio?
Econometra.
24


Se puede concluir que mientras ms aos tengas de escolaridad ms ingreso obtienes.
PASO 1: CALCULAR PROMEDIO.
x = 156 = 12
13
= 112.7712 = 8.6747
13

PASO 2: CALCULO DE .
= Sxy = 131.7856 = 0.7240
Sxx 182

Sxy = 1485.04 1353.2544 = 131.7856

= 26.7402 + 40.39 + 47.8296 + 65.9853 + 73.182 + 72.4284 + 93.8184 +


101.8563 + 154.3122 + 160.107 + 173.3776 + 231.455 + 243.558 = 1485.04
[(

)(

)/n] = (156)(112.7712) / 13 = 1353.2544



Sxx = 2054 1872 = 182

= 2054
[(

)/n] = (156) / 13 = 1872



PASO 3: CALCULAR .
= 8.6747 (0.7240)(12) = 8.6747 8.688 = -0.0133

PASO 4: .
= -0.0133 + (0.7240)x







0
5
10
15
0 5 10 15 20
SALARIO PROMEDIO
Econometra.
25

x y u u
6 4.4567 4.3307 0.1260 0.0159
7 5.7700 5.0547 0.7153 0.5117
8 5.9787 5.7787 0.2000 0.0400
9 7.3317 6.5027 0.8290 0.6872
10 7.3182 7.2267 0.0915 0.0084
11 6.5844 7.9507 -1.3663 1.8668
12 7.8182 8.6747 -0.8565 0.7336
13 7.8351 9.3987 -1.5636 2.4448
14 11.0223 10.1227 0.8996 0.8093
15 10.6738 10.8467 -0.1729 0.0299
16 10.8361 11.5707 -0.7346 0.5396
17 13.6150 12.2947 1.3203 1.7432
18 13.5310 13.0187 0.5123 0.2625
9.7117









Econometra.
26

Modelo de regresin con dos variables.
Problemas de estimacin.
Como ya se mencion la tarea ms importante es estimar la FRP con base en la FRM de la
forma ms precisa posible. Para esto existen dos mtodos:
1. Los mnimos cuadrados ordinarios (MCO).
2. La mxima verosimilidad (MV).
El mtodo de los MCO es el ms empleado en el anlisis de regresin por ser ms intuitivo
y matemticamente simple que el mtodo de MV. Ambos mtodos proporcionan resultados
similares en el anlisis de regresin. Nos enfocaremos en el MCO.

Mtodo de Mnimos Cuadrados Ordinarios.
El MCO se atribuye a Carl Friedrich Gauss un matemtico alemn. Este mtodo tiene
algunas propiedades estadsticas que lo han convertido es uno de los ms eficaces y populares
del anlisis de regresin. El principio de los mnimos cuadrados es el siguiente.
Recordemos la FRP de dos variables:
Y = + Xi + ui
Como se mencion antes la FRP no es observable directamente se debe estimar a
partir de la FRM:
Yi = + Xi + i
Yi i + i
Donde es el valor estimado (media condicional) de Yi.
Pero para determinar la FRM se procede de la siguiente manera:
i = Yi i
i = Yi Xi
Que muestra que los residuos son simplemente las diferencias entre los valores
observados y los estimados de Y.
Econometra.
27

Dados n pares de observaciones xy nos interesa determinar la FRM de manera que
este lo ms cerca posible a la Y observada. De esta manera se puede adoptar el siguiente
criterio seleccionar la FRM de manera que la suma de los residuos sea la menor posible [i
(Yi - i)]. El criterio aunque es atractivo no es infalible debido a la cancelacin de errores
por cambio de signo. Esto es porque todos los residuos reciben el mismo peso en la suma,
aunque algunos elementos se encuentren ms cerca de la FRM que otros. Es decir, a todos los
residuos se les da la misma importancia no importando lo cerca o lejos que se encuentren de
la FRM. Se puede evitar este problema con el criterio de mnimos cuadrados el cual establece
que la FRM puede estimarse de la siguiente manera:
u (Yi - i)
u (Yi - - Xi)
Entonces se busca que el resultado de la ecuacin dos sea lo ms pequea posible.
Este mtodo da ms peso a los residuos lejanos de la FRM que a los residuos cercanos
y los residuos pierden su signo.
La suma de los residuos elevados al cuadrado es algn tipo de funcin de los
estimadores y como se muestra a continuacin:
ui f( , )
Para cada conjunto de datos con diferentes valores para y se obtendr como
resultado residuos diferentes y por lo tanto valores diferentes para la sumatoria de residuos
al cuadrado.
Para lograr escoger el conjunto de valores beta adecuados se utiliza una tcnica
sencilla de clculo diferencial conocida como proceso de diferenciacin y genera las siguientes
ecuaciones para calcular y :
Yi n + Xi
YiXi Xi + Xi
Donde n es el tamao de la muestra. Estas ecuaciones simultneas se conocen como
ecuaciones normales.
Resolviendo las ecuaciones simultneas se obtiene:
n XiYi - Xi Yi x X - X
n Xi - (Xi) y Y -
Econometra.
28

(Xi - X ) (Yi - )
(Xi - X )
xy
x
La ecuacin siete se obtiene con simple manipulacin algebraica:
Xi Yi - Xi Xi Yi
n Xi - (Xi)
- X
Estos estimadores se conocen como estimadores de mnimos cuadrados.
Precisin o errores estndar de los mnimos cuadrados estimados.
Los mnimos cuadrados estimados estn en funcin de los datos mustrales. Y como es
probable que los datos cambien entre una muestra y otra esto har que los valores estimados
tambin cambien, por esto se requiere alguna medida de confiabilidad o precisin de los
estimadores y . En estadstica la precisin de un valor estimado es medida por su error
estndar (ee). Los errores estndar de los MCO estimados pueden contenerse de las
siguientes maneras:
var ( )
Xi

ee ( )


var ( ) Xi
n Xi

ee ( )

Donde var es varianza y ee error estndar y donde es la constante o varianza
homoscedstica de ui y se estima mediante la siguiente frmula:
= i
n 2
Donde es el estimador de MCO de la verdadera que es desconocida y donde la
expresin n 2 se conoce como el nmero de grados de libertad y la sumatoria de u se
conoce como la suma de residuos al cuadrado (SRC).


Econometra.
29

es conocida como el error estndar del valor estimado o el error estndar de la
regresin.
Coeficiente de determinacin r.
r una medida de la bondad del ajuste.
Se considerar ahora la bondad del ajuste de la recta de regresin ajustada a un
conjunto de datos, es decir, veremos que tan bien se ajuste a la recta a los datos. El coeficiente
de determinacin r es una medida comprendida que nos dice que tan bien se ajusta la recta a
los datos.
Se define r de la siguiente manera:
r = (i - i)
(Yi - i)
O en forma alterna:
r = 1 - ui
(Yi - i) A
La cantidad de r se conoce como el coeficiente de determinacin y es la medida ms
frecuentemente usada de la bondad del ajuste de una recta de regresin. r mide la
proporcin o el porcentaje de la variacin total en Y explicada por el modelo de regresin.
Pueden anotarse dos propiedades de r:
1. Es una cantidad no negativa.
2. Sus lmites son 0 r 1. Donde 1 significa un ajuste perfecto es decir que para cada i
elemento es igual a y. Cero significa que no hay relacin alguna entre la variable
dependiente y la variable explicativa.
Una cantidad estrechamente relacionada con r pero conceptualmente muy diferente es el
coeficiente de correlacin que es una medida del grado de asociacin entre dos variables.
Puede ser calculado a partir de:
r =


O a partir de su definicin:
Econometra.
30

r = n XiYi (Xi)(Yi) _
[ ()[ ()
Medida que se conoce como el coeficiente de correlacin muestral. Algunas de sus
propiedades son las siguientes:
1. Puede tener signo positivo o negativo dependiendo del signo del trmino en el
numerador que mide la covariacin muestral de dos variables.
2. Cae entre los lmites de -1 y +1 es decir -1 r +1.
3. Es simtrico por naturaleza. El coeficiente de correlacin entre X y Y es el mismo que
entre Y y X.
4. Es independiente del origen y de la escala.
5. Si X y Y son estadsticamente independientes, el coeficiente de correlacin entre ellos
es cero, pero si r es igual a cero no significa que las dos variables sean independientes.
Una correlacin igual a cero no necesariamente implica independencia.
6. Es una medida de asociacin lineal o dependencia lineal solamente; su uso en la
descripcin de relaciones no lineales no tiene significado.
7. Aunque es una medida de asociacin lineal entre dos variables no implica
necesariamente una relacin causa efecto.
Ejemplo numrico.
Para este ejemplo utilizaremos los datos planteados al inicio del curso respecto al
gasto de consumo familiar semanal (y) y el ingreso familiar semanal (x) como se muestra a
continuacin:
X Y
80 70
100 65
120 90
140 95
160 110
180 115
200 120
220 140
240 155
260 150
1700 1110
Econometra.
31

x = 1700/10 = 170
= 1110/10 = 111
= 16800/33000 = 0.5091
Sxy = 205500 188700 = 16800

= 5600 + 6500 + 10800 + 13300 + 17600 + 20700 + 24000 + 30800 + 37200 +


39000 = 205500
(

)(

) = (1700)(1110) = 1887000 = 188700


n 10 10
Sxx = 322000 289000 = 33000

= 322000
(

) = (1700) = 2890000 = 289000


n 10 10
= 111 (0.5091)(170) = 111 86.547 = 24.453
= 24.453 + 0.5091x

x y u u (x - x) (y - y) - y)
80 70 65.181 4.819 23.2228 8100 1681 2099.38
100 65 75.363 -10.363 107.3918 4900 2116 1270.00
120 90 85.545 4.455 19.8470 2500 441 647.96
140 95 95.727 -0.727 0.5285 900 256 233.26
160 110 105.909 4.091 16.7363 100 1 25.92
180 115 116.091 -1.091 1.1903 100 16 25.92
200 120 126.273 -6.273 39.3505 900 81 233.26
220 140 136.455 3.545 12.5670 2500 841 647.96
240 155 146.637 8.363 69.9398 4900 1936 1270.00
260 150 156.819 -6.819 46.4988 8100 1521 2099.38
1700 1110 1110 337.2728 33000 8890 8553.04



Econometra.
32

= 337.2728/10-2 = 42.1591
= 42.11 = 6.4930
var () = 42.1591/ 33000 = 0.0013
ee () = 6.4930/33000 = 0.0357
var () = [322000/10(33000)](42.1591) = 0.9758 (42.1591) = 41.1388
ee () = [322000/ 330000] (6.4930) = (567.4504/574.4563)(6.4930) = 6.4138
r = 8553.04/8890 = 0.9621
r = 0.21 = 0.9808






















Econometra.
33

TAREAS.
Primer Parcial.
1. Funcin.
La definicin general de funcin hace referencia a la dependencia entre los elementos
de dos conjuntos dados.
Dados dos conjuntos A y B, una funcin (tambin aplicacin o mapeo) entre ellos es
una asociacin f que a cada elemento de A le asigna un nico elemento de B.
Se dice entonces que A es el dominio (tambin conjunto de partida o conjunto inicial)
de f y que B es su codominio (tambin conjunto de llegada o conjunto final).
Un objeto o valor genrico a en el dominio A se denomina la variable independiente; y
un objeto genrico b del dominio B es la variable dependiente. Tambin se les llama valores
de entrada y de salida, respectivamente. Esta definicin es precisa, aunque en matemticas se
utiliza una definicin formal ms rigurosa, que construye las funciones como un objeto
concreto.
Ejemplo.
y = 2x + 3x
y = 4x +3
y = 5x + 6x +2x
y = 15x + 12x + 2
Grfica de una Funcin.
Es la representacin grfica de la correspondencia entre los elementos del conjunto
dominio y los del conjunto imagen. Es el conjunto formado por todos los pares ordenados (x,
f(x)) de la funcin f; es decir, como un subconjunto del producto cartesiano XY.
2. Sustitucin de funcin.
f = 2x + 5x 3
a) f (-2) = 2(-2) + 5(-2) 3 = 2 (4) 10 - 3 = 8 13 = - 5.
b) f (-1) = 2(-1) + 5(-1) 3 = 2 5 - 3 = 6.
c) f (0) = 2(0) + 5(0) 3 = - 3.
d) f (3) = 2(3) + 5(3) 3 = 18 + 15 3= 30.
e) f (h+1) = 2(h+1) + 5(h+1) 3 = 2(h + 2h + 1) + 5h +5 3 = 2h + 4h + 2 + 5h
+5 3 = 2h + 9h + 4.
f) f (2x) = 2(2x) + 5(2x) 3 = 2(4x) + 10x - 3 = 8x + 10x - 3.
Econometra.
34

g) f (x-3) = 2(x-3) + 5(x-3) 3 = 2(x - 6x +9) + 5x - 15 3 = 2x - 12x + 18 + 5x -
18 = 2x - 7x.
h) f (x+h) = 2(x+h) + 5(x+h) 3 = 2(x + 2xh +h) + 5x + 5h 3 = 2x + 4xh + 2h +
5x + 5h 3.
i) f (x) + f (h) = (2x + 5x 3) + (2h + 5h 3) = 2x + 5x 3 + 2h + 5h 3 = 2x + 5x
+ 2h + 5h 6.
3. Definiciones.
Inferencia: es la accin y efecto de inferir (deducir algo, sacar una consecuencia de otra cosa,
conducir a un resultado). La inferencia surge a partir de una evaluacin mental entre distintas
expresiones que, al ser relacionadas como abstracciones, permiten trazar una implicacin
lgica.
Conocimiento emprico: es aquel basado en la experiencia, experimentacin e investigacin, y
en ltimo trmino, en la percepcin, pues nos dice qu es lo que existe y cules son sus
caractersticas, pero no nos dice que algo deba ser necesariamente as y no de otra forma;
tampoco nos da verdadera universalidad. Consiste en todo lo que se sabe y que es repetido
continuamente teniendo o sin tener un conocimiento cientfico.
Cuantitativo: es un trmino que tiene antecedentes en la lengua latina (quanttas). Se trata de
un adjetivo que est vinculado a la cantidad. Este concepto, por su parte, hace referencia a una
cuanta, una magnitud, una porcin o un nmero de cosas.
Cualitativo: es un adjetivo que tiene su origen en el latn qualitatvus. El trmino se emplea
para nombrar a aquello vinculado a la cualidad (el modo de ser o las propiedades de algo).
4. Navaja de Ockham.
La navaja de Occam (o de Ockham) es un principio de razonamiento formulado al final
de la Edad Media, y conocido bajo varios nombres: principio de economa, principio de
parsimonia o de simplicidad. Es atribuido al monje franciscano y filsofo Guillermo de
Ockham, aunque era conocido antes de l.
En su formulacin original del siglo XV, en latn, dice pluralitas non est ponenda sine
necessitate, es decir que las cosas esenciales no se deben multiplicar sin necesidad.
En lenguaje moderno significa que no se deben multiplicar las causas, es decir las
hiptesis en un razonamiento: Un raciocinio basado en premisas menos numerosas y ms
sencillas es ms verosmil. Cuanto menos se supone, mejor.
El principio de parsimonia es pues la expresin del sentido comn, y su aplicacin no
debera plantear problema. Sin embargo, los desacuerdos surgen a la hora de definir la nocin
Econometra.
35

de sencillez de una hiptesis. En efecto, los hbitos de pensamientos y las creencias
determinan en gran medida lo que una persona est dispuesta a considerar sencillo.
Un ejemplo histricamente muy relevante: cuando se descubrieron fsiles cuyas
edades superaban la edad de la Tierra determinada por la Iglesia a partir de datos de la Biblia:
Cul era la hiptesis ms sencilla entre las siguientes?
1. La Tierra es ms antigua de lo que dice la Biblia; posiblemente tiene varios millones de
aos
2. Dios cre un mundo joven con la apariencia de un mundo muy antiguo (sembrando
indicios de una larga historia, como la erosin de las montaas y los fsiles, para
despistar a los librepensadores)
Hubo conservadores para defender la segunda opcin, porque la existencia de un dios
omnipotente no era parte de la hiptesis, sino un hecho indiscutible, y as la segunda hiptesis
se queda virtualmente vaca.
Ms generalmente, la creencia en un ser omnipotente y dispuesto a intervenir en los
asuntos humanos y en la leyes del universo cuantas veces haga falta invalida por completo el
principio de economa.
En el campo cientfico se dice que hay que favorecer la hiptesis ms sencilla que
explique las observaciones o que por lo menos sean compatibles con ellas.
Este principio es frecuentemente llevado ms lejos desde que se empez a admitir que
las leyes fsicas eran escritas en el lenguaje de las matemticas: la hiptesis ms sencilla es "a
priori" la que tiene una formulacin matemtica ms sencilla.
Por ejemplo la ley de la gravitacin universal de Isaac Newton:

Es particularmente satisfactoria por la simplicidad de su formulacin: con meras
multiplicaciones y una divisin explica el movimiento de los cuerpos celestes. En su momento
fue considerada inverosmil porque introduca la nocin desconcertante de fuerza a distancia,
mientras que las otras hiptesis se basaban en fuerzas por contacto.
Albert Einstein obtuvo su frmula de equivalencia entre la masa y la energa

porque le pareci matemticamente ms sencillo que existiera una nica expresin de una ley
fundamental que abarcara simultneamente la mecnica de los cuerpos y la fsica de los
Econometra.
36

campos electromagnticos. Aqu sencillez significa unicidad. Los fsicos modernos que buscan
La Gran Unificacin, es decir unificar las fuerzas fundamentales siguen el mismo criterio.
5. Grficas. (Consumo personal y consumo estimada, pag. 4).
6. Inferencia estadstica.
La estadstica inferencial es una parte de la estadstica que comprende los mtodos y
procedimientos que por medio de la induccin determina propiedades de una poblacin
estadstica, a partir de una pequea parte de la misma. La estadstica inferencial comprende
como aspectos importantes:
La toma de muestras o muestreo.
La estimacin de parmetros o variables estadsticas.
El contraste de hiptesis.
El diseo experimental.
La inferencia bayesiana.
Los mtodos no paramtricos
7. Prueba de Hiptesis.
Una prueba de hiptesis consiste en contrastar dos hiptesis estadsticas. Tal contraste
involucra la toma de decisin acerca de las hiptesis. La decisin consiste en rechazar o no
una hiptesis en favor de la otra. Una hiptesis estadstica se denota por H y son dos:
Ho: hiptesis nula.
H1: hiptesis alternativa.
Partes de una hiptesis.
1. Hiptesis.
- La hiptesis nula Ho.
Se refiere siempre a un valor especifico del parmetro de la poblacin, no a una
estadstica de muestra. La letra H significa hiptesis y el subndice cero no hay diferencia. Por
lo general hay un no en la hiptesis nula que indica que no hay cambio Podemos rechazar
o aceptar Ho.
Por lo tanto la hiptesis nula es una afirmacin que no se rechaza a menos que los
datos mustrales proporcionen evidencia convincente de que es falsa. El planteamiento de la
Econometra.
37

hiptesis nula siempre contiene un signo de igualdad con respecto al valor especificado del
parmetro.
- La hiptesis alternativa H1.
Es cualquier hiptesis que difiera de la hiptesis nula. Es una afirmacin que se acepta
si los datos mustrales proporcionan evidencia suficiente de que la hiptesis nula es falsa. Se
le conoce tambin como la hiptesis de investigacin. El planteamiento de la hiptesis
alternativa nunca contiene un signo de igualdad con respecto al valor especificado del
parmetro.
2. Nivel de significancia.
Probabilidad de rechazar la hiptesis nula cuando es verdadera. Se le denota mediante
la letra griega , tambin es denominada como nivel de riesgo, este trmino es ms adecuado
ya que se corre el riesgo de rechazar la hiptesis nula, cuando en realidad es verdadera.
La distribucin de muestreo de la estadstica de prueba se divide en dos regiones, una
regin de rechazo (conocida como regin crtica) y una regin de no rechazo (aceptacin). Si
la estadstica de prueba cae dentro de la regin de aceptacin, no se puede rechazar la
hiptesis nula. Estos valores no son tan improbables de presentarse si la hiptesis nula es
falsa. El valor crtico separa la regin de no rechazo de la de rechazo.
Errores tipo I y II.
Error tipo l se presenta si la hiptesis nula Ho es rechazada cuando es verdadera y
deba ser aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa .
Un error tipo II, se denota con la letra griega se presenta si la hiptesis nula es
aceptada cuando de hecho es falsa y deba ser rechazada.
3. Estadstico de prueba.
Valor determinado a partir de la informacin muestral, que se utiliza para determinar
si se rechaza la hiptesis nula., existen muchos estadsticos de prueba para nuestro caso
utilizaremos los estadsticos z y t. La eleccin de uno de estos depende de la cantidad de
muestras que se toman, si las muestras son iguales a 30 o mas se utiliza el estadstico z, en
caso contrario se utiliza el estadstico t.
Econometra.
38

Tipos de prueba.

4. Formular la regla de decisin
Se establece las condiciones especficas en la que se rechaza la hiptesis nula y las
condiciones en que no se rechaza la hiptesis nula. La regin de rechazo define la ubicacin de
todos los valores que son tan grandes o tan pequeos, que la probabilidad de que se presenten
bajo la suposicin de que la hiptesis nula es verdadera, es muy remota.
Distribucin muestral del valor estadstico z, con prueba de una cola a la derecha.
Valor crtico: Es el punto de divisin entre la regin en la que se rechaza la hiptesis
nula y la regin en la que no se rechaza la hiptesis nula.
5. Tomar una decisin.
En este ltimo paso de la prueba de hiptesis, se calcula el estadstico de prueba, se
compara con el valor crtico y se toma la decisin de rechazar o no la hiptesis nula. Tenga
presente que en una prueba de hiptesis solo se puede tomar una de dos decisiones: aceptar o
rechazar la hiptesis nula. Debe subrayarse que siempre existe la posibilidad de rechazar la
hiptesis nula cuando no debera haberse rechazado (error tipo I). Tambin existe la
posibilidad de que la hiptesis nula se acepte cuando debera haberse rechazado (error de
tipo II ).
8. SOFTWARE.
Software de paga:
Stata.
LIMDEP.
SAS/STAT.
Econometra.
39

TSP.
MATLAB.
GAUSS
Software gratuito:
Gretl.
R.
Dynare.
Bugs.
Octave.
SPSS.
Stata.
Stata
Desarrollador
StataCorp
www.stata.com
Informacin general
Lanzamiento inicial 1985
ltima versin estable Stata 12
25 de julio de 2011
Gnero Anlisis estadstico
Sistema operativo Windows, Mac OS X,Unix, Linux
Licencia No libre
En espaol No
Stata es un paquete de software estadstico creado en 1985 por StataCorp. Es utilizado
principalmente por instituciones acadmicas y empresariales dedicadas a la investigacin,
especialmente en economa, sociologa, ciencias polticas, biomedicina y epidemiologa.
Stata permite, entre otras funcionalidades, la gestin de datos, el anlisis estadstico, el
trazado de grficos y las simulaciones.
El tipo de archivos que utiliza son
Econometra.
40

dta archivos de datos
do archivos de comandos
ado programas
hlp archivos de ayuda
gph grficos
dct archivos diccionarios
smcl archivos log
El nombre Stata es una "palabra bal" que combina las palabras statistics (estadstica)
y data (datos); no es un acrnimo y por lo tanto no debe ser escrito en maysculas (es decir,
no es "STATA" sino "Stata").
Gretl.
gretl
Desarrollador
Comunidad gretl
gretl.sourceforge.net
Informacin general
Gnero Econometra
Sistema operativo Multiplataforma
Licencia GPL
En espaol S
Gretl es un software economtrico de libre distribucin. Tiene una interfaz grfica y
puede interactuar con R-project (el cual es un software estadstico de distribucin libre muy
utilizado). gretl incluye la posibilidad de producir salidas en LaTeX, y tambin permite
Econometra.
41

importar archivos de diversos formatos: CSV (coma separated values), GNumeric, Excel, Stata,
Eviews, JMulTi, RATS, OpenDocument Spreadsheet, entre otros.
R (lenguaje de programacin).
R

Desarrollador
R Development Core Team
www.r-project.org
Informacin general
ltima versin estable 2.15.2
26 de octubre de 2012; hace 3 meses
Gnero Software matemtico
Sistema operativo Multiplataforma
Licencia GPL
En espaol S
R es un lenguaje y entorno de programacin para anlisis estadstico y grfico.
Se trata de un proyecto de software libre, resultado de la implementacin GNU del
premiado lenguaje S. R y S-Plus -versin comercial de S- son, probablemente, los dos lenguajes
ms utilizados en investigacin por la comunidad estadstica, siendo adems muy populares
en el campo de la investigacin biomdica, la bioinformtica y las matemticas financieras. A
Econometra.
42

esto contribuye la posibilidad de cargar diferentes bibliotecas o paquetes con finalidades
especficas de clculo o grfico.
R se distribuye bajo la licencia GNU GPL y est disponible para los sistemas
operativos Windows, Macintosh, Unix y GNU/Linux.
Caractersticas.
R proporciona un amplio abanico de herramientas estadsticas (modelos lineales y no
lineales, tests estadsticos, anlisis de series temporales, algoritmos
de clasificacin y agrupamiento, etc.) y grficas.
Al igual que S, se trata de un lenguaje de programacin, lo que permite que los
usuarios lo extiendan definiendo sus propias funciones. De hecho, gran parte de las funciones
de R estn escritas en el mismo R, aunque para algoritmos computacionalmente exigentes es
posible desarrollar bibliotecas en C, C++ o Fortran que se cargan dinmicamente. Los
usuarios ms avanzados pueden tambin manipular los objetos de R directamente desde
cdigo desarrollado en C. R tambin puede extenderse a travs de paquetes desarrollados por
su comunidad de usuarios.
R hereda de S su orientacin a objetos. La tarea de extender R se ve facilitada por su
permisiva poltica de lexical scoping.
3

Adems, R puede integrarse con distintas bases de datos y existen bibliotecas que
facilitan su utilizacin desde lenguajes de programacin interpretados como Perl y Python.
Otra de las caractersticas de R es su capacidad grfica, que permite generar grficos
con alta calidad. R posee su propio formato para la documentacin basado en LaTeX.
R tambin puede usarse como herramienta de clculo numrico, campo en el que
puede ser tan eficaz como otras herramientas especficas tales como GNU Octave y su
equivalente comercial,MATLAB.
4
Se ha desarrollado una interfaz, RWeka
5
para interactuar
con Weka que permite leer y escribir ficheros en el formato arff y enriquecer R con los
algoritmos de minera de datos de dicha plataforma.
Extensiones y paquetes.
R forma parte de un proyecto colaborativo y abierto. Sus usuarios pueden publicar
paquetes que extienden su configuracin bsica. Existe un repositorio oficial de paquetes cuyo
nmero super en otoo de 2009 la cifra de los 2000.
Econometra.
43

Dado el enorme nmero de nuevos paquetes, stos se han organizado en vistas (o
temas), que permiten agruparlos segn su naturaleza y funcin. Por ejemplo, hay grupos de
paquetes relacionados con estadstica bayesiana, econometra, series temporales, etc.
Para facilitar el desarrollo de nuevos paquetes, se ha puesto a servicio de la
comunidad una forja de desarrollo que facilita las tareas relativas a dicho proceso.
Informacin General de LIMDEP.
LIMDEP Versin 9.0 es un programa ntegro para la estimacin y el anlisis de
modelos lineales y no-lineales, con datos bidimensionales, series de tiempo y series
representativas. LIMDEP ha sido por mucho tiempo el lder en el campo del anlisis
economtrico y ofrece todas las ltimas novedades que incluyen tcnicas de vanguardia para
el anlisis de datos bidimensionales, estimacin de frontera y eficiencia y modelaje de
eleccin discreta. La coleccin de tcnicas y procedimientos para analizar datos
bidimensionales no tiene paralelo con cualquier software que se pueda encontrar en el
mercado. Ha sido reconocido por muchos aos como el software estndar para la estimacin y
el manejo de modelos dependientes de variables, tanto discretos como limitados. LIMDEP 9.0
es la opcin insuperable de variedad en herramientas de estimacin.
La ms importante caracterstica del software, es un paquete de ms de 100
estimadores integrados para todo tipo de modelos de regresin lineal, frontera estocstica,
modelos dependientes de variables de eleccin discreta o limitados, modelos para variables
binarias, censuradas, truncadas, supervivencia, discretas y continuas. Ningn otro programa
le ofrece un rango igualable de modelos de ecuaciones nicas o mltiples, tanto lineales y no-
lineales.
LIMDEP es un moderno programa que es utilizado para la enseanza y la investigacin
en miles de universidades, agencias gubernamentales, institutos de investigacin, negocios e
industrias en todo el mundo.



Econometra.
44

Segundo Parcial.
1. Regresin lineal uniecuacional.
Los modelos uniecuacionales tratan de explicar el comportamiento de una variable
(endgena) en funcin de diversas variables explicativas (exgenas) o de valores anteriores
de ella misma (endgenas desplazadas).
2. Tabla de regresin lineal (Proceso de extraccin, pag. 11).
3. Grfica (Proceso de extraccin con , pag 13).
4. Conceptos.
Relacin estadstica.
Se dice que dos variables X e Y estn relacionadas estadsticamente cuando conocida la
primera se puede estimar aproximadamente el valor de la segunda, ejemplos:
Ingresos y gastos de una familia
Produccin y ventas de una fbrica
Gastos en publicidad y beneficios de una empresa
Si representamos cada par de valores como las coordenadas de un punto, el conjunto de
todos ellos se llama nube de puntos o diagrama de dispersin.
Relacin determinstica.
En estadstica, un suceso determinista es un experimento o fenmeno que da lugar a
un resultado cierto o seguro, es decir, cuando partiendo de unas mismas condiciones iniciales
tenemos la certeza de lo que va a suceder. La relacin causa-efecto se conoce en su totalidad.
Por ejemplo, todos los fenmenos que siguen las leyes de la fsica clsica, como puede
ser la cada de un cuerpo. Cuando un experimento o fenmeno no es determinista estamos
ante un experimento aleatorio.
Causalidad.
En estadstica, la causalidad se refiere a una relacin de necesidad de concurrencia de
dos variables estadsticas correlacionadas, probar causalidad entre dos variables implica
adems de que guarden una correlacin positiva, estudiar en casos donde una pueda aparecer
sin la otra, etc.

Econometra.
45

Correlacin.
En probabilidad y estadstica, la correlacin indica la fuerza y la direccin de
una relacin lineal y proporcionalidad entre dos variables estadsticas. Se considera que dos
variables cuantitativas estn correlacionadas cuando los valores de una de ellas varan
sistemticamente con respecto a los valores homnimos de la otra: si tenemos dos variables
(A y B) existe correlacin si al aumentar los valores de A lo hacen tambin los de B y
viceversa. La correlacin entre dos variables no implica, por s misma, ninguna relacin de
causalidad.
Coeficiente de correlacin.
En estadstica, el coeficiente de correlacin de Pearson es un ndice que mide la
relacin lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la
correlacin de Pearson es independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlacin de Pearson
como un ndice que puede utilizarse para medir el grado de relacin de dos variables siempre
y cuando ambas sean cuantitativas.
En el caso de que se est estudiando dos variables aleatorias x e y sobre una poblacin
estadstica; el coeficiente de correlacin de Pearson se simboliza con la letra , siendo la
expresin que nos permite calcularlo:

Dnde:
es la covarianza de
es la desviacin tpica de la variable
es la desviacin tpica de la variable
De manera anloga podemos calcular este coeficiente sobre un estadstico muestral,
denotado como a:


Econometra.
46

5. Tipos de datos.
Datos de series de Tiempo.
Consta de observaciones, de uno o ms variables, hechas en el tiempo. Como ejemplos
tenemos los precios de las acciones, el IPC, el PIB, las cifras de ventas de coches, etc.
En general ests datos son ms difciles de analizar que los datos de corte transversal,
porque las observaciones suelen ser dependientes en el tiempo.

Datos de corte transversal.
Consta de una muestra de individuos, hogares, empresas, ciudades, etc, tomada en un
momento de tiempo.
Normalmente, se supone muestreo aleatorio.
Los datos de corte transversal tienen mucho uso en economa como por ejemplo en la
microeconoma aplicada como la economa laboral, la organizacin industrial, la economa
urbana, etc.
Econometra.
47


Datos de panel o longitudinales.
Un conjunto de datos de panel consta de una serie temporal para cada miembro del corte
transversal en el conjunto de datos.
6. Regresin lineal de 60 datos (Pag. 19).
7. Conclusin del anlisis de 20 datos (Pag. 22).
8. Tabla completa del salario promedio por hora segn la escolaridad (Pag. 25).
9. Propiedades de las estimaciones de mnimos cuadrados.
Las estimaciones de mnimos cuadrados poseen algunas propiedades ideales u
ptimas, las cuales estn contenidas en el famoso teorema de Gauss-Markov. Para entender
este teorema necesitamos considerar la propiedad del mejor estimador lineal insesgado.
En estadstica, el Teorema de Gauss-Mrkov, formulado por Carl Friedrich
Gauss y Andri Mrkov, establece que en un modelo lineal general (MLG) en el que se
establezcan los siguientes supuestos:
Correcta especificacin: el MLG ha de ser una combinacin lineal de los parmetros ( ) y
no necesariamente de las variables:
Econometra.
48

Muestreo aleatorio simple: la muestra de observaciones del
vector es una muestra aleatoria simple y, por lo tanto, el
vector es independiente del vector
Esperanza condicionada de las perturbaciones nula:
Correcta identificacin: la matriz de regresoras (X) ha de tener rango completo:
rg(X)=K<=N
Homocedasticidad: Var(U/X)=S2I

El estimador mnimo cuadrtico ordinario (MCO) de B es el estimador lineal e
insesgado ptimo (ELIO o BLUE: best linear unbiased estimator), es decir, el estimador MCO
es el estimador eficiente dentro de la clase de estimadores lineales e insesgados.
Dicho teorema se basa en 10 supuestos, denominados, Supuestos de Gauss Mrkov;
que sirven como hiptesis a la demostracin del mismo:
1. El modelo est correctamente especificado.
2. Debe ser lineal en los parmetros.
3. El valor de la media condicional es cero.
4. Hay homocedasticidad.
5. No existe correlacin entre las perturbaciones.
6. La covarianza entre ui y xi es cero.
7. El nmero de observaciones es mayor que el de parmetros.
8. Existe variabilidad entre los x.
9. No hay multicolinealidad perfecta.
10. Las x son no estocsticas, es decir, son fijas en muestras repetidas.




Econometra.
49

10. Anlisis en PSPP.

CONCLUSIN:
Ingresando los datos de la tabla salario promedio por hora segn la escolaridad
se obtuvieron los resultados anteriores y se puede observar que el coeficiente de
correlacin es 0.95, entonces podemos afirmar que existe mucha relacin entre las
variables analizadas ya que es un valor muy cercano a la unidad. Adems de que los
aos de escolaridad influyen en un 72% en el salario promedio que obtienen los
trabajadores.

S-ar putea să vă placă și