Sunteți pe pagina 1din 47

INSESGADEZ Y EFICIENCIA DE LOS ESTIMADORES MCO

Esta secuencia es material complementario: la simulacin de Monte Carlo no es objeto de examen

INSESGADEZ Y EFICIENCIA

! Los estimadores b1 y b2 del modelo de regresin simple son variables aleatorias: con cada muestra concreta, obtendremos valores diferentes para estos coeficientes ! El atractivo del mtodo MCO es que, bajo los supuestos del modelo, b1 y b2 tienen buenas propiedades: son insesgados consistentes y eficientes dentro de los de su clase ! En esta secuencia vamos a emplear un experimento de Monte Carlo para ilustrar las propiedades de insesgadez y eficiencia ! Un experimento de Monte Carlo consiste en un ejercicio de simulacin para evaluar algn aspecto de inters, en este caso las propiedades mencionadas ! Este tipo de experimentos son cada vez ms frecuentes en la econometra actual

INSESGADEZ Y EFICIENCIA

Elegir el modelo en el que Y depende de X, los parmetros yu


Elegir datos X
Elegir valores de parametros

Y = !1 + !2X + u u is independent N(0,1)

Elegir la distribucin de u

X= 1, 2, ... , 20

!1 = 2.0 !2 = 0.5

Modelo Generar los valores de Y

Y = 2.0 + 0.5X + u Generate the values of Y

Mostramos el esquema a seguir !

INSESGADEZ Y EFICIENCIA

Elegir el modelo en el que Y depende de X, los parmetros yu


Elegir datos X
Elegir valores de parametros

Y = !1 + !2X + u u is independent N(0,1)

Elegir la distribucin de u

X= 1, 2, ... , 20

!1 = 2.0 !2 = 0.5

Modelo Generar los valores de Y

Y = 2.0 + 0.5X + u Generate the values of Y

Asumiremos que Y est determinado por una variable X y un trmino de error u, elegiremos datos para X y valores para los parmetros

INSESGADEZ Y EFICIENCIA

Elegir el modelo en el que Y depende de X, los parmetros yu


Elegir datos X
Elegir valores de parametros

Y = !1 + !2X + u u is independent N(0,1)

Elegir la distribucin de u

X= 1, 2, ... , 20

!1 = 2.0 !2 = 0.5

Modelo Generar los valores de Y

Y = 2.0 + 0.5X + u Generate the values of Y

Tambin generaremos valores para u a partir de una distribucin conocida (normal)

INSESGADEZ Y EFICIENCIA

Elegir el modelo en el que Y depende de X, los parmetros yu


Elegir datos X
Elegir valores de parametros

Y = !1 + !2X + u u is independent N(0,1)

Elegir la distribucin de u

X= 1, 2, ... , 20

!1 = 2.0 !2 = 0.5

Modelo Generar los valores de Y

Y = 2.0 + 0.5X + u Generate the values of Y

Los valores de Y en la muestra estarn determinados por los de X , los de valores de los parmetros que en este ejercicio asumiremos conocidos y los del trmino de perturbacin

INSESGADEZ Y EFICIENCIA

Elegir el modelo en el que Y dedende de X, los parmetros yu Datos para X Valores de los parametros Modelo Generar los valores deY Distribucion de u X= 1, 2, ... , 20

Y = !1 + !2X + u u is independent N(0,1)

!1 = 2.0 !2 = 0.5

Y = 2.0 + 0.5X + u Generate the values of Y

Estimadores Estimar los valores de los parmetros


Entonces usaremos la tcnica de la regresin para estimar los valores de los parmetros a partir nicamente de los valores de Y y X.

INSESGADEZ Y EFICIENCIA

Elegir el modelo en el que Y dedende de X, los parmetros yu Datos para X Valores de los parametros Modelo Generar los valores deY Distribucion de u X= 1, 2, ... , 20

Y = !1 + !2X + u u is independent N(0,1)

!1 = 2.0 !2 = 0.5

Y = 2.0 + 0.5X + u Generate the values of Y

Estimadores Estimar los valores de los parmetros


Repetiremos el proceso indefinidamente manteniendo siempre los mismos valores para X y los parmetros, pero usando nuevos valores para u generados aleatoriamente a partir de la misma distribucin de probabilidad.

INSESGADEZ Y EFICIENCIA

Elegir el modelo en el que Y dedende de X, los parmetros yu Datos para X Valores de los parametros Modelo Generar los valores deY Distribucion de u X= 1, 2, ... , 20

Y = !1 + !2X + u u is independent N(0,1)

!1 = 2.0 !2 = 0.5

Y = 2.0 + 0.5X + u Generate the values of Y

Estimadores Estimar los valores de los parmetros


De esta forma encontraremos las distribuciones de probabilidad de los estimadores MCO, lo que nos permitir por ejemplo, contrastar si son sesgados o insesgados.

INSESGADEZ Y EFICIENCIA

Elegir el modelo en el que Y dedende de X, los parmetros yu Datos para X Valores de los parametros Modelo Generar los valores deY Distribucion de u X= 1, 2,X ...=, 20 1, 2, ... , 20

Y = !1 + !2X + u Y = !1 + !2X + u

!1 = 2.0 !1= =0.5 2.0 ! 2 !2 = 0.5

u is u es indeindependent pendiente N(0,1) N(0,1)

Y = 2.0 + 0.5X + u Y = 2.0 + 0.5X + u Generate the Generar values of Y valores de Y

Estimadores Estimar los valores de los parmetros


En el experimento tenemos una muestra de 20 obs. X toma los valores 1, 2, !, 100. !1 es igual 2 y !2 es igual a 0.5.

INSESGADEZ Y EFICIENCIA

Elegir el modelo en el que Y dedende de X, los parmetros yu Datos para X Valores de los parametros Modelo Generar los valores deY Distribucion de u X= 1, 2,X ...=, 20 1, 2, ... , 20

Y = !1 + !2X + u Y = !1 + !2X + u

!1 = 2.0 !1= =0.5 2.0 ! 2 !2 = 0.5

u is u es indeindependent pendiente N(0,1) N(0,1)

Y = 2.0 + 0.5X + u Y = 2.0 + 0.5X + u Generate the Generar values of Y valores de Y

Estimadores Estimar los valores de los parmetros

b2

( X " X )(Y " Y ) ! b =Y !b X = ! (X " X )


i i 2
1 2

Estimar los valores de los parmetros

Regresamos Y sobre X por MCO y vemos cunto se acercan b1 y b2 a !1 y !2.

INSESGADEZ Y EFICIENCIA Y = 2.0 + 0.5X + u X 1 2 3 4 5 6 7 8 9 10 2.0+0.5X u Y X 11 12 13 14 15 16 17 18 19 20 2.0+0.5X u Y

Aqu tenemos los valores de X, arbitrariamente elegidos.

INSESGADEZ Y EFICIENCIA Y = 2.0 + 0.5X + u X 1 2 3 4 5 6 7 8 9 10 2.0+0.5X 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 u Y X 11 12 13 14 15 16 17 18 19 20 2.0+0.5X 7.5 8.0 8.5 9.0 9.5 10.0 10.5 11.0 11.5 12.0 u Y

Dados los valores de !1 and !2, podemos obtener el componente no estocstico de Y.

INSESGADEZ Y EFICIENCIA

Y
14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 0.00 5.00

Y = 2.0 + 0.5 X

10.00

15.00

20.00

Se muestra grficamente el componente no estocstico.

INSESGADEZ Y EFICIENCIA Y = 2.0 + 0.5X + u X 1 2 3 4 5 6 7 8 9 10 2.0+0.5X 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 -0.59 -0.24 -0.83 0.03 -0.38 -2.19 1.03 0.24 2.53 -0.13 u Y X 11 12 13 14 15 16 17 18 19 20 2.0+0.5X 7.5 8.0 8.5 9.0 9.5 10.0 10.5 11.0 11.5 12.0 1.59 -0.92 -0.71 -0.25 1.69 0.15 0.02 -0.11 -0.91 1.42 u Y

A continuacingeneramos raleatoriamente los valores del error para cada observacion usando la distribucin N(0,1).

INSESGADEZ Y EFICIENCIA Y = 2.0 + 0.5X + u X 1 2 3 4 5 6 7 8 9 10 2.0+0.5X 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 -0.59 -0.24 -0.83 0.03 -0.38 -2.19 1.03 0.24 2.53 -0.13 u 1.91 Y X 11 12 13 14 15 16 17 18 19 20 2.0+0.5X 7.5 8.0 8.5 9.0 9.5 10.0 10.5 11.0 11.5 12.0 1.59 -0.92 -0.71 -0.25 1.69 0.15 0.02 -0.11 -0.91 1.42 u Y

As el primer valor de Y es 1.91 en lugar de 2.50.

INSESGADEZ Y EFICIENCIA Y = 2.0 + 0.5X + u X 1 2 3 4 5 6 7 8 9 10 2.0+0.5X 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 -0.59 -0.24 -0.83 0.03 -0.38 -2.19 1.03 0.24 2.53 -0.13 u 1.91 2.76 2.67 4.03 4.12 2.81 6.53 6.24 9.03 6.87 Y X 11 12 13 14 15 16 17 18 19 20 2.0+0.5X 7.5 8.0 8.5 9.0 9.5 10.0 10.5 11.0 11.5 12.0 1.59 -0.92 -0.71 -0.25 1.69 0.15 0.02 -0.11 -0.91 1.42 u Y 9.09 7.08 7.79 8.75 11.19 10.15 10.52 10.89 10.59 13.42

De forma anloga, generamos el resto de valores de Y.

INSESGADEZ Y EFICIENCIA

Y
14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 0.00 5.00 10.00 15.00 20.00

Se muestran ahora grficamente estas 20 observaciones

INSESGADEZ Y EFICIENCIA

Elegir el modelo en el que Y dedende de X, los parmetros yu Datos para X Valores de los parametros Modelo Generar los valores deY Distribucion de u X= 1, 2,X ...=, 20 1, 2, ... , 20

Y = !1 + !2X + u Y = !1 + !2X + u

!1 = 2.0 !1= =0.5 2.0 ! 2 !2 = 0.5

u is u es indeindependent pendiente N(0,1) N(0,1)

Y = 2.0 + 0.5X + u Y = 2.0 + 0.5X + u Generate the Generar values of Y valores de Y

Estimadores Estimar los valores de los parmetros


Se muestra el punto alcanzado hasta ahora en el experimento.

INSESGADEZ Y EFICIENCIA

Elegir el modelo en el que Y depende de X, los parmetros, yu Datos para X Valores de los parametros Modelo Generar los valores de Y
Distribucin

Y = !1 + !2X + u u es independiente N(0,1)

para u

X= 1, 2, ... , 20

!1 = 2.0 !2 = 0.5

Y = 2.0 + 0.5X + u Generar los valores de Y

Estimadores Estimar los valores de los parametros

b2

( X " X )(Y " Y ) ! b =Y !b X = ! (X " X )


i i 2
1 2

Estimar los valores de los parametros

Aplicamos MCO a los datos y vemos si los estimadores b1, b2 se corresponden ms o menos con los verdaderos valores.

INSESGADEZ Y EFICIENCIA

Y
14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 0.00 5.00 10.00 15.00 20.00

Aqu tenemos de nuevo el diagrama de dispersin.

INSESGADEZ Y EFICIENCIA

Y
14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 0.00 5.00 10.00 15.00 20.00

Los estimadores de la regresin usan solo los datos observados de X eY.

INSESGADEZ Y EFICIENCIA

Y
14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 0.00 5.00

= 1.63 + 0.54 X Y

10.00

15.00

20.00

Esta es la recta de regresin ajustada a los datos

INSESGADEZ Y EFICIENCIA

Y
14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 0.00 5.00

= 1.63 + 0.54 X Y

10.00

15.00

20.00

Para comparar, se muestra el componente no estocstico de la verdadera relacin. !2 (verdadero valor 0.50) ha sido sobrestimado y !1 (verdadero valor 2.00) subestimado.

INSESGADEZ Y EFICIENCIA

Y
14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 0.00 5.00 10.00 15.00 20.00

Y = 2.0 + 0.5 X

Repetimos el proceso comenzando con el mismo componente no estocstico de Y.

INSESGADEZ Y EFICIENCIA

Y
14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 0.00 5.00 10.00 15.00 20.00

Como antes, los valores de Y se modifican al incorporar el componente estocstico generado de nuevo aleatoriamente a partir de una distribucin N(0, 1).

INSESGADEZ Y EFICIENCIA

Y
14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 0.00 5.00 10.00 15.00 20.00

Obviamente los nuevos valores del error sern diferentes.

INSESGADEZ Y EFICIENCIA

Y
14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 0.00 5.00

= 2.52 + 0.48 X Y

10.00

15.00

20.00

Esta vez el coeficiente de pendiente ha sido subestimado y el intercepto sobrestimado.

INSESGADEZ Y EFICIENCIA

Y
14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 0.00 5.00 10.00 15.00 20.00

Y = 2.0 + 0.5 X

Repetimos el proceso una vez ms.

INSESGADEZ Y EFICIENCIA

Y
14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 0.00 5.00 10.00 15.00 20.00

Un nuevo conjunto de nmeros aleatorios es empleado para generar los valores de Y.

INSESGADEZ Y EFICIENCIA

Y
14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 0.00 5.00

= 2.13 + 0.45 X Y

10.00

15.00

20.00

De nuevo la pendiente resulta subestimada y la constante sobrestimada.

INSESGADEZ Y EFICIENCIA

replicacion 1 2 3 4 5 6 7 8 9 10 1.63 2.52 2.13 2.14 1.71 1.81 1.72 3.18 1.26 1.94

b1 0.54 0.48 0.45 0.50 0.56 0.51 0.56 0.41 0.58 0.52

b2

La tabla resume los resultados de las tres regresiones realizadas y otras siete ms.

INSESGADEZ Y EFICIENCIA

12 10 8 6 4 2 0 0.40 0.45 0.50 0.55 0.60

10 rplicas
Este es el histograma de las estimaciones para !2. No se puede decir gran cosa de momento.

INSESGADEZ Y EFICIENCIA

1-10 0.54 0.48 0.45 0.50 0.56 0.51 0.56 0.41 0.58 0.52

11-20 0.49 0.54 0.49 0.54 0.54 0.52 0.49 0.53 0.60 0.48

21-30 0.54 0.46 0.45 0.50 0.41 0.53 0.53 0.47 0.51 0.47

31-40 0.52 0.47 0.54 0.53 0.51 0.51 0.47 0.55 0.51 0.58

41-50 0.49 0.50 0.48 0.44 0.53 0.48 0.47 0.50 0.53 0.51

Esta tabla muestra los resultados para !2 despus de repetir 50 veces el experimento

INSESGADEZ Y EFICIENCIA

12 10 8 6 4 2 0 0.40 0.45 0.50 0.55 0.60

50 rplicas
Aqu el histograma ya permite ver una clara tendencia central.

INSESGADEZ Y EFICIENCIA

12 10 8 6 4 2 0 0.40 0.45 0.50 0.55 0.60

100 rplicas
Este es el histograma con 100 repeticiones. Puede observarse que la distribucin parece simtrica en torno al verdadero valor del parmetro (0.50), lo que implicara un estimador insesgado.

INSESGADEZ Y EFICIENCIA

12 10 8 6 4 2 0 0.40 0.45 0.50 0.55 0.60

100 rplicas
Sin embargo la distribucin es todava poco clara. Sera mejor repetir muchas ms veces el experimento (1000.000 o ms)

INSESGADEZ Y EFICIENCIA

12 10 8 6 4 2 0 0.40 0.45 0.50 0.55 0.60

100 rplicas
La curva roja muestra la forma de la distribucin que se obtendra en el lmite. Es simtrica en torno al verdadero parmetro poblacional, indicando la insesgadez del estimador.

INSESGADEZ Y EFICIENCIA

12 10 8 6 4 2 0 0.40 0.45 0.50 0.55 0.60

100 rplicas
La distribucin es normal porque el trmino de error se ha extrado de una distribucin normal.

INSESGADEZ Y EFICIENCIA

500 rplicas

5000 rplicas

Density

.48

.49

.50

.51

.52 .48

.49

.50

.51

.52

En esta figura se muestra cmo disminuye la varianza a medida que aumenta el nmero de repeticiones

INSESGADEZ Y EFICIENCIA

500 rplicas

5000 rplicas

Density

.48

.49

.50

.51

.52 .48

.49

.50

.51

.52

En todo caso queda claro que el estimador MCO es insesgado. Sin embargo no es este el nico estimador insesgado que cabe considerar

INSESGADEZ Y EFICIENCIA Por ejemplo, el siguiente estimador

Yn ! Y1 b2 = X n ! X1
tambin es insesgado:

Yn " Y1 ( !1 + ! 2 X n + un ) " ( !1 + ! 2 X n + un ) un " u1 b2 = = = !2 + X n " X1 X n " X1 X n " X1 1 y E (b2 ) = E ( ! 2 ) + E (un " u1 ) = ! 2 X n " X1
dado que la esperanza de una constante (!2) es la misma constante y por hiptesis la esperanza de ui es nula para todo i

INSESGADEZ Y EFICIENCIA
12 10 8
Frequency

6 4 2 0 .494 .495 .496 .497 .498 .499 .500 .501 .502 .503 .504 .505

100 rplicas
Si llevamos a cabo el experimento de Monte Carlo con este estimador, comprobamos que se obtiene asimismo un estimador centrado (insesgado) como puede verse en la figura

INSESGADEZ Y EFICIENCIA

! Por tanto atendiendo al criterio de insesgadez no hay diferencia entre ambos estimadores: ambos son centrados ! Sin embargo el primero debe ser de mejor calidad dado que aprovecha mejor la informacin muestral: en el segundo solo se tienen en cuenta dos observaciones, mientras que el MCO se construye con todas ellas ! El teorema de Gauss Markov seala que el estimador MCO es el ms eficiente entre los de su clase. Puesto que el estimador alternativo pertenece a dicha clase su eficiencia debe ser menor ! Entre dos estimadores insesgados es ms eficiente el que tiene menor varianza ! Vamos a comprobar que esto es as utilizando la simulacin de Monte Carlo que venimos llevando a cabo

INSESGADEZ Y EFICIENCIA

Alternativo
12 10 8
Frequency

MCO
12 10 8
Frequency

6 4 2 0 .494 .496 .498 .500 .502 .504

6 4 2 0

.506

.498

.499

.500

.501

.502

100 rplicas
Puede verse en el eje horizontal que el rango de variacin del estimador MCO es sensiblemente menor que la del estimador alternativo

COEFICIENTES DE REGRESIN COMO VARIABLES ALEATORIAS


12 10 8 6 4 2 0 0.4980

Estimador MCO Sample 1 100 Observations 100 Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis Jarque-Bera Probability
0.4985 0.4990 0.4995 0.5000 0.5005 0.5010 0.5015

0.499974 0.499975 0.501609 0.498077 0.000724 0.136100 2.725886 0.621797 0.732788

12 10 8 6 4 2 0 0.494

Estimador altertativo Sample 1 100 Observations 100 Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis 0.500004 0.500245 0.504864 0.494036 0.002608 -0.282229 2.455820

Jarque-Bera 2.561442 Probability 0.277837


0.496 0.498 0.500 0.502 0.504

Se comprueba que la desviacin estndar del estimador MCO es mucho menor

FIN

S-ar putea să vă placă și