Documente Academic
Documente Profesional
Documente Cultură
(SW Ch. 8)
Un conjunto de datos panel contiene observaciones sobre múltiples entidades (individuos), donde se observa cada entidad en dos o
más puntos en el tiempo.
Ejemplos:
Los datos sobre los 420 distritos escolares de California en 1999 y nuevamente en 2000, de 840 observaciones
totales.
Los datos sobre los 50 estados de Estados Unidos, cada estado se observa en 3 años, para un total de 150
observaciones.
Los datos sobre 1000 personas, en cuatro meses diferentes, para 4000 observaciones totales.
Notación para datos de panel
Un doble subíndice distingue entidades (estados) y periodos de tiempo (años)
Datos: Supongamos que tenemos 1 regresor. Los datos son los siguientes:
8-1
Ejemplo de un conjunto de datos de panel:
las muertes de tráfico y los impuestos al alcohol
8-2
¿Por qué no podría ser más alto más muertes de tráfico en los estados que tienen los impuestos más altos de alcohol?
zi es un factor que no cambia con el tiempo (densidad), al menos durante los años en los que se dispone de datos.
Supongamos Zi no se observa, por lo que su omisión podría dar lugar a sesgo de la variable omitida.
El efecto de Zi puede ser eliminado utilizando T = 2 años.
La idea clave:
Cualquier cambio en la tasa de mortalidad 1982-1988 no puede ser causada por Zi, porque Zi (por supuesto) no cambia
entre 1.982 y 1.988.
8-3
Restando 1988-1982 (es decir, calculando el cambio), elimina el efecto de Zi ...
FatalityRatei1988 = 0 + 1BeerTaxi1988 + 2zi + ui1988
FatalityRateimil novecientos ochenta y dos = 0 + 1BeerTaximil novecientos ochenta y dos + 2zi + ui1982
asi que
FatalityRatei1988 - FatalityRatei1982 =
1(BeerTaxi1988 - BeerTaxi1982) + (ui1988 - ui1982)
El nuevo término de error, (ui1988 - ui1982), no está correlacionado con cualquiera BeerTaxi1988 o BeerTaxi1982.
Esta ecuación “diferencia” se puede estimar por MCO, a pesar de que no se observa Zi.
La variable omitida Zi no cambia, por lo que no puede ser un factor determinante del cambio en Y
1982 datos:
Fatality Rate = 2,01 + 0,15 BeerTax (norte = 48)
(0,15) (0,13)
1988 datos:
Fatality Rate = 1,86 + 0,44 BeerTax (norte = 48)
(0,11) (0,13)
bv
8-4
¿Qué pasa si usted tiene más de 2 períodos de tiempo (T> 2)?
En primer lugar, volver a escribir esto en forma de “efectos fijos”. Supongamos que tenemos n = 3 estados: California, Texas,
Massachusetts.
Yit = 0 + 1Salir + 2zi + Ui, i = 1, ..., n, T = 1, ..., T
Por TX:
YTX, t = 0 + 1XTX, t + 2ZTX + Utx, t
= (0 + 2ZTX) + 1XTX, t + Utx, t
o
YTX, t = TX + 1XTX, t + Utx, t, donde TX = 0 + 2ZTX
California
YTX, t = TX + 1XTX, t + Utx, t
LMA, t = MAMÁ + 1XMA, t + UMA, t
C
...,TX
o
+MA,=t 1X
Yit = + Salir + Uit, i = CA, TX,Y = 1, T +
al
yo 1
Á
8-5
Recall (Fig. 6.8a) que se desplaza en la intersección puede representarse usando regresores binarios ...
Y =
Y
California
C
Y TX +
+ =1X
al
C
Y1X=
T
if
al MAMÁ+
X
or
M
T
if
ni
A 1X
X
or
M aM X
ni
A
Á
aM
Á
8-6
En forma regresor binario:
Yit = 0 + CaliforniaDCAI + TXDTXi + 1Salir + uit
“efectos fijos”forma:
Yit = 1Salir + yo + ui
yo se llama un “efecto fijo estado” o “efecto estado” - es la constante de efecto (fijo) de estar en el estado i
Estos tres métodos producen estimaciones idénticas de los coeficientes de regresión, y los errores estándar idénticos.
Ya hicimos la especificación “cambios” (1988 menos 1982) - pero esto sólo funciona para T = 2 años
8-7
Métodos # 1 y # 2 de trabajo para general T
Método # 1 sólo es práctico cuando n no es demasiado grande
= yo + 1 +
Yit - = 1 +
Entidad-degradado de regresión OLS, CTD.
Yit - = 1 +
o
= 1 +
8-8
dónde = Yit - y = Xit -
Para i = 1 y t = 1,982, es la diferencia entre la tasa de mortalidad en Alabama en 1982, y su valor medio en
Alabama promedio durante los 7 años.
Entidad-degradado de regresión OLS, CTD.
= 1 + (2)
-------------------------------------------------- ----------------------------
| Robusto
vfrall | Coef. Std. Errar. t P> | t | [95% Conf. Intervalo]
------------- + ------------------------------------ ----------------------------
beertax | -.6558736 0,2032797 -3,23 0,001 -1.055982 -.2557655
_cons | 2.377075 2.170109 0.000 .1051515 22.61 2.584041
------------- + ------------------------------------ ----------------------------
estado | absorbida (48 categorías)
8-9
Ejemplo, CTD.
Para n = 48, T = 7:
Una variable omitida podría variar con el tiempo pero no entre estados:
Coches más seguros (bolsas de aire, etc.); cambios en las leyes nacionales
Estas intersecciones producen que cambian con el tiempo
Dejar que estos cambios ( “coches más seguros”) se denota por la variable St, que cambia con el tiempo, pero no estados.
El modelo de regresión población resultante es:
Yi,mil novecientos ochenta y dos = 0 + 1xi,mil novecientos ochenta y dos + 3Smil novecientos ochenta y dos + Ui, 1982
= (0 + 3Smil novecientos ochenta y dos) + 1xi,mil novecientos ochenta y dos + Ui, 1982
o
Yi,mil novecientos ochenta y dos = mil novecientos ochenta y dos + 1Xi,mil novecientos ochenta y dos + Ui, 1982, mil novecientos ochenta y dos = 0 + 3Smil novecientos
ochenta y dos
Similar,
Yi1983 = 1983 + 1Xi,1983 + Ui, 1983, 1983 = 0 + 3S1983
etcétera
Dos formulaciones para efectos de tiempo fijo
8-10
Yit = 1Salir + t + uit
Tiempo de efectos fijos: métodos de estimación
8-11
Prob> F = 0,0008
R-cuadrado = 0,9089
Adj R-cuadrado = 0,8914
Root MSE = 0,18788
-------------------------------------------------- ----------------------------
| Robusto
vfrall | Coef. Std. Errar. t P> | t | [95% Conf. Intervalo]
------------- + ------------------------------------ ----------------------------
beertax | -.6399799 0.2547149 -2,51 0,013 -1.141371 -.1385884
Y83 | -.0799029 0,0502708 0,0190522 -1,59 0,113 -.1788579
y84 | -.0724206 0,0452466 0,0166448 -1,60 0,111 -.161486
Y85 | -.1239763 0.0460017 -2,70 0,007 -.214528 -.0334246
Y86 | -.0378645 0,0486527 0,0579055 -0,78 0,437 -.1336344
Y87 | -.0509021 0,0516113 0,0506917 -0,99 0,325 -.1524958
Y88 | -.0518038 0,05387 -0,96 0,337 -.1578438 0.0542361
_cons | 2,42847 0,1468565 2,139392 2,717549 16.54 0.000
------------- + ------------------------------------ ----------------------------
estado | absorbida (48 categorías)
Algunos Teoría: Los fijos Supuestos Los efectos de regresión (SW Aplicación 8.2.)
Para un solo X:
Yit = 1Salir + yo + Uit, i = 1, ..., n, t = 1, ..., T
8-12
Supuesto nº 5 requiere que estos factores omitidos entran UIT a que no están correlacionadas con el tiempo, dentro de un
estado.
¿Qué pasa si falla la Hipótesis 5: corr (UIT, el IEU | Xit, X es,yo) 0?
Una analogía útil es heterocedasticidad.
Estimadores MCO de datos de panel 1 son imparciales, coherentes
Los errores estándar de MCO serán mal - por lo general los errores estándar de MCO subestiman la verdadera incertidumbre
La intuición: si uit se correlaciona con el tiempo, que no tiene mayor cantidad de información (como la variación aleatoria
mucho) como lo haría fueron uit correlacionadas.
Este problema se resuelve mediante el uso de “heterocedasticidad y autocorrelación consistente errores estándar” - volvemos a
esto cuando nos centramos en la regresión de series temporales
Algunos hechos
Aprox. 40.000 víctimas mortales de tráfico cada año en los EE.UU.
1/3 de las muertes de tráfico implican un conductor ebrio
25% de los conductores en la carretera 01 a.m.-03 a.m. haber estado bebiendo (estimación)
Un conductor borracho es 13 veces más propensos a causar un accidente fatal como conductor no potable (estimación)
Variables
tasa de mortalidad de tráfico (muertes por cada 10.000 habitantes)
Impuesto sobre una caja de cerveza (Beertax)
Edad mínima legal para beber
leyes de sentencias mínimas para la primera violación DWI:
o obligatorio de cárcel
o Servicio a la Comunidad manditory
o de lo contrario, condena será sólo una multa monetaria
millas del vehículo por conductor (US DOT)
los datos económicos del Estado (ingreso real per cápita, etc.)
¿Por qué podrían ayudar a un panel de datos?
OV sesgo potencial de las variables que varían entre estados, pero son constantes en el tiempo:
o cultura de beber y conducir
o calidad de las carreteras
o vendimia de autos en la carretera
8-13
utilizar efectos fijos estatales
OV sesgo potencial de las variables que varían con el tiempo, pero que son constantes a través de los estados:
o mejoras en la seguridad de los automóviles a través del tiempo
o cambiar las actitudes nacionales hacia conducir borracho
utilizar efectos de tiempo fijo
8-14
Signo del coeficiente cambia de impuestos cerveza cuando se incluyen efectos fijos estatales
efectos fijos de tiempo son estadísticamente significativas, pero no tienen gran impacto en los coeficientes estimados
efecto estimado de impuesto a la cerveza disminuye cuando otras leyes se incluyen como regresor
La única variable de política que parece tener un impacto es el impuesto sobre la cerveza - no edad mínima para beber, no
condena obligatoria, etc.
Las otras variables económicas tienen grandes coeficientes plausiblemente: más ingresos, más de conducción, más muertes
Extensiones del enfoque de “n-1 regresores binarios”
La idea de utilizar muchos indicadores binarios para eliminar el sesgo de la variable omitida puede extenderse a datos que no son
de pantalla - la clave es que la variable omitida es constante para un grupo de observaciones, por lo que en efecto significa que
cada grupo tiene su propia interceptación.
Ejemplo: Problema del tamaño de la clase.
Supongamos que la financiación y las cuestiones curriculares se determina a nivel del condado, y cada condado tiene
varios distritos. Dando como resultado el sesgo de la variable omitida podría abordarse mediante la inclusión de
indicadores binarios, uno para cada condado (omitir uno para evitar la multicolinealidad perfecta).
Resumen: Regresión con datos de panel
(SW Sección 8.6)
Limitaciones / desafíos
Necesidad variación en X con el tiempo dentro de los estados
Tiempo de retardo efectos pueden ser importantes
Los errores estándar podría ser demasiado baja (errores podrían estar correlacionados con el tiempo)
8-15