Sunteți pe pagina 1din 5

Capítulo 1.

Naturaleza del análisis de regresión

1.1 Origen histórico del termino regresión

Acuñado por Francis Galton, “la estatura promedio de los niños de padres de una estatura
determinada tiende a “regresar” a la estatura promedio de la población total”, confirmada por
Karl Pearson. “Regresión a la mediocridad”

1.2 Interpretación moderna de la regresión

“Estudio de la dependencia de una variable respecto a una o más (explicativas) con el objetivo de
estimar la media o valor promedio población de la primera en términos de valores conocidos o
fijos de la segunda”

Ejemplos

1. Predecir la estatura promedio de los hijos a partir de la estatura de sus padres

2. Estatura promedio a diferentes edades


3. Dependencia del consumo personal respecto al ingreso (PMC)
4. Elasticidad del precio (determinar precio que maximiza ganancias)
5. Predecir el cambio promedio en los salarios nominales con una cierta tasa de desempleo (curva
de Phillips)
6. Predecir la cantidad de dinero, como proporción del ingreso, que la gente deseara mantener
con diversas tasas de inflación
7. Elasticidad de la demanda respecto de los gastos publicitarios de un producto, así determinar
presupuesto “optimo” de publicidad
8. Agrónomo busca relación entre rendimiento de un cultivo y las condiciones (lluvia, temperatura,
etc.)

1.3 Relaciones estadísticas y relaciones deterministas

En las relaciones estadísticas (ejemplos) se analizan variables aleatorias o estocásticas, es decir,


con distribución de probabilidad (a diferencia de las relaciones deterministas o funcionales, como
la ley de Newton, ley de Ohm, etc.)

1.4 Regresión y causalidad

Una relación estadística por sí misma no puede, por lógica, implicar causalidad, ya que se debe
acudir a consideraciones teóricas (ejemplo 3, a la teoría económica)

“Una relación estadística, por más fuerte y sugerente que sea, nunca podrá establecer una
conexión causal: nuestras ideas de causalidad deben provenir de estadísticas externas y, en último
término, de una u otra teoría” (Kandall y Stuart)

1.5 Regresión y correlación

En el análisis de correlación se mide la fuerza de asociación lineal entre dos variables, mediante un
coeficiente.

En el análisis de regresión hay una asimetría en el tratamiento de las variables (dependiente es


estadística, aleatoria o estocástica, mientras explicativa tiene valores fijos), en la correlación las
variables se tratan de forma simétrica, y ambas se consideran aleatorias.

La mayor parte de la teoría de regresión esta condicionada al supuesto de que la variable


dependiente es estocástica, y que las variables explicativas son fijas o no estocásticas.
1.6 Terminología y notación

Si se estudia la dependencia respecto a una única variable explicativa, se conoce como análisis de
regresión simple, o con dos variables. Si hay más de una variable explicativa (lluvia, temperatura,
etc.) se trata de análisis de regresión múltiple.

Aleatorio es sinónimo de estocástico, aquellas que toman cualquier conjunto de valores, negativos
o positivos, con una probabilidad dada.

1.7 Naturaleza y fuentes de datos para el análisis económico

El éxito de todo análisis econométrico depende de la disponibilidad de los datos recopilados.

Hay 3 tipos de datos; series de tiempo (t), series transversales (i) e información combinada.

Datos de series de tiempo


Conjunto de observaciones sobre los valores de una variable en diferentes momentos, debe
recopilarse en intervalos regulares, diaria (acciones, tiempo), semanal (oferta monetaria), mensual
(IPC, desempleo), trimestral (PIB), anual (presupuesto gobierno, PIB), decenal (censo).

El problema que presentan, es que supone que estas son estacionarias, es decir su media y
varianza no varía con el tiempo (aunque no siempre es así).

Datos transversales
Datos de una o más variables recopilados en el mismo punto del tiempo (censo) y las diferentes
encuestas.

Su problema tiene relación con la heterogeneidad, por lo que debe tenerse presente el efecto de
tamaño o de escala, para no mezclar peras con manzanas
Datos combinados
La tabla 1.1 sobre huevos es transversal. Hay 50 observaciones transversales por año, y 2
observaciones de series de tiempo sobre precios y producción: un total de 100 observaciones
combinadas.

Datos en papel, longitudinales o en micro papel


Hay un tipo especial de datos combinados, el cual estudia a través del tiempo la misma unidad
transversal (por ejemplo, una familia o una empresa), los datos en papel que se obtienen son muy
útiles para entender las dinámicas de comportamiento de las unidades familiares.

Si comparamos unidades (empresas o familias) y estas tienen el mismo número de observaciones,


se tiene lo que se conoce como panel balanceado, de lo contrario tenemos panel desbalanceado.
(noooo me digas)

Fuentes de datos
Pueden provenir de una dependencia gubernamental, un organismo internacional, una
organización privada, un particular o en los últimos tiempos Internet.

Los datos recopilados pueden ser de naturaleza experimental o no experimental.

En los datos experimentales (frecuente en ciencias naturales) el investigador suele recabar datos
con algunos factores constantes, con el fin de evaluar el efecto de otros en un fenómeno dado.
Por ejemplo, al estimar el efecto de la obesidad en la presión arterial, mantiene constante los
hábitos de las personas.

Los de naturaleza no experimental (ciencias sociales) los datos no están sujetos al control del
investigador. Por ejemplo, el investigador no ejerce control sobre los datos del PIB, desempleo,
precio de acciones, etc. Esta falta de control genera problemas al identificar las causas precisas
que afectan una situación particular. Ejemplo, ¿la oferta monetaria determina el PIB o es a la
inversa?

Precisión de los datos

Su calidad no siempre es adecuada, por múltiples razones.

1. Datos de las C. Sc. De naturaleza no experimental, es posible caer en errores de observación,


sea por acción u omisión.
2. Aun con datos experimentales, errores de medición debido a las aprox. y redondeos.
3. Sesgo de selectividad (muestral) ya que un alto porcentaje no responde, o no del todo.
4. Diversos métodos de muestreo (resultados difíciles de comparar)
5. Las cifras económicas suelen estar en niveles muy agregados, no ilustren mucho sobre los
sujetos (Ej. PIB)
6. Debido al carácter confidencial, ciertos datos solo se publican de manera muy agregada. Por
ejemplo, ley prohíbe revelar declaración de impuestos (así no se puede conocer el gasto en salud
de cierto nivel socioeconómico), o el censo de empresas, que no revela alguna información
detallada de estas para así estudiar sus diferencias.
Por esto, el investigador debe tener siempre en mente que el resultado de la investigación será
tan bueno como lo sea la calidad de los datos. Por lo tanto, como los datos pueden no ser los
mejores, no ser muy dogmáticos sobre los resultados de un estudio dado, más aún cuando la
calidad de los datos no es confiable.

S-ar putea să vă placă și