Sunteți pe pagina 1din 18

A.

Justel - 2004/05 1

ANÁLISIS DE REGRESIÓN

Es la parte de la estadı́stica que se ocupa de estudiar


cómo una variable se relaciona con otras variables de
tipo cuantitativo

Ejemplos:

 Y ≡ Peso de una persona


X ≡ Su altura

 Y ≡ Altura de ola
X ≡ Velocidad del viento

/ Y ≡ Precio de la tonelada de maı́z


X ≡ Toneladas de maı́z recogidas en una cosecha

. Y ≡ Toneladas de maı́z recogidas en una cosecha


X ≡ Precipitaciones anuales por m3

◦ Y ≡ Deterioro del medioambiente


X ≡ PIB (producto interior bruto)

◦ Y ≡ Gastos en protección medioambiental


X ≡ PIB (producto interior bruto)
A. Justel - 2004/05 2

¿Cómo estudiamos la relación entre X e Y a partir de un


conjunto de pares de datos (x1, y1), . . . , (xn, yn)?

(A) MÉTODOS DESCRIPTIVOS


Métodos gráficos:
Diagrama de dispersión
%
RECTA DE REGRESIÓN
↓ &
Métodos numéricos:
↓ Covarianza muestral
coeficiente de correlación

(B) ANÁLISIS ESTADÍSTICO INFERENCIAL

1. Modelo estadı́stico
2. Estimación de los parámetros
3. Contrastes de hipótesis
4. Estimación y predicción
A. Justel - 2004/05 3

REGRESIÓN LINEAL SIMPLE

Objetivo: Estudiar un fenómeno cuyos valores dependen


o están influenciados por los valores que toma otra va-
riable de tipo cuantitativo.
Y es la variable respuesta o dependiente
X es la variable explicativa, independiente o regresora

Estamos interesados en saber:


- Si cambios en Y están asociados a cambios en X
- Qué forma tiene la relación
- Cómo de fuerte es la relación
- Cómo predecir la respuesta
A. Justel - 2004/05 4

Esto ya lo hemos hecho en Diseño de Experimentos:

X Cuándo los cambios en Y están asociados a cambios


en X ←- ANOVA

X Cómo es la relación ←- Comparaciones


Múltiples

X Cómo de fuerte es la relación ←- R2

X Predicción de nuevos valores ←- Estimación


del Modelo
DISEÑO DE EXPERIMENTOS y REGRESIÓN

En el diseño de experimentos las variables explicativas


se tratan siempre como cualitativas.
cualitativas No se tiene en
cuenta si existe un orden entre los niveles

En la regresión las variables explicativas siempre se


tratan como cuantitativas.
cuantitativas El orden dentro de la
variable es importante

Ana Justel, 2005-06


Modelo

Interpretación de los parámetros:

Representa el valor medio de la respuesta (y)


cuando la variable explicativa (x) vale cero

Representa el incremento de la respuesta


media (y) cuando la variable explicativa (x)
aumenta en una unidad

Ana Justel, 2005-06


Las hipótesis del modelo

Ana Justel, 2005-06


A. Justel - 2004/05 8

Metodologı́a para el análisis de la regresión simple

1. Identificar las variables respuesta y explicativa

2. “Comprobar” si son ciertas las hipótesis de linealidad


y homocedasticidad

- Diagrama de dispersión de los datos


- Transformaciones de los datos

3. Estimar los parámetros del modelo

4. Hacer el contraste de la regresión:


H0 : β1 = 0 vs. H1 : β1 6= 0
H0 : No existe relación lineal entre Y y X
H0 : El modelo no sirve para explicar la respuesta
5. Diagnosis del modelo con los residuos:
¿Se cumple la hipótesis de normalidad?

6. ¿Hay alguna otra variable explicativa que pueda ser


relevante y que podamos medir en los individuos de
la muestra? SI −→ 7. Regresión múltiple

7. Hacer predicciones con el modelo de regresión simple


Ejemplo

Ana Justel, 2005-06


Ejemplo

Tr
an
sf
or
m
am
os

os
am
m
for
ans
r T

Ana Justel, 2005-06


Transformaciones más habituales

Ana Justel, 2005-06


Ejemplo. Peso del cerebro en función del peso corporal para
62 especies de mamíferos

Elefante asiático Elefante africano

Hombre

Ana Justel, 2005-06


Ejemplo

Ana Justel, 2005-06


Ejemplo

Ana Justel, 2005-06


Buscamos que relación describe mejor los datos

Ana Justel, 2005-06


Buscamos que relación describe mejor los datos

Ana Justel, 2005-06


Buscamos que relación describe mejor los datos

El SPSS nos proporciona un resumen del ajuste con los


distintos modelos
Resumen del modelo y estimaciones de los parámetros

Variable dependiente: Porcentaje de fracaso escolar


Estimaciones de los
Resumen del modelo parámetros
Ecuación R cuadrado F gl1 gl2 Sig. Constante b1
Lineal ,550 25,658 1 21 ,000 38,494 -,001
Logarítmica ,572 28,032 1 21 ,000 205,975 -19,600
Inversa ,576 28,503 1 21 ,000 -,841 265851,8
Exponencial ,594 30,691 1 21 ,000 51,642 -7,4E-005
La variable independiente esRenta per cápita bruta en 2003 (euros).

¡OJO! Antes de aceptar un modelo no lineal a partir de


las apariencias de un gráfico, o incluso del análisis de la
tabla resumen, debemos hacer las correspondientes
transformaciones y representarlas
NO SIEMPRE LA TRANSFORMACIÓN “FUNCIONA”

Ana Justel, 2005-06


Ana Justel, 2005-06

S-ar putea să vă placă și