Documente Academic
Documente Profesional
Documente Cultură
Estadstica y Diseo
Experimental
Regresin lineal
mltiple
Objetivo:
Reconocer si hay relacin entre las variables
Medir el grado de relacin
Estimar un modelo de relacin
Verificar la bondad de ajuste del modelo
2
Tenemos las alturas y los pesos de 30 individuos representados en un
diagrama de dispersin.
100
90
80
Peso (Kg)
70
60
50
40
30
140 150 160 170 180 190 200
Estatura (cm)
3
100
80
90 Fuerte relacin 70 Cierta relacin
80 directa. 60 inversa
70 50
60 40
30
50
20
40
10
30 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
90
230
80
180 70
130 60
50
80
40
30
30
Y
4
La covarianza entre dos variables, Sxy, nos
indica si la posible relacin entre dos
variables es directa o inversa.
Directa: Sxy >0 1
Inversa: Sxy <0 S xy ( xi x )( yi y )
Incorreladas: Sxy =0 n i
El signo de la covarianza nos dice si el
aspecto de la nube de puntos es creciente o
no, pero no nos dice nada sobre el grado de
relacin entre las variables.
5
S xy
r
SxSy
Es adimensional
Cuanto ms cerca est r de +1 o -1 mejor ser
el grado de relacin lineal, siempre que no existan
observaciones anmalas.
6
Se hace un estudio para
determinar la relacin entre el
tiempo de vida (aos) y la
eficiencia de las mquinas (%)
de una fbrica. Los datos se
dan en la siguiente tabla:
Tiempo de vida 2 4 11 9 4 6 7 8
Eficiencia 90 65 25 40 80 60 35 50
7
Regresin
.. prediccin de una medida basndonos en
el conocimiento de otra.
Ejemplos:
Tiempo de asistencia a la escuela del hijo
en funcin al nmero de aos de
escolarizacin de la madre.
Calificacin obtenida en una materia segn
el nmero de horas de estudio semanal.
Tiempo de ejecucin de un programa en
funcin de la velocidad del procesador.
Predecir la tasa de desempleo segn la
edad.
8
Es posible descubrir una relacin?
RELACIN FUNCIONAL
Y=f (X1, X2, , Xn)
Ejemplo: La relacin que existe entre el tiempo (Y) que
tarda un mvil en recorrer una distancia (X) a velocidad
constante (v)
Y=X/v
NO EXISTE NINGUNA RELACIN
Ejemplo: La relacin que existe entre el dinero (Y) que
gana una persona adulta mensualmente y su altura (X)
RELACIN ESTOCSTICA
Y = f(X) + error
f es una funcin de un tipo determinado (desconocida)
el error es aleatorio, pequeo, y no depende de X
9
El anlisis de regresin sirve para predecir una
medida en funcin de otra medida (o varias).
Y = Variable
X = Variable
independiente
XY dependiente
regresora (X1, X2, , Xn) Y respuesta
predicha
predictora
explicada
explicativa
10
Dado dos variables
Y (dependiente)
X (independiente)
11
El modelo lineal de regresin se construye utilizando la tcnica
de estimacin mnimo cuadrtica:
Buscar b0, b1 de tal manera que se minimice la cantidad
i ei2
SY
b1 r b0 y b1 x
SX
Se obtiene adems unas ventajas de regalo
El error residual medio es nulo
La varianza del error residual es mnima para dicha
estimacin.
12
Lo adecuado del modelo depende
r= 0.415
de la relacin entre:
420
r^2 = 0.172
la dispersin marginal de Y
La dispersin de Y condicionada
400
aX
380
y
vemos cmo se distribuye Y
340
fijados de X, se denomina
150 160 170 180 190 distribucin condicionada.
r= 0.984
390
marginal.
370
y
Si la dispersin se reduce
notablemente, el modelo de
360
14
En primer lugar olvidemos que existe la Y
variable X. Veamos cul es la
variabilidad en el eje Y.
15
Fijmonos ahora en los errores de prediccin
(lneas verticales). Los proyectamos sobre el eje Y
Y.
16
Resumiendo: Y
18
Se pueden considerar
otros tipos de modelos, en recta o parbola?
funcin del aspecto que
presente el diagrama de
dispersin (regresin no
lineal)
Incluso se puede
considerar el que una
variable dependa de varias
140 150 160 170 180 190 200
(regresin mltiple).
recta o cbica?
19
4. Para una zapatera se obtiene la siguiente
ecuacin de regresin estimada en la que se
relacionan las ventas con la inversin en
inventario y los gastos en publicidad.
y 25 10 X 1 8 X 2
Donde
x1 :inversin en inventario (en miles de $)
x2 : gasto en publicidad (en miles de $)
y : ventas (en miles de $)