Documente Academic
Documente Profesional
Documente Cultură
REGRESION Y
CORRELACION
o SESION N 7
1
Introduccin
o El vicepresidente de una gran
compaa opina que las
ganancias anuales de la empresa
dependen de la cantidad gastada
en investigacin y desarrollo. El
presidente de la compaa no
est de acuerdo y ha solicitado
o Qu herramienta puede presentar el
vicepresidente que sustenten su teora?
o Qu variables tendr que medir?
o Qu ecuacin ayudar a predecir las
ganancias anuales en funcin de la cantidad
presupuestada en I y D?
o Ser esta ecuacin lineal o no lineal?
o Qu precisin se puede esperar al usar esta
herramienta de toma de decisiones?
A continuacin se presentan datos de 11 aos
Gasto en I y D Ganancia
Ao (ciento de anual
miles ) (millones)
50
1999 2 20 40
2000 4 25 30
20
2001 5 34
10
2002 4 30 0
1 2 3 4 5 6 7 8 9
2003 6 33
2004 5 34
2005 5 36 Una lnea recta podra
2006 7 35 ser lo ms adecuado
2007 8 40 para relacionar estas
2008 7 37 variables?
2009 8 41
ANALISIS DE REGRESION
X X X
Qu es el anlisis
de regresin
lineal ?
Yi 0 1 X i ei i=1, 2, , n
Error ~ NID(0, 2)
Parmetros Variable
Variable
predictora
dependiente
(independiente)
V. ECUACION DE
REGRESIN
Si la variable respuesta o variable dependiente (Y) est en relacin con
Donde:
Se interpretan como:
n n
Y
i 1
n 0 1 X
i 1
n n n
YX 0 X 1 X
2
i 1 i 1 i 1
o Al resolver este sistema de ecuaciones
normales obtenemos las siguientes formulas :
_ _
1 XY n X Y 0 y 1 x
_
X nX
2 2
n n n
Y
2
0 Y 1 XY
S y.x i 1 i 1 i 1
n2
ANALISIS DE CORRELACIN
o El anlisis de correlacin es una
tcnica estadstica que mide el
grado de asociacin o afinidad
entre las variables cuantitativas
consideradas en un estudio.
o Se llamar CORRELACION SIMPLE
cuando se trata de analizar la relacin
entre dos variables. Se llamar
CORRELACION LINEAL O RECTILINEA si la
funcin es una recta, y de CORRELACION
NO LINEAL cuando la funcin es una
curva o una funcin de grado superior.
El COEFICIENTE DE CORRELACION DE
PEARSON
Es el estadgrafo que mide el grado de asociacin
o afinidad entre las variables cuantitativas y se
denota por r la cual se define como:
n n n
n XY X Y
r n
i 1
n
i 1
n
i 1
n
n X 2 ( X ) 2 n Y 2 ( Y ) 2
i 1 i 1 i 1 i 1
Interpretacin:
NEGATIVA POSI
TIVA
COEFICIENTE DE DETERMINACIN
o El coeficiente de determinacin mide el
porcentaje de variabilidad en Y que puede
ser explicada por la variable
independiente X.
o Se denota por R2 o r2
0 Y 1 XY nY
2
r
2
Y
2
2
nY
INTERPRETACION:
o Si r2 0.70, la ecuacin
estimada se ajusta o tiende a
representar los datos.
o Si r2 = 1, la ecuacin estimada
es perfecta.
EJEMPLO 1:
Diagrama de Dispersion
100
f(x) = 32.5x + 5
R = 0.96
80
Costo 60
de mantenimiento $
40
20
0
0.5 1 1.5 2 2.5 3 3.5
n n n
n XY X Y
6(970) (12)( 420)
1 i 1 i 1 i 1
32.5
n
n X ( X )
2
n
2 6(28) (12) 2
i 1 i 1
0 y 1 x = 70 (32.5 (2)) = 5
Por lo tanto la ecuacin de regresin es:
Y = 5 + 32.5 X
Interpretacin:
o 0 = 5: Cuando la mquina no tienen
ningn ao de funcionamiento su costo de
mantenimiento es de 5 dlares.
o 1 = 32.5: Por cada ao de
funcionamiento de la maquina su costo de
mantenimiento aumenta en 32.5 dlares.
2 . Pronostico cuando la mquina
tienen 4 aos de
funcionamiento:
Costo 60
de mantenimiento $
40
20
0
0.5 1 1.5 2 2.5 3 3.5
Precio Ventas XY X2
192 25
205 14
197 18
213 12
208 11
199 15
178 29
172 35
Totales
Reemplazando los valores tenemos:
n8
_
X 1564 / 8 195.5
_
Y 159 / 8 19.875
_ _
b
XY n X Y 30227 8 195.5 19.875
0.5963
_
307200 8 195.5 2
X n X
2 2
_ _
a Y b X 19.875 (0.5963) 195.5 136.4545
Y 136.4545 0.5963x