Documente Academic
Documente Profesional
Documente Cultură
Regresin
lineal simple
H.A. para la toma de decisiones en MKT
Escuela de Economa y Negocios
Universidad Anhuac Cancn
Universidad Anhuac
Universidad Anhuac
Universidad Anhuac
Calif. En
Matemticas
Calif. En Estadstica
1
2
3
4
5
6
7
8
9
10
8
9
8
9
5
5
10
9
7
10
8
5
7
7
4
6
10
9
6
7
Universidad Anhuac
8
7
9
7
10
7
Matemticas
Podramos
ajustar una recta
que
pase
lo11ms
9
10
cerca de todos
los
datos.
La
recta de mejor
ajuste.
Universidad Anhuac
Universidad Anhuac
yj
<
Error de
estimaci La recta de
n = yj - j mejor ajuste
es la que
minimice los
Error de errores de
estimaci estimacin.
n = i - yi
i
yi
<
xi
= bx +
a mnimos cuadrados
Recta de
xj
Variable independiente
Escuela de Economa y Negocios
Universidad Anhuac
XY n X Y
b
X n X
2
a Y bX
Universidad Anhuac
6
4
2
0
4
10
11
Matemticas
Universidad Anhuac
Universidad Anhuac
Universidad Anhuac
Universidad Anhuac
Universidad Anhuac
Se representa como se
o Mide la variabilidad, o dispersin, de
los valores observados alrededor de
la RMC
o Se calcula con la siguiente frmula
o
se
Escuela de Economa y Negocios
(Y Y )
n2
Universidad Anhuac
se
n2
Universidad Anhuac
Ejemplo 1:
Estima el error estndar de
estimacin para las calificaciones de
Matemticas vs. Estadstica y
compara las rectas generadas con
los intervalos de estimacin.
Universidad Anhuac
Universidad Anhuac
= bx + a kSe
3S e
S
+a+
x
a+2 e
b
+
=
x
=b
a
Se
bx +
+
=
a
x+
=b
S
+a- e
x
b
a - 2S e
=
+
x
=b
a - 3S e
+
x
=b
Universidad Anhuac
datos
Escuela
de Economa y Negocios
Universidad Anhuac
Ejemplo 2:
El director del Depto. De Salubridad de
Chapel Hill est interesado en la relacin
que existe entre la edad de un camin de
basura y los gastos anuales de reparacin
que debera esperar. Con el fin de
determinar dicha relacin, el director ha
acumulado informacin referente a cuatro
de los camiones que la ciudad posee
actualmente.
Universidad Anhuac
Ejemplo:
Nmero
del
camin
Edad del
camin
en aos (X)
101
102
103
104
5
3
3
1
Gastos de reparacin
durante el ltimo ao
en cientos de dlares
(Y)
7
7
6
4
Universidad Anhuac
2)
3)
4)
Universidad Anhuac
Es la misma d.e.
estimada por Sy-x
Una desviacin
estndar
RMC
X1
X2
X3
1
Y 't ( S e )
n
X X
Universidad Anhuac
Ejemplo:
Nmero
del
camin
Edad del
camin
en aos (X)
101
102
103
104
5
3
3
1
Gastos de reparacin
durante el ltimo ao
en cientos de dlares
(Y)
7
7
6
4
Universidad Anhuac
Ejemplo:
Con la ecuacin de regresin, estimamos el valor Y, el
cual result de Y = 0.75(3) + 3.75 = 6.75
Con los n = 4 datos, los g.l. = 4-2 = 2, en la tabla al
95% para t es igual a 4.303
Y dado que el error de estimacin fue Se = 0.8660, se
obtiene el intervalo:
9.03
1 4 3
6.75 4.303(0.866)
6.75 2.28
2
4
4.47
12
44
4
2
Universidad Anhuac
Ejemplo:
De lo anterior, para todos los camiones con 4
aos de antigedad se espera que generen
un gasto de 6.75 cientos de dlares para su
mantenimiento, con una variacin de entre
4.47 hasta 9.03 cientos de dlares.
Y cul ser el intervalo de prediccin para un
camin que tiene exactamente 4 aos de
antigedad?
Universidad Anhuac
1
Y 't ( S e ) 1
n
X X
Universidad Anhuac
Ejemplo:
Aplicando tal variacin a los datos del ejemplo, se
obtiene
11.12
1 4 3
6.75 4.303(0.866) 1
6.75 4.37
2
4
2.38
12
44
4
2
Universidad Anhuac
Anlisis de Correlacin
Es suficiente la RMC y el error para dar
mayor certidumbre en el anlisis de la
relacin entre datos para obtener nuevas
estimaciones ?
El anlisis de correlacin es la
herramienta estadstica que podemos
usar para describir el grado hasta el
cual una variable (X) est linealmente
relacionada con otra (Y).
Escuela de Economa y Negocios
Universidad Anhuac
Anlisis de Correlacin
El anlisis de correlacin utiliza dos
medidas para describir la relacin entre las
variables:
El coeficiente de determinacin (r2),
principal valor para medir la extensin o
fuerza entre las variables X e Y.
El coeficiente de correlacin (r)*, nos
permite describir qu tan bien una variable
(Y) est explicada por otra (X).
*Desarrollado por Karl Pearson (1900)
Escuela de Economa y Negocios
Universidad Anhuac
Anlisis de Correlacin
El coeficiente de determinacin
(r2),
mide la extensin o fuerza entre las variables
X e Y, analizando la variacin de los valores Y
alrededor de la lnea de regresin y con
relacin a su propia media. Se calcula como:
Y Y
1
Y Y
2
2
Anlisis de Correlacin
Tambin se calcula de forma prctica como:
r
2
a Y b XY nY
nY
Su interpretacin es:
r2 = 1, es una correlacin perfecta
r2 cercano a uno, Y est fuertemente
relacionado con X.
r2 = 0, NO existe correlacin
Escuela de Economa y Negocios
Universidad Anhuac
Anlisis de Correlacin
Otra interpretacin de r2 es la proporcin o
porcentaje de desviacin explicada e
inexplicada de Y con relacin a X.
Por ejemplo: Si r2 = 0.576, significa que el
57.6% de la variacin en Y es explicada por la
variacin en X.
Veamos ms aplicaciones
Escuela de Economa y Negocios
Universidad Anhuac
Anlisis de Correlacin
Ejercicio 1: Obtener el coeficiente de
determinacin de las calificaciones de Mate
(X) y Estadstica (Y). Describa sus resultados.
Ejercicio 2: Obtener el coeficiente de
determinacin del gasto en mantenimiento
de camiones (Y) y la antigedad del mismo
(X). Describa sus resultados.
Universidad Anhuac
Anlisis de Correlacin
El coeficiente de correlacin (r) permite
analizar el tipo de relacin entre X e Y.
Correlacin
negativa
perfecta
Ninguna
correlacin
Correlacin
negativa
intensa
-1.00
Correlacin
positiva
perfecta
-0.50
Correlacin negativa
Correlacin
positiva
intensa
0.50
Correlacin positiva
1.00
Universidad Anhuac
Anlisis de Correlacin
Ejercicio 3: Resuelve el problema planteado
al inicio del tema, sobre la inversin en
Investigacin y Desarrollo:
a) Elabora el diagrama de dispersin
b) Calcula la recta de regresin y estima
las ganancias al invertir 9 mdd.
c) Obtener el error de estimacin
d) Calcula un intervalo de confianza al
95%
e) Calcula
el
coeficiente
de
determinacin y de correlacin
Escuela de Economa y Negocios
Universidad Anhuac
Anlisis de Correlacin
Finalmente, un anlisis prctico es la prueba
de significancia del coeficiente de
correlacin, apoyando suposiciones sobre
correlacin NO nula para TODA la poblacin, o
viceversa.
Se establecen las hiptesis nula y alternativa
H0: 0
Con n-2 g.l. para t-Student
r
n
2
H1: 0
con nivel de significancia
t
2
/2 (dos colas) (una
Y el estadstico
1 r cola)
de prueba es:
Escuela de Economa y Negocios
Universidad Anhuac
Anlisis de Correlacin
Ejemplo: Para las hiptesis nula y alternativa
H0: 0
H1: > 0
Considere una muestra al azar de 12 datos
con una correlacin de 0.32. Se puede
concluir que la correlacin en la poblacin es
mayor que cero? Aplica un nivel de
significancia de 0.05
Universidad Anhuac
Universidad Anhuac
Suma de
cuadrados
deResiduos
(SCR)
Suma de
cuadrados
Explicada
(SCE)
Suma de
cuadrados
Total (SCT)
( y y) ( y y ) ( y y)
2
g.l. = n-1
Escuela de Economa y Negocios
g.l. = n-2
g.l. = 1
Universidad Anhuac
Calculemos
conEXCEL!
Si Fprueba > Fcrtica, entonces H0 se rechaza y el
modelo S es significativo.
Escuela de Economa y Negocios
Universidad Anhuac
GRACIAS