Documente Academic
Documente Profesional
Documente Cultură
Covariancia ( xy )
r
Var( x) *Var( y )
(x i x ) ( yi y )
r i 1
n n
(x
i 1
i x ) * (y i y )
2
i 1
2
Ejemplo
• Un negocio de ventas por internet de artículos para computadoras personales, software y hardware,
tiene un almacén centralizado para la distribución de los productos que se le ordenan. La administración
examina el proceso de distribución desde el almacén y está interesado en estudiar los factores que
afecten los costos de distribución. En la actualidad, se agrega un pequeño cargo por envío
independiente del monto de la orden. Se recolectan datos durante los últimos 24 meses que indican los
costos de distribución y el número de órdenes recibidas. Los resultados son los siguientes
Mes Costo de Distribución Cantidad de ordenes
1 529500 4015
2 716600 3806
3 855800 5308
4 636900 4262
5 728100 4269
6 684400 4097
7 524600 3213
8 707700 4809 7000
9 820300 5237
6000
10 743900 4732
Costo de Distribución
11 708400 4413 5000
12 540800 2291
4000
13 629800 3977
14 723000 4428 3000
15 589900 3964
2000
16 793800 4582
17 944400 5582 1000
18 597400 3450
0
19 905000 5079
0 200000 400000 600000 800000 1000000
20 932400 5735
Cantidad de ordenes
21 693300 4269
22 537100 3708
23 891800 5387
24 668000 4161 Coeficiente de correlación= 0,89140076
Correlaciones espurias
Modelo de Regresión
Ecuación estimada de
b0 y b1 regresión
yi=b0+b1xi
proporcionan estimados Estadísticos de la muestra
0 y 1 b0.b1
Gráficamente
1000000
900000
800000
700000
Costo de Distribución
600000
500000
400000
300000
200000
100000
0
0 1000 2000 3000 4000 5000 6000 7000
Cantidad de ordenes
Método de Mínimos Cuadrados
i 1
b0 y b x
1
n n
Analiticamente
1000000
900000
800000
700000
Costo de Distribución
600000
500000
400000
300000
200000
100000
0
0 1000 2000 3000 4000 5000 6000 7000
Cantidad de ordenes
Interpretación gráfica de coeficientes de regresión
1000000
y = 144,01x + 83955
900000
800000
700000
144,01
Costo de Distribución
600000
Aumenta 1
500000 unidad
400000
300000
200000
100000
83955
0
0 1000 2000 3000 4000 5000 6000 7000
Cantidad de ordenes
Modelo de Regresión
Yi - Ŷi = e i
Y la suma de cuadrados es:
n n n
SCe (Yi Yˆi ) 2 (Yi b0 b1 X 1 ) 2 ei2
i 1 i 1 i 1
Estimación de la variancia de los términos del error (2)
SCe
e
CM e i 1 i
n (k 1) n (k 1)
Donde CM es el Cuadrado medio del error o
cuadrado medio residual. Es un estimador
insesgado de 2
Análisis de Variancia en el análisis de regresión
Consideremos la desviación
(Yi Yi )
Podemos descomponerla en
Y Y (Ŷ Y) (Y Ŷ )
i i i i
T R E
(T): desviación total
(R): es la desviación del valor ajustado por la
regresión con respecto a la media general
(E): es la desviación de la observación con respecto a
la línea de regresión
Partición de la variación total
Desarrollo formal de la partición
Y Y (Ŷ Y) (Y Ŷ )
2 2 2
i i i i
R 2
( yˆ c y) 2
(y o y) 2
Salida de Excel de la regresión
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,891400758
Coeficiente de determinación R^2 0,794595312
R^2 ajustado 0,785258735
Error típico 59916,90498
Observaciones 24