Documente Academic
Documente Profesional
Documente Cultură
Introducción
intersección pendiente
= + +
error
variable
dependiente variable
independiente
Regresión lineal simple
intersección pendiente
= + +
variable variable error
dependiente independiente
= + +
!= +
donde:
Rústica Construction
Recta de regresión
valor
pronosticado
error
valor observado
Rústica Construction
= −!
Rústica Construction
!= +
! !
= ( − )( − )
= = = !
= ( − )
!
=
SION MODELS
= = −
– – –
Y X (X – X )2 (X – X )(Y – Y )
6 3 (3 – 4)2 = 1 (3 – 4)(6 – 7) = 1
8 4 (4 – 4)2 = 0 (4 – 4)(8 – 7) = 0
9 6 (6 – 4)2 = 4 (6 – 4)(9 – 7) = 4
5 4 (4 – 4)2 = 0 (4 – 4)(5 – 7) = 0
4.5 2 (2 – 4)2 = 4 (2 – 4)(4.5 – 7) = 5
9.5 5 (5 – 4)2 = 1 (5 – 4)(9.5 – 7) = 2.5
g Y ! 42 g X ! 24 g 1X - X22 = 10 g 1X - X21Y - Y2 = 12.5
Rústica Construction
!= +
! !
=( − )( − ) .
= =
= = = ! = = .
= ( − )
!
= = − = −( . × )=
= = =
Entonces:
!= + .
Ventas = 2 + (1.25 x Nómina)
floro
Medición del ajuste del modelo de
regresión
Desviación de la recta de regresión y de la media
desviación
de la recta
de regresión
desviación
de la media
Medición del ajuste del
modelo de regresión
!
= ( − )
SCT = 22.5
Medición del ajuste del modelo de
regresión
! !
= = ( − ")
SCE = 6.875
Medición del ajuste del modelo de
regresión
!
= (" − )
SCR = 15.625
Medición del ajuste del modelo de
regresión
RELACION IMPORTANTE
= = −
.
= = .
.
Aproximadamente 69% de la variabilidad de las
ventas Y se explica con la nómina X del área.
Coeficiente de correlación
El coeficiente de correlación expresa el grado o la
fuerza de la relación lineal
√
=±
√ √
= = . = .
Coeficiente de correlación 4.4 MEASURING THE FIT OF THE REGRESSION MODEL 141
RE 4.3
Values of the Y Y
lation Coefficient
(a) Correlación
Perfect Positive X (b) Correlación
Positive Correlation:
positiva X
Correlation:
positiva perfecta 0 <#r r<#1
1
rr ="1 !1
Y Y
(c) NoNocorrelación
Correlation: X (d ) Correlación negativa X
Perfect Negative
rr ="0 0 Correlation:
perfecta
r=
"–1$1
Supuestos del modelo de regresión
mness
Error
X
Homocedasticidad
E
Gráfica de residuos
X
r
Error
X
Heterocedasticidad
Gráfica deX residuos
Errores que indican que la relación no es lineal
Error
X
Estimación de la varianza de los
errores
• Un supuesto importante es que la varianza de los
errores es constante con X. Esa varianza no se
conoce pero se puede estimar a partir de la
muestra.
• El cuadrado medio debido al error (EMC) se denota
con s2:
= =
− −
con:
Estimación de la varianza de los
errores
.
= = = = .
− − − −
= + +
=
• k es el número de variables independientes
• El estadístico F es:
=
=
2. Seleccionar el nivel de significancia α (generalmente 0.01
o 0.05)
<
Rústica Construction
1. Especificar las hipótesis nulas y alternativas:
=
=
2. Seleccionar α = 0.05
. , , = .
0.05
= + + + ··· + +
donde:
Análisis de regresión
múltiple
• Para estimar los valores de los coeficientes, se toma una muestra y se
desarrolla la ecuación:
!= + + + ··· +
donde:
Jenny Wilson Realty
• Jenny Wilson quiere desarrollar un modelo para determinar los precios
listados sugeridos de las casas con base en sus tamaños y
antigüedades.
!= + +
donde:
Jenny Wilson Realty
Precio de
Pies cuadrados Antigüedad Condición
venta ($)
95,000 1,926 30 Buena
119,000 2,069 40 Excelente
124,800 1,720 30 Excelente
135,000 1,396 15 Buena
142,000 1,706 32 Nueva
145,000 1,847 38 Nueva
159,000 1,950 27 Nueva
165,000 2,323 30 Excelente
182,000 2,285 26 Nueva
183,000 3,752 35 Buena
200,000 2,300 18 Buena
211,000 2,525 17 Buena
215,000 3,800 40 Excelente
219,000 1,740 12 Nueva
Evaluación del modelo de
regresión múltiple
• La evaluación es parecida a la evaluación del modelo de regresión simple: el
valor-p para la prueba F y r2 se interpretan de la misma manera.
=
• El estadístico de prueba se calcula con R y da los valores-p. Si el valor-p es
menor que el nivel de significancia, se rechaza la hipótesis nula y se
concluye que la variable es significativa.
Jenny Wilson Realty
• El modelo es estadísticamente significativo y útil para predecir el precio
de venta de las casas: el valor-p de la prueba F es de 0.002 y
r2 = 0.6719 (67% de la variabilidad en el precio se podrían explicar por
el modelo de regresión).
/( − − )
= −
/( − )
• Cuando más que dos variables son correlacionadas, se dice que existe
multicolinealidad.
Y Y
* * * *
*
** * * ** *
*
*** * ** *
Relación lineal
X Relación no lineal
X
Colonel Motors
• Los ingenieros de Colonel Motors quiere utilizar un modelo de regresión
para estudiar el impacto del peso de un carro sobre el consumo de
combustible (en millas por galón).
A sample of 12 new automobiles was selected, and the weight and MPG rating were
recorded. Table 4.6 provides this data. A scatter diagram of this data in Figure 4.6A shows the
weight and MPG. A linear regression line is drawn through the points. Excel was used to
develop a simple linear regression equation to relate the MPG (Y) to the weight in 1,000 lb. 1X12
in the form
Colonel Motors
YN = b0 + b1X1
WEIGHT WEIGHT
MPGPeso (1,000 (1,000 LB.) MPG Peso (1,000
(1,000LB.)
MPG
12
LBS.)
4.58
MPG
20
LBS.)
3.18
• En primer lugar, han buscado una
12 4.58 20 3.18
13
13
4.66
4.66
23
23
2.68
2.68 relación lineal entre el consumo (Y) y el
15
15
4.02
4.02
24
24
2.65
2.65 peso (X), de esa forma:
18 2.53 33 1.70
18 2.53 33 1.70
19 3.09 36 36 1.95 1.95
19
19 19
3.09
3.11 3.11 42 42 1.92 1.92
!= +
45
• Han obtenido la ecuación:
40
35 != . − .
30
25
• El valor de r2 es de 0.7446 con un nivel
MPG
20
de significancia para la prueba F
15
pequeño.
10
0
• Sin embargo, el diagrama de dispersión
1.00 2.00 3.00 4.00 5.00
Weight (1,000 lb.) sugiera una relación non lineal.
4.6
WEIGHT WEIGHT
obile Weight MPG (1,000 LB.) MPG (1,000 LB.)
G
45 12 4.58 20 3.18
13 4.66 23 2.68
40 15 4.02 24 2.65
Colonel Motors
18 2.53 33 1.70
35 19 3.09 36 1.95
19 3.11 42 1.92
30
E 4.6A 25
MPG
35
adaptado que el modelo lineal. En este
15
30 caso, buscamos una ecuación de la
10 25
forma:
MPG
20
5
15
0 10
= + ( )+ ( )
1.00 2.00 3.00 4.00 5.00
5
Weight (1,000 lb.)
0
1.00 2.00 3.00 4.00 5.00
• Para eso, definimos una nueva variable
Weight (1,000 lb.)
X2 = (peso)2. Así podemos buscar un
E 4.6B
45 45
modelo lineal de la forma:
ear Model for
ata
40
40
35
!= + +
35 30
25
• Se obtiene la ecuación:
MPG
30
20
25 15
!= . − . + .
MPG
10
20
5 • Equivalente a:
15 0
1.00 2.00 3.00 4.00 5.00
Weight (1,000 lb.)
10 = . − . ( )+ . ( )
5
• con r2 = 0.8478 y la r2 ajustada aumentó
0
1.00 2.00 3.00 4.00 5.00 de 0.719 a 0.814, confirmando que la
Weight (1,000 lb.)
nueva variable mejora el modelo.