Documente Academic
Documente Profesional
Documente Cultură
Ventas de la guitarra
f(x) = 0.1x + 6
70 12 12
R² = 0.593220339
60 10 10
8
80 15
6
50 13 4
2
0
20 30 40 50 60 70 80 90
Visitas en YT en miles
Visitas en YT en
Ventas (Y) miles(X) (Y-Y') (X-X') (X-X')^2
8 30 -3.5 -25 625
11 40 -0.5 -15 225
12 70 0.5 15 225
10 60 -1.5 5 25
15 80 3.5 25 625
13 50 1.5 -5 25
Σ(X-X')^2= 1750
X' media = 55 Σ(Y-Y')(X-X')=
Y' media = 11.5
b1= 0.1
b0= 6
Ecuación de regresión o mínimos cuadrados = Y^= 6+0.1X
Y^(40,000)= 10
ispersión
Ejercicio 4-10
a) Grafique estos datos para saber si una ecuación lineal podría
describir la relación entre las visitas en YouTube y las ventas de la
guitarra
b) Use las ecuaciones presentadas en este capítulo para calcular
la SCT, SEC y SCR. Encuentre la ecuación de regresión por
mínimos cuadrados para estos datos.
c) Use la ecuación de regresión para pronosticar las ventas de la
60 70 80 90 guitarra, si hubo 40,000 vistas el mes pasado
YT en miles Acorde al modelo de regresión se venderán 10 guitarras
X 98 77 88 80 96
Y Pronóstico 91.4953970081 75.95835731 84.09680667 78.17793441 90.01567894
Error 6.5046029919 1.041642693 3.903193326 1.822065593 5.984321059
100
90
f(x) = 0.7398590334x + 18.9892117376
80 R² = 0.8473535823
70
60
50
40
30
20
10
0
55 60 65 70 75 80 85 90 95 100 105
7 8 9
66 95 69
64 95 76
61 66 95 69
64.12061277 67.81990794 89.27581991 70.03948504
-3.12061277 -1.81990794 5.724180092 -1.03948504
Estudiante 1er parcial Promedio final
1 98 93 Final (y) 1er parcial (x) (Y-Y')^2
2 77 78 93 98 196
3 88 84 78 77 1
4 80 73 84 88 25
5 96 84 73 80 36
6 61 64 84 96 25
7 66 64 64 61 225
8 95 95 64 66 225
9 69 76 95 95 256
76 69 9
SCT= 998
SCT= 998
Y' 79 SEC= 152.3411249
X' 81.11 SCR= 845.6588751
n= 9
k= 1
ECM= SEC / (n - k - 1)
ECM= 21.76301784
RCM= SCR/k
RCM= 845.66
F= RCM/ECM
F= 38.85761072
^Y (Y-^Y)^2 (^Y-Y')^2 (X-X´) (Y-Y') (X-X´)(Y-Y´) (X-X´)^2
91.5 2.26 156.13 16.89 14 236.44 285.23
76.0 4.17 9.25 -4.11 -1 4.11 16.90
84.1 0.01 25.98 6.89 5 34.44 47.46
78.2 26.81 0.68 -1.11 -6 6.67 1.23
90.0 36.19 121.35 14.89 5 74.44 221.68
64.1 0.01 221.40 -20.11 -15 301.67 404.46
67.8 14.59 124.99 -15.11 -15 226.67 228.35
89.3 32.77 105.59 13.89 16 222.22 192.90
70.0 35.53 80.29 -12.11 -3 36.33 146.68
SEC= 152.341125 1143.00 1544.89
SCR= 845.6588751
b1= 0.74
b0= 18.99
^y=18.99 + 0.74x
Coefficients
Intercept 18.98921174
1er parcial 0.739859033
Con una significancia observado del .0004, se rechaza la hipótesis nula, lo cual sign
existe una relación estadísticamente significativa entre la calificación del primer ex
el promedio final del curso.
SS MS F Significance F
845.6588751 845.6588751 38.85761072 0.0004309527
152.3411249 21.76301784
998
Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
9.751788333 1.947254297 0.092541048 -4.0701034515 42.04852693 -4.07010345 42.04852693
0.118689127 6.233587307 0.000430953 0.4592038461 1.020514221 0.459203846 1.020514221
rechaza la hipótesis nula, lo cual significa que
tiva entre la calificación del primer examen y
Número de turistas Pasajeros (en Pasajeros (en cientos
Año (en millones) millones) de miles)
1 7 1.5 15 a)
2 2 1 10
3 6 1.3 13
4 4 1.5 15
5 14 2.5 25
6 15 2.7 27
7 16 2.4 24
8 12 2 20
9 14 2.7 27
10 20 4.4 44
11 15 3.4 34
12 7 1.7 17
b)
Y'= 2.258
X'= 11
SUMMARY OUTPUT
SCR
SEC
SCT
5
4.5
Pasajeros (en cientos de miles)
4
3.5 f(x) = 0.1593023256x + 0.5060077519
3 R² = 0.8402760031
2.5
2
1.5
1
0.5
0
0 5 10 15 20 25
Número de turistas (en millones)
R= 0.9167
Coeficiente 0.159
Constante 0.5060
Ecuación y = .5060 + .159x
UMMARY OUTPUT
Regression Statistics
Multiple R 0.9166656986
R Square 0.8402760031
Adjusted R Squ 0.8243036034
Standard Error 0.4073572418
Observations 12
ANOVA
df SS MS F Significance F
Regression 1 8.7297674419 8.729767442 52.608 2.74837E-05
Residual 10 1.6593992248 0.165939922
Total 11 10.389166667
) Si no hubiera turistas en absoluto, explique la cantidad de pasajeros previst 0.506 millones de pasajeros.
i no hubiera turistas en absoluto, existirían .506 millones de pasajeros.
sta cantidad se obtiene mediante la constante de la ecuación de regresión (^y=.506+.1593x).
uando x, la variable que considera la cantidad de turistas que visitan la ciudad, es igual a 0,
a cantidad de pasajeros (la variable y) tomará el valor de .506 millones.
(Y-Y') (X-X´)(Y-Y´) (X-X´)^2
-0.758 3.03 16.00
-1.258 11.33 81.00
-0.958 4.79 25.00
-0.758 5.31 49.00
0.242 0.73 9.00
0.442 1.77 16.00
0.142 0.71 25.00
-0.258 -0.26 1.00
0.442 1.33 9.00
2.142 19.28 81.00
1.142 4.57 16.00
-0.558 2.23 16.00
54.80 344.00
b1= 0.159
b0= 0.506
^y=.506 + .159x
Lower 95.0% Upper 95.0% Upper 95.0%
-0.09268088 1.104696388 11.04696388
0.110365198 0.208239453 2.082394529
Antigüedad
Precio de venta Pies cuadrados Habitaciones (años)
84000 1670 2 30
79000 1339 2 25
91500 1712 3 30
120000 1840 3 40
127500 2300 3 18
132500 2234 3 30
145000 2311 3 19
164000 2377 3 7
155000 2736 4 10
168000 2500 3 1
172500 2500 4 3
174000 2479 3 3
175000 2400 3 1
177500 3124 4 0
184000 2500 3 2
195500 4062 4 10
195000 2854 3 3
Desarrolle tres modelos de regresión con base en cada uno de los otros factores de manera individual
¿Cuál de estos modelos es el mejor?
R^2 R SIGNIFICANCIA F
A) PIES CUADRADOS 0.8366402795 0.6999669573 0.000028346
B) HABITACIONES 0.6581918608 0.4332165256 0.0040729544
C) ANTIGÜEDAD 0.8382649651 0.7026881518 2.64301625E-05
R= El modelo que calcula el precio con base en la antigüedad es el mejor, con una significancia F de
0.0000264, un coeficiente de determinación de .8382, y un coeficiente de correlación de .7027
A) PIES CUADRADOS
Precio de venta Pies cuadrados SUMMARY OUTPUT
84000 1670
79000 1339 Regression Statistics
91500 1712 Multiple R
120000 1840 R Square
127500 2300 Adjusted R Sq
132500 2234 Standard Erro
145000 2311 Observations
164000 2377
155000 2736 ANOVA
168000 2500
172500 2500 Regression
174000 2479 Residual
175000 2400 Total
177500 3124
184000 2500
195500 4062 Intercept
195000 2854 Pies cuadrado
RESIDUAL OUTPUT
Observation
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
B) NÚMERO DE HABITACIONES
Precio de venta Habitaciones SUMMARY OUTPUT
84000 2
79000 2 Regression Statistics
91500 3 Multiple R
120000 3 R Square
127500 3 Adjusted R Sq
132500 3 Standard Erro
145000 3 Observations
164000 3
155000 4 ANOVA
168000 3
172500 4 Regression
174000 3 Residual
175000 3 Total
177500 4
184000 3
195500 4 Intercept
195000 3 Habitaciones
RESIDUAL OUTPUT
Observation
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
C) ANTIGÜEDAD (AÑOS)
Antigüedad
Precio de venta (años) SUMMARY OUTPUT
84000 30
79000 25 Regression Statistics
91500 30 Multiple R
120000 40 R Square
127500 18 Adjusted R Sq
132500 30 Standard Erro
145000 19 Observations
164000 7
155000 10 ANOVA
168000 1
172500 3 Regression
174000 3 Residual
175000 1 Total
177500 0
184000 2
195500 10 Intercept
195000 3 Antigüedad (a
RESIDUAL OUTPUT
Observation
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
actores de manera individual
UMMARY OUTPUT
Regression Statistics
0.8366402795
0.6999669573
0.6799647545
21360.3043336953
17
df SS MS F Significance F
1 15966678628.64 15966678628.64 34.99449349 0.000028346
15 6843939018.421 456262601.2281
16 22810617647.06
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
26532.2361399713 21408.35528555 1.2393402382 0.23426098 -19098.5930046 72163.06528
51.0272115301 8.6258515606 5.9156143798 0.000028346 32.6416441411 69.41277892
ESIDUAL OUTPUT
UMMARY OUTPUT
Regression Statistics
0.6581918608
0.4332165256
0.3954309607
29358.3391020325
17
df SS MS F Significance F
1 9881936524.61 9881936524.61 11.46513294 0.0040729544
15 12928681122.45 861912074.8299
16 22810617647.06
ESIDUAL OUTPUT
UMMARY OUTPUT
Regression Statistics
0.8382649651
0.7026881518
0.6828673619
21263.2184635887
17
df SS MS F Significance F
1 16028750755.6 16028750755.6 35.45207613 2.64301625E-05
15 6781866891.454 452124459.4303
16 22810617647.06
Caballos de
MPG(Y) fuerza(X1)
44 1,844
44 1,998
40 1,752
37 1,980
37 1,797
34 2,199
35 2,404
32 2,611
30 3,236
28 2,606
26 2,580
26 2,507
25 2,922
22 2,434
20 3,248
21 2,812
18 3,382
18 3,197
16 4,380
16 4,036
Y'= 28.45
X'= 2696.25 #observaciones(n)= 20
b1= -0.011 #varibales ind. (k)= 1
b0= 57.533
Ecuación de regresión= Y^= 57.533-0.011X
r^2= 0.73260428
RCM= 1152.3499 F= 49.3159615794
ECM= 23.3666721
Modelo no-lineal 1
Resumen
Caballos de Caballos de fuerza al
MPG(Y) fuerza(X1) Peso(X2) cuadrado(X3)
Estadísticas de la
44 67 1,844 4489 regresión
Coeficiente de
44 50 1,998 2500 correlación múltiple
Coeficiente de
40 62 1,752 3844 determinación R^2
37 69 1,980 4761 R^2 ajustado
37 66 1,797 4356 Error típico
34 63 2,199 3969 Observaciones
35 90 2,404 8100
ANÁLISIS DE
32 99 2,611 9801 VARIANZA
30 63 3,236 3969
28 91 2,606 8281 Regresión
26 94 2,580 8836 Residuos
26 88 2,507 7744 Total
25 124 2,922 15376
22 97 2,434 9409
20 114 3,248 12996 Intercepción
Caballos de
21 102 2,812 10404 fuerza(X1)
18 114 3,382 12996 Peso(X2)
Caballos de fuerza
18 142 3,197 20164 al cuadrado(X3)
16 153 4,380 23409
16 139 4,036 19321
Modelo no-lineal 2
Caballos de Peso al
MPG(Y) fuerza(X1) Peso(X2) cuadrado(X3) Resumen
44 67 1,844 3400336
44 50 1,998 3992004 Estadísticas de la regresión
40 62 1,752 3069504 Coeficiente de correl
Ejercicio 4-28
Use lo datos del problema 4-26 para encontrar el mejor modelo de regresión cuadrática.
(Hay más de uno para cosniderar). ¿Cómo se compara esto con los modelos de los
problemas 4-26 y 4-27?
Inferior Superior
Error típico Estadístico t Probabilidad Inferior 95% Superior 95% 95.0% 95.0%
3.6512176772 15.7990748818 1.35503566E-11 49.9824655581 65.389257425 49.9824656 65.3892574
0.0595462354 -2.7821342158 0.0127765319 -0.2912971941 -0.040034044 -0.2912972 -0.040034
0.0024441245 -2.0645478978 0.0545681741 -0.0102026642 0.0001106398 -0.0102027 0.00011064
0.9370705751
0.8781012627
0.8552452495
3.4617609208
20
Superior Inferior
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% 95% 95.0%
84.5110897516 9.9021246704 8.5346420656 2.37214287E-07 63.519523189 105.502656 63.5195232
0.8698844546
0.8454877899
3.5765315523
20
DE VARIANZA
Grados de libertadSuma de cuadrados
Promedio de los cuadrados F Valor crítico de F
3 1368.284752892 456.094917631 35.6558760473 0.00000026
16 204.6652471083 12.7915779443
19 1572.95
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%
86.0439579228 11.4887173451 7.4894311818 1.29068233E-06 61.688965142 110.398951 61.6889651
-0.1525987203 0.0519016755 -2.9401501772 0.0096053516 -0.262625357 -0.0425721 -0.2626254
-0.0260996398 0.0084686217 -3.0819229837 0.0071452934 -0.044052316 -0.008147 -0.0440523
3.4996702591E-06 1.362882729E-06 2.5678440149 0.0206442265 6.104879E-07 6.3889E-06 6.1049E-07
Modelo no-lineal 3
Resumen
Estadísticas de la
regresión
Coeficiente de
correlación
múltiple 0.9399335832
Coeficiente de
determinación R^2 0.8834751408
R^2 ajustado 0.852401845
Error típico 3.4955951076
Observaciones 20
ANÁLISIS DE
VARIANZA
Grados de Suma de Promedio de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 4 1389.66222265 347.415555663 28.431974081 0.00000076
Residuos 15 183.287777346 12.2191851564
Total 19 1572.95
Superior
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% 95%
Intercepción 89.2017586603 11.4797257427 7.7703736709 1.230293E-06 64.7333024 113.670215
Caballos de
fuerza(X1) -0.510613298 0.2753846284 -1.8541822796 0.083480254 -1.0975817 0.07635514
Peso (X2) -0.0161525481 0.011183215 -1.444356392 0.1692021272 -0.039989 0.00768391
caballos de fuerza
al cuadrado(X3) 0.0018894877 0.0014285223 1.3226868247 0.2057518351 -0.0011553 0.00493431
Peso al cuadrado
(X4) 0.00000162 1.94777474E-06 0.8317259233 0.4186080268 -2.5316E-06 5.7716E-06
Resumen
(Y^-Y')^2
54.3079159 Estadísticas de la regresión
142.802471 Coeficiente d 0.87760695
75.9796074 Coeficiente 0.77019397
46.655667 R^2 ajustado 0.75742696
58.3518462 Error típico 4.48127835
71.3548612 Observacione 20
1.373811
1.56983635 ANÁLISIS DE VARIANZA
71.3548612 Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F
0.81477574 Regresión 1 1211.4766 1211.4766 60.3269248173
0.00889374 Residuos 18 361.473402 20.0818557
2.92749341 Total 19 1572.95
63.8260357
0.50984742 Coeficientes Error típico Estadístico t Probabilidad
28.0332587 Intercepción 53.8723763 3.42305993 15.7380757 5.755227691E-12
4.24884947 Caballos de f -0.2694475 0.03469115 -7.7670409 3.723505766E-07
28.0332587
164.844433
249.73793
144.740944
1211.4766
Resumen
(Y^-Y')^2
84.5064539 Estadísticas de la regresión
56.7254235 Coeficiente d 0.85592306
103.736083 Coeficiente 0.73260428
59.687739 R^2 ajustado 0.71774896
94.0842118 Error típico 4.83390857
28.7677199 Observacione 20
9.93721984
0.8455604 ANÁLISIS DE VARIANZA
33.895431 Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F
0.94765505 Regresión 1 1152.3499 1152.3499 49.3159615794
1.57232305 Residuos 18 420.600097 23.3666721
4.16703967 Total 19 1572.95
5.92940856
8.00178452 Coeficientes Error típico Estadístico t Probabilidad
35.4193463 Intercepción 57.5329253 4.28010547 13.441941 7.956246974E-11
1.55882678 Peso(X2) -0.0107864 0.00153598 -7.0225324 0.0000015
54.7126173
29.1741206
329.845889
208.835049
1152.3499
Superior
95.0%
105.502656
-0.2822335
-0.0024369
0.00480731
Superior 95.0%
110.398951
-0.0425721
-0.008147
6.3889E-06
Inferior Superior
95.0% 95.0%
64.7333024 113.670215
-1.0975817 0.07635514
-0.039989 0.00768391
-0.0011553 0.00493431
-2.5316E-06 5.7716E-06
Valor crítico de F
0.0000004
Valor crítico de F
0.0000015
Intercepción
Mediana del SAT (X)
X2
Y^=
1 Ejercicio 4-29
0 a) ¿Las escuelas con los resultados del SAT más altos cobran más por su
matricula y sus cuotas?
E VARIANZA
Grados de libertad Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
2 1005210980.96964 502605490.48482 27.6665133 0.00000927
15 272498463.474802 18166564.231654
17 1277709444.44444
Inferior 95.0%
Superior 95.0%
-11085.679 33062.7421
-8.0017387 17.9428352
9313.02137 18818.56
Liga Americana
Y^= 77.18+0.047(X)
Ejercicio 4-30
Desarrolle el modelo para pronosticar el número total de victorias con
base en la nómina.
Utilice el modelo para pronositcar el número de victorias para un
Abs Pct Err equipo con una nómina de $79 millones
12.86%
23.73% A pesar de que el modelo tiene un coficiente de correlación muy bajo
por lo cuál se podría determinar que no existe una gran relación entre la
03.80% varibale dependiente e independiente. El número de victorias para una
18.96% nómina de 79 millones es: 80.923
05.18%
11.21%
05.07%
23.69%
08.90%
15.10%
08.09%
10.86%
10.88%
10.63%
168.95%
12.07%
MAPE
w ERA R AVG OBP
Baltimore 93 3.9 712 0.247 0.311
Boston 69 4.7 734 0.26 0.315
Chicago 85 4.02 748 0.255 0.318
Cleveland 68 4.78 667 0.251 0.324
Detroid 88 3.75 726 0.268 0.335
Kansas City 72 4.3 676 0.265 0.317
Los Ángeles 89 4.02 767 0.274 0.332
Minnesota 66 4.77 701 0.26 0.325
Nueva York 95 3.85 804 0.265 0.337
Oakland 94 3.48 713 0.238 0.31
Seattle 75 3.76 619 0.234 0.296
Tampa Bay 90 3.19 697 0.24 0.317
Texas 93 3.99 808 0.273 0.334
Toronto 73 4.64 716 0.245 0.309 a) Desarrolle un modelo de regres
número de victorias con base en la
w (Y)
Y'= 82.1428571 93
X'= 4.08214286 69
b1= -17.870434 85
b0= 155.092523 68
Ecuación de regresión= Y^= 155.09-17.87X 88
r^2= 0.64871342 72
ECM= 45.7759873 89
# de observaciones= 14 66
# de var. Indepen. = 1 95
RCM= 1014.40244 94
F= 22.1601433 75
90
93
73
w (Y)
Y'= 82.1428571 93
X'= 720.571429 69
b1= 0.12354875 85
b0= -6.8828405 68
Ecuación de regresión= Y^= -6.88-0.123 88
r^2= 0.33175085 72
ECM= 87.0792286 89
# de observaciones= 14 66
# de var. Indepen. = 1 95
RCM= 518.763542 94
F= 5.95737411 75
90
93
73
w (Y)
Y'= 82.1428571 93
X'= 0.25535714 69
b1= 77.9030044 85
b0= 62.2497685 68
Ecuación de regresión= Y^= 62.24-77.90X 88
r^2= 0.00868278 72
ECM= 129.178075 89
# de observaciones= 14 66
# de var. Indepen. = 1 95
RCM= 13.5773808 94
F= 0.10510592 75
90
93
73
w (Y)
Y'= 82.1428571 93
X'= 0.32 69
b1= 289.010989 85
b0= -10.340659 68
Ecuación de regresión= Y^= -10.34-289.01X 88
r^2= 0.09721711 72
ECM= 117.641209 89
# de observaciones= 14 66
# de var. Indepen. = 1 95
RCM= 152.01978 94
F= 1.29223239 75
90
93
73
Coeficientes
Intercepción 72.3215785
ERA (X1) -16.881233
R (X2) 0.10926451
Y^= 72.32-16.88X1+0.109(X2)
) Desarrolle un modelo de regresión que se pueda utilizar para pronosticar el
úmero de victorias con base en las ERA
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
1417.03718 708.518589 53.1351117 0.0000022
146.677107 13.3342825
1563.71429
1014.40244
(Y^-Y')^2
1.12145827
2.75255701
11.4837327
43.8069636
0.44982937
30.3242315
32.9038971
5.84684728
106.244464
0.87504896
157.477973
8.48102814
116.676518
0.31899257
518.763542
(Y^-Y')^2
0.42386159
0.13082148
0.00077409
0.11521579
0.97006062
0.56431277
2.10927574
0.13082148
0.56431277
1.82837338
2.7681825
1.43129536
1.88906216
0.65101103
13.5773808
(Y^-Y')^2
6.76571549
2.08818379
0.33410941
1.33643763
18.7936541
0.75174617
12.0279387
2.08818379
24.1394047
8.35273518
48.1117546
0.75174617
16.3713609
10.1068096
152.01978