Sunteți pe pagina 1din 60

Equipo A: Andreas Maximiliano Argote Vallejo, Karen Marian G

Medida relacionada con el


coeficiente de determinación.
Expresa el grado o fuerza de la
relación lineal.
Visitas en YT SCR (suma de
Ventas (Y) en miles(X) Mide la proporción de la cuadrados de la
8 30 variabilidad en Y que se explica regresión):
por la ecuación de regresión. r^2 Indica cuanto de la
11 40 puede oscilar entre 0 y 1. Resumen
variabilidad total en Y
12 70 se explica por el
r^2 ajustado se utiliza para
10 60 determinar si una variable Estadísticas demodelo
la regresión
de regresión..
independiente adicional es También se le conoce
Coeficiente de correlación como variabilidad
15 80 benéfica. Toma en cuenta el múltiple
número de variables explicada en Y.
independientes en el modelo. Coeficiente de
13 50 Número de observaciones en la determinación R^2
muestra R^2 ajustado
Error típico
Grados de libertad de libertad
para el numerador: Observaciones
gl1 = k; donde
k = número de variables ANÁLISIS DE VARIANZA
independientes.

Grados de libertad de libertad Regresión


para el denominador: b0 = intersección.
Residuos
gl2 = n-k-1; donde SCT (suma de
n = número de observaciones Totalb1 = pendiente de recta de
cuadrados total):
en la muestra. regresión. Es la suma de la
k = número de variables variaciones de Y
independientes. respecto a la media, al
Intercepción
cuadrado. De modo
Visitas en YT en miles(X) que, las desviaciones
negativas no cancelen
las positivas.
lejo, Karen Marian García Ramírez

SCR (suma de SEC (suma de errores


cuadrados de la al cuadrado) : Estadistico F:
regresión): Si se utiliza la rectaFde
calculada= RCM/ECM
Indica cuanto de la regresión y aún hayCada vez que el valor
variabilidad total en Y errores, la suma deF sea grande, el nivel
se explica por el estos errores al de significancia
ticas demodelo
la regresión
de regresión..cuadrado. Tambiénobservado
se (valor p)
También se le conoce le conoce como será bajo.
como variabilidad variabilidad no
explicada0.7702079842
en Y. explicada en Y.
Nivel de significancia observado o valor p
0.593220339 del modelo.
Se rechaza la hipótesis nula (osea: si existe
0.4915254237 una relación lineal; X es útil para pronosticar
1.7320508076 Y) si el valor p es menor que el nivel de
6 significancia (α)

Suma de Promedio de los Valor crítico de


Grados de libertad cuadrados cuadrados F F
ción. 1 17.5 17.5 5.8333333333 0.0731395444
4 12 3
SCT (suma de Nivel de significancia
te de recta de
cuadrados total): 5 29.5
observado o valor p de cada
Es la suma de la variable.
variaciones de Y
Coeficientes A Error
diferencia
típicodel que Estadístico
es de t Probabilidad Inferior 95% Superior 95%
respecto a la media, al6 todo el modelo.
2.3844735867 Este evalúa el
2.5162786593 0.0656164899 -0.6203600183 12.6203600183
cuadrado. De modo nivel de significacia observado
que, las desviaciones0.1 de0.0414039336 2.4152294577
cada una de las variables 0.0731395444 -0.0149557487 0.2149557487
negativas no cancelen independientes.
las positivas.
Inferior 95.0%
-0.6203600183 12.6203600183
-0.0149557487 0.2149557487
Visitas en YT en
miles(X) Ventas (Y) Diagrama de dispersión
30 8 16
40 11 14

Ventas de la guitarra
f(x) = 0.1x + 6
70 12 12
R² = 0.593220339
60 10 10
8
80 15
6
50 13 4
2
0
20 30 40 50 60 70 80 90
Visitas en YT en miles

Visitas en YT en
Ventas (Y) miles(X) (Y-Y') (X-X') (X-X')^2
8 30 -3.5 -25 625
11 40 -0.5 -15 225
12 70 0.5 15 225
10 60 -1.5 5 25
15 80 3.5 25 625
13 50 1.5 -5 25
Σ(X-X')^2= 1750
X' media = 55 Σ(Y-Y')(X-X')=
Y' media = 11.5
b1= 0.1
b0= 6
Ecuación de regresión o mínimos cuadrados = Y^= 6+0.1X

Y^(40,000)= 10
ispersión
Ejercicio 4-10
a) Grafique estos datos para saber si una ecuación lineal podría
describir la relación entre las visitas en YouTube y las ventas de la
guitarra
b) Use las ecuaciones presentadas en este capítulo para calcular
la SCT, SEC y SCR. Encuentre la ecuación de regresión por
mínimos cuadrados para estos datos.
c) Use la ecuación de regresión para pronosticar las ventas de la
60 70 80 90 guitarra, si hubo 40,000 vistas el mes pasado
YT en miles Acorde al modelo de regresión se venderán 10 guitarras

(Y-Y')(X-X') (Y-Y')^2 Y^ (Y-Y^)^2 (Y^-Y')^2


87.5 12.25 9 1 6.25
7.5 0.25 10 1 2.25
7.5 0.25 13 1 2.25
-7.5 2.25 12 4 0.25
87.5 12.25 14 1 6.25
-7.5 2.25 11 4 0.25
SCT= 29.5 SEC= 12
175 SCR= 17.5
a ecuación lineal podría
ouTube y las ventas de la

e capítulo para calcular


de regresión por

nosticar las ventas de la


ado
nderán 10 guitarras
Estudiante 1 2 3 4 5 6
Calif. 1er examen 98 77 88 80 96 61
Promedio final 93 78 84 73 84 64
18.989
a)
Pendiente 0.7398590334
Constante 18.9892117376

^y= 18.9892 + .7398x

X 98 77 88 80 96
Y Pronóstico 91.4953970081 75.95835731 84.09680667 78.17793441 90.01567894
Error 6.5046029919 1.041642693 3.903193326 1.822065593 5.984321059

b) Calificación del 1er examen: 83


Pronóstico promedio final: 80.39751151

c) R^2= 0.84735 El modelo explica el 84% de la variabilidad de Y.


R= 0.9205 Existe una fuerte correlación positiva de .92
R^2= 0.84735
Con fórmula =CORREL R= 0.9205

100
90
f(x) = 0.7398590334x + 18.9892117376
80 R² = 0.8473535823

70
60
50
40
30
20
10
0
55 60 65 70 75 80 85 90 95 100 105
7 8 9
66 95 69
64 95 76

61 66 95 69
64.12061277 67.81990794 89.27581991 70.03948504
-3.12061277 -1.81990794 5.724180092 -1.03948504
Estudiante 1er parcial Promedio final
1 98 93 Final (y) 1er parcial (x) (Y-Y')^2
2 77 78 93 98 196
3 88 84 78 77 1
4 80 73 84 88 25
5 96 84 73 80 36
6 61 64 84 96 25
7 66 64 64 61 225
8 95 95 64 66 225
9 69 76 95 95 256
76 69 9
SCT= 998

SCT= 998
Y' 79 SEC= 152.3411249
X' 81.11 SCR= 845.6588751

n= 9
k= 1

ECM= SEC / (n - k - 1)
ECM= 21.76301784
RCM= SCR/k
RCM= 845.66
F= RCM/ECM
F= 38.85761072
^Y (Y-^Y)^2 (^Y-Y')^2 (X-X´) (Y-Y') (X-X´)(Y-Y´) (X-X´)^2
91.5 2.26 156.13 16.89 14 236.44 285.23
76.0 4.17 9.25 -4.11 -1 4.11 16.90
84.1 0.01 25.98 6.89 5 34.44 47.46
78.2 26.81 0.68 -1.11 -6 6.67 1.23
90.0 36.19 121.35 14.89 5 74.44 221.68
64.1 0.01 221.40 -20.11 -15 301.67 404.46
67.8 14.59 124.99 -15.11 -15 226.67 228.35
89.3 32.77 105.59 13.89 16 222.22 192.90
70.0 35.53 80.29 -12.11 -3 36.33 146.68
SEC= 152.341125 1143.00 1544.89
SCR= 845.6588751
b1= 0.74
b0= 18.99
^y=18.99 + 0.74x

La relación que existe entre la calificación del primer parcial con


el promedio final es estadísticamente significativa, guiándonos
por el estadístico F del modelo y la tabla del apéndice D.
Estudiante 1er parcial Promedio final
1 98 93 SUMMARY OUTPUT
2 77 78
3 88 84 Regression Statistics
4 80 73 Multiple R 0.920518105
5 96 84 R Square 0.847353582
6 61 64 Adjusted R Sq 0.825546951
7 66 64 Standard Erro 4.665084976
8 95 95 Observations 9
9 69 76
ANOVA
df
SCR Regression 1
SEC Residual 7
SCT Total 8

Coefficients
Intercept 18.98921174
1er parcial 0.739859033
Con una significancia observado del .0004, se rechaza la hipótesis nula, lo cual sign
existe una relación estadísticamente significativa entre la calificación del primer ex
el promedio final del curso.

SS MS F Significance F
845.6588751 845.6588751 38.85761072 0.0004309527
152.3411249 21.76301784
998

Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
9.751788333 1.947254297 0.092541048 -4.0701034515 42.04852693 -4.07010345 42.04852693
0.118689127 6.233587307 0.000430953 0.4592038461 1.020514221 0.459203846 1.020514221
rechaza la hipótesis nula, lo cual significa que
tiva entre la calificación del primer examen y
Número de turistas Pasajeros (en Pasajeros (en cientos
Año (en millones) millones) de miles)
1 7 1.5 15 a)
2 2 1 10
3 6 1.3 13
4 4 1.5 15
5 14 2.5 25
6 15 2.7 27
7 16 2.4 24
8 12 2 20
9 14 2.7 27
10 20 4.4 44
11 15 3.4 34
12 7 1.7 17

b)

Y'= 2.258
X'= 11

SUMMARY OUTPUT
SCR
SEC
SCT

c) ¿Cuántos pasajeros se esperan si 10 m


Turistas (millones)
Si 10 millones de turistas visitan la ciuda

d) Si no hubiera turistas en absoluto, exp


Si no hubiera turistas en absoluto, existi
Esta cantidad se obtiene mediante la con
Cuando x, la variable que considera la ca
la cantidad de pasajeros (la variable y) to
Siendo que el modelo explica el 84% de la variabilidad en Y, y que se tiene un coeficiente
de correlación del .9167, parece ser un modelo lineal considerablemente razonable.

5
4.5
Pasajeros (en cientos de miles)

4
3.5 f(x) = 0.1593023256x + 0.5060077519
3 R² = 0.8402760031
2.5
2
1.5
1
0.5
0
0 5 10 15 20 25
Número de turistas (en millones)

R= 0.9167
Coeficiente 0.159
Constante 0.5060
Ecuación y = .5060 + .159x

Pasajeros (y) Turistas (x) (Y-Y')^2 ^Y (Y-^Y)^2 (^Y-Y')^2 (X-X´)


1.5 7 0.58 1.6 0.01 0.41 -4.00
1 2 1.58 0.8 0.03 2.06 -9.00
1.3 6 0.92 1.5 0.03 0.63 -5.00
1.5 4 0.58 1.1 0.13 1.24 -7.00
2.5 14 0.06 2.7 0.06 0.23 3.00
2.7 15 0.20 2.9 0.04 0.41 4.00
2.4 16 0.02 3.1 0.43 0.63 5.00
2 12 0.07 2.4 0.17 0.03 1.00
2.7 14 0.20 2.7 0.00 0.23 3.00
4.4 20 4.59 3.7 0.50 2.06 9.00
3.4 15 1.30 2.9 0.25 0.41 4.00
1.7 7 0.31 1.6 0.01 0.41 -4.00
SCT= 10.39 SEC= 1.66
SCR= 8.73
SCT= 10.39
SEC= 1.66
SCR= 8.7297674419

UMMARY OUTPUT
Regression Statistics
Multiple R 0.9166656986
R Square 0.8402760031
Adjusted R Squ 0.8243036034
Standard Error 0.4073572418
Observations 12

ANOVA
df SS MS F Significance F
Regression 1 8.7297674419 8.729767442 52.608 2.74837E-05
Residual 10 1.6593992248 0.165939922
Total 11 10.389166667

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 0.5060077519 0.2686944916 1.883208505 0.08905228 -0.09268088 1.104696388
Número de turis 0.1593023256 0.0219632305 7.253137252 2.74837E-05 0.110365198 0.208239453

) ¿Cuántos pasajeros se esperan si 10 millones de turistas visitan la ciudad?


10
i 10 millones de turistas visitan la ciudad, se esperarían 2.099031008 millones de pasajeros.

) Si no hubiera turistas en absoluto, explique la cantidad de pasajeros previst 0.506 millones de pasajeros.
i no hubiera turistas en absoluto, existirían .506 millones de pasajeros.
sta cantidad se obtiene mediante la constante de la ecuación de regresión (^y=.506+.1593x).
uando x, la variable que considera la cantidad de turistas que visitan la ciudad, es igual a 0,
a cantidad de pasajeros (la variable y) tomará el valor de .506 millones.
(Y-Y') (X-X´)(Y-Y´) (X-X´)^2
-0.758 3.03 16.00
-1.258 11.33 81.00
-0.958 4.79 25.00
-0.758 5.31 49.00
0.242 0.73 9.00
0.442 1.77 16.00
0.142 0.71 25.00
-0.258 -0.26 1.00
0.442 1.33 9.00
2.142 19.28 81.00
1.142 4.57 16.00
-0.558 2.23 16.00
54.80 344.00

b1= 0.159
b0= 0.506
^y=.506 + .159x
Lower 95.0% Upper 95.0% Upper 95.0%
-0.09268088 1.104696388 11.04696388
0.110365198 0.208239453 2.082394529
Antigüedad
Precio de venta Pies cuadrados Habitaciones (años)
84000 1670 2 30
79000 1339 2 25
91500 1712 3 30
120000 1840 3 40
127500 2300 3 18
132500 2234 3 30
145000 2311 3 19
164000 2377 3 7
155000 2736 4 10
168000 2500 3 1
172500 2500 4 3
174000 2479 3 3
175000 2400 3 1
177500 3124 4 0
184000 2500 3 2
195500 4062 4 10
195000 2854 3 3

Desarrolle tres modelos de regresión con base en cada uno de los otros factores de manera individual
¿Cuál de estos modelos es el mejor?

R^2 R SIGNIFICANCIA F
A) PIES CUADRADOS 0.8366402795 0.6999669573 0.000028346
B) HABITACIONES 0.6581918608 0.4332165256 0.0040729544
C) ANTIGÜEDAD 0.8382649651 0.7026881518 2.64301625E-05

R= El modelo que calcula el precio con base en la antigüedad es el mejor, con una significancia F de
0.0000264, un coeficiente de determinación de .8382, y un coeficiente de correlación de .7027

A) PIES CUADRADOS
Precio de venta Pies cuadrados SUMMARY OUTPUT
84000 1670
79000 1339 Regression Statistics
91500 1712 Multiple R
120000 1840 R Square
127500 2300 Adjusted R Sq
132500 2234 Standard Erro
145000 2311 Observations
164000 2377
155000 2736 ANOVA
168000 2500
172500 2500 Regression
174000 2479 Residual
175000 2400 Total
177500 3124
184000 2500
195500 4062 Intercept
195000 2854 Pies cuadrado

RESIDUAL OUTPUT

Observation
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

B) NÚMERO DE HABITACIONES
Precio de venta Habitaciones SUMMARY OUTPUT
84000 2
79000 2 Regression Statistics
91500 3 Multiple R
120000 3 R Square
127500 3 Adjusted R Sq
132500 3 Standard Erro
145000 3 Observations
164000 3
155000 4 ANOVA
168000 3
172500 4 Regression
174000 3 Residual
175000 3 Total
177500 4
184000 3
195500 4 Intercept
195000 3 Habitaciones

RESIDUAL OUTPUT

Observation
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

C) ANTIGÜEDAD (AÑOS)
Antigüedad
Precio de venta (años) SUMMARY OUTPUT
84000 30
79000 25 Regression Statistics
91500 30 Multiple R
120000 40 R Square
127500 18 Adjusted R Sq
132500 30 Standard Erro
145000 19 Observations
164000 7
155000 10 ANOVA
168000 1
172500 3 Regression
174000 3 Residual
175000 1 Total
177500 0
184000 2
195500 10 Intercept
195000 3 Antigüedad (a
RESIDUAL OUTPUT

Observation
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
actores de manera individual

con una significancia F de


correlación de .7027

UMMARY OUTPUT

Regression Statistics
0.8366402795
0.6999669573
0.6799647545
21360.3043336953
17

df SS MS F Significance F
1 15966678628.64 15966678628.64 34.99449349 0.000028346
15 6843939018.421 456262601.2281
16 22810617647.06
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
26532.2361399713 21408.35528555 1.2393402382 0.23426098 -19098.5930046 72163.06528
51.0272115301 8.6258515606 5.9156143798 0.000028346 32.6416441411 69.41277892

ESIDUAL OUTPUT

Predicted Precio de venta Residuals Standard Residuals


111747.679395289 -27747.67939529 -1.3416325725
94857.6723788162 -15857.67237882 -0.7667369038
113890.822279555 -22390.82227956 -1.0826223003
120422.305355412 -422.3053554117 -0.0204189551
143894.822659272 -16394.82265927 -0.7927087446
140527.026698283 -8027.026698283 -0.3881160772
144456.121986103 543.8780138968 0.0262971346
147823.917947092 16176.08205291 0.7821323819
166142.686886409 -11142.68688641 -0.5387618712
154100.264965298 13899.7350347 0.6720683559
154100.264965298 18399.7350347 0.8896485899
153028.693523165 20971.30647683 1.0139870602
148997.543812285 26002.45618772 1.2572490005
185941.244960099 -8441.244960099 -0.4081440119
154100.264965298 29899.7350347 1.4456869657
233804.769375362 -38304.76937536 -1.8520801521
172163.897846964 22836.10215304 1.1041521001

UMMARY OUTPUT

Regression Statistics
0.6581918608
0.4332165256
0.3954309607
29358.3391020325
17

df SS MS F Significance F
1 9881936524.61 9881936524.61 11.46513294 0.0040729544
15 12928681122.45 861912074.8299
16 22810617647.06

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


20331.6326530612 38780.7764281 0.5242709024 0.60775107 -62327.6356411 102990.9009
41403.0612244898 12227.64735832 3.3860202221 0.004072954 15340.44781933 67465.67463

ESIDUAL OUTPUT

Predicted Precio de venta Residuals Standard Residuals


103137.755102041 -19137.75510204 -0.67324614
103137.755102041 -24137.75510204 -0.8491408927
144540.816326531 -53040.81632653 -1.8659202538
144540.816326531 -24540.81632653 -0.8633201636
144540.816326531 -17040.81632653 -0.5994780346
144540.816326531 -12040.81632653 -0.4235832819
144540.816326531 459.1836734694 0.0161535997
144540.816326531 19459.18367347 0.6845536599
185943.87755102 -30943.87755102 -1.0885731377
144540.816326531 23459.18367347 0.825269462
185943.87755102 -13443.87755102 -0.4729415033
144540.816326531 29459.18367347 1.0363431652
144540.816326531 30459.18367347 1.0715221157
185943.87755102 -8443.87755102 -0.2970467507
144540.816326531 39459.18367347 1.3881326705
185943.87755102 9556.12244898 0.3361743589
144540.816326531 50459.18367347 1.7751011264

UMMARY OUTPUT

Regression Statistics
0.8382649651
0.7026881518
0.6828673619
21263.2184635887
17

df SS MS F Significance F
1 16028750755.6 16028750755.6 35.45207613 2.64301625E-05
15 6781866891.454 452124459.4303
16 22810617647.06

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


182504.704359085 7581.975131306 24.0708655988 2.12134E-13 166344.106911 198665.3018
-2424.9136814847 407.2634605927 -5.9541646038 2.64302E-05 -3292.97519949 -1556.85216
ESIDUAL OUTPUT

Predicted Precio de venta Residuals Standard Residuals


109757.293914545 -25757.29391454 -1.2510814772
121881.862321968 -42881.86232197 -2.0828548154
109757.293914545 -18257.29391454 -0.8867920022
85508.1570996979 34491.8429003 1.6753353792
138856.258092361 -11356.25809236 -0.5515953732
109757.293914545 22742.70608546 1.1046571282
136431.344410876 8568.655589124 0.4161961395
165530.308588692 -1530.308588692 -0.0743300417
158255.567544238 -3255.567544238 -0.1581291989
180079.7906776 -12079.7906776 -0.5867387473
175229.963314631 -2729.963314631 -0.132599587
175229.963314631 -1229.963314631 -0.059741692
180079.7906776 -5079.7906776 -0.2467352373
182504.704359085 -5004.704359085 -0.2430881498
177654.876996116 6345.123003884 0.3081948704
158255.567544238 37244.43245576 1.8090339665
175229.963314631 19770.03668537 0.9602688382
Lower 95.0% Upper 95.0%
-19098.593 72163.06528
32.64164414 69.41277892

Lower 95.0% Upper 95.0%


-62327.6356 102990.9009
15340.44782 67465.67463

Lower 95.0% Upper 95.0%


166344.1069 198665.3018
-3292.9752 -1556.85216
Caballos de
MPG(Y) fuerza(X1) Peso(X2)
44 67 1,844 Modelo lineal simple 1 (MPG-Caballos de fuerza)
44 50 1,998
Caballos de
40 62 1,752 MPG(Y) fuerza(X1)
37 69 1,980 44 67
37 66 1,797 44 50
34 63 2,199 40 62
35 90 2,404 37 69
32 99 2,611 37 66
30 63 3,236 34 63
28 91 2,606 35 90
26 94 2,580 32 99
26 88 2,507 30 63
25 124 2,922 28 91
22 97 2,434 26 94
20 114 3,248 26 88
21 102 2,812 25 124
18 114 3,382 22 97
18 142 3,197 20 114
16 153 4,380 21 102
16 139 4,036 18 114
18 142
16 153
16 139
Y'= 28.45
X'= 94.35 #observaciones(n)= 20
b1= -0.269 #varibales ind. (k)= 1
b0= 53.872
Ecuación de regresión= Y^= 53.872-0.269X
r^2= 0.77019397
RCM= 1211.4766 F= 60.3269248173
ECM= 20.0818557

Modelo lineal simple 2 (MPG-Peso)

Caballos de
MPG(Y) fuerza(X1)
44 1,844
44 1,998
40 1,752
37 1,980
37 1,797
34 2,199
35 2,404
32 2,611
30 3,236
28 2,606
26 2,580
26 2,507
25 2,922
22 2,434
20 3,248
21 2,812
18 3,382
18 3,197
16 4,380
16 4,036
Y'= 28.45
X'= 2696.25 #observaciones(n)= 20
b1= -0.011 #varibales ind. (k)= 1
b0= 57.533
Ecuación de regresión= Y^= 57.533-0.011X
r^2= 0.73260428
RCM= 1152.3499 F= 49.3159615794
ECM= 23.3666721

Modelo lineal múltiple


Caballos de
MPG(Y) fuerza(X1) Peso(X2)
44 67 1,844 Resumen
44 50 1,998
40 62 1,752 Estadísticas de la regresión
Coeficiente de correlación
37 69 1,980 múltiple 0.9034722053
Coeficiente de
37 66 1,797 determinación R^2 0.8162620258
34 63 2,199 R^2 ajustado 0.7946457936
35 90 2,404 Error típico 4.1231815706
32 99 2,611 Observaciones 20
30 63 3,236
28 91 2,606 ANÁLISIS DE VARIANZA

26 94 2,580 Grados de libertad


26 88 2,507 Regresión 2
25 124 2,922 Residuos 17
22 97 2,434 Total 19
20 114 3,248

21 102 2,812 Coeficientes


18 114 3,382 Intercepción 57.6858614914
18 142 3,197 Caballos de fuerza(X1) -0.165665619
16 153 4,380 Peso(X2) -0.0050460122
16 139 4,036

¿Cómo se compara este modelo con cada uno de los


modelos del problema?

Respecto al primer modelo lineal simple (MPG-Caballos de


fuerza), podemos observar que el r^2 ajustado aumento,
mientras que el r^2 igual aumento, así mismo el estadistico
F dismunyo lo que aumento el valor p.

Modelo no-lineal 1

Resumen
Caballos de Caballos de fuerza al
MPG(Y) fuerza(X1) Peso(X2) cuadrado(X3)
Estadísticas de la
44 67 1,844 4489 regresión
Coeficiente de
44 50 1,998 2500 correlación múltiple

Coeficiente de
40 62 1,752 3844 determinación R^2
37 69 1,980 4761 R^2 ajustado
37 66 1,797 4356 Error típico
34 63 2,199 3969 Observaciones
35 90 2,404 8100
ANÁLISIS DE
32 99 2,611 9801 VARIANZA

30 63 3,236 3969
28 91 2,606 8281 Regresión
26 94 2,580 8836 Residuos
26 88 2,507 7744 Total
25 124 2,922 15376

22 97 2,434 9409
20 114 3,248 12996 Intercepción
Caballos de
21 102 2,812 10404 fuerza(X1)
18 114 3,382 12996 Peso(X2)
Caballos de fuerza
18 142 3,197 20164 al cuadrado(X3)
16 153 4,380 23409
16 139 4,036 19321
Modelo no-lineal 2

Caballos de Peso al
MPG(Y) fuerza(X1) Peso(X2) cuadrado(X3) Resumen
44 67 1,844 3400336
44 50 1,998 3992004 Estadísticas de la regresión
40 62 1,752 3069504 Coeficiente de correl

37 69 1,980 3920400 Coeficiente de deter


37 66 1,797 3229209 R^2 ajustado
34 63 2,199 4835601 Error típico
35 90 2,404 5779216 Observaciones
32 99 2,611 6817321
30 63 3,236 10471696 ANÁLISIS DE VARIANZA
28 91 2,606 6791236
26 94 2,580 6656400 Regresión
26 88 2,507 6285049 Residuos
25 124 2,922 8538084 Total
22 97 2,434 5924356
20 114 3,248 10549504
21 102 2,812 7907344 Intercepción
18 114 3,382 11437924 Caballos de fuerza(X1
18 142 3,197 10220809 Peso(X2)
16 153 4,380 19184400 Peso al cuadrado(X3)
16 139 4,036 16289296

Caballos de caballos de fuerza al Peso al cuadrado (X4)


MPG(Y) fuerza(X1) Peso (X2) cuadrado(X3)
44 67 1,844 4489 3,400,336

44 50 1,998 2500 3,992,004

40 62 1,752 3844 3,069,504

37 69 1,980 4761 3,920,400


37 66 1,797 4356 3,229,209
34 63 2,199 3969 4,835,601
35 90 2,404 8100 5,779,216
32 99 2,611 9801 6,817,321

30 63 3,236 3969 10,471,696

28 91 2,606 8281 6,791,236


26 94 2,580 8836 6,656,400
26 88 2,507 7744 6,285,049
25 124 2,922 15376 8,538,084
22 97 2,434 9409 5,924,356

20 114 3,248 12996 10,549,504


21 102 2,812 10404 7,907,344

18 114 3,382 12996 11,437,924


18 142 3,197 20164 10,220,809

16 153 4,380 23409 19,184,400

16 139 4,036 19321 16,289,296

Ejercicio 4-28
Use lo datos del problema 4-26 para encontrar el mejor modelo de regresión cuadrática.
(Hay más de uno para cosniderar). ¿Cómo se compara esto con los modelos de los
problemas 4-26 y 4-27?

El modelo de regresión no lineal que explica mejor la variabilidad en Y es el Y^=84.51 -


0.6776X1 - 0.007X2 + 0.0027X3 que toma en cuenta los caballos de fuerza al cuadrado.
Dado que es el que tien mejor r^2 ajustado (0.8552) así como el nivel de significacia
observado más bajo(0.00000015). En comparación con los modelos 4-26 y 4-27 se podría
decir que los modelos no lineales explican mejor la variabilidad en Y.
(Y-Y') (X-X') (X-X')^2 (Y-Y')(X-X') (Y-Y')^2 Y^ (Y-Y^)^2
15.55 -27.35 748.0225 -425.2925 241.8025 35.8193905 66.9223723
15.55 -44.35 1966.9225 -689.6425 241.8025 40.3999988 12.9600086
11.55 -32.35 1046.5225 -373.6425 133.4025 37.1666282 8.02799569
8.55 -25.35 642.6225 -216.7425 73.1025 35.2804954 2.95669618
8.55 -28.35 803.7225 -242.3925 73.1025 36.088838 0.83021616
5.55 -31.35 982.8225 -173.9925 30.8025 36.8971807 8.3936558
6.55 -4.35 18.9225 -28.4925 42.9025 29.6220968 28.9218424
3.55 4.65 21.6225 16.5075 12.6025 27.1970689 23.0681472
1.55 -31.35 982.8225 -48.5925 2.4025 36.8971807 47.5711011
-0.45 -3.35 11.2225 1.5075 0.2025 29.3526493 1.8296601
-2.45 -0.35 0.1225 0.8575 6.0025 28.5443066 6.47349629
-2.45 -6.35 40.3225 15.5575 6.0025 30.1609919 17.3138539
-3.45 29.65 879.1225 -102.2925 11.9025 20.4608802 20.6036088
-6.45 2.65 7.0225 -17.0925 41.6025 27.735964 32.901283
-8.45 19.65 386.1225 -166.0425 71.4025 23.1553557 9.95626935
-7.45 7.65 58.5225 -56.9925 55.5025 26.3887262 29.0383706
-10.45 19.65 386.1225 -205.3425 109.2025 23.1553557 26.577692
-10.45 47.65 2270.5225 -497.9425 109.2025 15.6108243 5.70816059
-12.45 58.65 3439.8225 -730.1925 155.0025 12.6469012 11.2432712
-12.45 44.65 1993.6225 -555.8925 155.0025 16.4191669 0.17570092
Σ(X-X')^2= 16686.55 SCT= 1572.95 SEC= 361.473402
Σ(Y-Y')(X-X')= -4496.15 SCR=

(Y-Y') (X-X') (X-X')^2 (Y-Y')(X-X') (Y-Y')^2 Y^ (Y-Y^)^2


15.55 -852 726,330.1 -13252.4875 241.8025 37.6427392 40.414765
15.55 -698 487,553.1 -10857.7875 241.8025 35.9816282 64.2942862
11.55 -944 891,608.1 -10906.0875 133.4025 38.6350912 1.86297601
8.55 -716 513,014.1 -6123.9375 73.1025 36.175784 0.67933195
8.55 -899 808,650.6 -7688.5875 73.1025 38.1497016 1.32181385
5.55 -497 247,257.6 -2759.7375 30.8025 33.8135548 0.03476182
6.55 -292 85,410.1 -1914.2375 42.9025 31.6023356 11.5441233
3.55 -85 7,267.6 -302.6375 12.6025 29.3695436 6.91930098
1.55 540 291,330.1 836.6125 2.4025 22.6280217 54.3460636
-0.45 -90 8,145.1 40.6125 0.2025 29.4234758 2.02628323
-2.45 -116 13,514.1 284.8125 6.0025 29.7039231 13.7190461
-2.45 -189 35,815.6 463.6625 6.0025 30.4913328 20.1720705
-3.45 226 50,963.1 -778.8375 11.9025 26.0149623 1.03014849
-6.45 -262 68,775.1 1691.5125 41.6025 31.2787426 86.0950636
-8.45 552 304,428.1 -4662.2875 71.4025 22.4985845 6.24292456
-7.45 116 13,398.1 -862.3375 55.5025 27.2014702 38.4582321
-10.45 686 470,253.1 -7166.0875 109.2025 21.0532022 9.32204384
-10.45 501 250,750.6 -5232.8375 109.2025 23.0486927 25.4892979
-12.45 1,684 2,835,014.1 -20962.6875 155.0025 10.2883401 32.6230584
-12.45 1,340 1,794,930.1 -16679.8875 155.0025 13.9988738 4.00450621
Σ(X-X')^2= 9904407.75 SCT= 1572.95 SEC= 420.600097
Σ(Y-Y')(X-X')= -106833.25 SCR=

Suma de Promedio de los


cuadrados cuadrados F Valor crítico de F
1283.9393535125 641.9696767562 37.7615310629 0.0000006
289.0106464876 17.000626264
1572.95

Inferior Superior
Error típico Estadístico t Probabilidad Inferior 95% Superior 95% 95.0% 95.0%
3.6512176772 15.7990748818 1.35503566E-11 49.9824655581 65.389257425 49.9824656 65.3892574
0.0595462354 -2.7821342158 0.0127765319 -0.2912971941 -0.040034044 -0.2912972 -0.040034
0.0024441245 -2.0645478978 0.0545681741 -0.0102026642 0.0001106398 -0.0102027 0.00011064
0.9370705751

0.8781012627
0.8552452495
3.4617609208
20

Suma de Promedio de los Valor crítico


Grados de libertad cuadrados cuadrados F de F
3 1381.209381237 460.403127079 38.4188289408 0.00000015
16 191.7406187631 11.9837886727
19 1572.95

Superior Inferior
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% 95% 95.0%
84.5110897516 9.9021246704 8.5346420656 2.37214287E-07 63.519523189 105.502656 63.5195232

-0.6776926236 0.1865456686 -3.6328510257 0.0022383533 -1.073151775 -0.2822335 -1.0731518


-0.0070309863 0.0021671034 -3.244416589 0.0050803479 -0.01162504 -0.0024369 -0.011625

0.0027563493 0.0009674796 2.8489999977 0.0116049664 0.0007053842 0.00480731 0.00070538


adísticas de la regresión
0.9326759644

0.8698844546
0.8454877899
3.5765315523
20

DE VARIANZA
Grados de libertadSuma de cuadrados
Promedio de los cuadrados F Valor crítico de F
3 1368.284752892 456.094917631 35.6558760473 0.00000026
16 204.6652471083 12.7915779443
19 1572.95

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%
86.0439579228 11.4887173451 7.4894311818 1.29068233E-06 61.688965142 110.398951 61.6889651
-0.1525987203 0.0519016755 -2.9401501772 0.0096053516 -0.262625357 -0.0425721 -0.2626254
-0.0260996398 0.0084686217 -3.0819229837 0.0071452934 -0.044052316 -0.008147 -0.0440523
3.4996702591E-06 1.362882729E-06 2.5678440149 0.0206442265 6.104879E-07 6.3889E-06 6.1049E-07

Modelo no-lineal 3

Resumen

Estadísticas de la
regresión
Coeficiente de
correlación
múltiple 0.9399335832
Coeficiente de
determinación R^2 0.8834751408
R^2 ajustado 0.852401845
Error típico 3.4955951076
Observaciones 20

ANÁLISIS DE
VARIANZA
Grados de Suma de Promedio de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 4 1389.66222265 347.415555663 28.431974081 0.00000076
Residuos 15 183.287777346 12.2191851564
Total 19 1572.95

Superior
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% 95%
Intercepción 89.2017586603 11.4797257427 7.7703736709 1.230293E-06 64.7333024 113.670215
Caballos de
fuerza(X1) -0.510613298 0.2753846284 -1.8541822796 0.083480254 -1.0975817 0.07635514
Peso (X2) -0.0161525481 0.011183215 -1.444356392 0.1692021272 -0.039989 0.00768391
caballos de fuerza
al cuadrado(X3) 0.0018894877 0.0014285223 1.3226868247 0.2057518351 -0.0011553 0.00493431
Peso al cuadrado
(X4) 0.00000162 1.94777474E-06 0.8317259233 0.4186080268 -2.5316E-06 5.7716E-06
Resumen

(Y^-Y')^2
54.3079159 Estadísticas de la regresión
142.802471 Coeficiente d 0.87760695
75.9796074 Coeficiente 0.77019397
46.655667 R^2 ajustado 0.75742696
58.3518462 Error típico 4.48127835
71.3548612 Observacione 20
1.373811
1.56983635 ANÁLISIS DE VARIANZA
71.3548612 Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F
0.81477574 Regresión 1 1211.4766 1211.4766 60.3269248173
0.00889374 Residuos 18 361.473402 20.0818557
2.92749341 Total 19 1572.95
63.8260357
0.50984742 Coeficientes Error típico Estadístico t Probabilidad
28.0332587 Intercepción 53.8723763 3.42305993 15.7380757 5.755227691E-12
4.24884947 Caballos de f -0.2694475 0.03469115 -7.7670409 3.723505766E-07
28.0332587
164.844433
249.73793
144.740944

1211.4766

Resumen

(Y^-Y')^2
84.5064539 Estadísticas de la regresión
56.7254235 Coeficiente d 0.85592306
103.736083 Coeficiente 0.73260428
59.687739 R^2 ajustado 0.71774896
94.0842118 Error típico 4.83390857
28.7677199 Observacione 20
9.93721984
0.8455604 ANÁLISIS DE VARIANZA
33.895431 Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F
0.94765505 Regresión 1 1152.3499 1152.3499 49.3159615794
1.57232305 Residuos 18 420.600097 23.3666721
4.16703967 Total 19 1572.95
5.92940856
8.00178452 Coeficientes Error típico Estadístico t Probabilidad
35.4193463 Intercepción 57.5329253 4.28010547 13.441941 7.956246974E-11
1.55882678 Peso(X2) -0.0107864 0.00153598 -7.0225324 0.0000015
54.7126173
29.1741206
329.845889
208.835049

1152.3499
Superior
95.0%
105.502656

-0.2822335
-0.0024369

0.00480731
Superior 95.0%
110.398951
-0.0425721
-0.008147
6.3889E-06
Inferior Superior
95.0% 95.0%
64.7333024 113.670215

-1.0975817 0.07635514
-0.039989 0.00768391

-0.0011553 0.00493431

-2.5316E-06 5.7716E-06
Valor crítico de F
0.0000004

Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
46.680794212 61.0639583 46.6807942 61.0639583
-0.3423309418 -0.1965642 -0.3423309 -0.1965642

Valor crítico de F
0.0000015

Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
48.540757331 66.5250932 48.5407573 66.5250932
-0.0140133989 -0.0075595 -0.0140134 -0.0075595
Mediana del
Costo Total (Y) SAT (X) X2 Categoria
21,700 1990 0 Pública Privada =
15,600 1620 0 Pública Pública =
16,900 1810 0 Pública
15,400 1540 0 Pública Resumen
23,100 1540 0 Pública
21,400 1600 0 Pública Estadísticas de la regresión
Coeficiente de
16,500 1560 0 Pública correlación múltiple
Coeficiente de
23,500 1890 0 Pública determinación R^2
20,200 1620 0 Pública R^2 ajustado
30,400 1630 1 Privada Error típico
41,500 1840 1 Privada Observaciones
36,100 1980 1 Privada
42,100 1930 1 Privada ANÁLISIS DE VARIANZA
27,100 2130 1 Privada
34,800 2010 1 Privada Regresión
32,100 1590 1 Privada Residuos
31,800 1720 1 Privada Total
32,100 1770 1 Privada

Intercepción
Mediana del SAT (X)
X2

Y^=
1 Ejercicio 4-29
0 a) ¿Las escuelas con los resultados del SAT más altos cobran más por su
matricula y sus cuotas?

Así es cobran aproximadamente $4.97 por cada punto de la mediana del


SAT, si existe relación entre el puntaje de la mediana del SAT y lo que
stadísticas de la regresión cobran las universidades.
¿Son las escuelas privadas más caras que las escuelas públicas cuando se
0.886977411 toman en consideración los resultados del SAT?
Aproximadamente son $14,065.89 más caras cuando se toma en
0.7867289276 consideración los resultados del SAT
0.7582927846
4262.2252675866
18

E VARIANZA
Grados de libertad Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
2 1005210980.96964 502605490.48482 27.6665133 0.00000927
15 272498463.474802 18166564.231654
17 1277709444.44444

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


10988.5314403665 10356.4312276212 1.061034559 0.30546016 -11085.6791934 33062.7421
4.9705482556 6.0861337137 0.8167004685 0.42688067 -8.0017386827 17.9428352
14065.7906660625 2229.8296045452 6.3080114451 0.00001404 9313.021368779 18818.56

10,988.53+ 4.97(X) + 14,065.79(X2)


tos cobran más por su

unto de la mediana del


iana del SAT y lo que

elas públicas cuando se


os del SAT?
cuando se toma en
l SAT

Inferior 95.0%
Superior 95.0%
-11085.679 33062.7421
-8.0017387 17.9428352
9313.02137 18818.56
Liga Americana

Forecasting Multiple regression


Enter
Enter the
the data
data inin the
the shaded
shaded area.
area. To
To get
get aa forecast
forecast use
use the
the shaded
shaded
data
data area
area at
at the
the bottom
bottom left
left of
of the
the sheet.
sheet.

Data Forecasts and Error Analysis


Nómina (en
Y millones) Forecast Error Absolute Squared
Baltimore 93 81.4 81.03662616 11.96337384 11.96337384 143.1223137
Boston 69 173.2 85.37513108 -16.37513108 16.37513108 268.1449178
Chicago 85 96.9 81.76916239 3.230837609 3.230837609 10.43831165
Cleveland 68 78.4 80.89484495 -12.89484495 12.89484495 166.2770263
Detroid 88 132.3 83.44218063 4.557819371 4.557819371 20.77371742
Kansas City 72 60.9 80.06778791 -8.067787913 8.067787913 65.0892018
Los Ángeles 89 154.5 84.49136156 4.508638443 4.508638443 20.32782061
Minnesota 66 94.1 81.63683327 -15.63683327 15.63683327 244.5105546
Nueva York 95 198 86.54718905 8.452810948 8.452810948 71.45001292
Oakland 94 55.4 79.8078557 14.1921443 14.1921443 201.4169598
Seattle 75 82 81.0649824 -6.064982399 6.064982399 36.7840115
Tampa Bay 90 64.2 80.22374724 9.77625276 9.77625276 95.57511803
Texas 93 120.5 82.88450788 10.11549212 10.11549212 102.3231808
Toronto 73 75.5 80.75778978 -7.757789784 7.757789784 60.18330234
Total -2.84217E-14 133.5947388 1506.416449
Coefficients 77.18962942 0.047260402 Average -2.03012E-15 9.542481341 107.6011749
intersección pendiente Bias MAD MSE
SE 11.20422706
Forecast 80.92320119 79
Correlation 0.191421365

Y^= 77.18+0.047(X)
Ejercicio 4-30
Desarrolle el modelo para pronosticar el número total de victorias con
base en la nómina.
Utilice el modelo para pronositcar el número de victorias para un
Abs Pct Err equipo con una nómina de $79 millones
12.86%
23.73% A pesar de que el modelo tiene un coficiente de correlación muy bajo
por lo cuál se podría determinar que no existe una gran relación entre la
03.80% varibale dependiente e independiente. El número de victorias para una
18.96% nómina de 79 millones es: 80.923
05.18%
11.21%
05.07%
23.69%
08.90%
15.10%
08.09%
10.86%
10.88%
10.63%
168.95%
12.07%
MAPE
w ERA R AVG OBP
Baltimore 93 3.9 712 0.247 0.311
Boston 69 4.7 734 0.26 0.315
Chicago 85 4.02 748 0.255 0.318
Cleveland 68 4.78 667 0.251 0.324
Detroid 88 3.75 726 0.268 0.335
Kansas City 72 4.3 676 0.265 0.317
Los Ángeles 89 4.02 767 0.274 0.332
Minnesota 66 4.77 701 0.26 0.325
Nueva York 95 3.85 804 0.265 0.337
Oakland 94 3.48 713 0.238 0.31
Seattle 75 3.76 619 0.234 0.296
Tampa Bay 90 3.19 697 0.24 0.317
Texas 93 3.99 808 0.273 0.334
Toronto 73 4.64 716 0.245 0.309 a) Desarrolle un modelo de regres
número de victorias con base en la

w (Y)
Y'= 82.1428571 93
X'= 4.08214286 69
b1= -17.870434 85
b0= 155.092523 68
Ecuación de regresión= Y^= 155.09-17.87X 88
r^2= 0.64871342 72
ECM= 45.7759873 89
# de observaciones= 14 66
# de var. Indepen. = 1 95
RCM= 1014.40244 94
F= 22.1601433 75
90
93
73

b) Desarrolle un modelo de regre


número de victorias c

w (Y)
Y'= 82.1428571 93
X'= 720.571429 69
b1= 0.12354875 85
b0= -6.8828405 68
Ecuación de regresión= Y^= -6.88-0.123 88
r^2= 0.33175085 72
ECM= 87.0792286 89
# de observaciones= 14 66
# de var. Indepen. = 1 95
RCM= 518.763542 94
F= 5.95737411 75
90
93
73

c) Desarrolle un modelo re regre


número de victorias c

w (Y)
Y'= 82.1428571 93
X'= 0.25535714 69
b1= 77.9030044 85
b0= 62.2497685 68
Ecuación de regresión= Y^= 62.24-77.90X 88
r^2= 0.00868278 72
ECM= 129.178075 89
# de observaciones= 14 66
# de var. Indepen. = 1 95
RCM= 13.5773808 94
F= 0.10510592 75
90
93
73

d) Desarrolle un modelo de regre


número de victorias c

w (Y)
Y'= 82.1428571 93
X'= 0.32 69
b1= 289.010989 85
b0= -10.340659 68
Ecuación de regresión= Y^= -10.34-289.01X 88
r^2= 0.09721711 72
ECM= 117.641209 89
# de observaciones= 14 66
# de var. Indepen. = 1 95
RCM= 152.01978 94
F= 1.29223239 75
90
93
73

e) ¿Cuál de los cuatro modelos

El que mejor pronostica el núme


ERA (carreras limpias) ya que es
e

f) Encuentre el mejor modelo de r


de victorias. Utilice cualquier com

El mejor modelo de regresión es e


carreras anotadas. Su ecuación d
w (Y) ERA (X1) R (X2) 72.32-1
93 3.9 712 Resumen
69 4.7 734
85 4.02 748 Estadísticas de la regresión
68 4.78 667 Coeficiente d 0.95194514
88 3.75 726 Coeficiente 0.90619955
72 4.3 676 R^2 ajustado 0.88914492
89 4.02 767 Error típico 3.65161368
66 4.77 701 Observacione 14
95 3.85 804
94 3.48 713 ANÁLISIS DE VARIANZA
75 3.76 619 Grados de libertad
90 3.19 697 Regresión 2
93 3.99 808 Residuos 11
73 4.64 716 Total 13

Coeficientes
Intercepción 72.3215785
ERA (X1) -16.881233
R (X2) 0.10926451

Y^= 72.32-16.88X1+0.109(X2)
) Desarrolle un modelo de regresión que se pueda utilizar para pronosticar el
úmero de victorias con base en las ERA

ERA (X) (Y-Y') (X-X') (X-X')^2 (Y-Y')(X-X') (Y-Y')^2 Y^ (Y-Y^)^2


3.9 10.8571429 -0.1821429 0.0331760204 -1.977551 117.877551 85.3978291 57.7930023
4.7 -13.142857 0.61785714 0.381747449 -8.1204082 172.734694 71.1014817 4.41622521
4.02 2.85714286 -0.0621429 0.0038617347 -0.177551 8.16326531 83.253377 3.05069195
4.78 -14.142857 0.69785714 0.4870045918 -9.8696939 200.020408 69.6718469 2.79507215
3.75 5.85714286 -0.3321429 0.1103188776 -1.9454082 34.3061224 88.0783942 0.00614566
4.3 -10.142857 0.21785714 0.0474617347 -2.2096939 102.877551 78.2496554 39.0581924
4.02 6.85714286 -0.0621429 0.0038617347 -0.4261224 47.0204082 83.253377 33.023676
4.77 -16.142857 0.68785714 0.473147449 -11.10398 260.591837 69.8505513 14.8267451
3.85 12.8571429 -0.2321429 0.0538903061 -2.9846939 165.306122 86.2913508 75.8405706
3.48 11.8571429 -0.6021429 0.3625760204 -7.1396939 140.591837 92.9034115 1.20250633
3.76 -7.1428571 -0.3221429 0.1037760204 2.30102041 51.0204082 87.8996899 166.402
3.19 7.85714286 -0.8921429 0.7959188776 -7.0096939 61.7346939 98.0858375 65.3807673
3.99 10.8571429 -0.0921429 0.0084903061 -1.0004082 117.877551 83.78949 84.8334941
4.64 -9.1428571 0.55785714 0.3112045918 -5.1004082 83.5918367 72.1737077 0.68275892
Σ(X-X')^2= 3.1764357143 SCT= 1563.71429 SEC= 549.311848
Σ(Y-Y')(X-X')= -56.764286 SCR=

b) Desarrolle un modelo de regresión que se pueda utilizar para pronosticar el


número de victorias con base en las carreras anotadas.

R (X) (Y-Y') (X-X') (X-X')^2 (Y-Y')(X-X') (Y-Y')^2 Y^ (Y-Y^)^2


712 10.8571429 -8.5714286 73.469387755 -93.061224 117.877551 81.0838679 141.994205
734 -13.142857 13.4285714 180.32653061 -176.4898 172.734694 83.8019403 219.097437
748 2.85714286 27.4285714 752.32653061 78.3673469 8.16326531 85.5316228 0.2826228
667 -14.142857 -53.571429 2869.8979592 757.653061 200.020408 75.5241742 56.6131978
726 5.85714286 5.42857143 29.469387755 31.7959184 34.3061224 82.8135503 26.89926
676 -10.142857 -44.571429 1986.6122449 452.081633 102.877551 76.636113 21.4935433
767 6.85714286 46.4285714 2155.6122449 318.367347 47.0204082 87.879049 1.25653113
701 -16.142857 -19.571429 383.04081633 315.938776 260.591837 79.7248317 188.371004
804 12.8571429 83.4285714 6960.3265306 1072.65306 165.306122 92.4503527 6.5007015
713 11.8571429 -7.5714286 57.326530612 -89.77551 140.591837 81.2074166 163.650189
619 -7.1428571 -101.57143 10316.755102 725.510204 51.0204082 69.5938343 29.2266272
697 7.85714286 -23.571429 555.6122449 -185.20408 61.7346939 79.2306367 115.979187
808 10.8571429 87.4285714 7643.755102 949.22449 117.877551 92.9445477 0.00307496
716 -9.1428571 -4.5714286 20.897959184 41.7959184 83.5918367 81.5780629 73.5831626
Σ(X-X')^2= 33985.428571 SCT= 1563.71429 SEC= 1044.95074
Σ(Y-Y')(X-X')= 4198.85714 SCR=

c) Desarrolle un modelo re regresión que se pueda utilizar para pronosticar el


número de victorias con base en el promedio de bateo

AVG (X) (Y-Y') (X-X') (X-X')^2 (Y-Y')(X-X') (Y-Y')^2 Y^ (Y-Y^)^2


0.247 10.8571429 -0.0083571 6.984184E-05 -0.0907347 117.877551 81.4918106 132.438423
0.26 -13.142857 0.00464286 2.155612E-05 -0.0610204 172.734694 82.5045497 182.372862
0.255 2.85714286 -0.0003571 1.27551E-07 -0.0010204 8.16326531 82.1150346 8.32302512
0.251 -14.142857 -0.0043571 1.898469E-05 0.06162245 200.020408 81.8034226 190.534476
0.268 5.85714286 0.01264286 0.0001598418 0.07405102 34.3061224 83.1277737 23.7385891
0.265 -10.142857 0.00964286 9.298469E-05 -0.0978061 102.877551 82.8940647 118.680645
0.274 6.85714286 0.01864286 0.0003475561 0.12783673 47.0204082 83.5951917 29.2119525
0.26 -16.142857 0.00464286 2.155612E-05 -0.074949 260.591837 82.5045497 272.40016
0.265 12.8571429 0.00964286 9.298469E-05 0.12397959 165.306122 82.8940647 146.55367
0.238 11.8571429 -0.0173571 0.0003012704 -0.2058061 140.591837 80.7906836 174.486041
0.234 -7.1428571 -0.0213571 0.0004561276 0.15255102 51.0204082 80.4790715 30.020225
0.24 7.85714286 -0.0153571 0.0002358418 -0.1206633 61.7346939 80.9464896 81.966051
0.273 10.8571429 0.01764286 0.0003112704 0.19155102 117.877551 83.5172887 89.9218132
0.245 -9.1428571 -0.0103571 0.0001072704 0.09469388 83.5918367 81.3360046 69.4889727
Σ(X-X')^2= 0.0022372143 SCT= 1563.71429 SEC= 1550.1369
Σ(Y-Y')(X-X')= 0.17428571 SCR=

d) Desarrolle un modelo de regresión que se pueda utilizar para pronosticar el


número de victorias con base en el promedio de bateo

OBP (X) (Y-Y') (X-X') (X-X')^2 (Y-Y')(X-X') (Y-Y')^2 Y^ (Y-Y^)^2


0.311 10.8571429 -0.009 0.000081 -0.0977143 117.877551 79.5417582 181.124271
0.315 -13.142857 -0.005 0.000025 0.06571429 172.734694 80.6978022 136.838576
0.318 2.85714286 -0.002 0.000004 -0.0057143 8.16326531 81.5648352 11.8003574
0.324 -14.142857 0.004 0.000016 -0.0565714 200.020408 83.2989011 234.056375
0.335 5.85714286 0.015 0.000225 0.08785714 34.3061224 86.478022 2.3164171
0.317 -10.142857 -0.003 0.000009 0.03042857 102.877551 81.2758242 86.0409141
0.332 6.85714286 0.012 0.000144 0.08228571 47.0204082 85.610989 11.4853955
0.325 -16.142857 0.005 0.000025 -0.0807143 260.591837 83.5879121 309.334652
0.337 12.8571429 0.017 0.000289 0.21857143 165.306122 87.056044 63.1064376
0.31 11.8571429 -0.01 0.0001 -0.1185714 140.591837 79.2527473 217.481464
0.296 -7.1428571 -0.024 0.000576 0.17142857 51.0204082 75.2065934 0.04268084
0.317 7.85714286 -0.003 0.000009 -0.0235714 61.7346939 81.2758242 76.1112438
0.334 10.8571429 0.014 0.000196 0.152 117.877551 86.189011 46.3895713
0.309 -9.1428571 -0.011 0.000121 0.10057143 83.5918367 78.9637363 35.5661502
Σ(X-X')^2= 0.00182 SCT= 1563.71429 SEC= 1411.69451
Σ(Y-Y')(X-X')= 0.526 SCR=

e) ¿Cuál de los cuatro modelos pronostica de mejor manera el número de


victorias?
El que mejor pronostica el número de victorias es el modelo de regresión del
ERA (carreras limpias) ya que es el que tiene r^2 más alto y mayor valor en el
estadistico F.

) Encuentre el mejor modelo de regresión múltiple para pronosticar el número


de victorias. Utilice cualquier combinación de variables para encontrar el mejor
modelo.
l mejor modelo de regresión es el que toma en cuenta las carreras limpias y las
carreras anotadas. Su ecuación de regreción o de cuadrados mínimos es: Y^=
72.32-16.88X1+0.109(X2)

Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
1417.03718 708.518589 53.1351117 0.0000022
146.677107 13.3342825
1563.71429

Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
17.256732 4.19091972 0.0015085 34.339767391 110.30339 34.3397674 110.30339
2.05676492 -8.2076627 5.1154E-06 -21.40814184 -12.354324 -21.408142 -12.354324
0.01988421 5.49503922 0.00018763 0.065499659 0.15302936 0.06549966 0.15302936
(Y^-Y')^2
10.5948425
121.911972
1.23325433
155.526096
35.2306007
15.1570199
1.23325433
151.100784
17.2099998
115.78953
33.1411234
254.178621
2.71139982
99.3839401

1014.40244

(Y^-Y')^2
1.12145827
2.75255701
11.4837327
43.8069636
0.44982937
30.3242315
32.9038971
5.84684728
106.244464
0.87504896
157.477973
8.48102814
116.676518
0.31899257

518.763542

(Y^-Y')^2
0.42386159
0.13082148
0.00077409
0.11521579
0.97006062
0.56431277
2.10927574
0.13082148
0.56431277
1.82837338
2.7681825
1.43129536
1.88906216
0.65101103

13.5773808

(Y^-Y')^2
6.76571549
2.08818379
0.33410941
1.33643763
18.7936541
0.75174617
12.0279387
2.08818379
24.1394047
8.35273518
48.1117546
0.75174617
16.3713609
10.1068096

152.01978

S-ar putea să vă placă și