Sunteți pe pagina 1din 8

3.1 Para los datos de la Liga Nacional de Futbol, en la tabla B.

1 del apéndice:

a. Ajustar un modelo de regresión lineal múltiple que relacione la cantidad de juegos


ganados con las yardas por aire del equipo ( x 2), el porcentaje de jugadas por tierra ( x 7) y
las yardas por tierra del contrario ( x 8).

^y =−1.81+ 0.003598 x 2 +0.193960 x7 −0.004816 x 8

Tabla Nº. I.1 análisis de varianza para los equipos de la liga nacional
Grados Suma de Cuadrados Valor Pr (> F)
de cuadrados medios F
Significancias
libertad
x2 1 76.193 76.193 26.172 3.100e-05 ***

x7 1 139.501 139.501 47.918 3.698e-07 ***

x8 1 41.400 41.400 14.221 0.000937 ***


8

b. Formar la tabla de análisis de varianza y probar el significado de la regresión.

c. Calcular el estadístico t para probar las hipótesis Ho:❑2 = 0, Ho: ❑7 = 0 y Ho: ❑8 =


O. ¿Qué conclusiones se pueden sacar acerca del papel de las variables x 2, x 7 y x 8 en el
modelo?

Tabla Nº. I.2 estadístico t


Estimar Error Valor t Pr (> t)
estándar
Significancias
Se
x2 0.003598 0.000695 5.177 2.66e-05 ***

x7 0.193960 0.088233 2.198 0.037815 *

x8 -0.004816 0.001277 -3.771 0.000938 ***

puede notar que x 2 y


x 7 aportan a la cantidad de juegos ganados para un equipo de la liga nacional y x 8 resta a
la cantidad de juegos ganados.

d. Calcular R2 y R2 Adj para este modelo.

R2=0.7863

R2 Adj =0.7596
e. Con la prueba F parcial, determinar la contribución de x 7 al modelo. ¿Cómo se
relaciona el estadístico F parcial con la prueba t para ❑7 calculada en la parte c
anterior?

3.2 Con los resultados del problema 3.1, demostrar en forma numérica que el cuadrado
del coeficiente de correlación simple entre los valores observados y i y los valores
ajustados ^y i es igual a R2 .

3.3 Véase el problema 3.l Calcular:

a. Un intervalo de confianza de 95% para ❑7.

b. Un intervalo de confianza de 95% para la cantidad media de juegos ganados por un


equipo cuando x 2 = 2 300, x 7 = 56 y x 8 = 2 100.

3.4 Para los datos de la Liga Nacional de Futbol del problema 3.1, ajustar un modelo a
esos datos, usando sólo x 7 Y x 8como regresores.

a. Probar la significancia de la regresión.

b. Calcular R2 y R2 Adj. ¿Cómo se comparan esas cantidades con las calculadas para el
modelo del problema 3.1, que tenía un regresor más ( x 2)?

c. Calcular un intervalo de confianza de 95% para ❑7. También, un intervalo de


confianza de 95% para la cantidad media de juegos ganados por un equipo cuando x 7 =
56 y x 8 = 2 100. Comparar la longitud de esos intervalos de confianza con las longitudes
de los correspondientes en el problema 3.3.

d. ¿Qué conclusiones se pueden sacar de este problema, acerca de las consecuencias de


omitir un regresor importante de un modelo?

3.5 Véanse los datos de rendimiento de gasolina en la tabla B.3 del apéndice.

a. Ajustar un modelo de regresión lineal múltiple, que relacione el rendimiento de la


gasolina y, en millas por galón, la cilindrada del motor x 1 y la cantidad de gargantas del
carburador, x 6.

b. Formar la tabla de análisis de varianza, y probar la significancia de la regresión.


D Sum Mean F Pr(>F)
f Sq Sq value
x1 1 955.34 104.687 3.916e-11 ***
955.34
x6 1 17.56 1.924 0.176
17.56
c. Calcular R2 y R2 Adj para este modelo. Compararlas con la R2 y R2 Adj para el modelo
de regresión lineal simple, que relacionaba las millas con la cilindrada en el problema
2.4.

explica un poquito mas que una variable

d. Determinar un intervalo de confianza de 95% para ❑1.

e. Calcular el estadístico t para probar Ho: ❑1 = O Y Ho: ❑6 = O. ¿Qué conclusiones se


pueden sacar?

Estimate Std. Error t value Pr(>|t|)


(Intercept) 32.910041 1.540929 21.357 < 2e-16 ***
x1 -0.053025 0.006145 -8.628 1.68e-09 ***
x6 0.929500 0.670108 1.387 0.176

f. Determinar un intervalo de confianza de 95% para el rendimiento promedio de la


gasolina, cuando x 1 = 275 pulg3 y x 6= 2 gargantas.

g. Determinar un intervalo de predicción de 95% para una nueva observación de


rendimiento de gasolina cuando x 1 = 275 pulg3 y x 6 = 2 gargantas.

3.6 En el problema 2.4 se pidió establecer un intervalo de confianza de 95% para el


rendimiento promedio de gasolina, y un intervalo de predicción de 95% para el
rendimiento cuando la cilindrada del motor es x 1 = 275 pulg3 . Comparar las longitudes
de esos intervalos con las de los intervalos de confianza y de predicción, para el
problema anterior, 3.5. ¿Dice algo acerca de las ventajas de agregar x 6 al modelo?

3.7 Véanse los datos sobre precios de viviendas en la tabla B.4 del apéndice.

a. Ajustar un modelo de regresión múltiple que relacione el precio de venta con los
nueve regresores.

^y =14.92+1.92472 x 1
b. Probar la significancia de la regresión. ¿Qué conclusiones se pueden sacar?

c. Usar pruebas t para evaluar la contribución de cada regresor al modelo.

d. ¿Cuál es la contribución del tamaño de lote y el espacio vital para el modelo, dado
que se incluyeron todos los demás regresores?

e. En este modelo, ¿la colinealidad es un problema potencial?

3.8 Los datos de la tabla B.5 del apéndice presentan la eficiencia de un proceso químico,
en función de varias variables controlables del proceso.

a. Ajustar un modelo de regresión múltiple que relaciona el CO 2 del producto (y) con el
solvente total ( x 6) y el consumo de hidrógeno ( x 7).

^y =2.52+ 0.018522 x 6 +2.185720 x 7

b. Probar la significancia de la regresión. Calcular R2 y R2 Adj.

R2=0.6996

R2 Adj =0.6746
c. Usar pruebas t para determinar la contribución de x 6 y x 7 al modelo.

Tabla Nº. I.2 estadístico t


d. Estimar Error Valor t Pr (> t)
estándar
Significancias
x6 0.018522 0.002747 6.742 5.66e-07 ***

x7 2.185720 0.972694 2.247 0.0341 *

Establecer intervalos de confianza de 95% para ❑6 y ❑7 .

3.281981

[-3.886304 : 10.45027]

e. Volver a ajustar el modelo sólo con x 6 como regresor. Probar la significancia de la

regresión y calcular R2 y R2 Adj. Comentar los resultados. Con base en estos estadísticos,
¿es satisfactorio el modelo?
f. Establecer un intervalo de confianza de 95% para ❑6 con el modelo que se ajustó en
el punto e. Comparar la longitud de este intervalo de confianza con la del determinado
en la parte d. ¿Se deduce algo importante acerca de la contribución de x 7 al modelo?

g. Comparar los valores de MS Res obtenidos con los dos modelos que se ajustaron
(partes a y e). ¿Cómo cambió la MS Res al quitar x 7 del modelo? ¿Indica lo anterior algo
importante acerca de la contribución de x 7 al modelo?

3.9 En la tabla B.6 del apéndice muestra la concentración de NbOCI 3 en un reactor de


tubo de flujo, en función de varias variables controlables.

a. Ajustar un modelo de regresión múltiple que relacione la concentración de NbOCI 3


(y) con la de COCI 2 ( x 1) y la fracción mol ( x 4 ).

^y =−8.28+0.005214 x 1+ 0.071554 x 4

b. Pruebe la significancia de la regresión.

Grados Suma de Cuadrados Valor F Pr (> F)


de cuadrados medios
Significancias
libertad
x1 1 115.07 115.068 14.6430 0.0007723 ***
x7 1 15.44 15.440 1.9648 0.1732899

c. Calcule R2 y R2 Adj para este modelo.

R2=0.3992

R2 Adj =0.3511

d. Con pruebas t, determinar la contribución de x 1 y x 4 al modelo. ¿Son necesarios los


dos regresores, x 1 y x 4?

Tabla Nº. I.2 estadístico t


Estimar Error Valor t Pr (> t)
estándar
Significancias
x1 0.005214 0.001402 3.719 0.00102 **

x4 0.071554 0.051047 1.402 0.17329


e. En este modelo, ¿es la colinealidad un problema potencial?

3.10 Se cree que la calidad del vino Pinot Noir se relaciona con sus propiedades de
claridad, aroma cuerpo, sabor y fuerza. Los datos de 38 vinos se presentan en el
apéndice B.ll.

a. Ajustar un modelo de regresión lineal múltiple que relacione la calidad del vino con
esos regresores.

b. Probar la significancia de la regresión. ¿A qué conclusiones se puede llegar?

c. Use pruebas t para evaluar la contribución de cada regresor al modelo. Comentar los
resultados.

d. Calcular R2 y R2 Adj para este modelo. Comparar esos valores con R2 y R2 Adj para el
modelo de regresión lineal que relacione la calidad del vino con su aroma y sabor.
Comentar los resultados.

e. Determinar un intervalo de confianza de 95% para el coeficiente de regresión del


sabor, para los dos modelos de la parte d. Comentar las diferencias encontradas.

3.11 Un ingeniero hizo un experimento para determinar la presión, temperatura y flujo


de CO 2, la humedad y el tamaño de partícula de los cacahuates sobre el rendimiento
total de aceite por lote de cacahuates. La tabla B.7 del apéndice resume sus resultados.

a. Ajustar un modelo de regresión lineal múltiple que relacione el rendimiento con esos
regresores.

^y =2.70+ 0.005211 x1 +0.003357 x 2−0.344927 x 3−0.009080 x 4 +0.042840 x 5

Tabla Nº. I.1 análisis de varianza


Grados Suma de Cuadrados Valor Pr (> F)
de cuadrados medios F
Significancias
libertad
x1 1 115.068 115.068 22.102 0.000108 ***
4 8
x2 1 83.343 83.343 16.008 0.000601 ***
6 6
b. Probar la significancia de la regresión. ¿A qué conclusiones se puede llegar?
c. Hacer pruebas t para evaluar la contribución de cada regresor al modelo. Comentar
los resultados.

d.
Tabla Nº. I.2 estadístico t
Estimar Error Valor t Pr (> t)
estándar
Significancias

x1 0.005211 0.001468 3.549 0.00180 **

x2 0.003357 0.000940 3.571 0.00171 **

x3 -0.344927 0.253208 -1.362 0.18691

0.85416
x4 -0.009080 0.048820 -0.186

x5 0.042840 0.053866 0.795 0.43493

Calcular R2 y

R2 Adj para este modelo. Comparar esos valores con los de R2 y R2 Adj para el modelo de
regresión lineal múltiple, que relacione el rendimiento con la temperatura y el tamaño
de partícula. Comentar los resultados.

R2=0.6497

R2 Adj =0.5701

e. Establecer un intervalo de confianza de 95% para el coeficiente de regresión de la


temperatura en ambos modelos de la parte d. Comentar las diferencias encontradas.

3.12. Un ingeniero químico estudió el efecto de la cantidad de surfactante y el tiempo


sobre la formación de catrato. Los catratos se usan como medio de conservación en frío.
La tabla B.8 del apéndice resume los resultados experimentales.

a. Ajustar un modelo de regresión lineal múltiple que relacione la formación de catrato


con estos regresores.
b. Probar la significancia de la regresión. ¿A qué conclusiones se puede llegar?

c. Hacer pruebas t para evaluar la contribución de cada regresor al modelo. Comentar


los resultados.

d. Calcular R2 y R2 Adj para este modelo. Comparar esos valores con los de R2 y R2 Adj
para el modelo de regresión lineal simple que relaciona la formación de catrato con el
tiempo. Comentar los resultados.

e. Determinar un intervalo de confianza de 95% para el coeficiente de regresión del


tiempo para los dos modelos de la parte d. Comentar las diferencias encontradas.

3.13 Un ingeniero estudió el efecto de cuatro variables de un factor adimensional con el


que se describen las caídas de presión en una columna de burbujeo de platos perforados.
En la tabla B.9 del apéndice se resumen los resultados experimentales.

a. Ajustar un modelo de regresión lineal múltiple que relacione ese número


adimensional con los cuatro regresores.

b. Probar la significancia de la regresión. ¿Qué conclusiones se pueden sacar?

c. Hacer pruebas t para evaluar la contribución de cada regresor al modelo. Comentar


los resultados.

d. Calcular R2 y R2 Adj para este modelo. Comparar estos valores con los de R2 y R2 Adj
para el modelo de regresión lineal múltiple que relacione el número adimensional con x 2
y x 3. Comentar los resultados.

e. Determinar un intervalo de confianza de 99% para el coeficiente de regresión de x 2 en


ambos modelos de la parte d. Comentar las diferencias.

S-ar putea să vă placă și