Sunteți pe pagina 1din 8

Problema 1

. En la Hoja Coches se presentan datos relativos a veinticuatro pases. El archivo


Consta de las siguientes variables referidas a cada pas:
- Coches: Nmero de coches por persona.
- Pob: Poblacin en millones de personas.
- Den: Densidad de poblacin.
- Ingresos: Ingresos per capita en dlares U.S.A.
- Gasol: Precio de la gasolina en centavos U.S.A. por litro.
- Consumo: Toneladas de gasolina consumida por coche al ao.
- Pasaj: Miles de pasajeros-kilmetros por persona que usan bs o tren.
- Pas: Pas al que se refieren los datos de la fila.

Se quiere ajustar un modelo de regresin mltiple que explique la variable Coches en


funcin de las variables explicativas: Pob, Den, Ingresos, Gasol, Consumo y Pasaj.
Problema

Regression Analysis: coches versus pob; den; ingresos; gasol; consumo; pasaj

Analysis of Variance

Source DF Adj SS Adj MS F-Value P-Value


Regression 6 0.299913 0.049986 18.99 0.000
pob 1 0.013095 0.013095 4.98 0.039
den 1 0.002564 0.002564 0.97 0.337
ingresos 1 0.231602 0.231602 88.01 0.000
gasol 1 0.027098 0.027098 10.30 0.005
consumo 1 0.044548 0.044548 16.93 0.001
pasaj 1 0.044197 0.044197 16.79 0.001
Error 17 0.044737 0.002632
Total 23 0.344650

Model Summary

S R-sq R-sq(adj) R-sq(pred)


0.0512989 87.02% 82.44% 78.70%

Coefficients

Term Coef SE Coef T-Value P-Value VIF


Constant 0.4725 0.0910 5.19 0.000
pob 0.000593 0.000266 2.23 0.039 1.45
den -0.000108 0.000109 -0.99 0.337 1.34
ingresos 0.03234 0.00345 9.38 0.000 1.16
gasol -0.00408 0.00127 -3.21 0.005 2.45
consumo -0.1090 0.0265 -4.11 0.001 2.67
pasaj -0.0717 0.0175 -4.10 0.001 1.96
Fits and Diagnostics for Unusual Observations

Std
Obs coches Fit Resid Resid
11 0.3000 0.1913 0.1087 2.39 R

R Large residual

Ecuacin de regresin

coches = 0.4725 + 0.000593 pob - 0.000108 den + 0.03234 ingresos - 0.00408 gasol
- 0.1090 consumo - 0.0717 pasaj

R2=87.02%
R2=82.44% AJUSTADO
R2= 78.70%DE PREDICCION

Problema 2
En la hoja Sismos se presentan datos sobre el nmero de muertes e intensidad de
los terremotos ocurridos desde 1.900. Tambin se proporciona el ao en que ocurri el
terremoto, en total, 40 datos. Se desea estudiar si existe una relacin entre el nmero de
muertes y la intensidad del terremoto. Analizar las hiptesis bsicas del modelo ajustado.
Scatterplot of damnificados vs intensidad
200000

150000
damnificados

100000

50000

6.0 6.5 7.0 7.5 8.0 8.5 9.0


intensidad

Entre las dos variables existe una relacion directa


Regression Analysis: damnificados versus intensidad

Analysis of Variance

Source DF Adj SS Adj MS F-Value P-Value


Regression 1 7233629549 7233629549 5.04 0.031
intensidad 1 7233629549 7233629549 5.04 0.031
Error 38 54529078527 1434975751
Lack-of-Fit 19 18175745146 956618166 0.50 0.930
Pure Error 19 36353333381 1913333336
Total 39 61762708076

Model Summary

S R-sq R-sq(adj) R-sq(pred)


37881.1 11.71% 9.39% 1.62%

Coefficients

Term Coef SE Coef T-Value P-Value VIF


Constant -96646 53223 -1.82 0.077
intensidad 15981 7118 2.25 0.031 1.00

Regression Equation

damnificados = -96646 + 15981 intensidad

Fits and Diagnostics for Unusual Observations

Std
Obs damnificados Fit Resid Resid
7 200000 35995 164005 4.45 R

R Large residual
Scatterplot of damnificados vs intensidad
200000

150000
damnificados

100000

50000

6.0 6.5 7.0 7.5 8.0 8.5 9.0


intensidad

Problema 3
En la hoja Salarios se presentan datos de tres variables relativas a las 48 ciudades
ms grandes del mundo en 2001. Las variables consideradas son:
Horas de trabajo= promedio ponderado de 12 ocupaciones
Nivel de precios= coste de una cesta de la compra de 112 productos bsicos, en
base al nivel de Zurich=100
Nivel de salarios= nivel del salario de 12 ocupaciones diferentes ponderadas
segn
la distribucin ocupacional, excludas tasas a la seguridad social e impuestos, en
base al nivel de Zurich=100
El objetivo del estudio es encontrar una relacin entre estas tres variables. En particular
tiene inters estudiar los siguientes modelos de regresin:

1. Estudiar la variable respuesta Nivel de precios respecto a la regresora


Nivel de salarios.

Regression Analysis: precio versus salario

Method

Rows unused 2

Analysis of Variance
Source DF Adj SS Adj MS F-Value P-Value
Regression 1 13302 13302.2 80.34 0.000
salario 1 13302 13302.2 80.34 0.000
Error 44 7285 165.6
Total 45 20587

Model Summary

S R-sq R-sq(adj) R-sq(pred)


12.8675 64.61% 63.81% 61.50%

Coefficients

Term Coef SE Coef T-Value P-Value VIF


Constant 42.64 3.60 11.83 0.000
salario 0.6945 0.0775 8.96 0.000 1.00

Regression Equation

precio = 42.64 + 0.6945 salario

Fits and Diagnostics for Unusual Observations

Obs precio Fit Resid Std Resid


34 115.50 86.87 28.63 2.27 R
41 111.30 69.86 41.44 3.26 R
45 115.00 89.86 25.14 2.01 R
48 100.00 112.08 -12.08 -1.02 X

R Large residual
X Unusual X

Scatterplot of precio vs salario


120

110

100

90

80
precio

70

60

50

40

30

0 20 40 60 80 100
salario
2. Estudiar la variable respuesta Nivel de precios respecto a las otras dos
variables regresoras.

Regression Analysis: precio versus salario; horas

Method

Rows unused 2

Analysis of Variance

Source DF Adj SS Adj MS F-Value P-Value


Regression 2 13488.8 6744.4 40.85 0.000
salario 1 9279.5 9279.5 56.21 0.000
horas 1 186.6 186.6 1.13 0.294
Error 43 7098.5 165.1
Total 45 20587.4

Model Summary

S R-sq R-sq(adj) R-sq(pred)


12.8484 65.52% 63.92% 61.15%

Coefficients

Term Coef SE Coef T-Value P-Value VIF


Constant 69.0 25.1 2.75 0.009
salario 0.6522 0.0870 7.50 0.000 1.26
horas -0.0131 0.0124 -1.06 0.294 1.26

Regression Equation

precio = 69.0 + 0.6522 salario - 0.0131 horas

Fits and Diagnostics for Unusual Observations

Std
Obs precio Fit Resid Resid
16 63.80 55.94 7.86 0.69 X
34 115.50 89.75 25.75 2.10 R
41 111.30 70.86 40.44 3.19 R
45 115.00 88.66 26.34 2.11 R

R Large residual
X Unusual X
Regression Analysis: salario versus horas

Method

Rows unused 2

Analysis of Variance

Source DF Adj SS Adj MS F-Value P-Value


Regression 1 5765.3 5765.3 11.63 0.001
horas 1 5765.3 5765.3 11.63 0.001
Error 44 21817.2 495.8
Lack-of-Fit 43 21568.5 501.6 2.02 0.515
Pure Error 1 248.6 248.6
Total 45 27582.5

Model Summary

S R-sq R-sq(adj) R-sq(pred)


22.2676 20.90% 19.10% 15.14%

Coefficients

Term Coef SE Coef T-Value P-Value VIF


Constant 161.6 35.9 4.50 0.000
horas -0.0649 0.0190 -3.41 0.001 1.00

Regression Equation

salario = 161.6 - 0.0649 horas

Fits and Diagnostics for Unusual Observations

Obs salario Fit Resid Std Resid


14 90.30 39.54 50.76 2.30 R
16 27.80 7.40 20.40 1.02 X
27 4.00 14.35 -10.35 -0.50 X
48 100.00 40.32 59.68 2.71 R

R Large residual
X Unusual X

Scatterplot of salario vs horas


100

80

60
salario

40

20

0
1500 1600 1700 1800 1900 2000 2100 2200 2300 2400
horas

S-ar putea să vă placă și