Sunteți pe pagina 1din 11

Trabajo # 2.

De Estadstica aplicada a la Ingeniera

Regresin Mltiple

El diseo eficaz de cierto tipo de indicadores para desperdicios municipales


requiere contar con informacin acerca del contenido de energa de los
desperdicios. Los siguientes datos acerca de y= contenido de energa (Kcal/Kg),
las tres variables fsicas de composicin X1= % de plstico en peso, X2= % de
papel en peso, X3= % de basura en peso y la variable de anlisis aproximado x4=
% de humedad en peso para especmenes de desperdicios obtenidos en cierta
regin:

Contenido
Obs. Plstico Papel Basura Agua de
energa
1 18,69 15,65 45,01 58,21 947
2 19,43 23,51 39,69 46,31 1407
3 19,24 24,23 43,16 46,63 1452
4 22,64 22,20 35,76 45,85 1553
5 16,54 23,56 41,20 55,14 989
6 21,44 23,65 35,56 54,24 1162
7 19,53 24,45 40,18 47,20 1466
8 23,97 19,39 44,11 43,82 1656
9 21,45 23,84 35,41 51,01 1254
10 20,34 26,50 34,21 49,06 1336
11 17,03 23,46 32,45 53,23 1097
12 21,03 26,99 38,19 51,78 1266
13 20,49 19,87 41,35 46,69 1401
14 20,45 23,03 43,59 53,57 1223
15 18,81 22,62 42,20 52,98 1216
16 18,28 21,87 41,50 47,44 1334
17 21,41 20,47 41,20 54,68 1155
18 25,11 22,59 37,02 48,74 1453
19 21,04 26,27 38,66 53,22 1278
20 17,99 28,22 44,18 53,37 1153
21 18,73 29,39 34,77 51,06 1225
22 18,49 26,58 37,55 50,66 1237
23 22,08 24,88 37,07 50,72 1327
24 14,28 26,27 35,80 48,24 1229
25 17,74 23,61 37,36 49,92 1205
26 20,54 26,58 35,40 53,58 1221
27 18,25 13,77 51,32 51,38 1138
28 19,09 25,62 39,54 50,13 1295
29 21,25 20,63 40,72 48,67 1391
30 21,62 22,71 36,22 48,19 1372
a.- Interprete los valores de los coeficientes de regresin estimados ^1 y ^4

Tabla 1.- Coeficientes de regresin estimados ^1 y ^4

Coefficientsa

Model Unstandardized Coefficients Standardized t Sig.


Coefficients

B Std. Error Beta

(Constant) 2244,923 177,902 12,619 ,000

Plastico 28,925 2,824 ,418 10,244 ,000

1 Papel 7,644 2,314 ,167 3,303 ,003

Basura 4,297 1,916 ,113 2,242 ,034

Agua -37,354 1,834 -,800 -20,365 ,000

a. Dependent Variable: contenido de energa

Para ^1 , manteniendo fijo el % de papel, basura y agua en peso, para


desperdicios municipales, si aumenta el porcentaje de plstico en peso, el
contenido de energa de los desperdicios; incrementara en un 28,925 Kcal/Kg,
para ^4 ; manteniendo fijo el % en peso de plstico, papel y basura, para
desperdicios municipales, si el porcentaje de agua en peso aumenta, el contenido
de energa de los desperdicios; disminuir en un 37,354 Kcal/Kg.

b.- Enuncie y pruebe las hiptesis para decidir si el ajuste del modelo a los datos
especifica una relacin lineal entre el consumo de energa y al menos uno de los
cuatro predictores.

Contraste de Hiptesis

Ho: j = 0 Hiptesis nula: No existe relacin entre el contenido de energa de los


desperdicios, con ninguna de las cuatro variables fsicas de composicin

Ha: j 0 Hiptesis alterna: Existe relacin entre el contenido de energa de los


desperdicios, con algunas de las cuatro variables fsicas de composicin

De acuerdo con el programa IBM SPSS V.21. Se obtiene los siguientes


coeficientes.
Tabla 2.- Coeficientes estandarizados

Coefficientsa

Model Unstandardized Coefficients Standardized t Sig.


Coefficients

B Std. Error Beta

(Constant) 2244,923 177,902 12,619 ,000

Plastico 28,925 2,824 ,418 10,244 ,000

1 Papel 7,644 2,314 ,167 3,303 ,003

Basura 4,297 1,916 ,113 2,242 ,034

Agua -37,354 1,834 -,800 -20,365 ,000

a. Dependent Variable: contenido de energa

Tomando en consideracin un nivel de significancia del 5% ( = 0,05); se


puede indicar qu l % de plstico, el % de papel, el % de basura y el % de
Humedad (agua) son menores de 0,05 por lo tanto se rechaza la hiptesis nula por
lo cual las variables independientes antes mencionadas son significativas y
aportan informacin al estudio.

1.- Ajustar un modelo de regresin mltiple con variable respuesta (_?__), y


regresoras.

El modelo de regresin ajustado a considerar ser el siguiente:

Contenido de energa = bo + b1Plstico + b2Papel + b3Basura + b4Agua

Contenido de energa = 2244,923 + 28,925Plastico + 7,644Papel + 4,297Basura -37,354Agua

2.- Son todas las variables significativas (contraste individual de la t)?

El contraste t-student de significatividad individual de los


parmetros; servir para juzgar si se debe incluir o no una variable en la
especificacin del modelo, por consiguiente las pruebas t individuales estn
diseadas para probar las hiptesis:

a) Ho: j = 0 Hiptesis nula. Aceptar H0 significa que la variable no aporta


informacin significativa
b) Ha: j 0 Hiptesis alterna

Las hiptesis se aplican a cada coeficiente de relacin parcial. Estas pruebas


estn basadas en la estadstica t de student dada por:

^
=
(^ )

El procedimiento es idntico al empleado para probar una hiptesis acerca de


la pendiente b del modelo de regresin lineal simple. Con un nivel de significancia
= 0,05, con respecto al valor t crtico se tiene:

2 = (12;1)

-2,059 2,059

Fig. 1.- curva de aceptacin y rechazo

Usando Excel se calcul t2 = Inv. T(0,975;25)

t2 = 2,05953855

En tal sentido y verificar las hiptesis para cada coeficiente se tienen que:

Se acepta Ho: si -2,0595 < Tcal < 2,0595

Se rechaza Ho: si Tcal > 2,0595 o Tcal < 2,0595

De la tabla 2. Coeficiente estandarizado obtenido del SPSS V.21 se toma


los valores de t y se tiene:

Tcal1= 10,244 Para Tcal1 > 2,0595 se rechaza Ho: 1 = 0

Tcal2= 3,303 Para Tcal2 > 2,0595 se rechaza Ho: 2 = 0

Tcal2= 2,242 Para Tcal3 > 2,0595 se rechaza Ho: 3 = 0

Tcal4= -20,365 Para Tcal4 < 2,0595 se rechaza Ho: 4 = 0


Concluyndose que para un riesgo de error tipo I; las evidencias mustrales
sugieren que las variables % del papel, plstico, agua y basura en peso, tienen un
efecto significativo en el modelo (contenido de energa Kcal/Kg.)

3.- Cul es el coeficiente de determinacin? Cul es el coeficiente de


correlacin mltiple? Interprete.

De acuerdo al programa IBM SPSS v.21, se obtiene

Tabla 2.- Coeficientes R y R2


Model Summaryb

Model R R Square Adjusted R Std. Error of the


Square Estimate

1 ,982a ,964 ,958 31,483

a. Predictors: (Constant), Agua, Papel, Plastico, Basura


b. Dependent Variable: contenido de energa

En tal caso el coeficiente de determinacin (R2); indica que las variables


regresoras (papel, agua, basura y plstico) explican en un 96,4% a la variable
respuesta (Contenido de energa), de acuerdo al modelo lineal considerado, y el
modelo se ajusta muy bien; mientras que r el coeficiente de correlacin mltiple
indica una relacin lineal mltiple entre el contenido de energa y los porcentajes
en peso de las variables regresoras: plstico, papel, basura y agua en un 98,2%.

4.- Tabla ANOVA Qu conclusiones se obtienen de esta tabla (contraste


conjunto con la F)? Qu indican los contrastes individuales de la F? Estos
contrastes tienen alguna relacin con los contrastes individuales de t?

Tabla 3.- Anova.


ANOVAa

Model Sum of Squares Df Mean Square F Sig.

Regression 664930,643 4 166232,661 167,714 ,000b

1 Residual 24779,224 25 991,169

Total 689709,867 29

a. Dependent Variable: contenido de energa

b. Predictors: (Constant), Agua, Papel, Plastico, Basura

En contraste conjunto de F se puede concluir que el valor estadstico F es


alto (167,714); con una probabilidad de ocurrencia igual 0.000 (menor que 0.05),
se rechaza la hiptesis nula de no validez global del modelo y se acepta, por tanto,
que el modelo es vlido, las variables explicativas influyen de forma conjunta y
lineal sobre Y. Declarndose que la regresin es altamente significativa.
Indicndose, al menos una de las variables predictoras est aportando informacin
significativa para la prediccin de la variable de respuesta y.

Para los contrastes individuales de F.




= Bajo Ho: k; n-k-1
1

Para Fcal= 167,714 de acuerdo a la tabla 3 ANOVA, con valor crtico y =


0,05 se decide si se rechaza o acepta la hiptesis nula.

= (1;;1) = (0,95;4;25)

Con ayuda de Excel se calcula el = . (0,95; 4; 25)

= 3,0555683


= 3,0555683
Figura 2. Curva para Fcritico

Una vez obtenido el valor de F crtico se plantean las hiptesis.

Se rechaza Ho: Si Fcal > 3,0555683

Se acepta Ho: Si Fcal < 3,0555683

Como Fcal= 167,714 > 3,0555683 se rechaza Ho; para lo que se puede decir
que las evidencias mustrales; sugieren un efecto significativo lineal entre las
variables % de papel, basura, agua y plstico en peso, por lo tanto el modelo es
valido.

Para ambos casos de t y F, se tiene relacin en cuanto se busca un nivel


de confianza del 95%, con un p-valor entre cero y 0,05 para que el modelo y los
parmetros sean estadsticamente significativos. En base a los resultados de los
contrastes individuales de la t y el contraste conjunto de la F se deduce la
influencia de cada una de las variables regresoras y la influencia conjunta del
modelo de regresin en la variable de inters, contenido de energa

5.- Analizar los residuos del modelo ajustado: estudio descriptivo y grfico
de los residuos Se verifican las hiptesis del modelo (homocedasticidad,
normalidad)? Mejora el modelo si se introduce la variable (__?__)?

Las representaciones grficas son una forma de juzgar visualmente la


bondad de ajuste y de detectar comportamientos extraos de observaciones
individuales, valores atpicos. Una visin global de la grfica nos puede orientar
sobre el cumplimiento de los supuestos del modelo: Normalidad, Linealidad y
Homocedasticidad (Igualdad de las Varianzas) e Independencia de los Residuos

1.- supuesto de normalidad: corroborar si la variable aleatoria se distribuye


normalmente para ello se utilizara la prueba de Kolmogorov-Smirnov (K-S), para
muestras grandes (>30 individuos), o la prueba de Chapiro Wilk, cuando el tamao
de la muestra es pequea (<30 individuos). El criterio para determinar si la variable
se distribuye normalmente es:

a) P-valor > aceptar Ho: los datos provienen de una distribucin normal

b) P-valor < rechazar Ho: los datos NO provienen de una distribucin normal

Para nuestro caso como es una muestra menor de 30 observaciones se


considera la prueba de Chapiro Wilk.

Tabla 4.- Prueba de normalidad Shapiro - wilk.


Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic Df Sig. Statistic df Sig.
Plastico ,087 30 ,200* ,983 30 ,895
Basura ,105 30 ,200* ,952 30 ,191
Papel ,137 30 ,157 ,937 30 ,075
Agua ,105 30 ,200* ,983 30 ,902
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

Concluyndose que se acepta la hiptesis nula; P-valor > (0,05); los datos
provienen de una distribucin normal.

El anlisis de normalidad de los residuos lo realizaremos grficamente


(Histograma y grfico de probabilidad normal).
Fig. 2.- histograma de los residuos

En este grfico, se puede apreciar que los datos no se aproximan


suficientemente a una curva normal, consecuencia del tamao de la muestra en
estudio la cual es pequea, por ende esta representacin grfica no es
aconsejable en tamaos muestrales pequeos.
Fig. 3.- Grafico probabilstico normal

En el grafico anterior se representa las funciones de distribucin de los


residuos tipificados. En el eje de ordenadas se representa la funcin terica bajo el
supuesto de normalidad y en el eje de abcisas, la funcin emprica. Desviaciones
de los puntos del grfico respecto de la diagonal indican alteraciones de la
normalidad. Con respecto a la ubicacin de los puntos del grfico, estos puntos se
aproximan razonablemente bien a la diagonal lo que confirma la hiptesis de
normalidad.

2.- supuesto de igualdad de varianza (Homocedasticidad): (Prueba de White),


se debe corroborar la igualdad de varianza entre los grupos

a) P-valor > aceptar Ho: Las varianzas son iguales


b) P-valor < aceptar Ho: Las varianzas NO son iguales
Fig 4.- Grfico de homogeneidad de las varianzas representando los residuos tipificados

En el grfico se observa que los residuos no presentan estructura definida


respecto de los valores predichos por el modelo por lo que no debemos rechazar
la hiptesis de homocedasticidad.

6.- Analizar la hiptesis de multicolinealidad

Correlations

Plastico Papel Agua Basura contenido de


energia

Pearson Correlation 1 -,150 -,259 -,090 ,590**

Plastico Sig. (2-tailed) ,430 ,168 ,638 ,001

N 30 30 30 30 30
Pearson Correlation -,150 1 -,005 -,630** ,038
Papel Sig. (2-tailed) ,430 ,978 ,000 ,842
N 30 30 30 30 30
Pearson Correlation -,259 -,005 1 ,071 -,901**
Agua Sig. (2-tailed) ,168 ,978 ,708 ,000
N 30 30 30 30 30
Basura Pearson Correlation -,090 -,630** ,071 1 -,087
Sig. (2-tailed) ,638 ,000 ,708 ,647
N 30 30 30 30 30
Pearson Correlation ,590** ,038 -,901** -,087 1

contenido de energia Sig. (2-tailed) ,001 ,842 ,000 ,647

N 30 30 30 30 30

**. Correlation is significant at the 0.01 level (2-tailed).

7.- Analizar la hiptesis de independencia

La hiptesis de independencia (no autocorrelacin) de los residuos, se


realizara mediante el contraste de Durbin-Watson y grficos residuales

Tabla. . constraste de Durbin Watson

Model Summaryb

Model R R Square Adjusted R Std. Error of the Durbin-Watson


Square Estimate
a
1 ,982 ,964 ,958 31,483 2,410

a. Predictors: (Constant), Agua, Papel, Plastico, Basura


b. Dependent Variable: contenido de energia

El estadstico de Durbin-Watson mide el grado de autocorrelacin entre el


residuo correspondiente a cada observacin y la anterior. En tal sentido
H0: No hay autocorrelacin
Si d<1.18 rechazar,
Si d>1.4 no rechazar.
Si 1.18<d<1.4 no es concluyente

De acuerdo al valor arrojado del SPSS V21. En nuestro caso, toma el valor
2,410 > de 1,4; lo que indica la incorrelacin de los residuos, es decir no se
rechaza Ho y no hay evidencia estadstica de que los trminos de error estn
autocorrelacionados.

S-ar putea să vă placă și