Sunteți pe pagina 1din 32

Regresión lineal múltiple

Estadística Inferencial II

Instituto Tecnológico Nacional de México


Campus Querétaro
Ingeniería Industrial
Estadística Inferencial II
Prof. Guadalupe Patricia Yscapa Moran

Práctica de análisis de regresión lineal múltiple

Alumna:
Carla Paola Valero Ballen
Número de Control: 18141703

Querétaro, 15 de febrero de 2019

1
Regresión lineal múltiple
Estadística Inferencial II

REGRESIÓN LINEAL MÚLTIPLE

Objetivo
Interpretar el proceso metodológico en el cual se construirá un modelo de
regresión lineal múltiple, donde se denotará la correlación y el análisis de varianza, y se
interpretarán datos específicos para lograr predicciones que ayuden a la toma de
decisiones en un problema.

Introducción

El Análisis de Regresión Lineal Múltiple nos permite establecer la relación que se


produce entre una variable dependiente Y y un conjunto de variables independientes (X1,
X2, ... XK).

A diferencia del simple, se aproxima más a situaciones de análisis real puesto que
los fenómenos, hechos y procesos sociales, por definición, son complejos y, en
consecuencia, deben ser explicados en la medida de lo posible por la serie de variables
que, directa e indirectamente, participan en su concreción.

La anotación matemática del modelo o ecuación de regresión lineal múltiple es la


que sigue: Y = a + b1x1 + b2x2 + ... + bnxn + e

en donde:

 Y es la variable a predecir; b1x1, b2x2... bnxn, son parámetros


desconocidos a estimar; y e es el error que cometemos en la predicción de
los parámetros.

2
Regresión lineal múltiple
Estadística Inferencial II

ÍNDICE
Página
I. ANÁLISIS DE REGRESIÓN
6-7
1) Obtener ecuación de regresión utilizando fórmulas
2) Obtener ecuación de regresión con Minitab y Excel 8-9
3) Interpretación del modelo encontrado 10
4) Encontrar dos valores ajustados 11

II. PRUEBA DE SIGNIFICANCIA


12
1) Hipótesis
2) SSTotales 13-14
3) SSModelo 13-14
4) SSError 13-14
5) ANOVA
15
6) Conclusión e Interpretación
16
7) Gráfico F

III. ANÁLISIS DE CORRELACIÓN 17


1) Obtener el coeficiente de determinación r2 17
2) Interpretación r2
18
3) Obtener el coeficiente de correlación r
18
4) Interpretación r

IV. ADECUACIÓN DEL MODELO 19


1) Gráfico Normalidad 19
2) Hipótesis e interpretación
20
3) Gráfico errores vs ajustes
20
4) Hipótesis e interpretación
5) Gráfico errores vs orden 21
6) Hipótesis e interpretación 21

V. ESTIMACIÓN Y PRUEBAS DE HIPÓTESIS PARA β0 β1


22
1) Error estándar para los βi
22
2) Intervalos de confianza βi
3) Gráficas intervalos 23
4) Prueba de Hipótesis para βi 24
5) Valor de P para βi 25-27

26 3
Regresión lineal múltiple
Estadística Inferencial II

27-28
6) Conclusión e Interpretación

VI. INTERVALOS DE CONFIANZA Y PREDICCIÓN PARA UNA OBSERVACIÓN


29
1) Error estándar de la estimación
2) Intervalo de confianza para un solo valor. 30
3) Error estándar de la predicción 31
4) Intervalo de predicción para un solo valor
32
5) Gráfico con intervalos de confianza y de predicción
para todos los valores

Referencias Bibliográficas
33
Referencias en la web 33

4
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,894685789
Coeficiente de determinación R^2 0,800462661
R^2 ajustado 0,76304941
Error típico 0,056168806
Observaciones 20

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 3 0,202501044 0,067500348 21,3951646 7,60875E-06
Residuos 16 0,050478956 0,003154935
Total 19 0,25298

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción -3,507778141 3,004864063 -1,167366665 0,26016555 -9,877805391 2,86224911 -9,87780539 2,862249109
Variable X 1 -0,002624991 0,000654863 -4,008460201 0,00101383 -0,004013237 -0,00123674 -0,00401324 -0,001236744
Variable X 2 0,000798941 0,002045143 0,390652909 0,70120615 -0,003536568 0,00513445 -0,00353657 0,00513445
Variable X 3 0,15415503 0,101367459 1,520754603 0,1478365 -0,060734384 0,36904444 -0,06073438 0,369044444

Análisis de los residuales Resultados de datos de probabilidad


error estandar de prediccion
Observación Pronóstico para Y Residuos Residuos estándares Percentil Y
1 0,861375512 0,038624488 0,749349379 2,5 0,77
2 0,963637936 -0,053637936 -1,040623614 7,5 0,78
3 0,971276114 -0,011276114 -0,218766635 12,5 0,82
Estadística Inferencial II
Regresión lineal múltiple

4 0,966530409 -0,076530409 -1,48475793 17,5 0,87


5 1,1179876 -0,1179876 -2,28906427 22,5 0,89
6 1,042824443 0,057175557 1,109256611 27,5 0,9
7 1,100666544 0,049333456 0,957112868 32,5 0,91
8 1,045388402 -0,015388402 -0,298548669 37,5 0,91
9 0,849145075 -0,079145075 -1,535484774 42,5 0,94
10 1,046299284 0,023700716 0,459814948 47,5 0,95
11 1,021755533 0,048244467 0,935985514 52,5 0,96
12 0,961435729 -0,021435729 -0,415872183 57,5 1
13 1,038586762 0,061413238 1,191471382 62,5 1,03
14 1,090168262 0,009831738 0,190744447 67,5 1,07
15 1,076021183 0,023978817 0,465210353 72,5 1,07
16 0,892927127 0,017072873 0,331228901 77,5 1,1
17 0,870194349 -0,000194349 -0,003770537 82,5 1,1
18 0,816725248 -0,036725248 -0,71250244 87,5 1,1
19 0,754766463 0,065233537 1,265588583 92,5 1,1
20 0,932288024 0,017711976 0,343628064 97,5 1,15

5
Regresión lineal múltiple
Estadística Inferencial II

ANÁLISIS DE REGRESIÓN MÚLTIPLE

1) Obtener ecuación de regresión utilizando fórmulas

Se elige un problema de 3 variables:


X1 HUMEDAD, X2 TEMPERATURA, X3 PRESIÓN, Y ÓXIDO NITROSO

Se eligió el ejercicio 12.1 del tema Regresión Lineal Múltiple del libro de
“Probabilidad y Estadística para ingenierías”. Walpole. 8va Edición

6
Regresión lineal múltiple
Estadística Inferencial II

Fig 1. Tabla de datos iniciales

7
Regresión lineal múltiple
Estadística Inferencial II

2) Obtener ecuación de regresión con Minitab


Matriz MATDIS
1 72,4 76,3 29,18

1 41,6 70,3 29,35


Fig 2. “Matriz
1 34,3 77,1 29,24 MATDIS” será Xo
1 35,1 68,0 29,27
MINITAB
1 10,7 79,0 29,78

1 12,9 67,4 29,39

1 8,3 66,8 29,69

1 20,1 76,9 29,48

1 72,2 77,7 29,09

1 24,0 67,7 29,60


1 23,2 76,8 29,38

1 47,4 86,6 29,35

1 31,5 76,9 29,63

1 10,6 86,3 29,56


1 11,2 86,0 29,48

1 73,3 76,3 29,40

1 75,4 77,9 29,28

1 96,6 78,7 29,29

1 107,4 86,8 29,03

1 54,9 70,9 29,37


Fig 3. “Matriz transpuesta M2”
será Xo’
Matriz M2
1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,0 1,00 1,00 1,00
72,40 41,60 34,30 35,10 10,70 12,90 8,30 20,10 72,20 24,0 23,20 47,40 31,50
76,30 70,30 77,10 68,00 79,00 67,40 66,80 76,90 77,70 67,7 76,80 86,60 76,90
29,18 29,35 29,24 29,27 29,78 29,39 29,69 29,48 29,09 29,6 29,38 29,35 29,63
1,00 1,00 1,0 1,00 1,00 1,00 1,00
10,60 11,20 73,3 75,40 96,60 107,40 54,90
86,30 86,00 76,3 77,90 78,70 86,80 70,90
29,56 29,48 29,4 29,28 29,29 29,03 29,37

8
Regresión lineal múltiple
Estadística Inferencial II

Fig 4. Ecuación de regresión Minitab

2.1) Obtener ecuación de regresión con EXCEL

Fig 5. Matrices y ecuación de regresión

9
Regresión lineal múltiple
Estadística Inferencial II

3) Interpretación del modelo encontrado

De acuerdo con los datos obtenidos podemos denotar los valores de los betas, se puede
demostrar que los Bo, B1, B2, y B3 vienen dados por las matrices. Y a su vez quiere decir que Y
ajustada va a cambiar en tanto cambien las variables X1, X2 o X3.

Respuesta del problema:

Para 50% de humedad, una temperatura de 76˚F y una presión barométrica de 29.30, la

cantidad estimada de óxido nitroso emitido es

𝑦̂ = −3,507778141 − 0,002624991 X1+0,000798941X2+0,15415503X3


Es decir que cada vez que aumenten las betas, cambiará la Y ajustada.

10
Regresión lineal múltiple
Estadística Inferencial II

4) Encontrar dos valores ajustados

Fig 6. Valores ajustados de la ecuación de regresión

11
Regresión lineal múltiple
Estadística Inferencial II

PRUEBA DE SIGNIFICANCIA

1) Hipótesis

Fig 7. Hipótesis

 El valor de P = 0 implica que la variabilidad explicada por el modelo es


significativa.
 Existe evidencia suficiente para pensar que el modelo ajustado le es significativo
para decir que las variables influyen en las emisiones de óxido nitroso.
 Existe evidencia suficiente para decir que existe un comportamiento normal donde
dos variables, X2 Y X3 le son significativas a “Y” y la hacen cambiar.

12
Regresión lineal múltiple
Estadística Inferencial II

2) SSTotales
3) SSModelo
4) SSError

Fig 8. Tabla de SStotal, SSmodelo y SSerror

13
Regresión lineal múltiple
Estadística Inferencial II

AJUSTES RESID
0,86138 0,038624
0,96364 -0,053638
0,97128 -0,011276
0,96653 -0,076530
1,11799 -0,117988
1,04282 0,057176
1,10067 0,049333
1,04539 -0,015388
0,84915 -0,079145
1,04630 0,023701
1,02176 0,048244
0,96144 -0,021436
1,03859 0,061413
1,09017 0,009832
1,07602 0,023979
0,89293 0,017073
0,87019 -0,000194
0,81673 -0,036725
0,75477 0,065234
0,93229 0,017712

14
Regresión lineal múltiple
Estadística Inferencial II

5) ANOVA MINITAB

Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


Regresión 3 0,202501 0,067500 21,40 0,000

Humedad x1 1 0,050693 0,050693 16,07 0,001

Temperatura x2 1 0,000481 0,000481 0,15 0,701

Presión x3 1 0,007296 0,007296 2,31 0,148

Error 16 0,050479 0,003155

Total 19 0,252980

5.1) ANOVA EXCEL

Fig 9. Tabla ANOVA

6)Conclusión e Interpretación
La primera columna contiene las fuentes de variación:
Regresión, Error residual, Total

La segunda columna corresponde a los grados de libertad:


Modelo k = número de variables predictoras

15
Regresión lineal múltiple
Estadística Inferencial II

Error n-k-1 = número total de observaciones menos número de


variables regresoras menos 1
Total n-1 = número total de observaciones menos1.

La tercera columna contiene las sumas de cuadrados de las desviaciones.


La cuarta columna el componente de varianza para el modelo y el error.
La quinta columna el valor de F

Conclusiones:
 La variabilidad total de las observaciones es = 0,252979913
 El valor de P = 0 implica que la variabilidad explicada por el modelo es significativa.

16
Regresión lineal múltiple
Estadística Inferencial II

7) Gráfico F .

Gráfica de distribución
F. df1 =2. df2=1 7

1 ,0
0,025

0,8
Densidad

0,6

0,4

0,2

0,025
0,0
0 0,02536 4,619
X

Fig 10. Gráfica del valor de P

17
Regresión lineal múltiple
Estadística Inferencial II

ANÁLISIS DE CORRELACIÓN

1) Obtener el coeficiente de determinación “r2”


2) Interpretación “r2”
Un 80% de la variabilidad total le es atribuible al modelo.

Fig 11. Correlación

3) Obtener el coeficiente de correlación “r”


4) Interpretación “r”
El coeficiente de correlación es simplemente la raíz cuadrada del coeficiente de determinación

r r2  .8004625  0.89469
 El 89% de los cambios en los cambios en las variables, están relacionadas con las Y, eso
quiere decir que le es significante.

r 2 ajust 
 El 76,30 % de la variabilidad total se ve explicada por el modelo.

Resumen del modelo


R-cuad. R-cuad. Fig 12. Ánalisis de correlación del
S R-cuad. (ajustado) (pred) modelo en MINITAB
0,0561688 80,05% 76,30% 64,63%

18
Regresión lineal múltiple
Estadística Inferencial II

ADECUACIÓN DEL MODELO

1) Gráfico Normalidad
2) Hipótesis e interpretación

Fig 13. Probabilidad normal

 Cumple con la condición para tener un comportamiento normal; los puntos se encuentran
cercanos o sobre la línea dibujada en el papel probabilístico.

19
Regresión lineal múltiple
Estadística Inferencial II

3) Gráfico errores vs ajustes


4) Hipótesis e interpretación

Fig 14. Errores vs. ajustes

 Los errores cumplen con la condición de que no tienen patrón alguno para la
representación gráfica.

20
Regresión lineal múltiple
Estadística Inferencial II

5) Gráfico errores vs orden


6) Hipótesis e interpretación

Fig 15. Errores vs orden

 Sí hay aleatoriedad en la recolección de los datos, estos fueron extraídos en forma


aleatoria en la gráfica y no presenta patrón alguno.

21
Regresión lineal múltiple
Estadística Inferencial II

ESTIMACIÓN Y PRUEBAS DE HIPÓTESIS PARA βetas

1) Error estándar para los βi

Fig 16. Error estándar

2) Intervalos de confianza βi

Fig 17. Intervalos de confianza

22
Regresión lineal múltiple
Estadística Inferencial II

3) Gráficas intervalos de confianza βi

Fig 18. Intervalos de confianza para Beta0

23
Regresión lineal múltiple
Estadística Inferencial II

Fig 19. Intervalos de confianza para Beta1

24
Regresión lineal múltiple
Estadística Inferencial II

Fig 20. Intervalos de confianza para Beta2

25
Regresión lineal múltiple
Estadística Inferencial II

Fig 21. Intervalos de confianza para Beta3

26
Regresión lineal múltiple
Estadística Inferencial II

4)Prueba de hipótesis para Bi


5) Valor de P para Bi

Fig 22. Pruebas de hipótesis para las betas

6 )Conclusión e interpretación

Fig 23. Valores de P en el ANOVA de Minitab

27
Regresión lineal múltiple
Estadística Inferencial II

Conclusiones

 El valor de P = 0 implica que la variabilidad explicada por el modelo es


significativa.
 Existe evidencia suficiente para pensar que el modelo ajustado le es significativo
para decir que las variables influyen en las emisiones de óxido nitroso.
 Existe evidencia suficiente para decir que existe un comportamiento normal donde
dos variables, X2 Y X3 le son significativas a “Y” y la hacen cambiar.

28
Regresión lineal múltiple
Estadística Inferencial II

INTERVALOS DE CONFIANZA Y PREDICCIÓN PARA UNA OBSERVACIÓN

1) Error estándar de la estimación

Fig 23. Errores

2) Intervalo de confianza para un solo valor.

LIMC_2 LIMC_3

0,82023 0,90253

0,92448 1,00280

0,92087 1,02168

0,91004 1,02302

1,05179 1,18418
Fig 24. Intervalos de
0,98358 1,10207 confianza para cada
1,04054 1,16080 valor en MINITAB

1,01060 1,08018

0,79810 0,90019

0,99380 1,09880

0,98173 1,06178

0,91077 1,01210

0,98994 1,08724

1,02635 1,15399

29
Regresión lineal múltiple
Estadística Inferencial II

1,01208 1,13996

0,84209 0,94377

0,82978 0,91061

0,75248 0,88097

0,68389 0,82564

0,89217 0,97240

3) Error estándar de la predicción

Fig 25. Errores estándar de predicción

30
Regresión lineal múltiple
Estadística Inferencial II

4) Intervalo de predicción para un solo valor

LIMP_2 LIMP_3

0,735393 0,98736

0,838292 1,08898

0,841974 1,10058

0,834739 1,09832

0,981753 1,25422

0,909829 1,17582

0,967272 1,23406 Fig 26. Intervalo de


predicción para cada
0,921337 1,16944 valor en MINITAB
0,719591 0,97870

0,916167 1,17643

0,896136 1,14738

0,832031 1,09084

0,909960 1,16721

0,955070 1,22527

0,940867 1,21118

0,763456 1,02240

0,744449 0,99594

0,681427 0,95202

0,616196 0,89334

0,806639 1,05794

31
Regresión lineal múltiple
Estadística Inferencial II

Referencias Bibliográficas

 Probabilidad y Estadística para ingeniería y ciencias. 9va Edición. Walpole, Myers, Myers.
Editorial Pearson. University of Texas at San Antonio, US. 2012.
 Probability and Statistics in Engineering and Management Science. 2da Edición. W.W.
Hines, D.C. Montgomery. Grupo Editorial Patria S.A. de C.V. 2014

Referencias en la web

 https://itq2017.blogspot.com/2016/06/seccion-3.html

32

S-ar putea să vă placă și