Sunteți pe pagina 1din 14

REGRESIÓN Y CORRELACIÓN MULTIPLE

REGRESIÓN LINEAL MULTIPLE


Es una técnica estadística que consiste en la extensión del análisis del análisis de
regresión simple que implican dos o mas variables independientes 𝒙𝟏 , 𝒙𝟐 , 𝒙𝟑 …𝒙𝒏 .

yˆ   0   x1i   x2i   x3i ... n xni  


 Error de observación
 Regresión lineal  Regresión lineal múltiple

ŷ  a0  a1 x1 ŷ  a0  a1 x1  a2 x2
Método de minimos cuadrados
Método que permite calcular cuales son los coeficientes 𝒂𝟎 , 𝒂𝟏 , 𝒂𝟐 … 𝒂𝒏 que relacionan la
variable dependiente Y con las variables independientes 𝒙𝟏 , 𝒙𝟐 , … 𝒙𝒏
error  e  yi  yˆ
n n n

 e   ( y  yˆ )   ( y  
i 1
2
i
i 1
i i
2

i 1
i 0   0 x1i  1 x2i   2 x3i  ... n xni ) 2

Derivando con respecto 𝒂𝟎 , 𝒂𝟏 , 𝒂𝟐 … 𝒂𝒏 se obtienen las ecuaciones normales.

 y  n    x    x   x
0 1 1 2 2 n n

x y   x  x  x x  x x
1 0 1 1
2
1 2 2 1 n 1 n

x y   x  x x  x  x x
2 0 2 1 1 2 2
2
2 n 1 n

x y   x
n 0 n  1  x1 xn   2  x2 xn  n  xn2
Estas ecuaciones pueden ser resueltas por cualquier método apropiado para resolver el
sistema de ecuaciones y obtener 𝒂𝟎 , 𝒂𝟏 , 𝒂𝟐 … 𝒂𝒏

 y   n x x  x    
   1 2 n
 
0

 1   x
x y
x x x
2
x x  
 1
  x2 y   1 1 2 1 n 1
 2 
   x x x x
2
 
  x3 y    2 1 2 2
  3 
    x3 x x x x
1 3 2 3
 
    
    
   2
  xn y    x n x x x x
1 n 2 n
an  x n    n 
ERROR ESTANDAR DEL ESTIMADO PARA LA REGRESIÓN MULTIPLE

El error estándar de la regresión es el valor que muestra la diferencia entre los valores
reales y los estimados de una regresión. Es utilizado para valorar si existe una
correlación entre la regresión y los valores medidos.


n
( y  ˆ
y ) 2

s i 1 i i

n p
Q A I
15.50 1.25 1.70 Error estándar de estimación =3.9439
8.50 0.87 2.10
Q (observado) Q(regresión) e
85.00 5.69 1.90 15.5000 18.1148 -2.6148

105.00 8.27 1.90 8.5000 13.1351 -4.6351

24.80 1.62 2.10 85.0000 76.5077 8.4923

3.80 0.18 2.40 105.0000 110.4374 -5.4374

24.8000 22.9852 1.8148


1.76 0.15 3.20
3.8000 3.9853 -0.1853
18.00 1.40 2.70
1.7600 3.6392 -1.8792
8.75 0.30 2.90
18.0000 20.0987 -2.0987
8.25 0.32 2.90
8.7500 5.5953 3.1547
3.56 0.18 2.80 78.57
8.2500 5.9241 2.3259
1.90 0.15 2.70 3.5600 4.0292 -0.4692

16.50 0.87 2.10 1.9000 3.6336 -1.7336

2.80 0.09 2.90 16.5000 13.1482 3.3518

2.8000 2.8862 -0.0862


APLICACIÓN DE REGRESIÓN MÚLTIPLE

1.-Obtener las ecuaciones de pronóstico del volumen esperado en el período


octubre a marzo en el río Atuel (Mendoza) en función del volumen medido al
final del invierno (septiembre) y el equivalente de agua en nieve medido a
principios de octubre.
Datos: Volumen Atuel Volumen (septiembre) equivalente de agua
Observación (octubre-marzo)Hm3(1) Hm3 (2) en nieve mm (3)
1953 1005.30 59.40 1587.00
1954 644.80 63.20 577.00
1955 485.30 38.40 504.00
1956 501.40 33.70 505.00
1957 570.90 34.20 354.00
1958 734.60 54.80 857.00
1959 868.10 60.70 1075.00
1960 593.90 51.80 568.00
1961 812.50 47.20 1142.00
1962 493.20 50.40 531.00
1963 781.30 49.50 1091.00
1964 450.70 39.90 475.00
1965 736.40 62.20 1014.00
1966 721.10 54.70 1153.00
1967 578.80 47.80 576.00
1968 599.00 45.80 471.00
1969 378.80 39.60 469.00
1970 627.60 46.60 702.00
1971 1112.00 65.90 1416.00
1972 694.70 59.70 583.00
1973 747.60 63.40 969.00
1974 707.00 66.60 982.00
1975 515.90 49.70 206.00
1976 796.60 62.00 933.00
Reconociendo a las variables:
SOLUCIÓN:

Reconociendo a las variables:


𝑦 = 𝑣𝑜𝑙𝑢𝑚𝑒𝑛 𝐴𝑡𝑢𝑒𝑙
𝑥1 = 𝑣𝑜𝑙𝑢𝑚𝑒𝑛 𝑠𝑒𝑡𝑖𝑒𝑚𝑏𝑟𝑒
𝑥2 = 𝐸𝑞 𝑛𝑖𝑒𝑣𝑒

Nuestra muestra es: n=24


número de variables regresoras: k=2

Usaremos el programa Excel para hallar la regresión lineal múltiple


Tener en cuenta que el nivel de confianza con el que trabajamos
es del 95%, por lo que, nuestro nivel de significación es 0.05
Volumen Equival.de agua en
Volumen Atuel (septiembre) nieve
Volumen Atuel 1
Volumen
(septiembre) 0.702845328 1
Equival. de agua en
nieve 0.898847433 0.615575424 1

Resumen

Estadísticas de la regresión

Coeficiente de correlación múltiple 0.918657367


Coeficiente de determinación R^2 0.843931358
R^2 ajustado 0.829067678
Error típico 71.94827758
Observaciones 24

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los
libertad cuadrados cuadrados F Valor crítico de F
Regresión 2 587829.762 293914.881 56.7780891 3.38699E-09
Residuos 21 108707.6476 5176.554647
Total 23 696537.4096
Coeficientes Error típico Estadístico t VIF Probabilidad Inferior 95% Superior 95%

Intercepción 167.2795173 80.93507663 2.066835842 0.051299145 -1.034188629 335.593223

Variable X 1 4.163039954 1.89138292 2.201056121 1.06 0.039055116 0.229693847 8.09638606

Variable X 2 0.370899048 0.054051435 6.861964912 1.06 8.78665E-07 0.258492936 0.48330516

Solución:

Ecuación de Regresión Múltiple para los valores de volúmenes acumulados entre


octubre y marzo:
VAT =1645*Vs + 0.371*Ea + 167.19

Donde:
VAT es el volumen esperado en el río Atuel para la temporada octubre-marzo.
Vs es el volumen escurrido durante septiembre.
E a es el equivalente de agua en nieve en Valle Hermoso a principios de octubre.
Validación de la regresión:

• El valor del coeficiente de determinación ajustado es cercano a 1 entonces


hay una fuerte relación de las variables independientes con la variable
dependiente.

• En el análisis de varianza se tiene que F > Valor critico de F; lo que demuestra


que la regresión es significativa.

• En el análisis de variables se tiene que las probabilidades de son menores a


0.05, es decir: , lo que significa que las variables regresoras influyen en “y”.

• Calculando el VIF (factor de inflación de la varianza) se tiene: FIV= 1.06 por lo


tanto tiene una correlación moderada.
Por lo tanto, la ecuación de Regresión Múltiple para los valores de volúmenes acumulados
entre octubre y marzo es:
VAT  1645(Vs )  0.371( Ea)  167.19
Donde:
• VAT es el volumen esperado en el río Atuel para la temporada octubre-marzo.
• Vs es el volumen escurrido durante septiembre.
• Ea es el equivalente de agua en nieve en Valle Hermoso a principios de octubre.
Análisis de los residuales

Pronóstico
Observación Residuos
para Y
1 1003.180879 2.119120655
Se muestra la tabla de 2 644.3923929 0.407607094
pronósticos para “y” y el valor 3 514.0733716 -28.77337157
residual al compararlo con los 4 494.8779828 6.522017168

“y” observados 5 440.9537466 129.9462534


6 713.2745907 21.32540932
7 818.6925188 49.40748118
8 593.595646 0.304353996
9 787.3417156 25.15828435
10 574.0441253 -80.8441253
11 778.0008561 3.299143898
12 509.5618591 -58.86185911
13 802.3122368 -65.91223683
14 822.6444048 -101.5444048
15 579.9106786 -1.110678572
16 532.6401986 66.35980135
17 506.0875528 -127.2875528
18 621.6483106 5.951689352
19 966.8169019 145.1830981
20 632.0471474 62.65285264
21 790.6174276 -43.01742763
22 808.7608431 -101.7608431
23 450.5878068 65.3121932
24 771.436806 25.16319403

S-ar putea să vă placă și