Sunteți pe pagina 1din 13

INSTITUTO TECNOLÓGICO DE TAPACHULA

ESTADÍSTICA INFERENCIAL II

DOCENTE:
ING. VELÁZQUEZ REYES JORGE ARTURO

TEMA: REGRESIÓN LINEAL MÚLTIPLE (TRIPLE)

INTEGRANTES DE EQUIPO:
1. TERÁN CARREDANO HÉCTOR IVÁN
2. SUÁSTEGUI CALVO JOSÉ LUIS
3. CAMERAS REYES DANEYRI
4. GUTIÉRREZ HERNÁNDEZ DAIMER OBED
5. RANGEL CANSECO KAREN ELIZABETH
6. VÁZQUEZ CRUZ AURELIO

FECHA DE ENTREGA:
MIÉRCOLES
27/NOV/2019
1.- Calcular las medias de c/u de las variables (X1, X2, Y).

Media Y:
12392/16=774.5
Media X1:
4291/16=268.1875
Media X2:
779/16= 48.6875

2.- Calcular las variancias y desviaciones estándar de c/u de las variables, (X1, X2,
Y). Explicar la interpretación de los resultados obtenidos (1,2).
Variables Desviación estándar Variancia S^2
Y 85.03803071 7231.466667
X1 133.2447466 17754.1625
X2 11.08583932 122.8958333

En el caso de la varianza los valores obtenidos son en lo que se espera que puedan
a llegar a dispersarse nuestros datos de cada una de las variables 7231.466667
para y, 17754.1625 para x1, 122.8958333 para x2.

En el caso de la desviación estándar se espera que varíen en intervalos de


85.03803071 para y, 133.2447466 para x1, 11.08583932 para x2.

3.- Calcular los coeficientes de regresión múltiple.


𝑚1 𝑚4−𝑚2𝑚5
b1= 𝑚3𝑚4−(𝑚5)²

88305449
b1= 131564855= 0.6711933
𝑚2 𝑚3−𝑚1𝑚5
b2= 𝑚3𝑚4−(𝑚5)²

−182010960
b2= 131564854.6= -1.383431468

b0= Y̅-b1X̅1i-b2X̅2i
b0= 774.5- (0.6711933* 268.1875) - (-1.383431468* 48.6875) = 661.8501663
4.- Ajustar la ecuación de regresión lineal múltiple que exprese la media de Y en
términos de X1, X2.
Y̅=b0+b1-b2
Y̅=661.8501663+0.67711933x1-1.3834315x2

5.- Prediga el salario semana para un empleado administrativo que ha estado


empleado durante 15 años en la empresa y tiene 47 años.

b0+(b1*180) +(b2*47)

661.8501663+ (0.6711933*180) + (-1.383431468*47) = 717.6436814

6.- Construya la tabla anova o andeva (análisis de variancia).


yi- (yTestilla-
yTestilla yTestilla(sse)^2 Y)^2ssr SST=(yi-Y)^2
819.706108 372.2542702 2043.592196 4160.25
953.836109 61.4046022 32161.43994 29412.25
834.69206 1246.650604 3623.084126 9120.25
672.67373 2054.470726 10368.5892 3192.25
749.436036 2762.970338 628.2023042 756.25
810.447012 2.411772429 1292.187656 1406.25
768.736462 430.0008558 33.21837042 702.25
816.569841 653.8167797 1769.87154 272.25
822.021477 4903.00729 2258.29081 506.25
749.286332 411.5352538 635.7290692 2070.25
681.507902 650.6530834 8647.530221 14042.25
817.487304 3193.684841 1847.908281 9900.25
651.304204 2052.470887 15177.20419 28392.25
697.247138 1008.244259 5968.004722 2070.25
743.190072 230.7382783 980.31161 2162.25
803.858213 140.6172244 861.9046924 306.25
12392 20174.93107 88297.06893 108472
comprobación 108472

fuente ss. GRADOS DE LIBERTAD MS Fcal FTAB


regresión 88297.0689 2 44148.5345 28.4477278 3.80556525
error 20174.9311 13 1551.91777
total 108472 15 7231.46667
7.- Haciendo uso de la (6) pruebe la hipótesis nula Con un nivel de significancia del
5 %, si hay o no relación significativa entre las variables dependientes y las variables
independientes (X1, X2) ¿Cuál es la conclusión?
en este caso es:
H0: β1= β2=0 H1: β1≠ 0 H2: β2≠ 0
Primero se obtiene el valor f de Fisher
F (2/13) =msr/mse=28.4477278
Luego se procede a buscar su valor en tablas de significancia del 5%(0.05) = 3.80556525

Rechazar H0

0 F (2,13) = 3.80556525

Para rechazar H0: B1=B2=0 Fp (2/13)>Fc (2/13)


Fp (2/13) = 28.4477278 > Fc (2/13) 3.80556525 por lo tanto se rechaza la hipótesis nula
debido a que Fp fue mayor a Fc.
En conclusión, debido a lo que se describió anteriormente podemos decir que hay
una relación significativa de entre las variables de meses de antigüedad (x1) y edad
que tiene el trabajador(x2).

fuente ss. GRADOS DE LIBERTAD MS Fcal FTAB


regresión 88297.0689 2 44148.5345 28.4477278 3.80556525
error 20174.9311 13 1551.91777
total 108472 15 7231.46667

confianza 95%

DECISIÓN
FCAL > FTAB RECHAZAR H0
SE RECHAZA
28.44773 > 3.805565 H0
8.- Calcular el coeficiente de determinación triple r²y1,2 e interprete el resultado.
r²X1X2

r²= 88297.06893/108472= 0.814007937*100=81.4007937%


como podemos apreciar en el resultado se puede concluir que el 81.4007937% de
la variación en el salario puede explicarse por la variación en el número de meses
trabajados y la variación en la edad

9.- Calcular el coeficiente de determinación ajustado. ¿Por qué calcularlo?


1- 0.814007937=0.18599206
15/13=1.15384615
r² ajustado= 0.18599206*1.15384615=0.785393773
Se calcula para ver el grado de intensidad o efectividad que tienen las variables
independientes en explicar la variable dependiente o dicho de otra manera nos
ayuda a no creer erróneamente que por el hecho de aumentar las variables al
modelo explique porque aumenta el coeficiente de determinación.

10.- determine el coeficiente de correlación triple r²y1,2 ¿Cuál es la interpretación


del resultado?
√0.814007937=0.902223884
Se concluye que para empezar presenta una correlación excelente, por lo cual
podemos intuir que hay una fuerte asociación entre el salario, el número de meses
trabajando yd la edad.
11.- Calcular el error estándar. interprete el resultado.
el modelo presenta una variabilidad de 39.3944, por lo cual se espera que los
datos varíen en intervalos +- de ese valor
Syx= √mse = √ (1551.9177743204) = 39.3943875993
12.- Calcular los errores estándar de los coeficientes de regresión.

Sb0=Syx

(1417105)(39771) - (227875)^2

(16)(1417105)(39771) + 2 (4291)(779)(227875) -
)(39771)-(39771)
(16)(227875)^2 - (4291)^2(39771) - (779)^2(1417105)

Sb0= 57.1658922807
Sb1=

(16)(39771) - (779)^2
Sb1=Syx
(16)(1417105)(39771) + 2 (4291)(779)(227875) -
)(39771)-(39771)
(16)(227875)^2 - (4291)^2(39771) - (779)^2(1417105)

Sb1= 0.1474614899

(16)(1417105) - (4291)^2
Sb2=Syx
(16)(1417105)(39771) + 2 (4291)(779)(227875) -
)(39771)-(39771)
(16)(227875)^2 - (4291)^2(39771) - (779)^2(1417105)

Sb2=Syx= 1.7723934374
13.- Pruebe la hipótesis de la pendiente de la población Hi ẞ1=0.
V O.025
1

tv = 13; alfa =0.025 = 2.160 ,por lo tanto


V =13 1=0.95 - alfa

Donde:
tv=n-p-1 alfa= 1 - alfa/2
tv=13 1- 0.05/2
t130.975(área de cola) o t5; 0.025(área de colas)
se busca t de p el cual es para este caso es b1/Sb1=4.551651425

TP = 4.551651425>2.160; SE RECHAZA LA HIPÓTESIS

Tc=-2.160 Tc=2.160 Tp=4.55165142


5

Dado que Tp13=4.551651425>a Tc12=2.160 se rechaza la hipótesis H0 y se llega


a la conclusión de que hay una relación significativa entre la variable x1(antigüedad
en meses) y el salario de los empleados, tomando en cuenta x2 (la edad).

14.- Pruebe la hipótesis de la pendiente de la población Hi ẞ2=0.


V O.025
1

tv = 13; alfa =0.025 = 2.160 ,por lo tanto


V =13 1=0.95 - alfa
TP = -0.7805442285<-2.160; SE RECHAZA LA HIPÓTESIS

Tc=-2.160 Tc=2.160

Tp= -0.7805442285

TP = -0.7805442285<-2.160; SE RECHAZA LA HIPÓTESIS

TC = -2.16

Dado que Tp13= - 0.7805442285<a Tc12= - 2.160 se rechaza la hipótesis H0 y se


llega a la conclusión de que hay una relación significativa entre la variable
x1(antigüedad en meses) y el salario de los empleados, tomando en cuenta x2 (la
edad).

15.- Establezca un intervalo de confianza del 95% para estimar la pendiente real
de la población ẞ1.
bi (+-) t13 sb1
0.6711933005 (+-) (2.16) (0.1474614899) =

P(0.3526764824<=B1<=0.9897101186) =0.95
16.- Establezca un intervalo de confianza del 95% para estimar la pendiente real
de la población ẞ2.
bi (+-) t13 sb1
-1.3834314682 (+-) (2.16) (178) =

P(-5.211801293<=B2<=2.4449383566) =0.95

17.- Calcular las covarianzas de los coeficientes de regresión múltiple.

ΣX2 ΣX1X2 - (ΣX1)(ΣX2^2)

Sb0b1= syx^2

(779) (227875) - (4291) (39771)


Sb0b1=(1551.9177
743204)
(16)(1417105)(39771) + 2 (4291)(779)(227875) -
(16)(227875)^2 - (4291)^2(39771) - (779)^2(1417105)

Sb0b1=5.0554486584

ΣX1 ΣX1X2 - (ΣX2)(ΣX1^2)

Sb0b2= syx^2
(4291) (227875) - (779) (1417105)

Sb0b2=
(1551.9177743204)
(16)(1417105)(39771) + 2 (4291)(779)(227875) -
(16)(227875)^2 - (4291)^2(39771) - (779)^2(1417105)

Sb0b2= -92.9756614412

ΣX1 ΣX2 - n ΣX1X2

Sb1b2=
syx^2

(4291) (779)- 227875

Sb1b2=
(1551.9177743204) (16)(1417105)(39771) + 2 (4291)(779)(227875) -
(16)(227875)^2 - (4291)^2(39771) - (779)^2(1417105)

Sbi1b2= -0.2236129728
18.- Calcular la varianza y desviación estándar de la variable propuesta Y (SῩi y
SŶi)
Calculo de la varianza:

S^2yTestilla=3267.93924+704.534468+6939.3051+1819.96152-8739.71218-
3783.5315
S^2 yTestilla= 208.4966507
Calculo de la desv. Std:√SῩi: 14.4394131017

19.- Cual es la interpretación de los resultados obtenidos de los coeficientes de


regresión pregunta 3.
La intersección con y, b0 se calculó como 661.8501663 siendo esta la estimación
esperada de salario para alguien que no tiene antigüedad en meses y no presenta
edad.
La pendiente de la antigüedad en meses respecto al salario, b1 cuyo resultado fue
0.6711933, estimándose que el salario esperado aumente en 0.6711933 por cada
mes trabajado,
Por otro lado, la pendiente de la edad del trabajador, b2 que dio como resultado -
1.383431468, lo cual se estima que el salario disminuya por la cantidad de
1.383431468 por cada año que tenga el empleado.

20.- establezca una estimación de un intervalo con 95% de confianza del valor real
de la media My/x predicho para Y. Haciendo uso de datos de la pregunta (5).
717.6436813761(+-)(2.16)(14.4394131017)

P(686.4545490765<=Myx<=748.8328136756) =0.95
Anexos:

Gráfica de dispersión de 3D de Y vs. X1 vs. X2

900

Y 800

700 600

400
600
X1
200
30
40
50 0
X2 60

Gráfica de superficie de Y vs. X2; X1

1050

900
Y

750
60

600 50
X2
40
0
200 30
400
X1 600

S-ar putea să vă placă și