Sunteți pe pagina 1din 12

FACULTAD DE CIENCIAS EXACTAS Y NATURALES

ESCUELA DE CIENCIAS FÍSICAS Y MATEMÁTICA


“Ser más para servir mejor”

TEMA: Análisis de correlación – Regresión lineal


OBJETIVO: Emplear Excel y R en el análisis de correlación – Regresión lineal

EJERCICIO 2

edad<-c(20,19,30,15,40)

peso<-c(110,170,90,250,180)

data.frame(edad,peso)

View(data.frame(edad,peso)

edad peso
1 20 110
2 19 170
3 30 90
4 15 250
5 40 180

plot(edad,peso)

reg<-lm(peso~edad)

reg

Call:

lm(formula = peso ~ edad)


Coefficients:

(Intercept) edad

205.88 -1.85

summary(reg)

Call:

lm(formula = peso ~ edad)

Residuals:

1 2 3 4 5
-58.8802 -0.7303 -60.3797 71.8695 48.1207

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 205.881 90.864 2.266 0.108

edad -1.850 3.441 -0.538 0.628

Residual standard error: 69.75 on 3 degrees of freedom

Multiple R-squared: 0.08788, Adjusted R-squared: -0.2162

F-statistic: 0.289 on 1 and 3 DF, p-value: 0.6282

abline(reg)
Grafico 1:

Edad (años) – Peso (libras)

Fuente: Taller de estadística PUCE 16/07/2018


Elaborado por: Juan Sebastián Altamirano

Ecuación de regresión lineal

ŷ = 205,881 − 1,850x

Conclusión

El 8,788% de los pesos se explican por la edad

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.29644108
Coeficiente de determinación R^2 0.08787731
-
R^2 ajustado 0.21616358
Error típico 69.747074
Observaciones 5
Conclusión:

Debido a que el coeficiente de correlación múltiple es 0,29644108se puede concluir que existe
una correlación positiva débil.

Observación Pronóstico para Y Residuos


-
1 168.8802337 58.8802337
-
2 170.7302824 0.73028238
-
3 150.3797468 60.3797468
4 178.1304771 71.8695229
5 131.87926 48.12074

residuos<-c(1.198606272,-0.846689895,-0.756097561,1.017421603,1.06271777,-
0.891986063,0.243902439,-1.027874564)

residuos

qqnorm(residuos)

qqline(residuos)

Grafico 2:

Norma Q-Q Plot (residuos)

Fuente: Taller de estadística PUCE 16/07/2018


Elaborado por: Juan Sebastián Altamirano
Conclusión de residuos

El 91,212% que falta para explicar la relación que existe entre el peso y la edad se debe a los
residuos (factores de error), como resultado da que no sea una distribución perfectamente
normal

EJERCICIO 3

precio<-c(15,14,13,12,11,10,9,8)

ventas<-c(8,11,14,17,20,23,27,30)

data.frame(precio,ventas)

View(data.frame(precio,ventas))

precio ventas
1 15 8
2 14 11
3 13 14
4 12 17
5 11 20
6 10 23
7 9 27
8 8 30

plot(precio,ventas)

reg<-lm(ventas~precio)

reg

Call:

lm(formula = ventas ~ precio)

Coefficients:

(Intercept) precio

54.893 -3.143

summary(reg)

Call:

lm(formula = ventas ~ precio)


Residuals:

Min 1Q Median 3Q Max

-0.46429 -0.21429 0.03571 0.25000 0.39286

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 54.89286 0.59225 92.69 1.06e-10 ***

precio -3.14286 0.05051 -62.23 1.16e-09 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.3273 on 6 degrees of freedom

Multiple R-squared: 0.9985, Adjusted R-squared: 0.9982

F-statistic: 3872 on 1 and 6 DF, p-value: 1.158e-09

abline(reg)

Grafico 3:

Precio ($) – Cantidad vendida

Fuente: Taller de estadística PUCE 16/07/2018


Elaborado por: Juan Sebastián Altamirano
Ecuación de regresión lineal

ŷ = 54,89286 − 3,14286x

Conclusión

El 99,85% de las ventas se explican por el precio

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.99922611
Coeficiente de determinación R^2 0.99845281
R^2 ajustado 0.99819495
Error típico 0.32732684
Observaciones 8

Conclusión:

Debido a que el coeficiente de correlación múltiple es 0,99922611 se puede concluir que existe
una correlación positiva débil.

Observación Pronóstico para Y Residuos


1 7.75 0.25
2 10.89285714 0.10714286
-
3 14.03571429 0.03571429
-
4 17.17857143 0.17857143
-
5 20.32142857 0.32142857
-
6 23.46428571 0.46428571
7 26.60714286 0.39285714
8 29.75 0.25

residuos<-c(0.25,0.107142857,-0.035714286,-0.178571429,-0.321428571,-
0.464285714,0.392857143,0.25)

residuos

qqnorm(residuos)

qqline(residuos)
Grafico 4:

Norma Q-Q Plot (residuos)

Fuente: Taller de estadística PUCE 16/07/2018


Elaborado por: Juan Sebastián Altamirano

Conclusión de residuos:

El 0,15% que falta para explicar la relación que existe entre el peso y la edad se debe a los
residuos (factores de error), como resultado da que no sea una distribución perfectamente
normal

EJERCICIO 3

llamadas<-c(20,30,40,50,10,5,15)

ventas<-c(20,30,40,50,10,5,11)

data.frame(llamadas,ventas)

View(data.frame(llamadas,ventas))

llamadas ventas
1 20 20
2 30 30
3 40 40
4 50 50
5 10 10
6 5 5
7 15 11

plot(llamadas,ventas)

reg<-lm(ventas~llamadas)

reg

Call:

lm(formula = ventas ~ llamadas)

Coefficients:

(Intercept) llamadas

-1.128 1.023

summary(reg)

Call:

lm(formula = ventas ~ llamadas)

Residuals:

1 2 3 4 5 6 7
0.66960 0.44053 0.21145 -0.01762 0.89868 1.01322 -3.21586

Coefficients:

Estimate Std. Error t value Pr(>|t|)


(Intercept) -1.12775 1.14164 -0.988 0.369
llamadas 1.02291 0.03983 25.680 1.67e-06 ***
---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.604 on 5 degrees of freedom

Multiple R-squared: 0.9925, Adjusted R-squared: 0.991

F-statistic: 659.5 on 1 and 5 DF, p-value: 1.672e-06


abline(reg)

Gráfico 5:

Llamadas telefónicas – Copiadoras vendidas

Fuente: Taller de estadística PUCE 16/07/2018


Elaborado por: Juan Sebastián Altamirano

Ecuación de regresión lineal

ŷ = −1,12775 + 1,02291x

Conclusión

El 99,25% de las copiadoras vendidas se explican por las llamadas telefónicas

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.9962304
Coeficiente de determinación R^2 0.99247501
R^2 ajustado 0.99097001
Error típico 1.60395986
Observaciones 7

Conclusión:

Debido a que el coeficiente de correlación múltiple es 0,9962304 se puede concluir que existe
una correlación positiva débil.
Observación Pronóstico para Y Residuos
1 19.33039648 0.66960352
2 29.55947137 0.44052863
3 39.78854626 0.21145374
4 50.01762115 -0.01762115
5 9.101321586 0.89867841
6 3.986784141 1.01321586
7 14.21585903 -3.21585903

residuos<-c(0.669603524,0.440528634,0.211453744,
0.017621145,0.898678414,1.013215859,-3.215859031)

residuos

qqnorm(residuos)

qqline(residuos)

Grafico 6:

Norma Q-Q Plot (residuos)

Fuente: Taller de estadística PUCE 16/07/2018


Elaborado por: Juan Sebastián Altamirano
Conclusión de residuos:

El 0,75% que falta para explicar la relación que existe entre el peso y la edad se debe a los
residuos (factores de error), como resultado da que no sea una distribución perfectamente
normal

S-ar putea să vă placă și