Sunteți pe pagina 1din 24

Regresión lineal simple y regresión lineal múltiple

Estadística descriptiva

Grupo: 100105_83

Universidad Nacional Abierta y a Distancia UNAD


Tecnología en Regencia de Farmacia
Agosto 04 de 2018
INTRODUCCIÓN

En este trabajo podrás encontrar una serie de ejercicios y los


laboratorios del tema de regresión y correlación; tema presente en la
tercera unidad del módulo de estadística descriptiva que abarca temas
como regresión lineal simple y regresión lineal múltiple Para estas
confrontaciones se utiliza el diagrama de dispersión que es plano
cartesiano en el que se marcan los puntos correspondientes a los pares
(x,y) de los valores de las variables.
JUSTIFICACIÓN

Con este trabajo se busca adquirir conocimiento y habilidades para que


nosotros podamos tener un mayor conocimiento en el entorno de la estadística
descriptiva donde lleguemos a lograr tomar un problema y poder transformarlo
en resultados para de este modo tomar decisiones mirar estrategias que
puedan solucionar a la comunidad individuo u organización.
OBJETIVOS

GENERAL.

Conocer temas importantes que están presente en la unidad tres tales


como la regresión y la correlación.

ESPECIFICOS.

 Conocer la importancia de temas como la regresión y correlación


en la estadística descriptiva.

 Trabajar la regresión lineal simple.

 Trabajar la regresión lineal múltiple.


Regresión y Correlación lineal Simple

1. Identificar dos variables cuantitativas de la situación estudiada


que puedan estar relacionadas.

1. Número de heridos.
2. Número de muertos.

Diagrama de dispersión.

Object 3

Modelo matemático que permite predecir el efecto de una variable sobre la


otra

n X∗Y −X Y
b = n X 2−( X)2 ⅀Y −b ⅀ X
a=
n

120∗( 244 )−( 330 )∗(103)


b= 120∗( 1798 )−( 330 ) 2 103−(−0,0441)(330)
a=
120

29280−33,990 117553
b= 215760−108900 a=
120
−4710
b= 106860
b = - 0,0441 a = 0,9795

y = -0,0441 x + 0,9795

Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.

Coeficiente de correlación.

Se= √
⅀ y2 −a ⅀ y−b ⅀ x∗y
n−2

se=
√ 166−0,9795 (103 )−0,0441(244)
120−2

se= √
166−100,88−10,76
118

se= √
54,36
118

se= √0,460

Se = 0,678

Varianza.

⅀ y2
Sy2 = n
− ý 2

166
Sy2 = 120
−(0,85) 2
Sy2 = 1,383– 0,722

Sy2= 0,661
Se 2
R2 = 1 - Sy 2

(0,67) 2
R2 = 1 - (0,66) 2

0,44
R2 = 1 - 0,43

R2 = 1 – 1,02

R2 = 0,02

Con los resultados obtenidos se puede asegurar que la ecuación de la recta es


2
una muy buena estimación de la relación entre las dos variables. El R afirma
además que el modelo explica el 2 % de la información y el valor de r
coeficiente de correlación lineal confirma además el grado de relación (2%)
entre las variables: 1. Número de heridos y 2. Número de muertos.

Regresión y Correlación Lineal Múltiple

2. Determine la relación entre una variable dependiente y varias variables


independientes; si es el caso.

a. identificar una variable dependiente y varias variables independientes del


estudio de investigación.
Variable dependiente:
Número de muertos.

Variables independientes.
x.1. Número de heridos.
x.2. Edad.
x.3. Velocidad.
Diagrama de dispersión múltiple.

Object 39

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,149735431
Coeficiente de determinación R^2 0,022420699
R^2 ajustado -0,002861524
Error típico 0,85425013
Observaciones 120

ANÁLISIS DE
VARIANZA
Grados de Suma de Promedio de Valor crítico
libertad cuadrados los cuadrados F de F
0,8868167 0,45022996
Regresión 3 1,941445713 0,647148571 5 9
Residuos 116 84,65022095 0,729743284
Total 119 86,59166667

Probabilida Superior Inferior Superior


Coeficientes Error típico Estadístico t d Inferior 95% 95% 95,0% 95,0%
Intercepció 1,16809311 0,38883719 3,00406733 0,39795205 1,93823416 0,39795205 1,93823416
n 1 4 2 0,00326443 5 7 5 7
- - - -
0,04220392 0,02929950 1,44043128 0,10023528 0,01582743 0,10023528 0,01582743
Variable X 1 2 4 7 0,15243905 1 7 1 7
- -
0,00620525 0,01494836 0,00963220 0,01494836 0,00963220
Variable X 2 -0,00265808 3 -0,42835961 0,66918366 5 6 5 6
- - - -
0,00130929 0,00455850 0,28722118 0,01033799 0,00771939 0,01033799 0,00771939
Variable X 3 9 5 6 0,77445541 2 4 2 4
LABORATORIO

distancia en tiempo de
kilómetros entrega(días)
825 3,5
215 1
1070 4
550 2
480 1
920 3
1350 4,5
325 1,5
670 3
1215 5
CONCLUSIONES

Este trabajo nos sirvió para entender que el análisis de Regresión se utiliza
para obtener los estimadores de los parámetros, estimar la varianza del
error, obtener los errores estándares de los parámetros estimados, probar la
hipótesis sobre los parámetros, cálculo de valores estimados basados en la
ecuación estimada, estimar el ajuste o la falta de ajuste del modelo.

El modelo a utilizar fue Y= a+ bx, a es el intercepto, b es la


pendiente de la función, la que nos indica el cambio marginal de Y
respecto a X.
REFERENCIAS BIBLIOGRÁFICAS.

https://www.youtube.com/watch?v=pDHdSovBxb4

https://www.youtube.com/watch?v=b0blULCMHAs
LABORATORIO DE REGRESIÓN YCORRELACIÓN JESSICA ALEJANDRA
LOZANO

1. El rendimiento del producto de un proceso químico está relacionado con


la temperatura de operación del proceso. Se desea establecer la relación
que existe entre la pureza (y) del oxígeno producido y el porcentaje de
hidrocarburo (x) que está presente en el condensador principal en un
proceso de destilación, de acuerdo con los siguientes datos:

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

Object 41

Lo que se observa en la gráfica es que los datos no están muy dispersos y


tienden siempre al lado positivo al incrementar.

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. Es confiable.
n X∗Y −X Y
b = n X 2−( X)2 ⅀Y −b ⅀ X
a=
n

20∗( 2214,66 ) −( 23,92 )∗(1843,21)


b= 20∗( 29,29 ) −( 23,92 ) 2 1843,21−14,947(23,92)
a=
20
44293,2−44089,583 1485,67
b= 585,8−572,16 a=
20
203,61
b= 13,64

b = 14,947 a = 74,283

y = 14,947 x + 74,283

c. Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.

Coeficiente de correlación.

Se= √
⅀ y2 −a ⅀ y−b ⅀ x∗y
n−2

se=
√ 170044,53−74, 283 ( 1843,21 )−14,947(2214,66)
20−2

se= √
170044,53−136919,16−33102,52
18

se= √
22,85
18

se= √1,27

Se = 1,12

Varianza.

⅀ y2
Sy2 = − ý 2
n
170044,53
Sy2 = 20
−(92,16) 2

Sy2 = 8502,22 – 8493,46


Sy2= 8,76

Se 2
R2 = 1 - Sy 2

(1,126)2
R2 = 1 - (8,76)2

1,267
R2 = 1 - 76,737

R2 = 1 – 0,016

R2 = 0,984

Con los resultados obtenidos se puede asegurar que la ecuación de la recta


2
es una muy buena estimación de la relación entre las dos variables. El R
afirma además que el modelo explica el 88 % de la información y el valor de r
coeficiente de correlación lineal confirma además el grado de relación
(98%) entre las variables: porcentaje de hidrocarburos y pureza presentes en
el condensador para el proceso de destilación.

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es


igual a 91,3?

y = 14,947 x + 74,283 y = 14,947 (91,3) + 74,283


y = 1364,66 + 74,283
y = 1,43

El porcentaje de hidrocarburo cuando la pureza del oxígeno es 91,3 es de


1%.
2. El número de libras de vapor (y) consumidas mensualmente por una
planta química, se relaciona con la temperatura ambiental promedio (en o
F). Para el año 2014, se registraron los siguientes valores de temperatura
y consumo anual.
a. Realice el diagrama de dispersión y determine el tipo de asociación
entre las variables.

Object 77

De la gráfica podemos decir que los datos están muy dispersos y existe una
relación muy cercana entre las variables.

b. Ajuste un modelo matemático que permita predecir el efecto de una


variable sobre la otra. Es confiable

n X∗Y −X Y ⅀Y −b ⅀ X
b = n X 2−( X) 2
a=
n

12∗( 265883,86 )− (558 )∗(5062,63) 5062,63−9,2087(558)


b= a=
12∗( 29256 )− ( 558 ) 2 12

3190606.32−2824947,54
b=
351072−(311364) 75,8246
a=
12

365658,78
b=
39708
b = 9,2087 a = -6,3184
y = 9,2087 x - 6,3184
c. Determine el porcentaje de explicación del modelo y el grado de
relación de las dos variables.

Se= √
⅀ y2 −a ⅀ y−b ⅀ x∗y
n−2

se=
√ 2416493,37−6,3184 ( 5062,63 )−9,2087 (265883,86)
12−2

se= √
2416493,37−31987,72139−2448444,702
10

se= √
63939,06
10
se= √6393,906

Se = 79,96

Varianza.

⅀ y2
Sy2 = n
− ý 2

2416493,37
Sy2 = 12
−(421,88) 2

Sy2 = 201374,44 – 177982,73

Sy2= 23391,71

Se 2
R2 = 1 - Sy 2

(79,96)2
R2 = 1 - (23391,71) 2

6393,60
R2 = 1 - 547172096,7
R2 = 1 – 0,0000116

R2 = 0,9999

Con los resultados obtenidos se puede asegurar que la ecuación de la recta


2
es una muy buena estimación de la relación entre las dos variables. El R
afirma además que el modelo explica el 100 % de la información y el valor de
r coeficiente de correlación lineal confirma además el grado de relación
(100%) entre las variables: porcentaje del consumo de vapor en libras con
relación a la temperatura.

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?

y = 9,2087 x + 6,3184

y = 9,2087 (70) + 6,3184

y = 644,609 + 6,3184

y = 650,92

El consumo de vapor cuando la temperatura es 70 ̊ F es de 650,92 libras.

3. Los investigadores están estudiando la correlación entre la obesidad y la


respuesta individual al dolor. La obesidad se mide como porcentaje
sobre el peso ideal (x). La respuesta al dolor se mide utilizando el umbral
de reflejo de reflexión nociceptiva (y) que es una medida de sensación de
punzada. Obsérvese que ambas, X e Y, son variables aleatorias

a. Realice el diagrama de dispersión y determine el tipo de asociación


entre las variables.
Object 113

b. Ajuste un modelo matemático que permita predecir el efecto de una


variable sobre la otra. Es confiable

n X∗Y −X Y ⅀Y −b ⅀ X
b = n X 2−( X) 2
a=
n

10∗( 4461,5 )−( 627 )∗(77) 77−(−0,0629)(627)


b= a=
10∗( 45141 )−( 627 ) 2 10

77+0,0629
44615−48279
b= a=¿(627) ¿
451410−(393129) 10

3664 116,43
b= a=
58281 10

b = -0,0629 a = 11,642
y = -0,0629 x + 11,642

c. Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

Se= √
⅀ y2 −a ⅀ y−b ⅀ x∗y
n−2

se=
√ 799,5−11,642 ( 77 )+ 0,0629(4461,5)
10−2
se= √
799,5−896,434+280,62835
8

se= √
183.694 35
8
se= √22,961

Se = 4,79

Varianza.
⅀ y2
Sy2 = n
− ý 2

799,5
Sy2 = 10
−(7,7) 2

Sy2 = 79,95 – 59,29

Sy2= 20.66

Se 2
R2 = 1 - Sy 2

(4,79)2
R2 = 1 - (20,66)2

22,9441
R2 = 1 - 426,8356

R2 = 1 – 0,05375

R2 = 0,9462

Con los resultados obtenidos se puede asegurar que la ecuación de la recta


2
es una muy buena estimación de la relación entre las dos variables. El R
afirma además que el modelo explica el 11 % de la información y el valor de r
coeficiente de correlación lineal confirma además el grado de relación
(95%) entre las variables: umbral de reflejo de reflexión nociceptiva y el
porcentaje de sobre peso.

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un


porcentaje de sobrepeso, de 40?

y = -0,0629 x + 11,642

y = -0,0629 (40) + 11,642

y = -2,516 + 11,642

y = 9,126

El umbral de reflejo de flexión nociceptiva para un sobre peso de 40 es de


9,126.

LABORATORIO DE REGRESION Y CORRELACION DE HOLMAN ANDRES PEÑA.

1. El rendimiento del producto de un proceso químico está relacionado con


la temperatura de operación del proceso. Se desea establecer la
relación que existe entre la pureza (y) del oxígeno producido y el
porcentaje de hidrocarburo (x) que está presente en el condensador
principal en un proceso de destilación, de acuerdo con los siguientes
datos.

Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.
105

100

95
VARIABLE Y

90
Linear ()
85

80
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6
VARIABLE X

Lo que puedo observar en la gráfica de dispersión es que los datos no se


encuentran muy dispersos de su medida

Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. Es confiable?

Y= a + bx
Y=14,97x + 74,283 R2 = 0,8774

El efecto de la variable es confiable porque su coeficiente de


correlación está en 0,8774

Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.

Este porcentaje corresponde a R 2 = 0,8774 donde indica el valor de


87,74% para el porcentaje del hidrocarburo

Se observa un grado de relación entre las 2 variables que es


conducido por la correlación lineal entre las variables que da r=0.93
donde podemos decir que la relación de las variables son altas y
positivas.
¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a
91,3?

Es de 1%

2. El número de libras de vapor (y) consumidas mensualmente por una


planta química, se relaciona con la temperatura ambiental promedio (en
o
F). Para el año 2014, se registraron los siguientes valores de
temperatura y consumo anual.

Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.
800
700
600
500
400
Axis Title
300
200 Linear ()
100
0
10 20 30 40 50 60 70 80
Axis Title

Ajuste un modelo matemático que permita predecir el efecto de una variable


sobre la otra. Es confiable?

Y= 9,2087x – 6,3184 R2 = 0,9999

El efecto de la variable es altamente confiable porque sus coeficientes


de correlación son de 0,9999

Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.

El porcentaje corresponde a R2 = 0,9999 donde podemos observar el


0.9999% para la temperatura
El grado de relación entre las 2 variables es llevado por la correlación
lineal entre las variables del valor r= 0,999931 y donde se observa alto y
positivo la relación entre las variables

¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?

Y= 9,2087x – 6,3184
Y= 9,2087x – 6,3184
= 9,2087(70) = 644.609 - 6,3184 = 638,2906
El consumo de vapor cuando la temperatura es de 70°f es de 638,2906
3. Los investigadores están estudiando la correlación entre la obesidad y la
respuesta individual al dolor. La obesidad se mide como porcentaje
sobre el peso ideal (x). La respuesta al dolor se mide utilizando el umbral
de reflejo de reflexión nociceptiva (y) que es una medida de sensación
de punzada. Obsérvese que ambas, X e Y, son variables aleatorias

Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.
16
14
12
10
fexion

8
6
Linear ()
4
2
0
10 20 30 40 50 60 70 80 90 100
sobre peso

Ajuste un modelo matemático que permita predecir el efecto de una variable


sobre la otra. Es confiable?

Y= -0,0629x + 11,642 R2 = 0,1115


El efecto de la variable no es confiable ya que su coeficiente de
correlación es de 0,1115

Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.

La explicación del modelo corresponde a R 2 = 0,1115 donde el indica


que el valor es 11,15%

El grado de relación entre las 2 variables es deducida por la correlación


lineal entre las variables que da de valor r = 0,3339079 donde se
observa que el nivel de relación de las variables es bajo y negativo.
¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje
de sobrepeso, de 40?

Es igual a 0,90

S-ar putea să vă placă și