Sunteți pe pagina 1din 24

TRABAJO COLABORATIVO

Unidad 3: Paso 4. Descripción de la información

Estudiantes

Johan Alberto Herrera

Deivi Jonathan Ciceri Erazo

Grupo del curso

244040

Presentado a

Leidi Mildrec Rojas

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

12 de mayo de 2018

1
INTRODUCCIÓN

Mediante la estadística podemos desarrollar procesos de recolección de la


información y el análisis de la misma, gracias a la estadística podemos
desarrollar actividades de interpretación de datos e identificación de variables
cuantitativas y cualitativas y por las cuales podemos desarrollar un análisis e
interpretar la información con el fin de determinar la asociación de las variables
cuantitativas además de establecer si es confiable por medio de los modelos
matemáticos los cuales permiten predecir el efecto de una variable sobre otra y
gracias a ello poder desarrollar una análisis estadístico lo más preciso posible.

2
JUSTIFICACIÓN

El estudio de la información es algo indispensable en los diferentes entornos de


la vida diaria además que los procesos por los cuales se desarrollan para la
recolección de la información y el tratamiento que se desarrolla con la misma es
importante es hay en donde la estadística juega un gran papel importante por el
cual podemos desarrollar una interpretación de la información con claridad,
gracias a las diferentes herramientas las cuales nos brinda la estadística como
lo es las tablas de frecuencia, histogramas, polígono de frecuencia, etc., y con
ello poder tener una mejor interpretación y análisis de la información.

3
OBJETIVOS

Analizar e interpretar las distintas variables cuantitativas sobre la temática del


desempleo en Colombia para identificar las relaciones entre las distintas
variables y el tipo de asociación que las componen.

Mediante el análisis de las variables y sus relaciones encontrar el modelo


matemático el cual permita predecir el efecto de una variable sobre otra además
de establecer el nivel de confiabilidad del modelo y la relación de las variables.

Permitir desarrollar un análisis de la problemática teniendo en cuenta las


variables analizadas y los procesos desarrollados estadísticamente.

4
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

Estudiante 1: Johan Herrera

Variable Y: Tasa de empleo


Variable X: Personas con empleo

Diagrama de dispersión:

persons con empleo/tasa de empleo


70.00
60.00 y = 1E-06x + 26.943
R² = 0.8576
tasa de empleo

50.00
40.00
30.00 Series1
20.00 Linear (Series1)
10.00
0.00
- 10,000,00020,000,00030,000,00040,000,000
personas con empleo

Tipo de asociación de las variables Directa


Modelo matemático Y = 1E-06x + 26.943
R2 0.8576
R 0.92
Confiabilidad 85.76%
% de explicación 92%
Grado de relación Excelente

Análisis e interpretación de resultados

De acuerdo a que visualizamos en la gráfica y el valor obtenido encontramos un


modelo matemático que permite determinar la cantidad de empresas a partir del
número de personas con empleo, el modelo matemático es confiable por ser
cercano R2 a 1.
La correlación entre las variables es excelente dado a que su valor de coeficiente
es de 0.92, es decir ofrece el 92%. el grado de correlación.
El grado de relación es directo entre personas con empleo y tasa de empleo.

5
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

Estudiante 2: DEIVI JONATHAN CICERI ERAZO

Variable Y: Producción de personas


Variable X: Cantidad de empresas

Diagrama de dispersión:

produccion de personas por empresa


350,000

300,000

250,000
PRODUCION DE PERSONAS

200,000
y = 0.0702x + 180938
150,000
R² = 0.7473
100,000

50,000

-
- 200,000 400,000 600,000 800,000 1,000,000 1,200,000 1,400,000 1,600,000
CANTIDAD DE EMPRESAS

Tipo de asociación de las variables


Modelo matemático Y=0,0702X+180938
R2 0,7473
R 0,86
Confiabilidad 74,73%
% de explicación 0,8627
Grado de relación aceptable

Análisis e interpretación de resultados

Como conclusión se observa que mientras más aumenta la producción de


personas van creciendo las empresas… puedo deducir que este fenómeno se ya
que si la producción aumenta aumentan los activos por ende hay más dinero para
la creación de mas empresas.

6
REGRESION MULTIPLE

Estudiante 1: Johan Herrera

Variable Y: Tasa de empleo


Variable X1: personas con empleo
Variable X2: producido por persona

Diagrama 1

producido persona/tasa empleo


1600000
1400000 y = 71707x - 3E+06
R² = 0.6866
1200000
1000000
Tasa

800000
Series1
600000
Linear (Series1)
400000
200000
0
0.00 20.00 40.00 60.00 80.00
producido

persons con empleo/tasa de empleo


70.00
60.00 y = 1E-06x + 26.943 27,592,497 ,
R² = 0.8576 57.40
50.00
40.00
tasa

30.00 Series1
20.00 Linear (Series1)
10.00
0.00
- 10,000,00020,000,00030,000,00040,000,000
personas

7
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,927162425
Coeficiente de determinación R^2 0,859630162

Intercepción 28,27407028
Variable X 1 1,02958E-06
Variable X 2 1,04869E-06
Tipo de asociación de las variables Directa
Modelo matemático Y= 28.2740+1.02958E-06+1.04869E-06
R2 0.8959
R 0.9271
Confiabilidad 89.59%
% de explicación 92.71%
Grado de relación Excelente

Análisis e interpretación de resultados

Estadísticamente podemos decir que la relación entre las tres variables tasa de empleo,
personas con empleo y producción por persona se encuentran relacionadas a través del
modelo matemático de regresión múltiple Y= 28.2740+1.02958E-06 +1.04869E-06, este
modelo explica que el 85.96% de confiabilidad esto debido a que dichas variables se
encuentran bajo una correlación excelente.

El grado de correlación entre las variables es excelente dado que su valor de coeficiente
es de 0.92, la relación entre las tres variables es directa, se dice que entre más tasa de
empleo hay, mas alto el número de personas con empleo y la producción igual.

8
REGRESION MULTIPLE
Estudiante 2: DEIVI JONATHAN CICERI ERAZO

Variable Y: Índice de precios


Variable X1: Valor dolar
Variable X2: Exportaciones Mill

INDICE DE PRECIOS/VALOR DÓLAR


4,000
3,500 y = 7.2257x + 1481.3
R² = 0.0591
3,000
VALOR DOLAR

2,500
2,000
1,500
1,000
500
-
0.0 20.0 40.0 60.0 80.0 100.0 120.0 140.0 160.0
INDICE DE PRECIOS

INDICE DE PRECIOS/EXPORTACIONES MILL


6,000,000
y = 36190x - 611734
5,000,000
EXPORTACIONES MILL

R² = 0.2172
4,000,000

3,000,000

2,000,000

1,000,000

-
0.0 20.0 40.0 60.0 80.0 100.0 120.0 140.0 160.0
INDICE DE PRECIOS

9
Estadísticas de la regresión según calculo estadístico
Coeficiente de correlación múltiple 1
Coeficiente de determinación R^2 1

Intercepción 76,702884
Variable X 1 0
Variable X 2 0

Tipo de asociación de las variables directa


Modelo matemático y= 0 (x1) - 0 (x1) + 76,702884
R2 1
R 1
Confiabilidad 100%
% de explicación 1
Grado de relación perfecta

Análisis e interpretación de resultados

Se puede determinar estadísticamente que utilizando las variables índices de precios (y),
valor dólar (x1), exportación en Mill (x2) y teniendo en cuenta la tabla de correlación
lineal se encuentran relacionadas perfectamente debido a que se obtuvo un valor de 1
Y un porcentaje del 100 %,
Con estos valores podemos evidenciar que el índice de precio va de la mano con el valor
del dólar puesto que si este incrementa las exportación también o viceversa

10
CONCLUSIONES

Gracias al proceso de análisis de las variables estadísticas en los casos de


estudio en los cuales podemos concluir de forma más asertiva sobre la
información con la cual nos encontramos estudiando y que gracias a los modelos
matemáticos, los diagramas, los cuales son de mucha ayuda para poder conocer
la relaciones de las variables estudiadas además de los diferentes porcentajes
de confiabilidad cuya información es muy importante para el momento de
desarrollar un análisis y una conclusión estadística de la información con la cual
se esta trabajando.

11
REFERENCIAS BIBLIOGRÁFICAS

García, M.S. (2004). Introducción a la estadística económica y empresarial.


Paraninfo. Páginas 74 – 98. Recuperado de:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052900012&v=2.1&u=unad&i
t=r&p=GVRL&sw=w&asid=4a9b0a469e755a4327207c94b4c0d549

• Montero, J.M. (2007). Regresión y Correlación Simple. Madrid:


Paraninfo. Paginas. 130 – 172. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&i
t=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

• Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple.


México City: Cengage Learning. Páginas 675 – 686 Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&i
t=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41

• Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de


mercados. México City: Cengage Learning. Páginas 686 – 695.Recuperado de:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=unad&i
t=r&p=GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9

• Montero, J.M. (2007). Regresión y Correlación Múltiple. Madrid:


Paraninfo. Páginas 191 – 225. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100012&v=2.1&u=unad&i
t=r&p=GVRL&sw=w&asid=47eaa8f46c19ad13af26a0a74e510de2

12
ANEXO
Estudiante 1

LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL

2.1. El rendimiento del producto de un proceso químico está relacionado con la


temperatura de operación del proceso. Se desea establecer la relación que
existe entre la pureza (y) del oxígeno producido y el porcentaje de hidrocarburo
(x) que está presente en el condensador principal en un proceso de destilación,
de acuerdo con los siguientes datos:

13
Diagrama de dispersión:

Rendimiento en un proceso quimico


102
100 y = 14.947x + 74.283
R² = 0.8774
98
96
Pureza

94
92
90
88
86
0 0.5 1 1.5 2
% Hidrocarburo

Tipo de asociación de las variables Directa


Modelo matemático Y = 14.947x + 74.283
R2 0.8774
R 0.93
Confiabilidad 87.74

% de explicación 93%
Grado de relación Aceptable

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?


El porcentaje de hidrocarburo es de 1.14

2.2 El número de libras de vapor (y) consumidas mensualmente por una planta
Química, se relaciona con la temperatura ambiental promedio (en o F). Para el año 2014,
se registraron los siguientes valores de temperatura y consumo anual:

14
Diagrama de dispersión:

Temperatura/consumo de vapor
800
700 y = 9.2087x - 6.3184
Consumo de Vapor lb

600 R² = 0.9999
500
400
300
200
100
0
0 10 20 30 40 50 60 70 80
Temperatura Of

15
Tipo de asociación de las variables Directa
Modelo matemático Y = 9.2087x – 6.3184
R2 0.9999
R 0.99
Confiabilidad 99.99%
% de explicación 99%
Grado de relación excelente

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 °F?

Y= 9.2087 (70)-6.3184
Y = 6.38

El consumo de vapor es de 38.29 lb

2.3 Los investigadores están estudiando la correlación entre la obesidad y la respuesta


individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La
respuesta al dolor se mide utilizando el umbral de reflejo de reflexión nociceptiva (y)
que es una medida de sensación de punzada. Obsérvese que ambas, X e Y, son variables
aleatorias:

16
Diagrama de dispersión:

% sobrepeso vs m. al dolor
16
Umbral de reflejo-ref nocicep

14
12
10 umbral de reflejo de
8 flexiòn nociceptiva
y = -0.0629x + 11.642
6
R² = 0.1115
4 Linear (umbral de
2 reflejo de flexiòn
0 nociceptiva)
0 20 40 60 80 100
% de sobrepeso

Tipo de asociación de las variables Inversa


Modelo matemático Y = -0.0629x + 11.642
R2 0.1115
R 0.3339
Confiabilidad 11%
% de explicación -33%
Grado de relación Ninguno

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un


porcentaje de sobrepeso, de 40?

𝑌 = −0.0629𝑋 + 11.642
𝑌 = −0.0629(40) + 11.642
𝑌 = −2.516 + 11.642
𝑌 = 9.126

El umbal de reflexión nociceptiva es de 9.126

17
ENEXO LABORATORIO

Estudiante 2 DEIVI JONATHAN CICERI ERAZO

2.1 El rendimiento del producto de un proceso químico está relacionado con la


temperatura de operación del proceso. Se desea establecer la relación que existe entre la
pureza (y) del oxígeno producido y el porcentaje de hidrocarburo (x) que está presente
en el condensador principal en un proceso de destilación, de acuerdo con los siguientes
datos:

X
Y
(% de Hidro
(Pureza)
carburos)

0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25

 Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

18
Rendimiento de un producto quimico
102
100
98
96
PUREZA
94
92
90
88
86
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
% DE HIDROCARBUROS

DIRECTA: Si aumenta o disminuye una magnitud la otra va realizar lo mismo


INVERSA: Si aumenta una magnitud la otra disminuye y viceversa
 Encuentre el modelo matemático que permite predecir el efecto de una variable
sobre la otra. Es confiable.
Para obtener el nivel de confiabilidad realizamos el valor de
𝑅 2 𝑙𝑜 𝑚𝑢𝑙𝑡𝑖𝑝𝑙𝑖𝑐𝑎𝑚𝑜𝑠 𝑋100 nos arroja el 86.66 %

Rendimiento de un producto quimico


102
100
y = 14.885x + 74.5
98 R² = 0.8666
96
PUREZA

94
92
90
88
86
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
% DE HIDROCARBUROS

 Determine el porcentaje de explicación del modelo y el grado de relación de las


dos variables
El porcentaje de explicación se obtiene de 𝑅 2 = 0.8666, el grado de relación de las dos
variable es R= √0,8666 = 0,93
19
Según tabla de correlación nos arroja que es excelente

 Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?


y = 14,885x + 74,5
Pureza de oxigeno = 91,3
91,3 = 14,885(𝑥) + 74,5
91,3 − 74,5 = 14,885(𝑥)
16,8
=𝑋
14,885
𝑋 = 1.12 % 𝐷𝐸 𝐻𝐼𝐷𝑅𝑂𝐶𝐴𝑅𝐵𝑈𝑅𝑂
2.2 El número de libras de vapor (y) consumidas mensualmente por una planta química,
se relaciona con la temperatura ambiental promedio (en o F). Para el año 2014, se
registraron los siguientes valores de temperatura y consumo anual
2014 Registros de temperatura y consumos de vapor.

Temperatur Consumo de
Mes
a (oF) vapor (Lb)
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
20
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98
 Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables.

VALORES DE TEMPERATURA Y
CONSUMO ANUAL
800
CONSUMO DE VAPOR (LB)

700
600
500
400
300
200
100
0
0 10 20 30 40 50 60 70 80
TEMPERATURA (OF)

En el anterior diagrama nos muestra una recta lineal con aumentos positivos a medida
que el consumo de valor aumenta la temperatura también se observa su incremento.
 Ajuste un modelo matemático que permita predecir el efecto de una variable sobre
la otra. Es confiable?

VALORES DE TEMPERATURA Y
CONSUMO ANUAL
800
CONSUMO DE VAPOR (LB)

700 y = 9.2087x - 6.3184


600 R² = 0.9999

500
400
300
200
100
0
0 10 20 30 40 50 60 70 80
TEMPERATURA (OF)

21
Para obtener el nivel de confiabilidad tenemos en cuenta el valor de 𝑅 2 = 0,9999 a este
valor lo multiplicamos X 100 el cual nos da como resultado 99.9 % de confiabilidad, si
es confiable
 Determine el porcentaje de explicación del modelo y el grado de relación de las
dos variables
Teniendo en cuenta el coeficiente de determinación 𝑅 2 = 0,9999 realizamos a dicho
valor la raíz cuadrada, el grado de relación de las dos variables es de 0.99 y según la tabla
de correlación lineal nos dice que es excelente
 ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?

𝑦 = 9.2087 ∗ (𝑥) − 6.3184

𝑦 = 9.2087 ∗ 70℉ − 6.3184

𝑦 = 644.609 − 6.3184

𝑦 = 638.2906 𝑐𝑜𝑛𝑠𝑢𝑚𝑜 𝑑𝑒 𝑣𝑎𝑝𝑜𝑟

2.3 Los investigadores están estudiando la correlación entre la obesidad y la respuesta


individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La
respuesta al dolor se mide utilizando el umbral de reflejo de reflexión nociceptiva (y) que
es una medida de sensación de punzada. Obsérvese que ambas, X e Y, son variables
aleatorias

X Y
(porcentaje (umbral de reflejo de
de sobrepeso) flexión nociceptiva)
89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14

22
 Realice el diagrama de dispersión y determine el tipo de asociación entre
las variables

correlación entre la obesidad y la respuesta


individual al dolor
16
Umbral de reflejo de reflexion nociceptiva

14
12
10
8
6
4
2
0
0 20 40 60 80 100
Porcentaje de sobrepeso

 Ajuste un modelo matemático que permita predecir el efecto de una variable


sobre la otra. ¿Es confiable?

correlación entre la obesidad y la respuesta


individual al dolor
16
y = -0.0629x + 11.642
Umbral de reflejo de reflexion

14 R² = 0.1115
12
10
nociceptiva

8
6
4
2
0
0 20 40 60 80 100
Porcentaje de sobrepeso

𝑌 = 0.0629𝑋 + 11.642

Para obtener el % de confiabilidad se realiza el valor de 𝑅 2 ∗ 100

0.1112 ∗ 100 = 11.12% 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑

23
 Determine el porcentaje de explicación del modelo y el grado de relación de las
dos variables
Teniendo en cuenta el valor de coeficiente de determinación 𝑅 2 = 0,1112 ha dicho
valor le adicionamos la raíz cuadrada estos nos da como resultado 0,333 observando
la tabla de correlación lineal nos dice que la correlación es mínima.

¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de


sobrepeso, de 40?
Sobrepeso =40

𝑦 = −0,0629𝑋 + 11,642
Teniendo en cuanta los valores anteriores y la pregunta propuesta se despejaría el valor
de X ya que en la gráfica se observa dicho valor en dicho eje.

𝑦 = (−0,0629) ∗ 40 + 11,642

𝑦 = (−2.512) + 11.642

𝑦 = 9.126

24

S-ar putea să vă placă și