Sunteți pe pagina 1din 20

UNIDAD 2: PASO 4- DESCRIPCIÓN DE LA INFORMACIÓN.

DETALLAR Y
RELACIONAR VARIABLES DE LA PROBLEMÁTICA UTILIZANDO MEDIDAS
BIVARIANTES.

ESTADISTICA DESCRIPTIVA

ERINZON DE JESUS CENTANARO ORTEGA

YENIRA ROSA JASSAN CAMPUZANO

GRUPO: 27

TUTORA: JHANNA PATRICK BRIEVA FUENTES

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ESCUELA DE CIENCIAS DE LA EDUCACION

CCVA COROZAL

2018
INTRODUCCIÓN

En esta fase cuarto de curso estadística descriptiva se evidencia la descripción de


la información donde se evidencia el uso de variables cuantitativas y diagramas de
dispersión como método estadístico para entender mejor el problema estudiando.
Esto ha permitido comprender mejor la situación dada la aplicación de las gráficas;
al mismo tiempo que su análisis.
La aplicación numérica a una variable cuantitativa, aplicando cálculos y operaciones
aritméticas es una de las funciones primordiales de la estadística. Entonces la
descripción de los datos graficados obtenidos en el paso 4, permite analizar dos
características de la población estudiada, con la finalidad de encontrar la variable
de correlación entre ambas.
JUSTIFICACIÓN

El comportamiento de una variable de regresión dada entendiéndola como una


técnica estadística para conocer la relación existente entre dos o más variables,
dándole lógica al problema estudiado. Po lo tanto se emplea también el modelo de
correlación que especifica el nivel de relación entre las dos variables, porque el
sistema de regresión no es suficiente para obtener la regresión. Siendo esta ultima
la herramienta estadística que permite analizar y predecir o estimar observaciones
futuras de dos o más variables relacionadas, siendo una herramienta útil para la
planeación.

Por lo tanto, el conocimiento de la variable de regresión, de dispersión y medidas


bivariantes le da al estudiante las herramientas necesarias para poder entender una
situación, analizarla mediante variables cuantitativas, diagramas de dispersión y
procesos aritméticos para poder dar un juicio científico basado en datos
cuantificables, donde se pueda aplicar esos conocimientos en un marco de
interpretación de datos.
OBJETIVOS

Objetivo general

Explicar los modelos de diagramas de dispersión con el análisis de las variables


cuantitativas y determinar el tipo de asociación entre ellas y su confiablidad.

Objetivos específicos
 Aplicar regresión y correlación lineal al problema estudiado.
 Realizar diagramas de dispersión de las variables.
 Determinar el grado de relación entre las variables.
 Relacionar los datos obtenidos y aplicarlos al problema.
 Analizar más detalladamente mediante resultados cuantitativos el problema
estudiado.
ANÁLISIS DE CORRELACIÓN LINEAL SIMPLE DE LAS DOS VARIABLES
CUANTITATIVAS SELECCIONADAS.

Variable estudiante Erinzon

Regresión y Correlación lineal Simple. A partir de la base de datos suministrada,


cada estudiante debe:

- Identificar dos variables cuantitativas de la situación estudiada que


puedan estar relacionadas. Se identifican las dos variables
cuantitativas:
X: Persona con empleo
Y: Tasa de empleo

Este ejercicio, pretende el análisis de la relación entre las dos variables ya


identificadas y poner en práctica los conceptos de Regresión y Correlación
Lineal, el cual se realizará utilizando Excel incluido en el paquete office.
Realizar el diagrama de dispersión de dichas variables y determinar el tipo
de asociación entre las variables.
Tasa de empleo vs Pesona con empleo
35,000,000

30,000,000 y = 761895x - 2E+07


R² = 0.8576
persona con empleo
25,000,000

20,000,000

15,000,000

10,000,000

5,000,000

-
0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00
Tasa de empleo

Grafica 1
La asociación que se presenta de la variable es positiva

- Encuentre el modelo matemático que permite predecir el efecto de


una variable sobre la otra. ¿Es confiable?
El modelo matemático que la herramienta Excel no ofrece es: y=761895x-
2E+07
Para veridical la cofacilitate excel nos proporciona el valor R² = 0,8576, el
valor de determinación
Confiabilidad =R2 *100%
= 85.76%
Según los resultados el modelo matemático es confiable

- Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

El porcentaje de explicación del modelo matemático es =85.76%


y el grado de relación de las variables está determinado por la expresión:
Coeficiente de correlación = √𝑹𝟐 = 0,926
Tabla1

Teniendo en cuenta la tabla anterior se puede argumentar que la correlación es


excelente.

Variable estudiante Yenira Jassan


A partir de la base de datos suministrada:

- Identificar dos variables cuantitativas de la situación estudiada que


puedan estar relacionadas.

Se identifican las dos variables cuantitativas:

X: Cantidad de empresas
Y: Tasa de empleo

Este ejercicio, pretende el análisis de la relación entre las dos variables ya


identificadas y poner en práctica los conceptos de Regresión y Correlación
Lineal, el cual se realizará utilizando Excel incluido en el paquete office.

- Realizar el diagrama de dispersión de dichas variables y determinar el


tipo de asociación entre las variables.
Relacion Cantidad Empresas y Tasa de empleo en
Colombia desde Enero 2004 a Marzo 2017
70.00
y = 0.0001x + 28.32
60.00 R² = 0.818

50.00
Tasa de empleo (%)

40.00

30.00

20.00

10.00

0.00
- 50,000 100,000 150,000 200,000 250,000 300,000 350,000
Cantidad de empresas

Grafica 2

Se evidencia según la gráfica que hay una correlación lineal positiva entre la
tasa de empleo y la cantidad de empresas ya que mientras que la aumenta
la cantidad de empresas la tasa de empleo aumenta linealmente.

- Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Según el cálculo de Excel se nota que el modelo matemático es:

y = 0,0001x + 28,32; para verificar su confiabilidad igualmente nos


proporciona el valor de R2 que indica el coeficiente de determinación y que
la confiabilidad se determina por la expresión:

Confiabilidad=R2 *100%; por lo que tenemos:


Confiabilidad=0,818*100%
Confiabilidad=81.8%; por lo que se puede inferir que el modelo matemático
es confiable.
- Determine el porcentaje de explicación del modelo y el grado de
relación de las dos variables.
El porcentaje de explicación del modelo corresponde al 81.8% y el grado de
relación de las dos variables está determinado por la expresión:

𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛 = √𝑅 2
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛 = √0,818

Grado de relación= 0,9044

Ya teniendo el coeficiente de correlación procedemos a determinar qué grado


de correlación de acuerdo con la tabla 1:

Determinamos así que la correlación es Excelente.


ANÁLISIS Y CONCLUSIONES, A PARTIR DE LOS RESULTADOS OBTENIDOS
Y APLICADOS AL PROBLEMA O SITUACIÓN ESTUDIADA.

De acuerdo con la base de datos la cantidad de empresas durante el periodo de


Enero del 2004 y Marzo del 2017 ha dado la posibilidad de brindar oportunidades
de empleo a los habitantes de la población colombiana.

Según la gráfica 1, se evidencia la tasa de empleo es aproximadamente 13% es


decir un crecimiento de personas con empleo de 10.000 personas
aproximadamente.
De acuerdo con este análisis realizado existe una relación positiva entre la tasa de
empleo y la cantidad de personas con empleo lo que ayuda al crecimiento laboral
en país.
Mientras que en la gráfica 2 según los resultados, existe igualmente una relación
positiva entre la tasa de empleo y la cantidad de empresas lo ayuda al crecimiento
económico del país.
CONCLUSION

La estadística es una de las bases más sólidas para poder hallar soluciones a diferentes
problemáticas es los ámbitos, económicos, sociales y culturales, haciendo interpretaciones
claras y concisas, arrojando datos exactos y con probabilidades seguras. La implementación
de regresión lineal en este trabajo ha sido de gran beneficio porque nos ayudó a analizar la
dependencia, la relación que hubo en las dos variables implementadas arrojando datos
ayudaron a concretar y consolidad la información buscada.

Por medio de esta herramienta podemos establecer soluciones a la problemática del


desempleo en Colombia, porque dependiendo a la relación que tenga una variable de la
otra, se pueden establecer formas para mitigar el desempleo y contribuir para aquellas
personas que no tienen empleo a solventar esta necesidad tan grande del país.
REFERENCIAS BIBLIOGRÁFICAS

Churchill, G.A.(2009).Análisis de Correlación y de Regresión Simple. México City:


Cengage Learning. Páginas 675 – 686 Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it
=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41

Chica, D. (09 de Noviembre de 2017). Estadistica descriptiva. Obtenido de Paso 4:


https://drive.google.com/drive/folders/1u7ilOnoi9iYZU8_1-kPpGLXV2fETOIKo

Pava, M. F. (21 de Noviembre de 2017). Estadistica descriptiva. Obtenido de paso 4.


(Descripción de la Información) Dudas e inquietudes:
http://conferencia2.unad.edu.co/p7zh55urcqq/?launcher=false&fcsContent=true&pb
Mode=normal

Pava, M. F. (09 de Noviembre de 2017). Estadistica descriptiva. Obtenido de paso 4.


(Descripción de la Información):
http://conferencia2.unad.edu.co/p2bnlsd0mjo/?launcher=false&fcsContent=true&pb
Mode=normal
ANEXO LABORATORIO REGREION Y CORRELACION LINEAL

1. El rendimiento del producto de un proceso químico está relacionado con la


temperatura de operación del proceso. Se desea establecer la relación que existe
entre la pureza (y) del oxígeno producido y el porcentaje de hidrocarburo (x) que
está presente en el condensador principal en un proceso de destilación, de acuerdo
con los siguientes datos:

X
(% de Hidro Y (Pureza)
carburos)

0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33

Tabla 1

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.
Rendimiento en un Proceso Quimico
102
100
y = 14.947x + 74.283
98 R² = 0.8774
96
Pureza

94
92
90
88
86
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
% de Hidrocarburos

Grafica 1

Se evidencia según la gráfica que hay una correlación lineal positiva ya que mientras
que el porcentaje de hidrocarburo aumenta la pureza impacta de manera directa
haciéndose igualmente mayor.

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Según el cálculo de Excel se nota que el modelo matemático es:

y = 14,947x + 74,283; para verificar su confiabilidad igualmente nos proporciona el


valor de R2 que indica el coeficiente de determinación y que la confiabilidad se
determina por la expresión:

Confiabilidad=R2 *100%; por lo que tenemos:


Confiabilidad=0,8774*100%
Confiabilidad=87.74%; por lo que se puede inferir que el modelo matemático es
confiable.

c. Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.
El porcentaje de explicación del modelo corresponde al 87.74% y el grado de
relación de las dos variables esta determinado por la expresión:
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛 = √𝑅 2
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛 = √0,8774

Grado de relación= 0,93669632


Ya teniendo el coeficiente de correlación procedemos a determinar que grado de
correlación de acuerdo con la siguiente tabla:
Tabla 2

Determinamos así que la correlación es Excelente.

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual


a 91,3?

Según el modelo matemático: y = 14,947x + 74,283


Procedemos a calcular el valor de X para el valor de Y=91,3.

91,3=14,947x + 74,283
91,3 – 74,283 =14,947x
17,017=14,947x
x=17,017/14,947
x=1,1384

Cuando el oxígeno es igual a 91,3 el porcentaje del hidrocarburo será 1,13%.

2. El número de libras de vapor (y) consumidas mensualmente por una


planta química, se relaciona con la temperatura ambiental promedio (en
o
F). Para el año 2014, se registraron los siguientes valores de
temperatura y consumo anual.
2014 registros de temperatura y
consumos de vapor.

Temperatur Consumo de
Mes
a (oF) vapor (Lb)

Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98

Tabla 3

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.
2014 registros de temperatura y consumos de vapor
800

700 y = 9.2087x - 6.3184


R² = 0.9999
600
Consumo de vapor (Lb)

500

400

300

200

100

0
0 10 20 30 40 50 60 70 80
Temperatura (°F)

Grafica 2

Se evidencia según la gráfica que hay una correlación lineal positiva ya que mientras
que la temperatura aumenta, el consumo de vapor aumenta linealmente.

b. Ajuste un modelo matemático que permita predecir el efecto de una variable


sobre la otra. ¿Es confiable?
Según el cálculo de Excel se nota que el modelo matemático es:

y = 9,2087x + 6,3184; para verificar su confiabilidad igualmente nos proporciona el


valor de R2 que indica el coeficiente de determinación y que la confiabilidad se
determina por la expresión:

Confiabilidad=R2 *100%; por lo que tenemos:


Confiabilidad=0,9999*100%
Confiabilidad=99,99%; por lo que se puede inferir que el modelo matemático es
confiable.

c. Determine el porcentaje de explicación del modelo y el grado de


El porcentaje de explicación del modelo corresponde al 99.99% y el grado de
relación de las dos variables está determinado por la expresión:
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛 = √𝑅 2
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛 = √0,9999

Grado de relación= 0,9999


Ya teniendo el coeficiente de correlación procedemos a determinar qué grado de
correlación de acuerdo con la tabla 1, determinamos que la correlación es
Excelente.

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70°F?


Según el modelo matemático: y = 9,2087x + 6,3184
Procedemos a calcular el valor de Y para el valor de X=.70

y = 9,2087(70) + 6,3184
y= 644,609 + 6,3184
y= 650,9274

Cuando la temperatura es igual a 70°F el consumo de vapor será 650,92 Lb.

Los investigadores están estudiando la correlación entre la obesidad y la respuesta


individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La
respuesta al dolor se mide utilizando el umbral de reflejo de reflexión nociceptiva (y) que es
una medida de sensación de punzada. Obsérvese que ambas, X e Y, son variables
aleatorias

x
(porcentaj y (umbral
e de de reflejo
sobrepeso de flexión
) nociceptiva
)

89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14

Tabla 4
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables.

correlación entre la obesidad y la respuesta


individual al dolor.
umbral de reflejo de flexión nociceptiva

y = -0.0629x + 11.642
16 R² = 0.1115
14
12
10
8
6
4
2
0
0 20 40 60 80 100
% de sobrepeso

Grafica 3

Se evidencia según la gráfica se evidencia que, aunque muestre una correlación


negativa, no hay una correlación alguna, ya que los datos se encuentran muy
dispersos respecto a la línea de tendencia.

a. Ajuste un modelo matemático que permita predecir el efecto de una variable


sobre la otra. ¿Es confiable?

Según el cálculo de Excel se nota que el modelo matemático es:

y = -0,0629x + 11,642; para verificar su confiabilidad igualmente nos proporciona el


valor de R2 que indica el coeficiente de determinación y que la confiabilidad se
determina por la expresión:

Confiabilidad=R2 *100%; por lo que tenemos:


Confiabilidad=0,1115*100%
Confiabilidad=11,15%; por lo que se puede inferir que el modelo matemático no es
confiable.

b. Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.
El porcentaje de explicación del modelo corresponde al 11.15% y el grado de
relación de las dos variables está determinado por la expresión:
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛 = √𝑅 2
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛 = √0,1115
Grado de relación= 0,3339
Ya teniendo el coeficiente de correlación procedemos a determinar qué grado de
correlación de acuerdo con la tabla 1, determinamos que la correlación es Mínima.

c. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje


de sobrepeso, de 40?

Según el modelo matemático: y = -0,0629x + 11,642


Procedemos a calcular el valor de Y para el valor de X= 40

y = -0,0629 (40) + 11,642


y= -2,516 + 11,642
y= 9,126

Cuando el porcentaje de sobrepeso es de 40%, el umbral de reflejo de flexión


nociceptiva es de 9,126.

S-ar putea să vă placă și