Sunteți pe pagina 1din 16

Actividad Individual Paso 4

Estadística Descriptiva 100105_9

Por:
Heather Yelettni Peña Orozco
Boris Estiven Palacios Alarcón
Malfer Mejía Mendoza

Presentado a:
Ing. Giovanni Rueda Carrillo

Ingeniería de Sistemas
Barranquilla - Colombia
septiembre de 2017
Introducción

Luego de reconocer los resultados obtenidos y representados con los


métodos propuestos en la primer unidad como son las medidas de tendencia
central o de posición y la organización en tablas, no son suficientes para
determinar características que pasan desapercibidas pero que complementan
y esclarecen dudas específicas y casi siembre de absoluto significado en la
obtención de conclusiones objetivas, es así como en esta segunda unidad se
contemplan operaciones estratégicas para el análisis más específico en la
observación de datos que respaldan el estudio de los movimientos de
variables ya sea individuales o complementarias.

Es así como esta segunda unidad entra a trabajar las Medidas de


dispersión y estadísticas bivariantes que son medidas con el objetivo de
analizar la fluctuación de datos de variables donde la comparación y la
relación de los mismos disipa dudas más específicas en de la investigación,
cuestionamientos que no son tomados en cuenta al analizar los datos desde
el punto de vista de su tendencia centralizada y promedia, por tal motivo las
Medidas de Dispersión enfocan su campo de acción a los paquetes de datos
ubicados en los extremos de los arreglos y conglomerados de datos que
tiene una dinámica muy decisiva sobre la totalidad de las bases de
información y así una se convierte en determinante en la complementación y
diversificación delas conclusiones luego del análisis estadístico sobre un
fenómeno posible de describir.
Justificación

Este informe es realizado con la intención de poner en práctica los ítems


propuestos en la unidad dos y que surgen de la necesidad del análisis de la
repercusión que ejercen los datos extremos no tenidos en cuenta por las
medidas de tendencia central pero que son decisivos en cuanto al análisis
completo de la información.

Con esta actividad se pretende observar la dinámica de los datos


extremos con el uso de las Medidas de dispersión y estadísticas bivariantes y
el posterior análisis de los resultados para concluir de forma complementaria
con los resultados obtenidos en la aplicación de las medidas de tendencia
central. Es también importante reconocer que esta unidad hace gran énfasis
en la comparación de variables y sus fluctuaciones en el desarrollo de un
fenómeno.
Objetivos

 Comprender el uso que tienen las medidas de dispersión y estadísticas


bivariantes para el análisis y comparación de variables con datos en
distinto grado de relación.
 Aprender a determinar la medida que cumple los requisitos en cada
caso para hacer más efectivo el análisis.
 Graficar de manera correcta y comprensible los datos que surgen del
análisis de la dispersión de la información.
 Observar y aplicar las operaciones de sumatorias y productoras
necesarias para organizar y engranar los daros.
 Reconocer la importancia de las medidas de tendencia central, definir
la pertinente en cada caso o fenómeno y determinar su relación con
las demás.
 Aplicar las competencias colaborativas y comunicativas en la
elaboración grupal de conocimiento a través de la estrategia del
ambiente virtual ofrecido por la UNAD.
Regresión y Correlación lineal Simple

Base de datos: Desempleo en Colombia

A partir de la base de datos suministrada, cada estudiante debe:

a. Identificar dos variables cuantitativas de la situación estudiada


que puedan estar relacionadas.

Rta: Para el presente análisis se tomaron las siguientes variables:

Cantidad de empresas (x) y Personas con empleo (y).

Producción por millones (x) y Producción por personas (y).

Personas sin empleo (x) y Tasa de desempleo (y).

b. Realizar el diagrama de dispersión de dichas variables y


determinar el tipo de asociación entre las variables.

Factores del desempleo en Colombia


35,000,000.00
30,000,000.00
f(x) = 96.27 x + 892743.85
Personas con empleo

25,000,000.00 R² = 0.97
20,000,000.00
15,000,000.00
10,000,000.00
5,000,000.00
-
150,000 200,000 250,000 300,000 350,000
Cantidad de empresas

En la gráfica, podemos observar que a medida que la Cantidad de empresas,


lo hace igualmente las Personas con empleo, con este análisis podemos decir
que se presenta una tendencia lineal positiva, es decir, que es directamente
proporcional.

Producción por Millones y persona


1,600,000
1,400,000 f(x) = 0.02 x + 111361.49
R² = 1
produccion por persona

1,200,000
1,000,000
800,000
600,000
400,000
200,000
-
10,000,000 20,000,000 30,000,000 40,000,000 50,000,000 60,000,000 70,000,000 80,000,000
produccion en millones

Se puede determinar que a mayor producción en millones mayor es la


producción por persona, el tipo de asociación es directa porque a medida
que aumenta una la otra también.

Personas Sin Empleo Vs Tasa Desempleo


9,000,000
8,000,000
7,000,000
f(x) = 328458.56 x + 1325190.31
Personas sin Empleo

6,000,000
R² = 0.44
5,000,000
4,000,000
3,000,000
2,000,000
1,000,000
-
6.00 8.00 10.00 12.00 14.00 16.00 18.00 20.00
Tasa de Desempleo

Las dos variables tienen una tendencia al alza. Lo que acrecienta el


promedio de desocupación e inactividad en la población laboralmente apta.
C. Encuentre el modelo matemático que permite predecir el efecto de
una variable sobre la otra. ¿Es confiable?

Modelo matemático Cantidad de empresas (x) y Personas con


empleo (y):

y = 96,27x + 892744
A partir de R2 que es el coeficiente de determinación, podemos decir que un
96.9% pertenece a los valores representado en la gráfica, por lo cual para
este proceso podríamos decir que este modelo es muy confiable.

Modelo matemático Producción por millones (x) y Producción por


personas (y):

y = 0,0193x + 111361

sí, es confiable ya que la relación que tiene estas dos variables es del
99,87%

Modelo matemático Personas sin empleo(x) y Tasa de desempleo(y):

Según los resultados el modelo matemático es:


T ( y ) = y=328459 x∗Pd ( x )+ 1E+06

La ecuación de la recta es NO confiable porque el coeficiente de la


determinación (R2) está muy alejado de 1.

d. Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

Cantidad de empresas (x) y Personas con empleo (y):

R2 es el coeficiente de determinación, en el presente análisis arroja un valor


de 0.969, del cual podemos determinar cómo un 96.9% la representación de
los valores en el estudio.
En cuanto a la relación de las variables, se determina que la correlación de
estas es excelente, según la tabla del grado de correlación, pues el
coeficiente de correlación para el presente análisis fue de 0,98 .

Producción por millones (x) y Producción por personas (y):

el tipo de correlación es excelente ya que el valor esta entre 0,90 y 1

Personas sin empleo(x) y Tasa de desempleo (y):


R2=0,4409∗100=44,09 % → Porcentaje de Explicación
r =√ 0,4409=0,664
r =0,664 →Grado de relaciónentre las dos variable

En la ecuación la estimación entre las variables maneja un coeficiente de


determinación R2 explica tan solo el 44,09 % de la información y el valor del
coeficiente de correlación R confirma el grado de relación de las variables en
el 66,4%. Considerado como Regular.

e. Relacionar la información obtenida con el problema.

Cantidad de empresas (x) y Personas con empleo (y):

Con el desarrollo del presente análisis podemos determinar que es


fundamental la creación de empresas en Colombia para así contribuir al
aumento de las cifras de personas con empleo.

Es necesario la que aumente el número de empresas para disminuir el


desempleo en Colombia.

Producción por millones (x) y Producción por personas (y):


Personas sin empleo(x) y Tasa de desempleo(y):
Con base en los resultados obtenidos mediante este análisis, podemos decir
que a medida que crecía la población laboralmente activa en Colombia y al
no encontrar puestos de trabajo, la tasa de desempleo también aumentaba,
acrecentando el problema.

Análisis y conclusiones, a partir de los resultados obtenidos y


aplicados al problema o situación estudiada.

Según el estudio de las variables de la problemática utilizando Medidas


Bivariantes podemos determinar algunos de los factores que influyen
fuertemente en el Desempleo en Colombia.

Podemos decir que es de vital importancia el crecimiento y la generación


de empresas en el país para poder generar mucho más empleo y aumentar
la cifra de personas laborando, disminuyendo las cifras de desempleo, cabe
resaltar además de ello, que también aumentaría la producción por millones
lo cual influiría en hacernos una nación más competitiva.

En conclusión es necesario trabajar fuertemente en la creación de empresas


para aumentar el número de ocupados en Colombia y así mismo su
producción, logrando la disminución del número de personas sin empleo,
para que cada día esta tasa de desempleo se cada vez más baja.
Conclusiones

El análisis de la varianza de los datos es de gran importancia para


observar la correlación de los mismos y comprender el comportamiento de
un fenómeno. Los diagramas de dispersión son herramientas fundaméntales
para observar de forma gráfica la asociación de los datos en dos variables
que representan un fenómeno determinado.

El uso de los índices simples tiene gran importancia ya que permite


observar la fluctuación de precios en dos periodos de tiempo distintos, los
resultados de este análisis son decisivos para crear estrategias y objetivos
en el campo empresarial y financiero. Los usos de las medidas de dispersión
son de gran utilidad en todas las áreas de la cotidianidad humana, así como
las medidas de tendencia central; son una fuente de información valiosa y
pertinente para la identificación de puntos clave en la optimización de los
procesos y la búsqueda de soluciones objetivas a los problemas localizados.

Es indispensable el uso adecuado de los datos de una investigación, del


orden de estos depende el eficiente tratamiento bajo una determinada
operación de medidas ya sea de dispersión o de tendencia central.
ANEXOS

Laboratorio Regresión y Correlación Lineal


1. Se quiere estudiar la asociación entre consumo de sal y tensión
arterial. A una serie de voluntarios se les administra distintas dosis
de sal en su dieta y se mide su tensión arterial un tiempo después.
X (sal) Y (Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120

a. Realice el diagrama de dispersión y determine el tipo de asociación entre


las variables

Asociación Sal-Tensión
140

120
f(x) = 6.11 x + 88.13
100 R² = 0.99
Tensión arterial

80

60

40

20

0
1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
consumo de Sal
Podemos observar que a medida que el consumo de sal es mayor, aumenta
de igual manera la tensión, por lo cual podríamos decir presenta una
tendencia lineal positiva y que es directamente proporcional.
b. Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?
Rta: El modelo matemático es:
Tensión (y)=6,1062*Consumo Sal (x)+88,128
Por lo cual es podemos determinar a partir de R2 que el coeficiente de
determinación es del 98,7%, es decir que ese porcentaje pertenece a los
valores representado en la gráfica. Siendo así podríamos decir que hay
confiabilidad.
c. Determine el grado de relación de las dos variables.
Rta: se determina que la correlación de las dos variables es excelente, pues
el coeficiente de correlación es de 0,99.
d. Si a un paciente se le administra una dosis de sal de 4,8. ¿Cuál es la
tensión arterial esperada?
Utilizando el modelo matemático plateado tenemos que y = tensión y x= 4,8
:
y=6,1062*(x)+88.128
y=6,1062*4,8+88,128
y=29,30976+88,128
y=117,43776

La tensión arterial esperada para una dosis de 4,8 de sal es de 117,43776


2. En un nuevo proceso artesanal de fabricación de cierto artículo
que está implantado, se ha considerado que era importante ir
anotando periódicamente el tiempo medio (medido en minutos) que
se utiliza para realizar una pieza y el número de días desde que
empezó dicho proceso de fabricación. Con ello, se pretende analizar
como los operarios van adaptándose al nuevo proceso mejorando
paulatinamente su proceso de producción.
Los siguientes datos representan dicha situación:

X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20

a. Identifique la variable dependiente (y) y la variable independiente (x),


realice el diagrama de dispersión y determine el tipo de asociación entre
las variables.
X= días
Y= tiempo en minutos

Proceso de Fabricación
50
45
40
35 f(x) = − 0.36 x + 42.57
30 R² = 0.8
Tiempo

25
20
15
10
5
0
0 10 20 30 40 50 60 70 80
N° dias

A partir del grafico podemos decir con respecto a la asociación de las


variables que hay una tendencia lineal negativa entre estas, es decir,
inversamente proporcional. A mayor número de días es menor el tiempo
empleado.
b. Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?
Modelo matemático:
y = -0,3566 (x) + 42,569
A partir de R2 que es el coeficiente de determinación, podemos decir que un
79,6% lo que se traduce a la confiabilidad de este modelo, por lo cual para
este proceso no es muy confiable.
c. Determine el grado de correlación de las dos variables.
La determinación de la correlación (R) de las 2 variables (tiempo y N° de
días) la hallamos sacando la raíz cuadrada de R2, para este caso seria de
0,89 lo cual se considera como una correlación aceptable.
d. ¿Qué tiempo deberá tardarse un empleado cuando lleven 80 días?
y=tiempo x=N° de días
y = -0,3566 (x) + 42,569
y = -0,3566 (80) + 42,569
y = -28,528 + 42,569
y = 14,041

Un empleado debería tardarse 14 minutos cuando lleven 80 días.


3. Una Nutricionista de un hogar infantil desea encontrar un modelo
matemático que permita determinar la relación entre el peso y la
estatura de sus estudiantes. Para ello selecciona 10 niños y realiza
las mediciones respectivas.
A continuación, se presentan los resultados:

Estatu 120 12 107 118 112 110 115 104 110 116
ra 4
(cm)
Peso ( 24 23 19 24 21 19 22 16 20 23
kg)

a. Identifique la variable dependiente (y) y la variable independiente (x),


realice el diagrama de dispersión y determine el tipo de asociación entre las
variables.
X= estatura
Y= peso

Relacion estaura - peso


30

25
f(x) = 0.39 x − 22.75
20 R² = 0.83
Peso kg.

15

10

0
100 105 110 115 120 125 130
estatura cm
b. Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?
Modelo matemático:
y = 0,386 (x) - 22,751
A partir de R2 que es el coeficiente de determinación, podemos decir que un
83,2% por lo que podemos decir que este modelo es confiable.

c. Determine el grado de correlación de las dos variables.


La determinación de la correlación para las variables peso y estatura es de
0,91 lo cual se considera como una correlación excelente.

e. ¿Cuál es el peso que debería tener un estudiante que mida 120 cm?
Y= peso (?)
X= estatura (120 cm)

y = 0,386 (x) - 22,751


y = 0,386 (120) - 22,751
y = 46,32 - 22,751
y = 23,5

Un estudiante que mida 120 cm debe tener un peso entre 23 y 24 kg.

S-ar putea să vă placă și