Sunteți pe pagina 1din 20

Estadisitica Descriptiva

Tutor/A: Luis Robinson Camelo

Estudiante: Kevin Andres Padilla Bernal

Código:1082850132

Grupo: 100105_231

Universidad Nacional Abierta Y A Distancia Unad

Ingeneria De Sistemas

Santa Marta – Magdalena. Octubre 2019


INTRODUCCIÓN

Se realiza el siguiente trabajo con el fin de investigar las medidas de


estadística univariantes, tomando de cada una de ellas las ideas
principales para desarrollar un mapa mental y así poder brindar o
exponer de una manera más clara y dinámica la temática anteriormente
mencionada.
De igual manera luego de realizar lectura de las respectivas referencias
que fueron suministradas en el foro, se colocan en práctica los conceptos
básicos aprendidos de temas como lo son: tablas de frecuencias con datos
agrupados y no agrupados, medidas de tendencias: central y de posición
y medidas de dispersión y se determinó su respectiva conclusión.
JUSTIFICACIÓN

En el interés de mejorar la enseñanza y la aplicación de la estadística que


permita una compresión adecuada de las técnicas básicas de análisis de
datos, viene de la mano con el rápido desarrollo y difusión de la estadística
como ciencia.
La Estadística es una disciplina que se aplica en todos los campos de la
actividad del ser humano. Es muy frecuente encontrarse en las diferentes
áreas del conocimiento con incertidumbres como el pronosticar el
crecimiento poblacional de un país, el crecimiento económico de una
empresa o en este caso el desempleo de Colombia.
En el mundo de hoy, es considerado la Estadística de gran importancia
porque suministra los mejores instrumentos de investigación, no sólo
para observar y recopilar toda una gama de información incubada dentro
de un mismo entorno o fuera de ello, sino también en el control de ciertas
actividades desarrolladas como son: producción, ventas, organización,
proyecciones o estimaciones a corto plazo, mediano y largo plazo,
procesos encaminados a facilitar la conceptualización y toma de
decisiones de unos datos plasmados en tablas y gráficos.
OBJETIVOS

 Investigar las diferentes unidades de medidas de estadística


univariantes con el fin de obtener los resultados y plasmarlos en
un mapa mental
 Desarrollar destrezas para calcular algunas medidas de dispersión.
 Identificar en la base de datos (el desempleo en Colombia) las
variables cuantitativas continua y discreta y realizar una tabla de
frecuencias con datos no agrupados y agrupados
 Identificar los tipos de asimetría y apuntamiento en una distribución
de datos.
 Desarrollar los diferentes gráficos (histograma, lineal, barras y
circular) con la información suministrada.
 Realizar el análisis de los datos para obtener el resultado de las
medidas de tendencia central y de posición y medidas de posición.
 Determinar las diferentes conclusiones luego de obtener el
resultado de cada medida.
MARCO REFERENCIAL

Unidades de medida Univariante


Al ver la forma de representar los conjuntos de datos en histogramas y
polígonos de frecuencia se puso de relieve un comportamiento peculiar
de estos, y es el de mostrar una tendencia a agruparse alrededor de los
datos más frecuentes, haciendo de esta forma que estas representaciones
adquieran una forma de campana. Esta tendencia al agrupamiento de los
datos hacia la parte central de los gráficos que los representan da lugar a
lo que se conoce como medidas de tendencia central, correspondientes a
la media, mediana y moda
 Media aritmética

Es la medida más conocida y la más fácil de calcular. Se define como la


suma de los valores de una cantidad dada de números dividido entre la
cantidad de números.
n

X i
x i 1

n
donde:
n = cantidad de elementos
Xi = valor de cada elemento
x = media aritmética, o simplemente media
 Mediana

Se define como el valor que divide una distribución de datos ordenados


en dos mitades, es decir, se encuentra en el centro de la distribución.

 Moda

Se trata del valor más frecuente en un conjunto de datos. Se considera


como el valor más representativo o típico de una serie de valores. Es
simbolizada como Mo.
MEDIDAS DE DISPERSIÓN
 Rango o recorrido

Sobre esta medida ya se había trabajado en la construcción de las tablas


de frecuencia agrupada. Se trata de la diferencia entre el límite superior
y el límite inferior de un conjunto de datos.
 Varianza

Es una de las medidas más usadas en estadística, ella a su vez da


origen a otra mucho más significativa: la desviación típica o estándar.
Se define como la media aritmética de los cuadrados de las desviaciones
respecto a la media aritmética. Se simboliza s2 para la varianza
muestral y σ2 para la varianza poblacional.

Para datos no agrupados:

s2 
 ( X  x) 2

 s2 
X 2

 x2
n n

Para datos agrupados:

s 2

 f ( X  x) 2

 s 2

 f X 2

 x2
n n
 Desviación típica o estándar
Esta medida se obtiene extrayendo la raíz cuadrada de la varianza,
tomando siempre el valor positivo. Se simboliza por s en la muestra y σ
en la población. Esta es la medida de dispersión más conocida y más
utilizada en el análisis de datos estadísticos.

Para datos no agrupados:

s
( X  x) 2

 s
X 2

 x2
n n
Para datos agrupados:

s
 f ( X  x) 2

 s
 f X 2

 x2
n n

 Coeficiente de variación
Las medidas de dispersión que se han estudiado son medidas absolutas
y se expresan en las mismas unidades con las que se mide la variable

 Desviación media
Se define como la media aritmética de las desviaciones respecto a la
media, tomadas en valor absoluto.
Para datos no agrupados:

DM 
 X x
n
Para datos agrupados:

DM 
 f  X x
n
Actividad 1. Mapa Mental

Nota: Si se le dificulta mirar el mapa aquí le dejo el link para que lo


pueda observar con mayor atención
https://www.lucidchart.com/invitations/accept/c0301302-865a-4263-a8f1-8de8fa54c429
Actividad 2. Medidas Univariantes -variable Discreta
Para el desarrollo de esta actividad, voy a trabajar con la variable
cuantitativa discreta: Personas con empleo
a. Tabla de frecuencia datos no agrupados.
Al realizar el análisis de la variable anteriormente mencionada podemos
concluir que no tiene moda, es decir que no tiene datos que se repiten
por tal motivo no se realiza la tabla de frecuencia para datos no
agrupados puesto que para cada uno de estos valores tendría una
repetición una frecuencia absoluta.

b. Medidas de tendencias central y de Posición.

Medidas de tendencia central


Media Mediana Moda
25.457.219 25.553.171 #N/A

Cuartiles:
cuartiles Posición Valor

Q1 36 23.188.672

Q2 72 25.507.712

Q3 108 27.451.534

Deciles:
Deciles Posición Valor

Q5 72 25.507.712

Percentiles:
percentiles Posición Valor

Q50 72 25.507.712
Asimetría:

Tipo de asimetría:
0,026113711
Distribución asimétrica
pocitiva
Curtosis:
Tipo de curtosis
-1,070458984
Curtosis platicúrtica

Conclusiones:
Luego de analizar los resultados obtenidos al realizar las medidas de
tendencia central y de posición podemos concluir que:
 En ninguno de los meses en los cuales se realizó el estudio de la
población cantidad personas este número de personas es el
mismo; es decir que va en aumento la cantidad de personas.
 El 50% de la población a la cual se le realizó el estudio es igual o
menor de 1’657.900.806 (cantidad de personas).

c. Medidas de Dispersión

MEDIDAS DE DISPERCION
DES. COE. DE
RANGO VARIANZA TIPICA VARIACION
6274192 3,3496E+12 1830190,76 0,039964345

Conclusiones:

 teniendo en cuenta la desviación estándar no hay diferencias


significativas en la cantidad de personas entre los diferentes
meses del estudio.
 La diferencia entre la cantidad de personas a las cuales se les
realizo el estudio desde el primer mes hasta el último es de
6.274.192
Actividad 3. Medidas Univariantes -variable Continua
Para el desarrollo de esta actividad, voy a trabajar con la variable
cuantitativa continua: TASA DE DESEMPLEO %
a. Tabla de frecuencia datos agrupados.

Rango= dato max – dato min =14.62 - 7.27=7.35

Numero de intervalos= √𝟏𝟒𝟒 = 𝟖. 𝟏 = 𝟖


𝑟 7.35
Amplitud=𝐴 = 𝑘 = 𝐴 = = 0.9
8

INTERVALOS FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA


X
CLASE ABSOLUTA ACUMULADA RELATIVA %
[7 a 8) 7,5 5 5 0,035 3,47
[8 a 9) 8,5 22 27 0,153 15,28
[9 a 10) 9,5 23 50 0,160 15,97
[10 a 11) 10,5 30 80 0,208 20,83
[11 a 12) 11,5 34 114 0,236 23,61
[12 a 13) 12,5 21 135 0,146 14,58
[13 a 14) 13,5 6 141 0,042 4,17
[14 a 15) 14,5 3 144 0,021 2,08
SUMA 144 1 100

HISTOGRAMA
DESEMPLEO EN COLOMBIA
45
40
34
35
30
30
25 22 23
21
20
15
10 6
5
5 3

0
-5 [7 a 8) [8 a 9) [9 a 10) [10 a 11) [11 a 12) [12 a 13) [13 a 14) [14 a 15)

Polígono de frecuencias

DESEMPLEO EN COLOMBIA
50

40
34
30 30
22 23 21
20

10
5 6
3
0
[7 a 8) [8 a 9) [9 a 10) [10 a 11) [11 a 12) [12 a 13) [13 a 14) [14 a 15)
-10

Conclusiones:
Luego de realizar la tabla de frecuencias y sus respectivas gráficas, para
la variable elegida podemos concluir que:
 El desempleo en Colombia en los intervalos de 11 a 12
presenta el mayor porcentaje en el índice de población.
 Los intervalos de 10 a 11 y 11 a 12 representan el 44% del
desempleo en Colombia.
 El desempleo en Colombia va aumentando con el paso de los
años

b. Medidas de tendencias central y de Posición.


 MEDIA:
Marca Frecuencia
Número de Límite Límite de Frecuencia absoluta
Intervalos inferior superior clase absoluta f acumulada
(x) F f.x
1 7 8 7,5 5 5 37,5
2 8 9 8,5 22 27 187
3 9 10 9,5 23 50 218,5
4 10 11 10,5 30 80 315
5 11 12 11,5 34 114 391
6 12 13 12,5 21 135 262,5
7 13 14 13,5 6 141 81
8 14 15 14,5 3 144 43,5
Total 144 1536
n 144
Min 7,27
Max 14,62
Rango 7,35
K 8,1 8
A 0,9

Media 10,67

Conclusión: Según el estudio realizado en los 144 meses al desempleo


en Colombia el promedio esta en 10,69%.

 MEDIANA:

Marca Frecuencia
Número de Límite Límite de Frecuencia absoluta
Intervalos inferior superior clase absoluta f acumulada
(x) F
1 7 8 7,5 5 5
2 8 9 8,5 22 27
3 9 10 9,5 23 50
4 10 11 10,5 30 80
5 11 12 11,5 34 114
6 12 13 12,5 21 135
7 13 14 13,5 6 141
8 14 15 14,5 3 144
Total 144

n/2 72
n 144
Fk-1 50
fk 30
Ak 0,9
Lk 10

MEDIANA 10,66
Minimo Mediana Maximo
7,27 10,66 14,62

Conclusión: el 50% de los meses en los que estudiamos la tasa de


desempleo en Colombia se mantuvo de 7,27 hasta 10,66 y el otro 50%
se mantuvo de 10,66 hasta 14,62

 MODA

Marca Frecuencia
Número de Límite Límite de Frecuencia absoluta
Intervalos inferior superior clase absoluta f acumulada
(x) F
1 7 8 7,5 5 5
2 8 9 8,5 22 27
3 9 10 9,5 23 50
4 10 11 10,5 30 80
5 11 12 11,5 34 114
6 12 13 12,5 21 135
7 13 14 13,5 6 141
8 14 15 14,5 3 144
Total 144

fk-1 30
fk+1 21
Ak 0,9
Lk 5

MODA 11,53
Conclusión: En los años que se realizó el estudio del desempleo en
Colombia la moda fue una tasa de 11,53%.

 PERCENTIL
n/2 72 K(n/100) 36
n 144 n 144
Fk-1 50 Fk-1 27
fk 30 fk 23
Ak 0,9 A 0,9
Lk 10 Lk 9

P50% 10,66 P25% 9,35


Frecuencia
Marca
Número de Límite Límite Frecuencia absoluta
de
Intervalos inferior superior absoluta f acumulada
clase
(F)
1 7 8 7,5 5 5
2 8 9 8,5 22 27
3 9 10 9,5 23 50 PERCENTIL 25%
4 10 11 10,5 30 80 PERCENTIL 50%
5 11 12 11,5 34 114
6 12 13 12,5 21 135
7 13 14 13,5 6 141
8 14 15 14,5 3 144
Total 144

Conclusión:

 el 25% de la población desempleada se encuentra entre la tasa


de 9%
 El 75% de la población desempleada se encuentra entre la tasa
10% a 14%

 Cuartil:
Frecuenc
número Frecuenc
Límite Límite Marca ia
de ia
inferi superi de absoluta
Interval absoluta
or or clase acumula
os f
da (F)
1 7 8 7,5 5 5
2 8 9 8,5 22 27
3 9 10 9,5 23 50 Q1
4 10 11 10,5 30 80 Q2
5 11 12 11,5 34 114 Q3
6 12 13 12,5 21 135
7 13 14 13,5 6 141
8 14 15 14,5 3 144
Total 144
K(n/10
n/2 72 0) 36
n 144 n 144
Fk-1 50 Fk-1 27
fk 30 fk 23
Ak 0,9 A 0,9
Lk 10 Lk 9

Q2 10,66 Q1 9,35

K(n/100) 82,5
n 144
Frecuencia
Número de Límite Límite Marca de Frecuencia absoluta
Intervalos inferior superior clase absoluta f acumulada
(F)
1 7 8 7,5 5 5
2 8 9 8,5 22 27
3 9 10 9,5 23 50
4 10 11 10,5 30 80 D5
5 11 12 11,5 34 114 D7
6 12 13 12,5 21 135
7 13 14 13,5 6 141
8 14 15 14,5 3 144
Total 144
n/2 72 K(n/100) 100,8
n 144 n 144
Fk-1 50 Fk-1 80
fk 30 fk 34
Ak 0,9 A 0,9
Lk 10 Lk 11

D5 10,66 D7 11,55
Fk-1 80
fk 34
Ak 0,9
Lk 11

Q3 11,07

Conclusiones:

 El 75% de la población desempleada en los años de estudio se


encuentran en la tasa de 11,07.

 DECIL

Conclusiones:
 El 50% de los meses en los cuales se realizó el estudio del
desempleo en Colombia se encuentra en una tasa menor a 10,66%.

Curtosis -0,53
Coeficiente de
asimetría 0,08

d. Medidas de Dispersión

Rango 7,35
Varianza 2,42
Desviacion
tipica 1,56
coe de
variacion 0,145930776

Conclusiones

 teniendo en cuenta la desviación no hay diferencias significativas en


las tasas de desempleo en los diferentes meses del estudio.
 La diferencia entre la cantidad de personas desempleadas a las
cuales se les realizo el estudio desde el primer mes hasta el último
equivalen a una tasa de 7,35%
CONCLUSIONES

Luego de realizar la aplicación de las diferentes medidas estadísticas


univariantes podemos concluir que su análisis nos ayuda a facilitar el
tratamiento y manejo de cada uno de los datos que hacen parte de las
unidades de estudio, luego de tener los resultados de estas medidas se
procedió a plasmar en gráficas y de igual manera se construyó su tabla
de frecuencia, la cual nos permitió llegar a las conclusiones finales.
Para concluir con el desarrollo de esta actividad, podemos afirmar que se
cumplieron a cabalidad con todos los objetivos planteados al inicio, puesto
que se colocó en práctica todo el conocimiento adquirido luego de realizar
las diferentes investigaciones, análisis de la base de datos y creación de
las diferentes tablas y gráficas para plasmar la información en estudio.
Referencias Bibliográficas

 Churchill, G.A. (2009). Análisis de Correlación y de Regresión


Simple. México City: Cengage Learning. Recuperado
de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&
v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=e558184ed89e57d11e
de116134cfce41
 Montero, J. M. (2007). Características de Una Distribución de
Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo,
S.A. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100008&v=
2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea6096
1107ffc27a0
 Ortegón Pava, M. (2017).
Ova_Medidas_Univariantes.Colombia.Recuperado
de http://hdl.handle.net/10596/11579

S-ar putea să vă placă și