Sunteți pe pagina 1din 16

Paso 3– Análisis de la Información.

Realizado por:

Grey altamar Grau 112952076

Presentado al tutor

CARLOS ARTURO VIDES

Código de curso

100105_2

Universidad Nacional Abierta y a Distancia – UNAD

Barranquilla, Atlántico

26 de mayo de 2018
Introducción

En este trabajo colaborativo vamos aplicar el concepto de estadística descriptiva la cual se


conoce como la que orienta a un proceso mediante la recopilación , organización ,
presentación , análisis e interpretación de datos de forma fácil y rápida las características
esenciales de los datos de una investigación de mercados debido al empleo de gráficos ,
tabulares o numéricos.
El nivel descriptivo se refiere al estudio y análisis de datos obtenidos de una muestra (n) dado
como su nombre lo indica describe y resume las observaciones obtenidas en el planteamiento
o suceso de un problema.
En el desarrollo de actividad desarrollaremos un ejercicio práctico donde veremos las
medidas de tendencia central que son la media, mediana, moda, calcular los Deciles,
percentiles, cuartil, amplitud, rango y número de intervalos donde interpretaremos los
resultados de este.

.
Justificación

Con el siguiente estudio vamos a corroborar que los métodos estadísticos se utilizan para
propósitos descriptivos y una manera fácil de organizar y resumir datos numéricos los cuales
serán puestos en práctica durante esta primera fases del paso 2 organización y presentación.
Podemos ver que la estadística descriptiva es de gran utilidad ya que nos permite informar
basado en datos recopilados eficaz y con gran facilidad a la hora dar solución a un problema,
reflejada en gráficos y análisis de resultados.
La estadística es una disciplina aplicada en todos los campos de la actividad humana. De ahí
que se tenga como una asignatura indispensable en todas las áreas y carreras del
conocimiento de nivel intermedio y profesional.
Objetivos

 Aplicar adecuadamente las medidas de tendencia central

 Comprender las propiedades de media y varianza en el análisis de datos

 Calcular acertadamente las medidas de variabilidad

 Diferenciar los datos cualitativos y cuantitativos

 Elaborar gráficas de representación de la distribución de frecuencias en datos


estadísticos
Cálculo e interpretación de las medidas univariantes de tendencia central y de
dispersión para la variable discreta.
Variable discreta: Edad en Datos No Agrupados

edades fre abs fre acum fre relativa


17 5 5 0,04545455 4,5%
18 5 10 0,04545455 4,5%
19 3 13 0,02727273 2,7%
21 6 19 0,05454545 5,5%
22 6 25 0,05454545 5,5%
23 2 27 0,01818182 1,8%
24 1 28 0,00909091 0,9%
29 5 33 0,04545455 4,5%
30 1 34 0,00909091 0,9%
31 2 36 0,01818182 1,8%
32 4 40 0,03636364 3,6%
33 7 47 0,06363636 5,5%
34 2 49 0,01818182 1,8%
35 4 53 0,03636364 3,6%
36 3 56 0,02727273 2,7%
38 7 63 0,06363636 6,4%
42 3 66 0,02727273 2,7%
43 2 68 0,01818182 1,8%
44 1 69 0,00909091 0,9%
45 3 72 0,02727273 2,7%
46 14 86 0,12727273 12,7%
48 1 87 0,00909091 0,9%
50 1 88 0,00909091 0,9%
52 6 94 0,05454545 5,5%
53 1 95 0,00909091 0,9%
54 6 101 0,05454545 5,5%
55 5 106 0,04545455 4,5%
56 2 108 0,01818182 1,8%
60 2 110 0,01818182 1,8%
Edad

Media 36,97272727
Error típico 1,207183053
Mediana 36
Moda 46
Desviación estándar 12,66104268
Varianza de la muestra 160,3020017
Curtosis -1,210463783
Coeficiente de asimetría -0,045033409
Rango 43
Mínimo 17
Máximo 60
Suma 4067
Cuenta 110
Recuento 110
Promedio 36,9727
Mediana 36,0
Moda 46,0
Media Geométrica 34,6104
Media Recortada 5% 36,9545
Media Winsorizada 5% 36,9091
Varianza 160,302
Desviación Estándar 12,661
Coeficiente de Variación 34,2443%
Error Estándar 1,20718
Sigma Winsorizada 5% 13,0241
DAM 10,0
Sbi 13,3003
Mínimo 17,0
Máximo 60,0
Rango 43,0
Cuartil Inferior 24,0
Cuartil Superior 46,0
Rango Intercuartílico 22,0
1/6 sextil 21,0
5/6 sextil 52,0
Rango Intersextil 31,0
Sesgo -0,0450334
Sesgo Estandarizado -0,192822
Curtosis -1,21046
Curtosis Estandarizada -2,59145
Suma 4067,0
Suma de Cuadrados 167841,
Esta tabla muestra los estadísticos de resumen para Col_1. Incluye medidas de tendencia
central, medidas de variabilidad y medidas de forma. De particular interés aquí son el sesgo
estandarizado y la curtosis estandarizada, las cuales pueden utilizarse para determinar si la
muestra proviene de una distribución normal. Valores de estos estadísticos fuera del rango
de -2 a +2 indican desviaciones significativas de la normalidad, lo que tendería a invalidar
cualquier prueba estadística con referencia a la desviación estándar. En este caso, el valor
del sesgo estandarizado se encuentra dentro del rango esperado para datos provenientes una
distribución normal. El valor de curtosis estandarizada no se encuentra dentro del rango
esperado para datos provenientes de una distribución normal.

𝑁𝑑 − 𝑁𝑎
Deciles 𝑥𝑝 = 𝐿𝑖 + 𝐴 ( )
𝑁𝑥
𝑥5 = 36
𝑥7 = 46
𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 30
𝑃30 = 29
𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 50
𝑃50 = 36

Edad
16

14

12

10

0
17 18 19 21 22 23 24 29 30 31 32 33 34 35 36 38 42 43 44 45 46 48 50 52 53 54 55 56 60
fr abs 5 5 3 6 6 2 1 5 1 2 4 7 2 4 3 7 3 2 1 3 14 1 1 6 1 6 5 2 2
La moda es la edad de 46 años donde más se repiten los accidentes dentro transito

fre frecuencia frecuencia relativa


Etiquetas de fila fre abs acumulada relativa acumulada
0 22 22 0,2 20%
0,3 1 23 0,209090909 20,91%
0,5 1 24 0,218181818 21,82%
0,6 15 25 0,227272727 22,73%
0,8 4 26 0,236363636 23,64%
1,1 8 27 0,245454545 24,55%
1,2 4 28 0,254545455 25,45%
1,3 2 29 0,263636364 26,36%
1,4 6 30 0,272727273 27,27%
1,6 7 31 0,281818182 28,18%
1,8 1 32 0,290909091 29,09%
1,9 4 33 0,3 30,0%
2,1 6 34 0,309090909 30,91%
2,2 1 35 0,318181818 31,82%
2,4 7 36 0,327272727 32,73%
2,5 1 37 0,336363636 33,64%
2,6 1 38 0,345454545 34,55%
2,7 7 39 0,354545455 35,45%
2,9 2 40 0,363636364 36,36%
3,0 10 41 0,372727273 37,27%
Total general 110

Recuento 110
Promedio 1,36
Mediana 1,25
Moda 0
Media Geométrica
Media Recortada 1,34444
5%
Media Winsorizada 1,36
5%
Varianza 1,04132
Desviación 1,02045
Estándar
Coeficiente de 75,0332%
Variación
Error Estándar 0,097296
2
Sigma Winsorizada 1,07075
5%
DAM 0,85
Sbi 1,06774
Mínimo 0
Máximo 3,0
Rango 3,0
Cuartil Inferior 0,6
Cuartil Superior 2,4
Rango 1,8
Intercuartílico
1/6 sextil 0
5/6 sextil 2,7
Rango Intersextil 2,7
Sesgo 0,164823
Sesgo 0,705728
Estandarizado
Curtosis -1,26423
Curtosis -2,70656
Estandarizada
Suma 149,6
Suma de Cuadrados 316,96
25
Grados de Alcohol
22
20

15 15

10 10
8
7 7 7
6 6
5
4 4 4
2 2
1 1 1 1 1 1
0
0 0,3 0,5 0,6 0,8 1,1 1,2 1,3 1,4 1,6 1,8 1,9 2,1 2,2 2,4 2,5 2,6 2,7 2,9 3,0
Total 22 1 1 15 4 8 4 2 6 7 1 4 6 1 7 1 1 7 2 10

Esta tabla muestra los estadísticos de resumen para GRADOS DE ALCOHOL DEL
CONDUCTOR. Incluye medidas de tendencia central, medidas de variabilidad y medidas
de forma. De particular interés aquí son el sesgo estandarizado y la curtosis estandarizada,
las cuales pueden utilizarse para determinar si la muestra proviene de una distribución
normal. Valores de estos estadísticos fuera del rango de -2 a +2 indican desviaciones
significativas de la normalidad, lo que tendería a invalidar cualquier prueba estadística con
referencia a la desviación estándar. En este caso, el valor del sesgo estandarizado se
encuentra dentro del rango esperado para datos provenientes una distribución normal. El
valor de curtosis estandarizada no se encuentra dentro del rango esperado para datos
provenientes de una distribución normal.

Cálculo e interpretación de las medidas univariantes de tendencia central y de dispersión para


la variable continúa.

DATOS AGRUPADOS - Velocidad esta variable puede tomar cualquier valor

intervalos marca de clase FRE ABSO fre acum fre relativa fre relativa acumulada
33-42 37,5 3 3 0,02727273 2,7% 0,027272727 2,7%
43-52 47,5 8 11 0,07272727 7,3% 0,1 10,0%
53-62 57,5 11 22 0,1 10,0% 0,2 20,0%
63-72 67,5 33 55 0,3 30,0% 0,5 50,0%
73-82 77,5 34 89 0,30909091 30,9% 0,809090909 80,9%
83-92 87,5 12 101 0,10909091 10,9% 0,918181818 91,8%
93-102 97,5 3 104 0,02727273 2,7% 0,945454545 94,5%
103-112 107,5 3 107 0,02727273 2,7% 0,972727273 97,3%
133-142 117,5 2 109 0,01818182 1,8% 0,990909091 99,1%
143-152 127,5 1 110 0,00909091 0,9% 1 100,0%

Cuenta de
Etiquetas de fila velocidad
33-43 3
44-54 8
55-65 14
66-76 42
77-87 30
88-98 6
99-109 3
110-120 1
132-142 2
143-153 1
Total general 110
Velocidad
Media 73,3727273
Error típico 1,70862792
Mediana 72,5
Moda 66
Desviación estándar 17,9202408
Varianza de la
muestra 321,135029
Curtosis 4,87139266
Coeficiente de
asimetría 1,38163038
Rango 117
Mínimo 33
Máximo 150
Suma 8071
Cuenta 110

Recuento 110
Promedio 73,3727
Mediana 72,5
Moda 66
Media Geométrica 71,3724
Media Recortada 5% 72,2071
Media Winsorizada 5% 72,6364
Varianza 321,135
Desviación Estándar 17,9202
Coeficiente de Variación 24,4236%
Error Estándar 1,70863
Sigma Winsorizada 5% 14,4668
DAM 7,5
Sbi 13,3692
Mínimo 33,0
Máximo 150,0
Rango 117,0
Cuartil Inferior 66,0
Cuartil Superior 80,0
Rango Intercuartílico 14,0
1/6 sextil 60,0
5/6 sextil 83,0
Rango Intersextil 23,0
Sesgo 1,38163
Sesgo Estandarizado 5,91579
Curtosis 4,87139
Curtosis Estandarizada 10,429
Suma 8071,0
Suma de Cuadrados 627195,

RANGO = 150 – 33 = 117

INTERVALOS = √110 = 10,48- O

K = 1 +3,333 log n
K= 1+3,333 log (110)
K= 11

AMPLITUD = R /M = 11

Deciles para la velocidad

110 × 5
− 11
𝑥5 = 53 + 11 ( 10 )
8
55 − 11
𝑥5 = 53 + 11 ( )
8
44
𝑥5 = 53 + 11 ( )
8
5,5
𝑥5 = 53 + ( )
8
𝒙𝟓 = 𝟓𝟑, 𝟓

𝑁𝑃
− 𝑁𝐴
𝑥7 = 𝐿𝑖 + 𝐴 ( 10 )
𝑁𝑥
100 × 7
− 55
𝑥7 = 73 + 11 ( 10 )
34
22
𝑥7 = 73 + +11 ( )
34

𝒙𝟕 = 𝟖𝟎, 𝟏𝟏

Percentiles de velocidad

𝑁𝑃
100 − 𝑁𝐴
𝑃𝑝 = 𝐿𝑖 + 𝐴 ( )
𝑁𝑋
100 × 25
− 22
𝑝 (25) = 63 + 11 ( 100 )
11
𝑷(𝟐𝟓) = 𝟔𝟑 + 𝟓, 𝟓 = 𝟔𝟖, 𝟓

110 × 50
− 22
𝑝 (50) = 63 + 11 ( 100 )
11

𝑝(50) = 63 + (55 − 22)

𝑝(50) = 63 + 33

𝑷(𝟓𝟎) = 𝟗𝟔

27,5 0
37,5 3
47,5 8
57,5 11
67,5 33
77,5 34
87,5 12
97,5 3
107,5 3
117,5 2
127,5 1
137,5 0

POLIGONO DE FRECUENCIA
40
35
30
25
20
15
10
5
0
27.5 37.5 47.5 57.5 67.5 77.5 87.5 97.5 107.5 117.5 127.5 137.5
HISTOGRAMA
40
27.5
35
37.5
30
25 47.5

20 57.5
15 67.5
10 77.5
5
87.5
0
27.5 37.5 47.5 57.5 67.5 77.5 87.5 97.5 107.5117.5127.5137.5 97.5

Esta tabla muestra los estadísticos de resumen para velocidad. Incluye medidas de tendencia
central, medidas de variabilidad y medidas de forma. De particular interés aquí son el sesgo
estandarizado y la curtosis estandarizada, las cuales pueden utilizarse para determinar si la
muestra proviene de una distribución normal. Valores de estos estadísticos fuera del rango
de -2 a +2 indican desviaciones significativas de la normalidad, lo que tendería a invalidar
cualquier prueba estadística con referencia a la desviación estándar. En este caso, el valor de
sesgo estandarizado no se encuentra dentro del rango esperado para datos provenientes de
una distribución normal. El valor de curtosis estandarizada no se encuentra dentro del rango
esperado para datos provenientes de una distribución normal.
Conclusiones
Referencias Bibliograficas

 http://blade1.uniquindio.edu.co/uniquindio/facultades/humanas/cinfo/uniquind
io/assets/documentos/4/06_estadistica.pdf
 Montero, J. M. (2007). Características de Una Distribución de Frecuencias.
Statistical Descriptive. Cengage Learning Paraninfo, S.A. Página 4 – 10
Recuperado
de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052900008&v=2.1&u=unad
&it=r&p=GVRL&sw=w&asid=84a84913a25d9dfd21d0a0d3deb41dea
 Matus, R., Hernández, Martha, and García, E (2010). Estadística. México, D.F.,
MX: Instituto Politécnico Nacional, (2010). ProQuest ebrary. Recuperado de:
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=1&docID=1
0365616&tm=1489456296586
 García, J.E (2005).Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo.
Página 26 -51 Recuperado
de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052300007&v=2.1&u=unad
&it=r&p=GVRL&sw=w&asid=03f8699ec7ccf10e8745c0ceb7b85bf1

S-ar putea să vă placă și