Documente Academic
Documente Profesional
Documente Cultură
ESTADÍSTICA
DESCRIPTIVA
TRANSVERSAL
Estadística Descriptiva
© Corporación Universitaria
2 Remington
Segunda edición
2018
Estadística Descriptiva
Pablo Emilio Botero Tobón
Facultad de Ciencias Básicas e Ingeniería
Editorial Uniremington
Medellín, Colombia
Derechos Reservados ©2011
Responsables
Jorge Mauricio Sepúlveda Castaño
Decana de la Facultad de Ciencias Básicas e Ingeniería
jsepulveda@uniremington.edu.co
Edición y Montaje
Vicerrectoría de Educación a Distancia y Virtual
Equipo de diseño gráfico
www.uniremington.edu.co
virtual@uniremington.edu.co
3 TABLA DE CONTENIDO
Pág.
3.3 TEMA 2 CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS CUANTITATIVOS AGRUPADOS
4 EN INTERVALOS DE CLASE 85
3.3.1 EJERCICIO DE APRENDIZAJE 89
3.4 TEMA 3 MEDIDAS DE POSICIÓN RELATIVA PARA DATOS CUANTITATIVOS AGRUPADOS EN INTERVALOS
DE CLASE 90
3.4.1 EJERCICIO DE APRENDIZAJE: 91
3.4.2 EJERCICIO DE APRENDIZAJE: 93
3.4.3 EJERCICIO DE APRENDIZAJE 94
3.4.4 EJERCICIOS DE ENTRENAMIENTO 95
4 GLOSARIO 113
5 BIBLIOGRAFÍA 114
Estadística Descriptiva
5 PROPÓSITO GENERAL
ESTADÍSTICA
DESCRIPTIVA
La estadística es la ciencia de los datos, por tanto, cuando se aplica el método estadístico, se recolectan, se
sintetizan, se organizan, se analizan y se interpretan los datos.
En todas las profesiones se necesita información, para poder avanzar y cualificar los procesos, por lo tanto,
necesita recoger, organizar, analizar y presentar datos con el fin de tomar decisiones que favorezcan este
desarrollo profesional; esta herramienta se la proporciona la Estadística Descriptiva, de la cual se realizará un
amplio detalle a través de este módulo que le presenta la Corporación Universitaria Remington.
La estadística descriptiva se encarga de describir los datos por medio de tablas, gráficos y medidas; en este
módulo se explicará cómo lograrlo. Se pretende que el estudiante, aplicando paulatinamente cada paso que
se explica, lo logre.
Para alcanzar el propósito del módulo, éste se ha diseñado de forma innovadora: se estudiarán métodos de
organización, análisis y presentación de un conjunto de datos asociados a una situación problémica por medio
del modelo de representación estadístico y aprenderá a caracterizar un conjunto de datos, a partir de
mediciones estadísticas, para obtener conclusiones que sirvan de apoyo en la toma de decisiones.
En la primera parte se definen los conceptos generales que se requieren en estadística, las unidades
se han dividido de acuerdo con los tipos de datos, a saber: datos cualitativos, datos cuantitativos
ordenados en fila y datos cuantitativos agrupados en intervalos explicando como:
Se pueden identificar.
Se pueden recolectar,
Se pueden organizar,
Se pueden describir por medio de tablas gráficos y medidas
Una vez determinados estos elementos se puedan obtener conclusiones, que permitan tomar decisiones
acertadas y que beneficien los procesos en los cuales se está realizando el estudio estadístico.
El módulo está construido con un lenguaje sencillo y con ejercicios aplicados a la cotidianidad y a situaciones
prácticas, coherentes a los planes de estudio de las asignaturas que lo contemplan en su desarrollo académico,
con el fin de que, en una forma pedagógica, aprenda y logre los objetivos propuestos en el mismo.
Estadística y Probabilística
6
ESTADÍSTICA
DESCRIPTIVA
OBJETIVO GENERAL
Al finalizar el módulo el estudiante estará en capacidad de:
OBJETIVOS ESPECÍFICOS
Explicar los conceptos generales de la estadística, analizando datos
cualitativos y describiendo por medio de tablas, gráficas y medidas los datos
ordenados en fila.
Analizar datos cuantitativos agrupados en intervalos de clase.
Definir los conceptos fundamentales de los modelos de representación de
procesos propuestos por la estadística y su aplicabilidad.
CONCEPTO DEFINICIÓN
ESTADÍSTICA INFERENCIAL “Se puede definir como aquellos métodos que hacen
posible la estimación de la población o la toma de una
decisión referente a una población, basándose sólo en los
resultados de una muestra” (Berenson y Levine, 1996, p.3).
Es la rama de la estadística que trata de los procesos y
Estadística Descriptiva
Deporte favorito
Comida preferida.
Número de acciones
vendidas cada día en la
Bolsa.
Temperaturas
registradas cada hora
en un observatorio.
Período de duración de
un automóvil.
El diámetro de las
ruedas de varios
coches.
Número de hijos de 50
familias.
Número de alumnos de
curso.
Estadística Descriptiva
TIPS
Recuerde que: Como que como se ha citado anteriormente la
Estadística trata sobre el recuento, ordenación y clasificación de
los datos obtenidos por las observaciones, para poder hacer
comparaciones y sacar conclusiones.
Se entiende por redondear un número, reducir el número de cifras del mismo, consiguiendo un
valor parecido, pero que se nos haga más fácil de utilizar en los procesos a desarrollar.
Por ejemplo: si se tiene el número 52, pero se están analizando los múltiplos de número 10, por
facilidad aproximaríamos dicho número a 50, que es el múltiplo más próximo, pero si el número
fuese 57 lo aproximaríamos a 60 que es el más cercano.
Número y condición de
Redondeo Razón
redondeo
Número y condición de
Redondeo Razón
redondeo
Nota: Si el número empieza por ceros, estos no se cuentan, estos ceros indican
únicamente lo pequeño que es el número.
Estadística Descriptiva
17
Número y condición de
Redondeo Razón
redondeo
Cuando se hace la estadística descriptiva se debe dar una información general sobre la
investigación que se hizo. Esta información contiene:
Entre las familias de Medellín se eligieron aleatoriamente 5.000 con el fin de investigar el
número de hijos por familia.
En la Corporación Universitaria Remington, sede Medellín, se realizó una encuesta entre 300
estudiantes, con el fin de conocer el medio de transporte utilizado en sus desplazamientos
hacia la universidad, en metro, en carro particular, en bus de servicio público o en otro
medio diferente a los mencionados, para determinar cuál de ellos era el más utilizado y
proponer alternativas diferentes de movilización, para favorecer la llegada a tiempo a sus
horas de clase
Muestra 300estudiantes
Enunciado:
Población
Muestra
Descripción de la variable
Tipo de variable
Enunciado:
Población
Muestra
Descripción de la variable
Tipo de variable
Enunciado:
Estadística Descriptiva
21 Población
Muestra
Descripción de la variable
Tipo de variable
TIPS
Recuerde que: La correcta redacción de la ficha técnica es
importante para garantizar la satisfacción del consumidor,
especialmente en los casos donde la incorrecta utilización de un
producto puede resultar en daños personales o materiales o
responsabilidades civiles o penales.
ELEMENTO DEFINICIÓN
𝒇𝒂𝒊
𝒇𝒓𝒊 =
𝒏 𝒐 𝑵
Frecuencia Relativa
𝒇𝒓𝒊 𝒐 𝒉𝒊
𝒏𝒊
𝒉𝒊 =
𝒏 𝒐 𝑵
23 TIPS
Recuerde que: Una distribución de frecuencia: es la agrupación
de datos en categorías mutuamente excluyentes que indica el
número de observaciones en cada categoría.
B R R R R R B B B
B R M M M R B B B
B M R R R R B R R
R R B M M M R R R
R R B M B R R R R
Dónde:
B: Bueno
R: Regular
M: Malo
Estadística Descriptiva
24
Nota: Esto indica que el primer contador dijo que el paquete era bueno, el segundo,
regular y así sucesivamente, el último dijo que era regular. Como tenemos 45
resultados este fue el total de contadores encuestados, además como nos dicen que
se escogiera aleatoriamente, es una muestra.
𝟏𝟑 𝟎. 𝟐𝟖𝟗 × 𝟏𝟎𝟎
𝑩𝒖𝒆𝒏𝒐 𝟏𝟑 𝟒𝟓
= 𝟎. 𝟐𝟖𝟖𝟖.. *𝟐𝟖. 𝟗%
𝟐𝟒
𝑹𝒆𝒈𝒖𝒍𝒂𝒓 𝟐𝟒 𝟒𝟓 𝟎. 𝟓𝟑𝟑 × 𝟏𝟎𝟎
= 𝟎. 𝟓𝟑𝟑𝟑..
Estadística Descriptiva
25 ∗ 𝟓𝟑. 𝟑%
𝟖 𝟎. 𝟏𝟕𝟖 × 𝟏𝟎𝟎
𝑴𝒂𝒍𝒐 𝟖 𝟒𝟓
= 𝟎. 𝟏𝟕𝟕𝟕 … ∗ 𝟏𝟕. 𝟖%
𝑻𝒐𝒕𝒂𝒍 𝒏 = 𝟒𝟓 𝟏 𝟏𝟎𝟎%
13 El paquete es bueno.
24 El paquete es regular.
8 El paquete es malo.
Estadística Descriptiva
b) Frecuencia relativa:
26
El grupo de contadores evaluó el paquete de nómina de la siguiente forma:
Una vez construida la tabla de frecuencias, estas se pueden representar mediante distintos
gráficos el estudio estadístico realizado. Entre los gráficos más utilizado podemos destacar:
a) Diagrama de Barras
Son dos ejes perpendiculares y una barra o un rectángulo para cada uno de los valores de la
variable. Por lo general, en el eje horizontal (eje x del plano cartesiano) se colocan los valores de
la variable y el otro eje (eje y del plano cartesiano), se gradúa de acuerdo al valor de las
frecuencias.
En este diagrama se dibuja una barra o un rectángulo por cada uno de los valores de la variable
con una altura igual a la respectiva frecuencia, de la siguiente forma:
Estadística Descriptiva
b) Histograma
Es un caso particular del diagrama de barras para variables continuas; en la representación gráfica
los rectángulos aparecen pegados y de igual base (ver gráfica) si los intervalos son iguales (tienen
la misma amplitud); en caso de que la amplitud no sea igual para todos los intervalos, se debe
hacer coincidir el área del rectángulo con la frecuencia de cada uno de los intervalos
determinados en el problema.
c) Polígono de frecuencias
Son dos ejes perpendiculares, en el eje horizontal se colocan los valores de la variable y en el eje
vertical el valor de las frecuencias.
Se determina un par ordenado que tiene como primera coordenada el valor de la variable y como
segunda coordenada el valor de la frecuencia, esto es en forma general:
Estadística Descriptiva
𝑷 (𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆, 𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂),, luego se unen estos puntos y se obtiene una Línea Poligonal que
28 corresponde a la representación buscada.
Nótese que la línea poligonal une el centro de cada uno de los lados de los rectángulos, cada uno
de esos puntos corresponde a un par ordenado.
Es un diagrama que se utiliza para expresar los porcentajes, cada sector del gráfico indica la
categoría y es proporcional a su porcentaje.
Estadística Descriptiva
29
Nota: Todo gráfico estadístico debe tener un título, relacionado con lo que se está
investigando.
30
EVALUACIÓN DE UN PAQUETE DE
NÓMINA
número de contadores
30
25
20
15
10
5
0
BUENO REGULAR MALO
Evaluación
MALO
evaluación
REGULAR
BUENO
0 5 10 15 20 25 30
número de contadores
32
EVALUACIÓN DE UN PAQUETE DE
NÓMINA
MALO
BUENO
18%
29%
REGULAR
53%
Nota: Siempre se debe seleccionar uno de los gráficos de acuerdo con lo que se quiere
mostrar, cantidad o porcentaje.
CONCLUSIONES:
De acuerdo a los resultados obtenidos, el paquete no tuvo la acogida y resultados que se
esperaban entre los contadores, por lo tanto, la empresa productora del software debe
reformarlo basándose en las exigencias de los contadores.
Estadística Descriptiva
1) DATOS CUALITATIVOS
34
Para cada uno de los ejercicios planteados a continuación:
a) La compañía “los Dulces” desea lanzar al mercado una nueva chocolatina. Por tal razón realizó
una encuesta entre los niños de las escuelas de Medellín para evaluar el producto y seleccionó
una muestra al azar con los siguientes resultados (en miles):
𝒙𝒊 𝒇𝒂𝒊
Bueno 321
Regular 105
Malo 195
b) Entre las amas de casa de Medellín se elaboró una encuesta con el fin de investigar la
efectividad de un detergente. Para tal fin se seleccionó una muestra al azar con los siguientes
resultados (en miles):
𝒙𝒊 𝒇𝒂𝒊
Excelente 225
Bueno 104
Estadística Descriptiva
35 Regular 291
Malo 120
c) Se realizó una encuesta entre los visitantes al Éxito de San Antonio en diciembre de 2002
para seleccionar entre 4 artículos: A1, A2, A3, A4 el de mejor calidad. se seleccionó una muestra
al azar con los siguientes resultados (en miles):
𝒙𝒊 𝒇𝒂𝒊
𝑨𝟏 25
𝑨𝟐 100
𝑨𝟑 125
𝑨𝟒 7
d) El secretario de gobierno de Medellín ordenó un informe sobre las causas de muertes violentas
ocurridas en Medellín durante el último trimestre, para tal fin seleccionó una muestra aleatoria y
los resultados fueron los siguientes:
𝒙𝒊 𝒇𝒂𝒊
𝑷𝒐𝒓 𝒂𝒄𝒄𝒊𝒅𝒆𝒏𝒕𝒆 𝒅𝒆 𝒕𝒓á𝒏𝒔𝒊𝒕𝒐 65
𝑷𝒐𝒓 𝒕𝒆𝒓𝒓𝒐𝒓𝒊𝒔𝒎𝒐 90
e) Un investigador judicial realizó un informe sobre el número de reclusos que hay en las
cárceles del Área Metropolitana discriminados por sexo, los resultados fueron los siguientes:
Estadística Descriptiva
36 𝒙𝒊 𝒇𝒂𝒊
𝑴𝒂𝒔𝒄𝒖𝒍𝒊𝒏𝒐 11.538
𝑭𝒆𝒎𝒆𝒏𝒊𝒏𝒐 8.983
f) Para cada uno de los siguientes ejercicios, tome los datos de la siguiente tabla:
2 2 2 4 4 4 4 1 1 1 1 1 3 3 1
1 1 3 4 1 1 1 1 3 3 3 4 4 4 4
1 1 1 1 1 2 2 2 4 4 4 1 1 1 1
2 2 3 3 1 1 4 4 1 1 2 3 4 4 1
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
__________________
______________________________________________________________________________
______________________________________________________________________________
Estadística Descriptiva
______________________________________________________________________________
37 __________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
__________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
__________________
5) En la institución “Despertar” el psicólogo clasificó a los niños sobre el grado de retardo mental
según el DSMIV: 1. leve, 2. moderado, 3. grave 4. Profundo. (Ver datos de la tabla)
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
__________________
1 1 2 1 1 3 1 1 2 1 2 4
Estadística Descriptiva
38 2 3 4 4 1 4 5 3 4 3 4 1
1 2 3 2 2 2 2 1 2 4 1 5
3 3 3 3 1 1 2 3 2 2 3 4 3
3 3 4 4 3 3 2 2 2 2 1 4 2
1 3 3 3 2 2 2 1 4 4 2 3 2
2 2 3 3 3 3 2 2 2 1 1 2 1
4 4 3 3 3 1 3 1 3 3 3 2 1
𝒙𝒊 𝒇𝒂𝒊
𝑬𝒙𝒄𝒆𝒍𝒆𝒏𝒕𝒆 400
𝑩𝒖𝒆𝒏𝒐 900
𝑹𝒆𝒈𝒖𝒍𝒂𝒓 225
𝑫𝒆𝒇𝒊𝒄𝒊𝒆𝒏𝒕𝒆 15
j) A los extranjeros que visitaron la embajada de Colombia en Estados Unidos durante el último
trimestre se les preguntó sobre su visita a Colombia y respondieron lo siguiente:
Estadística Descriptiva
39 𝒙𝒊 𝒇𝒂𝒊
𝑽𝒆𝒏𝒅𝒓á𝒏 257
𝑵𝒖𝒏𝒄𝒂 𝒗𝒆𝒏𝒅𝒓á𝒏 10
k) Se hizo una selección aleatoria entre los estudiantes de Corporación Universitaria Remington
y se les preguntó ¿En qué dedican su tiempo libre? y respondieron lo siguiente:
𝒙𝒊 𝒇𝒂𝒊
𝑰𝒓 𝒂𝒄𝒊𝒏𝒆 159
𝑰𝒓 𝒂 𝒅𝒊𝒔𝒄𝒐𝒕𝒆𝒄𝒂 98
𝑳𝒆𝒆𝒓 105
l) Dado el siguiente diagrama de sectores, responda: Verdadero (V) o Falso (F), según sea el
caso, justificando la respuesta
Estadística Descriptiva
7%
14% 28%
Administración
Contaduría
Sistemas
Secretariado
18% Psicología
33%
m) Como ejercicio final realiza una investigación estadística, sobre datos cualitativos en tu
41 medio; ya sea tu lugar de trabajo, tu ciudad o tu familia y realiza todo el proceso: tablas, gráficos
y conclusiones o decisiones finales. (Recuerde los pasos a seguir para desarrollar esta actividad)
Estadística Descriptiva
44 1 3 8 5 3 5 4 5 5 5
4 6 5 5 2 6 6 7 4 1
3 5 1 5 6 4 5 1 4 8
5 8 5 4 5 6 6 3 8 5
5 6 5 1 3 4 5 5 6 5
3 7 2 3 5 2 5 3 2 4
Enunciado: El jefe de personal de la compañía “Aceros S.A.” preocupado por las llegadas tarde
de sus empleados, seleccionó una muestra aleatoria entre los empleados que han llegado
tarde al trabajo durante los últimos cuatro meses y anotó el número de llegadas tarde de cada
uno de dichos empleados y los resultados fueron los siguientes:
1 5 5 5 𝟖, 𝟑 0,083 𝟖, 𝟑
= 0,083
60
2 4 5+4=9 4 𝟔, 𝟕 0,150 𝟏𝟓
= 0,067
60
𝒏 = 𝟔𝟎 ∑=1 ∑ = 100
Como los datos fueron organizados de menor a mayor, entonces siempre el primer dato será el
menor y el último dato será el mayor; además recuerde que los datos siempre están en 𝒙𝒊 y
que la frecuencia absoluta indica el número de veces que se presenta el dato.
DATO CARACTERÍSTICA
Estadística Descriptiva
25 21
20
empleados
número de
15
8 8 8
10 5 4 4
5 2
0
`1 2 `3 `4 `5 `6 `7 `8
número de llegadas tarde
Estadística Descriptiva
48 TIPS
La Ficha Técnica
Interprete dato: mayor, menor, más frecuente y menos frecuente.
Elabore el diagrama de barras e interprételo.
12 10 10 8 4 3 0 2 1 12
12 11 9 2 6 4 8 0 7 11
5 9 9 3 7 6 9 0 8 8
4 10 9 7 8 7 9 1 7 8
6 10 4 8 11 10 7 12 9 8
2) En la feria Expo - navidad del año pasado se realizó un estudio sobre lo que los visitantes tenían
disponible para gastar en regalos navideños. Se seleccionó una muestra al azar con los siguientes
resultados: (el dinero disponible está dado en miles):
Estadística Descriptiva
49 𝒙𝒊 𝒇𝒂𝒊
50 10
200 25
400 15
600 10
800 8
1000 8
1500 2
2500 3
Esta referencia está dada por unos elementos estadísticos denominados Medidas de Tendencia Central,
las cuales nos permiten una interpretación de los datos obtenidos en cualquier medición que se realice.
Sirve como un método para comparar cualquier puntaje, con el puntaje central o típico.
50
Sirve como un método para comparar el puntaje obtenido por una misma persona, obtenido
en dos o más ocasiones.
Sirve como método para comparar los resultados medios obtenidos por dos o más grupos.
Estas medidas centralizan los datos y dan información sobre la parte de la distribución hacia
donde se están agrupando los datos
Nota: Las medidas de tendencia central más importantes son: Media aritmética, la
moda y la mediana.
“Es la medida más conocida, más fácil de calcular y con la que siempre estamos más
familiarizados” (Martínez Bencardino, C. 2004, p. 74) Es el promedio de los datos y se representa:
51
La media aritmética se obtiene sumando todos los valores y dividiendo
esa suma por el número de valores de la medición.
̅=
𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝒏
𝝁 𝒐𝑿
𝑵 𝒐 𝒏
Ejemplo 1: Un estudiante obtuvo las siguientes notas en matemáticas 4.3, 2.5, 3.3, 4.2, 3.1, 2.9 y
quiere conocer el promedio (Media Aritmética) de las mismas:
Ejemplo 2: A continuación, se dan los valores de las boletas para las diferentes tribunas del
estadio Atanasio Girardot de Medellín:
Solución: Para conocer el promedio del valor de la boleta se aplica el concepto de la media
aritmética, esto es:
Estadística Descriptiva
∑𝒏
𝟏 𝒙𝒊 𝒇𝒂
̅=
𝝁 𝒐𝑿 𝒊
𝑵 𝒐 𝒏
Estadística Descriptiva
𝒙𝒊 𝒇𝒂𝒊 𝒙𝒊 ∗ 𝒇𝒂𝒊
1 6 6
2 5 10
3 7 21
4 9 36
5 13 65
6 12 72
7 8 56
8 4 32
9 8 72
10 10 100
𝒏 = 𝟖𝟐 ∑ 𝟒𝟕𝟎
𝟒𝟕𝟎
̅=
𝑿 = 𝟓, 𝟕𝟑𝟏
𝟖𝟐
El promedio (la media aritmética) para el problema anterior es 𝟓, 𝟕𝟑𝟏
La media aritmética, de un conjunto de datos, es única es decir, sólo existe una media
3. aritmética.
Estadística Descriptiva
54 4.
Cuando se tienen valores extremos (es decir, muy altos o muy bajos) la media
aritmética no puede tomarse como representativa de los datos.
LA MODA (Mo)
“Es el valor que ocurre con mayor frecuencia; es decir, el valor más frecuente” (Spiegel, M. R.,
1995).
Características de la Moda
1 Existen distribuciones que tienen varias modas, esto es: Bimodal cuando tiene dos
modas, si tiene más de dos, se llama Multimodal.
3 En el gráfico de barras verticales la moda se identifica como la barra más alta y su valor
se ubica en el eje 𝑿.
La Mediana (𝑴𝒆 )
Es aquel valor de la serie de datos que se ubica exactamente en la mitad (en el centro) de los
mismos.
Estadística Descriptiva
También se puede decir que es el valor que ocupa el lugar central de todos los datos, cuando
55
éstos están ordenados de menor a mayor.
Características de la Mediana
Cálculo de la Mediana
1. Para calcular la Mediana se tienen que ordenar los datos de menor a mayor.
2. Si el ordenamiento tiene un número impar de datos, la mediana está dada por el dato
central de la misma, esto es:
1
3
5
6
7
8
9
Estadística Descriptiva
56 11
12
13
14
Como el número de datos es impar (11), la mediana sería entonces el dato del centro, esto es:
𝑴𝒆 = 𝟖
Si el ordenamiento tiene un número par de datos, la mediana está dada por la media
aritmética entre los dos datos centrales, esto es:
1
3
5
6
7
9
11
12
13
14
17
18
20
21
Estadística Descriptiva
Quedan, exactamente, 6 valores por encima de 11 y 12, (1,3,5,6,7,9) y 6 valores por debajo
57
(13,14,17,18,20,21) , por lo tanto, la Mediana sería:
𝟏𝟏 + 𝟏𝟐 𝟐𝟑
𝑴𝒆 = = = 𝟏𝟏. 𝟓
𝟐 𝟐
Como conclusión: Cuando se tiene la distribución de frecuencias para ubicar la mediana se
procede así:
𝒏+𝟏
Si el número de datos ( 𝒏 𝒐 𝑵) es par, se calcula y se busca la Frecuencia Absoluta
𝟐
Acumulada (𝒇𝒂𝒂 ), el correspondiente 𝒙𝒊 , es la Mediana (Me).
2.3.2 EJEMPLOS
1. Dada la siguiente tabla ordenada de datos, calcular la Mediana:
𝒙𝒊 𝒇𝒂𝒊 𝒇𝒂𝒂𝒊
𝟑. 𝟖 𝟏 𝟏
𝟒. 𝟎 𝟏 𝟐
𝟒. 𝟓 𝟑 𝟓
𝑵=𝟓
𝟓+𝟏
𝑴𝒆 = =𝟑
𝟐
Corresponde al tercer dato que es 𝟒. 𝟓
Estadística Descriptiva
𝒏
58 Si el número de datos ( 𝒏 𝒐 𝑵) es par, se calcula y su consecutivo, se buscan en la
𝟐
Frecuencia Absoluta Acumulada (𝒇𝒂𝒂 ) y el promedio (Media Aritmética) de los
correspondientes datos (𝒙𝒊 ), es la Mediana (Me).
𝒙𝒊 𝒇𝒂𝒊 𝒇𝒂𝒂𝒊
𝟑. 𝟖 𝟐 𝟐
𝟒. 𝟎 𝟏 𝟑
𝟒. 𝟓 𝟑 𝟔
𝑵=𝟔
𝟔
𝑴𝒆 = 𝟐 = 𝟑 que corresponde a 4.0 y su consecutivo que es el 4 y corresponde a 𝟒. 𝟓,
por lo tanto la Mediana sería:
𝟒. 𝟎 + 𝟒. 𝟓
𝑴𝒆 = = 𝟒. 𝟑
𝟐
Recuerde que son seis datos y ordenados de menor a mayor y con su respectiva
frecuencia se tiene:
Estadística Descriptiva
59 1 2 3 4 5 6
Nota:
Recuerde que, para solucionar estos ejercicios, se deben ordenar los datos de menor a mayor.
Revise los ejercicios de aprendizaje resueltos en el desarrollo del tema.
1. La profesora de estadística realizó una prueba a un grupo de alumnos que constaba de 12
puntos. Eligió una muestra al azar y los resultados del número de respuestas acertadas fueron
los siguientes:
12 10 10 8 4 3 0 1 12 2
12 11 9 2 6 4 8 0 7 11
5 9 9 3 7 6 90 0 8 8
4 10 9 7 8 7 9 1 7 8
6 10 4 8 11 10 7 12 9 8
2. En la feria Expo - navidad del año pasado se realizó un estudio sobre lo que los visitantes
tenían disponible para gastar en regalos navideños. Se seleccionó una muestra al azar con los
siguientes resultados: (el dinero disponible está dado en miles)
Estadística Descriptiva
60 𝒙𝒊 𝒇𝒂𝒊
50 3
200 4
400 10
600 9
800 8
1000 8
1500 7
1600 4
2000 11
3. Se seleccionó una muestra aleatoria entre los habitantes de la tercera edad que viven en el
Área Metropolitana y se clasificaron de acuerdo con su estatura, los siguientes son los datos:
1,45 6
1,50 10
1,55 10
1,60 18
Estadística Descriptiva
61 1,65 18
1,70 12
1,75 10
1,80 7
1,85 3
1,90 1
4. Termine la tabla y responda verdadero (V) o falso (f), de acuerdo a la distribución anterior, las
siguientes preguntas, justificando debidamente su respuesta:
Pregunta V F Justificación
b) 1,60
c) 1,638
b) 1,90
c) 1,60 y 1,65
b) 1,70
c) 1,65
Estadística Descriptiva
63 TIPS
Recuerde que: Las medidas de Tendencia central, nos permiten
una interpretación de los datos obtenidos en cualquier medición
que se realice.
Para encontrar la media, la moda y la mediana, se deben ordenar
los datos de menor a mayor.
Estadística Descriptiva
Para agrupar los datos en intervalos existen varios métodos, entre ellos tenemos, el siguiente:
Li , Ls .
Estadística Descriptiva
Li , Ls
Para utilizar este método se debe realizar el siguiente procedimiento:
𝐾 = 1 + 3.3 × log 𝑛
Dónde:
𝑲: 𝑵ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐𝒔
𝒏: 𝑵ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒅𝒂𝒕𝒐𝒔
3. Se calcula la Amplitud (𝑨: es la misma para todos los intervalos) de cada uno de los
intervalos mediante la ecuación:
Estadística Descriptiva
67 𝑅
𝐴=
𝐾
Dónde:
𝑹: 𝑹𝒂𝒏𝒈𝒐
𝑲: 𝑵ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐𝒔
Nota: La Amplitud (A) se debe subir un poco (así el resultado sea entero). Es un error
dejar la amplitud igual, ya que esto ocasiona que el dato mayor quede por fuera del
último intervalo.
𝑳𝒊 = 𝑫𝒂𝒕𝒐 𝑴𝒆𝒏𝒐𝒓
b. El límite derecho o límite superior de cualquier intervalo es igual al límite izquierdo del
mismo intervalo más la amplitud.
𝑳𝒔 = 𝑳𝒊 + 𝑨𝒎𝒑𝒍𝒊𝒕𝒖𝒅
Estadística Descriptiva
68 Nota: Los intervalos son abiertos a derecha. Quiere decir que el límite derecho de un
intervalo se cuenta en el intervalo que se encuentra exactamente debajo de dicho
intervalo.
𝑳𝒊 = 𝑳𝒔 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 𝒂𝒏𝒕𝒆𝒓𝒊𝒐𝒓
Es un valor que identifica a cada intervalo “es el punto medio de cada intervalo”, está dada
por la siguiente ecuación:
𝑳 𝒊 + 𝑳𝒔
𝒙𝒊 =
𝟐
(Berenson, M. L. Y LEVINE, D. M., 1996, p. 38).
69 25 36 40 45 48 32 17 22 18 20
21 44 46 19 19 26 24 28 29 31
39 36 35 33 32 34 41 42 31 30
20 45 43 23 22 21 38 34 37 43
19 20 23 25 22 25 27 24 19 18
20 21 22 25 24 27 29 19 23 21
CONCEPTO CARACTERÍSTICA
Estudiantes de Administración de
Población
UNIREMINGTON.
b. PROCEDIMIENTO
70
Se realiza de acuerdo a los pasos indicados en la definición de conceptos, esto es:
Reemplazando, se tiene:
𝑹 = 𝟒𝟖 − 𝟏𝟕 = 𝟑𝟏
𝑹 = 𝟑𝟏
𝐾 = 1 + 3.3 × log 𝑛
Reemplazando, se tiene:
𝑲 = 𝟏 + 𝟑. 𝟑 × 𝐥𝐨𝐠 𝒏 → 𝑲 = 𝟏 + 𝟑. 𝟑 × 𝐥𝐨𝐠 𝟔𝟎 →
𝑲 = 6,868, utilizando el concepto de redondeo (ver unidad 1) a números enteros, se tiene que:
𝑲 = 𝟕.
𝑅
𝐴=
𝐾
Reemplazando, se tiene:
31
𝐴= = 4,428
7
Estadística Descriptiva
Por norma (determinada en la definición del concepto) se sube un poco la amplitud, por lo tanto:
71
𝑨 = 𝟒, 𝟓
𝑳𝒊 = 𝑫𝒂𝒕𝒐 𝑴𝒆𝒏𝒐𝒓
Reemplazando, se tiene:
𝑳𝒊 = 𝟏𝟕
Para determinar el primer límite superior, se tiene que todo el intervalo tiene la misma
amplitud, por lo tanto:
Para el primer intervalo, se tiene entonces que: los datos son mayores o iguales que 17 y menores
que 21,5: en total se encontraron 16 datos con esta característica, siendo esta la primera
Frecuencia Absoluta.
Para calcular el segundo límite superior se aplica la fórmula 𝑳𝒔 = 𝑳𝒊 + 𝑨, se tiene entonces que el
segundo intervalo tiene como límite inferior 21,5 y como límite superior, 𝑳𝒔 = 𝟐𝟏, 𝟓 + 𝟒, 𝟓 = 𝟐𝟔,
se encontraron 14 datos que cumplen esta característica siendo esta será la segunda frecuencia
absoluta.
Estadística Descriptiva
72
Nota: Este procedimiento se repite tantas veces sea necesario, hasta que queden
incluidos todos los datos del programa.
25 36 40 45 48 32 17 22 18 20
21 44 46 19 19 26 24 28 29 31
39 36 35 33 32 34 41 42 31 30
20 45 43 23 22 21 38 34 37 43
19 20 23 25 22 25 27 24 19 18
20 21 22 25 24 27 29 19 23 21
𝑳𝒊 𝑳𝒔 Conteo
17 21,5 Corresponde a las celdas llenas con el color rojo (16)
21,5 26 Corresponde a las celdas llenas con color azul (14)
26 30,5 Corresponde a las celdas llenas con color verde (6)
30,5 35 Corresponde a las celdas sin llenar (8)
35 39,5 Corresponde a las celdas llenas con color amarillos (6)
39,5 44 Corresponde a las celdas llenas con azul obscuro (5)
44 48,5 Corresponde a las celdas llenas con púrpura (5)
Estadística Descriptiva
𝑵 = 𝟔𝟎 ∑ = 1 ∑ = 100
𝑳𝒊 𝑳𝒔 𝑳𝒊 ≤ 𝑿 < 𝑳𝒔,
17 21,5 [𝟏𝟕, 𝟐𝟏, 𝟓)
21,5 26 [𝟐𝟏, 𝟓, 𝟐𝟔)
26 30,5 [𝟐𝟔, 𝟑𝟎. 𝟓)
30,5 35 [𝟑𝟎, 𝟓, 𝟑𝟓)
35 39,5 [𝟑𝟓, 𝟑𝟗, 𝟓)
49,5 44 [𝟑𝟗, 𝟓, 𝟒𝟒)
44 48,5 [𝟒𝟒, 𝟒𝟖, 𝟓)
Donde:
Estadística Descriptiva
Ejercicio 2: Los siguientes son los sueldos de los tecnólogos de Medellín de acuerdo con una
muestra elegida aleatoriamente (en miles de pesos).
Nota: En este caso ya están los datos agrupados, por tanto, no hay que aplicar los pasos para
calcular los intervalos, simplemente se complementa la tabla.
𝑳𝒊 𝑳𝒔 𝑳𝒊 ≤ 𝑿 < 𝑳𝒔, 𝒇𝒂
400 600 [𝟒𝟎𝟎, 𝟔𝟎𝟎) 30
600 800 [𝟔𝟎𝟎, 𝟖𝟎𝟎) 100
800 1000 [𝟖𝟎𝟎, 𝟏𝟎𝟎𝟎) 55
1000 1200 [𝟏𝟎𝟎𝟎, 𝟏𝟐𝟎𝟎) 240
1200 1400 [𝟏𝟐𝟎𝟎, 𝟏𝟒𝟎𝟎) 25
1400 1600 [𝟏𝟒𝟎𝟎, 𝟏𝟔𝟎𝟎) 20
𝒏 = 𝟒𝟕𝟎 ∑ = 1 ∑ = 1 00
Ejercicio 3. De la producción mensual en una fábrica de pilas para reloj, se tomó al azar 50
pilas sometiéndolas a un test de laboratorio para estimar el tiempo de duración (vida útil), en
horas, de cada pila. Los resultados obtenidos son los siguientes. Elabore la tabla de frecuencias
agrupando los datos.
302 315 420 460 530 590 306 580 470 310
372 570 348 417 440 483 455 322 417 560
483 405 430 452 570 360 390 422 511 558
595 506 580 333 310 572 590 533 479 394
355 346 520 511 466 480 490 547 383 555
SOLUCIÓN
302 315 420 460 530 590 306 580 470 310
372 570 348 417 440 483 455 322 417 560
483 405 430 452 570 360 390 422 511 558
Estadística Descriptiva
76 595 506 580 333 310 572 590 533 479 394
355 346 520 511 466 480 490 547 383 555
R 293
Amplitud. A 41,857... A 41,9 La amplitud siempre se debe subir un
k 7
poquito.
La secuencia para determinar los demás límites de la distribución es la misma que para los
intervalos uno y dos, hasta completar los 7 intervalos, como se puede ver a continuación en la
siguiente tabla borrador.
Número de Límite
Límite inferior
intervalos superior
1 302 302 + 41,9 = 343,9
Estadística Descriptiva
Conteo. Para realizar el conteo recomendable utilizar colores en la tabla dónde se registró la
información y tomar una tabla con los intervalos.
302 315 420 460 530 590 306 580 470 310
372 570 348 417 440 483 455 322 417 560
483 405 430 452 570 360 390 422 511 558
595 506 580 333 310 572 590 533 479 394
355 346 520 511 466 480 490 547 383 555
TIEMPO (HORAS)
79
EL HISTOGRAMA: “Son diagramas de barras verticales en los que se construyen barras
rectangulares en los límites de cada clase”.
𝑳 𝒊 + 𝑳𝒔
𝒙𝒊 =
𝟐
(Berenson, M. L. Y LEVINE, D. M., 1996, p. 38).
POLÍGONO: “Se puede obtener uniendo cada punto medio (marca de clase) de los
rectángulos del histograma con líneas rectas, teniendo cuidado de agregar al inicio y
al final marcas de clase adicionales, con el objeto de asegurar la igualdad del área”.
http://sitios.ingenieriausac.edu.gt/estadistica/estadistica2/estadisticadescriptiva.html
Estadística Descriptiva
60
PORCENTAJE DE
50
INGENIEROS
40
30
20
10
0
`500 `700 `900 `1100 ´1300 `1500 `1700
SUELDOS (en miles de $)
Este modelo de población presenta la característica que la moda, el promedio y la mediana tienen
igual valor o son aproximadamente iguales. Presenta muchas aplicaciones en la inferencia
estadística, ya que en la práctica hay muchas poblaciones que presentan un comportamiento de
población con distribución normal. La forma de una distribución normal es la siguiente:
CURVA NORMAL
82
M0 Me x
Se presenta cuando la media aritmética es menor que la mediana y que la moda. En esta curva
la cola más larga se encuentra a la izquierda.
Su forma la podemos ver en el gráfico:
Mo M e x
Cuando se presenta este modelo en participación en el mercado, o en producción, o en ventas;
es bueno, quiere decir que la mayoría de ventas o de utilidades superan el promedio.
Estadística Descriptiva
En este modelo la cola más larga está a la derecha. Su forma es la mostrada en la figura.
M0 Me x
OJIVA: “Es el polígono de frecuencias acumuladas, es decir, que en ella se permite
ver cuántas observaciones se encuentran por encima o por debajo de ciertos valores,
en lugar de solo exhibir los números asignados a cada intervalo”.
Esta Ojiva puede ser de: frecuencias absolutas acumuladas o de porcentajes acumulados.
84
Se grafica tomando:
500
INGENIEROS
400
NÚMERO DE
300
200
100
0
`400 `600 `800 `1000 ´1200 `1400 `1600
SUELDOS (en miles de $)
Calcule e interprete: las medidas de tendencia central, las medidas de posición relativas y las
85 medidas de variabilidad.
1. En la compañía “La Delicia” se hizo un estudio sobre los sueldos, a continuación, se dan los
resultados, en miles de $.
900 500 450 1900 1200 1250 2500 550 1650 1200
1000 550 950 600 750 1300 850 350 1400 700
300 1100 300 600 1600 1500 1000 1800 900 500
650 2000 450 750 850 600 300 1950 3000 1500
TIPS
Recuerde que: Cuando, en un estadístico, se obtienen muchos
datos en la medición y la frecuencia de cada uno de los datos es
muy baja, es necesario agruparlos por clase o por categoría y
cada una de éstas distribuciones se dispondrá en un intervalo
determinado.
∑ 𝑋𝑖 ∗ 𝑓𝑎𝑖
𝑋̅ 𝑜 𝜇 =
𝑛𝑜𝑁
Para el ejemplo 1
Estadística Descriptiva
86 𝑳𝒊 𝑳𝒔 𝒇𝒂𝒊 𝒙𝒊 𝒙𝒊 ∗ 𝒇 𝒂𝒊
15 20 12 17,5 210
20 25 18 22,5 405
25 30 7 27,5 192,5
30 35 8 32,5 260
35 40 6 37,5 225
40 45 7 42,5 297,5
45 50 2 47,5 95
𝑵 = 𝟔𝟎 ∑ 𝟏𝟔𝟖𝟓
1685
𝑋̅ 𝑜 𝜇 = 60 → 𝑋̅ 𝑜 𝜇 = 28,03
El promedio (la media aritmética) de la edad en que iniciaron sus estudios en la universidad los
estudiantes de Administración de UNIREMINGTON es de 28,03 años. Para el ejemplo 2
𝑳𝒊 𝑳𝒔 𝒇𝒂𝒊 𝒙𝒊 𝒙𝒊 ∗ 𝒇 𝒂𝒊
461.000
𝑋̅ 𝑜 𝜇 = → 𝑋̅ 𝑜 𝜇 = 980,851
470
El promedio (la media aritmética) de los sueldos de los tecnólogos de Medellín es de $980.851
Estadística Descriptiva
2. La moda (𝑴𝒐 )
87
𝒅𝟏
𝑴𝒐 = 𝑳 𝒊 + ( )∗𝑨
𝒅 𝟏 + 𝒅𝟐
Done:
𝒅𝟏 = 𝒇𝒂𝒊 − 𝒇𝒂(𝒊−𝟏)
𝒅𝟐 = 𝒇𝒂𝒊 − 𝒇𝒂(𝒊+𝟏)
𝑨 = 𝑳𝒔𝒊 − 𝑳𝒍𝒊
Por lo tanto, el intervalo que contiene la Moda es el más frecuente.
El intervalo más frecuente es el rojo (ver ***) en las tablas, por lo tanto:
𝑳𝒍 = 𝟐𝟎
𝒅𝟏 = 𝟏𝟖 − 𝟏𝟐 = 𝟔
𝒅𝟐 = 𝟏𝟖 − 𝟕 = 𝟏𝟏
𝑨 = 𝟐𝟓 − 𝟐𝟎 = 𝟓
𝟔
𝑴𝒐 = 𝟐𝟎 + ( ) ∗ 𝟓 → 𝑴𝒐 = 𝟐𝟏, 𝟕𝟔𝟒
𝟔 + 𝟏𝟏
La edad en que iniciaron sus estudios en la universidad los estudiantes de Administración de
UNIREMINGTON más frecuente es de 21,764 años.
𝒅𝟏 = 𝟐𝟒𝟎 − 𝟓𝟓 = 𝟏𝟖𝟓
88
𝒅𝟐 = 𝟐𝟒𝟎 − 𝟐𝟓 = 𝟐𝟏𝟓
𝟏𝟖𝟓
𝑴𝒐 = 𝟏𝟎𝟎𝟎 + ( ) ∗ 𝟐𝟎𝟎 → 𝑴𝒐 = 𝟏𝟎𝟗𝟐, 𝟓
𝟏𝟖𝟓 + 𝟐𝟏𝟓
3. Mediana (𝑴𝒆 ):
𝒏
− 𝒇𝒂𝒂(𝒊−𝟏)
𝑴𝒆 = 𝑳𝒊 + 𝟐 ∗𝑨
𝒇𝒂𝒊
Para ubicar el intervalo que contiene la mediana se puede hacer por:
𝒏
1. y se busca en 𝒇𝒂𝒂
𝟐
Para el ejemplo 1
𝒏 𝟔𝟎
El intervalo que contiene la mediana lo ubicamos en = = 𝟑𝟎 60/2 = este valor,
𝟐 𝟐
buscando en la frecuencia absoluta acumulada, está en el 2º intervalo es el mismo de la moda,
Estadística Descriptiva
pero no siempre dan en el mismo, existen ciertas distribuciones que cumplen con esta
89 característica. Si observamos, acá está el 50% en el porcentaje acumulado. Reemplazando en la
fórmula, se tiene que:
𝒏
− 𝒇𝒂𝒂(𝒊−𝟏) 𝟑𝟎 − 𝟏𝟐
𝑴𝒆 = 𝑳𝒊 + 𝟐 ∗ 𝑨 → 𝑴𝒆 = 𝟐𝟎 + ( )∗𝟓
𝒇𝒂𝒊 𝟏𝟖
𝑴𝒆 = 𝟐𝟓
Para el ejemplo 2
𝒏
El intervalo que contiene la mediana lo ubicamos = 𝟐𝟑𝟓, este valor está en 425 en el
𝟐
mismo de la moda, no siempre dan en el mismo, existen ciertas distribuciones que cumplen con
esta característica. Si observamos, acá está el 50% en el porcentaje acumulado. Reemplazando
en la fórmula, se tiene que:
𝒏
− 𝒇𝒂𝒂(𝒊−𝟏) 𝟐𝟑𝟓 − 𝟏𝟖𝟓
𝑴𝒆 = 𝑳𝒊 + 𝟐 ∗ 𝑨 → 𝑴𝒆 = 𝟏𝟎𝟎 + ( ) ∗ 𝟐𝟎𝟎
𝒇𝒂𝒊 𝟐𝟒𝟎
𝑴𝒆 = 𝟏𝟎𝟒𝟏, 𝟔𝟔𝟕
Como está dado en miles, se multiplica por 1000, esto es:
90 𝑳𝒊 𝑳𝒔 𝒇𝒂𝒊
0 1 15
1 2 15
2 3 20
3 4 28
4 5 22
TIPS
Recuerde que: El intervalo que contiene la Moda es el más
frecuente.
Una vez definidos los conceptos básicos en el estudio de una distribución de frecuencias de una
variable, se estudiarán las distintas formas de resumir dichas distribuciones mediante medidas de
posición (o de centralización), teniendo presente el error cometido en el resumen mediante las
correspondientes medidas de dispersión.
Se trata de encontrar unas medidas que sinteticen las distribuciones de frecuencias. En vez de
manejar todos los datos sobre las variables, tarea que puede ser pesada, se puede caracterizar
su distribución de frecuencias mediante algunos valores numéricos, eligiendo como resumen de
los datos un valor central alrededor del cual se encuentran distribuidos los valores de la variable.
Tomado
de:http://www.monografias.com/trabajos14/medidasposicion/medidasposicion.shtml#ixzz3DQ
Ms8KcO
Estadística Descriptiva
Estas medidas dividen la distribución en partes iguales, así como La Mediana, por lo tanto, se
91 calculan e interpretan similar a ella. Entre estas medidas de posición relativa se tienen:
𝑸𝟏 = 𝟐𝟓%
𝑸𝟐 = 𝟓𝟎%
𝑸𝟏 = 𝟕𝟓%
𝑸𝟏 = 𝟏𝟎𝟎%
Se calcula con la siguiente ecuación:
𝒏
#𝑸 × − 𝒇𝒂𝒂(𝒊−𝟏)
𝑸 = 𝑳𝒊 + ( 𝟒 )∗𝑨
𝒇𝒂𝒊
#𝑸∗𝒏
1. y se busca en 𝒇𝒂𝒂
𝟒
2. El porcentaje respectivo se busca en el porcentaje acumulado.
𝟏∗𝟒𝟕𝟎
𝑸𝟏 = → 𝑸𝟏 = 𝟏𝟏𝟕, 𝟓, en la 𝒇𝒂𝒂𝒊 está en 130 o el 25% está acá también
𝟒
(en la tabla es el intervalo azul); Reemplazando en la fórmula, se tiene:
Estadística Descriptiva
𝟏𝟏𝟕, 𝟓 − 𝟑𝟎
92 𝑸𝟏 = 𝟔𝟎𝟎 + ( ) ∗ 𝟐𝟎𝟎 → 𝑸𝟏 = 𝟕𝟕𝟓
𝟏𝟎𝟎
Como está dado en miles de pesos: 𝟕𝟕𝟓 × 𝟏𝟎𝟎𝟎 = 𝟕𝟕𝟓. 𝟎𝟎𝟎
El 25% de los sueldos de los tecnólogos de Medellín es de $ 775.000 o menos.
𝑫𝟏 = 𝟏𝟎%
𝑫𝟐 = 𝟐𝟎%
𝑫𝟑 = 𝟑𝟎%
𝑫𝟒 = 𝟒𝟎%
⋮
𝑫𝟏𝟎 = 𝟏𝟎𝟎%
Se calcula con la siguiente ecuación:
𝒏
# 𝑫 ∗ 𝟏𝟎 − 𝒇𝒂𝒂(𝒊−𝟏)
𝑫 = 𝑳𝒊 + ( )∗𝑨
𝒇𝒂𝒊
#𝑫∗𝒏
1. y se busca en 𝒇𝒂𝒂
𝟏𝟎
2. El porcentaje respectivo se busca en el porcentaje acumulado.
Estadística Descriptiva
Se tiene que:
𝟒𝟕𝟎
𝑫𝟑 = 𝟑 ∗ → 𝑫𝟑 = 𝟏𝟒𝟏, en la 𝒇𝒂𝒂𝒊 está en 185 o el 𝟑𝟎% está acá también (En la
𝟏𝟎
tabla es el intervalo de color marrón).
𝒏
#𝑫∗ − 𝒇𝒂𝒂(𝒊−𝟏) 𝟏𝟒𝟏 − 𝟏𝟑𝟎
𝑫𝟑 = 𝑳𝒊 + ( 𝟏𝟎 ) ∗ 𝑨 = 𝟖𝟎𝟎 + ( ) ∗ 𝟐𝟎𝟎 →
𝒇𝒂𝒊 𝟓𝟓
𝑫𝟑 = 𝟖𝟒𝟎
𝑷𝟏 = 𝟏%
𝑷𝟐 = 𝟐%
𝑷𝟑 = 𝟑%
𝑷𝟒 = 𝟒%
⋮
𝑷𝟏𝟎𝟎 = 𝟏𝟎𝟎%
Se calcula con la siguiente ecuación:
Estadística Descriptiva
94 𝒏
# 𝑷 ∗ 𝟏𝟎𝟎 − 𝒇𝒂𝒂(𝒊−𝟏)
𝑷 = 𝑳𝒊 + ( )∗𝑨
𝒇𝒂𝒊
#𝑷∗𝒏
1. y se busca en 𝒇𝒂𝒂
𝟏𝟎𝟎
2. El porcentaje respectivo se busca en el porcentaje acumulado.
Se tiene que:
𝟒𝟕𝟎
𝑷𝟓 = 𝟓 ∗ → 𝑷𝟓 = 𝟐𝟑, 𝟓 En la 𝒇𝒂𝒂𝒊 está en 𝟑𝟎 𝒐 𝒆𝒍 𝟓% está acá también (En la
𝟏𝟎𝟎
tabla es el intervalo de color Fucsia).
𝟐𝟑, 𝟓 − 𝟎
𝑷𝟓 = 𝟒𝟎𝟎 + ( ) ∗ 𝟐𝟎𝟎 → 𝑷𝟓 = 𝟓𝟓𝟔, 𝟔𝟔𝟕
𝟑𝟎
Como está dado en miles de pesos:
1. Las siguientes son las notas de dos grupos de estadística de UNIREMINGTON, de una muestra
tomada al azar:
GRUPO I
𝒙𝒊 (𝒏𝒐𝒕𝒂) 𝒇𝒂𝒊 (# 𝒆𝒔𝒕𝒖𝒅𝒊𝒂𝒏𝒕𝒆𝒔)
1 4
2 11
3 10
4 5
5 12
𝑁𝑃: 𝑛𝑜 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎𝑟𝑜𝑛 𝑙𝑎 𝑝𝑟𝑢𝑒𝑏𝑎 4
GRUPO II
𝒙𝒊 (𝒏𝒐𝒕𝒂) 𝒇𝒂𝒊 (# 𝒆𝒔𝒕𝒖𝒅𝒊𝒂𝒏𝒕𝒆𝒔)
1 17
2 16
3 2
4 3
5 4
𝑁𝑃: 𝑛𝑜 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎𝑟𝑜𝑛 𝑙𝑎 𝑝𝑟𝑢𝑒𝑏𝑎 6
Estadística Descriptiva
TIPS
Recuerde que: Una vez definidos los conceptos básicos en el
estudio de una distribución de frecuencias de una variable, se
estudiarán las distintas formas de resumir dichas distribuciones
mediante medidas de posición (o de centralización), teniendo
presente el error cometido en el resumen mediante las
correspondientes medidas de dispersión.
Entre más grande sea el grado de variación, menores uniformidades tendrán los datos (sinónimo
de heterogeneidad) y por lo tanto menor representatividad o confiabilidad del promedio de
tendencia central o localización por haber sido obtenido de datos dispersos.
Por el contrario, si este valor es pequeño (respecto a la unidad de medida) entonces, hay una
gran uniformidad entre los datos. Cuando es cero quiere decir que todos los datos son iguales.
Estadística Descriptiva
Hay básicamente dos tipos de medidas de dispersión: Medidas Absolutas y Medidas Relativas.
97
Las medidas absolutas se caracterizan por ser números concretos, es decir, valores expresados
en las mismas unidades de la variable en estudio y que por lo tanto no permiten comparaciones
o análisis respecto a la mayor o menor dispersión de series expresadas en diferentes unidades.
Estas medidas son: la varianza, la desviación estándar y el rango intercuartilico.
Las medidas relativas de dispersión son valores abstractos, es decir, medidas adimensionales y
por lo tanto no expresadas en ninguna unidad específica, obviando así el inconveniente señalado
para las medidas absolutas. La principal medida es el coeficiente de variación”.
Para tener una mejor comprensión de estos conceptos, veamos el siguiente ejemplo:
A continuación, se tiene el número de unidades producidas por hora durante un día por dos
operarios:
A 60 30 40 100 20 80 60 40
B 50 60 60 40 80 50 50 40
Para calcular el promedio (la media aritmética) de las unidades producidas por hora en el día de
cada operario, se aplica la fórmula correspondiente a la media aritmética, esto es:
Operario A:
𝟔𝟎 + 𝟑𝟎 + 𝟒𝟎 + 𝟏𝟎𝟎 + 𝟐𝟎 + 𝟖𝟎 + 𝟔𝟎 + 𝟒𝟎 𝟒𝟑𝟎
𝝁𝑨 = → 𝝁𝑨 =
𝟖 𝟖
𝝁𝑨 = 𝟓𝟑. 𝟕𝟓 𝒖𝒏𝒊𝒅𝒂𝒅𝒆𝒔
Operario B:
𝟓𝟎 + 𝟔𝟎 + 𝟔𝟎 + 𝟒𝟎 + 𝟖𝟎 + 𝟓𝟎 + 𝟓𝟎 + 𝟒𝟎 𝟒𝟑𝟎
𝝁𝑩 = → 𝝁𝑩 =
𝟖 𝟖
Estadística Descriptiva
𝝁𝑩 = 𝟓𝟑. 𝟕𝟓 𝒖𝒏𝒊𝒅𝒂𝒅𝒆𝒔
98
De acuerdo a los resultados obtenidos, ambos operarios tienen el mismo promedio. Pero
analicemos algo adicional, se traza un diagrama de líneas para cada operario:
120
número de horas trabajadas
100
80 oper A
60 oper B
40 promedio
20
0
1 2 3 4 5 6 7 8
hora
Analizando el gráfico obtenido se tiene que: el operario A presenta mayor variación con respecto
al promedio que el operario B.
Para analizar cómo varía un conjunto de datos con relación a su propio promedio.
Para comparar la variabilidad de dos o más conjuntos de datos entre sí.
1. La Varianza
Se define como:
Estadística Descriptiva
a. Si los datos no están organizados en una tabla de frecuencias, la varianza se calcula así:
1. Como parámetro, es decir, si los datos se toman de una población:
𝟐
(𝒙𝟏 − 𝝁)𝟐 + (𝒙𝟐 − 𝝁)𝟐 + (𝒙𝟑 − 𝝁)𝟐 + ⋯ + (𝒙𝒏 − 𝝁)𝟐
𝝈 = →
𝑵
𝟐
∑(𝒙𝒊 − 𝝁)𝟐
𝝈 =
𝑵
2. Como estadística, es decir, si los datos se toman de una muestra:
𝟐
̅)𝟐 + (𝒙𝟐 − 𝒙
(𝒙𝟏 − 𝒙 ̅)𝟐 + (𝒙𝟑 − 𝒙
̅)𝟐 + ⋯ + (𝒙𝒏 − 𝒙
̅ )𝟐
𝑺 = →
𝒏−𝟏
𝟐
̅ )𝟐
∑(𝒙𝒊 − 𝒙
𝝈 =
𝒏−𝟏
𝑶𝑷𝑬𝑹𝑨𝑹𝑰𝑶 𝑨
Estadística Descriptiva
100 (𝒙𝒊 − 𝝁𝑨 )𝟐
𝒙𝒊
∑ = 𝟒𝟑𝟎 ∑ = 𝟒𝟗𝟖𝟕, 𝟓
∑ 𝒙𝒊 𝟒𝟑𝟎
𝝁𝑨 = → 𝝁𝑨 = → 𝝁𝑨 = 𝟓𝟑, 𝟕𝟓
𝑵 𝟖
𝟐(
∑(𝒙𝒊 − 𝝁)𝟐 𝟒𝟗𝟖𝟕, 𝟓
𝝈 𝑨) = → 𝝈𝟐 (𝑨) = → 𝝈𝟐 (𝑨) = 𝟔𝟐𝟑, 𝟒𝟑𝟖
𝑵 𝟖
𝑶𝑷𝑬𝑹𝑨𝑹𝑰𝑶 𝑩
Estadística Descriptiva
101 (𝒙𝒊 − 𝝁𝑩 )𝟐
𝒙𝒊
∑ = 𝟒𝟑𝟎 ∑ = 𝟏𝟏𝟖𝟕, 𝟓
∑ 𝒙𝒊 𝟒𝟑𝟎
𝝁𝑩 = → 𝝁𝑩 = → 𝝁𝑩 = 𝟓𝟑, 𝟕𝟓
𝑵 𝟖
𝟐(
∑(𝒙𝒊 − 𝝁)𝟐 𝟏𝟏𝟖𝟕, 𝟓
𝝈 𝑩) = → 𝝈𝟐 (𝑩) = → 𝝈𝟐 (𝑨) = 𝟏𝟒𝟖, 𝟒𝟑𝟖
𝑵 𝟖
Estadística Descriptiva
(𝒙𝟏 − 𝝁)𝟐 𝒇𝒂𝟏 + (𝒙𝟐 − 𝝁)𝟐 𝒇𝒂𝟐 + (𝒙𝟑 − 𝝁)𝟐 𝒇𝒂𝟑 + ⋯ + (𝒙𝒏 − 𝝁)𝟐 𝒇𝒂𝒏
𝝈𝟐 =
𝑵
𝟐
∑(𝒙𝒊 − 𝝁)𝟐 𝒇𝒂𝒊
𝝈 =
𝑵
𝟐
̅)𝟐 𝒇𝒂𝒊
∑(𝒙𝒊 − 𝒙
𝝈 =
𝒏−𝟏
OPERARIO A
𝟏𝟎𝟎 𝟏 𝟏𝟎𝟎 ∗ 𝟏 = 𝟏𝟎𝟎 (𝟏𝟎𝟎 − 𝟓𝟑, 𝟕𝟓)𝟐 ∗ 𝟏 = (𝟒𝟔, 𝟐𝟓)𝟐 ∗ 𝟏 = 𝟐𝟏𝟑𝟗, 𝟎𝟔𝟐𝟓
∑ 𝒙𝒊 ∗ 𝒇𝒂𝒊 𝟒𝟑𝟎
𝝁𝑨 = = = 𝟓𝟑, 𝟕𝟓
𝑵 𝟖
𝟐
∑(𝒙𝒊 − 𝝁)𝟐 𝒇𝒂𝒊 𝟒𝟗𝟖𝟕, 𝟓
𝝈 = = = 𝟔𝟐𝟑, 𝟒𝟑𝟖
𝑵 𝟖
OPERARIO B
∑ 𝒙𝒊 ∗ 𝒇𝒂𝒊 𝟒𝟑𝟎
104 𝝁𝑩 = = = 𝟓𝟑, 𝟕𝟓
𝑵 𝟖
𝟐
∑(𝒙𝒊 − 𝝁)𝟐 𝒇𝒂𝒊 𝟏𝟏𝟖𝟕, 𝟓
𝝈 = = = 𝟏𝟒𝟖, 𝟒𝟑𝟖
𝑵 𝟖
Cálculo de la Varianza
̅
1. Se calcula el promedio o Media Aritmética 𝝁 𝒐 𝒙.
2. DESVIACIÓN ESTÁNDAR
105
También se conoce como Desviación Típica, se define como:
(http://www.fisterra.com/mbe/investiga/10descriptiva/10descriptiva.asp#introduccion)
a. Si los datos no están organizados en una tabla de frecuencias, la varianza se calcula así:
1. Como parámetro, es decir, si los datos se toman de una población:
(𝒙𝟏 − 𝝁)𝟐 𝒇𝒂𝟏 + (𝒙𝟐 − 𝝁)𝟐 𝒇𝒂𝟐 + (𝒙𝟑 − 𝝁)𝟐 𝒇𝒂𝟑 + ⋯ + (𝒙𝒏 − 𝝁)𝟐 𝒇𝒂𝒏
𝝈= √
𝑁
A simple vista parece ser que el operario D tiene 3 veces más variabilidad que el operario C; pero
debe tenerse en cuenta que el operario D produce unidades en promedio 4 veces más que el
operario C; para evaluar este tipo de resultados se tiene un elemento denominado Coeficiente
de Dispersión o de variación, cuya conceptualización es la siguiente:
Es conocida como variación relativa, puesto que muestra en qué porcentaje está variando un
conjunto de datos; es decir, que no está expresado en las unidades de investigación, se calcula
de la siguiente forma:
𝝈
𝐶. 𝑽 = 𝒙̅ ∗ 𝟏𝟎𝟎 (𝒑𝒂𝒓𝒂 𝒖𝒏𝒂 𝒑𝒐𝒃𝒍𝒂𝒄𝒊ó𝒏)
𝑺
𝑪. 𝑽 = 𝒙̅ ∗ 𝟏𝟎𝟎 (𝒑𝒂𝒓𝒂 𝒖𝒏𝒂 𝒎𝒖𝒆𝒔𝒕𝒓𝒂)
Para el ejercicio anterior:
𝟓
𝐶. 𝑽𝑪 = 𝟒𝟎 ∗ 𝟏𝟎𝟎 = 𝟏𝟐. 𝟓%
𝟏𝟓
𝐶. 𝑽𝑫 = 𝟏𝟔𝟎 ∗ 𝟏𝟎𝟎 = 𝟗. 𝟒%
𝐶. 𝑽𝑨 =
𝟐𝟒,𝟗𝟔𝟗
∗ 𝟏𝟎𝟎 = 𝟒𝟔, 𝟒𝟓𝟒 %
107 𝟓𝟑,𝟕𝟓
𝐶. 𝑽𝑩 =
𝟏𝟐,𝟏𝟖𝟒
𝟓𝟑,𝟕𝟓
∗ 𝟏𝟎𝟎 = 𝟐𝟐, 𝟔𝟔𝟖 %
𝑳𝒊 𝑳𝒔 𝒇𝒂 𝒊 𝒙𝒊 𝒙 𝒊 ∗ 𝒇𝒂 𝒊 ( 𝒙 𝒊 − 𝝁 ) 𝟐 ∗ 𝒇𝒂 𝒊
𝑵 = 𝟖𝟏 ∑ 𝟐𝟖𝟏𝟎. 𝟓 ∑ 𝟕𝟏𝟕𝟐. 𝟖𝟒
Estadística Descriptiva
∑ 𝒙𝒊 ∗𝒇𝒂𝒊 𝟐𝟖𝟏𝟎.𝟓
108 𝝁= = = 𝟑𝟒, 𝟔𝟗𝟖 Promedio de edad de los empleados.
𝑵 𝟖𝟏
∑(𝒙𝒊 −𝝁)𝟐 𝒇𝒂𝒊 𝟕𝟏𝟕𝟐,𝟖𝟒
𝟐
𝝈 = = = 𝟖𝟖, 𝟓𝟓𝟒 , no se interpreta.
𝑵 𝟖𝟏
Las edades de los empleados de la empresa tienen una Desviación Promedio de 9,41 años, con
relación al promedio que es de 34,689 años.
Mónica 88 68 90 101 89
Alex 77 89 90 87 78
2. Los siguientes son los ingresos semanales (en millones de pesos) de 2 centros de atención
psicológica durante los últimos 2 años, de acuerdo con una muestra aleatoria:
0 1 13 0 1 33
1 2 40 1 2 10
2 3 10 2 3 10
3 4 24 3 4 40
4 5 3 4 5 7
d. Los ingresos menos frecuentes del Centro psicológico B están dos intervalos:
1. Verdadero
2. Falso
Estadística Descriptiva
TIPS
Recuerde que: Hay básicamente dos tipos de medidas de
dispersión: Medidas Absolutas y Medidas Relativas.
11
1
Recuerde que: Como que como se ha citado anteriormente la Estadística trata sobre
el recuento, ordenación y clasificación de los datos obtenidos por las observaciones,
para poder hacer comparaciones y sacar conclusiones
Recuerde que: Los datos numéricos, sean pocos o muchos, siempre se organizan en una Fila en
forma ascendente.
Recuerde que: Las Medidas de Tendencia Central, nos permiten una interpretación de los datos
obtenidos en cualquier medición que se realice.
Para encontrar la Media, la Moda y la Mediana, se deben ordenar los datos de menor a mayor.
Recuerde que: Una vez definidos los conceptos básicos en el estudio de una distribución de
frecuencias de una variable, se estudiarán las distintas formas de resumir dichas distribuciones
mediante medidas de posición (o de centralización), teniendo presente el error cometido en el
resumen mediante las correspondientes medidas de dispersión.
Recuerde que: Hay básicamente dos tipos de medidas de dispersión: Medidas Absolutas y
Medidas Relativas.
Las medidas absolutas se caracterizan por ser números concretos, es decir, valores expresados
en las mismas unidades de la variable en estudio y que por lo tanto no permiten comparaciones
Estadística y Probabilística
Las medidas relativas de dispersión son valores abstractos, es decir, medidas adimensionales y
por lo tanto no expresadas en ninguna unidad específica, obviando así el inconveniente señalado
para las medidas absolutas. La principal medida es el coeficiente de variación”
Estadística Descriptiva
11 4 GLOSARIO
3 Dato más frecuente: Es el dato que más se repite; es decir la moda. Se identifica como el que
tiene la frecuencia absoluta más alta.
Frecuencias: Indica en forma numérica (absoluta) o en forma porcentual (relativa) las veces que
se presenta cada dato.
Dispersión: Indica cómo se dispersan o varían los datos en la distribución; existen varias medidas
para analizar dicha dispersión; las más utilizadas son las que varían con relación al promedio.
Frecuencias acumuladas: Las frecuencias absolutas y las relativas, se acumulan por cada clase y
se utilizan para hacer interpretaciones de los datos como: mayor o igual, menor, menor o igual.
Interpretación de datos: mayor, dato menor, dato más frecuente, dato menos frecuente.
Consiste en el análisis de los datos con el fin de analizar el comportamiento de ellos y concluir.
Estadística Descriptiva
114 5 BIBLIOGRAFÍA
Anderson, D., Sweeney, D. & Williams, T. Berenson, M. L. & Levine, D. M. (1996).
(1999). Estadística para Administración y Estadística básica en Administración. (6ª
Economía. (7ª edición). México: edición). México: Prentice-Hall.
Internacional Thomson Editores.
Anderson, D., Sweeney, D. & Williams, T.
Berenson, M. L. & LEVINE, D. M. (1996). (1999). Estadística para Administración y
Estadística básica en Administración. (6ª Economía. (7ª edición). México:
edición). México: Prentice-Hall. Internacional Thomson Editores.
Madrid, Jarpyo Editores, S.A. 1997; 115- Universidad de San Carlos. Estadística
115 161. Actualizado 06/03/2001. Extraído el 27 descriptiva: Conceptos básicos [Versión
de octubre de 2009 electrónica]. Guatemala, actualizado el 21de
agosto de 2007. Extraído el 24 de octubre de
de:http://www.fisterra.com/mbe/investiga/
2009 de http://sitios.ingenieria-
10descriptiva/10descriptiva.asp#introduccio usac.edu.gt/estadistica/estadistica2/estadis
n ticadescriptiva.html