Documente Academic
Documente Profesional
Documente Cultură
Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo
número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina
medida o parámetro de tendencia central o de centralización.
Se les denomina medidas de localización, posición o de tendencia central, debido a que tales valores tienden
a situarse en el sector central del conjunto de datos ordenados.
Media aritmética
Media ponderada
Media geométrica
Media armónica
Mediana
Moda
De acuerdo a la organización de los datos hay dos formas de estimar este tipo de medidas ya sea para datos
no agrupados o agrupados
Equivale al cálculo del promedio simple de un conjunto de datos. Para diferenciar datos muestrales da datos
poblacionales, la media aritmética se representa con un símbolo para cada uno de ellos: si trabajamos con la
población, este indicador será µ; en el caso de que estemos trabajando con una muestra, el símbolo será 𝑋̅.
41
Observe que la variación de ambas fórmulas radica en el tamaño de los datos (N identifica el tamaño de la
población, mientras que n el de la muestra).
Ejemplo 1. El profesor de la materia de estadística desea conocer el promedio de las notas finales de los 10
alumnos de la clase. Las notas de los alumnos son:
Solución:
3,2 + 3,1 + 2,4 + 4,0 + 3,5 + 3,0 + 3,5 + 3,8 + 4,2 + 4,0 34,7
µ= =
10 10
µ = 3,47
Cabe anotar que en el ejemplo estamos hablando de una población correspondiente a todos los alumnos de
la clase (10 alumnos en total). El promedio de las notas es de 3,47.
Cuando los datos se agrupan en variables discretas la media aritmética es igual a la división de la sumatoria
del producto de las clases por la frecuencia sobre el número de datos.
42
La sumatoria parte desde el primer intervalo de clase (i=1) hasta el último (c), siendo X i la clase del intervalo
i.
Ejemplo 2 : Una empresa dedicada al transporte de viajeros cuenta con 100 vehículos para recorridos largos.
El año pasado la distribución del número de kilómetros recorridos (miles) por los vehículos se encuentra en
la siguiente tabla:
Xi (En miles de
Frecuencia
Km recorridos)
100 20
120 10
160 60
230 5
250 5
Total 100
• Paso 1. Determinar las marcas de clase (punto medio) de cada una de las clases y determinar la
frecuencia absoluta de cada clase y realizar el producto resultante entre ellos.
Solución:
Luego, construir la tabla de frecuencias y calcular el promedio aritmético para poder compararlos
Clase Lm Ls f Mi
1 11,0 17,4 8 14,21
2 17,4 23,8 6
3 23,8 30,2 2
4 30,2 36,6 5
5 36,6 43,0 4
6 43,0 49,4 5
Total 30
PASO 1: Realiza la sumatoria del producto resultante entre las marcas de clase por su frecuencia absoluta.
𝑁𝑐
∑ 𝑀𝑐𝑖 𝑓𝑖 = 14,21𝑥8 + ⋯ … … … … … … .
𝑖=1
∑𝑁
𝑖=1 𝑀𝑐𝑖 𝑓𝑖
𝑐
𝑋̅ = =
𝑛
Podemos ver claramente una diferencia entre ambas medias: 27,74 para los datos no agrupados y 28,29 para
los datos agrupados. Esta diferencia radica que en la tabla existe una pérdida de información, al agrupar los
datos en los intervalos de clase.
44
Ventajas
Desventajas
PROPIEDADES DE LA MEDIA
Ejemplo 4. Se tiene que en una empresa del ramo de las consultorías los empleados tienen un salario
promedio de $2’800.000 y para el año 2015 se les hizo un aumento de 15%. Además se les da una bonificación
mensual de $50.000 por aniversario de la empresa. ¿Cuál es el salario promedio del año 2015?
w x i i
Xp i 1
n
w
i 1
i 45
Ejercicio 5: ON LINE LIBRARY es una librería especializada que se dedica a la venta de libros usados por
Internet. Los libros de pasta blanda cuestan $1.00 cada uno y los de pasta dura, $3.50 cada uno. De los 50
libros vendidos el pasado martes por la mañana, 40 eran de pasta blanda y el resto de pasta dura. ¿Cuál fue
el precio promedio ponderado de un libro?
Ejercicio 6: En una Ferretería que maneja 4 productos, los márgenes de utilidad correspondientes a cada uno
de ellos durante el año fiscal anterior fueron: Producto A: 4.2%; producto B 5.5%, producto C 7.4% y el
producto D 10.1%. Las cantidades vendidas para los cuatro elementos son:
Margen de
Producto Ventas
utilidad
A 4,20% $ 30´000.000
B 5,50% $ 20'000.000
C 7,40% $ 5'000.000
D 10,10% $ 3'000.000
2.3. MEDIANA
Se define como aquel valor de la variable que divide la distribución de los valores en dos partes iguales., es
decir, que los valores ordenados con respecto a su magnitud tendrán la mitad de ellos por debajo del valor
mediano, y la otra mitad por encima del mismo valor.
PROCEDIMIENTO DE CÁLCULO
• Paso 1.- Ordenar de menor a mayor los valores X del conjunto de datos individuales, i = 1,2,…,n
i
• Paso 2.- Identificar si n es impar o par
•
𝑋(𝑛+1) Cuando n es impar
2
Me =
𝑋𝑛 + 𝑋𝑛
+1 46
2 2
Cuando n es par
2
La mediana se simboliza como Me. Es menos usada que la media aritmética. Para su cálculo es necesario que
los datos estén ordenados. Cuando la cantidad de datos es impar, fácilmente se identifica la mediana; pero
cuando el número de datos es par, la mediana se calcula hallando el valor medio entre los dos valores centrales
y no coincidirá con ninguno de los valores del conjunto de datos.
Ejercicio 7: Dados los valores 19, 15, 23, 28, 14, 26, 18, 20, 30, determinar su mediana. Lo primero que debe
hacerse es ordenar los datos:
14 15 18 19 20 23 26 28 30
Como el número de datos es 9, el valor del medio de estos datos es la mediana, puesto que deja cuatro valores
por debajo y cuatro valores por encima. Este valor es 20.
14 15 18 19 20 23 26 28 30 32
Observe que son 10 datos, un número par de datos. En este caso se toman los dos valores del medio y se
promedian:
20 + 23
𝑀𝑒 = = 21.5
2
Solución
Paso 1: Localizar entre que clases se encuentra la mediana. Observe que la mediana se encuentra entre las
clases 3 y 4, donde podremos encontrar una frecuencia relativa acumulada del 50%.
Nc Clase f F H H
1 10 5 5 10,4166% 10,4166%
2 20 7 12 14,583% 25,0000%
3 30 10 22 20,8333% 45,8333%
4 40 13 35 27,0830% 72,9166%
5 50 10 45 20,8333%
Entre las clases93,7500%
3 y 4 se
6 60 2 47 4,1667% el punto
encuentra 97,91667%
que
7 70 1 48 2,0833% 100%
divide en dos partes iguales
Total 48 la 100%
cantidad de datos.
Paso 1: Obtener la clase de la mediana, es decir, el primer intervalo que cumpla la condición:
𝑛
𝐹𝑖 ≥ 2
Donde n: Número total de datos del conjunto
i: Es el número del intervalo de clase que cumple la condición, i= 1, 2,…, k.
Fi: Frecuencia acumulada del intervalo de clase i
48
Paso 2: Calcular la mediana con la siguiente ecuación:
𝑀𝑒 = 𝐿𝑚 + 𝐼𝑛𝑐𝑟𝑒𝑚𝑒𝑛𝑡𝑜
Siendo Lm: Límite de la clase mediana. Para efectos de fórmula se expresa en términos de LS i-1
El incremento resulta de multiplicar el incremento para llevar la frecuencia al 50% (50% - Hi-1) por el ancho de
la clase (A) sobre la diferencia porcentual entre los límites superiores (Hi-Hi-1):
(0,5 − 𝐻𝑖−1 )
𝑀𝑒 = 𝐿𝑆𝑖−1 + 𝐴.
(𝐻𝑖 − 𝐻𝑖−1 )
𝑛
( − 𝐹𝑖−1 )
𝑀𝑒 = 𝐿𝑆𝑖−1 + 𝐴. 2
𝑓𝑖
Ventajas
Desventajas
Ejercicio 10. Determinar la mediana para los datos agrupados del ejercicio 3. Completar la tabla de frecuencias
Clase Intervalo fi Mi Fi hi Hi
1 [ 11,00 - 17,41 ) 8
2 [ 17,41 - 23,81) 6
3 [ 23,81 - 30,21) 2
4 [ 30,21 - 36,61 ) 5
5 [ 36,61 - 43,01 ) 4
6 [ 43,01 - 49,40 ] 5
TOTAL 30
2.4. MODA
Moda (Mo): Indica el valor que más se repite, o la clase que posee mayor frecuencia.
En el caso de que dos valores presenten la misma frecuencia, decimos que existe un conjunto de datos
49
bimodal. Para más de dos modas hablaremos de un conjunto de datos multimodal.
Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la marca de gaseosa que más
consume a la semana:
Solución
Paso 2: La moda representa el valor que más se repite. En este caso es la marca 1.
Ejercicio 11. Determinar la moda para el ejercicio 2 , tal y como aparece en la siguiente tabla.
¿Qué número de kilómetros recorre la mayoría de los vehículos?
Xi (En miles de
Frecuencia
Km recorridos)
100 20
120 10
160 60
230 5
250 5
Total 100
Moda Datos Agrupados: Variables continuas
Procedimiento:
50
Paso 1. La Moda estará representada por la clase que posee la más alta frecuencia, denominándose clase
modal.
Paso 2. El cálculo de la Moda se obtiene con la siguiente expresión:
Donde:
𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑆−1 + 𝐴 ∗
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖−1 )
Donde Ls-1 equivale al límite del intervalo donde se encuentra la moda.
Siendo
Donde:
𝑓𝑖−1 es la frecuencia absoluta de la clase anterior en donde se encuentra el dato más frecuente.
𝑓𝑖+1 es la frecuencia absoluta de la clase posterior en donde se encuentra el dato más frecuente.
𝐴𝑖 es la amplitud de la clase en donde se encuentra el dato mas frecuente.
Ejercicio 12 : Para un estudio de retiro voluntario en la empresa minera A se tiene un informe de los años de
servicio de los trabajadores de la empresa en diciembre del año pasado. La tabla adjunta muestra las
categorías correspondientes y sus frecuencias absolutas acumuladas de los datos obtenidos en el estudio:
Frecuencia
Frecuencia Frecuencia
Marca de Frecuencia relativa
Categorías acumulada relativa
clase Mi fi acumulada
Fi hi
Hi
[5 - 10) 10
[10 - 15) 10
[15 - 20) 80
[20 - 25) 180
[25 - 30) 240
[30 - 35) 280
[35 - 40) 290
[40 - 45) 300
2.5.1 La media geométrica se utiliza para promediar crecimiento geométricos de la variable, o cuando se
51
quiere dar importancia a valores pequeños, o cuando se quiere determinar el valor medio para un conjunto
de porcentajes. Suele utilizarse en negocios y economía para calcular las tasas de cambio promedio, las tasas
de crecimiento promedio o tasas promedio. Se simboliza Mg y se define como la raíz n- ésima de la productoria
de los n valores de la variable.
La Media Geométrica (G) de una variable estadística X positiva es la raíz enésima del producto de n valores de
la variable., se define como:
𝑀𝐺 = 𝑛√𝑋1 𝑋2 ∗ … ∗ 𝑋𝑛
Ejemplo 13
Cuando los datos están agrupados, la media geométrica se define como la raíz n-ésima de la productoria de
los valores de la variable (marca de clase) elevadas cada una de ellas a su correspondiente frecuencia absoluta.
𝑛𝑛 𝑛 𝑛
𝑀𝐺 = √𝑋1 1 ∗ 𝑋2 2 ∗ … ∗ 𝑋𝑛 𝑖
6 6
𝑀𝐺 = √2 ∗ 4 ∗ 6 ∗ 9 ∗ 12 ∗ 15 = √77,760 = 6,53
Intervalos de Marca
Frecuencias
clase de clase
[0.5 - 1.5) 1 2
[1.5 - 2.5) 2 5
[2.5 - 3.5) 3 8
[3.5 - 4.5) 4 5
TOTAL 20
4
𝑀𝑔 = √12 ∗ 25 ∗ 38 ∗ 45 = 121,1
2.5.2 La media armónica de un conjunto de datos es el reciproco de la media aritmética de los recíprocos de
los números de la serie de datos. Se simboliza Mh y se define como:
1 1 1 1
+ +⋯+
1 𝑋1 𝑋2 𝑋𝑛 ∑ 𝑥 𝑛 52
= = = 𝑀ℎ =
𝑀ℎ 𝑛 𝑛 1
∑
𝑥
Ejercicio 15 : Un obrero se gasta 50 minutos en terminar un producto y otro lo hace en 40 minutos. ¿Cuál es
el tiempo medio requerido para terminar dicho producto?
1
𝑀ℎ = = 44,44
0,0225
Ejercicio 16: La recuperación de una inversión realizada por la Compañía Constructora durante cuatro años
consecutivos fue de 30%, 20%, −40% y 200%. ¿Cuál es la media geométrica de la recuperación de la inversión?
Ejercicio 17 : La población colombiana durante los últimos años se resume en el siguiente cuadro. Determine:
Fuente: DANE censo ajustado 1985. Censo 2005. Proyecciones para el periodo 2010,2015.
Ejercicio 18: Supóngase que en una carrera de automóviles de relevos, 3 pilotos condujeron 3000 kilómetros,
es decir 1000 kilómetros cada uno, con las siguientes velocidades promedio:
Velocidad
Conductor
promedio (km/h)
A 100
B 120
C 140
11 5 4
8 9 8
6 11 3
7 10 2
7 3 8
Nc Lm Ls f
1 100 150,1 1
2 150,1 200,1 2
3 200,1 250,1 15
4 250,1 300,1 16
5 300,1 350,1 21
6 350,1 400,1 14
7 400,1 450,1 11
8 450,1 500 7
Total 87
3. Para que un producto sea aceptado por su cliente principal, debe cumplir con ciertas especificaciones de
calidad. Una de ellas, radica en que el promedio de longitud de los 20 primeros productos este entre 20 y 20,9
centímetros. Si las medidas son:
22,3 20,4 19,8 19,9 20,1 20,8 21,6 19,8 20,5 23,4
19,6 21,5 18,5 18,7 20,9 21,1 20,1 21,5 22,3 17,9
4. Calcular la media, mediana y moda para los siguientes datos (agrúpelos en una tabla de frecuencia):
Medidas de posición: Son indicadores estadísticos que muestran la frecuencia acumulada hasta un valor k
cualquiera. 56
Las medidas de posición equivalen a los valores que puede tomar una variable caracterizados por agrupar a
cierto porcentaje de observaciones en la muestra o población.
Las medidas de posición son ideales para obtener información adicional a partir de datos resumidos, es
decir, que presentan perdida de información por agrupamiento en intervalos de clase.
Además, las medidas de posición nos permiten dividir a una distribución en distintas partes. Según el
número de partes, estas divisiones tendrán distintos nombres:
Requisitos
Variables cuantitativas
Los resultados están ordenados de menor a mayor
Equivalencias
Como todas las medidas se refieren al mismo grupo de datos, se pueden hacer
equivalentes entre sí
D1 D2 D3 D4 D5 D6 D7 D8 D9 D10
P10 P20 P30 P40 P50 P60 P70 P80 P90 P100
P25 P75
PERCENTILES Q1 Q2 Q3
Los percentiles representan los valores de la variable que están por debajo de un porcentaje, el cual puede
ser un valor de 1% a 100% ( en otras palabras , el total de los datos es divido en 100 partes iguales).
Pk
DECILES
Para los deciles, tomaremos el total de los datos divididos en 10 partes iguales, por tanto, existirán 10
deciles representado como Dk.
P10=D1
P20=D2
P30=D3
P40=D4
P50=D5 = Me
P60=D6
P70=D7
P80=D8
P90=D9
P100=D10
CUARTILES
Para los cuartiles se toma el total de los datos divididos en 4 partes iguales. Denotaremos el cuartil como Qk.
P25=Q1
P50=D5 =Q2= Me
P75=Q3
P100=D10 =Q4
𝑘(𝑛 + 1) ÷ 4
𝑘(𝑛 + 1) ÷ 100
Paso 1. Identificar la clase donde se encuentra el percentil i –esimo. Se parte de una tabla de
frecuencias ordenadas por clases.
El percentil k parte desde el límite superior del intervalo anterior al que se encuentra dicho percentil más un
incremento:
𝑃𝑘 = 𝐿𝑠𝑖−1 + 𝐼𝑛𝑐𝑟𝑒𝑚𝑒𝑛𝑡𝑜
(𝑘 − 𝐻𝑖−1 )
𝑃𝑘 = 𝐿𝑠𝑖−1 + 𝐴 ∗
(𝐻𝑖 − 𝐻𝑖−1 )
(𝑛 ∗ 𝑘 − 𝐹𝑖−1 )
𝑃𝑘 = 𝐿𝑠𝑖−1 + 𝐴 ∗
𝑓𝑖
Nc Lm Ls f F h H
1 [5 15) 14 14 14% 14%
2 [15 25) 12 26 12% 26%
3 [25 35) 20 46 20% 46%
4 [35 45) 18 64 18% 64%
5 [45 55) 14 78 14% 78%
6 [55 65) 12 90 12% 90%
7 [65 75) 10 100 10% 100%
TOTAL 100 100%
Podemos concluir fácilmente (con ayuda de las frecuencias acumuladas), que 14 personas (14% del total)
están por debajo de los 15 años (podemos aproximarlo a 15 años), lo cual representaría al percentil 14:
𝑃14 = 15 61
El percentil 5 (P5) no puede ser calculado directamente, pero podemos concluir que dicho valor se
encuentra en el primer intervalo, ya que este acumula el 14% de las personas. No ocurre lo mismo con el
percentil 78 (P78) que aparece directamente en la tabla:
El 78% de las personas consultadas poseen una edad igual o inferior a los 55 años.
Nc Lm Ls f F h H
1 137 141,1 4 4 10% 10%
2 141,1 145,1 2 6 5% 15%
3 145,1 149,1 10 16 25% 40%
4 149,1 153,1 10 26 25% 65%
5 153,1 157,1 12 38 30% 95%
6 157,1 161,1 2 40 5% 100%
TOTAL 40 100%
62
Grafiquemos el percentil 35 (P35) el cual equivale al valor de la variable de 147,5 (localizado en el intervalo
3). Ubicamos el 35% en el vertical y lo proyectamos al eje horizontal. El área debajo de la curva representa el
35% de los datos.
EJERCICIOS PROPUESTOS
Segundo punto: Calcular todos los deciles a partir de los siguientes datos:
10 15 21 20 23 5 14 15
33 21 29 19 5 14 25 25
30 15 1 26 32 22 30 15
28 27 14 16 21 22 39 34
Tercer punto: La siguiente tabla muestra la distribución de frecuencia sobre los ingresos de los trabajadores
de un cargo en particular de varias empresas el sector manufacturero (cifras dadas en miles de pesos).
Nc Lm Ls f
1 [452 460) 37
2 [460 468) 23
3 [468 476) 13
4 [476 482) 8
5 [482 490) 7
6 [490 498] 2
Total 90
a. ¿Cuántas personas ganan menos de $ 470.000?
b. ¿Cuántas personas ganan menos de $ 482.000?
c. ¿Cuántas personas ganan más de $460.