Sunteți pe pagina 1din 24

2.

Medidas de tendencia central


40
La característica más importante que describe o resume un grupo de datos es su posición.

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo
número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina
medida o parámetro de tendencia central o de centralización.

Se les denomina medidas de localización, posición o de tendencia central, debido a que tales valores tienden
a situarse en el sector central del conjunto de datos ordenados.

Entre las medidas de tendencia central tenemos:

 Media aritmética
 Media ponderada
 Media geométrica
 Media armónica
 Mediana
 Moda

De acuerdo a la organización de los datos hay dos formas de estimar este tipo de medidas ya sea para datos
no agrupados o agrupados

2.1. Promedio, o Media Aritmética simple

Es la medida más común de localización y representa el centro de un grupo de datos.

Equivale al cálculo del promedio simple de un conjunto de datos. Para diferenciar datos muestrales da datos
poblacionales, la media aritmética se representa con un símbolo para cada uno de ellos: si trabajamos con la
población, este indicador será µ; en el caso de que estemos trabajando con una muestra, el símbolo será 𝑋̅.

Media aritmética (µ o 𝑋´ ): Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto


de datos sobre el número total de datos. Solo es aplicable para el tratamiento de datos cuantitativos.
Hay que entender que existen dos formas distintas de trabajar con los datos tanto poblacionales como
muestrales: sin agruparlos o agrupándolos en tablas de frecuencias. Esta apreciación sugiere dos formas de
representar la media aritmética.
a. Media aritmética para datos no agrupados
Podemos diferenciar la fórmula del promedio simple para datos poblaciones y muestrales:

41

Observe que la variación de ambas fórmulas radica en el tamaño de los datos (N identifica el tamaño de la
población, mientras que n el de la muestra).

Ejemplo 1. El profesor de la materia de estadística desea conocer el promedio de las notas finales de los 10
alumnos de la clase. Las notas de los alumnos son:

3,2 3,1 2,4 4 3,5


3 3,5 3,8 4,2 4

¿Cuál es el promedio de notas de los alumnos de la clase?

Solución:

Aplicando la fórmula para datos no agrupados tenemos:

3,2 + 3,1 + 2,4 + 4,0 + 3,5 + 3,0 + 3,5 + 3,8 + 4,2 + 4,0 34,7
µ= =
10 10

µ = 3,47

Cabe anotar que en el ejemplo estamos hablando de una población correspondiente a todos los alumnos de
la clase (10 alumnos en total). El promedio de las notas es de 3,47.

Modifique la primera nota por 0,0 y calcule nuevamente la media aritmética.

b. Media Aritmética para datos agrupados. VARIABLES DISCRETAS

Cuando los datos se agrupan en variables discretas la media aritmética es igual a la división de la sumatoria
del producto de las clases por la frecuencia sobre el número de datos.
42

La sumatoria parte desde el primer intervalo de clase (i=1) hasta el último (c), siendo X i la clase del intervalo
i.

Ejemplo 2 : Una empresa dedicada al transporte de viajeros cuenta con 100 vehículos para recorridos largos.
El año pasado la distribución del número de kilómetros recorridos (miles) por los vehículos se encuentra en
la siguiente tabla:

Xi (En miles de
Frecuencia
Km recorridos)

100 20
120 10
160 60
230 5
250 5
Total 100

Determine ¿Cuál es el recorrido promedio de los vehículos?

c. Media Aritmética para datos agrupados. VARIABLES CONTINUAS

• Paso 1. Determinar las marcas de clase (punto medio) de cada una de las clases y determinar la
frecuencia absoluta de cada clase y realizar el producto resultante entre ellos.

• Paso 2. Efectuar la sumatoria entre el número de datos.

Aplicar la siguiente formula:


Mi = Punto medio de la clase
∑𝑘
𝑖=1 𝑀𝑖 𝑓𝑖
𝑋̅ = ; donde fi = Frecuencia de la clase i
𝑛 n = Tamaño de la muestra
k = Número de clases
Ejemplo 3: Calcular la media aritmética a los siguientes datos agrupando en una tabla de frecuencia (suponga
que los datos son poblacionales):

47,8 23,1 12,4 35,4 44 26,2 43


18,6 11 32 12,4 49,4 41,4
18,6 21 26,3 11,1 21,4 30,6
12,8 43,1 18,1 38,1 16,8 12,4
33,6 40,9 15,2 33,2 48,2 37

Solución:

Calculemos la media para los datos sin agrupar:

47,8 + 23,1 + 12,4 + 35,4 + 44 + 26,2 + ⋯ + 37 832,1


µ= = = 27,74
30 30

Luego, construir la tabla de frecuencias y calcular el promedio aritmético para poder compararlos

Clase Lm Ls f Mi
1 11,0 17,4 8 14,21
2 17,4 23,8 6
3 23,8 30,2 2
4 30,2 36,6 5
5 36,6 43,0 4
6 43,0 49,4 5
Total 30

PASO 1: Realiza la sumatoria del producto resultante entre las marcas de clase por su frecuencia absoluta.

𝑁𝑐

∑ 𝑀𝑐𝑖 𝑓𝑖 = 14,21𝑥8 + ⋯ … … … … … … .
𝑖=1

PASO 2: Dividir la sumatoria sobre el número total de datos.

∑𝑁
𝑖=1 𝑀𝑐𝑖 𝑓𝑖
𝑐
𝑋̅ = =
𝑛
Podemos ver claramente una diferencia entre ambas medias: 27,74 para los datos no agrupados y 28,29 para
los datos agrupados. Esta diferencia radica que en la tabla existe una pérdida de información, al agrupar los
datos en los intervalos de clase.
44
Ventajas

 Es la medida de tendencia central más usada.


 El promedio es estable en el muestreo.
 Es sensible a cualquier cambio en los datos (puede ser usado como un detector de variaciones en los
datos).
 Se emplea a menudo en cálculos estadísticos posteriores.
 Presenta rigor matemático.
 En la gráfica de frecuencia representa el centro de gravedad.

Desventajas

 Es sensible a los valores extremos.


 No es recomendable emplearla en distribuciones muy asimétricas.

PROPIEDADES DE LA MEDIA

1. La suma de las desviaciones de todas las puntuaciones respecto a la media es 0.


2. Si todos los valores observados X1, X2,…, Xn son iguales a una constante, el promedio será la misma
constante.
3. Si definimos Yi = KXi, entonces Yi = KXi para K ϵ R
4. Si definimos Yi = Xi + K, entonces Yi = Xi + K para K ϵ R
5. Si un grupo esta particionado en r partes y cada parte tiene ni datos con una media cada parte i-ésima
de Xi, entonces la media del grupo está dada por la media ponderada.

Ejemplo 4. Se tiene que en una empresa del ramo de las consultorías los empleados tienen un salario
promedio de $2’800.000 y para el año 2015 se les hizo un aumento de 15%. Además se les da una bonificación
mensual de $50.000 por aniversario de la empresa. ¿Cuál es el salario promedio del año 2015?

2.2. Media ponderada


• Esta medida surge como una forma de discriminar la importancia de cada dato en el cálculo
del promedio
• A través de un factor de ponderación se asigna el peso de cada dato dentro de la muestra o
población
n

w x i i
Xp  i 1
n

w
i 1
i 45

Wi = peso para la observación i


Xi = valor de la observación i

Ejercicio 5: ON LINE LIBRARY es una librería especializada que se dedica a la venta de libros usados por
Internet. Los libros de pasta blanda cuestan $1.00 cada uno y los de pasta dura, $3.50 cada uno. De los 50
libros vendidos el pasado martes por la mañana, 40 eran de pasta blanda y el resto de pasta dura. ¿Cuál fue
el precio promedio ponderado de un libro?

Ejercicio 6: En una Ferretería que maneja 4 productos, los márgenes de utilidad correspondientes a cada uno
de ellos durante el año fiscal anterior fueron: Producto A: 4.2%; producto B 5.5%, producto C 7.4% y el
producto D 10.1%. Las cantidades vendidas para los cuatro elementos son:

Determinar el promedio de ventas:

Margen de
Producto Ventas
utilidad
A 4,20% $ 30´000.000
B 5,50% $ 20'000.000
C 7,40% $ 5'000.000
D 10,10% $ 3'000.000

2.3. MEDIANA

La mediana Me de un conjunto de datos x ,x ,……. ,x , es el valor x que se encuentra en el punto medio o


1 2 n i
centro, cuando se ordenan los valores de menor a mayor.

Se define como aquel valor de la variable que divide la distribución de los valores en dos partes iguales., es
decir, que los valores ordenados con respecto a su magnitud tendrán la mitad de ellos por debajo del valor
mediano, y la otra mitad por encima del mismo valor.

PROCEDIMIENTO DE CÁLCULO
• Paso 1.- Ordenar de menor a mayor los valores X del conjunto de datos individuales, i = 1,2,…,n
i
• Paso 2.- Identificar si n es impar o par

𝑋(𝑛+1) Cuando n es impar
2
Me =
𝑋𝑛 + 𝑋𝑛
+1 46
2 2
Cuando n es par
2

La mediana se simboliza como Me. Es menos usada que la media aritmética. Para su cálculo es necesario que
los datos estén ordenados. Cuando la cantidad de datos es impar, fácilmente se identifica la mediana; pero
cuando el número de datos es par, la mediana se calcula hallando el valor medio entre los dos valores centrales
y no coincidirá con ninguno de los valores del conjunto de datos.

Ejercicio 7: Dados los valores 19, 15, 23, 28, 14, 26, 18, 20, 30, determinar su mediana. Lo primero que debe
hacerse es ordenar los datos:

14 15 18 19 20 23 26 28 30

Como el número de datos es 9, el valor del medio de estos datos es la mediana, puesto que deja cuatro valores
por debajo y cuatro valores por encima. Este valor es 20.

b. Hallar la media del siguiente conjunto de datos ordenados:

14 15 18 19 20 23 26 28 30 32

Observe que son 10 datos, un número par de datos. En este caso se toman los dos valores del medio y se
promedian:

20 + 23
𝑀𝑒 = = 21.5
2

MEDIANA para datos agrupados VARIABLES DISCRETAS

1. Obtener las frecuencias absolutas acumuladas


𝑛
2. Buscar la mitad de las observaciones por medio de la operación
2
3. Localizar el resultado anterior en la columna de las frecuencias absolutas acumuladas.

Ejemplo: 8 Mediana para datos agrupados. Variables discretas.

Calcular la mediana a partir de la siguiente tabla de frecuencia:


Nc Clase f F h H
1 10 5 5 10,40% 10,40%
2 20 7 12 14,60% 25,00%
3 30 10 22 20,80% 45,80% 47
4 40 13 35 27,10% 72,90%
5 50 10 45 20,80% 93,80%
6 60 2 47 4,20% 97,90%
7 70 1 48 2,10% 100%
Total 48 100%

Solución

Paso 1: Localizar entre que clases se encuentra la mediana. Observe que la mediana se encuentra entre las
clases 3 y 4, donde podremos encontrar una frecuencia relativa acumulada del 50%.

Nc Clase f F H H
1 10 5 5 10,4166% 10,4166%
2 20 7 12 14,583% 25,0000%
3 30 10 22 20,8333% 45,8333%
4 40 13 35 27,0830% 72,9166%
5 50 10 45 20,8333%
Entre las clases93,7500%
3 y 4 se
6 60 2 47 4,1667% el punto
encuentra 97,91667%
que
7 70 1 48 2,0833% 100%
divide en dos partes iguales
Total 48 la 100%
cantidad de datos.

Paso 2: Interpolar los datos para encontrar la mediana.

Para llegar al 50% de los datos 𝑀𝑒 =

Ejercicio 9 : De acuerdo al ejercicio 2 correspondiente a la empresa dedicada al transporte de viajeros,


responder: ¿Qué número de kilómetros recorre la mayoría de los vehículos?

Mediana Datos Agrupados: Variables continúas

Paso 1: Obtener la clase de la mediana, es decir, el primer intervalo que cumpla la condición:
𝑛
𝐹𝑖 ≥ 2
Donde n: Número total de datos del conjunto
i: Es el número del intervalo de clase que cumple la condición, i= 1, 2,…, k.
Fi: Frecuencia acumulada del intervalo de clase i
48
Paso 2: Calcular la mediana con la siguiente ecuación:

𝑀𝑒 = 𝐿𝑚 + 𝐼𝑛𝑐𝑟𝑒𝑚𝑒𝑛𝑡𝑜

Siendo Lm: Límite de la clase mediana. Para efectos de fórmula se expresa en términos de LS i-1

El incremento resulta de multiplicar el incremento para llevar la frecuencia al 50% (50% - Hi-1) por el ancho de
la clase (A) sobre la diferencia porcentual entre los límites superiores (Hi-Hi-1):

(0,5 − 𝐻𝑖−1 )
𝑀𝑒 = 𝐿𝑆𝑖−1 + 𝐴.
(𝐻𝑖 − 𝐻𝑖−1 )

Para expresar la fórmula en frecuencias absolutas tenemos que:

𝑛
( − 𝐹𝑖−1 )
𝑀𝑒 = 𝐿𝑆𝑖−1 + 𝐴. 2
𝑓𝑖

Ventajas

 Es estable a los valores extremos.


 Es recomendable para distribuciones muy asimétricas.

Desventajas

 No presenta todo el rigor matemático.


 Se emplea solo en variables cuantitativas.

Ejercicio 10. Determinar la mediana para los datos agrupados del ejercicio 3. Completar la tabla de frecuencias

Clase Intervalo fi Mi Fi hi Hi
1 [ 11,00 - 17,41 ) 8
2 [ 17,41 - 23,81) 6
3 [ 23,81 - 30,21) 2
4 [ 30,21 - 36,61 ) 5
5 [ 36,61 - 43,01 ) 4
6 [ 43,01 - 49,40 ] 5
TOTAL 30

2.4. MODA
Moda (Mo): Indica el valor que más se repite, o la clase que posee mayor frecuencia.

En el caso de que dos valores presenten la misma frecuencia, decimos que existe un conjunto de datos
49
bimodal. Para más de dos modas hablaremos de un conjunto de datos multimodal.

Ejemplo: Moda para datos no agrupados Variables cualitativas

Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la marca de gaseosa que más
consume a la semana:

Marca 1 Marca 2 Marca 1 Marca 1 Marca 1 Marca 3


Marca 1 Marca 3 Marca 1 Marca 2 Marca 1 Marca 1
Marca 2 Marca 1 Marca 3 Marca 3 Marca 2 Marca 1
Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 2
Marca 3 Marca 1 Marca 3 Marca 3 Marca 2 Marca 3

Solución

Paso 1: Determinar las frecuencias de cada valor de la variable.

La marca 1 se repite 15 veces


La marca 2 se repite 6 veces
La marca 3 se repite 9 veces

Paso 2: La moda representa el valor que más se repite. En este caso es la marca 1.

Ejercicio 11. Determinar la moda para el ejercicio 2 , tal y como aparece en la siguiente tabla.
¿Qué número de kilómetros recorre la mayoría de los vehículos?

Xi (En miles de
Frecuencia
Km recorridos)

100 20
120 10
160 60
230 5
250 5
Total 100
Moda Datos Agrupados: Variables continuas

Procedimiento:
50

Paso 1. La Moda estará representada por la clase que posee la más alta frecuencia, denominándose clase
modal.
Paso 2. El cálculo de la Moda se obtiene con la siguiente expresión:
Donde:
𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑆−1 + 𝐴 ∗
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖−1 )
Donde Ls-1 equivale al límite del intervalo donde se encuentra la moda.

Siendo
Donde:
𝑓𝑖−1 es la frecuencia absoluta de la clase anterior en donde se encuentra el dato más frecuente.
𝑓𝑖+1 es la frecuencia absoluta de la clase posterior en donde se encuentra el dato más frecuente.
𝐴𝑖 es la amplitud de la clase en donde se encuentra el dato mas frecuente.

Ejercicio 12 : Para un estudio de retiro voluntario en la empresa minera A se tiene un informe de los años de
servicio de los trabajadores de la empresa en diciembre del año pasado. La tabla adjunta muestra las
categorías correspondientes y sus frecuencias absolutas acumuladas de los datos obtenidos en el estudio:

Frecuencia
Frecuencia Frecuencia
Marca de Frecuencia relativa
Categorías acumulada relativa
clase Mi fi acumulada
Fi hi
Hi
[5 - 10) 10
[10 - 15) 10
[15 - 20) 80
[20 - 25) 180
[25 - 30) 240
[30 - 35) 280
[35 - 40) 290
[40 - 45) 300

a. Completar la tabla de distribución de frecuencia


b. Identificar la unidad de análisis, variable en estudio y tipo de variable.
c. Calcular las medidas de tendencia central e interpretar cada una de ellas.
2.5. Otras medidas de tendencia central

2.5.1 La media geométrica se utiliza para promediar crecimiento geométricos de la variable, o cuando se
51
quiere dar importancia a valores pequeños, o cuando se quiere determinar el valor medio para un conjunto
de porcentajes. Suele utilizarse en negocios y economía para calcular las tasas de cambio promedio, las tasas
de crecimiento promedio o tasas promedio. Se simboliza Mg y se define como la raíz n- ésima de la productoria
de los n valores de la variable.

La Media Geométrica (G) de una variable estadística X positiva es la raíz enésima del producto de n valores de
la variable., se define como:

𝑀𝐺 = 𝑛√𝑋1 𝑋2 ∗ … ∗ 𝑋𝑛

Ejemplo 13

Las tasas de interés de tres bonos son 5%, 7% y 4%.


3
La media geométrica es 𝑀𝐺 = √7 ∗ 5 ∗ 4 = 5,192
La MG da una cifra de ganancia más conservadora

Cuando los datos están agrupados, la media geométrica se define como la raíz n-ésima de la productoria de
los valores de la variable (marca de clase) elevadas cada una de ellas a su correspondiente frecuencia absoluta.

𝑛𝑛 𝑛 𝑛
𝑀𝐺 = √𝑋1 1 ∗ 𝑋2 2 ∗ … ∗ 𝑋𝑛 𝑖

Ejemplo 13 : Hallar la media geométrica de 2, 4, 6, 9, 12, 15

6 6
𝑀𝐺 = √2 ∗ 4 ∗ 6 ∗ 9 ∗ 12 ∗ 15 = √77,760 = 6,53

Ejercicio 14 : Hallar la media geométrica de la siguiente distribución de frecuencias agrupadas.

Distribución de frecuencias agrupadas

Intervalos de Marca
Frecuencias
clase de clase
[0.5 - 1.5) 1 2
[1.5 - 2.5) 2 5
[2.5 - 3.5) 3 8
[3.5 - 4.5) 4 5
TOTAL 20

4
𝑀𝑔 = √12 ∗ 25 ∗ 38 ∗ 45 = 121,1
2.5.2 La media armónica de un conjunto de datos es el reciproco de la media aritmética de los recíprocos de
los números de la serie de datos. Se simboliza Mh y se define como:

1 1 1 1
+ +⋯+
1 𝑋1 𝑋2 𝑋𝑛 ∑ 𝑥 𝑛 52
= = = 𝑀ℎ =
𝑀ℎ 𝑛 𝑛 1

𝑥

Ejercicio 15 : Un obrero se gasta 50 minutos en terminar un producto y otro lo hace en 40 minutos. ¿Cuál es
el tiempo medio requerido para terminar dicho producto?

1
𝑀ℎ = = 44,44
0,0225

El tiempo promedio requerido es de 44,44 minutos

Ejercicio 16: La recuperación de una inversión realizada por la Compañía Constructora durante cuatro años
consecutivos fue de 30%, 20%, −40% y 200%. ¿Cuál es la media geométrica de la recuperación de la inversión?

Ejercicio 17 : La población colombiana durante los últimos años se resume en el siguiente cuadro. Determine:

– ¿Cuál es el incremento anual promedio?

Resumen de Población Colombiana por Año


1985 1990 1995 2000 2005 2010 2015
Total
30.062.200 33.321.757 36.565.456 39.762.707 42.888.592 45.916.802 48.834.000
Población

Fuente: DANE censo ajustado 1985. Censo 2005. Proyecciones para el periodo 2010,2015.

Ejercicio 18: Supóngase que en una carrera de automóviles de relevos, 3 pilotos condujeron 3000 kilómetros,
es decir 1000 kilómetros cada uno, con las siguientes velocidades promedio:

Velocidad
Conductor
promedio (km/h)
A 100
B 120
C 140

Determine el promedio de velocidad


Ejercicios propuestos:
1. Calcular la media, mediana y moda para los siguientes datos:
53

11 5 4
8 9 8
6 11 3
7 10 2
7 3 8

2. Determinar la media, mediana y moda a la siguiente tabla de frecuencia:

Nc Lm Ls f
1 100 150,1 1
2 150,1 200,1 2
3 200,1 250,1 15
4 250,1 300,1 16
5 300,1 350,1 21
6 350,1 400,1 14
7 400,1 450,1 11
8 450,1 500 7
Total 87

3. Para que un producto sea aceptado por su cliente principal, debe cumplir con ciertas especificaciones de
calidad. Una de ellas, radica en que el promedio de longitud de los 20 primeros productos este entre 20 y 20,9
centímetros. Si las medidas son:

22,3 20,4 19,8 19,9 20,1 20,8 21,6 19,8 20,5 23,4
19,6 21,5 18,5 18,7 20,9 21,1 20,1 21,5 22,3 17,9

¿Cumple en el proveedor con las especificaciones del cliente?

4. Calcular la media, mediana y moda para los siguientes datos (agrúpelos en una tabla de frecuencia):

22,1 44,4 32,1


56 29,4 37,7
32,3 29 30,5
45,3 20,7 15,6
41,1 41,2 39,5
20,8 34,1 31,8
21,9 47 25,6 54

5. Calcule y ubique la media, mediana y moda en el siguiente gráfico de ojiva:

6. Calcule la media, mediana y moda a partir del siguiente histograma:

Caso: población y muestra


7. Los ingresos en dólares de 30 hombres elegidos al azar (entre un total de 1000) se muestran a
continuación:

a. Calcule la media aritmética para todos los datos sin agruparlos.


b. Calcule la media aritmética empleando la tabla de frecuencias.
c. ¿Cuál cree usted son las razones de las diferencias entre ambas medias?
d. ¿Explique mediante este ejemplo, la diferencia entre media, mediana y moda?
e. ¿Que representa para usted la moda y mediana (en termino de pesos)?
f. ¿Se puede considerar que la población de 1000 personas tendrán la misma media que la muestra
55
de 30 personas?
45,16 79,85 76,91
88,91 62,59 88,61
68,89 54,33 16,6
19,92 19,48 6,37
58,42 56,7 37,25
83,61 22,07 65,73
99,49 34,2 41,5
92,22 53,2 62,59
58 77,41 47,1
42,16 91,46 45,4
3. Medidas de Posición

Medidas de posición: Son indicadores estadísticos que muestran la frecuencia acumulada hasta un valor k
cualquiera. 56

Las medidas de posición equivalen a los valores que puede tomar una variable caracterizados por agrupar a
cierto porcentaje de observaciones en la muestra o población.

Las medidas de posición son ideales para obtener información adicional a partir de datos resumidos, es
decir, que presentan perdida de información por agrupamiento en intervalos de clase.

Además, las medidas de posición nos permiten dividir a una distribución en distintas partes. Según el
número de partes, estas divisiones tendrán distintos nombres:

 Percentiles: Cuando dividimos una distribución en 100 partes.


 Deciles : Cuando dividimos una distribución en 10 partes.
 Cuartiles: Cuando dividimos una distribución en 4 partes.
 Mediana: Cuando dividimos una distribución en 2 partes.

 Requisitos
 Variables cuantitativas
 Los resultados están ordenados de menor a mayor
 Equivalencias
 Como todas las medidas se refieren al mismo grupo de datos, se pueden hacer
equivalentes entre sí

D1 D2 D3 D4 D5 D6 D7 D8 D9 D10

P10 P20 P30 P40 P50 P60 P70 P80 P90 P100

P25 P75

PERCENTILES Q1 Q2 Q3

Los percentiles representan los valores de la variable que están por debajo de un porcentaje, el cual puede
ser un valor de 1% a 100% ( en otras palabras , el total de los datos es divido en 100 partes iguales).

La notación empleada será:

Pk

Donde k es equivalente al porcentaje de datos acumulados, y Pk es el valor de la variable que representa


dicho porcentaje. Por ejemplo, P5 es el valor de la variable que deja por debajo el 5% de los datos. P78 será
entonces el valor que agrupa el 78% de los datos.
57

DECILES

Para los deciles, tomaremos el total de los datos divididos en 10 partes iguales, por tanto, existirán 10
deciles representado como Dk.

D1= Valor de la variable que agrupa el 10% de los datos.


D2= Valor de la variable que agrupa el 20% de los datos.
D3= Valor de la variable que agrupa el 30% de los datos.
D4= Valor de la variable que agrupa el 40% de los datos.
D5= Valor de la variable que agrupa el 50% de los datos.
D6= Valor de la variable que agrupa el 50% de los datos.
D7= Valor de la variable que agrupa el 70% de los datos.
D8= Valor de la variable que agrupa el 80% de los datos.
D9= Valor de la variable que agrupa el 90% de los datos.
D10= Valor de la variable que agrupa el 100% de los datos.

El histograma con los deciles identificados quedaría como sigue:


58

Las equivalencias entre percentiles y deciles son:

P10=D1
P20=D2
P30=D3
P40=D4
P50=D5 = Me
P60=D6
P70=D7
P80=D8
P90=D9
P100=D10

CUARTILES

Para los cuartiles se toma el total de los datos divididos en 4 partes iguales. Denotaremos el cuartil como Qk.

Q1= Valor de la variable que agrupa el 25% de los datos.


Q2= Valor de la variable que agrupa el 50% de los datos.
Q3= Valor de la variable que agrupa el 75% de los datos.
Q4= Valor de la variable que agrupa el 100% de los datos.

El histograma de ejemplo con los cuartiles identificados quedaría como sigue:


59

Las equivalencias entre percentiles, deciles y cuartiles son:

P25=Q1
P50=D5 =Q2= Me
P75=Q3
P100=D10 =Q4

3.1. Metodología para determinar percentiles, cuartiles, deciles Datos No agrupados


4.
 Paso 1. Ordenar los datos de manera ascendente
 Paso 2. Calcular la posición según el índice k, en donde k es el percentil de interés y n es la cantidad
de elementos

𝑘(𝑛 + 1) ÷ 4

Posición dato 𝑘(𝑛 + 1) ÷ 10

𝑘(𝑛 + 1) ÷ 100

Ejercicio 1 : A continuación se presentan la evaluación de latidos cardíacos de un grupo de 30 personas


después de cierta actividad física. Calcule los siguientes valores:

a) Percentiles: P10; P43; P81


b) Deciles: D2, D4, D8
c) Quartiles: Q1, Q2, Q3
58 70 80 85 88 94
60 74 82 85 91 95
62 75 82 85 91 95 60
64 76 82 87 92 95
68 76 84 88 92 110

3.2. Metodología para determinar percentiles, cuartiles, deciles


Datos agrupados

 Paso 1. Identificar la clase donde se encuentra el percentil i –esimo. Se parte de una tabla de
frecuencias ordenadas por clases.

 Paso 2. Utilizar la fórmula descrita

El percentil k parte desde el límite superior del intervalo anterior al que se encuentra dicho percentil más un
incremento:

𝑃𝑘 = 𝐿𝑠𝑖−1 + 𝐼𝑛𝑐𝑟𝑒𝑚𝑒𝑛𝑡𝑜

El incremento está dado por:

(𝑘 − 𝐻𝑖−1 )
𝑃𝑘 = 𝐿𝑠𝑖−1 + 𝐴 ∗
(𝐻𝑖 − 𝐻𝑖−1 )

Para expresar la fórmula en frecuencias absolutas tenemos que:

(𝑛 ∗ 𝑘 − 𝐹𝑖−1 )
𝑃𝑘 = 𝐿𝑠𝑖−1 + 𝐴 ∗
𝑓𝑖

Ejercicio 2 . La siguiente tabla de frecuencias, corresponde a la edad consultada a 100 personas.

Nc Lm Ls f F h H
1 [5 15) 14 14 14% 14%
2 [15 25) 12 26 12% 26%
3 [25 35) 20 46 20% 46%
4 [35 45) 18 64 18% 64%
5 [45 55) 14 78 14% 78%
6 [55 65) 12 90 12% 90%
7 [65 75) 10 100 10% 100%
TOTAL 100 100%
Podemos concluir fácilmente (con ayuda de las frecuencias acumuladas), que 14 personas (14% del total)
están por debajo de los 15 años (podemos aproximarlo a 15 años), lo cual representaría al percentil 14:

𝑃14 = 15 61

El percentil 5 (P5) no puede ser calculado directamente, pero podemos concluir que dicho valor se
encuentra en el primer intervalo, ya que este acumula el 14% de las personas. No ocurre lo mismo con el
percentil 78 (P78) que aparece directamente en la tabla:

El 78% de las personas consultadas poseen una edad igual o inferior a los 55 años.

a) Determine el P5, P78


b) Determine D3 , D9

3.3. LAS MEDIDAS DE POSICIÓN Y EL GRÁFICO DE OJIVA


El gráfico de ojiva es ideal para mostrar las medidas de posición, ya que esta registra las frecuencias
acumuladas, tanto absolutas como relativas. Analice la siguiente tabla de frecuencia con su respectivo
gráfico de ojiva:

Nc Lm Ls f F h H
1 137 141,1 4 4 10% 10%
2 141,1 145,1 2 6 5% 15%
3 145,1 149,1 10 16 25% 40%
4 149,1 153,1 10 26 25% 65%
5 153,1 157,1 12 38 30% 95%
6 157,1 161,1 2 40 5% 100%
TOTAL 40 100%
62

Grafiquemos el percentil 35 (P35) el cual equivale al valor de la variable de 147,5 (localizado en el intervalo
3). Ubicamos el 35% en el vertical y lo proyectamos al eje horizontal. El área debajo de la curva representa el
35% de los datos.
EJERCICIOS PROPUESTOS

Primer punto: A partir de la siguiente tabla de frecuencia calcular:


63
Nc Lm Ls f F h H
1 [12 15) 13 13 26% 26%
2 [15 18) 11 24 22% 48%
3 [18 21) 9 33 18% 66%
4 [21 24) 7 40 14% 80%
5 [24 27) 6 46 12% 92%
6 [27 30) 4 50 8% 100%
TOTAL 50 100%
a. Percentil 15
b. Percentil 35
c. Percentil 40
d. Percentil 85
e. Decil 2
f. Decil 6
g. Decil 8
h. Cuartil 1
i. Cuartil 2
j. Cuartil 3

Segundo punto: Calcular todos los deciles a partir de los siguientes datos:

10 15 21 20 23 5 14 15
33 21 29 19 5 14 25 25
30 15 1 26 32 22 30 15
28 27 14 16 21 22 39 34
Tercer punto: La siguiente tabla muestra la distribución de frecuencia sobre los ingresos de los trabajadores
de un cargo en particular de varias empresas el sector manufacturero (cifras dadas en miles de pesos).

Nc Lm Ls f
1 [452 460) 37
2 [460 468) 23
3 [468 476) 13
4 [476 482) 8
5 [482 490) 7
6 [490 498] 2
Total 90
a. ¿Cuántas personas ganan menos de $ 470.000?
b. ¿Cuántas personas ganan menos de $ 482.000?
c. ¿Cuántas personas ganan más de $460.

S-ar putea să vă placă și