Documente Academic
Documente Profesional
Documente Cultură
DMAE E003
Prof. Nolfa Núñez - Edmundo Peña
Medidas de Posición
Las medidas de posición se definen bajo el mismo concepto de la mediana, correspondiendo a una generalización de la
100𝑘
misma. Así, las medidas de posición son valores que cumplen con la condición de superar a no más del % de las
𝑟
𝑘
observaciones y de ser superadas al mismo tiempo por no más del 100 (1 − ) % de las observaciones. De lo anterior se
𝑟
tiene:
Percentiles (Pk) son 99 valores (P1, P2,…, P99) que permiten dividir el conjunto de observaciones en 100 grupos.
Deciles (Dk) son 9 valores (D1, D2,…, D9) que dividen al conjunto de observaciones en 10 grupos.
Cuartiles (Qk) son 3 valores (Q1, Q2, Q3) que permiten dividir el conjunto de observaciones en 4 grupos.
De acuerdo a lo anterior:
100k k
r k % 100 1 % Descripción
r r
Valor tal que supera a no más del 1% de las
100(1) 1
P1 100 1 % = 1% 100 (1 − ) % = 99% observaciones y es al mismo tiempo superado por
100 100 no más del 99% de las observaciones.
Valor tal que supera a no más del 3% de las
100(3) 3
P3 100 3 % = 3% 100 (1 − ) % = 97% observaciones y es al mismo tiempo superado por
100 100 no más del 97% de las observaciones.
Valor tal que supera a no más del 20% de las
100(2) 2
D2 10 2 % = 20% 100 (1 − ) % = 80% observaciones y es al mismo tiempo superado por
10 10 no más del 80% de las observaciones.
Valor tal que supera a no más del 75% de las
100(3) 3
Q3 4 3 % = 75% 100 (1 − ) % = 25% observaciones y es al mismo tiempo superado por
4 4 no más del 25% de las observaciones.
Valor tal que supera a no más del 25% de las
100(1) 1
Q1 4 1 % = 25% 100 (1 − ) % = 75% observaciones y es al mismo tiempo superado por
4 4 no más del 75% de las observaciones.
Valor tal que supera a no más del 50% de las
100(1) 1
Me 2 1 % = 50% 100 (1 − ) % = 50% observaciones y es al mismo tiempo superado por
2 2 no más del 50% de las observaciones.
Antes de describir la forma de calcular un percentil (el procedimiento de cálculo de un decil o cuartil es el mismo), es
necesario mencionar que no existe un único criterio para su ello de tal forma que es frecuente que las aplicaciones
estadísticas arrojen resultados diferentes.
Datos No Agrupados
𝑘𝑛
Si es decimal, entonces, tomar la parte entera y calcular 𝑃𝑘 = 𝑥(𝑘𝑛+1)
𝑟 𝑟
𝑥 𝑘𝑛 +𝑥 𝑘𝑛
𝑘𝑛 ( ) ( +1)
𝑟 𝑟
Si es entero, entonces calcular: 𝑃𝑘 =
𝑟 2
Ejemplo: Para los siguientes datos calcular Q1, Q2, Q3
18 13 16 18 19 16 13 20 16 14 17
13 13 14 16 16 16 17 18 18 19 20
Para Q1:
kn 11
2.75
r 4
Q1 X nk X 111
X 2.751 X 3 14
1 1
r 4
Para Q2:
Para Q3:
kn 3 11
8.25
r 4
Q3 X nk X 113
X 8.251 X 9 18
1 1
r 4
Ejemplo: Se presentan 20 observaciones del tiempo de falla (en horas), de un material aislante eléctrico.
204 228 252 300 324 444 624 720 816 912
1176 1296 1392 1488 1512 2520 2856 3192 3528 3710
Calcule D1, P75, Q3, P50, P80, P10
Para D1, se tiene:
kn 1 20
2
r 10
X 120 X 120
1 X 3 X 2 252 228
D1 10 10
240
2 2 2
kn 75 20
15
r 100
X X 15 1512 2520
P75 16 2016
2 2
Para Q3, se tiene:
kn 3 20
15
r 4
X X 15 1512 2520
Q3 16 2016
2 2
Para el caso de P50, que corresponde a la mediana y a Q2
kn 50 20
10
r 100
X X 10 1176 912
P50 11 1044
2 2
P80, el cual corresponde al quintil 4
kn 80 20
16
r 100
X X 16 2856 2520
P80 17 2688
2 2
Ahora, notar que P10 equivale al primer decil (D1)
kn 10 20
2
r 100
X X 2 252 228
P10 3 240
2 2
En Excel es posible calcular cuartiles utilizando para las versiones 2007 y anteriores la función CUARTIL(matriz; Cuartil),
donde matriz corresponde a los datos y cuartil es alguno de los siguientes valores: 0=mínimo; 1=primer cuartil; 2=segundo
cuartil; 3=tercer cuartil; 4=máximo. Si se utiliza Excel 2010, se puede utilizar además las funciones CUARTIL.INC o
CUARTIL.EXC, las cuales tienen la misma sintaxis que la función CUARTIL. La diferencia entre una y otra es que CUARTIL.INC
entrega el cuartil incluyendo el valor.
Ejemplo:
NOTA: Recordar que existe más de un algoritmo de cálculo para obtener percentiles, de tal forma que según sea el algoritmo
utilizado, no siempre coincidirán los resultados
k n
Calcular
r
k n x j x j 1
Si existe un N j entonces Fk , donde x j 1 es el primer valor con frecuencia absoluta acumulada
r 2
k n
mayor a
r
k n
Si no existe un N j entonces Fk x j 1 , donde x j 1 es el primer valor con frecuencia absoluta acumulada
r
Ejemplo: Calcular Q1, Q2, Q3
xi ni Para Q1
Ni
k n 119 19
8 3 3 4.75 Q1 x j x 2 9
r 4 4
9 8 11
Para Q2
10 4 15
k n 2 19 38
11 3 18 9.5 Q2 x j x 2 9
12 1 19 r 4 4
Para Q3
k n 3 19 57
14.25 Q3 x j x 3 10
r 4 4
xi ni Para Q1
Ni
k n 1 34 34
10 5 5 8.5 Q1 x j x 2 20
r 4 4
20 7 12
30 5 17
Para Q2
40 10 27
k n 2 34 68 x x 30 40 70
50 4 31 17 Q2 3 4 35
60 3 34 r 4 4 2 2 2
Para Q3
k n 3 34 102
25.5 Q3 x j x 4 40
r 4 4
Para el cálculo de los fractiles y al igual que en el caso de la mediana, en primer término se debe determinar el intervalo
que contiene el fractil deseado, el que corresponde al primer intervalo de clase cuya frecuencia absoluta acumulada es
𝑘𝑛 𝑘𝑛
mayor que , es decir el primer intervalo que cumple la condición 𝑁𝑗 >
𝑟 𝑟
𝑘𝑛
− 𝑁𝑗−1
𝑃𝑘 = 𝐿𝑗−1 + 𝑎𝑗 𝑟
𝑛𝑗
Ejemplo:
La siguiente tabla de distribución de frecuencias, contiene de manera resumida las observaciones del peso de 40 adultos:
𝐿𝑗−1 - 𝐿𝑗 𝑥𝑖 𝑛𝑖 ℎ𝑖 𝑁𝑖 𝐻𝑖
50 - 60 55 7 0.175 7 0.175
60 - 70 65 11 0.275 18 0.450
70 - 80 75 10 0.250 28 0.700
80 - 90 85 4 0.100 32 0.800
90 - 100 95 5 0.125 37 0.925
100 - 110 105 3 0.075 40 1.000
40 1.000
El cálculo del tercer decil para datos agrupados (intervalos de clase) es:
k n 3 40 120
12 N j 12
r 10 10
Entonces el intervalo que contiene el tercer decil (D 3) corresponde al segundo intervalo de clase
𝑘𝑛
− 𝑁𝑗−1
𝑃𝑘 = 𝐿𝑗−1 + 𝑎𝑗 𝑟
𝑛𝑗
3 40
7
12 7 5
D3 60 10 10 60 10 60 10 60 10(0.4545) 60 4.545 64.545kg
11 11 11
El diagrama de caja y bigote fue introducido por John Wilder Tukey para el Análisis exploratorio de datos, permitiendo con
el visualizar e ilustrar características relevantes de los datos bajo estudio, en particular, permiten visualizar el Valor máximo,
Tercer cuartil (Q3), Mediana (Me), Primer cuartil (Q1) y el Valor mínimo del conjunto de datos que se está representando.
La utilidad de este gráfico pasa por permitir al usuario visualizar la simetría de la distribución, la posición relativa de la
mediana, los cuartiles y extremos de la distribución, visualizar la presencia de datos atípicos que pueden sugerir el uso de
determinados estadígrafos y comparar la misma variable en dos o más muestras distintas. Los valores atípicos son valores
apartados del cuerpo principal de los datos que bien pueden representar los efectos de causas extrañas, como algún error
de medición o registro.
El gráfico consiste en un rectángulo donde el lado más largo muestra el recorrido intercuartílico (R q), el cual es dividido por
una línea que marca la mediana del conjunto de datos. A partir del eje central de la caja se trazan dos líneas o bigotes
(inferior y superior).
El trazado del bigote superior no debe exceder del máximo observado, mientras que el bigote inferior no puede ser menor
al mínimo observado de acuerdo a la siguiente regla:
Dibuje el bigote superior con una línea hasta la observación con mayor valor comprendido entre Q3 y Q3+1,5Rq.
Dibuje el bigote inferior con una línea hasta la observación con menor valor comprendido entre Q1 y Q1-1,5Rq.
Las observaciones que se encuentren entre Q1 y Q1-1,5Rq o Q3 y Q3+1,5Rq se consideran aceptables, fuera de estos límites
las observaciones son consideradas atípicas. Si alguna observación se encuentra más allá de los límites Q 1-3Rq o Q3+3Rq, se
considera como un dato aún más atípico (extremo).
Ejemplo:
90; 87; 90; 81; 93; 84; 87; 79; 101; 84; 84; 91; 95; 102; 106; 108; 109; 118;
121; 130; 145; 177; 114; 126; 121; 112; 107; 83; 87; 79; 144
Con los datos presentados más arriba, el gráfico de Caja y Bigote que se
obtiene, considerando como longitud de los bigotes al máximo y mínimo
observado respectivamente.
Ejemplo:
El Diagrama de Caja y Bigote para los siguientes datos: 90; 87; 90; 81; 93; 84; 87; 79; 101; 84; 84; 91; 95; 102; 106; 108;
109; 118; 121; 130; 145; 177; 114; 126; 121; 112; 107; 83; 87; 79; 144 es:
Q3 118
M e 101
Q1 87
X min 79 X max 177
RQ 118 87 31
Q1 1,5 RQ 87 46,5 40,5
Como Xmín =79 > Q1-1,5RQ, el Q3 1,5 RQ 118 46,5 164,5
bigote se dibuja hasta Xmín
Q1 3RQ 87 93 6
Q3 3RQ 118 93 211
2019-1 DMAE E003 06 Medidas de Posicion 16/03/2019
Estadística 8
DMAE E003
Prof. Nolfa Núñez - Edmundo Peña
Este gráfico se puede aplicar sobre uno o varios conjuntos de datos, de esta manera es posible hacer una representación
gráfica por ejemplo de los puntajes PSU promedio de los establecimientos Municipalizados y observar los indicadores
anteriormente señalados, como también representar gráficamente la misma variable pero considerando tanto a
establecimientos municipalizados como particulares pagados y particulares subvencionados, pudiendo con ello observar las
diferencias existentes entre cada uno de estos tipos de establecimientos.
700,00
Promedio Lenguaje y Matemática
600,00
500,00
400,00
DEP
1. En un estudio en que se midió la cantidad de plomo, en microgramo por decilitro, en la sangre en 65 niños de 4 a 9 años
de edad, se encontró las medidas de posición siguientes. Interprete cada una según el contexto.
Cuartil 2= 7,87
Decil 9= 11,41
2. Se somete a un examen de salud a 24 mujeres de 17 años para determinar cuántas de ellas se encuentran bajo peso.
Los datos obtenidos son los siguientes:
44 – 52 – 55 – 48 – 52 – 57 – 48 – 54 – 57 – 48 – 54 – 57 – 48 – 54 – 57 – 50 – 55 – 58 – 50 – 55 – 60 – 51 – 55 - 61
Encontrar e interpretar:
a) Mediana
b) Cuartil 1 y cuartil 3
c) Percentil 10 y Percentil 90
3. A continuación se relacionan las edades de una muestra de usuarios de un centro de rehabilitación psicoterapéutica:
51- 63 -61 -44- 63 -57 -53 -63- 44- 59 -51 -56 -58 -59- 71- 25- 28 -82 -85- 72- 58- 72- 58
Si se sabe que Q1 = 51, Q2 = 58 y Q3 = 63
a) Encontrar el rango intercuartílico.
b) Encontrar los datos atípicos.
c) Representa mediante un diagrama de cajas la situación. Interpreta brevemente.
4. En un examen de salud se mide el nivel de colesterol de 80 pacientes, 40 hombres y 40 mujeres, obteniendo las
siguientes estadísticas
Usando los datos de la salida anterior completar el siguiente gráfico. Indique cuál de las cajas representa el nivel de
colesterol femenino y cuál es el masculino, ubique todos los valores que sean necesarios para la buena interpretación del
gráfico. Interprete.