Sunteți pe pagina 1din 11

Estadística 1

DMAE E003
Prof. Nolfa Núñez - Edmundo Peña

Medidas de Posición

Las medidas de posición se definen bajo el mismo concepto de la mediana, correspondiendo a una generalización de la
100𝑘
misma. Así, las medidas de posición son valores que cumplen con la condición de superar a no más del % de las
𝑟
𝑘
observaciones y de ser superadas al mismo tiempo por no más del 100 (1 − ) % de las observaciones. De lo anterior se
𝑟
tiene:

 Percentiles (Pk) son 99 valores (P1, P2,…, P99) que permiten dividir el conjunto de observaciones en 100 grupos.
 Deciles (Dk) son 9 valores (D1, D2,…, D9) que dividen al conjunto de observaciones en 10 grupos.
 Cuartiles (Qk) son 3 valores (Q1, Q2, Q3) que permiten dividir el conjunto de observaciones en 4 grupos.

De acuerdo a lo anterior:

100k  k
r k % 100 1   % Descripción
r  r
Valor tal que supera a no más del 1% de las
100(1) 1
P1 100 1 % = 1% 100 (1 − ) % = 99% observaciones y es al mismo tiempo superado por
100 100 no más del 99% de las observaciones.
Valor tal que supera a no más del 3% de las
100(3) 3
P3 100 3 % = 3% 100 (1 − ) % = 97% observaciones y es al mismo tiempo superado por
100 100 no más del 97% de las observaciones.
Valor tal que supera a no más del 20% de las
100(2) 2
D2 10 2 % = 20% 100 (1 − ) % = 80% observaciones y es al mismo tiempo superado por
10 10 no más del 80% de las observaciones.
Valor tal que supera a no más del 75% de las
100(3) 3
Q3 4 3 % = 75% 100 (1 − ) % = 25% observaciones y es al mismo tiempo superado por
4 4 no más del 25% de las observaciones.
Valor tal que supera a no más del 25% de las
100(1) 1
Q1 4 1 % = 25% 100 (1 − ) % = 75% observaciones y es al mismo tiempo superado por
4 4 no más del 75% de las observaciones.
Valor tal que supera a no más del 50% de las
100(1) 1
Me 2 1 % = 50% 100 (1 − ) % = 50% observaciones y es al mismo tiempo superado por
2 2 no más del 50% de las observaciones.

2019-1 DMAE E003 06 Medidas de Posicion 16/03/2019


Estadística 2
DMAE E003
Prof. Nolfa Núñez - Edmundo Peña

Antes de describir la forma de calcular un percentil (el procedimiento de cálculo de un decil o cuartil es el mismo), es
necesario mencionar que no existe un único criterio para su ello de tal forma que es frecuente que las aplicaciones
estadísticas arrojen resultados diferentes.

Datos No Agrupados

 Ordenar las observaciones de menor a mayor

𝑘𝑛
 Si es decimal, entonces, tomar la parte entera y calcular 𝑃𝑘 = 𝑥(𝑘𝑛+1)
𝑟 𝑟

𝑥 𝑘𝑛 +𝑥 𝑘𝑛
𝑘𝑛 ( ) ( +1)
𝑟 𝑟
Si es entero, entonces calcular: 𝑃𝑘 =
𝑟 2
Ejemplo: Para los siguientes datos calcular Q1, Q2, Q3

Consideremos los siguientes datos

18 13 16 18 19 16 13 20 16 14 17

Al ordenar los datos

13 13 14 16 16 16 17 18 18 19 20

Para Q1:

kn 11
  2.75
r 4
 Q1  X  nk   X  111 
 X  2.751  X 3  14
 1  1
 r   4 

Para Q2:

kn 2 11 En términos más simples:


  5.5
r 4 𝑛𝑘
Si es un número decimal,
𝑟
 Q2  X  nk   X  112 
 X 5.51  X  6  16 se debe aproximar al entero
 1  1 inmediatamente siguiente
 r   4 

Para Q3:

kn 3 11
  8.25
r 4
 Q3  X  nk   X  113 
 X 8.251  X 9  18
 1  1
 r   4 

2019-1 DMAE E003 06 Medidas de Posicion 16/03/2019


Estadística 3
DMAE E003
Prof. Nolfa Núñez - Edmundo Peña

Ejemplo: Se presentan 20 observaciones del tiempo de falla (en horas), de un material aislante eléctrico.
204 228 252 300 324 444 624 720 816 912
1176 1296 1392 1488 1512 2520 2856 3192 3528 3710
Calcule D1, P75, Q3, P50, P80, P10
Para D1, se tiene:

kn 1  20
 2
r 10
X  120   X  120 
 1    X 3   X  2  252  228
 D1   10   10 
   240
2 2 2

Para P75, se tiene (Notar que P75 es equivalente a Q3):

kn 75  20
  15
r 100
X  X 15 1512  2520
 P75  16   2016
2 2
Para Q3, se tiene:

kn 3  20
  15
r 4
X  X 15 1512  2520
 Q3  16   2016
2 2
Para el caso de P50, que corresponde a la mediana y a Q2

kn 50  20
  10
r 100
X  X 10 1176  912
 P50  11   1044
2 2
P80, el cual corresponde al quintil 4

kn 80  20
  16
r 100
X  X 16 2856  2520
 P80  17   2688
2 2
Ahora, notar que P10 equivale al primer decil (D1)

2019-1 DMAE E003 06 Medidas de Posicion 16/03/2019


Estadística 4
DMAE E003
Prof. Nolfa Núñez - Edmundo Peña

kn 10  20
 2
r 100
X  X 2  252  228
 P10  3   240
2 2

En Excel es posible calcular cuartiles utilizando para las versiones 2007 y anteriores la función CUARTIL(matriz; Cuartil),
donde matriz corresponde a los datos y cuartil es alguno de los siguientes valores: 0=mínimo; 1=primer cuartil; 2=segundo
cuartil; 3=tercer cuartil; 4=máximo. Si se utiliza Excel 2010, se puede utilizar además las funciones CUARTIL.INC o
CUARTIL.EXC, las cuales tienen la misma sintaxis que la función CUARTIL. La diferencia entre una y otra es que CUARTIL.INC
entrega el cuartil incluyendo el valor.

De manera análoga utilizando las funciones PERCENTIL(matriz;k), PERCENTIL.INC(matriz;k) y PERCENTIL.EXC(matriz;k) es


posible calcular percentiles, donde k es un valor entre 0 y 1. Si por ejemplo se desea calcular el percentil 25, k debe ser igual
a 0,25

Ejemplo:

A partir de los datos que se presentan a continuación se ejemplifica el


cálculo de cuartiles usando Excel 2010.

Nótese que las funciones CUARTIL y CUARTIL.INC entregan resultados


coincidentes, sin embargo, si se calculan los cuartiles de manera manual se
puede observar que el tercer cuartil no coincide con el que obtiene al utilizar
cualquiera de estas dos funciones.

NOTA: Recordar que existe más de un algoritmo de cálculo para obtener percentiles, de tal forma que según sea el algoritmo
utilizado, no siempre coincidirán los resultados

2019-1 DMAE E003 06 Medidas de Posicion 16/03/2019


Estadística 5
DMAE E003
Prof. Nolfa Núñez - Edmundo Peña

Datos Agrupados Variable Discreta (sin intervalos)

k n
 Calcular
r
k n x j  x j 1
 Si existe un N j  entonces Fk  , donde x j 1 es el primer valor con frecuencia absoluta acumulada
r 2
k n
mayor a
r
k n
 Si no existe un N j  entonces Fk  x j 1 , donde x j 1 es el primer valor con frecuencia absoluta acumulada
r
Ejemplo: Calcular Q1, Q2, Q3

xi ni Para Q1
Ni
k  n 119 19
8 3 3    4.75  Q1  x j  x 2  9
r 4 4
9 8 11
Para Q2
10 4 15
k  n 2 19 38
11 3 18    9.5  Q2  x j  x 2  9
12 1 19 r 4 4
Para Q3
k  n 3 19 57
   14.25  Q3  x j  x 3  10
r 4 4

xi ni Para Q1
Ni
k  n 1  34 34
10 5 5    8.5  Q1  x j  x 2  20
r 4 4
20 7 12
30 5 17
Para Q2
40 10 27
k  n 2  34 68 x x 30  40 70
50 4 31    17  Q2  3 4    35
60 3 34 r 4 4 2 2 2

Para Q3
k  n 3  34 102
   25.5  Q3  x j  x 4  40
r 4 4

2019-1 DMAE E003 06 Medidas de Posicion 16/03/2019


Estadística 6
DMAE E003
Prof. Nolfa Núñez - Edmundo Peña

Datos Agrupados en intervalos de clase

Para el cálculo de los fractiles y al igual que en el caso de la mediana, en primer término se debe determinar el intervalo
que contiene el fractil deseado, el que corresponde al primer intervalo de clase cuya frecuencia absoluta acumulada es
𝑘𝑛 𝑘𝑛
mayor que , es decir el primer intervalo que cumple la condición 𝑁𝑗 >
𝑟 𝑟
𝑘𝑛
− 𝑁𝑗−1
𝑃𝑘 = 𝐿𝑗−1 + 𝑎𝑗 𝑟
𝑛𝑗

donde: 𝐿𝑗−1 es el límite inferior del intervalo que contiene la fractila.


𝑎𝑗 es la amplitud del intervalo que contiene la fractila.
𝑛𝑗 es la frecuencia absoluta del intervalo que contiene la fractila.
𝑁𝑗−1 es la frecuencia absoluta acumulada del intervalo anterior al que contiene la fractila.

Ejemplo:

La siguiente tabla de distribución de frecuencias, contiene de manera resumida las observaciones del peso de 40 adultos:

𝐿𝑗−1 - 𝐿𝑗 𝑥𝑖 𝑛𝑖 ℎ𝑖 𝑁𝑖 𝐻𝑖
50 - 60 55 7 0.175 7 0.175
60 - 70 65 11 0.275 18 0.450
70 - 80 75 10 0.250 28 0.700
80 - 90 85 4 0.100 32 0.800
90 - 100 95 5 0.125 37 0.925
100 - 110 105 3 0.075 40 1.000
40 1.000

El cálculo del tercer decil para datos agrupados (intervalos de clase) es:

k  n 3  40 120
   12  N j  12
r 10 10

Entonces el intervalo que contiene el tercer decil (D 3) corresponde al segundo intervalo de clase

𝑘𝑛
− 𝑁𝑗−1
𝑃𝑘 = 𝐿𝑗−1 + 𝑎𝑗 𝑟
𝑛𝑗

3  40
7
12  7 5
D3  60  10  10  60  10  60  10  60  10(0.4545)  60  4.545  64.545kg
11 11 11

Diagrama de Caja y Bigotes (Box -and-Whisker Plot)

El diagrama de caja y bigote fue introducido por John Wilder Tukey para el Análisis exploratorio de datos, permitiendo con
el visualizar e ilustrar características relevantes de los datos bajo estudio, en particular, permiten visualizar el Valor máximo,
Tercer cuartil (Q3), Mediana (Me), Primer cuartil (Q1) y el Valor mínimo del conjunto de datos que se está representando.

2019-1 DMAE E003 06 Medidas de Posicion 16/03/2019


Estadística 7
DMAE E003
Prof. Nolfa Núñez - Edmundo Peña

La utilidad de este gráfico pasa por permitir al usuario visualizar la simetría de la distribución, la posición relativa de la
mediana, los cuartiles y extremos de la distribución, visualizar la presencia de datos atípicos que pueden sugerir el uso de
determinados estadígrafos y comparar la misma variable en dos o más muestras distintas. Los valores atípicos son valores
apartados del cuerpo principal de los datos que bien pueden representar los efectos de causas extrañas, como algún error
de medición o registro.

El gráfico consiste en un rectángulo donde el lado más largo muestra el recorrido intercuartílico (R q), el cual es dividido por
una línea que marca la mediana del conjunto de datos. A partir del eje central de la caja se trazan dos líneas o bigotes
(inferior y superior).

El trazado del bigote superior no debe exceder del máximo observado, mientras que el bigote inferior no puede ser menor
al mínimo observado de acuerdo a la siguiente regla:
 Dibuje el bigote superior con una línea hasta la observación con mayor valor comprendido entre Q3 y Q3+1,5Rq.
 Dibuje el bigote inferior con una línea hasta la observación con menor valor comprendido entre Q1 y Q1-1,5Rq.
Las observaciones que se encuentren entre Q1 y Q1-1,5Rq o Q3 y Q3+1,5Rq se consideran aceptables, fuera de estos límites
las observaciones son consideradas atípicas. Si alguna observación se encuentra más allá de los límites Q 1-3Rq o Q3+3Rq, se
considera como un dato aún más atípico (extremo).

Ejemplo:

90; 87; 90; 81; 93; 84; 87; 79; 101; 84; 84; 91; 95; 102; 106; 108; 109; 118;
121; 130; 145; 177; 114; 126; 121; 112; 107; 83; 87; 79; 144

Con los datos presentados más arriba, el gráfico de Caja y Bigote que se
obtiene, considerando como longitud de los bigotes al máximo y mínimo
observado respectivamente.

En la figura se observa con claridad de que la longitud del bigote superior


no es igual a la longitud del bigote inferior, lo cual indica que la distribución
de los datos es asimétrica positiva

Ejemplo:

El Diagrama de Caja y Bigote para los siguientes datos: 90; 87; 90; 81; 93; 84; 87; 79; 101; 84; 84; 91; 95; 102; 106; 108;
109; 118; 121; 130; 145; 177; 114; 126; 121; 112; 107; 83; 87; 79; 144 es:

X22=177 se encuentra entre Q3+1,5RQ y Q3+3RQ por lo tanto se


considera una observación atípica

Como Xmáx=177 > Q3+1,5RQ, el bigote se dibuja hasta el valor


máximo entre el mínimo y Q3+1,5RQ (145)

Q3  118
M e  101
Q1  87
X min  79 X max  177
RQ  118  87  31
Q1  1,5 RQ  87  46,5  40,5
Como Xmín =79 > Q1-1,5RQ, el Q3  1,5 RQ  118  46,5  164,5
bigote se dibuja hasta Xmín
Q1  3RQ  87  93  6
Q3  3RQ  118  93  211
2019-1 DMAE E003 06 Medidas de Posicion 16/03/2019
Estadística 8
DMAE E003
Prof. Nolfa Núñez - Edmundo Peña

Con Infostat, el gráfico de caja y bigotes se obtiene de la siguiente forma:

Este gráfico se puede aplicar sobre uno o varios conjuntos de datos, de esta manera es posible hacer una representación
gráfica por ejemplo de los puntajes PSU promedio de los establecimientos Municipalizados y observar los indicadores
anteriormente señalados, como también representar gráficamente la misma variable pero considerando tanto a
establecimientos municipalizados como particulares pagados y particulares subvencionados, pudiendo con ello observar las
diferencias existentes entre cada uno de estos tipos de establecimientos.

700,00
Promedio Lenguaje y Matemática

600,00


500,00

400,00

300,00 n=31 n=19 n=45

MUNICIPAL PAGADO SUBVENC

DEP

2019-1 DMAE E003 06 Medidas de Posicion 16/03/2019


Estadística 9
DMAE E003
Prof. Nolfa Núñez - Edmundo Peña

1. En un estudio en que se midió la cantidad de plomo, en microgramo por decilitro, en la sangre en 65 niños de 4 a 9 años
de edad, se encontró las medidas de posición siguientes. Interprete cada una según el contexto.

Percentil 40= 7,09

Cuartil 2= 7,87

Decil 9= 11,41

2. Se somete a un examen de salud a 24 mujeres de 17 años para determinar cuántas de ellas se encuentran bajo peso.
Los datos obtenidos son los siguientes:
44 – 52 – 55 – 48 – 52 – 57 – 48 – 54 – 57 – 48 – 54 – 57 – 48 – 54 – 57 – 50 – 55 – 58 – 50 – 55 – 60 – 51 – 55 - 61
Encontrar e interpretar:
a) Mediana
b) Cuartil 1 y cuartil 3
c) Percentil 10 y Percentil 90

2019-1 DMAE E003 06 Medidas de Posicion 16/03/2019


Estadística 10
DMAE E003
Prof. Nolfa Núñez - Edmundo Peña

3. A continuación se relacionan las edades de una muestra de usuarios de un centro de rehabilitación psicoterapéutica:
51- 63 -61 -44- 63 -57 -53 -63- 44- 59 -51 -56 -58 -59- 71- 25- 28 -82 -85- 72- 58- 72- 58
Si se sabe que Q1 = 51, Q2 = 58 y Q3 = 63
a) Encontrar el rango intercuartílico.
b) Encontrar los datos atípicos.
c) Representa mediante un diagrama de cajas la situación. Interpreta brevemente.

2019-1 DMAE E003 06 Medidas de Posicion 16/03/2019


Estadística 11
DMAE E003
Prof. Nolfa Núñez - Edmundo Peña

4. En un examen de salud se mide el nivel de colesterol de 80 pacientes, 40 hombres y 40 mujeres, obteniendo las
siguientes estadísticas

Usando los datos de la salida anterior completar el siguiente gráfico. Indique cuál de las cajas representa el nivel de
colesterol femenino y cuál es el masculino, ubique todos los valores que sean necesarios para la buena interpretación del
gráfico. Interprete.

2019-1 DMAE E003 06 Medidas de Posicion 16/03/2019

S-ar putea să vă placă și