Sunteți pe pagina 1din 54

Tema

5
MEDIDAS RESUMEN

PROMEDIOS
5.1 La estadística de resumen

Después de construir tablas y gráficos, a partir de


una colección de datos, se requieren medidas más
exactas.
La estadística de resumen, proporciona medidas
para describir un conjunto de datos.
Existen tres tipos de medidas de resumen:
• De tendencia central.
• De dispersión.
• De la forma de la distribución.
(A) Las medidas de tendencia central
Se refieren al punto medio de una distribución
Se conocen como medidas de posición
Ejemplo: A partir del gráfico siguiente, se observa que la
posición central de la curva B está a la derecha de la
posición central de las curvas A y C. Observese que la
posición central de la curva A es la misma que la curva C.
(B) Las medidas de dispersión
1.Se refieren a la extensión o amplitud de los datos de
una distribución
2.Representan el grado de variabilidad de los datos.
Ejemplo: Observe que la curva A en el siguiente
gráfico tiene una mayor dispersión que la curva B, a
pesar que la posición central es la misma.
(C) Las medidas de la forma de la curva
Las curvas que representan a un conjunto de datos,
pueden ser analizadas de acuerdo a su:
a) Simetría b) Curtósis

Las curvas simétricas, tienen una forma tal que con una
línea vertical que pase por el punto más alto de la curva,
dividirá el área de esta en dos partes iguales.
Las curvas sesgadas son aquellas cuyos valores están
concentrados en el extremo inferior o superior de la
escala de medición del eje horizontal. La “cola” indica el
tipo de sesgo.
Cuando medimos la curtósis nos referimos al grado de
agudeza. Pueden ser: leptocúrtica (concentración al centro)
mesocúrtica distribuidos simétricamente) o platicúrtica
(aplanada).
5.2 Propiedades de la sumatoria
1ra Regla: La suma de los n términos de una serie
constante, es igual a n veces la constante.
n

c
i 1
i  nc

Ejemplo:
C = 10, n=3
3

 c = 10 + 10 + 10 =
i 1
3 (10) = 30
2da Regla: La suma de los productos de una constante por
una variable, es igual a la constante multiplicada por la
suma de la variable.
n n

 cx
i 1
i  c x i
i 1
Ejemplo:
C = 5, X1 = 2, X2 = 4, X3 = 6
3

 cx
i 1
i  5(2) + 5(4) + 5(6) = 60
3ra Regla: La suma de los valores de una variable más una constante
es igual a la suma de los valores de la variable más n veces esa
constante.

n n
 (x i  c)   x i  nc
1
i i1

Ejemplo:
C =2, x1 =5, x2 =3, x3 =2
3

 (x i  c)  (5 + 2) + (3 + 2) + (2 + 2) = 16
i 1

= (5 + 3 + 2) + 3(2) = 16
5.3 Las medidas de tendencia central

1. En general se denominan promedios.


2. Los más importantes son la media, la mediana y la moda.
Aritmética
Media Geométrica
Medidas de Mediana Armónica
tendencia central Moda

3. También es útil conocer los percentiles (o fractiles).


¿POR QUÉ SON IMPORTANTES LAS MEDIDAS DE
TENDENCIA CENTRAL?
Porque la mayor parte de los conjuntos de datos
muestran una tendencia a agruparse alrededor de un
dato central.
Las medidas de tendencia central son puntos en una
distribución, los valores medios o centrales de ésta
nos ayudan a ubicarla dentro de la escala de medición.
5.3.1 La Media
(A) La media aritmética ( x)
a) Obtención: Se obtiene sumando los valores
registrados y dividiéndolos entre el número de datos.
Ejemplo:
La siguiente tabla muestra el número de reclamos y
quejas presentadas por pacientes en el Servicio de
Emergencias a lo largo de una semana. Calcule e
interprete la media.

Día/Semana Lun Mar Mier Jue Vier Sab


Reclamos/día 8 10 5 12 10 15
8  10  5  12  10  15 60
Media aritmética = 
6 6
x = 10 reclamos
b) Interpretación: Si elige al azar un día de la semana,
se espera que los pacientes del servicio de
emergencia realicen 10 reclamos en ese día.
c) Simbología:
Tamaño Media aritmética
Muestra n x (equis barra)
Población N  (mu)
d) Cálculos a partir de datos no agrupados, se
utilizan las siguientes formulas.
Para una muestra
donde: x : media muestral


n
: suma de todos los datos
 Xi X
x  i 1 i
n : número de datos (muestra)
n

Para una población


N donde:  : media poblacional
 Xi  X : suma de todos los datos
  i 1
i

N N : número de datos (población)


e) Cálculo a partir de datos agrupados.
El cálculo de la media aritmética, cuando los datos
disponibles se encuentran en tablas de distribución de
frecuencias, se realiza utilizando la formula siguiente
n
 Yi ni
x  i 1n
 ni
donde: x :media muestral i 1

ni :frecuencia absoluta de la clase i


yi :marca de la clase i
Ejemplo:
La distribución de frecuencias siguiente, representa los puntajes
obtenidos en una evaluación del desempeño, aplicado al
personal técnico de un Centro de Salud. El puntaje máximo en la
prueba es 50. Calcule e interprete en media.
Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Primero se calcularán las marcas de clase ( y );
i
es decir, el valor intermedio de cada clase
Marca de Frecuencia
clase
clase ( yi ) absoluta(ni)
12 - 16 14 4
17 - 21 19 8
22 - 26 24 15
27 - 31 29 23
32 - 36 34 10
Total 60

x
14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10) x  1575
4 + 8 + 15 + 23 + 10 60
x  26.25
Interpretación: Si se elige al azar a un trabajador técnico de este
hospital, se espera que tenga un puntaje de 26,25 en su
evaluación de desempeño.

f) La media aritmética ponderada ( x p )


donde:
n

w X i i wi = factor de ponderación
xp  i 1
n

w
i 1
i X i = datos
Ejemplo: Una empresa comercializadora de Seguros Médicos
dispone de 3 representantes para la zona de el Golf, cada uno de
los cuales cobra diferente comisión por póliza vendida, y realiza
diferente número de contratos. Calcule e interprete el valor
medio de la comisión

Nº de polizas de Comisión
Vendedor Seguro Médico por venta $
wi Xi
Pedro 30 30
Juan 25 40
Pablo 20 50
30(30)  25(40)  20(50) 2900
xp    $38.67
30  25  20 75

Interpretación:

Si se elige al azar un representante se espera que cobre una


comisión de $38.67 por póliza vendida.
g)Ventajas y desventajas de la media aritmética
Ventajas:
Concepto familiar para muchas personas
Es única para cada conjunto de datos
Es posible comparar medias de diferentes
muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no están
agrupados, su cálculo es tedioso
Si los datos están agrupados en clases con
extremos abiertos, no es posible calcular la
media.
5.3.2 La Mediana
Es la medida que divide en dos subconjuntos iguales a
datos, de tal manera que 50% de los datos es menor a
la mediana y el otro 50% es mayor a la mediana.

a) Obtención: Se obtiene ordenando la serie de datos


(en forma ascendente o descendente) y ubicando el
dato central.
Ejemplo:
Los siguientes datos se refieren al número de pacientes
que llegaron a su cita, después de la hora programada
durante los últimos 11 días en el Servicio de Pediatría.
Calcule e interprete la mediana.
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16

Primero se ordenan lo datos:

5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17


5 datos menores 5 datos mayores
mediana
b) Interpretación: Durante 5 días llegaron menos de 11
pacientes tarde a su cita y durante 5 días, más de 11
pacientes llegaron tarde a su cita.

c) Reglas

1º Si la serie es impar, la mediana ocupa el lugar central de


la serie previamente ordenada.

Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24


2º Si la serie es par, la mediana se obtiene de la semisuma
de los dos valores centrales de la serie previamente
ordenada.

Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34
18  23
mediana   20.5
2
 n  1
3º Sea la serie par o impar, la mediana ocupa el  2  lugar
 
,de la serie previamente ordenada.
d) Cálculo a partir de datos agrupados.

n 

 2 N i 1 
Me  Li   c
donde:  ni 
 
Me : mediana
L i : limite real (o frontera) inferior de la clase
mediana.
n : número total de datos.
N i : suma de todas las frecuencias hasta, pero
sin incluir, la clase mediana.
ni : frecuencia de la clase mediana
c : amplitud de clase
Ejemplo: La tabla siguiente muestra la experiencia laboral
(años) del personal de seguridad que labora en un gran
hospital. Calcule e interprete la mediana.
Lugar de la mediana:
Experiencia Número de
laboral trabajadores Ni
(años) de seguridad
4
 69  (16) 
0-3 4
16
4-7 12
Clase Me  8   2 3
8 - 11 24 40  24 
Mediana
56
 
12 - 15 16
66
16 - 19 10
69  8
 34.5  16  3
20 - 23 3
69
 24 
Mediana = 10,31 años
Interpretación:

La mitad del personal de seguridad que labora en


este hospital tienen una experiencia laboral igual o
menor a 10 años 4 meses. La otra mitad de este
personal tiene una experiencia laboral igual o
mayor a 10 años y 4 meses.
e) Ventajas y desventajas
Ventajas:
Los valores extremos no afectan a la mediana
como en el caso de la media aritmética.
Es fácil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos,
registrados bajo una escala ordinal.
Desventajas:
Como valor central, se debe ordenar primero la
serie de datos.
Para una serie amplia de datos no agrupados, el
proceso de ordenamiento de los datos demanda
tiempo y usualmente provoca equivocaciones.
5.3.3 La Moda

La moda es el valor que más se repite dentro de un


conjunto de datos.
a) Obtención: se obtiene organizando la serie de datos y
seleccionando el o los datos que más se repiten.

Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38


b) Cálculo a partir de datos agrupados

 1 
Mo  L    c
donde:  
i
 1 2
Mo : moda
L : limite real (o frontera) inferior de la clase
i
modal (la de mayor frecuencia)
 : frecuencia de la clase modal menos la
1
frecuencia de la clase anterior
 : frecuencia de la clase modal menos la
2
frecuencia de la clase siguiente
c : amplitud de clase
Las clases mediana y modal pueden coincidir pero
conceptualmente son diferentes.
Ejemplo: La tabla siguiente muestra los errores de facturación
durante un mes, en una Clínica. Calcule e interprete la moda.
Errores de
facturación Días
0-3 6  6
1
Clase
4-7 12
Modal
8 - 11 8  4
Clase modal : (4 - 7)
2
12 - 15 3  6 
Mo  4   3
64
16 - 19 1
Total 30

Mo = 5,8
Interpretación: Durante un mes, el número más frecuente de
errores de facturación en esta clínica es 6.
e) Ventajas y desventajas de la moda.
Ventajas:
Se puede utilizar tanto para datos cualitativos como
cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan una o más
clases abiertas.
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribución amodal).
En otros casos la distribución tiene varias modas, lo
que dificulta su interpretación.
Cuantiles

Son aquellos valores de la variable, que ordenados de menor a


mayor, dividen a la distribución en partes, de tal manera que cada
una de ellas contiene el mismo número de frecuencias.

Los tipos más importantes de cuantiles son:

 Los cuartiles, que dividen a la distribución en cuatro partes


 Los deciles, que dividen a la distribución en diez partes
 Los percentiles, que dividen a la distribución en cien partes
Cuartiles
• Los cuartiles son los 3 valores que dividen la serie de datos en 4
partes iguales. Corresponden a los valores que acumulan el 25%,
50%, 75 % de los datos.
• Para calcular los cuartiles, en primer lugar, debemos tener
ordenado el arreglo de datos de menor a mayor.

• A continuación debe utilizarse la siguiente fórmula que nos señala


la ubicación del cuartil deseado en el arreglo de datos.
r(n  1)
Q r
:
4 ; r=1,2,3

• Es importante señalar que se deben utilizar las mismas reglas para


la búsqueda de deciles, cuando el resultado de la formula da
entero, fracción con decimal 5 o otra forma decimal
CUARTILES PARA DATOS NO
AGRUPADOS
Ejemplo:
Las edades (años) de 12 estudiantes universitarios tomados al azar fueron:
Se
18,solicita
22, 19, la
20,posición del20,
21, 22, 23, cuartil,
19, 24,aplicando la fórmula
22, 21. Calcular de cuartil.
el primer posición:
𝑘(𝑛 + 1)
𝐶𝑘 = k= orden del cuartil
4 n= número
Organizar las informaciones de menor a mayorde datos

𝑘(𝑛 + 1) 1 ∗ (12 + 1)
𝑄1 : = = 3,25
Aplicar la fórmula 4 4

El primer cuartil se encuentra en el término o lugar 3,25. Se


debe interpolar entre las edades 19 y 20; que representan las
posiciones 3 y 4.

El 25% (primer cuartil) de los


𝑄1 = 19 + 0,25 ∗ 20 − 19 = 19,25 𝑎ñ𝑜𝑠
estudiantes tienen 19,25 años o menos .
Cuartiles
• Ahora para calcular los cuartiles para datos agrupados,
debemos recurrir a la siguiente fórmula, idéntica salvo por un
detalle para el cálculo de la mediana para datos agrupados:
 rn 

 4 F i 1 
 
Qr Li   A; r  12,3
 fi 
 
• Donde = limite inferior de la clase decil.
n = nº de datos.
𝐹𝑖−1 = frecuencia acumulada de la clase que antecede a
la clase decil.
A = longitud de clase decil.
= frecuencia absoluta de la clase decil
Cuartiles
• Ej.: Se tiene la siguiente tabla de frecuencia agrupada en 6
clases. Encuentre el tercer cuartil.
Limites Frecuencia Abs. Frecuencia Acum.
49.5 – 59.5 3 3
59.5 – 69.5 7 10
69.5 – 79.5 18 28
79.5 – 89.5 12 40
89.5 – 99.5 8 48
99.5 – 109.5 2 50
• Para comenzar, es necesario encontrar la clase que contiene al
tercer cuartil(r=3), por lo tanto, es necesario encontrar con la
fórmula (r*n)/4 el valor 3*50/4 = 37.5 en la tabla de
frecuencia acumuladas
Deciles
• Dado que este valor se encuentra en la clase 4, esta es
nuestra clase cuartil y se procede a reemplazar en la fórmula
correspondiente:

 37.5  28 
Q3  79.5   12  10  87.41
Deciles
• Los deciles son los 9 valores que dividen la serie de datos en 10
partes iguales. Corresponden a los valores que acumulan el 10%,
20%, ... , 90 % de los datos.
• Para calcular los deciles, en primer lugar, debemos tener ordenado
el arreglo de datos de menor a mayor.

• A continuación debe utilizarse la siguiente fórmula que nos señala


la ubicación del decil deseado en el arreglo de datos.
r(n  1)
Dr : 10 ; r  12,3, 9
• Es importante señalar que se deben utilizar las mismas reglas para
la búsqueda de cuartiles, cuando el resultado de la formula da
entero, fracción con decimal 5 o otra forma decimal
Deciles
• Ej.: Encuentre D₃ y D₇ en el siguiente grupo de datos: 3.2, 5.4,
1.8, 4.3, 4.1, 5.2, 1.7, 6.1, 6.3, 3.2, 3.6, 2.4, 1.9, 4.9, 1.5, 2.2,
0.6, 6.2, 2.6, 3.3

• En primer lugar se debe ordenar el arreglo anterior de datos,


quedando de la siguiente forma: 0.6, 1.5, 1.7, 1.8, 1.9, 2.2,
2.4, 2.6, 3.2, 3.2, 3.3, 3.6, 4.1, 4.3, 4.9, 5.2, 5.4, 6.1, 6.2, 6.3

• D₃ : 3*(20+1)/10 = 6.3 , por regla 3 se redondea a 6 entonces


D₃ = 2.2

• D₇ : 7*(20+1)/10 = 14.7, por regla 3 se redondea a 15


entonces D₇= 4.9
Deciles
• Ahora para calcular los deciles para datos agrupados,
debemos recurrir a la siguiente fórmula, idéntica salvo por un
detalle para el cálculo de la mediana para datos agrupados:
 rn 

 10 F i 1 
Dr Li  f  A; r  12,3, 9
 
 i 
 
• Donde = limite inferior de la clase decil.
n = nº de datos.
𝐹𝑖−1 = frecuencia acumulada de la clase que antecede a
la clase decil.
A = longitud de clase decil.
= frecuencia absoluta de la clase decil
Deciles
• Ej.: Se tiene la siguiente tabla de frecuencia agrupada en 6
clases. Encuentre el séptimo decil.
Limites Frecuencia Abs. Frecuencia Acum.
49.5 – 59.5 3 3
59.5 – 69.5 7 10
69.5 – 79.5 18 28
79.5 – 89.5 12 40
89.5 – 99.5 8 48
99.5 – 109.5 2 50
• Para comenzar, es necesario encontrar la clase que contiene al
séptimo decil (r=7), por lo tanto, es necesario encontrar con la
fórmula (r*n)/10 el valor 7*50/10 = 35 en la tabla de
frecuencia acumuladas
Deciles
• Dado que este valor se encuentra en la clase 4, esta es
nuestra clase decil y se procede a reemplazar en la fórmula
correspondiente:

 35  28 
D7  79.5   12  10  85.3
Percentiles
• Los percentiles son los 99 valores que dividen la serie de datos en
100 partes iguales. Corresponden a los valores que acumulan el 1%,
2 %, ... , 99 % de los datos.
• Para calcular los percentiles, en primer lugar, debemos tener
ordenado el arreglo de datos de menor a mayor.

• A continuación debe utilizarse la siguiente fórmula que nos señala


la ubicación del percentil deseado en el arreglo de datos.
r (n  1)
Pr : 100 ;1,2,3...,99
• Es importante señalar que se deben utilizar las mismas reglas para
la búsqueda de cuartiles, cuando el resultado de la formula da
entero, fracción con decimal 5 o otra forma decimal
Percentiles
• Ej.: Encuentre P₃₀ y P₉₀ en el siguiente grupo de datos: 3.2,
5.4, 1.8, 4.3, 4.1, 5.2, 1.7, 6.1, 6.3, 3.2, 3.6, 2.4, 1.9, 4.9, 1.5,
2.2, 0.6, 6.2, 2.6, 3.3

• En primer lugar se debe ordenar el arreglo anterior de datos,


quedando de la siguiente forma: 0.6, 1.5, 1.7, 1.8, 1.9, 2.2,
2.4, 2.6, 3.2, 3.2, 3.3, 3.6, 4.1, 4.3, 4.9, 5.2, 5.4, 6.1, 6.2, 6.3

• P₃₀ : 30*(20+1)/100 = 6.3 , redondeo a entero más próximo,


entonces P₃₀ se encuentra en la 6 posición y su valor es 2.2

• P₉₀ : 90*(20+1)/100 = 18.9, redondeo a entero más próximo,


entonces P₉₀ se encuentra en la 19 posición y su valor es 6.2
5.3.4 Los Percentiles
Son los valores que dividen en 100 partes iguales a un
conjunto de datos

a) Cálculo: para datos agrupados.

 Kn  Ni 1

 100 
P L  c
K i  ni 
 
donde:
P : percentil
K
K : el percentil buscado
n : número de datos
Ni-1 : frecuencia acumulativa hasta la clase
anterior a la clase donde se ubica el percentil K
n i : frecuencia absoluta de la clase donde se ubica
el percentil K
c : amplitud de clase
Ejemplo:
La tabla muestra la experiencia (en años) de las
enfermeras de un gran centro hospitalario

Experiencia Trabajadores
(años)
0-3 18
4-7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334
¿Sobre qué edad se ubica el 25% de las enfermeras de mayor
experiencia?

75 % 25 %

P75
Menor Mayor
Experiencia Experiencia
K = 75

Kn 75(334)
Lugar del P75    250,5o (de los números ordenados )
100 100

Para saber en cuál clase se halla este dato, se calculó la


frecuencia acumulativa.
Experiencia Nº Trabajadores Frec. Acumulada
(años) ni Ni
0-3 18 18
4-7 42 60 N=248
8 - 11 68 128
12 - 15 120 248 En esta clase
16 - 19 40 288 se localizan del
20 - 23 34 322 249º - 288º
24 - 27 12 334
334

 75(334)  248 
 100  P  16.19 años
P  16 
75  40 3 75
 
Interpretación: Para que una enfermera esté
comprendida dentro del 25% de mayor experiencia
laboral debe tener al menos 16.19 años.

S-ar putea să vă placă și