Documente Academic
Documente Profesional
Documente Cultură
© Jorge Córdova
Medidas de tendencia central
• Por ejemplo:
X = Peso (Kg) de recién nacidos
media aritmética=(3.6+3.0+2.9+3.8+3.6+3.4+3.8+3.5)/8
Media = 27.6/8 =3.45
Cálculo de la media aritmética para una
muestra
n
• Para datos no agrupados: x i
X i 1
n
k
x f i i
N
Xi
• Todo conjunto de variables
posee una media. i 1
N
x i
X i 1
n
Por ejemplo: X = Peso (Kg) de recién nacidos
Xi = 3.6, 3.0, 2.9, 3.8, 3.6, 3.4, 3.8, 3.5
media aritmética=(3.6+3.0+2.9+3.8+3.6+3.4+3.8+3.5)/8
Media = 27.6/8 =3.45
n
x i
X i 1
27.6 / 8 3.45
n
Media aritmética – datos agrupados
Ejemplo:
La distribución de frecuencias siguiente, representa los
puntajes obtenidos en una evaluación del desempeño,
aplicado al personal técnico de un hospital. El puntaje
máximo en la prueba es 50. Calcule e interprete la
media.
Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Media aritmética – datos agrupados
Clase
Marca Frecuencia 14 (4) 19 (8) 24 (15 ) 29 (23) 34 (10 )
de Clase (xi) Absoluta (fi) x
12 -16 14 4
4 8 15 23 10
17-21 19 8
22- 26 24 15 1575
27-31 29 23
x
60
32- 36 34 10
Total 60 x 26.25 puntos
Interpretación:
Si se elige al azar a un técnico, se espera que tenga un puntaje de
26,25 en su evaluación de desempeño.
Media aritmética
• Ventajas:
• Concepto familiar para muchas personas
• Es única para cada conjunto de datos
• Es posible comparar medias de diferentes muestras
• Desventajas:
• Se ve afectada por los datos extremos.
• Si los datos están agrupados en clases con extremos
abiertos, no es posible calcular la media.
Mediana
• Es el valor que ocupa la posición central de un
conjunto de observaciones, una vez que han
sido ordenados en forma ascendente o
descendente.
• Divide al conjunto de datos en dos partes
iguales.
Cálculo de la mediana
Para datos no agrupados:
Pasos:
1) Ordenar los datos de menor a mayor.
2) Determinar la ubicación de la mediana: (n+1)/2
- Si n es impar, la ubicación de la mediana cae en único
valor.
- Si n es par: la ubicación de la mediana cae en dos
valores.
3) Determinar el valor de la mediana
Para n par, la mediana es la media de los valores que
están ubicados en dos valores.
Mediana
Ejemplo:
Los siguientes datos se refieren a la edad de madres que dieron a luz por
primera vez: 25, 18, 15, 28, 20, 26, 30, 21, 19
1) Primero se ordenan lo datos:
1 2 3 4 5 6 7 8 9
15, 18, 19, 20, 21, 25, 26, 28, 30
2) Ubicación de la mediana = (9+1)/2 = 5
3) Mediana
1 2 3 4 5 6 7 8 9
15, 18, 19, 20, 21 , 25, 26, 28, 30
mediana
4 datos menores 4 datos mayores
Interpretación:
El 50% de las madres que dieron a luz por primera vez, tienen
edades menores que 21 años y otras 50% tuvieron edades
Mediana
Reglas
1º Si la serie es impar, la mediana ocupa el lugar
central de la serie previamente ordenada.
21, 18, 19, 27, 24, 29, 25, 30, 35, 16
1 2 3 4 5 6 7 8 9 10
16 18 19 21 24 25 27 29 30 35
2º Ubicación = (10+1)/2 = 5.5 entre 5 y 6
1 2 3 4 5 6 7 8 9 10
16 18 19 21 24 25 27 29 30 35
3)
24 25
mediana 24.5
2
Mediana
Ventajas:
• Los valores extremos no afectan a la mediana como
en el caso de la media aritmética.
• Es fácil de calcular, interpretar y entender.
• Se puede determinar para datos cualitativos.
Desventajas:
• Como valor central, se debe ordenar primero la
serie de datos.
• Para una serie amplia de datos no agrupados, el
proceso de ordenamiento de los datos demanda
tiempo y usualmente provoca equivocaciones.
Moda
• Observación (dato) que tiene la mayor
frecuencia en un conjunto de observaciones.
• Un conjunto de datos puede ser unimodal,
bimodal o multimodal.
Cálculo de la moda
Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15
OBSERVACIÓN DATOS
22, 24, 25, 26, 27, 28,
EDAD
28, 29, 30, 31, 33, 34
INGRESO EN 8, 8.2, 9,10,11,12,
MILES DE $ 12.3,12.5,13,13.5, 86,97
TALLA 39, 40, 41, 41, 41, 41,
ZAPATOS 42, 41, 43, 41, 44, 41
Selección del promedio más adecuado
• Medidas de posición.
• Dividen en :
– Cuartiles (Qi)
– Deciles (Di)
– Percentiles (Pi)
• Formulación
semejante a la
mediana.
Selección del promedio más adecuado
CUARTILES: son los tres valores que dividen al conjunto de datos
ordenados en cuatro partes iguales.
25% 25% 25% 25%
Q1 Q2 Q3
DECILES: son los nueve valores que dividen al conjunto de datos
ordenados en diez partes iguales.
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1 D2 D3 D4 D5 D6 D7 D8 D9
P1 P2 P3 P4 . . . . . P99
Cálculo de la Cuantiles
Pasos:
1) Ordenar los datos de menor a mayor
2) Determinar la ubicación (posición)
Para Cuartiles:
Posición (Qi) = (n+1)i/4, i= 1, 2, 3
Para Deciles:
Posición (Di) = (n+1)i/10, i= 1, 2, 3, 4, 5, 6, 7, 8, 9
Para Percentiles:
Posición (Pi) = (n+1)i/100, i= 1, 2, 3, 4, …, 99
3) Determinar el valor del cuantil
Cuartiles, deciles y percentiles
(Fractiles o cuantiles)
¿Sobre qué edad se ubica el 25% de las madres
primerizas con mayor edad?
75 % 25 %
P75
Menor Mayor
edad edad
Ejemplo
25 18 15 28 20 26 30 21 18 19 27 24 29 25 30 35 21 20 16
23 26 22 17 24 19 27 32 23 25 24 26 28 19 30 33 23 26 21
29 24
Cuartiles
Ejemplo
1) ordenamiento
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 15 17 18 19 20
15 16 17 18 18 19 19 19 20 20 21 21 21 22 23 23 23 24 24 24
21 22 23 24 25 25 27 28 29 30 31 32 33 34 35 36 37 38 39 40
24 25 25 25 26 26 26 26 27 27 28 28 29 29 30 30 30 32 33 35
3) Valor del Q3 27 28
Q3 27.5
2
Medidas de dispersión
• Se refieren a la extensión o amplitud de los datos de
una distribución alrededor del promedio aritmético.
• Representan el grado de variabilidad de los datos.
Ejemplo:
Observe que la curva A en el siguiente gráfico tiene
una mayor dispersión que la curva B, a pesar que la
posición central es la misma.
© Jorge Córdova
Medidas de dispersión
Son:
• Rango,
• Varianza,
• Desviación estándar,
• Coeficiente de Variación (CV).
Rango o recorrido
• Diferencia entre el
R V . max V . min . valor mayor y el
valor menor de un
comjunto de datos.
• No está afectado
por los valores
comprendidos
entre los extremos.
Rango o recorrido
Ejemplo:
Los siguientes datos representan el peso de 10 niños
al nacer, (en kgs).
Calcule e interprete el rango.
2.86 3.15 3.45 2.95 3.78
4.17 3.92 3.28 4.05 3.12
Ventajas
• fácil de calcular
• fácil de entender e interpretar
Desventajas
• sólo considera los valores extremos
• no toma en cuenta ni el número de datos ni el valor
de estos
Varianza
N
X
2
i 1
2
• Media aritmética de las
desviaciones cuadráticas N
respecto a la media. Poblacion
• Expresada en unidades n
xi x
2
al cuadrado.
• n-1, factor de corrección. S 2 i 1
n1
Muestra
Varianza
Ejemplo:
La siguiente información se refiere a una muestra del
peso (Kg) de niños y niñas recién nacidad:
3,6 3,5 3,1 3,8 3,6 3,4
¿Cuál en el nivel de variabilidad de las ventas?
x Xi x Xi x 2
21
3,6 3,6 - 3,5 = 0,1 0,01 x
3,5 3,5 - 3,5 = 0 0 6
3,1 3,1 - 3,5 = -0,4 0,16
3,8 3,8 - 3,5 = 0,3 0,09
3,6 3,6 - 3,5 = 0,1 0,01 x 3.5
3,4 3,4 - 3,5 = -0,1 0,01
X 21 Xi x 0 Xi x
2
0.28
Varianza
Xi x 0.28
2
(X i x )
2
S
2
n 1
0.28
2
S 6 1 0.056 Kilogramos2
Desviación estándar
N
X i
2
• Es la raíz cuadrada
i 1 positiva de la varianza.
N
• Unidades originales.
Poblacion
• Permite medir el % de
n elementos dentro de
xi x
2
intervalos de una curva
i 1
S simétrica.
n1 • Puntaje estándar (Z).
Muestra
Desviación estándar
Ejemplo:
Empleando los mismos datos del ejemplo anterior,
complementemos la información sobre la variabilidad
de los artículos vendidos.
Ya sabemos por el ejemplo anterior que S2 = 0.056
artículos vendidos al cuadrado.
Entonces
S
2
s
S 0.056
S 0.237 Kilogramos
4-15
13.60%
13.60%
2.135% 2.135%
0.135% 0.135%
68.26%
95.46%
99.73%
Puntaje o Resultado Estándar (Z)
x
Z
Z
-3 -2 -1
0 +1 +2 +3
Coeficiente de variación
(variabilidad relativa)
• Indica la magnitud
CV *100
relativa de la desviación
estándar con respecto a
la media aritmética. Poblacion
• Comparación de S
distribuciones. CV *100
x
Muestra
Coeficiente de variación
Ejemplo:
A continuación se presentan una muestra de las edades
de pacientes que acudieron a un centro de salud.
40,70,60,48,52,65,58
Calculamos la media y desviación estándar
Coeficiente de variación
n
Tienda I Xi 393
x i 1
56.14años
n 7
x Xi x Xi x 2
40 -16.14 260.50
70 13.86 192.10
60 3.86 14.90
48 -8.14 66.26
52 -4.14 17.14
65 8.86 78.50
58 1.86 3.46
(X i x )
2
632.86
S i 1
10.27 años
n 1 7 1
S
CV 100
x
10.27 años
CV 100 18.29%
56.14 años
Coeficiente de variación
CV Grado de Variablidad
0 < CV < 10 Datos muy homogéneos
Datos regularmente
10 ≤ CV < 15
homogéneos
Datos regularmente
15 ≤ CV < 20
variables
20 ≤ CV < 25 Datos variables
CV ≥ 25 Datos muy variables
Medidas de Forma
• Son medidas numéricas que permiten
determinar la forma que tiene la curva de los
datos, por lo tanto, sirven para corroborar lo
que los gráficos muestran.
Coeficiente de Pearson
-Asimetría
Medidas Coeficiente de Fisher
de forma
-Kurtosis o apuntamiento
Distribución Simétrica (Normal o de Gauss)
Moda Media
Mediana
Examen fácil
Asimetría negativa
Media Moda
Mediana
Sesgo de una distribución
Negativamente Positivamente
Simétrica Sesgada
Sesgada
Media < Mediana < Moda Media = Mediana = Moda Moda < Mediana < Media
Medidas de Forma: Asimetría
ASP
3 X Md
s
Interpretación:
= 0, Simétrica
x X
n
3
i
ASF i 1
ns 3
Medidas de Forma: Asimetría
Interpretación:
= 0, Simétrica
x X
n
4
i
CK i 1
4
3
ns
Interpretación:
=0 Mesocúrtica
CK >0 Leptocúrtica
<0 Platicúrtica
Ejemplo: Medidas de Simetría y Curtosis
3(𝑥 − 𝑚𝑒𝑑) 1 𝑄3 − 𝑄1
𝑆𝑘𝑝 = 𝑘𝑢 =
𝑠 2 𝐷9 − 𝐷1
Medidas de Simetría y Curtosis
251.9
𝑥= = 7.871875 soles 𝑚𝑒 = 7.8007 𝑠𝑜𝑙𝑒𝑠
32
𝑠 = 1.292843 𝑠𝑜𝑙𝑒𝑠
𝑄3 = 𝑃75 = 8.8 𝐷9 = 𝑃90 = 9.664
𝑄1 = 𝑃25 = 7.0 𝐷1 = 𝑃10 = 6.136
3(7.871875 − 7.8007)
𝑆𝑘𝑝 = = 0.165159
1.292843
1 8.8 − 7.0
𝑘𝑢 = = 0.255102
2 9.664 − 6.136
• Los gastos diarios tienen una distribución con sesgo positivo, existen
estudiantes con gastos elevados.
• Regular concentración con respecto al precio promedio.