Sunteți pe pagina 1din 60

“La estadística es una ciencia que

demuestra que si mi vecino tiene dos


coches y yo ninguno, los dos tenemos
uno.”
“Las estadísticas son como las
minifaldas: te dan algunas ideas,
pero esconden lo más importante”
Medidas numéricas

• Después de construir tablas y gráficos, a partir de


una colección de datos, se requieren medidas más
exactas.
• La estadística sumaria o de resumen, proporciona
medidas para describir un conjunto de datos.
Medidas numéricas

1. Medidas de Tendencia Central


2. Medidas de posición o de ubicación
3. Medidas de Dispersión
4. Medidas de Forma (Simetría y Kurtósis)
Medidas de tendencia central

• Se refieren a indicadores que tienen una tendencia a


ubicarse al centro de una distribución de datos.
Ejemplo:
Observese que la posición central de la curva A es la
misma que la curva C.
Ejemplo:
11, 18, 10, 16, 08 (C)
12, 14, 15, 13, 09 (A)
54, 58, 60, 65, 55 (B)

© Jorge Córdova
Medidas de tendencia central

• Aquellas que nos indican cual podría ser el valor


medio o representativo de un conjunto de datos
analizados. Llamados “Promedios”.
• Promedios principales:
Media aritmética
Media ponderada
Media geométrica
Media Armónica
Mediana
Moda
Media Aritmética
Es la suma de todas las observaciones dividida entre el
número total de observaciones.

• Por ejemplo:
X = Peso (Kg) de recién nacidos

Xi = 3.6, 3.0, 2.9, 3.8, 3.6, 3.4, 3.8, 3.5

media aritmética=(3.6+3.0+2.9+3.8+3.6+3.4+3.8+3.5)/8
Media = 27.6/8 =3.45
Cálculo de la media aritmética para una
muestra
n
• Para datos no agrupados: x i
X  i 1

n
k

x f i i

• Para datos agrupados: X i 1


n

Donde: xi: punto medio de la clase i (marca de clase)


fi: frecuencia absoluta de la clase i
k: cantidad de clases
Media aritmética para una población

N
Xi
• Todo conjunto de variables
posee una media.   i 1
N

• Suma de las desv. de N


cualquier valor y la media
es cero.
 f i Xi
  i 1
N
• Es afectada por valores
extremos.
Media Aritmética
Para datos no agrupados. n

x i
X i 1
n
Por ejemplo: X = Peso (Kg) de recién nacidos
Xi = 3.6, 3.0, 2.9, 3.8, 3.6, 3.4, 3.8, 3.5
media aritmética=(3.6+3.0+2.9+3.8+3.6+3.4+3.8+3.5)/8
Media = 27.6/8 =3.45
n

x i
X i 1
 27.6 / 8  3.45
n
Media aritmética – datos agrupados
Ejemplo:
La distribución de frecuencias siguiente, representa los
puntajes obtenidos en una evaluación del desempeño,
aplicado al personal técnico de un hospital. El puntaje
máximo en la prueba es 50. Calcule e interprete la
media.
Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Media aritmética – datos agrupados

1. Calcular las marcas de clase (xi); el valor intermedio de cada clase.


2. Sumatoria del producto de cada marca y su respectiva frecuencia
(fi) .
3. Dividir entre la sumatoria de las frecuencias de clase.

Clase
Marca Frecuencia 14 (4)  19 (8)  24 (15 )  29 (23)  34 (10 )
de Clase (xi) Absoluta (fi) x
12 -16 14 4
4  8  15  23  10
17-21 19 8
22- 26 24 15 1575
27-31 29 23
x
60
32- 36 34 10
Total 60 x  26.25 puntos
Interpretación:
Si se elige al azar a un técnico, se espera que tenga un puntaje de
26,25 en su evaluación de desempeño.
Media aritmética

• Ventajas:
• Concepto familiar para muchas personas
• Es única para cada conjunto de datos
• Es posible comparar medias de diferentes muestras
• Desventajas:
• Se ve afectada por los datos extremos.
• Si los datos están agrupados en clases con extremos
abiertos, no es posible calcular la media.
Mediana
• Es el valor que ocupa la posición central de un
conjunto de observaciones, una vez que han
sido ordenados en forma ascendente o
descendente.
• Divide al conjunto de datos en dos partes
iguales.
Cálculo de la mediana
Para datos no agrupados:
Pasos:
1) Ordenar los datos de menor a mayor.
2) Determinar la ubicación de la mediana: (n+1)/2
- Si n es impar, la ubicación de la mediana cae en único
valor.
- Si n es par: la ubicación de la mediana cae en dos
valores.
3) Determinar el valor de la mediana
Para n par, la mediana es la media de los valores que
están ubicados en dos valores.
Mediana
Ejemplo:
Los siguientes datos se refieren a la edad de madres que dieron a luz por
primera vez: 25, 18, 15, 28, 20, 26, 30, 21, 19
1) Primero se ordenan lo datos:
1 2 3 4 5 6 7 8 9
15, 18, 19, 20, 21, 25, 26, 28, 30
2) Ubicación de la mediana = (9+1)/2 = 5
3) Mediana
1 2 3 4 5 6 7 8 9
15, 18, 19, 20, 21 , 25, 26, 28, 30
mediana
4 datos menores 4 datos mayores
Interpretación:
El 50% de las madres que dieron a luz por primera vez, tienen
edades menores que 21 años y otras 50% tuvieron edades
Mediana

Reglas
1º Si la serie es impar, la mediana ocupa el lugar
central de la serie previamente ordenada.
21, 18, 19, 27, 24, 29, 25, 30, 35, 16
1 2 3 4 5 6 7 8 9 10
16 18 19 21 24 25 27 29 30 35
2º Ubicación = (10+1)/2 = 5.5 entre 5 y 6

1 2 3 4 5 6 7 8 9 10
16 18 19 21 24 25 27 29 30 35
3)
24  25
mediana   24.5
2
Mediana

Ventajas:
• Los valores extremos no afectan a la mediana como
en el caso de la media aritmética.
• Es fácil de calcular, interpretar y entender.
• Se puede determinar para datos cualitativos.

Desventajas:
• Como valor central, se debe ordenar primero la
serie de datos.
• Para una serie amplia de datos no agrupados, el
proceso de ordenamiento de los datos demanda
tiempo y usualmente provoca equivocaciones.
Moda
• Observación (dato) que tiene la mayor
frecuencia en un conjunto de observaciones.
• Un conjunto de datos puede ser unimodal,
bimodal o multimodal.
Cálculo de la moda

• Para datos no agrupados: es simplemente la


observación que más se repite.
• Para datos agrupados:
1
Mo  Li  TIC
1   2
Donde: Li: límite inferior de la clase modal.
1: diferencia entre fi de la clase modal y la
anterior.
2: diferencia entre fi de la clase modal y la
posterior.
TIC: amplitud o tamaño de intervalo de la clase modal
(clase de mayor frecuencia).
Moda

Ejemplo:

4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38 21


Selección del promedio apropiado

OBSERVACIÓN DATOS
22, 24, 25, 26, 27, 28,
EDAD
28, 29, 30, 31, 33, 34
INGRESO EN 8, 8.2, 9,10,11,12,
MILES DE $ 12.3,12.5,13,13.5, 86,97
TALLA 39, 40, 41, 41, 41, 41,
ZAPATOS 42, 41, 43, 41, 44, 41
Selección del promedio más adecuado

• La mediana siempre es la posición central.


• La moda se puede emplear cuando se requiere
una idea rápida de la tendencia central.
• La más usada es la media aritmética.
• La más representativa para datos de una
distribución asimétrica es la mediana.
• Media valor de equilibrio de Magnitud .
Mediana valor de equilibrio de Cantidad.
Moda valor con mayor frecuencia.
Medidas de ubicación :Cuartiles, deciles y percentiles

• Medidas de posición.
• Dividen en :
– Cuartiles (Qi)
– Deciles (Di)
– Percentiles (Pi)
• Formulación
semejante a la
mediana.
Selección del promedio más adecuado
CUARTILES: son los tres valores que dividen al conjunto de datos
ordenados en cuatro partes iguales.
25% 25% 25% 25%

Q1 Q2 Q3
DECILES: son los nueve valores que dividen al conjunto de datos
ordenados en diez partes iguales.
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1 D2 D3 D4 D5 D6 D7 D8 D9

PERCENTILES: son 99 valores que dividen el conjunto de datos


ordenados en cien partes iguales.
1% 1% 1% 1% . . . . . 1%

P1 P2 P3 P4 . . . . . P99
Cálculo de la Cuantiles
Pasos:
1) Ordenar los datos de menor a mayor
2) Determinar la ubicación (posición)
Para Cuartiles:
Posición (Qi) = (n+1)i/4, i= 1, 2, 3
Para Deciles:
Posición (Di) = (n+1)i/10, i= 1, 2, 3, 4, 5, 6, 7, 8, 9
Para Percentiles:
Posición (Pi) = (n+1)i/100, i= 1, 2, 3, 4, …, 99
3) Determinar el valor del cuantil
Cuartiles, deciles y percentiles
(Fractiles o cuantiles)
¿Sobre qué edad se ubica el 25% de las madres
primerizas con mayor edad?

75 % 25 %

P75
Menor Mayor
edad edad
Ejemplo
25 18 15 28 20 26 30 21 18 19 27 24 29 25 30 35 21 20 16
23 26 22 17 24 19 27 32 23 25 24 26 28 19 30 33 23 26 21
29 24
Cuartiles

Ejemplo
1) ordenamiento
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 15 17 18 19 20
15 16 17 18 18 19 19 19 20 20 21 21 21 22 23 23 23 24 24 24
21 22 23 24 25 25 27 28 29 30 31 32 33 34 35 36 37 38 39 40
24 25 25 25 26 26 26 26 27 27 28 28 29 29 30 30 30 32 33 35

2) Ubicación del cuartil 3 (Q3) = (40+1)x3/4 = 30,75,


El Q3 se encuentra entre las posiciones 30 y 31

3) Valor del Q3 27  28
Q3   27.5
2
Medidas de dispersión
• Se refieren a la extensión o amplitud de los datos de
una distribución alrededor del promedio aritmético.
• Representan el grado de variabilidad de los datos.
Ejemplo:
Observe que la curva A en el siguiente gráfico tiene
una mayor dispersión que la curva B, a pesar que la
posición central es la misma.

© Jorge Córdova
Medidas de dispersión

• Describen cuan agrupados o separados están los datos


respecto a un valor común (media).
• Permiten juzgar la confiabilidad de la medida de
tendencia central.
• Es posible comparar dispersión de diversas muestras.

Son:
• Rango,
• Varianza,
• Desviación estándar,
• Coeficiente de Variación (CV).
Rango o recorrido

• Diferencia entre el
R  V . max  V . min . valor mayor y el
valor menor de un
comjunto de datos.
• No está afectado
por los valores
comprendidos
entre los extremos.
Rango o recorrido

Ejemplo:
Los siguientes datos representan el peso de 10 niños
al nacer, (en kgs).
Calcule e interprete el rango.
2.86 3.15 3.45 2.95 3.78
4.17 3.92 3.28 4.05 3.12

Rango = (4.17 – 2.86)


Rango = 1.310 Kgs

La diferencia entre el bebe de mayor peso y el bebe


menor peso es 1.310 Kgs.
Rango o recorrido

Ventajas
• fácil de calcular
• fácil de entender e interpretar

Desventajas
• sólo considera los valores extremos
• no toma en cuenta ni el número de datos ni el valor
de estos
Varianza

N
  X  
2

  i 1
2
• Media aritmética de las
desviaciones cuadráticas N
respecto a la media. Poblacion
• Expresada en unidades n
 xi  x 
2
al cuadrado.
• n-1, factor de corrección. S 2  i 1
n1
Muestra
Varianza

Ejemplo:
La siguiente información se refiere a una muestra del
peso (Kg) de niños y niñas recién nacidad:
3,6 3,5 3,1 3,8 3,6 3,4
¿Cuál en el nivel de variabilidad de las ventas?
x Xi  x Xi  x  2
21
3,6 3,6 - 3,5 = 0,1 0,01 x
3,5 3,5 - 3,5 = 0 0 6
3,1 3,1 - 3,5 = -0,4 0,16
3,8 3,8 - 3,5 = 0,3 0,09
3,6 3,6 - 3,5 = 0,1 0,01 x  3.5
3,4 3,4 - 3,5 = -0,1 0,01
 X  21  Xi  x   0  Xi  x 
2
 0.28
Varianza

 Xi  x   0.28
2

 (X i  x )
2

S 
2

n 1

0.28
 
2
S 6 1 0.056 Kilogramos2
Desviación estándar

N
  X i  
2
• Es la raíz cuadrada
 i 1 positiva de la varianza.
N
• Unidades originales.
Poblacion
• Permite medir el % de
n elementos dentro de
 xi  x 
2
intervalos de una curva
i 1
S simétrica.
n1 • Puntaje estándar (Z).
Muestra
Desviación estándar
Ejemplo:
Empleando los mismos datos del ejemplo anterior,
complementemos la información sobre la variabilidad
de los artículos vendidos.
Ya sabemos por el ejemplo anterior que S2 = 0.056
artículos vendidos al cuadrado.
Entonces
S
2
s
S  0.056

S  0.237 Kilogramos
4-15

Interpretación y usos de la Desviación Estándar

• Regla empírica: para una distribución de frecuencias


simétrica de campana:
– Cerca de 68% de las observaciones estará dentro
de ±1σ de la media (μ);
– Cerca de 95% de las observaciones estará dentro
de ±2σ de la media (μ);
– Casi todas (alrededor de 99.7%) las observaciones
estarán dentro de ±3σ de la media (μ).
Distribución Normal

-3σ -2σ -1σ μ +1σ +2σ +3σ


Distribución Normal
34.13% 34.13%

13.60%
13.60%

2.135% 2.135%

0.135% 0.135%

-3σ -2 σ -1σ +1σ +2σ +3σ


μ

68.26%

95.46%

99.73%
Puntaje o Resultado Estándar (Z)

x
Z 

-3σ -2σ -1σ


μ +1σ +2σ +3σ

Z
-3 -2 -1
0 +1 +2 +3
Coeficiente de variación
(variabilidad relativa)

• Indica la magnitud 
CV  *100
relativa de la desviación

estándar con respecto a
la media aritmética. Poblacion
• Comparación de S
distribuciones. CV  *100
x
Muestra
Coeficiente de variación

Ejemplo:
A continuación se presentan una muestra de las edades
de pacientes que acudieron a un centro de salud.

40,70,60,48,52,65,58
Calculamos la media y desviación estándar
Coeficiente de variación
n
Tienda I  Xi 393
x  i 1
  56.14años
n 7

x Xi  x Xi  x  2

40 -16.14 260.50
70 13.86 192.10
60 3.86 14.90
48 -8.14 66.26
52 -4.14 17.14
65 8.86 78.50
58 1.86 3.46

 X  393  Xi  x   0  Xi  x   632,86


2
Coeficiente de variación
Si  Xi  x   632.86
2

 (X i  x )
2

632.86
S i 1
  10.27 años
n 1 7 1

S
CV   100
x
10.27 años
CV  100  18.29%
56.14 años
Coeficiente de variación

CV Grado de Variablidad
0 < CV < 10 Datos muy homogéneos
Datos regularmente
10 ≤ CV < 15
homogéneos
Datos regularmente
15 ≤ CV < 20
variables
20 ≤ CV < 25 Datos variables
CV ≥ 25 Datos muy variables
Medidas de Forma
• Son medidas numéricas que permiten
determinar la forma que tiene la curva de los
datos, por lo tanto, sirven para corroborar lo
que los gráficos muestran.

Coeficiente de Pearson
-Asimetría
Medidas Coeficiente de Fisher
de forma
-Kurtosis o apuntamiento
Distribución Simétrica (Normal o de Gauss)

-3σ -2σ -1σ μ +1σ +2σ +3σ


Asimetría positiva Examen difícil
Salarios
Tiempos de Reacción

Moda Media
Mediana

Examen fácil
Asimetría negativa

Media Moda
Mediana
Sesgo de una distribución

Negativamente Positivamente
Simétrica Sesgada
Sesgada

Media < Mediana < Moda Media = Mediana = Moda Moda < Mediana < Media
Medidas de Forma: Asimetría

Coeficiente de Asimetría de Pearson:


• Fácil de calcular e interpretar.
• Cálculo:

ASP 

3 X  Md 
s

Interpretación:
= 0, Simétrica

ASP > 0, Asimétrica Positiva

< 0, Asimétrica Negativa


Medidas de Forma: Asimetría

Coeficiente de Asimetría de Fisher:


• No es de fácil cálculo, pero si su interpretación.

 x  X 
n
3
i
ASF  i 1
ns 3
Medidas de Forma: Asimetría

Interpretación:
= 0, Simétrica

ASF > 0, Asimétrica Positiva

< 0, Asimétrica Negativa


Medidas de Forma: Kurtosis

• Miden si los valores de la distribución están


más o menos concentrados alrededor de los
valores medios de la muestra (zona central de
la distribución).
• Se definen tres tipos de distribución según su
grado de Kurtosis:
Medidas de la forma: Kurtosis
• Cuando medimos la curtósis nos referimos al grado
de agudeza.
• Pueden ser:
a) Leptocúrtica (concentración al centro)
b) mesocúrtica (distribuidos simétricamente)
c) platicúrtica (aplanada).
Coeficiente de Curtosis

• Grado de concentración con relación a la media


aritmética.
• Se emplea para distribuciones unimodales simétricas.
• Sin unidades.
• Valores (0, ½)
1 𝑄3 − 𝑄1
𝑘𝑢 =
2 𝐷9 − 𝐷1
Medidas de Forma: Kurtosis

 x  X 
n
4
i
CK  i 1
4
3
ns

Interpretación:

=0 Mesocúrtica

CK >0 Leptocúrtica

<0 Platicúrtica
Ejemplo: Medidas de Simetría y Curtosis

Suponga que los datos que se presentan a continuación


corresponden a los gastos diarios en refrigerio (soles)
observados de 32 estudiantes de la UNSM elegidos al
azar.
Calcule los coeficientes de asimetría y de curtosis.
5.2 10.2 7.0 7.1 10.2 8.3 9.4 9.2 6.5 7.1 6.6 7.8 6.8 7.2 8.4 9.6
8.5 5.7 6.4 10.1 8.2 9.0 7.8 8.2 5.3 6.2 9.1 8.6 7.0 7.7 8.3 7.5

3(𝑥 − 𝑚𝑒𝑑) 1 𝑄3 − 𝑄1
𝑆𝑘𝑝 = 𝑘𝑢 =
𝑠 2 𝐷9 − 𝐷1
Medidas de Simetría y Curtosis

251.9
𝑥= = 7.871875 soles 𝑚𝑒 = 7.8007 𝑠𝑜𝑙𝑒𝑠
32
𝑠 = 1.292843 𝑠𝑜𝑙𝑒𝑠
𝑄3 = 𝑃75 = 8.8 𝐷9 = 𝑃90 = 9.664
𝑄1 = 𝑃25 = 7.0 𝐷1 = 𝑃10 = 6.136

3(7.871875 − 7.8007)
𝑆𝑘𝑝 = = 0.165159
1.292843
1 8.8 − 7.0
𝑘𝑢 = = 0.255102
2 9.664 − 6.136
• Los gastos diarios tienen una distribución con sesgo positivo, existen
estudiantes con gastos elevados.
• Regular concentración con respecto al precio promedio.

S-ar putea să vă placă și