Documente Academic
Documente Profesional
Documente Cultură
MEDIDAS DE RESUMEN
Aquellas que con un solo valor representan y describen las características relevantes de la
variable. Las más usuales son:
A. MEDIDAS DE TENDENCIA CENTRAL
B. MEDIDAS DE ´POSICION O CUANTILES
C. MEDIDAS DE DISPERSION
D. MEDIDAS DE FORMA
A. MEDIDAS DE TENDENCIA CENTRAL
Son medidas que tienden al centro de la distribución. Las mas usuales son:
MEDIA ARITMETICA
MEDIANA
MODA
MEDIA ARITMETICA
�x i
X = i =1
n
Donde:
X : Media aritmética de la muestra
xi : valos de las observaciones individuales
n: N° total de datos
Datos no agrupados(Tablas de frecuencias)
K
�y n i i
Y = i =1
n
Y : : Media aritmética de la muestra
yi : Clase o marca de clase i- esima
ni : Frecuencia absoluta simple de la clase o marca de clase
EJEMPLOS
1. Calcular e interpretar el promedio de una muestra de las edades de 12 estudiantes:
15 10 25 30 13 16 19 22 24 17 28 23
SOLUCION:
Cálculos según la formula a usar:
n=
n
�x
i =1
i =
�x i
X = i =1
= =
n
Interpretacion:
En promedio los estudiantes tienen…………años de edad, aproximadamente.
TOTAL
SOLUCION:
1°) disposición de la información en la siguiente tabla, según la formula:
CALIFICACIONES
Y ´
i 1 Y ´i Yi ni Y*ni
TOTAL
�y n i i
Y = i =1
= =
n
Interpretacion:
LA MEDIANA
Es Aquella medida que divide a un conjunto de datos ordenados en dos partes
aproximadamente iguales a 50%. Se calcula de la siguiente manera:
Datos no agrupados: a
a) Si n es un numero impar: el valor de la mediana es el valor que ocupa la posición
n+1
2
Me = x n +1
2
b) Si n es un numero par: el valor de la mediana es la media aritmética de los
n n+2
valores que ocupan las posiciones y
2 2
xn + xn+2
Me = 2 2
2
Datos no agrupados (Tablas de frecuencias)
n
: Factor de localización de la Me
2
N j 1 : Frecuencia absoluta acumulada del intervalo anterior que contiene a la
mediana
ni : Frecuencia absoluta simple del intervalo mediano
LI: Limite inferior del intervalo que contiene a la mediana
C j : Limite inferior del intervalo que contiene a la mediana.
PROPIEDADES DE LA MEDIANA
EJEMPLOS:
15 10 25 30 13 16 19 22 24 17 28 23
SOLUCION:
X j :10, 13, 15, 16, 17, 19, 22, 23, 24, 25, 28, 30
X n+2 =
Segundo valor central:
2
Interpretación:
SOLUCIÓN:
CALIFICACIONES
Y ´
i 1 Y ´i ni Ni
TOTAL --
2°) Cálculos:
n 35
= = 17,5 , esta contenido en N j =
2 2
N j 1 =
nj =
LI=
Cj =
Luego, la mediana de la información será:
n / 2 N j 1 �
�
Me = LI + � �* C j =
� nj �
Interpretación:
LA MODA
Es el valor mas frecuente en una serie de datos. Una distribución de datos puede o no tener
moda.
Si una distribución no tiene moda, esta se denomina distribución AMODAL.
Si una distribución tiene una moda, esta se denomina distribución UNIMODAL
Si una distribución tiene dos o mas modas, esta se denomina distribución MULTIMODAL.
La moda se calcula de la siguiente manera:
EN DATOS NO AGRUPADOS
Valor (ó valores) de la variable con mayor frecuencia
EN DATOS AGRUPADOS
� d �
M O = LI + � 1 �* C j
d1 + d 2 �
�
Donde:
nj :
Máxima frecuencia (factor de localización de la moda)
d1 = n j n j 1
d1 = n j n j +1
LI : Limite inferior del intervalo que contiene a la moda
Cj
: Amplitud del intervalo que contiene a la moda
PROPIEDADES DE LA MODA
La moda se puede usar como una localización tanto para datos cualitativos como
cuantitativos
EJEMPLOS:
1. Calcular e interpretar la moda en la siguiente distribución de datos:
X j :10, 13, 15, 16, 17, 19, 22, 23, 24, 25, 28, 30, 15
M O = 15
Interpretacion: la edad que se repite con mayor frecuencia es de 15 años.
SOLUCIÓN:
CALIFICACIONES
Y ´
i 1 Y ´i ni
TOTAL
2°) Cálculos:
nj =
d1 = n j n j 1 =
d1 = n j n j +1 =
LI =
Cj =
� d �
M O = LI + � 1 �* C j
d1 + d 2 �
�
Interpretacion:
1. EN DISTRIBUCIONES SIMETRICAS
Una distribución es simetrica, cuando cada par de valores equidistantes de un valor
central, tienen las mismas frecuencias.
En las distribuciones simétricas la media, mediana y moda son iguales. Es decir:
X = Me = Mo
En este tipo de distribuciones la media aritmética es la más adecuada.
2. EN DISTRIBUCIONES ASIMETRICAS
2.1. EN DISTRIBUCIONES ASIMETRICAS SESGADAS A LA DERECHA, SE
TIENE LA RELACION:
X > Me > Mo
Gráficamente:
X < Me < Mo
Gráficamente:
LOS CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
aproximadamente iguales a 25%. Se denotan por Qi ; con i=1,2,3
Gráficamente:
Q1 : Es el PRIMER CUARTIL, significa que el 25% de los datos son menores o iguales a él; y
el 75% restante son mayores que él.
Q2 : es la MEDIANA
Q3 : Es el TERCER CUARTIL, significa que el 75% de los datos son menores o iguales a él;
y el 25% restante son mayores que él.
�n + 1 �
ii) Si i * � �no es un entero, se hace una interpolación lineal entre los dos valores
�4 �
correspondientes a las dos observaciones entre los cuales se encuentra la fracción.
LOS DECILES
Los deciles son los nueve valores que dividen al conjunto de datos ordenados en diez partes
aproximadamente iguales a 10%. Se denotan por Di ; con i=1,2,....,9
Gráficamente:
D1 : Es el PRIMER DECIL, significa que el 10% de los datos son menores o iguales a él; y el
90% restante son mayores que él.
D5 : es la MEDIANA
.
.
.
D9 : Es el NOVENO DECIL, significa que el 90% de los datos son menores o iguales a él; y
el 10% restante son mayores que él.
�n + 1 �
iv) Si i * � �no es un entero, se hace una interpolación lineal entre los dos valores
�10 �
correspondientes a las dos observaciones entre los cuales se encuentra la fracción.
CALCULO EN DATOS AGRUPADOS:
�n �
�i N j 1 �
Di = LI + �10 �c j i = 1, 2, ... , 9 ,
� n j �
� �
Donde:
LI = Límite real inferior de la clase del decil i
in
Factor de localización del
10
N j 1 = Frecuencia acumulada de la clase que antecede a la clase del decil i.
LOS PERCENTILES
Los percentiles son los noventinueve valores que dividen al conjunto de datos ordenados en
CIEN partes aproximadamente iguales a 1%. Se denotan por Pi ; con i=1,2,....,99
Gráficamente:
P1 : Es el PRIMER DECIL, significa que el 1% de los datos son menores o iguales a él; y el
99% restante son mayores que él.
P50 : es la MEDIANA
.
.
.
D99 : Es el NOVENTINUEVE PERCENTIL, significa que el 99% de los datos son menores
o iguales a él; y el 1% restante son mayores que él.
CALCULO EN DATOS NO AGRUPADOS:
Procedimiento:
1°) Ordenamiento ascendente de los datos
�n + 1 �
2° Localización del punto de posición que corresponde a la i * � � observación
�100 �
ordenada.
�n + 1 � P = X �n +1 �
v) Si i * � �es un entero, entonces i i*� �
�100 � �100 �
�n + 1 �
vi) Si i * � �no es un entero, se hace una interpolación lineal entre los dos valores
�100 �
correspondientes a las dos observaciones entre los cuales se encuentra la fracción.
SOLUCION
Procedimiento:
1°) Ordenamiento ascendente de los datos
X j :10, 13, 15, 16, 17, 19, 22, 23, 24, 25, 28, 30, 32
�n + 1 �
2° Localización del punto de posición que corresponde a la i * � � observación
�4 �
ordenada.
�n + 1 � 13 + 1
i *� �= = 3,5 , no es un entero
�4 � 4
Haremos una interpolación para encontrar el valor del Q1
3� � 15
Q1 15 3,5 3
3,5 � Q1 = Q1 = 15,5
16 15 43
4� � 16
INTERPRETACION:
�n + 1 �
2° Localización del punto de posición que corresponde a la 7 * � � observación
�10 �
ordenada.
�n + 1 � 13 + 1
i *� �= 7 = 9,8 , no es un entero
�4 � 10
D7 24 9,8 9
9,8 � D7 = Q1 = 24,8
25 24 10 9
10� � 25
INTERPRETACION:
�n + 1 �
2° Localización del punto de posición que corresponde a la 60 * � � observación
�100 �
ordenada.
�n + 1 � 13 + 1
60 * � �= 60 = 8, 4 , no es un entero
�100 � 100
P60 22 8, 4 8
8, 4 � P60 = Q1 = 22,8
23 22 98
9� � 23
INTERPRETACION:
CALIFICACIONES
Y
ni
Ni
´
i 1 Y ´i
TOTAL --
2°) Cálculos:
n 35
3 = 3 = , esta contenido en N j =
4 4
N j 1 =
nj =
LI=
Cj =
Luego, el tercer cuartil de la información será:
� n �
3* N j 1 �
�
Q3 = LI + � 4 �c j =
� n j �
� �
INTERPRETACION:
� n �
8 * N j 1 �
� 10
CALCULO DEL OCTAVO DECIL: D8 = LI + � �c j
� nj �
� �
1°) Disposición de la información según la formula de aplicación.
CALIFICACIONES
Y
ni
Ni
´
i 1 Y ´
i
TOTAL --
2°) Cálculos:
n 35
8 = 8 = , esta contenido en N j =
10 10
N j 1 =
nj =
LI=
Cj =
Luego, el OCTAVO DECIL de la información será:
� n �
8 * N j 1 �
�
D8 = LI + � 10 �c j =
� nj �
� �
INTERPRETACION:
� n �
90 *
� N j 1 �
100
CALCULO DEL PERCENTIL NOVENTA: P90 = LI + � �c j
� n j �
� �
1°) Disposición de la información según la formula de aplicación.
CALIFICACIONES
Y Y ´i
ni
´ Ni
i 1
TOTAL --
2°) Cálculos:
n 35
90 = 90 = , esta contenido en N j =
100 100
N j 1 =
nj =
LI=
Cj =
Luego, el percentil noventa será:
� n �
� 100 N j 1 �
90 *
P90 = LI + � �cj =
� nj �
� �
INTERPRETACION:
C. MEDIDAS DE DISPERSIÓN
Son medidas que expresan el alejamiento o acercamiento de cada uno de los datos con
respecto a la media aritmética
�( x i X )2
s2 = i =1
2
�n
n
�
� x ��xi 2
i �
FORMULA PRÁCTICA: SX =
2 i =1
�i =1 �
n �n �
� �
� �
�( y i Y ) 2 * ni
s2 = i =1
n
2
�K
K
�
� y * ni ��yi * ni 2
i �
FORMULA PRÁCTICA: S y2 = i =1 �i =1 �
n � n �
� �
� �
PROPIEDADES DE LA VARIANZA
2
K
�K �
� y2
i * ni ��yi * ni �
Sy = i =1
�i =1 �
n � n �
� �
� �
Si:
CV ( X )% �50% , la distribución tiene una BAJA dispersión, y consecuentemente la
media aritmética tiene una ALTA REPRESENTATIVIDAD.
MEDIDAS DE ASIMETRÍA
Son aquellas medidas que miden e indican el grado de deformación de las distribuciones
de frecuencias con respecto al eje horizontal del sistema de coordenadas. Una de las
medidas más importantes es el coeficiente de asimetría de Pearson, que se calcula de la
siguiente manera:
X Mo
CA =
S
Si:
CA > 0, La distribución es asimétrica a la derecha (la distribución tiene cola a la
derecha)
CA = 0, La distribución es simétrica
EJEMPLOS:
Solución:
CALIFICACIONES Yi
Y
ni
Ni
´
i 1 Y ´
i
TOTAL
CALCULO DE LA VARIANZA:
1°) Disposición de la información según la formula practica a aplicar:
CALIFICACIONES Yi ni Yi 2 * ni
Y ´
i 1 Y ´i
Yi * ni
TOTAL
La varianza es:
2
K
�K �
� y * ni ��yi * ni
2
i �
S y2 = i =1 �i =1 �=
n � n �
� �
� �
Interpretación:
CALCULO DE LA DESVIACIÓN ESTANDAR:
S y = S y2 =
Interpretación:
Sy
CV ( y % = *100 =
Y
Interpretación:
Y Mo
CA = =
SY
Interpretación: