Documente Academic
Documente Profesional
Documente Cultură
Unidad:
Video
Medidas de dispersión, de
Imagen posición y de forma
docent
e
Logro
Al finalizar la unidad, el estudiante calcula e interpreta las
medidas de dispersión, de posición (cuantiles) y las medidas de
forma (asimetría y curtosis) para datos agrupados y no
agrupados.
Importancia
Es importante conocer e interpretar la variabilidad de los datos,
correspondientes a una variable de estudio. Así como también,
identificar que porcentaje de datos dentro de una distribución
de frecuencias son menores o mayores a un valor de dato
específico. Y finalmente, conocer la forma de la distribución de
los datos.
Contenido general
• Medidas de dispersión
• Medidas de posición
• Medidas de forma
Tema: Medidas de dispersión
Medidas de dispersión
Son cantidades que miden el grado en que los datos numéricos tienden a
extenderse alrededor de un valor medio.
Medidas de dispersión
La importancia que tienen es porque proporcionan más información que permite
juzgar la confiabilidad de las medidas de tendencia central. Si los datos están muy
dispersos, las medidas de tendencia central son menos representativas de los
datos que cuando están más agrupadas alrededor de la media.
Rango o recorrido de la
variable
PRINCIPALES MEDIDAS
Varianza
DE DISPERSIÓN
Desviación estándar
Coeficiente de variación
Medidas de dispersión
Definiciones de Estadígrafos
Varianza: (S2)
Es el promedio aritmético de las desviaciones estándar respecto a su media elevadas al cuadrado.
Desviación estándar: (S)
Representa el grado de dispersión de los valores de una variable, con respecto a su media.
Coeficiente de variación: (CV)
Indica el porcentaje de variabilidad de los datos respecto a la media:
CV Dispersión
0 ≤ CV < 20% BAJA
20% ≤ CV < 50% MEDIA
50% ≤ CV < 100% ALTA
Medidas de dispersión
Rango o recorrido de la variable: Es la diferencia entre el valor máximo y el
valor mínimo de la variable para un conjunto de datos.
Donde:
Xmax: valor máximo de la variable
Xmin: valor mínimo de la variable
Medidas de dispersión
Varianza: Se define como la media aritmética del cuadrado de las desviaciones de
las observaciones con respecto a su media.
Para datos no agrupados: Para datos agrupados:
Medidas de dispersión
Desviación estándar: Se define como la raíz cuadrada de la varianza.
PROPIEDAD 2
Si a cada valor de las observaciones se le suma (o resta) una constante, la
varianza del nuevo conjunto transformado e será la misma que la varianza de las
observaciones iniciales, es decir:
PROPIEDAD 3
Si a cada valor de las observaciones se le multiplica por una constante
diferente de cero, la varianza del nuevo conjunto transformado es la varianza del
conjunto original multiplicado por la constante elevado al cuadrado.
Tema: Medidas de posición
Medidas de posición
La medidas de posición corresponden a los valores Deciles (Dk)
de la variable que dividen a un conjunto de datos Los deciles son nueve valores que dividen al
ordenados en intervalos que contienen el mismo conjunto de datos en diez partes iguales.
número de observaciones. También se les conoce
con el nombre de cuantiles.
Cuartiles (Qk)
Los cuartiles son tres valores que dividen al
conjunto de datos en cuatro partes iguales. Percentiles (Pk)
Los percentiles son novena y nueve valores que
dividen al conjunto de datos en cien partes iguales.
Q1 Q2 Q3
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
D1 D2 D3 D4 D5 D6 D7 D8 D9
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Equivalencias:
✓ Q2 = D5 = P50 = Me
✓ Q3 = P75
✓ D7 = P70
Cálculo de percentiles para datos no agrupados (Pk)
Procedimiento a seguir:
Donde:
¿Cuál es la valor a partir del cuál se encuentra el 30% superior de los tiempos en
horas de vida útil de las baterías?
Cálculo de percentiles para datos no agrupados (Pk)
Caso: Duración de una batería
Solución:
1. Ordenando los datos en forma ascendente
120 122 122 125 126 128 131 132
134 134 136 139 140 140 140 145
146 153 155 159 161 162 172 180
3. Cálculo de P70:
Procedimiento a seguir:
Posición = k n
100
Donde:
Pk: Percentil k-ésimo.
Li: Límite inferior del intervalo donde se encuentra el valor del percentil Pk.
c: Amplitud de la clase
k: Valor k-ésimo
Fi-1: Frecuencia acumulada.
fi: Frecuencia absoluta del intervalo donde se encuentra el valor del percentil Pk.
Cálculo de percentiles para datos agrupados (Pk)
Caso: Aplicativos en Android
La empresa SYSTEM S.A.C. se dedica al desarrollo de aplicativos desarrollados en ANDROID para dispositivos
móviles. A la empresa le interesa desarrollar aplicaciones de calidad que tengan el menor tamaño en MB posible
para que los usuarios puedan hacer las descarga más rápidamente en sus dispositivos móviles. A continuación
se presentan los tamaños registrados en MB de 40 aplicaciones desarrolladas:
Tamaño del aplicativo (MB) N° de aplicativos
[0; 10> 8
[10; 20> 12
[20; 30> 7
[30; 40> 10
[40; 50] 3
Total 40
El área de calidad de software de la empresa indicó que si el promedio
del tamaño registrado de las aplicaciones desarrolladas pertenece al
45% inferior de los datos, se le dará un bono a los programadores a fin
de mes. ¿Cuál es la decisión final que tomará el gerente de la
empresa?
Cálculo de percentiles para datos agrupados (Pk)
Caso: Aplicativos en Android
Solución:
1. Calculo de la marca de clase y de la media:
Tamaño del aplicativo N° de aplicativos Marca de clase Frecuencia acumulada
fi . Xi
(MB) (fi) (Xi) (Fi)
[0; 10> 8 5 8 40
[10; 20> 12 15 20 180
[20; 30> 7 25 27 175
[30; 40> 10 35 37 350
[40; 50] 3 45 40 135
Total 40 880
X = 880/40 = 22 MB
Cálculo de percentiles para datos agrupados (Pk)
Caso: Aplicativos en Android
Solución:
2. Cálculo de la posición del percentil:
Tamaño del aplicativo N° de aplicativos Marca de clase Frecuencia acumulada
fi . Xi
(MB) (fi) (Xi) (Fi)
[0; 10> 8 5 8 40
[10; 20> 12 15 20 180
[20; 30> 7 25 27 175
[30; 40> 10 35 37 350
[40; 50] 3 45 40 135
Total 40 880
Para el 45% superior de los datos corresponde k = 45.
Posición = k n = 45 (40) = 18
100 100
Cálculo de percentiles para datos agrupados (Pk)
Caso: Aplicativos en Android
Ubicamos la posición calculada (Posición = 18) en la columna de frecuencias acumuladas (Fi).
Posición = k n
Cuartil: 4
Posición = k n
Decil: 10
kn
100 - F
10 i-1
Decil: P
Dkk = L
i
+ c
f
i
Tema: Medidas de forma
Asimetría
• Son medidas que permiten conocer la forma que tiene la curva que representa al conjunto de datos. Nos
brindan información sobre la dirección de la dispersión de los datos.
• Si esta dispersión tiende hacia el lado derecho, diremos que la curva tiene asimetría positiva, en caso
contrario diremos que tiene asimetría negativa.
• Si las dispersiones de la curva son iguales diremos que la curva es simétrica.
Coeficiente de asimetría de Pearson (Ak)
(x - Me)
A =3
k s
: media muestral
Me: mediana
S: desviación estándar