Documente Academic
Documente Profesional
Documente Cultură
Medidas de Dispersión
Las Medidas de Dispersión nos van a dar una idea sobre la representatividad de las medidas
centrales, a mayor dispersión menor representatividad.
Hasta el momento, hemos estudiado los valores centrales de la distribución, pero también es
importante conocer si los valores en general están cerca o alejados de estos valores centrales, es
por lo que surge la necesidad de estudiar medidas de dispersión.
Las medidas de dispersión permiten evaluar la confiabilidad del promedio. Diremos que existe una
dispersión pequeña si los datos se encuentran acumulados cercanamente, en este caso la media es
muy representativa, en caso que la dispersión sea grande la media no es muy confiable.
Las medidas de dispersión nos permiten además apreciar cuan dispersas están dos o mas
distribuciones.
A.- Rango
Por lo tanto, está fuertemente influenciado por los datos extremos. Solo debe usarse cuando se
desea saber en forma inmediata la dispersión de los datos, sin ninguna precisión estadística.
Donde: R = rango
Xmax = dato mayor
Xmin = dato menor
Se tiene la edad de 15 pobladores de la comunidad del Pueblo Joven Santo Toribio de Mogrovejo
Edad
18 22 21 20 18
22 24 23 21 18
24 25 21 19 23
Para hallar el rango utilizando Excel, se ingresa las formulas en una celda como la muestra la figura
1.
Figura 1.
El rango es la diferencia entre el límite superior de la última clase y el límite inferior de la primera
clase. Así:
Ejemplo:
Figura 2.
126.75 126
Q3 42 6 42.236 42 años
145 126
42.25 21
Q1 24 6 26.602 27 años
70 21
RIQ Q3 Q1 42 27 15 años
El 50% central de la edad de los Pobladores del pueblo joven Santo Toribio de Mogrovejo se
distribuye a una distancia de 15 años.
C.- Varianza
Miden la variación en una población. La varianza poblacional es la suma de las diferencias con
respecto a la media de la población elevada al cuadrado y dividida por el tamaño de la población
N.
Datos No tabulados
Datos tabulados
Se define como la raíz cuadrada de la varianza. Es uno de los estadígrafos de dispersión de mayor
uso en el cual las unidades de la variable ya no están elevadas al cuadrado. La desviación estándar
al igual que la varianza es no negativa.
Es el indicador relativo del grado de dispersión de los valores respecto de su promedio, el mismo
que esta expresado en tanto por ciento.
El valor de este indicador no está afectado por la unidad de medida, por lo tanto es útil para la
comparación en términos relativos del grado de concentración entorno a la media de dos
distribuciones distintas. En general cuando el coeficiente de variación es igual al 30% se dice que la
distribución es homogénea, si el valor es superior al 30% se considera que la distribución es
heterogénea o tiene alto grado de dispersión.
Ejemplo: datos no agrupados
Varianza
Figura 3.
Desviación Estándar
Figura 4.
Coeficiente de variación
Figura 5.
La media de las diferencias cuadráticas de las edades de los pobladores del pueblo joven Santo
Toribio de Mogrovejo respecto a la edad promedio es 5.3523 años2, la variabilidad de la edad es
2.3135 años. Y la desviación estándar de la edad representa el 10.88% de la edad promedio. El
bajo valor del coeficiente de variabilidad nos indica que no existe una gran dispersión en la edad de
los pobladores, por lo tanto los datos son homogéneos.
Ejemplo: datos agrupados
1 2 Yi ni 1 58952
2
S
2
Yi ni 223785 108.08115
n 1 n 168 169
S 108.08115 10.396208
S 10.396208
CV * 100 * 100 29.804228%
Y 34.882
La media de las diferencias cuadráticas de las edades de los pobladores del pueblo joven Santo
Toribio de Mogrovejo respecto a la edad promedio es 108. 08115 años2, la variabilidad de la edad
es 10.396208 años. Y la desviación estándar de la edad representa el 29.80% de la edad promedio.
El alto valor del coeficiente de variabilidad nos indica que existe una gran dispersión en la edad de
los pobladores.
La Regla Empírica
Es posible que dos conjuntos de datos distintos tengan el mismo rango pero difieran
considerablemente en el grado de variación de los datos. En consecuencia, el rango es una medida
relativamente insensible de la variación de los datos. La varianza tiene importancia teórica, pero es
difícil de interpretar porque las unidades de medición de la variable de interés están elevadas al
cuadrado. En cambio, las unidades de medición de la desviación estándar son las unidades de la
variable. Si la desviación estándar se combina con la media del conjunto de datos, resulta fácil
interpretarla.
Si el histograma asociado a unos datos de origen tiene la forma de una campana o de una joroba,
el conjunto de datos tendrá las siguientes características, lo que algunos libros se conocen como
Regla Empírica.
Si un conjunto de datos tiene una distribución aproximadamente simétrica se pueden utilizar las
siguientes reglas prácticas para describir el conjunto de datos