Sunteți pe pagina 1din 7

UNIDAD 4: Medidas de dispersin

Introduccin.
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersin dicen hasta que punto estas medidas de tendencia central
son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la
separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central.
Se distinguen las medidas de dispersin absolutas, que no son comparables entre diferentes
muestras y las relativas que permiten comparar varias muestras.
Para variables numricas o cuantitativas, en las que puede haber un gran nmero de valores
observados distintos, se ha de optar por un mtodo de anlisis distinto, respondiendo a las siguientes
preguntas:
a.

Alrededor de qu valor se agrupan los datos?

b.

Supuesto que se agrupan alrededor de un nmero, cmo lo hacen? muy

concentrados? muy dispersos?


Las medidas de centralizacin vienen a responder a la primera pregunta. Es decir que estas
medidas de centralizacin, sirven para describir un aspecto de los datos, pero no nos dicen nada
acerca de otro aspecto de igual importancia: la dispersin de los valores observados. Un promedio
como la Media o la Mediana slo localizan el centro de los datos. Eso es valioso desde ese punto de
vista, pero un promedio no nos dice nada acerca de la dispersin de los datos,

para esto

utilizaremos las medidas de dispersin o variabilidad. Si el valor de estas medidas de dispersin es


pequeo, nos indica que los datos estn estrechamente agrupados alrededor de la Media, entonces
la media se considera representativa de los datos, la Media es un promedio confiable. Inversamente,
una medida de dispersin grande indica que la Media no es confiable, no es representativa de los
datos.
Para entender mejor esto, supongamos que tenemos dos muestras de tamao tres:
10, 20 y 60

28,29 y 33

La media aritmtica de ambas muestras es 30. Sin embargo, existe una diferencia esencial
entre ellas, puesto que los valores de la primera muestra se encuentran ms separados que los de la

segunda. Es por esto, que es necesario que introduzcamos alguna medida de variabilidad que
distinga a las dos muestras.
La importancia prctica de tales medidas, se evidencia por ejemplo, en que una muy
pequea variabilidad en un proceso de produccin de cierto producto, puede indicar alta calidad.

4. 2 . Medidas de Dispersin

Son indicadores estadsticos que muestran la distancia promedio que existe entre los datos y la
media aritmtica.

PARA VARIABLES
CUANTITATIVAS

ABSOLUTAS:
RELATIVAS:
Rango
Coeficiente de
Variacin

Variancia
Desvo Estndar

4.3 Medidas de dispersin Absolutas:


4.3.1 Rango
Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el
valor mayor y el menor de la distribucin. Lo notaremos como R. Realmente no es una medida muy
significativa en la mayora de los casos, pero indudablemente es muy fcil de calcular.
Se lo llama tambin ancho o recorrido.
2

En el caso de datos sueltos se obtiene buscando el mximo y el mnimo valor entre los datos,
que se llaman valores extremos, y se realiza la diferencia.
Ejemplo: Tenemos los siguientes datos, que representan el valor del colesterol Total de 10
nios internados en el Hospital V.J.Vilela:
156 209 189 196 203 162 228 134 -155 - 96

Rango = 228 - 96 = 132


Si disponemos de datos agrupados, no sabemos los valores mximos o mnimos, por lo que
no podemos calcularlo.
Ventajas:
Es fcil de calcular y es comnmente usado como una medida burda, pero eficaz de variabilidad.
Es comprensible para cualquier persona, an cuando no conozca de estadstica.
Desventajas:
La desventaja ms importante es que posiblemente deseemos saber ms respecto a la dispersin de
los datos, que lo que podemos obtener del rango, puesto que ste refleja nicamente los valores
extremos, ignorando la informacin intermedia.
No es aconsejable usarlo para muestras grandes, pues puede conducirnos a errores. Pero s, por lo
comn, se lo utiliza en muestras pequeas de 4 a 5 observaciones, sobre todo en el control
estadstico de la calidad.
4.3.2 Variancia
Tal y como se adelantaba antes, otro aspecto a tener en cuenta al describir datos continuos es
la dispersin de los mismos. Existen distintas formas de cuantificar esa variabilidad.
De todas ellas, la varianza (S2) de los datos es la ms utilizada.
Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media
aritmtica de la distribucin.
3

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por
tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la
variable estudiada.
Como ejemplo, consideremos 10 pacientes de edades 21 aos, 32, 15, 59, 60, 61, 64, 60, 71,
y 80. La media de edad de estos sujetos ser de:

En el ejemplo anterior la varianza sera:


S
2
x =

La Variancia se utiliza slo a fin de realizar demostraciones tericas y se la define como el


cuadrado del desvo standard que veremos a continuacin.

4.3.3 Desvio Estndar


Qu se entiende por desviacin?
Desviacin es la diferencia que se observa entre el valor de la variable y la media aritmtica.
La desviacin estndar (S) es la raz cuadrada de la varianza. Expresa la dispersin de la
distribucin y se expresa en las mismas unidades de medida de la variable. La desviacin tpica es
la medida de dispersin ms utilizada en estadstica.

Donde:
Xj: valores de la muestra.
X : media aritmtica de la muestra.
n: tamao de la muestra.
En los clculos del ejercicio previo, la desviacin estndar muestral, que tiene como
denominador n, el valor sera 20,68. A efectos de clculo lo haremos como n-1 y el resultado sera
21,79.
El haber cambiado el denominador de n por n-1 est en relacin al hecho de que esta
segunda frmula es una estimacin ms precisa de la desviacin estndar verdadera de la
poblacin y posee las propiedades que necesitamos para realizar inferencias a la poblacin.
Ejemplo:
Continuamos con el ejemplo de la medicin de Colesterol Total realizada a 10 nios del Hospital
V.J.Vilela:
X = 156 + 209 + 189 + 196 + 203 + 162 + 228 + 134 + 155 + 96 = 1728 = 172,8
10
10

Por lo tanto el promedio de Colesterol Total es de 172,8.


Siguiendo el ejemplo calculamos S:

S=
S =

(156 172,8)2 + (209 172,8)2 +..+ (96 172,8)2


10 1
228,24 + 1310,44 +262,44+..+ 5898,24
9

14189,6
9

= 39,71

Interpretacin: Los valores de la variable se dispersan en promedio en 39,71 con respecto a la


Media Aritmtica.
5

Como medidas de variabilidad ms importantes, conviene destacar algunas caractersticas de


la varianza y el desvo estndar:

Son ndices que describen la variabilidad o dispersin y por tanto cuando los datos estn
muy alejados de la media, el numerador de sus frmulas ser grande y la varianza y la
desviacin estndar tambin lo sern.

Al aumentar el tamao de la muestra, disminuye la varianza y la desviacin estndar.

Cuando todos los datos de la distribucin son iguales, la varianza y el desvo estndar son
iguales a 0.

Para su clculo se utilizan todos los datos de la distribucin; por tanto, cualquier cambio de
valor ser detectado.

4.4 Medidas de dispersin Relativa: Coeficiente de Variacin


Otra medida que se suele utilizar es el coeficiente de variacin (CV). Es una medida de
dispersin relativa de los datos y se calcula dividiendo la desviacin estndar muestral por la media
y multiplicando el cociente por 100. Su utilidad estriba en que nos permite comparar la dispersin o
variabilidad de dos o ms grupos.
El coeficiente de variacin se utiliza se utiliza para comparar la homogeneidad de dos series
de datos, an cuando estn expresados en distintas unidades de medida.
Se debe destacar que a medida que el Coeficiente de variacin disminuye, se observa una
mayor homogeneidad en los datos o lo que es lo mismo, los datos estn ms concentrados alrededor
del promedio.
As, por ejemplo, si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg) cuya media es
de 69,6 kg. y su desviacin estndar (S) = 10,44 kg y la Talla de los mismos (150, 170, 135, 180 y
195 cm) cuya media es de 166 cm y su desviacin estndar de 21,3 cm. La pregunta sera: qu
distribucin es ms dispersa, el peso o la talla? Si comparamos las desviaciones estndar
observamos que la desviacin estndar de la talla es mucho mayor; sin embargo, no podemos

comparar dos variables que tienen escalas de medidas diferentes, por lo que calculamos los
coeficientes de variacin:
CV de la variable peso = 10,44 = 15 %
69,6
CV de la variable talla = 21,3 = 12,8 %
166
Respuesta: La distribucin ms dispersa es la del peso.

S-ar putea să vă placă și