El coeficiente de variacin permite comparar la dispersin entre dos
poblaciones distintas e incluso, comparar la variacin producto de
dos variables diferentes (que pueden provenir de una misma poblacin).
El coeficiente de variacin elimina la dimensionalidad de las variables y tiene en cuenta la proporcin existente entre una medida de tendencia y la desviacin tpica o estndar.
Equivale a la razn entre la media aritmtica y la desviacin estndar.
Estas variables podran tener unidades diferentes, por ejemplo, podremos determinar si los datos tomados al medir el volumen de llenado de un embase de cierto lquido varan ms que los datos tomados al medir la temperatura de el liquido contenido en el embase al salir al consumidor. El volumen los mediremos en centmetros cbicos y la temperatura en grados centgrados.
Los pesos de los toros de una ganadera se distribuyen con una media X= 500 kg y una desviacin tpica = 40 kg.
Los pesos de los perros de una exposicin canina tienen una media X = 20 kg y una desviacin tpica = 10 kg.
La desviacin tpica de los pesos de la manada de toros bravos (40 kg) es superior a la de los perros (10 kg). Sin embargo, los 40 kg son poca cosa para el enorme tamao de los toros (es decir, los toros de esa manada son muy parecidos en peso), mientras que 10 kg es mucho en relacin con el peso de un perro.
X TOROS 500 40 PERROS 20 10 Para comparar la dispersin de dos poblaciones heterogneas, se define el coeficiente de variacin as:
CV = / X
Al dividir entre X estamos relativizando la dispersin, el resultado se da, a veces, en tantos por ciento. De los toros y los perros, obtenemos:
Para los toros: CV = 40/500 = 0,08 Es decir, el 8%
Para los perros: CV = 10/20= 0,50 Es decir, el 50%. X CV TOROS 500 40 8% PERROS 20 10 50% De este modo s se aprecia claramente que la variacin de los pesos de los perros (50%) es mucho mayor que la de los pesos de los toros (8%).
Es una grfica que describe varias caractersticas importantes de una distribucin de datos al mismo tiempo, tales como la DISPERSIN Y SIMETRA.
Se dibuja una caja rectangular, dividida por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relacin con los cuartiles primero y tercero, el segundo cuartil coincide con la mediana. Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mnimo y mximo de la variable. Las lneas que sobresalen de la caja se llaman bigotes. Ejemplo distribucin de edades de 20 personas
Q1, el Primer Cuartil es el valor mayor que el 25% de los valores de la distribucin. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmtica de dicho valor y el siguiente:
Q1= (24 + 25) / 2 = 24,5
Q2, el es la mediana de la distribucin, ocupa el lugar central en el conjunto de datos ordenados. Como N/2 =10; la mediana es la media aritmtica de dicho valor y el siguiente:
Mediana= Q2 = (33 + 34)/ 2 =33,5
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45 Q3, el , es el valor que sobrepasa al 75% de los valores de la distribucin. En nuestro caso, como 3N / 4 = 15, resulta
Q2= (39 + 39) / 2 = 39
- La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades comprendidas entre el 25% y el 50% de la poblacin estn ms dispersas que entre el 50% y el 75%.
- El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; (de 20 a 25 aos) por ello el 25% de los ms jvenes estn ms concentrados que el 25% de los mayores (de 39 a 45 aos)