Sunteți pe pagina 1din 29

MEDIDAS DE

DISPERSIN
ESTADSTICA
VARIABILIDAD
Es la medida de las diferencias que presentan los datos
entre si.

Para medirla se aprovecha el hecho, de que si los datos son


semejantes entre si, estn ms cerca a la media aritmtica,
entonces se dice que tienen poca variabilidad que son
homogneos.

Por el contrario si son muy diferentes entre si, estarn


muy dispersos respecto a la media aritmtica y se dice de
ellos que son muy variables o que son heterogneos.

ES PREFERIBLE SIEMPRE QUE LOS DATOS SEAN


HOMOGNEOS
Medidas de Dispersin

Las medidas de variabilidad o de dispersin son


aquellas que miden el grado de separacin de
los datos con respecto a un valor central.

Las principales medidas de dispersin son:

EL RANGO (R)
EL RANGO INTERCUARTILICO (RI)
LA VARIANZA [ V(X) S2(X) ]
LA DESVIACION ESTANDAR [S(X)]
COEFICIENTE DE VARIACION [ CV(X) ]
EL RANGO (R)
El Rango de variacin o recorrido de una serie de
datos, esta representado por la diferencia entre sus
valores mximo y mnimo, resultando ser la medida
de variabilidad ms sencilla y menos confiable, ya
que slo usa dos datos para su clculo.

R = Xmx Xmn
donde:
Xmx : valor mximo
Xmn : valor mnimo
EL RANGO INTERCUARTILICO (RI)

Es la diferencia entre el tercer cuartil y el


primer cuartil.

RI = Q3 Q1

El Rango Intercuartlico es una medida que


excluye el 25% ms alto y el 25% ms bajo,
dando un rango que contiene al 50% central de
los datos, lo que elimina el efecto causado por
los valores extremos.

Si el rango intercuartlico es muy pequeo


entonces indica alta uniformidad o pequea
variacin de los valores centrales.
VARIANZA

La varianza variancia es una medida de


variabilidad absoluta, que se expresa en unidades
al cuadrado y que utiliza todos los datos para su
clculo (el cual se basa en las diferencias entre el
valor de las observaciones y su media).
Se defina como el promedio de las desviaciones,
elevadas al cuadrado, de cada uno de los datos
con respecto del promedio (media aritmtica).
Clculo de la Varianza
a) Datos no agrupados:

X
n n

i
2
i X
2
X
2
S
2 i 1
i 1
X
n n

Xi : i-sima observacin
n : Nmero de datos
X : media aritmtica
Clculo de la Varianza

b) Datos agrupados:


k k

if
2
Xi X fi X 2
2
S
2 i 1
i 1
X
n n

Xi : marca de clase valor de la variable en estudio


fi : frecuencia absoluta
k : nmero de intervalos filas de la tabla segn sea el caso
X : Promedio de los datos
La Desviacin Estndar

Como la varianza se mide en unidades al


cuadrado, por ejemplo si los datos estn expresados
en metros, la varianza se medir en metros al
cuadrado.
Esto trae dificultades para su interpretacin real.
Es por ello que en ocasiones se prefiere el uso de la
Desviacin Estndar, definida como la raz cuadrada
(positiva) de la varianza:

Desviacin Estndar : s s 2
Interpretacin

El valor numrico de la varianza y la desviacin


estndar cuantifican el grado de dispersin
absoluta de los datos de la variable en estudio,
con respecto a su media aritmtia, la primera en
unidades al cuadrado y la segunda en unidades
reales , es por ello que, en trminos generales,
tendremos que:

A mayor variabilidad o dispersin de


los datos le corresponde una mayor
varianza o una mayor desviacin estndar.
Ejemplo 1:
Hallar la varianza y desviacin estndar de:
17, 19, 19, 19, 19, 18, 18, 20, 21, 19, 18, 17, 20, 20, 17

X X2 i
X 2
2
S
2 i 1
X n=15
17 289 n
281
19 361
n
X 281 x
15
18.7333

19 361 X i
2
2 X 2
5285
S
2 i 1
X
n 5285
. . S2 318.7332 1.3956
15
. .
S 1.3956 1.1813
x x 2

La dispersin absoluta de los datos


respecto a la media es 1.18
Ejemplo 2:

Hallar la varianza y desviacin estndar para la siguiente


distribucin de datos:

INTERVALOS Xi fi
[0 ,3 > 1.5 2
[3 ,6 > 4.5 3
[6 ,9 > 7.5 5
[9 , 12 > 10.5 4
[12 , 15 > 13.5 1
k 109.5
x 7.3
X i
2
f
2
15
S
2 i 1
X 969.75
n S
2
7.32 11.36
15

S 11.36 3.3705

INTERVALOS Xi fi Xi f i X i2 f i
[ 0 3> 1.5 2 3 4.5

[ 3 6> 4.5 3 13.5 60.75

[ 6 9> 7.5 5 37.5 281.25

[ 9 12> 10.5 4 42 441

[ 12 15> 13.5 1 13.5 182.25

TOTAL n =15 109.5 969.75


Coeficiente de Variabilidad

Esta medida de dispersin es muy til cuando se


quiere comparar el grado de dispersin
(homogeneidad o variabilidad) en dos conjuntos de
datos que tienen un promedio diferente y/o que tienen
diferentes unidades de medida
En general consideraremos lo siguiente:

Si CV < 25% implica baja dispersin


Si CV > 50% implica Alta dispersin

En otro caso se tiene Dispersin moderada


Clculo del Coeficiente de Variacin

S
CV ( X )
X

S
CV ( X )% (100)
X
EJEMPLO1:
Un administrador debe decidir la compra de una de dos mquinas,
tiene la siguiente informacin con respecto al tiempo diario que requiere
cada mquina para su mantenimiento.

Promedio Varianza
Mquina A 27 min 4.5 min2
Mquina B 35 min 5 min2

Utilizando la medida de variabilidad adecuada.Cul de las dos mquinas tiene


menos variabilidad en cuanto al tiempo de mantenimiento?

Solucin: Dado que la unidad de medida es la misma para ambos


grupos, pero las medias no son iguales, entonces
utilizamos el coeficiente de variacin para comparar:

CVA = SA = 4.5
= 0.07856 CVB = S B = 5 = 0.06388
XA 27 XB 35
7.86 % 6.39 %

Entonces la mquina B tiene una distribucin de tiempos menos variable.


Ejemplo 2:

El nivel de ventas promedio de un establecimiento comercial es


de 800 dlares por da, con una desviacin estndar de 45
dlares; en otro centro comercial la venta promedio por da es
de 270 dlares, con una desviacin estndar de 32 dlares. En
cual de estos establecimientos el nivel de ventas por da es ms
homogneo (en cual se tiene menos dispersin en cuanto al
nivel de ventas?)
Ejemplo 3:

En la compaa A los obreros tienen un jornal diario de 50


soles en promedio, con una desviacin estndar de 12
soles, en la compaa B los obreros tienen un jornal
promedio de 37.5 dlares con una desviacin estndar de
5.63 dlares.
En cul de estas dos empresas el jornal diario es de lo
obreros es ms homogneo? Justifique su respuesta.
PROPIEDADES DE LA VARIANZA

1) V(X) 0 (la varianza siempre es positiva cero)

2) Si c es una constante entonces: V(c)=0

3) Si Y=X c entonces: V(Y) = V(X c) = V(X)

4) Si Y=bX entonces: V(Y) = V(bX) = b2 V(X)

5) Si Y =bX c entonces: V(Y) = V(bX c) = b2V(X)


Ejemplo:

Supongamos que se tiene una variable X con


varianza V(X)= 2 y adems considere las
siguientes constantes C = 5 y b = 3

Si Y = X+5 entonces V(Y) = V(X+5) = V(X) = 2

Si Y = 3X entonces V(Y) = V(3X) = 32 V(X) = 9(2) = 18

Si Y=3X+5 entonces V(Y)=V(3X+5) = 32V(X) = 9(2) =18


MEDIDAS DE
FORMA
ESTADSTICA
MEDIDAS DE LA FORMA DE LA
DISTRIBUCIN

Son medidas que nos indican la forma de la


distribucin de la variable en estudio.
Se estudiar la deformacin de una distribucin
tanto en el sentido horizontal como vertical con
respecto a la forma de la curva normal.

I. MEDIDA DE ASIMETRA
La asimetra o sesgo es el grado de deformacin
horizontal de una distribucin, con respecto a la
distribucin normal, que se produce por la presencia
de valores extremos (altos bajos).
Asimetra Negativa: cuando lacola ms larga de la
distribucin est a la izquierda, esto significa que la
mayora de los datos estn concentrados a la derecha;
el sesgo es originado por la presencia de valores extremos
bajos.

Asimetra Positiva: cuando lacolams larga de la


distribucin est a la derecha, esto significa que la
mayora de los datos estn concentrados a la izquierda; hay
presencia de valores extremos altos.
As<0

As=0

As>0
Para medir la Asimetra se emplea el coeficiente de
Pearson; el cul se calcula de la siguiente forma:

3( X Me)
Ak
S

Si Ak = 0 la distribucin es simtrica.

Si Ak > 0 la distribucin tiene asimetra positiva.

Si Ak < 0 la distribucin tiene asimetra negativa.


Ejemplo:

Determine la forma de una distribucin de un conjunto


Datos que tienen una media igual a 7.87, una mediana
igual a 7.80 y una desviacin estndar 1.293

3(7.87- 7.80)
Ak = = 0.162
1.293

Ak = 0.162 > 0 se tiene una asimetra positiva

(distribucin con cola a la derecha)


II. CURTOSIS
Analiza la deformacin vertical de una distribucin de
datos respecto a la normal, es decir el grado de elevacin o
apuntamiento de la curva.
Para medir la Curtosis se emplea el coeficiente de curtosis:

P75 P25
KU
2(P90 P10 )

El coeficiente de curtosis se compara con un valor


referencial (0.263) de la siguiente manera, si:
KU = 0.263 la distribucin es Mesocrtica (Distribucin Normal)

KU < 0.263 la distribucin es Platicrtica (Distribucin Aplanada)

KU > 0.263 la distribucin es Leptocrtica (Distribucin Elevada)


Ejemplo:

Evale el grado de agudeza de la distribucin de un


conjunto de datos con las siguientes caractersticas:

P75 = 8.8 , P25 = 7.0 , P90 = 9.7 y P10 = 6.1

8.8 7.0
Ku = = 0.25
2 (9.7 6.1)

Ku = 0.25 < 0.263 entonces se tiene una distribucin


Platicrtica.

S-ar putea să vă placă și