Sunteți pe pagina 1din 6

TEMA 5: MEDIDAS DE DISPERSIN Y DE FORMA Las medidas de tendencia central nos presentan informacin sobre el comportamiento de los datos

a travs de un dato que tiende a ubicarse en un punto intermedio, sin embargo no nos proporciona informacin sobre la dispersin o esparcimiento que puedan tener los datos observados. Por tanto, definimos dispersin como el grado en que los datos numricos tienden a extenderse alrededor de algn valor medio 5.1. Rango o recorrido Es la diferencia entre los valores mximo y mnimo del conjunto de datos. Recorrido= Xmax Xmin Ejemplo Si tenemos las siguientes notas: 60, 30, 80, 90 y100 El Rango se calcula R=100-30= 70 5.2. Rango intercuartlico.- Llamado tambin propagacin media, es la diferencia entre el tercer cuartil y el primero. Rango intercuartil = Q3 Q1 Esta medicin considera la dispersin en 50% de los datos del medio, por tanto no se ve influida por los valores extremos. 5.3. Desviacin Media Otra medida de dispersin es la desviacin media que incluye todos los datos en el clculo y es la media de los desvos o diferencias con relacin a algn valor central, se tiene la desviacin media es decir la media aritmtica de los desvos alrededor de la media. 5.3.1 Desviacin media en datos no agrupados DM= i =1 Ejemplo: Sea calcular la DM de las siguientes calificaciones: 40, 40, 50 y 70. La formula requiere que calculemos primero la media aritmtica
n

xi x n

=
n

4 + 4 + 5 + 7 20 = =5 4 4

DM= i =1

xi x N

4 5 + 4 5 + 5 5 + 7 5 =1 4

R: La desviacin con respecto a la media 5 es de un 1 punto de nota, esto es que existen estudiantes que tendrn notas inferiores a la media en un punto y superiores a la media en un punto en promedio. 5.3.2 Desviacin media en datos agrupados Se desarrolla la siguiente frmula DM= i =1
n

X i x * Fi N

En el siguiente ejemplo calcular e interpretar la desviacin media X=Notas 30 40 50 60 70 Fi frecuencia 1 5 8 6 5 25 Xi * 30 200 400 360 350 1340 Xi - X -29 -14 -4 6 16 Valor absoluto 29 14 4 6 16
xi x
i

* F

29 70 32 36 80 242

=1340/25=54
n

DM= i =1

X i x * Fi N

242 = 9.7 25

R: La desviacin media es de 9,7 puntos alrededor de la media 54, esto es que existen estudiantes que tendrn una nota de 44,3(54-9.7) puntos y tambin estudiantes que pueden tener hasta 63,7 (54+9.7) puntos por encima de la media 5.4 Desviacin estndar Una de las medidas de mayor utilidad dentro del anlisis estadstico es la desviacin estndar, que es una medida que considera que tan lejos de la media estn localizados cada uno de los valores observados y se la define como la raz cuadrada positiva de la varianza.

La varianza es una medida previa a la desviacin estndar y la diferencia con la desviacin media es que toma las diferencia con sus respectivos signos. 5.4.1 La varianza y la desviacin en datos no agrupados Para el clculo se debe desarrollar las siguientes frmulas Varianza poblacional

(X =

X) N
i

Varianza muestral
S
2

(X =

X)

n 1

Desviacin estndar
=

( X

X) N
i i

S =

( X

X)

n 1

Ejemplo: Calcular la varianza y desviacin de los siguientes datos referidos a notas: 40, 40, 50, 70
2 =
X
i

=50
2

( X

X)

(40 50) + (40 50) + (50 50) + (70 50) 60 = =1.5 40 4

= 1.5 =1.2

5.4.2 La varianza y la desviacin en datos agrupados a) Varianza

(X =

X ) * fi N

b) Desviacin estndar
=

( X

X) *f i N

5.5. Coeficiente de variacin.Con frecuencia se quiere comparar la dispersin de 2 o ms variables. Ejm: se quiere saber si la variabilidad de la temperatura de un lugar es mayor o menor que la de otro; si los salarios varan de un grupo de obreros a otro. En estos casos, la comparacin puede hacerse usando el error estndar si las variables estn expresadas en la misma unidad de medida. Si esto no ocurre, la comparacin suele hacerse a travs del coeficiente de variacin que ese define como
CV =

.100

6.Teorema de Chebyshev.- Establece que para todo conjunto de datos, por lo menos 1(1/k2)% de las observaciones estn dentro de k desviaciones estndar de la media; donde k es cualquier nmero mayor a 1.

1 1 2 100 K

Interpretacin.- Por lo menos el % de las observaciones tendrn un valor de la variable que est entre los lmites del intervalo. 5.6 Medidas de forma Una tercera caracterstica importante de una serie de datos es su forma. Ya sea que la distribucin sea simtrica o no lo sea. Si la serie no es simtrica, se denomina asimtrica o sesgada. Para describir su forma, solo se necesita comparar la media con la mediana. La relacin que se da es la siguiente: > Me < Me = Me Asimtrica positiva o sesgo derecho Asimtrica negativa o sesgo izquierdo Simtrica o de sesgo cero

El sesgo positivo surge cuando la media se incrementa en algunos valores inusualmente altos; el sesgo negativo ocurre cuando la media se reduce en algunos valores

inusualmente bajos. Los datos son simtricos cuando no existen valores extremos reales en una direccin u otra, de manera que los valores altos y bajos se compensan. Medidas de asimetra 5.6.1. Coeficientes de asimetra de Pearson
CaS =

Mo

CaS p =

3( M e )

CaS<0 a izquierda o negativo CaS=0 Normal CaS>0 a derecha o positivo 5.6.2. Distribucin normal.- Las medidas de forma estn directamente asociadas con esta distribucin. Una distribucin normal es una distribucin de datos continuos que produce una curva simtrica en forma de campana.

Si se tiene un gran N de datos sobre los pesos de las personas, y si estos estn distribuidos normalmente. La grfica de la frecuencia con la que ocurre cada observacin se muestra en la figura anterior. Las observaciones en cada extremo ocurrirn relativamente de forma poco frecuente, pero las observaciones que estn cerca del centro ocurren con mayor frecuencia. Regla emprica.- Esta regla especfica que: 68.3% de las observaciones estn dentro de ms o menos una desviacin estndar de la media. 95.5% de las observaciones estn dentro de ms o menos dos desviaciones estndar de la media. 99.7% de las observaciones estn dentro de ms o menos tres desviaciones estndar de la media.

5.6.3. Medidas de Agudeza o apuntamiento.- Por medio del coeficiente de curtsis, clasificamos diferentes grados de agudeza en 3 categoras: a) Leptocrtica: es la curva de mayor apuntamiento. b) Mesocrtica: de apuntamiento intermedio (normal) c) Platicrtica: curva achatada. Una medida relativa de curtsis es:
k=

m4

m4

x =
N

4 i

( X =

)4

Donde: Si k=0 es mesocrtica Si k>0 es leptocrtica Si k<0 es platicrtica

S-ar putea să vă placă și