Sunteți pe pagina 1din 12

Revisor: Emilio González

 Medidas  de  dispersión  

Revisor: Emilio González Olguín

Por: Oliverio Ramírez Juárez

Las medidas de tendencia central dirigen su interés al comportamiento de los datos con relación a un valor
central, pero se olvidan de la forma en la que los datos varían o se dispersan.

Las medidas de dispersión se encargan de estudiar el


comportamiento de todos los datos y cómo se distribuyen
alrededor de un valor central: la media aritmética.

Dentro de las medidas de dispersión se encuentran: el rango, la desviación media, la desviación estándar y
la varianza.

Observa a qué se refieren.

Rango  
En León, Guanajuato, una familia de fabricantes de calzado se dedica a producir exclusivamente zapatos
para adulto. Las tallas (longitud del pie en centímetros) que maneja en zapato para mujer son las
siguientes:
Talla
(en centímetros)
21.5
22
22.5
23
23.5
24
24.5
25
25.5
26
26.5
27
Tabla 1. Tallas de zapato de mujer.

©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González

De esta lista de tallas de calzado, ¿cuál es la menor?, ¿cuál es la mayor? Al observar la tabla te podrás
percatar de que la talla menor que maneja esta familia de fabricantes de calzado es 21.5 y la talla mayor es
27.

A partir de esta información se puede decir que la variación en las tallas de los zapatos, desde la menor
hasta la mayor es:
27 - 21.5=5.5

A la variación o diferencia entre el dato mayor y el dato menor de un conjunto de datos u observaciones se
le llama Rango.

Como puedes ver, con sólo identificar el valor mayor y el menor, es posible calcular el rango.

El Rango (R) se define como:

“La diferencia entre los datos mayor y menor del conjunto”


(Kazmier, Díaz y Eslava, 1991, p. 50).

Observa  otro  ejemplo  


La siguiente distribución de frecuencias con intervalos muestra información acerca de personas que acuden
a un club deportivo en una ciudad fronteriza de acuerdo a sus edades.

Intervalos Número de
de personas
edades 𝑓!
42-46 2
47-51 9
52-56 31
57-61 50
62-66 51
67-71 30
72-76 7
180
Tabla 2. Tabla de intervalos de clase.

De los datos de la tabla 2 se aprecia que el valor mayor es 76 y el menor es 42, por lo que el rango es:

Rango = 76 − 42 = 34

©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González

Esto quiere decir que la diferencia entre las edades de las personas que acuden al club deportivo es de 34
años.

Ejemplo

Uno de los problemas que aquejan a la juventud es el consumo de drogas o alcohol a temprana edad.

En una comunidad con una población no mayor a 3000 personas se realizó una encuesta a 85 habitantes y
se les peguntó si consumían alcohol. Para el análisis de los datos, los encuestados fueron agrupados por
edades; el resultado se presenta en la tabla 3:

Edades Personas que


consumen
alcohol
12 – 15 8
16 – 19 13
20 – 23 15
24 – 27 21
28 – 31 16
32 – 35 12
85
Tabla 3. Tabla de intervalos de personas que consumen alcohol.

¿Cuál es rango de edades que se consideró para la encuesta?


35-12

Desviación  media  
Como viste, el rango sólo considera dos datos: el dato mayor y el dato menor. Sin embargo, es conveniente
contar con otra medida de dispersión de los datos respecto a la media en la que se tomen en cuenta todas
las observaciones.

Para Kazmier, Díaz y Eslava (1991) la desviación media es igual al


promedio del valor absoluto de la diferencia de cada uno de los elementos del
conjunto respecto a la media aritmética (ya sea muestral o poblacional).

Para una muestra:

D.M =
∑ x−x
n

©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González

Para una población:

D.M =
∑ x−µ
N

Ejemplo

Se tiene el conjunto 5, 10, 15, 20, 25, 30, 35, cuya x = 20

𝑥! xi − x
60
5 15 D.M = = 8.57
10 10 7
15 5
140
x= = 20 20 0 8.57 es el promedio de las
7 25 5 diferencias de los datos con
30 10 respecto a la media aritmética.
35 15
n=7 ∑x i − x = 60

Una desviación media menor a 8.57 (por ejemplo el dato 25, cuya diferencia con la media es 5) nos
indicaría que los datos se encuentran más cercanos a su media aritmética. Si la desviación media fuera
cero (como el dato 20) significaría que todas las observaciones son idénticas a la media aritmética. La
desviación media obtenida indica que los datos de la variable se separan 8.57 en promedio de la media
aritmética.

Esta medida de dispersión cada vez se utiliza menos, pero aún puede ayudar a comprender el significado
de las siguientes medidas de dispersión: la varianza y la desviación estándar.

Varianza  
 

La varianza muestral es el promedio de los cuadrados de las diferencias de cada dato del conjunto
respecto a su media aritmética y se representa con el símbolo s2 (Kazmier, Díaz y Eslava, 1991).

©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González

Matemáticamente se representa:

2 2 2 2

s 2
=
(x 1 ) ( ) (
− x + x 2 − x + x3 − x + ! + x n − x ) ( )
n −1

Si usamos la notación de sumatorias, la varianza se calcula con:

n 2

2
∑ (x − x )
i =1
i
s =
n −1

La varianza poblacional se representa con el símbolo σ2 y su expresión matemática es

2 2 2 2
σ 2
=
( x1 − µ ) + (x2 − µ ) + (x3 − µ ) + ! + (xN − µ )
N

En forma abreviada queda:


N 2

2
∑ (x − µ )
i =1
i
σ =
N

Fabiola, una estudiante de la UVEG, obtuvo en el cuatrimestre las siguientes calificaciones: 9.2, 8.3,
7.6, 8.9 y 7.5. ¿Cuál es la varianza de sus calificaciones?

Primero debes calcular la media aritmética:

9.2 + 8.3 + 7.6 + 8.9 + 7.5 41.5


x= = = 8.3
5 5

2 2 2 2 2
s 2
=
(9.2 − 8.3) + (8.3 − 8.3) + (7.6 − 8.3) + (8.9 − 8.3) + (7.5 − 8.3) 2.3
= = 0.575
4 4

En este caso la varianza de las calificaciones de Fabiola es 0.575 unidades cuadradas. ¿Qué significado
tiene? Si habláramos de kilogramos, ¿la varianza estaría en kilogramos cuadrados? Lo anterior es cierto:
una desventaja de la varianza es que se trata de un estadístico cuyas unidades se encuentran elevadas al
cuadrado. Para solucionar este inconveniente se recurre a la desviación estándar, que es simplemente la
raíz cuadrada de la varianza por lo que las unidades de esta medida de dispersión no están elevadas al
cuadrado.

©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González

La  desviación  estándar  

La desviación estándar es la raíz cuadrada de la varianza (Kazmier, Díaz y Eslava,


1991).

La desviación estándar muestral es:

s = s2

n 2

∑ (x
i =1
i −x )
s=
n −1

De la misma forma, la desviación estándar poblacional es:

σ = σ2

N 2

2
∑ (x − µ )
i =1
i
σ =
N

La desviación estándar, por definición, es la raíz cuadrada de la varianza de tal manera que si se conoce
ésta, para calcular la desviación, simplemente se le extrae raíz a la varianza.

Ejemplo

Volvamos al caso de Fabiola, quien obtuvo un promedio de calificaciones de 8.3 con una varianza de 0.575.
La desviación estándar de las calificaciones de Fabiola es:

s = 0.575 = 0.758

Es decir, las calificaciones de Fabiola varían en promedio 0.758 puntos.

Ejemplo

Arturo es un agricultor que cosecha sandías, pesó 6 sandías y sus resultados fueron: 4.5, 5.2, 4.8, 6.1, 5.8
y 6.3 kilogramos. ¿Cuál es la varianza y la desviación estándar de los pesos de las sandías de Arturo?

Lo primero que debes calcular es la media aritmética:

©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González

4.5 + 5.2 + 4.8 + 6.1 + 5.8 + 6.3 32.7


x= = = 5.45
6 6

Luego la varianza:

s2 =
(4.5 − 5.45)2 + (5.2 − 5.45)2 + (4.8 − 5.45)2 + (6.1 − 5.45)2 + (5.8 − 5.45)2 + (6.3 − 5.45)2
5
2.655
s2 = = 0.531
5

Nuevamente para calcular la desviación estándar sólo determinamos la raíz cuadrada de la varianza.

s = 0.531 = 0.728
Tanto la varianza como la desviación estándar miden la forma en que se dispersan los datos alrededor de
la media aritmética. Sin embargo, una de las desventajas de la varianza es que sus resultados son
unidades al cuadrado. En el caso de Arturo, la varianza fue 0.531 kilogramos al cuadrado. La desviación
estándar en cambio fue 0.728 kilogramos, que tiene más sentido en el caso de las sandías.

Ejemplo

Rafael pretende vender algunas cabezas de ganado por lo que decidió pesar cinco de ellas. Los pesos en
kilogramos de los cinco animales registrados por Rafael fueron:

385, 396, 405, 398 y 415

¿Cuál es el peso promedio de los cinco animales?, ¿cuál es la desviación estándar de los pesos de los
cinco animales?

La media aritmética es:


385 + 396 + 405 + 398 + 415
x= = 399.8 Kilogramos
5

La varianza se calcula mediante:

s2 =
(385 − 399.8)2 + (396 − 399.8)2 + (405 − 399.8)2 + (398 − 399.8)2 + (415 − 399.8)2 = 123.7
4

La desviación estándar, por tanto es de:

s = s 2 = 123 .7 = 11.12

©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González

Después de terminar los cálculos, estás listo(a) para responder las preguntas que se formularon en un
principio:

• ¿Cuál es el peso promedio de los cinco animales?


El peso promedio fue de 399.8 kilogramos

• ¿Cuál es la desviación estándar de los pesos de los cinco animales?


La desviación estándar es 11.12

Otra implicación importante de la desviación estándar es el hecho de que la mayoría de los datos se
encuentra en un intervalo de x ± s , esto indica que la mayor parte de los pesos de los animales se
encuentra entre 399.8 − 11.12 = 388.68 y 399.8 + 11.12 = 410.92

De hecho, dos de los cinco pesos de los animales se encuentra en este rango: 385 y 415.

Varianza  y  desviación  estándar  de  una  distribución  de  frecuencias  


 
¿Recuerdas el cambio que sufrió la fórmula de la media aritmética de datos no ordenados cuando se utilizó
para datos organizados en distribuciones de frecuencia?

x=∑
xi
→ x=
∑ f ⋅x
i i
n n
De la misma manera, las fórmulas de la desviación media, la varianza y la desviación estándar se verán
afectadas por la frecuencia absoluta (𝑓).

Para datos no Para distribuciones de


agrupados frecuencia
Media aritmética xi fi ⋅ xi
x=∑ x=∑
n n
Desviación media
D.M =
∑x −xi
D.M =
∑ f ⋅ x−x
i

n n
Varianza n 2 n 2

∑ (x − x )
i ∑ f i ⋅ (xi − x )
s2 = i =1
s2 = i =1
n −1 n −1
Desviación estándar n 2 n 2

∑ (x − x )
i =1
i ∑ f ⋅ (x − x )
i i
s= s= i =1
n −1 n −1
Tabla 4. Fórmulas de Medidas de Dispersión (Devore, 2005).

©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González

Ejemplo

A partir de los datos de la tabla 5, calcula la desviación media, la varianza y la desviación estándar en una
distribución de frecuencias con intervalos.

Marca de Frecuencia
Clases clase 𝑓!
𝑥!
42-46 44 2
47-51 49 9
52-56 54 31
57-61 59 50
62-66 64 51
67-71 69 30
72-76 74 7
180
Tabla 5. Tabla de distribución.

Para calcular x es necesario generar la columna fi ⋅ xi . Sin embargo, la media aritmética de esta
distribución de frecuencia ya la has resuelto en páginas anteriores.

f x 11005
x=∑ i i = = 61.14
n 180
2
Para encontrar la varianza es conveniente calcular la columna
(x − x) y luego simplemente sumarla. i
Todos estos cálculos pueden llevarse a cabo en Excel para facilitarlos y evitar errores.

2
Clases
Marca
de clase
Frecuencia
𝒇𝒊 (x − x)
i
fi ⋅ (xi − x )
2

𝒙𝒊
42-46 44 2 (44-61.14)2 = 293.77 (2)(293.77)=587.5592
2
47-51 49 9 (49-61.14) = 147.37 (9)(147.37)=1326.4164
52-56 54 31 50.97 1580.3676
57-61 59 50 4.57 228.98
62-66 64 51 8.17 417.1596
67-71 69 30 61.77 1853.388
72-76 74 7 165.37 1157.6572
180 7151.528
Tabla 6. Tabla de distribución para calcular la Varianza.

©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González

7151.528
s2 = = 39.952
179

s = 39.952 = 6.32

Usos  frecuentes  de  la  desviación  estándar  


Teorema  de  Chebyshev  

Este teorema fue formulado por el matemático ruso Pafnuty Ivóvich Chebyshev.

El teorema de Chebyshev establece que, sin importar la distribución que tenga un conjunto
de datos, se puede encontrar el porcentaje de observaciones contenidas dentro de
𝑘  desviaciones estándar alrededor de la media usando la siguiente fórmula:
1
1− %
k2

Donde 𝑘 es cualquier número mayor que uno (Monroy, 2008).

Por ejemplo, si consideramos dos desviaciones estándar tenemos:


1
1− = 0.75%
22

¿Qué significa este resultado?, para el caso de Arturo, el agricultor que cosecha sandías, la media
aritmética fue x = 5.45 con una desviación estándar de s = 0.728 . Los límites del intervalo serán:

x + 2(0.728) = 5.45 + 0.728 = 6.906


x − 2(0.728) = 5.45 − 0.728 = 3.994

Es decir, el 75% de los pesos de las sandías cosechadas por Arturo estarán en el intervalo:

[3.994 − 6.906]

10

©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González

Coeficiente  de  variación  


Aunque la desviación estándar es una medida de dispersión bastante útil, una de sus limitantes es que
cuando se trabaja con dos o más distribuciones de datos con medias distintas las conclusiones en torno a
la dispersión pueden no ser ciertas. Para estos casos se prefiere usar el coeficiente de variación.

Para Monroy (2008) el coeficiente de variación se define como la


expresión porcentual que representa la relación entre la desviación
estándar y la media aritmética. Y se obtiene usando la siguiente fórmula:
⎛ s ⎞
CV = ⎜ ⎟100%
⎝ x ⎠

El coeficiente de variación para el caso de los pesos de las sandías de Arturo, tomando en cuenta que
x = 5.45y s = 0.728 , sería entonces:
⎛ 0.728 ⎞
CV = ⎜ ⎟100% = 13.36%
⎝ 5.45 ⎠

Por otra parte, si la media del peso de las conchas en una panadería es de x = 50.87 y la desviación
estándar (no calculada en el ejercicio) de 7.84, el coeficiente de variación de las conchas es entonces:

⎛ 7.84 ⎞
CV = ⎜ ⎟100% = 15.41%
⎝ 50.87 ⎠

Al comparar los coeficientes de variación anteriores es posible determinar que la variabilidad del peso de
las conchas fue mayor que la variabilidad del peso de las sandías. Nota que el peso de las sandías está
dado en kilogramos y el peso de las conchas en gramos y esto no fue impedimento para que se llevara a
cabo la comparación.

Más adelante en el Módulo se analiza la distribución de probabilidad normal, que es otra aplicación
importante de la desviación estándar.

11

©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González

Referencias      

Devore,  J.  L.  (2005).  Probabilidad  y  estadística  para  ingeniería  y  ciencias  (6ª  ed.).  México:  
Thomson.  
 
Kazmier,  L.  J.,  Díaz,  A.,  y  Eslava,  G.  (1991).  Estadística  aplicada  a  administración  y  economía  
(2ª  ed.).  México:  McGraw-­‐Hill  Interamericana.  Recuperado  de  la  base  de  datos  
e-­‐libro  Cátedra.  (10522957)  
 
Monroy,   S.   (2008).   Estadística   descriptiva.   México:   Instituto   Politécnico   Nacional.  
Recuperado  de  la  base  de  datos  e-­‐libro  Cátedra.  (10436604)  
 

 Bibliografía  

Levin, R. I.,y Rubin, D. S. (2004). Estadística para administración y


Economía (7ª ed.). México: Pearson Educación.

12

©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.

S-ar putea să vă placă și