Sunteți pe pagina 1din 17

TEMA 4:

MEDIDAS DE DISPERSIN

ESTADSTICA DESCRIPTIVA
Medidas de dispersin: recorridos y varianza
El recorrido, rango o amplitud es la diferencia entre el mayor y
el menor valor de la variable.
Un valor pequeo del recorrido indica poca dispersin, puesto
que la variable toma valores en un intervalo pequeo. Sin
embargo, un valor grande puede indicar mucha dispersin o la
existencia de valores extremos.
La concentracin de albmina mxima observada es de
42.5 gr/l y la mnima de 41.1 gr/l siendo la media de 41.9
gr/l. El recorrido es de 42.5 - 41.1 = 1.4 gr/l indicando
poca dispersin en los datos.
2

ESTADSTICA DESCRIPTIVA
Medidas de dispersin: recorridos y varianza
En otra muestra la concentraciones de albmina
observadas han sido
41.1, 41.6, 49.1, 42.1, 42.2, 42.5.
Se podra decir ahora que todos los pacientes estn
sanos?
En este caso la media aumenta a 43.1 gr/l, afectada por
el valor mximo observado. Mientras que la mediana es
42.1 gr/l, puesto que est menos afectada por los
valores extremos.
El valor del recorrido es 49.1 - 41.1 = 8 gr/l indicando
mucha dispersin o existencia de valores extremos.

ESTADSTICA DESCRIPTIVA
Medidas de dispersin: recorridos y varianza
En una tercera muestra la concentraciones de albmina
observadas han sido
41.1, 42.6, 49.1, 45.1, 47.2, 43.5.
Se podra decir ahora que todos los pacientes estn
sanos?
En este caso la media es 44.8 gr/l, y la mediana es 43.5
gr/l.
El valor del recorrido es 49.1 - 41.1 = 8 gr/l indicando
mucha dispersin o existencia de valores extremos.
4

ESTADSTICA DESCRIPTIVA
Medidas de dispersin: recorridos y varianza
El recorrido intercuartlico es la diferencia entre tercer y primer
cuartiles.
Un valor pequeo del recorrido intercuartlico indica poca
dispersin. Sin embargo, un valor grande puede indicar mucha
dispersin o la existencia de valores extremos.
Como los cuartiles estn poco afectados por la existencia de
valores extremos, un recorrido intercuartlico pequeo frente a un
recorrido grande indicar la existencia de valores extremos. Si
ambos son grandes, podemos asegurar que existe dispersin.

ESTADSTICA DESCRIPTIVA
Medidas de dispersin: recorridos y varianza
En la primera muestra de concentraciones de albmina el
recorrido intercuartlico es 42.2 - 41.6 = 0.6 gr/l., que
indica poca dispersin.
En la segunda muestra el recorrido intercuartlico es
42.5 - 41.6 = 0.9 gr/l, pequeo en comparacin con el
recorrido lo que indica la existencia de valores
extremos.
En la tercera muestra el recorrido intercuartlico es
47.2 - 42.6 = 4.6 gr/l, un valor alto, como el del
recorrido, que indica que hay dispersin.
6

ESTADSTICA DESCRIPTIVA
Medidas de dispersin: recorridos y varianza
La varianza es la media las distancias de los valores a la media
elevadas al cuadrado.
Calculamos las distancias de las cantidades de albmina
a su media 41.9 en el primer ejemplo:
41.6-41.9=-0.3

42.1-41.9=0.8

42.2-41.9=0.7
41.1

41.6

41.1-41.9=-0.8

41.9

41.9-41.9=0

42.5

42.1 42.2

42.5-41.9=0.6

ESTADSTICA DESCRIPTIVA
Medidas de dispersin: recorridos y varianza
Qu ocurre si sumamos las distancias?
(- 0.8) + (- 0.3) + 0 + 0.2 + 0.3 + 0.6 = 0
Al compensarse las distancias positivas con las
negativas la suma de las distancias no proporciona una
buena medida de dispersin.
La suma de las distancias de las observaciones a la
media es siempre cero, por ello, se dice que la media es
el centro de gravedad de la distribucin.
8

ESTADSTICA DESCRIPTIVA
Medidas de dispersin: recorridos y varianza
Cmo se podran medir las distancias eliminando el
efecto del signo?
(- 0.8)2 + (- 0.3)2 + 0 2 + 0.2 2 + 0.3 2 + 0.6 2 = 1.22
La varianza es, por tanto, 1.22/6=0.203 (gr/l)2
En la segunda muestra el valor de la varianza es 7.4
(gr/l) 2.
En la tercera muestra el valor de la varianza es tambin
7.4 (gr/l) 2.
9

ESTADSTICA DESCRIPTIVA
Medidas de dispersin: recorridos y varianza
El inconveniente de la varianza es que no se mide en las mismas
unidades de medida que la variable y, por tanto, es difcil de
interpretar. La solucin consiste en definir la desviacin tpica o
desviacin estndar como la raz cuadrada de la varianza.
En la primera muestra el valor de la desviacin tpica es
0.45 gr/l, un valor pequeo que indica poca dispersin.
En la segunda y tercera muestras el valor de la varianza
es 2.7 gr/l, un valor alto que indica dispersin o
existencia de valores extremos.
10

ESTADSTICA DESCRIPTIVA
Medidas de dispersin: recorridos y varianza
Ninguna de las tres medidas de dispersin presentadas permite,
por s sola, determinar si la variable est dispersa o no. Se
recomienda el uso de las tres medidas simultneamente para poder
describir esta caracterstica de la variable.
Adems, el histograma o el diagrama de barras, nos
permitirn determinar la existencia o no de dispersin y la
posible existencia de valores atpicos.

11

ESTADSTICA DESCRIPTIVA
Medidas de dispersin: recorridos y varianza
Descriptivos
Estadstico
162,9651
162,7000
80,598
8,9776
133,80
193,10
59,30
11,8000

Talla
200

100

Frecuencia

Media
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil

19

18

18

17

17

16

16

15

15

14

14

13

5,

0,

5,

0,

5,

0,

0,

0,

5,

0,

5,

5,

Talla

12

ESTADSTICA DESCRIPTIVA
El diagrama de caja
El diagrama de caja es una representacin grfica que nos
ayudar a detectar la existencia de valores extremos.
Valor mximo

200

Extremos
entre los que
espera
encontrar los
valores de la
variable

696
740
768
1068
789
1308
1100
599
635

190

Cuartiles, la
caja contiene
al 50% de las
observaciones

180

170

160

150

Valor mnimo

140
917
924

130
N=

1501

Talla

13

ESTADSTICA DESCRIPTIVA
El diagrama de caja
50
3

48

Aparecen
valores 46
extremos

Mucha
dispersin

44

42

Poca
40
dispersin

N=

MUESTRA1

MUESTRA2

MUESTRA3

14

ESTADSTICA DESCRIPTIVA
El diagrama de caja
El diagrama de caja representa el recorrido y el recorrido
intercuartlico, as como los lmites entre los que se espera
encontrar a la mayor parte de las observaciones. Los valores que
quedan fuera de los lmites se representan con un crculo si
quedan, relativamente cerca de lo que se considera normal y
con un asterisco si se pueden considerar datos atpicos.
Ante la existencia de valores extremos se debe estudiar su
procedencia: pueden ser errores de transcripcin a la hora de
almacenar los datos, individuos que no pertenecen a la poblacin
en estudio o simplemente datos atpicos.
15

ESTADSTICA DESCRIPTIVA
Medidas de dispersin: el coeficiente de variacin
Para comparar la dispersin entre dos poblaciones distintas se
define el coeficiente de variacin como el cociente entre la
desviacin tpica y la media.
El peso de las chicas es de 52.66 kg. con una desviacin
tpica de 8.94 kg. y el de los chicos de 56.91 kg. con una
desviacin tpica de 11.91 kg. Para comparar la dispersin
entre las dos poblaciones calculamos el coeficiente de
variacin:

CVChicos =

11.91
= 0.209
56.91

CVChicas =

8.94
= 0.170
52.66
16

ESTADSTICA DESCRIPTIVA
Medidas de dispersin: el coeficiente de variacin
SEXO:

1 Chicos

SEXO:

120

2 Chicas

140
120

100

100
80
80
60
60
40

Frecuencia

Frecuencia

40
20
0

17

Peso

12

11

11

10

99

93

87

80

74

68

62

55

49

43

37

30

10

10

95

90

85

80

75

70

65

60

55

50

45

40

35

30

Peso

20

S-ar putea să vă placă și