Sunteți pe pagina 1din 8

Sesin

18

MEDIDAS DE DISPERSIN EN EL ANLISIS DE DATOS PARA LA TOMA DE DECISIONES


En muchos mbitos del quehacer laboral y de la investigacin es frecuente escuchar frases como,
la desviacin tpica del peso de los estudiantes es muy grande o la media de las estaturas
presenta poca desviacin, estas medidas de dispersin estadstica entre otras se utilizan para
tomar decisiones y constituyen importantes fuentes para el anlisis de datos y variables, a
continuacin veamos un caso.
Caso 1: La prueba de Historia
Nro
Sexo
Notas
Las notas de una prueba de Historia de un grupo de estudiantes
de 5to ao se muestran en la tabla siguiente.
1
M
14
a) El profesor cree que el rango de las notas obtenidas en la
2
H
16
prueba es muy grande. Cul es el rango de las notas
3
M
14
obtenidas en la prueba de historia?
4
H
12
.
5
M
17
.
6
M
10
.
7
M
16
.
8
M
12
.
9
M
17
10
M
17
b) El profesor del curso ha sealado que si la desviacin media
de dicha prueba es mayor de 2 les dar otra oportunidad y
tomarn otra prueba Tomarn otra prueba de Historia los
estudiantes de 5to? (se sabe que la media de los datos es 14,5)
.
.
.
.
c) Al ver la media de la prueba (14,5), el profesor del curso ha sealado que, una varianza de
hasta 4,5 indicara buenos resultados. Cul es la varianza de las notas en la prueba de
Historia?
.
.
.
.
d) Con la finalidad de estar seguro de la distribucin de las notas, el profesor de Historia decide
que ser la desviacin estndar la que defina si se toma o no otro examen, por ello ha
sealado que, si el doble de la desviacin estndar es mayor que 4,5 se tomar otro examen.
.
.
.
.
Aprendemos
Rango.- El rango es una medida de dispersin de datos, se calcula a partir de la diferencia entre
el mayor y el menor de todos ellos. Hay 2 maneras de expresar esta medida.
- La diferencia entre los valores. (mayor y menor)
- Los valores mayor y menor del grupo.
Limitaciones del rango:
- Considera slo los valores extremos de un conjunto, y no proporciona mayor
informacin respecto a los dems valores del mismo
- Tiene una limitada utilidad para los distintos tipos de anlisis estadsticos
Desviacin media (DM).- Mide la desviacin promedio de valores con respecto a la media del
grupo, sin tomar en cuenta el signo de la desviacin.

es la media aritmtica de los nmeros y |x j - | es el valor absoluto de la desviacin de x j


respecto de . (El valor absoluto de un nmero es el nmero sin signo y se denota con dos
barras verticales)

DM
Varianza (S2).- La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la
media de una distribucin estadstica.

Propiedades de la varianza
-

La varianza ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean
iguales.
Si a todos los valores de la variable se les suma un nmero la varianza no vara.
Si todos los valores de la variable se multiplican por un nmero la varianza queda multiplicada
por el cuadrado de dicho nmero.
Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas
se puede calcular la varianza total.
Limitaciones de la varianza

La varianza, al igual que la media, es un ndice muy sensible a las puntuaciones extremas.
En los casos que no se pueda hallar la media tampoco ser posible hallar la varianza.
La varianza no viene expresada en las mismas unidades que los datos, ya que las
desviaciones estn elevadas al cuadrado.
Desviacin estndar (DS).- Tambin conocida como desviacin tpica, es la raz cuadrada de la
varianza. Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de
desviacin.

DS

Propiedades de la desviacin tpica


-

La desviacin tpica ser siempre un valor positivo o cero, en el caso de que las puntuaciones
sean iguales.
Si a todos los valores de la variable se les suma un nmero la desviacin tpica no vara.
Si todos los valores de la variable se multiplican por un nmero la desviacin tpica queda
multiplicada por dicho nmero.
Si tenemos varias distribuciones con la misma media y conocemos sus respectivas
desviaciones tpicas se puede calcular la desviacin tpica total.
Observaciones sobre la desviacin estndar

La desviacin tpica, al igual que la media y la varianza, es un ndice muy sensible a las
puntuaciones extremas.
En los casos que no se pueda hallar la media tampoco ser posible hallar la desviacin tpica.
Cuanta ms pequea sea la desviacin tpica mayor ser la concentracin de datos alrededor
de la media.

ANALIZAMOS
Caso 2: Colesterol
La compaa farmacutica "Mediplus" llev a cabo un
estudio clnico con 20 personas, para probar la efectividad
del medicamento Radinul, el cual se ha diseado para
ser un potente y seguro tratamiento para reducir los
elevados niveles de colesterol. Este estudio se llev a cabo
en 12 semanas, en las cuales los participantes ingirieron
una pastilla diaria de Radinul. -La base de datos obtenida
en este estudio se muestra en la tabla adjunta, en la cual
se muestran los niveles de colesterol Antes y Despus
del tratamiento. Se sabe que las medias del nivel de
colesterol Antes y Despus del tratamiento
respectivamente son 264,4 y 167,1
a) Cul es el rango del nivel de colesterol antes del
tratamiento con Radinul?
Solucin
Se sabe: Rango = Mximo Mnimo
Luego:
Mximo = 314; Mnimo = 118
==> Rango = 314 118 = 196

Cdi
go
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Nivel de
Gne colesterol
ro
Despu
Antes
s
2
2
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
1
1

230
267
312
314
306
292
249
230
232
269
230
267
312
314
306
292
249
230
118
269

173
173
168
168
169
169
162
162
165
165
168
169
168
169
176
176
168
168
153
153

b) Con la finalidad de determinar el intervalo que agrupe los datos alrededor de la media antes
del tratamiento. Los responsables del estudio, han decidido utilizar la DM. Cul es el
intervalo que agrupa los datos alrededor de la media utilizando la DM?
Solucin
El intervalo solicitado tendra la siguiente forma:
[Media DM ; Media + DM]
Luego, se requiere calcular la Desviacin Media DM del nivel de colesterol antes del
tratamiento.
1. Se calculan x i x * ni
Se sabe por dato que la antes =

264.4
2. Se suman los valores [|Xi - |]*ni, en
este caso
[|Xi - X|]*ni = 694,40
3. Se divide el valor hallado entre el total
de datos, en este caso n = 20

DM

xi x
n

Xi

ni

Ni

[|Xi - |]*ni

118
230
232
249
267
269
292
306
312
314

1
4
1
2
2
2
2
2
2
2

1
5
6
8
10
12
14
16
18
20

146,40
137,60
32,40
30,80
5,20
9,20
55,20
83,20
95,20
99,20

694,40
34,72
20

Finalmente como el intervalo solicitado es [Media DM ; Media + DM]


Entonces: [264,40 34,72 ; 264,40 + 34,72] = [229,68 ; 299,12]

c) Ordene de forma creciente los niveles de colesterol de cada persona y elabore un grfico de
dispersin de puntos de dichos niveles en el siguiente plano cartesiano.

d) En el grfico anterior grafique la lnea de tendencia que mejor se ajuste a los puntos.

e) Segn un informe de la Asociacin Americana del Corazn1 los niveles de colesterol son:
Nivel
Situacin
Menos de 200 mg/dL
Deseable (menor riesgo)
200 a 239 mg/dL
Lmite elevado (mayor riesgo)
Elevado (ms del doble de
240 mg/dL y superior
riesgo que el nivel deseable)
Y como se sabe ( antes = 264,4), por tanto se sabe que en promedio las personas
que participan del estudio tienen nivel elevado de colesterol, por lo que l os
responsables del estudio, esperan que la varianza sea menor a 1800. Cul es la varianza
del nivel de colesterol antes del tratamiento en las personas que participan de este estudio?
Solucin
1. Se calculan [Xi -]2*ni
[Xi - ]2*ni
Xi
ni
Ni
2. Se suman los valores [Xi - ]2*ni, en este caso
[Xi - X]2*ni = 42 182,80
3. Se divide el valor hallado entre el total de
datos, en este caso n = 20

118
230
232
249
267
269
292
306
312
314

https://www.heart.org/idc/groups/heartpublic/@wcm/@hcm/documents/downloadable/ucm_316249.pdf

1
4
1
2
2
2
2
2
2
2

1
5
6
8
10
12
14
16
18
20

21 432,96
4 733,44
1 049,76
474,32
13,52
42,32
1 523,52
3 461,12
4 531,52
4 920,32

s2

[Xi - X] 2 * ni
42 182,80

2 109,1 4
n
20

Finalmente la Varianza del nivel de colesterol antes del tratamiento es 2 109,14


f)

Cul es la diferencia de medias Antes y despus del estudio? Qu significa esta


diferencia? Explique.
Solucin
Como se sabe:
Mediaantes= 264,40
Mediadespus= 167,10
Luego la diferencia de medias es: 264,40 167,10 = 97,30
Luego, esta diferencia significa que los participantes del estudio redujeron en promedio 97,30
puntos en los niveles de colesterol despus del tratamiento.

g) Halle las medidas de dispersin (Rango, DM, varianza y DS) de los niveles de colesterol
despus del tratamiento con Radinul.
Solucin
Hallando el rango:
Se sabe: Rango = Mximo Mnimo
Luego:
Mximo = 176; Mnimo = 153
==> Rango = 176 153 = 23
Hallando la DM
1. Se calculan xi x * ni
2. Se suman los valores [|Xi - |]*ni,
en este caso
[|Xi - |]*ni = 85,20
3. Se divide el valor hallado entre el
total de datos, en este caso n = 20

DM

xi x

n
Hallando la varianza

Xi

ni

Ni

[|Xi - X|]*ni

153
162
165
168
169
173
176

2
2
2
6
4
2
2

2
4
6
12
16
18
20

28,20
10,20
4,20
5,40
7,60
11,80
17,80

85,20
4,26
20

1. Se calculan [Xi - ]2*ni

Xi

ni

Ni

[Xi - X]2*ni

153
162
165
168
169
173
176

2
2
2
6
4
2
2

2
4
6
12
16
18
20

397,62
52,02
8,82
4,86
14,44
69,62
158,42

2. Se suman los valores [Xi - ]2*ni, en este caso


[Xi - X]2*ni = 705,80
3. Se divide el valor hallado entre el total de datos, en este caso n = 20

[Xi - X] 2 * ni
705,80

35,29
n
20
Hallando la desviacin estndar
S2

Se sabe que la desviacin estndar DS =


Entonces DS =

= 5,94

Practicamos

Tabla 1

Caso 3: Agresividad e Inteligencia emocional

Intelige

Una encuesta annima para determinar los niveles Nr Nombr Sex Agresivi
ncia
de agresividad e inteligencia emocional se llev a
o
es
o
dad
Emocion
cabo en un grupo de estudiantes de 5to de
al
secundaria de un colegio secundario. En la tabla
1 Jos
H
0,68
38
adjunta se muestran los puntajes obtenidos en cada
H
0,54
53
2 Marcos
variable. Asimismo se conoce el sexo (M: Mujer y H:
Hombre) de dichos estudiantes. Asimismo, se sabe
H
0,70
35
3 David
que las medias de dichas variables son, agresividad =
Roberto
H
0,30
66
4
0,65; int.emoc = 41,95
M
0,54
54
5 Mara
1. Cul es el rango del nivel de agresividad de
M
0,66
50
6 Rosmeri
los estudiantes de 5to de secundaria?
H
0,83
28
7 Luis
a) 0,04
Carla
M
0,63
47
8
b) 0,40
M
0,73
31
9 Regina
c) 0,50
Mercedes
M
0,66
45
10
d) 0,53
Pedro
H
0,43
50
11
2. Los responsables de la encuesta, han sealado
Juan
H
0,67
44
que, si la desviacin media de los niveles de 12
M
0,74
26
agresividad, es menor o igual a 0,05 (DM 13 Celia
Matas
H
0,71
33
14
0,05), puede considerarse que la agresividad
Jess
H
0,73
27
15
en dicho grupo de estudiantes requiere ser
Ramiro
H
0,67
42
atendida por un psiclogo, mientras que si es 16
H
0,69
39
superior a dicho valor bastara que su tutor 17 No
Ricardo
H
0,72
36
18
converse con ellos. Cul de las dos decisiones
Roco
M
0,65
48
19
deber
tomarse
con
los
estudiantes
M
0,64
47
20 Felicia
encuestados de 5to de secundaria?
a) Debern ser atendidos por un psiclogo.
b) El tutor deber conversar con los estudiantes.
c) No se puede determinar la DM de agresividad.
d) Debera intervenir el Director.
3. Con la finalidad de determinar la dispersin de los niveles de agresividad, los responsables de la
encuesta deciden tomar en cuenta la varianza. Cul es el valor de la varianza del nivel de agresividad
en los estudiantes de 5to de secundaria?
a) 0,01
b) 0,10
c) 0,26
d) 2,60
4. Considerando los valores de agresividad e inteligencia emocional de la Tabla 1 elabore un grfico de
dispersin de puntos de dichos valores en el siguiente plano cartesiano.

0,2
0,80

0,4
1,00

0,6

5. En el grfico anterior grafique la lnea de tendencia que mejor se ajuste a los puntos

0,2
0,80

0,4

dados.

0,6

1,00

6. Qu puede concluir de la grfica anterior, en relacin a la agresividad y la inteligencia emocional de


los estudiantes?
a) Existe relacin inversa entre la agresividad y la inteligencia emocional.
b) Existe relacin directa entre la agresividad y la inteligencia emocional.
c) No existe relacin entre la agresividad y la inteligencia emocional.
d) No se puede llegar a ninguna conclusin.
7. Con la finalidad de establecer la amplitud de puntajes en inteligencia emocional, se desea calcular el
rango de dichos valores para el grupo de estudiantes de la Tabla 1. Cul es el rango de puntajes de
inteligencia emocional mostrados en la Tabla 1?
a) 30
b) 40
c) 42
d) 45
8. Con la finalidad de establecer diferencias por sexo para la variable agresividad, los responsables de la
encuesta desean saber si el rango presenta diferencias cuando se agrupa por sexo a los estudiantes.
Determine si el rango de los puntajes de agresividad mostrados en la Tabla 1 es mayor en los hombres
o en las mujeres.
a) El rango es mayor en los hombres
b) El rango es mayor en las mujeres
c) Es igual en ambos
d) No se puede determinar.
9. A partir de los resultados hallados en el problema anterior. En relacin a los rangos de los hombres y
mujeres para la variable agresividad, puede concluirse lo siguiente:
a) Los puntajes de agresividad de los hombres tienen menor dispersin que en las mujeres.
b) Los puntajes de agresividad de los hombres tienen mayor dispersin que en las mujeres.
c) Los puntajes de agresividad de los hombres y mujeres son iguales.
d) No se puede determinar diferencias en el rango entre hombres y mujeres.
10. Con la finalidad de establecer diferencias por sexo para la variable inteligencia emocional, los
responsables de la encuesta desean saber si el rango presenta diferencias cuando se agrupa por sexo
a los estudiantes. Determine si el rango de los puntajes de inteligencia emocional es mayor en los
hombres o en las mujeres.
a) El rango es mayor en los hombres
b) El rango es mayor en las mujeres
c) Es igual en ambos

d) No se puede determinar.
11. Con la finalidad de precisar la dispersin de datos entre las variables agresividad e inteligencia
emocional se ha dispuesto, hallar las desviaciones estndar de ambas variables y determinar cul de
las dos tiene mayor desviacin?
a) La agresividad tiene mayor desviacin estndar que la inteligencia emocional.
b) La agresividad tiene menor desviacin estndar que la inteligencia emocional.
c) La agresividad y la inteligencia emocional tienen la misa desviacin estndar.
d) No se puede determinar la desviacin estndar de ambas variables.
12. Con relacin a los puntajes de agresividad e inteligencia emocional de los 20 estudiantes considerados
en el estudio de referencia, y considerando sus respectivas desviaciones estndar halladas en la
pregunta anterior. Cul de las siguientes afirmaciones es correcta?
a) Los puntajes de agresividad estn ms concentrados alrededor de su media que los puntajes de
inteligencia emocional.
b) Los puntajes de agresividad estn menos concentrados alrededor de su media que los puntajes de
inteligencia emocional.
c) Los puntajes de inteligencia emocional y agresividad presentan la misma dispersin
d) Existe una aparente diferencia en las desviaciones estndar
13. Segn se aprecia en la Tabla 1, el conjunto de puntajes de agresividad es bimodal, es decir presenta 2
modas (0,66 y 0,73). si a partir de la media se construye un intervalo cuyo radio es 1 SD (Desviacin
estndar). Cul de las siguientes afirmaciones en relacin a las modas es correcta?
a) Slo la moda 0,66 pertenece al intervalo definido por la desviacin estndar.
b) Slo la moda 0,73 pertenece al intervalo definido por la desviacin estndar.
c) Ambas modas 0,66 y 0,73 pertenecen al intervalo definido por la desviacin estndar.
d) Ninguna de las modas 0,66 y 0,73 pertenecen al intervalo definido por la desviacin estndar.
14. Se sabe que la mediana de puntajes de agresividad es 0,675. Considerando el intervalo hallado en la
pregunta anterior. Grafique en la recta numrica dicho intervalo y los siguientes valores, Rango, Media,
Mediana, Moda para la variable agresividad.

15. Segn se aprecia en la Tabla 1, el conjunto de puntajes de inteligencia emocional es polimodal, ya que
presenta 4 modas (27, 45, 48, 50). Si a partir de la media se construye un intervalo cuyo radio es 1 DS
(Desviacin estndar). Cul de las siguientes afirmaciones en relacin a las modas es correcta?

a)
b)
c)
d)

Todas las modas pertenecen al intervalo definido por la desviacin estndar.


Slo la moda 50 no pertenece al intervalo definido por la desviacin estndar.
Las modas 27 y 50 no pertenecen al intervalo definido por la desviacin estndar.
Slo la moda 27 no pertenece al intervalo definido por la desviacin estndar.

S-ar putea să vă placă și