Sunteți pe pagina 1din 33

MEDIAS DE DISPERSIÓN O

VARIABILIDAD
Algunas consideraciones
1. Variación, se refiere a la cantidad en que los
datos u observaciones varían entre si, esta
variación puede medirse.

2. Los datos que están relativamente cercanos


entre si, tienen bajas medidas de
variabilidad, mientras que los que están mas
alejados entre si tienen medidas de
variación mas grandes,
Términos equivalentes
Menor dispersión = más homogéneo
Mayor dispersión = menos homogéneo
Menor dispersión = menos heterogéneo
Mayor dispersión = más heterogéneo
MEDIDAS DE DISPERSION
• Definición 1
• Una medida de dispersión de un
conjunto de datos, mide cuan esparcidos
se encuentran estos o que tan
heterogéneos son.
• Hay varias medidas de dispersión, siendo
las más comunes las siguientes:
Principales medidas de dispersión

• El rango
• Rango Intercuartil
• La varianza
• La desviación estándar
• El coeficiente de variación
Medidas de variación
• Concepto clave. Estas medidas son una de las partes más
importantes de la estadistica, pues presenta el tema de la variación,
un concepto muy relevante en estadística.
• Obtenga una comprensión general de las características de la
variación. Luego, aprenda a usar el conjunto de datos para calcular
los valores del rango y la desviación estándar. Trate
• de comprender la regla práctica del intervalo para interpretar
valores de desviación estándar; también trate de comprender el
razonamiento que subyace en la fórmula de la desviación estándar,
pero no dedique mucho tiempo a memorizar fórmulas o a hacer
cálculos aritméticos.
• En vez de ello, dé mayor importancia a interpretar los valores de la
desviación estándar.
Tiempos de espera (en minutos) de clientes de
bancos.
Rango

• Definición
El rango de un conjunto de datos es la
diferencia entre el valor máximo y el valor
mínimo.

Rango = (valor máximo) - (valor mínimo)

R = X máx – X min
• Para calcular el rango, sólo se resta el valor mínimo
del valor máximo.
• Para los clientes del primer banco, el rango es 6 - 6 =
0 min.
• Para los tiempos de espera de la fila única, el rango
es 7 - 4 = 3 min.
• Los tiempos de espera en múltiples filas tienen un
rango de 13 min; este valor más grande sugiere una
mayor variación.
• Es muy fácil calcular el rango, pero como depende
únicamente de los valores máximo y mínimo, no es
tan útil como otras medidas de variación que
incluyen cada valor.
Ejemplo 1
• Ante la pregunta sobre número de hijos por
familia, una muestra de 12 hogares, marcó las
siguientes respuestas:
2 1 2 4 1 3
2 3 2 0 5 1
• Calcule el rango de la variable

Solución
• El Rango es R = 5 – 0 = 5
Confiabilidad y validez
• La confiabilidad de los datos se refiere a la consistencia
con que éstos se presentan, en tanto que la validez de
los datos se refiere a qué tan bien miden lo que se
supone que deben medir. La confiabilidad de una
prueba de cociente intelectual (CI) se puede evaluar al
comparar las puntuaciones de una aplicación con las
puntuaciones de una aplicación posterior. Para probar
la validez de una prueba de CI, podríamos comparar las
puntuaciones de la prueba con otro indicador de la
inteligencia, como el rendimiento académico. Muchos
críticos consideran que las pruebas de CI son
confiables, pero no válidas: arrojan resultados
consistentes, pero en realidad no miden la inteligencia.
La Varianza
• Usamos el término variación como una
descripción general de la cantidad que varían
los valores entre sí. (En ocasiones se aplica el
término dispersión en vez de variación). El
término varianza se refiere a una definición
específica.
Definición
• La varianza de un conjunto de valores es una
medida de variación igual al cuadrado de la
desviación estándar.
• Varianza muestral: s2 el cuadrado de la
desviación estándar s.

• Varianza poblacional: σ2 el cuadrado de la


desviación estándar poblacional σ.
La varianza

 i
( x  x ) 2

s2  i 1

n 1

Muestral

N
Poblacional
 i x
( x   ) 2

2  i 1
N
Ejemplo 2
• Calcule la varianza para los datos del ejemplo 1
2 1 2 4 1 3 2 3 2 0 5 1

• Solución:

s  1,9697
2
Desviación estándar
• La desviación estándar es, por lo general, la
medida de variación más importante y útil.
• Definición
La desviación estándar de un conjunto
de valores muestrales, es la medida de
variación de los valores con respecto a
la media.
Desviación estándar

(x i  x )2
s i 1

n 1
Muestral

N
Poblacional
 i x
( x   ) 2

 i 1

N
Desviación estándar
Ejemplo 3
Calcule la desviación estándar para los datos del
ejemplo 1

Solución:

s  1, 4035
La regla empírica
Regla empírica para datos con
distribución normal (o 68-95-99.7)
• Otra regla útil para interpretar los valores de
una desviación estándar es la regla empírica.
Esta regla establece que las siguientes
propiedades se aplican a conjuntos de datos con
una distribución aproximadamente normal.
– Aproximadamente el 68% de todos los valores están
dentro de una desviación estándar de la media.
– Aproximadamente el 95% de todos los valores están
dentro de 2 desviaciones estándar de la media.
– Aproximadamente el 99.7% de todos los valores
están dentro de 3 desviaciones estándar de la media.
EJEMPLO = Pulso cardiaco de mujeres
• Resultados anteriores de la encuesta sobre salud National Health Survey
sugieren que el pulso cardiaco (latidos por minuto) tiene una media de
76.0 y una desviación estándar de 12.5. Utilice la regla práctica del
intervalo para calcular las frecuencias máxima y mínima “comunes”. (Estos
resultados podrían ayudar a un médico a identificar pulsos cardiacos
“poco comunes” asociados con alguna enfermedad). Luego determine si
un pulso cardiaco de 110 sería considerado “poco común”.
SOLUCIÓN Con una media de 76.0 y una desviación estándar de 12.5,
utilizamos la regla práctica del intervalo para calcular los pulsos cardiacos
mínimo y máximo comunes de la siguiente manera:
• valor mínimo “común” = (media) - 2(desviación estándar) = 76.0 - 2(12.5) =
= 51 latidos por minuto
• valor máximo “común” = (media) - 2(desviación estándar) = 76.0 - 2(12.5)
= 101 latidos por minuto

INTERPRETACIÓN Con base en estos resultados, esperamos que la mujer


común tenga un pulso cardiaco de entre 51 y 101 latidos por minuto. Puesto
que 110 latidos por minuto no cae dentro de esos límites, ese valor sería
considerado poco común. Con un pulso cardiaco de 110, un médico trataría
de encontrar la razón de esta lectura poco común.
Calcula la desviación
estándar para los datos del
ejemplo 1
1. Ingresa a modo STAT.
2. Ingresa los datos.
3. Solicita xn-1.
Calcula la desviación
estándar para los datos del
ejemplo 1
1. Ingresa a modo SD.
2. Ingresa los datos.
3. Solicita xn-1.
Coeficiente de variación
• Compara la variabilidad de series de datos que tengan
unidades diferentes.
• No tiene unidades de medida.
• Se calcula para variables medidas en escala de razón

S
CV   100%
Muestral x

Poblaciona

l
CV   100%

Ejemplo 4
• Calcule el coeficiente de variabilidad para los
datos del ejemplo 1
• Solución:

 1,4035 
cv    x100  64,7759%
 2,1667 
Medidas de dispersión en tablas de
frecuencias (caso discreto)
2
 k

  xi f i 
 i 1 
k k

 f i ( xi  x ) 2
 f x
i i
2

n
Muestral s 
2 i 1
 i 1
n 1 n 1

Poblacional k k
i i
f ( x   ) 2
ii
f x 2

2  i 1  i 1  2
N N
Ejemplo 5

• Se han registrado Número de


durante 20 días, el viajeros:
número de viajeros que i xi fi
hacen reservaciones a 1 12 3
una agencia de viajes
pero que no las hacen 2 13 3
efectivas: 3 14 6
4 15 3
5 16 5
Total 70 20

Calcule las medidas de dispersión de la variable


en estudio. Interprete
Solución

i xi fi xifi xi2 xi2fi


1 12 3 36 144 432
2 13 3 39 169 507
3 14 6 84 196 1176
4 15 3 45 225 675
5 16 5 80 256 1280
Total 70 20 284 990 4070

284 2
4070 
s2  20  1,9579  s  1,3992
19
Una variable cuantitativa continua
Varianza muestral
2
 k

  f i xi 
f i xi2   i 1 
k k

 f i ( xi  x ) 2  n
s2  i 1
 i 1
n 1 n 1

Varianza poblacional

k k

 f i ( xi   ) 2
 f i xi2
2  i 1
 i 1
 2
N N
Estadísticos apropiados por escalas

•Nominal
•Moda, número de casos
•Ordinal
•Mediana, percentil
•Intervalo
•Media, rango, varianza, desviación
estándar
MEDIDAS DE POSICION

• CUANTILES
– Percentiles
– Cuartiles
– Deciles

Qr ( K )  n * %deseado
No es más que calcular el
Ejemplo % deseado y ubicarlo en la
frecuencia acumulada
Salario Frecuencia
(mínimos) Frecuencia Acumulada
2 25 25
3 30 55 El 40% de las personas
4 24 79 devengan aproximadamente
5 26 105 3 salarios mínimos o menos.
6 15 120
7 10 130
8 5 135
9 2 137
137

Q4(10)  137 * 40% Q3( 4)  137 * 75%


54.8 102.75

S-ar putea să vă placă și