Sunteți pe pagina 1din 19

Estudia la distribucin, analizando si los datos se

encuentran ms o menos concentrados o ms o


menos dispersos.
Proporciona informacin extra que permite juzgar la
confiabilidad de las medidas de tendencia central,
debido a que cuando los datos estn muy dispersos,
la posicin central es menos representativa de la
serie de datos.
La dispersin se puede medir desde tres enfoques:
la distancia, la dispersin promedio y la dispersin
relativa
Nos permiten medir la dispersin en trminos de la
diferencia entre dos valores seleccionados del
conjunto de datos.
Rango: Es fcil de entender y calcular, pero su
utilidad es limitada, pues slo toma en cuenta el
valor ms grande y el valor ms pequeo y ninguna
otra observacin del conjunto de datos.
Rango Intercuartlico: Mide qu tan lejos de la
mediana se debe ir en cualquiera de las dos
direcciones, antes de recorrer una mitad de los
valores del conjunto de datos.
Rango Interpercentlico: Medida de
dispersin que calcula la diferencia en los
extremos de la distribucin (percentil 90 y
percentil 10)
Al realizar su clculo, nos proporcionan una
descripcin ms completa de la dispersin
respecto a alguna medida de tendencia central
Varianza: Medida del cuadrado de la distancia
promedio entre la media y cada observacin de la
poblacin
Desviacin Estndar: Es la raz cuadrada positiva
de la varianza. Tiene las mismas dimensionales
que los datos originales, a diferencia de la
varianza en la cual las dimensionales estn
expresadas por los cuadrados de las unidades
Determine que proveedor parece ms confiable por
medio de la desviacin estndar.

Compaa A Compaa B
Resistencia f Resistencia f
15.0-18.0 50 25.0-27.5 50
18.0-21-0 200 27.5-30.0 200
21.0-24.0 500 30.0-32.5 500
24.0-27.0 200 32.5-35.0 200
27.0-30.0 50 35.0-37.5 50
Para medir la dispersin relativa utilizamos el coeficiente de
variacin, el cual relaciona la desviacin estndar y la
media, expresando la desviacin estndar como
porcentaje de la media.

La unidad de medida del coeficiente de variacin es


porcentaje, en lugar de las dimensionales originales de la serie
de datos
La media y la desviacin tpica de los puntos conseguidos por
Ana y Rosa en una semana de entrenamiento jugando al
baloncesto han sido las siguientes: media de Ana 22 puntos y
desviacin tpica 4,106. Media de Rosa 22 puntos y desviacin
tpica 2.
a) Calcula el coeficiente de variacin de cada una de ellas.
b) Cul de las dos ha sido ms regular?
Entre dos personas que llevan una dieta reductora, la primera
pertenece a un grupo de edad de la cual el peso medio es 146
libras con una desviacin estndar de 14 libras y la segunda
pertenece a un grupo de edad de la que el peso medio es de
160 libras con una desviacin estndar de 17 libras. Cul de
los grupos lleva una dieta relativamente menos consistente?
Caractersticas
La forma es la manera en que los datos se distribuyen, es decir,
la forma de la curva que representa a la serie de datos.

La forma se mide en dos aspectos: Sesgo o Asimetra y Curtosis


o Apuntamiento
Mide si la curva de la grfica que representa a los datos es
simtrica respecto al eje vertical
Si en la curva hay simetra, entonces la distribucin es Simtrica o
Insesgada
Si en la curva no hay simetra, entonces la distribucin es
Asimtrica o Sesgada
El signo en los coeficientes de sesgo determina la asimetra:
+ Distribucin asimtrica positiva
- Distribucin asimtrica negativa
0 Distribucin simtrica
Del ejemplo 5 calcular SK1 y SK3
(coeficientes de sesgo) e interprete su
resultado.
Lmites aparentes Lmites reales Xi f F
0.2-1.5 0.15-1.55 0.85 17 17
1.6-2.9 1.55-2.95 2.25 11 28
3.0-4.3 2.95-4.35 3.65 7 35
4.4-5.7 4.35-5.75 5.05 6 41
5.8-7.1 5.75-7.15 6.45 4 45
7.2-8.5 7.15-8.55 7.85 3 48
8.6-9.9 8.55-9.95 9.25 2 50
Mide la altura o grado de apuntamiento de la curva
que representa a los datos (eje horizontal)
Segn su grado de curtosis, se definen 3 tipos de
distribuciones:
1. Mesocrtica: Grado de concentracin medio
alrededor de los valores centrales de la variable
(distribucin normal)
2. Leptocrtica: Grado de concentracin elevado
alrededor de los valores centrales de la variable
3. Platicrtica: Grado de concentracin reducido
alrededor de los valores centrales de la variable
El signo en el coeficiente de curtosis determina el grado de
concentracin:
Del ejemplo 5 calcular el coeficiente de curtosis.

Lmites aparentes Lmites reales Xi f F


0.2-1.5 0.15-1.55 0.85 17 17
1.6-2.9 1.55-2.95 2.25 11 28
3.0-4.3 2.95-4.35 3.65 7 35
4.4-5.7 4.35-5.75 5.05 6 41
5.8-7.1 5.75-7.15 6.45 4 45
7.2-8.5 7.15-8.55 7.85 3 48
8.6-9.9 8.55-9.95 9.25 2 50
Tablas de contingencia
La tabla de contingencia es una tabla de doble entrada, donde en
cada casilla figurar el nmero de casos o individuos que poseen
un nivel de uno de los factores o caractersticas analizadas y otro
nivel del otro factor analizado.
Se sortea un viaje a Roma entre los 120 mejores clientes de una
agencia de automviles. De ellos, 65 son mujeres, 80 estn
casados y 45 son mujeres casadas.
Tabule los datos anteriores.

S-ar putea să vă placă și