Documente Academic
Documente Profesional
Documente Cultură
SEMANA 03
Medidas de resumen y
diagrama de cajas
ഥ𝑨 = 2500 unidades
𝒙 ഥ𝑩 = 2500 unidades
𝒙
Conservas de atún producidas diariamente según local de producción
Local A
Local B
Producción de atún
Observando el comportamiento de los datos, ¿en cuál de los dos locales, la
producción promedio (en unidades de atún) es más representativa?
X
x i El que se presenta con
n mayor frecuencia según
fi, hi o pi
Características
20%
estatura mínima
Si la medida de dispersión:
R= Xmáximo- Xmínimo
Ejemplo1:
El jefe de control de calidad de la empresa industrial de termas eléctricas
Thermosol S.A. presenta en una muestra de 12 termas, el número de
defectos que presenta cada terma.
x 𝑁 ′
2
i σ𝑁 𝑥𝑖 − 𝜇 2𝑓 2
σ𝑖=1 𝑥𝑖 − 𝜇 2 𝑓𝑖
poblacional 2 i 1
𝜎2 =
𝑖=1 𝑖 𝜎 =
N 𝑁 𝑁
Varianza n
x x
2 𝑛 ′
𝑛 2 σ 𝑥 − 𝑥ҧ 2𝑓
muestral i σ𝑖=1 𝑥𝑖 − 𝑥ҧ 𝑓𝑖 𝑖=1 𝑖 𝑖
s2 i 1 2
𝑆 = 𝑆2 =
n 1 𝑛−1 𝑛−1
Medidas de dispersión o variación
Es una medida de dispersión relativa libre
S de unidades y que siempre se expresa en
CV(X) x100% porcentaje. Es útil para comparar la
X variabilidad de dos o más grupos de datos,
aunque ellos estén expresados en distintas
unidades de medida o cuando los
promedios de los conjuntos de datos a
comparar son diferentes.
GrupoA
Datos de ingresos
(en dólares) ¿Qué grupo de datos es más homogéneo?
Asimétrica negativa o
sesgo izquierdo
Asimétrica positivo o
sesgo derecho
Curtosis
Mesocúrtica (B): Grado de
concentración normal
700 10000
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
Resistencia
Diagramas de cajas
Permite:
Comparar las medianas de
dos o mas conjuntos de
datos.
Observar el tipo de
distribución de los datos
(simétrica o asimétrica).
Determinar la dispersión
en el 50% central de los
datos.
Identificar la presencia de
valores extremos (datos
atípicos)
Construcción de un diagrama de caja
1. Se calcula: Q1, Q2 , Q3 , RIC, 1,5RIC, Li, Ls y bigotes.
2. Se traza una línea de referencia horizontal o vertical (para la escala)
3. Se traza un rectángulo con los extremos en el primer y tercer cuartil y se traza
una recta vertical en la mediana.
4. Se dibujan los límites a 1,5 rango intercuartil de los cuartiles 1 y 3, Se
considera que los datos fuera de estos límites son atípicos. Li =Q1-(1,5)RIC;
Ls=Q3 +(1,5)RIC.
5. Las líneas antes y después de las cajas se llaman bigotes, se traza desde los
extremos de la caja hasta el mínimo y máximo dentro de los límites inferior y
superior.
6. Se marcan con un asterisco los valores fuera de los límites (valores atípicos).
bigote
Ejemplo
Modo A 28 29 32 37 33 25 29 32 45 34
Modo B 29 31 33 32 34 30 31 32 35 33
Afirmaciones V F
Con el RIC se analiza la dispersión de todos Verdadero
los datos.
Si las unidades de los datos son minutos, la Verdadero
varianza se expresa en minutos al cuadrado.
La Rango es afectado por valores muy Verdadero
grandes.
Si el CV(A)=20.4% y CV(B)=60.4%. ¿Quién es B
más variable?
La varianza muestral se define como la suma Falso
de las diferencias al cuadrado de cada valor
respecto a su media entre el numero de
datos.
Evaluación
Llene los espacios en blanco de tal manera que
la proposición resultante resulte verdadera
1. El índice de calidad mediano es Distribución del índice de calidad para productos fabricados en dos plantas
aproximadamente______________ en 200
ambas plantas.
2. El índice de calidad en la planta A presenta
150
distribución asimétrica_______________
Indice de calidad
mientras que el índice de calidad en la
planta B presenta distribución
100
asimétrica____________________
3. La variabilidad del índice de calidad en el
50% central es mayor en la planta ______ 50
COMPLEMENTARIA