Sunteți pe pagina 1din 39

HISTOGRAMAS

LA RECOLECCION DE DATOS:

Los valores que se registran deben corresponder realmente a lo


que hanos observado. Es necesario registrar fielmente los datos.
Sí los datos son contínuos, como por ejemplo tiempo o
temperatura del lugar, etc. Es muy importante efectuar la
medición con la mayor precisión posible, esto es, con el menor
error posible.
Se deben usar adecuadamente los instrumentos de medición y
cuidar que estén calibrados carrectamente.

Si hay errores en la obtención de datos, las conclusiones no serán


objetivas, a pesar de tener muestras representativas y realizar un
buen estudio estadístico.
HISTOGRAMAS
LA ORGANIZACIÓN DE DATOS EN DISTRIBUCIONES
DE FRECUENCIAS

Para poder analizar los datos y obtener la información que


deseamos a partir de ellos, necesitamos ordenarlos. La forma
común de ordenarlos consiste en construir con ellos una tabla
llamada distribución de frecuencia.

El procedimiento que se sigue para la elaboración de ésta tabla


consiste básicamente en organizar los datos por grupos, a fín de
poder ver:.
HISTOGRAMAS
LA ORGANIZACIÓN DE DATOS EN DISTRIBUCIONES
DE FRECUENCIAS

Que datos representan los valores más bajos, y cuales los más
altos.

Con que frecuencia se presentan los datos en los grupos.

La forma de población de los datos.


HISTOGRAMAS
LA ORGANIZACIÓN DE DATOS EN DISTRIBUCIONES
DE FRECUENCIAS

Nota: El uso y elabración del histograma requieren que los datos


en que se apoya sean del tipo variables contínuas, es decir,
aquellas que provienen de procesos de medición. En caso de que
los datos no sean de ésta clase, y correspondan al grupo de
variables por atributos, se recomienda utilizar la gráfica de
barras.
DISTRIBUCION
DE FRECUENCIA
COMO SE HACE?
Paso 1:
Obtenga el rango (R) de los datos, que es la diferencia que existe
entre el dato mayor (XM) y el menor (Xm) de un conjunto de datos:
R = XM – Xm, e indica cuanta distancia cubren los datos si se
ordenan en una recta numérica.
Paso 2:

Determinación del número de subgrupos que se formarán. Se


llama clase a cada uno de los subconjuntos en los que se agrupan
los datos.
DISTRIBUCION
DE FRECUENCIA
COMO SE HACE?
Paso 2:
 Cabe aclarar que se utilizan términos sonónimos para éstos
subconjuntos: Clases, intervalos de calse, o intervalos. Para
determinar en cuantas clases (K) conviene agrupar los datos,
se acostumbra a tomar en cuenta la siguiente norma:
Cantidad de datos (N) Cantidad de clases (K)
Menos de 50 5a7
50 – 100 6 – 10
100 – 250 7 – 12
Más de 250 10 - 20
DISTRIBUCION
DE FRECUENCIA
COMO SE HACE?
Paso 2:

 El valor de K indicado por ésta tabla es uno tentativo, es


decir, el número de clases para un conjunto de datos es más
bien arbitrario, sirviendo los criterios presentes sólo de
guias. Existe un criterio adicional para determinar el valor de
K; se calcula la raiz cuadrada de N, y se redondea al entero
que uno considere apropiado.
DISTRIBUCION
DE FRECUENCIA
COMO SE HACE?
Paso 3:

Establecido el número de clases en que van a quedar agrupados los


datos, se determina la amplitud de cada clase. Esto se lleva a cabo,
primero, dividiendo el rango (R) obtenido del conjunto de datos
entre el número establecido de clases: (R  U)
A
K

 Para el manejo de datos, aplicar conceptos de cifras


significativas en los resultados finales.
DISTRIBUCION
DE FRECUENCIA
COMO SE HACE?
Paso 4:

Establecer los valores límites de cada clase, que son llamados las
fronteras inferior (FI) y superior (FS) de cada una. La frontera
inferior d ela primera clase se establece restando la mitad de na
unidad (U) al dato menor de todo el conjunto.

 Cuando se trabaja con números enteros, la unidad (U)


equivale a 1. Si se trabaja con números fraccionarios, la
unidad U es de la misma clase que la de las unidades
fraccionarias que se manejan.
DISTRIBUCION
DE FRECUENCIA
COMO SE HACE?
Paso 4:

Sea X la frontera inferior de la primera clase; tenemos entonces


que:
1
X  Xm - (U )
2
La frontera superior de la primera clase se establece añadiendo a la
frontera inferior la cantidad de amplitud (A) obtenida:

 1 
 X m  (U)   A
 2 
DISTRIBUCION
DE FRECUENCIA
COMO SE HACE?
Paso 4:

La frontera inferior de la segunda clase se identifica con la frontera


superior de la primera clase. La frontera superior de la segunda
clase se obtiene añadiendo 2 veces la cifra obtenida como
amplitud, a la frontera inferior de la primera clase (X). Así, la
frontera superior de la segunda clase es X + 2A. y así
sucesivamente...

La tabla de distribución de frecuencias toma así la siguiente forma:


DISTRIBUCION
DE FRECUENCIA
COMO SE HACE?
Paso 4:
Clase Fronteras
i FI Fs
1 X X+A
2 X+A X + 2A
3 X + 2A X + 3A
4 X + 3A X + 4A
. . .
. . .
K X + (K – 1)A X + KA
DISTRIBUCION
DE FRECUENCIA
COMO SE HACE?
Paso 5:

Se calcula el punto medio de cada clase, valor que se denomina


marca de clase; esta se denota por Xi (con i = 1,2,3,.., K) y es la
semisuma de las fronteras de clase: F F
Xi  Ii Si
2
DISTRIBUCION
DE FRECUENCIA
COMO SE HACE?
Paso 6:

Contar el número de datos que caen dentro de cada una de las


clases establecidas, esto es calcular las frecuencias absolutas
denotadas fi. (Lógicamente, la suma de la columna de frecuencias
absolutas debe coincidir con el total de los datos manejados (N); es
decir: ) K

 fi  N
i 1
DISTRIBUCION DE FRECUENCIA
COMO SE HACE?
Paso 7:
La tabla de frecuencias es realmente una manera de sumarizar un
conjunto de datos, es decir, estamos interesados en obtener una
vista general de estos. En primera instancia, cada calse logra este
objetivo. Por ejemplo, se puede tener una clase (1.0, 5.0), con
frecuencia 7. El valor de 7 quiere decir que tenemos 7 datos con
valores comprendidos entre 1.0 y 5.0; sin embargo, hemos perdido
esos datos. Por otra parte, el valor de 3.0 para la marca de clase
representa el valor promedio de cada uno de los datos que integran
la clase. Es decir, que cada uno de los 7 datos tienen un valor
promedio de 3.0. Así, los dos valores límites de la clase se pierden,
para dar lugar a la marca de clase. En cambio, se gana una
perspectiva general de los datos.
DISTRIBUCION DE FRECUENCIA
EJEMPLO 1:

Analizar el tiempo de vida de los focos de las señales direccionales


para autos, producidos en un mes en la compañía ACME, para ello
se procede a obtener una muestra de 30 focos, registrando el
número de horas que duran encendidos. Los resultados obtenidos
se registran en la siguiente tabla:
DISTRIBUCION DE FRECUENCIA
EJEMPLO 1:
Paso 1:
DISTRIBUCION DE FRECUENCIA
EJEMPLO 1:
Paso 2:

Determinación del número de clases (K) en las que se van agrupar


los datos. En el presente caso, agruparemos los datos en 5 clases,
pues la cantidad de ellos es menor de 50.

Paso 3:

Determinación de la amplitud (A) de las clases:


194  1
A  39
5
DISTRIBUCION DE FRECUENCIA
EJEMPLO 1:
Paso 4:

Determinación de las fronteras de cada clase:


DISTRIBUCION DE FRECUENCIA
EJEMPLO 1:
Paso 5:

Identificación del valor medio de cada clase; valor que es


llamado marca de clase (Xi). Por ejemplo, para la primera clase:
Xi = (179.5 + 218.5)2 = 199.
Paso 6:

Conteo de datos que pertenecen a cada clase. Aquí hay que


calcular la frecuencia fi de cada clase. Se recomienda llevar la
cuenta con tallos y ramas, tachando los datos que se van
integrando a la cuenta.
DISTRIBUCION DE FRECUENCIA
EJEMPLO 1:
Paso 7:

Elaboración de la tabla de distribución de frecuencias, obtenida


utilizando los resultados de pasos anteriores:
DISTRIBUCION DE FRECUENCIA
EJEMPLO 1:

¿Qué información nos proporciona esta tabla de frecuencia?

 Las duraciones se distribuyen en el intervalo [180 – 374


horas]
 La mayor parte de los datos, toman valores de entre 257.5
y 296.5 horas
 Solo un 10% de los focos duraron menos de 218.5 horas

 Los valores de las frecuencias absolutas nos dicen que los


datos siguen una distribución normal. Se presentan pocos
datos en los valores bajos y altos de la variable (duración),
estando la mayor parte de los datos en el centro del rango de
valores de la misma.
QUE ES EL HISTOGRAMA?
Es una gráfica que resulta de la tabla de frecuencia de los datos;
está integrada por un conjunto de barras que representan los
intervalos o clases, ubicadas en un sistema de coordenadas
QUE ES EL HISTOGRAMA?

La línea vertical sirve para indicar la cantidad de datos que


contiene cada clase. Por consiguiente, se gradúa teniendo en
cuenta tanto el número de datos que corresponden a cada clase,
como el total de datos.
QUE ES EL HISTOGRAMA?

En la línea horizontal se disponen las fronteras de todas las clases.


Las barras corresponden a cada clase, y su altura es proporcional al
valor de la frecuencia absoluta de la misma.
QUE ES EL HISTOGRAMA?

 Se recomienda colocar los rótulos correspondientes en los


ejes; en la parte horizontal se menciona la variable que se
estudia, junto con una indicación de la unidad de medición.
En la parte vertical, se anota ya sea la frecuencia o una
expresión equivalente.
QUE ES EL HISTOGRAMA?

 Este es el histograma para el ejercicio anterior, nótese su


forma acampanada. En estadística, variables que se
comportan de ésta manera se llaman normales.
FORMAS HISTOGRAMA
La forma de un histograma depende de la distribución de las
frecuencias absolutas de los datos.
FORMAS HISTOGRAMA
FORMAS HISTOGRAMA
FORMAS HISTOGRAMA
HISTOGRAMA
Para un mismo conjunto de datos, el histograma depende del
número de clases que se elija. Obsérvese en la siguientes figuras,
como cambia la forma del histograma en función del valor de K.

Una clase representa el conjunto total de


datos. Con un cierto valor de K se puede
apreciar el patrón de comportamiento de los
datos, y más allá de ese valor se tendría ¡una
clase para cada datos¡
HISTOGRAMA
Después de construido el histograma, podemos responder en una
forma inmediata las suguientes cuestiones:

Cuál es la forma de la distribución?

Cuál es la relación con las especificaciones?

Es necesario un cambio en el proceso?


HISTOGRAMA Y LOS LIMITES
DE ESPECIFICACION
Es conveniente marcar los límites de especificación en el
histograma, con el objeto de reconocer la existencia de
problemas en el comportamiento de la variable en cuestión, para
comprobar un cambio en el mismo.
HISTOGRAMA Y LOS LIMITES
DE ESPECIFICACION
Si todos los datos caen dentro de los límites, el proceso está
dentro de las especificaciones. Sí algunos de ellos se encuentran
fuera de esos límites, el proceso tendrá valores de la
característica de calidad muy altos o muy bajos.

Si un histograma muestra una situación problemática, las figuras


enseguida detectan un problema, así como los resultados de un
correspondiente proyecto de mejora.
HISTOGRAMA Y LOS LIMITES
DE ESPECIFICACION

En la figura, algunos datos exceden el límite superior de las


especificaciones, con los datos sesgados hacia ese lado, y
además el histograma es más bien ancho, lo cual implica una
variabilidad grande en el proceso.
HISTOGRAMA Y LOS LIMITES
DE ESPECIFICACION

Después de la mejora, vemos que el histograma es ahora más


estrecho menos variabilidad en los datos y que el centro del
histograma coincide aproximadamente con el de los límites de
especificaciones. El proceso está centrado.
HISTOGRAMAS
EJERCICIO 1:

Con el propósito de estudiar el tiempo de espera en la antesala


de un consultorio de un dentista, se analizó la estancia de 40
clientes. El número de minutos que stuvo esperando cada uno de
esos 40 clientes se muestra en el siguiente cuadro:

Construya el diagrama de frecuencias y el histograma.


HISTOGRAMAS
EJERCICIO 2:
Se consideró la fracción de error de 40 capturistas de datos en el
departamento de sistemas de una empresa. Las medidas de los
reprocesos internos de los 40 capturistas redondeadas a dos
decimales, se dan a continuación:

Construya el diagrama de frecuencias y el histograma

Suponga que el límite máximo aceptable de reproceso es de 0.35. Marque en


el histograma el límite de especificación y conteste los siguiente
¿Cuál es el porcentaje de empleados fuera de especificación?

S-ar putea să vă placă și