Sunteți pe pagina 1din 73

CONTROL DE

CALIDAD

Ing. Vanessa M. García Díaz


FUNDAMENTOS DE ESTADISTICA
La Estadística es una ciencia que estudia las características de
un conjunto de casos para hallar en ellos regularidades en el
comportamiento, que sirven para describir el conjunto y para
efectuar predicciones.

La Estadística tiene por objeto recolectar, organizar, resumir,


presentar y analizar datos relativos a un conjunto de objetos,
personas, procesos, etc. A través de la cuantificación y el
ordenamiento de los datos intenta explicar los fenómenos
observados, por lo que resulta una herramienta de suma
utilidad para la toma de decisiones.
CLASIFICACION DE LA
ESTADISTICA
A) ESTADISTICA DESCRIPTIVA B) ESTADISTICA INFERENCIAL

El término “estadística Extraer conclusiones de una


descriptiva” se refiere a muestra, para inferirlas a una
procedimientos para resumir y población con un determinado
presentar datos cuantitativos nivel de confianza.
de manera que revele las
características de la
distribución de los datos.
C) ESTADISTICA NO D) ESTADISTICA
PARAMETRICA PARAMETRICA

Pruebas estadísticas Pruebas estadísticas


aplicadas cuando se aplicadas cuando se
supone que los datos “no” supone que los datos se
se distribuyen distribuyen normalmente
normalmente.
E) ANALISIS UNIVARIANTE F) ANALISIS BIVARIANTE

Técnicas empleadas para Técnicas empleadas para


analizar los cambios de una analizar simultáneamente los
variable en cada observación cambios de dos variables en
realizada. cada observación realizada.

G) ANALISIS MULTIVARIANTE

Técnicas empleadas para


analizar simultáneamente los
cambios de diversas variables.
Conceptos básicos
Es una característica que se observa en una
población o muestra, y a la cual se desea
VARIABLE estudiar.
La variable puede tomar diferentes valores
dependiendo de cada individuo.

CUANTITATIVA CUALITATIVA

CONTINUA ORDINAL
Son valores reales. Pueden Son cualidades que
tomar cualquier valor dentro de representan un orden y
un intervalo. Ej. Peso, estatura, jerarquía. Ej. Nivel educacional,
días de la semana.
DISCRETA NOMINAL
Toma valores enteros. Ej. N° de Son cualidades sin orden. Ej
hijos de una familia, n° de estado civil, sexo, etc.
alumnos de un curso.
POBLACION Es el total del conjunto de elementos u
objetos de los cuales se quiere obtener
información. El tamaño de una población
viene dado por la cantidad de elementos que
la componen. Las características de la
población se resumen en valores llamados
parámetros.
.
elementos

muestra

Es un subconjunto de unidades de
análisis de una población dada,
destinado a suministrar información
Unidades de sobre la población. Para que este
analisis subconjunto de unidades de análisis sea
de utilidad estadística, deben reunirse
ciertos requisitos en la selección de los
Es/son el objeto(s) del cual se elementos.
desea obtener información.
Proceso por el que se realizan
inferencias inductivas sobre parámetros
estimación de la población a partir de datos de un
muestra.

Datos Observaciones codificadas.

Cuantificación de un hecho ocurrido en


medida una población.

Cualquier expresión numérica que señala


Datos la magnitud de un fenómeno ya sea en
estadísticos su intensidad o en la frecuencia con que
se produce.

Cualquier hecho cuantitativo o


observación cualitativo que puede ser
interpretado.
inferencia

En la investigación es la deducción de parámetros de la


población a partir de los estadísticos obtenidos en una
muestra.

parámetro

Es una característica numérica de una población. Equivale a


una constante fija para un estudio en particular pero que
cambia en los diferentes estudios.

estadístico

Es una característica numérica de una muestra.


Propuesta que puede ser formalmente
hipótesis comprobada mediante estudios
estadísticos.
Probabilidad de que la diferencia observada entre
dos mediciones de una variable no se deba al azar
Nivel de confianza (1 - nivel de significación), o probabilidad de aceptar
la hipótesis nula cuando esta es verdadera. Equivale
a (1 error I).

Probabilidad de que la diferencia observada entre


Nivel de
dos mediciones se deba al azar.
significación
Equivale al error tipo I.

Poder de la prueba Equivalente a potencia.

Probabilidad de que un test estadístico permita


Potencia rechazar una hipótesis nula cuando esta es falsa.
Equivale a 1-error II.

Grado con que un acontecimiento puede producirse.


Proporción entre el número de casos favorables a
Probabilidad
que ocurra un proceso en una población respecto al
número total de casos posibles.
Razón que indica la modificación de una cantidad
Proporción con respecto a otra y en la que el numerador forma
parte del denominador.
ESTADISTICA
DESCRIPTIVA

MEDIDAS
Las variables de salida o de respuesta de un proceso deben cumplir con
ciertas metas y/o especificaciones, a fin de que sea posible considerar
que el proceso funciona de manera satisfactoria. Por ello, una tarea
primordial del control de calidad es conocer la capacidad o habilidad de
un proceso, que consiste en determinar la amplitud de la variación
natural del proceso para una característica de calidad dada.
Esto permitirá saber en qué medida tal característica de calidad es
satisfactoria.
Valor en torno al cual los
1. MEDIDAS DE datos o mediciones de
una variable tienden a
TENDENCIA aglomerarse o
CENTRAL COMUNES concentrarse.

Al describir grupos de observaciones, con frecuencia es


conveniente resumir la información con un solo numero. Este
numero que, para tal fin, suele situarse hacia el centro de la
distribución de datos se denomina medida o parámetro de
tendencia central o de centralización.

Tamaño de
N _
muestra
: (X1, X2, ……, Xn) X
n
MEDIA MUESTRAL ó MEDIA POBLACIONAL o DEL
PROMEDIO PROCESO

Suma de los valores de una serie Se utilizan todos los elementos


de medidas respecto del numero de la población, por ejemplo, el
de valores existentes. Considera grosor de todos los discos
la magnitud de los valores. producidos en la ultima semana o
mes, entonces el promedio
calculado es la media del proceso
(o media poblacional) y se denota
con la letra griega μ (mu).

Es importante destacar que la media del proceso μ es igual a cierto valor, aunque no
siempre se conoce; mientras que el valor de se obtiene para cada muestra y es
diferente (variable) de una muestra a otra, ya que su valor depende de las piezas que
se seleccionan es una variable aleatoria.
Por lo anterior, el valor que se observa de la media muestral, X por lo general
es diferente a la media del proceso, μ.
MEDIANA
Valor que divide a la mitad a los datos cuando son
ordenados de menor a mayor.
Así, para calcular la mediana cuando el numero de
datos es impar, estos se ordenan de manera creciente y
el que quede en medio de dicho ordenamiento será la
mediana. Pero si el numero de datos es par, entonces la
mediana se calcula dividiendo entre dos la suma de los
números que están en el centro del ordenamiento

MODA
Valor que se presenta con mas frecuencia en una serie
de mediciones. Si varios datos tienen la frecuencia más
grande, entonces cada uno de ellos es una moda, y se
dice que el conjunto de datos es multimodal.
2. MEDIDAS DE DISPERSION O VARIABILIDAD

Además de conocer la tendencia central de un conjunto de


datos es necesario saber qué tan diferentes son entre sí, es
decir, es preciso determinar su variabilidad o dispersión.

Las medidas de dispersión, también llamadas medidas de


variabilidad, muestran la variabilidad de una distribución,
indicando por medio de un numero, si las diferentes
puntuaciones de una variable están muy alejadas de la
tendencia central.

Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto


menor sea, mas homogénea será a la tendencia central.

Ahora, repasaremos cuatro formas de medir la variabilidad.


DESVIACIÓN ESTANDAR DESVIACION ESTANDAR
MUESTRAL (S) POBLACIONAL o DEL PROCESO (σ)

Es la medida mas usual de Refleja la variabilidad de un


variabilidad e indica que tan proceso. Para su cálculo se debe
esparcidos están los datos con utilizar un número grande de datos
respecto a la media; se denota con que hayan sido obtenidos en el
la letra S, se expresa en las mismas transcurso de un lapso de tiempo
unidades de medicion (gramos, amplio.
milimetros, etc) y se calcula
mediante la siguiente expresion:

DESVIACION RELATIVA A LA
MEDIANA
Medida de la variación de una serie
de observaciones respecto de la
VARIANZA (S2) media. Equivale a la dispersión
respecto de la media en una serie
de datos continuos.

Es el cuadrado de la desviación estándar,


S2, conocido como varianza muestral, es
muy importante para propósitos de
inferencia estadística. Y en forma
equivalente σ2 es la varianza (o
variancia) poblacional.
RANGO (R) Medición de la variabilidad de un
conjunto de datos que es resultado
de la diferencia entre el dato mayor
y el dato menor de la muestra.

El rango mide la amplitud de la


variación de un grupo de datos, y
también es independiente de la
magnitud de los datos
COEFICIENTE DE
VARIACION (CV o RSD)
Medida de variabilidad que indica la
magnitud relativa de la desviación
estándar en comparación con la
media.
Es útil para contrastar la variación de
dos o más variables que están
medidas en diversas escalas.
RELACION ENTRE y S
Una forma de apreciar claramente el significado de la desviación estándar como
medida de dispersión en torno a la media, es a través de la relación entre la
media y la desviación estándar, la cual esta dada por la desigualdad de Chebyshev
y la regla empírica.
La desviación estándar es mas usada que la varianza. Una de sus utilidades es
medir la concentración de los datos respecto a la media aritmética.
Chebyshev Regla Empírica
El 75 % de los datos están en el rango X − 2S, X + 2S El 68,27% de los datos están en el rango X − S, X + S
El 89% de los datos están en el rango X −3S, X + 3S El 95,45% de los datos están en el rango X − 2S, X + 2S
El 99,73% de los datos están en el rango X −3S, X + 3S
3. MEDIDAS DE FORMA
Un aspecto relevante en el análisis de un conjunto de datos o una variable es estudiar
la forma de su distribución. Una medida numérica del sesgo o asimetría en la
distribución de un conjunto de datos se obtiene a través del sesgo y del sesgo
estandarizado (skewness), los cuales están dados por:

Sesgo
Es una medida numérica de la
asimetría en la distribución de un
conjunto de datos.

El signo del sesgo indica el lado para el que la cola de la distribución es mas larga, ya
sea hacia la izquierda (signo −) o hacia la derecha (signo +). Para los datos que siguen
una distribución normal, el valor del sesgo estandarizado debe caer dentro de (−2,
+2), por lo que si n es grande (n > 100) y el sesgo estandarizado esta fuera de tal
intervalo, será una evidencia de que la distribución de los datos tiene un sesgo
significativamente diferente al de la distribución normal o, en otras palabras, que la
distribución de los datos no es normal.
Una medida para determinar que tan elevada o plana (achatada o picuda) es la
distribución de ciertos datos, tomando como referencia la distribución normal, se
obtiene a través del estadístico llamado curtosis y del coeficiente de curtosis
estandarizado, que están dados por:

donde n es el tamaño de la muestra, S la desviación estándar y X la media muestral.


Si el signo de la curtosis es positivo, indica que la curva de la distribución de los
datos es mas empinada o alta (picuda) en el centro y con colas relativamente largas;
ambos aspectos se refieren a la distribución normal. Pero si el signo es negativo, se
tendrá una curva mas aplanada y con colas mas cortas con respecto a normalidad.
Para los datos que siguen una distribución normal el valor de la curtosis
estandarizada debe estar dentro de (−2, +2), por lo que si n es grande (n> 100) y el
estadístico cae fuera de este intervalo, será una evidencia de que la distribución de
los datos no es normal.
4. MEDIDAS DE LOCALIZACIÓN

CUANTILES

Medidas de localización que separan por magnitud un conjunto de datos en cierto


número de grupos o partes que contienen la misma cantidad de datos. Por ejemplo,
los deciles dividen los datos en 10 grupos. Los cuantiles de una distribución o de un
conjunto de datos son medidas de localización relativa, que ayudan a complementar
la descripción de la distribución de una característica de calidad.

PERCENTIL
De manera mas formal, sea x1, x2, ..., xn un conjunto de n mediciones ordenadas en
forma creciente, se define su percentil p como el valor x tal que el p% de las
mediciones es menor o igual a x, y el (100 – p)% mayor o igual.

CUARTILES
Al percentil 25 también se le conoce como primer cuartil o cuartil inferior, Ci;
mientras que la mediana que es el percentil 50 corresponde al cuartil medio Cm; y el
percentil 75 es el cuartil superior, Cs o tercer cuartil. Son iguales a los percentiles
25, 50 y 75, y sirven para separar por magnitud la distribución de unos datos en
cuatro grupos, donde cada uno contiene 25% de los datos.
5. DIAGRAMA DE CAJAS
El diagrama de caja es otra herramienta para describir el comportamiento de los datos y es de
suma utilidad para comparar procesos, tratamientos y, en general, para hacer análisis por
estratos (lotes, proveedores, turnos, etc.).

El diagrama de caja se basa en los cuartiles y divide los datos ordenados en cuatro grupos, que
contienen, cada uno, 25% de las mediciones. De esta forma es posible visualizar donde termina
de acumularse 25% de los datos menores, y a partir de donde se localiza 25% de los datos
mayores. Entre estos dos cuartiles se ubica 50% de los datos que están al centro. Pero además
de los cuartiles están involucrados los siguientes conceptos:

Es igual a la distancia entre el cuartil inferior y el


RANGO INTERCUARTILICO superior, y determina el rango en el que se ubican 50%
de los datos que están en el centro de la distribución.

BARRERA INTERIOR IZQ. Y DER.


Ci − 1.5Rc Cs + 1.5Rc
BARRERA EXTERIOR IZQ. Y DER.

Ci − 3Rc Cs + 3Rc
1. El largo del diagrama (que incluye el rectángulo mas ambos brazos o bigotes), ya que
esto indica una medida de la variación de los datos y resulta de gran utilidad sobre
todo para comparar la variación entre procesos, tratamientos, lotes o turnos de
trabajo o producción. En general, entre mas largo sea un diagrama indicara una mayor
variación de los datos correspondientes.
2. La parte central del diagrama indica la tendencia central de los datos, por lo que
también ayudara a comparar dos o mas procesos, maquinas, lotes o turnos en cuanto a
su tendencia central.
3. Comparar de manera visual la longitud de ambos brazos. Si uno es notoriamente mas
largo que el otro, entonces la distribución de los datos quizás esta sesgada en la
dirección del brazo mas largo. También es preciso observar la ubicación de la linea
mediana que parte la caja, ya que si esta mas cerca de uno de los extremos, será señal
de un probable sesgo en los datos.
4. En caso de que el diagrama este basado en una cantidad suficiente de datos (por
ejemplo 10 como mínimo), es necesario ver si hay datos fuera de las barreras
interiores, marcados con un punto, ya que entre mas alejado este un dato del final del
brazo, será señal de que probablemente sea un dato atípico. Si los datos caen mas allá
de las barreras exteriores, prácticamente es un hecho que tales datos son atípicos o
aberrantes.
4. LIMITES REALES O NATURALES
Los limites reales o naturales de un proceso indican los puntos entre los cuales varia la
salida de un proceso y, por lo general, se obtienen de la siguiente manera:
Limite real inferior (LRI) = μ − 3σ y
Limite real superior (LRS) = μ + 3σ

El calculo de estos limites esta inspirado en la regla empírica, que a su vez coincide con
la propiedad de la distribución normal. En un estudio de capacidad, estos limites reales
se comparan con las especificaciones para la característica de calidad.

Por ejemplo, si las especificaciones para una característica de calidad son que esta debe
tener dimensiones de 800 ± 5; luego, la especificación inferior es EI = 795, y la superior
es ES = 805. Si además se sabe que la media y la desviación estándar de tal característica
de calidad son μ = 800.6 y σ = 1.2, respectivamente, entonces los límites reales son:

LRI = 800.6 - 3 (1.2) = 797.0

LRS = 800.6 - 3 (1.2) = 804.2 μ


LRI LRS
CONTROL DE
CALIDAD

Ing. Vanessa M. García Díaz


HISTOGRAMA Y TABLA DE FRECUENCIAS
El histograma es una representación gráfica, en forma de barras, de la
distribución de un conjunto de datos o una variable, donde los datos se
clasifican por su magnitud en cierto número de grupos o clases, y cada clase es
representada por una barra, cuya longitud es proporcional a la frecuencia de
los valores representados. Permite ilustrar la frecuencia con las que ocurren
cosas y eventos relacionados entre sí.

Por lo general, el eje horizontal está formado por una escala numérica para
mostrar la magnitud de los datos; mientras que en el eje vertical se
representan las frecuencias.

Es una grafica de barras que presenta en forma ordenada los datos que se
analizan presentando las variaciones de los mismos su frecuencia, tendencia,
dispersión y la capacidad de la calidad del proceso.

Se utiliza para mejorar procesos, productos y servicios al identificar patrones


de ocurrencia. Los más fáciles de entender tienen no menos de 5 barras y no
mas de 12.
Construcción del histograma - datos agrupados
Paso 1. Contar los datos (N)
Paso 2. Calcular el rango de los datos R = (Valor mayor- valor menor)

Paso 3. Seleccionar el número de columnas o celdas del histograma


(K). Como referencia si N = 1 a 50, K = 5 a 7; si N = 51 - 100; K = 6 -
10. También se utiliza el criterio K = Raíz (N)

Paso 4. Dividir el rango por K para obtener el ancho de clase

Paso 5. Identificar el límite inferior de clase más conveniente y


sumarle el ancho de clase para formar todas las celdas necesarias

Paso 6. Tabular los datos dentro de las celdas de clase


Paso 7. Graficar el histograma y observar si tiene una forma normal
Datos:

19 21 25 33 30 27 31 25 35
37 44 43 42 39 43 40 38 37
36 42 41 44 32 45 46 47 45
54 52 50 48 49 47 48 49 47
52 51 50 49 58 59 61 62 63
59 61 66 76 70

Paso 1. Número de datos N = 50

Paso 2. Rango R = 76 - 16 = 60

Paso 3. Número de celdas K = 6;

Paso 4. Ancho de clase = 60 / 6 = 10


Paso 5. Lím. de clase: 15-24, 25- 34, 35- 44, 45- 54, 55 - 64, 65-74, 75-94
Paso 6. Número de datos: 2 7 14 17 7 2 1
Marcas de clase 19.5 29.5 39.5 49.5 59.5 69.5 79.5

Paso 7. Graficar el histograma y observar si tiene una forma normal

18
16
14
12
10
8 Frec.
6
4
2
0
15-24 25-34 35-44 45-54 55-64 65-75

P. Reyes
Consideraciones para la Interpretacion:
Observar la tendencia central de los datos. Localizar en el eje
horizontal o escala de medición las barras con mayores frecuencias.
Estudiar el centrado del proceso. Para ello, es necesario observar la
posición central del cuerpo del histograma con respecto a la calidad
optima y a las especificaciones. Aun cuando se cumplan las
especificaciones, si el proceso no esta centrado, la calidad que se
produce no es adecuada, ya que entre mas se aleje del optimo mas
mala calidad se tendra. Por ello, en caso de tener un proceso
descentrado se procede a realizar los ajustes o cambios necesarios
para centrar el proceso.
Examinar la variabilidad del proceso. Consiste en comparar la
amplitud de las especificaciones con el ancho del histograma. Para
considerar que la dispersion no es demasiada, el ancho del
histograma debe caber de forma holgada en las especificaciones.
 Analizar la forma del histograma. Al observar un histograma considerar que la
forma de distribución de campana es la que mas se da en salidas de proceso y
tiene características similares a la distribución normal. Es frecuente que cuando
la distribución no es de este tipo sea la señal de un hecho importante que esta
ocurriendo en el proceso y que tiene un efecto negativo en la calidad.

 Datos raros o atípicos. Una pequeña cantidad de mediciones muy extremas o


atípicas son identificadas con facilidad mediante un histograma, debido a que
aparecen una o mas barras pequeñas bastante separadas o aisladas del resto. Un
dato raro refleja una situación especial que se debe investigar.
 Estratificar. En ocasiones, en el histograma no se observa ninguna forma
particular pero existe mucha variación y, en consecuencia, la capacidad del
proceso es baja. Cuando los datos proceden de distintas maquinas, proveedores,
lotes, turnos u operadores, puede encontrarse información valiosa si se hace un
histograma por cada fuente (estratificar), con lo que se podra determinar cual
es la maquina o el proveedor mas problemático.
Limitaciones:
1. No considera el tiempo en el que se obtuvieron los datos; por lo
tanto, con el histograma es difícil detectar tendencias que ocurren
a través del tiempo. Por tal razón, no ayuda a estudiar la
estabilidad del proceso en el tiempo, lo cual se analiza por medio
de cartas de control.
2. No es la técnica más apropiada para comparar de manera
práctica varios procesos o grupos de datos; en esos casos, el
diagrama de caja o la gráfica de medias son más apropiados.
3. La cantidad de clases o barras influye en la forma del histograma,
por lo que una buena práctica es que a partir de la cantidad de
clases que de manera inicial sugiere un software, se analice el
histograma con un número de clases ligeramente menor y un poco
más de clases, a fin de verificar si se observa algo diferente.
CONTROL DE
CALIDAD

Ing. Vanessa M. García Díaz

S-ar putea să vă placă și