Sunteți pe pagina 1din 56

DESCOMPOSICIN DEL ESTADSTICO T2 PARA LA

INTERPRETACIN DEL GRFICO DE CONTROL


MULTIVARIABLE

INTEGRANTES:

HUAYAPA ALCA, ROMEL

PAJUELO MONTES, EDUARDO ANDR

PALOMINO YATACO, ROSENDA ESTHER

SUREZ SNCHEZ, JOU ANDERSON

INTRODUCCIN
El uso de los grficos de control multivariable para monitorear procesos industriales es
cada vez ms popular.
Entre los grficos de control multivariable ms populares esta uno basado en el
estadstico T2.
Sin embargo la tcnica tiene varios inconvenientes prcticos. Un gran inconveniente es
que cuando el estadstico T2 indica que un proceso est fuera de control, este no
provee informacin.
El procedimiento consiste en la descomposicin del estadstico T2 en partes
independientes, cada uno de los cuales es similar a una variable aleatoria T2
individual.

DESCOMPOSICIN

Veamos:

Representa un vector de dimensin p de medida hecha en un proceso de periodo


de tiempo i. El valor Xij representa una observacin en la j-sima
Supongamos que cuando el proceso est en control, los X i son independientes y
siguen una distribucin normal multivariable con vector medio y matriz de
covarianza .

DESCOMPOSICIN

Nosotros estimamos y desde una muestra de referencia teniendo n


observaciones usando y s, la muestra usual de vector medio y matriz de
covarianza.

Para construir un grfico de control multivariable tipo-Shewhart para un


proceso, es usado el estadstico T2 de Hotelling como grfico estadstico. Este
estadstico tiene la forma:

Donde el lmite de control superior (LCS)esta dado por:


LCS =

DESCOMPOSICIN

Otro
enfoque para resolver el problema de la interpretacin de seales es
descomponer el estadstico T2 en componentes independientes, cada uno de
los cuales refleja la contribucin de una variable individual.

Para simplificar, asumimos que queremos agrupar las primeras p-1 variables
juntas y aislar la p-sima variable as que:

Donde:
Es un vector de dimensin p-1, excluyendo la p-sima variable.

DESCOMPOSICIN

T2 de Hotelling puede ser dividida en dos partes, como sigue:

El trmino esel estadstico T2 de Hotelling usando los primeros p-1 variables, y


tienes la forma:
Donde:

la media de la muestra del vector


es
de n observaciones multivariables de
las p-1 variables
: matriz de varianzas y covarianzas
: es la principal submatriz de

DESCOMPOSICIN

El estadstico es el p-simo componente del vector ajustado por las estimaciones de la media y
desviacin estndar de la distribucin condicional de .

Donde:
es la media muestral de las n observaciones sobre la p-sima variable
es un vector de dimensin p-1

Adems:

DESCOMPOSICIN

Puesto que el primer trmino en (2) es un estadstico T2 de Hotelling sobre


variables p-1, tambin por separado nos podemos dividir en dos partes:

El primer trmino , es un estadstico T2 de Hotelling, digamos, las primeras p2 variables, y el segundo trmino, es el cuadrado de la variable (p-1) variable
ajustada por la estimacin de la media y la desviacin estndar de la
distribucin condicional.

DESCOMPOSICIN

Continuando
la iteracin y la particin de esta manera, produce la descomposicin general
siguiente de Hotellings T2 para p variables:

El valor final de T2, , es el estadstico T2 de Hotelling para la primera variable. Reduce al cuadro
del estadstico univariable t para la variable inicial:

Para ilustrar la mecnica del procedimiento de descomposicin, aplicaremos las


tcnicas en el siguiente ejemplo:
INDUSTRIA QUMICA :
Un electrolizador convierte la salmuera en soda caustica y gas de cloro. Se presentan
tres variables comnmente medidas monitoreando el desempeo del electrolizador:
El porcentaje de impurezas
La proporcin de soda custica
Medida de la eficiencia de conversin
De un conjunto histrico de datos codificados de tamao n = 16 se obtiene la siguiente
media y matriz de covarianza de la muestra del vector:
y

Supongamos

que una nueva observacin es tomada del proceso y es dada por:

Solucin:

Usando la ecuacin (1), el estadstico T2 asociado con esta nueva observacin


tiene un valor de:

Aplicando la ecuacin (4), es posible descomponer este estadstico en tres


componentes.

La ecuacin (5) puede ser utilizada para determinar

Del mismo modo, la ecuacin (3) se puede utilizar para determinar .

Para calcular necesitaremos y . Estos se calculan como sigue:

es un vector
de dimensin
p-1

Y :

Reemplazando los datos tenemos:

En una manera similar, podemos calcular y


Para calcular necesitaremos y . Estos se calculan como sigue:

Y:

Reemplazando los datos tenemos:

Aadiendo nuestro resultado, confirmamos:


1.595 = + += 0.002 + 0.363+1.230

Nota primero que el ordenamiento de los trminos de condiciones individuales no es nica.


De hecho hay

p! diferentes particiones de factores que producirn el mismo conjunto

estadstico T2. Por ejemplo, podemos empezar la particin seleccionando cualquiera de las p
variables. Podramos elegir cualquiera de los p-1 variables que sobran que condicionan en la
primera caracterstica seleccionada. Luego podramos escoger cualquiera de los p-2 variables
que sobran que condicionan en las dos primeras caractersticas seleccionadas. Continuando
de esta manera dara las diferentes secuencias de los trminos que componen el estadstico
general.

Para ilustrar, supongamos que p = 3. Entonces el siguiente 3! = 6, son


posibles 6 descomposiciones del valor T2 para una observacin individual:

Interpretacin de seales
La razn principal para dividir el estadstico T2 es obtener informacin sobre las variables
que contribuyen significativamente a una seal fuera de control.
La pregunta que surge es cmo utilizar la informacin proporcionada en los distintos
trminos de la descomposicin. Ser til reconocer que los trminos p dentro de una
descomposicin particular, son independientes uno del otro aunque los trminos en todo
el p! descomposiciones no son todos independientes. Adems, cada uno de los trminos
se distribuye (bajo la hiptesis nula es apropiado) como una constante por una
distribucin F con 1 y n - 1 grados de libertad.

As, se puede comparar cada trmino en (4) a un valor F presentado, multiplicado por
una constante, para determinar si es significativo. Este proceso proporciona un
mecanismo para decidir cundo un trmino est sealando un problema.

EJEMPLOS

Las15 observaciones de las dos variables son:

El proceso est bajo control para las primeras 15 observaciones, por lo que
podemos utilizar estas observaciones como datos histricos para calcular
X = (10,10)'

Se tienen cuatro puntos adicionales (marcados A, B, C y D), incluidos para


indicar "comportamiento anormal", estn contenidos en la Tabla 1.

La Figura 1 contiene una grfica de los 19 puntos en una regin de control


elptica T2 95%. Tambin se incluyen los lmites de control separados
univariados Shewhart, para X1 y X2, con X1 lo largo del eje horizontal y X2 a
lo largo del eje vertical.

La

observacin A, tomada del proceso, est dada por:

Solucin:

Usando la ecuacin (1), el estadstico T2 asociado con esta nueva observacin


tiene un valor de:
8.51

Aplicando la ecuacin (4), es posible descomponer este estadstico en dos


componentes.


PARA
La ecuacin (5) puede ser utilizada para determinar

DATOS
DEL PROBLEMA:

X = (10,10)'

OBSERVACION

DEL PUNTO A:

Del mismo modo, la ecuacin (3) se puede utilizar para determinar .

Para calcular necesitaremos y . Estos se calculan como sigue:

Y :

Reemplazando los datos tenemos:

PARA

La ecuacin (5) puede ser utilizada para determinar

DATOS DEL PROBLEMA:


X = (10,10)'

OBSERVACION
DEL PUNTO A:

Del mismo modo, la ecuacin (3) se puede utilizar para determinar .

Para calcular necesitaremos y . Estos se calculan como sigue:

Y :

Reemplazando los datos tenemos:

La

observacin B, tomada del proceso, est dada por:

Solucin:

Usando la ecuacin (1), el estadstico T2 asociado con esta nueva observacin


tiene un valor de:

Aplicando la ecuacin (4), es posible descomponer este estadstico en tres


componentes.


PARA

La ecuacin (5) puede ser utilizada para determinar

DATOS DEL PROBLEMA:


X = (10,10)'

OBSERVACION

DEL PUNTO A:

Del mismo modo, la ecuacin (3) se puede utilizar para determinar .

Para calcular necesitaremos y . Estos se calculan como sigue:

Y :

Reemplazando los datos tenemos:


PARA

La ecuacin (5) puede ser utilizada para determinar

DATOS DEL PROBLEMA:


X = (10,10)'

OBSERVACION

DEL PUNTO A:

Del mismo modo, la ecuacin (3) se puede utilizar para determinar .

Para calcular necesitaremos y . Estos se calculan como sigue:

Y :

Reemplazando los datos tenemos:

El estadstico T2 indica que el proceso est fuera de control para


observaciones B, C y D

Utilizando como lmite superior de control (2x 16x 14) / (15 x 13) x F (2,13,
0.95) = 8,743 ( Ver tabla 2).

ANLISIS DE CADA PUNTO

Punto B:

Valores condicionales, :

Son no significativos, por lo tanto:


La relacin entre las 2 variables es apropiada respecto a la muestra histrica.

Valores incondicionales

Son significativamente grandes, por lo tanto:


Cada variable est fuera de los lmites univariados Shewhart.

Punto C:

Valores
condicionales, :

Son significativamente grandes,


por lo tanto:
La relacin entre las 2 variables ha cambiado respecto a la muestra histrica.

Valores incondicionales

Son no significativos, por lo tanto:


X1 y X2 son observaciones dentro de sus respectivos lmites de control.

Punto D:

Valores condicionales, :

Son significativamente grandes,


por lo tanto:
La relacin entre las 2 variables ha cambiado respecto a la muestra histrica.

Valores incondicionales

= 9.13; lo cual indica que esta variable (X1) es la que contribuye


significativamente a la seal.

EJEMPLO 2
El procedimiento de descomposicin T2 descrito
anteriormente tambin puede ser una herramienta de
diagnstico til en ausencia de una seal. Doganaksoy,
Faltin, y Tucker (1991) describen una situacin donde
la contra-correlacin es un problema.

partir de una muestra histrica grande que contiene 1000 observaciones


A
sobre tres variables se calculan = (0,0,0) y

A continuacin, un nuevo vector de observacin, XNew = (2,2,0) se toma y se


calcula un valor T2 de 6,25. A nivel de significancia de 0.05, esta observacin
no hace seal (UCL = (3 x 1001 x 999) / (1000 x 997) x F (3,997, O.95) = 7,86).
Sin embargo, cuando se ignora la segunda variable, y T2 se vuelve a calcular
utilizando slo las primera y tercera variables, la observacin hace seal.
Doganaksoy, Faltin, y Tucker discuten la dificultad de diagnosticar el
problema en este caso.

Vamos a volver a examinar este problema utilizando la tcnica de


descomposicin propuesto. La Tabla 5 muestra una descomposicin completa
del valor T2, usando las tres variables, para la nueva observacin. Aunque
XNew no seal en su valor total T2, este hace seal en varios componentes
de su descomposicin T2.

Los
trminos significativos son . Los dos primeros trminos incondicionales
significativos indican que Xl y X2 tienen valores fuera de sus rangos
aceptables. Los dos trminos condicionales significativos implican que la
relacin de cada variable con X3 es un problema.

Observaciones Finales

La descomposicin de
control multivariable
informacin, ya que
significativamente a la

un valor T2 significativa detectada en un grfico de


puede proporcionar una importante fuente de
la variable o grupo de variables que contribuyen
seal pueden ser identificados.

La descomposicin completa del estadstico T2 en p componentes T2


independientes no es nico como p! diferentes particiones no independientes
son posibles. Por ejemplo, tres variables producen seis descomposiciones
diferentes, mientras que cuatro variables produciran 24 particiones
diferentes.

Para los datos de Hawkins (1991), las cinco variables resultaran en 120
descomposiciones distintas del valor T2 para una observacin dada. En vez de
examinar los valores condicionales para todo el conjunto de p!
descomposiciones, sera ms prctico para idear un esquema a la salida slo
para los valores significativos. Un ejemplo de esta salida reducida se da en la
Tabla 4 para un problema de cinco variables.

Es importante tener en cuenta que una vez que se ha detectado una seal, la
multiplicidad de pruebas de significacin no es un problema. Cada
componente en la descomposicin se puede comparar con un valor crtico
como una medida de "amplitud" de la contribucin a la seal en lugar de para
la significancia estadstica.

Una ventaja en la descomposicin del valor T2 se encuentra en su capacidad


de consolidar ltimos resultados de la investigacin sobre la interpretacin de
seales T2. Incrustadas en esta divisin son las variables de regresin
ajustados de Hawkins (1991), el enfoque de bajada de Roy (1958), las
diferencias T2 de Murphy (1987), as como los valores t estandarizados de
Doganaksoy, Faltin y Tucker (1991). Adems, se incluyen muchos otros
trminos, y cada uno ofrece informacin sobre la causa de la seal.
Algoritmos innovadores para el clculo de estos trminos es un rea de
investigacin futura