Sunteți pe pagina 1din 24

Henning, E. et. al.

Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



2
pode ter incio a partir da reduo substancial do nmero de variveis. Com isso, possvel
descrever com mxima preciso os valores das variveis de um conjunto de dados a partir de
um pequeno subconjunto destas, o que reduz de forma significativa a dimenso do problema
custa de uma pequena perda de informaes (PEA, 2002).
A aplicao de mtodos multivariados que permitem a reduo das dimenses, entre
eles a Anlise de Componentes Principais (ACP), aparece como ferramenta adequada para o
melhor aproveitamento da informao disponvel. Segundo Jackson (1991), a anlise de
componentes principais utilizada na indstria moderna para o controle estatstico de
processos multivariados que envolvam um conjunto de dados com grande nmero de
variveis correlacionadas, tais como os processos qumicos. Com a aplicao desse mtodo
estatstico de projeo de dados, possvel considerar todas as variveis originais no
tratamento estatstico e visualizar os dados em duas ou trs dimenses. Assim, pode-se
representar a maior parte da varincia, ou seja, a melhor disperso dos pontos em relao s
componentes principais.
O objetivo principal deste trabalho comparar, a partir de uma aplicao, o
desempenho dos grficos de controle multivariados T
2
de Hotelling, MCUSUM e MEWMA,
com a projeo de dados.
No Brasil, a utilizao de grficos de controle com metodologia para processos
multivariados no comum no monitoramento de processos industriais em razo das
dificuldades inerentes s tcnicas multivariadas. Felizmente, com o avano da tecnologia nas
ltimas dcadas, programas computacionais (comerciais e livres) tm possibilitado um maior
desenvolvimento e implantao de mtodos de controle estatstico multivariados na indstria,
como ferramenta de controle da qualidade. Assim, neste artigo, so utilizadas e desenvolvidas
rotinas no ambiente GNU R (R DEVELOPMENT CORE TEAM, 2009), para os grficos de
controle multivariados. Destaca-se a importncia da escolha de um recurso computacional
livre para complementar algumas funes ainda no disponveis nos principais pacotes
estatsticos comerciais, como por exemplo, o desenvolvimento do grfico MCUSUM.
Este trabalho est assim estruturado: a seo 2 trata do controle estatstico de
processos multivariados abrangendo os grficos T
2
de Hotelling, MCUSUM e MEWMA; a

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



3
seo 3 descreve a anlise de componentes principais; na seo 4 esto os procedimentos
metodolgicos e, na seo 5, a anlise dos dados e os resultados obtidos a partir de um
exemplo de aplicao. Para finalizar, na seo 6, esto as concluses e sugestes para
trabalhos futuros.
2. Controle Estatstico Multivariado baseado em Mtodo de Projeo de Dados
O controle estatstico multivariado de processos est fundamentado nos mtodos de
projeo de dados via Anlise de Componentes Principais (ACP) e via Projeo de Estruturas
Latentes (PEL) (FILHO, 2001). O objetivo destes transformar variveis de processo
(caractersticas da qualidade) em um grupo reduzido de variveis latentes (combinao linear
das originais), preservando informaes relevantes contidas nestas, e eliminando redundncias
no sistema inicial, representadas por variveis colineares. Dessa forma, quando os dados
originais so projetados num espao de dimenses menores, trazem consigo a estrutura de
covarincia das variveis originais. Normalmente, duas ou trs variveis latentes so
suficientes para representar variveis originais (FILHO, 2001).
Os tradicionais mtodos estatsticos de controle multivariado, tais como os grficos de
controle T
2
de Hotelling, MCUSUM e MEWMA no so suficientemente robustos para tratar
com um grande nmero de variveis correlacionadas, pois foram desenvolvidos para
monitorar um pequeno nmero dessas variveis (PHAM, 2006). A estrutura colinear das
variveis do processo faz com que as estatsticas de controle utilizadas nestes grficos
forneam sinalizaes distorcidas acerca do estado do processo. Em algumas situaes tais
estatsticas no podero ser calculadas, devido dificuldade de inverso da matriz de
covarincias das variveis de processo.
Alm disso, os mtodos convencionais so razoavelmente eficazes desde que o
nmero de variveis p no seja muito grande. Na medida em que p aumenta, so necessrias
mais amostras para detectar uma mudana no vetor de mdias. Isto ocorre, pois a alterao se
dilui no espao p-dimensional das variveis do processo. Deste modo, outros mtodos so
sugeridos, particularmente quando se suspeita que a variabilidade do processo no esteja
uniformemente distribuda entre todas as variveis. Isso significa que um subconjunto das
variveis responsvel pela maior parte da variabilidade (MONTGOMERY, 2004).

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



4
Surge ento a necessidade de utilizar grficos de controle multivariados baseados em
mtodos de projeo de dados (PHAM, 2006). Dois mtodos so sugeridos pela literatura
(MONTGOMERY, 2004): o mtodo das componentes principais e o mtodo dos mnimos
quadrados parciais. Neste trabalho, utiliza-se o mtodo das componentes principais, conforme
descrito na seo 3.
2.1 Grfico de Controle T
2
de Hotelling
Hotelling (1947), pioneiro na pesquisa sobre controle multivariado de qualidade,
utilizou uma abordagem multivariada de controle em dados contendo informaes sobre
localizaes de bombardeios, durante a Segunda Guerra Mundial. Os desenvolvimentos
tericos propostos pelo autor esto descritos nesta seo.
Entre os grficos de controle multivariados existentes, o grfico T
2
de Hotelling o
mais conhecido na literatura. Foi desenvolvido por Hotelling (1947), que supe situaes em
que as variveis de interesse seguem uma distribuio normal multivariada, com vetor de
mdias X e matriz de covarincias S. Assim, para amostras de tamanho n, para cada uma das
p variveis de interesse (a serem monitoradas), e considerando as estimativas dos parmetros,
a Equao para a obteno das estimativas da estatstica T
2
dada por:
) (
'
) ( T
1 2
X X S X X =

(1)
onde X e S representam, respectivamente, as estimativas para o vetor de mdias e matriz de
covarincias do processo. A Equao (1) utilizada como base para a construo do grfico
de controle T
2
de Hotelling (LOWRY; MONTGOMERY, 1995). Na primeira fase, os limites
de controle, para Tracy, Young e Mason (1992) so baseados na distribuio beta e, expressos
por

2 / ) 1 ( , 2 ,
2
m
1) - (m
LSC

=
p m p
(2)
onde
2 / ) 1 ( , 2 / , p m p
o ponto percentual superior de uma distribuio com parmetros
2 / p e . 2 / ) 1 ( p m Na segunda fase, os novos limites so estabelecidos apenas para
monitorar as observaes futuras, utilizando os limites de controle conforme Equao (3)

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



5
( )
p m p
F
mp m
m m p
LSC

+
=
, , 2
) 1 ( 1

(3)
onde p o nmero de variveis (caracterstica de qualidade) e m, o nmero de amostras. Se o
valor da estatstica T
2
excede o limite superior de controle (LSC), diz-se que o processo est
fora de controle estatstico. O limite inferior de controle (LIC), para as duas fases,
considerado igual a zero 0 = LIC .
Um problema significativo, no caso das observaes individuais, a estimativa da
matriz de covarincias do processo. Sullivan e Woodall (1996) apud Montgomery (2004, p.
332) apresentam critrios para estimar a matriz de covarincias de processos. Esses autores
propem alguns procedimentos para obteno de S (estimadores) que tornam o deslocamento
abrupto (mudana sbita), no processo, e deslocamento gradativo (tendncia ou mudana
gradativa), no vetor de mdias do processo. Neste artigo, considerou-se a matriz de
covarincias amostral conhecida, no havendo necessidade de estimadores.
Alm do grfico de controle T
2
de Hotelling, outros tipos de grficos de controle para
processos multivariados so indispensveis para atender especificidade de um determinado
processo, tais como os grficos de controle com memria MCUSUM (Multivariado de Soma
Acumulada) e o MEWMA (Multivariado de Mdia Mvel Exponencialmente Ponderada).
Esses grficos multivariados de controle estatstico possuem a caracterstica de detectar
pequenas mudanas no processo, abaixo de 2 (desvios-padro), ao contrrio do grfico de
controle multivariado T
2
Hotelling, indicado para detectar grandes alteraes.
2.2 Grfico Multivariado de Soma Acumulada (MCUSUM)
O modelo de grfico de controle univariado CUSUM (Soma Acumulada), de acordo
com Alves e Samohyl (2004), oferece maior sensibilidade a pequenos e moderados desvios na
mdia de um processo que passam despercebidos pelo grfico de Shewhart. Os procedimentos
de controle estatsticos multivariados baseados na filosofia CUSUM so discriminados em
duas principais categorias: (i) procedimentos de controle que utilizam mltiplos grficos de
controle CUSUM univariados (abreviados por MCU), desconsiderando assim a correlao
entre as variveis e (ii) procedimentos de controle que utilizam um grfico de controle

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



6
CUSUM multivariado (abreviado por MCUSUM), isto , utilizam a matriz de covarincias
das variveis para obter uma aproximao do grfico CUSUM em processos multivariados.
O grfico de controle multivariado de Soma Acumulada (MCUSUM - Multivariate
CUSUM Control Chart) um procedimento que utiliza a soma acumulada dos desvios de cada
vetor aleatrio previamente observado em relao ao valor nominal, para monitorar o vetor de
mdias de um processo multivariado (ALVES, 2009). Esse grfico de controle foi proposto
por Crosier (1988) a partir de dois procedimentos de controle. O primeiro, baseado na raiz
quadrada da estatstica T
2
de Hotelling, denominado de grfico de controle CUSUM COT
(CUSUM of T), consiste em reduzir as observaes multivariadas a escalares. O segundo
procedimento, denominado MCUSUM (CUSUM de vetores), se constitui numa extenso
multivariada do grfico de controle CUSUM univariado em que as quantidades escalares so
substitudas por vetores. Define-se
i
C
como
)] ( )' [(
1
o i 1 i o i 1 i
X S X S + + =

i
C (4)
onde S
i
so as somas acumuladas expressas por

> +

, ), 1 )( (
; ,
k C se
C
k
k C se
i
i
i
i 1 i
i
X S
0
S (5)
com 0 S
o
= e valor de referncia k > 0, relacionado magnitude de mudana.
A estatstica Y
i
de controle a ser plotada no grfico de controle MCUSUM dada por

i i
S ' S
1
=
i
Y . (6)
O mtodo sinaliza uma situao fora de controle se Y
i
> H, na equao (6). O valor de
H intervalo de deciso (limite superior de controle) escolhido a partir do desempenho de
ARL (Average Run Length), que corresponde ao nmero mdio de amostras coletadas at a
emisso de um sinal.
Crosier (1988) demonstra que, de uma maneira geral, esse procedimento tem
desempenho de ARL melhor do que o procedimento escalar. Alm disso, ainda de acordo com
o autor, este tipo de grfico de controle apresenta um desempenho de ARL superior em

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



7
relao ao grfico T
2
de Hotelling na deteco de deslocamentos no vetor de mdias do
processo.
2.3 Grfico Multivariado de Mdia Mvel Exponencialmente Ponderada (MEWMA)
A primeira referncia a grfico de controle multivariado de Mdia Mvel
Exponencialmente Ponderada (MEWMA - Multivariate Exponentially Weighted Moving
Average) se deve a Lowry, Woodall e Champ (1992), que definem o MEWMA como uma
extenso lgica do controle EWMA univariado. Seja um processo multivariado em que se est
interessado no controle simultneo de p variveis (caractersticas da qualidade)
correlacionadas entre si. Neste caso, X
1
, X
2
,....,X
n
so vetores de tamanho p que representam
as mdias amostrais tomadas do processo. Suponha-se que os vetores aleatrios X
i
so
independentes e esto identicamente distribudos segundo uma normal p-variante de vetor
de mdias e matriz de covarianas , X
i
iid
p
N ( , ). O processo estar sob controle
se =
o
e fora de controle caso contrrio. Define-se o vetor Z
i
como
, ) 1 (
1 - i i i
Z X Z r r + =

(7)
com , 1 i tomando-se como um vetor de partida
o o
Z = . Se o processo estiver sob controle,
o i
Z = ) ( E . A matriz de covarinias de
i
Z
i
Z
, conforme expresso (9).
i
X o vetor com
os dados da amostra e r um escalar cujo valor est compreendido entre 0 e 1. Quando r = 1,
obtm-se o grfico T
2
de Hotelling. A estatstica de controle
2
i
T utilizada para o grfico
MEWMA definida como

i
'
i
Z Z
1 2
=
i
Z i
T (8)
onde
1

i
Z
a inversa da matriz de covarincias de
i
Z . A matriz de covarincias de
i
Z dada
segundo a equao

r
r r
i


=
2
] ) 1 ( 1 [
2
i
Z
(9)
Para o procedimento do grfico de controle MEWMA, pode-se tomar a matriz de covarincia
assinttica dada por

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



8

|

\
|

= =

r
r
i
Z
i
2
lim
Z
(10)
de forma anloga ao que ocorre no caso univariado para observaes individuais. No caso em
que o tamanho da amostra n > 1, obtm-se a equao (11), corrigida por n

|
|

\
|

=
n r
r
) 2 (
Z
(11)
O processo considerado fora de controle se
2
i
T > h, na equao (8). O valor de h
(limite superior de controle) escolhido a partir do desempenho de ARL para o grfico de
controle MEWMA.
3. Anlise de Componentes Principais
A Anlise de Componentes Principais (ACP) um mtodo estatstico multivariado
que visa transformar um grupo de variveis correlacionadas em variveis independentes,
denominadas componentes principais. O objetivo facilitar a interpretao dos dados
(RENCHER, 2002). Estas componentes so combinaes lineares das variveis originais (12)
e representam suas projees nas direes de mxima variabilidade dos dados.
p p
x c x c x c
1 2 12 1 11 1
... z + + + = ;
p p
x c x c x c
2 2 22 1 21 2
... z + + + = ; (12)
M
p pp p p
x c x c x c + + + = ... z
2 2 1 1 p
.
Geometricamente, as variveis das componentes principais z
1
, z
2,...,
z
p
so os eixos do
novo sistema de coordenadas, obtido pela rotao do sistema das variveis originais. Os
novos eixos representam as direes de mxima variabilidade. A informao contida no
conjunto completo das p componentes principais corresponde quela contida no conjunto
completo de variveis originais do processo (PEA, 2002). Segundo o autor, o principal
objetivo das componentes principais determinar o novo conjunto de direes ortogonais que
definem a variabilidade mxima dos dados originais.
Como ilustrao, considere-se o caso da Figura 1: h duas variveis, x
1
e x
2
, e duas

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



9
componentes principais, z
1
e z
2
. De acordo com Montgomery (2004), encontrar os c
ij
que
definem as componentes principais fcil. X uma matriz, m x p, de dados preliminares do
processo, que contm uma observao p variada em cada linha e S=(m-1)
-1
XX a matriz de
covarincias amostrais. No entanto, se for utilizada, no lugar de X, a matriz Z de dados
padronizados, obtm-se, ao invs de S, a matriz R de correlaes amostrais.
Figura 1: Componentes principais para p = 2
Fonte: Montgomery (2004: 340)
Como a matriz S simtrica e no singular, existe uma matriz ortonormal U=[u
1
,
u
2
,...,u
p
] que transforma a matriz S numa matriz diagonal L (FILHO,2001).
L SU U =
'
(13)
Os elementos da diagonal L so os autovalores obtidos atravs da soluo da Equao
caracterstica da matriz S (JACKSON, 1980):
0 I S = (14)
onde I uma matriz identidade de ordem p p . A partir da Expresso (14), pode-se
transformar p variveis correlacionadas x
1,
x
2
, ..., x
p
em p variveis independentes z
1
, z
2
,...,z
p,
denominadas componentes principais. A matriz L apresenta as covarincias amostrais dessas
novas variveis independentes. Os autovalores de L esto dispostos em ordem decrescente,
com
p
representando a varincia de componente z
p
. Os autovetores de S so obtidos atravs
da soluo da Equao (15)

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



10
0 t I S =
i p
] [ (15)
tal que

i i
i
i
t t
t
u
'
= ; , , , 1 p i K = (16)
representam os autovetores normalizados que descrevem os eixos de coordenadas das novas
variveis (JACKSON, 1980, 1985).
Cada autovetor , , , 1 , p i
i
K = u de U, obtido a partir de
i
, uma combinao linear das
variveis originais X, projetados nas direes de mxima variabilidade em relao nuvem de
pontos p-dimensional, obtida a partir dos dados (JOHNSON; WICHERN, 1998). A matriz U
chamada matriz das cargas, com cada autovetor u
i
contendo as cargas devidas a componente
z
i
. Dessa forma, o vetor Z de variveis latentes pode ser escrito como
Z = UX (17)
A primeira componente, de acordo com Pea (2002), se define como a combinao
linear das variveis originais que tm varincia mxima. Os valores, nesta primeira
componente z
1,
so dados por

z
1
=Xu
1
. Como as variveis originais tm mdia zero, pois
foram padronizadas, z
1
tambm ter mdia

nula. Sua varincia ser
1
,
1 1
' ,
1 1
,
1
1 1
Su u Xu X u z z = =
n n
(18)
onde S a matriz de varincias e covarincias das observaes. Para que (18) seja
maximizado e tenha soluo, a restrio 1
1
,
1
= u u introduzida mediante o multiplicador de
Lagrange ) 1 (
1
,
1 1
,
1
= u u Su u M , derivando, respectivamente, as componentes principais de
u
1
e

igualando-as a zero. Ento:
0 2 2
M
1 1
1
= =

u Su
u
(19)
cuja soluo
1 1
u Su = (20)
que implica que u
1
um autovetor de S, e , seu correspondente valor prprio. Para
determinar que autovalor de S a soluo de (15), multiplicando esta Equao por
,
1
u
tem-se:

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



11
= =
1
,
1 1
,
1
u u Su u (21)
Conclui-se, por (21), que a varincia de z
1
. Como o autovalor o que se deseja
maximizar, ser o maior autovalor de S. Seu vetor associado, autovetor, u
1,
define os
coeficientes de cada varivel na primeira componente principal.
A segunda componente, conforme Pea (2002), representa a projeo das variveis
originais na segunda maior direo de variabilidade. Para obter o melhor plano de projeo
das variveis X, estabelece-se, como funo objetivo, que a soma das varincias z
1
= Xu
1
e z
2
=
Xu
2
seja mxima, onde u
1
e u
2
so vetores que definem o plano. Esta funo objetivo ser:
) 1 u u ( ) 1 u u ( Su u Su u
2
,
2 2 1
,
1 1 2
,
2
1
,
1
+ = , (22)
que incorpora as restries de que as direes devem ter mdulo unitrio 1
1
,
1
= u u , com i =1,2.
Derivando e igualando a zero,

= =

= =

0 2 2
0 2 2
2 2 2
2
1 1 1
1
u Su
u
u Su
u

(23)
a soluo deste sistema
1 1
u Su = (24)
2 2
u Su = (25)
indica que u
1
e u
2
so vetores prprios de S, e
1
e
2,
seus valores prprios correspondentes.
Esses valores prprios

so as quantidades que se quer maximizar. ser o maior valor prprio
da matriz S. Seu vetor associado, u
1
e u
2
, define os coeficientes de cada varivel na primeira e
segunda componente principal, respectivamente.
4. Procedimentos Metodolgicos
Os procedimentos adotados neste artigo envolvem a utilizao da anlise de
componentes principais a um conjunto de dados da literatura, e posterior aplicao dos
grficos de controle T
2
de Hotelling, MCUSUM e MEWMA s componentes. Neste estudo,
contempla-se as duas fases do processo e adota-se uma taxa de alarmes de 0,5%, ou seja,
ARL
0
= 200.

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



12
Na descrio dos procedimentos metodolgicos deste trabalho, utiliza-se um exemplo
de aplicao envolvendo uma srie de dados reais de um processo de montagem de cabines de
caminhes, obtidos na literatura de Colacioppo (2001, p. 92). Este conjunto de dados reais
composto de oito variveis que representam medidas relativas ao assento do capuz do motor
de um caminho. Para isso, foram analisadas 43 observaes coletadas desse processo,
durante um perodo de dois meses. O objetivo era avaliar a situao atual do processo em
relao variabilidade do produto estudado, e verificar como este diagnstico pode agir
preventivamente, ou seja, como reduzir custos de ajustes bem como aumentar a produtividade
na linha de montagem.
Para este estudo, dois procedimentos so utilizados para escolha do nmero de
componentes. O primeiro, conhecido como critrio da raiz latente, implica que apenas
autovalores maiores que um (1) sejam considerados significantes. O segundo determinado
por meio de um grfico (screeplot) em que se relacionam os autovalores ordem de
extrao. A forma da curva resultante usada para avaliar o nmero de componentes. O ponto
no qual o grfico comea a ficar horizontal um indicativo do nmero de componentes
(HAIR et al., 2005). So ento comparados os grficos T
2
de Hotelling, MCUSUM e
MEWMA aplicados s componentes.
A anlise estatstica multivariada dos dados realizada com o GNU R (R
DEVELOPMENT CORE TEAM, 2009), com auxlio dos pacotes qcc (SCRUCCA, 2004),
para o grfico T
2
de Hotelling. Para os grficos MCUSUM e MEWMA, aplicam-se rotinas
desenvolvida por Alves, Henning e Samohyl (2008), no GNU R, com o limite superior de
controle h do MCUSUM, determinado pelo Mtodo da Equao Integral (ALVES, 2009).
Para o grfico MEWMA, =1 e h = 8,66, valores sugeridos pela literatura, Lowry et al
(1992), considera-se p = 2 (duas variveis) e um ARL
0
de 200. As rotinas utilizadas neste
trabalho esto no Apndice A.
5. Anlise dos Dados e Resultados Obtidos
A anlise de componentes principais e os grficos de controle T
2
de Hotelling,
MCUSUM e MEWMA, pressupem que os dados tenham distribuio normal e sejam
independentes. Para a verificao da normalidade, utilizado o teste de Mardia e o grfico de

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



13
probababilidade normal multivariado (Figura 2) (MINGOTI, 2005). Por meio da anlise
visual do grfico de probabilidade normal multivariado (Figura 2), e dos resultados do teste,
pode-se aceitar a hiptese de normalidade ao nvel de 1% ( p-valor assimetria = 0,014 e p-
valor curtose = 0,43). A partir dos correlogramas, no apresentados neste trabalho em virtude
do nmero de variveis, verificou-se que os dados no eram autocorrelacionados.
importante salientar que a independncia, uma condio para o uso dos grficos T
2
de
Hotelling, MCUSUM e MEWMA, deve ser garantida preferencialmente pelo processo de
amostragem, que deve ser aleatrio.
Em seguida, realizada a anlise de componentes principais, pela matriz de correlaes.
Na Tabela 1, e no grfico da Figura 3, observa-se que apenas duas componentes tem autovalor
maior que 1 (um) e, a partir da terceira componente (Figura 3), a curva comea a ficar
horizontal. Apenas duas componentes so responsveis por, aproximadamente, 92% da
variabilidade dos dados (Tabela 1). Portanto, os grficos de controle podem ser aplicados a
apenas duas componentes.
5 10 15 20 25
0
5
1
0
1
5
2
0

d
2

2

Figura 2: Grfico de probabilidade normal multivariado para os dados

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



14
Tabela 1: Autovalores, varincia explicada por componente e proporo da varincia acumulada para os dados

Componentes


Autovalores

Proporo da varincia

Proporo da varincia acumulada
1 2,10 0,5520 0,5520
2 1,72 0,3693 0,9213
3 0,55 0,0385 0,9598
4 0,44 0,0250 0,9848
5 0,32 0,0126 0,9974
6 0,11 0,0015 0,9989
7 0,08 0,0009 0,9998
8 0,04 0,0002 1,0000
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8

V
a
r
i
a
n
c
e
s
0
1
2
3
4

Figura 3: Grfico das componentes (scree-plot)


Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



15
As Figuras 4, 5 e 6 ilustram os grficos de controle T
2
de Hotelling, MCUSUM e
MEWMA, aplicados s duas componentes resultantes.

Amostras
T
2
0
2
4
6
8
1
0
1
2
1
4
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42
LS(fase 1)=9,547
LS(fase 2)=12,675

Figura 4: Grfico T
2
de Hotelling para as componentes principais

Amostras
M
C
U
S
U
M
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43
0
5
1
0
1
5
H = 5.493
Figura 5: Grfico MCUSUM para as componentes principais

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



16

Amostras
M
E
W
M
A
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43
0
5
1
0
1
5
H = 8.66

Figura 6: Grfico MEWMA para as componentes principais

No grfico T
2
de Hotelling (Figura 4), o processo est sob controle estatstico. No
entanto, tanto o grfico MCUSUM (Figura 5) quanto o MEWMA (figura 6) revelam uma
alterao no vetor de mdias do processo a partir da 10 amostra, sendo suficientemente
sensveis para indicar que o processo saiu de controle estatstico entre a 12 e 19 amostra. O
desempenho, em termos de sensibilidade dos grficos de controle multivariados MCUSUM e
MEWMA, para o conjunto de dados desse processo, se mostrou praticamente similar. Como
se pode observar, o grfico MCUSUM (figura 5) assinala um deslocamento no vetor de
mdias do processo a partir da 10 amostra, ultrapassando o limite superior do MCUSUM na
12 amostra, enquanto o grfico MEWMA (figura 6) assinala este deslocamento no vetor de
mdias do processo a partir da 11 amostra, ultrapassando o limite superior do MEWMA na
13 amostra.

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



17
6. Concluses e Consideraes Finais
Este trabalho apresentou a importncia da anlise de componentes principais no
desenvolvimento de grficos de controle multivariados, em que a reduo das
dimensionalidades da matriz original de dados permite uma adequada visualizao da
variao dos resultados. A utilizao da ACP fundamental ainda para diagnosticar no
processo quais variveis esto bem explicadas para o modelo de grfico de controle desejado.
Alm disso, um grfico de controle multivariado convencional perde sua eficcia na medida
em que aumentam as variveis p de um processo, pois a mudana se dilui no espao das
variveis, resultando num ARL
1
maior (MONTGOMERY, 2004).
Um estudo comparativo entre grficos de controle T
2
de Hotelling e MCUSUM, com a
aplicao da anlise de componentes principais, realizado tendo como referencial um
conjunto de dados reais. Neste estudo, as oito variveis iniciais deste conjunto de dados so
reduzidas a duas componentes. Os grficos MCUSUM e MEWMA das componentes
sinalizam uma alterao no vetor de mdias do processo, alterao esta no detectada pelo
grfico T
2
de Hotelling. Conclui-se, ainda, que a anlise de componentes principais aplicada
ao controle estatstico de processos multivariados uma alternativa vivel para reduzir o
nmero de variveis analisadas, sem perda de informao. Este tipo de anlise pode ser
importante para o monitoramento de processos com vrias variveis, como por exemplo,
processos qumicos industriais.
O ambiente R utilizado mostrou ser uma ferramenta computacional adequada e
poderosa para anlise de dados multivariados baseados na projeo de dados com a utilizao
da ACP, e posterior aplicao dos grficos multivariados abordados neste trabalho. Esta
ferramenta, em ambiente de computao estatstica como projeto GNU, baseado no conceito
de software livre, importante, pois possui inmeras funes para tal aplicao e permite a
utilizao e adaptao dessas funes, de acordo com a necessidade do usurio.
Como sugesto para trabalhos futuros est a investigao da sensibilidade dos grficos
multivariados, aplicando a anlise de componentes principais, em situaes sob e fora de
controle estatstico. Outra sugesto analisar como se comportam esses grficos aplicando-se
diferentes estimadores da matriz de covarincia.

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



18
Referncias
ALVES, C.C. O mtodo de Equao Integral com Quadratura Gaussiana para otimizar os parmetros do
grfico de controle multivariado de Somas Acumuladas. 2009. 196 f. Tese (Doutorado em Engenharia de
Produo) Centro Tecnolgico, Universidade Federal de Santa Catarina, Florianpolis, 2009.
ALVES, C.C.; HENNING, E.; SAMOHYL, R.W. O desenvolvimento de grficos de controle MCUSUM e
MEWMA em ambiente R como um procedimento alternativo para anlise estatstica de processos multivariado.
In: XXIVIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUO ENEGEP 2008, 2008,
Florianpolis. Anais - XXIVIII Encontro Nacional de Engenharia de Produo Enegep 2008. Rio de
Janeiro, RJ, Brasil, 2008.
ALVES, C.C.; SAMOHYL, R.W. A utilizao dos grficos de controle CUSUM para o monitoramento de
processos industriais. In: XXIV ENCONTRO NACIONAL DE ENGENHARIA DE PRODUO ENEGEP
2004, 2004, Florianpolis. Anais - XXIV Encontro Nacional de Engenharia de Produo Enegep 2004.
Florianpolis, UFSC, 2004.
COLACIOPPO, R.C. Controle estatstico multivariados de processo para observaes individuais, 2001.
121 f. Dissertao (Mestrado em Estatstica) IME, Universidade Estadual de Campinas, Campinas, 2001.
CROSIER, R.B. Multivariate Generalizations of Cumulative Sum Quality Control Schemes. Technometrics,
v.30, n.3, p. 291-303, 1988.
FILHO, D.M. Monitoramento de Processos em Batelada atravs de Cartas de Controle Multivariadas
Baseada na Anlise de Componentes Principais Multidirecionais (ACPM). 2001. 204 f. Dissertao
(Mestrado em Engenharia de Produo), UFRGS, Porto Alegre, 2001.
HAIR, J. F.; ANDERSON, R. E.; T., RONLALD L.; BLACK, W. Anlise Multivariada de Dados. 5 ed. Porto
Alegre: Bookman, 2005. 600 p.
HOTELLING, H. Multivariate Quality Control-illustrated by the air testing of sample bombsights. In:
Techniques of Statistical Analysis. p. 111-184, New York : McGraw Hill, 1947.
JACKSON, J.E. Multivariate Quality Control. Communication in Statistics: Theory and Methods, v.14, n.11,
p. 2657-2658, 1985.
JACKSON, J.E. Principal Components and factor Analysis: Part I. Journal of Quality Technology, v.12, n.4, p.
201-213, 1980.
JACKSON, J.E. A user guide to Principal Components. Wiley. New York: 1991.
JOHNSON, R.A; WICHERN, D.W. Applied multivariate statistical analysis. New Jersey: Prentice Hall, 1998.
816 p.
LOWRY, A.C.; WOODALL, W.H.; CHAMP, C.W.; RIGDON, C.C. A Multivariate Exponentially Weighted
Moving Average Control Chart. Technometrics, v.34, n.1, p. 46-53, 1992.
LOWRY, A.C.; MONTGOMERY, D.C. A Review of Multivariate Control Charts. IIE Transactions, v. 27, p.
800-810, 1995.

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



19
MONTGOMERY, D. C. Introduo ao Controle Estatstico da Qualidade. Rio de Janeiro. LTC Editora, 4
edio, 2004. 513 p.
MINGOTI, S.A. Anlise de dados atravs de mtodos de estatstica multivariada: uma abordagem
aplicada. Belo Horizonte: Editora UFMG, 2005.
PEA, D. Anlisis de Datos Multivariantes. Espaa: McGraw-Hill Interamericana de Espaa, 2002. 539 p.
PHAM, H. Springer Handbook of Engineering Statistics. London: Springer-Verlag, 2006, 1120p.
R DEVELOPMENT CORE TEAM. R: A language and environment for statistical computing. R Foundation
for Statistical Computing, Vienna, Austria, 2009. Disponvel em: <http://www.R-project.org> Acesso em:
10/5/2010.
RENCHER, A.C. Methods of Multivariate Analysis. 2a ed., New York: Wiley-Interscience, 2002. 708 p.
SCRUCCA, L.. qcc: an R package for quality control charting and statistical process control. R News, v. 4, n.1,
p. 11-17. 2004.
TRACY, N.D.; YOUNG, J. C.; MASON, R.L. Multivariate Control Charts for Individual Observations. Journal
of Quality Technology. v. 24, n. 2, 1992.


Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



20
APNDICE A Rotinas no R

#programa hotelling

hotelling1=function(x,medias=NULL,mc=NULL,m=NULL,alfa=0.05,fase=2){
#x = dados
#xm = vetor de medias alvo (OPCIONAL)
#xs = matriz de covariancias
#m = numero de subgrupos
#alfa = nivel de significancia
#fase = I ou II, default II
if(!is.matrix(x))
x<-as.matrix(x)
if (any(alfa < 0))
stop("Valores para alfa entre 0 e 1")
if (any(alfa > 1))
stop("Valores para alfa entre 0 e 1")
if (any(fase < 1))
stop("Fase 1 ou 2")
if (any(fase > 2))
stop("Fase 1 ou 2")
#vetor de medias
if (is.null(medias)) {medias<-colMeans(x)}
#matriz de covariancias
if (is.null(mc)) {
m<-nrow(x)
v<-matrix(c(0),nrow=(nrow(x)-1),ncol=ncol(x))
for (i in 1:(m-1)) {v[i,]<-x[i+1,]-x[i,]}
vt<-t(v)
vv<-vt%*%v
mc<-matrix(c(0),ncol=ncol(x),nrow=ncol(x))
for (i in 1:ncol(mc)){mc[i,]<-(1/(2*(m-1)))*(vv[i,])}}
#calculo de m
if (is.null(m)){m<-nrow(x)}
#calculo de p
p<-ncol(x)
#limite superior
ls=9.15
if (fase == 2) {ls<-((p*(m+1)*(m-1))/(m^2-m*p))*qf(alfa,p,m-p,lower=F)}
else {ls<-((m-1)^2/m)*qbeta(alfa,p/2,(m-p-1)/2,lower=F)}
#matriz desvios
md<-matrix(c(0),ncol=ncol(x),nrow=nrow(x))
for (i in 1:ncol(x)){md[,i]<- x[,i]-medias[i]}
#inversa matriz desvios
tmd<-t(md)
#inversa matriz covariancia
imc<-solve(mc)
#calculo de t2
t2<-0
for (i in 1:nrow(x)){
t2[i]<-(md[i,]%*%imc%*%tmd[,i])}
t2

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



21
pontos.fora<-subset(t2,t2>ls)
plot(t2,type='b',pch=19,main=' ',ylab=expression(T^2),xlab='Amostras',lwd=1,ylim=c(0,13.5),axes=FALSE)
axis(2)
axis(1,0:nrow(x))
abline(h=ls,lwd=2)
text(2,1.05*ls,paste("LSC =",round(ls,2)))
box()
structure(list(vetor.medias=medias,matriz.covariancia=mc,t2=t2,pontos.fora=length(pontos.fora),valores=pontos
.fora))
}

###Grfico MCUSUM OBSERVACOES INDIVIDUAIS - com escolha k###
mcusum4=function(x,media=NULL,mc=NULL,k=0.5,ARL0=c(200,500))
{
x<-as.matrix(x)
p<-ncol(x)
if (p!=2 && p!=3 && p!=4){stop ("2,3 ou 4 variveis")}

#arl k e h
k.val<-c(0.05,0.25,0.5,0.75,1,1.25,1.5)
#p=2
h.2.200<-c(15.670,8.658,5.493,3.946,3.010,2.892,2.732)
h.2.500<-c(22.859,10.791,6.566,4.653,3.535,2.942,2.792)
tab.2<-cbind(k.val,h.2.200,h.2.500)
#p=3
h.3.200<-c(19.564,10.875,6.885,4.946,3.777,3.392,3.54)
h.3.500<-c(28.215,13.413,8.117,5.745,4.364,3.782,3.492)
tab.3<-cbind(k.val,h.3.200,h.3.500)
#p=4
h.4.200<-c(22.958,12.903,8.171,5.88,4.501,3.722,3.262)
h.4.500<-c(33.19,15.824,9.549,6.761,5.143,4.820,3.722)
tab.4<-cbind(k.val,h.4.200,h.4.500)
h<-
ifelse(ARL0==200,subset(tab.2,k.val==k,select=c(h.2.200)),subset(tab.2,k.val==k,select=c(h.2.500)))
#ARL0=200
h.2.200<-c(15.670,8.658,5.493,3.946,3.010,2.892,2.732)
h.3.200<-c(19.564,10.875,6.885,4.946,3.777,3.392,3.54)
h.4.200<-c(22.958,12.903,8.171,5.88,4.501,3.722,3.262)
tab.200<-cbind(k.val,h.2.200,h.3.200,h.4.200)
#ARL0=500
h.2.500<-c(22.859,10.791,6.566,4.653,3.535,2.942,2.792)
h.3.500<-c(28.215,13.413,8.117,5.745,4.364,3.782,3.492)
h.4.500<-c(33.19,15.824,9.549,6.761,5.143,4.820,3.722)
tab.500<-cbind(k.val,h.2.500,h.3.500,h.4.500)

if (p==2){
h<-
ifelse(ARL0==200,subset(tab.200,k.val==k,select=c(h.2.200)),subset(tab.500,k.val==k,select=c(h.2.500)))}
if (p==3){
h<-
ifelse(ARL0==200,subset(tab.200,k.val==k,select=c(h.3.200)),subset(tab.500,k.val==k,select=c(h.3.500)))}
if (p==4){
h<-

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



22
ifelse(ARL0==200,subset(tab.200,k.val==k,select=c(h.4.200)),subset(tab.500,k.val==k,select=c(h.4.500)))}
if (is.null(mc)) {
m=nrow(x)
v=matrix(c(0),nrow=(nrow(x)-1),ncol=ncol(x))
for (i in 1:(m-1)) {v[i,]=x[i+1,]-x[i,]}
vt=t(v)
vv=vt%*%v
mc=matrix(c(0),ncol=ncol(x),nrow=ncol(x))
for (i in 1:ncol(mc)){mc[i,]=(1/(2*(m-1)))*(vv[i,])}}
if (is.null(media)){
media=matrix(c(0),ncol=1,nrow=ncol(x))
for (i in 1:ncol(x)){media[i,1]=mean(x[,i])}}
s=matrix(c(0),ncol=ncol(x),nrow=nrow(x))
st=matrix(c(0),ncol=ncol(x),nrow=nrow(x))
ci=matrix(c(0),ncol=1,nrow=nrow(x))
p=matrix(c(0),ncol=1,nrow=nrow(x))
vmc=matrix(c(0),ncol=ncol(x),nrow=nrow(x))
for (i in 1:ncol(x)){x[,i]=x[,i]-media[i,1]}
s[1,]=s[1,]+x[1,]
st[1,]=s[1,]%*% solve(mc)
ts=t(s)
ci[1]=sqrt(st[1,]%*% ts[,1])
p[1]=1-k/ci[1]
if (ci[1]>k){vmc[1,]=(vmc[1,]+x[1,])*p[1]} else (vmc[1,]=matrix(c(0),ncol=ncol(x)))
for (i in 2:nrow(x)){
s[i,]=vmc[i-1,]+x[i,]
st[i,]=s[i,]%*%solve(mc)
ts=t(s)
ci[i]=sqrt(st[i,]%*%ts[,i])
p[i]=1-k/ci[i]
if (ci[i]>k){vmc[i,]=(vmc[i-1,]+x[i,])*p[i]}
else (vmc[i,]=matrix(c(0),ncol=ncol(x)))}
vmc1=vmc %*% solve(mc)
tc=t(vmc)
MCUSUM=0
for (i in 1:nrow(x)){MCUSUM[i]=sqrt(vmc1[i,]%*%tc[,i])}
pontos.fora=subset(MCUSUM,MCUSUM>h)
amostra=seq(1,nrow(x))
plot(amostra,MCUSUM,type='b',pch=19,ylim=c(0,max(1.1*h,1.1*max(MCUSUM))),main='
',xlab='Amostras',axes=FALSE)
axis(1,1:nrow(x))
axis(2)
box()
abline(h=h,lwd=2)
text(2,1.20*h,paste("H =",h))
#grid()
structure(list(ESTATISTICA.MCUSUM=MCUSUM,matriz.cov=mc,Media=media,H=h,K=k,pontos.fo
ra=length(pontos.fora),valores=pontos.fora))}
##programa qqplot multivariado##

qqmult4<- function(y){
library(QRMlib)#Para acessar teste Mardia
x<-as.matrix(y,ncol=ncol(y),nrow=nrow(y))

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



23
colnames(x)<-names(y)
nvar<-dim(x)[2]
##qqplot multivariado e teste de Mardia
par(mfrow=c(1,1))
vetormedias<-as.vector(colMeans(x))
mc<-cov(x)
desvios<-matrix(c(0),ncol=ncol(x),nrow=nrow(x))
for (j in 1:ncol(x)){
desvios[,j]<-x[,j]-vetormedias[j]}
imc<-solve(mc)
nop<-desvios %*% imc
na<-1:length(x[,1])
q<-(na-0.5)/nrow(x)
p<-ncol(x)
c2<-qchisq(q,p,lower=F)
td<-t(desvios)
d2<-0
for (i in 1:nrow(x)){
d2[i]<- nop[i,]%*%td[,i]}
c2<-sort(c2)
d2<-sort(d2)
rtm<-MardiaTest(x)
plot(d2,c2,main=" ",ylim=c(-
0.5,max(c2+0.5)),ylab=expression(chi^2),pch=19,xlab=expression(d^2),cex.main=1.2,cex.lab=1.5)
abline(lm(c2~d2))
structure(list(MARDIA.coef.ass=rtm[1],p.valor=rtm[2],MARDIA.coef.curtose=rtm[3],p.valor=rtm[4]))
}

##grafico MEWMA OBSERVACOES INDIVIDUAIS ####

mewma2=function(x,media=NULL,s=NULL,lambda=0.1,h=8.66)
{
x=as.matrix(x)
if (is.null(s)) {
m=nrow(x)
v=matrix(c(0),nrow=(nrow(x)-1),ncol=ncol(x))
for (i in 1:(m-1))
{v[i,]=x[i+1,]-x[i,]}
vt=t(v)
vv=vt%*%v
s=matrix(c(0),ncol=ncol(x),nrow=ncol(x))
for (i in 1:ncol(s))
{s[i,]=(1/(2*(m-1)))*(vv[i,])}}
if (is.null(media)){
media=matrix(c(0),ncol=1,nrow=ncol(x))
for (i in 1:ncol(x))
media[i,1]=mean(x[,i])}
mx=matrix(c(0),ncol=ncol(x),nrow=nrow(x))
for(i in 1:ncol(x)){
mx[,i]=(x[,i]-media[i,1])}
z=matrix(c(0),ncol=ncol(mx),nrow=(nrow(mx)+1))
for(i in 1:nrow(mx)){
z[i+1,]=lambda*mx[i,]+(1-lambda)*z[i,]}

Henning, E. et. al.
Aplicao de grficos de controle ... via Anlise de Componentes Principais. Produo em Foco, v. 1, n. 1, p. 41,66 jan./jun. 2011



24
z=z[-1,]
w=0
is=matrix(c(0),ncol=2,nrow=2)
tz=t(z)
MEWMA=0
for (i in 1:nrow(mx)){
w[i]=(lambda/(2-lambda))*(1-(1-lambda)^(2*i))
is=solve(w[i]*s)
MEWMA[i]=(tz[,i]%*%is)%*%z[i,]}
pontos.fora=subset(MEWMA,MEWMA>h)
amostra=1:length(MEWMA)
plot(amostra,MEWMA,type='b',pch=19,ylim=c(0,max(1.1*h,1.1*max(MEWMA))),main='
',ylab='MEWMA',xlab='Amostras',axes=FALSE)
axis(1,1:length(MEWMA))
axis(2)
box()
abline(h=h,lwd=2)
text(2,1.1*h,paste("H =",h))
#grid()
structure(list(ESTATISTICA.MEWMA=MEWMA,cov=s,medias=media,LS=h,lambda=lambda,pontos.
fora=length(pontos.fora),valores=pontos.fora))
}

S-ar putea să vă placă și