Sunteți pe pagina 1din 8

ARTIGO

ANÁLISE EXPLORATÓRIA EM QUÍMICA ANALÍTICA


COM EMPREGO DE QUIMIOMETRIA: PCA E PCA
DE IMAGENS
Resumo Geraldo D. Matos
Edenir R. Pereira-Filho
Este trabalho trata da divulgação e aplicação da análise de componentes principais em Ronei J. Poppi
Marco A. Z. Arruda*
dados numéricos e imagens (PCA e PCA de imagens). Foram apresentadas e discutidas as
propriedades da PCA como alternativa para estudar uma grande quantidade e variedade
Universidade Estadual de
de dados. No primeiro caso, foi empregada a PCA para estudar dados bidimensionais Campinas – UNICAMP
provenientes de análises morfológicas e químicas de plantas de girassóis cultivadas em Departamento de Química
três tipos diferentes de substrato: solo, solo + vermicomposto e solo + vermicomposto sa- Analítica
turado de Cd, Cu, Pb e Zn. Com o auxílio da PCA concluiu-se que as plantas cultivadas no
solo e solo + vermicomposto foram as mais altas e as plantadas no solo + vermicomposto *Autor para correspondência:
saturado as de maior diâmetro do caule. Além disso, foi observado que o Cu e o Pb foram Caixa Postal 6154
13083-862. Campinas. SP
responsáveis por estas diferenças. No segundo caso foi empregada a PCA de imagens para
Fone: (19) 3788-3089
classificar e prever imagens de diferentes formatos, tamanhos, cores e tamanhos de partí- Fax: (19) 3788-3023
cula. Com a PCA de imagens foi possível separar diferentes figuras geométricas (círculos, E-mail: zezzi@iqm.unicamp.br
triângulos e losangos) e classificar algumas amostras. Além disso, foi apresentada a possibi-
lidade de empregar a PCA de imagens para separar três tamanhos de partícula: 63, 150 e
600µm. Tanto a PCA como a PCA de imagens, podem se configurar como uma importante
ferramenta quimiométrica em química analítica ou em outras áreas do conhecimento.

Palavras-chave: Análise de componentes principais, PCA, PCA de imagens

Summary

This work presents the principal component analysis applied numerical data and image
samples (PCA and Image PCA). In this work it was presented and discussed the PCA as a
good alternative to study a great variety of data. In the first example, it was employed the
PCA to study bidimentional data from morphological and chemical analysis of sunflower
cultivated on three types of substrates: soil, soil + vermicompost and soil + vermicompost
saturated of Cd, Cu, Pb and Zn. With PCA it was concluded that plants cultivated on soil
and soil + vermicompost were the highest and the plants cultivated on soil + vermicom-
post saturated presented the larger steam diameter. In addition, it was observed that Cu
and Pb were responsible for these differences. On the second, it was presented the Image
PCA properties for images classification and prediction with different shapes, sizes, colors
and particle sizes. Using image PCA it was possible to separate three diferent geometrical
images (circles, triangles and losangs) and to classify some samples. In addition, it was pre-
sented the possibility to employ the image PCA for separating three particle sizes: 63, 150
and 600µm. The image PCA can be a good chemometric tool when applied to analytical
chemistry or other research areas.

Keywords: Principal component analysis, PCA, Image PCA

Revista Analytica • Agosto/Setembro 2003 • Nº 06


38
ARTIGO

Introdução

É notório nos diversos segmentos da química o cresci- cos, com conseqüente perda de informações que podem ser
mento tecnológico/científico manifestado pela utilização, relevantes. Geralmente, na análise de imagens em química
cada vez mais freqüente, de recursos computacionais. A quí- analítica são efetuadas apenas algumas inspeções visuais a
mica analítica não foge a esta regra, principalmente, devido fim de encontrar similaridades ou diferenças perceptíveis
ao contínuo aumento da quantidade dos dados analíticos somente ao olho humano.
gerados, bem como o aumento da variabilidade de técnicas Ao se trabalhar com a PCA de imagens, uma nova manei-
para obtê-los (1). Diante desta realidade, muitas vezes, os ra de visualização dos dados deve ser introduzida: a grande
químicos analíticos se deparam com uma gama de dados que maioria dos químicos, principalmente os analíticos, está ha-
possibilitam oferecer diversos tipos de informações. bituada a submeter uma amostra de material biológico, por
No cenário atual, é importante ter como alternativa algu- exemplo, a algum processo analítico, e ter como resultado
ma ferramenta matemática que possa, de um modo mais cri- final um número (concentração de algum analito). Já com a
terioso e científico, extrair um maior número de informações PCA de imagens, um conjunto de imagens é processado e o
de um conjunto de dados ou imagens. resultado final pode ser, por exemplo, a distribuição espacial
A Análise de Componentes Principais (PCA, do inglês, da concentração, informações sobre fenômenos de superfície
Principal Component Analysis) é uma ferramenta quimiomé- e similaridades ou desigualdades (classificação) entre mate-
trica que permite extrair, de um determinado conjunto de riais que passaram por algum processo (6).
dados, informações relevantes para o seu entendimento. Este As aplicações da PCA de imagens são variadas, porém,
conjunto de dados é organizado na forma de uma matriz (da- elas estão apenas surgindo na literatura. Como exemplos
dos bidimensionais), onde as linhas podem ser amostras e as recentes pode ser citado o trabalho de Skarpeid et al. (10).
colunas variáveis. Neste sentido, com a PCA é possível efetuar Neste trabalho, os autores empregaram fotos de géis de ele-
uma simplificação, redução da dimensão original dos dados, troforese para modelar a composição de diversos tipos de
modelamento, detecção de amostras anômalas (outliers), carnes, tendo como ferramenta a PCA de imagens.
seleção de variáveis importantes em determinado sistema, Shu et al. (11) empregaram a PCA de imagens e sensoria-
classificação e previsão (2). mento remoto para monitorar a qualidade de águas, tendo
As aplicações da PCA são diversas e abrangem diversos como parâmetro a concentração da clorofila A. A PCA de
ramos do conhecimento, principalmente a química analítica. imagens pode ser empregada, também, para a classificação
Na literatura são encontradas inúmeras aplicações para a e previsão de propriedades funcionais de pós (12,13).
PCA, entre as quais destaca-se o trabalho de DelValls et al Em um outro trabalho, Pereira-Filho et al. (14) emprega-
(3). Neste trabalho, os autores determinaram as fontes de ram PCA de imagens no estudo da morfologia de imagens
contaminação em sedimentos marinhos provenientes do micrográficas. Estas imagens foram provenientes de bobinas
Golfo de Cádiz. de Teflon utilizadas para a mineralização de amostras na
Com a popularização da PCA e aumento da complexida- forma de suspensões. Os autores concluíram, com o auxílio
de dos dados analíticos gerados, houve também o surgimen- da PCA de imagens, que houve um comportamento distin-
to da Análise de Componentes Principais de Imagens (Image to entre as diversas regiões da bobina de mineralização. Os
PCA, do inglês, Image Principal Component Analysis). Esta mesmos autores (15) empregaram a PCA de imagens para in-
segunda técnica é uma ferramenta quimiométrica muito útil, vestigar características morfológicas de plataformas de grafi-
quando uma grande quantidade de imagens é produzida e te pirolítico tratadas com diferentes modificadores químicos.
necessita ser explorada (4-7). Estas plataformas haviam sido utilizadas na determinação de
Além de dados numéricos, algumas técnicas analíticas Al em suspensões de leite em pó.
são capazes de gerar imagens. A Microscopia Eletrônica de Os objetivos principais deste trabalho estão voltados para
Varredura (SEM, do inglês, Scanning Electron Microscopy) é a divulgação da PCA e da PCA de imagens no estudo de dados
um exemplo de como imagens podem ser utilizadas na visu- numéricos e imagens. No exemplo da aplicação da PCA fo-
alização de fenômenos e/ou interações que podem ter ocor- ram utilizados dados provenientes das análises morfológicas e
rido durante determinado processo e/ou tratamento (8). Ou- químicas de girassóis plantados em diferentes condições: solo,
tros exemplos podem ser encontrados em microscopia ótica solo agregado ao vermicomposto comercial e solo agregado
(9), sensoriamento remoto (8), entre outras. Entretanto, na ao vermicomposto saturado de metais (Cd, Cu, Pb e Zn). Com
grande maioria das vezes, essas informações visuais não são a ajuda da PCA foi possível visualizar o comportamento das
tratadas com o mesmo rigor científico que os dados numéri- plantas sob diferentes condições de cultivo.

Revista Analytica • Agosto/Setembro 2003 • Nº 06


40
ARTIGO

No caso da PCA de imagens, como uma ferramenta n


1 (1)
analítica/quimiométrica, foram apresentados dois exemplos Xj =
n Σ
i=j
X ij

que podem facilmente ser extrapolados para aplicações ana-


líticas. No primeiro, foi abordada a propriedade da PCA de onde Xj é a média dos dados Xij contidos em uma coluna (va-
imagens em separar objetos com diferentes formatos e tama- riáveis). Em seguida, subtrai-se os dados originais pela média
nhos. No segundo exemplo, foi mostrada a propriedade em calculada (equação 2):
distinguir diferentes cores e tamanhos de partículas.
(2)
Xij(cm) = Xij - Xj
Teoria da PCA
No AS, calcula-se a variância dos dados s2 (equação 3):
A PCA para dados bidimensionais é uma ferramenta
1 n (3)
quimiométrica bastante difundida e utilizada para diminuir S2j =
n-1 Σ
i=j
(X ij
- Xj ) 2
a dimensão dos dados originais (2). Desta forma, uma gama
infinita de informações pode ser organizada em uma matriz em seguida, subtrai-se os dados originais pela média (ver
de dados X formada por N linhas e M colunas. As linhas po- equação 1), e dividi-se pelo desvio padrão, segundo a
dem ser, por exemplo, amostras de água de diferentes locais equação 4:
ou diferentes tratamentos, e as colunas (variáveis) podem ser
Xij - Xj (4)
características físico-químicas ou até mesmo concentrações Xij(as) =
de espécies químicas (16). Sj
Na PCA, a dimensão dos dados originais é diminuída
para um menor conjunto de dimensões chamadas de Com- O pré-processamento CM é mais empregado para
ponentes Principais – PC’s. Desta forma, as principais vanta- dados espectrais e o AS é empregado quando se quer dar
gens da PCA estão na simplificação, modelamento, detecção a mesma importância para todas as variáveis. A Figura 2
de amostras anômalas, classificação e previsão (4, 17). mostra uma ilustração dos tipos de pré-processamento
A partir dos PC’s são gerados dois novos conjuntos de discutidos anteriormente. Na Figura 2a temos 10 variáveis
dados chamados de scores e loadings. Estes dois conjuntos tra- (representadas por retângulos) e, como pode ser facilmen-
zem, respectivamente, informações sobre as amostras e as vari- te observado, elas possuem tamanhos muito diferentes.
áveis. A Figura 1 mostra a decomposição dos dados originais em Ao se aplicar o pré-processamento centrado na média
scores (t) e loadings (p) e uma matriz de erros E. Ao se combinar colocamos todas as médias em zero (ver Figura 2b). Já na
os dados dos scores é possível efetuar um estudo mais criterioso Figura 2c temos os dados autoescalados e o tamanho das
dos dados originais sem perda de informações relevantes (18). variáveis é basicamente o mesmo.

Figura 1. Decomposição de uma matriz X com N linhas e K


colunas em vetores de scores (t) e loadings (p) e uma matriz
de erros E.
Antes de aplicar a PCA a dados numéricos, é necessário
efetuar algum tipo de pré-processamento nos dados origi- Figura 2. Exemplo de pré-processamento de dados para 10
variáveis fictícias: (a) dados originais, (b) dados centrados na
nais. Os principais tipos de pré-processamento são o Cen-
média (média igual a zero) e (c) dados autoescalados (média
trado na Média – CM e o Autoescalamento – AS (2). No CM igual a zero e desvio padrão igual a 1). As linhas horizontais
calcula-se a média de cada variável, segundo a equação 1: representam as médias de cada variável.

Revista Analytica • Agosto/Setembro 2003 • Nº 06


42
Com relação à PCA de imagens, temos que o processa- Experimental
mento digital de imagens é uma área relativamente recente.
A mesma se beneficia de uma importante propriedade das Programas computacionais
imagens: a sua transformação em uma matriz de dados. Na aplicação da PCA e da PCA de imagens foi emprega-
Cada pequena parte da imagem, denominada pixel (contra- do o MATLAB versão 6.1 (The MathWorks, Natick, USA). As
ção das palavras em inglês picture element), pode ser conside- rotinas foram aplicadas a partir do “PLS Toolbox”, versão 2.0
rada como um objeto de uma matriz (19). (Eigenvector Technologies, Manson, USA).
As imagens digitalizadas (transformadas em matrizes)
podem ser organizadas em um arranjo tridimensional G de Dados numéricos
dimensões I, J e K (ver Figura 3). As dimensões I e J são as Para exemplificar a utilização da PCA, foram realizados
coordenadas geométricas das imagens e K é o número de estudos das características física e nutricional de plantas, a
imagens ou variáveis. Desta forma, a PCA de imagens pode partir de uma cultura de girassol. Estas plantas foram subme-
ser empregada para a interpretação de dados em um espaço tidas a três diferentes tipos de tratamentos/substratos:
de variáveis. O arranjo tridimensional G pode ser desdobrado • Tratamento 1 – T1: 10 amostras cultivadas somente
em uma longa matriz G de tamanho I.J x K (ver Figura 3). Na com solo (terra vegetal);
PCA de imagens, a matrix G é multiplicada pela sua transpos- • Tratamento 2 – T2: 10 amostras cultivadas com solo
ta (G’) tendo como resultado uma matriz Z de dimensões K agregado ao vermicomposto comercial, 20% (m/m);
e K. A matriz Z é então decomposta em uma somatória de • Tratamento 3 – T3: 10 amostras cultivadas com solo
imagens de scores e vetores de loadings, ou seja, o mesmo agregado ao vermicomposto saturado de metais, utili-
tratamento matemático utilizado na PCA para dados bidi- zando a mesma proporção do tratamento anterior.
mensionais (ver Figura 1). A visualização dos loadings é muito
útil para efetuar uma análise exploratória ou classificação (4). Imagens
A equação 5 resume as informações presentes na Figura 3. No primeiro exemplo, imagens de círculos, triângulos e
losangos foram gerados empregando-se o Microsoft Power-
a (5) Point 2000 (Microsoft, Redmond, USA) e tratadas utilizando
G= ΣT
a=1
a
*pa + E
o PhotoSuite versão 1.05 (MGI, Santa Clara, USA).
Já no segundo exemplo três amostras de giz escolar das
no qual G é o arranjo tridimensional de imagens, Ta é o cores vermelha, verde e azul foram peneiradas em peneiras
score de imagens, pa é a matriz de loadings e E é uma matriz (Bertel, Caieiras, Brasil) com granulometrias de 63, 150 e
com os erros (4-7). 600 µm. As amostras peneiradas foram digitalizadas empre-
gando-se uma máquina fotográfica digital (Sony, New York,
USA) acoplada a uma lupa com aumento de 32 vezes (Carl
Zeiss, Jena, Germany). As imagens foram tratadas no software
Axion Vision (Carl Zeiss). Quatro misturas foram preparadas:
a primeira com partes iguais das três cores, e as outras forma-
das pelas mesmas cores, porém, misturadas duas a duas.

Procedimentos

Obtenção dos dados por meio de cultivo de girassóis


Durante o período de cultivo (53 dias) foram avaliadas as
diferentes fases de crescimento das plantas, tais como: altura,
diâmetro do caule, comprimento e largura das folhas para cada
um dos tratamentos. Estas informações foram coletadas ao lon-
go do período de cultivo, e devido a este fato temos ao todo
95 amostras. Os dados foram organizados em uma matriz com
95 linhas e 10 colunas. As linhas correspondem às amostras.
Estas amostras foram divididas em 3 classes (T1, T2 e T3) e 10
Figura 3. Formação do arranjo tridimensional G de dimensões
variáveis (altura, diâmetro, comprimento e largura das folhas).
I, J e K, e desdobramento do arranjo G em uma matriz G de Com estes dados temos uma matriz com 10 variáveis, ou seja,
dimensões I.J x K. 10 dimensões. O olho humano é capaz de observar apenas até

Revista Analytica • Agosto/Setembro 2003 • Nº 06


43
ARTIGO

3 dimensões. Desta forma, é impossível visualizar, simultane- Imagens


amente, o comportamento das 10 variáveis para todas as 95 Inicialmente, foram geradas 30 imagens a partir do Po-
amostras. Já com a PCA é possível reduzir estas dimensões sem werPoint: 10 círculos, 10 triângulos e 10 losangos. Este pro-
perder informações relevantes. Devido à natureza heterogênea cedimento foi adotado para investigar as potencialidades da
dos dados, os mesmo foram auto-escalados. PCA de imagens em classificar/separar imagens com diferentes
Além das características físicas das plantas foi efetuada formatos. Cada grupo de imagens possuía certas particularida-
uma avaliação nutricional dos girassóis. Nesta avaliação des; estas particularidades foram geradas ao se inserir diferen-
foram determinados Cd, Cu, Pb e Zn nas raízes, caules e tes números de figuras geométricas, cheias ou vazias, no inte-
folhas, bem como no substrato. Após a aquisição dos dados rior das imagens. Além destas, foram geradas mais 6 imagens
físicos as plantas foram coletadas, separadas, secas (até mas- – 2 círculos, 2 triângulos e 2 losangos que apresentam algumas
sa constante) em estufa a 50ºC e trituradas. Todas as partes características diferentes das 30 imagens iniciais. Com estas 6
das plantas e substratos foram coletadas em triplicata sendo imagens procuramos verificar se a PCA de imagens é capaz de
geradas 36 amostras. classifica-las em seus respectivos grupos, e este grupo com 6
Para efetuar estas determinações foram realizadas imagens foi chamado de amostras testes. Para todos os casos
decomposições destas amostras em forno de microondas o tamanho das imagens foi de 10x10 cm.
fechado (modelo QW 3000, QCI, Mississauga, Canadá). As 36 imagens foram digitalizadas e a resolução final foi
Para a decomposição das diferentes partes das plantas foi de 300 por 300 pixels para cada uma. Com as 36 imagens
empregado 150 mg de amostra, 10 ml HNO3 (Merck, Darms- digitalizadas foi possível obter um arranjo tridimensional de
tadt, Alemanha) concentrado e 0,5 ml H2O2 65% (Merck). O 300x300x36, sendo este arranjo tratado por meio da PCA de
programa de mineralização utilizado constou de 4 etapas: 1a imagens. As cores das imagens foram normalizadas para a
etapa com potência de 400 W por 5 min; 2a etapa potência escala de cinza, ou seja, foram utilizadas 256 (28) tonalidades
de 790 W por 1 min; 3a etapa com potência de 320 W por variando do preto (0) até o branco (255).
4 min; e uma 4a etapa a potência zero por 3 min (20). Após Ao utilizar a PCA de imagens foram testados dois proces-
a decomposição, as amostras foram filtradas e coletadas em samentos de dados: centrado na média e auto-escalado, e as
balões volumétricos de 10 ml, cujo volume foi completado imagens foram empregadas, também, sem nenhum pré-proces-
com HNO3 0,2% (v/v). Os quatro metais de interesse foram samento. O emprego dos dados sem nenhum tipo de pré-pro-
determinados por Espectrometria de Absorção Atômica com cessamento significa que eles serão utilizados tal e qual. No caso
Atomização Eletrotérmica (ETAAS, do inglês, Electrothermal do processamento centrado na média, é efetuada a média arit-
Atomic Absorption Spectrometry). Nestas determinações foi mética dos dados (pixels) referentes a cada imagem, e a mesma é
empregado um espectrômetro modelo AAnalyst 600 da subtraída de cada pixel da imagem original. Para o processamen-
PerkinElmer (Überlingen, Alemanha). to auto-escalado também é subtraída a média aritmética e, em
As decomposições das amostras de substratos foram fei- seguida, o valor resultante é dividido pelo desvio padrão.
tas também em forno de microondas utilizando 250 mg de Neste trabalho foi também investigada a possibilidade
amostra, 10 ml de água régia e 5 ml de HF (Merck). Para esta de utilizar a PCA de imagens para prever a forma de ima-
decomposição foram utilizadas as seguintes etapas: 1a etapa gens destorcidas ou com partes faltantes. As 36 imagens
com potência de 250 W durante 3 min; 2a etapa com potên- descritas anteriormente foram digitalizadas empregando-se
cia de 500 W por 5 min; 3a etapa com potência de 600 W por resoluções de 150x150, 75x75 e 30x30. Estas imagens foram
5 min; 4a etapa com potência de 700 W por 20 min; e uma autoescaladas e a PCA de imagens foi empregada.
5a etapa com potência de 80 W durante 2 min (21). As amos- Além dos experimentos descritos anteriormente, foram in-
tras foram filtradas e coletadas em balões de 25 ml, onde seu vestigadas as potencialidades da PCA de imagens em separar
volume foi completado com HNO3 2%. A quantificação dos imagens com formatos semelhantes, porém com tamanhos di-
íons metálicos foi feita por Espectrometria de Absorção Atô- ferentes. Desta forma, as imagens já descritas foram reduzidas
mica com Chama (FAAS, do inglês, Flame Atomic Absorption progressivamente de tamanho, e a resolução de 300x300 foi
Spectrometry). Neste caso empregou-se um AAnalyst 300 da mantida. Para as 30 imagens (círculos, triângulos e losangos)
Perkin-Elmer (Norwalk, Estados Unidos). as primeiras imagens foram dimensionadas em 10x10 cm, e
Finalizadas as determinações por ETAAS e FAAS os dados as demais foram dimensionadas com 1 cm a menos que a
foram organizados em uma matriz com 36 linhas (3 réplicas imagem anterior. Após redimensionamento, as imagens foram
para raiz, caule, folhas e substrato) e 4 colunas (concentração digitalizadas e levadas até a PCA de imagens.
de Cd, Cu, Pb e Zn). Estes dados também apresentavam va- No último exemplo foram empregados bastões de giz
lores muito heterogêneos e foram auto-escalados. nas cores vermelho, verde e azul. Estes bastões foram tritu-

Revista Analytica • Agosto/Setembro 2003 • Nº 06


44
ARTIGO

rados e frações com 63, 150 e 600 µm foram obtidas com de 100%) da variância dos dados. Ao se avaliar as concentra-
o auxílio de peneiras. Além das imagens individuais, foram ções dos metais mencionados anteriormente foi detectada,
realizadas misturas combinando as cores em uma proporção novamente, uma separação entre as amostras cultivadas em
de 1:1, e uma mistura tendo todas as cores na proporção de T3 das demais plantas. Na Figura 5c podemos visualizar o
1:1:1. Em todos os casos foi empregada a fração com 63 µm. gráfico dos scores para a PCA efetuada com as informações
As frações e as misturas foram fotografadas com um aumento nutricionais. Em primeiro plano podemos notar dois grupos:
de 32 vezes, obtendo-se um total de 13 imagens.

Resultados e Discussão

PCA – Análises morfológicas e nutricionais


A PCA foi aplicada com o intuito de estudar as caracte-
rísticas (físicas e químicas) das plantas ao se empregar três
tipos de tratamentos. Antes de visualizar os gráficos de scores
e loadings é necessário escolher o número de componentes
principais (PC’s) que caracterizam os dados originais. Os PC’s
são novos eixos criados a partir das variáveis iniciais.
Na primeira PCA (características físicas) foi observado
que a PC1 (Componente Principal 1) explica ou contém
cerca de 57% da variância dos dados originais. As PC’s 2, 3
Figura 4. Variância explicada (%) para cada componente
e 4 explicam 20, 10 e 4%, respectivamente. Os demais PC’s
principal (PC’s). A seta em vermelho indica o número ideal
(de 5 a 10) explicam muito pouco dos dados originais (8% de componentes principais – PC’s para representar os dados
ao todo). A Figura 4 mostra um gráfico da variância explica- originais.
da em cada PC. Nesta figura pode-se observar que, a partir
do PC4, não há uma variação muito grande da variância
explicada, ou seja, ao se aplicar a PCA, foi possível reduzir a
dimensão original dos dados de 10 (10 variáveis/dimensões)
para 4 (4 PC). Os resultados aplicando a PCA são mostrados
na Figura 5 (gráficos de Scores e Loadings). Na Figura 5a te-
mos o gráfico dos scores para o PC1, PC2 e PC3. O gráfico
de Scores traz informações sobre as amostras. Nesta figura é
possível visualizar dois diferentes grupos: o primeiro é forma-
do pelas plantas cultivadas em T1 (bolas pretas) e cultivadas
em T2 (bolas azuis). O outro grupo, representado por bolas Figura 5a Figura 5b

vermelhas, representa as plantas em T3.


Na Figura 5b temos o gráfico dos loadings. Este gráfico
traz informações sobre as variáveis. Os gráficos de scores e lo-
adings são analisados em conjunto. Desta forma, temos que
as plantas cultivadas em T1 e T2 (preto e azul) são as plantas
mais altas (bola azul na Figura 5b). Já as plantas cultivadas
em T3 correspondem às plantas mais baixas e com maior
diâmetro do caule (bola vermelha na Figura 5b).
Com a PCA foi possível verificar que as plantas cultivadas
em T3 (em vermelho) apresentaram-se mais desenvolvidas Figura 5c Figura 5d

em relação ao diâmetro do caule, comprimento e larguras Figura 5. Gráficos em três dimensões dos scores e loadings
das folhas (bolas pretas na Figura 5b), porém estas apresen- para as PCAs da avaliação morfológica e nutricional de uma
taram alturas inferiores aos demais tratamentos. cultura de girassol, cultivada em três diferentes tratamentos
Na PCA para as informações nutricionais das plantas fo- (T1, T2 e T3). Nos gráficos (a) e (b) temos os scores e loadings
para a avaliação em relação ao aspecto morfológico. Nos
ram necessários apenas 3 PC’s para descrever toda a variância gráficos (c) e (d) temos os gráficos dos scores e loadings em
dos dados. A PC1, PC2 e PC3 explicaram 78, 13 e 9% (total relação à avaliação nutricional.

Revista Analytica • Agosto/Setembro 2003 • Nº 06


46
ARTIGO

o primeiro formado pelas plantas cultivadas em T1 (bolas


pretas) e em T2 (bolas azuis); o segundo formado pelas par-
tes das plantas (caule – C, raiz – R e folhas – F) e substrato uti-
lizados em T3 (bolas vermelhas). Além disso, foi notada uma
separação entre as diversas partes das plantas (raízes, caule
e folhas) cultivadas em T3. O substrato do T3 também apre-
sentou-se separado (representado pela letra S). Ao observar o
gráfico dos loadings (Figura 5d) podemos constatar que tanto
as plantas como o substrato do T3 são caracterizados pela
alta concentração de Cu e Pb.
Analisando os gráficos da Figura 5 pode-se concluir que
os metais responsáveis pela baixa estatura e diâmetro do caule
das plantas cultivadas em T3 foram o Cu e o Pb. Este tipo de
Figura 6a
conclusão só foi possível após o estudo dos dados com a PCA e
união dos dois resultados. Este tipo de associação e estudo de
informações representa uma inovação em química analítica.
Com o uso de uma ferramenta quimiométrica simples foi pos-
sível visualizar comportamentos e tendências dos dados.

PCA de imagens - Investigação do formato,


resolução e tamanho
As 36 imagens foram digitalizadas, e a PCA de imagens
foi aplicada conforme ilustra a Figura 3. A Figura 6a mostra
os resultados quando nenhum tipo de pré-processamento
foi aplicado. A partir desta figura podemos visualizar que
não foi possível detectar nenhum tipo de separação entre
Figura 6b
as amostras. Mesmo ao se empregar as amostras centradas
na média, novamente, nenhuma tendência ou classificação Figura 6. PCA de imagens das figuras geométricas. Em (a)
foi observada. Entretanto, ao se utilizar as amostras com temos as imagens sem nenhum tipo de pré-processamento
e em (b) temos as imagens auto-escaladas. Os círculos,
dados auto-escaladas, foi observada um separação entre as
triângulos e losangos cheios representam as imagens descrita
diversas figuras geométricas utilizadas. A Figura 6b mostra a no item Procedimentos, e os vazios representam as 6 imagens
separação entre círculos (cheios e vazios), triângulos (cheios que foram utilizadas como amostras.
e vazios) e losangos (cheios e vazios). As seis imagens
utilizadas como amostras (círculos, triângulos e losangos PCA de imagens - Investigação das cores e tamanhos
vazios – Figura 6b) foram posicionadas em seus respectivos de partículas
grupos. A PCA de imagens além de separar as imagens em Ao se trabalhar com imagens de diferentes cores e tamanhos
grupos efetuou uma classificação daquelas 6 imagens que de partícula, foi notada uma separação entre as cores com a for-
utilizamos como amostras testes. mação de três agrupamentos distintos. A PCA de imagens (com
Ao se empregar imagens com diferentes resoluções foi ob- dados auto-escalados) permitiu, também, uma discriminação
servado que mesmo se deformando totalmente as imagem (re- entre os diferentes tamanhos de partícula, como mostra a Figura
solução 30x30) foi detectada uma nítida separação entre elas. 8. Já as imagens formadas pela mistura das cores apresentaram
Ao se trabalhar com imagens de diferentes tamanhos um agrupamento em separado. A mistura azul+vermelho se
não foi detectada uma diferença entre os três formatos, aproxima mais da cor azul, a mistura verde+vermelho é mais
mas sim uma diferenciação entre as amostras maiores e próxima da cor vermelha e as misturas entre as três cores e
menores. Essa observação foi independente do tipo de pré- azul+verde são localizadas no meio deste sub-agrupamento. É
processamento utilizado. A Figura 7 mostra os resultados interessante ressaltar que a PCA de imagens permitiu, ao mesmo
encontrados (dados centrados na média), onde as maiores tempo, efetuar uma separação das diferentes cores sem, con-
imagens se posicionaram perifericamente, e as menores for- tudo, confundir os tamanhos de partículas. Estas características
maram um grupo (estrelas). podem ser muito úteis no estudo de fenômenos de superfície.

Revista Analytica • Agosto/Setembro 2003 • Nº 06


48
ARTIGO

Figura 7. PCA de imagens com dados centrados na média para Figura 8. PCA de imagens para as amostras de gizes colo-
as imagens geométricas com diferentes tamanhos. Os círculos, ridos. Os triângulos vermelhos, círculos verdes e quadrados
triângulos e losangos em preto, vermelho e azul representam azuis representam as cores vermelha, verde e azul, respectiva-
as imagens com dimensões de 8 a 10 cm. As estrelas vazias mente. Os números representam os tamanhos de partículas:
representam as imagens com dimensões de 1 a 7 cm. 63, 150 e 600 µm. Os triângulos pretos invertidos represen-
tam as misturas de cores: todas as cores na proporção 1:1:1,
verde+vermelho, azul+verde e azul + vermelho.

Conclusão
Referências
Os exemplos mostrados neste trabalho servem de
1. Valcárcel M. Trends Anal. Chem. 1997, 16, 124.
subsídios para diferentes aplicações, bem como divulga- 2. Wold S, Esbensen K, Geladi P. Chemometr. Intell. Lab. 1987, 2, 37.
ção de ferramentas quimiométricas em química analítica 3. DelValls TA, Forja JM, González-Mazo E, Gómez-Parra A, Blas-
com ênfase em análise exploratória. A PCA para dados co J. Trends Anal. Chem. 1998, 17, 181.
4. Geladi P, Grahn H. Multivariate Image Analysis ; John Wiley &
bidimensionais pode ser empregada em uma gama muito Sons, Chichester, 1996.
extensa de dados numéricos. Assim, é viável estudar um 5. Geladi P, Wold S, Esbensen K. Anal. Chim. Acta. 1986, 191, 473.
número muito grande de variáveis para amostras de dife- 6. Geladi P, Bengtsson E, Esbensen K, Grahn H. Trends Anal.
Chem. 1992, 11, 41.
rentes naturezas. 7. Geladi P. Chemometr. Intell. Lab. 1992, 14, 375.
Com os dados apresentados neste trabalho é possível 8. Balaban RS, Kurtz I, Cascio HE, Smith PD. J. Microsc-Oxford.
visualizar a aplicação da PCA de imagens em diversos seg- 1986, 141, 31.
9. Turner DW, Plummer IR, Porter HQ. J. Microsc-Oxford. 1984,
mentos da química analítica ou mesmo em outras áreas do 136, 259.
conhecimento. A PCA de imagens pode ser empregada, 10. Skarpeid HJ, Moe RE, Indahl UG. Meat Sci. 2001, 57, 227.
11. Shu X, Qiu Y, Kuang D. Proc. SPIE-Int. Soc. Opt. 1999, 3868,
por exemplo, na detecção de diferentes tamanhos de par-
460.
tículas, ou até mesmo em um estudo mais aprofundado de 12. Huang J, Esbensen KH. Chemometr. Intell. Lab. 2000, 54, 1.
fenômenos de superfície. 13. Huang J, Esbensen KH. Chemometr. Intell. Lab. 2001, 57, 37.
14. Pereira-Filho ER, Poppi RJ, Arruda MAZ. Mikrochim. Acta.
Finalmente, as aplicações da PCA de imagens são
2001, 136, 55.
ainda muito insipientes e têm muito ainda que contribuir 15. Pereira-Filho ER, Pérez CA, Poppi RJ, Arruda MAZ. Spectro-
na mudança de paradigma na análise e interpretação de chim. Acta B. 2002, 57, 1259.
16. Geladi P, Kowalski BR. Anal. Chim. Acta. 1986, 185, 1.
dados analíticos.
17. Malinowski F, Howery D. Factor Analysis in Chemistry; Wiley,
New York, 1980.
19. Castleman KR. Digital Image Processing, Prentice-Hall, Inc.,
Englewood Cliffs, 1979.
Agradecimentos 18. Martens H, Naes T. Multivariate Calibration, John Wiley & Sons,
Os autores são gratos à Fundação de Amparo à Pesquisa do Chichester, 1993.
Estado de São Paulo (FAPESP) pelo apoio financeiro, e pela bol- 20. Arruda MAZ, Alves FL, Jardim WF, Cadore S, Smichowiski P,
Marrero J.Quim. Nova. 2001, 24, 756.
sa concedida a ERPF (Processo no 99/00259-5) e ao Conselho 21. Alves FL, Cadore S, Jardim WF, Arruda MAZ. J. Braz. Chem.
Nacional de Desenvolvimento Científico e Tecnológico (CNPq) Soc. 2001, 12, 799.
pelas bolsas concedidas a GDM, RJP e MAZA.

Revista Analytica • Agosto/Setembro 2003 • Nº 06


50

S-ar putea să vă placă și