Sunteți pe pagina 1din 20

UNIVERSIDADE ESTADUAL DO RIO DE JANEIRO

Programa de Ps-Graduao em Engenharia Qumica

PCA e HCA Workspace Rio


Observe o resultado mostrado. Verifique Plot Eigen/RMSECV, Scores, Loads e BiPlot na barra de menu.

PCA - Anlise de Componentes Principais


A Quimiometria uma rea da Qumica que estuda mtodos estatsticos e modelos matemticos aplicados a problemas de origem qumica. Dentre esses mtodos estatsticos a Anlise de Componentes Principais (PCA) tem sido de grande aplicao em diversas reas, como fsica, matmtica e geografia, no sendo observadas aplicaes na rea de Ensino de Qumica. Um dos objetivos da PCA a reduo de um espao multidimensional em um espao bidimensional, extraindo do conjunto de dados originais, informaes relevantes para o entendimento de determinado problema. No caso da Matriz Rio temos uma matriz de 15 linhas e 7 colunas que representam nossas 15 amostras e 7 variveis analisadas . Para fazer a anlise PCA foi necessrio gerar alguns grficos como : RMSEC e RMSECV; SCORES; LOADIGNS E BIPLOT Cada conjunto de grficos sero analisados separadamente.

Anlise dos Resultados ( RMSEC e RMSECV)


Verificando o Plot Eigen/RMSEC e RMSECV:
Para avaliar o desempenho dos modelos de calibrao foram calculados os erros de validao cruzada RMSECV ("Root Mean Square Error of Crossvalidation"). Na etapa de validao tambm muito importante determinar a quantidade adequada de componentes principais ou fatores necessrios para a construo do modelo
Com Matlab atravs do PLS toolbox foi possivel determinar a quantidade de componentes principais pelos grficos de RMSEC e RMSECV. O grfico RMSEC e RMSECV indica que com 2 parmetros tm-se os maiores autovalores e o menor erro . O cotovelo formado na posio dos 2 componentes.

Observa=se que o modelo com 2 parmetros tem varincia acumulada maior que 89,85%

Anlise dos Resultados ( SCORES PLOT)


Verificando o Plot Eigen/ SCORES PLOT OF Rio
Calculado o modelo para 2 parmetros foram gerados os grficos de Scores. No grfico de Q resduos X Hotelling observa-se valores baixos para Q e hotelling o q nos mostra que a modelagem foi apropriada para os dados apresentados. No grfico dos escores do PC1 e PC2 obtidos as amostras se dividem em 3 classes distintas, sabendo que haviam trs classes de amostras (fontes prximas, rea agrcola e prxima de um esturio) vemos uma coerncia na apresentao dos dados. No grfico dos escores do PC1 que explica 68,78% 4 amostrastem escores negativos, ou seja, o aumento do resultado tem efeito contrario neste escore.

2X- rea agrcola

1X =fontes prximas

3X - prxima de um esturio

Anlise dos Resultados ( LOADINGS PLOT)


Verificando o Plot Eigen/ LOADINGS PLOT OF Rio
Calculado o modelo para 2 parmetros foram gerados os grficos de Loading. No grfico de Hotelling X Loading PC1 observa-se as variveis representadas por essa componente: 1,2,3,4 e 6. ou seja Nitrato, Cloreto, Sulfato, Fosfato e Condutividade. No grfico de Hotelling X Loading PC2 observa-se as variveis representadas por essa componente: 2,3,6 e 7. ou seja Cloreto, Sulfato, Condutividade e O2 dissolvido. As variveis se posicionam em diferentes quadrantes no grfico Loading PC1 X Loading PC2 o que nos permite fazer uma anlise futura do grfico dos Scores e Biplot. Observamos que as propriedades: Cloreto, Sulfato e Condutividade se contrapes a Silicato e as propriedades: Nitrato e Fosfato se contrape a O2 dissolvido.

Anlise dos Resultados ( BiPLOT)


Verificando o Plot Eigen/ Biplot OF Rio
Calculado o modelo para 2 parmetros foram gerados os grficos de Loading.
No grfico de PC1 X PC2 vemos que de acordo com o grfico de Loadings de PC1 X PC2 observando a posio das amostras nos quadrantes podemos afirmar que : Para as amostras do Q 1 a concentrao de Silicato possui maior peso. Para as amostras do Q 2 a concentrao de Nitrato e Fosfato possui maior peso. Para as amostras do Q3 a concentrao de O2 dissolvido possui maior peso. Para as amostras do Q4 a as propriedades Cloreto, Sulfato e Condutividade possui maior peso.

Q4 Q3

Q1

Q2

HCA - Hierarchical Cluster Analysis


A anlise de agrupamento hierrquico (Hierarchical Cluster Analysis, HCA) so tcnicas estatsticas multivariadas apropriadas para explicar as diferenas entre conjuntos de amostras caracterizadas por um nmero elevado de variveis.

Anlise dos Resultados ( BiPLOT)

Verificando o Plot Eigen/ Dendograma of Rio


No Dendograma obtida aplicando o HCA confirma o que o grfico de Scores mostrou no PCA, pois possvel observar que as amostras se dividem em 3 classes, como: fontes prximas, rea agrcola e prxima de um esturio.

Concluso
No grfico dos Scores de PC1 e PC2 vemos que os as amostras Nas amostras de regies agrcolas observa-se a presena de Cloretos, Sulfatos e altos valores de Condutividade isso com certeza deve-as a uso de adubos tipo adubos potssicos ou outros que apresentam alto teores de dessas substncias. Nas amostras de regies prximas a esturios observa-se a presena de Nitratos e Fosfatos isso com certeza deve-as a uso de fertilizantes na proximidade do esturio. Nas amostras de regies prximas observa-se a presena de Silicatos e O2 dissolvidos.

S-ar putea să vă placă și