Documente Academic
Documente Profesional
Documente Cultură
Coordonatele punctelor pe axa α din Rp (şi respectiv din Rn) sunt, prin
construcţie, componentele lui Xuα (respectiv X′vα).
Relaţiile precedente arată proporţionalitatea care există între coordonatele
punctelor pe o axă α dintr-un spaţiu şi componentele unitare (cosinuşii directori) ai
axei α din celălalt spaţiu.
Reconstituirea tabloului X
Din relaţia (*) se obţine
Xuα = λα vα , de unde Xuα uα′ = λα vα uα′ şi sumând
p p
X ∑ uα uα′ = ∑ λα vα uα′ .
α =1 α =1
p
Cum ∑ uα uα′
α =1
este produsul matricei ortogonale a vectorilor proprii cu
transpusa sa, adică este matricea unitate, se obţine reconstituirea tabloului iniţial prin
p
X = ∑ λα vα uα'
α =1
cu menţiunea că anumite valori proprii pot fi 0 (dar există vectorii proprii
corespunzători).
O reconstituire aproximativă X* este obţinută prin limitarea la primele q axe
factoriale (reamintim că valorile proprii au fost luate în ordine descrescătoare, deci
λq+1, …, λp sunt valorile cele mai mici):
q
X ≈ X * = ∑ λα vα uα' .
α =1
Fiecare valoare proprie măsoară suma pătratelor distanţelor la origine ale
proiecţiilor pe axa factorială respectivă. Prin urmare, reconstituirea va fi cu atât mai
bună cu cât suma valorilor proprii reţinute va constitui o parte notabilă a sumei tuturor
valorilor proprii. Calitatea globală a reconstituirii poate fi măsurată prin cantitatea
q p
τ q = ∑ λα ∑ λα
α =1 α =1
numită rata de inerţie (măsoară partea din varianţa norului explicată de subspaţiul cu q
dimensiuni). Se poate verifica şi
τ q = ∑ xij* ∑x
2 2
ij .
i, j i, j
Analiza în R p
Cele n puncte ale acestui spaţiu sunt indivizi (observaţii) şi se doreşte o
reprezentare a apropierilor dintre aceste puncte într-un spaţiu de dimensiune mai
mică. Prin transformările prealabile are loc o translaţie a norului de puncte într-un
reper având ca origine centrul de greutate al norului.
In ACPN se modifică şi scala pe fiecare axă.
Analiza în R n
Cele p puncte sunt aici variabilele, transformările prealabile au însă o
interpretare diferită:
• transformarea din ACP este o proiecţie paralelă cu prima bisectoare
Astfel, în cazul n=2 (neimportant din punct de vedere statistic, dar permite o
vizualizare corectă), un punct variabilă este supus transformării:
Criteriul Kaiser
Se reţin doar componentele principale corespunzând valorilor proprii mai mari
decât 1. Se aplică de regulă în ACPN.
Reprezentări grafice
In ACP/ACPN datele iniţiale se referă la n observaţii asupra a p variabile, care
pot fi interpretate ca
• n puncte-indivizi (observaţii) în R p,
• p puncte-variabile în R n.
Reţinerea unui număr de axe factoriale echivalează cu determinarea unui
subspaţiu în care datele iniţiale pot fi regăsite cu suficientă acurateţe. Examinarea
structurii norilor de puncte din subspaţiile respective se realizează prin metode
grafice, reprezentând punctele prin proiecţii pe un număr suficient de plane factoriale.
Astfel, pentru a putea înţelege structura unui nor de puncte în R 3 este nevoie
de proiecţia lor pe două plane (xOy şi xOz, de exemplu). Interpretările diferă totuşi
după cum este vorba de variabile sau de observaţii.
Variabile
Prin metoda numerică utilizată, coordonatele punctelor variabile sunt mai mici
de 1, punctele fiind pe sfera unitate. Cum distanţele dintre puncte sunt invers
proporţionale cu corelaţiile dintre variabilele corespunzătoare, grupările de puncte
indică grupuri de variabile corelate.
Pentru eliminarea erorilor de perspectivă, aprecierea corectă apare doar după
analiza proiecţii-lor pe mai multe planuri factoriale (= nr.de factori – 1). Variabilele
apropiate de o axă sunt corelate cu acea componentă principală, se poate considera că
axa respectivă este o combinaţie a variabilelor apropiate de ea.
Observaţii
Reprezentarea punctelor-observaţii prezintă de asemenea grupările de
observaţii, fără a mai fi pe sfera unitate.
Prima axă factorială este, uzual, factorul de talie, separând de-a lungul ei
observaţiile mici de cel mari. A doua axă factorială este factorul de formă. care
nuanţează diferen-ţele efectuate de primul factor.
Dacă observaţiile aparţin la grupuri de interes, evidenţierea claselor (ca în
figură) poate oferi informaţii utile prin configuraţiile vizibile. Concluziile sunt
justificate doar după utilizarea unui număr suficient de proiecţii.
B. Instrumente SPSS
Dialogul Factor Analysis
Pentru a aplica analiza factorială, prin natura metodei, trebuie ca între
variabile să existe corelaţii suficient de mari pentru a avea sens problema reducerii
dimensiunii. Prin urmare, dacă o variabilă nu este corelată cu celelalte va trebui
exclusă din analiză. În acelaşi timp, nici corelaţiile foarte mari (multicoliniaritatea) nu
conduc la rezultate uşor de interpretat, situaţia extremă fiind cea de singularitate, a
existenţei variabilelor perfect corelate. În asemenea cazuri este imposibil să se
determine contribuţia individuală la un factor a variabilelor. Prin urmare este necesar
să se calculeze şi să se analizeze matricea de corelaţii a variabilelor prin Analyse –
Correlate – Bivariate, inclusiv determinantul acestei matrice pentru determinarea
multicoliniarităţii.
Este de asemenea necesar să se testeze că variabilele au o distribuţie apropiată
de distribuţia normală (prin analizarea histogramelor sau a testelor de normalitate).
Dialogul principal este Analyse – Data Reduction – Factor. Se afişează
dialogul Factor Analysis.
Descriptives
În grupul Statistics se poate cere afişarea statisticilor elementare (media,
abaterea standard etc.). Selectarea Initial solution afişează comunalităţile iniţiale,
valorile proprii etc.
Extraction
Din lista Method se poate fixa metoda de analiză factorială. Pentru analiza în
componente principale sau componente principale normate se va selecta Principal
components. În acest caz, tipul analizei este dat de selecţia din grupul Analyze:
correlation matrix pentru ACPN sau covariance matrix pentru ACP.
Rotation
Rotaţia reperului axelor factoriale pentru a prinde un “unghi de vedere” mai
bun se poate selecta în dialogul Rotation. Ca metode sunt disponibile: varimax (se
minimizează numărul de variabile cu încărcări mari pe fiecare factor, ceea ce
simplifică interpretarea factorilor), direct oblimin (rotaţie oblică), quartimax
(minimizează numărul de factori necesari explicării fiecărei variabile), equamax
(combinaţie între metodele varimax şi quartimax) şi promax (rotaţie oblică în care se
admit factori corelaţi).
Pentru soluţia obţinută în urma rotaţiei se poate cere soluţia sau diagramele
încărcărilor pentru primii doi (dacă nu s-au extras cel puţin trei factori) sau trei
factori. Şi pentru procesul de rotaţie se poate preciza numărul maxim de iteraţii în
Maximum Iterations for Convergence.
Scores
Se poate cere salvarea ca noi variabile a scorurilor factoriale finale, fiecare
factor producând o variabilă. Cu alte cuvinte coordonatele cazurilor în reperul
factorial sau transformări ale acestora.
Se poate preciza metoda de calcul a scorurilor: regression (scorurile produse
au media zero şi o dispersie egală cu pătratul corelaţiei multiple între scorurile
factoriale estimate şi coordonatele factoriale adevărate), Bartlett (scorurile produse au
media zero şi este minimizată suma pătratelor factorilor reţinuţi) sau Anderson-Rubin
(scorurile au media zero, abatere standard unitară şi sunt necorelate).
Options
Se precizează modul de tratare a valorilor lipsă ca şi modul de afişare a
matricelor, de exemplu se pot omite coeficienţii care sunt în valoare absolută sub un
anumit prag.
Initial Eigenvalues
% of Cumulative
Component Total Variance %
1 3.313 47.327 47.327
2 2.616 37.369 84.696
3 .575 8.209 92.905
4 .240 3.427 96.332
5 .134 1.921 98.252
6 9.E-02 1.221 99.473
7 4.E-02 .527 100.000
Extraction Method: Principal Component Analysis.
Se observă că din ultima coloană se citeşte direct cât din varianţa totală se
explică prin reţinerea unui număr de componente.
Pentru ajutor în stabilirea numărul de componente se poate cere afişarea
diagramei valorilor (diagrama dată de exemplu conduce la reţinerea a două sau trei
componente, decizia finală fiind influenţată şi de proporţia cumulată a varianţei
explicate):
Scree Plot
3.5
3.0
2.5
2.0
1.5
1.0
Eigenvalue
.5
0.0
1 2 3 4 5 6 7
Component Number
Component
1 2
COLOR .760 -.576
AROMA .736 -.614
REPUTAT -.735 -.071
TASTE .710 -.646
COST .550 .734
ALCOHOL .632 .699
SIZE .667 .675
Extraction Method: Principal Component Analysis.
a. 2 components extracted.
Structura mai utilă pentru interpretare este, totuşi, cea obţinută după rotirea
factorilor, care oferă o "viziune" mai bună. Matricea de încărcare este afişată şi după
ce s-au rotit factorii, interpretarea fiind cea dată mai sus.
Rotated Component Matrixa
Component
1 2
TASTE .960 -.028
AROMA .958 1.E-02
COLOR .952 6.E-02
SIZE 7.E-02 .947
ALCOHOL 2.E-02 .942
COST -.061 .916
REPUTAT -.512 -.533
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
a. Rotation converged in 3 iterations.