Documente Academic
Documente Profesional
Documente Cultură
x ij x j
zij
sj
Vectori și valori proprii
Vectori și valori proprii
Vectori și valori proprii
Vectori și valori proprii - standardizare
Vectori și valori proprii - standardizare
II. Principiul metodei
ACP sintetizează variabilitatea iniţială a datelor privind cele p variabile iniţiale
în câteva componente necorelate între ele, numite componentele principale.
Fiecare componentă principală este extrasă ca o combinaţie liniară de
variabile iniţiale. Metoda constă în extragerea celui mai mic număr de
componente care preiau cea mai mare parte a varianţei datelor iniţiale, adică
în reducerea datelor iniţiale cu o pierdere minimă de „informaţie”.
Valorile proprii
s 2 s12 s1n
1 1. Măsoară cantitatea de varianţă „explicată” de fiecare
s s 22 s 2n componentă principală.
S 21
2. Descresc odată cu indexul componentei, prima
s s 2n
componenta principală având valoarea proprie
n1 s n 2 maximă.
3. Au suma egală cu p (numărul variabilelor iniţiale).
4. Exprimă „importanţa” componentelor principale
Dacă primele k componente principale preiau 80% sau mai mult din varianţa
datelor iniţiale, atunci scopul reducerii dimensionalităţii va fi atins.
III. Axe principale, factori principali,
componente principale
Axele principale
Axele principale sunt vectorii proprii ai matricii SM, cu M-norma egală cu 1
Axele principale sunt M şi S-1 ortogonale
SMa = a și a’Ma=1, 𝑎 ∈ 𝑅𝑝
Factorii principali
Fiecărei axe principale i se asociază factorul principal: u = Ma, element din Rp.
Factorii principali sunt vectorii proprii M-1 normaţi ai lui MS
Factorii principali sunt M-1 şi S ortogonali
MSu = u
Componentele principale
Componentele principale sunt variabilele ci, elemente din Rn, definite cu ajutorul
factorilor principali ci = Xui
ci este vectorul care conţine coordonatele proiecţiilor M-ortogonale ale indivizilor
pe axa definită de ai cu ai unitar
III. Axe principale, factori principali,
componente principale
În cazul în care se lucrează cu un tabel de date centrat şi redus Z, asociat lui X:
metrica folosită va fi M = I
matricea de covarianţă a datelor centrate şi reduse va fi matricea de corelaţie R
deci factorii principali vor fi vectorii proprii succesivi ai lui R,
aranjaţi după ordinea descrescătoare a valorilor proprii:
Ru = u cu u2 = 1
Interes practic mai au doar componentele principale calculate drept combinaţii liniare
de variabilele centrate-reduse:
c = Zu
c este variabila cea mai legată de xj în sensul sumei pătratelor corelațiilor:
p
r
j1
2
( c, x j
)
III. Axe principale, factori principali,
componente principale
1
Contribuţia individului i la componenta ck : CTRI(i,k) = p i c k2i
k
Când ponderile sunt toate egale cu 1/n, contribuţiile nu aduc mai multe informaţii
decât coordonatele
yk
unde este centrul de greutate pentru indivizii din categoria k.