Documente Academic
Documente Profesional
Documente Cultură
valorii proprii .
k
(C 1 , X j ) s fie maxim.
j 1
R 2 (C 2 , X j )
m
Cov(C 1 , X j ) 2
Var(C )Var( X j )
R 2 (C 1 , X j )
j 1
1
n
1 t
t 1
1 (C ) X j ( X j ) C
n
(C 1 ) t C 1
(C 1 ) t X j ( X j ) t C 1
j 1
(C 1 ) t C 1
1 (C1 ) t XX t C1
n (C1 ) t C1
Maxim
C1
1 (C 1 ) t XX t C 1
.
n (C 1 ) t C 1
1
XX t , corespunztor celei
n
mai mari valori proprii 1 i se determin printr-o rezolvare a problemei similare celei date la
analiza n spaiul indivizilor.
2
Etapa 2. Se determin a doua component principal C , maxim corelat cu
1
variabilele iniiale i absolut necorelat cu prima component principal C .
Problema de maxim este:
1 (C 2 ) t XX t C 2
n (C 2 ) t C 2 .
C2
R(C 1 , C 2 ) 0
1
XX t , corespunztor celei
Soluia este vectorul propriu de ordinul 2 al matricei
n
2
de-a doua valori proprii .
k
Etapa k. n mod identic se determin variabila C maxim corelat cu variabilele
i
iniiale dar absolut necorelat cu celelate variabile noi, C , i=1,k-1.
Problema care se rezolv:
1 (C 1 ) t XX t C 1
n (C 1 ) t C 1
C1
R(C k , C i ) 0, i 1, k 1
Maxim
Maxim
1
XX t , corespunztor
n
1 t
X X . n spaiul variabilelor se
n
1
XX t . Valoarea proprie, comuna celor
n
1 t
k
k
X X a = k a , rezult:
n
1
1
XX t Xa k X k a k XX t C k k C k .
n
n
t
Numrul de etape n spaiul indiviziilor este m (gradul matricei X X) iar n spaiul
t
variabilelor este n (gradul matricei XX ). Prin urmare se opteaz pentru abordarea care da
numrul minim de etape.
Evaluarea rezultatelor
Criterii de alegere a numrului de axe
Notm cu s numrul de etape n care se efectueaz analiza. La fiecare etap este
extras mai puin informaie dect la etapa precedent. Exist mai multe criterii prin care s
se determine s, numrul de axe, numrul de componente principale alese n analiz, astfel
nct acoperirea informaional s fie satisfctoare.
1. Criteriul procentului de acoperire
O preocupare important n evaluarea calitii analizei este determinarea cantitii
de variaie (varian) explicat prin fiecare ax.
Deoarece criteriul de optim n alegerea axei k a fost maximizarea varianei pe axa
respectiv, se poate scrie:
1 k t t k
(a ) X Xa (a k ) t k a k k .
n
Variana explicat prin axa k este, deci, k. tim c variana total este m (tabelul X
este standardizat). Prin urmare, procentul de variaie explicat prin axa k este k/m , iar
k 1
j 1
m
n cazul n care
j
j 1
k 1
j 1
.
m
k
n mod similar, n spaiul variabilelor, la etapa k, corelaia dintre variabila nou C i
variabilele vechi este:
variabilele X sunt standardizate, vk =
R 2 (C k ,X j )
j 1
1 (C k ) t XX t C k (C k ) t k C k
k .
n (C k ) t C k
(C k ) t C k
(c
j 1
j 2
) . Un individ este cu
m
r 2
att mai bine reprezentat pe axa r cu ct (ci ) are o valoare mai mare n raport cu
j 1
j 2
) .
r 2
3. Criteriul Cattell
Acest criteriu se poate aplica n variant grafic (vizual - Figura 1) sau analitic. n
varianta grafic se detecteaz, ncepnd cu a treia valoare proprie, primul cot (unghi mai mic
decat 180). Se rein doar valorile proprii de pn n acel loc, inclusiv.
n varianta analitic se calculeaz diferente de ordinul doi ntre valorile proprii:
1 = 0, k = k-1- k, k = 2, m
1=2=0, k= k-1 - k , k=3, m
i se determin valoarea lui s astfel nct 1, 2, , s-1 s fie mai mari sau egale cu 0.
(c
(c
j 1
j 2
) .
Valoarea raportului este egal i cu cosinusul unghiului dintre vectorul punctului i i vectorul
r
a.
Contribuia indivizilor la variana explicat prin axa r
Variana explicat prin axa r este
1 n r 2
(ci ) =r . Partea din aceast varian
n i 1
r 2
principal, Ck, preia o cantitate de varian egal cu k, iar suma coeficienilor de determinare
dintre aceast component i variabilele iniiale este tot k. Comunalitatea unei variabile Xj n
raport cu primele s componente principale este deci suma coeficienilor de determinare dintre
s
2
R X j , C k . Pentru s = m aceast valoare
variabil i aceste componente principale:
k 1
este 1. Cele m componente principale preiau integral informaia din X.
Axa r
r
R(C ,Xj)
s
R(C ,Xj)
Axa s
Axa r
R (C , X j )
2
ci
Cov(C r , X j ) 2
Var(C r )Var( X j )
Cov(C r , X j ) 2
) =1.
Matriceal, obinem vectorul coeficieniilor de corelaie dintre variabilele iniiale i
Axa s
s
ci
Figura 2.2
Cr:
1 t r 1 t
X C
X X r
ar
n
n
r ar r .
Reprezentarea variabilelor
Fiecare variabil poate fi proiectat n planul definit de componentele principale de
ordin r i s. Coordonata variabilei Xj pe axa r este coeficientul de corelaie ntre aceast
variabil i componenta principal r, iar pe axa s este coeficientul de corelaie cu componenta
principal s. Reprezentarea se face cu ajutorul cercului corelaiilor:
unde xlj, j=1,m sunt valorile luate de individul suplimentar j pentru cele m variabile iar a i a
sunt factorii de ordin s i r.
Coordonatele variabilei suplimentare l n raport cu axele r i s sunt:
1 t r
X C
Cov( X l , C ) n l
r
R( X l , C )
X C At X t A C t X t X A C t C At
1 t
1 t t
X X A C C A
n
n
1 t s
Xl C
R( X l , C s ) n
.
1 t
C C . Cum
n
1 t
k
componentele principale sunt dou cte dou necorelate, iar var(C )=k, rezult c C C
n
Rezult c
k t
k 1
X=
k 1
(C k )
i este egal cu
Ck
(a k ) t .
(C k )
t
C
a k , care au aceleai norme de la o etap la alta, fiind doar ponderate cu rdcina
k
C
valorilor proprii.
Dac lum n considerare numai primele r etape, informaia rezidual
m
k r 1
Ck
k
ak
k
C
1 t
X X
n
Maxim R 2 (C k , X j ) , devine
C
j 1
Maxim Cov
C
j 1
(C k , X j ) .
1 t
X X.
n
Fiecrui individ i se asociaz o pondere. Fie pi, ponderea asociat individului i, 0<
n
pi<1,
p
i 1
1.
p1
0
Fie P matricea ponderilor: P =
...
0
Criteriul
de
optim
0
0
.
... pn
0 ...
p2 ...
0
spaiul
indivizilor
devine
urmtorul:
pi (cik ) 2 .
Maxim
i 1
Criteriul rmne neschimbat n spaiul variabilelor. Corelaia dintre dou variabile
este atunci calculat innd cont de ponderile indivizilor. Covariana dintre dou variabile
centrate X i Y se scrie:
n
Cov(X,Y) =
p x y
i 1
2
i
Var(X) =
p x
i 1
X X tP.
X t P X iar