Sunteți pe pagina 1din 3

Analiza canonic

2. Se determin al doilea cuplu de variabile canonice, z i u astfel


2 2
inct R (z ,u ) sa fie maxim sub restriciile:
t
2 t 2
z z 1, u 2 u 2 1


.

t
t
z 2 z1 0, u 2 u1 0



2

Procednd ca la pasul 1, obinem c soluiile problemei sunt vectorii


proprii ai matricelor P1P2 i P2P1 corespunztori celei de-a doua valori proprii ca
mrime. Valoarea proprie 2 este coeficientul de corelaie ntre variabilele
2

canonice z i u :
P1P2z2 = 2z2, P2P1u2 = 2 u2.

n plus fa de pasul 1 trebuie demonstrat c z2 i z1 respectiv u2 i u1


nu sunt deloc corelate , deci ( z 2 )t z1 0 i (u 2 )t u1 0 .
Dezvltm produsul 2 ( z 2 )t z1 astfel:
2 ( z 2 )t z1 = ( z 2 )t P2 P1z1 deoarece (P1P2z2 )t = (2z2)t
2 ( z 2 )t z1 = ( z 2 )t P1P2 P1z1 , deoarece proiecia unui vector in
propriul spaiu este vectorul insui, P1z2 = z2, sau (z2)tP1 = (z2)t.
2 ( z 2 )t z1 = ( z 2 )t P1P2 z1 , deoarece P1z1=z1
2 ( z 2 )t z1 = 1( z 2 )t z1 , deoarece P1P2z1 = 1z1
Deci: 2 ( z 2 )t z1 = 1( z 2 )t z1 .
Cum 1 2 , rezult c ( z 2 )t z1 0 .
n mod asemntor:
2 (u 2 )t u1= (u 2 )t P1P2u1 = (u 2 )t P2 P1P2u1 = (u 2 )t P2 P1u1 =
= 1(u 2 )t u1
(u 2 )t u1 0 .

k. Se determin cuplul k de variabile canonice (z ,u ) astfel nct


acestea s fie maxim corelate, variana lor s fie 1 iar raportul de corelaie cu
variabilele canonice determinate la paii anteriori s fie 0.

( R 2 ( z k , u k ))

z k ,u k

( z k )t z k 1, (u k )t u k 1

( z k )t z i 0, (u k )t u i 0, i 1, k 1

Soluiile problemei sunt vectorii proprii ai matricelor P 1P2 i P2P1


corespunztori valorii proprii de ordinul k.
Variabilele canonice ale aceleiai grupe sunt dou cte dou
noncorelate.
Se poate arta c i variabilele canonice de ordin diferit din grupe
diferite sunt noncorelate:
r
k
(z )tu = ( P1 z r ) t u k ( z r ) t P1u k ( z r ) t R( z k , u k ) z k R( z k , u k )( z r ) t z k 0

Max

Factorii canonici
Variabilele canonice sunt combinaii liniare de variabilele celor dou
grupe, asfel:
i
i
i
i
z = Xa , u = Yb , i=1,k
i
i
unde a i b sunt factorii canonici corespunztori.
Se poate observa c matricele P1P2 i P2P1 sunt de ordinul n. n imensa
majoritate a situaiilor numrul de indivizi este mult mai mare dect numrul de
variabile. Prin urmare, operaiunile de determinare a vectorilor i valorilor
proprii sunt foarte costisitoare pe astfel de matrice.
k
La etapa k se determin z , vector propriu al matricei P1P2. Deci:
k

P1P2z = R (z ,u )z .
t

-1 t

-1 t

Deoarece P1 = X(X X) X si P2 = Y(Y Y) Y (vezi regresia multipl), iar


k

z = Xa , se obine:
t -1 t
t -1 t
k
2 k k
k
X(X X) X Y(Y Y) Y Xa = R (z ,u ) Xa .
t -1 t
nmulind aceasta relaie la stnga cu (X X) X rezult:
t -1 t
t -1 t
k
2 k k
k
(X X) X Y(Y Y) Y Xa = R (z ,u ) a .

Dac se efectueaz urmtoarele notaii: V11 =

1 t
1 t
X X, V22 = Y Y, V12
n
n

1 t
1 t
X Y , V21 = Y X , se obine:
n
n
-1
-1
k
2 k k
k
V11 V12V22 V21 a = R (z ,u ) a .

Reprezentarea variabilelor se face precum la ACP cu ajutorul cercului


corelaiilor. Spaiul W1 al primelor variabile este numit spaiul primal iar spaiul
W2 al celui de-al doilea grup de variabile, spaiul dual. Reprezentarea se poate
face n fiecare dintre cele dou spaii sau pe un grafic comun.
Axa r

-1

-1

Axa r

n mod asemntor se obine relaia: V22 V21V11 V12 b = R (z ,u ) b .


Se poate observa c V11 este matricea de covarian ntre variabilele
din grupa X, V22 este matricea de covarian ntre variabilele din grupa Y, V12
este matricea de covarian ntre variabilele din grupa X i grupa Y iar V21 este
matricea de covarian ntre variabilele din grupa Y i grupa X.
k
n concluzie a este vectorul propriu de ordinul k al matricei

R(Z ,Xj)

R(U ,Xj)

R(Z ,Xj)

R(U ,Xj)

Axa s

Axa s

1
1
V11
V12V22
V21 corespuztor valorii proprii k = R (z ,u ), iar b este vectorul
2

-1

-1

propriu de ordinul k al matricei V22 V21V11 V12 corespunztor aceleai valori


proprii. Deoarece aceste matrice au dimensiunile p respectiv q este mult mai
convenabil aceast modalitate de determinare a variabilelor canonice. Numrul
de etape se determin dup relaia m = min (p,q).
Legturile dintre factori
tim c P2 z k R( z k , u k )u k . nlocuind

P2 Y (Y t Y )Y t , z k Xa k

i u k Yb k , rezult: Y (Y t Y ) 1 Y t Xa k R( z k , u k )Yb k .
Se

inmulete

1
V22
V21a k

aceast

relaie

la

stnga

cu

(Y t Y ) 1 Y t

rezult:

R( z , u )b .
Relaiile ntre factori sunt deci urmtoarele:
1
1
bk
V22
V21a k
R( z k , u k )
a
k

1
R( z k , u k )

Figura 2. Reprezentarea variabilelor spaiile W1 i W2


Reprezentarea indivizilor
Permite evidenierea indivizilor cu un comportament particular n
raport cu cele dou grupe de variabile. Astfel dac un individ i ocup locuri
complet diferite n cele dou grafice , primal i dual, atunci cele dou grupe de
variabile sunt complet diferite informaional din punctul de vedere al acestui
individ.
Axa r

Axa r

V111V12b k

Reprezentri grafice
Scopul analizei canonice este de a pune n eviden afinitile dintre
dou grupuri de variabile urmrite la o aceeai mulime de indivizi.
Reprezentrile grafice se realizeaz , aadar, att din perspectiva variabilelor ct
i din aceea a indivizilor. Graficele sunt mai semnificative cnd se refer la
primele etape ale analizei, etape n care cuplurile de variabile canonice sunt mai
puternic corelate.
Reprezentarea variabilelor

zi

ui
Axa s
s

zi

Axa s
s

ui

Figura 3. Reprezentarea indivizilor n spaiile W1 i W2


Variana explicat i redundana informaional
Cantitatea de varian explicat de fiecare cuplu de variabile canonice,
pentru fiecare din grupe, este dat de suma corelaiilor dintre variabilele
canonice i variabilele grupelor:

VXk =

R( z k , X j ) 2 , k = 1,m

asik aik

Xi
, i = 1, p, k = 1, m
zk

bsik bik

Y i
, i = 1, q, k = 1, m
uk

j 1
q

VYk =

R(u ,Y
k

j 2

) , k = 1,m ,

j 1

unde R( z k , X j ) 2 este coeficientul de determinare (raportul de corelaie) ntre


variabila canonic zk a cuplului k i variabila Xj din prima grup (cu elementele

Interpretarea coeficienilor standardizai este asemntoare celei de la regresia


multipl: creterea cu o unitate a abaterii standard a variabilelor Xi sau Yi
genereaz o cretere cu asik sau bsik a abaterii standard a variabilelor zk i uk.

n coloana j a matricei X), iar R(u k ,Y j ) 2 este acelai lucru dar pentru grupa a
doua i variabila uk a cuplului. n exprimare proporional valorile sunt:
i

VX k
p

VYk
.
q
m

Variana total explicat de cele m rdcini canonice este: VX =

VX k pentru

k 1

prima grup i VY =

VYk .

k 1

Redundana este dat de informaia comun celor dou grupe extras de


rdcinile (cuplurile) canonice. Informaia comun este reflectat de corelaiile
canonice. Dac avem o anumit cantitate de informaie extras de o variabil
canonic dintr-o grup, partea din aceast informaie care se gsete i n
cealalt grup este aflat cu ajutorul corelaiei canonice astfel:
SXk = VXk k, k = 1, m,
SYk = VYk k, k = 1, m.
m

Redundana la nivelul celor m radacini canonice este: SX =

SX k , SY =

k 1

SYk .

k 1
Standardizarea factorilor canonici
Interpretarea factorilor canonici este mai uor de fcut dac acetia sunt
standardizati. Factorii standardizati sunt calculai astfel:

S-ar putea să vă placă și