Documente Academic
Documente Profesional
Documente Cultură
Prin urmare:
(1) oricrui individ i i corespunde n matricea X o linie, adic un
vector cu p elemente, care va fi scris: Li = ( xi1 , xi 2 ,..., xip ) R p ;
(2) oricrei variabile j i corespunde n matricea X o coloan cu n
elemente, care va fi notat: C j = ( x1 j , x 2 j ,..., x nj ) T R n .
Dac matricea este privit pe linii, atunci avem n linii ce pot fi
reprezentate n spaiul Rp al variabilelor. Se obine, n spaiul variabilelor,
un nor de n puncte de coordonate ( xi1 , xi 2 ,..., xip ) , cte un punct pentru
fiecare individ i.
Dac matricea este privit pe coloane, atunci avem p coloane ce pot
fi reprezentate n spaiul Rn al indivizilor. Se obine, n spaiul indivizilor,
un nor de p puncte de coordonate ( x1 j , x 2 j ,..., x nj ) , cte un punct pentru
fiecare variabil j.
Atunci cnd n sau/i p sunt mari (mult mai mari dect 2 sau 3), nu
mai putem s interpretm grafic norul de puncte. Ideea ar fi s dezvoltm
nite tehnici care s ne permit, fr a pierde prea mult informaie
coninut n norul de puncte, s aproximm att spaiul coloanelor ct i
spaiul liniilor prin nite subspaii de dimensiuni mai mici. Vom prezenta n
cele ce urmeaz o asemenea tehnic.
S notm cu m = ( m1 , m 2 ,..., m p ) vectorului mediilor celor p
variabile. Punctul de coordonate ( m1 , m 2 ,..., m p ) din Rp este numit centrul
de greutate al norului de puncte. Informaia I k cu care particip un individ
oarecare k n norul de puncte poate fi exprimat prin distana (euclidian) de
la punctul ce-l reprezint de coordonate ( x k1 , x k 2 ,..., x kp ) pn la centrul
de greutate, adic:
p
I k=
(x
kj
m j )2 .
(1)
j =1
I=
I = ( x
k
k =1
k =1 j =1
kj
m j )2 .
(2)
sunt ( x k1 , x k 2 ,..., x kp ) .
S proiectm acest individ
ck
Pk(y1,y2,)
pe dreapta de versor u. Proiecia
sa se afl la distana ck de origine;
0
numrul ck reprezint unica
Figura 1. Proiecia pe o dreapt
coordonat a individului k pe
dreapta . Coordonata ck,, obinut
prin proiecie ortogonal, este dat de formula:
c k = x k1 u1 + x k 2 u 2 + ... + x kp u p .
(Pentru edificare putem urmri i desenul din figura 1.)
Iu =
I' = c
k
k =1
2
k
(3)
k =1
max I u =
u
(x
k1 u1
+ ... + x kp u p ) 2
k =1
(4)
u12 + u 22 + ... + u 2p = 1.
Versorul u * = (u1* ,.u 2* ,.., u *p ) T , soluie a problemei (4), pentru care
se obine maximul expresiei informaiei totale, va fi notat
f 1 = ( f11 , f 21 ,..., f p1 ) T . El poart numele de prima ax factorial.
Se observ c numerele c k* ce determin proieciilor celor n puncte
(indivizi) pe aceast prim ax factorial se obin prin nmulirea
matriceal X f 1 R n . S notm cu C1 acest vector. El se numete prima
component factorial sau prima variabil factorial. Prin urmare, n loc
s analizm p variabile asupra celor n indivizi, putem analiza doar o singur
variabil nou, dat de vectorul C1 obinut prin formula
C1 = X f 1
(5)
Pk Pk '
(6)
u u = 1.
(7)
L(u, ) = u T R u + (1 u T u ).
L
= 0 rezult c vectorul u i
u
multiplicatorul trebuie s fie soluii ale sistemului de ecuaii
R u = u
(8)
uT R u = uT u
i, cum vectorul u verific condiia u T u = 1 (este de norm 1), rezult c
uT R u =
(9)
max I u =
(x
k1 u1
+ ... + x kp u p ) 2
k =1
u u =1
(10)
1 T
( f ) u = 0
este
ortogonal pe f 1 .
n ceea ce privete coordonatele celor n indivizi pe aceast nou ax,
grupate n vectorul C 2 R n , vor fi obinute la fel ca i n cazul primei axe,
adic printr-un produs matriceal:
C2 = X f 2
(11)
C = X F
(12)
Pasul 6. Dup parcurgerea pasului 5 pentru toate cele q (< p) axe factoriale,
cantitatea total de informaie din norul de puncte recuperat de
f 1 , f 2 , ..., f q este
subspaiul factorial descris de axele
1 + 2 + .. + q .
Un mod practic de apreciere a calitii ajustrii norului de puncte
prin acest subspaiu este calculul raportului
q =
1 + 2 + .. + q
1 + 2 + .. + p
100 .
(13)
j =1
1 1
1
ponderile folosite fiind , .,.., . Am grei ns din nou acordnd
p
p p
aceleai ponderi tuturor variabilelor, nediscriminndu-le n nici un fel.
Soluia cea mai rezonabil ar fi s considerm o combinaie liniar a
p
x
j
, unde
j =1
2
j
= 1,
j =1
(14)
T = 1.
y = 1T ( x )
(15)
Y = T ( x )
(16)
Pre
10970
12000
12115
12400
12981
13050
13050
13260
13275
13475
13806
14000
14156
DaihatsuCharadeTS
SuzukiSwiftGL
Peugeot205GL
ToyotaStarlettXL
Renault5GTS
FiatUno70SL
Volkswagen Polo
Peugeot205GT
SEATIbizaGLX
FordFiestaXR-2
FiatUnoTurboTE
Peugeot205GTI
Renault5GTTurbo
Pre
14625
14655
15780
16850
17250
17845
18045
18965
19283
21743
25005
25175
25319
FiatUnoTur boTE
200
180
Renault5GTTur bo
P eugeot205GTI
SEATIbizaGLX
Volks wagen P olo
ToyotaStar lettXL
P eugeot205GT
SuzukiSwif tGL
Renault5GTS FiatUno70SL
160
ToyotaStar lettL
SuzukiSwif tGA
140
P eugeot205GL
Renault5SL
P eugeot205XE
120
RenauIt4GTL
Renault4TL
100
10000
12000
14000
16000
18000
20000
22000
24000
26000
28000
P re t ( $ )
-1855.04
-1280.37
-676.63
-1190.93
4014.64
781.28
-1388.15
2537.94
-1676.16
-1382.78
-1296.92
-162.79
1286.63
Peugeot205GTI
Renault4TL
Renault4GTL
Renault5SL
Renault5GTS
Renault5GTTurbo
SEATIbizaGLX
SEATMarbella GL
SuzukiSwiftGA
SuzukiSwiftGL
ToyotaStarlettL
ToyotaStarlettXL
Volkswagen Polo
4081.72
-1438.69
-1065.26
-888.17
516.98
4155.06
1433.32
-2323.72
-1799.14
-647.12
-951.67
340.78
875.20
Peugeot205GTI
Renault4TL
Renault4GTL
FiatUno45Fire
FiatUnoTurboTE
FiatUno70SL
FordFiestaJunior
FordFiestaXR-2
Nissan Micra 1.0 DX
Opel Corsa Swing
Peugeot205XE
Peugeot205GL
Peugeot205GT
-0.6249
2.1009
0.4082
-0.7254
1.3297
-0.8791
-0.7254
-0.6757
-0.0800
0.6730
-0.4338
1.9988
0.4508
-0.7876
1.1142
-0.6549
-0.5222
-0.9203
-0.5665
0.6719
Renault5SL
Renault5GTS
Renault5GTTurbo
SEATIbizaGLX
SEATMarbella GL
SuzukiSwiftGA
SuzukiSwiftGL
ToyotaStarlettL
ToyotaStarlettXL
Volkswagen Polo
-0.4639
0.2675
2.1751
0.7481
-1.2171
-0.9464
-0.3460
-0.5008
0.1730
0.4555
-0.5222
0.5392
1.9988
0.8931
-1.0530
-0.4338
0.3623
-0.2126
0.6719
0.6719
-1.0212
-0.6886
-0.5459
-0.6675
2.7273
0.5857
-1.0289
1.5913
-0.9789
-0.7915
-1.1253
-0.5424
0.9020
Peugeot205GTI
Renault4TL
Renault4GTL
Renault5SL
Renault5GTS
Renault5GTTurbo
SEATIbizaGLX
SEATMarbella GL
SuzukiSwiftGA
SuzukiSwiftGL
ToyotaStarlettL
ToyotaStarlettXL
Volkswagen Polo
2.3496
-1.9064
-1.6214
-0.6745
0.6019
2.7605
1.1333
-1.4861
-0.8112
0.1693
-0.4141
0.6783
0.8046
-1.1516
-0.7820
-0.5564
-0.7486
2.8989
0.6074
-1.0699
1.7281
-1.0847
-0.8822
-1.1286
-0.4571
0.9510
Peugeot205GTI
Renault4TL
Renault4GTL
Renault5SL
Renault5GTS
Renault5GTTurbo
SEATIbizaGLX
SEATMarbella GL
SuzukiSwiftGA
SuzukiSwiftGL
ToyotaStarlettL
ToyotaStarlettXL
Volkswagen Polo
2.6146
-1.7694
-1.4751
-0.6973
0.5705
2.9514
1.1605
-1.6052
-0.9760
0.0116
-0.5045
0.5974
0.7972
Renault4TL
Renault4GTL
SEATMarbella GL
Peugeot205XE
FordFiestaJunior
Austin Metro Special
Nissan Micra 1.0 DX
SuzukiSwiftGA
Opel Corsa Swing
CitroenAX 10RE
Renault5SL
FiatUno45Fire
DaihatsuCharadeTS
-1.9065
-1.6214
-1.4861
-1.1253
-1.0289
-1.0212
-0.9789
-0.8112
-0.7915
-0.6886
-0.6746
-0.6675
-0.5459
Peugeot205GL
ToyotaStarlettL
SuzukiSwiftGL
FiatUno70SL
Renault5GTS
ToyotaStarlettXL
Volkswagen Polo
Peugeot205GT
SEATIbizaGLX
FordFiestaXR-2
Peugeot205GTI
FiatUnoTurboTE
Renault5GTTurbo
-0.5424
-0.4142
0.1694
0.5857
0.6020
0.6783
0.8047
0.9020
1.1334
1.5913
2.3497
2.7273
2.7605
(ranguri)
Pre
2
9
14
10
24
19
6
23
4
7
8
16
21
P, Vm
6
10
13
12
25
17
5
23
7
9
4
14
21
Peugeot205GTI
Renault4TL
RenauIt4GTL
Renault5SL
Renault5GTS
Renault5GTTurbo
SEATIbizaGLX
SEATMarbella GL
SuzukiSwiftGA
SuzukiSwiftGL
ToyotaStarlettL
ToyotaStarlettXL
Volkswagen Polo
Pre
25
5
11
13
18
26
22
1
3
15
12
17
20
P, Vm
24
1
2
11
18
26
22
3
8
16
15
19
20
(17)
putem scrie
x1 q11
x 2 q 21
... = ...
x p q p1
q12
q 22
...
q p2
... q1k f1 1
... q 2 k f 2 2
+
... ... ... ...
... q pk f k p
(18)
sau, matriceal
x = QF +
(19)
0 1
= (1 2 ) 1
0 0 2
(20)
Y2 2
( x ) ~ 0, 1
0
x = Y = 1Y1 +
0
, putem scrie c
0
(21)
(22)
(23)
xj =
jl f l
+U j + j
(24)
l =1
De aici obinem
k
Var ( x j ) =
q
l =1
k
Numrul
2
jl
2
jl
+ jj
(25)
l =1
= QQ T + .
(26)
% n industrie
% n agricultur
20
60
30
30
10
50
60
50
40
B
30
20
10
0
0
10
20
30
40
50
60
70
80
90
100
110
120
% in indus trie
1/ r
d ij =|| xi x j || r = | xik x jk | r
k =1
(27)
la individul 1). Pentru toi cei trei indivizi avem, utiliznd formula (27),
matricea distanelor date de norma L1:
D
(1)
0 1 10
= 1 0 9 .
10 9 0
D ( 2)
= 1
50
1
0
41
50
41
1
2
3
45
43
47
45
2
30000
35000
34000
33000
2645.75
Media
Ab. standard
1
2
3
1
0
5000
4000
2
5000
0
1000
3
4000
1000
0
Ele se ordoneaz astfel: d12 > d13 > d 23 indicnd faptul c cele mai
similare sunt autoturismele 2 i 3 i cele mai disimilare sunt autoturismele 1
i 2. Se observ faptul c distanele au fost calculate din datele originale, n
care pentru cele dou variabile s-au folosit uniti de msur foarte diferite
ca ordin de msur (litri de combustibil la 1000 km i preul n $). Evident,
distanele obinute sunt influenate de acest aspect. Pentru a elimina aceast
influen suntem condui spre ideea standardizrii datele. n procesul de
standardizare folosim mediile i abaterile standard. Prezentm n tabelul
urmtor datele corespunztoare n form standardizat.
Autoturismul
1
2
3
Media
Abaterea standard
0
-1
1
0
1
-1,134
0,756
0,378
0
1
1
0
2.137
1.812
1
2
3
2
2.137
0
2.035
3
1.812
2.035
0
A
B
C
D
Total minute
Minute reclam
TV
2
1
3
4
10
Radio
5
3
8
4
20
Total minute
7
4
11
8
30
xi j xi j
d 2 (i1 , i 2 ) =
bj 1 2
xi xi
2
1
j =1
p
unde b j =
x
.
x j
(28)
x j
.
calculate folosind o matrice a ponderilor, i anume A = diag
S revenim la exemplul repartizrii fondului de timp pentru reclam.
Folosind formula (28) putem calcula distanele dintre produse. Mai nti
vom transforma datele primare, construind o matrice de contingen folosind
frecvenele marginale pe linii. Noile date, exprimnd pe linii profilul
fiecrui individ (produs) sunt prezentate n tabelul urmtor.
Produsul
A
B
C
D
Ponderile
Frecvenele condiionate
TV
Radio
2/7
5/7
1/4
3/4
3/11
8/11
4/8
4/8
3
1.5
d 2 ( j1 , j 2 ) =
j =1
xi j1 xi j2
bi
x j
x j2
1
(29)
unde bi =
x
.
xi
B
A
O1
D
Distana
ntre centre
O2
Q
Pe baza acestei noi matrice se identific alte dou obiecte, cele mai
apropiate ntre ele, i cu acestea se va forma un nou grup. Iterativ, aceste
obiecte pot fi fie doi indivizi, fie un individ i un grup deja constituit, fie
dou grupuri deja constituie.
Descretem n0 (= n0 1) i repetm pasul 2 pn cnd toi indivizii
au fost grupai.
nQ
Algoritmul
nP
n P + nQ
nQ
n P + nQ
0
1
D= 1
0
41
50
aadar primul grup se
P + Q = {x1 , x 2 } .
50
41 ,
0
va constitui din indivizii P i Q, adic
0
iar noua matrice asociat va fi:
41
41
.
0
50
.
0
1
R