Documente Academic
Documente Profesional
Documente Cultură
Analiza În Componente Principale PDF
Analiza În Componente Principale PDF
ÎN
COMPONENTE PRINCIPALE
IIN
NTTR
ROOD
DUUC
CEER
REE
Studiem cu ajutorul acestei metode un tabel indivizi x variabile, în cazul
în care toate variabilele sunt numerice.
3UH]HQW P PDL vQWkL R DERUGDUH H[SORUDWRDUH FDUH SHUPLWH GHVFULHUHD
indivizilor în multiplele lor GLPHQVLXQL úL YL]XDOL]DUHD DFHVWRU UHOD LL vQWUH
variabile.
8UPHD] $QDOL]D vQ &RPSRQHQWH 3ULQFLSDOH $&3 $FHDVW PHWRG
DLQGLYL]LORUúLDYDULDELOHORU
tipologie a indivizilor.
3UH]HQW P GH DVHPHQL PHWRGD GH FODVLILFDUH DVFHQGHQW LHUDUKLF FDUH
IRORVHúWHFULWHULXOOXL:DUGIRDUWHELQHDGDSWDWODWUDWDUHDGDWHORUQXPHULFH
WDEHOXOXL UHSUH]LQW PRGHOH GH PDúLQL GLQ DQXO LDU FRORDQHOH
JUHXWDWHOXQJLPHO LPH
Tabelul 1
Nr. Crt. Model Cilindree Putere 9LWH] Greutate Lungime / LPH
Figura 1
Grafic în stea
9LWH] Putere
Greutate Cilindree
Lungime / LPH
GDF FDUDFWHULVWLFDHVWHPD[LP
&HLLQGLYL]LVXQWUHSUH]HQWD LvQILJXUD
6 SXQFW PFkWHYDFD]XULSDUWLFXODUH
3HXJHRW 5DOO\H 6HDW ,EL]D 6;L úL &LWURsQ$; 6SRUW DX YLWH]H
5HQDXOWDUHRSXWHUHPLF vQUDSRUWFXFLOLQGUHHDVD$FHVWDHVWH
un diesel.
ÌQJHQHUDOPXO LPHDFDUDFWHULVWLFLORUHYROXHD] vQDFHODúLVHQV
*UDILFHOHvQVWHDFUHVFUHJXODWGHOD PDúLQLOHPLFLSUHFXP)RUG)LHVWDúL
)LDW8QRODFHOHPDLPDULSUHFXP%09,5RYHULúL5HQDXOW
Studiul descriptiv al variabilelor
Tabelul 2
Rezumate statistice ale datelor
Statistici elementare
Abaterea
Variabila Media Dispersia medie Minim Maxim
S WUDWLF
&RUHOD LL
VWDWLVWLF
6WDWLVWLFD LQIHUHQ LDO VWXGLD] XQ HúDQWLRQ úL WUDJH FRQFOX]LL SHQWU u
vQWUHDJDPXO LPH
3HQWUX D DYHD R YL]LXQH FRPSOHW D GDWHORU úL D LQWHU UHOD LLORU vQWUH
-
variabile, am construit graficul din figura 3.
Figura 3
*UDILFXOFRUHOD LLORULQWHU -variabile
H[LVW XQ IDFWRU P ULPH WDOLH úL F OD R SULP DQDOL] PDúLQLOH SRW IL
RUGRQDWH GH OD FHOH PDL PLFL OD FHOH PDL PDUL $FHDVWD VH YHGH GH DOWIHO úL
GLQWUH3XWHUHúL9LWH]
3XWHP V UH]XP P úL V YL]XDOL] P DFHDVW SULP DQDOL] SULQWU -o
FODVLILFDUH LHUDUKLF DVFHQGHQW D YDULDELOHORU OXkQG GUHSW LQGLFH GH
ÌQ SULPD HWDS VH UHJUXSHD] FHOH GRX YDULDELOH FHOH PDL FRUHODWH
*UHXWDWHúL/XQJLPH
0.894.
ÌQDSDWUDHWDS / LPHDvQWkOQHúWHJUXSXO&LOLQGUHH*UHXWDWH/XQJLPH
ùL vQ VIkUúLW vQ D FLQFHD HWDS FHOH GRX JUXSXUL 3XWHUH 9LWH] úL
Indicele de agregare calculat este cHD PDL SXWHUQLF FRUHOD LH vQWUH
YDULDELOHOHXQXLJUXSúLFHOHDOHFHOXLODOWJUXSvQPRPHQWXOUHJUXS ULL
Figura 4
&ODVLILFDUHDLHUDUKLF DVFHQGHQW DYDULDELOHORU
0HWRGDFRUHOD LLORUPD[LPH
1 4.29
(1 + 0.8612 + 0.6932 + 0.905 2 + 0.864 2 + 0.709 2 ) = = 0.715
6 6
7DEHOXO FRQ LQH VLPLODULWDWHD ILHF UHL YDULDELOH FX vQWUHDJD PXO LPH D
variabilelor:
Tabelul 3
dispersiei.
$QDOL]D vQ &RPSRQHQWH 3ULQFLSDOH FRQVW vQ F XWDUHD XQXL QXP U PLF GH
variabile noi Y1 ,......,Ym numite componente principale QHFRUHODWH vQWUH HOH úL
DPHWRGHLúLDUH]XOWDWHORULQWHUPHGLDUHFDUHDMXW ODLQWHUSUHWDUHDHL
FRUHVSXQGDFHVWHLDERUG UL
&ULWHULXO LQHU LHL HVWH vQ DFHODúL WLPS PXOW PDL FRPSOH[ GHFkW FHOHODOWH
GRX FULWHULL SURSXVH GH +RWHOOLQJ FULWHULXO FRUHOD LHL úL FULWHULXO
dispersiei.
Vom prezenta de asemeni aceste criterii, ele corespunzând rezultatelor
RE LQXWHFXSURJUDPHOHDPHULFDQH$&3
3UH]HQWDUHD$&3FRQIRUPDERUG ULLJHRPHWULFHDOXL3HDUVRQ
1RUXOGHSXQFWHDVRFLDWGDWHORUúLFDUDFWHULVWLFLO e sale
ÌQ DFHDVW DERUGDUH JHRPHWULF VH DVRFLD] GDWHORU QRUXO GH SXQFWH
N = {x1 ,...., xi ,.., xn } într-XQ VSD LX GH GLPHQVLXQH S ILHFDUH YHFWRU xi de
caracteristici ( xi1 ,.....xip ) ale individului i este considerat drept un punct într-un
VSD LXFXSGLPHQVLXQL
&HQWUXOGHJUHXWDWHDOQRUXOXL1HVWHSXQFWXOJDOHF UXLFRRUGRQDWHVXQW
ÌPSU úWLHUHD QRUXOXL vQ MXUXO FHQWUXOXL V X GH JUHXWDWH VH P VRDU FX
1 n p
DMXWRUXOLQHU LHLWRWDOHDQRUXOXL1GHILQLW SULQ I (N , g) = ∑∑ ( xij − x j ) 2 .
n i =1 j =1
,QHU LD WRWDO SRDWH IL FDOFXODW GLUHFW ILLQG HJDO FX VXPD GLVSHUVLLO or
YDULDELOHORUGLQSUREOHP
1 n 2 1 n p
I (N , g) = ∑ i
n i =1
d ( x , g ) = ∑∑ ( xij − x j ) 2 =
n i =1 j =1
p p
1 n
=∑ ∑ ( xij − x j ) 2
= ∑ s 2j
j =1 n i =1 j =1
2E LQHPSHQWUXH[HPSOX
I(N,g)=267072+1441+609+50824+1638+56=321640.
6HREVHUY F LQHU LDQRUXOXLVHGDWRUHD] vQSULQFLSDOFLOLQGUHHL
$FHDVWD GLQ FDX]D DOHJHULL XQLW LORU GH P VXU 'DF DP IL P V urat
FLOLQGUHHD vQ OLWUL LPSRUWDQ D H[DJHUDW D FLOLQGUHHL vQ FDOFXOXO LQHU LHL DU IL
GLVS UXW
FHQWUDWH UHGXVH ILHF UHL YDULDELOH X j L VH DVRFLD] YDULDELOD FHQWUDW UHGXV
X j − xj
X *j = GHPHGLHúLGLVSHUVLH
sj
1RXOWDEHOVWXGLDWHVWHIRUPDWGLQFDQWLW LOH
xij − x j
xij* = .
sj
La individXOLVHDVRFLD] DFXPSXQFWXO xi* = ( xi*1 ,...., xip* ).
Noul nor de puncte este N * = {x1* ,...., xn* } .
Centrul de greutate al norului N * HVWH úL LQHU LD VD WRWDO HVWH HJDO FX
QXP UXOSDOYDULDELOHORU
9RP VWXGLD FRQVWUXF LD úL SURSULHW LOH SULPHL FRPSRQHQWH SULQFLSDOH
norului de puncte N * .
3ULPDD[ SULQFLSDO
& XW P V IDFHP FD R GUHDSW ∆1 V WUHDF FkW PDL ELQH SRVLELO SULQ
*
mijlocul norului de puncte N .
6H P VRDU vPSU úWLHUHD QRUXOXL N * în jurul unei drepte ∆ cu ajutorul
LQHU LHL I ( N * , ∆) norului N * UDSRUWDW ODGUHDSWD ∆ .
1 n
I ( N * , ∆) = ∑ d 2 ( xi* , yi ) unde yi HVWH SURLHF LD RUWRJRQDO P∆ ( xi* ) a
n i =1
punctului xi pe dreapta ∆ .
*
a norului N * .
6H SRDWH DU WD F GUHDSWD ∆1 trece prin originea O, centrul de greutate al
norului N al datelor centrate-UHGXVH úL HVWH JHQHUDW
*
GH YHFWRUXO XQLWDU u1 ,
YHFWRUSURSULXQRUPDWDOPDWULFHL5DFRUHOD LLORUvQWUHYDULDELOHOH X j , asociat
la cea mai mare valoare proprie λ 1 .
9DORULOHSURSULLúLYHFWRULLSURSULLDLPDWULFHL5VXQWFXSULQúLvQWDEHOXO
Tabelul 4
9DORULúLYHFWRULSURSULLDLPDWULFHLGHFRUHOD LL
Figura 5
& XWDUHDSULPHLD[HSULQFLSDOH
3HQWUXH[HPSOXOFXPDúLQLOHDPRE LQXW
λ1 = 4.6745
u1 = (0.4434;0.4182;0.3497;0.4252;0.4246;0.3811).
3ULPDFRPSRQHQW SULQFLSDO
ILHFDUH LQGLYLG L SULQ OXQJLPHD DOJHEULF D SURLHF LHL SXQFWXOXL xi* pe axa
∆1 .Valoarea lui Y1 (i ) este deci egaO FXSURGXVXOVFDODUvQWUHYHFWRULL u1 úL xi* :
p x ij − x j
Y1 (i ) = Oy i = ∑ u1 j ( )
j =1 sj
Astfel, valoarea primei componente principale Y1 SHQWUX5RYHUHVWHHJDO FX
Y1 (Rover)=0.44*1.49+0.41*1.67+0.34*1.58+0.43*1.13+0.43*1.17+0.38*0.83=3.19
Global, Y1 se scrie deci:
Y1 = 0.44Cilindree* + 0.41Putere * + 0.34Viteza * +
+ 0.43Greutate* + 0.43Lungime* + 0.38Latime* .
Valorile lui Y1 pentru fiecare individ sunt cuprinse în tabelul 5.
Tabelul 5
3 WUDWHOHGLVWDQ HORUSkQ ODRULJLne, componentele principale
úLS WUDWHOHFRVLQXVXULORU
3ULPD FRPSRQHQW SULQFLSDO Y1 HVWH FHQWUDW ILLQG FRPELQD LH OLQLDU GH
variabile centrate.
6HSRDWHDU WDF GLVSHUVLDVDHVWHHJDO FX λ1 :
n n
1 1
Dispersie (Y1 ) =∑
n i =1
Y12 (i ) = ∑ d 2 ( y i ,0) = I ({ y1 ,...., y n },0) = λ1 .
n i =1
Dispersia primei componente principale Y1 HVWH HJDO FX LQHU LD QRUXOXL
6H GHGXFH F DVLPLODULWDWHD OXL Y1 ID GH PXO LPHD GH YDULDELOH HVWH
HJDO FX
1 p λ
∑
p j =1
cor 2 ( X j , Y1 ) = 1
p
4.656
Pentru exempluO QRVWUX RE LQHP = 0.776 comparabil cu 0.715 al
6
cilindreei din tabelul 3.
&RUHOD LLOHvQWUH X j úL Y1 DSDUvQSULPDFRORDQ DWDEHOXOXL
Tabelul 6.
&RUHOD LLYDULDELOH -componente principale
YDULDELOHOH HD SRDWH IL LQWHUSUHWDW FD XQ IDFWRU GH P ULPH FODVkQG PDúLQLOH
de la cele mai mici ( Y1 (Fiat Uno)= -3.76; Y1 (Ford Fiesta)= - 3.50) la cele mai
mari ( Y1 (Renault 25)=3.44; Y1 (BMV530i)=3.95).
&DOLWDWHDJOREDO DSULPHLFRPSRQHQWHSULQFLSDOH
FRQVLGHUDW FD UH]XPDW DO GDWHORU VH IRORVHúWH IRUPXOD GH GHVFRPSXQHUH D
LQHU LHLWRWDOH
,QHU LDWRWDO
1 n 2 *
I ( N * ,0) = ∑ d ( xi ,0) = p
n i =1
VHGHVFRPSXQHGHFLvQGRX S U L
1 n 2
- primul termen ∑ d ( yi ,0) = I ({ y1 ,...., yn },0) UHSUH]LQW LQHU LD WRWDO D
n i =1
norului { y1 ,...., yn } D SURLHF LLORU SXQFWHORU xi* pe axa ∆1 $FHDVW
FDQWLWDWHUHSUH]LQW LQHU LDH[SOLFDW GHD[D ∆1 úLHVWHHJDO FX λ1
n
1
- al doilea termen ∑
n i =1
d 2 ( xi* , yi ) = I ( N * , ∆1 ) UHSUH]LQW LQHU LD UH]LGXDO
λ1
de iner LH H[SOLFDW 6H UHJ VHúWH DSURSULHUHD FRPSRQHQWHL SULQFLSDOH Y1
p
ID GHPXO LPHDGHYDULDELOH
4.656
ÌQH[HPSOXSDUWHDGHLQHU LHH[SOLFDW GH ∆1 HVWHHJDO FX = 0.776. Se
6
poate sSXQH F GLQ LQHU LD WRWDO HVWH H[SOLFDW SULQ DOXQJLUHD QRUXOXL
d 2 ( yi ,0) Y1 (i ) 2
cos 2 ( xi* , ∆1 ) = = .
d 2 ( xi* ,0) d 2 ( xi* ,0)
$GRXDD[ SULQFLSDO
vectorul u2 YHFWRU SURSULX QRUPDW GLQ PDWULFHD GH FRUHOD LL 5 DVRFLDW OD D
doua cea mai mare valoare proprie λ2 .
Valoarea proprie λ2 úL YHFWRUXO SURSULX u2 SHQWUX H[HPSOXO FX PDúLQLOH
se DIO vQ 7DEHOXO & XWDUHD FHOHL GH-a doua axe principale ∆ 2 este
YL]XDOL]DW vQ)LJXUD
Figura 6
& XWDUHDFHOHLGH -a doua axe principale
6 QRW P FX zi úL ai SURLHF LLOH SXQFWXOXL xi* pe axa ∆ 2 úL SH SODQXO
( ∆1 , ∆ 2 ) respectiv. Vectorii yi úL zi VXQWGHDVHPHQLSURLHF LLOHSXQFWHORU ai pe
axele ∆1 úL ∆ 2 .
Din descompunerea:
d 2 ( xi* ,0) = d 2 (ai ,0) + d 2 ( xi* , ai ) =
deducem:
= d 2 ( yi ,0) + d 2 ( zi ,0) + d 2 ( xi* , ai )
posibile.
Planul (∆1 , ∆ 2 ) VH QXPHúWH SULPXO SODQ SULQFLSDO (VWH SODQXO FDUH WUHFH
cel mai bine posibil prin mijlocul norului N * vQVHQVXOFULWHULXOXLLQHU LHL
$GRXDFRPSRQHQW SULQFLSDO
cor ( X J , Y2 ) = λ2 u 2 j
&RUHOD LLOH GLQWUH YDULDELOHOH úL FRPSRQHQWD SULQFLSDO Y2 din exemplul
nostru sunt datH vQ 7DEHOXO 3XWHP REVHUYD F Y2 HVWH FRUHODW SR]LWLY FX
&DOLWDWHDJOREDO -
DFHOHLGH DGRXDFRPSRQHQW SULQFLSDO úLDSULPHORU
GRX FRPSRQHQWHSULQFLSDOH
'LQ HFXD LLOH úL VH GHGXFH F SDUWHD GH LQHU LH H[SOLFDW GH D GRX a
D[ SULQFLSDO HVWH HJDO FX
λ2 LDU DFHHD H[SOLFDW GH SODQXO (∆1 , ∆ 2 ) este
p
(λ1 + λ2 )
HJDO FX .
p
În exemplu, ∆ 2 H[SOLF GLQ LQHU LD WRWDO LDU (∆1 , ∆ 2 )
H[SOLF GLQLQHU LDWRWDO
plan principal
&DOLWDWHDUHSUH]HQW ULLILHF UXLSXQFW xi* pe axa ∆ 2 úLSHSODQXO (∆1 , ∆ 2 ) se
P VRDU FX DMXWRUXO S WUDWHORU FRVLQXVXULORU XQJKLXULORU IRUPDWH GH YHFWRUXO
FRQ LQXWvQSULPXOSODQSULQFLSDO
Rezultate generale
Extinzând UH]XOWDWHOH SUH]HQWDWH vQ VHF LXQLOH SUHFHGHQWH VH RE LQ R
Figura 7
Axele principale. Componentele principale
p
Componentele principale Y1 ,......,Y p sunt definite prin Yh (i ) = ∑ u hj xij* .
j =1
Formulele carH XUPHD] VXQW IRDUWH LPSRUWDQWH úL VH GHGXF GLUHFW GLQ
procesul de construire al componentelor principale:
Formula de reconstituire a datelor:
p
xij* = ∑Yh (i )u hj (3)
h =1
)RUPXODGHUHFRQVWLWXLUHDPDWULFHLFRUHOD LLORUGLQWUHYDULDELOH :
p
cor ( X j , X l ) = ∑ λhuhj uhl (4)
h =1
de unde se deduce:
p
(i) ∑ cos ( x , ∆
h =1
2 *
i h ) =1
p
(ii) ∑λh =1
h =p
H[SOLFDW GHD[DSULQFLSDO ∆h .
'LVWDQ DOXL0DKDODQRELV
(D VH GHILQHúWH vQ IHOXO XUP WRU VH FRQVWUXLHVF PDL vQWkL FRPSRQHQWHOH
5HSUH]HQW ULJUDILFH
(VWHYRUEDGHUHSUH]HQW ULJUDILFHDOHLQGLYL]LORUúLYDULDELOHORU
Harta indivizilor
3URLHF LLOH SXQFWHORU xi* pe primul plan principal (∆1 , ∆ 2 ) au drept
coordonate pe axele principale ∆1 , ∆ 2 valorile Y1 (i ) úL Y2 (i ) .
5HSUH]HQWDUHDJUDILF D SXQFWHORU Ai = (Y1 (i ), Y2 (i )) QH G DVWIHO FHO PDL EXQ
în Figura 8.
6H YHULILF LQWHUSUHWDUHD D[HORU SUH]HQWDW DQWHULRU PDúLQLOH DSDU GH -a
OXQJXO SULPHL D[H vQ IXQF LH GH PRGHOXO ORU GH OD FHOH PDL PLFL )LDW 8QR
Figura 8
3ULPXOSODQSULQFLSDOúLFHUFXOFRUHOD LLORU
Harta variabilelor
Variabilele sunt reprezentate într-un plan cu ajutorul punctelor:
B j = ( cor ( X j , Y1 ), cor ( X j ,Y2 )) Se RE LQH UHSUH]HQWDUHD JUDILF GLQ )LJXUD
QXPLW ÄFHUFXOGHFRUHOD LL´
Variabile Rj
Cilindree 0.96
Putere 0.98
9LWH] 0.97
Greutate 0.92
Lungime 0.97
/ LPH 0.93
7RDWHYDULDELOHOHVXQWELQHUHSUH]HQWDWHSHFHUFXOGHFRUHOD LL
3DUWHD GH LQHU LH H[SOLFDW GH SULPXO SODQ SULQFLSDO ILLQG IRDUWH PDUH
$VWIHO FRUHOD LD vQWUH YDULDELOHOH X j úL X l SRDWH IL DSUR[LPDW SULQ
FRVLQXVXULORUXQJKLXULORUGLQWUHDFHúWLYHFWRUL
6H SRDWH YHULILFD GH H[HPSOX F GHQGRJUDPD GLQ )LJXUD H[SULP ELQH
Biplotul
Luându-QH FkWHYD SUHFDX LXQL vQ FHHD FH SULYHúWH VFDUD GH UHSUH]HQWDUH
HVWH SRVLELO V VXSUDSXQHP FHOH GRX JUDILFH SULPXO SODQ SULQFLSDO úL FHUFXO
3UHVXSXQHP PDL vQWkL F SDUWHD HVHQ LDO GLQ LQHU LD WRWDO HVWH H[SOLFDW
YRU XUPD OD SXQFWH ELQH UHSUH]HQWDWH SH SULPXO SODQ SULQFLSDO úL OD YDULDELOH
IRDUWHSXWHUQLFFRUHODWHFXSULPHOHGRX FRPSRQHQWHSULQFLSDOH
ij XWLOL]kQGGRDUSULPHOHGRX GLPHQVLXQL
*
x
2 Yh
xij* = ∑ Yh (i )u hj Notând Yh =
*
FRPSRQHQWD SULQFLSDO Yh UHGXV úL
h =1 λh
utilizând faptulF
2
xij* = ∑Yh* (i )cor ( X j , Yh ) (6).
h =1
2675 − 1906.1
Exemplu Avem x(*Rover ,Cilindree ) = = 1.49 bine reconstituit prin
516.79
Y1* ( Rover )cor (Cilindree, Y1 ) + Y2* ( Rover ) ⋅ cor (Cilindree, Y2 ) =
1 1
= 3.19 × 0.96 + 0.77 × 0.03 = 1.44.
4.656 0.9152
2
1
OPij = ∑Y (i)cor(X ,Y )
h
*
j h
cor ( X j ,Y1 ) + cor ( X j ,Y2 ) h=1
2 2
Figura 9
3XQFWHLQGLYL]LúLD[HYDULDELOH
axa ∆( B j ) UHIOHFW GHFL ELQH UHSDUWL LD YDORULORU xij* ale variabilei X *j úL vQ
FRQVHFLQ úLDFHHDDYDORULORU xij ale variabilei de origine X j .
ÌQ)LJXUDDPFRQVWUXLWELSORWXOUHSUH]HQWDUHDVLPXOWDQ DLQGLYL]LORUúL
DYDULDELOHORUvQIHOXOXUP WRU
$VWIHO VH SRDWH YHULILFD IDSWXO F SURLHF LD PDúLQLORU SH D[D 9LWH]
(BMW 530i, Renault 25, Audi 90 Quatro) se opun bine la cele mai lente (Ford
Fiesta, Nissan Vanette, Fiat Uno, VW Caravelle).
'H DVHPHQHD SURLHF LLOH PDúLQLORU SH D[D / LPH RSXQ ELQH PDúLQD FHD
componentelor principaOHGDUVHSLHUGHvQDFHVWFD]GLPHQVLXQHDJHRPHWULF
a problemei.
9RPSUH]HQWDFULWHULXOFRUHOD LHLDSRLDOGLVSHUVLHL
&ULWHULXOFRUHOD LHL
maximizeze criteriul :
m p
1
∑[ p ∑ cor
h =1 j =1
2
( X j , Fh )] (7)
&X DOWH FXYLQWH VH FDXW UH]XPDUHD YDULDELOHORU GH RULJLQH X 1 ,....., X p
printr-XQ QXP U PDL PLF GH YDULDELOH F1,....., Fm QHFRUHODWH vQWUH HOH úL FDUH V
Yh
Fh = Yh* = ,care sunt tocmai componentele principale reduse. Valoarea
λh
PD[LPXOXLHVWHHJDO FX (λ1 + .... + λm ) / p .
Criteriul dispersiei
p
6H FDXW P YDULDELOH Z1,....., Z m de forma Z h = ∑ v hj X j cu vectorii
j =1
∑ Dispersie( Z
h =1
h ) (8)
úLRE LQHP
m
∑ Dispersie(Z
h =1
h ) = λ1 + ....... + λm .
Ward
$FHDVW PHWRG FRQGXFH OD XQ DOW SURFHGHX GH D UH]XPD GDWHOH
FDUH DSDU LQ DFHOHLDúL FODVH V ILH DVHP Q WR ri (similari) în timp ce indivizii
FDUHDSDU LQODFODVHGLIHULWHV ILHGHRVHEL LGHS UWD LGLVLPLODUL
$FHVW WHUPHQ VH QRWHD] FX , G1 ,....., Gk úL UHSUH]LQW LQHU LD H[SOLFDW GH
tipologie.
Al doilea termHQ GLQ GUHDSWD VH QXPHúWH LQHU LD LQWUD-FODVH úL P VRDU
omogenitatea claselor.
&DOLWDWHD WLSRORJLHL VH P VRDU FX DMXWRUXO UDSRUWXOXL GLQWUH LQHU LD LQWHU -
FODVHúLLQHU LDWRWDO
ni n j
D (Gi , G j ) = d 2 ( gi , g j )
n(ni + n j )
$FHVW FULWHULX XWLOL]DW SHQWUX P VXUDUHD GLVWDQ HL vQWUH GRX FODVH Gi úL
G j VHQXPHúWHFULWHULXOGHDJUHJDUHDOOXL:DUG
Exemplu:
G1 = {xCitroenBX
*
}
6 OX P . Avem
G2 = {x*Peugeot 405 }
d 2 ( x CitroenBX 405 ) =
* *
, x Peugeot
(1769 − 1769) 2 (90 − 90) 2 (182 − 180) 2
= + + +
267072 1442 609
(1060 − 1080) 2 (424 − 440) 2 (168 − 169) 2
+ + + = 0.189
50824 1638 56
1× 1
D 2 ( xCitroenBX
*
, x*Peugeot 405 ) = × 0.189 = 0.00393
24 × (1 + 1)
&ODVLILFDUHDLHUDUKLF DVFHQGHQW
HJDO FX LQHU LD WRWDO /D ILHFDUH HWDS VH FDOFXOHD] XQ LQGLFH RE LQXW SULQ
a indicelui
$SOLFD LH
GHQGRJUDP OD QLYHOXO OXL &LWURHQ %; DGLF D HOHPHQWXOXL FDUH SUHFHGH SH
DOF UHLLQGLFHGHDJUHJDUH D ( x2* , ( x4* , x6* ) / 6 este egal cu 0.19%.
$OJRULWPXO XUPHD] DFHODúL SURFHGHX SkQ OD XOWLPD HWDS FkQG VH
GLQUHVWXOHúDQWLRQXOXL
I(43,46)=D(43,46)=3.07202
Întrucât iQHU LD H[SOLFDW , SULQ FODVD IRUPDW GLQ DQVDPEOXO GH
REVHUYD LL HVWH QXO ÌQ FRQVHFLQ LQHU LD H[SOLFDW GH WLSRORJLD IRUPDW GLQ
GRX FODVH úL HVWH HJDO FX úL SDUWHD GH LQHU LH H[SOLFDW HVWH
&RQWLQX PVSUHvQFHSXWXODOJRULWPXOXL
Clasa 45 provine din reuniunea claselor:
ù(VSDFH2PHJD9:&DUDYHOOH`úL
ù7LSR55`
IRUPDW GLQ FODVH OD WLSRORJLD IRUPDW GLQ FODVH
DGRSW PWLSRORJLDGDWHORUGLQFODVH
Tabelul 7
&ODVLILFDUHDLHUDUKLF DVFHQGHQW
Figura 11
Dendograma
Figura 12
Vizualizarea tipologiei din 3 clase
reprezentat-RSHSODQXOSULQFLSDOGLQ)LJXUDúLDPFRQVWUXLW7DEHOXOXQGH
YDULDELOHOH VXQW DUDQMDWH vQ RUGLQHD GHVFUHVF WRare a testului Fisher între
YDULDELOHúLWLSRORJLH
&ODVDPDúLQLORUPLFLFRUHVSXQGHFODVHL
Honda Civic, Seat Ibiza Sxi, Citroen AX Sport, Peugeot 205 Rallye,
Peugeot 205, Fiat Uno, Ford Fiesta.
&ODVDPDúLQLORUPHGLLFRUHVSXQGHFODVHL
Fiat Tipo, Renault 19,Citroen BX, Peugeot 405, Renault 21, Espace, Opel
Omega, Ford Sierra, Peugeot 405 Break, Nissan Vanette, VW Caravelle.
&ODVDPDúLQLORUPDULFRUHVSXQGHFODVHL
&RPSRQHQWH 3ULQFLSDOH DWkW OD QLYHO WHRUHWLF FkW úL SUDFWLF UHFRPDQG P
0RULQHDX úL )pQpORQ /HEDUW 0RULQHDX úL 7DEDQ d (1977), Saporta
6DSRUWDùWHI QHVFX
ÌQ FHHD FH SULYHúWH PHWRGHOH GH RE LQHUH D WLSRORJLLORU UHFRPDQG P vQ
special:
(YHULWW úL SURFHGXULOH $&(&/86&/867(5)$67&/86 GLQ
programul SAS.
B
BIIB
BLLIIO
OGGR
RAAF
FIIE
E
Michel Tenenhaus - Methodes Statistiques en Gestion. Editura Dunod
1994, Paris.
Gilbert Saporta, - $QDOL]D GDWHORU úL ,QIRUPDWLF (GLWXUD (FRQRPLF
9LRULFDùWHI QHVFX 1996.