Documente Academic
Documente Profesional
Documente Cultură
3. Analiza Cluster......................................................................................pag. 17
4. Bibliografie........................................................................................... pag. 32
5. Anexe................................................................................................................
1. PREZENTAREA DATELOR
2
RASDAQ, pentru care au fost selectaţi 6 indicatori din situaţiile finanicar-contabile disponibile
pentru anul 2004.
Astfel pentru colectarea şi prezentarea datelor sub forma unui tabel s-a procedat astfel:
1. http://www.rasd.ro/ - apoi din meniul din stânga se alege Societăţi listate → Alte informaţi →
Căutare după CAEN, după care se alege Diviziunea: D → Produse ale industrie
prelucrătoare; Secţiunea: 36 → Producţia de mobilier şi alte activităţi industriale n.c.a;
Grupa: 361 → Producţia de mobilier; Clasa: 3614 → Producţia altor tipuri de mobilier; şi
apoi se face o sortare după Stare, alegându-se acele firme tranzacţionabile.
2. Pentru fiecare firmă despre care se doreşte să se afle informaţii financiar-contabile, se dă click
pe Simbolul acesteia, după care de la Infornaţii Financiare găsim rubrica Raportări
financiare şi se va selecta de aici indictori necesari efectuării analizei.
3
3. După care am sintetizat informaţii despre cele 25 de firme şi cei 6 indicatori financiar contabili
pentru anul 2004, în tabelul următor:
TABELUL NR. 1
Unde cei 6 indicatori financiar-contabili sunt:
4
a) CA – Cifra de afaceri (exprimată în milioane lei) reprezintă volumul tuturor încasărilor de pe
urma rezultatelor obţinute în activitatea de exploatare a întreprinderii şi este unul dintre cei
mai reprezentativi indicatori ai volumului de activitate al unei întreprinderi.
b) VT – Veniturile totale(exprimate în milioane lei) reprezintă totalitate avantajelor obţinute de
către întreprindere din desfăşurarea celor 3 activităţii: de exploatare, financiară, şi
excepţională.
c) VE – Veniturile din activitatea de exploatare(exprimate în milioane lei) reprezintă acele
avantaje dobândite de către întreprinderi numai pe seamă desfăşurării activităţii de exploatere.
d) SAL – Numărul mediu anual de salariaţi (exprimat în număr salariaţi/anual)
e) AI – Activele imobilizate (exprimate în milioane lei) reprezintă bunuri şi valori destinate a
servi o perioadă îndelungată în activitatea unităţilor patrimoniale (de regulă mai mare de un
an), deci care nu se consumă la prima lor utilizare, valoarea lor recuperându-se treptat prin
includerea în cheltuielile mai multor exerciţii financiare în funcţie de durata de folosire.
f) AC – Activele circulante (exprimate în milioane lei) reprezintă aceea parte din capitalul tehnic
care se consumă în fiecare ciclul de exploatare (de producţie), participând cu întrega lui
expresie banească la formarea costurilor şi se înlocuieşte după fiecare consumare, o dată cu
reluarea unui nou ciclu de exploatare.
După ce au fost trecute în revistă toate aceste lucruri, vom trece la analiza matricei de date
prezentată în tabelul de mai sus, cu scopul de a identifica câţiva „indicatori relevanţi” (de regulă doi
sau trei), pe baza cărora să putem obţine o clasificare cât mai precisă a firmelor; astfel problema
formulată în acest mod ne conduce spre ideea utilizării tehnicii analizei componentelor principale,
dublată şi de o analiză a clasificării.
Scopul acestei analize fiind ca pentru matricea noastră de date să identifice noi variabile ce să
exprime sintetic vechile variabile astfel încât cantitatea totală de informaţie să nu se piardă decât în
mod contralat.
Astfel, după încarcarea matricei de date în SPSS, vom începe analiza prin a remarca faptul că
toate caracteristicile urmărite, anume indicatorii financiar contabili sunt variabile continue, scara lor
de măsură fiind uşor de identificat. Prin urmare pentru fiecare variabilă în parte, pentru început, vom
calcula indicatorii de centrare şi de împrăştiere cum ar fi media, valoarea minimă, valoarea maximă,
precum şi abaterea standard.
Pentru aceasta în SPSS, alegem Analyse → Descriptive Statistics → Descriptives..., după care
alegem toţii indicatorii, iar la Options... bifăm căsuţa pentru Mean, Std. Deviation, Minimum,
Maximum şi apoi dăm Continue şi apoi OK.
5
Şi astfel obţinem următorul tabel:
TABELUL NR. 2
Descriptive Statistics
După cum putem observa elementele matricei de date iniţiale ar necesita şi o standardizare,
deoarece abaterile standar ale celor 6 indicatori sunt destul de diferite, fapt pentru care am bifat în
căsuţa de dialog Descriptives → Save standardized values as variables, şi astfel la matricea de date
iniţiale se vor adăuga şi cei 6 indicatori standardizaţi (adică de medie 0 şi dispersie 1), prezentaţi în
următorul tabel:
6
TABELUL NR. 3
După ce am standardizat datele, prin acesta supunând faptul că ne-am detaşat de scara de
măsurare a variabilelor, matricea coeficienţilor de corelaţii va fi echivalentă cu matricea de covarianţă
şi astfel vom începe analiza compomentelor principale utilizând matricea de date strandardizate,
astfel:
7
Pas 3 – Alegem variabilele după care să se facă analiza şi anume acele variabile standardizate cele
care încep cu litera Z, după care în parte de jos a căsuţei de dialog avem mai multe opţiuni ca:
Descriptives, Extraction, Rotation, Scores, Options; care vor fi prezentate în următoarele print screen-
uri:
După parcurgerea tuturor opţiunilor din parte de jos se va da OK şi se vor obţine datele prezenta în Anexa Nr.1,
ceea ce conţine listingul din SPSS cu privirea la analiza componentelor proncipale.
1.) În această căsuţa de dialog vom alege să ne
prezinte informaţii legate de o variabilă (medie,
dispersie etc) precum si afisarea coeficientilor
matricei de corelaţie, după care dăm Continue.
8
2.)
3.)
4.)
Aici alegem ca scorurile firmelor pe fiecare
dintre cele două axe analizate să fie salvate ca
variabile în tabelul SPSS imediat după
variabilele standardizate, şi totodată selectând şi
a doua opţiune vom obţine versorii axelor „u”,
apoi Continue.
După parcurgerea paşilor de mai sus, vom trece la interpretarea rezultatelor obţinute. Astfel
primul tabel din Anexa Nr.1, ne oferă informaţii cu privire la media şi abatarea standard a fiecărui
indicator şi având în vedere faptul că media este 0 iar dispersia este 1, confirmă faptul că datele sunt
standardizate, după cum puteţi observa în următorul tabel:
TABELUL NR. 4
Descriptive Statistics
9
Std.
Mean Analysis N
Deviation
CA 0 1 25
VT 0 1 25
VE 0 1 25
SAL 0 1 25
AI 0 1 25
AC 0 1 25
Apoi pentru a vedea dacă indicatori calculaţii sunt independenţi sau nu vom analiza matricea
coeficienţilor de corelaţie din tabelul următor:
TABELUL NR. 5
Correlation Matrix
CA VT VE SAL AI AC
CA 1 0,164 0,156 0,769 0,378 0,327
VT 0,164 1 0,997 0,516 0,618 0,807
VE 0,156 0,997 1 0,514 0,625 0,816
SAL 0,769 0,516 0,514 1 0,477 0,648
AI 0,378 0,618 0,625 0,477 1 0,758
AC 0,327 0,807 0,816 0,648 0,758 1
La o primă vedere, putem afirma faptul că în matricea coeficienţilor de corelaţie, există numai
corelaţii în sens prozitiv, cele în sens negativ lipsind cu desăvârşire. Astfel identificăm în matricea de
mai sus, un coeficient foarte mare de corelaţie apropriat de valoarea 1, şi anume între indicatorul VT
(Venit Total) şi indicatorul VE (Venit din Exploatare) având o valoare de 0,997, existând posibilitatea
de a se renunţa la unul dintre având în vederea şi domeniul contabil conform căruia VE intră în
alcătuirea VT. Totodată se mai identifică coeficienţi de corelaţie destul de mari între indicatorul CA şi
indicatorul SAL, indicatorul VT şi indicatorul AC, indicatorul VE şi indicatorul AC, precum şi între
indicatorul AI şi indicatorul AC. Ca urmare a acestor constatării am putea totuţi să eliminăm unii
indicatori, dar problema este pe care să-i eliminăm; pentru a elimina subiectivismul decizie, vom
folosi tehnicile de analiză a componentelor principale implementate în SPSS, şi ne propunem să
identificăm doi indicatori sintetici cu care ne-am mulţumi în atingerea scopului propus.
Mai departe vom trece la analiza calităţii norului de puncte (în cazul nostru a firmelor)
urmărind informaţiile din tabelul următor:
TABELUL NR. 6
Total Variance Explained
Eigenvalues
Component % of Cumulative
Eigenvalue
Variance %
1 3,944 65,733 65,733
2 1,273 21,220 86,953
3 0,482 8,033 94,986
4 0,201 3,355 98,341
5 0,097 1,614 99,955
6 0,003 ,045 100,000
Extraction Method: Principal Component Analysis.
10
Acest tabel ne prezintă în coloana „Eigenvalue” , toate valorile proprii asociate spectrului
matricei, în ordine descrescătoare, şi anume: λ1 =3,944 , λ2 =1,273 etc. Dar cum pe noi ne
interesează explicitarea norului de puncte prin două axe şi cum rangul matricei coeficienţilor de
corelaţie este 6, atunci putem să explicăm uşor conţinutul coloanei „% of Varinace”, astfel: ajustând
norul de puncte printr-o axă factorială (adică acceptând doar un singur indicator sintetic) se explică
65,733% din totalul variaţiei datelor; apoi ajustând norul de puncte prin două axe factoriale (adică
acceptând doi indicatori sintetici), recuperăm încă 21,220% din variaţia totală, adică un total de
86,953% din această varianţă, ceea ce reprezintă un rezultat foate bun pentru analiza noastră. Iar dacă
am fi solicitat trei axe factoriale am fi explicitat aproximativ 95% din varianţa totală, dar în această
analiză ne-am propus doar ajustarea norului de puncte doar prin 2 axe factoriale.
Odată cu tabelul de mai sus, SPSS-ul asociază un grafic al nivelurilor valorilor proprii,
denumit Scree Plot-ul şi prezent în cele ce urmează:
3
Eigenvalue
1 2 3 4 5 6
Component Number
În continuarea analizăm informaţiile despre axele principale care sunt prezente în următorul
tabel:
TABELUL NR. 7
Component Score Coefficient Matrix
11
Factor Score Coefficients
Factor 1 Factor 2
CA -0,202 0,632
VT 0,341 -0,152
VE 0,344 -0,157
SAL -0,026 0,456
AI 0,191 0,075
AC 0,254 0,024
Acest tabel de mai sus, de fapt este matricea ce ne dă versorii axelor, iar coloana unui factor ne oferă
infornaţii despre ponderile (coeficienţii) cu care participă fiecare indicator financiar-contabil (CA,
VT, VE, SAL, AI, AC) la descrierea factorului respectiv. Acest factor putând fi exprimat, prin
urmare, ca o combinaţie liniară de indicatori financiari-contabili, avându-se în vedere coeficienţii cu
care participă fiecare indicator în parte.
Apoi vom avea în vedere informaţiile despre scorurile firmelor, care sunt proiecţiile acestor
firme (considerate ca puncte în spaţiul indivizilor) pe cele două axe principale, ele fiind salvate în
matricea de date iniţială, imediat după valorile indicatorilor standardizaţi, fiind prezentate în
următorul tabel:
TABELUL NR. 8
Factor Scores
Rotation: Varimax
CODFIRMA Factor1 Factor2
F1 -0,498 -0,460
F2 -0,271 -0,306
F3 1,600 1,095
F4 0,472 0,322
F5 -0,492 2,149
F6 -0,821 -0,761
F7 0,138 -0,297
F8 -0,310 0,651
F9 -0,192 -0,537
F10 -0,236 -0,195
F11 -0,875 -0,799
F12 -0,290 -0,045
F13 -0,984 3,370
F14 -0,345 -0,311
F15 -0,637 -0,549
F16 0,599 0,897
F17 0,247 -0,257
F18 -0,862 -0,819
F19 -0,849 -0,792
F20 -0,888 -0,807
F21 3,511 -0,472
F22 0,570 0,364
F23 1,357 -0,574
F24 -0,335 -0,630
F25 0,391 -0,237
Astfel cel două coloane (Factor1 şi Factor2) conţin componentele principale sau noii indicatori
12
sintetici calculaţii pentru cele 25 de firme. Aşadar apelăm Graphs → Scatter/Dot... (1.) → Alegem
„Simple Scatter” (2.)
1.) 2.)
(3.)
După care (3.) alegem cordonatele axelor X – factorul 1 şi Y – factorul 2, iar la Label Case by
– alegem CodFirma, şi pentru a ne afişa codurile firmelor pe grafic din Options... bifăm căsuţa
corespunzătoare „Display chart with case labels” , apoi Continue şi în final OK şi vom obţine
următorul grafic:
13
4,00000
2 F13
1
3,00000
F5
2,00000
F3
F16
1,00000
F8
F4 F22
F12
0,00000 F14 F25
F9 F21
F23
F20 F17
F24
-1,00000 F18 F19
-2,00000
-3,00000
-4,00000
În acest grafic putem observa un grup destul de compact ce par a avea un comportament
asemănător în raport cu noii indicatori, dar şi trei firme, anume F5, F13, F21, care se detaşează de
grup.
Şi în finalul analizei componentelor principale vom analiza informaţiile privind interpretarea
componentelor principale care se obţin analizând coeficienţii de corelaţii calculaţi între cele trei
componente principale şi indicatori financiar-contabili, acest lucru se face analizând „Component
Matrix” – fiind matricea corelaţiilor Person între variabile iniţiale ale modelului şi noile variabile
formate, şi „Rotated Component Matrix” – folosită pentru a obţine o interpretare mai clară şi corectă,
prin selectarea opţiuni de Rotation astfel încât să se realizeze corelaţii mari cu una din componente şi
mici cu celelalte componente rămase.
Întorcându-ne la aplicaţia noastra, se obţin aşa-numiţii „Factor Loadings” din explicitarea
tabelului SPSS – „Component Matrix” la care se adaugă şi valorile proprii şi ponderile lor cu privire
la cantitatea de informaţie recuperată, obţinându-se următorul tabel:
TABELUL NR. 9
Component Matrix
14
Factor Loadings (Unrotated)
Factor 1 Factor 2
CA 0,506 0,829
VT 0,888 -0,379
VE 0,890 -0,386
SAL 0,777 0,525
AI 0,804 -0,034
AC 0,925 -0,129
Expl. Var 3,94 1,27
Prp. Totl 0,65 0,21
15
Figura 3. Component Plot in Rotated Space
ZCA
1,0
ZSAL
0,5
ZAI ZAC
Factor 2
ZVT
0,0 ZVE
-0,5
-1,0
Factor 1
Astfel de data aceasta se observă că am obţinut coeficienţi de corelaţie mari pentru câte o
componentă şi mici pentru cealaltă componentă principală. Acum componenta principală 1 poate fi
interpretată în termenii indicatorul VT sau eventual VE (corelaţie pozitivă), dar cum matricea
corelaţiilor ne arată că aceştia sunt puternic corelaţi între ei, coeficientul de corelaţie alor având
valoarea de 0,997, putem aşa bine să renunţăm la unul dintre ei, astfel renunţam la indicatorul VE
deoarece el intră şi în alcătuirea indicatorului VT.
Componenta principală 2 este cum a fost interpretată şi mai devreme, tot în termenii
indicatorului CA (corelaţie pozitivă), adică este un indicator sintetic reprezentând volumul tuturor
încasărilor de pe urma rezultatelor obţinute în activitatea de exploatare a întreprinderii şi este unul
dintre cei mai reprezentativi indicatori ai volumului de activitate al unei întreprinderi.
În final după ce am dat o interpretare a acestor 2 componente principale,putem să obţinem o
clasificare a firmelor, utilizând proiecţiile în planul axelor principale, şi astfel ne folosim de scorurile
acestor firme şi graficul din figura 2, dar mai înanite de acestea remarcăm faptul că cele două
componente principale au scorul cu atât mai bun cu cât acesta este mai mare, lucru datorat corelaţie
pozitive prezente. Prin urmare, cele 25 de firme în planul indicatorilor CA şi VT se clasifică astfel:
Clasa 1. Conţine firmele F3, F4, F16, F22 care au scoruri bune pe ambele componente;
Clasa 2. Conţine firmele F5, F8, F13 care au scoruri bune la indicatorul Cifra de afaceri dar
16
au o situaţie mai proastă la indicatorul Venit total;
Clasa 3. Conţine firmele F9, F17, F21, F23, F25 care au scoruri mai slabe la indictorul Cifra
de afaceri dar o situaţie mai bună la indicatorul Venit total;
Clasa 4. Conţine firmele F1, F2, F6, F7, F10, F11, F12, F14, F15, F18, F19, F20, F24 care au
scoruri slabe la ambii indicatori de sinteză, atât la Venit total cât şi la Cirfa de afaceri.
3. ANALIZA CLUSTER
În continuare, tot pentru aceiaşi matrice a datelor standardizate vom aplica tehnici de
clasificare bazate pe algoritmi ierarhici pentru a putea exemplifica atât gruparea firmelor cât şi
gruparea indicatorilor.
În vederea aplicării tehnicii de clasificare în SPSS vom parcurge următorii paşii:
Pas 1 – avem matricea de date standardizate în SPSS
Pas 2 – apelăm Analyse → Classify → Hierarchical Cluster...
Pas 3 – Alegem variabilele după care să se facă analiza şi anume acele variabile standardizate cele
care încep cu litera Z, după care în parte de jos a căsuţei de dialog avem mai multe opţiuni ca:
Statistics, Plots, Merhod, Save; care vor fi prezentate în următoarele print screen-uri:
17
După parcurgerea tuturor opţiunilor din parte de jos se va da OK şi se vor obţine datele prezenta în Anexa Nr.2,
ceea ce conţine listingul din SPSS cu privirea la analiza cluster. Dar tot în această fereastră, avem de ales la
câmpul „Cluster” între „Cases” (ceea ce ne va permite aplicarea tehnicilor de clasificare pentru gruparea
firmelor în clase cât mai omogene, luând în considerare toţi cei 6 indicatori) şi „Variables” (ceea ce ne va
permite aplicarea tehnicilor de clasificare pentru gruparea celor 6 indicatori în clase cât mai omogene)
1.)
2.)
18
neighbor (vecinii cei mai apropriaţi), Furthest
neighbor ( vecinii cei mai îndepărtaţi ), sau
Between-groups sau Within-groups linkage
(înlănţuirea prin medii ) – deci vom avea 3 aplicaţii
câte una pentru fiecare metodă. Tot aici alegem şi
modul de calcul a distanţei dintre două obiecte
(clase), şi anume distanţa euclidiană. Şi tot aici dacă
datele nu erau standardizate am fi putut alege să fie
standardizate la „Transform Values”, după care dăm
Continue.
4.)
După ce am trecut în revistă principalii paşi de urmat în SPSS pentru analiza cluster, vom
trece pentru început la gruparea firmelor în clase cât mai omogene, luând în considerare toţi cei 6
indicatori, şi folosind cei trei algoritmi învaţaţi şi anume: vecinii cei mai apropriaţi, vecinii cei mai
depărtaţii şi agregarea prin medii. Dar mai întâi de toate va fi calculată matricea de proximitatea (de
dimensiune 25 x 25, simetrică), în care care fiecare element al ei este reprezentat de distanţa
euclidiană între firmele corespunzătoare, distanţă calculată în funcţie de toţi cei 6 indicatori observaţi
(folosind distanţa euclidiană ca măsură a disimilarităţii). Această matrice fiind prezentată în următorul
tabel:
19
TABELUL NR. 11
Proximity Matrix
0,00 0,73 5,26 2,86 3,73 0,90 1,90 2,36 2,27 0,91 1,01 0,86 5,01 0,45 0,76 3,43 1,59 1,02 0,97 1,03 7,36 2,81 3,43 0,32 2,86
0,73 0,00 4,72 2,52 3,40 1,47 1,46 2,04 2,24 0,96 1,57 0,81 4,67 0,45 1,21 3,08 1,24 1,59 1,54 1,62 6,88 2,36 2,89 0,65 2,34
5,26 4,72 0,00 2,91 3,44 6,08 3,97 4,28 4,95 4,55 6,22 4,52 4,64 4,85 5,54 2,29 3,91 6,20 6,16 6,25 3,71 2,52 2,73 5,15 3,76
2,86 2,52 2,91 0,00 2,44 3,56 1,62 2,17 2,23 2,18 3,73 2,24 4,37 2,58 2,91 1,50 1,71 3,67 3,64 3,74 5,60 0,92 2,07 2,82 1,93
3,73 3,40 3,44 2,44 0,00 4,39 3,11 2,65 3,73 3,17 4,52 3,05 2,26 3,44 3,89 2,18 3,16 4,50 4,46 4,54 6,79 2,36 3,89 3,83 3,35
0,90 1,47 6,08 3,56 4,39 0,00 2,43 2,87 2,39 1,72 0,19 1,73 5,62 1,33 0,71 4,28 2,38 0,16 0,09 0,21 8,15 3,62 4,14 1,04 3,29
1,90 1,46 3,97 1,62 3,11 2,43 0,00 2,08 1,36 1,61 2,59 1,70 4,87 1,69 1,86 2,71 1,46 2,53 2,50 2,62 6,43 1,69 2,27 1,78 1,04
2,36 2,04 4,28 2,17 2,65 2,87 2,08 0,00 2,61 2,25 3,01 2,04 3,67 2,21 2,38 2,85 1,70 3,02 2,96 3,05 6,65 2,45 2,94 2,48 2,42
2,27 2,24 4,95 2,23 3,73 2,39 1,36 2,61 0,00 2,16 2,56 2,35 5,60 2,31 1,76 3,57 2,33 2,45 2,45 2,57 7,41 2,70 3,33 2,24 1,82
0,91 0,96 4,55 2,18 3,17 1,72 1,61 2,25 2,16 0,00 1,85 0,45 4,66 0,68 1,32 2,63 1,19 1,82 1,78 1,85 6,79 2,08 2,99 0,91 2,62
1,01 1,57 6,22 3,73 4,52 0,19 2,59 3,01 2,56 1,85 0,00 1,85 5,70 1,43 0,89 4,41 2,51 0,16 0,13 0,08 8,26 3,76 4,27 1,14 3,45
0,86 0,81 4,52 2,24 3,05 1,73 1,70 2,04 2,35 0,45 1,85 0,00 4,41 0,54 1,38 2,60 1,08 1,85 1,80 1,86 6,75 2,11 2,98 0,91 2,68
5,01 4,67 4,64 4,37 2,26 5,62 4,87 3,67 5,60 4,66 5,70 4,41 0,00 4,73 5,29 3,76 4,54 5,74 5,69 5,73 7,52 4,17 5,27 5,16 5,08
0,45 0,45 4,85 2,58 3,44 1,33 1,69 2,21 2,31 0,68 1,43 0,54 4,73 0,00 1,10 3,06 1,29 1,45 1,40 1,46 6,99 2,44 3,10 0,44 2,66
0,76 1,21 5,54 2,91 3,89 0,71 1,86 2,38 1,76 1,32 0,89 1,38 5,29 1,10 0,00 3,75 1,91 0,82 0,79 0,90 7,74 3,06 3,68 0,90 2,75
3,43 3,08 2,29 1,50 2,18 4,28 2,71 2,85 3,57 2,63 4,41 2,60 3,76 3,06 3,75 0,00 2,25 4,39 4,35 4,43 5,04 1,13 2,46 3,40 3,10
1,59 1,24 3,91 1,71 3,16 2,38 1,46 1,70 2,33 1,19 2,51 1,08 4,54 1,29 1,91 2,25 0,00 2,51 2,46 2,54 5,89 1,67 2,03 1,51 2,23
1,02 1,59 6,20 3,67 4,50 0,16 2,53 3,02 2,45 1,82 0,16 1,85 5,74 1,45 0,82 4,39 2,51 0,00 0,08 0,14 8,27 3,73 4,26 1,14 3,40
0,97 1,54 6,16 3,64 4,46 0,09 2,50 2,96 2,45 1,78 0,13 1,80 5,69 1,40 0,79 4,35 2,46 0,08 0,00 0,13 8,22 3,69 4,22 1,10 3,37
1,03 1,62 6,25 3,74 4,54 0,21 2,62 3,05 2,57 1,85 0,08 1,86 5,73 1,46 0,90 4,43 2,54 0,14 0,13 0,00 8,29 3,79 4,31 1,16 3,49
7,36 6,88 3,71 5,60 6,79 8,15 6,43 6,65 7,41 6,79 8,26 6,75 7,52 6,99 7,74 5,04 5,89 8,27 8,22 8,29 0,00 5,27 4,23 7,18 6,27
2,81 2,36 2,52 0,92 2,36 3,62 1,69 2,45 2,70 2,08 3,76 2,11 4,17 2,44 3,06 1,13 1,67 3,73 3,69 3,79 5,27 0,00 1,82 2,72 2,04
3,43 2,89 2,73 2,07 3,89 4,14 2,27 2,94 3,33 2,99 4,27 2,98 5,27 3,10 3,68 2,46 2,03 4,26 4,22 4,31 4,23 1,82 0,00 3,25 2,21
0,32 0,65 5,15 2,82 3,83 1,04 1,78 2,48 2,24 0,91 1,14 0,91 5,16 0,44 0,90 3,40 1,51 1,14 1,10 1,16 7,18 2,72 3,25 0,00 2,74
2,86 2,34 3,76 1,93 3,35 3,29 1,04 2,42 1,82 2,62 3,45 2,68 5,08 2,66 2,75 3,10 2,23 3,40 3,37 3,49 6,27 2,04 2,21 2,74 0,00
20
După care pentru exemplificarea agregării firmelor prezentăm în tabelul următor etapele de constituire a claselor, în care se poate observa
modul de formare a uni grup precum şi nivelul de agregare corespunzător pentru fiecare algoritm în parte, astfel:
Nivel
ul
agregă 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
rii
0,078 C11 C20
0,079 C18 C19
0,088 C6 C18 C19
0,125 C6 C18 C19 C11 C20
0,323 C1 C24
0,438 C1 C24 C14
0,445 C1 C24 C14 C2
0,446 C10 C12
0,536 C1 C24 C14 C2 C10 C12
0,709 C6 C18 C19 C11 C20 C15
0,758 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15
0,919 C4 C22
1,040 C7 C25
1,083 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17
1,129 C4 C22 C16
1,362 C7 C25 C9
1,459 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9
1,622 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9 C4 C22 C16
1,701 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9 C4 C22 C16 C8
1,820 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9 C4 C22 C16 C8 C23
2,179 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9 C4 C22 C16 C8 C23 C5
2,257 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9 C4 C22 C16 C8 C23 C5 C13
2,286 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9 C4 C22 C16 C8 C23 C5 C13 C3
3,708 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9 C4 C22 C16 C8 C23 C5 C13 C3 C21
21
2. Pentru Complete linkage
TABELUL NR. 13
Nivel
ul
agregă 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
rii
0,078 C11 C20
0,079 C18 C19
0,155 C6 C18 C19
0,207 C6 C18 C19 C11 C20
0,323 C1 C24
0,445 C2 C14
0,446 C10 C12
0,727 C1 C24 C2 C14
0,904 C6 C18 C19 C11 C20 C15
0,919 C4 C22
0,961 C1 C24 C2 C14 C10 C12
1,040 C7 C25
1,496 C4 C22 C16
1,587 C1 C24 C2 C14 C10 C12 C17
1,817 C7 C25 C9
2,257 C5 C13
2,457 C4 C22 C16 C23
2,479 C1 C24 C2 C14 C10 C12 C17 C8
2,859 C1 C24 C2 C14 C10 C12 C17 C8 C7 C25 C9
2,911 C3 C4 C22 C16 C23
3,490 C1 C24 C2 C14 C10 C12 C17 C8 C7 C25 C9 C6 C18 C19 C11 C20 C15
5,272 C3 C4 C22 C16 C23 C5 C13
6,254 C1 C24 C2 C14 C10 C12 C17 C8 C7 C25 C9 C6 C18 C19 C11 C20 C15 C3 C4 C22 C16 C23 C5 C13
8,289 C1 C24 C2 C14 C10 C12 C17 C8 C7 C25 C9 C6 C18 C19 C11 C20 C15 C3 C4 C22 C16 C23 C5 C13 C21
22
3. Pentru Average linkage
TABELUL NR. 14
Nivel
ul
agregă 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
rii
0,078 C11 C20
0,079 C18 C19
0,121 C6 C18 C19
0,158 C6 C18 C19 C11 C20
0,323 C1 C24
0,444 C1 C24 C14
0,446 C10 C12
0,608 C1 C24 C14 C2
0,822 C6 C18 C19 C11 C20 C15
0,822 C1 C24 C14 C2 C10 C12
0,919 C4 C22
1,040 C7 C25
1,313 C4 C22 C16
1,318 C1 C24 C14 C2 C10 C12 C17
1,534 C1 C24 C14 C2 C10 C12 C17 C6 C18 C19 C11 C20 C15
1,589 C7 C25 C9
2,115 C4 C22 C16 C23
2,257 C5 C13
2,370 C7 C25 C9 C8
2,431 C1 C24 C14 C2 C10 C12 C17 C6 C18 C19 C11 C20 C15 C7 C25 C9 C8
2,612 C3 C4 C22 C16 C23
3,457 C1 C24 C14 C2 C10 C12 C17 C6 C18 C19 C11 C20 C15 C7 C25 C9 C8 C3 C4 C22 C16 C23
4,218 C1 C24 C14 C2 C10 C12 C17 C6 C18 C19 C11 C20 C15 C7 C25 C9 C8 C3 C4 C22 C16 C23 C5 C13
6,737 C1 C24 C14 C2 C10 C12 C17 C6 C18 C19 C11 C20 C15 C7 C25 C9 C8 C3 C4 C22 C16 C23 C5 C13 C21
23
Pentru algoritmii mai sus prezentaţii, în SPSS se întocmeşte câte o dendrogramă pentru fiecare
în parte, şi sunt prezentate în cele ce urmează:
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
11
20
18
19
6
15
1
24
14
2
10
12
17
7
25
9
4
22
16
8
23
5
13
3
21
24
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
11
20
18
19
6
15
7
25
9
10
12
1
24
2
14
17
8
5
13
4
22
16
23
3
21
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
11
25
20
18
19
6
15
10
12
1
24
14
2
17
7
25
9
8
4
22
16
23
3
5
13
21
Iar în final, înainte de a trage concluziile acestei analize cluster a firmelor, prezentăm într-un
mod mai sintetizat, etapele de grupare ale firmelor pentru cele trei metode de agregare Single linkage
(vecinii cei mai apropiaţi), Complete linkage (vecinii cei mai îndepărtaţi) şi Average linkage
(înlănţuirea prin medii), în următorul tabel:
TABELUL NR. 15
Nivelul de
Single linkage. Clase Complete linkage. Clase Average linkage. Clase
agregare
C1=(3,9); C2=(18,19);
<0,1 C1=(11,20); C2=(18,19) C1=(11,20); C2=(18,19)
C3=(6,C2)
0,1 – 0,2 C4=(C3,11) C3=(6,C2) C3=(6,C2); C4=(C3, C1)
0,2 – 0,4 C5=(1,24) C4=(C3,C1); C5=(1,24) C5=(1,24)
C6=(C1,14); C7=(C6,2);
0,4 – 0,5 C6=(2,14); C7=(10,12) C6=(C5,14); C7=(10,12)
C8=(10,12)
C9=(C7,C8); C10=(C4,15)
0,5 – 0,8 C8=(C5,C6) C8=(C6,2)
C11=(C9,C10)
C9=(C4,15); C10=(4,22) C9=(C4,15); C10=(C8,C7)
0,8 – 1,0 C12=(4,22)
C11=(C8,C7) C11=(4,22)
C13=(7,25); C14=(C11,17)
1,0 – 1,2 C12=(7,25) C12=(7,25)
C15=(C12,16)
1,2 – 1,5 C16=(C13,9); C17=(C14,C16) C13=(C10,16) C13=(C11,16); C14=(C10,17)
C18=(C17,C15); C19=(C18,8)
1,5 – 1,9 C14=(C11,17); C15=(C12,9) C15=(C14,C9); C16=(C12,9)
C20=(C19,23)
C21=(C20,5); C22=(C21,13) C16=(5,13); C17=(C13,23) C17=(C13,23); C18=(5,13)
1,9 – 2,5
C23=(C22,3) C18=(C14,8) C19=(C16,8); C20=(C15,C19)
2,5 – 4,0 C24=(C23,21) C19=(C18,C15); C20=(3,C17) C21=(3,C17); C22=(C20,C21)
26
C21=(C19,C9)
C22=(C20,C16); C23=(C21,C22)
>4,0 – C23=(C22,C18); C24=(C23,21)
C24=(C23,21)
Pentru a trage concluziile acestei analize cluster, vom analiza cele trei dendrograme asociate
fiecărei metode înparte, astfel câteva concluzii sunt evidente:
- în dendrograma din figura 4 putem distinge două grupe de firme şi anume grupa
formată din firmele (F11, F20, F18, F19, F6) şi (F1, F24, F2, F10, F12), în rest
firmele par destul de omogene, cu excepţia uneia (F21), care întoate cele trei
dendrograme se detaşează evident faţă de celelate firme, lucru ce poate sugera că
algoritmul celor mai apropriaţi vecini nu este indicat de folosit în acest caz.
- în schimb în dendrograma din figura 5 apar unele clase distincte, mai precis 4 grupe
disticte formate astfel (F11, F20, F18, F19, F6) , (F7, F25, F9) , (F10, F12, F1, F24,
F2, F14, F17, F8) şi (F5, F13, F4, F22, F16, F23, F3), dar şi o firmă ca în cazul
anterior ce se detaşează evident de celelalte, aceasta fiind tot firma F21.
- în final în dendrograma din figura 6, avem o evoluţie asemănătoare cu evoluţia din
figura 4, putând distenge şi aici 2-3 clase omogene, dar şi o firmă ce se detasează de
celelalte, aceasta fiind tot firma 21.
Şi facând o paralelă între clasele de firme formate în planul primelor două axe factoriale, este
interesant de văzut dacă clasele obţinute prin tehnicile analizei cluster, bazate pe distanţa euclidiană,
ne conduce la acelaşi rezultate. Acest lucru poate fi luat în discuţie numai în cazul aplicării metodei
vecinilor celor mai îndepărtaţii şi a înlănţuirii bazate pe medii, putem afirma că existe şi firme ale
căror poziţionare în clase se păstrează (de exemplu putem Clasa 1 – (F3,F4, F16,F22) ), dar şi firme
care care se grupează cu altele ce nu aparţineau îniţial în clasa lor, dar în general clasificarea realizată
conform componentelor principale este mult mai elocventă şi explicativă.
În finalul acestui proiect prezentăm şi o grupare a celor 6 indicatori financiar contabili în clase
cât mai omogene, şi pentru aceasta vor fi urmaţi paşii descrişi la începutul analizie cluster, numai că
în prima fereastră de dialog la câmpul „Cluster” în loc de „Cases” alegem „Variables”, şi mai întâi
vom obţine în outputul SPSS, matricea distanţelor euclidiene între coloanele matricei, rezultând astfel
matricea simetrică a disimilarităţilor (matrice de ordin 6 x 6), în următorul tabel:
TABELUL NR. 16
După care pentru exemplificarea agregării indicatorilor prezentăm în tabelul următor etapele
27
de constituire a claselor, în care se poate observa modul de formare a uni grup precum şi nivelul de
agregare corespunzător pentru fiecare algoritm în parte, astfel:
1. Pentru Single Linkage
TABELUL NR. 17
Nivel ul
agregării 1 2 3 4 5 6
0,374 I2 I3
2,970 I2 I3 I6
3,329 I1 I4
3,408 I2 I3 I6 I5
4,111 I1 I4 I2 I3 I6 I5
Nivel ul
agregării 1 2 3 4 5 6
0,374 I2 I3
3,042 I2 I3 I6
3,329 I1 I4
4,282 I2 I3 I6 I5
6,364 I1 I4 I2 I3 I6 I5
Nivel ul
agregării 1 2 3 4 5 6
0,374 I2 I3
3,006 I2 I3 I6
3,329 I1 I4
3,979 I2 I3 I6 I5
5,327 I1 I4 I2 I3 I6 I5
Pentru algoritmii mai sus prezentaţii, în SPSS se întocmeşte câte o dendrogramă pentru fiecare
în parte, şi sunt prezentate în cele ce urmează:
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
28
VT 2
VE 3
AC 6
AI 5
CA 1
SAL 4
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
VT 2
VE 3
AC 6
AI 5
CA 1
SAL 4
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
VT 2
VE 3
AC 6
AI 5
CA 1
SAL 4
Iar în final, înainte de a trage concluziile acestei analize cluster a indicatorilor, prezentăm într-
un mod mai sintetizat, etapele de grupare ale firmelor pentru cele trei metode de agregare Single
linkage (vecinii cei mai apropiaţi), Complete linkage (vecinii cei mai îndepărtaţi) şi Average linkage
(înlănţuirea prin medii), în următorul tabel:
TABELUL NR. 20
Nivelul de
Single linkage. Clase Complete linkage. Clase Average linkage. Clase
agregare
<2 C1=(2,3) C1=(2,3) C1=(2,3)
C2=(C1,6); C3=(1,4) C2=(C1,6); C3=(1,4)
2–4 C2=(C1,6); C3=(1,4)
C4=(C2,5) C4=(C2,5)
29
>4 C5=(C3,C4) C4=(C2,5); C5=(C3,C4) C5=(C3,C4)
După cum se poate observa în informaţiile de mai sus, pentru toate cele trei metode folosite
obţinem aceleaşi grupări ale indicatorilor în clase, doar nivelul agregării în clase diferind de la o
metodă la altă, fapt pentru care în vederea extragerii a unor concluzii privind omogenitatea celor 6
indicatori financiar-contabili, putem urmării etapele constituirii claselor numai pentru una dintre
metode, şi fie aceasta metoda ce foloseşte algoritmul agregării vecinilor celor mai îndepărtaţii
(Complete Linkage).
Atunci cei mai apropriaţii, la un nivel minim de 0,374, sunt indicatorul VT (Venit total) şi
indicatorul VE (Venit din exploatare) formând o primă clasă. După care urmează un salt foarte mare
de aproximativ 2,668 până la un nivel de 3,042, unde primei clase formate i se adugă şi indicatorul
AC (Active circulante). După aceea la un nivel de 3,329 se formează o a doua clasă din indicatorul
CA (Cifra de afaceri) şi indicatorul SAL (Număr mediu de salariaţi anual). Urmând ca mai apoi la
nivelul de 4,282 primei clase formate să se mai aduge şi indicatorul AI (Active Imobilizate). Şi în
final cele două clase formate se agregă la nivelul de 6,364.
Concluzia interpretării prezentată în paragraful anterior, este aceea că folosind algoritmul de
clasificare putem supune că indicatori financiar-contabili urmăriţii prin nivelele lor pentru cele 25 de
firme se pot grupa în două clase:
C1 – formată din indicatorii VT, VE, AC şi AI
C2 – formată din indicatorii CA şi SAL
Şi în final vom compara clasele de indicatori obţinute pe baza matricei euclidiene cu gruparea
indicatorilor după coeficienţii lor de corelaţie liniară claculaţii în etapa de analiză a componentelor
principale, şi avem următorul tabel:
TABELUL NR. 21
CA VT VE SAL AI AC
Corelaţie
CA C2
puternică
Corelaţie Corelaţie
VT C1
puternică puternică
Corelaţie
VE C1
puternică
SAL C2
Corelaţie
AI C1
puternică
AC C1
Astfel pentru comparaţie putem urmării tabelul anterior ce ne informează atât despre
corelaţiile puternice între indicatorii financiar-contabili, corelaţii exprimate prin coeficienţii de
corelaţie „mari”, cât şi despre clasa căruia aparţie un indicator (informaţiile de pe diagonala
principală), clasă obţinută prin tehnica agregării. Şi care urmare a acestui lucru, putem observa că
30
împarţirea indicatorilor în clasele mai sus memţionate este justă, acest lucru fiind întărit şi de anumite
informaţii din domeniul financiar-contabil, conform cărora cifra a afacerii ca indicator de output este
corelată cu numărul de salariaţi care este un indicator de input în cadrul activităţii unei firme, iar
venitul total care are în componenţa sa şi venitul de exploatare reprezintă tot nişte indicatori de output
rezultaţii ca urmare a intrării în procesul de desfăşurarea al activităţii firmei a unor indicatori de input
ca activele imobilizate şi activele circulante.
4. BIBLIOGRAFIE
1. Liliana SPIRCU – „Analiza datelor. Aplicaţii economice” , Editura ASE, Bucureşti, 2005
2002.
31