Sunteți pe pagina 1din 7

APLICAIE ANALIZA CLUSTER Identificarea structurii de clase a

statelor membre UE pornind de la indicatorii de dezechilibru

Introducere

Scopul acestei analize este acela de a identifica grupele n care rile


membre UE care pot fi mprite pe baza similitudinii dintre ele, avnd la
baz informaia furnizat de un numr de 14 indicatori referitori la
dezechilibre macroeconomice. Pornind de la aceast grupare a statelor se
pot trage concluzii referitoare la caracteristicile majore ale clusterelor i a
diferenelor dintre ele.

Serii de date i metodologie

Seriile de date folosite sunt ., sursa lor fiind Eurostat i se refer la anul
2014. nainte de a aplica analiza cluster, variabilele au fost standardizate,
distantele nefiind, astfel, afectate de unitatea de msur a indicatorilor.

Analiza cluster este o tehnic de analiza datelor..completai cu o scurt


descriere

n cele ce urmeaz, vor fi aplicate att metode de clasificare ierarhic, ct i


algoritmi de partiionare (algoritmul K-means).

Rezultatele analizei

Reprezentarea grafic a tuturor rilor n funcie de doar dou variabile


sugereaz, apriori, posibilitatea gruprii acestora n trei clase (grafic 1)

Toate metodele de analiz ierarhic au la baz calculul distantei dintre


variabile (Anexa 1), in prim faz unindu-se cele mai apropiate dou obiecte.

1
La baza analizei ierarhice sta calculul distantei dintre variabile (Anexa 1), n
prim faz unindu-se cele mai apropiate dou obiecte: 1 i 10 n acest caz,
Belgia i Frana, i apoi 25 cu 21 Slovacia i Polonia.

Crearea unui grafic de tip heatmap, ofer indicii asupra modului n care se
vor grupa variabilele prin analiza ierarhic, coninnd att o grupare a
obiectelor ct i a variabilelor.

2
Dendrograma construit pe heatmap are la baz metoda agregrii complete,
asa nct prima modalitate de analiz ierarhica aleas a fost aceasta.

Aplicarea analizei ierarhice de tip complete linkage, sugereaz un numr de


3 clustere avnd urmtoarea componen:

1. Irlanda, Bulgaria, Cehia, Ungaria, Malta, Suedia, Luxemburg,


Danemarca, Olanda, Germania, Austria, Finlanda, Belgia i Frana;
2. Estonia, Letonia, Lituania, UK, Romnia, Polonia, Slovacia;
3. Spania, Portugalia, Slovenia, Croaia, Italia, Grecia i Cipru.

Utilizarea metodei agregrii medii ofer o cu totul alta soluie problemei de


clasificare. n acest caz, dendrograma este cea de mai jos:

3
n acest caz, multe dintre ri rmn izolate de grupuri pn la final. Punctul
n care se taie dendrograma este greu de identificat.

Metoda lui Ward reapropie rezultatele clasificrii de cele obinute prin


metoda agregrii complete:

4
Apartenena la clustere este n acest caz:

1. Irlanda, UK, Luxemburg, Malta, Suedia, Danemarca, Olanda, Germania,


Austria, Finlanda, Belgia i Frana (rile avansate);
2. Estonia, Letonia, Lituania, Romnia, Polonia, Slovacia, Bulgaria, Cehia
i Ungaria (economiile emergente);
3. Spania, Portugalia, Slovenia, Croaia, Italia, Grecia i Cipru (datorii
suverane -PIIGS).

Comparnd rezultatele gruprii prin metoda agregrii complete (MAC) i


metoda lui Ward observm ca cele 7 membre ale clusterului 3 sunt aceleai,
11 alte ri au fost alocate la fel primei grupe (metoda lui Ward alocnd 12
ri acestei grupe, ce-a de-a dousprezecea aparinnd grupei 2 n MAC (UK),
iar MAC alocnd 14 ri grupei 1, restul de 3 fiind n grupa 3 conform metodei
Ward (Bulgaria, Cehia, Ungaria))

Tabel.

member.c
member.w 1 2 3
1 11 1 0
2 3 6 0

5
3 0 0 7

ntruct metoda lui Ward ofer o mprire a rilor mai coerent dpdv
economic, vom alege aceast metod de clasificare.

Mai mult, comparnd acurateea clasificrii, metoda lui Ward ofer


rezultatele cele mai bune, n acest caz (graficele Silhouette)

Centroizii grupelor obinute prin metoda lui Ward sunt:

Group.1 CA NIIP REER EXPShare ULC HPI CreditFlow


1 1 0.4905886 0.8315633 0.3049942 -0.3772918 0.2575874 0.2415892 0.56619540
2 2 -0.3874706 -0.3822833 -0.2586839 0.9977278 0.6108556 0.3181052 -0.04630649
3 3 -0.3428326 -0.9340299 -0.1902536 -0.6360069 -1.2269642 -0.8231453 -0.91108377
PSDebt GGGD Unemploy TFSL ActivityRate LTUR YuR
1 0.5021179 -0.03906994 -0.6144989 0.4096069 -0.1763923 -0.2214250 -0.0481981
2 -0.8508275 -0.82662892 -0.1059922 0.3224578 0.6446825 -0.6706519 -0.8953273
3 0.2331475 1.12978566 1.1897024 -1.1167718 -0.5264907 1.2418526 1.2337604

CA i REER au cea mai mic putere de separare a clusterelor, media de la un


cluster la altul nediferind semnificativ.

K-means clustering

6
- n cadrul acestei analize v referii:
o puin la procedur (pornete de la anumite puncte central ale
clusterelor i n urma iteraiilor succesive ajunge la un centroid
final pentru fiecare dintre ele, atunci cnd modificarea
centroizilor de la o iteraie la alta devine 0);

In urma aplicrii K-means clustering pentru un numr de 3 grupe,


dimensiunea obinut a acestora este: 9, 7, 12, iar structura este identic cu
cea obinut prin metoda lui Ward.

Din variana total de 378, aproximativ 158 (41.7%) este reprezentat de


variana dintre clustere. n ceea ce privete variana n interiorul grupelor,
cea mai ridicat este ntlnit la nivelul gupei de ri avansate.

Concluzii

n aceast aplicaie ne-am propus identificarea grupelor n care n urma


aplicrii celor dou clase de algoritmi am obinut un numr de grupe, ele
avnd ca membri . n urma aplicrii algoritmului k-means putem
concluziona c rile din grupa 1 sunt cele pentru care indicatorii..
nregistreaz valorile cele mai, cele din grupa 2 se caracterizeaz mai
degrab prin niveluri..... ale indicatorilor etc.

S-ar putea să vă placă și