Introducere
Seriile de date folosite sunt ., sursa lor fiind Eurostat i se refer la anul
2014. nainte de a aplica analiza cluster, variabilele au fost standardizate,
distantele nefiind, astfel, afectate de unitatea de msur a indicatorilor.
Rezultatele analizei
1
La baza analizei ierarhice sta calculul distantei dintre variabile (Anexa 1), n
prim faz unindu-se cele mai apropiate dou obiecte: 1 i 10 n acest caz,
Belgia i Frana, i apoi 25 cu 21 Slovacia i Polonia.
Crearea unui grafic de tip heatmap, ofer indicii asupra modului n care se
vor grupa variabilele prin analiza ierarhic, coninnd att o grupare a
obiectelor ct i a variabilelor.
2
Dendrograma construit pe heatmap are la baz metoda agregrii complete,
asa nct prima modalitate de analiz ierarhica aleas a fost aceasta.
3
n acest caz, multe dintre ri rmn izolate de grupuri pn la final. Punctul
n care se taie dendrograma este greu de identificat.
4
Apartenena la clustere este n acest caz:
Tabel.
member.c
member.w 1 2 3
1 11 1 0
2 3 6 0
5
3 0 0 7
ntruct metoda lui Ward ofer o mprire a rilor mai coerent dpdv
economic, vom alege aceast metod de clasificare.
K-means clustering
6
- n cadrul acestei analize v referii:
o puin la procedur (pornete de la anumite puncte central ale
clusterelor i n urma iteraiilor succesive ajunge la un centroid
final pentru fiecare dintre ele, atunci cnd modificarea
centroizilor de la o iteraie la alta devine 0);
Concluzii