Documente Academic
Documente Profesional
Documente Cultură
> library(e1071)
>result
Pe ecran apar centroizii (=centrele) clusterelor si gradele de apartenenta ale instantelor la cele 3
clustere.
Reprezinta grafic instantele si clusterele asociate in functie de 2 atribute numerice alese, aici primele 2
coloane.
1
4.0
3.5
iris[, 2]
3.0
2.5
2.0
iris[, 1]
>points(result$centers[,c(1,2)],col=2:4,pch=8,cex=2)
cex=un nr. care indica marimea cu care textul si simbolurile normale sunt mai mari decat cele
normale(=implicite, pt. care cex=1).
De exemplu, daca cex=1.5, textul va fi scris cu 50% mai mare decat cel normal.
Daca cex=0.5, textul va fi scris cu 50% mai mic decat cel normal.
2
4.0
3.5
iris[, 2]
3.0
2.5
2.0
iris[, 1]
> result$membership[1:3,]
1 2 3
> result$membership
>table(iris$Species, result$cluster)
3
Afiseaza repartitia observatiilor in cele 3 clustere:
1 2 3
setosa 0 50 0
versicolor 3 0 47
virginica 37 0 13
Mai jos este prezentat un tabel cu simbolurile reprezentate de functia pch. Cand pch ia valori intre
21 si 25, parametrii "col=" si "bg=" trebuie specificati.
col =culoare
bg=culoare de background
4
5
pch=0,square
pch=1,circle
pch=2,triangle point up
pch=3,plus
pch=4,cross
pch=5,diamond
pch=6,triangle point down
pch=7,square cross
pch=8,star
pch=9,diamond plus
pch=10,circle plus
pch=11,triangles up and down
pch=12,square plus
pch=13,circle cross
pch=14,square and triangle down
pch=15, filled square blue
pch=16, filled circle blue
pch=17, filled triangle point up blue
pch=18, filled diamond blue
pch=19,solid circle blue
pch=20,bullet (smaller circle)
pch=21, filled circle red
pch=22, filled square red
pch=23, filled diamond red
pch=24, filled triangle point up red
pch=25, filled triangle point down red
>library(fclust)
Se va folosi setul de date Mc, care se refera la 81 de sortimente de snacksuri ce intra in componenta
meniului de la McDonalds. Aceste elemente for fi clusterizate pentru a identifica daca exista similaritati in
termenii componentelor nutritionale: marimea portiei, calorii, grasimi saturate, nesaturate, colesterol,
etc.
Forma generala a functiei FKM este: FKM (X, k, m, RS, stand, startU, conv, maxit)
Unde
X=matricea de date
6
RS=numarul (aleator) de porniri (valoare implicita RS=1)
[16] "Type"
Se normalizeaza datele prin impartirea componentelor nutritionale la prima coloana, marimea portiei
>Mc[,j]=Mc[,j]/Mc[,1]
> Mc=Mc[,-1]
Se aplica fuzzy k-means pentru 7 clustere, excluzand ultima coloana, variabila calitativa Type
24 12 4 13 15 10 3
7
VAT
Fiecare celula din figura se refera la disimilaritatea dintre o pereche de obiecte. Disimilaritatile mici sunt
reprezentate prin umbre mai intunecate, iar disimilaritatile mai mari prin umbre mai deschise. In figura,
disimilaritatile sunt reorganizate, astfel incat blocurile diagonal mai intunecate corespund clusterelor de
date. Prin urmare, k blocuri de pe diagonaal principal sugereaza k clustere, si marimea unui bloc
reprezinta marimea aproximativa a clusterului.
Incercand evitarea clusterelor cu numar redus de elemente, se studiaza situatia cu k=6 clustere:
Se afiseaza gradele de apartenenta ale meniurilor la cele sase clustere (fuzzy clustering) , iar gradul cel
mai mare de apartenenta la un cluster incadreaza meniul in clusterul respectiv (hard clustering):
>fkm6
8
> cl.size(fkm6$U)
12 26 10 15 5 13
1 2 3 4 5 6 7
1 0 12 0 0 0 0 0
2 24 0 0 0 0 0 2
3 0 0 0 0 0 10 0
4 0 0 0 015 0 0
5 0 0 4 0 0 0 1
6 0 0 0 13 0 0 0
Interpretare:
>table(Mc$Type, fkm6$clus[,1])
1 2 3 4 5 6
Breakfast 12 5 0 1 1 0
Chicken 0 4 0 0 0 0
Desserts/Shakes 0 0 0 12 4 0
Salads 0 0 10 0 0 0
In componenta primului cluster intra 12 meniuri de tip Breakfast, clusterul 3 contine 10 meniuri de tip
Salads, etc.
> fkm6$Hraw
Elementele din primul cluster au cel mai mare continut in Cholesterol (1.3995887 mg) si Sodium
(6.4716862 mg). Clusterul trei contine cele mai sanatoase alimente (salatele), avand cel mai redus nivel
de Calories (0.8194943), Total Fat (0.03395795g), Saturated Fat (0.01145265 g) and Trans Fat
9
(1.525538e-06 g) si cel mai mare nivel de Vitamin A (0.53784859 %DV) and Vitamin C (0.10887706
%DV)), etc.
> VIFCR(fkm6,2)
http://pro1.unibz.it/projects/Clustering_Methods_2014/Ferraro.pdf
http://cran.r-project.org/web/packages/fclust/fclust.pdf
10