Documente Academic
Documente Profesional
Documente Cultură
ProgramKmeans
X = forestfires(:,9:10);
figure;
plot(X(:,1),X(:,2),'k*','MarkerSize',5);
title 'Date incendii paduri negrupate';
xlabel 'Temperatura';
ylabel 'RH';
rng(1);
[idx,C] = kmeans(X,3);
x1 = min(X(:,1)):0.01:max(X(:,1));
x2 = min(X(:,2)):0.01:max(X(:,2));
[x1G,x2G] = meshgrid(x1,x2);
XGrid = [x1G(:),x2G(:)];
idx2Region = kmeans(XGrid,3,'MaxIter',1,'Start',C);
figure;
gscatter(XGrid(:,1),XGrid(:,2),idx2Region,...
[0,0.75,0.75;0.75,0,0.75;0.75,0.75,0],'..');
hold on;
plot(X(:,1),X(:,2),'k*','MarkerSize',5);
title 'Date incendii grupate';
xlabel 'Temperatura';
ylabel 'RH';
legend('Regiune 1','Regiune 2','Regiune 3','Date','Centroizi', 'Location','SouthEast');
hold off;
Rezultatele programului sunt seturile de date negrupate și Gaussian este un model probabilistic care presupune că toate
apoi grupate care sunt reprezentate de figurile 1-a și 1-b. punctele de date sunt generate dintr-un amestec dintr-un
număr finit de distribuții Gaussiene cu parametri necunoscuți.
Modelele mixte, în general, nu necesită știința cărui grup
aparține un punct de date, permițând modelului să învețe
automat clusterele.
Amestecul Gaussian este o funcție care este alcătuită din
mai mulți gaussieni, fiecare identificat prin k ∈ {1, ..., K},
unde K este numărul de clustere din setul de date. Fiecare k
Gaussian din amestec cuprinde următorii parametri:
• O medie μ care îi definește centrul.
• O covarianță Σ care îi definește lățimea. Acest lucru
ar fi echivalent cu dimensiunile unui elipsoid într-un
scenariu multivariat.
• O probabilitate de amestecare π care definește cât de
mare sau mică va fi funcția Gaussiană.
B. Funcția FITGMDIST
Cu ajutorul funcției fitgmdist, se aplică un amestec de
distribuție Gaussian al datelor. Un model de amestec
ProgramFitgmdist
X = forestfires(:,9:10);
x1=min(X(:,1)):0.01:max(X(:,1));
x2=min(X(:,2)):0.01:max(X(:,2));
[xx,yy]=meshgrid(x1,x2);
gridDataSet=[xx(:),yy(:)];
hold on
GMM=fitgmdist(X,3);
GMM.mu,
GMM.Sigma,
idxGmm=cluster(GMM,gridDataSet);
idxGmmData=cluster(GMM,X);
gscatter(gridDataSet(:,1),gridDataSet(:,2),idxGmm,[0,0.8,0.8;0.8,0,0.8;0.8,0.8,0,]),
hold on
gscatter(X(:,1),X(:,2),idxGmmData)
hold on
xlabel('procent alcool')
ylabel('procent acid malic')
title('Fitgmdist in EM')
legend('Regiune 1','Regiune 2','Regiune 3', 'Location','SouthEast');
figure,silhouette(X,idxGmmData)
hold off;
Program WDBC
X=wdbc;
X=X([1:150],[3:4])
x1=min(X(:,1)):0.01:max(X(:,1));
x2=min(X(:,2)):0.01:max(X(:,2));
[xx,yy]=meshgrid(x1,x2);
gridDataSet=[xx(:),yy(:)];
modelGMM=fitgmdist(X,3);
modelGMM.mu
modelGMM.Sigma
figure
idxGridGmm=cluster(modelGMM,gridDataSet);
idxGmmData=cluster(modelGMM,X);
gscatter(gridDataSet(:,1),gridDataSet(:,2),idxGridGmm,[0,0.8,0.8;0.8,0,0.8;0.8,0.8,0,]),
hold on
gscatter(X(:,1),X(:,2),idxGmmData)
hold on
title('Expectation-maximization')
legend('Regiune 1','Regiune 2','Regiune 3', 'Location','SouthEast');
figure,silhouette(X,idxGmmData)
____________________________________________________________________________________________________
Fig. 5 Rezultatele grafice ale programului Fig. 6. Coeficientul de siluetă aferent progamului
III. CONCLUZII