Sunteți pe pagina 1din 5

Metoda KNN

În cadrul acestei metode, se calculează media distanșelor de la fiecare punct la cei mai
apropiati k vecini, apoi se ordonează crescator distanțele și se reprezinta grafic cu funcția kNN
displot. Locul în care graficul face o curbă determina valoarea optimă a lui epsilon.

Fig. 28: Graficul metodei KNN

Conform acestei metode s-au realizat 2 clase, prima având 112 elemente, iar cea de-a doua
21, restul de 24 de elemente fiind puncte de zgomot. Pentru aplicarea acestei metode s-a ales
valoarea lui epsilon de 0,4 și 5 puncte minim între 2 valori.

Fig. 29: Reprezentarea grafică a celor 2 clustere conform KNN


Se observă că este cea mai mică mulțime convexă care include acea mulțime de puncte
amintită anterior, în functie de libertate și sănătate.

Fig. 30 Repartizarea regiunilor pe clustere

Din matricea formată în fig. 30, se disting 2 țări din Australia, 27 din Europa centrală și de
est, 5 din Asia de Est, 23 din America Latină și Caraibe, 17 din Estul Mijlociu și Africa de Nord,
2 din Nordul America, 9 din Asia de Sud-Est, 5 din cea de sud, 3 din Africa Sub-Sahariană și 19
din Europa de Vest. Astfel că în clusterul 2 sunt incluse 21 de țări din Africa Sub-Sahariană.

a. Predicția KNN
Fig. 31: Clusterul de care aparține fiecare țară în urma predicției

Se disting astfel țările ce se previzioneaza a fi parte din clusterul 1, țări precum Ethiopia,
Kenya și Egipt aparțin clusterului 2, însă sunt și observații precum Grecia și Pakistan ce nu
aparțin niciunui cluster.
Fig. 32: Plot reprezentând clusterele inițiale, cât și predicțiile

Marcate cu „*” în Fig. 32 sunt predicțiile modelului, acestea fiind împărțite din nou,
conform celor 10 clase redate de regiuni, împrăștiere ce se poate vedea în fig. 33.

Fig. 33: Împărțirea țărilor pe clase

b. Siluete KNN

Fig. 34: Silueta KNN


Silueta medie a clusterului 0(zgomotele) este -0,12, a clusterului 1 este 0,31, cu o structură
slabă, iar al celui de-al doilea este 0,6, reprezentând o structură puternică de obiecte.
La nivelul ȋntregii structuri de clustere, se calculează silueta medie globală, ca fiind media
aritmetică a coeficienţilor siluetă ai obiectelor din cluster. Notând Sk silueta cluster-ului k,
distingem următoarea analiză:

 dacă aceasta aparţine [0,71;1], s-a determinat o structură puternică şi bine-definită


de clustere.
 dacă aparţine [0,51;0,71), s-a distins o structură acceptabilă
 pentru intervalul [0,26;0,51) determinăm o structură slabă
 dacă Sk<0,26, structura este artificială.

Media celor 3 este: 0,28, reprezentând o structură slabă a clusterelor.

Fig. 35: Reprezentarea grafică a siluetelor

S-ar putea să vă placă și