Documente Academic
Documente Profesional
Documente Cultură
ALGORITMUL
KNN
Realizat de Dombrovschi Iulia
Introducere în algoritmul KNN
4) O altă modalitate de a alege K este prin validare încrucișată. O modalitate de a selecta setul de
date de validare încrucișată din setul de date de antrenament. Luați partea mică din setul de date
de antrenament și numiți-l set de date de validare, apoi folosiți același lucru pentru a evalua
diferite valori posibile ale lui K. Astfel vom prezice eticheta pentru fiecare instanță din setul de
validare folosind cu K este egal cu 1, K este egal cu 2, K este egal cu 3 .. și apoi ne uităm la ce
valoare a lui K ne oferă cea mai bună performanță pe setul de validare și atunci putem lua acea
valoare și folosiți acest lucru ca setare finală a algoritmului nostru, astfel încât să minimalizăm
eroarea de validare. mostre în setul de date de antrenament.
6) Încercați să păstrați valoarea lui k impar pentru a evita confuzia între două clase de date
VERSIUNEA NAIVĂ A ALGORITMULUI ESTE UȘOR DE
IMPLEMENTAT PRIN CALCULUL DISTANȚELOR DE LA EXEMPLUL
DE TESTARE LA TOATE EXEMPLELE STOCATE, DAR ESTE
INTENSIVĂ DIN PUNCT DE VEDERE COMPUTAȚIONAL PENTRU
SETURI MARI DE ANTRENAMENT. FOLOSIREA UNUI ALGORITM
DE CĂUTARE APROXIMATIV PENTRU CEL MAI APROPIAT VECIN
FACE CA K-NN SĂ FIE TRATABIL DIN PUNCT DE VEDERE
COMPUTAȚIONAL CHIAR ȘI PENTRU SETURI MARI DE DATE.
MULȚI ALGORITMI DE CĂUTARE A VECINILOR APROPIATI AU
FOST PROPUȘI DE-A LUNGUL ANILOR; ACESTEA URMĂRESC ÎN
GENERAL SĂ REDUCĂ NUMĂRUL DE EVALUĂRI LA DISTANȚĂ
EFECTUATE EFECTIV.