Documente Academic
Documente Profesional
Documente Cultură
http://florinleon.byethost24.com/curs_ml.htm
Florin Leon, Invatare automata, http://florinleon.byethost24.com/curs_ml.htm
Clasificarea bazată pe ansambluri.
Selecția trăsăturilor
1. Bagging. Algoritmul Random Forest
2. Boosting. Algoritmul Adaboost
3. Agregarea în stivă
4. Selecția trăsăturilor
D 1 D1 1 D2 6 D3 3 D4 2
2 3 3 5 3
3 5 4 6 6
4 3 4 4 2
5 1 2 4 6
6 3 1 5 1
Subiectivitatea (bias)
Reprezintă rata de eroare a unui model pentru o
anumită problemă
Poate fi diferită de 0 chiar dacă există un număr infinit
de mulțimi de antrenare sau modele independente
Apare deoarece un model nu se potrivește suficient de
bine cu problema
Exemplu
aleatorii generate dintr-o distribuție
normală cu μ = 0 și σ = 0.2
refund = yes : no
refund = no Toți acești arbori au
| status = married : no eroare 0 pe mulțimea
| status = single de antrenare
| | income < 77.5 : no
| | income >= 77.5 : yes
| status = divorced : yes
Florin Leon, Invatare automata, http://florinleon.byethost24.com/curs_ml.htm 21
Random Forest
Se bazează pe votul a m arbori aleatorii, unde m este
un parametru de intrare
Se generează m mulțimi de antrenare bootstrapped
Se antrenează câte un arbore aleatoriu pentru fiecare
mulțime
Pentru o instanță de test, fiecare arbore dă un vot
privind apartenența la o clasă
Clasa cu cele mai multe voturi este răspunsul pădurii
aleatorii
H, ht {-1, 1}
și altele...
f3
wavelet Haar
trăsătură asemănătoare
regiunii nasului
trăsătură asemănătoare
regiunii ochilor
Rețele omogene
Funcție de activare
sigmoidă bipolară
Rețele neomogene
Ieșiri: sigmoidă
bipolară, exponențială
Descompunerea
fotocatalitică
eterogenă a
triclopirului
Algoritmul Relief
Puncte bidimensionale,
clasă binară (Y / N)