Documente Academic
Documente Profesional
Documente Cultură
Florin Leon
http://florinleon.byethost24.com/curs_ml.htm
Florin Leon, Invatare automata, http://florinleon.byethost24.com/curs_ml.htm
Algoritmi de grupare (clustering)
1. Învățarea și învățarea automată
2. Algoritmul k-medii (k-means)
3. Algoritmul EM (Expectation-Maximization)
4. Gruparea ierarhică
5. Algoritmul DBSCAN
Convergența
Algoritmul converge, dar găsește de obicei un minim local al
funcției de eroare
De obicei, se recomandă mai multe rulări și alegerea
rezultatului celui mai potrivit
k=3
Florin Leon, Invatare automata, http://florinleon.byethost24.com/curs_ml.htm 30
Numărul de grupuri
k=2 k=5
yℕ
Florin Leon, Invatare automata, http://florinleon.byethost24.com/curs_ml.htm 44
Funcție de verosimilitate
engl. “likelihood”
Dacă am obținut de 7 ori
„cap” din 10 încercări, care
este probabilitatea banului
de a cădea „cap”?
y ℕ, dar w ℝ
Florin Leon, Invatare automata, http://florinleon.byethost24.com/curs_ml.htm 45
Când n e mare și proporția „cap”-ului (y / n) este 70%, este
puțin probabil ca probabilitatea de succes (w) să nu fie 0.7
Funcție de verosimilitate
n = 100 n = 1000
condiția de optim
(valori așteptate)
Florin Leon, Invatare automata, http://florinleon.byethost24.com/curs_ml.htm 54
EM
Se pleacă cu θ(t)
În pasul E, se estimează gt
În pasul M, se calculează θ(t+1)
care maximizează gt
Ș.a.m.d.
/ n → “biased”
/ (n – 1) → “unbiased”
Mediile grupurilor:
Covarianțele grupurilor:
D este mulțimea
de antrenare
Eps = 0.5