Documente Academic
Documente Profesional
Documente Cultură
Florin Leon
http://florinleon.byethost24.com/curs_ml.htm
Florin Leon, Invatare automata, http://florinleon.byethost24.com/curs_ml.htm
Algoritmi de grupare (clustering)
1. Învățarea și învățarea automată
2. Algoritmul k-medii (k-means)
3. Algoritmul EM (Expectation-Maximization)
4. Gruparea ierarhică
5. Algoritmul DBSCAN
“World happiness
report”
Convergența
Algoritmul converge, dar găsește de obicei un minim local al
funcției de eroare
De obicei, se recomandă mai multe rulări și alegerea
rezultatului celui mai potrivit
k=3
Florin Leon, Invatare automata, http://florinleon.byethost24.com/curs_ml.htm 31
Numărul de grupuri
k=2 k=5
yℕ
Florin Leon, Invatare automata, http://florinleon.byethost24.com/curs_ml.htm 45
Funcție de verosimilitate
engl. “likelihood”
Dacă am obținut de 7 ori
„cap” din 10 încercări, care
este probabilitatea banului
de a cădea „cap”?
y ℕ, dar w ℝ
Florin Leon, Invatare automata, http://florinleon.byethost24.com/curs_ml.htm 46
Când n este mare și proporția de apariție a „capului” (y / n) este 70%, este
foarte puțin probabil ca probabilitatea de succes (w) să fie depărtată de 0.7
Funcție de verosimilitate
n = 100 n = 1000
condiția de optim
(valori așteptate)
Florin Leon, Invatare automata, http://florinleon.byethost24.com/curs_ml.htm 54
EM, pasul 2
Se pleacă cu θ(t)
În pasul E, se estimează gt
În pasul M, se calculează θ(t+1)
care maximizează gt
Ș.a.m.d.
/ n → “biased”
/ (n – 1) → “unbiased”
Mediile grupurilor:
Covarianțele grupurilor:
D este mulțimea
de antrenare
Eps = 0.5