Sesiune 2019

Învăţare automată
— Licenţă, anul III, 2018-2019, examenul parţial II —

Nume student: Grupa: OC1, OC2, SD1, SD2, SA
1. (Comparaţie ı̂ntre algoritmii 1-NN: zone şi suprafeţe de decizie;

xxx calculul erorii la CV cu metoda “leave-one-out”)
5
a. Pe setul de date alăturat desenaţi graniţele
de decizie produse de către algoritmul 1-NN 4
(veţi obţine deci diagrama Voronoi ). Apoi
haşuraţi suprafaţa de decizie corespunzătoare 3
clasei +, marcată prin eticheta / simbolul •.
2
0
0 1 2 3 4 5 6
x
b. Pe acelaşi set de date, calculaţi eroarea produsă la cross-validare cu metoda “leave-
one-out” (CVLOO) de către algoritmul 1-NN. Veţi exprima această eroare sub forma unei
fracţii.
Atenţie: În cazul ı̂n care veţi obţine ,,paritate“ de voturi, veţi calcula eroarea CVLOO
folosind algoritmul 3-NN. Dacă nici atunci nu reuşiţi să eliminaţi paritatea, aplicaţi algo-
ritmul 5-NN ş.a.m.d.
Răspuns:
Data Eticheta Vecinătate Clasificare Eroare?

la CVLOO
A(1, 2) { . . .}
B(1, 4) Observaţie: La completarea
coloanei Vecinătate, veţi folosi
C(2, 1) litere ı̂n loc de coordonatele
D(2, 3) punctelor. (Pentru aceasta,
este recomandabil ca, ı̂n pre-
E(3, 4) alabil, pe desenul de mai
F (4, 3) sus să puneţi literele core-
spunzătoare punctelor, con-
G(4, 5) form primei coloane din tabel.)
H(5, 1)
I(5, 3)
J(5, 5)
errCVLOO (1-NN) = . . .
1
2. (Distribuţia gaussiană uni-variată: estimarea parametrilor;
xxx calcularea unor probabilităţi a posteriori)
X Y
0 A
2 A
Presupunem că dispunem de setul de date de antrenament din tabelul
3 B
alăturat; singurul atribut de intrare (X) ia valori reale, iar atributul de ieşire
4 B
(Y ) este de tip Bernoulli, deci ia două valori, notate cu A şi respectiv B.
5 B
6 B
7 B
a. Pornind de la acest set de date şi presupunând că instanţele din clasa A au fost generate
de o distribuţie gaussiană, iar instanţele din clasa B au fost generate de o altă gaussiană,
estimaţi parametrii acestor gaussiene, prin metoda verosimilităţii maxime (MLE).
Atenţie!
Veţi enunţa mai ı̂ntâi formulele corespunzătoare din capitolul Estimarea parametrilor;
metode de regresie.
Centralizaţi rezultatele, completând tabelul de mai jos.
2
µA = σA = P (Y = A) =
2
µB = σB = P (Y = B) =
b. Notăm α = p(X = 2|Y = A) şi β = p(X = 2|Y = B).
− Cât este p(X = 2, Y = A) ı̂n funcţie de α?
− Cât este p(X = 2, Y = B) ı̂n funcţie de β?
− Cât este p(X = 2) ı̂n funcţie de α şi β?
− Cât este p(Y = A|X = 2) ı̂n funcţie de α şi β?
c. [Bonus]
Cum va clasifica varianta gaussiană a algoritmului Bayes Naiv (pe care am prezentat-o ı̂n
mod succint la curs) punctul X = 2?
Veţi exprima răspunsul mai ı̂ntâi ı̂n funcţie de α şi β. Apoi veţi veţi face calculele folosind
valorile lui α şi β, determinate ı̂n funcţie de parametrii calculaţi la punctul precedent.
Răspuns:
2
3. (Algoritmul K-means – varianta care foloseşte variabile-indicator γij :
xxx aplicare pe date din R;
xxx Algoritmul EM/GMM, cazul σ12 = σ22 = 1, π1 = π2 :
xxx executarea unei iteraţii, pe date din R)
A. Fie X = {x1 , x2 , . . . , xn } o mulţime de instanţe de clusterizat, iar K numărul de clustere
cu care vom lucra.
Veţi folosi următoarea variantă a algoritmului K-means:
• Se iniţializează ı̂n mod arbitrar centroizii µ1 , µ2 , . . . , µK şi se ia C = {1, . . . , K}.

• Repetă:
Pasul 1:
Calculează matricea γ (de dimensiune n×K şi având elemente din mulţimea {0, 1})
astfel: (
1, dacă kxi − µj k2 ≤ kxi − µj ′ k2 , ∀j ′ ∈ C,
γij ←
0, ı̂n caz contrar.
În caz de egalitate, alege ı̂n mod arbitrar cărui cluster (dintre cele eligibile) să-i
aparţină instanţa xi .
Pasul 2:
Recalculează µj folosind matricea γ actualizată:
Pentru fiecare j ∈ C, dacă n
P
i=1 γij > 0, asignează
Pn
γij xi
µj ← Pi=1 n .
i=1 γij
Altfel, menţine neschimbat centroidul µj .

până când matricea γ nu se mai schimbă de la o iteraţie la alta.
În continuare se va considera că n = 2, x1 = 0.5 şi x2 = 2, iar valorile iniţiale pentru centroizii
(0) (0)
µ1 şi µ2 sunt 1 şi respectiv 2. (Notaţie: µ1 = 1, µ2 = 2.)
Aplicaţi algoritmul K-means (ı̂n varianta de mai sus!) pe aceste date.
Răspuns:
Iniţializare:
(0) (0)
µ1 = 1, µ2 = 2
Iteraţia 1:
Iteraţia 2:
Iteraţia 3:
...
3
B. Fie un model de mixtură gaussiană (engl., Gaussian mixture model, GMM) cu două
componente având varianţe cunoscute şi probabilităţi a priori egale pentru selecţia celor
două distribuţii:
1 1
N (x; µ1 , 1) + N (x; µ2 , 1), x ∈ R.
2 2
În continuare se va considera (din nou) că n = 2, x1 = 0.5 şi x2 = 2, iar valorile iniţiale
(0) (0)
pentru mediile µ1 şi µ2 sunt 1 şi respectiv 2. (Notaţie: µ1 = 1, µ2 = 2.)
Executaţi ı̂n mod manual o iteraţie a algoritmului EM, versiunea prezentată la curs (pre-
luată din cartea Machine Learning a lui Tom Mitchell, pag. 193) pe aceste date, astfel:
a. Pasul E — estimarea probabilităţilor pentru variabilele ,,neobservabile“:
(0) (0)
Pentru i ∈ {1, 2} şi j ∈ {1, 2}, calculaţi P (Zij = 1|X = xi ; µ1 , µ2 ), probabilităţile a posteriori
de apartenenţă a datelor observate (x1 şi x2 ) la cele două componente ale mixturii. (Vă
readucem aminte că Zij = 1 dacă instanţa xi a fost generată de către gaussiana cu media
µj , iar Zij = 0 ı̂n cazul contrar.) Justificaţi ı̂n mod detaliat!
Indicaţie: În vederea efectuării calculelor, pentru convenienţă puteţi considera valorile
distribuţiei normale / gaussiene standard N (x; µ = 0, σ 2 = 1) ı̂n punctele 0, 0.5, 1, 1.5 şi 2 ca
fiind respectiv 0.4, 0.35, 0.24, 0.13 şi 0.05.
b. Pasul E (continuare) — calcularea funcţiei ,,auxiliare“:
Definiţia funcţiei ,,auxiliare“ la iteraţia 1 este următoarea:
(0) (0)
Q(µ1 , µ2 |µ1 , µ2 ) = E[ln P (Y |µ1 , µ2 )],
unde
not. not.
Y = {y1 , y2 }, cu yi = (xi , Zi1 , Zi2 ), pentru i ∈ {1, 2},
µ1 şi µ2 sunt din R şi sunt consideraţi parametri liberi, iar
media E se calculează ı̂n funcţie de mediile variabilelor ,,neobservable“ Zij calculate
[folosind probabilităţile a posteriori deduse] la punctul precedent.
Determinaţi formula (formulele) de calcul pentru
not.
µ(1) = arg max Q(µ|µ(0) ).
µ∈R2
(t) (t)
Am folosit notaţiile µ = (µ1 , µ2 ) şi µ(t) = (µ1 , µ2 ).
c. Pasul M — maximizarea funcţiei ,,auxiliare“ Q:
(1) (1)
Calculaţi valorile parametrilor µ1 şi µ2 la iteraţia 1 (adică µ1 şi µ2 ), ı̂n funcţie de prob-
abilităţile calculate la primul punct. (Justificaţi ı̂n mod detaliat!) Care credeţi că va fi
tendinţa de mişcare a mediilor la următoarele iteraţii?
C. La curs am enunţat un rezultat teoretic (demonstrat ı̂n carte), care afirmă că ı̂n anumite
condiţii, algoritmul EM pentru mixturi de distribuţii gaussiene se comportă la limită
asemenea algoritmului K-means. Concret, la ce anume se referă această trecere la limită?
Folosind acest rezultat teoretic, propuneţi o schimbare [minimală!] relativă la setarea
iniţială a parametrilor distribuţiilor gaussiene astfel ı̂ncât, pe datele X = {x1 , x2 } de la
punctele A şi B de mai sus, la limită poziţiile finale ale mediilor obţinute de către EM să
coincidă cu centroizii obţinuţi de către algoritmul K-means la convergenţă.
Răspuns:
a.
(0) (0)
P (Z11 = 1|x1 ; µ1 , µ2 ) = . . .
(0) (0)
P (Z12 = 1|x1 ; µ1 , µ2 ) = . . .
4
(0) (0)
P (Z21 = 1|x2 ; µ1 , µ2 ) = . . .
(0) (0)
P (Z22 = 1|x2 ; µ1 , µ2 ) = . . .
b.
not.
y1 = (x1 , Z11 , Z12 ) ⇒ ln P (y1 |µ1 , µ2 ) = . . .
not.
y2 = (x2 , Z21 , Z22 ) ⇒ ln P (y2 |µ1 , µ2 ) = . . .
not.
Y = {y1 , y2 } ⇒ ln P (Y |µ1 , µ2 ) = . . .
(0) (0) def.

⇒ Q(µ1 , µ2 |µ1 , µ2 )] = E[ln P (Y |µ1 , µ2 )] = . . .
c.
(1)
Formula de calcul pentru µ1 :
Justificare (demonstraţie!):
(1)
Aşadar, valoarea lui µ1 este:
(1)
Formula de calcul pentru µ2 :
5
Justificare (demonstraţie!):
(1)
Aşadar, valoarea lui µ2 este:
C.

Sesiune 2019

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Sesiune 2019

Încărcat de

Drepturi de autor:

Formate disponibile

Învăţare automată

— Licenţă, anul III, 2018-2019, examenul parţial II —

1. (Comparaţie ı̂ntre algoritmii 1-NN: zone şi suprafeţe de decizie;

Data Eticheta Vecinătate Clasificare Eroare?

Centralizaţi rezultatele, completând tabelul de mai jos.

b. Notăm α = p(X = 2|Y = A) şi β = p(X = 2|Y = B).

− Cât este p(X = 2, Y = A) ı̂n funcţie de α?

− Cât este p(X = 2, Y = B) ı̂n funcţie de β?

− Cât este p(X = 2) ı̂n funcţie de α şi β?

− Cât este p(Y = A|X = 2) ı̂n funcţie de α şi β?

• Se iniţializează ı̂n mod arbitrar centroizii µ1 , µ2 , . . . , µK şi se ia C = {1, . . . , K}.

Altfel, menţine neschimbat centroidul µj .

(0) (0) def.

S-ar putea să vă placă și