Documente Academic
Documente Profesional
Documente Cultură
Lle & Le
Lle & Le
Laplacian Eigenmaps
Introducere
Local Linear Embeding și Laplacian Eigenmaps sunt algoritmi de
reducere a dimensionalității în care spațiul de soluție este convex.
Acești algoritmi rezolvă problema valorilor proprii ale matricelor
rare(matrici ce conțin un număr mare de zerouri). Caracteristica
comună este că acești algoritmi se concentrează doar pe păstrarea
structurii locale a datelor, spre deosebire de Isomap ce se axează pe
cea globală.
Local Linear Embedding
Încorporarea liniară locală , prescurtat LLE, este o tehnică similară cu
Isomap și MVU prin faptul că construiește o reprezentare grafică a
datelor (datapoints).
LLE este mai puțin sensibil la scurtcircuitare decât Isomap, deoarece
doar un număr mic de proprietăți locale o să fie afectate în cazul
apariției unei scurtcircuitări.
Această scurtcircuitare este cauzată de ’’datele zgomotoase’’(noisy
data). În machine learning se numește zgomot orice greșeală sau
eroare apărută în urma colectării datelor. Zgomotul creează probleme
pentru algoritmii de machine learning, deoarece dacă aceștea nu sunt
instruiți în mod corespunzător, algoritmii pot crede că zgomotul este
un model (pattern) și poate începe să se generalizeze de la acesta,
ceea ce duce, evident, la învățarea mai puțin precisă.
Un alt avantaj datorat păstrării proprietăților locale, permite
încorporarea cu succes a colecțiilor de date neconvexe. În LLE,
proprietățile locale ale colecțiilor de date sunt construite prin scrierea
datelor de înaltă dimensiune ca combinații liniare a celor mai apropiați
vecini.
În reprezentarea de dimensiune joasă a datelor, LLE încearcă să
păstreze atât de bine pe cât este posibil ’’greutatea’’ de reconstrucție
(reconstruction weights) în combinații liniare. Erorile de reconstruție
sunt măsurate prin intermediul funcțiilor de cost :
Primul pas al LLE este crearea unui graf al vecinătăților . Pentru a
măsura distanța între două puncte este necesară o distanță
metrică. După calcularea acestor distațe, punctele pot fi clasificate
ca vecini. Pot fi folosite distanțe Euclidiene (distanța liniară
obișnuită între două puncte din spațiul euclidian) sau
Mahalanobis(măsoară distanța între un punct P și distribuția sa D).
Crearea grafului se poate realiza prin mai multe metode, printre
care cea a e-vecinătății. Astfel se crează o muchie între punctele
xi și xj dacă distanța între ele este mai mică decât un parametru
dat e. Parametrul e nu trebuie să fie prea mic sau prea mare. Dacă
este prea mare, fiecare punct va avea trasată o muchie către
celelalte puncte xj, iar în caz contrat, multe puncte nu vor avea
vecini.
Pasul doi constă în reconstrucția liniară a ponderei unui punct xi
, folosind vecinii săi.
Fiecare punct din colecția de date este reconstruit ca o . . .
. . . Sumă ponderată liniară (linear weighted sum) a vecinilor
săi. Având în . vedere faptul că participă doar vecinii,
reconstrucția este locală.
Reconstrucția este realizată de către coeficienții liniari a
ponderilor, de . asemenea liniari. Acesta este motivul de ce
algoritmul se numește . . încorporare locar liniară.
• Ponderele punctelor xi și xj sunt
independente una față de cealaltă.
• Rotația, translația și amplificarea cu scalar a
unui punct și a vecinătății sale nu afectează
matricea locală Wij a punctului xi.
• Este important de notat că dacă numărul
vecinilor este mai mare decât mărimea
originală D (dimensiunea superioară) unii
din coeficienții greutății ar putea fi zero,
ceea ce ar duce la apariția mai multor
soluții.
Pasul 3 constă în reconstruirea punctelor in dimeniune mai
joasă:
În această etapă nu mai avem nevoie de colecția de date. Acum
trebuie să se creeze ,în dimensiunea mai joasă, fiecare punct
utilizând vecinii și matricea locală W. Graful vecinătătăților și
matricea locală W , au păstrat topologia(geometria locală,
distanțele) setului de date.
• http://rstudio-pubs-static.s3.amazonaws.com/94107_913ae6a
497fc408a91a2529b6c57f791.html
Referințe:
• https://cs.nyu.edu/~roweis/lle/papers/lleintro.pdf
• https://scikit-learn.org/stable/modules/manifold.html
Laplacian Eigenmaps
Laplacian Eigenmaps
Similar cu LLE(Local Linear Embbeding), Laplacian Eigenmaps(hărțile
laplaciene proprii) găsesc o reprezentare de date cu dimensiuni scăzute prin
păstrarea proprietăților locale ale varietații. În acest algoritm, proprietățile
locale se bazează pe distanțe pereche între vecinii apropiați.
(1)
pentru d cele mai mici valori proprii diferite de 0. (Cei d vectori proprii
Algoritm
Având k puncte date x1.....xk in Rl, construim un graf ponderat cu
k noduri, unul pentru fiecare punct, și setul de muchii care leagă
punctele vecine între ele.
Pasul 1 [Construirea graficului]
Punem o muchie între nodurile i si j daca xi si xj sunt "apropiate". Există
două variante:
ε vecinatati [parametrul ε ∊ R]. Nodurile i si j sunt conectate printr-
o muchie daca: